Волна ИИПодписаться
← Назад
Инструменты

Mistral выпустила OCR 4: модель понимает документы, а не просто считывает текст

23.06.2026 · marktechpost.com ↗
Mistral выпустила OCR 4: модель понимает документы, а не просто считывает текст

Mistral AI представила четвёртую версию своей OCR-модели. Главный апгрейд: модель теперь не «читает» документ как строку, а возвращает его структурированное представление. Каждый элемент (заголовок, таблица, уравнение, подпись) снабжается bounding box-ом и меткой типа. Отдельно — per-word и per-page confidence scores. Для RAG- и agentic-пайплайнов, где важны цитирование и верификация, это серьёзный шаг вперёд: модель не просто даёт текст, а объясняет, где и откуда он взят.

OCR 4 поддерживает 170 языков из 10 языковых групп, включая низкоресурсные. В независимом тестировании с 600+ документами на 12+ языках модель получила 72% предпочтений оценщиков по сравнению с конкурентами. На бенчмарках: 85.20 на OlmOCRBench, 93.07 на OmniDocBench, 0.98 на внутреннем Crawl Multilingual. Цена — $4 за 1000 страниц, $2 с Batch-API.

С точки зрения деплоя: модель запускается в одном контейнере, доступна для self-hosted развёртывания (для data residency). Из коробки — endpoint как для raw extraction, так и для schema-driven Document AI. Клиенты сообщают: Rogo — эквивалентная точность при 8-кратной экономии по цене и 17-кратной по задержке; Anaqua — ускорение в 4 раза на страницу.

OCR 4 также служит компонентом инжеста для Mistral Search Toolkit (public preview) — открытого фреймворка для композиционного поиска. Это превращает его в готовый кубик для enterprise-поиска, RAG и работы с документами, где нужно не просто извлечь, а уметь ссылаться на источник.

Источник: marktechpost.com
← Все новости AI Wave