Модели и агенты
Baidu представила Unlimited OCR: десятки страниц за один проход с памятью как у человека
Предыдущие OCR-системы «запинались» уже на десяти страницах. Baidu Unlimited OCR легко проглатывает десятки — секрет в изменённом attention-механизме, который не накапливает память по мере обработки, а работает по принципу человеческого забывания. Разработчики утверждают, что потребление памяти остаётся постоянным независимо от числа страниц.
Сейчас модель возглавляет рейтинг самого авторитетного бенчмарка OCR. Решение может серьёзно упростить распознавание многостраничных документов — от сканов книг до архивов накладных — без разбивки на фрагменты.
Источник: the-decoder.com