Тесты и бенчмарки
Qwen и Whisper против дореволюционного русского: как ASR-модели справляются со старыми записями
Команда энтузиастов решила проверить, как современные системы распознавания речи (ASR) справляются с нестандартными сценариями: старыми русскими текстами в дореволюционной орфографии, длинными видеозаписями и фоновым шумом. В бенчмарке участвовали модели Qwen и Whisper.
Тесты показали, что контекстное окно алгоритмов может ломаться на продолжительных аудио, а качество транскрибации сильно зависит от уровня шума. Полные результаты и детали эксперимента доступны на Hugging Face.
Источник: habr.com