Тесты и бенчмарки

Qwen и Whisper против дореволюционного русского: как ASR-модели справляются со старыми записями

24.06.2026 · habr.com ↗

Команда энтузиастов решила проверить, как современные системы распознавания речи (ASR) справляются с нестандартными сценариями: старыми русскими текстами в дореволюционной орфографии, длинными видеозаписями и фоновым шумом. В бенчмарке участвовали модели Qwen и Whisper.

Тесты показали, что контекстное окно алгоритмов может ломаться на продолжительных аудио, а качество транскрибации сильно зависит от уровня шума. Полные результаты и детали эксперимента доступны на Hugging Face.

Источник: habr.com

Темы: Тесты и бенчмарки Huggingface