Фичи и апдейты
Неочевидные проблемы в Text-to-Speech, о которых молчат
При переходе в Text-to-Speech из классического машинного обучения или компьютерного зрения кажется, что всё понятно: датасет, модель, функция потерь, валидация. Но на практике быстро понимаешь, что подводных камней гораздо больше, чем кажется.
Статья на Хабре перечисляет неочевидные проблемы, с которыми сталкиваются новички в TTS: от качества данных до специфических артефактов синтеза. Материал будет полезен тем, кто только начинает погружаться в синтез речи.
Источник: habr.com