Фичи и апдейты
На страницах моделей Hugging Face появились все результаты бенчмарков разом
Hugging Face запустил новую функцию: на страницах моделей теперь есть отдельная вкладка «Evals», где отображаются результаты всех известных бенчмарков для этой модели. Раньше разработчикам приходилось собирать эти данные вручную из разных мест — теперь всё в одном окне.
Вкладка показывает не только сырые цифры, но и визуализацию: графики, сравнения с другими моделями, историю изменений. Это упрощает оценку модели «на лету» — особенно когда нужно быстро понять, насколько она подходит под задачу.
Фича уже доступна на всех страницах моделей в Hugging Face Hub. Для разработчиков и исследователей это серьёзное ускорение: не надо открывать десяток статей и репозиториев, чтобы понять, как модель показала себя на MMLU, HumanEval или других тестах.
Источник: huggingface.co