Sina выкатила VibeThinker-3B: крошка на 3B параметров обходит гигантов, доказывая, что логика не требует размера
Sina Weibo представила VibeThinker-3B — модель с всего тремя миллиардами параметров, которая на бенчмарках по математике и программированию показывает результаты, сопоставимые с DeepSeek V3.2 и Kimi K2.5. Для сравнения: конкуренты больше неё вплоть до 333 раз. Разработчики утверждают, что секрет не в размере, а в многоэтапном пост-тренинге.
На основе своих результатов команда выдвинула гипотезу: логическое рассуждение хорошо сжимается в малые модели, а вот широкая фактическая база знаний — нет. Это объясняет, почему крошечная модель блестяще справляется с задачами, требующими рассуждений, но может пасовать на тестах, требующих энциклопедических знаний.
VibeThinker-3B — ещё один шаг в сторону эффективных моделей, которые не требуют гигантских вычислительных ресурсов. Это важно для десктопов, мобильных устройств и встраиваемых систем, где каждый параметр на счету.