Sakana AI запустила Fugu — единый API для роя из десятков LLM
Fugu — это не просто очередной API-роутер, а полноценная языковая модель, обученная вызывать другие LLM из агентного пула. Она сама решает, кому делегировать задачу, как агентам общаться между собой и как синтезировать итоговый ответ. Разработчику не нужно знать, сколько моделей работает «под капотом» — всё выглядит как один вызов к одному эндпоинту.
Доступны две версии: Fugu (баланс скорости и качества для повседневных задач) и Fugu Ultra (максимальная точность на сложных многошаговых задачах с фиксированным пулом экспертов). В бенчмарках Fugu Ultra обходит большинство опубликованных моделей по коду и рассуждениям.
Архитектура основана на двух научных работах, принятых на ICLR 2026: TRINITY (лёгкий эволюционный координатор, назначающий роли Thinker/Worker/Verifier) и Conductor (обучение с подкреплением для поиска естественно-языковых стратегий координации). Вместо жёстко прописанных воркфлоу — модель учится собирать команду под задачу.
Sakana AI позиционирует Fugu как страховку от vendor lock-in: если один провайдер (например, Anthropic) ограничивает доступ к своим моделям, Fugu автоматически перемаршрутизирует запросы. В пул можно добавлять новые модели по мере их появления.