Волна ИИПодписаться
← Назад
Модели и агенты

LongCat-2.0 от Meituan: 1,6 трлн параметров, 1 млн контекста и работа на китайских ASIC

05.07.2026 · marktechpost.com ↗

Meituan представила LongCat-2.0 — следующее поколение своей открытой MoE-модели. В ней 1,6 трлн параметров, из которых на каждый токен активируется около 48 млрд (динамический диапазон 33–56 млрд). Модель поддерживает нативный контекст в 1 млн токенов и позиционируется как агентный кодер: понимание, генерация и выполнение кода в агентных воркфлоу. Обучение шло на более чем 35 трлн токенов, и Meituan заявляет, что не было ни откатов, ни невосстановимых всплесков потерь — важный показатель для не-Nvidia железа.

Архитектура включает несколько ключевых решений для снижения стоимости масштабирования. Zero-computation experts: простые токены (например, пунктуация) направляются в «нулевой» эксперт и возвращаются без вычислений. LongCat Sparse Attention (LSA) — эволюция DeepSeek Sparse Attention: три метода индексации (streaming-aware, cross-layer, hierarchical) снижают сложность внимания с квадратичной до почти линейной. N-gram embedding (135 млрд параметров) захватывает плотные локальные связи токенов и уменьшает I/O памяти при декодировании. Пост-тренинг через MOPD объединяет три группы экспертов (Agent, Reasoning, Interaction) в единую модель.

На бенчмарках Meituan сравнивает LongCat-2.0 с GPT-5.5 и Gemini 3.1 Pro. По SWE-bench Pro модель набирает 59,5% (против 58,6% у GPT-5.5), Terminal-Bench 2.1 — 70,8%, SWE-bench Multilingual — 77,3%. По общим агентным тестам (FORTE, BrowseComp) модель уступает фронтирным системам. По сравнению с предыдущей версией LongCat-Flash (560B, 128K контекст) прирост значительный. Важно: все цифры — внутренние тесты Meituan, независимого подтверждения пока нет.

Ключевая особенность — полный цикл обучения и инференса на отечественных AI-ASIC-суперподах. Это демонстрация зрелости китайской инфраструктуры для超大 моделей. Модель открытая, доступна на longcat.ai. LongCat-2.0 — серьёзный игрок в сегменте агентного кодинга, особенно для экосистем, где важна работа на альтернативных чипах.

Источник: marktechpost.com
← Все новости AI Wave