AIRI выпустила OCC-RAG: компактные модели, которые не выдумывают, а отвечают строго по источникам
Исследователи из AIRI (Optimal Cognitive Core) выпустили первую модель семейства OCC — OCC-RAG, предназначенную для контекстного Q&A. В отличие от гигантских LLM, которые пытаются запомнить всю энциклопедию, OCC-RAG делает ставку на умение рассуждать и анализировать именно тот текст, который ей дали. Доступны два чекпойнта: на 0,6 и 1,7 млрд параметров, а также ONNX- и GGUF-сборки.
По заявлению разработчиков, OCC-RAG отвечает на уровне или лучше моделей общего назначения, которые в 2–6 раз больше, а по верности контексту (насколько ответ соответствует предоставленным источникам) показывает лучший результат среди всех моделей до 32B параметров. Это делает её особенно полезной для задач, где важна фактологическая точность, а не широта знаний.
Модели уже выложены в открытый доступ. Код, веса и инструкции по запуску — на странице проекта. OCC-RAG может работать локально даже на скромном железе, что открывает путь к внедрению в корпоративные RAG-пайплайны без необходимости арендовать дорогие GPU.