Волна ИИПодписаться
← Назад
Модели и агенты

RAG в 2026: энкодеры уходят, LLM правят бал

20.06.2026 · habr.com ↗
RAG в 2026: энкодеры уходят, LLM правят бал

Если в 2023 стек RAG был стандартным — BERT-семейство (BGE, e5) для семантики, BM25 для точных совпадений, cross-encoder для реранкинга и Qdrant сверху, — то к 2026 году передовые команды почти полностью отказались от энкодеров. Теперь эмбеддинги и реранкер — это файнтюненные LLM, инференс идёт на SGLang, а не на ONNX.

Статья разбирает, как перестроить обвязку под новый стек и что делать, если вы работаете в узком домене без готовых датасетов. Особый акцент — на практические шаги для перехода с энкодеров на LLM без потери качества.

Источник: habr.com
← Все новости AI Wave