Модели и агенты
RAG в 2026: энкодеры уходят, LLM правят бал
Если в 2023 стек RAG был стандартным — BERT-семейство (BGE, e5) для семантики, BM25 для точных совпадений, cross-encoder для реранкинга и Qdrant сверху, — то к 2026 году передовые команды почти полностью отказались от энкодеров. Теперь эмбеддинги и реранкер — это файнтюненные LLM, инференс идёт на SGLang, а не на ONNX.
Статья разбирает, как перестроить обвязку под новый стек и что делать, если вы работаете в узком домене без готовых датасетов. Особый акцент — на практические шаги для перехода с энкодеров на LLM без потери качества.
Источник: habr.com