Инструменты
От вызова LLM к полноценному RAG-бэкенду: как собрать систему с логированием, таймингами и честными ограничениями
Статья — не очередной обзор «как устроен RAG», а практический путь от простого POST /ask к небольшому бэкенду с чётким API-контрактом. В проекте есть request_id для трассировки, логирование каждого этапа, тайминги, sources (какие фрагменты попали в промпт), механизм rebuild index и честные ограничения — например, что делать, если индекс устарел.
Материал будет полезен разработчикам, которые хотят понять, где заканчивается вызов локальной LLM и начинается настоящая backend-система с тестами и ограничениями. Всё на FastAPI и Ollama — без лишних абстракций.
Источник: habr.com