Инструменты

Как мы с Claude Code оценивали RAG-систему: история без прикрас

18.06.2026 · habr.com ↗

На Хабре вышла статья о том, как с помощью Claude Code автоматизировать оценку качества RAG-системы. Автор проходил курс по вайб-воркингу (для непрограммистов) на Stepik и решил применить AI-ассистента к реальной задаче — вместо готовых библиотек вроде RAGAS, которые требуют навыков программирования.

Идея была в том, чтобы переложить рутинные операции оценки на ИИ. Но в процессе выяснилось: полностью без кода не обошлось — автор признаёт, что это, возможно, профессиональная деформация, но честно рассказывает о всех проблемах.

Статья будет полезна всем, кто хочет ускорить валидацию RAG-пайплайнов с помощью ИИ-ассистентов, но готов к тому, что автоматизация — это не волшебная таблетка.

Источник: habr.com

Темы: Инструменты Anthropic