Семь типов памяти для ИИ-агентов: от рабочей до проспективной
LLM по умолчанию не имеют состояния — каждый вызов API начинается с чистого листа. Для одиночного ответа это нормально, но для агента, который планирует, вызывает инструменты и выполняет задачи в несколько шагов, это катастрофа. Память — инфраструктура, которая фиксирует это: переносит контекст между шагами и позволяет системе учиться на опыте.
Автор выделяет семь типов памяти, различая её по форме (параметрическая в весах модели или непараметрическая в тексте) и времени (кратко- или долгосрочная). Внутренняя/рабочая память — всё, что модель видит в окне контекста: системный промпт, выводы инструментов, цепочки рассуждений. Это быстрый, но ограниченный кэш. Семантическая память — долговременное хранилище фактов и предпочтений пользователя (например, «пользователь предпочитает Python»). Эпизодическая — журнал событий и выполненных задач, который позволяет агенту делать выводы о том, что сработало, а что нет (реализации: Reflexion, ExpeL). Процедурная — навыки и паттерны: агент поддержки на сотом сбросе пароля не перепридумывает логику, а выполняет выученную процедуру.
Внешняя/поисковая память — знания, хранящиеся вне модели, в векторной базе, которые подтягиваются в контекст через RAG на этапе инференса. Параметрическая — знания, запёчённые в веса модели на этапе тренировки (язык, общие закономерности, рассуждения), но они заморожены после обучения. Проспективная память — способность помнить о будущих намерениях и запланированных целях; без неё агент забывает собственные обещания. Все семь типов отображены на плоскости «время × место»: один тип краткосрочный, четыре долгосрочных, два — смешанные.