Обычный LLM-бот «живет» в пределах текущего контекста: видит последние сообщения, но не помнит пользователя по-настоящему. Чтобы агент вел себя последовательно, учитывал прошлые действия и персональные настройки, ему нужна memory-архитектура.
Что такое memory в AI-агентах
Это не магическая «память человека», а система хранения и извлечения данных, которые помогают модели принимать более точные решения. По сути, memory — это слой между диалогом, инструментами и хранилищем данных.
Какие виды памяти используют 📌
Short-term memory — краткосрочная память
Хранит текущий контекст: недавние сообщения, активную задачу, промежуточные шаги reasoning-цепочки. Обычно ограничена окном контекста модели.Long-term memory — долгосрочная память
Сохраняет факты о пользователе, прошлые задачи, предпочтения, историю решений. Например: «пользователь работает в Python», «любит краткие ответы».Episodic memory — память о событиях
Запоминает конкретные кейсы: что произошло, какие действия предпринимались, чем завершилось. Полезно для саппорт-ботов и автономных агентов.Semantic memory — память о знаниях
Хранит обобщенные факты, правила, связи между сущностями. Часто строится поверх базы знаний или RAG.
Как это реализуют технически ⚙️
Буфер диалога — простейший вариант: хранить последние сообщения
Сводки (summarization) — старые диалоги сжимаются в краткое резюме
Vector DB — память через embeddings и семантический поиск
SQL/NoSQL — для фактов, профилей, событий и метаданных
Knowledge Graph — если важны связи между объектами
RAG-пайплайн — агент достает релевантную информацию перед ответом
Как работает хороший memory-пайплайн 🔍
Агент получает запрос
Определяет, что нужно вспомнить
Ищет данные в нужном хранилище
Фильтрует релевантное
Подмешивает это в prompt
После ответа решает, что сохранить в память
Что важно учитывать 🚨
Не сохраняйте всё подряд: память должна быть полезной, а не шумной
Разделяйте факты, предпочтения и временный контекст
Настройте TTL и политику удаления устаревших данных
Следите за приватностью: персональные данные нужно хранить безопасно
Проверяйте, когда memory вредит — модель может цепляться за неактуальные факты
Где это особенно полезно 💡
персональные AI-ассистенты
support-боты
sales-агенты
coding-агенты
multi-step workflow-системы
Итог
Память в AI-агентах — это не одна функция, а целая архитектура: что запоминать, где хранить, как искать и когда забывать. Именно memory превращает обычный чат-бот в устойчивого агента, который помнит контекст, пользователя и свои прошлые действия.
👀 Ниже — мягко рекомендую посмотреть подборку каналов про IT: там много полезного про AI, разработку, инфраструктуру и практические кейсы.