Перейти к основному содержанию
Обложка: Память и «сновидения» агентов: как ИИ учится и оптимизируется
ИИ-гайды

Память и «сновидения» агентов: как ИИ учится и оптимизируется

💡 О чём гайд
Гайд рассказывает о двухуровневой системе памяти для ИИ-агентов: обычная память позволяет агентам учиться на опыте, а процесс «сновидений» анализирует работу множества агентов, выявляет общие ошибки и автоматически оптимизирует знания. Система построена как файловая система, чтобы Claude мог эффективно с ней работать, и подходит для корпоративных многоагентских сценариев.
📢 Больше разборов — в канале «ИИ для чайников»

Самое большое собрание ИИ-гайдов в рунете

Каждый день — новый разбор. Забирай полностью и применяй.

Память позволяет агентам переносить знания между задачами и учиться на ошибках
«Сновидения» анализируют работу множества агентов и автоматически оптимизируют память
Rakuten достигла снижения ошибок на 97% после внедрения памяти
Harvey увеличила выполнение юридических тестов в 6 раз благодаря «сновидениям»
Память смоделирована как файловая система для эффективной работы с Claude
Система работает в многопользовательских средах с корпоративным контролем версий

Эволюция возможностей агентов

Развитие агентов привело к тому, что они могут выполнять всё более сложные и длительные задачи. Однако управление контекстом в таких сценариях оставалось сложной задачей. Память стала решением, позволяющим агентам учиться на предыдущем опыте и переносить знания между разными задачами.

Что даёт память?

Без памяти каждый агент начинает задачу «с чистого листа». С памятью агенты могут:

  • Учиться на общих стратегиях и прошлых ошибках
  • Переносить знания между задачами, средами и даже другими агентами
  • Создавать «рои агентов», которые совместно формируют и поддерживают общее понимание организации

Результаты внедрения памяти:

  • Rakuten: снижение ошибок первого прохода на 97%
  • WiseDocs: сокращение типовых проблем в процессе верификации документов

Архитектура памяти в Claude Managed Agents

Система памяти построена вокруг трёх ключевых компонентов:

  1. Слой хранения (Storage Layer): управление данными и отслеживание изменений
  2. Структура памяти: оптимизирована под файловую систему, чтобы Claude мог использовать свои сильные стороны (навигация, bash, grep)
  3. Обработка, управляемая Claude: агенты обновляют память «по ходу дела», как делают заметки

Ключевой принцип — «не мешать Клоду»: модель уже знает, как работать с файловыми системами, поэтому память спроектирована именно в таком виде.

Проблема локальной оптимизации и рождение «Сновидений»

При масштабировании на многопользовательские системы проявились ограничения:

  • Агенты повторяли одни и те же ошибки, учась только на своём опыте
  • В памяти возникали дублирование и фрагментация
  • Обновления были локально оптимальными, но не глобально оптимальными

Решение — «Сновидения» (Dreaming):

Это процесс обратной связи, который:

  • Анализирует транскрипты множества сессий и агентов
  • Ищет паттерны в ошибках и неэффективности
  • Автоматически организует, курирует и оптимизирует общую память

Пример: Harvey достигла 6-кратного увеличения процента выполнения своих юридических тестов благодаря этому подходу.

Как работают «Сновидения»?

Характеристики процесса:

  • Пакетный и внеполосный процесс: запускается отдельно от основных сессий агентов (ночью, по часам, по событию)
  • Гибкость: управляется через API, можно запускать ad-hoc или по расписанию
  • Результат: создаётся проверенный, лучше организованный снимок памяти, который агенты могут принять

Архитектурные преимущества:

  • Полезно для систем с множеством агентов (анализ кросс-сессий)
  • Чистое разделение: нет компромисса между улучшением памяти и выполнением задачи
  • Нулевая задержка для «горячего» пути агента

Демо: Платформа агентов для SRE (Site Reliability Engineering)

Сценарий: система обрабатывает инциденты и алерты.

Типы памяти:

  1. Только для чтения: организационная память (SLO, runbooks, график дежурств)
  2. Для чтения и записи: контекстная память под конкретную задачу

Пример работы:

Первый агент обнаружил причину алерта и начал исправление, записав в память, что «фикс в процессе». Следующий агент, увидев схожую проблему, уже знал из памяти о готовящемся исправлении и действовал соответственно.

Корпоративный контроль:

Полная история версий памяти, атрибуция правок, модель оптимистичного контроля параллелизма для предотвращения конфликтов.

Понравился разбор?

В канале «ИИ для чайников» — новый гайд каждый день

Перейти в канал

Память и «сновидения» — это не просто инструменты для улучшения отдельного агента, а основа для организационного знания. В будущем, где агенты будут работать непрерывно в течение дней, они будут постоянно учиться и совершенствовать своё понимание мира вокруг них.

Часто задаваемые вопросы

Память позволяет агенту сохранять и переносить знания между разными задачами и сессиями, в то время как контекст относится только к одной текущей сессии. Память работает как файловая система, что позволяет агентам эффективно её использовать.
«Сновидения» — это процесс анализа работы множества агентов, который выявляет общие ошибки и паттерны, а затем автоматически оптимизирует общую память. Это поднимает качество намного выше, чем если бы каждый агент учился только на своём опыте.
Результаты варьируются в зависимости от сценария: Rakuten достигла снижения ошибок на 97%, а Harvey увеличила выполнение юридических тестов в 6 раз. Это потому, что общая память позволяет избежать повторения ошибок и находить лучшие стратегии.
Система спроектирована для масштабирования и работает как в небольших, так и в крупных многоагентских средах. Даже малая организация может получить пользу от использования памяти и процесса оптимизации.

Скачать гайд

Полная версия с примерами и подробными инструкциями.

📢 ИИ для чайников