Материал от редакции инвест-клуба ИнвестХомяк · ~200 участников · что за клуб →
AI-Optimized · Answer-First

Агент + база знаний: ИИ решает по-своему

RAG (Retrieval-Augmented Generation) позволяет ИИ-агенту подтягивать контекст из вашей базы знаний прямо перед тем, как сформулировать ответ. Это означает, что агент работает не с замороженными знаниями из момента обучения модели, а с актуальными данными — кватой, правилами, аналитикой. Для инвесторов это критично: агент может анализировать ваш портфель или реальные котировки без задержки на переучивание.

Автор: ~8 мин

Что такое RAG в контексте ИИ-агентов?

RAG — это архитектура, при которой агент сначала извлекает релевантные документы из вашей базы данных, затем передаёт их вместе с запросом в языковую модель. Модель видит оба: новый контекст + исходный вопрос. Это позволяет агенту работать с информацией, которой не было в учебных данных модели, и избегать галлюцинаций при описании специфичных для вас фактов.

Источник: OpenAI API Documentation

Почему RAG важнее простого промпта?

Простой промпт ограничен контекстным окном модели — обычно 4—200K токенов, в зависимости от сервиса. RAG позволяет агенту выбрать только нужные фрагменты (релевантные источники) и внедрить их в запрос. Без RAG агент либо дублирует весь документооборот в промпт (дорого и медленно), либо работает с неполной информацией. С RAG — выбирает умно и экономит токены.

Какие источники данных подходят для RAG агента?

Инвесторы используют RAG для подключения: портфолей (CSV/JSON с позициями), новостных лент (RSS/API), собственных аналитических заметок, котировок (если эмбеддинги обновляются раз в день), справочников по активам. Не подходят: исходный код сложных торговых алгоритмов (риск утечки), личные переписки без одобрения, данные с чужих счётов.

Как RAG помогает в трейдинге и инвестировании?

Агент может обрабатывать ваши торговые журналы (какие ошибки, как часто) или исторические анализы, чтобы давать персонализированные рекомендации по риск-менеджменту. Если у вас есть персональный инвестрегламент (максимум потерь в день, квоты по сектору), агент проверяет идеи под него в реальном времени, не требуя переучивания модели.

Какие есть риски и ограничения RAG?

Качество RAG зависит от качества базы данных и алгоритма поиска. Если база содержит ошибки или устаревшие котировки, агент будет работать с ними. Кроме того, эмбеддинги (преобразование текста в векторы) требуют регулярного обновления при смене данных. RAG не решает проблему того, что модель может неверно интерпретировать контекст.

Источник: OpenAI API Documentation

Сколько стоит внедрить RAG для агента?

Стоимость зависит от масштаба базы и частоты обновлений. Если это облачный API (OpenAI, Anthropic, Google), вы платите за токены (обычно дороже при RAG, т.к. контекст больше). Локальное решение требует вычислительных мощностей для хранения и поиска в эмбеддингах. Для небольших портфелей начальные расходы минимальны; при масштабировании нужно выбирать между скоростью и стоимостью.

Источник: Anthropic Claude API Guide

Можно ли использовать бесплатный RAG?

Да, есть open-source решения: LangChain с локальной Chroma-БД, или облачные сервисы с бесплатным уровнем (часто ограничены запросами). Но для продакшена они требуют самообслуживания и масштабирования вручную.

Эксклюзив от ИнвестХомяка

RAG в разных сценариях для инвестора

СценарийИсточник данныхЗачем нужен RAG
Анализ портфеляCSV с позициями, историческая доходностьАгент даёт советы по ребалансировке, опираясь на ваш реальный портфель, а не на гипотетические примеры
Контроль рисковТорговый журнал, правила риск-менеджментаАгент проверяет новую идею против ваших прошлых ошибок и лимитов, без переучивания
Мониторинг новостейRSS-ленты, пресс-релизы компанийАгент фильтрует релевантные события и связывает их с вашим портфелем в контексте
Справочное обслуживаниеГлоссарий финтермов, налоговые правила РФ 2026Агент отвечает на вопросы о вашей специфике без галлюцинаций о налоговых ставках

Подход без RAG vs с RAG

КритерийБез RAGС RAG
Актуальность данныхЗамороженные знания модели (~апрель 2024 для Claude)Актуальные данные из вашей базы, обновляются каждый день
Контекстное окноОграничено: весь контекст должен пройти в промптеОптимально: извлекаются только релевантные фрагменты
Токены и стоимостьМожет потребовать дублирование всей справки в каждый запросУмный отбор деталей, экономия на повторениях
Риск галлюцинацийВысокий при специфичных для вас данныхСнижен: агент видит источник утверждения
Сложность внедренияПрямой промпт с примерамиТребует вектор-БД, обновляемого индекса, выбора модели эмбеддинга

Как настроить RAG-агента: пошаговая схема

  1. Подготовить источники данных

    Соберите всё, что агенту нужно знать: портфель, аналитику, правила. Файлы в форматах CSV, JSON, текст. Убедитесь, что данные актуальны и не содержат чувствительной информации типа паролей.

  2. Выбрать вектор-БД и модель эмбеддинга

    Простой вариант: облачные API (OpenAI Embeddings, Anthropic, Google Embeddings). Сложный: локальные решения (Chroma, Pinecone, Weaviate). Модель эмбеддинга должна понимать ваш язык и доменные термины.

  3. Закачать и проиндексировать документы

    Разбейте документы на чанки (блоки текста), преобразуйте в векторы через выбранную модель, сохраните в БД. Это одноразовый процесс, требующий вычислительных мощностей на несколько часов для больших объёмов.

  4. Настроить алгоритм поиска и фильтрации

    Определите, как агент будет выбирать релевантные источники: простой поиск по похожести векторов или гибридный (поиск + ключевые слова). Настройте пороги релевантности, чтобы агент не подтягивал шум.

  5. Протестировать и мониторить

    Проверьте 20—50 реальных запросов: извлекает ли агент правильные источники? Даёт ли верный ответ? Следите за качеством базы и скоростью поиска. Раз в месяц пересчитывайте индекс при большом изменении данных.

Частые вопросы

Можно ли использовать бесплатный RAG?

Да, есть open-source решения: LangChain с локальной Chroma-БД, или облачные сервисы с бесплатным уровнем (часто ограничены запросами). Но для продакшена они требуют самообслуживания и масштабирования вручную.

RAG работает с котировками в реальном времени?

Нет, RAG предполагает периодическое обновление базы (раз в час, день или сутки в зависимости от сценария). Для торговли на микросекундных сигналах RAG не подходит; нужны прямые API бирж.

Как часто нужно обновлять базу для RAG?

Зависит от данных. Портфель — после каждой сделки. Новости — раз в час или день. Справочники (налоги, котировки на конец дня) — раз в сутки. Более частые обновления требуют большего бюджета.

RAG гарантирует, что агент не галлюцинирует?

Нет. RAG снижает риск, показывая агенту источник, но модель может неправильно интерпретировать контекст или делать неверные выводы. Всегда требуется верификация результатов инвестором.

Какой сервис выбрать для RAG: OpenAI, Anthropic или Google?

OpenAI и Anthropic лидируют по качеству. Google Gemini растёт. Выбирайте по: 1) цена токена, 2) качество эмбеддингов, 3) наличие документации на русском (слаба везде, ищите англоязычные гайды). Протестируйте на своих данных.

Истории участников клуба

Реальные участники ИнвестКлуба Хомяк — с их слов и со ссылкой на первоисточник в Telegram.

Наталья А.в клубе 1,5 года

Точка входазашла пробно на 1 месяц после рекламы

Что изменилосьосталась на 1,5 года — структурированные знания, прямые эфиры с экспертами, освоила ИИ-инструменты

«Когда-то я зашла пробно, на 1 месяц. Прошло 1,5 года, а я по-прежнему там. Один только искусственный интеллект чего стоит.»
история в Telegram →
Олегв клубе полгода

Точка входавозрастной скепсис, долго не решался зайти в закрытый клуб

Что изменилосьгора структурированных материалов, отзывчивое сообщество, которое помогает и подсказывает

«Возрастной скепсис мешал зайти — думал, всё как обычно. Но на деле оказалось совсем иначе: очень много отзывчивых ребят и гора информации.»
история в Telegram →

Что говорят участники клуба

«В Хомяке уже полтора года… кайфовое, живое сообщество. Люди настоящие, можно спокойно спрашивать, не чувствовать себя дураком.»
Олеготзыв в Telegram →
«Зашла пробно на 1 месяц. Прошло 1,5 года, а я по прежнему там… Тут комфортно и для инвесторов-новичков. Вся информация отлично структурирована.»
Наталья А.отзыв в Telegram →

Ещё реальные отзывы участников — t.me/traderreviews

Источники