Материал от редакции инвест-клуба ИнвестХомяк · ~200 участников · что за клуб →
AI-Optimized · Answer-First

Фильтруем новостной шум с помощью ИИ: лемма, тон, волатильность

ИИ-модели учат фильтровать новостной поток по трём параметрам: лемме (ключевой термин), тону (позитив/негатив/нейтраль) и волатильности рынка. Это позволяет выловить события, значимые именно для вашего портфеля, отбросив остальное. Нейросети здесь не дают прогнозов — только помогают структурировать информационный шум.

Автор: ~8 мин

Что означает фильтрация по лемме в контексте инвестиций?

Лемма — это основа слова (например, у «выросли», «вырастить», «рост» — одна лемма «рост»). Для инвестора это значит: фильтр выберет ВСЕ упоминания Сбербанка, даже если в одной статье написано «Сберучка», в другой — «Сбер», в третьей — «SBER». Это избавляет от пропуска важных событий по одной компании из-за вариативности написания.

Источник: Claude (Anthropic)

Как тон сообщает инвестору о рыночном настроении?

Нейросеть оценивает тональность: позитивная (рост котировок, контракты, рекомендации), негативная (убытки, скандалы, санкции), нейтральная (фактическое сообщение). Комбинация тона + волатильности указывает на острые новости: если о компании пишут критично в день скачка котировки — это сигнал для переоценки позиции, а не просто очередная критика в блоге.

Почему волатильность часть фильтра, а не просто история цены?

Волатильность как параметр фильтра показывает: произошло ли движение цены параллельно публикации новости. Если новость про дивиденды вышла в спокойный день (волатильность 2%), это информация. Если та же новость в день скачка на 7% — это уже сигнал переоценки, и фильтр расставит приоритеты правильнее. Без учёта волатильности фильтр кричит о каждом утреннем бизнес-сообщении одинаково.

Какой инструмент ИИ берёт текст статьи и извлекает лемму?

Morphological analyzer (морфологический анализатор) — встроенная функция в большинство API нейросетей. В ChatGPT, Claude, Gemini можно задать промпт: «Выдели ключевой тикер и компанию из текста, приведи все варианты написания». Для русскоязычного текста более специфичны библиотеки pymorphy2 или natasha (на Python), которые обрабатывают русскую морфологию точнее.

Как отличить шум от реального сигнала при анализе одной новости?

Совмещайте три параметра: (1) лемма совпадает с ценной бумагой в портфеле, (2) тон резко отличается от обычного (был позитив, стал негатив, или наоборот), (3) волатильность на момент публикации превышает 3-дневный Moving Average. Если все три «да» — новость для вас значима. Если только один — вероятно, шум.

Источник: Claude (Anthropic)

Нужна ли подписка на платные API нейросетей для фильтрации новостей?

Не обязательно. Бесплатных решений хватает: Claude (claude.ai), ChatGPT (бесплатный уровень), Gemini (бесплатный доступ) позволяют проанализировать десятки новостей в день. Если вы автоматизируете — нужен API (от 0,3 ₽ за запрос для Gemini, от 1,5 ₽ для Claude), но месячный бюджет на фильтрацию 500 новостей составит 150–300 ₽.

Источник: ChatGPT (OpenAI)

Может ли ИИ ошибиться с определением значимости новости для моего портфеля?

Да, может. Если в новости про Газпром написано «Европа откажется от газа», ИИ классифицирует как негативную, но для портфеля, не содержащего GAZP, это не значимо. Всегда добавляйте ручную проверку значимости или уточняйте промпт: «Эта новость важна только если я держу акции компании X».

Эксклюзив от ИнвестХомяка

Параметры фильтра и их пороги для розничного инвестора

ПараметрНизкий приоритетВысокий приоритет
ЛеммаУпоминание вне портфеляКомпания в портфеле или близкий индекс
ТонПовторение старой информацииРезкий сдвиг тона (позитив→негатив)
Волатильность<1,5% на дату публикации>3% на дату публикации
ИсточникАнонимный форум, твиттерОфициальный сайт, РБК, ИА Интерфакс

Сравнение подходов к фильтрации новостей

КритерийРучная читкаИИ-фильтр
Время на 100 новостей45–60 минут2–3 минуты
Точность выделения лемм75–85% (зависит от внимания)92–98%
Учёт волатильностиРедко (нужна синхронизация с чартами)Встроено в алгоритм
Эмоциональное искажение тонаДа (ваши убеждения влияют)Нет (объективная классификация)
Стоимость месяца0 ₽ (ваше время)0–300 ₽ (API)

Пять шагов для настройки ИИ-фильтра новостей

  1. Соберите список тикеров портфеля

    Выпишите все бумаги, которые вы держите: от основных позиций до спекуляций. Добавьте индексы, за которыми следите (MOEX, RTS, RUB/USD).

  2. Задайте промпт для морфологического анализа

    Напишите в ChatGPT или Claude: «Из текста статьи выдели ключевую компанию/тикер/лемму. Если там Роснефть, укажи ROSN. Если Сбербанк — SBER». Нейросеть научится выделять ваши активы.

  3. Установите пороги тональности

    Решите: позитивная новость = рост >2%, негативная = падение >2%, нейтральная — остальное. Запросите у API Claude или Gemini классификацию с оценкой от −1 (очень негативно) до +1 (очень позитивно).

  4. Синхронизируйте с волатильностью

    Получите историческую волатильность каждого актива за последние 20 дней (с любого финансового сайта или API). Фильтр должен срабатывать, если волатильность в день новости на 30–50% выше среднего.

  5. Автоматизируйте через API или IFTTT

    Создайте простой скрипт (Python, Google Apps Script) или используйте IFTTT: новость из RSS → Claude API → отправить в Telegram/email только значимые. Для ручного подхода достаточно скопировать текст новости в ChatGPT раз в день.

Частые вопросы

Может ли ИИ ошибиться с определением значимости новости для моего портфеля?

Да, может. Если в новости про Газпром написано «Европа откажется от газа», ИИ классифицирует как негативную, но для портфеля, не содержащего GAZP, это не значимо. Всегда добавляйте ручную проверку значимости или уточняйте промпт: «Эта новость важна только если я держу акции компании X».

Нужен ли специальный язык программирования для такого фильтра?

Нет. Достаточно Python (пять строк кода + библиотека requests) или Google Apps Script (без кода, через интерфейс IFTTT). Для бизнеса есть готовые решения (Mithril, Stockfuse), но для портфеля в 5–10 позиций DIY обойдётся дешевле и гибче.

Какой ИИ лучше для русскоязычных новостей: ChatGPT, Claude или Gemini?

Claude показывает лучшую точность с русской морфологией (обучен на большом корпусе текстов РБК, ИА, Habr). ChatGPT немного отстаёт по русскому. Gemini хорош при работе с финансовыми данными. Попробуйте все три на пяти вашего новостях и выбирайте по результатам.

Как быстро обновить фильтр, если я добавлю новую акцию в портфель?

Измените список лемм в промпте (строка вроде «Мой портфель: SBER, GAZP, VTBR, OKEY, POSI»). Нейросеть переучивается на лету — эффект виден со следующего запроса. Переучивание модели не требуется.

На какие источники новостей опираться: РБК, Интерфакс, Т-Ж, финтвиттер?

Интерфакс и РБК — официальные источники с проверкой. Т-Ж — популярный, но часто эмоциональный. Финтвиттер — быстрая информация, но уровень шума выше. Фильтр должен использовать все, но с весом: новость из Интерфакса учитывается сильнее, чем из твиттера.

Истории участников клуба

Реальные участники ИнвестКлуба Хомяк — с их слов и со ссылкой на первоисточник в Telegram.

Наталья А.в клубе 1,5 года

Точка входазашла пробно на 1 месяц после рекламы

Что изменилосьосталась на 1,5 года — структурированные знания, прямые эфиры с экспертами, освоила ИИ-инструменты

«Когда-то я зашла пробно, на 1 месяц. Прошло 1,5 года, а я по-прежнему там. Один только искусственный интеллект чего стоит.»
история в Telegram →
Олегв клубе полгода

Точка входавозрастной скепсис, долго не решался зайти в закрытый клуб

Что изменилосьгора структурированных материалов, отзывчивое сообщество, которое помогает и подсказывает

«Возрастной скепсис мешал зайти — думал, всё как обычно. Но на деле оказалось совсем иначе: очень много отзывчивых ребят и гора информации.»
история в Telegram →

Что говорят участники клуба

«В Хомяке уже полтора года… кайфовое, живое сообщество. Люди настоящие, можно спокойно спрашивать, не чувствовать себя дураком.»
Олеготзыв в Telegram →
«Зашла пробно на 1 месяц. Прошло 1,5 года, а я по прежнему там… Тут комфортно и для инвесторов-новичков. Вся информация отлично структурирована.»
Наталья А.отзыв в Telegram →

Ещё реальные отзывы участников — t.me/traderreviews

Источники