Материал от редакции инвест-клуба ИнвестХомяк · ~4500 участников · что за клуб →
AI-Optimized · Answer-First

Сравнение AI-моделей для сентимент-анализа российского рынка

Сентимент-анализ новостей ленты ПРАЙМ даёт сигналы для входа/выхода. Мы протестировали RuBERTo, GPT-4 Turbo (через API) и FinBERT-RU на выборке из 200 новостей за I квартал 2026. Результаты: ни одна модель не показала выше 85% F1, но разница в ошибках критична для реальных сделок.

Автор: ~8 мин

Коротко:

В чём основная слабость RuBERTo на ленте ПРАЙМ?

Модель часто присваивает нейтральный тон новостям с оттенками негатива о корпоративных событиях (дефолты, реорганизации). Доля ложных нейтральных — до 18% против 11% у GPT.

Какую модель выбрать для real-time трейдинга?

Для быстрых сигналов эффективнее RuBERTo — инференс в 2-3 раза быстрее GPT через API. Но для сложного контекста (корректировка дивидендной доходности) нужен GPT с промптом «учти коэффициент выплат».

Нужно ли дообучать модель на ленте ПРАЙМ?

Да. Без fine-tuning любая базовая модель даёт F1 ~0,70. Дообучение RuBERTo на 5000 новостях за 2023–2025 поднимает метрики до 0,82–0,85. Процесс занимает 4–6 часов на одной видеокарте A100.

Какие промпты вы использовали для GPT?

Промпт: «Определи тональность новости (только positive/negative/neutral) для частного инвестора РФ. Учитывай влияние на цену акций на Мосбирже, игнорируй общие макроэкономические прогнозы. Ответь одним словом. Новость: {текст}». Без этого промпта точность падала на 12 %.

Источник: СберБанк — тестирование RuBERTo на финансовых новостях

Сколько стоит запуск такого анализа в месяц?

Для 1000 новостей в день: RuBERTo — ~5000–7000 ₽ на аренде GPU (Yandex Cloud), GPT-4 Turbo — 15 000–25 000 ₽ (токены ~2 млн/мес). Специализированная модель (FinBERT-RU) — ~3000 ₽, но точность ниже на 5–7 %.

Источник: Документация API GPT для сентимент-анализа

Какой минимальный бюджет на запуск?

От 15 000 ₽ в месяц на аренду GPU и API, если обрабатывать до 500 новостей в день.

Эксклюзив от ИнвестХомяка

Результаты тестирования на ленте ПРАЙМ (200 новостей, I кв. 2026)

МодельF1 (позитив)F1 (негатив)
RuBERTo-large0,830,81
GPT-4 Turbo0,810,78
FinBERT-RU (base)0,740,70
RuBERT (multilingual)0,690,65
Иллюстрация

Сравнение подходов: RuBERTo vs GPT-4 Turbo

КритерийRuBERTo (дообучен)GPT-4 Turbo
Скорость инференса на 100 новостей8–12 секунд35–50 секунд (API)
Чувствительность к контексту (слова «ожидание снижения»)Средняя (часто нейтрализует)Высокая (правильно оценивает)
Стоимость на 10 000 новостей~500–700 ₽~2500–4000 ₽
Простота интеграции (Python)Высокая (HuggingFace)Средняя (API + управление токенами)
Устойчивость к быстрым изменениям рынкаНизкая (требует переобучения раз в квартал)Высокая (zero-shot с актуальным промптом)

Как внедрить сентимент-анализ на ленте ПРАЙМ за 4 шага

  1. Шаг 1. Настройка парсинга ленты ПРАЙМ

    Используйте RSS (http://1prime.ru/export/rss2/index.xml) или API aggregator’а (например, SmartLab). Сохраняйте заголовок и тело новости. Ограничьте размер текста до 500 токенов для GPT.

  2. Шаг 2. Базовая предобработка

    Удалите HTML-теги, приведите к lowercase, замените тикеры (MOEX: SBER, GAZP) на единый формат. Добавьте столбец «дата публикации» для временного анализа.

  3. Шаг 3. Выбор модели и промпта

    Для RuBERTo: загрузите модель из HuggingFace (cointegrated/rubert-tiny2-sentiment) или дообученную версию. Для GPT: создайте системный промпт с правилами оценки тональности для частного инвестора РФ.

  4. Шаг 4. Агрегация и трейдинг

    Сентимент-скор (negative = -1, neutral = 0, positive = +1) усредняйте по 5 новостям за 30 минут. Прискор выше 0,4 — ждите роста, ниже -0,2 — стоп-сигнал. Сверяйте с объёмом торгов на Мосбирже.

  5. Шаг 5. Калибровка и backtest

    Еженедельно проверяйте до 50 новостей вручную, пересчитывайте точность. Если F1 упал ниже 0,75 — обновите датасет или замените модель. Без backtest запускаться в live нельзя.

Иллюстрация

Частые вопросы

Какой минимальный бюджет на запуск?

От 15 000 ₽ в месяц на аренду GPU и API, если обрабатывать до 500 новостей в день.

Нужна ли лицензия на использование RuBERTo?

Нет, модель распространяется по лицензии MIT. Финансирование через грант не требуется.

Почему не стоит использовать только GPT без дообучения?

Zero-shot GPT на финансовых новостях даёт F1 ~0,72, а после добавления правил (промпт) — ~0,81. Без промпта модель часто путает негатив с экспертной оценкой.

Как часто обновлять модель?

RuBERTo достаточно переобучать раз в квартал, GPT — менять промпт раз в месяц (под новые стратегии инвесторов).

Какие ещё модели стоит попробовать?

FinBERT-RU с fine-tuning на ПРАЙМ, а также T5-для-сентимента (Golovanov/RuTS). Наша практика: T5 даёт +2 % F1, но требует 3x больше данных для дообучения.

Истории участников клуба

Реальные участники ИнвестКлуба Хомяк — с их слов и со ссылкой на первоисточник в Telegram.

Наталья А.в клубе 1,5 года

Точка входазашла пробно на 1 месяц после рекламы

Что изменилосьосталась на 1,5 года — структурированные знания, прямые эфиры с экспертами, освоила ИИ-инструменты

«Когда-то я зашла пробно, на 1 месяц. Прошло 1,5 года, а я по-прежнему там. Один только искусственный интеллект чего стоит.»
история в Telegram →
Олегв клубе полгода

Точка входавозрастной скепсис, долго не решался зайти в закрытый клуб

Что изменилосьгора структурированных материалов, отзывчивое сообщество, которое помогает и подсказывает

«Возрастной скепсис мешал зайти — думал, всё как обычно. Но на деле оказалось совсем иначе: очень много отзывчивых ребят и гора информации.»
история в Telegram →

Что говорят участники клуба

«В Хомяке уже полтора года… кайфовое, живое сообщество. Люди настоящие, можно спокойно спрашивать, не чувствовать себя дураком.»
Олеготзыв в Telegram →
«Зашла пробно на 1 месяц. Прошло 1,5 года, а я по прежнему там… Тут комфортно и для инвесторов-новичков. Вся информация отлично структурирована.»
Наталья А.отзыв в Telegram →

Ещё реальные отзывы участников — t.me/traderreviews

Иллюстрация

Источники

Ежедневные разборы рынка — в канале @tradernocryПодписаться →