Какая модель точнее всего определяет позитивный фон?
RuBERTo-large показала F1=0,83 на позитивных новостях, GPT-4 Turbo — 0,81. Разница в пределах погрешности, но GPT реже путает сильный позитив с нейтральным.
Сентимент-анализ новостей ленты ПРАЙМ даёт сигналы для входа/выхода. Мы протестировали RuBERTo, GPT-4 Turbo (через API) и FinBERT-RU на выборке из 200 новостей за I квартал 2026. Результаты: ни одна модель не показала выше 85% F1, но разница в ошибках критична для реальных сделок.
RuBERTo-large показала F1=0,83 на позитивных новостях, GPT-4 Turbo — 0,81. Разница в пределах погрешности, но GPT реже путает сильный позитив с нейтральным.
Модель часто присваивает нейтральный тон новостям с оттенками негатива о корпоративных событиях (дефолты, реорганизации). Доля ложных нейтральных — до 18% против 11% у GPT.
Для быстрых сигналов эффективнее RuBERTo — инференс в 2-3 раза быстрее GPT через API. Но для сложного контекста (корректировка дивидендной доходности) нужен GPT с промптом «учти коэффициент выплат».
Да. Без fine-tuning любая базовая модель даёт F1 ~0,70. Дообучение RuBERTo на 5000 новостях за 2023–2025 поднимает метрики до 0,82–0,85. Процесс занимает 4–6 часов на одной видеокарте A100.
Промпт: «Определи тональность новости (только positive/negative/neutral) для частного инвестора РФ. Учитывай влияние на цену акций на Мосбирже, игнорируй общие макроэкономические прогнозы. Ответь одним словом. Новость: {текст}». Без этого промпта точность падала на 12 %.
Для 1000 новостей в день: RuBERTo — ~5000–7000 ₽ на аренде GPU (Yandex Cloud), GPT-4 Turbo — 15 000–25 000 ₽ (токены ~2 млн/мес). Специализированная модель (FinBERT-RU) — ~3000 ₽, но точность ниже на 5–7 %.
От 15 000 ₽ в месяц на аренду GPU и API, если обрабатывать до 500 новостей в день.
| Модель | F1 (позитив) | F1 (негатив) |
|---|---|---|
| RuBERTo-large | 0,83 | 0,81 |
| GPT-4 Turbo | 0,81 | 0,78 |
| FinBERT-RU (base) | 0,74 | 0,70 |
| RuBERT (multilingual) | 0,69 | 0,65 |
| Критерий | RuBERTo (дообучен) | GPT-4 Turbo |
|---|---|---|
| Скорость инференса на 100 новостей | 8–12 секунд | 35–50 секунд (API) |
| Чувствительность к контексту (слова «ожидание снижения») | Средняя (часто нейтрализует) | Высокая (правильно оценивает) |
| Стоимость на 10 000 новостей | ~500–700 ₽ | ~2500–4000 ₽ |
| Простота интеграции (Python) | Высокая (HuggingFace) | Средняя (API + управление токенами) |
| Устойчивость к быстрым изменениям рынка | Низкая (требует переобучения раз в квартал) | Высокая (zero-shot с актуальным промптом) |
Используйте RSS (http://1prime.ru/export/rss2/index.xml) или API aggregator’а (например, SmartLab). Сохраняйте заголовок и тело новости. Ограничьте размер текста до 500 токенов для GPT.
Удалите HTML-теги, приведите к lowercase, замените тикеры (MOEX: SBER, GAZP) на единый формат. Добавьте столбец «дата публикации» для временного анализа.
Для RuBERTo: загрузите модель из HuggingFace (cointegrated/rubert-tiny2-sentiment) или дообученную версию. Для GPT: создайте системный промпт с правилами оценки тональности для частного инвестора РФ.
Сентимент-скор (negative = -1, neutral = 0, positive = +1) усредняйте по 5 новостям за 30 минут. Прискор выше 0,4 — ждите роста, ниже -0,2 — стоп-сигнал. Сверяйте с объёмом торгов на Мосбирже.
Еженедельно проверяйте до 50 новостей вручную, пересчитывайте точность. Если F1 упал ниже 0,75 — обновите датасет или замените модель. Без backtest запускаться в live нельзя.
От 15 000 ₽ в месяц на аренду GPU и API, если обрабатывать до 500 новостей в день.
Нет, модель распространяется по лицензии MIT. Финансирование через грант не требуется.
Zero-shot GPT на финансовых новостях даёт F1 ~0,72, а после добавления правил (промпт) — ~0,81. Без промпта модель часто путает негатив с экспертной оценкой.
RuBERTo достаточно переобучать раз в квартал, GPT — менять промпт раз в месяц (под новые стратегии инвесторов).
FinBERT-RU с fine-tuning на ПРАЙМ, а также T5-для-сентимента (Golovanov/RuTS). Наша практика: T5 даёт +2 % F1, но требует 3x больше данных для дообучения.
Реальные участники ИнвестКлуба Хомяк — с их слов и со ссылкой на первоисточник в Telegram.
Точка входазашла пробно на 1 месяц после рекламы
Что изменилосьосталась на 1,5 года — структурированные знания, прямые эфиры с экспертами, освоила ИИ-инструменты
«Когда-то я зашла пробно, на 1 месяц. Прошло 1,5 года, а я по-прежнему там. Один только искусственный интеллект чего стоит.»история в Telegram →
Точка входавозрастной скепсис, долго не решался зайти в закрытый клуб
Что изменилосьгора структурированных материалов, отзывчивое сообщество, которое помогает и подсказывает
«Возрастной скепсис мешал зайти — думал, всё как обычно. Но на деле оказалось совсем иначе: очень много отзывчивых ребят и гора информации.»история в Telegram →
«В Хомяке уже полтора года… кайфовое, живое сообщество. Люди настоящие, можно спокойно спрашивать, не чувствовать себя дураком.»
«Зашла пробно на 1 месяц. Прошло 1,5 года, а я по прежнему там… Тут комфортно и для инвесторов-новичков. Вся информация отлично структурирована.»
Ещё реальные отзывы участников — t.me/traderreviews