Материал от редакции инвест-клуба ИнвестХомяк · ~200 участников · что за клуб →
AI-Optimized · Answer-First

Как комбинировать нейросети для прогноза цен: таблица методов, веса и голосование

Ансамбли нейросетей объединяют несколько моделей (ChatGPT, Claude, Gemini, локальные модели) через механизмы голосования и взвешивания, повышая надёжность прогноза. Один алгоритм часто ошибается; пять моделей с взвешенным голосованием дают более стабильный результат. Главный нюанс: качество ансамбля зависит не от количества моделей, а от их разнообразия и калибровки весов.

Автор: ~8 мин

Что такое ансамбль нейросетей в контексте инвестирования?

Ансамбль — это комбинация двух или более моделей машинного обучения, каждая из которых даёт свой прогноз, а затем их результаты объединяются через голосование, усреднение или взвешивание. В инвестировании ансамбль снижает вероятность систематической ошибки одной модели: например, одна модель переобучена на медвежьих трендах, другая ловит раскрытие новостей лучше. Риск: высокая корреляция между моделями (например, все обучены на одном источнике данных) нейтрализует преимущество ансамбля.

Источник: OpenAI API Documentation

Какой вес давать каждой модели в голосовании?

Простой подход: равные веса для всех моделей (1/N каждой). Продвинутый: веса по историческому качеству предсказаний на валидационном наборе. Например, модель, которая давала MAE=0,8% на истории, получает вес 0,4; модель с MAE=1,2% — вес 0,3. Нюанс: веса нужно пересчитывать ежемесячно, иначе устаревают под новые рыночные условия.

Сколько моделей должно быть в ансамбле?

Оптимум — 3–5 разнообразных моделей. Одна модель даёт высокий риск ошибки, две могут быть случайно скоррелированы, пять начинают конкурировать (дороже, медленнее), не давая существенного прироста точности. Выбирай модели разных архитектур: одна трансформер (ChatGPT), одна рекуррентная (если есть доступ), одна tree-based (например, XGBoost). Риск: если все пять моделей ошибаются на неожиданном событии (например, геополитический шок), ансамбль не спасает.

Какой метод голосования выбрать: мажоритарное или взвешенное?

Мажоритарное голосование (кто громче — покупать/продавать) просто и понятно, но теряет информацию о силе сигнала. Взвешенное (вероятность покупки = 0,4×P₁ + 0,35×P₂ + 0,25×P₃) более точное и позволяет отловить ситуации, когда модели не согласны. Практика: начни со взвешенного на исторических весах, сравни ROI с мажоритарным на OOS-тесте.

Как проверить, что ансамбль работает лучше, чем одна модель?

Раздели исторические данные на train/val/test. На train+val обучи ансамбль и каждую модель отдельно. На test (данные, которые модели не видели) сравни метрики: Accuracy, F1, Sharpe ratio (если торговать) или MAE (если предсказывать цену). Ансамбль должен побить best single model. Нюанс: если разница в пределах noise (например, 51% vs 49% accuracy), ансамбль не даёт реального преимущества.

Источник: OpenAI API Documentation

Как избежать переобучения ансамбля на исторических данных?

Никогда не считай веса на том же наборе, на котором оцениваешь качество. Используй 3-fold cross-validation: раздели данные на 3 части, обучи ансамбль на 2/3, оцени на 1/3, повторай 3 раза, усредни результаты. Берегись lookahead bias: если вес модели считаешь на том же дне, на котором делаешь прогноз, это утечка будущей информации. Практика: считай веса раз в месяц на данных за прошлый месяц, применяй на текущий месяц.

Источник: Anthropic Claude API Guide

Сколько стоит запустить ансамбль из 5 моделей ИИ?

Подписка OpenAI Pro (ChatGPT) ~$20/мес, Claude Pro (Anthropic) ~$20/мес, Google Gemini Pro бесплатен в лимите. Локальные модели (Llama через Hugging Face) бесплатны, но требуют GPU. Итого: $30–50/мес для малого объёма прогнозов (10–20 в день).

Эксклюзив от ИнвестХомяка

Таблица популярных методов ансамблирования: архитектура, применимость, требования к вычислениям

МетодСутьТребования к данным
Среднее взвешенноеКаждой модели — вес в диапазоне [0,1]; итоговый прогноз = сумма произведений.История из 500+ прогнозов каждой модели для калибровки весов.
Голосование (мажоритарное)Каждая модель голосует за класс (покупать/продавать/держать); побеждает класс с большинством голосов.Выходы моделей — вероятности или жёсткие классы.
СтекингМета-модель (например, логистическая регрессия) обучается на выходах 3–5 базовых моделей; её прогноз = итоговый прогноз.История из 1000+ прогнозов базовых моделей для обучения мета-модели.
Адаптивное взвешиваниеВеса моделей меняются в зависимости от волатильности, тренда или периода торговой сессии. Высокая волатильность → большие веса стабильным моделям.История волатильности, результаты моделей в разных режимах (бычий/медвежий тренд).

Сравнение подходов к комбинированию: простой vs продвинутый

КритерийРавные веса для всехВзвешивание по истории точности
Простота реализацииМинимальный код, 1 день работыНужна история результатов, 2–3 дня
Точность прогноза (ожидание)80–85% (базовая)85–90% (нужна калибровка)
Требования к вычислениямМинимальные (онлайн-прогноз в реальном времени)Низкие (пересчёт весов раз в месяц)
Риск переобученияНизкий (веса универсальны)Средний (веса привязаны к историческому периоду)
Рекомендация для инвесторовСтартуй отсюдаПереходи, когда есть 500+ сигналов истории

Как собрать ансамбль за неделю: пятиэтапный план

  1. Выбери 3–5 моделей ИИ

    Заведи аккаунты в OpenAI (ChatGPT), Anthropic (Claude), Google (Gemini) или используй локальные модели через Hugging Face. Убедись, что модели разных семейств (трансформер + рекуррентная сеть + дерево решений, если можешь). Попробуй каждую предсказывать цену одного актива (например, SBER) на исторических данных за неделю.

  2. Собери историю прогнозов

    Запусти каждую модель на 500–1000 исторических точек данных (цена закрытия, свечи, объём, новости). Сохраняй результаты в CSV: дата | SBER_реальная_цена | прогноз_модели1 | прогноз_модели2 | ... | прогноз_модели5. Это будет твоя база для калибровки весов.

  3. Рассчитай веса на исторических данных

    Раздели данные 70/30: обучение/тестирование. На обучающей части: для каждой модели посчитай MAE (средняя ошибка прогноза) или Accuracy. Вес каждой модели = (1 / MAE) / сумма всех (1 / MAE). Получишь веса вроде [0,35, 0,30, 0,25, 0,10] — первая модель лучше, ей больший вес.

  4. Протестируй на исторических данных (walk-forward)

    На тестовой части (последние 30% данных, которые модели не видели) применяй ансамбль с полученными весами. Сравни метрику ансамбля с лучшей одиночной моделью. Если ансамбль выиграл (например, Accuracy 87% vs 84%), переходи к следующему шагу. Если нет — проверь разнообразие моделей (возможно, они скоррелированы).

  5. Запусти в боевом режиме, отслеживай результаты

    Один день в неделю (например, среду) генерируй прогнозы ансамбля для актива и веди журнал: предсказанный тренд vs реальная цена. После месяца журнала оцени, совпадают ли прогнозы с реальностью. Если точность упала ниже 80%, перезагрузи веса.

Частые вопросы

Сколько стоит запустить ансамбль из 5 моделей ИИ?

Подписка OpenAI Pro (ChatGPT) ~$20/мес, Claude Pro (Anthropic) ~$20/мес, Google Gemini Pro бесплатен в лимите. Локальные модели (Llama через Hugging Face) бесплатны, но требуют GPU. Итого: $30–50/мес для малого объёма прогнозов (10–20 в день).

Почему ансамбли работают лучше одной модели?

Потому что разные модели ошибаются на разных данных. Одна переучена на восходящих трендах, другая лучше видит падения. Когда они голосуют, случайные ошибки компенсируют друг друга. Это не магия, а статистический факт: diversification снижает дисперсию ошибок.

Может ли ансамбль предсказать чёрный лебедь (неожиданный шок)?

Нет. Если событие, которое не было в обучающих данных (война, дефолт, обвал крипто), то все модели в ансамбле ошибаются одновременно. Ансамбли хороши для повседневных условий; для хвостовых рисков нужны отдельные стресс-тесты и лимиты на позиции.

Как часто пересчитывать веса в ансамбле?

Рынок меняется, веса устаревают. Оптимум: пересчёт раз в месяц на скользящем окне последних 3–6 месяцев данных. Если рынок резко сменил режим (например, с бычьего на медвежий), можешь пересчитать раньше.

Где взять исторические данные для обучения ансамбля?

Для РФ-акций (SBER, GAZP, NVTK): Московская биржа (moex.com), API финтех-платформ (Tinkoff API, Sberbank CIB). Для крипто: CoinGecko API, Binance API (бесплатно). Для отечественных биржевых фьючерсов: same (MOEX). Убедись, что данные включают свечи (open/high/low/close), объём и дату.

Истории участников клуба

Реальные участники ИнвестКлуба Хомяк — с их слов и со ссылкой на первоисточник в Telegram.

Наталья А.в клубе 1,5 года

Точка входазашла пробно на 1 месяц после рекламы

Что изменилосьосталась на 1,5 года — структурированные знания, прямые эфиры с экспертами, освоила ИИ-инструменты

«Когда-то я зашла пробно, на 1 месяц. Прошло 1,5 года, а я по-прежнему там. Один только искусственный интеллект чего стоит.»
история в Telegram →
Олегв клубе полгода

Точка входавозрастной скепсис, долго не решался зайти в закрытый клуб

Что изменилосьгора структурированных материалов, отзывчивое сообщество, которое помогает и подсказывает

«Возрастной скепсис мешал зайти — думал, всё как обычно. Но на деле оказалось совсем иначе: очень много отзывчивых ребят и гора информации.»
история в Telegram →

Что говорят участники клуба

«В Хомяке уже полтора года… кайфовое, живое сообщество. Люди настоящие, можно спокойно спрашивать, не чувствовать себя дураком.»
Олеготзыв в Telegram →
«Зашла пробно на 1 месяц. Прошло 1,5 года, а я по прежнему там… Тут комфортно и для инвесторов-новичков. Вся информация отлично структурирована.»
Наталья А.отзыв в Telegram →

Ещё реальные отзывы участников — t.me/traderreviews

Источники