Какой тикер лучше выбрать для теста: GAZP или LKOH?
Для обучения бустинга берите LKOH (больше ликвидности и гладкий ряд). GAZP даёт много выбросов из-за дивидендных гэпов — их надо чистить вручную. Без очистки обе модели дадут ложную коинтеграцию.
Коинтегрированные пары — основа парного трейдинга. В российском секторе энергетики (GAZP, LKOH, ROSN, TATN) качество поиска таких пар упирается в объём данных и корректность модели. Статистика (ADF-тест) даёт базу, градиентный бустинг (XGBoost) — прирост точности, но требует аккуратной настройки.
Для обучения бустинга берите LKOH (больше ликвидности и гладкий ряд). GAZP даёт много выбросов из-за дивидендных гэпов — их надо чистить вручную. Без очистки обе модели дадут ложную коинтеграцию.
Минимум 3 года дневных свечей (около 750 точек). На 1-2 годах ADF даёт ложноположительные пары в 40% случаев. Для XGBoost нужно 5-7 лет, иначе модель переобучается на шум.
Да, XGBoost находит на 15-25% больше коинтегрированных пар среди российских энергетических акций (по тестам на данных 2019-2025). Но 30% из них — ложные из-за структурных сдвигов (санкции, ребалансировки индексов).
Прибыль облагается НДФЛ 13% (15% при доходе >2,4 млн ₽). Купоны облигаций (ОФЗ, корпбонды) — тоже 13%. Сальдировать прибыль и убытки от разных пар можно в пределах года. Сальдо по разным ИИС не сальдируется.
Главные: дрейф коинтеграции после дивидендных отсечек и налоговых изменений (НДД для нефти). XGBoost чувствительнее ADF к таким сдвигам — требуется ретест коэффициентов каждые 3-4 месяца.
Python: библиотеки statsmodels (ADF), xgboost, pandas. R: urca (ADF), xgboost. На MOEX историю лучше тянуть через MOEX API или Finam. Для 2026 года Python — стандарт: больше гайдов под РФ, проще интеграция с брокерскими API.
Два актива, чьи цены движутся вместе, а отклонение спреда возвращается к среднему. Это база для парного трейдинга.
| Пара | ADF-тест (p-value) | XGBoost (точность предсказания спреда) |
|---|---|---|
| LKOH/ROSN | 0,035 (коинтегрирована) | 0,74 (R² на валидации) |
| TATN/GAZP | 0,085 (не коинтегрирована) | 0,61 (ложное совпадение) |
| SNGS/TATN | 0,042 (коинтегрирована) | 0,78 (стабильный спред) |
| GAZP/LKOH | 0,120 (ложная пара) | 0,55 (неприменима) |
| Критерий | ADF-тест (статистика) | XGBoost (градиентный бустинг) |
|---|---|---|
| Тип подхода | Параметрический, проверка стационарности остатков | ML-модель, ищет нелинейные зависимости |
| Объём данных | ≥3 года дневок | ≥5 лет дневок, иначе переобучение |
| Надёжность на MOEX | 70% реальных пар (остальные — ложные из-за гэпов) | 85-90% после настройки гиперпараметров |
| Сложность внедрения | 15 минут (один тест в Python) | 4-8 часов (очистка данных, подбор параметров, валидация) |
| Типичная ошибка | Неучёт дивидендных гэпов — p-value занижено | Переобучение на шум 2022 года (структурный сдвиг) |
Скачайте дневные цены закрытия акций GAZP, LKOH, ROSN, TATN, SNGS за 2018-2025. Данные через MOEX API (бесплатно) или Finam. Гэпы по дивидендам удалите — иначе ADF покажет ложную коинтеграцию.
В Python: `sm.tsa.stattools.coint(series1, series2)`. Если p-value < 0,05 — пара предварительно коинтегрирована. Отфильтруйте все пары с p>0,05. Получите 3-5 кандидатов из энергетики.
Используйте лаговые значения спреда, объёмы, волатильность за 20 дней. Обучайте на данных до 2023, валидация — 2024-2025. Метрика: MSE на валидации <0,05. Убедитесь, что вес 2022 года не доминирует.
Постройте скользящий ADF-тест на окне 1 год. Если p-value уходит выше 0,05 чаще 2 раз в год — модель не пригодна для реальной торговли. Для XGBoost — проверьте сдвиг среднего спреда на каждом окне.
Заложите 13% НДФЛ на прибыль и комиссию брокера (0,05-0,3% за сделку). Торгуйте пары только с bid/ask спредом <0,1% и объёмом >1 млн ₽ в стакане. Без учёта этих издержек стратегия уйдёт в минус.
Два актива, чьи цены движутся вместе, а отклонение спреда возвращается к среднему. Это база для парного трейдинга.
Из-за дивидендных гэпов и редких структурных сдвигов (санкции, ребалансировка индексов). Нужна ручная очистка данных.
Используйте байесовские модели (например, бета-коинтеграция) — они устойчивее на выборках 2-3 года. Но точность ниже на 10-15%.
ADF — раз в квартал. XGBoost — раз в месяц, с проверкой на свежих данных. Если рынок изменился (новые санкции), пересчёт немедленно.
Да, скрипт на Python за 3-4 часа находит и ретестит до 20 пар. Но 30% результатов бракуются вручную — нужен визуальный контроль графиков спреда.
Реальные участники ИнвестКлуба Хомяк — с их слов и со ссылкой на первоисточник в Telegram.
Точка входазашла пробно на 1 месяц после рекламы
Что изменилосьосталась на 1,5 года — структурированные знания, прямые эфиры с экспертами, освоила ИИ-инструменты
«Когда-то я зашла пробно, на 1 месяц. Прошло 1,5 года, а я по-прежнему там. Один только искусственный интеллект чего стоит.»история в Telegram →
Точка входавозрастной скепсис, долго не решался зайти в закрытый клуб
Что изменилосьгора структурированных материалов, отзывчивое сообщество, которое помогает и подсказывает
«Возрастной скепсис мешал зайти — думал, всё как обычно. Но на деле оказалось совсем иначе: очень много отзывчивых ребят и гора информации.»история в Telegram →
«В Хомяке уже полтора года… кайфовое, живое сообщество. Люди настоящие, можно спокойно спрашивать, не чувствовать себя дураком.»
«Зашла пробно на 1 месяц. Прошло 1,5 года, а я по прежнему там… Тут комфортно и для инвесторов-новичков. Вся информация отлично структурирована.»
Ещё реальные отзывы участников — t.me/traderreviews