Частые вопросы
Сколько времени занимает fine-tuning на ноутбуке без GPU?
На CPU — 4–12 часов для 500–1000 баров. На GPU (например, NVIDIA RTX 3060) — 15–45 минут. Если нет GPU дома, используй Colab (бесплатно, 12 часов в сессию) или облачный сервис (Google Compute, AWS SageMaker ~$0,5–2 за час).
Как узнать, пригодны ли активы для переноса знаний?
Рассчитай корреляцию returns: если для двух активов корреляция >0,6, перенос обычно работает. Второй способ: обучи модель на исходном активе, применй к целевому без fine-tuning. Если точность хотя бы 45–50% (выше случайности 25%), переносимые паттерны есть.
Что если у целевого актива совсем мало истории?
Используй agressive fine-tuning: заморозь только первые 2–3 слоя, размораживай остальное. Либо комбинируй несколько источников данных (например, приплюси историю похожего актива в датасет с весом 0,3). Если истории <100 баров, перенос может не сработать — попробуй простые правила (moving average, RSI).
Как защитить fine-tuned модель от переобучения?
Используй dropout (вероятность отключения нейронов 0,2–0,4) и L2-регуляризация (weight decay 0,0001–0,001). Контролируй разрыв между обучением и валидацией: если gap >10%, увеличь регуляризацию. Наконец, выбери валидационный набор из будущего периода (не случайный) — это имитирует реальную торговлю.
Можно ли комбинировать fine-tuning разных моделей (ансамбль)?
Да. Натренируй fine-tuned версии 2–3 предобученных моделей на одних данных. Для прогноза усредни их выходы с весами, пропорциональными их валидационной точности. Ансамбль обычно даёт RMSE на 5–10% лучше, чем одна модель, ценой большего расхода памяти.