Сколько факторов оптимально для AI-модели?
Эмпирическое правило для рынка РФ — 3—5 значимых переменных. При 10+ факторах ошибка на тестовой выборке растёт в 2—3 раза из-за мультиколлинеарности. Пример: модель c макростатистикой, волатильностью индекса MOEX и ставкой ЦБ (~16—18%) показывает среднюю ошибку 12—15%. Добавление ещё 7 факторов (цены нефти, курс юаня, объёмы IPO) не снижает ошибку, а переобучает модель под шум 2024—2025 годов.