Классический технический анализ предлагает оценивать графики «глазами». Однако в долгосрочной перспективе ручной поиск закономерностей на финансовых рынках сталкивается с человеческим фактором и ограниченностью восприятия. В рамках нашей R&D-лаборатории мы разработали собственную предиктивную систему анализа акций, основанную на машинном обучении, чтобы проверить: можно ли стабильно выделять чистые сигналы из рыночного шума.

Главная идея эксперимента состояла в том, чтобы уйти от субъективной оценки графиков. Вместо этого мы решили построить модель машинного обучения, которая оценивает рынок по широкому спектру факторов и выдает математически обоснованную вероятность движения цены — вверх или вниз.
На практике задача оказалась значительно сложнее стандартного скрипта с парой технических индикаторов. Для получения качественного прогноза потребовалось спроектировать полноценный многоуровневый конвейер данных (Data Pipeline).
Модель обучалась на комплексе признаков, описывающих состояние рынка с разных сторон:
Для обучения моделей использовалась детальная 5-летняя историческая глубина рынка. Простые алгоритмы классификации плохо работают со временными последовательностями, поэтому ядро системы было реализовано в виде ансамбля из двух моделей:
Чтобы исключить эффект подгонки под исторические данные (overfitting), система проходит жесткий процесс валидации:
График: Пример отработки предиктивной модели на исторических данных и сравнение прогнозной траектории с реальным графиком цены.
Этот R&D проект отлично иллюстрирует реалии разработки современных систем искусственного интеллекта. Генеративные модели (AI) могут помочь написать отдельный кусок кода или оптимизировать функцию. Но собрать такую систему целиком, спроектировать пайплайны данных, настроить валидацию и связать разрозненные модули в единый стабильно работающий организм — это сложная инженерная задача, требующая классического опыта системного разработчика.
В дальнейших планах нашей лаборатории — исследование зон эффективности модели (где алгоритм дает наиболее точные сигналы) и детальный разбор условий, при которых происходят ложные срабатывания.