Разработка AI-модели прогнозирования волатильности
Прогнозирование волатильности — ключевая задача для опционного трейдинга, управления рисками и аллокации позиций. В отличие от прогноза цены (почти невозможно), волатильность кластеризуется и предсказуема: высокая волатильность сегодня предсказывает высокую волатильность завтра.
Типы волатильности
Historical Volatility (HV): реализованная волатильность за прошлый период. Простейшее вычисление: стандартное отклонение log returns × √252 (годовая). Зависит от выбранного окна: 10d, 21d, 63d дают разные значения.
Implied Volatility (IV): рыночная оценка будущей волатильности, "встроенная" в цены опционов (обратная задача Блэка-Шоулза). VIX — 30-дневная implied volatility S&P500.
Realized Volatility (RV): высокочастотная оценка истинной волатильности. Вычисляется из внутридневных returns: RV = √(Σ r_i²). Более точная оценка, чем стандартная HV.
GARCH и его расширения
GARCH(1,1) — базовый статистический подход:
σ²_t = ω + α × ε²_{t-1} + β × σ²_{t-1}
Параметры: ω (базовая волатильность), α (shock persistence), β (variance persistence). Сумма α+β близка к 1 = persistence эффект.
Расширения:
- GJR-GARCH / EGARCH: асимметрия (leverage effect — падения увеличивают волатильность сильнее, чем рост)
- GARCH-DCC: Dynamic Conditional Correlation — корреляционная матрица для портфеля
- HAR-RV (Heterogeneous Autoregressive RV): использует дневную, недельную и месячную RV как предикторы
ML-модели волатильности
Feature set:
features = {
'rv_1d': realized_volatility(returns, '1D'),
'rv_5d': realized_volatility(returns, '5D'),
'rv_22d': realized_volatility(returns, '22D'),
'iv_atm': implied_volatility_atm, # если доступно
'iv_skew': iv_25d_put - iv_25d_call,
'vix': vix_level,
'vvix': vvix, # volatility of VIX
'volume_ratio': volume / sma_volume_20d,
'return_1d': log_return_1d,
'abs_return_5d': abs(log_return_5d)
}
Нейросетевые модели:
- LSTM с RV features: хорошо захватывает volatility clustering
- WaveNet: dilated causal convolutions для длинных контекстов
- Transformer: позволяет attended на разные временные горизонты
Сравнительный результат (MSE на 1-day forecast): HAR-RV → GARCH → LightGBM → LSTM ≈ Transformer. Разница между лучшими ML и HAR-RV: 5-15% по MSE. HAR-RV неожиданно сильный baseline.
Прогноз Volatility Surface
Для опционного desk нужен прогноз не одной точки, а поверхности волатильности (IV по всем страйкам и экспирациям):
Параметрические модели:
- SVI (Stochastic Volatility Inspired) параметризация: 5 параметров на каждый slice
- SSVI (Surface SVI): добавляет no-arbitrage constraints
ML для surface dynamics:
- PCA на исторических поверхностях → предсказание PC coefficients → реконструкция поверхности
- Autoencoder + temporal model (LSTM): кодирование поверхности, предсказание в latent space
Применение прогнозов волатильности
Options trading:
- IV > predicted RV → опционы дорогие → short vega strategies (short straddle)
- IV < predicted RV → опционы дешёвые → long vega (buy gamma)
- Volatility premium: IV в среднем на 10-30% выше RV — это VRP (Volatility Risk Premium)
Position sizing:
Position_Size = Risk_Budget / (ATR_multiplier × Forecast_Volatility)
При высокой предсказанной волатильности — меньше позиция. Это Kelly Criterion в действии.
Risk management:
- VaR (Value at Risk): зависит от волатильности, обновляется динамически
- CVaR / Expected Shortfall: регуляторное требование Basel III
- Margin requirements: для futures/options — динамический расчёт залога
Production система
Stack:
- QuantLib / py_vollib для теоретических вычислений
- Polygon.io / CBOE для IV данных
- ClickHouse для хранения высокочастотных RV данных
- Airflow для ежедневного пересчёта прогнозов
Мониторинг: Mincer-Zarnowitz regression для оценки calibration: прогнозируемая волатильность должна быть несмещённым предсказателем реализованной. Bias correction при систематическом отклонении.
Сроки: HAR-RV baseline + GARCH сравнение — 2-3 недели. ML-модель с volatility surface и интеграцией с trading system — 8-12 недель.







