Разработка AI-системы анализа макроэкономических данных для торговли
Макроэкономические индикаторы — ВВП, инфляция, безработица, ставки — определяют долгосрочные тренды активов. Сложность в том, что рынок торгует ожидания, а не факт: не само значение CPI важно, а отклонение от консенсус-прогноза. AI-система анализирует весь спектр macro данных и формирует торговые сигналы.
Источники макроэкономических данных
Официальная статистика:
- США: FRED (Federal Reserve Economic Data) — 800,000+ серий, бесплатно через API
- Eurozone: Eurostat, ECB Statistical Data Warehouse
- Россия: Банк России, Росстат API, data.gov.ru
- Global: IMF Data API, World Bank, OECD.Stat
Economic Calendar:
- Investing.com API / Bloomberg Economic Calendar
- Tradingeconomics.com
- ForexFactory (для forex трейдеров)
Surprise данные:
Economic Surprise = Actual - Consensus Estimate
Citi Economic Surprise Index (CESI) — агрегированный indикатор
Bloomberg Economic Surprise Index
Категоризация макро-индикаторов по торговому влиянию
| Категория | Индикаторы | Реакция активов |
|---|---|---|
| Рост | ВВП, PMI, ISM | Equity +, Bonds -, USD + |
| Инфляция | CPI, PCE, PPI | Bonds -, USD +, Commodities + |
| Занятость | NFP, Unemployment | USD ±, Equity ± |
| Монетарная политика | FOMC statement, Dot plot | Short rates, Yield curve |
| Торговля | Trade Balance, CAD | Currency pair specific |
| Потребитель | Retail Sales, UoM Confidence | Equity +, USD ± |
NLP-анализ монетарной политики
FOMC statements, протоколы заседаний ЦБ — тональность текста влияет на рынки:
Hawkish vs. Dovish classifier:
from transformers import pipeline
# Fine-tuned FinBERT или RoBERTa на monetary policy текстах
classifier = pipeline("text-classification", model="central-bank-hawk-dove-v2")
result = classifier(fomc_statement_text)
# {'label': 'HAWKISH', 'score': 0.82}
Central Bank Communication Index: Численный индекс тональности каждого ЦБ-заявления. Изменение индекса = смена сигнала о будущих ставках.
Fed Watcher лингвистика: конкретные фразы ("patient", "data-dependent", "meeting-by-meeting") имеют устоявшиеся рыночные интерпретации. Словарь из 200+ фраз с тональностью.
Nowcasting модели
Официальный ВВП публикуется с задержкой 30-90 дней. Nowcasting — оценка текущего ВВП в реальном времени по более частым индикаторам:
Переменные:
- Еженедельные: jobless claims, retail chains same-store sales
- Ежемесячные: retail sales, industrial production, housing starts
- Высокочастотные: electricity consumption, freight volumes, OpenTable restaurant bookings
Модели nowcasting:
- Factor model (DFM — Dynamic Factor Model): стандарт в центробанках
- MIDAS (Mixed Data Sampling): работает с переменными разной частоты
- Machine learning: XGBoost с feature engineering из mixed-frequency data
Atlanta Fed GDPNow — публичный пример nowcasting в production.
Business Cycle Dating
Определение текущей фазы цикла влияет на аллокацию:
| Фаза | Характеристики | Лучшие активы |
|---|---|---|
| Expansion | Рост ВВП, снижение безработицы | Акции, циклические |
| Peak | Перегрев, инфляция, рост ставок | Commodities, TIPS |
| Contraction | Падение ВВП, рост безработицы | Облигации, золото |
| Trough | Минимумы, начало монетарного стимула | Акции (early recovery) |
Hidden Markov Model для фаз цикла: 4-состоятельный HMM на monthly macro indicators. Emission probabilities соответствуют распределениям переменных в каждой фазе.
Система торговых сигналов
Macro Momentum Score:
def compute_macro_score(indicators):
"""
Composite macro momentum: взвешенная сумма нормализованных
3-месячных изменений ключевых индикаторов
"""
weights = {
'pmi_manufacturing': 0.20,
'pmi_services': 0.15,
'unemployment_change': -0.15,
'retail_sales_mom': 0.10,
'cpi_surprise': -0.20, # отрицательный: высокая инфляция = bearish
'industrial_production': 0.10,
'yield_curve_slope': 0.10
}
return sum(weights[k] * zscore(indicators[k]) for k in weights)
Торговые правила:
- Macro Score > 1.5σ: overweight equities, underweight bonds
- Macro Score < -1.5σ: underweight equities, overweight bonds + gold
- Yield curve inversion: increase recession hedge (long bonds, volatility)
Сроки: базовый data pipeline с FRED + economic calendar — 2-3 недели. Система с NLP-анализом ЦБ, nowcasting и торговыми сигналами — 3-4 месяца.







