Реализация предсказания спроса на товары (Demand Forecasting)
Прогнозирование спроса в ритейле и производстве — классическая задача операционного управления. Ошибка в меньшую сторону ведёт к упущенным продажам (out-of-stock), в большую — к излишкам запасов и списаниям. ML-подход в сравнении с ARIMA и экспертными методами снижает MAPE на 20-40% при правильной постановке.
Специфика задачи
Иерархия прогнозирования: Обычно нужны прогнозы на нескольких уровнях одновременно:
- Компания в целом → дивизион → категория → SKU → SKU × склад
- Temporal coherence: сумма прогнозов SKU должна совпадать с прогнозом категории
Методы reconciliation: bottom-up (агрегируем снизу), top-down (распределяем сверху), MinT (Minimum Trace) — математически оптимальный.
Масштаб: Ритейлер с 10 000 SKU × 50 складов × 365 дней = 182.5M прогнозов в год. Каждая модель на каждый SKU-склад — не реалистично. Нужны global models.
Подходы к моделированию
Global Deep Learning модели (рекомендуемый подход для крупного ритейла):
- DeepAR (Amazon): Autoregressive RNN, работает как глобальная модель по всем SKU
- N-BEATS / N-HiTS: interpretable нейросети специально для временных рядов
- Temporal Fusion Transformer (TFT): state-of-the-art для hierarchical forecasting с known covariates
Преимущество: одна модель обучается на всех SKU и извлекает общие паттерны (паттерны выходного дня работают для большинства товаров).
Gradient Boosting для ритейла: LightGBM с лаговыми признаками — часто лучший компромисс speed/accuracy:
- Lag features: продажи t-1, t-7, t-14, t-28, t-365
- Rolling stats: среднее, медиана, std за 7/28/90 дней
- Calendar: день недели, месяц, неделя года, праздники
- Price и промо-флаги: текущая цена, скидка %, флаг акции
Intermittent demand (редкие продажи): Croston's method, ADIDA, IMAPA — специальные методы для SKU с нечастыми продажами (sporadics). Неподходящие методы дают катастрофические ошибки для таких позиций.
Внешние факторы
| Фактор | Источник | Влияние |
|---|---|---|
| Промо-активность | Trade calendar | +50-300% в период акции |
| Праздники | Calendar + HR | Специфично по категории |
| Погода | OpenWeatherMap API | Сезонные товары ±30-50% |
| Конкурентные цены | Парсинг / DataWeave | Эластичность спроса |
| Тренды | Google Trends | Новые товары без истории |
Промо-lift модель — критическая часть: нужно предсказать не просто прогнозируемый спрос, а incremental спрос от конкретного промо-механизма (скидка 10% vs. 2+1).
Производственное прогнозирование
В производстве задача усложняется:
- Прогноз спроса → план производства → план закупки сырья
- Производственные мощности как ограничение
- Lead time поставщиков: спрос через 3 месяца определяет заказ сейчас
MRP II / APS-системы (SAP PP, OMP, Kinaxis) интегрируются с ML-прогнозом через API или файловый обмен. AI даёт прогноз, APS-система транслирует в производственный план с учётом мощностей.
Метрики и бэктестинг
Правильное бэктестирование — walk-forward validation:
- Обучение на данных до даты D
- Прогноз на горизонт H (28 дней)
- Сдвиг вперёд на H, повтор
- Усреднение ошибок по всем периодам
Метрики:
- MAPE: недостаток — взрывается при малых значениях (деление на 0)
- SMAPE (Symmetric MAPE): более устойчив
- RMSSE (Root Mean Squared Scaled Error): нормирован на наивный прогноз
- Bias: систематический перепрогноз или недопрогноз (важен для управления запасами)
Интеграция с SCM
- SAP S/4HANA: IBP (Integrated Business Planning) имеет native ML-интеграцию или файловый импорт прогнозов
- Oracle SCM: импорт прогнозов через REST API в Demand Management
- Собственные WMS: прямая запись в PostgreSQL / API endpoint
Сроки: глобальная LightGBM-модель с базовыми фичами для 1 000-10 000 SKU — 4-6 недель. Иерархическое прогнозирование с промо-лифтом и SCM-интеграцией — 4-6 месяцев.







