Услуги анализа временных рядов

Проектируем и внедряем системы искусственного интеллекта: от прототипа до production-ready решения. Наша команда объединяет экспертизу в машинном обучении, дата-инжиниринге и MLOps, чтобы AI работал не в лаборатории, а в реальном бизнесе.

8+Лет на рынкеподробнее 900+Реализованных проектовподробнее 100+Разработчиков в штатеподробнее 19+Партнеровподробнее

Предлагаемые услуги

Показано 99 из 99 услугВсе 1566 услуг

AI-система прогнозирования спортивных событий для букмекеров

Сложная

от 1 недели до 3 месяцев

AI-система прогнозирования природных катастроф

Сложная

от 1 недели до 3 месяцев

AI-система медиапланирования (Media Mix Modeling AI)

Средняя

~2-4 недели

AI-система атрибуции конверсий (Multi-Touch Attribution AI)

Средняя

~2-4 недели

AI-система оптимизации химических процессов

Сложная

от 1 недели до 3 месяцев

AI-система предиктивного обслуживания оборудования на химическом производстве

Средняя

~2-4 недели

AI-система автоматического кормления рыб (Feeding Optimization AI)

Средняя

~2-4 недели

AI-система мониторинга качества воды в аквакультуре

Средняя

~2-4 недели

AI-система прогнозирования улова

Средняя

~2-4 недели

Часто задаваемые вопросы

Направления AI-разработки

Обсудить AI-проект

Бесплатная консультация — расскажем, как AI решит вашу задачу

Оценить стоимость

Рассчитаем бюджет и сроки вашего AI-проекта

Этапы разработки AI-решения

Последние работы

Разработка сайта компании B2B ADVANCE
1240
Разработка веб-приложения для компании FEEDME
1167
Разработка веб-сайта для компании БЕЛФИНГРУПП
867
Разработка интернет магазина для компании FURNORO
1084
Разработка логотипа компании B2B Advance
563
Разработка веб-приложения для компании Enviok
829

Показать больше работ

Прогнозирование временных рядов: от Prophet до трансформеров

Финансовый директор хочет прогноз продаж на квартал вперёд. Аналитик строит SARIMA, получает хорошие метрики на тестовой выборке — MAPE 8.3%. Деплоит. Через два месяца MAPE в production 23%. Причина: модель обучалась на данных до COVID, тестировалась на стабильном периоде, а production попал на период с промо-акцией и сбоем поставок. Data leakage + distribution shift = красивые числа в ноутбуке и неработающий прогноз в жизни.

Типовые проблемы прогнозирования

Неправильная кросс-валидация. Стандартный train_test_split для временных рядов — ошибка. Случайное разбиение создаёт data leakage: модель видит «будущие» значения в обучении. Правильно — TimeSeriesSplit или walk-forward validation с expanding window.

Множественная сезонность. Почасовые данные потребления электроэнергии имеют три сезонности: суточную (24 ч), недельную (168 ч), годовую (8760 ч). SARIMA справляется только с одной. Prophet обрабатывает несколько, но медленно масштабируется на тысячи рядов.

Пропуски и аномалии в данных. Пропуск в сенсорных данных — это информация (датчик отключился), а не просто NaN. Линейная интерполяция убивает этот сигнал. Правильная обработка зависит от природы пропуска.

Cold start при иерархическом прогнозировании. Новый SKU в ассортименте из 50 000 позиций: исторических данных нет, нужен прогноз. Стандартные подели тут не работают — нужны cross-learning подходы или feature-based методы.

Инструменты и когда что применять

Prophet (Meta) — отличный старт для бизнес-данных с понятной сезонностью и праздниками. Быстро настраивается, интерпретируем, встроенная обработка выбросов и пропусков. Падает в точности при нерегулярных паттернах и не масштабируется на десятки тысяч рядов без параллелизации. neuralprophet добавляет AR-компоненты и AutoML, но теряет интерпретируемость.

Gradient boosting на фичах (LightGBM, XGBoost) — часто недооценённый подход. Создаёте фичи вручную: лаги (t-1, t-7, t-28), скользящие средние, категориальные признаки (день недели, месяц), экзогенные переменные. Модель обучается на всех рядах одновременно — решает cold start через похожие ряды. MAPE на ритейл-прогнозировании часто лучше нейронных сетей при правильной feature engineering.

TFT (Temporal Fusion Transformer) — трансформер, специально разработанный для интерпретируемого прогнозирования с ковариатами. Встроенные механизмы: variable selection (какие признаки важны), temporal self-attention (какие временные точки влияют на прогноз), квантильные предсказания. Доступен в pytorch-forecasting. Требует ~10 000+ записей на ряд для стабильного обучения.

PatchTST — трансформер, который делит временной ряд на патчи (аналогично ViT для изображений). Лучше захватывает локальные паттерны, чем классические трансформеры. Хорошо работает для long-horizon forecasting (прогноз на 96–720 шагов). Реализация в neuralforecast от Nixtla.

N-HiTS, N-BEATS — нейронные архитектуры без attention, быстрее TFT, конкурентная точность. N-BEATS выигрывает на M4/M5 benchmark для задач без ковариат.

Метод	Ковариаты	Масштаб (рядов)	Интерпретируемость	Сложность
Prophet	Да (регрессоры)	До 10k	Высокая	Низкая
LightGBM + фичи	Да	100k+	Средняя	Средняя
TFT	Да	1k–100k	Высокая	Высокая
PatchTST	Нет/ограничено	Любой	Низкая	Средняя
N-HiTS	Нет	Любой	Низкая	Низкая

Глубже: TFT в production

TFT требует тщательной подготовки данных. Типичный пайплайн через pytorch-forecasting:

training = TimeSeriesDataSet(
    data,
    time_idx="time_idx",
    target="sales",
    group_ids=["store", "sku"],
    min_encoder_length=max_encoder_length // 2,
    max_encoder_length=max_encoder_length,  # 120 дней
    min_prediction_length=1,
    max_prediction_length=max_prediction_length,  # 28 дней
    static_categoricals=["store_type", "category"],
    time_varying_known_reals=["price", "promo_flag"],
    time_varying_unknown_reals=["sales"],
    target_normalizer=GroupNormalizer(groups=["store", "sku"], transformation="softplus"),
)

Частая ошибка: target_normalizer по умолчанию (StandardScaler) ломает предсказания для рядов с нулевыми значениями (нет продаж в выходные). GroupNormalizer с transformation="softplus" — правильный выбор для count-данных.

Кейс: прогноз спроса в ритейле. Сеть из 120 магазинов, 8000 SKU, горизонт прогноза 28 дней. Исходная система: SARIMA отдельно для каждого ряда, MAPE 18.4%, полный цикл переобучения — 6 часов. TFT на PyTorch + pytorch-forecasting: одна модель на все ряды, MAPE 11.2%, переобучение — 40 мин на A10G. Дополнительный бонус: feature importance через variable selection — выяснилось, что day_before_holiday влияет сильнее, чем сама дата праздника.

Оценка качества прогнозов

Не используйте RMSE как единственную метрику — она сильно штрафует за большие ошибки на больших значениях. Набор метрик для ритейл-прогнозирования:

MAPE — интерпретируема, но нестабильна при значениях близких к нулю
sMAPE — симметричная версия, избегает деления на маленькие числа
MASE (Mean Absolute Scaled Error) — нормализован относительно наивного сезонного прогноза, отлично подходит для сравнения между рядами с разными масштабами
Quantile loss / Pinball loss — для вероятностного прогнозирования, оценка покрытия интервалов

Процесс работы

Начинаем с EDA: визуализация, тест ADF на стационарность, STL-декомпозиция, анализ пропусков и выбросов. Это 2–3 дня, но часто выявляет системные проблемы данных, которые блокируют прогнозирование.

Затем: baseline (наивный seasonal, Prophet), feature engineering для LGBM, выбор архитектуры нейронной сети если нужно. Walk-forward validation с реалистичным горизонтом. Деплой через API с автоматическим переобучением по расписанию через Airflow или Prefect.

Сроки: MVP-прогноз на одном типе данных — 3–6 недель. Иерархическая система прогнозирования с автоматизацией — 2–5 месяцев.