Реализация предсказания LTV клиента
Customer Lifetime Value — ожидаемая сумма прибыли от клиента за весь период взаимодействия. Точная оценка LTV позволяет правильно инвестировать в привлечение (CAC), сегментировать базу и приоритизировать удержание. ML-подход даёт на 30-50% более точные прогнозы, чем простые исторические средние.
Два подхода к предсказанию LTV
Contractual модели (SaaS, подписки): Клиент либо активен, либо ушёл. Задача разбивается на:
- Churn prediction: вероятность ухода в каждый период
- Revenue prediction: размер оплаты при условии, что клиент активен
- LTV = Σ P(alive at t) × Expected_Revenue(t) × Discount_Factor(t)
Non-contractual модели (e-commerce, retail): Клиент не уведомляет об уходе. Классический подход — BG/NBD модель (Beta Geometric/Negative Binomial Distribution):
- Frequency model: частота транзакций = NBD
- Dropout model: вероятность "смерти" клиента = Beta-Geometric
- Monetary value model: гамма-гамма модель для среднего чека
Библиотека lifetimes (Python) реализует BG/NBD + гамма-гамма из коробки. Данные: customer_id, frequency, recency, T (возраст клиента), monetary_value.
ML-подход: прямое предсказание
Альтернатива вероятностным моделям — прямое предсказание 12-месячного LTV через regression:
Features:
- RFM за первые 30/60/90 дней после онбординга
- Канал привлечения (paid search, organic, referral)
- Когортные характеристики (сезон привлечения)
- Поведенческие: использование фич, глубина сессий
- Сегмент: B2B vs. B2C, geography, company size
Алгоритм: LightGBM Regressor с квантильными потерями для неопределённости. Метрика: MAPE на holdout когорте (клиенты, онбординг которых был 12+ месяцев назад).
Типичная точность: MAPE 25-40% для 12-месячного прогноза — достаточно для сегментации, но не для точного CAC-расчёта.
Ранний предиктор LTV
Ценный нюанс: предсказывать LTV в первые 7-30 дней после регистрации, когда данных мало:
Early life signals:
- Онбординг completion rate
- Количество key actions в первую неделю (product activation)
- NPS score при первом опросе
- Глубина использования: количество модулей/фич
Random Forest с этими фичами позволяет классифицировать "whales" (высокий LTV) с Precision 60-70% уже через 7 дней после регистрации. Это позволяет направить Customer Success на правильных клиентов с первых дней.
Сегментация по LTV
Прогноз LTV → сегментация клиентской базы:
| Сегмент | LTV percentile | Стратегия |
|---|---|---|
| Champions | > 90th | VIP поддержка, референс-программы |
| High Potential | 70-90th | Активный CS, upsell |
| Core | 30-70th | Автоматизированный nurturing |
| At Risk | < 30th | Watchlist, проверка fit |
Сегменты пересматриваются ежеквартально или при значимом изменении поведения.
Оптимизация маркетинговых расходов
Главное применение LTV-модели — CAC-оптимизация:
Bidding в paid channels:
- Google Ads / Meta Ads поддерживают передачу predicted LTV как conversion value
- Smart Bidding оптимизирует ставки на максимизацию LTV, не ROAS
- Результат: сдвиг бюджета к каналам с лучшим LTV/CAC ratio
Когортный анализ: LTV по когортам привлечения (месяц × канал × кампания) показывает какие кампании привлекают клиентов с реальной ценностью, а не просто дешёвых.
Мониторинг модели
LTV — долгосрочный прогноз, его сложно валидировать быстро. Подходы:
- Shortened horizon validation: обучаем на когорте 24 месяца, предсказываем 12-месячный LTV, сравниваем с фактом через 12 месяцев
- Relative ranking accuracy: важна не абсолютная точность, а правильный порядок клиентов по LTV
- Early vs. final LTV correlation: насколько 7-дневный LTV коррелирует с 12-месячным фактом
Сроки: BG/NBD + гамма-гамма модель из lifetimes — 2-3 недели. ML-система с early predictor, мониторингом и интеграцией с CRM/paid channels — 10-14 недель.







