Реализация AI-предсказания LTV пользователя в мобильном приложении
LTV (Lifetime Value) — деньги, которые пользователь принесёт за всё время жизни в продукте. Знать его предсказанное значение на 3-й день после установки означает возможность принимать решения о UA-затратах на когорту с доказательной базой, а не на интуиции.
Зачем предсказывать LTV заранее
Реальный LTV считается постфактум — через 12–24 месяца. К тому времени вы уже потратили бюджет на привлечение. Predicted LTV на основе поведения первых 7–14 дней позволяет:
- Корректировать ставки в UA-кампаниях (более ценным когортам — больший CPI)
- Сегментировать пользователей для персонализированных офферов ещё в onboarding
- Принимать решение о pre-emptive churn prevention для высокоценных пользователей
Какие модели применяем
BG/NBD (Beta Geometric / Negative Binomial Distribution) — классика для подписочных и транзакционных приложений. Моделирует «когда пользователь совершит следующую покупку» и «когда он станет неактивным» как независимые процессы. Хорошо работает на данных с историей 30+ дней.
Pareto/NBD — более точный вариант, особенно на первых 30–60 днях жизни пользователя.
ML-регрессия (XGBoost, LightGBM) — работает лучше, когда у тебя много поведенческих признаков и нелинейные зависимости. На практике часто выигрывает у параметрических моделей на мобильных данных, где поведение неоднородное.
Гибридный подход: параметрическая модель даёт baseline, ML — улучшает его с добавлением контекстуальных признаков.
Feature engineering
Транзакционная история — основа. Признаки для LTV-модели:
- Количество и сумма покупок за первые 7/14/30 дней
- Межпокупочный интервал (IPT — Inter-Purchase Time): чем короче, тем выше LTV
- Средний чек и его тренд
- Тип монетизации (single IAP, subscription, consumables) — предсказываем по-разному
- Отклик на скидки: пользователь, купивший только по промокоду, имеет другой LTV, чем купивший по полной цене
- Engagement: сессии, глубина использования
Данные о транзакциях на iOS — через StoreKit / RevenueCat webhook. На Android — Google Play Developer API / RevenueCat. RevenueCat особенно удобен: единый webhook для обоих платформ, нормализованные события (initial_purchase, renewal, cancellation, refund).
Когортный анализ перед моделью
Перед тем как строить предсказательную модель, проведи когортный анализ вручную. Постройте retention-кривые по неделям для когорт по источнику трафика, дате установки, платформе. Это часто выявляет, что у вас не один паттерн LTV, а три–четыре разных сегмента — и для каждого нужна своя модель или хотя бы отдельная стратификация.
Интеграция результатов
Предсказанный LTV хранится в user_predicted_ltv(user_id, ltv_30d, ltv_90d, ltv_365d, segment, updated_at). Сегменты: L (low, < P33), M (medium), H (high, > P67).
UA-кампании: экспортируем high-LTV сегмент в Custom Audiences Facebook / Google Ads для lookalike. Пользователи похожие на ваших high-LTV — целевая аудитория.
Персонализация в приложении: H-сегмент видит premium upsell раньше и с меньшей скидкой (они готовы платить). L-сегмент — более агрессивный free trial для создания привычки.
Распределение support-ресурсов: H-сегмент при обращении получает приоритетный ответ. Технически — тег в CRM через интеграцию с Zendesk/Intercom.
Точность и мониторинг
Валидация: train на когортах до месяца M, тест — на когорте M+1, сравниваем predicted vs actual LTV через 90 дней. RMSE и MAPE как метрики. Типичный MAPE хорошей модели — 25–40% на горизонте 90 дней: предсказывать деньги сложно.
Переобучение ежеквартально, плюс при значимых изменениях продукта (новый paywall, изменение цен).
Ориентиры по срокам
Базовая LTV-модель с когортным анализом и сегментацией — 3–4 недели при наличии 6+ месяцев транзакционных данных. Полная система с интеграцией в UA-кампании, персонализацией и мониторингом — 8–12 недель. Стоимость рассчитывается индивидуально.







