Реализация предсказания конверсии (Conversion Prediction)
Conversion prediction — это оценка вероятности целевого действия пользователя в ближайшее время: покупки, регистрации, запроса демо, оформления подписки. Точная модель позволяет персонализировать интерфейс, оптимизировать рекламные ставки и приоритизировать работу sales team.
Типы задач конверсии
E-commerce:
- Добавление в корзину → покупка (micro-conversion)
- Сессия → транзакция
- Email-рассылка → переход и покупка
SaaS / B2B:
- Посетитель сайта → регистрация (freemium)
- Trial → Paid conversion
- MQL → SQL → Closed Won (pipeline conversion)
Marketplace / финтех:
- Заявка → одобрение → выдача продукта
- Просмотр объявления → контакт с продавцом
Каждая задача имеет свою специфику данных и временного горизонта.
Feature Engineering по источникам данных
Web analytics / clickstream:
- Количество сессий и страниц в текущей сессии
- Источник трафика (utm_source, utm_medium, utm_campaign)
- Устройство, браузер, гео
- Глубина скролла на ключевых страницах
- Time spent на pricing / product pages
- Recency последнего визита
Поведенческие паттерны:
- Sequence of page views: кто посмотрел /pricing → /case-studies → /demo конвертирует в 3× выше
- Session velocity: ускорение активности (много действий за короткое время — сильный сигнал)
- Return visitor patterns: 2-й и 3-й визит сильнее первого
CRM / firmographic (B2B):
- Company size, industry, geography
- Technology stack (данные BuiltWith, Clearbit)
- Intent data: поисковые запросы компании по G2, Capterra
Модели и метрики
Для высокочастотных e-commerce событий: LightGBM с click-stream features. Обучение на последних 30-90 днях. Переобучение ежедневно или еженедельно.
Для B2B с длинным циклом: Survival analysis (Cox Proportional Hazards) — правильная постановка: предсказываем не факт конверсии, а время до конверсии. Логистическая регрессия или CatBoost с firmographic фичами как baseline.
Метрики:
- AUC-ROC: общее качество ранжирования
- Precision@K: точность на top-K% лидов (самый важный для sales)
- Lift curve: во сколько раз модель лучше случайного выбора
- Calibration: насколько predicted probabilities соответствуют реальным частотам
Real-time Personalization
На основе conversion score в реальном времени:
| Score | Действие на сайте |
|---|---|
| > 0.8 | Всплывающее окно "Поговорите с менеджером" |
| 0.6-0.8 | Показ case study отрасли компании |
| 0.4-0.6 | Персонализированный CTA на pricing |
| < 0.4 | Стандартный контент |
Технически: JavaScript SDK отправляет события в ML API → score < 200 мс → front-end рендерит персонализированный контент через React/Vue.
Pipeline в CRM
Для B2B: conversion score интегрируется в sales workflow:
- Salesforce / HubSpot: поле "Propensity to Buy" в объекте Lead
- Автоматическая приоритизация очереди звонков sales
- Триггер high-intent: при score > 0.75 — автозадача "Позвони в течение 1 часа"
Исследования показывают: звонок high-intent лиду в течение 5 минут повышает конверсию в 9× по сравнению со звонком через 60 минут.
Attribution и обратная связь
Важно правильно строить обучающую выборку — проблема attribution window:
- Conversion label должен браться через фиксированное время после события: 30 или 60 дней
- Новые данные без конверсий нельзя включать в обучение до истечения окна
- Censored data (пользователь ещё активен, окно не прошло) — обрабатывается отдельно
Сроки: базовая logistic regression модель с web analytics данными — 2-3 недели. Полноценная система с real-time scoring API, персонализацией и CRM-интеграцией — 8-12 недель.







