Разработка AI-системы для прогнозирования увольнений
Предсказание добровольных увольнений сотрудников — HR-задача с прямым финансовым эффектом. Замена одного сотрудника стоит 50-200% его годовой зарплаты (рекрутинг, онбординг, потеря производительности). AI-система выявляет сотрудников с высоким риском за 1-3 месяца до увольнения, когда retention ещё возможен.
Этические и правовые ограничения
Прежде чем начать — ключевые ограничения:
152-ФЗ / GDPR:
- Явное согласие сотрудника на обработку персональных данных для предиктивного анализа
- Не использовать данные для автоматических HR-решений (только как подддержку)
- Право на объяснение и оспаривание предсказания
Этические границы:
- Не использовать данные личной переписки
- Не применять скрытое биометрическое наблюдение
- Прозрачность: сотрудники должны знать, что система существует (не обязательно детали)
Без этих ограничений система создаёт токсичную культуру и нарушает закон.
Данные для модели
HR-система (ок. 80% предиктивной силы):
hr_features = {
# Карьерный трек
'months_since_last_promotion': months,
'promotions_count_3y': count,
'salary_vs_market': salary / market_benchmark,
'performance_rating_last': rating_1_to_5,
'performance_trend': rating_last - rating_prev,
# Вовлечённость
'training_hours_annual': hours,
'projects_participated': count,
'internal_transfers_requested': count,
# Рабочие условия
'average_work_hours_weekly': hours,
'remote_work_days_weekly': days,
'manager_tenure': months_with_current_manager,
'team_size': headcount,
# Демографические (с осторожностью и fairness-аудитом)
'tenure_months': total_months_at_company,
'department': department_encoded
}
Engagement-опросы: eNPS (Employee Net Promoter Score), pulse surveys: "Порекомендуете ли работодателя?", "Довольны ли менеджером?", "Видите ли карьерные перспективы?"
Система контроля доступа:
- Аномально много рабочего времени за пределами офиса
- Изменение паттернов прихода/ухода
С разрешения и в агрегированном виде:
- Частота использования HR-системы для просмотра льгот (может означать сравнение с рынком)
- Заявки на отпуск: много дней сразу = возможно, берёт паузу перед уходом
Модель и таргет
Определение таргета: добровольное увольнение в течение следующих 90 дней.
Несбалансированность: типично 5-15% текучесть в год = 1.5-4% за квартал. SMOTE или class_weight для балансировки.
Алгоритм: LightGBM с SHAP для объяснений. Каждый сотрудник в high-risk категории получает top-3 фактора риска — конкретные причины для HR-менеджера.
Segment-level анализ
Помимо индивидуального скора, анализ по сегментам:
Cohort analysis: Какие когорты нанятых в конкретный период увольняются быстрее? Если cohort 2022-Q3 имеет 2× отток — что произошло при их найме/онбординге?
Department risk radar: Отделы с системно высоким риском увольнений → системная проблема (плохой менеджмент, неконкурентная компенсация, скучные задачи).
Manager effectiveness: Сотрудники под конкретным менеджером увольняются в 3× чаще среднего → флаг для HR.
Retention actions
Матрица действий:
| Risk | Причина (SHAP) | Действие |
|---|---|---|
| Высокий | Нет промо 18 мес | Разговор о карьерных перспективах |
| Высокий | Зарплата < рынка | Компенсационная ревизия |
| Высокий | Конфликт с менеджером | HR-медиация |
| Высокий | Много переработок | Пересмотр нагрузки |
| Средний | Нет обучения | Подключение к L&D программе |
Эффективность измеряем через A/B: Рандомизируем retention interventions по high-risk группе, измеряем retention rate vs. control.
Дашборд для HR
- Workforce risk heat map по отделам
- Top-10 individual risk с факторами
- Trend: как меняется общий риск увольнений по компании
- Forecast: ожидаемое число увольнений в следующие 90 дней (для планирования рекрутинга)
Интеграция с HRIS: SAP SuccessFactors, Workday, 1С:ЗУП — API для получения HR-данных и записи risk scores.
Сроки: базовая модель на HR-данных из HRIS — 4-5 недель. Полноценная система с SHAP-объяснениями, дашбордом и HRIS-интеграцией — 3-4 месяца.







