Разработка AI-системы для HR и рекрутинга
HR — одна из отраслей, где субъективность принятия решений максимальна. AI стандартизирует оценку кандидатов, сокращает time-to-hire и прогнозирует удержание сотрудников — не заменяя HR, а убирая рутину и предвзятость.
AI-рекрутинг
Автоматическая обработка резюме (CV Parsing и Matching)
from transformers import AutoTokenizer, AutoModel
import torch
import numpy as np
from sklearn.metrics.pairwise import cosine_similarity
class JobMatchingSystem:
"""Семантический матчинг вакансий и резюме через embedding"""
def __init__(self, model_name='sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2'):
self.tokenizer = AutoTokenizer.from_pretrained(model_name)
self.model = AutoModel.from_pretrained(model_name)
def encode(self, texts):
"""Получение sentence embeddings"""
inputs = self.tokenizer(texts, padding=True, truncation=True,
max_length=512, return_tensors='pt')
with torch.no_grad():
outputs = self.model(**inputs)
# Mean pooling
embeddings = outputs.last_hidden_state.mean(dim=1)
return embeddings.numpy()
def match_candidates(self, job_description, cv_list, top_k=20):
"""Ранжирование кандидатов по релевантности вакансии"""
job_embedding = self.encode([job_description])
cv_embeddings = self.encode(cv_list)
scores = cosine_similarity(job_embedding, cv_embeddings)[0]
ranked_indices = np.argsort(scores)[::-1][:top_k]
return [(idx, float(scores[idx])) for idx in ranked_indices]
def extract_skills(self, cv_text):
"""NER извлечение навыков и технологий"""
# spaCy + кастомный NER или regex-паттерны
pass
Structured Interview Automation:
AI-ассистент для проведения структурированного интервью:
- Генерация вопросов по STAR-методологии на основе требований вакансии
- Транскрипция видеоинтервью (Whisper) + NLP-анализ ответов
- Оценка по заданным компетенциям (автоматическое rubric scoring)
Bias Mitigation:
Основная этическая проблема AI в HR — закрепление исторических предвзятостей:
- Удаление демографических признаков (имя, фото, возраст, пол) из признаков модели
- Fairness metrics: демографический паритет, равенство шансов между группами
- Adversarial debiasing: обучение классификатора + adversarial network, удаляющей признаки защищённых атрибутов
- Обязательный human-in-the-loop для финальных решений (ТК РФ запрещает автоматические решения о найме без участия человека)
Прогнозирование удержания и оттока
Early Warning для оттока сотрудников:
import lightgbm as lgb
import pandas as pd
def build_retention_model(hr_data):
"""
Прогноз увольнения в ближайшие 90 дней.
Признаки из HRIS, анализа коммуникаций (с согласия), опросов.
"""
features = [
# Карьерные
'months_since_last_promotion', 'salary_vs_market_pct',
'performance_score_last', 'performance_score_trend',
# Рабочая среда
'overtime_hours_30d', 'overtime_trend',
'manager_tenure_months', # новый менеджер = риск
'team_attrition_rate_6m', # уходят соседи → тоже уйдёт
# Вовлечённость
'survey_engagement_score', 'survey_intent_to_stay',
'learning_hours_90d', # снижение = снижение вовлечённости
# Контекстные
'job_market_activity', # обновлял ли профиль LinkedIn
'years_in_company',
'commute_time_min'
]
model = lgb.LGBMClassifier(n_estimators=300, class_weight='balanced')
model.fit(hr_data[features], hr_data['left_90d'])
return model
При P(attrition) > 0.6 → автоматическое уведомление HR BP с рекомендациями: разговор о карьере, пересмотр компенсации, перевод в другой отдел.
Управление производительностью
Continuous Performance Management:
Замена ежегодного Performance Review на непрерывный мониторинг:
- OKR tracking: прогресс по целям в реальном времени
- Peer feedback aggregation: NLP-обработка обратной связи → тематические инсайты
- Recognition patterns: кто чаще получает признание → корреляция с результативностью
Прогноз высокого потенциала (High Potential Identification):
ML-модель на исторических данных: какие признаки характеризуют будущих лидеров:
- Кросс-функциональная вовлечённость, инициативы
- Темп роста показателей эффективности
- Нетворкинг: центральность в корпоративной социальной сети (ONA — Organizational Network Analysis)
People Analytics
Workforce Planning:
- Прогноз потребности в персонале по функциям на 1–3 года
- Анализ разрыва компетенций (Skills Gap): что умеет команда vs. что потребует бизнес
- Build / Buy / Borrow решение: обучить внутри, нанять или взять подрядчика
Организационная аналитика:
- Выявление «перегруженных» сотрудников (center nodes в ONA + overtime data)
- Команды с высокими коммуникационными барьерами
- Time in meetings analysis: >60% времени в совещаниях → alert для менеджера
Срок разработки: 4–7 месяцев для HR AI платформы с CV matching, retention prediction и people analytics с интеграцией в 1С:ЗУП, SAP HCM или BambooHR.







