Реализация классификации обращений клиентов по тематике

Проектируем и внедряем системы искусственного интеллекта: от прототипа до production-ready решения. Наша команда объединяет экспертизу в машинном обучении, дата-инжиниринге и MLOps, чтобы AI работал не в лаборатории, а в реальном бизнесе.
Показано 1 из 1 услугВсе 1566 услуг
Реализация классификации обращений клиентов по тематике
Средняя
~3-5 рабочих дней
Часто задаваемые вопросы
Направления AI-разработки
Этапы разработки AI-решения
Последние работы
  • image_website-b2b-advance_0.png
    Разработка сайта компании B2B ADVANCE
    1218
  • image_web-applications_feedme_466_0.webp
    Разработка веб-приложения для компании FEEDME
    1161
  • image_websites_belfingroup_462_0.webp
    Разработка веб-сайта для компании БЕЛФИНГРУПП
    853
  • image_ecommerce_furnoro_435_0.webp
    Разработка интернет магазина для компании FURNORO
    1047
  • image_logo-advance_0.png
    Разработка логотипа компании B2B Advance
    561
  • image_crm_enviok_479_0.webp
    Разработка веб-приложения для компании Enviok
    825

Реализация классификации обращений клиентов по тематике

Классификация обращений — автоматическое определение темы входящего запроса клиента. Входящий поток писем, чатов, звонков (после транскрипции) распределяется по тематическим категориям без участия оператора.

Проектирование таксономии тематик

До обучения модели нужно создать правильную иерархию. Типичные ошибки: слишком мало классов (всё попадает в «Прочее»), слишком много (500+ классов плохо обучаются), нечёткие границы между классами.

Двухуровневая иерархия работает хорошо:

Технические проблемы
    ├── Проблема с подключением
    ├── Медленная скорость
    └── Ошибки в личном кабинете
Финансовые вопросы
    ├── Оплата и тарифы
    ├── Возврат средств
    └── Задолженность
Договорные вопросы
    ...

Первый уровень: 5–15 категорий — высокий recall. Второй уровень: детализация для маршрутизации к нужному специалисту.

Обучение классификатора

Этап 1 — сбор данных: 200–500 примеров на класс из архива обращений с историческими метками операторов. Важно: операторы часто метят неточно → нужен этап контроля качества разметки.

Этап 2 — baseline: TF-IDF + Logistic Regression. Быстро обучается, интерпретируемо, хорошо для начала. Accuracy на типовых задачах: 82–88%.

Этап 3 — BERT fine-tuning: DeepPavlov/rubert-base-cased. Accuracy: 90–95% при наличии 500+ примеров на класс.

Этап 4 — LLM zero/few-shot: GPT-4o-mini с описанием классов — для новых категорий без переобучения.

Обработка многотематических обращений

«У меня не работает подключение и я хочу сменить тариф» — два класса. Стратегии:

  • Multilabel классификация (sigmoid + порог 0.5)
  • Разбивка на предложения, классификация каждого
  • Выбор primary + secondary класса

Мониторинг и дрейф

Распределение тематик меняется при акциях, сезонах, инцидентах. Мониторинг: chi-square тест на отклонение от исторического распределения. Алерт при значительном отклонении → переоценка актуальности классификатора.