Как система обрабатывает смешанные обращения?

Система разбивает обращение на отдельные вопросы с помощью NLP-модели. Каждая часть маршрутизируется независимо, а ответы консолидируются в единое письмо заявителю. Срок рассмотрения считается по максимальному из компонентов.

Какая точность классификации гарантируется?

Accuracy@1 (правильное подразделение с первой попытки) — 92–95% на обученной модели. Accuracy@3 достигает 99%+. Мы гарантируем целевые показатели после адаптации под ваши данные.

Интегрируется ли система с DIRECTUM или Docsvision?

Да, поддерживаются СЭД: ДЕЛО, DIRECTUM, Docsvision, 1С:Документооборот. Система передает обращение с заполненной карточкой регистрации, что исключает ручной ввод и ошибки.

Как происходит обучение на исторических данных?

Мы используем активное обучение: эксперты размечают сложные кейсы, модель дообучается итерационно. Историческая разметка очищается от ошибочных перенаправлений. Дополнительно привлекаются анонимизированные данные из аналогичных органов.

Как система обрабатывает смешанные обращения?

Система разбивает обращение на отдельные вопросы с помощью NLP-модели. Каждая часть маршрутизируется независимо, а ответы консолидируются в единое письмо заявителю. Срок рассмотрения считается по максимальному из компонентов.

Какая точность классификации гарантируется?

Accuracy@1 (правильное подразделение с первой попытки) — 92–95% на обученной модели. Accuracy@3 достигает 99%+. Мы гарантируем целевые показатели после адаптации под ваши данные.

Интегрируется ли система с DIRECTUM или Docsvision?

Да, поддерживаются СЭД: ДЕЛО, DIRECTUM, Docsvision, 1С:Документооборот. Система передает обращение с заполненной карточкой регистрации, что исключает ручной ввод и ошибки.

Как происходит обучение на исторических данных?

Мы используем активное обучение: эксперты размечают сложные кейсы, модель дообучается итерационно. Историческая разметка очищается от ошибочных перенаправлений. Дополнительно привлекаются анонимизированные данные из аналогичных органов.

Разработка AI-системы классификации и маршрутизации обращений граждан

Q: Сколько времени занимает внедрение?

Сроки зависят от объема данных и количества рубрик. Пилотный проект — от 4 недель, полное внедрение с интеграцией — от 3 месяцев. Мы предоставляем точную оценку после аудита вашей текущей системы.

Проектируем и внедряем системы искусственного интеллекта: от прототипа до production-ready решения. Наша команда объединяет экспертизу в машинном обучении, дата-инжиниринге и MLOps, чтобы AI работал не в лаборатории, а в реальном бизнесе.

8+Лет на рынкеподробнее 900+Реализованных проектовподробнее 100+Разработчиков в штатеподробнее 19+Партнеровподробнее

Услуги, которые мы предлагаем

Показано 1 из 1Все 1564 услуг

Разработка AI-системы классификации и маршрутизации обращений граждан

Средний

~1-2 недели

Часто задаваемые вопросы

Направления AI-разработки

Обсудить AI-проект

Бесплатная консультация — расскажем, как AI решит вашу задачу

Оценить стоимость

Рассчитаем бюджет и сроки вашего AI-проекта

Этапы разработки AI-решения

Последние работы

Разработка сайта компании B2B ADVANCE
1358
Разработка веб-приложения для компании FEEDME
1251
Разработка веб-сайта для компании БЕЛФИНГРУПП
957
Разработка интернет магазина для компании FURNORO
1188
Разработка логотипа компании B2B Advance
646
Разработка веб-приложения для компании Enviok
929

Показать больше работ

Ручная маршрутизация обращений: потери времени и ошибки

В государственных органах до 30% первичных обращений попадают не к тому исполнителю. Заявитель получает формальный отказ «не в нашей компетенции», а ответственный сотрудник тратит время на переадресацию. Результат — срыв сроков рассмотрения и рост повторных жалоб. Мы разработали AI-классификатор, который решает эту задачу: Accuracy@1 достигает 92–95% сразу после адаптации. Получите консультацию эксперта — мы проанализируем вашу текущую схему маршрутизации.

Как работает классификация и почему она точнее ручного распределения?

Рубрикаторы госорганов иерархичны: федеральный → ведомственный → территориальный. Обращение нужно отнести к правильному уровню и конкретному исполнителю. Мы применяем комбинацию семантического поиска по прецедентам и LLM-парсинга. Ручное распределение даёт Accuracy@1 60–70% и 20–30% ложных перенаправлений. AI-классификатор снижает false routing rate до 5% за счёт учёта территориальной принадлежности, неструктурированных вложений и временного контекста.

class RequestClassification(BaseModel):
    federal_rubric: str
    department_rubric: str
    responsible_unit: str
    responsible_officer: str | None
    territorial_scope: str
    subject_area: str
    requires_field_inspection: bool
    other_agencies: list[str]
    confidence: float

def classify_request(text: str, attachments: list) -> RequestClassification:
    # Семантический поиск по базе прецедентов
    precedents = precedent_db.search(text, top_k=10)
    # Мультимодальная классификация при наличии вложений (фото, документы)
    if attachments:
        attachment_context = analyze_attachments(attachments)
    else:
        attachment_context = ""
    return llm.parse(
        build_routing_prompt(text, attachment_context, precedents),
        response_format=RequestClassification
    )

Параметр	Ручная маршрутизация	AI-классификатор
Accuracy@1	60–70%	92–95%
Accuracy@3	80–85%	99%+
Время на обращение	5–15 мин	0,5–2 сек
Доля повторных перенаправлений	20–30%	<5%

Особые случаи: вложения, геолокация, смешанные обращения

Вложения (фото, сканы, PDF) часто содержат ключевую информацию. Система автоматически извлекает текст, распознаёт объекты (например, ямы на фото) и геотеги. Если вложение нечитаемо, модель опирается на текст обращения и помечает случай как требующий экспертной оценки.

def extract_and_geolocate(text: str) -> GeoContext:
    addresses = ner_model.extract(text, entity_type="ADDRESS")
    located_objects = []
    for addr in addresses:
        coords = geocoder.geocode(addr)
        if coords:
            admin_unit = geodata.get_admin_unit(coords)
            responsible = routing_matrix.get_responsible(
                issue_category=...,
                admin_unit=admin_unit
            )
            located_objects.append(GeoObject(
                address=addr,
                coords=coords,
                responsible_org=responsible
            ))
    return GeoContext(objects=located_objects)

Геокодирование — через Яндекс.Геокодер или Nominatim. Точность определения муниципального образования — 95%+.

Одно обращение часто содержит несколько разноплановых вопросов (например, «шумные соседи и сломанный лифт»). Система разбивает текст на независимые сегменты, каждый классифицирует отдельно, а затем консолидирует ответы. Срок рассмотрения считается по самому длительному сегменту.

Обучение классификатора и метрики

Основа — исторические данные. Критический этап — очистка от ошибочных перенаправлений (исключаем обращения, которые пересылались). Дополняем анонимизированными данными из аналогичных органов. Применяем Active Learning: эксперты размечают сложные кейсы, модель дообучается итерационно. Для оценки качества на новых рубриках применяем few-shot тестирование.

Метрика	Целевое значение
Accuracy@1	≥ 92%
Accuracy@3	≥ 99%
False routing rate	< 5%
Среднее время классификации	< 2 сек

Что даёт автоматизация?

За счёт автоматизации снижается нагрузка на сотрудников — они перестают быть «сортировщиками» и сосредотачиваются на содержательной работе. Экономия времени: от 15 минут на каждое обращение. Для органа с потоком 1000 обращений в день это более 200 часов рабочего времени в месяц, что эквивалентно экономии от 1,2 млн рублей в год.

Интеграция с системами документооборота

Поддерживаем СЭД: ДЕЛО, DIRECTUM, Docsvision, 1С:Документооборот. Система передаёт обращение уже с заполненной карточкой регистрации — исполнитель получает не email, а структурированную задачу с установленным сроком.

Процесс и сроки внедрения

Аудит текущего процесса маршрутизации и данных.
Разработка модели классификации (fine-tuning LLaMA 3 или GPT-4o, ансамбль с BERT-классификатором).
Создание векторной базы прецедентов (Qdrant, 1536-dim эмбеддинги).
Интеграция с вашей СЭД (настройка API, карточки, статусы).
Дашборд аналитики и мониторинга.
Документация, обучение операторов, гарантийная поддержка 6 месяцев.

Пилотный проект — от 4 недель. Полное внедрение с интеграцией — от 3 месяцев. Средний бюджет пилотного проекта — от 300 до 500 тыс. рублей, полное внедрение — от 1 до 3 млн рублей. Точные сроки и стоимость определяем после аудита вашей системы.

Типичные ошибки и их обработка

Обращения с неполными данными (без адреса или темы).
Синонимия рубрик (разные названия одной темы).
Вложения без текста (только изображения) — модель маркирует их как «требует экспертизы».

Мы предусматриваем обработку каждого из этих кейсов. Гарантируем Accuracy@1 не ниже 90% после адаптации, иначе доработаем модель бесплатно.

Что входит в работу?

Полный аудит текущей схемы маршрутизации и данных.
Разработка и кастомизация модели классификации.
Интеграция с вашей СЭД (API, карточки, статусы).
Векторная база прецедентов с эмбеддингами.
Дашборд аналитики и мониторинга.
Обучение операторов и техническая документация.
Гарантийная поддержка 6 месяцев.

Свяжитесь с нами для бесплатного аудита. Закажите пилотный проект — оцените результат на своих данных.

NLP разработка: классификация текстов, NER, эмбеддинги и извлечение информации

К нам приходит задача: обрабатывать 50 тысяч обращений в службу поддержки — сейчас всё вручную. Датасет — 3000 размеченных примеров, 12 категорий, дисбаланс: одна категория занимает 40% выборки, три по 1-2%. Baseline accuracy — 78%. Звучит неплохо, пока не смотришь на recall по редким классам: 0.31, 0.44, 0.28. Именно эти классы — жалобы и угрозы оттока — важнее всего бизнесу.

Это типичный проект NLP разработки. Проблема не в алгоритме, а в том, что accuracy — не та метрика. Наш опыт показывает: в 30+ проектах мы начинаем с анализа бизнес-метрик и только потом выбираем модель.

Почему accuracy — не та метрика для редких классов?

Accuracy игнорирует дисбаланс. Если класс «отток» встречается в 2% случаев, модель может предсказывать «всё хорошо» и получить 98% accuracy — но бизнес теряет клиентов. Решение: F1 macro (усреднение по всем классам) или weighted F1. Для NER — strict entity F1 (только точные совпадения). Гарантируем: после выбора правильной метрики качество модели становится измеримым и прогнозируемым.

Классификация текста: от BERT до дистилляции

BERT-подобные модели — стандарт для классификации. ruBERT-base или ruBERT-large от DeepPavlov для русского языка. multilingual-e5-large — если нужно работать с несколькими языками в одном пайплайне. XLM-RoBERTa-large — сильный multilingual backbone.

Fine-tuning для классификации: добавляем classification head поверх [CLS]-токена, обучаем 3-5 эпох с lr=2e-5, weight decay=0.01. При дисбалансе — weighted CrossEntropyLoss или focal loss с gamma=2.0. Пишите — покажем code snippet.

Кейс с дисбалансом. Датасет — 3000 примеров, дисбаланс 1:20. Решение: class_weight через sklearn + CrossEntropyLoss. Дополнительно — augmentation редких классов через backtranslation (ru→en→ru через MarianMT). Recall по редким классам вырос с 0.31 до 0.67 при незначительном падении accuracy (76%→74%). Полная NLP разработка под ключ заняла 3 недели.

Дистилляция для production. BERT-large даёт F1 0.89, но inference на CPU — 180ms. Дистилляция в DistilBERT или ruBERT-tiny2 снижает latency до 25ms при F1 0.84. Экспорт в ONNX Runtime даёт дополнительный 1.5-2x. Оценим проект — рассчитаем экономию на инфраструктуре.

Модель	F1 macro	Latency (CPU)	Размер
BERT-large	0.89	180 ms	1.3 GB
DistilBERT	0.84	25 ms	250 MB
ruBERT-tiny2	0.81	12 ms	120 MB
DistilBERT + ONNX	0.84	14 ms	150 MB

NER: распознавание именованных сущностей

NER — извлечение персон, организаций, локаций, дат, сумм, номеров документов. Для общих категорий (PER, ORG, LOC) предобученные модели работают хорошо. Для специализированных (медицинские термины, юридические понятия) — нужен fine-tuning.

Разметка данных. Основная стоимость NER-проекта. Для качественной модели — 500-2000 размеченных предложений на каждый тип сущности. Инструменты: Label Studio (open source) или Prodigy (от создателей spaCy). Формат IOB2 — стандарт.

Архитектура. Token classification поверх BERT: каждому токену метка (B-PER, I-PER, O). spaCy 3.x с transformer pipeline — удобный production-выбор.

Вложенные сущности. Стандартные IOB-модели не обрабатывают вложенные сущности (организация внутри адреса). Для таких задач — span-based NER: SpanBERT или SpERT. Сложнее, но правильно.

Постобработка обязательна. Модель предсказывает токены — нужны нормализованные сущности. Дата — dateparser. Суммы — regex + валидация. Имена — дедупликация через rapidfuzz. Входит в нашу стандартную поставку.

Sentiment Analysis и opinion mining

Бинарная классификация positive/negative работает с BERT из коробки. Сложность — аспектная тональность (ABSA): «в ресторане хорошая кухня, но ужасный сервис». Для ABSA: aspect extraction (NER) + sentiment по каждому аспекту. Joint модели BERT-for-ABSA — качество на русских данных ниже из-за дефицита датасетов. RuSentiment, SentiRuEval — основные ресурсы.

Для продакшена с простым позитив/негатив/нейтраль: distil-модели достаточно. Три класса, balanced датасет, 2000+ примеров — F1 macro 0.82-0.87 за 1-2 дня.

Суммаризация текста

Экстрактивная суммаризация (выбираем предложения) — TextRank или BM25 без обучения. Быстро, не галлюцинирует. Хорошо для длинных документов.

Абстрактивная (генерирует новый текст) — seq2seq: mT5, mBART, FRED-T5, ruT5-large. Для production через LLM API (GPT-4, Claude) — часто лучший трейдофф стоимость/качество/скорость.

Эмбеддинги: векторные представления текста

Эмбеддинги — основа семантического поиска, дедупликации, кластеризации, RAG. Качество критически влияет на downstream задачи.

Модели. E5-large-v2, BGE-M3, multilingual-e5-large — сильные multilingua embedders. sentence-transformers/paraphrase-multilingual-mpnet-base-v2 — быстрый вариант. Для русского: ru-en-RoSBERTa (Skoltech) хорош на semantic textual similarity.

Как оценить качество эмбеддингов? MTEB benchmark — стандарт. Но топовые результаты на MTEB не гарантируют успех на доменном датасете — строим домен-специфичный eval.

Fine-tuning эмбеддингов. Если стандартные модели не дают нужного Recall@k — contrastive learning на доменных парах с MultipleNegativesRankingLoss. 500-2000 пар, 1-3 эпохи — 5-15% прирост Recall@k.

Размерность и хранение. E5-large: 1024 dim, float32 — 4KB на вектор. При 10M документов — 40GB. Квантизация int8 снижает до 10GB. FAISS IVF_PQ — ещё компактнее, но с потерями. Входит в наши рекомендации по деплою.

Извлечение информации

Структурированное извлечение — одна из частых задач. Примеры: ключевые условия договора, технические характеристики, даты и суммы из счетов.

Regex + rule-based. Для ИНН, ОГРН, сумм, дат — надёжнее нейросети. Не требует данных.
NER + постобработка. Для вариативных форматов.
LLM с structured output. GPT-4 / Claude с JSON schema — для сложных документов. Стоимость: ~$0.001-0.01 на документ. Для 10k+ документов/день — считаем экономику.

Гарантируем гибрид: regex/NER для типовых полей + LLM для edge cases. Сертификат доверия: 5 лет на рынке, >30 проектов.

Этапы работы

Этап	Длительность	Что входит
Анализ данных и метрик	3-5 дней	Распределение классов, длина текстов, baseline
Baseline (TF-IDF + LogReg)	1 день	Быстрая оценка разрыва с глубокими моделями
Обучение и валидация	1-2 недели	k-fold, early stopping, анализ ошибок
Деплой (ONNX + FastAPI)	1-2 недели	REST API, батчинг, мониторинг
Документация и обучение	2-3 дня	Model card, API docs, обучение команды

Прототип на существующих данных — 1-3 недели. Production-система с CI/CD — 1.5-2.5 месяца. Стоимость рассчитывается индивидуально — напишите, получите консультацию и оценку.

Что входит в работу

Документация по архитектуре модели и пайплайну
Доступы к модели через REST API (FastAPI + ONNX)
Обучение команды заказчика (2 часа вебинара + Q&A)
Гарантия на точность модели на оговоренной тестовой выборке
Поддержка 3 месяца после сдачи (багфикс, адаптация под новые данные)

Наш опыт

Более 5 лет в NLP, 30+ проектов от классификации до RAG-систем. Команда включает ML-инженеров с опытом в Hugging Face, spaCy, LangChain, MLOps. Используем vLLM, Kubeflow, Weights & Biases — продакшен-стек, а не игрушки. Пишите — оценим проект за 2 дня.