Интеграция NLP-движка (Rasa) в мобильного чат-бота
Rasa — это self-hosted NLP-стек: вы контролируете модель, данные и инфраструктуру. Именно поэтому его выбирают для проектов с чувствительными данными или с нестандартной предметной областью. Но «self-hosted» означает и то, что настройку pipeline придётся делать самостоятельно — дефолтный конфиг даёт посредственную точность на русском языке.
Rasa NLU pipeline для русского
Стандартный конфиг с WhitespaceTokenizer на русском работает плохо: русская морфология сложнее английской, формы одного слова воспринимаются как разные токены. Рабочий конфиг для русскоязычного бота:
language: ru
pipeline:
- name: SpacyNLP
model: ru_core_news_md
- name: SpacyTokenizer
- name: SpacyFeaturizer
- name: RegexFeaturizer
- name: LexicalSyntacticFeaturizer
- name: CountVectorsFeaturizer
- name: CountVectorsFeaturizer
analyzer: char_wb
min_ngram: 1
max_ngram: 4
- name: DIETClassifier
epochs: 150
- name: EntitySynonymMapper
- name: ResponseSelector
epochs: 100
- name: FallbackClassifier
threshold: 0.7
ambiguity_threshold: 0.1
spacy с моделью ru_core_news_md + char n-gram фичи от CountVectorsFeaturizer — это базовая комбинация, которая даёт разумную точность на коротких фразах из продакшна. DIETClassifier с 150 эпохами обычно достаточно для 20–50 интентов.
Rasa Core: управление диалогом
Rasa разделяет NLU (понимание намерений) и Core (управление диалогом). Core работает на основе правил (rules.yml) и историй (stories.yml). Самая частая ошибка — пытаться описать все сценарии через rules и получить хрупкую систему, которая ломается на нестандартном порядке реплик.
Правило: жёсткие команды (отмена, помощь, начать заново) — в rules. Многошаговые сценарии с вариативностью — в stories. Rasa Core обучается на историях и обобщает сценарии, которых явно не видел — это его главное преимущество перед деревьями решений.
Custom Actions. Динамические ответы (статус заказа, доступные слоты) реализуются через action_server — отдельный Python-сервис, который Rasa вызывает через HTTP. Мобильное приложение с этим не взаимодействует напрямую:
class ActionCheckOrderStatus(Action):
def name(self) -> str:
return "action_check_order_status"
async def run(self, dispatcher, tracker, domain) -> list:
order_id = tracker.get_slot("order_id")
status = await order_service.get_status(order_id)
dispatcher.utter_message(text=f"Ваш заказ #{order_id}: {status}")
return [SlotSet("order_status", status)]
Интеграция с мобильным приложением
Rasa Server предоставляет REST-канал на /webhooks/rest/webhook. Мобильное приложение отправляет POST-запрос:
{
"sender": "user_device_id_or_session_uuid",
"message": "текст сообщения"
}
Ответ — массив сообщений, каждое из которых может быть текстом, изображением, кнопками или кастомным payload.
На Android это стандартный Retrofit-вызов. Важный момент: sender должен быть стабильным идентификатором сессии — Rasa хранит слоты (slots) между запросами в рамках одного sender. Если генерировать новый ID каждый раз, контекст диалога будет теряться.
Для продакшна Rasa не стоит открывать напрямую в интернет — перед ним ставим nginx с rate limiting и аутентификацией по токену.
Развёртывание
Rasa Server + Action Server удобно запускать в Docker Compose. Модель обучается командой rasa train и монтируется в контейнер. На слабом VPS обучение 50 интентов занимает 5–10 минут — вполне приемлемо для CI/CD.
Rasa Enterprise (коммерческая версия) добавляет аналитику и A/B тестирование диалогов, но для большинства задач достаточно open-source версии.
Процесс работы
Аудит предметной области, сбор примеров реплик для NLU-датасета.
Настройка pipeline, обучение базовой модели, оценка точности через rasa test.
Разработка диалоговых сценариев (rules + stories), custom actions.
Интеграция REST-канала с мобильным клиентом, настройка инфраструктуры.
Ориентиры по срокам
Интеграция с готовым Rasa-сервером — 3–4 дня. Полный цикл включая обучение модели с нуля, написание сценариев и развёртывание — 2–4 недели в зависимости от числа интентов.







