Настройка транскрибации звонков в Битрикс24
Запись звонков есть у всех — но слушать часовые разговоры менеджеров вручную никто не будет. Именно здесь транскрибация превращает аудио в текст, который можно искать, анализировать и передавать в CRM без прослушивания.
Как работает транскрибация в Битрикс24
Битрикс24 использует встроенный модуль Битрикс24 Контакт-центр совместно с облачным сервисом распознавания речи. После завершения звонка запись через telephony модуль отправляется на сервер распознавания — результат возвращается текстом и сохраняется в карточку сущности CRM (лид, сделка, контакт).
Технически процесс выглядит так:
- Звонок завершён, запись сохраняется в
b_voip_callс привязкой кCALL_ID. - Задача на транскрибацию ставится в очередь обработчика.
- Сервис Speech-to-Text (Яндекс SpeechKit или встроенный движок Битрикс) получает аудиофайл.
- Текст возвращается и записывается в поле
TRANSCRIPTзаписи звонка. - В CRM-карточке появляется блок «Расшифровка звонка» с разделением по спикерам.
Что нужно для включения
Транскрибация доступна только на тарифах Профессиональный и Энтерпрайз (Битрикс24 облако). На коробочной версии — через внешний Speech-to-Text провайдер и REST API метод telephony.externalcall.finish.
Шаги активации:
- CRM → Телефония → Настройки → вкладка «Транскрибация».
- Включить переключатель «Расшифровывать звонки».
- Выбрать язык распознавания (русский, английский — список зависит от тарифа).
- Указать, для каких номеров активировать транскрибацию.
- Настроить права доступа: кто видит расшифровки (руководитель, сам менеджер, все).
После активации каждый новый звонок длиннее 10 секунд будет расшифровываться автоматически. Старые записи — только через ручной запуск или REST-скрипт.
Ограничения и частые проблемы
Качество распознавания сильно зависит от качества записи. Если на линии шум, эхо или низкий битрейт — точность падает до 60-70%. Стандартный битрейт для нормального распознавания: 8 кГц моно минимум, лучше 16 кГц.
Разделение по спикерам (диаризация) работает только при стерео-записи, где оператор и клиент пишутся на разные каналы. При моно-записи транскрибация даёт единый текст без разметки «кто говорил».
Квоты. Каждый тариф имеет лимит минут транскрибации в месяц. При превышении — расшифровка прекращается до следующего расчётного периода. Лимиты видны в разделе «Тарифы» → «Использование».
Коробочная версия. Встроенный движок недоступен. Интеграция с Яндекс SpeechKit или Google Speech-to-Text реализуется через обработчик события OnVoipCallEnd с вызовом внешнего API и записью результата обратно в Битрикс через CRest::call('telephony.externalcall.finish', [...]).
Что делать с текстом после транскрибации
Расшифровки можно использовать в роботах и бизнес-процессах: триггер «Звонок завершён» → условие по тексту транскрибации → действие (смена стадии, задача руководителю, уведомление). Поле транскрибации доступно как переменная {=Document.TRANSCRIPT} в конструкторе бизнес-процессов.
Поиск по текстам расшифровок работает через стандартный поиск CRM — транскрипт индексируется в b_search_content наравне с другими полями.
| Этап | Трудозатраты |
|---|---|
| Активация транскрибации на облаке | 1-2 ч |
| Настройка прав и фильтров по номерам | 1-3 ч |
| Интеграция с коробкой через SpeechKit | 6-16 ч |
| Настройка роботов по тексту расшифровки | 2-8 ч |







