Внедрение платформы Retell AI для голосовых AI-агентов

Проектируем и внедряем системы искусственного интеллекта: от прототипа до production-ready решения. Наша команда объединяет экспертизу в машинном обучении, дата-инжиниринге и MLOps, чтобы AI работал не в лаборатории, а в реальном бизнесе.

8+Лет на рынкеподробнее 900+Реализованных проектовподробнее 100+Разработчиков в штатеподробнее 19+Партнеровподробнее

Предлагаемые услуги

Показано 1 из 1 услугВсе 1566 услуг

Средняя

от 1 рабочего дня до 3 рабочих дней

Часто задаваемые вопросы

Направления AI-разработки

Обсудить AI-проект

Бесплатная консультация — расскажем, как AI решит вашу задачу

Оценить стоимость

Рассчитаем бюджет и сроки вашего AI-проекта

Этапы разработки AI-решения

Последние работы

Разработка сайта компании B2B ADVANCE
1240
Разработка веб-приложения для компании FEEDME
1167
Разработка веб-сайта для компании БЕЛФИНГРУПП
867
Разработка интернет магазина для компании FURNORO
1084
Разработка логотипа компании B2B Advance
563
Разработка веб-приложения для компании Enviok
829

Показать больше работ

Разработка голосовых агентов на Retell AI

Retell AI — платформа для production-grade голосовых агентов с акцентом на низкую задержку и управление состоянием разговора. Ключевое отличие от конкурентов — встроенная поддержка статeful диалогов через LLM WebSocket стриминг и собственный оркестратор разговорного контекста.

Архитектура и ключевые возможности

Retell использует двунаправленный WebSocket между своей инфраструктурой и LLM-бэкендом разработчика. Это означает, что вы контролируете логику разговора на своём сервере, а Retell берёт на себя телефонию, STT, TTS и управление аудио.

import asyncio
import json
import websockets
from typing import AsyncGenerator

class RetellAgentServer:
    """
    Кастомный LLM сервер для Retell AI.
    Retell подключается по WebSocket и ожидает streaming ответы.
    """

    def __init__(self, openai_client, system_prompt: str):
        self.openai = openai_client
        self.system_prompt = system_prompt

    async def handle_connection(self, websocket, path):
        """Обработка WebSocket сессии от Retell"""
        async for message in websocket:
            data = json.loads(message)

            if data.get("interaction_type") == "call_details":
                # Начало звонка — получаем метаданные
                call_info = data.get("call", {})
                print(f"New call: {call_info.get('call_id')}")
                continue

            if data.get("interaction_type") in ("response_required", "reminder_required"):
                # Пользователь что-то сказал или наступил таймаут
                transcript = data.get("transcript", [])

                # Генерируем ответ через OpenAI streaming
                async for chunk in self._generate_response(transcript):
                    response_message = {
                        "response_id": data.get("response_id"),
                        "content": chunk,
                        "content_complete": False,
                        "end_call": False,
                    }
                    await websocket.send(json.dumps(response_message))

                # Финальный чанк
                await websocket.send(json.dumps({
                    "response_id": data.get("response_id"),
                    "content": "",
                    "content_complete": True,
                    "end_call": False,
                }))

    async def _generate_response(self, transcript: list) -> AsyncGenerator[str, None]:
        """Стриминг ответа через OpenAI"""
        messages = [{"role": "system", "content": self.system_prompt}]

        for turn in transcript:
            role = "assistant" if turn["role"] == "agent" else "user"
            messages.append({"role": role, "content": turn["content"]})

        stream = await self.openai.chat.completions.create(
            model="gpt-4o",
            messages=messages,
            stream=True,
            temperature=0.7,
        )

        async for chunk in stream:
            delta = chunk.choices[0].delta.content
            if delta:
                yield delta


class RetellAPIClient:
    """Управление агентами через Retell REST API"""

    def __init__(self, api_key: str):
        import requests
        self.api_key = api_key
        self.base_url = "https://api.retellai.com"
        self.session = requests.Session()
        self.session.headers.update({
            "Authorization": f"Bearer {api_key}",
            "Content-Type": "application/json"
        })

    def create_agent(self, agent_name: str,
                      llm_websocket_url: str,
                      voice_id: str = "11labs-Adrian",
                      language: str = "russian") -> dict:
        """
        Создание агента с кастомным LLM бэкендом.
        llm_websocket_url: ваш сервер для обработки диалога
        """
        payload = {
            "agent_name": agent_name,
            "llm_websocket_url": llm_websocket_url,
            "voice_id": voice_id,
            "language": language,
            "response_engine": {
                "type": "retell-llm",  # Или "custom-llm"
            },
            "responsiveness": 1.0,        # 0-1, насколько быстро реагирует
            "interruption_sensitivity": 1.0,
            "enable_backchannel": True,   # "угу", "да" во время пауз
            "backchannel_frequency": 0.9,
            "end_call_after_silence_ms": 600000,
            "max_call_duration_ms": 3600000,
        }

        return self.session.post(
            f"{self.base_url}/create-agent",
            json=payload
        ).json()

    def create_phone_call(self, from_number: str,
                           to_number: str,
                           agent_id: str,
                           retell_llm_dynamic_variables: dict = None) -> dict:
        """Инициирование исходящего звонка"""
        payload = {
            "from_number": from_number,
            "to_number": to_number,
            "agent_id": agent_id,
        }

        if retell_llm_dynamic_variables:
            payload["retell_llm_dynamic_variables"] = retell_llm_dynamic_variables

        return self.session.post(
            f"{self.base_url}/create-phone-call",
            json=payload
        ).json()

Управление состоянием сложных диалогов

Преимущество архитектуры Retell с кастомным LLM: полный контроль над состоянием разговора на вашем сервере. Можно хранить историю, подгружать данные из CRM в реальном времени и управлять логикой ветвления.

class ConversationStateManager:
    """Управление состоянием разговора для Retell"""

    def __init__(self, call_id: str, customer_id: str):
        self.call_id = call_id
        self.customer_id = customer_id
        self.state = "greeting"
        self.collected_data = {}
        self.escalation_triggers = ["оператор", "жалоба", "претензия", "руководитель"]

    def should_escalate(self, user_message: str) -> bool:
        """Определяем нужна ли передача живому оператору"""
        msg_lower = user_message.lower()
        return any(trigger in msg_lower for trigger in self.escalation_triggers)

    def get_context_prompt(self) -> str:
        """Динамический промпт на основе текущего состояния"""
        base = f"Текущий шаг: {self.state}. Уже собрано: {self.collected_data}."

        if self.state == "qualification":
            base += " Узнай: есть ли бюджет, сроки принятия решения, лицо принимающее решение."
        elif self.state == "scheduling":
            base += " Предложи 3 слота для встречи на следующей неделе."

        return base

Метрики Retell AI

Параметр	Значение
End-to-end latency	500-800ms
Одновременных звонков	масштабируется горизонтально
WebSocket reconnect	автоматически
Webhook события	call_started, call_ended, call_analyzed
Русский TTS (ElevenLabs)	хорошее качество

Retell оптимален для сложных сценариев, где требуется кастомная бизнес-логика на сервере: CRM-интеграция в реальном времени, dynamic pricing, сложные квалификационные воронки. Прототип — 3-4 дня, production с интеграциями — 4-6 недель.