Интеграция Deepgram для распознавания речи

Проектируем и внедряем системы искусственного интеллекта: от прототипа до production-ready решения. Наша команда объединяет экспертизу в машинном обучении, дата-инжиниринге и MLOps, чтобы AI работал не в лаборатории, а в реальном бизнесе.
Показано 1 из 1 услугВсе 1566 услуг
Интеграция Deepgram для распознавания речи
Простая
от 1 рабочего дня до 3 рабочих дней
Часто задаваемые вопросы
Направления AI-разработки
Этапы разработки AI-решения
Последние работы
  • image_website-b2b-advance_0.png
    Разработка сайта компании B2B ADVANCE
    1218
  • image_web-applications_feedme_466_0.webp
    Разработка веб-приложения для компании FEEDME
    1161
  • image_websites_belfingroup_462_0.webp
    Разработка веб-сайта для компании БЕЛФИНГРУПП
    853
  • image_ecommerce_furnoro_435_0.webp
    Разработка интернет магазина для компании FURNORO
    1047
  • image_logo-advance_0.png
    Разработка логотипа компании B2B Advance
    561
  • image_crm_enviok_479_0.webp
    Разработка веб-приложения для компании Enviok
    825

Интеграция Deepgram для распознавания речи

Deepgram — один из самых быстрых облачных STT-провайдеров: задержка при потоковом распознавании 100–200 мс. Модель Nova-2 показывает WER 5–8% на английском, для русского — модель в beta, WER около 12–18%.

Модели Deepgram

Модель Языки Скорость Сценарий
Nova-2 30+ 30x RT Общее назначение
Enhanced 36+ 50x RT Колл-центры
Base 36+ 100x RT Требовательные к скорости
Whisper 99+ 10x RT Мультиязычные задачи

Интеграция через WebSocket (streaming)

import asyncio
import websockets
import json

async def transcribe_stream():
    url = "wss://api.deepgram.com/v1/listen"
    headers = {"Authorization": f"Token {DEEPGRAM_API_KEY}"}
    params = "?model=nova-2&language=ru&punctuate=true&diarize=true"

    async with websockets.connect(url + params, extra_headers=headers) as ws:
        async def send_audio():
            with open("audio.wav", "rb") as f:
                while chunk := f.read(4096):
                    await ws.send(chunk)
            await ws.send(json.dumps({"type": "CloseStream"}))

        async def receive_results():
            async for message in ws:
                result = json.loads(message)
                if result.get("is_final"):
                    transcript = result["channel"]["alternatives"][0]["transcript"]
                    print(transcript)

        await asyncio.gather(send_audio(), receive_results())

Стоимость

Nova-2: $0.0043/минута. Enhanced: $0.0145/минута. Бесплатный лимит: $200 кредитов при регистрации.

Интеграция: 1 день (REST), 2 дня (WebSocket streaming).