Интеграция AssemblyAI для распознавания речи
AssemblyAI — облачная платформа с богатым набором post-processing инструментов поверх STT: авто-чаптеры, извлечение сущностей, детекция тональности, PII-редакция. Удобна когда нужен не просто транскрипт, а аналитика по записи.
Уникальные возможности
- Auto Chapters — автоматическое разбиение записи на тематические главы
- Entity Detection — люди, компании, адреса, даты без дополнительной настройки
- Sentiment Analysis — тональность по предложениям
- IAB Categories — классификация контента по таксономии IAB
- LeMUR — встроенный LLM для вопросов по транскрипту
Интеграция через SDK
import assemblyai as aai
aai.settings.api_key = ASSEMBLYAI_API_KEY
config = aai.TranscriptionConfig(
language_code="ru",
speaker_labels=True,
punctuate=True,
format_text=True,
sentiment_analysis=True,
auto_chapters=True,
entity_detection=True
)
transcriber = aai.Transcriber(config=config)
transcript = transcriber.transcribe("https://example.com/audio.mp3")
for chapter in transcript.chapters:
print(f"{chapter.start}ms - {chapter.end}ms: {chapter.headline}")
# Вопрос к записи через LeMUR
result = transcript.lemur.task(
"Выдели ключевые решения, принятые на встрече",
final_model=aai.LemurModel.claude3_haiku
)
Стоимость
Базовая транскрипция: $0.0065/минута. Best Plan с Speaker Diarization: $0.012/минута. Nano (быстрая модель): $0.002/минута.
Поддержка русского языка: базовая, WER 15–20%. Для русскоязычных задач рекомендуется Whisper-based модель внутри AssemblyAI.
Интеграция: 1 день.







