Реализация автоматической суммаризации транскрибированных встреч
Транскрипция встречи — это сырой материал. 60-минутное совещание даёт 8–12 тысяч слов текста, из которых 80% — контекст, повторения и разговорные конструкции. Задача суммаризации: извлечь смысловое ядро за секунды.
Архитектура суммаризатора
Пайплайн получает текст транскрипции (plain text или структурированный JSON с метками спикеров) и возвращает структурированное резюме:
[Транскрипт]
→ [Препроцессинг: разбивка на chunks по 3000 токенов]
→ [Map: суммаризация каждого chunk]
→ [Reduce: синтез итогового резюме]
→ [Структурирование: темы, решения, следующие шаги]
Для встреч до 30 минут (< 6000 токенов) — прямой промпт без map-reduce.
Промпт и выходной формат
Оптимальный выходной формат суммаризации встречи:
## Краткое резюме (2–3 предложения)
## Ключевые темы
## Принятые решения
## Открытые вопросы
## Участники и их позиции
Модели: GPT-4o-mini для стандартных встреч (стоимость ~$0.002 на час), GPT-4o для встреч с плотным техническим содержанием. Latency: 5–15 секунд на типовую встречу.
Интеграция с источниками
- Zoom — Zoom AI Companion API или Download recordings API + Whisper для транскрипции
- Google Meet — Google Meet API + Speech-to-Text
- Microsoft Teams — Graph API transcripts
- Fireflies.ai / Otter.ai — webhook с готовым транскриптом
Результат сохраняется в Notion, Confluence, Jira, или корпоративную вики — через соответствующие API.







