Реализация автоматического извлечения Action Items из транскрибированных встреч
Action Items — конкретные задачи с исполнителем и сроком, которые возникают в ходе обсуждения. Из часового транскрипта их нужно вычленить точно: не пропустить ни одного, не зафиксировать обещания, которые на самом деле были гипотетическими.
Подход к извлечению
Прямой промпт с инструкцией «найди все задачи» даёт много шума — модель включает обсуждения и вопросы как задачи. Лучший подход — двухэтапный:
-
Классификация фраз — модель проходит по транскрипту и размечает фрагменты как:
action_item,decision,question,discussion -
Структурирование — только фрагменты типа
action_itemобрабатываются для извлечения полей
class ActionItem(BaseModel):
task: str # описание задачи
assignee: str | None # имя исполнителя (если упомянут)
deadline: str | None # срок (если упомянут)
context: str # оригинальная цитата из транскрипта
confidence: float # уверенность модели
Работа с неопределённостью
Транскрипты содержат условные обязательства: «Надо бы сделать», «Может, Иван займётся». Модель должна различать:
- Чёткое обязательство: «Пётр, сделайте к пятнице» → confidence 0.95
- Потенциальная задача: «Нам нужно разобраться с этим вопросом» → confidence 0.6, флаг для ревью
Action Items с confidence < 0.7 выносятся в отдельную секцию «Требуют уточнения».
Интеграция с таск-трекерами
Автоматическое создание задач в Jira / Linear / Asana / Trello через API после подтверждения пользователем (или автоматически для задач с confidence > 0.9). Assignee маппится на реальных пользователей через fuzzy matching по имени.







