Разработка AI-системы упрощения текстов Easy Read
Easy Read — стандарт упрощения текстов для людей с нарушениями чтения, когнитивными особенностями, ментальными расстройствами. Юридические документы, инструкции, государственные уведомления — переформатирование в доступный язык без потери смысла.
Задача упрощения текста
Упрощение — не просто замена сложных слов простыми. Требования Easy Read:
- Короткие предложения (максимум 15–20 слов)
- Одна идея в одном предложении
- Активный залог вместо пассивного
- Конкретные существительные вместо абстрактных
- Объяснение специальных терминов при первом употреблении
- Разбивка на короткие абзацы
- Поддержка пиктограммами (опционально)
Реализация
class TextSimplifier:
def simplify(self, text: str, target_level: str = "easy_read") -> SimplifiedText:
# Оценка читабельности оригинала
original_score = readability_score(text)
simplified = llm.generate(f"""Упрости текст по стандарту Easy Read:
- Короткие предложения (до 15 слов)
- Простые слова, активный залог
- Объясняй термины
- Один факт — одно предложение
Текст:
{text}
Упрощённый текст:""", max_tokens=len(text.split()) * 3)
# Верификация: все ключевые факты из оригинала присутствуют
coverage = verify_fact_coverage(text, simplified)
return SimplifiedText(
original=text,
simplified=simplified,
original_readability=original_score,
simplified_readability=readability_score(simplified),
fact_coverage=coverage
)
Метрика читабельности
Для русского языка адаптированная формула Флеша-Кинкейда: учитывает среднюю длину предложения и среднее число слогов в слове. Цель для Easy Read: индекс читабельности > 60 (из 100), средняя длина предложения < 12 слов.
Применения
Государственные письма гражданам с ОВЗ, медицинские инструкции, условия договоров для массовой аудитории, обучающие материалы для детей и взрослых с особенностями развития. В ряде стран (Великобритания, Германия) Easy Read-версия официальных документов — юридическое требование.







