Разработка AI-системы для клинических испытаний подбор пациентов мониторинг
Клинические испытания — самый дорогой этап разработки лекарства. Фаза III: $200M–$1B, 3–7 лет. 30% испытаний проваливаются из-за проблем с набором пациентов, 50% сайтов набирают менее 70% запланированного числа участников. AI решает это системно.
Подбор пациентов (Patient Recruitment)
Автоматическое скрининг EHR по критериям включения/исключения
Каждое клиническое испытание имеет десятки критериев включения/исключения, написанных на медицинском English. Задача: найти подходящих пациентов в базе EMR больницы.
NLP система:
- Парсинг критериев: structured representation через clinical concept extraction (SNOMED, LOINC, RxNorm)
- Matching по EHR: поиск пациентов, удовлетворяющих всем критериям
- Ranking: приоритизация по вероятности прохождения предскрининга
На практике: ручной скрининг 1000 пациентов = 100–200 часов. NLP-скрининг = 2–5 минут с recall >92% по критериям.
Generalizability анализ
AI анализирует, насколько популяция испытания репрезентативна реальной популяции пациентов. Выявление systematic exclusion (например, все испытания по сердечной недостаточности исторически исключали женщин и пожилых).
Предсказание completion rate
Модель предсказывает вероятность, что конкретный пациент завершит испытание (vs. dropout):
- Географическая доступность
- Социально-экономические факторы
- История compliance с предыдущими назначениями
- Количество визитов и их частота
Выбор сначала высокоcompliance пациентов снижает dropout rate и ускоряет набор.
Мониторинг в ходе испытания
Safety Signal Detection
Real-time анализ adverse events (AE) по мере поступления данных. Традиционно: мониторы вручную просматривают CRF (Case Report Forms). AI:
- Автоматическая кодировка AE по MedDRA
- Детекция потенциальных serious AEs в source documents (NLP)
- Statistical signal detection: disproportionality анализ (PRR, ROR) для раннего обнаружения safety signals
Protocol Deviation Detection
NLP + rule checking: автоматическое выявление отклонений от протокола по данным EMR и ePRO. Например: пациент принял запрещённое лекарство по данным pharmacy records.
ePRO качество данных
Electronic Patient-Reported Outcomes: предсказание missing/implausible responses. Модели: временные паттерны, ответы вне диапазона, аномальная скорость ответов (слишком быстро → не читал вопросы).
Adaptive Trial Design поддержка
Для adaptive trials: Bayesian статистика + симуляции для обоснования промежуточных решений (continue, modify, stop). AI компонент: быстрые симуляции operating characteristics при разных сценариях.
Оптимизация сети сайтов
Site Performance Prediction
Предсказание enrollment rate и качества данных по каждому сайту:
- Историческая performance на предыдущих испытаниях
- Размер и качество patient population
- Опыт персонала
- Инфраструктура (EMR, связь с регулятором)
Site selection стала data-driven вместо основанной на личных связях CRO.
Country Feasibility
AI анализирует регуляторные timelines, размер patient pool, стоимость, скорость одобрения по странам → оптимальный микс стран для multinational trial.
Synthetic Control Arms
Вместо традиционной контрольной группы (плацебо) — построение synthetic control из реальных пациентов (RWD - Real World Data), не получавших исследуемый препарат. Propensity score matching + ML для максимальной сопоставимости.
Regulatory статус: FDA и EMA принимают synthetic controls для orphan diseases и accelerated pathways при определённых условиях. Экономия: исключение 30–50% участников контрольной группы = снижение стоимости и этических проблем с плацебо.
Срок разработки patient recruitment AI системы: 3–5 месяцев для конкретной терапевтической области с интеграцией в 3–5 EMR систем.







