Реализация извлечения отношений между сущностями (Relation Extraction)

Проектируем и внедряем системы искусственного интеллекта: от прототипа до production-ready решения. Наша команда объединяет экспертизу в машинном обучении, дата-инжиниринге и MLOps, чтобы AI работал не в лаборатории, а в реальном бизнесе.
Показано 1 из 1 услугВсе 1566 услуг
Реализация извлечения отношений между сущностями (Relation Extraction)
Средняя
~5 рабочих дней
Часто задаваемые вопросы
Направления AI-разработки
Этапы разработки AI-решения
Последние работы
  • image_website-b2b-advance_0.png
    Разработка сайта компании B2B ADVANCE
    1218
  • image_web-applications_feedme_466_0.webp
    Разработка веб-приложения для компании FEEDME
    1161
  • image_websites_belfingroup_462_0.webp
    Разработка веб-сайта для компании БЕЛФИНГРУПП
    853
  • image_ecommerce_furnoro_435_0.webp
    Разработка интернет магазина для компании FURNORO
    1047
  • image_logo-advance_0.png
    Разработка логотипа компании B2B Advance
    561
  • image_crm_enviok_479_0.webp
    Разработка веб-приложения для компании Enviok
    825

Реализация извлечения отношений между сущностями (Relation Extraction)

Relation Extraction (RE) определяет тип связи между двумя именованными сущностями в тексте. «Сбербанк» и «Герман Греф» → отношение является_руководителем. Это шаг выше NER — от распознавания сущностей к пониманию их взаимосвязей.

Формальная постановка

На входе: текст + пара сущностей (e1, e2) + их типы. На выходе: тип отношения из предопределённого набора или NO_RELATION.

Пример схемы отношений для корпоративных текстов:

  • работает_в(PERSON, ORG)
  • является_дочерней(ORG, ORG)
  • расположена_в(ORG, LOC)
  • участвует_в_сделке(ORG, ORG, MONEY)
  • назначен_на_должность(PERSON, ORG, DATE)

Подходы к реализации

Prompt-based (LLM): самый быстрый путь к рабочей системе. Тройка (e1, текст, e2) передаётся модели:

В следующем тексте определи тип отношения между сущностями [Сбербанк] и [Герман Греф].
Доступные типы: работает_в, является_руководителем, основал, покинул.
Если отношений нет — ответь NO_RELATION.

Текст: {текст}

Fine-tuned BERT: для высокой нагрузки и фиксированной схемы отношений. Подход entity-marker: в тексте вставляются специальные токены [E1]Сбербанк[/E1], классификация по [CLS] + [E1] + [E2] токенам.

REBEL (Facebook): end-to-end RE без промежуточного NER, генерирует тройки (субъект, отношение, объект) напрямую.

Distant Supervision

Проблема RE — нужна разметка. Distant Supervision позволяет обойти это: берётся база знаний (Wikidata, Freebase), автоматически размечаются тексты, в которых встречаются пары сущностей, состоящие в известных отношениях. Нечисто (много шума), но позволяет получить 100K+ примеров без ручной разметки.

Метрики

RE метрики считаются строго: правильно, только если верно определены обе сущности, направление отношения и тип. F1 micro по всем отношениям. Типичное качество fine-tuned BERT: 70–80% F1 на стандартных датасетах (TACRED, DocRED).