Разработка AI-системы детекции AI-сгенерированных работ

Проектируем и внедряем системы искусственного интеллекта: от прототипа до production-ready решения. Наша команда объединяет экспертизу в машинном обучении, дата-инжиниринге и MLOps, чтобы AI работал не в лаборатории, а в реальном бизнесе.
Показано 1 из 1 услугВсе 1566 услуг
Разработка AI-системы детекции AI-сгенерированных работ
Средняя
~1-2 недели
Часто задаваемые вопросы
Направления AI-разработки
Этапы разработки AI-решения
Последние работы
  • image_website-b2b-advance_0.png
    Разработка сайта компании B2B ADVANCE
    1240
  • image_web-applications_feedme_466_0.webp
    Разработка веб-приложения для компании FEEDME
    1167
  • image_websites_belfingroup_462_0.webp
    Разработка веб-сайта для компании БЕЛФИНГРУПП
    867
  • image_ecommerce_furnoro_435_0.webp
    Разработка интернет магазина для компании FURNORO
    1084
  • image_logo-advance_0.png
    Разработка логотипа компании B2B Advance
    563
  • image_crm_enviok_479_0.webp
    Разработка веб-приложения для компании Enviok
    829

Разработка AI-системы детекции AI-сгенерированных работ

Детекция AI-сгенерированных учебных работ — специализированная задача с более высокими требованиями к точности и обоснованности по сравнению с общими AI-детекторами. Ошибочное обвинение в академической нечестности — серьёзное нарушение прав студента.

Признаки AI-сгенерированного текста

Статистические сигналы:

  • Низкая perplexity: AI выбирает предсказуемые слова
  • Низкий burstiness: равномерная длина предложений без характерных для человека «всплесков»
  • Отсутствие личного стиля и экспериментов с языком

Семантические сигналы:

  • Слишком правильная структура (введение-тезис-аргументы-вывод без отступлений)
  • Отсутствие персональных примеров и конкретики
  • «Энциклопедический» стиль для заданий, где ожидается личный взгляд
  • Характерные AI-фразы: «Важно отметить», «Это фундаментальный вопрос», «В заключение следует подчеркнуть»

Ансамблевый подход

class AIContentDetectionResult(BaseModel):
    is_ai_generated: bool
    confidence: float
    signals: list[DetectionSignal]
    human_review_required: bool
    evidence: str

def detect_ai_content(text: str) -> AIContentDetectionResult:
    signals = []

    # Сигнал 1: GPTZero API
    gptzero_score = gptzero_api.classify(text)
    signals.append(DetectionSignal("gptzero", gptzero_score))

    # Сигнал 2: Perplexity через локальную модель
    perplexity = compute_perplexity(text)
    signals.append(DetectionSignal("perplexity", normalize_perplexity(perplexity)))

    # Сигнал 3: Burstiness
    burstiness = compute_burstiness(text)
    signals.append(DetectionSignal("burstiness", 1 - burstiness))  # низкий burstiness → высокий сигнал

    # Агрегация
    avg_signal = weighted_average(signals)
    return AIContentDetectionResult(
        is_ai_generated=avg_signal > 0.7,
        confidence=avg_signal,
        signals=signals,
        human_review_required=0.5 < avg_signal < 0.85,
        evidence=generate_evidence_report(signals, text)
    )

Процедура при детекции

  1. Система флагирует работу с confidence > 0.7
  2. Обязательная ручная проверка преподавателем
  3. При необходимости: устное собеседование со студентом (может ли объяснить содержание?)
  4. Финальное решение — только за человеком, не за AI-системой

Легитимное использование AI в учёбе

Не все AI-следы означают нарушение. Институту нужна политика: что разрешено (использовать AI для идей, проверять грамматику), что запрещено (сдавать AI-текст как свой). Детектор настраивается согласно политике — не «AI = нарушение».