Реализация Guardrails (ограничений ответов) AI-ассистента в мобильном приложении

TRUETECH занимается разработкой, поддержкой и обслуживанием мобильных приложений iOS, Android, PWA. Имеем большой опыт и экспертизу для публикации мобильных приложений в популярные маркеты Google Play, App Store, Amazon, AppGallery и другие.

Разработка и поддержка любых видов мобильных приложений:

Информационные и развлекательные мобильные приложения
Новостные приложения, игры, справочники, онлайн-каталоги, погодные, фитнес и здоровье, туристические, образовательные, социальные сети и мессенджеры, квиз, блоги и подкасты, форумы, агрегаторы
Мобильные приложения электронной коммерции
Интернет-магазины, B2B-приложения, маркетплейсы, онлайн-обменники, кэшбэк-сервисы, биржи, дропшиппинг-платформы, программы лояльности, доставка еды и товаров, платежные системы
Мобильные приложения для управления бизнес-процессами
CRM-системы, ERP-системы, управление проектами, инструменты для команды продаж, учет финансов, управление производством, логистика и доставка, управление персоналом, системы мониторинга данных
Мобильные приложения электронных услуг
Доски объявлений, онлайн-школы, онлайн-кинотеатры, платформы предоставления электронных услуг, платформы кешбека, видеохостинги, тематические порталы, платформы онлайн-бронирования и записи, платформы онлайн-торговли

Это лишь некоторые из типы мобильных приложений, с которыми мы работаем, и каждый из них может иметь свои специфические особенности и функциональность, а также быть адаптированным под конкретные потребности и цели клиента.

Услуги, которые мы предлагаем
Показано 1 из 1Все 1735 услуг
Реализация Guardrails (ограничений ответов) AI-ассистента в мобильном приложении
Средний
~3-5 дней
Часто задаваемые вопросы

Наши компетенции:

Этапы разработки

Последние работы

  • image_mobile-applications_feedme_467_0.webp
    Разработка мобильного приложения для компании FEEDME
    792
  • image_mobile-applications_xoomer_471_0.webp
    Разработка мобильного приложения для компании XOOMER
    671
  • image_mobile-applications_rhl_428_0.webp
    Разработка мобильного приложения для компании RHL
    1097
  • image_mobile-applications_zippy_411_0.webp
    Разработка мобильного приложения для компании ZIPPY
    969
  • image_mobile-applications_affhome_429_0.webp
    Разработка мобильного приложения для компании Affhome
    914
  • image_mobile-applications_flavors_409_0.webp
    Разработка мобильного приложения для компании FLAVORS
    495

Реализация Guardrails (ограничений ответов) AI-ассистента в мобильном приложении

AI-ассистент в продакшене без guardrails — это открытая уязвимость. Пользователь задаст вопрос вне домена, попробует prompt injection через пользовательский контент, или модель сама уйдёт в нежелательную тему. Guardrails — это не один фильтр, а слоёная система валидации на входе и выходе.

Слои защиты: что и где проверяем

Input guardrails — проверка запроса пользователя до отправки в LLM.

Тематический фильтр: определяем, относится ли вопрос к домену приложения. Простейший вариант — embeddings + cosine similarity с набором «разрешённых тем». Более надёжный — отдельный быстрый классификатор (GPT-4o-mini с примитивным промптом, latency ~200мс):

func isOnTopic(_ userMessage: String) async -> Bool {
    let classifierPrompt = """
    Определи, относится ли следующий вопрос к теме личных финансов (бюджет, расходы, сбережения, инвестиции).
    Ответь только: YES или NO.
    Вопрос: \(userMessage)
    """
    let response = await llmClient.complete(classifierPrompt, temperature: 0)
    return response.trimmingCharacters(in: .whitespaces) == "YES"
}

Prompt injection detection: если приложение обрабатывает пользовательский контент (заметки, документы) и передаёт его в контекст LLM, нужна проверка на инжекции вида «Ignore previous instructions and...». Базовая защита — поиск по паттернам, более надёжная — специализированный классификатор типа rebuff или lakera-guard.

Output guardrails — валидация ответа модели перед показом пользователю.

Контроль формата и бизнес-правил

Когда ассистент возвращает структурированные данные, каждый ответ нужно валидировать перед рендерингом:

// Android — Kotlin
data class AssistantResponse(
    val text: String,
    val category: String?,
    val amount: Double?
)

fun validateResponse(raw: String): AssistantResponse? {
    return try {
        val parsed = gson.fromJson(raw, AssistantResponse::class.java)
        // Бизнес-правила: сумма не может быть отрицательной
        if (parsed.amount != null && parsed.amount < 0) return null
        // Категория должна быть из разрешённого списка
        if (parsed.category != null && parsed.category !in allowedCategories) return null
        parsed
    } catch (e: JsonSyntaxException) {
        null // Ответ не в формате JSON — отбрасываем, показываем fallback
    }
}

Длина и тон ответа. Некоторые модели при определённых запросах начинают генерировать неожиданно длинные ответы. Жёсткий max_tokens в запросе + проверка длины на клиенте до рендеринга.

Библиотеки и готовые решения

Guardrails AI (guardrails-ai Python) — декларативное описание правил валидации с автоматическим retry. Применимо на сервере, который проксирует запросы от мобильного клиента. NeMo Guardrails от NVIDIA — более тяжеловесное решение для enterprise, поддерживает диалоговые флоу и topical rails.

Для небольших приложений достаточно собственной middleware-прослойки на сервере с набором правил. Главное — не делать это на клиенте: guardrails должны работать на сервере, иначе их можно обойти прямым обращением к API.

Ориентиры по срокам

Базовые input/output фильтры — 1–2 дня. Тематический классификатор с тестовым покрытием — 2–3 дня. Полная слоёная система с логированием нарушений — 4–5 дней.