Разработка AI-ассистента в мобильном приложении на базе GPT-4/GPT-4o

TRUETECH занимается разработкой, поддержкой и обслуживанием мобильных приложений iOS, Android, PWA. Имеем большой опыт и экспертизу для публикации мобильных приложений в популярные маркеты Google Play, App Store, Amazon, AppGallery и другие.

Разработка и поддержка любых видов мобильных приложений:

Информационные и развлекательные мобильные приложения
Новостные приложения, игры, справочники, онлайн-каталоги, погодные, фитнес и здоровье, туристические, образовательные, социальные сети и мессенджеры, квиз, блоги и подкасты, форумы, агрегаторы
Мобильные приложения электронной коммерции
Интернет-магазины, B2B-приложения, маркетплейсы, онлайн-обменники, кэшбэк-сервисы, биржи, дропшиппинг-платформы, программы лояльности, доставка еды и товаров, платежные системы
Мобильные приложения для управления бизнес-процессами
CRM-системы, ERP-системы, управление проектами, инструменты для команды продаж, учет финансов, управление производством, логистика и доставка, управление персоналом, системы мониторинга данных
Мобильные приложения электронных услуг
Доски объявлений, онлайн-школы, онлайн-кинотеатры, платформы предоставления электронных услуг, платформы кешбека, видеохостинги, тематические порталы, платформы онлайн-бронирования и записи, платформы онлайн-торговли

Это лишь некоторые из типы мобильных приложений, с которыми мы работаем, и каждый из них может иметь свои специфические особенности и функциональность, а также быть адаптированным под конкретные потребности и цели клиента.

Услуги, которые мы предлагаем
Показано 1 из 1Все 1735 услуг
Разработка AI-ассистента в мобильном приложении на базе GPT-4/GPT-4o
Сложный
от 2 недель до 3 месяцев
Часто задаваемые вопросы

Наши компетенции:

Этапы разработки

Последние работы

  • image_mobile-applications_feedme_467_0.webp
    Разработка мобильного приложения для компании FEEDME
    792
  • image_mobile-applications_xoomer_471_0.webp
    Разработка мобильного приложения для компании XOOMER
    671
  • image_mobile-applications_rhl_428_0.webp
    Разработка мобильного приложения для компании RHL
    1097
  • image_mobile-applications_zippy_411_0.webp
    Разработка мобильного приложения для компании ZIPPY
    969
  • image_mobile-applications_affhome_429_0.webp
    Разработка мобильного приложения для компании Affhome
    914
  • image_mobile-applications_flavors_409_0.webp
    Разработка мобильного приложения для компании FLAVORS
    495

Разработка AI-ассистента в мобильном приложении на базе GPT-4/GPT-4o

GPT-4o — мультимодальная модель: принимает текст, изображения и аудио в одном API-вызове. Это меняет архитектуру ассистента по сравнению с GPT-4-turbo: вместо отдельных пайплайнов для OCR + текст + голос — один эндпоинт gpt-4o с content типа array. Мобильное приложение, которое не использует эту возможность, теряет половину ценности модели.

Интеграция OpenAI API: что реально важно

Базовый вызов — через POST /v1/chat/completions. На iOS удобнее всего использовать официальный openai-swift пакет или написать тонкий wrapper на URLSession — зависимость от тяжёлых HTTP-клиентов здесь не нужна.

Ключевые параметры для мобильного ассистента:

let request = ChatCompletionRequest(
    model: "gpt-4o",
    messages: conversationHistory,
    stream: true,           // стриминг — обязателен для UX
    maxTokens: 1024,
    temperature: 0.7
)

Стриминг — не опция, а требование. Пользователь, который ждёт 5–8 секунд тишины перед появлением ответа, закрывает приложение. С stream: true первый токен приходит через 300–500 мс, и текст появляется посимвольно. Реализация на iOS через URLSession + AsyncBytes или через EventSource для SSE.

Мультимодальность GPT-4o. Передача изображения:

let message = ChatMessage(role: .user, content: [
    .text("Что изображено на этом скриншоте?"),
    .imageURL(base64Image: imageBase64, detail: .auto)
])

detail: .auto — модель сама выбирает между low (85 токенов) и high (до 1700 токенов) в зависимости от задачи. Для анализа документов лучше high, для быстрых ответов — low.

Управление контекстом и токенами

GPT-4o имеет контекстное окно 128K токенов. Но слать всю историю диалога в каждом запросе — ошибка, которая бьёт по стоимости и задержке. Правильная стратегия: скользящее окно с суммаризацией.

Когда история превышает порог (например, 4000 токенов), последние N сообщений сохраняются полностью, более ранние — заменяются summary, сгенерированным через отдельный вызов с gpt-4o-mini (дешевле в 20 раз). Summary хранится как system сообщение в начале истории.

Токены считаем через tiktoken на сервере или используем эвристику: ~4 символа ≈ 1 токен для английского, ~2–3 символа ≈ 1 токен для кириллицы.

Обработка ошибок и rate limits

OpenAI API возвращает 429 Too Many Requests при превышении rate limit. На мобильном клиенте нужен exponential backoff с jitter:

func retryWithBackoff<T>(maxAttempts: Int = 3, operation: () async throws -> T) async throws -> T {
    var attempt = 0
    while attempt < maxAttempts {
        do {
            return try await operation()
        } catch APIError.rateLimitExceeded {
            let delay = Double.random(in: 1.0...2.0) * pow(2.0, Double(attempt))
            try await Task.sleep(nanoseconds: UInt64(delay * 1_000_000_000))
            attempt += 1
        }
    }
    throw APIError.maxRetriesExceeded
}

Таймаут на стриминговый запрос нужно ставить на уровне чтения (timeout per chunk), а не на весь запрос — иначе длинные ответы обрываются.

Безопасность API-ключа

API-ключ OpenAI нельзя хардкодить в мобильном приложении — его можно извлечь из бинарника за минуты. Правильная схема: мобильный клиент аутентифицируется на собственном бэкенде, бэкенд проксирует запросы к OpenAI с ключом из переменных окружения. Дополнительно — rate limiting на уровне пользователя.

Процесс работы

Аудит требований: какие модальности нужны (только текст, изображения, голос), нужен ли серверный прокси, требования к истории диалога (сколько хранить, синхронизировать ли между устройствами).

Разработка: API-клиент → стриминговый UI → управление историей → мультимодальность → обработка ошибок → серверный прокси.

Ориентиры по срокам

Текстовый ассистент с стримингом и историей — 1–2 недели. С изображениями, голосом, серверным прокси и управлением контекстом — 3–5 недель.