Разработка AI-ассистента в мобильном приложении на базе GPT-4/GPT-4o

TRUETECH занимается разработкой, поддержкой и обслуживанием мобильных приложений iOS, Android, PWA. Имеем большой опыт и экспертизу для публикации мобильных приложений в популярные маркеты Google Play, App Store, Amazon, AppGallery и другие.

8+Лет на рынкеподробнее 900+Реализованных проектовподробнее 100+Разработчиков в штатеподробнее 19+Партнеровподробнее

Разработка и поддержка любых видов мобильных приложений:

Информационные и развлекательные мобильные приложения

Новостные приложения, игры, справочники, онлайн-каталоги, погодные, фитнес и здоровье, туристические, образовательные, социальные сети и мессенджеры, квиз, блоги и подкасты, форумы, агрегаторы

Мобильные приложения электронной коммерции

Интернет-магазины, B2B-приложения, маркетплейсы, онлайн-обменники, кэшбэк-сервисы, биржи, дропшиппинг-платформы, программы лояльности, доставка еды и товаров, платежные системы

Мобильные приложения для управления бизнес-процессами

CRM-системы, ERP-системы, управление проектами, инструменты для команды продаж, учет финансов, управление производством, логистика и доставка, управление персоналом, системы мониторинга данных

Мобильные приложения электронных услуг

Доски объявлений, онлайн-школы, онлайн-кинотеатры, платформы предоставления электронных услуг, платформы кешбека, видеохостинги, тематические порталы, платформы онлайн-бронирования и записи, платформы онлайн-торговли

Это лишь некоторые из типы мобильных приложений, с которыми мы работаем, и каждый из них может иметь свои специфические особенности и функциональность, а также быть адаптированным под конкретные потребности и цели клиента.

Услуги, которые мы предлагаем

Показано 1 из 1Все 1735 услуг

Разработка AI-ассистента в мобильном приложении на базе GPT-4/GPT-4o

Сложный

от 2 недель до 3 месяцев

Часто задаваемые вопросы

Наши компетенции:

Бесплатная консультация

Закажите бесплатную консультацию если у вас есть вопросы. Профильный специалист вас проконсультирует.

Расчет стоимости

Если вы знаете, что именно вам нужно разработать, или у вас уже есть готовое техническое задание.

Этапы разработки

Последние работы

Разработка мобильного приложения для компании FEEDME
792
Разработка мобильного приложения для компании XOOMER
671
Разработка мобильного приложения для компании RHL
1097
Разработка мобильного приложения для компании ZIPPY
969
Разработка мобильного приложения для компании Affhome
914
Разработка мобильного приложения для компании FLAVORS
495

Показать больше работ

Разработка AI-ассистента в мобильном приложении на базе GPT-4/GPT-4o

GPT-4o — мультимодальная модель: принимает текст, изображения и аудио в одном API-вызове. Это меняет архитектуру ассистента по сравнению с GPT-4-turbo: вместо отдельных пайплайнов для OCR + текст + голос — один эндпоинт gpt-4o с content типа array. Мобильное приложение, которое не использует эту возможность, теряет половину ценности модели.

Интеграция OpenAI API: что реально важно

Базовый вызов — через POST /v1/chat/completions. На iOS удобнее всего использовать официальный openai-swift пакет или написать тонкий wrapper на URLSession — зависимость от тяжёлых HTTP-клиентов здесь не нужна.

Ключевые параметры для мобильного ассистента:

let request = ChatCompletionRequest(
    model: "gpt-4o",
    messages: conversationHistory,
    stream: true,           // стриминг — обязателен для UX
    maxTokens: 1024,
    temperature: 0.7
)

Стриминг — не опция, а требование. Пользователь, который ждёт 5–8 секунд тишины перед появлением ответа, закрывает приложение. С stream: true первый токен приходит через 300–500 мс, и текст появляется посимвольно. Реализация на iOS через URLSession + AsyncBytes или через EventSource для SSE.

Мультимодальность GPT-4o. Передача изображения:

let message = ChatMessage(role: .user, content: [
    .text("Что изображено на этом скриншоте?"),
    .imageURL(base64Image: imageBase64, detail: .auto)
])

detail: .auto — модель сама выбирает между low (85 токенов) и high (до 1700 токенов) в зависимости от задачи. Для анализа документов лучше high, для быстрых ответов — low.

Управление контекстом и токенами

GPT-4o имеет контекстное окно 128K токенов. Но слать всю историю диалога в каждом запросе — ошибка, которая бьёт по стоимости и задержке. Правильная стратегия: скользящее окно с суммаризацией.

Когда история превышает порог (например, 4000 токенов), последние N сообщений сохраняются полностью, более ранние — заменяются summary, сгенерированным через отдельный вызов с gpt-4o-mini (дешевле в 20 раз). Summary хранится как system сообщение в начале истории.

Токены считаем через tiktoken на сервере или используем эвристику: ~4 символа ≈ 1 токен для английского, ~2–3 символа ≈ 1 токен для кириллицы.

Обработка ошибок и rate limits

OpenAI API возвращает 429 Too Many Requests при превышении rate limit. На мобильном клиенте нужен exponential backoff с jitter:

func retryWithBackoff<T>(maxAttempts: Int = 3, operation: () async throws -> T) async throws -> T {
    var attempt = 0
    while attempt < maxAttempts {
        do {
            return try await operation()
        } catch APIError.rateLimitExceeded {
            let delay = Double.random(in: 1.0...2.0) * pow(2.0, Double(attempt))
            try await Task.sleep(nanoseconds: UInt64(delay * 1_000_000_000))
            attempt += 1
        }
    }
    throw APIError.maxRetriesExceeded
}

Таймаут на стриминговый запрос нужно ставить на уровне чтения (timeout per chunk), а не на весь запрос — иначе длинные ответы обрываются.

Безопасность API-ключа

API-ключ OpenAI нельзя хардкодить в мобильном приложении — его можно извлечь из бинарника за минуты. Правильная схема: мобильный клиент аутентифицируется на собственном бэкенде, бэкенд проксирует запросы к OpenAI с ключом из переменных окружения. Дополнительно — rate limiting на уровне пользователя.

Процесс работы

Аудит требований: какие модальности нужны (только текст, изображения, голос), нужен ли серверный прокси, требования к истории диалога (сколько хранить, синхронизировать ли между устройствами).

Разработка: API-клиент → стриминговый UI → управление историей → мультимодальность → обработка ошибок → серверный прокси.

Ориентиры по срокам

Текстовый ассистент с стримингом и историей — 1–2 недели. С изображениями, голосом, серверным прокси и управлением контекстом — 3–5 недель.