Разработка AI-ассистента в мобильном приложении на базе Gemini (Google)

TRUETECH занимается разработкой, поддержкой и обслуживанием мобильных приложений iOS, Android, PWA. Имеем большой опыт и экспертизу для публикации мобильных приложений в популярные маркеты Google Play, App Store, Amazon, AppGallery и другие.

Разработка и поддержка любых видов мобильных приложений:

Информационные и развлекательные мобильные приложения
Новостные приложения, игры, справочники, онлайн-каталоги, погодные, фитнес и здоровье, туристические, образовательные, социальные сети и мессенджеры, квиз, блоги и подкасты, форумы, агрегаторы
Мобильные приложения электронной коммерции
Интернет-магазины, B2B-приложения, маркетплейсы, онлайн-обменники, кэшбэк-сервисы, биржи, дропшиппинг-платформы, программы лояльности, доставка еды и товаров, платежные системы
Мобильные приложения для управления бизнес-процессами
CRM-системы, ERP-системы, управление проектами, инструменты для команды продаж, учет финансов, управление производством, логистика и доставка, управление персоналом, системы мониторинга данных
Мобильные приложения электронных услуг
Доски объявлений, онлайн-школы, онлайн-кинотеатры, платформы предоставления электронных услуг, платформы кешбека, видеохостинги, тематические порталы, платформы онлайн-бронирования и записи, платформы онлайн-торговли

Это лишь некоторые из типы мобильных приложений, с которыми мы работаем, и каждый из них может иметь свои специфические особенности и функциональность, а также быть адаптированным под конкретные потребности и цели клиента.

Услуги, которые мы предлагаем
Показано 1 из 1Все 1735 услуг
Разработка AI-ассистента в мобильном приложении на базе Gemini (Google)
Сложный
от 2 недель до 3 месяцев
Часто задаваемые вопросы

Наши компетенции:

Этапы разработки

Последние работы

  • image_mobile-applications_feedme_467_0.webp
    Разработка мобильного приложения для компании FEEDME
    792
  • image_mobile-applications_xoomer_471_0.webp
    Разработка мобильного приложения для компании XOOMER
    671
  • image_mobile-applications_rhl_428_0.webp
    Разработка мобильного приложения для компании RHL
    1097
  • image_mobile-applications_zippy_411_0.webp
    Разработка мобильного приложения для компании ZIPPY
    969
  • image_mobile-applications_affhome_429_0.webp
    Разработка мобильного приложения для компании Affhome
    914
  • image_mobile-applications_flavors_409_0.webp
    Разработка мобильного приложения для компании FLAVORS
    495

Разработка AI-ассистента в мобильном приложении на базе Gemini (Google)

Gemini — единственная из топовых моделей с нативным Android SDK от Google. google-ai-android (Generative AI SDK) интегрируется через Gradle без серверного прокси, что упрощает старт. Но для продакшена прямой доступ с мобильного клиента — ошибка: API-ключ в APK извлекаем. Это противоречие между удобством и безопасностью нужно решить на старте проекта.

Google AI SDK: Android и iOS

На Android официальный путь:

// build.gradle.kts
implementation("com.google.ai.client.generativeai:generativeai:0.9.0")
val model = GenerativeModel(
    modelName = "gemini-1.5-pro",
    apiKey = BuildConfig.GEMINI_API_KEY,
    generationConfig = generationConfig {
        temperature = 0.7f
        maxOutputTokens = 2048
        topK = 40
        topP = 0.95f
    },
    safetySettings = listOf(
        SafetySetting(HarmCategory.HARASSMENT, BlockThreshold.MEDIUM_AND_ABOVE)
    )
)

На iOS — GoogleGenerativeAI через Swift Package Manager. API идентичен, разница только в синтаксисе.

Для Flutter — google_generative_ai пакет покрывает оба платформы.

Мультимодальность: нативное преимущество Gemini

Gemini 1.5 Pro обрабатывает текст, изображения, аудио, видео и PDF в одном запросе с контекстом до 1 миллиона токенов. Для мобильного ассистента это открывает сценарии, недоступные другим моделям: передать 30-минутное видео и попросить резюме, или загрузить аудиозапись встречи для транскрипции с резюме.

Передача изображения через Android SDK:

val image = BitmapFactory.decodeResource(resources, R.drawable.photo)
val content = content {
    image(image)
    text("Опиши, что происходит на фотографии")
}
val response = model.generateContent(content)

Файлы больше 20 МБ нужно загружать через File API (POST https://generativelanguage.googleapis.com/upload/v1beta/files), а не передавать inline base64. File API хранит файл 48 часов, возвращает file_uri, который используется в дальнейших запросах.

Стриминг и нативный Kotlin coroutines

Gemini Android SDK возвращает Flow<GenerateContentResponse> для стриминга — нативная интеграция с Kotlin coroutines:

viewModelScope.launch {
    model.generateContentStream(prompt).collect { chunk ->
        val text = chunk.text ?: return@collect
        _uiState.update { it + text }
    }
}

Это чище, чем ручной парсинг SSE-потока. На iOS аналогичный AsyncThrowingStream<GenerateContentResponse, Error>.

Gemini vs Vertex AI: выбор для продакшена

Google предлагает два пути:

  • Google AI (Gemini API) — прямой доступ, простой старт, для MVP и небольших приложений
  • Vertex AI — enterprise-вариант с дополнительными возможностями: fine-tuning, корпоративный SLA, данные не используются для обучения, интеграция с Google Cloud IAM

Для мобильного приложения с пользовательскими данными — Vertex AI с серверным прокси. Для прототипа или B2B-инструмента без чувствительных данных — Gemini API достаточно.

Vertex AI SDK на Android: com.google.cloud:google-cloud-aiplatform, но он требует аутентификации через сервисный аккаунт, что подразумевает серверный слой.

Safety Settings и цензура

Gemini имеет встроенную систему блокировок по категориям: HARASSMENT, HATE_SPEECH, SEXUALLY_EXPLICIT, DANGEROUS_CONTENT. По умолчанию порог BLOCK_MEDIUM_AND_ABOVE — довольно агрессивный. Для медицинских или юридических приложений, где нужно обсуждать чувствительные темы, порог снижается до BLOCK_ONLY_HIGH или BLOCK_NONE для конкретных категорий.

Ответ с заблокированным контентом возвращает finishReason: SAFETY, а не ошибку HTTP — нужно явно проверять это поле, иначе пользователь получит пустой ответ без объяснений.

Ориентиры по срокам

Текстовый ассистент с нативным SDK — 1 неделя. Мультимодальный ассистент с File API, стримингом и серверным прокси — 3–4 недели.