Реализация классификации объектов в мобильном приложении

TRUETECH занимается разработкой, поддержкой и обслуживанием мобильных приложений iOS, Android, PWA. Имеем большой опыт и экспертизу для публикации мобильных приложений в популярные маркеты Google Play, App Store, Amazon, AppGallery и другие.
Разработка и поддержка любых видов мобильных приложений:
Информационные и развлекательные мобильные приложения
Новостные приложения, игры, справочники, онлайн-каталоги, погодные, фитнес и здоровье, туристические, образовательные, социальные сети и мессенджеры, квиз, блоги и подкасты, форумы, агрегаторы
Мобильные приложения электронной коммерции
Интернет-магазины, B2B-приложения, маркетплейсы, онлайн-обменники, кэшбэк-сервисы, биржи, дропшиппинг-платформы, программы лояльности, доставка еды и товаров, платежные системы
Мобильные приложения для управления бизнес-процессами
CRM-системы, ERP-системы, управление проектами, инструменты для команды продаж, учет финансов, управление производством, логистика и доставка, управление персоналом, системы мониторинга данных
Мобильные приложения электронных услуг
Доски объявлений, онлайн-школы, онлайн-кинотеатры, платформы предоставления электронных услуг, платформы кешбека, видеохостинги, тематические порталы, платформы онлайн-бронирования и записи, платформы онлайн-торговли

Это лишь некоторые из типы мобильных приложений, с которыми мы работаем, и каждый из них может иметь свои специфические особенности и функциональность, а также быть адаптированным под конкретные потребности и цели клиента.

Предлагаемые услуги
Показано 1 из 1 услугВсе 1735 услуг
Реализация классификации объектов в мобильном приложении
Средняя
~1-2 недели
Часто задаваемые вопросы
Наши компетенции:
Этапы разработки
Последние работы
  • image_mobile-applications_feedme_467_0.webp
    Разработка мобильного приложения для компании FEEDME
    756
  • image_mobile-applications_xoomer_471_0.webp
    Разработка мобильного приложения для компании XOOMER
    624
  • image_mobile-applications_rhl_428_0.webp
    Разработка мобильного приложения для компании RHL
    1052
  • image_mobile-applications_zippy_411_0.webp
    Разработка мобильного приложения для компании ZIPPY
    947
  • image_mobile-applications_affhome_429_0.webp
    Разработка мобильного приложения для компании Affhome
    862
  • image_mobile-applications_flavors_409_0.webp
    Разработка мобильного приложения для компании FLAVORS
    445

Реализация классификации объектов в мобильном приложении

Классификация объектов отличается от детекции одним ключевым моментом: модель отвечает на вопрос «что это?», а не «где это?». Один выход — вектор вероятностей по классам. Кажется проще детекции, но именно здесь чаще всего получают проблемы с confidence threshold и UX.

Выбор модели под задачу

Для топ-1000 классов (продукты, животные, объекты быта) — MobileNetV3, EfficientNetB0/B1. Работают out-of-the-box через ML Kit Image Labeling или Core ML с моделями из Apple Model Gallery. Для узкой предметной области (конкретный вид продукции, дефекты на производстве) — нужна дообученная модель.

Дообучение (fine-tuning) под кастомный датасет: берём предобученный backbone (MobileNetV2, EfficientNetB0), замораживаем нижние слои, обучаем только верхние на своих данных. Для 10–50 классов достаточно 200–500 примеров на класс при правильной аугментации. Меньше — нужен few-shot подход (Prototypical Networks).

После обучения: конвертация в .mlmodel (iOS) или .tflite (Android), добавление metadata с именами классов и параметрами нормализации.

Пороги уверенности: где теряются продукты

Самая частая ошибка в UX — показывать результат классификации без учёта confidence. Модель всегда возвращает распределение вероятностей, argmax всегда выдаёт «победителя» — даже когда модель в него не верит. Если топ-1 класс имеет score 0.23 при следующем 0.21 — это не классификация, это случайность.

Правильный подход: задать threshold (обычно 0.5–0.7 в зависимости от задачи). Если топ-1 ниже порога — показываем «не удалось определить» или просим переснять. Для критичных задач (медицина, юридические документы) — дополнительно проверяем entropy распределения.

На iOS через VNCoreMLRequest:

request.imageCropAndScaleOption = .centerCrop
let observations = results as? [VNClassificationObservation]
let confident = observations?.filter { $0.confidence > 0.65 }

На Android через ML Kit ImageLabeling:

val options = ImageLabelerOptions.Builder()
    .setConfidenceThreshold(0.65f)
    .build()

Топ-N и отображение результатов

Показывать топ-3 класса с процентами — правильно для образовательных и consumer-приложений. Для бизнес-приложений (автоматизация, склад) нужен один уверенный результат или ничего.

Кейс: приложение для инвентаризации на складе, классификация 87 SKU через кастомную EfficientNetB0-модель. Исходный порог 0.5 давал 12% ложных срабатываний. После анализа confusion matrix выяснили: 80% ошибок — между SKU с похожей упаковкой. Добавили второй уровень: если топ-2 и топ-3 суммарно больше 0.4, просим оператора подтвердить выбор. Ложные срабатывания упали до 2.1%.

UI результата: не перегружать пользователя числами. Прогресс-бар или цветовая индикация (зелёный/жёлтый/красный) воспринимается лучше, чем «73.4%». Анимация появления результата через withAnimation (SwiftUI) или ObjectAnimator (Android) снижает ощущение «холодного» ответа от модели.

Сроки и процесс

Интеграция готовой модели в существующее приложение — 3–5 дней. Fine-tuning кастомной модели + интеграция — 1–2 недели. Стоимость рассчитывается индивидуально.