Интеграция On-Device ML модели (Core ML) для офлайн AI в iOS-приложении

TRUETECH занимается разработкой, поддержкой и обслуживанием мобильных приложений iOS, Android, PWA. Имеем большой опыт и экспертизу для публикации мобильных приложений в популярные маркеты Google Play, App Store, Amazon, AppGallery и другие.

Разработка и поддержка любых видов мобильных приложений:

Информационные и развлекательные мобильные приложения
Новостные приложения, игры, справочники, онлайн-каталоги, погодные, фитнес и здоровье, туристические, образовательные, социальные сети и мессенджеры, квиз, блоги и подкасты, форумы, агрегаторы
Мобильные приложения электронной коммерции
Интернет-магазины, B2B-приложения, маркетплейсы, онлайн-обменники, кэшбэк-сервисы, биржи, дропшиппинг-платформы, программы лояльности, доставка еды и товаров, платежные системы
Мобильные приложения для управления бизнес-процессами
CRM-системы, ERP-системы, управление проектами, инструменты для команды продаж, учет финансов, управление производством, логистика и доставка, управление персоналом, системы мониторинга данных
Мобильные приложения электронных услуг
Доски объявлений, онлайн-школы, онлайн-кинотеатры, платформы предоставления электронных услуг, платформы кешбека, видеохостинги, тематические порталы, платформы онлайн-бронирования и записи, платформы онлайн-торговли

Это лишь некоторые из типы мобильных приложений, с которыми мы работаем, и каждый из них может иметь свои специфические особенности и функциональность, а также быть адаптированным под конкретные потребности и цели клиента.

Услуги, которые мы предлагаем
Показано 1 из 1Все 1735 услуг
Интеграция On-Device ML модели (Core ML) для офлайн AI в iOS-приложении
Сложный
~1-2 недели
Часто задаваемые вопросы

Наши компетенции:

Этапы разработки

Последние работы

  • image_mobile-applications_feedme_467_0.webp
    Разработка мобильного приложения для компании FEEDME
    792
  • image_mobile-applications_xoomer_471_0.webp
    Разработка мобильного приложения для компании XOOMER
    671
  • image_mobile-applications_rhl_428_0.webp
    Разработка мобильного приложения для компании RHL
    1097
  • image_mobile-applications_zippy_411_0.webp
    Разработка мобильного приложения для компании ZIPPY
    969
  • image_mobile-applications_affhome_429_0.webp
    Разработка мобильного приложения для компании Affhome
    914
  • image_mobile-applications_flavors_409_0.webp
    Разработка мобильного приложения для компании FLAVORS
    495

Интеграция On-Device ML модели (Core ML) для офлайн AI в iOS-приложении

Core ML — это не просто «запустить модель на iPhone». Это конкретный путь от PyTorch/TensorFlow весов до вызова .prediction() в SwiftUI-приложении, где на каждом шаге есть нюансы, которые съедают неделю работы, если не знать заранее.

Конвертация модели: coremltools

Большинство современных моделей приходят как PyTorch checkpoint или ONNX файл. Конвертируем через coremltools (Apple, Python-пакет):

import coremltools as ct
import torch

# Допустим, у нас PyTorch модель классификации изображений
model = MyModel()
model.load_state_dict(torch.load("model.pth"))
model.eval()

# Tracing — нужно передать пример входных данных
example_input = torch.zeros(1, 3, 224, 224)
traced = torch.jit.trace(model, example_input)

# Конвертация
mlmodel = ct.convert(
    traced,
    inputs=[ct.ImageType(
        name="input_image",
        shape=(1, 3, 224, 224),
        color_layout=ct.colorlayout.RGB,
        bias=[-0.485/0.229, -0.456/0.224, -0.406/0.225],  # ImageNet нормализация
        scale=1/(255.0 * 0.229)  # встроена в модель, не нужно делать в Swift
    )],
    outputs=[ct.TensorType(name="class_probabilities")],
    compute_precision=ct.precision.FLOAT16,  # для ANE
    minimum_deployment_target=ct.target.iOS16
)

mlmodel.save("MyClassifier.mlpackage")

ct.precision.FLOAT16 + minimum_deployment_target=iOS16 означает, что Core ML активно использует ANE (Apple Neural Engine). На iPhone 14 это 4–8× быстрее GPU для inference, при этом батарея расходуется значительно меньше. На iOS 15 та же модель запускается через Metal GPU.

ct.ImageType с нормализацией встроена в граф — конвертировать UIImage в нормализованный FloatArray в Swift не нужно, Core ML делает это сам.

Частые проблемы при конвертации

Dynamic shapes — модели с torch.Size([batch, seq_len, hidden]) где seq_len не фиксирован ломают torch.jit.trace. Решение: ct.RangeDim для переменных размеров или задать несколько конфигураций через ct.EnumeratedShapes.

# Переменная длина последовательности
flexible_shape = ct.Shape(shape=(1, ct.RangeDim(1, 512), 768))
mlmodel = ct.convert(model, inputs=[ct.TensorType(shape=flexible_shape)])

Неподдерживаемые операции — например, кастомные CUDA kernels. coremltools выбросит NotImplementedError. Путь: либо переписать операцию на стандартных PyTorch примитивах, либо добавить ct.op кастомный слой через C++/Swift extension.

Ошибка Unsupported model format при загрузке .mlpackage на симуляторе x86 — симулятор использует CPU fallback, некоторые FLOAT16 операции не поддерживаются. Тестировать точность — только на реальном устройстве.

Загрузка и запуск на iOS

import CoreML
import Vision

// Загрузка модели (один раз при старте)
let config = MLModelConfiguration()
config.computeUnits = .all  // ANE + GPU + CPU

// .mlpackage загружается из bundle
guard let modelURL = Bundle.main.url(forResource: "MyClassifier", withExtension: "mlpackage"),
      let model = try? MyClassifier(contentsOf: modelURL, configuration: config) else {
    fatalError("Не удалось загрузить модель")
}

// Инференс — в фоновом потоке
DispatchQueue.global(qos: .userInitiated).async {
    do {
        let input = MyClassifierInput(input_image: cgImage)
        let output = try model.prediction(input: input)
        let probs = output.class_probabilities
        // probs — MLMultiArray, достать значение: probs[0].doubleValue
    } catch {
        print("Ошибка инференса: \(error)")
    }
}

Модель загружается ~100–300 мс (зависит от размера). Не загружайте её в viewDidLoad — только один раз при старте приложения или при первом использовании, держите в памяти пока нужна.

Vision Framework как обёртка

Для задач computer vision удобнее VNCoreMLRequest — Vision берёт на себя ресайзинг входа, ориентацию изображения, координатные преобразования:

let coreMLModel = try VNCoreMLModel(for: model.model)  // .model — MLModel из generated class

let request = VNCoreMLRequest(model: coreMLModel) { request, error in
    guard let results = request.results as? [VNClassificationObservation] else { return }
    let topResult = results.sorted { $0.confidence > $1.confidence }.first
    print("\(topResult?.identifier ?? "?") — \(topResult?.confidence ?? 0)")
}
request.imageCropAndScaleOption = .centerCrop  // или .scaleFit

let handler = VNImageRequestHandler(cgImage: inputCGImage, options: [:])
try handler.perform([request])

VNCoreMLRequest автоматически решает проблему несовпадения входного размера — передаёте произвольное изображение, Vision ресайзит до ожидаемого размера модели. Без Vision пришлось бы делать это вручную через vImage или CIImage.

Производительность: замеры

Устройство Модель computeUnits Время инференса
iPhone 14 Pro MobileNetV3 (5 МБ FP16) .all (ANE) 2–4 мс
iPhone 14 Pro ResNet-50 (48 МБ FP16) .all (ANE) 8–15 мс
iPhone 12 BERT-base (350 МБ FP16) .all 180–250 мс
iPhone SE 2nd gen MobileNetV3 (5 МБ FP16) .cpuOnly 12–20 мс

Xcode Instruments → Core ML Instrument для профилирования реального использования ANE/GPU/CPU.

Обновление модели без обновления приложения

Core ML поддерживает загрузку модели из произвольного URL, не только из bundle. Это позволяет обновлять модель через сервер:

// Загружаем mlpackage из документов-директории
let documentsURL = FileManager.default.urls(for: .documentDirectory, in: .userDomainMask)[0]
let downloadedModelURL = documentsURL.appendingPathComponent("updated_model.mlpackage")

if FileManager.default.fileExists(atPath: downloadedModelURL.path) {
    let model = try MyClassifier(contentsOf: downloadedModelURL, configuration: config)
} else {
    // Fallback на bundle
}

Загрузка модели по сети через URLSession, сохранение в Documents, верификация через SHA256-хэш перед использованием.

Процесс

Получение весов → конвертация с подбором precision и compute units → профилирование на целевых устройствах → интеграция в приложение с fallback и обработкой ошибок → опционально: remote model update.

Ориентиры по срокам

Конвертация существующей модели + базовая интеграция в iOS — 1–2 недели. Сложная модель с нестандартными операциями, несколькими входами/выходами, remote update — 3–5 недель.