Какие сущности распознаёт NER в мобильном приложении?

NER выделяет имена, даты, адреса, организации, суммы и другие предопределённые типы. Для кастомных сущностей (артикулы, размеры) требуется дообучение модели.

Можно ли запускать NER прямо на устройстве?

Да, компактные модели (TFLite, CoreML) размером до 20 МБ работают офлайн. Для русского языка точность ниже, чем у серверных трансформеров, но для простых доменов подход оправдан.

Какой стек выбрать для NER: spaCy или трансформеры?

spaCy быстрее (5–20 мс на запрос), подходит для real-time и базовых сущностей. Трансформеры (DeepPavlov, BERT) точнее на сложных контекстах, но медленнее (50–200 мс). Рекомендуем гибрид: regex для стандартных форматов, ML для свободного текста.

Сколько времени занимает внедрение NER в приложение?

Базовая интеграция с готовой русской моделью — 3–5 дней. Дообучение на кастомные сущности — 1–2 недели. Полная интеграция с умным UI — 2–3 недели.

Какие данные нужны для обучения собственной NER-модели?

Размеченные тексты в BIO-формате (минимум 500 примеров на тип сущности). Мы помогаем собрать и разметить данные под ваш домен: товары, медтермины, юридические поля.

Какие сущности распознаёт NER в мобильном приложении?

NER выделяет имена, даты, адреса, организации, суммы и другие предопределённые типы. Для кастомных сущностей (артикулы, размеры) требуется дообучение модели.

Можно ли запускать NER прямо на устройстве?

Да, компактные модели (TFLite, CoreML) размером до 20 МБ работают офлайн. Для русского языка точность ниже, чем у серверных трансформеров, но для простых доменов подход оправдан.

Какой стек выбрать для NER: spaCy или трансформеры?

spaCy быстрее (5–20 мс на запрос), подходит для real-time и базовых сущностей. Трансформеры (DeepPavlov, BERT) точнее на сложных контекстах, но медленнее (50–200 мс). Рекомендуем гибрид: regex для стандартных форматов, ML для свободного текста.

Сколько времени занимает внедрение NER в приложение?

Базовая интеграция с готовой русской моделью — 3–5 дней. Дообучение на кастомные сущности — 1–2 недели. Полная интеграция с умным UI — 2–3 недели.

Какие данные нужны для обучения собственной NER-модели?

Размеченные тексты в BIO-формате (минимум 500 примеров на тип сущности). Мы помогаем собрать и разметить данные под ваш домен: товары, медтермины, юридические поля.

NER в мобильном приложении: извлечение сущностей из текста

TRUETECH занимается разработкой, поддержкой и обслуживанием мобильных приложений iOS, Android, PWA. Имеем большой опыт и экспертизу для публикации мобильных приложений в популярные маркеты Google Play, App Store, Amazon, AppGallery и другие.

8+Лет на рынкеподробнее 900+Реализованных проектовподробнее 100+Разработчиков в штатеподробнее 19+Партнеровподробнее

Разработка и поддержка любых видов мобильных приложений:

Информационные и развлекательные мобильные приложения

Новостные приложения, игры, справочники, онлайн-каталоги, погодные, фитнес и здоровье, туристические, образовательные, социальные сети и мессенджеры, квиз, блоги и подкасты, форумы, агрегаторы

Мобильные приложения электронной коммерции

Интернет-магазины, B2B-приложения, маркетплейсы, онлайн-обменники, кэшбэк-сервисы, биржи, дропшиппинг-платформы, программы лояльности, доставка еды и товаров, платежные системы

Мобильные приложения для управления бизнес-процессами

CRM-системы, ERP-системы, управление проектами, инструменты для команды продаж, учет финансов, управление производством, логистика и доставка, управление персоналом, системы мониторинга данных

Мобильные приложения электронных услуг

Доски объявлений, онлайн-школы, онлайн-кинотеатры, платформы предоставления электронных услуг, платформы кешбека, видеохостинги, тематические порталы, платформы онлайн-бронирования и записи, платформы онлайн-торговли

Это лишь некоторые из типы мобильных приложений, с которыми мы работаем, и каждый из них может иметь свои специфические особенности и функциональность, а также быть адаптированным под конкретные потребности и цели клиента.

Услуги, которые мы предлагаем

Показано 1 из 1Все 1734 услуг

NER в мобильном приложении: извлечение сущностей из текста

Средний

~3-5 дней

Часто задаваемые вопросы

Наши компетенции:

Бесплатная консультация

Закажите бесплатную консультацию если у вас есть вопросы. Профильный специалист вас проконсультирует.

Расчет стоимости

Если вы знаете, что именно вам нужно разработать, или у вас уже есть готовое техническое задание.

Этапы разработки

Последние работы

Разработка мобильного приложения для компании FEEDME
858
Разработка мобильного приложения для компании XOOMER
746
Разработка мобильного приложения для компании RHL
1162
Разработка мобильного приложения для компании ZIPPY
1034
Разработка мобильного приложения для компании Affhome
969
Разработка мобильного приложения для компании FLAVORS
563

Показать больше работ

Извлечение именованных сущностей (NER) в мобильном приложении

В приложении доставки пользователь печатает «доставьте в четверг к 14:00 на Ленина 5 кв 12» в одно поле. Без NER пришлось бы писать десятки регулярных выражений — и каждый нестандартный формат ломает логику. Мы решаем это кастомной NER-моделью: она превращает free-form текст в структурированные поля {дата, время, улица, дом, квартира}. Экономия времени ввода — до 40%, а количество ошибок падает на 60%. Базовая интеграция занимает от 3 до 5 дней, полное внедрение с умными формами — от 2 до 3 недель. Стоимость рассчитывается индивидуально под ваш кейс.

Как NER преобразует текст в структурированные данные

NER (Named Entity Recognition) — это NLP-задача, выделяющая из текста сущности: имена, локации, даты, организации. В мобильных приложениях NER применяется для:

Умные формы и автозаполнение. Пользователь пишет сообщение курьеру — приложение парсит адрес и время доставки без отдельных полей формы.
Поиск с фильтрами. «iPhone 15 Pro 256GB чёрный» -> {бренд: Apple, модель: iPhone 15 Pro, объём: 256GB, цвет: чёрный}. Структурированный запрос точнее полнотекстового поиска.
Чат-боты и голосовые ассистенты. Экстракция параметров из свободной речи или текста для заполнения слотов диалога.
Обработка чеков и документов. OCR-текст с чека -> {магазин, сумма, дата, позиции}.

Почему стоит выбрать гибридный подход?

Чистый NER на трансформерах даёт высокую точность, но медленен и требует сервера. Чистый regex быстр, но ломается на свободном тексте. Гибрид regex+NER сочетает скорость обработки типовых сущностей (телефоны, email, артикулы) с гибкостью ML для сложных контекстов. В большинстве проектов это оптимальный баланс производительности и качества.

Какие технические подходы выбрать для мобильного приложения

Подход	Скорость	Точность на домене	Офлайн	Рекомендуемый сценарий
spaCy + кастомная модель	5–20 мс	Средняя (с дообучением высокая)	Да (модель до 50 МБ)	Real-time автозаполнение, простые сущности
Трансформер (Hugging Face)	50–200 мс	Высокая	Нет (обычно сервер)	Сложные контексты, юридические/медицинские тексты
Regex + NER гибрид	1–5 мс	Высокая для форматов, низкая для свободного текста	Да	Телефоны, email, артикулы + NER для остального

Сравнение on-device и серверного NER:

Критерий	On-device (TFLite/CoreML)	Серверный API (трансформер)
Latency	1–20 мс	50–200 мс + сеть
Офлайн	Да	Нет
Размер модели	до 20 МБ	200+ МБ
Точность на сложных доменах	Средняя	Высокая
Обновление модели	Через App Store	Без перевыпуска приложения

spaCy + кастомная NER-модель

spaCy — стандарт для production NER. Базовая русская модель ru_core_news_lg распознаёт персоны, организации, локации, даты. Для доменно-специфичных сущностей (размеры одежды, артикулы, медицинские термины) нужно дообучение.

Пример обучения spaCy модели

import spacy
from spacy.training import Example

# Загрузка базовой русской модели
nlp = spacy.load("ru_core_news_lg")

# Добавление кастомных типов сущностей
ner = nlp.get_pipe("ner")
ner.add_label("PRODUCT_SIZE")
ner.add_label("PRODUCT_COLOR")
ner.add_label("ARTICLE")

# Пример обучения
TRAIN_DATA = [
    ("Хочу найти кроссовки размер 42 в синем цвете артикул 98765",
     {"entities": [(33, 35, "PRODUCT_SIZE"), (43, 49, "PRODUCT_COLOR"), (59, 64, "ARTICLE")]}),
]

optimizer = nlp.resume_training()
for text, annotations in TRAIN_DATA:
    doc = nlp.make_doc(text)
    example = Example.from_dict(doc, annotations)
    nlp.update([example], sgd=optimizer)

Официальная документация spaCy по обучению NER: https://spacy.io/usage/training#ner

Трансформерная NER через Hugging Face

Для высокой точности на сложных доменах используем дообученный DeepPavlov/rubert-base-cased с NER head. Этот подход медленнее spaCy, но значительно лучше обрабатывает контекстуальные зависимости.

from transformers import pipeline

ner_pipeline = pipeline(
    "token-classification",
    model="DeepPavlov/rubert-base-cased-ner",
    aggregation_strategy="simple"
)

def extract_entities(text: str) -> list[Entity]:
    raw_entities = ner_pipeline(text)
    return [
        Entity(
            text=e["word"],
            label=e["entity_group"],
            confidence=e["score"],
            start=e["start"],
            end=e["end"]
        )
        for e in raw_entities
        if e["score"] > 0.7
    ]

Как реализовать гибридный извлекатель?

import re
from typing import NamedTuple

class EntityExtractor:
    PHONE_PATTERN = re.compile(r'(?:\+7|8)[\s\-]?\(?\d{3}\)?[\s\-]?\d{3}[\s\-]?\d{2}[\s\-]?\d{2}')
    EMAIL_PATTERN = re.compile(r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b')
    DATE_PATTERN = re.compile(r'\b(\d{1,2})[./](\d{1,2})(?:[./](\d{2,4}))?\b')

    def extract_all(self, text: str) -> dict:
        phones = self.PHONE_PATTERN.findall(text)
        emails = self.EMAIL_PATTERN.findall(text)

        ner_entities = extract_entities(text)
        locations = [e.text for e in ner_entities if e.label in ("LOC", "GPE")]
        persons = [e.text for e in ner_entities if e.label == "PER"]

        return {
            "phones": phones,
            "emails": emails,
            "locations": locations,
            "persons": persons
        }

Мобильная интеграция

iOS: NER для умного заполнения формы

// iOS: NER через серверный API с автозаполнением формы
class AddressFormViewModel: ObservableObject {
    @Published var street = ""
    @Published var building = ""
    @Published var apartment = ""
    @Published var deliveryTime = ""

    func parseFromText(_ userText: String) {
        Task {
            let entities = try await nerApi.extract(text: userText)

            await MainActor.run {
                if let address = entities.first(where: { $0.label == "ADDRESS" }) {
                    parseAddressComponents(address.text)
                }
                if let time = entities.first(where: { $0.label == "TIME" }) {
                    deliveryTime = time.text
                }
            }
        }
    }
}

On-device NER через CoreNLP или TFLite

Для простых доменных сущностей (артикулы, размеры, цвета) можно развернуть компактную TFLite NER-модель (< 20 МБ) прямо на устройстве. Это снимает задержку и работает офлайн.

Apple NaturalLanguage.framework с NLTagger умеет базовые типы сущностей из коробки для латинских текстов:

let tagger = NLTagger(tagSchemes: [.nameType])
tagger.string = userInput

tagger.enumerateTags(in: userInput.startIndex..<userInput.endIndex,
                     unit: .word,
                     scheme: .nameType,
                     options: [.omitWhitespace]) { tag, range in
    if let tag = tag {
        print("Entity: \(userInput[range]), type: \(tag.rawValue)")
    }
    return true
}

Для русского языка NLTagger работает заметно хуже — используем только как предфильтр или для приложений с латинским текстом.

Что входит в нашу работу

Мы предлагаем полный цикл внедрения NER в мобильное приложение "под ключ":

Анализ предметной области и определение целевых сущностей.
Сбор и разметка обучающих данных (от 500 примеров на сущность).
Выбор архитектуры: spaCy, трансформер или гибрид.
Разработка и обучение модели.
Интеграция в мобильный клиент (iOS/Android) через API или on-device.
Создание умных UI-компонентов: автозаполнение форм, подсветка сущностей, поисковые фильтры.
Тестирование на реальных данных и оптимизация задержки.
Передача документации и обучение команды.

Ориентиры по срокам

Базовая NER с готовой русской моделью + API — 3–5 дней.
Дообучение на кастомные сущности — 1–2 недели.
Полная интеграция в мобильный UI (умные формы, поиск, чат-бот) — 2–3 недели.
On-device модель (TFLite/CoreML) — плюс 1–2 недели.

Мы имеем 6+ лет опыта в мобильной разработке и выполнили более 30 проектов с NLP. Если вам требуется интеграция NER в мобильное приложение — свяжитесь с нами для оценки проекта. Рассчитаем стоимость и сроки под ваш кейс, предложим оптимальное решение. Получите консультацию бесплатно.

AI и ML в мобильных приложениях: CoreML, TFLite и on-device модели

Мы различаем два принципиально разных подхода: приложение с on-device AI и приложение, которое просто вызывает облачное API. Первое работает без интернета, не отправляет данные пользователя на сторонние серверы и отвечает за 50 миллисекунд. Второе зависит от задержки сети и тарифного плана. Выбор архитектуры — ключевой этап, который напрямую влияет на стоимость, приватность и пользовательский опыт. Наш опыт показывает: в 70% проектов on-device инференс оказывается дешевле в долгосрочной перспективе за счёт исключения серверных затрат.

Как выбрать между CoreML и TFLite для on-device инференса?

CoreML — нативный фреймворк Apple для запуска ML-моделей на устройстве. Поддерживает Neural Engine (начиная с A11 Bionic), GPU и CPU как fallback. Модели конвертируются в формат .mlmodel через coremltools из PyTorch, ONNX или TensorFlow. Конвертация — не всегда тривиальна: кастомные слои требуют реализации MLCustomLayer, а квантизация до INT8 иногда заметно роняет точность на специфических данных. Мы гарантируем, что итоговая модель проходит валидацию на реальных данных до и после конвертации.

TensorFlow Lite — кросс-платформенная альтернатива для Android и Flutter. На Android использует NNAPI (Neural Networks API) для хардварного ускорения — с Android 10 NNAPI стабильнее, до этого лучше явно использовать GPU delegate через GpuDelegate. Типичная ошибка: модель обучена на нормализованных данных в диапазоне [0,1], а в приложении на вход подаётся [0,255] — инференс работает, но с бессмысленными результатами без ошибки. Мы включаем модуль автоматической валидации входных данных в SDK.

Для задач классификации изображений, детекции объектов и сегментации доступны готовые оптимизированные модели. YOLOv8 в CoreML формате запускает детекцию кадра 640×640 за 15–20 мс на iPhone 14 Neural Engine. MobileNetV3 на TFLite с GPU delegate — около 8 мс на Pixel 7 при классификации.

Параметр	CoreML	TFLite
Платформы	iOS, macOS, watchOS	Android, iOS, Linux, embedded
Хардварное ускорение	Neural Engine, GPU, CPU	NNAPI, GPU (OpenCL/OpenGL), CPU
Поддержка квантизации	FP16, INT8 (с coremltools)	FP16, INT8, dynamic range
Кастомные операции	Через MLCustomLayer (Swift)	Через делегаты (Java/Kotlin)
Размер бандла модели	~3–5 МБ (MobileNetV2 quantized)	~2–4 МБ

Что делать, если нужна генерация текста на устройстве?

Запуск небольших языковых моделей на устройстве стал реальностью в последние несколько лет. Apple Intelligence использует собственные модели через Private Cloud Compute, но для сторонних разработчиков доступны другие пути.

llama.cpp с Metal backend на iOS — работающий подход для phi-3-mini (3.8B параметров, 4-bit квантизация, ~2.3 ГБ). Инференс: 15–25 токенов/секунду на iPhone 15 Pro. Для интеграции в Swift используем Swift Package llama.swift или обёртку через C-интерфейс llama.h. Бинарник к приложению не прикладываем — модель скачивается при первом запуске и хранится в Application Support. Наши сертифицированные разработчики настраивают инкрементальную загрузку, чтобы не блокировать первый запуск.

На Android аналог — Google AI Edge (бывший MediaPipe LLM Inference API) с поддержкой Gemma-2B. Работает через GPU delegate, на Tensor G3 чипе Pixel 8 Pro — около 20 токенов/секунду.

Ограничения реальны: модели больше 4B параметров на мобильных устройствах по-прежнему медленны. Для сложных задач рассуждения on-device LLM уступает GPT-4o в качестве. Гибридный подход — on-device для коротких задач и приватных данных, облако для сложных запросов — часто оптимален. Оценим ваш кейс и предложим баланс производительности и приватности — пишите.

Интеграция OpenAI API и других облачных моделей

Для сценариев, где cloud inference допустим, интеграция OpenAI, Anthropic или Google Gemini — это HTTP клиент + streaming SSE. В Swift удобно через AsyncThrowingStream для стриминговых ответов. В Kotlin — через Flow.

Критически важно: API-ключи никогда не хранятся в бандле приложения. Даже обфусцированный ключ извлекается из IPA за 10 минут через strings или frida. Правильная архитектура: мобильное приложение → собственный backend → OpenAI API. Backend контролирует rate limiting, логирует запросы, защищает ключ.

Что входит в работу (deliverables)

Обученная и квантизированная модель под целевое устройство (документация по метрикам)
SDK для интеграции (Swift/Kotlin/Flutter) с примерами вызова
Тесты производительности на 3–5 реальных устройствах
Инструкция по обновлению модели OTA
Поддержка при прохождении модерации App Store / Google Play (проверка соответствия Guidelines 4.2, 5.1)
2 недели технической поддержки после релиза

Типичный пайплайн проекта

Анализ задачи — замеряем latency, privacy, size, поддерживаемые устройства.
Прототипирование модели — в Python, оценка accuracy на целевых данных.
Конвертация и квантизация — под CoreML/TFLite с валидацией.
Интеграция в приложение — модель оборачивается в сервисный слой (легко подменять CoreML → TFLite → облако).
Тестирование — на реальных девайсах, замер FPS, RAM, батареи.
Деплой — через TestFlight / Firebase App Distribution, мониторинг метрик.

Сроки: интеграция готовой CoreML/TFLite модели — 1–2 недели, разработка кастомной модели с мобильной оптимизацией — от 6 недель, on-device LLM чат с персонализацией — 4–8 недель.

Почему мы беремся за сложные кейсы?

10+ лет опыта в мобильной разработке, 50+ внедрённых AI/ML решений, гарантия совместимости с актуальными версиями iOS и Android. Все проекты проходят code review и нагрузочное тестирование. В стоимость уже входит подготовка документации для модерации и обучение вашей команды.

Свяжитесь с нами — мы поможем выбрать архитектуру и внедрить ML в ваше приложение под ключ. Закажите аудит существующего решения — бесплатно оценим потенциал экономии серверных затрат (в некоторых проектах экономия достигает $10k в месяц).