Разработка AI-системы для анализа чеков покупателей
Анализ чеков — основа для понимания покупательского поведения в retail. Каждый чек содержит: что куплено, когда, в каком магазине, по какой цене. AI превращает миллионы чеков в actionable инсайты.
Источники данных чеков
- Мобильное приложение: покупатели сканируют QR-код чека через приложение ФНС или кешбэк-сервис
- Программа лояльности: автоматическая передача данных о транзакциях
- ОФД (оператор фискальных данных): прямая интеграция через API ОФД
- Кабинет налогоплательщика: API ФНС для получения оцифрованных чеков
Структура данных чека
Фискальный чек в России имеет стандартизированный формат (ФФД 1.05/1.1):
class Receipt(BaseModel):
receipt_id: str
fiscal_number: str
date_time: datetime
store_name: str
store_inn: str
cashier: str | None
items: list[ReceiptItem]
total_amount: Decimal
payment_type: str # наличные / карта / QR
class ReceiptItem(BaseModel):
name: str # наименование товара
quantity: float
price: Decimal
amount: Decimal
product_code: str | None # штрихкод
AI-обработка: нормализация и категоризация
Наименования товаров в чеках — хаос: «МОЛ.ПАСТ.2,5% 1кг», «Молоко паст. 2,5% т/п 1л», «МОЛОКО ДОМИК 2.5 1Л» — одно и то же. Нормализация через AI:
def normalize_product_name(raw_name: str) -> NormalizedProduct:
return llm.parse(f"""Нормализуй название товара из кассового чека.
Извлеки: категорию, бренд, объём/вес, жирность (для молочных).
Сырое название: {raw_name}""",
response_format=NormalizedProduct
)
Для высокой нагрузки: обучить BERT-классификатор на нормализованном корпусе — inference в 100x быстрее LLM.
Аналитика на основе чеков
Basket analysis: какие товары покупают вместе. Алгоритм Apriori / FP-Growth для нахождения ассоциативных правил.
Customer lifetime value: предсказание будущих покупок на основе истории чеков. Модель BG/NBD для prediction transaction count.
Price elasticity: реакция покупки на изменение цены по данным множества чеков.
Category management: какие категории растут/падают, сезонность по категориям.
Churn prediction: снижение частоты визитов → предупреждение об оттоке + retention offer.
Визуализация: Superset или Metabase для retail-аналитиков с дашбордами без SQL.







