Реализация Edge AI / TinyML
TinyML — ML на микроконтроллерах с RAM в килобайтах и потреблением в милливаттах. Это не упрощение — это отдельная инженерная дисциплина с уникальными ограничениями и подходами.
Аппаратный спектр TinyML
Tier 1 (Microcontrollers):
- Cortex-M4/M7: STM32H7, nRF52840. RAM 256 KB – 1 MB. Потребление 1–100 мВт
- Xtensa LX7: ESP32-S3 с векторными инструкциями. RAM 512 KB. ~240 МГц
Tier 2 (AI-enabled MCU):
- MAX78000/MAX78002 (Maxim/Analog Devices): встроенный CNN accelerator, 0.5 мВт inference
- STM32N6: встроенный NPU 600 GOPS — прорыв для MCU класса
- Arduino Nicla Vision: OV2640 + Cortex-M7 для edge vision
Tier 3 (Edge SBC):
- Raspberry Pi 5 + Hailo-8 (26 TOPS за $20)
- BeagleBone AI-64
Фреймворки и инструменты
TFLite Micro: Google, наиболее зрелый. Portable C++, ~100 KB footprint, поддержка всех MCU.
Edge Impulse Studio: cloud platform для обучения + деплой на MCU. Drag-and-drop для prototyping.
ONNX Runtime for MCU: более новый, растущая экосистема.
ExecuTorch (PyTorch): Meta's embedded ML runtime, поддержка ARM Cortex-M.
Типичный workflow
Data Collection → Feature Engineering (на MCU нет места для raw data) → Model Design (NAS для конкретных ресурсных ограничений) → Training → Post-Training Quantization (INT8/INT4) → Deployment → Validation.







