AI-система навигации сервисных роботов (SLAM)
Simultaneous Localization and Mapping — ключевая технологическая проблема для любого мобильного робота, работающего без GPS в закрытых помещениях. Современный SLAM в связке с deep reinforcement learning позволяет роботу строить карту окружения, локализоваться на ней с точностью до 2-5 см и принимать навигационные решения в условиях динамической среды с людьми, тележками и изменяющейся расстановкой объектов.
Архитектура SLAM-системы
Современные реализации используют factor graph-подход. Две основные ветки:
LiDAR-based SLAM
- SLAM-алгоритм: Cartographer (Google) или LOAM/LeGO-LOAM для 3D-сенсоров
- Сенсоры: Velodyne VLP-16, Ouster OS1, Livox Mid-360
- Частота обновления карты: 10-20 Гц
- Точность локализации: 2-5 см в статичной среде
Visual SLAM (vSLAM)
- ORB-SLAM3, OpenVINS для стерео/monocular камер
- Intel RealSense D435i, Zed 2 как основные платформы
- Fusion с IMU через EKF (Extended Kalman Filter)
- Работает при сбоях лидара (дым, яркий свет)
На практике используется гибридный подход: LiDAR SLAM как основной, vSLAM как резервный и для визуальной верификации.
Deep RL для навигации
Классические планировщики (A*, Dijkstra, RRT) хорошо работают в статичной среде. Проблема — динамические препятствия: люди, движущиеся тележки, роботы-коллеги. Здесь подключается RL.
Формализация задачи:
- Состояние: локальная карта occupancy grid 64×64 вокруг робота + скорость + вектор до цели
- Действия: линейная скорость [0, 0.8 м/с], угловая скорость [-1.0, 1.0 рад/с]
- Награда: продвижение к цели - штраф за близость к препятствиям - штраф за остановку
Алгоритм: SAC (Soft Actor-Critic) — лучший баланс исследования/эксплуатации для непрерывных пространств действий. Обучение в симуляторе Gazebo/Isaac Sim, sim-to-real transfer через domain randomization.
Стек технологий
| Уровень | Компоненты |
|---|---|
| Hardware | Husarion ROSbot, Clearpath Husky, кастомная платформа |
| Middleware | ROS2 Humble, Nav2 |
| SLAM | Cartographer / ORB-SLAM3 |
| Planning | Nav2 + RL-политика для локального планирования |
| Inference | NVIDIA Jetson AGX Orin / x86 + GPU |
| Fleet | ROS2 Fleet Management, Formant |
Работа в динамической среде
Ключевая задача — предсказание траекторий людей для социально приемлемой навигации. Используется Social Force Model и его нейросетевое расширение — Social LSTM или DESIRE.
Метрики социальной навигации:
- Personal Space Intrusion (PSI): доля времени в зоне < 0.5 м от человека
- Path Efficiency: отношение фактического пути к оптимальному
- Freeze ratio: доля времени в состоянии "застыл перед людьми"
Для сервисного робота в ресторане или отеле PSI должен быть < 1%, иначе пользователи воспринимают его как агрессивный.
Multi-robot координация
При нескольких роботах на площадке возникают deadlock-ситуации. Решения:
- Centralized: сервер планирования (CBS — Conflict-Based Search) + ROS2 Nav2 Multi-robot
- Decentralized: ORCA (Optimal Reciprocal Collision Avoidance) — каждый робот самостоятельно разруливает конфликты
- Hybrid: зональное разделение + локальный ORCA
Для склада с 10-20 роботами рекомендован централизованный CBS. Для открытых торговых залов — децентрализованный ORCA с мягкими зонами приоритета.
Pipeline разработки
Фаза 1 (недели 1-6): Выбор и настройка SLAM-алгоритма под конкретный сенсорный пакет. Картирование тестового помещения, оценка точности локализации.
Фаза 2 (недели 7-14): Создание симуляционной среды в Isaac Sim с реальными CAD-моделями помещения. Обучение RL-агента навигации, 20-50 млн шагов симуляции.
Фаза 3 (недели 15-20): Sim-to-real transfer на физическом роботе. Domain randomization: случайные задержки датчиков, шум одометрии, случайное расположение мебели.
Фаза 4 (недели 21-26): Fleet management, мониторинг, интеграция с операционными системами (PMS для отелей, WMS для складов).
Итоговые метрики продакшн-системы: успешность миссий > 97%, средняя скорость передвижения 0.4-0.6 м/с в людных местах, автономная работа 8-12 часов на одной зарядке.







