Анализ почвы по данным сенсоров и снимков с ИИ
Лабораторный анализ почвы стоит денег, требует времени и даёт точечный результат. Агрохимическая карта 500-гектарного поля, составленная по классической сетке 1 проба/га, обходится в 50–80 тысяч рублей и делается раз в 3–5 лет. При этом почвенная неоднородность на реальном поле — явление на масштабе 10–50 метров. AI-системы на основе дистанционного зондирования и сенсорных данных позволяют строить непрерывные почвенные карты без сплошного лабораторного опробования.
Источники данных и что они дают
Современная почвенная аналитика работает с гетерогенными данными:
Мультиспектральные и гиперспектральные снимки. Спектральные характеристики почвы в диапазоне 400–2500 нм коррелируют с содержанием органического вещества, влажностью, содержанием глины. Гиперспектральные камеры (Headwall Photonics, Resonon Pika) дают точность предсказания SOC (Soil Organic Carbon) R² = 0.75–0.85. Мультиспектральные камеры (6–10 каналов) дешевле и проще в обработке, но точность ниже — R² 0.55–0.70.
Данные ЭМ-зондирования. Электромагнитные датчики (Veris 3100, DUALEM-1S) измеряют электропроводность (EC) почвы на ходу со скоростью трактора. EC коррелирует с механическим составом, влажностью, засолённостью. Один проход 100-метровыми полосами даёт карту с разрешением 5–10 м за несколько часов.
Почвенные IoT-сенсоры. Сети датчиков (Sentek, Decagon, METER Group) меряют влажность, температуру, электропроводность на разных горизонтах в реальном времени. Данные идут через LoRaWAN или NB-IoT.
Как строим предсказательные модели
Фьюжн разнородных источников
Главная техническая сложность — совместить данные с разными пространственными разрешениями и временными метками. Спутниковый снимок — 10 м/пикс, ЭМ-карта — 5 м/пикс, лабораторные точки — штучные. Пайплайн:
- Перепроецирование всех слоёв в единую CRS (обычно UTM) через GDAL
- Интерполяция ЭМ-данных методом ordinary kriging (библиотека
pykrige) - Извлечение пиксельных значений всех слоёв по координатам лабораторных проб
- Формирование feature matrix: спектральные индексы + EC + рельеф (DEM-производные) + исторические NDVI
Модели предсказания почвенных свойств
Не нейросети — здесь они часто уступают классическому ML. На типичном датасете 150–500 лабораторных проб:
| Модель | R² (SOC) | RMSE | Преимущество |
|---|---|---|---|
| Random Forest | 0.79 | 0.41% | Интерпретируемость, робастность |
| XGBoost | 0.81 | 0.38% | Лучший базовый результат |
| CatBoost | 0.82 | 0.37% | Хорошо на малых выборках |
| 1D-CNN по спектру | 0.77 | 0.43% | Если только спектральные данные |
| Gaussian Process | 0.75 | 0.45% | Даёт uncertainty оценку |
Для пространственного предсказания добавляем geospatial cross-validation (блочная CV вместо random split) — иначе пространственная автокорреляция даёт завышенный R² на 0.10–0.15.
Continuous soil mapping
После обучения модель применяется ко всем пикселям поля, давая сплошную карту предсказанного свойства. Неопределённость предсказания (из Gaussian Process или bootstrap ансамбля) накладывается отдельным слоем — агроном видит, где карта надёжна, а где нужна дополнительная лабораторная проба.
Кейс: 1 800 га в Ростовской области, задача — карта содержания гумуса для дифференцированного внесения органики. Исходные данные: 47 лабораторных проб (старые), Sentinel-2 временной ряд за 3 сезона, ЭМ-съёмка. CatBoost + kriging остатков (Regression Kriging) дал R² = 0.84 на независимой тестовой выборке из 12 новых проб. Сэкономили 70% бюджета по сравнению с классической сеткой опробования.
Интеграция с системами точного земледелия
Выходной артефакт — GeoTIFF с предсказанными значениями и картой неопределённости. Совместимость с John Deere Operations Center, Trimble Ag Software, агро-ERP через стандартные форматы ISOXML/Shape. Карты переменного внесения (VRA) генерируются автоматически на основе почвенных карт и нормативных баз.
Сроки
Базовая система предсказания одного свойства: 3–5 недель при наличии данных. Полная платформа с фьюжном источников, мониторингом сенсоров и интеграцией с агро-ERP: 2–4 месяца.







