AI-система расчёта углеродного следа
Scope 3 emissions — 70–90% углеродного следа типичной компании. Рассчитать их точно без автоматизации невозможно: категория 1 (закупленные товары и услуги) требует данных от сотен поставщиков, категория 11 (использование проданных продуктов) — понимания паттернов потребления клиентов. Ручной расчёт раз в год даёт погрешность 35–50%. ML-пайплайн считает непрерывно с погрешностью 12–20%.
Архитектура расчётного движка
Иерархия методов расчёта
GHG Protocol допускает три метода для Scope 3 Category 1:
| Метод | Точность | Требования к данным |
|---|---|---|
| Spend-based | ±40% | Расходы + EEIO факторы |
| Average-data | ±25% | Вес/объём закупок + emission intensity |
| Supplier-specific | ±10% | PCF данные от поставщика |
ML-задача: для каждой строки закупок автоматически выбрать лучший доступный метод и рассчитать emission factor. Классификатор (LightGBM) определяет метод по доступным данным. Если от поставщика есть PCF — supplier-specific. Если есть вес — average-data. Иначе — spend-based с EXIOBASE 3.8 EEIO таблицами.
Парсинг счетов-фактур и документов
80% activity data приходит в виде PDF-счетов. Document AI пайплайн:
- LayoutLMv3 (Microsoft) — multimodal модель для structured extraction из документов
- Извлекаемые поля: supplier_name, line_item_description, quantity, unit, unit_price, total
- NER + классификация по HS-коду (Harmonized System) → emission factor lookup
- Точность extraction: 93% на тестовом датасете счетов-фактур из 8 отраслей
Деплой: Azure Form Recognizer или self-hosted TorchServe. Обработка 10 000 документов в день на 2×A10G GPU, latency 1.8 с на документ.
Расчёт Scope 1 и Scope 2
Scope 1: прямые выбросы
Источники: сжигание топлива (котлы, генераторы, корпоративный автотранспорт), технологические процессы (сварка, химические реакции), утечки хладагентов (F-gases). SCADA/EMS интеграция: потребление топлива с счётчиков → умножение на IPCC AR5/AR6 emission factors.
ML-аномалия: если потребление газа котельной в выходной день >150% от среднего выходного дня прошлого года — alert. LSTM Autoencoder на часовых данных, обученный на 2 годах нормальных показаний.
Scope 2: закупленная энергия
Location-based метод: потребление кВт·ч × региональный emission factor (IEA, Ember, AIB для Европы). Market-based: Guarantees of Origin (GO), RECs, Power Purchase Agreements — вычитаются из расчёта.
Автоматизация: интеграция с личным кабинетом энергосбытовых компаний (API или web scraping) для ежемесячного обновления consumption data без ручного ввода.
Прогнозирование и сценарный анализ
Net-zero pathway моделирование
Компания ставит цель SBTi (Science Based Targets initiative) — снизить Scope 1+2 на 46% к 2030. ML-компонент: time-series forecasting (Temporal Fusion Transformer) baseline emissions + scenario analysis:
- Business as usual
- Renewables transition (solar/wind PPA)
- Fleet electrification (EV conversion schedule)
- Supplier engagement (top 20 по выбросам → требование PCF данных)
Для каждого сценария: NPV декарбонизационных инвестиций vs. cost of carbon (EU ETS цена + regulatory risk).
Внутренний carbon pricing
Shadow carbon price ($50–150/tCO2e) применяется к инвестиционным решениям. ML-модуль автоматически рассчитывает carbon cost для capex проектов из ERP данных (оборудование → lifecycle emissions по Ecoinvent базе).
Интеграция с рынками углерода
Верификация carbon credits: проверка качества offsets по базе Gold Standard, VCS (Verra). ML-классификатор оценивает риск double-counting и permanence риск лесных проектов (satellite imagery + деградация леса через NDVI time series).
Автоматический реестровый учёт: API интеграция с Xpansiv CBL, Gold Standard Registry для отслеживания retire/cancel операций с credits.
Стек
Хранение: Snowflake с dbt-трансформациями для ESG-модели. Вычисления: Python (pandas, pyCO2SYS для marine emissions). ML: scikit-learn, LightGBM, PyTorch для time-series. Document AI: LayoutLMv3, Hugging Face Transformers. Оркестрация: Apache Airflow.
Срок разработки: 3–6 месяцев для базового расчётного движка с автоматическим импортом данных. Полный Scope 1-2-3 с document AI и сценарным анализом: 6–10 месяцев.







