Разработка DeAI-проекта (Decentralized AI)
«Децентрализованный AI» — термин, который используют и для принципиально разных вещей. Одни имеют в виду децентрализованный маркетплейс GPU (Akash, io.net), другие — верифицируемые ML-инференсы (Giza, EZKL, Modulus), третьи — on-chain управление моделями через DAO. Перед тем как проектировать архитектуру, нужно честно ответить: что именно децентрализовано, зачем, и какую угрозу это устраняет? Если ответа нет — скорее всего, это маркетинг, а не продукт.
Реальные случаи, когда децентрализация в AI оправдана: цензуроустойчивость инференса (нельзя заблокировать запрос к модели), аудитируемость результатов (доказуемо, что модель X дала ответ Y на вход Z), или экономика — распределённые GPU дешевле AWS для определённых нагрузок.
Верифицируемый инференс: zkML и OPML
Это технически самая сложная часть DeAI. Задача: доказать, что вычисление нейросети выполнено корректно, без раскрытия весов модели.
zkML (Zero-Knowledge ML)
EZKL — наиболее зрелый инструмент. Принимает модель в формате ONNX, генерирует Halo2 circuit. Ограничения реальны: на сегодня это модели до ~10M параметров, и только прямые вычисления (inference), не обучение.
# Конвертация модели
ezkl gen-settings -M model.onnx
ezkl calibrate-settings -M model.onnx -D input.json
ezkl compile-circuit -M model.onnx -S settings.json
ezkl gen-witness -D input.json -M model.compiled
ezkl prove --witness witness.json --compiled-circuit model.compiled
ezkl verify --proof proof.json --vk vk.key
Proof generation для небольшой модели (~1M параметров) занимает 30–120 секунд на современном CPU. На GPU — в 5–10 раз быстрее. Это реальная цифра для планирования UX: пользователь не будет ждать 2 минуты на каждый запрос.
Giza строит более высокоуровневый стек поверх Starknet: модели компилируются в Cairo, доказательства верифицируются on-chain. Используется для agent frameworks с верифицируемыми шагами.
Modulus (ранее Daniel Kang et al.) предлагает подход через optimistic execution с fraud proof — компромисс между скоростью и гарантиями.
OPML (Optimistic ML)
ORA Protocol реализует optimistic подход: результат инференса публикуется on-chain, есть окно для challenge. Challenger запускает ту же модель, сравнивает результат. При расхождении — on-chain dispute resolution. Это дешевле zkML в 100x, но требует экономически обеспеченных валидаторов.
Децентрализованные вычисления: оркестрация GPU
Если проект не требует верифицируемости каждого запроса, но нужна децентрализованная инфраструктура — работаем через compute marketplaces.
Akash Network (Cosmos-based) — аренда GPU через on-chain SDL манифесты:
# deployment.yaml для LLM инференса
version: "2.0"
services:
llm:
image: ollama/ollama:latest
resources:
gpu:
units: 1
attributes:
vendor:
nvidia:
- model: rtx3090
env:
- OLLAMA_MODEL=llama3.1:8b
io.net специализируется на батч-инференсе и обучении, агрегирует GPU из датацентров и майнинг-ферм.
Bittensor — другой подход: miners соревнуются в качестве ответов, validators оценивают, TAO-токен распределяется по весам. Для интеграции нужно понять subnet модель: каждый subnet — отдельный рынок с конкретной задачей (text, images, финансовые данные).
On-chain управление моделями
Децентрализованное управление ML-моделями через DAO — нишевый, но растущий паттерн.
Типичная схема:
- Модель хранится в IPFS/Arweave, CID публикуется on-chain
- Governance голосует за апгрейд: новый CID + changelog
- Smart contract хранит реестр версий с их audit статусом
- Treasury финансирует обучение через grants
struct ModelVersion {
bytes32 cid; // IPFS CID в bytes32
uint256 timestamp;
uint256 votesPassed;
bool audited;
address auditor;
}
mapping(uint256 => ModelVersion) public versions;
uint256 public activeVersion;
Архитектурные компоненты DeAI-проекта
Реалистичный DeAI-проект состоит из нескольких слоёв:
Data layer — откуда берутся данные для обучения/инференса. Ocean Protocol предоставляет маркетплейс датасетов с access control через ERC-20 datatokens. Важно: данные могут продаваться без раскрытия — Compute-to-Data паттерн, вычисления выполняются рядом с данными.
Compute layer — Akash/io.net для сырых GPU, или специализированные сети вроде Ritual (на базе Infernet).
Inference layer — zkML для высоких гарантий, OPML для экономии, или просто API с децентрализованным доступом.
Application layer — смарт-контракты, которые консьюмят результаты инференса. Здесь работают оракулы типа Chainlink Functions или Ritual's on-chain AI calls.
Практические сложности
Детерминизм — главная проблема. Floating-point операции в нейросетях не детерминированы на разном железе. Для fraud-proof систем это критично. Решения: фиксированная арифметика, конкретные версии CUDA, или zkML где детерминизм встроен в доказательство.
Latency vs. decentralization trade-off: zkML доказательство = минуты, centralized inference = миллисекунды. Для большинства пользовательских приложений это неприемлемо. Реалистичный ответ: hybrid — централизованный inference с periodic zkML audit, или OPML с достаточным challenge window.
Token economics для compute marketplace: нужно избежать race-to-bottom на качество при минимизации цены. Bittensor решает это через scoring validators; альтернатива — reputation staking, где плохие провайдеры теряют stake.
Стек разработки
| Компонент | Инструменты |
|---|---|
| zkML | EZKL, Giza, Risc Zero (для general compute) |
| OPML | ORA Protocol, Optimistic zkML |
| Compute | Akash, io.net, Bittensor, Ritual |
| Data | Ocean Protocol, Filecoin FVM |
| On-chain AI calls | Chainlink Functions, Ritual Infernet |
| Model storage | IPFS, Arweave, Filecoin |
Разработка DeAI — это пересечение ML engineering, cryptography и blockchain. Команда должна понимать все три области: написать ONNX экспорт, сгенерировать Halo2 circuit, задеплоить верификатор на EVM — это разные скилл-сеты. Мы работаем с этим стеком как единым целым.







