Настройка контроля расходов на AI-агентов в Paperclip (Cost Control)
AI-агенты без контроля расходов — источник непредсказуемых счетов. Один плохо сконфигурированный агент в бесконечном цикле может потратить сотни долларов за час. Paperclip имеет встроенные механизмы cost control — мы их настраиваем.
Уровни ограничений
Per-agent limits:
max_cost_usd на задачу. max_tokens_per_call и max_calls_per_task. При достижении лимита — автоматическая остановка и эскалация.
Per-organization daily/monthly budget: Общий бюджет на всю AI-команду. При 80% использования — предупреждение. При 100% — новые задачи не принимаются до сброса периода или ручного увеличения бюджета.
Cost allocation: Расходы трекируются по агентам, ролям, типам задач. Выявление неэффективных агентов (высокий расход / низкое качество результатов).
Оптимизация стоимости
Routing дорогих задач на GPT-4o, простых — на GPT-4o-mini или Claude Haiku. Кэширование повторяющихся запросов (prompt caching у Anthropic снижает стоимость на 90% для кэшируемой части). Батчинг независимых запросов.
Reporting
Еженедельный cost report: топ-5 агентов по расходам, trend, cost per output unit. Помогает принимать решения об оптимизации конфигурации.







