Интеграция Cohere API: Command R, Command R+, Embed
Cohere специализируется на корпоративном NLP: их эмбеддинги (embed-multilingual-v3) занимают лидирующие позиции в MTEB benchmark для многоязычного поиска. Command R+ оптимизирован для RAG-задач с встроенным RAG-режимом, который возвращает цитаты источников. Полезно для enterprise-поиска с требованием верифицируемых ответов.
Базовая интеграция
import cohere
co = cohere.Client("COHERE_API_KEY")
# Chat (Command R+)
response = co.chat(
model="command-r-plus",
message="Объясни принцип работы трансформеров",
temperature=0.1,
)
print(response.text)
# Async
import cohere.asyncio as async_cohere
async_co = async_cohere.AsyncClient("COHERE_API_KEY")
response = await async_co.chat(model="command-r-plus", message="Запрос")
RAG-режим со встроенными цитатами
documents = [
{"id": "doc_1", "title": "Политика безопасности", "text": "...текст..."},
{"id": "doc_2", "title": "Регламент доступа", "text": "...текст..."},
]
# Cohere автоматически находит релевантные документы и цитирует их
response = co.chat(
model="command-r-plus",
message="Как получить доступ к корпоративным системам?",
documents=documents,
# Ответ содержит citations с указанием источников
)
print(response.text)
for citation in response.citations:
print(f"Цитата: {citation.text}, источники: {citation.document_ids}")
Эмбеддинги (лучшее в классе для поиска)
# Многоязычные эмбеддинги — один из лучших вариантов для RU/EN/UA
response = co.embed(
texts=["Поиск по документам", "Document search", "Пошук документів"],
model="embed-multilingual-v3.0",
input_type="search_query", # "search_query" или "search_document"
)
embeddings = response.embeddings
# Для индексирования документов
doc_embeddings = co.embed(
texts=["Текст документа 1", "Текст документа 2"],
model="embed-multilingual-v3.0",
input_type="search_document",
)
Rerank — переранжирование результатов поиска
# Cohere Rerank — сильный инструмент для улучшения RAG точности
docs = [
"Python — интерпретируемый язык программирования",
"Anaconda — дистрибутив Python для data science",
"Змеи питоны распространены в тропических регионах",
"Django — Python web-фреймворк",
]
results = co.rerank(
model="rerank-multilingual-v3.0",
query="Python для машинного обучения",
documents=docs,
top_n=3,
)
for result in results.results:
print(f"Score: {result.relevance_score:.3f} | {docs[result.index]}")
Стоимость Cohere (2025)
| Сервис | Стоимость |
|---|---|
| Command R+ | $2.50 input / $10 output (1M токенов) |
| Command R | $0.15 input / $0.60 output |
| Embed multilingual v3 | $0.10 / 1M токенов |
| Rerank | $2.00 / 1000 поисков |
Сроки
- Базовая интеграция chat: 0.5–1 день
- RAG с цитатами: 2–3 дня
- Rerank-пайплайн: 1–2 дня







