Интеграция SaluteSpeech TTS (Сбер) для синтеза речи
SaluteSpeech TTS от Сбербанка — российская нейронная система синтеза речи с акцентом на русский язык. Инфраструктура в РФ, возможность on-premise развёртывания для защищённых контуров, ГОСТ-совместимость.
Голоса и характеристики
- Nec — нейтральный мужской
- Bys — тёплый мужской
- May — женский
- Tur — эмоциональный мужской
- Ost — официальный мужской
- Pon — дружелюбный женский
REST API интеграция
import requests
import base64
def get_access_token(client_id: str, client_secret: str) -> str:
response = requests.post(
"https://ngw.devices.sberbank.ru:9443/api/v2/oauth",
headers={
"Authorization": f"Basic {base64.b64encode(f'{client_id}:{client_secret}'.encode()).decode()}",
"RqUID": "unique-uuid-here",
"Content-Type": "application/x-www-form-urlencoded"
},
data={"scope": "SALUTE_SPEECH_CORP"},
verify=False # Потребуется корневой сертификат Сбер
)
return response.json()["access_token"]
def synthesize(text: str, voice: str = "Nec", token: str = None) -> bytes:
response = requests.post(
"https://smartspeech.sber.ru/rest/v1/text:synthesize",
headers={
"Authorization": f"Bearer {token}",
"Content-Type": "application/text",
"model": f"v4/\"{voice}\":emotion"
},
params={
"format": "wav16",
"voice": f"{voice}_24000"
},
data=text.encode("utf-8")
)
return response.content
Особенности интеграции
Токен истекает каждые 30 минут — реализуем автоматическое обновление через background worker. SSL-сертификаты Сбера не входят в стандартные браузерные хранилища — настраиваем доверие к корневому CA.
Стоимость: по запросу, корпоративные тарифы.
Сроки: 2–3 дня (включая решение SSL-специфики).







