Интеграция OpenAI Structured Outputs для парсинга ответов

Проектируем и внедряем системы искусственного интеллекта: от прототипа до production-ready решения. Наша команда объединяет экспертизу в машинном обучении, дата-инжиниринге и MLOps, чтобы AI работал не в лаборатории, а в реальном бизнесе.

8+Лет на рынкеподробнее 900+Реализованных проектовподробнее 100+Разработчиков в штатеподробнее 19+Партнеровподробнее

Услуги, которые мы предлагаем

Показано 1 из 1Все 1566 услуг

Интеграция OpenAI Structured Outputs для парсинга ответов

Простой

~1 день

Часто задаваемые вопросы

Направления AI-разработки

Обсудить AI-проект

Бесплатная консультация — расскажем, как AI решит вашу задачу

Оценить стоимость

Рассчитаем бюджет и сроки вашего AI-проекта

Этапы разработки AI-решения

Последние работы

Разработка сайта компании B2B ADVANCE
1284
Разработка веб-приложения для компании FEEDME
1196
Разработка веб-сайта для компании БЕЛФИНГРУПП
901
Разработка интернет магазина для компании FURNORO
1119
Разработка логотипа компании B2B Advance
586
Разработка веб-приложения для компании Enviok
853

Показать больше работ

Интеграция OpenAI Structured Outputs для парсинга ответов

Structured Outputs гарантирует, что ответ модели точно соответствует заданной JSON-схеме. В отличие от response_format: json_object (который просто просит вернуть JSON), Structured Outputs обеспечивает соответствие конкретной схеме через constrained decoding — модель физически не может вернуть невалидный JSON.

Базовая интеграция с Pydantic

from openai import OpenAI
from pydantic import BaseModel
from typing import Literal, Optional

client = OpenAI()

# Схема для извлечения данных
class Invoice(BaseModel):
    vendor_name: str
    invoice_number: str
    date: str
    total_amount: float
    currency: str
    line_items: list["InvoiceItem"]
    vat_amount: Optional[float] = None

class InvoiceItem(BaseModel):
    description: str
    quantity: float
    unit_price: float
    total: float

Invoice.model_rebuild()  # Необходимо для forward references

# Парсинг — гарантированное соответствие схеме
def extract_invoice(text: str) -> Invoice:
    response = client.beta.chat.completions.parse(
        model="gpt-4o",
        messages=[
            {"role": "system", "content": "Извлеки данные счёта из текста"},
            {"role": "user", "content": text}
        ],
        response_format=Invoice,
    )
    return response.choices[0].message.parsed  # Сразу Pydantic объект

Классификация с Enum

from enum import Enum

class TicketCategory(str, Enum):
    technical = "technical"
    billing = "billing"
    feature_request = "feature_request"
    complaint = "complaint"
    general = "general"

class TicketClassification(BaseModel):
    category: TicketCategory
    priority: Literal["low", "medium", "high", "critical"]
    sentiment: Literal["positive", "neutral", "negative", "angry"]
    requires_human: bool
    summary: str
    tags: list[str]

def classify_ticket(text: str) -> TicketClassification:
    response = client.beta.chat.completions.parse(
        model="gpt-4o-mini",  # Structured Outputs доступны и в mini
        messages=[{"role": "user", "content": f"Классифицируй тикет: {text}"}],
        response_format=TicketClassification,
        temperature=0,
    )
    return response.choices[0].message.parsed

Structured Outputs через JSON Schema (без Pydantic)

# Для языков без Pydantic или сложных схем
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "Данные продукта"}],
    response_format={
        "type": "json_schema",
        "json_schema": {
            "name": "product_data",
            "strict": True,
            "schema": {
                "type": "object",
                "properties": {
                    "name": {"type": "string"},
                    "price": {"type": "number"},
                    "in_stock": {"type": "boolean"},
                    "categories": {
                        "type": "array",
                        "items": {"type": "string"}
                    }
                },
                "required": ["name", "price", "in_stock", "categories"],
                "additionalProperties": False,
            }
        }
    }
)
import json
data = json.loads(response.choices[0].message.content)

Ограничения Structured Outputs

strict: True требует additionalProperties: False на всех уровнях
Не поддерживаются: nullable fields через "type": ["string", "null"] (используйте anyOf)
Максимальная вложенность: 5 уровней
Для рекурсивных схем — использовать $ref

Когда использовать

Сценарий	Метод
Извлечение данных из документов	Structured Outputs
Классификация	Structured Outputs
Ответы с предсказуемой структурой	Structured Outputs
Свободный JSON (неизвестная структура)	`json_object` mode
Простые ответы	Обычный текст

Сроки

Базовое извлечение с Pydantic: 0.5–1 день
Комплексные вложенные схемы: 1–2 дня