OpenAI-совместимый API-шлюз к GPT-моделям

Рассказываем о новом решении, которое позволяет подключать GPT-модели через привычный endpoint и использовать единый баланс лимитов для API и SEO-инструментов PR-CY.

Представляем новый инструмент для разработчиков, SEO-специалистов и агентств — OpenAI-совместимый шлюз к GPT-моделям. Он расширяет возможности платформы и позволяет использовать ИИ в собственных продуктах и внутренних сервисах.

Как подключить и начать работу

Доступ к этому API есть на любом платном тарифе PR-CY. Отдельный тариф для API не требуется, один и тот же баланс лимитов используется и для API-запросов, и для SEO-инструментов платформы. Оплачивать можно российскими картами.

Чтобы начать работу, нужно:

Зарегистрироваться или войти в аккаунт PR-CY.
Купить любой платный тариф PR-CY, если он еще не подключен.
Открыть раздел «Настройки API» в личном кабинете и скопировать ключ.
Указать base_url: https://api.pr-cy.ru/v1.
Отправить запрос на /v1/chat/completions.

Пример cURL-запроса:

curl https://api.pr-cy.ru/v1/chat/completions \
  -H "Authorization: Bearer $PRCY_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "prcy-5.4-mini",
  "max_tokens": 400,
  "messages": [
    {
      "role": "system",
      "content": "Ты SEO-копирайтер PR-CY."
    },
    {
      "role": "user",
      "content": "Сделай SEO-title и description для страницы угловых диванов."
    }
  ]
}'

Особенности инструмента

Передовые модели

Шлюз принимает модели семейства GPT:

prcy-5.4-nano — экономичная быстрая модель для массовых задач. Контекст до 200K символов, максимальный вывод до 32K токенов.
prcy-5.4-mini — мини-версия GPT-5.4 для регулярных задач и массовой генерации. Контекст до 200K символов, вывод до 32K токенов.
prcy-4o-mini — базовая быстрая модель. Контекст до 128K символов, максимальный вывод до 16,4K токенов.
prcy-5.5 и prcy-5.4 — флагманские модели для сложных текстов и рассуждений. Контекст до 200K символов, вывод до 32K токенов.

Стоимость списания зависит от модели. Для входа лимиты считаются за 1000 символов промпта, для выхода — за 1000 токенов ответа. Самыми экономичными вариантами будут nano- и mini-модели: prcy-5.4-nano, prcy-4o-mini и prcy-5.4-mini. Флагманские модели prcy-5.5 и prcy-5.4 выйдут дороже, но лучше подойдут для сложных задач.

Если модель не указана, запрос по умолчанию направляется в модель prcy-4o-mini.

Совместимость с IDE и AI-агентами

API можно подключать к инструментам, которые поддерживают связку base_url + api_key. Среди поддерживаемых сценариев — интеграции с IDE и агентами, включая Opencode, Continue, Cursor и Aider.

Решение позволяет отправлять запросы к моделям через адрес https://api.pr-cy.ru/v1 и использовать привычную схему OpenAI API без установки новых библиотек и переписывания кода.

Для подключения достаточно указать:

baseURL: https://api.pr-cy.ru/v1.
apiKey: API-ключ из кабинета PR-CY.
список моделей PR-CY, например, prcy-4o-mini, prcy-5.4-mini, prcy-5.5.

Endpoint /v1/chat/completions совместим со схемой OpenAI и поддерживает привычные параметры, включая model, messages, stream, temperature. Ответ возвращается в формате стандартного объекта chat.completion, поэтому его можно парсить теми же библиотеками и инструментами, которые уже используются в проектах.

Поддержка стриминга и изображений

API поддерживает потоковую генерацию через параметр "stream": true с использованием Server-Sent Events. Модели, поддерживающие изображения, принимают блок image_url в content по аналогии с OpenAI vision.

Обработка ошибок

Формат ошибок совместим с OpenAI. API возвращает HTTP-код и JSON с полем error.message. Основные коды:

401 — неверный ключ, нужно проверить заголовок Authorization: Bearer <ключ>.
402 — недостаточно лимитов или модель недоступна на текущем тарифе.
404 — модель не найдена, нужно проверить идентификатор модели или вызвать /v1/models.
422 — некорректный запрос (например, отсутствует messages или нарушен формат JSON).
429 — превышен лимит частоты или закончились лимиты тарифа.
5xx — временная ошибка апстрима, рекомендуем повторить запрос с экспоненциальной задержкой.

Прозрачное списание лимитов

API использует единый баланс лимитов аккаунта. В расчет входят системное сообщение, пользовательский запрос и вся история переписки. Если общая длина превышает контекст модели, часть истории, которая не помещается в контекст, срезается и не участвует в стоимости.

Вход считается в символах, а не в токенах, что упрощает предварительный расчет стоимости запроса. Для этого используется длина промпта в mb_strlen. Выход считается в токенах ответа.

Формула списания:

лимиты = вход × [prompt_chars / 1000] + выход × [сompletion_tokens / 1000]

Округление выполняется вверх, минимум — одна единица входа. Фактический объем запроса возвращается в поле usage каждого ответа.

Для vision-моделей изображения учитываются отдельно. Каждый image_url добавляет лимиты в зависимости от разрешения по формуле [width / 512] × [height / 512] × 170 токенов на изображение.

Списание проходит в два этапа: при запуске запроса система резервирует стоимость промпта и 1000 токенов ответа, а после генерации корректирует итоговую сумму, если фактический completion_tokens оказался больше.

Планы на будущее

Сейчас через API маршрутизируются модели семейства GPT. Мы также тестируем другие семейства моделей — Claude, Gemini и DeepSeek. После проверки совместимости с OpenAI-схемой они будут открываться через тот же endpoint /v1/chat/completions.