Представляем новый инструмент для разработчиков, SEO-специалистов и агентств — OpenAI-совместимый шлюз к GPT-моделям. Он расширяет возможности платформы и позволяет использовать ИИ в собственных продуктах и внутренних сервисах.
Как подключить и начать работу
Доступ к этому API есть на любом платном тарифе PR-CY. Отдельный тариф для API не требуется, один и тот же баланс лимитов используется и для API-запросов, и для SEO-инструментов платформы. Оплачивать можно российскими картами.
Чтобы начать работу, нужно:
Зарегистрироваться или войти в аккаунт PR-CY.
Купить любой платный тариф PR-CY, если он еще не подключен.
Открыть раздел «Настройки API» в личном кабинете и скопировать ключ.
Указать base_url: https://api.pr-cy.ru/v1.
Отправить запрос на /v1/chat/completions.
Пример cURL-запроса:
curl https://api.pr-cy.ru/v1/chat/completions \
-H "Authorization: Bearer $PRCY_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "prcy-5.4-mini",
"max_tokens": 400,
"messages": [
{
"role": "system",
"content": "Ты SEO-копирайтер PR-CY."
},
{
"role": "user",
"content": "Сделай SEO-title и description для страницы угловых диванов."
}
]
}'
Особенности инструмента
Передовые модели
Шлюз принимает модели семейства GPT:
prcy-5.4-nano — экономичная быстрая модель для массовых задач. Контекст до 200K символов, максимальный вывод до 32K токенов.
prcy-5.4-mini — мини-версия GPT-5.4 для регулярных задач и массовой генерации. Контекст до 200K символов, вывод до 32K токенов.
prcy-4o-mini — базовая быстрая модель. Контекст до 128K символов, максимальный вывод до 16,4K токенов.
prcy-5.5 и prcy-5.4 — флагманские модели для сложных текстов и рассуждений. Контекст до 200K символов, вывод до 32K токенов.
Стоимость списания зависит от модели. Для входа лимиты считаются за 1000 символов промпта, для выхода — за 1000 токенов ответа. Самыми экономичными вариантами будут nano- и mini-модели: prcy-5.4-nano, prcy-4o-mini и prcy-5.4-mini. Флагманские модели prcy-5.5 и prcy-5.4 выйдут дороже, но лучше подойдут для сложных задач.
Если модель не указана, запрос по умолчанию направляется в модель prcy-4o-mini.
Совместимость с IDE и AI-агентами
API можно подключать к инструментам, которые поддерживают связку base_url + api_key. Среди поддерживаемых сценариев — интеграции с IDE и агентами, включая Opencode, Continue, Cursor и Aider.
Решение позволяет отправлять запросы к моделям через адрес https://api.pr-cy.ru/v1 и использовать привычную схему OpenAI API без установки новых библиотек и переписывания кода.
Для подключения достаточно указать:
baseURL: https://api.pr-cy.ru/v1.
apiKey: API-ключ из кабинета PR-CY.
список моделей PR-CY, например, prcy-4o-mini, prcy-5.4-mini, prcy-5.5.
Endpoint /v1/chat/completions совместим со схемой OpenAI и поддерживает привычные параметры, включая model, messages, stream, temperature. Ответ возвращается в формате стандартного объекта chat.completion, поэтому его можно парсить теми же библиотеками и инструментами, которые уже используются в проектах.
Поддержка стриминга и изображений
API поддерживает потоковую генерацию через параметр "stream": true с использованием Server-Sent Events. Модели, поддерживающие изображения, принимают блок image_url в content по аналогии с OpenAI vision.
Обработка ошибок
Формат ошибок совместим с OpenAI. API возвращает HTTP-код и JSON с полем error.message. Основные коды:
401 — неверный ключ, нужно проверить заголовок Authorization: Bearer <ключ>.
402 — недостаточно лимитов или модель недоступна на текущем тарифе.
404 — модель не найдена, нужно проверить идентификатор модели или вызвать /v1/models.
422 — некорректный запрос (например, отсутствует messages или нарушен формат JSON).
429 — превышен лимит частоты или закончились лимиты тарифа.
5xx — временная ошибка апстрима, рекомендуем повторить запрос с экспоненциальной задержкой.
Прозрачное списание лимитов
API использует единый баланс лимитов аккаунта. В расчет входят системное сообщение, пользовательский запрос и вся история переписки. Если общая длина превышает контекст модели, часть истории, которая не помещается в контекст, срезается и не участвует в стоимости.
Вход считается в символах, а не в токенах, что упрощает предварительный расчет стоимости запроса. Для этого используется длина промпта в mb_strlen. Выход считается в токенах ответа.
Формула списания:
лимиты = вход × [prompt_chars / 1000] + выход × [сompletion_tokens / 1000]
Округление выполняется вверх, минимум — одна единица входа. Фактический объем запроса возвращается в поле usage каждого ответа.
Для vision-моделей изображения учитываются отдельно. Каждый image_url добавляет лимиты в зависимости от разрешения по формуле [width / 512] × [height / 512] × 170 токенов на изображение.
Списание проходит в два этапа: при запуске запроса система резервирует стоимость промпта и 1000 токенов ответа, а после генерации корректирует итоговую сумму, если фактический completion_tokens оказался больше.
Планы на будущее
Сейчас через API маршрутизируются модели семейства GPT. Мы также тестируем другие семейства моделей — Claude, Gemini и DeepSeek. После проверки совместимости с OpenAI-схемой они будут открываться через тот же endpoint /v1/chat/completions.