GPT-5.4 — полный обзор: три варианта модели, цены и доступ из России в 2026
5 марта 2026 года OpenAI выпустила GPT-5.4 — и впервые сделала это одновременно в ChatGPT, API и Codex. Модель управляет компьютером, работает с контекстом в миллион токенов и обходит человека в тестах на автоматизацию рабочего стола. Маркетинг? Отчасти. Но бенчмарки подтверждают.
Что нового в GPT-5.4
GPT-5.4 — первая модель OpenAI, которая объединяет reasoning, генерацию кода и нативное управление компьютером в одном релизе. Раньше для этого приходилось жонглировать разными моделями.
Что изменилось:
Управление компьютером (Computer Use). Модель взаимодействует с десктопными приложениями: кликает, вводит текст, заполняет формы, переключается между окнами. На бенчмарке OSWorld-Verified — 75%, при человеческом базовом уровне 72.4%. Агенты на GPT-5.4 могут закрывать рутину в браузере без написания отдельных интеграций под каждый сервис.
Контекст в 1 миллион токенов. У предыдущих моделей OpenAI потолок был 128K. Теперь в контекст влезает целый репозиторий или документ на сотни страниц. Claude Opus 4.6 тоже поддерживает 1M, Gemini 3.1 Pro — ещё больше.
Tool Search. Экономит до 47% токенов при работе с инструментами. Модель сама находит нужные функции из набора, вместо того чтобы каждый раз получать полное описание всех tools. Если у вас десятки функций — разница в счёте заметная.
Три варианта: Standard, Thinking, Pro
OpenAI выпустила GPT-5.4 сразу в пяти вариантах, но для разработчиков через API актуальны три основных. Mini и Nano — отдельная история, про них есть подробный разбор.
GPT-5.4 Standard
Базовая версия для большинства задач. Быстрая, дешёвая относительно Pro, достаточно умная для 90% рабочих сценариев.
- Контекст: 1M токенов
- Computer Use: да
- Цена: $2.50 / 1M входных токенов, $15 / 1M выходных
- Когда использовать: чат-боты, генерация контента, суммаризация, работа с документами, стандартная генерация кода
GPT-5.4 Thinking
Та же модель, но с включённым режимом reasoning — модель «думает вслух», разбивая задачу на шаги. В ChatGPT это отображается как цепочка рассуждений перед ответом.
- Контекст: 1M токенов
- Reasoning: расширенный, с прозрачной цепочкой рассуждений
- Цена: аналогична Standard, но reasoning-токены тарифицируются отдельно
- Когда использовать: математика, логические задачи, сложный анализ данных, задачи, где важна верифицируемость рассуждений
GPT-5.4 Pro
Режим максимальной производительности. OpenAI позиционирует его как research-grade модель для задач, где качество важнее скорости и стоимости.
- Контекст: 1M токенов
- Цена: $30 / 1M входных, $180 / 1M выходных — в 12 раз дороже Standard
- Когда использовать: глубокий анализ кода, научные расчёты, сложное многошаговое планирование, задачи с высокой ценой ошибки
Для большинства проектов Standard — оптимальный выбор. Pro имеет смысл, когда стоимость ошибки модели превышает разницу в цене API.
Бенчмарки: где GPT-5.4 реально силён
Цифры из независимых тестов (не из пресс-релиза OpenAI):
| Бенчмарк | GPT-5.4 | Claude Opus 4.6 | Gemini 3.1 Pro | Что измеряет |
|---|---|---|---|---|
| OSWorld-Verified | 75.0% | — | — | Управление компьютером |
| SWE-bench Pro | 57.7% | 53.2% | 49.8% | Реальные баг-фиксы в open-source |
| GPQA Diamond | 71.4% | 68.9% | 94.3% | Экспертные вопросы (физика, химия, биология) |
| ARC-AGI-2 | 38.2% | 34.1% | 77.1% | Абстрактное мышление |
| GDPval | 83% | — | — | Соответствие работе профессионалов |
Что бросается в глаза:
- Computer Use — GPT-5.4 пока единственная модель, которая обходит человека на OSWorld. Claude Opus 4.6 тоже управляет компьютером, но в другом формате и с другими результатами.
- Код — на SWE-bench Pro GPT-5.4 лидирует, но отрыв от Claude Opus 4.6 небольшой. На практике Claude часто лучше справляется с длительными агентными задачами и рефакторингом больших кодовых баз.
- Рассуждения — тут Gemini 3.1 Pro доминирует. GPQA Diamond и ARC-AGI-2 — его территория. Если задача требует глубокого научного reasoning, GPT-5.4 пока не дотягивает.
Одной «лучшей» модели нет. GPT-5.4 берёт автоматизацией и кодом. Claude Opus 4.6 — агентными задачами. Gemini 3.1 Pro — аналитикой.
Сравнение цен: GPT-5.4 vs конкуренты
Цена часто решает больше, чем бенчмарки. Актуальные цены через OfoxAI на апрель 2026:
| Модель | Вход ($/1M токенов) | Выход ($/1M токенов) | Контекст |
|---|---|---|---|
| GPT-5.4 Standard | 2.50 | 15.00 | 1M |
| GPT-5.4 Pro | 30.00 | 180.00 | 1M |
| GPT-5.4 Mini | 0.75 | 4.50 | 1M |
| Claude Opus 4.6 | 5.00 | 25.00 | 1M |
| Claude Sonnet 4.6 | 3.00 | 15.00 | 1M |
| Claude Haiku 4.5 | 1.00 | 5.00 | 200K |
| Gemini 3.1 Pro | 2.00 | 12.00 | 1M+ |
| Gemini 2.5 Flash | 0.30 | 2.50 | 1M |
| DeepSeek V3.2 | 0.29 | 0.43 | 128K |
Что тут интересного:
- GPT-5.4 Standard и Claude Sonnet 4.6 стоят одинаково по выходным токенам ($15/M). Выбор между ними — вопрос задачи, не бюджета.
- Gemini 3.1 Pro дешевле всех топовых моделей ($2/$12) и при этом лидирует на ряде бенчмарков. Соотношение цена/качество у него сейчас лучшее.
- DeepSeek V3.2 — в 35 раз дешевле GPT-5.4 Standard по выходным токенам. Для задач без требований к максимальной точности — разумная альтернатива. Подробнее в обзоре китайских моделей.
- GPT-5.4 Pro оправдан только когда ошибка стоит дорого. Для прототипов и тестов — Standard или Mini. Полное сравнение тарифов всех провайдеров — в обзоре цен API нейросетей в 2026 году.
Бюджет ограничен? Стоит посмотреть на мультимодельную стратегию — дешёвая модель для простых запросов, дорогая для сложных. Ещё способы сэкономить — в руководстве по оптимизации затрат.
Как подключить GPT-5.4 API из России
Напрямую через OpenAI не получится — российские IP и карты заблокированы с 2022 года. VPN и виртуальные карты работают, но нестабильно: аккаунт могут заблокировать без предупреждения.
Проще через API-агрегатор. OfoxAI даёт доступ к GPT-5.4 и ещё 80+ моделям через OpenAI-совместимый API. Меняется только base URL, код остаётся прежним.
Подключение:
- Регистрация на ofox.ai — без зарубежной карты
- Получение API-ключа в личном кабинете
- Замена base URL в коде:
from openai import OpenAI
client = OpenAI(
api_key="ваш-ключ-ofoxai",
base_url="https://api.ofox.ai/v1"
)
response = client.chat.completions.create(
model="gpt-5.4",
messages=[{"role": "user", "content": "Привет, GPT-5.4!"}]
)
Формат работает с любым OpenAI SDK — Python, Node.js, Go, curl. Если у вас уже есть код под OpenAI API, меняете две строки и всё.
OfoxAI поддерживает и нативные протоколы Anthropic и Google для тех, кто работает с их SDK. О способах оплаты из России — в отдельном руководстве.
Какой вариант GPT-5.4 под какую задачу
GPT-5.4 Standard — рабочая лошадка. Генерация кода, рефакторинг, тексты, суммаризация, чат-боты. Соотношение цена/качество лучшее в линейке OpenAI. Не знаете, с чего начать — начинайте с него.
GPT-5.4 Thinking пригодится, когда нужно видеть ход решения. Математика, анализ данных, задачи планирования, где ошибка в одном шаге ломает всё остальное.
GPT-5.4 Pro — для случаев, когда неправильный ответ стоит дороже, чем разница в цене API. Аудит безопасности, юридический анализ, научные расчёты.
GPT-5.4 Mini — когда запросов много, а задачи типовые: классификация, извлечение данных, простые ответы. Подробнее в обзоре Mini и Nano.
В IDE тоже есть нюансы. GPT-5.4 хорошо работает в Cursor для быстрых задач, Claude Opus 4.6 — для длительных агентных сессий. Сравнение — в обзоре Cursor 3 vs Claude Code.
Итог
GPT-5.4 хорош в автоматизации и коде, но в рассуждениях проигрывает Gemini 3.1 Pro, а в агентных задачах — Claude Opus 4.6. DeepSeek V3.2 при этом в десятки раз дешевле для простых задач. Серебряной пули нет.
Из России все эти модели доступны через OfoxAI — единый API, без зарубежных карт. Регистрация, ключ, замена base URL — готово.
Выбираете между агрегаторами? Есть сравнение альтернатив OpenRouter с ценами и особенностями.


