Сравнение цен API нейросетей в 2026 году: GPT-5.4, Claude, Gemini, DeepSeek

Я потратил неделю, разбираясь в ценах на LLM API. Десятки моделей, четыре крупных провайдера, разброс цен в 100 раз. Один считает за миллион токенов, другой за запрос, третий прячет реальную стоимость за «бесплатным тарифом» с лимитом в 15 запросов в минуту.

Ниже — таблицы и расчёты по GPT-5.4, Claude Opus 4.6, Claude Sonnet 4.6, Gemini 3.1 Pro и DeepSeek V3.2. Все цифры актуальны на апрель 2026 года.

Текущие цены: сводная таблица

Все цены указаны в долларах за 1 миллион токенов (стандартный контекст).

МодельПровайдерВходВыходКонтекст
GPT-5.4OpenAI$2.50$15.001M
GPT-5.4 MiniOpenAI$0.75$4.501M
GPT-5.4 NanoOpenAI$0.20$1.251M
Claude Opus 4.6Anthropic$5.00$25.00200K (1M бета)
Claude Sonnet 4.6Anthropic$3.00$15.00200K (1M бета)
Claude Haiku 4.5Anthropic$1.00$5.00200K
Gemini 3.1 ProGoogle$2.00$12.001M
Gemini 2.5 ProGoogle$1.25$10.001M
Gemini 2.5 FlashGoogle$0.30$2.501M
DeepSeek V3.2DeepSeek$0.27$1.10128K

Разница между Claude Opus 4.6 и DeepSeek V3.2 по входным токенам — почти в 20 раз. Но цена за токен мало что говорит сама по себе.

Скрытые расходы, которые не видны в прайсе

Итоговый счёт зависит не только от цены за токен.

Кэширование промптов у OpenAI и Anthropic снижает стоимость повторяющихся частей запроса. Кэшированный вход GPT-5.4 стоит $0.25/M вместо $2.50 — в 10 раз дешевле. У Claude Opus — $2.50/M. Если приложение отправляет длинный системный промпт с каждым запросом, кэширование срезает 40–60% расходов на входные токены.

Gemini 3.1 Pro при контексте свыше 200K токенов удваивает цену: $4.00/$24.00. OpenAI пока не берёт наценку за длинный контекст, но ограничивает выходные токены.

Модели с «размышлением» (o3, Claude с extended thinking) генерируют скрытые токены, которые не видны в ответе, но оплачиваются. Запрос к o3 Pro обходится в $150/$600 за миллион токенов. Это отдельная категория расходов, и её легко проглядеть.

Batch API у OpenAI даёт 50% скидку на задачи, не требующие мгновенного ответа. GPT-5.4 в batch-режиме — $1.25/$7.50.

Какая модель под какую задачу

Абстрактное «качество» ничего не значит. Значение имеет конкретная задача.

Claude Sonnet 4.6 на SWE-bench Verified показывает 79.6% — на полтора процента ниже GPT-5.4 (81.2%), при той же цене $3/$15. Для генерации кода и рефакторинга это лучшее соотношение цены к результату.

Gemini 2.5 Pro с контекстом в 1M токенов и ценой $1.25/$10 выигрывает на длинных документах. Загрузить репозиторий целиком или книгу на 500 страниц — тут Gemini дешевле всех.

DeepSeek V3.2 при $0.27/$1.10 подходит для массовой обработки: классификация, извлечение данных, суммаризация. Платить за топовую модель ради таких задач — пустая трата.

Claude Opus 4.6 и GPT-5.4 стоит использовать для сложного анализа и рассуждений. На простых задачах разница между ними и дешёвыми моделями незаметна, но на сложных — ощутима.

Китайские модели: дёшево, но попробуй подключи

Китайские LLM в 2026 году подтянулись по качеству, а цены остались в разы ниже западных.

МодельВходВыходКомментарий
Qwen 3.6 Plus$0.50$3.00Сильная модель от Alibaba, хорошо работает с русским
Kimi K2.5$0.60$3.00Moonshot AI, длинный контекст
GLM-5.1$1.40$4.40Zhipu AI, мультимодальная
MiniMax M2.7$0.30$1.20Хороша для генерации контента
Doubao Seed 2.0 Pro$0.67$3.36ByteDance, стабильная работа
Qwen Flash$0.022$0.22Почти бесплатная для простых задач

Qwen Flash за $0.022 на входе — в 100 раз дешевле GPT-5.4. Классификация писем, извлечение структурированных данных — справляется.

Подвох: подключить API китайских моделей напрямую из России — квест. Документация на китайском, регистрация требует китайский номер, оплата через Alipay. Без агрегатора не обойтись.

Доступ из России: теория vs практика

Ценовые таблицы выше — теория. На практике для российских разработчиков всё сложнее.

OpenAI официально не работает в России. Прямая регистрация и оплата невозможны без VPN и иностранной карты. Anthropic — та же ситуация, Claude API закрыт для российских аккаунтов. Google ограничивает Gemini API для российских IP. DeepSeek доступен, но оплата через китайские платёжные системы.

Даже если удалось зарегистрироваться через VPN, Visa и Mastercard российских банков не проходят. Криптовалюта, виртуальные карты, посредники — всё это добавляет 5–15% к стоимости и создаёт риск блокировки аккаунта за нарушение ToS.

Агрегаторы: один ключ вместо пяти аккаунтов

Агрегаторы LLM API решают две проблемы разом — доступ и удобство. Один аккаунт, один API-ключ, один счёт.

OfoxAI работает именно так. Через OpenAI-совместимый эндпоинт https://api.ofox.ai/v1 доступны 80+ моделей: GPT-5.4, Claude Opus 4.6, китайские Qwen, DeepSeek, Kimi. Поддерживаются три протокола (OpenAI, Anthropic, Gemini) с одним API-ключом.

Переключение между моделями — замена одной строки в коде. Доступ к китайским моделям без китайского номера и Alipay. Оплата криптовалютой. Pay-as-you-go без подписок.

Миграция с OpenAI SDK:

client = OpenAI(
    base_url="https://api.ofox.ai/v1",
    api_key="ваш-ofox-ключ"
)

Streaming, function calling, structured output — всё работает.

Как тратить меньше

Маршрутизация по сложности. Простые запросы отправляйте на GPT-5.4 Nano ($0.20/$1.25) или Qwen Flash ($0.022/$0.22), сложные — на Claude Opus или GPT-5.4. Автоматический роутинг сокращает средний чек в 3–5 раз.

Prompt caching. Если системный промпт не меняется между запросами, кэширование экономит до 90% на входных токенах.

Batch API. Генерация отчётов, обработка логов, анализ данных — всё, что терпит задержку, можно отправить в batch со скидкой 50%.

Короткие промпты. Сокращение системного промпта с 2000 до 500 токенов при 10 000 запросов в день экономит $37.50 ежедневно на GPT-5.4. За месяц набегает больше $1000.

Логирование расходов. Без трекинга один неоптимальный промпт может незаметно съедать половину бюджета.

Какую модель выбрать

ЗадачаРекомендацияСтоимость
Прототипирование, тестыGPT-5.4 Nano или Qwen Flash$0.02–0.20/M вход
Чат-бот, генерация контентаClaude Sonnet 4.6 или Qwen 3.6 Plus$0.50–3.00/M вход
Код, рефакторингClaude Sonnet 4.6$3.00/M вход
Длинные документыGemini 2.5 Pro$1.25/M вход
Массовая обработкаDeepSeek V3.2$0.27/M вход
Сложный анализClaude Opus 4.6 или GPT-5.4$2.50–5.00/M вход

Для России дополнительный фактор — доступность. Агрегатор вроде OfoxAI снимает проблему регистрации и оплаты у каждого провайдера по отдельности.

За последний год стоимость топовых моделей упала в 2–3 раза. Opus 4.6 стоит втрое дешевле Opus 4.1. Через полгода цены снова изменятся — пересматривайте выбор регулярно.