Журнал обновлений
Каждый шаг OfoxAI — новые модели, новые возможности, новый опыт. Обновляется еженедельно.
v1.1.0-20260428
💰 Управление бюджетом — три измерения: команда / участник / API Key
Превращаем «сколько тратим» из устной договорённости в системное ограничение. Внутри одной организации одновременно настраиваются три измерения × три периода лимитов расходов:
| Измерение | Сценарий применения |
|---|---|
| Команда (Organization) | Общий бюджет компании или проекта |
| Участник (User) | Месячная квота на одного сотрудника |
| API Key | Отдельный бюджет на приложение или сервис |
В каждом измерении задаются три типа лимитов: дневной / месячный / накопительный. При превышении запрос автоматически отклоняется.
Прогресс-бар подсвечивает три уровня предупреждений:
- 🟢 40% — расход в норме
- 🟡 80% — приближение к лимиту
- 🔴 110% — превышение (запас оставлен специально, чтобы при высоком RPS лимит не пробивался мгновенно)
Иерархическая валидация работает автоматически: лимит API Key ≤ лимит участника ≤ лимит команды. Фронтенд в реальном времени показывает квоту родительского уровня, чтобы исключить ошибочные значения.
Раздел: Настройки → Квоты
⏱️ Командный лимит RPM
Добавлен командный лимит запросов в минуту (RPM) — он защищает от ситуации, когда несколько API Key суммарно пробивают квоту вышестоящего провайдера.
- RPM считается агрегированно по всей команде, а не отдельно по каждому ключу
- По умолчанию 100 RPM; если нужно больше, напишите на [email protected]
- Превышающие запросы возвращают
429 Too Many Requests
Сценарии: всплески трафика в CI/CD, защита батч-задач от перегрузок, единый лимит для команды разработчиков.
🪙 OpenAPI запроса остатка
Появился новый эндпоинт GET /v1/user/balance — с любым OfoxAI API Key можно получить доступный остаток, суммарные пополнения и суммарные списания по аккаунту.
curl https://api.ofox.ai/v1/user/balance \
-H "Authorization: Bearer $OFOX_API_KEY"Структура ответа совместима со сторонними инструментами вроде cc-switch — OfoxAI можно сразу подключать как поставщика данных об остатке.
🧰 Интеграция с cc-switch
OfoxAI теперь нативно совместим с cc-switch — переключитесь на OfoxAI в cc-switch, и актуальный остаток отобразится сразу, без дополнительной разработки.

Настройка занимает четыре шага:
- Откройте конфигурацию запроса использования — нажмите иконку 📊 в правом верхнем углу карточки провайдера OfoxAI
- Включите запрос использования — переведите переключатель в активное положение
- Введите API Key — подойдёт любой пользовательский ключ OfoxAI (создаётся в Dashboard )
- Адрес запроса — выберите «Универсальный шаблон» и укажите
https://api.ofox.ai/v1
После сохранения карточка провайдера сразу покажет статус остатка, например Осталось: 64.77 USD.
Подробное руководство по подключению: Интеграция с cc-switch.
Новые модели · 24 апреля 2026
🤖 Новые модели
- GPT-5.5 (OpenAI) — новый флагман для сложных профессиональных нагрузок: контекст более 1M токенов (922K на вход / 128K на выход), заметный прирост в надёжности рассуждений и эффективности использования токенов по сравнению с GPT-5.4
- DeepSeek V4 Pro (DeepSeek) — флагманский MoE: 1.6T параметров всего и 49B активных, контекст 1M токенов, оптимизирован под продвинутые рассуждения, код и долгие агентские сценарии
- DeepSeek V4 Flash (DeepSeek) — ускоренный MoE: 284B параметров всего и 13B активных, контекст 1M токенов, ставка на высокий throughput и низкую задержку при предельной экономичности
Новые модели · 21 апреля 2026
🤖 Новые модели
- Kimi K2.6 (Moonshot AI) — самый сильный Kimi на сегодня: ощутимый прогресс в коде, рассуждениях и понимании изображений
- GPT Image 2 (OpenAI) — новое поколение модели генерации изображений: больше деталей и точнее передача
Новые модели · 16 апреля 2026
🤖 Новые модели
- Claude Opus 4.7 (Anthropic) — новый флагман Anthropic: ещё один шаг вперёд в рассуждениях и качестве текста
Акция · 15 апреля 2026
🎁 Апрельский кэшбэк GPT — до $250 в подарок
- Сроки — с 15 по 25 апреля, всего 11 дней
- Возврат — 25% обратно на всю линейку GPT, шесть градаций, максимум до $250
- Зачисление — бонусные средства бессрочны, обмен в один клик после завершения акции
- Команды — расходы участников суммируются автоматически, чтобы быстрее достичь высоких уровней
Страница акции: Апрельский кэшбэк GPT .
v1.0.55-20260407
🎁 Подарочные карты
Введите код подарочной карты на странице Кошелёк — баланс пополнится мгновенно. Самый элегантный способ подарить другу AI.
- Приватность по умолчанию — в истории операций отображаются только последние четыре цифры номера карты
- Безопасность — многоуровневая защита от злоупотреблений и сквозное шифрование
🔍 Инструмент проверки моделей
Сначала расставим точки над i: OfoxAI — не реселлер-шлюз.
- Юридическое лицо — NICE TALK PTE. LTD. (международная LLM-платформа)
- Лицензирование — официальные авторизации от поставщиков моделей
- Вычисления — Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Engine — напрямую от облачных провайдеров
- Маршрут запроса — Edge CDN сразу к облачному провайдеру, без промежуточных подмен и обёрток
Чтобы пользователи могли проверить подлинность моделей у любого LLM-шлюза, мы выпустили бесплатный инструмент: укажите API Base + Key и сразу увидите, не подменена ли модель.
Инструмент: Проверка моделей . Работает с любой платформой, не только с OfoxAI.
v1.0.54-20260403
💳 Платежи и пополнения — апгрейд
- Новый платёжный канал Airwallex — альтернатива Stripe, удобнее для зарубежных платежей
- Поддержка USD / CNY / SGD — расчёты в привычной валюте
- Лимит на одно пополнение поднят до $10 000 — крупные клиенты больше не упираются в потолок
- Бонус $3 за первое пополнение по приглашению партнёра — пользователи, зарегистрированные через партнёра, автоматически получают $3 на первое пополнение
🏢 Корпоративная страница — чем больше расходы, тем больше экономия
Автоматический кэшбэк при достижении порога ежемесячных расходов: без заявок, без переговоров с менеджером, начисление в первый день следующего месяца.
| Уровень | Расходы в месяц | Кэшбэк |
|---|---|---|
| Bronze | $1,000+ | 3% |
| Silver | $5,000+ | 4% |
| Gold | $10,000+ | 5% |
| Platinum | $20,000+ | 7% |
Поверх кэшбэка — корпоративные возможности:
- 0% комиссии платформы — тарифы один в один с официальными ценами поставщиков моделей
- Глобальные edge-точки — Токио / Сингапур / Франкфурт
- SLA 99.99% — мульти-региональное резервирование с автопереключением
- Нулевое хранение контента — промпты и ответы не логируются и не используются для обучения
Подробнее: Корпоративные услуги .
🤖 Новые модели
- GLM-5V-Turbo (Zhipu) — Turbo-версия мультимодальной линейки GLM
- Qwen3.6 Plus (Alibaba Bailian) — свежий уровень Plus в линейке Qwen3.6
v1.0.47-20260327
🏷️ Одна модель — много имён
Короткие имена и устаревшие идентификаторы — называйте модели как удобно. Миграция между платформами становится бесплатной: алиасы работают сразу, маршрутизатор распознаёт их автоматически.
Несколько примеров:
| Канонический ID | Алиасы |
|---|---|
anthropic/claude-opus-4.7 | claude-opus-4.7 · claude-opus-4-7 · claude-opus-4-7-20260416 |
anthropic/claude-sonnet-4.6 | claude-sonnet-4.6 · claude-sonnet-4-6 · claude-sonnet-4-6-20260217 |
openai/gpt-5.4-pro | gpt-5.4-pro |
openai/gpt-5.4 | gpt-5.4 |
moonshotai/kimi-k2.6 | kimi-k2.6 |
z-ai/glm-5.1 | glm-5.1 |
Полный список алиасов доступен через GET https://api.ofox.ai/v1/models — каждая запись модели содержит готовый массив aliases.
🖼️ Поштучная тарификация изображений
API изображений теперь тарифицируется за каждое сгенерированное изображение, цены прозрачны. Стандартные размеры автоматически сопоставляются с нативными размерами поставщика — менять клиентский код не нужно.
📊 Расход на изображения — наглядно
На главной консоли, страницах использования, расходов и рейтингов появилось отдельное измерение «Изображения» — месячный расход виден с одного взгляда.
🤖 Новые модели
- GLM 5.1 (Zhipu) — следующее поколение GLM с подтянутыми универсальными возможностями
🔗 Короче ссылки-приглашения
Реферальные ссылки сократились до формата /x/ваш-код — проще запомнить и поделиться.
v1.0.39-20260320
🔄 Fallback моделей — автоматическое переключение при сбое основной
Если основная модель возвращает 4xx/5xx, шлюз автоматически пробует резервные — до трёх уровней страховки. Поддерживаются все три протокола: OpenAI / Anthropic / Gemini. Клиентский код менять не нужно. Подробности: документация Fallback.
⚔️ OfoxAI vs OpenRouter — построчное сравнение
OpenRouter удерживает 5.5% с каждого пополнения, у OfoxAI — 0%. Тот же охват в 100+ моделей, при ежемесячных расходах от $1 000 экономия по итогам составляет более 10%. Полное сравнение: OfoxAI vs OpenRouter .
🤖 Новые модели
- GLM-5-Turbo (Zhipu) — Turbo-вариант GLM-5
- GPT-5.4 Mini / Nano (OpenAI) — лёгкая пара GPT-5.4: стоимость вызова существенно ниже
- MiniMax M2.7 / M2.7 Highspeed — новое поколение MiniMax; Highspeed заточен под низкую задержку
v1.0.36-20260313
🎊 Мартовский кэшбэк Claude
20% возврата на все уровни. Промокод OFOXAI2603 копируется одним кликом из всплывающего окна акции.
| Пополнение | Кэшбэк | Итого получаете |
|---|---|---|
| $20 | $4 | $24 |
| $50 | $10 | $60 |
| $100 | $20 | $120 |
| $200 | $40 | $240 |
| $500 | $100 | $600 |
Страница акции: Claude Spring, второй раунд .
🤖 Новые модели
- GPT-5.4 / GPT-5.4 Pro (OpenAI) — новый флагманский дуэт; Pro даёт более высокий потолок рассуждений
- Gemini Embedding 2 Preview (Google) — следующее поколение мультимодальной модели векторизации от Google
🖼️ Векторизация — все модальности
Gemini Embedding покрывает текст, изображения, аудио и видео — все четыре модальности. Параллельно подключены прямые интеграции с мультимодальной векторизацией Qwen и Volcengine.
⚡ Данные о расходах — обновление по часам
Агрегация использования стала ежечасной (раньше — раз в сутки). Расход появляется в Dashboard почти сразу после события.
💰 Понятнее купоны
В списке заказов теперь видны и сумма скидки, и сумма бонуса по каждому заказу.
v1.0.32-20260303
🎉 Мартовская акция Claude стартовала
В Dashboard добавились акционный баннер и прогресс-бар расходов; ошибки купонов локализованы на русский, английский и китайский. Страница акции: Claude Spring, первый раунд .
🤖 Новые модели
- GPT-5.3 Chat (OpenAI) — диалоговая версия GPT-5.3
- Gemini 3.1 Flash Lite Preview (Google) — облегчённый превью Gemini 3.1
- Nano Banana 2 (Google) — Gemini 3.1 Flash Image Preview, новое поколение генерации изображений
🏷️ Обновлённая навигация
- «Мои счета» → «Мой кошелёк» — название, ближе к реальному сценарию
- «Модели» → «Витрина моделей» — акцент на каталоге
- В шапку добавлен раздел Blog
v1.0.30-20260226
🔒 Вход через GitHub в один клик
На странице входа появился вход по GitHub OAuth — регистрация и логин одним кликом. Система запоминает последний выбранный способ входа. В настройках поддерживаются привязка/отвязка GitHub-аккаунта и синхронизация аватара.
🤖 Новые модели
- Полный набор Qwen3.5 — пять моделей разом (Alibaba Bailian) — Flash / 27B / 35B A3B / 122B A10B / 397B A17B
- GPT-5.3 Codex (OpenAI) — версия GPT-5.3, заточенная под код
- Gemini 3.1 Pro Preview (Google) — превью Gemini 3.1 Pro
- Qwen3 Coder Next (Alibaba Bailian) — новая профильная модель Qwen для кода
📱 Мобильная адаптация консоли
Модули «Пользователи», «Организации» и «Заказы» полностью адаптированы под мобильные устройства: складная боковая панель, умное скрытие колонок таблиц, удобная работа на маленьких экранах.
v1.0.27-20260217
📊 Аналитический дашборд
Три интерактивных графика — Использование, Расходы, Запросы. Тренды по месяцам, рейтинг моделей, фильтры по Provider / Model / User / API Key и временному диапазону в любой комбинации. Какая модель тащит на себе основную нагрузку? Теперь это видно с первого взгляда.
🤖 Новые модели
- Claude Sonnet 4.6 (Anthropic) — обновлённый Sonnet, прагматичный выбор по соотношению цена/качество
- Qwen3.5 Plus (Alibaba Bailian) — уровень Plus в линейке Qwen3.5
- Doubao Seed 2.0 в четырёх вариантах (Volcengine) — Code / Lite / Mini / Pro — полный набор Seed 2.0 онлайн
🌐 Поведение приведено к OpenAI
chat/completions без параметра stream по умолчанию теперь работает в нестриминговом режиме — точно как у OpenAI. Ваш код менять не придётся.
v1.0.24-20260212
🤖 Новые модели
- GLM-5 (Zhipu) — новый флагман линейки GLM
- MiniMax M2.5 / M2.5 Lightning — пара MiniMax; Lightning заточен под низкую задержку
🎊 Приветственное окно при первом входе
При первом входе появляется приветственный диалог с полным набором эндпоинтов трёх API — OpenAI, Anthropic, Gemini — с копированием в один клик. Плюс анимация конфетти — немного праздничного настроения для разработчиков.
🧠 Кэш «привязки к провайдеру»
Когда один и тот же пользователь переключается между моделями, шлюз отдаёт приоритет тому же базовому провайдеру. Это повышает попадание в Prompt Cache — ответы быстрее, расходы ниже.
🎟️ Реферальная программа Angel
Полноценная реферальная система: карточный UI, диалог присоединения, таблица истории использования. Двусторонние награды для приглашающего и приглашённого, генерация персонального постера-приглашения в один клик.
v1.0.20-20260206
🤖 Новые модели
- Claude Opus 4.6 (Anthropic) — новый флагман Anthropic, очередной шаг вперёд в рассуждениях и качестве текста
🌍 Переключение языков в один клик
Более 1100 ключей перевода — полная пара русский/английский/китайский по всей платформе без швов. Языковые предпочтения запоминаются в cookie.
🔍 Тарификация Web Search по вызовам
Вызовы инструмента Web Search во всех трёх протоколах — OpenAI / Anthropic / Gemini — теперь корректно тарифицируются за каждый вызов.
📊 Обновлённый Dashboard
- Персонализированное приветствие по имени пользователя вместо безликого «Hi»
- Статистика расходов перешла с дневного на недельный обзор
- Отображение API Key в трёх режимах: полностью скрыто / маскированно / полностью открыто
💵 Аккуратнее с ценами
$0.6000 автоматически избавляется от хвостовых нулей и показывается как $0.6. Сообщения о недостатке средств теперь сразу в долларовом формате — без устного пересчёта из наноцентов.
📚 Сайт документации запущен
- Полные референсы протоколов OpenAI / Anthropic / Gemini
- Гайды по интеграции с 10+ инструментами: Claude Code, Codex, Gemini CLI, Zed, Cline, Cherry Studio, OpenClaw, OpenCode и другие — от настройки до рабочего пайплайна
v1.0.1 ~ v1.0.9 · 20 января – 1 февраля 2026 — две недели на фундамент
После запуска мы не сделали ни одного перерыва. Каждый релиз этих двух недель делал платформу стабильнее, точнее и удобнее в подключении.
💻 Полноценная поддержка Claude Code
Мы сами пишем код в Claude Code. 21 января шлюз получил полную совместимость с Claude Code — указываете API Base на OfoxAI, меняете ключ sk-***, и все модели Claude сразу работают.
🧠 Цепочки рассуждений Thinking
Thinking-блоки — внутренний «ход мысли» модели — сквозно проброшены для Claude и Gemini по всем протоколам. Видно, как модель рассуждает, а не только итог.
🌐 Нативная поддержка протокола Gemini
Не только OpenAI-совместимый режим — заработал и нативный API Gemini generateContent. Официальный SDK Google подключается напрямую, без потерь на трансляцию.
💵 Многовалютный Stripe
Помимо USD добавились CNY, SGD и другие валюты. Курс обмена фиксируется в снимке на момент заказа. Пользователи Азиатско-Тихоокеанского региона рассчитываются в своей валюте.
🎯 Точность биллинга до 6 знаков
Уровень NanoDollar. Даже если вызов API стоит сотые доли цента, он будет точно учтён и тарифицирован. Крупные клиенты не теряют на округлении, мелкие — не платят лишнего.
v1.0.0 · 16 января 2026 — шлюз вышел в свет
«С сегодняшнего дня — 100+ моделей и один Key.»
В этот день платформа OfoxAI официально открылась для пользователей.
🚀 Возможности на старте
- Три протокола нативно — OpenAI / Anthropic / Gemini поддерживаются напрямую, существующий код подключается без изменений
- 100+ моделей под одним Key — Claude , GPT , Gemini , DeepSeek , Qwen и десятки других — за одним ключом. Полный каталог: Витрина моделей
- Умный роутинг — алгоритм маршрутизации на уровне «Provider × Model» автоматически выбирает самый быстрый и стабильный канал. Подробнее: Provider Routing
- Самостоятельное управление API Key — создание, включение/отключение и контроль использования прямо в Dashboard
- Pay-as-you-go и 0% комиссии платформы — официальная цена поставщика без надбавок. Тарифы: Pricing
- Оплата картой через Stripe — мгновенное зачисление, остаток виден в реальном времени
- Глобальные edge-узлы — Токио / Сингапур / Франкфурт, маршрутизация к ближайшему узлу
🌐 Что под капотом
Это не реселлер-шлюз — это платформа. Запросы идут через Edge CDN напрямую к Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Engine.
Day 1 · 27 декабря 2025 — как всё начиналось
«Дать разработчикам самый простой способ обращаться к самым умным моделям мира.»
🦊 Первая строчка кода
В конце 2025-го крошечный коммит положил первый камень OfoxAI:
feat: initialize ofox-studio monorepo⚡ Момент озарения
Через три дня у нас одновременно заработали Claude на AWS Bedrock и GPT на Azure — два хайперскейлера, две топовые модели, прямое подключение без посредников.
Когда первые ответы по обеим веткам легли в терминал почти одновременно, стало ясно: это получится.
Это была не demo-адаптация, а настоящее мульти-облачное прямое подключение. Следом подключились Google Cloud, Alibaba Cloud, Z.AI, Moonshot, Volcano Engine — позиция «не реселлер-шлюз, а платформа» была закреплена уже на третий день.
🌱 Точка отсчёта
commit 0001
Одна строка кода, одно направление. Сделать самый умный интеллект в мире доступным каждому.
Двигатели — на старт.