Skip to Content
ChangelogChangelog

Журнал обновлений

Каждый шаг OfoxAI — новые модели, новые возможности, новый опыт. Обновляется еженедельно.


v1.1.0-20260428

💰 Управление бюджетом — три измерения: команда / участник / API Key

Превращаем «сколько тратим» из устной договорённости в системное ограничение. Внутри одной организации одновременно настраиваются три измерения × три периода лимитов расходов:

ИзмерениеСценарий применения
Команда (Organization)Общий бюджет компании или проекта
Участник (User)Месячная квота на одного сотрудника
API KeyОтдельный бюджет на приложение или сервис

В каждом измерении задаются три типа лимитов: дневной / месячный / накопительный. При превышении запрос автоматически отклоняется.

Прогресс-бар подсвечивает три уровня предупреждений:

  • 🟢 40% — расход в норме
  • 🟡 80% — приближение к лимиту
  • 🔴 110% — превышение (запас оставлен специально, чтобы при высоком RPS лимит не пробивался мгновенно)

Иерархическая валидация работает автоматически: лимит API Key ≤ лимит участника ≤ лимит команды. Фронтенд в реальном времени показывает квоту родительского уровня, чтобы исключить ошибочные значения.

Раздел: Настройки → Квоты 

⏱️ Командный лимит RPM

Добавлен командный лимит запросов в минуту (RPM) — он защищает от ситуации, когда несколько API Key суммарно пробивают квоту вышестоящего провайдера.

  • RPM считается агрегированно по всей команде, а не отдельно по каждому ключу
  • По умолчанию 100 RPM; если нужно больше, напишите на [email protected]
  • Превышающие запросы возвращают 429 Too Many Requests

Сценарии: всплески трафика в CI/CD, защита батч-задач от перегрузок, единый лимит для команды разработчиков.

🪙 OpenAPI запроса остатка

Появился новый эндпоинт GET /v1/user/balance — с любым OfoxAI API Key можно получить доступный остаток, суммарные пополнения и суммарные списания по аккаунту.

Terminal
curl https://api.ofox.ai/v1/user/balance \ -H "Authorization: Bearer $OFOX_API_KEY"

Структура ответа совместима со сторонними инструментами вроде cc-switch  — OfoxAI можно сразу подключать как поставщика данных об остатке.

🧰 Интеграция с cc-switch

OfoxAI теперь нативно совместим с cc-switch  — переключитесь на OfoxAI в cc-switch, и актуальный остаток отобразится сразу, без дополнительной разработки.

Настройка запроса остатка OfoxAI в cc-switch

Настройка занимает четыре шага:

  1. Откройте конфигурацию запроса использования — нажмите иконку 📊 в правом верхнем углу карточки провайдера OfoxAI
  2. Включите запрос использования — переведите переключатель в активное положение
  3. Введите API Key — подойдёт любой пользовательский ключ OfoxAI (создаётся в Dashboard )
  4. Адрес запроса — выберите «Универсальный шаблон» и укажите https://api.ofox.ai/v1

После сохранения карточка провайдера сразу покажет статус остатка, например Осталось: 64.77 USD.

Подробное руководство по подключению: Интеграция с cc-switch.


Новые модели · 24 апреля 2026

🤖 Новые модели

  • GPT-5.5 (OpenAI) — новый флагман для сложных профессиональных нагрузок: контекст более 1M токенов (922K на вход / 128K на выход), заметный прирост в надёжности рассуждений и эффективности использования токенов по сравнению с GPT-5.4
  • DeepSeek V4 Pro (DeepSeek) — флагманский MoE: 1.6T параметров всего и 49B активных, контекст 1M токенов, оптимизирован под продвинутые рассуждения, код и долгие агентские сценарии
  • DeepSeek V4 Flash (DeepSeek) — ускоренный MoE: 284B параметров всего и 13B активных, контекст 1M токенов, ставка на высокий throughput и низкую задержку при предельной экономичности

Новые модели · 21 апреля 2026

🤖 Новые модели

  • Kimi K2.6 (Moonshot AI) — самый сильный Kimi на сегодня: ощутимый прогресс в коде, рассуждениях и понимании изображений
  • GPT Image 2 (OpenAI) — новое поколение модели генерации изображений: больше деталей и точнее передача

Новые модели · 16 апреля 2026

🤖 Новые модели

  • Claude Opus 4.7 (Anthropic) — новый флагман Anthropic: ещё один шаг вперёд в рассуждениях и качестве текста

Акция · 15 апреля 2026

🎁 Апрельский кэшбэк GPT — до $250 в подарок

  • Сроки — с 15 по 25 апреля, всего 11 дней
  • Возврат — 25% обратно на всю линейку GPT, шесть градаций, максимум до $250
  • Зачисление — бонусные средства бессрочны, обмен в один клик после завершения акции
  • Команды — расходы участников суммируются автоматически, чтобы быстрее достичь высоких уровней

Страница акции: Апрельский кэшбэк GPT .


v1.0.55-20260407

🎁 Подарочные карты

Введите код подарочной карты на странице Кошелёк  — баланс пополнится мгновенно. Самый элегантный способ подарить другу AI.

  • Приватность по умолчанию — в истории операций отображаются только последние четыре цифры номера карты
  • Безопасность — многоуровневая защита от злоупотреблений и сквозное шифрование

🔍 Инструмент проверки моделей

Сначала расставим точки над i: OfoxAI — не реселлер-шлюз.

  • Юридическое лицо — NICE TALK PTE. LTD. (международная LLM-платформа)
  • Лицензирование — официальные авторизации от поставщиков моделей
  • Вычисления — Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Engine — напрямую от облачных провайдеров
  • Маршрут запроса — Edge CDN сразу к облачному провайдеру, без промежуточных подмен и обёрток

Чтобы пользователи могли проверить подлинность моделей у любого LLM-шлюза, мы выпустили бесплатный инструмент: укажите API Base + Key и сразу увидите, не подменена ли модель.

Инструмент: Проверка моделей . Работает с любой платформой, не только с OfoxAI.


v1.0.54-20260403

💳 Платежи и пополнения — апгрейд

  • Новый платёжный канал Airwallex — альтернатива Stripe, удобнее для зарубежных платежей
  • Поддержка USD / CNY / SGD — расчёты в привычной валюте
  • Лимит на одно пополнение поднят до $10 000 — крупные клиенты больше не упираются в потолок
  • Бонус $3 за первое пополнение по приглашению партнёра — пользователи, зарегистрированные через партнёра, автоматически получают $3 на первое пополнение

🏢 Корпоративная страница — чем больше расходы, тем больше экономия

Автоматический кэшбэк при достижении порога ежемесячных расходов: без заявок, без переговоров с менеджером, начисление в первый день следующего месяца.

УровеньРасходы в месяцКэшбэк
Bronze$1,000+3%
Silver$5,000+4%
Gold$10,000+5%
Platinum$20,000+7%

Поверх кэшбэка — корпоративные возможности:

  • 0% комиссии платформы — тарифы один в один с официальными ценами поставщиков моделей
  • Глобальные edge-точки — Токио / Сингапур / Франкфурт
  • SLA 99.99% — мульти-региональное резервирование с автопереключением
  • Нулевое хранение контента — промпты и ответы не логируются и не используются для обучения

Подробнее: Корпоративные услуги .

🤖 Новые модели

  • GLM-5V-Turbo (Zhipu) — Turbo-версия мультимодальной линейки GLM
  • Qwen3.6 Plus (Alibaba Bailian) — свежий уровень Plus в линейке Qwen3.6

v1.0.47-20260327

🏷️ Одна модель — много имён

Короткие имена и устаревшие идентификаторы — называйте модели как удобно. Миграция между платформами становится бесплатной: алиасы работают сразу, маршрутизатор распознаёт их автоматически.

Несколько примеров:

Канонический IDАлиасы
anthropic/claude-opus-4.7claude-opus-4.7 · claude-opus-4-7 · claude-opus-4-7-20260416
anthropic/claude-sonnet-4.6claude-sonnet-4.6 · claude-sonnet-4-6 · claude-sonnet-4-6-20260217
openai/gpt-5.4-progpt-5.4-pro
openai/gpt-5.4gpt-5.4
moonshotai/kimi-k2.6kimi-k2.6
z-ai/glm-5.1glm-5.1

Полный список алиасов доступен через GET https://api.ofox.ai/v1/models — каждая запись модели содержит готовый массив aliases.

🖼️ Поштучная тарификация изображений

API изображений теперь тарифицируется за каждое сгенерированное изображение, цены прозрачны. Стандартные размеры автоматически сопоставляются с нативными размерами поставщика — менять клиентский код не нужно.

📊 Расход на изображения — наглядно

На главной консоли, страницах использования, расходов и рейтингов появилось отдельное измерение «Изображения» — месячный расход виден с одного взгляда.

🤖 Новые модели

  • GLM 5.1 (Zhipu) — следующее поколение GLM с подтянутыми универсальными возможностями

🔗 Короче ссылки-приглашения

Реферальные ссылки сократились до формата /x/ваш-код — проще запомнить и поделиться.


v1.0.39-20260320

🔄 Fallback моделей — автоматическое переключение при сбое основной

Если основная модель возвращает 4xx/5xx, шлюз автоматически пробует резервные — до трёх уровней страховки. Поддерживаются все три протокола: OpenAI / Anthropic / Gemini. Клиентский код менять не нужно. Подробности: документация Fallback.

⚔️ OfoxAI vs OpenRouter — построчное сравнение

OpenRouter удерживает 5.5% с каждого пополнения, у OfoxAI — 0%. Тот же охват в 100+ моделей, при ежемесячных расходах от $1 000 экономия по итогам составляет более 10%. Полное сравнение: OfoxAI vs OpenRouter .

🤖 Новые модели

  • GLM-5-Turbo (Zhipu) — Turbo-вариант GLM-5
  • GPT-5.4 Mini / Nano (OpenAI) — лёгкая пара GPT-5.4: стоимость вызова существенно ниже
  • MiniMax M2.7 / M2.7 Highspeed — новое поколение MiniMax; Highspeed заточен под низкую задержку

v1.0.36-20260313

🎊 Мартовский кэшбэк Claude

20% возврата на все уровни. Промокод OFOXAI2603 копируется одним кликом из всплывающего окна акции.

ПополнениеКэшбэкИтого получаете
$20$4$24
$50$10$60
$100$20$120
$200$40$240
$500$100$600

Страница акции: Claude Spring, второй раунд .

🤖 Новые модели

  • GPT-5.4 / GPT-5.4 Pro (OpenAI) — новый флагманский дуэт; Pro даёт более высокий потолок рассуждений
  • Gemini Embedding 2 Preview (Google) — следующее поколение мультимодальной модели векторизации от Google

🖼️ Векторизация — все модальности

Gemini Embedding покрывает текст, изображения, аудио и видео — все четыре модальности. Параллельно подключены прямые интеграции с мультимодальной векторизацией Qwen и Volcengine.

⚡ Данные о расходах — обновление по часам

Агрегация использования стала ежечасной (раньше — раз в сутки). Расход появляется в Dashboard почти сразу после события.

💰 Понятнее купоны

В списке заказов теперь видны и сумма скидки, и сумма бонуса по каждому заказу.


v1.0.32-20260303

🎉 Мартовская акция Claude стартовала

В Dashboard добавились акционный баннер и прогресс-бар расходов; ошибки купонов локализованы на русский, английский и китайский. Страница акции: Claude Spring, первый раунд .

🤖 Новые модели

  • GPT-5.3 Chat (OpenAI) — диалоговая версия GPT-5.3
  • Gemini 3.1 Flash Lite Preview (Google) — облегчённый превью Gemini 3.1
  • Nano Banana 2 (Google) — Gemini 3.1 Flash Image Preview, новое поколение генерации изображений

🏷️ Обновлённая навигация


v1.0.30-20260226

🔒 Вход через GitHub в один клик

На странице входа появился вход по GitHub OAuth — регистрация и логин одним кликом. Система запоминает последний выбранный способ входа. В настройках поддерживаются привязка/отвязка GitHub-аккаунта и синхронизация аватара.

🤖 Новые модели

📱 Мобильная адаптация консоли

Модули «Пользователи», «Организации» и «Заказы» полностью адаптированы под мобильные устройства: складная боковая панель, умное скрытие колонок таблиц, удобная работа на маленьких экранах.


v1.0.27-20260217

📊 Аналитический дашборд

Три интерактивных графика — Использование, Расходы, Запросы. Тренды по месяцам, рейтинг моделей, фильтры по Provider / Model / User / API Key и временному диапазону в любой комбинации. Какая модель тащит на себе основную нагрузку? Теперь это видно с первого взгляда.

🤖 Новые модели

  • Claude Sonnet 4.6 (Anthropic) — обновлённый Sonnet, прагматичный выбор по соотношению цена/качество
  • Qwen3.5 Plus (Alibaba Bailian) — уровень Plus в линейке Qwen3.5
  • Doubao Seed 2.0 в четырёх вариантах (Volcengine) — Code  / Lite  / Mini  / Pro  — полный набор Seed 2.0 онлайн

🌐 Поведение приведено к OpenAI

chat/completions без параметра stream по умолчанию теперь работает в нестриминговом режиме — точно как у OpenAI. Ваш код менять не придётся.


v1.0.24-20260212

🤖 Новые модели

  • GLM-5 (Zhipu) — новый флагман линейки GLM
  • MiniMax M2.5 / M2.5 Lightning — пара MiniMax; Lightning заточен под низкую задержку

🎊 Приветственное окно при первом входе

При первом входе появляется приветственный диалог с полным набором эндпоинтов трёх API — OpenAI, Anthropic, Gemini — с копированием в один клик. Плюс анимация конфетти — немного праздничного настроения для разработчиков.

🧠 Кэш «привязки к провайдеру»

Когда один и тот же пользователь переключается между моделями, шлюз отдаёт приоритет тому же базовому провайдеру. Это повышает попадание в Prompt Cache — ответы быстрее, расходы ниже.

🎟️ Реферальная программа Angel

Полноценная реферальная система: карточный UI, диалог присоединения, таблица истории использования. Двусторонние награды для приглашающего и приглашённого, генерация персонального постера-приглашения в один клик.


v1.0.20-20260206

🤖 Новые модели

  • Claude Opus 4.6 (Anthropic) — новый флагман Anthropic, очередной шаг вперёд в рассуждениях и качестве текста

🌍 Переключение языков в один клик

Более 1100 ключей перевода — полная пара русский/английский/китайский по всей платформе без швов. Языковые предпочтения запоминаются в cookie.

🔍 Тарификация Web Search по вызовам

Вызовы инструмента Web Search во всех трёх протоколах — OpenAI / Anthropic / Gemini — теперь корректно тарифицируются за каждый вызов.

📊 Обновлённый Dashboard

  • Персонализированное приветствие по имени пользователя вместо безликого «Hi»
  • Статистика расходов перешла с дневного на недельный обзор
  • Отображение API Key в трёх режимах: полностью скрыто / маскированно / полностью открыто

💵 Аккуратнее с ценами

$0.6000 автоматически избавляется от хвостовых нулей и показывается как $0.6. Сообщения о недостатке средств теперь сразу в долларовом формате — без устного пересчёта из наноцентов.

📚 Сайт документации запущен


v1.0.1 ~ v1.0.9 · 20 января – 1 февраля 2026 — две недели на фундамент

После запуска мы не сделали ни одного перерыва. Каждый релиз этих двух недель делал платформу стабильнее, точнее и удобнее в подключении.

💻 Полноценная поддержка Claude Code

Мы сами пишем код в Claude Code. 21 января шлюз получил полную совместимость с Claude Code — указываете API Base на OfoxAI, меняете ключ sk-***, и все модели Claude сразу работают.

🧠 Цепочки рассуждений Thinking

Thinking-блоки — внутренний «ход мысли» модели — сквозно проброшены для Claude и Gemini по всем протоколам. Видно, как модель рассуждает, а не только итог.

🌐 Нативная поддержка протокола Gemini

Не только OpenAI-совместимый режим — заработал и нативный API Gemini generateContent. Официальный SDK Google подключается напрямую, без потерь на трансляцию.

💵 Многовалютный Stripe

Помимо USD добавились CNY, SGD и другие валюты. Курс обмена фиксируется в снимке на момент заказа. Пользователи Азиатско-Тихоокеанского региона рассчитываются в своей валюте.

🎯 Точность биллинга до 6 знаков

Уровень NanoDollar. Даже если вызов API стоит сотые доли цента, он будет точно учтён и тарифицирован. Крупные клиенты не теряют на округлении, мелкие — не платят лишнего.


v1.0.0 · 16 января 2026 — шлюз вышел в свет

«С сегодняшнего дня — 100+ моделей и один Key.»

В этот день платформа OfoxAI  официально открылась для пользователей.

🚀 Возможности на старте

  • Три протокола нативноOpenAI / Anthropic / Gemini поддерживаются напрямую, существующий код подключается без изменений
  • 100+ моделей под одним KeyClaude , GPT , Gemini , DeepSeek , Qwen  и десятки других — за одним ключом. Полный каталог: Витрина моделей 
  • Умный роутинг — алгоритм маршрутизации на уровне «Provider × Model» автоматически выбирает самый быстрый и стабильный канал. Подробнее: Provider Routing
  • Самостоятельное управление API Key — создание, включение/отключение и контроль использования прямо в Dashboard 
  • Pay-as-you-go и 0% комиссии платформы — официальная цена поставщика без надбавок. Тарифы: Pricing
  • Оплата картой через Stripe — мгновенное зачисление, остаток виден в реальном времени
  • Глобальные edge-узлы — Токио / Сингапур / Франкфурт, маршрутизация к ближайшему узлу

🌐 Что под капотом

Это не реселлер-шлюз — это платформа. Запросы идут через Edge CDN напрямую к Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Engine.


Day 1 · 27 декабря 2025 — как всё начиналось

«Дать разработчикам самый простой способ обращаться к самым умным моделям мира.»

🦊 Первая строчка кода

В конце 2025-го крошечный коммит положил первый камень OfoxAI:

feat: initialize ofox-studio monorepo

⚡ Момент озарения

Через три дня у нас одновременно заработали Claude на AWS Bedrock и GPT на Azure — два хайперскейлера, две топовые модели, прямое подключение без посредников.

Когда первые ответы по обеим веткам легли в терминал почти одновременно, стало ясно: это получится.

Это была не demo-адаптация, а настоящее мульти-облачное прямое подключение. Следом подключились Google Cloud, Alibaba Cloud, Z.AI, Moonshot, Volcano Engine — позиция «не реселлер-шлюз, а платформа» была закреплена уже на третий день.

🌱 Точка отсчёта

commit 0001

Одна строка кода, одно направление. Сделать самый умный интеллект в мире доступным каждому.

Двигатели — на старт.


Last updated on