Skip to Content
ChangelogChangelog

Changelog

Cada passo da OfoxAI — novos modelos, novos recursos, novas experiências. Atualizado toda semana.


v1.1.0-20260428

💰 Gestão de Orçamento — Equipe / Membro / API Key em três dimensões

Transformamos o “quanto se pode gastar” de combinado verbal em restrição forte do sistema. Cada organização pode configurar simultaneamente limites de consumo em três dimensões × três períodos:

DimensãoCaso de uso
Equipe (Organization)Orçamento total da empresa/projeto
Membro (User)Cota mensal por colaborador
API KeyOrçamento independente por aplicação / serviço

Cada dimensão pode ter limites configurados em três períodos: diário / mensal / acumulado. Requisições que ultrapassam o limite são rejeitadas automaticamente.

A barra de progresso traz três níveis de alerta:

  • 🟢 40% — uso normal
  • 🟡 80% — próximo do limite
  • 🔴 110% — excedido (margem reservada para evitar estouro instantâneo em alta concorrência)

A validação hierárquica é automática: limite da API Key ≤ limite do membro ≤ limite da equipe. O frontend mostra a cota do nível superior em tempo real para evitar configurações inconsistentes.

Acesso: Configurações → Cotas 

⏱️ RPM no nível da equipe

Adicionamos o limite de taxa de requisições no nível da equipe (RPM), evitando na raiz que múltiplas API Keys somadas estourem a cota dos provedores upstream.

  • O RPM é calculado de forma agregada para toda a equipe, não mais por chave individual
  • Padrão de 100 RPM; para taxas mais altas, fale com [email protected]
  • Requisições acima do limite recebem automaticamente 429 Too Many Requests

Casos de uso: picos de tráfego em CI/CD, controle de jobs em batch e limite unificado para times com muitos colaboradores.

🪙 OpenAPI de consulta de saldo

Novo endpoint GET /v1/user/balance: com qualquer API Key da OfoxAI você consulta o saldo disponível, total de entradas e total de débitos da conta.

Terminal
curl https://api.ofox.ai/v1/user/balance \ -H "Authorization: Bearer $OFOX_API_KEY"

A estrutura da resposta é compatível com ferramentas de terceiros como o cc-switch , podendo ser usada diretamente como provedor de saldo.

🧰 Suporte nativo ao cc-switch

A OfoxAI agora é compatível nativamente com o cc-switch  — basta selecionar a OfoxAI no cc-switch para visualizar o saldo em tempo real, sem nenhum desenvolvimento adicional.

Configuração de consulta de saldo OfoxAI no cc-switch

Configuração em quatro passos:

  1. Abrir as configurações de consulta de uso — clique no ícone 📊 no canto superior direito do card do provedor OfoxAI
  2. Ativar a consulta de uso — ligue o switch
  3. Informar a API Key — qualquer API Key de usuário da OfoxAI serve (crie no Dashboard )
  4. Endereço da requisição — selecione “Modelo genérico” e use https://api.ofox.ai/v1

Após salvar, o card do provedor mostra imediatamente o saldo, por exemplo Restante: 64,77 USD.

Passo a passo completo: Guia de integração do cc-switch.


Novos modelos · 2026-04-24

🤖 Novos modelos

  • GPT-5.5 (OpenAI) — novo carro-chefe para cargas de trabalho profissionais complexas, com contexto de mais de 1M tokens (922K entrada / 128K saída) e ganhos consistentes de confiabilidade de raciocínio e eficiência de tokens em relação ao GPT-5.4
  • DeepSeek V4 Pro (DeepSeek) — flagship MoE com 1,6T de parâmetros totais e 49B ativos, contexto de 1M tokens, otimizado para raciocínio avançado, código e workflows de Agente de longa duração
  • DeepSeek V4 Flash (DeepSeek) — versão acelerada MoE com 284B de parâmetros totais e 13B ativos, contexto de 1M tokens, focada em alto throughput, baixa latência e excelente custo-benefício

Novos modelos · 2026-04-21

🤖 Novos modelos

  • Kimi K2.6 (Moonshot AI) — o Kimi mais poderoso até hoje, com avanços em código, raciocínio e compreensão visual
  • GPT Image 2 (OpenAI) — nova geração de modelo de imagem, com mais detalhe e fidelidade

Novos modelos · 2026-04-16

🤖 Novos modelos

  • Claude Opus 4.7 (Anthropic) — novo flagship da Anthropic, com mais um salto em raciocínio e escrita

Promoção · 2026-04-15

🎁 Cashback de abril em GPT — até $250 de bônus

  • Período — de 15 a 25 de abril, 11 dias
  • Cashback — 25% de retorno em todo o consumo da família GPT, com 6 faixas e até $250 de bônus
  • Crédito — o bônus é vitalício e pode ser resgatado em um clique após o término da promoção
  • Para times — o consumo dos membros é somado automaticamente, ajudando a alcançar faixas mais altas em conjunto

Página da campanha: Cashback de abril em GPT .


v1.0.55-20260407

🎁 Sistema de gift cards no ar

Na página da carteira , basta inserir o código do gift card e o saldo cai instantaneamente. A forma mais elegante de presentear alguém com IA.

  • Privacidade — o histórico de transações exibe apenas os quatro últimos dígitos do código
  • Segurança — múltiplas camadas anti-abuso e criptografia ponta a ponta protegem cada cartão

🔍 Ferramenta de verificação de modelos no ar

Vamos ao ponto: a OfoxAI não é um proxy intermediário.

  • Operadora — NICE TALK PTE. LTD. (plataforma internacional de modelos de fundação)
  • Licenciamento dos modelos — autorizado oficialmente pelos fornecedores
  • Infraestrutura — fornecida diretamente por Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Cloud, entre outros provedores
  • Caminho da requisição — CDN edge conectado direto aos provedores, sem intermediação ou substituição

Para que qualquer usuário possa verificar a autenticidade dos modelos em qualquer LLM gateway, lançamos uma ferramenta gratuita: informe API Base + Key e descubra em um clique se o modelo foi substituído.

Acesse: Verificação de modelos . Funciona em qualquer plataforma, não só OfoxAI.


v1.0.54-20260403

💳 Pagamentos e recargas aprimorados

  • Novo gateway Airwallex — uma alternativa ao Stripe, com pagamentos internacionais mais fluidos
  • Suporte a USD / CNY / SGD — pague na moeda que você usa no dia a dia
  • Limite por recarga aumentado para $10.000 — clientes maiores não ficam mais limitados
  • Bônus de $3 na primeira recarga via indicação de parceiro — usuários trazidos por parceiros recebem $3 automaticamente na primeira recarga

🏢 Página enterprise no ar — quanto mais você usa, mais economiza

Atinge o consumo mínimo no mês e o cashback é automático. Nada de pedir, nada de tickets — chega na sua conta no início do mês seguinte.

FaixaConsumo mínimo mensalCashback
Bronze$1.000+3%
Silver$5.000+4%
Gold$10.000+5%
Platinum$20.000+7%

Recursos enterprise empilhados:

  • 0% de taxa da plataforma — preço oficial dos modelos passado direto
  • Aceleração global — pontos de presença em Tóquio, Singapura e Frankfurt
  • SLA de 99,99% de disponibilidade — redundância multirregional e failover automático
  • Zero retenção de conteúdo — prompts e respostas não são armazenados nem usados em treinamento

Detalhes: Serviços enterprise .

🤖 Novos modelos

  • GLM-5V-Turbo (Zhipu) — versão Turbo da família multimodal GLM
  • Qwen3.6 Plus (Alibaba Bailian) — a mais nova revisão Plus do Qwen3.6

v1.0.47-20260327

🏷️ Um modelo, várias formas de chamar

Crie atalhos curtos, mantenha IDs antigos e troque de plataforma sem migração. O alias funciona na hora — o roteador reconhece automaticamente.

Alguns exemplos:

ID oficialAliases disponíveis
anthropic/claude-opus-4.7claude-opus-4.7 · claude-opus-4-7 · claude-opus-4-7-20260416
anthropic/claude-sonnet-4.6claude-sonnet-4.6 · claude-sonnet-4-6 · claude-sonnet-4-6-20260217
openai/gpt-5.4-progpt-5.4-pro
openai/gpt-5.4gpt-5.4
moonshotai/kimi-k2.6kimi-k2.6
z-ai/glm-5.1glm-5.1

A lista completa de aliases pode ser consultada em GET https://api.ofox.ai/v1/models — o campo aliases da resposta já vem pronto para uso.

🖼️ Geração de imagem cobrada por imagem

A API de imagem agora cobra pelo número de imagens geradas, com preço transparente por imagem. Tamanhos padronizados são mapeados automaticamente para os tamanhos nativos de cada provedor — zero alteração no código do cliente.

📊 Visualização de uso de imagem

A página inicial do console, além das telas de uso, custos e ranking, ganharam a dimensão de “Imagens”, para acompanhar o consumo mensal num relance.

🤖 Novos modelos

  • GLM 5.1 (Zhipu) — próxima geração da família GLM, com upgrade geral nas capacidades

Os links de convite passaram a ser /x/seu-código — mais fáceis de lembrar e compartilhar.


v1.0.39-20260320

🔄 Fallback de modelos — troca automática quando o principal falha

Quando o modelo principal retorna erros 4xx/5xx, o gateway tenta automaticamente os modelos de backup configurados, com até 3 níveis de proteção. Funciona com OpenAI, Anthropic e Gemini, sem alterar o código do cliente. Detalhes: documentação de Fallback.

⚔️ OfoxAI vs OpenRouter, item por item

O OpenRouter cobra 5,5% de taxa em cada recarga; a OfoxAI cobra 0%. Com a mesma cobertura de mais de 100 modelos, quem consome acima de $1.000/mês pode economizar mais de 10% no custo total. Comparativo completo: OfoxAI vs OpenRouter .

🤖 Novos modelos


v1.0.36-20260313

🎊 Cashback Claude de março

20% de cashback em todas as faixas; o pop-up da campanha copia o cupom OFOXAI2603 em um clique.

RecargaBônusTotal recebido
$20$4$24
$50$10$60
$100$20$120
$200$40$240
$500$100$600

Página da campanha: Claude Spring 2ª onda .

🤖 Novos modelos

🖼️ Embeddings com cobertura multimodal

O Gemini Embedding agora aceita as quatro modalidades — texto, imagem, áudio e vídeo. Os modelos de embedding multimodal da Qwen e Volcano também estão integrados diretamente.

⚡ Dados de uso atualizados a cada hora

A agregação de uso passou de uma vez ao dia para uma vez por hora. Logo após o consumo já é possível visualizar no Dashboard.

💰 Cupons exibidos com mais clareza

A lista de pedidos passou a mostrar de forma completa o desconto e o bônus aplicados em cada transação.


v1.0.32-20260303

🎉 Promoção Claude de março no ar

O Dashboard ganhou um banner de campanha e uma barra de progresso de consumo; mensagens de erro de cupom foram totalmente localizadas em chinês e inglês. Página da campanha: Claude Spring 1ª onda .

🤖 Novos modelos

🏷️ Navegação renovada


v1.0.30-20260226

🔒 Login com GitHub em um clique

A tela de login passou a oferecer OAuth do GitHub para cadastro/login imediato. O sistema lembra o último método utilizado. Em Configurações é possível vincular, desvincular e sincronizar avatar da conta GitHub.

🤖 Novos modelos

📱 Console responsivo no mobile

Os módulos de usuários, organizações e pedidos do console passaram a ser totalmente adaptados ao mobile. Sidebar com colapso, tabelas que se ajustam de forma inteligente e fluidez em telas pequenas.


v1.0.27-20260217

📊 Painel analítico

Três gráficos interativos de uso, custo e requisições. Tendências mensais, ranking por modelo, filtros combinando Provider, Model, User, API Key e período. Qual é o seu modelo principal? Resposta de bate-pronto.

🤖 Novos modelos

  • Claude Sonnet 4.6 (Anthropic) — nova versão da família Sonnet, equilíbrio entre custo e desempenho
  • Qwen3.5 Plus (Alibaba Bailian) — versão Plus do Qwen3.5
  • Doubao Seed 2.0 em quatro versões (Volcano) — Code  / Lite  / Mini  / Pro , a família completa Doubao Seed 2.0 disponível ao mesmo tempo

🌐 Comportamento alinhado à OpenAI

Em chat/completions, quando stream não é informado, o padrão é não-streaming — exatamente como na OpenAI oficial. Seu código não precisa mudar nada.


v1.0.24-20260212

🤖 Novos modelos

  • GLM-5 (Zhipu) — novo flagship da família GLM
  • MiniMax M2.5 / M2.5 Lightning — duas versões da MiniMax; a Lightning é otimizada para baixa latência

🎊 Boas-vindas no primeiro login

No primeiro login, um pop-up apresenta os três endpoints — OpenAI, Anthropic e Gemini — com botão de copiar em um clique. Acompanhado de uma animação festiva, dá um toque cerimonial à experiência do desenvolvedor.

🧠 Cache com afinidade de provedor

Ao alternar entre modelos diferentes, o gateway prioriza manter o usuário no mesmo provedor. A taxa de acerto do Prompt Cache sobe — respostas mais rápidas e custos menores.

🎟️ Sistema de códigos de convite Angel

Sistema completo de convites no ar: UI em cards, diálogo de adesão, tabela de histórico de uso. Recompensas bidirecionais e geração em um clique de pôster personalizado para compartilhar.


v1.0.20-20260206

🤖 Novos modelos

  • Claude Opus 4.6 (Anthropic) — novo flagship da Anthropic, elevando mais uma vez o teto de raciocínio e escrita

🌍 Alternância chinês/inglês em um clique

Mais de 1100 traduções; alternância integral entre chinês e inglês na plataforma toda. Um cookie guarda sua preferência de idioma.

🔍 Web Search cobrado por chamada

A ferramenta Web Search é cobrada com precisão nos três protocolos: OpenAI, Anthropic e Gemini.

📊 Dashboard renovado

  • A tela de login traz uma saudação personalizada por usuário, no lugar do “Hi” genérico
  • Estatísticas de uso passaram de visão diária para visão semanal
  • A exibição da API Key tem três modos: oculta, mascarada e em texto puro

💵 Exibição de preços otimizada

$0.6000 deixa de mostrar zeros no fim, virando $0.6. Mensagens de erro por saldo insuficiente passaram a usar formato em dólar — sem cálculo mental.

📚 Site de documentação oficialmente no ar


v1.0.1 ~ v1.0.9 · 2026-01-20 ~ 02-01 — As duas semanas de fundação

Nas duas semanas seguintes ao lançamento, não tiramos o pé. Cada release deixou a plataforma mais estável, mais precisa e mais fácil de integrar.

💻 Suporte oficial ao Claude Code

Nós mesmos usamos Claude Code para escrever código. Em 21 de janeiro, o gateway recebeu adaptação completa para o Claude Code — basta apontar o API Base para a OfoxAI, trocar a chave por uma sk-*** e todos os modelos Claude estão disponíveis.

🧠 Cadeia de raciocínio (Thinking)

Os blocos de thinking (o “processo de raciocínio” do modelo) do Claude e do Gemini funcionam de ponta a ponta nos três protocolos. Você não vê só o resultado, vê como o modelo está pensando.

🌐 Suporte nativo ao protocolo Gemini

Não é só compatibilidade com OpenAI — a API nativa do Gemini, generateContent, também roda. Os SDKs oficiais do Google se conectam direto, sem perdas de tradução.

💵 Pagamento Stripe multimoeda

Além do USD, foram adicionados CNY, SGD e outras moedas; o snapshot do câmbio é guardado junto com o pedido. Usuários da Ásia-Pacífico podem pagar na própria moeda.

🎯 Faturamento com 6 casas decimais

Atualização para precisão NanoDollar. Mesmo que uma chamada de API consuma alguns milésimos de centavo, ela é registrada e cobrada com fidelidade. Cliente grande não paga a mais; cliente pequeno não paga a menos.


v1.0.0 · 2026-01-16 — The Gateway Goes Live

“A partir de hoje, mais de 100 modelos, uma única Key.”

Este é o dia do lançamento oficial da plataforma OfoxAI .

🚀 Capacidades inaugurais

  • Compatibilidade nativa com três protocolosOpenAI, Anthropic e Gemini suportados diretamente; código existente entra sem alterações
  • Mais de 100 modelos unificadosClaude , GPT , Gemini , DeepSeek , Qwen  e mais cem outros, tudo com uma chave. Catálogo completo: Praça de modelos 
  • Roteamento inteligente — algoritmo no nível de Provider × Model que escolhe automaticamente o canal mais rápido e estável. Ver Provider Routing
  • Gestão self-service de API Keys — criação, ativação, desativação e acompanhamento de uso em um clique no Dashboard 
  • Pagamento por consumo, com 0% de taxa de plataforma — preço oficial dos modelos, direto. Consulta de preços: Pricing
  • Pagamento Stripe com cartão de crédito — recargas em tempo real e saldo consultável
  • Pontos de presença globais — Tóquio, Singapura, Frankfurt; roteamento pelo nó mais próximo

🌐 Infraestrutura subjacente

Não é proxy intermediário, é plataforma. As requisições passam pelo CDN edge e chegam direto a Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Cloud e outros provedores.


Day 1 · 2025-12-27 — How It Began

“Permitir que desenvolvedores acessem os modelos mais inteligentes do mundo da forma mais simples possível.”

🦊 A primeira linha de código

No final de 2025, um pequeno commit registrou a primeira linha de código da OfoxAI:

feat: initialize ofox-studio monorepo

⚡ O momento da virada

Três dias depois, conseguimos rodar simultaneamente o Claude sobre o AWS Bedrock e o GPT sobre o Azure — duas grandes nuvens, dois modelos de ponta, conexão direta sem intermediação.

Quando a primeira resposta dos dois caminhos saiu junta no terminal, a gente soube: isso é viável.

Não era uma adaptação nível demo, era multi-cloud direto de verdade. Em seguida vieram Google Cloud, Alibaba Cloud, Z.AI, Moonshot, Volcano Cloud — o posicionamento “não é proxy, é plataforma” já estava cravado desde o terceiro dia.

🌱 O Ponto de Partida

commit 0001

Uma linha de código, uma direção. Tornar a inteligência mais brilhante do mundo acessível a qualquer pessoa.

Motores, ignição.


Last updated on