Changelog
Cada passo da OfoxAI — novos modelos, novos recursos, novas experiências. Atualizado toda semana.
v1.1.0-20260428
💰 Gestão de Orçamento — Equipe / Membro / API Key em três dimensões
Transformamos o “quanto se pode gastar” de combinado verbal em restrição forte do sistema. Cada organização pode configurar simultaneamente limites de consumo em três dimensões × três períodos:
| Dimensão | Caso de uso |
|---|---|
| Equipe (Organization) | Orçamento total da empresa/projeto |
| Membro (User) | Cota mensal por colaborador |
| API Key | Orçamento independente por aplicação / serviço |
Cada dimensão pode ter limites configurados em três períodos: diário / mensal / acumulado. Requisições que ultrapassam o limite são rejeitadas automaticamente.
A barra de progresso traz três níveis de alerta:
- 🟢 40% — uso normal
- 🟡 80% — próximo do limite
- 🔴 110% — excedido (margem reservada para evitar estouro instantâneo em alta concorrência)
A validação hierárquica é automática: limite da API Key ≤ limite do membro ≤ limite da equipe. O frontend mostra a cota do nível superior em tempo real para evitar configurações inconsistentes.
Acesso: Configurações → Cotas
⏱️ RPM no nível da equipe
Adicionamos o limite de taxa de requisições no nível da equipe (RPM), evitando na raiz que múltiplas API Keys somadas estourem a cota dos provedores upstream.
- O RPM é calculado de forma agregada para toda a equipe, não mais por chave individual
- Padrão de 100 RPM; para taxas mais altas, fale com [email protected]
- Requisições acima do limite recebem automaticamente
429 Too Many Requests
Casos de uso: picos de tráfego em CI/CD, controle de jobs em batch e limite unificado para times com muitos colaboradores.
🪙 OpenAPI de consulta de saldo
Novo endpoint GET /v1/user/balance: com qualquer API Key da OfoxAI você consulta o saldo disponível, total de entradas e total de débitos da conta.
curl https://api.ofox.ai/v1/user/balance \
-H "Authorization: Bearer $OFOX_API_KEY"A estrutura da resposta é compatível com ferramentas de terceiros como o cc-switch , podendo ser usada diretamente como provedor de saldo.
🧰 Suporte nativo ao cc-switch
A OfoxAI agora é compatível nativamente com o cc-switch — basta selecionar a OfoxAI no cc-switch para visualizar o saldo em tempo real, sem nenhum desenvolvimento adicional.

Configuração em quatro passos:
- Abrir as configurações de consulta de uso — clique no ícone 📊 no canto superior direito do card do provedor OfoxAI
- Ativar a consulta de uso — ligue o switch
- Informar a API Key — qualquer API Key de usuário da OfoxAI serve (crie no Dashboard )
- Endereço da requisição — selecione “Modelo genérico” e use
https://api.ofox.ai/v1
Após salvar, o card do provedor mostra imediatamente o saldo, por exemplo Restante: 64,77 USD.
Passo a passo completo: Guia de integração do cc-switch.
Novos modelos · 2026-04-24
🤖 Novos modelos
- GPT-5.5 (OpenAI) — novo carro-chefe para cargas de trabalho profissionais complexas, com contexto de mais de 1M tokens (922K entrada / 128K saída) e ganhos consistentes de confiabilidade de raciocínio e eficiência de tokens em relação ao GPT-5.4
- DeepSeek V4 Pro (DeepSeek) — flagship MoE com 1,6T de parâmetros totais e 49B ativos, contexto de 1M tokens, otimizado para raciocínio avançado, código e workflows de Agente de longa duração
- DeepSeek V4 Flash (DeepSeek) — versão acelerada MoE com 284B de parâmetros totais e 13B ativos, contexto de 1M tokens, focada em alto throughput, baixa latência e excelente custo-benefício
Novos modelos · 2026-04-21
🤖 Novos modelos
- Kimi K2.6 (Moonshot AI) — o Kimi mais poderoso até hoje, com avanços em código, raciocínio e compreensão visual
- GPT Image 2 (OpenAI) — nova geração de modelo de imagem, com mais detalhe e fidelidade
Novos modelos · 2026-04-16
🤖 Novos modelos
- Claude Opus 4.7 (Anthropic) — novo flagship da Anthropic, com mais um salto em raciocínio e escrita
Promoção · 2026-04-15
🎁 Cashback de abril em GPT — até $250 de bônus
- Período — de 15 a 25 de abril, 11 dias
- Cashback — 25% de retorno em todo o consumo da família GPT, com 6 faixas e até $250 de bônus
- Crédito — o bônus é vitalício e pode ser resgatado em um clique após o término da promoção
- Para times — o consumo dos membros é somado automaticamente, ajudando a alcançar faixas mais altas em conjunto
Página da campanha: Cashback de abril em GPT .
v1.0.55-20260407
🎁 Sistema de gift cards no ar
Na página da carteira , basta inserir o código do gift card e o saldo cai instantaneamente. A forma mais elegante de presentear alguém com IA.
- Privacidade — o histórico de transações exibe apenas os quatro últimos dígitos do código
- Segurança — múltiplas camadas anti-abuso e criptografia ponta a ponta protegem cada cartão
🔍 Ferramenta de verificação de modelos no ar
Vamos ao ponto: a OfoxAI não é um proxy intermediário.
- Operadora — NICE TALK PTE. LTD. (plataforma internacional de modelos de fundação)
- Licenciamento dos modelos — autorizado oficialmente pelos fornecedores
- Infraestrutura — fornecida diretamente por Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Cloud, entre outros provedores
- Caminho da requisição — CDN edge conectado direto aos provedores, sem intermediação ou substituição
Para que qualquer usuário possa verificar a autenticidade dos modelos em qualquer LLM gateway, lançamos uma ferramenta gratuita: informe API Base + Key e descubra em um clique se o modelo foi substituído.
Acesse: Verificação de modelos . Funciona em qualquer plataforma, não só OfoxAI.
v1.0.54-20260403
💳 Pagamentos e recargas aprimorados
- Novo gateway Airwallex — uma alternativa ao Stripe, com pagamentos internacionais mais fluidos
- Suporte a USD / CNY / SGD — pague na moeda que você usa no dia a dia
- Limite por recarga aumentado para $10.000 — clientes maiores não ficam mais limitados
- Bônus de $3 na primeira recarga via indicação de parceiro — usuários trazidos por parceiros recebem $3 automaticamente na primeira recarga
🏢 Página enterprise no ar — quanto mais você usa, mais economiza
Atinge o consumo mínimo no mês e o cashback é automático. Nada de pedir, nada de tickets — chega na sua conta no início do mês seguinte.
| Faixa | Consumo mínimo mensal | Cashback |
|---|---|---|
| Bronze | $1.000+ | 3% |
| Silver | $5.000+ | 4% |
| Gold | $10.000+ | 5% |
| Platinum | $20.000+ | 7% |
Recursos enterprise empilhados:
- 0% de taxa da plataforma — preço oficial dos modelos passado direto
- Aceleração global — pontos de presença em Tóquio, Singapura e Frankfurt
- SLA de 99,99% de disponibilidade — redundância multirregional e failover automático
- Zero retenção de conteúdo — prompts e respostas não são armazenados nem usados em treinamento
Detalhes: Serviços enterprise .
🤖 Novos modelos
- GLM-5V-Turbo (Zhipu) — versão Turbo da família multimodal GLM
- Qwen3.6 Plus (Alibaba Bailian) — a mais nova revisão Plus do Qwen3.6
v1.0.47-20260327
🏷️ Um modelo, várias formas de chamar
Crie atalhos curtos, mantenha IDs antigos e troque de plataforma sem migração. O alias funciona na hora — o roteador reconhece automaticamente.
Alguns exemplos:
| ID oficial | Aliases disponíveis |
|---|---|
anthropic/claude-opus-4.7 | claude-opus-4.7 · claude-opus-4-7 · claude-opus-4-7-20260416 |
anthropic/claude-sonnet-4.6 | claude-sonnet-4.6 · claude-sonnet-4-6 · claude-sonnet-4-6-20260217 |
openai/gpt-5.4-pro | gpt-5.4-pro |
openai/gpt-5.4 | gpt-5.4 |
moonshotai/kimi-k2.6 | kimi-k2.6 |
z-ai/glm-5.1 | glm-5.1 |
A lista completa de aliases pode ser consultada em GET https://api.ofox.ai/v1/models — o campo aliases da resposta já vem pronto para uso.
🖼️ Geração de imagem cobrada por imagem
A API de imagem agora cobra pelo número de imagens geradas, com preço transparente por imagem. Tamanhos padronizados são mapeados automaticamente para os tamanhos nativos de cada provedor — zero alteração no código do cliente.
📊 Visualização de uso de imagem
A página inicial do console, além das telas de uso, custos e ranking, ganharam a dimensão de “Imagens”, para acompanhar o consumo mensal num relance.
🤖 Novos modelos
- GLM 5.1 (Zhipu) — próxima geração da família GLM, com upgrade geral nas capacidades
🔗 Links de convite mais curtos
Os links de convite passaram a ser /x/seu-código — mais fáceis de lembrar e compartilhar.
v1.0.39-20260320
🔄 Fallback de modelos — troca automática quando o principal falha
Quando o modelo principal retorna erros 4xx/5xx, o gateway tenta automaticamente os modelos de backup configurados, com até 3 níveis de proteção. Funciona com OpenAI, Anthropic e Gemini, sem alterar o código do cliente. Detalhes: documentação de Fallback.
⚔️ OfoxAI vs OpenRouter, item por item
O OpenRouter cobra 5,5% de taxa em cada recarga; a OfoxAI cobra 0%. Com a mesma cobertura de mais de 100 modelos, quem consome acima de $1.000/mês pode economizar mais de 10% no custo total. Comparativo completo: OfoxAI vs OpenRouter .
🤖 Novos modelos
- GLM-5-Turbo (Zhipu) — versão Turbo do GLM-5
- GPT-5.4 Mini / Nano (OpenAI) — duas versões leves do GPT-5.4 com forte redução de custo
- MiniMax M2.7 / M2.7 Highspeed — nova geração da MiniMax; a versão Highspeed é otimizada para baixíssima latência
v1.0.36-20260313
🎊 Cashback Claude de março
20% de cashback em todas as faixas; o pop-up da campanha copia o cupom OFOXAI2603 em um clique.
| Recarga | Bônus | Total recebido |
|---|---|---|
| $20 | $4 | $24 |
| $50 | $10 | $60 |
| $100 | $20 | $120 |
| $200 | $40 | $240 |
| $500 | $100 | $600 |
Página da campanha: Claude Spring 2ª onda .
🤖 Novos modelos
- GPT-5.4 / GPT-5.4 Pro (OpenAI) — duas versões do novo flagship GPT-5.4; a Pro entrega teto maior de raciocínio
- Gemini Embedding 2 Preview (Google) — próxima geração de modelo de embedding multimodal do Google
🖼️ Embeddings com cobertura multimodal
O Gemini Embedding agora aceita as quatro modalidades — texto, imagem, áudio e vídeo. Os modelos de embedding multimodal da Qwen e Volcano também estão integrados diretamente.
⚡ Dados de uso atualizados a cada hora
A agregação de uso passou de uma vez ao dia para uma vez por hora. Logo após o consumo já é possível visualizar no Dashboard.
💰 Cupons exibidos com mais clareza
A lista de pedidos passou a mostrar de forma completa o desconto e o bônus aplicados em cada transação.
v1.0.32-20260303
🎉 Promoção Claude de março no ar
O Dashboard ganhou um banner de campanha e uma barra de progresso de consumo; mensagens de erro de cupom foram totalmente localizadas em chinês e inglês. Página da campanha: Claude Spring 1ª onda .
🤖 Novos modelos
- GPT-5.3 Chat (OpenAI) — versão do GPT-5.3 otimizada para conversação
- Gemini 3.1 Flash Lite Preview (Google) — preview leve do Gemini 3.1
- Nano Banana 2 (Google) — Gemini 3.1 Flash Image Preview, nova geração de geração de imagem
🏷️ Navegação renovada
- “Minha conta” → “Minha carteira”, nome mais fiel ao uso
- “Modelos” → “Praça de modelos”, reforçando o catálogo navegável
- O cabeçalho ganhou um link para o Blog
v1.0.30-20260226
🔒 Login com GitHub em um clique
A tela de login passou a oferecer OAuth do GitHub para cadastro/login imediato. O sistema lembra o último método utilizado. Em Configurações é possível vincular, desvincular e sincronizar avatar da conta GitHub.
🤖 Novos modelos
- Família Qwen3.5 completa, cinco modelos lançados juntos (Alibaba Bailian) — Flash / 27B / 35B A3B / 122B A10B / 397B A17B
- GPT-5.3 Codex (OpenAI) — variante do GPT-5.3 dedicada a código
- Gemini 3.1 Pro Preview (Google) — preview do Gemini 3.1 Pro
- Qwen3 Coder Next (Alibaba Bailian) — novo modelo da Qwen dedicado a código
📱 Console responsivo no mobile
Os módulos de usuários, organizações e pedidos do console passaram a ser totalmente adaptados ao mobile. Sidebar com colapso, tabelas que se ajustam de forma inteligente e fluidez em telas pequenas.
v1.0.27-20260217
📊 Painel analítico
Três gráficos interativos de uso, custo e requisições. Tendências mensais, ranking por modelo, filtros combinando Provider, Model, User, API Key e período. Qual é o seu modelo principal? Resposta de bate-pronto.
🤖 Novos modelos
- Claude Sonnet 4.6 (Anthropic) — nova versão da família Sonnet, equilíbrio entre custo e desempenho
- Qwen3.5 Plus (Alibaba Bailian) — versão Plus do Qwen3.5
- Doubao Seed 2.0 em quatro versões (Volcano) — Code / Lite / Mini / Pro , a família completa Doubao Seed 2.0 disponível ao mesmo tempo
🌐 Comportamento alinhado à OpenAI
Em chat/completions, quando stream não é informado, o padrão é não-streaming — exatamente como na OpenAI oficial. Seu código não precisa mudar nada.
v1.0.24-20260212
🤖 Novos modelos
- GLM-5 (Zhipu) — novo flagship da família GLM
- MiniMax M2.5 / M2.5 Lightning — duas versões da MiniMax; a Lightning é otimizada para baixa latência
🎊 Boas-vindas no primeiro login
No primeiro login, um pop-up apresenta os três endpoints — OpenAI, Anthropic e Gemini — com botão de copiar em um clique. Acompanhado de uma animação festiva, dá um toque cerimonial à experiência do desenvolvedor.
🧠 Cache com afinidade de provedor
Ao alternar entre modelos diferentes, o gateway prioriza manter o usuário no mesmo provedor. A taxa de acerto do Prompt Cache sobe — respostas mais rápidas e custos menores.
🎟️ Sistema de códigos de convite Angel
Sistema completo de convites no ar: UI em cards, diálogo de adesão, tabela de histórico de uso. Recompensas bidirecionais e geração em um clique de pôster personalizado para compartilhar.
v1.0.20-20260206
🤖 Novos modelos
- Claude Opus 4.6 (Anthropic) — novo flagship da Anthropic, elevando mais uma vez o teto de raciocínio e escrita
🌍 Alternância chinês/inglês em um clique
Mais de 1100 traduções; alternância integral entre chinês e inglês na plataforma toda. Um cookie guarda sua preferência de idioma.
🔍 Web Search cobrado por chamada
A ferramenta Web Search é cobrada com precisão nos três protocolos: OpenAI, Anthropic e Gemini.
📊 Dashboard renovado
- A tela de login traz uma saudação personalizada por usuário, no lugar do “Hi” genérico
- Estatísticas de uso passaram de visão diária para visão semanal
- A exibição da API Key tem três modos: oculta, mascarada e em texto puro
💵 Exibição de preços otimizada
$0.6000 deixa de mostrar zeros no fim, virando $0.6. Mensagens de erro por saldo insuficiente passaram a usar formato em dólar — sem cálculo mental.
📚 Site de documentação oficialmente no ar
- Referências completas dos protocolos OpenAI, Anthropic e Gemini
- Mais de 10 guias de integração de ferramentas: Claude Code, Codex, Gemini CLI, Zed, Cline, Cherry Studio, OpenClaw, OpenCode e mais — da configuração até a primeira chamada bem-sucedida
v1.0.1 ~ v1.0.9 · 2026-01-20 ~ 02-01 — As duas semanas de fundação
Nas duas semanas seguintes ao lançamento, não tiramos o pé. Cada release deixou a plataforma mais estável, mais precisa e mais fácil de integrar.
💻 Suporte oficial ao Claude Code
Nós mesmos usamos Claude Code para escrever código. Em 21 de janeiro, o gateway recebeu adaptação completa para o Claude Code — basta apontar o API Base para a OfoxAI, trocar a chave por uma sk-*** e todos os modelos Claude estão disponíveis.
🧠 Cadeia de raciocínio (Thinking)
Os blocos de thinking (o “processo de raciocínio” do modelo) do Claude e do Gemini funcionam de ponta a ponta nos três protocolos. Você não vê só o resultado, vê como o modelo está pensando.
🌐 Suporte nativo ao protocolo Gemini
Não é só compatibilidade com OpenAI — a API nativa do Gemini, generateContent, também roda. Os SDKs oficiais do Google se conectam direto, sem perdas de tradução.
💵 Pagamento Stripe multimoeda
Além do USD, foram adicionados CNY, SGD e outras moedas; o snapshot do câmbio é guardado junto com o pedido. Usuários da Ásia-Pacífico podem pagar na própria moeda.
🎯 Faturamento com 6 casas decimais
Atualização para precisão NanoDollar. Mesmo que uma chamada de API consuma alguns milésimos de centavo, ela é registrada e cobrada com fidelidade. Cliente grande não paga a mais; cliente pequeno não paga a menos.
v1.0.0 · 2026-01-16 — The Gateway Goes Live
“A partir de hoje, mais de 100 modelos, uma única Key.”
Este é o dia do lançamento oficial da plataforma OfoxAI .
🚀 Capacidades inaugurais
- Compatibilidade nativa com três protocolos — OpenAI, Anthropic e Gemini suportados diretamente; código existente entra sem alterações
- Mais de 100 modelos unificados — Claude , GPT , Gemini , DeepSeek , Qwen e mais cem outros, tudo com uma chave. Catálogo completo: Praça de modelos
- Roteamento inteligente — algoritmo no nível de Provider × Model que escolhe automaticamente o canal mais rápido e estável. Ver Provider Routing
- Gestão self-service de API Keys — criação, ativação, desativação e acompanhamento de uso em um clique no Dashboard
- Pagamento por consumo, com 0% de taxa de plataforma — preço oficial dos modelos, direto. Consulta de preços: Pricing
- Pagamento Stripe com cartão de crédito — recargas em tempo real e saldo consultável
- Pontos de presença globais — Tóquio, Singapura, Frankfurt; roteamento pelo nó mais próximo
🌐 Infraestrutura subjacente
Não é proxy intermediário, é plataforma. As requisições passam pelo CDN edge e chegam direto a Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Cloud e outros provedores.
Day 1 · 2025-12-27 — How It Began
“Permitir que desenvolvedores acessem os modelos mais inteligentes do mundo da forma mais simples possível.”
🦊 A primeira linha de código
No final de 2025, um pequeno commit registrou a primeira linha de código da OfoxAI:
feat: initialize ofox-studio monorepo⚡ O momento da virada
Três dias depois, conseguimos rodar simultaneamente o Claude sobre o AWS Bedrock e o GPT sobre o Azure — duas grandes nuvens, dois modelos de ponta, conexão direta sem intermediação.
Quando a primeira resposta dos dois caminhos saiu junta no terminal, a gente soube: isso é viável.
Não era uma adaptação nível demo, era multi-cloud direto de verdade. Em seguida vieram Google Cloud, Alibaba Cloud, Z.AI, Moonshot, Volcano Cloud — o posicionamento “não é proxy, é plataforma” já estava cravado desde o terceiro dia.
🌱 O Ponto de Partida
commit 0001
Uma linha de código, uma direção. Tornar a inteligência mais brilhante do mundo acessível a qualquer pessoa.
Motores, ignição.