Registro de cambios
Cada paso de OfoxAI: nuevos modelos, nuevas funciones, nuevas experiencias. Publicaciones semanales.
v1.1.0-20260428
💰 Gestión de presupuestos — Equipo / Miembro / API Key en tres dimensiones
Convertimos el “cuánto se gasta” de un acuerdo verbal en una restricción dura del sistema. Una organización puede configurar simultáneamente tres dimensiones × tres ciclos de límites de gasto:
| Dimensión | Caso de uso |
|---|---|
| Equipo (Organization) | Presupuesto global de la empresa o proyecto |
| Miembro (User) | Cuota mensual por empleado |
| API Key | Presupuesto independiente por aplicación o servicio |
Cada dimensión admite tres ciclos: diario / mensual / acumulado. Las solicitudes que excedan el límite se rechazan automáticamente.
La barra de progreso muestra tres niveles de alerta:
- 🟢 40% — Consumo normal
- 🟡 80% — Cerca del límite
- 🔴 110% — Excedido (margen reservado para evitar rupturas instantáneas en alta concurrencia)
Las restricciones jerárquicas se validan automáticamente: límite de API Key ≤ límite de Miembro ≤ límite de Equipo. La interfaz muestra en tiempo real la cuota del nivel superior para evitar configuraciones incorrectas.
Acceso: Configuración → Cuotas
⏱️ Cuota de RPM a nivel de equipo
Añadimos un límite de tasa de solicitudes (RPM) a nivel de equipo para evitar de raíz que múltiples API Keys juntas saturen las cuotas de los proveedores upstream.
- El RPM se calcula de forma agregada para todo el equipo, no por API Key individual
- Por defecto 100 RPM; si necesitas más, contacta con [email protected]
- Las solicitudes que excedan el límite reciben automáticamente
429 Too Many Requests
Casos de uso: picos de tráfico en CI/CD, control de procesos por lotes, limitación unificada para equipos de varias personas.
🪙 OpenAPI de consulta de saldo
Añadimos GET /v1/user/balance: con cualquier API Key de OfoxAI puedes consultar el saldo disponible, el total acumulado de ingresos y el total acumulado de gastos.
curl https://api.ofox.ai/v1/user/balance \
-H "Authorization: Bearer $OFOX_API_KEY"La estructura de la respuesta es compatible con herramientas de terceros como cc-switch , por lo que puede usarse directamente como proveedor de saldo.
🧰 Integración nativa con cc-switch
OfoxAI ya es nativamente compatible con cc-switch : al cambiar a OfoxAI dentro de cc-switch verás el estado de saldo en tiempo real, sin desarrollo adicional.

Configuración en cuatro pasos:
- Abrir la configuración de consulta de uso — Haz clic en el icono 📊 de la esquina superior derecha de la tarjeta del proveedor OfoxAI
- Activar la consulta de uso — Pulsa el interruptor
- Introducir la API Key — Cualquier API Key de usuario de OfoxAI sirve (créala en el Dashboard )
- URL de la solicitud — Selecciona “Plantilla genérica” e introduce
https://api.ofox.ai/v1
Tras guardar, la tarjeta del proveedor mostrará al instante estados como Restante: 64.77 USD.
Pasos detallados de integración: Guía de integración con cc-switch.
Nuevos modelos · 2026-04-24
🤖 Nuevos modelos
- GPT-5.5 (OpenAI) — Nuevo buque insignia para cargas de trabajo profesionales complejas, con contexto de 1M+ tokens (922K de entrada / 128K de salida); mejora integral en fiabilidad de razonamiento y eficiencia de tokens frente a GPT-5.4
- DeepSeek V4 Pro (DeepSeek) — MoE insignia con 1.6T de parámetros totales / 49B activos, contexto de 1M tokens, optimizado para razonamiento avanzado, código y workflows de agente de larga duración
- DeepSeek V4 Flash (DeepSeek) — Versión acelerada MoE con 284B totales / 13B activos, contexto de 1M tokens; alto throughput y baja latencia con una relación calidad-precio insuperable
Nuevos modelos · 2026-04-21
🤖 Nuevos modelos
- Kimi K2.6 (Moonshot AI) — El Kimi más potente hasta la fecha, con mejoras integrales en código, razonamiento y comprensión visual
- GPT Image 2 (OpenAI) — Nueva generación de modelo de imagen, con mayor riqueza de detalle y mejor fidelidad
Nuevos modelos · 2026-04-16
🤖 Nuevos modelos
- Claude Opus 4.7 (Anthropic) — Nuevo buque insignia de Anthropic; razonamiento y escritura suben otro escalón
Promoción · 2026-04-15
🎁 Bono de consumo de GPT en abril, hasta $250
- Fechas — Del 15 al 25 de abril, 11 días por tiempo limitado
- Bonificación — 25% de devolución sobre el consumo de toda la familia GPT, 6 niveles a elegir, hasta $250 de regalo
- Acreditación — El crédito bonificado no caduca; al finalizar la promoción se canjea con un clic
- Equipo — El consumo de los miembros se suma automáticamente para alcanzar niveles más altos
Página de la promoción: Bono GPT de abril .
v1.0.55-20260407
🎁 Sistema de tarjetas de regalo
Introduce el código de tu tarjeta regalo en la página de la cartera y el saldo se acreditará al instante. La forma más elegante de regalar IA a un amigo.
- Privacidad — Los registros de transacción solo muestran los últimos cuatro dígitos del código
- Seguridad — Múltiples capas antiabuso y cifrado de extremo a extremo, cada tarjeta protegida
🔍 Herramienta de verificación de modelos
Lo decimos sin ambigüedad: OfoxAI no es un revendedor.
- Entidad operadora — NICE TALK PTE. LTD. (plataforma internacional de modelos grandes)
- Licenciamiento de modelos — Autorización oficial de los proveedores de modelos
- Infraestructura de cómputo — Suministrada directamente por Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcengine
- Ruta de invocación — CDN de borde conectado directamente al proveedor cloud, sin intermediarios ni sustituciones
Para que cualquier usuario pueda verificar la autenticidad de los modelos en cualquier gateway LLM, lanzamos una herramienta gratuita: introduce API Base + Key y comprueba con un clic si el modelo ha sido sustituido.
Acceso a la herramienta: Verificación de modelos . Compatible con cualquier plataforma, no solo OfoxAI.
v1.0.54-20260403
💳 Mejoras en pagos y recargas
- Nuevo canal de pago Airwallex — Una alternativa a Stripe; pagos internacionales más fluidos
- Soporte de USD / CNY / SGD — Liquida en la moneda con la que estés cómodo
- Límite de recarga única elevado a $10,000 — Sin restricciones para grandes clientes
- Bonus de $3 en la primera recarga vía agente — Los usuarios registrados mediante invitación de un agente reciben automáticamente $3 extra en su primera recarga
🏢 Página Enterprise: cuanto más usas, más ahorras
Bonificación automática al alcanzar el consumo mensual: sin solicitudes, sin trámites, acreditada a comienzos del mes siguiente.
| Nivel | Consumo mensual mínimo | Bonificación |
|---|---|---|
| Bronze | $1,000+ | 3% |
| Silver | $5,000+ | 4% |
| Gold | $10,000+ | 5% |
| Platinum | $20,000+ | 7% |
Capacidades de nivel empresarial incluidas:
- 0% de comisión de plataforma — Acceso directo a la tarifa oficial del modelo
- Nodos de aceleración globales — Tokio / Singapur / Frankfurt y más
- SLA de 99.99% de disponibilidad — Redundancia multirregión y failover automático
- Cero retención de contenido — Por defecto los prompts y las respuestas no se registran ni se usan para entrenamiento
Detalles: Servicios Enterprise .
🤖 Nuevos modelos
- GLM-5V-Turbo (Zhipu) — Versión Turbo acelerada de la familia multimodal GLM
- Qwen3.6 Plus (Alibaba Bailian) — Última especificación Plus de Qwen3.6
v1.0.47-20260327
🏷️ Un modelo, varios alias
Asigna nombres cortos a los modelos y conserva los IDs antiguos: cambiar de plataforma sale gratis. Los alias son inmediatos y el enrutamiento los reconoce automáticamente.
Algunos ejemplos:
| ID oficial | Alias disponibles |
|---|---|
anthropic/claude-opus-4.7 | claude-opus-4.7 · claude-opus-4-7 · claude-opus-4-7-20260416 |
anthropic/claude-sonnet-4.6 | claude-sonnet-4.6 · claude-sonnet-4-6 · claude-sonnet-4-6-20260217 |
openai/gpt-5.4-pro | gpt-5.4-pro |
openai/gpt-5.4 | gpt-5.4 |
moonshotai/kimi-k2.6 | kimi-k2.6 |
z-ai/glm-5.1 | glm-5.1 |
Consulta la lista completa de alias en GET https://api.ofox.ai/v1/models; el campo aliases de la respuesta es directamente utilizable.
🖼️ Facturación de imágenes por unidad
La API de imágenes pasa a facturarse por número de imágenes generadas, con precio transparente por unidad. Los tamaños estándar se mapean automáticamente a los tamaños nativos de cada proveedor: cero cambios en tu cliente.
📊 Visualización del consumo de imágenes
La pantalla de inicio del panel, así como las secciones de uso, costes y rankings, incorporan la dimensión “Imagen”: el consumo mensual de imágenes se ve de un vistazo.
🤖 Nuevos modelos
- GLM 5.1 (Zhipu) — La siguiente generación de la serie GLM, con capacidades generales mejoradas en todos los frentes
🔗 Enlaces de invitación más cortos
Los enlaces de invitación pasan de cadenas largas a /x/tu-código: más fáciles de recordar, más fáciles de compartir.
v1.0.39-20260320
🔄 Fallback de modelos: conmutación automática ante fallo del modelo principal
Cuando el modelo principal devuelve errores 4xx/5xx, el gateway prueba automáticamente los modelos de respaldo que hayas configurado, hasta tres niveles de protección. Compatible con los tres protocolos OpenAI / Anthropic / Gemini, sin tocar el código del cliente. Más detalles en la documentación de Fallback.
⚔️ OfoxAI vs OpenRouter, punto por punto
OpenRouter cobra un 5.5% de comisión en cada recarga; OfoxAI cobra un 0%. Con la misma cobertura de 100+ modelos, los clientes con más de $1,000 de consumo mensual ahorran más de un 10% en costes totales. Comparativa completa: OfoxAI vs OpenRouter .
🤖 Nuevos modelos
- GLM-5-Turbo (Zhipu) — Versión Turbo acelerada de GLM-5
- GPT-5.4 Mini / Nano (OpenAI) — Dos variantes ligeras de GPT-5.4 con un coste de invocación mucho menor
- MiniMax M2.7 / M2.7 Highspeed — Nueva generación de MiniMax; la versión Highspeed está optimizada para escenarios de baja latencia
v1.0.36-20260313
🎊 Bono de Claude en marzo
20% de devolución en todos los niveles. El pop-up de la promoción permite copiar el código OFOXAI2603 con un clic.
| Recarga | Bono | Total recibido |
|---|---|---|
| $20 | $4 | $24 |
| $50 | $10 | $60 |
| $100 | $20 | $120 |
| $200 | $40 | $240 |
| $500 | $100 | $600 |
Página de la promoción: Claude Spring Round 2 .
🤖 Nuevos modelos
- GPT-5.4 / GPT-5.4 Pro (OpenAI) — Las dos variantes insignia de GPT-5.4; la versión Pro ofrece un mayor techo de razonamiento
- Gemini Embedding 2 Preview (Google) — La próxima generación del modelo multimodal de embeddings de Google
🖼️ Embeddings, multimodalidad completa
Gemini Embedding admite las cuatro modalidades: texto / imagen / audio / vídeo. Los embeddings multimodales de Qwen y Volcengine también se conectan directamente.
⚡ Datos de uso, actualizados cada hora
La agregación de uso pasa de una vez al día a una vez por hora: el consumo se ve en el Dashboard poco después de producirse.
💰 Mejoras en la visualización de cupones
La lista de pedidos muestra de forma completa el descuento y el bono asociados a cada pedido.
v1.0.32-20260303
🎉 Promoción Claude de marzo
El Dashboard incorpora un banner de promoción con barra de progreso de consumo, y los mensajes de error de cupones están totalmente localizados en chino e inglés. Página de la promoción: Claude Spring Round 1 .
🤖 Nuevos modelos
- GPT-5.3 Chat (OpenAI) — Versión de GPT-5.3 optimizada para conversación
- Gemini 3.1 Flash Lite Preview (Google) — Vista previa ligera de Gemini 3.1
- Nano Banana 2 (Google) — Gemini 3.1 Flash Image Preview, nuevo modelo de generación de imágenes
🏷️ Renovación de la navegación
- “Mis facturas” → “Mi cartera”, más acorde con el uso real
- “Modelos” → “Plaza de modelos”, enfatiza la navegación tipo catálogo
- Nueva entrada Blog en el header
v1.0.30-20260226
🔒 Inicio de sesión con un clic mediante GitHub
La página de login añade entrada con OAuth de GitHub: registro/login en un clic. El sistema recuerda el último método utilizado. La página de configuración permite vincular y desvincular la cuenta de GitHub y sincronizar el avatar.
🤖 Nuevos modelos
- Familia Qwen3.5 al completo, cinco modelos a la vez (Alibaba Bailian) — Flash / 27B / 35B A3B / 122B A10B / 397B A17B
- GPT-5.3 Codex (OpenAI) — Modelo de GPT-5.3 especializado en código
- Gemini 3.1 Pro Preview (Google) — Vista previa de Gemini 3.1 Pro
- Qwen3 Coder Next (Alibaba Bailian) — Nuevo modelo de Qwen especializado en código
📱 Diseño responsive en móvil
Los módulos de usuario, organización y pedidos del panel se adaptan completamente al móvil. La barra lateral se pliega, las tablas se reorganizan inteligentemente y la experiencia en pantallas pequeñas es fluida.
v1.0.27-20260217
📊 Dashboard de analítica
Tres gráficos interactivos: uso, coste y solicitudes. Tendencia mensual, ranking por modelo, filtros por Provider / Model / User / API Key / rango de fechas en cualquier combinación. ¿Cuál es tu modelo principal? Lo ves de un vistazo.
🤖 Nuevos modelos
- Claude Sonnet 4.6 (Anthropic) — Nueva versión de la serie Sonnet, la mejor relación calidad-precio
- Qwen3.5 Plus (Alibaba Bailian) — Especificación Plus de Qwen3.5 disponible
- Doubao Seed 2.0 en cuatro variantes (Volcengine) — Code / Lite / Mini / Pro ; la familia Doubao Seed 2.0 al completo
🌐 Comportamiento alineado con OpenAI
chat/completions adopta por defecto el modo no-streaming cuando no se pasa stream, idéntico al comportamiento oficial de OpenAI. Tu código no necesita ningún cambio.
v1.0.24-20260212
🤖 Nuevos modelos
- GLM-5 (Zhipu) — Nueva generación insignia de la serie GLM
- MiniMax M2.5 / M2.5 Lightning — Dos variantes de MiniMax; la versión Lightning está optimizada para baja latencia
🎊 Bienvenida en el primer login
En el primer inicio de sesión, un pop-up de bienvenida muestra los tres endpoints OpenAI / Anthropic / Gemini con copia en un clic. Acompañado de una animación de confeti, una pequeña ceremonia para los desarrolladores.
🧠 Caché con afinidad de proveedor
Cuando un mismo usuario alterna entre modelos, el gateway prioriza el mismo proveedor. La tasa de aciertos en Prompt Cache mejora, las respuestas son más rápidas y el coste, menor.
🎟️ Sistema de códigos de invitación Angel
Sistema completo de códigos de invitación: UI tipo tarjeta, diálogo de unión y tabla de registro de uso. Mecánica de recompensa bidireccional y póster personalizado generado con un clic.
v1.0.20-20260206
🤖 Nuevos modelos
- Claude Opus 4.6 (Anthropic) — Nuevo buque insignia de Anthropic; vuelve a elevar el techo de razonamiento y escritura
🌍 Cambio entre chino e inglés con un clic
Más de 1100 cadenas traducidas; cambio chino/inglés sin fricción en toda la plataforma. La preferencia de idioma se guarda en una cookie.
🔍 Web Search facturado por uso
Las llamadas a la herramienta Web Search en los tres protocolos OpenAI / Anthropic / Gemini se facturan con precisión.
📊 Renovación del Dashboard
- La página de inicio personaliza el saludo con el nombre del usuario, sustituyendo al genérico “Hi”
- Las estadísticas de uso pasan de vista diaria a vista semanal
- Visualización de API Key con tres modos conmutables: oculta / parcialmente enmascarada / texto plano
💵 Mejor formato de precios
$0.6000 se muestra automáticamente como $0.6 (sin ceros finales). Los mensajes de error de saldo insuficiente usan formato en dólares, sin necesidad de hacer cálculos mentales.
📚 Sitio de documentación oficial
- Referencia completa de los protocolos OpenAI / Anthropic / Gemini
- Más de 10 guías de integración con herramientas: Claude Code, Codex, Gemini CLI, Zed, Cline, Cherry Studio, OpenClaw, OpenCode, entre otras; cobertura completa de la configuración a la primera ejecución
v1.0.1 ~ v1.0.9 · 2026-01-20 ~ 02-01 — Las dos semanas de cimientos
En las dos primeras semanas tras el lanzamiento no nos detuvimos. Cada release dejó la plataforma más estable, más precisa y más fácil de integrar.
💻 Adaptación oficial para Claude Code
Nosotros mismos usamos Claude Code para escribir código. El 21 de enero, el gateway recibió una adaptación completa para Claude Code: apunta el API Base a OfoxAI, sustituye la sk-*** Key, y todos los modelos Claude están operativos al instante.
🧠 Cadenas de razonamiento (Thinking)
Los thinking blocks (el “proceso de razonamiento” del modelo) de Claude y Gemini se transmiten íntegros entre protocolos. Ves cómo razona el modelo, no solo el resultado.
🌐 Soporte nativo del protocolo Gemini
No solo el modo de compatibilidad con OpenAI: la API nativa generateContent de Gemini también funciona. Los SDK oficiales de Google se conectan directamente, sin pérdidas por transducción.
💵 Pago Stripe en múltiples divisas
Además de USD, añadimos entradas en CNY / SGD y otras divisas; la cotización se guarda con cada pedido. Los usuarios de Asia-Pacífico pueden liquidar directamente en su moneda local.
🎯 Facturación con precisión de 6 decimales
Actualización a precisión de NanoDollar. Aunque una llamada a la API consuma solo unas milimillonésimas de dólar, queda registrada y facturada con exactitud. Los grandes clientes no pierden y los pequeños tampoco.
v1.0.0 · 2026-01-16 — The Gateway Goes Live
“Desde hoy, 100+ modelos, una sola Key.”
Este es el día del lanzamiento público de la plataforma OfoxAI .
🚀 Capacidades de la plataforma en el lanzamiento
- Compatibilidad nativa con tres protocolos — Soporte directo de OpenAI / Anthropic / Gemini; integra tu código actual sin tocar nada
- 100+ modelos unificados — Claude , GPT , Gemini , DeepSeek , Qwen y muchos más, con una sola Key. Catálogo completo: Plaza de modelos
- Enrutamiento inteligente — Algoritmo a granularidad Provider × Model que elige automáticamente el canal más rápido y estable. Detalles en Provider Routing
- Gestión autoservicio de API Keys — En el Dashboard , crear, activar/desactivar y rastrear el uso con un clic
- Pago por uso, 0% de comisión de plataforma — Acceso directo a los precios oficiales de los modelos. Consulta de precios: Pricing
- Pago con tarjeta de crédito vía Stripe — Recargas instantáneas, saldo consultable
- Nodos de borde globales — Tokio / Singapur / Frankfurt y otros, con enrutamiento al más cercano
🌐 Infraestructura subyacente
No es un revendedor, es una plataforma. Las solicitudes pasan por el CDN de borde directamente a Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcengine.
Day 1 · 2025-12-27 — How It Began
“Que los desarrolladores accedan al modelo más inteligente del mundo de la forma más sencilla.”
🦊 La primera línea de código
A finales de 2025, un pequeño commit dejó plasmada la primera línea de código de OfoxAI:
feat: initialize ofox-studio monorepo⚡ El momento eureka
Tres días más tarde, conseguimos que Claude sobre AWS Bedrock y GPT sobre Azure funcionaran en paralelo: dos clouds, dos modelos punteros, conexión directa sin intermediarios.
Cuando las primeras respuestas de ambas rutas se imprimieron simultáneamente en la terminal, lo supimos: esto sí se puede hacer.
No era una adaptación a nivel demo, sino verdadera conexión multicloud directa. Después se sumaron Google Cloud, Alibaba Cloud, Z.AI, Moonshot y Volcengine: el posicionamiento “no somos revendedores, somos plataforma” quedó establecido desde el Día 3.
🌱 El punto de partida
commit 0001
Una línea de código, una dirección. Hacer que la inteligencia más brillante del mundo esté al alcance de todos.
Motores, encender.