Journal des mises à jour
Chaque étape d’OfoxAI — nouveaux modèles, nouvelles fonctionnalités, nouvelles expériences. Mises à jour hebdomadaires.
v1.1.0-20260428
💰 Gestion des budgets — équipe / membre / clé API, trois dimensions
Faire passer la question « combien dépense-t-on ? » d’un accord verbal à une contrainte appliquée par le système. Une organisation peut désormais configurer simultanément des plafonds de consommation sur trois dimensions × trois périodes :
| Dimension | Cas d’usage |
|---|---|
| Équipe (Organization) | Budget global de l’entreprise / du projet |
| Membre (User) | Quota mensuel d’un collaborateur |
| Clé API | Budget dédié à une application / un service |
Chaque dimension peut être configurée indépendamment selon trois périodes — journalier / mensuel / cumulé — et tout dépassement entraîne le rejet automatique des requêtes.
La barre de progression affiche trois seuils d’alerte :
- 🟢 40 % — utilisation normale
- 🟡 80 % — approche du plafond
- 🔴 110 % — dépassement (marge réservée pour absorber les pics de concurrence)
Les contraintes hiérarchiques sont vérifiées automatiquement : plafond clé API ≤ plafond membre ≤ plafond équipe. L’interface affiche en temps réel le quota du niveau parent pour éviter les erreurs de configuration.
Accès : Paramètres → Quotas
⏱️ Quota RPM au niveau de l’équipe
Nouvelle limite de débit de requêtes par équipe (RPM), qui empêche à la racine que la multiplication des clés API ne sature les quotas du fournisseur en amont.
- Le RPM est calculé de façon agrégée pour toute l’équipe, et non plus clé par clé
- Valeur par défaut : 100 RPM. Pour un débit supérieur, contactez [email protected]
- Les requêtes hors limite renvoient automatiquement un
429 Too Many Requests
Cas d’usage : pics de trafic CI/CD, sécurisation des traitements par lots, limitation unifiée pour les équipes multi-utilisateurs.
🪙 OpenAPI de consultation du solde
Nouveau point d’entrée GET /v1/user/balance : avec n’importe quelle clé API OfoxAI, vous pouvez consulter le solde disponible, le total crédité et le total débité du compte.
curl https://api.ofox.ai/v1/user/balance \
-H "Authorization: Bearer $OFOX_API_KEY"La structure de la réponse est compatible avec des outils tiers comme cc-switch — utilisable directement comme fournisseur de solde.
🧰 Intégration cc-switch
OfoxAI est désormais nativement compatible avec cc-switch — il suffit de basculer sur OfoxAI dans cc-switch pour voir l’état du solde en temps réel, sans aucun développement additionnel.

Configuration en quatre étapes :
- Ouvrir la configuration de consultation d’usage — cliquer sur l’icône 📊 en haut à droite de la carte fournisseur OfoxAI
- Activer la consultation d’usage — basculer l’interrupteur
- Renseigner la clé API — n’importe quelle clé API utilisateur OfoxAI convient (à créer depuis le Dashboard )
- Adresse de la requête — choisir « modèle générique » et saisir
https://api.ofox.ai/v1
Une fois enregistrée, la carte fournisseur affiche immédiatement l’état du solde, par exemple Restant : 64,77 USD.
Étapes détaillées : Guide d’intégration cc-switch.
Nouveaux modèles · 2026-04-24
🤖 Nouveaux modèles
- GPT-5.5 (OpenAI) — nouveau modèle phare pour les charges de travail professionnelles complexes, contexte de plus d’1M de tokens (922K en entrée / 128K en sortie), fiabilité du raisonnement et efficacité des tokens largement améliorées par rapport à GPT-5.4
- DeepSeek V4 Pro (DeepSeek) — modèle phare MoE de 1,6T de paramètres totaux / 49B activés, contexte de 1M de tokens, optimisé pour le raisonnement avancé, le code et les workflows d’agents à long horizon
- DeepSeek V4 Flash (DeepSeek) — version accélérée MoE, 284B de paramètres totaux / 13B activés, contexte de 1M de tokens, taillée pour le haut débit et la faible latence avec un rapport qualité-prix imbattable
Nouveaux modèles · 2026-04-21
🤖 Nouveaux modèles
- Kimi K2.6 (Moonshot AI) — le Kimi le plus puissant à ce jour, mise à niveau complète sur le code, le raisonnement et la compréhension visuelle
- GPT Image 2 (OpenAI) — nouvelle génération de modèle d’image, davantage de détails, fidélité accrue
Nouveaux modèles · 2026-04-16
🤖 Nouveaux modèles
- Claude Opus 4.7 (Anthropic) — nouveau modèle phare d’Anthropic, raisonnement et écriture font un saut supplémentaire
Promotion · 2026-04-15
🎁 Cashback GPT d’avril, jusqu’à 250 $ offerts
- Période — du 15 au 25 avril, 11 jours seulement
- Cashback — 25 % de cashback sur toute la gamme GPT, 6 paliers au choix, jusqu’à 250 $ offerts
- Crédit — le montant du cashback est valable à vie et activable en un clic à la fin de l’opération
- Équipe — la consommation des membres est cumulée automatiquement, vous montez ensemble vers les paliers supérieurs
Page de l’opération : Cashback GPT d’avril .
v1.0.55-20260407
🎁 Système de cartes-cadeaux
Saisissez le code d’une carte-cadeau dans la page Portefeuille et le solde est crédité instantanément. La façon la plus élégante d’offrir de l’IA à vos amis.
- Protection de la vie privée — l’historique de transaction n’affiche que les quatre derniers chiffres du numéro
- Sécurité renforcée — défenses anti-abus en plusieurs couches et chiffrement de bout en bout, chaque carte est protégée
🔍 Outil de vérification d’authenticité des modèles
D’abord un positionnement clair : OfoxAI n’est pas un revendeur intermédiaire.
- Entité opérationnelle — NICE TALK PTE. LTD. (plateforme internationale de grands modèles)
- Licences modèles — autorisation officielle des éditeurs de modèles
- Infrastructure de calcul — fournie directement par Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Engine, etc.
- Chaîne d’appel — CDN edge en lien direct avec les fournisseurs cloud, sans intermédiaire ni substitution
Pour permettre à chacun de vérifier l’authenticité des modèles servis par n’importe quelle passerelle LLM, nous avons publié un outil gratuit : saisissez l’API Base et la clé, et identifiez en un clic si le modèle a été remplacé.
Accès à l’outil : Vérification de modèle . Compatible avec toutes les plateformes, pas uniquement OfoxAI.
v1.0.54-20260403
💳 Mise à niveau des paiements et de la recharge
- Nouveau canal de paiement Airwallex — une alternative à Stripe, paiement international plus fluide
- Prise en charge USD / CNY / SGD — réglez dans la devise qui vous est familière
- Plafond unitaire de recharge porté à 10 000 $ — les grands comptes ne sont plus bridés
- 3 $ offerts à la première recharge via parrainage agent — les utilisateurs inscrits via un agent reçoivent automatiquement un bonus de 3 $ à leur premier rechargement
🏢 Page « Services Entreprise », plus vous consommez, plus vous économisez
Cashback automatique dès que la consommation mensuelle atteint le palier, sans demande, sans contact commercial, crédité au début du mois suivant.
| Palier | Seuil mensuel | Taux de cashback |
|---|---|---|
| Bronze | 1 000 $+ | 3 % |
| Silver | 5 000 $+ | 4 % |
| Gold | 10 000 $+ | 5 % |
| Platinum | 20 000 $+ | 7 % |
Capacités entreprise complémentaires :
- 0 % de frais de plateforme — tarification officielle des modèles en accès direct
- Nœuds d’accélération mondiaux — déploiement à Tokyo / Singapour / Francfort
- SLA de disponibilité de 99,99 % — redondance multi-régions, basculement automatique
- Zéro rétention de contenu — prompts et réponses ne sont par défaut ni journalisés ni utilisés pour l’entraînement
Détails : Services Entreprise .
🤖 Nouveaux modèles
- GLM-5V-Turbo (Zhipu) — version Turbo accélérée de la série multimodale GLM
- Qwen3.6 Plus (Alibaba Bailian) — la dernière déclinaison Plus de Qwen3.6
v1.0.47-20260327
🏷️ Un modèle, plusieurs noms
Donnez à vos modèles des alias courts ou conservez les anciens IDs : changement de plateforme sans coût de migration. Les alias prennent effet immédiatement, le routeur les reconnaît automatiquement.
Quelques exemples :
| ID officiel | Alias disponibles |
|---|---|
anthropic/claude-opus-4.7 | claude-opus-4.7 · claude-opus-4-7 · claude-opus-4-7-20260416 |
anthropic/claude-sonnet-4.6 | claude-sonnet-4.6 · claude-sonnet-4-6 · claude-sonnet-4-6-20260217 |
openai/gpt-5.4-pro | gpt-5.4-pro |
openai/gpt-5.4 | gpt-5.4 |
moonshotai/kimi-k2.6 | kimi-k2.6 |
z-ai/glm-5.1 | glm-5.1 |
La liste complète des alias est consultable via GET https://api.ofox.ai/v1/models, le champ aliases de la réponse est directement exploitable.
🖼️ Génération d’images facturée à l’unité
L’API d’image est désormais facturée par image générée, avec une tarification transparente. Les tailles standard sont automatiquement mappées vers les tailles natives de chaque fournisseur, votre code client n’a rien à modifier.
📊 Visualisation de l’usage d’images
La page d’accueil de la console, l’usage, les coûts et les classements proposent désormais une dimension « Image » : la consommation d’images du mois est visible d’un coup d’œil.
🤖 Nouveaux modèles
- GLM 5.1 (Zhipu) — nouvelle génération de la série GLM, capacités générales globalement renforcées
🔗 Liens d’invitation plus courts
Les liens d’invitation passent d’une longue chaîne au format /x/votre-code : plus faciles à mémoriser, plus faciles à partager.
v1.0.39-20260320
🔄 Fallback de modèle — bascule automatique en cas de panne du modèle principal
Lorsque le modèle principal renvoie une erreur 4xx/5xx, la passerelle essaye automatiquement les modèles de secours configurés, jusqu’à 3 niveaux de filet de sécurité. Compatible avec les trois protocoles OpenAI / Anthropic / Gemini, sans modification du code client. Voir la documentation Fallback.
⚔️ OfoxAI vs OpenRouter, comparaison point par point
OpenRouter prélève 5,5 % de frais à chaque rechargement, OfoxAI 0 %. Avec une couverture identique de plus de 100 modèles, l’économie globale dépasse 10 % au-delà de 1 000 $ de consommation mensuelle. Comparatif complet : OfoxAI vs OpenRouter .
🤖 Nouveaux modèles
- GLM-5-Turbo (Zhipu) — version Turbo accélérée de GLM-5
- GPT-5.4 Mini / Nano (OpenAI) — duo léger de GPT-5.4, coût d’appel fortement réduit
- MiniMax M2.7 / M2.7 Highspeed — nouvelle génération MiniMax, version Highspeed optimisée pour les usages à faible latence
v1.0.36-20260313
🎊 Cashback Claude de mars
20 % de cashback sur tous les paliers, code promo OFOXAI2603 copiable en un clic depuis la pop-up de l’opération.
| Recharge | Cashback | Reçu |
|---|---|---|
| 20 $ | 4 $ | 24 $ |
| 50 $ | 10 $ | 60 $ |
| 100 $ | 20 $ | 120 $ |
| 200 $ | 40 $ | 240 $ |
| 500 $ | 100 $ | 600 $ |
Page de l’opération : Claude Spring acte 2 .
🤖 Nouveaux modèles
- GPT-5.4 / GPT-5.4 Pro (OpenAI) — duo phare GPT-5.4, la version Pro offre un plafond de raisonnement plus élevé
- Gemini Embedding 2 Preview (Google) — nouvelle génération de modèle vectoriel multimodal de Google
🖼️ Vectorisation, couverture multimodale complète
Gemini Embedding prend en charge quatre modalités : texte / image / audio / vidéo. Les vectorisations multimodales Qwen et Volcano Engine sont également disponibles en accès direct.
⚡ Données d’usage, mises à jour toutes les heures
L’agrégation d’usage passe d’un rafraîchissement quotidien à un rafraîchissement horaire : la consommation est rapidement visible dans le Dashboard après l’appel.
💰 Affichage des coupons amélioré
La liste des commandes affiche désormais en clair, pour chaque transaction, le montant de remise et le montant offert.
v1.0.32-20260303
🎉 Lancement de l’opération Claude de mars
Bannière promotionnelle et barre de progression de la consommation ajoutées sur le Dashboard, et localisation bilingue chinois / anglais pour tous les messages d’erreur des coupons. Page de l’opération : Claude Spring acte 1 .
🤖 Nouveaux modèles
- GPT-5.3 Chat (OpenAI) — version optimisée conversation de GPT-5.3
- Gemini 3.1 Flash Lite Preview (Google) — version preview légère de Gemini 3.1
- Nano Banana 2 (Google) — Gemini 3.1 Flash Image Preview, nouvelle génération de modèle de génération d’images
🏷️ Refonte de la navigation
- « Mes factures » → « Mon portefeuille », plus en phase avec l’usage réel
- « Modèles » → « Galerie de modèles », pour mettre en avant la navigation par catalogue
- Nouvelle entrée Blog dans le header
v1.0.30-20260226
🔒 Connexion en un clic via GitHub
Nouveau point d’entrée OAuth GitHub sur la page de connexion : inscription/connexion en un seul clic. Le système retient votre dernière méthode de connexion. La page Paramètres permet désormais de lier, délier et synchroniser l’avatar du compte GitHub.
🤖 Nouveaux modèles
- Toute la famille Qwen3.5, cinq modèles d’un coup (Alibaba Bailian) — Flash / 27B / 35B A3B / 122B A10B / 397B A17B
- GPT-5.3 Codex (OpenAI) — modèle GPT-5.3 dédié au code
- Gemini 3.1 Pro Preview (Google) — version preview de Gemini 3.1 Pro
- Qwen3 Coder Next (Alibaba Bailian) — nouveau modèle Qwen dédié au code
📱 Mode responsive mobile
Les modules Utilisateurs, Organisations et Commandes de la console sont entièrement adaptés au mobile. La barre latérale est repliable, les tableaux se compactent intelligemment, l’expérience reste fluide sur petit écran.
v1.0.27-20260217
📊 Tableau de bord analytique
Trois graphiques interactifs : usage, coûts, requêtes. Tendances mensuelles, classement par modèle, filtres combinables sur Provider / Model / User / Clé API / plage de dates. Quel est votre modèle phare ? La réponse est sous vos yeux.
🤖 Nouveaux modèles
- Claude Sonnet 4.6 (Anthropic) — nouvelle version de la série Sonnet, le choix du meilleur rapport qualité-prix
- Qwen3.5 Plus (Alibaba Bailian) — la déclinaison Plus de Qwen3.5
- Doubao Seed 2.0, quatre déclinaisons (Volcano) — Code / Lite / Mini / Pro , série Doubao Seed 2.0 complète disponible
🌐 Comportement aligné sur OpenAI
Lorsque le paramètre stream n’est pas transmis, chat/completions est désormais non-streaming par défaut, exactement comme l’API OpenAI officielle. Aucun changement nécessaire dans votre code.
v1.0.24-20260212
🤖 Nouveaux modèles
- GLM-5 (Zhipu) — nouveau modèle phare de la série GLM
- MiniMax M2.5 / M2.5 Lightning — duo MiniMax, la version Lightning est optimisée pour la faible latence
🎊 Accueil à la première connexion
Lors de la toute première connexion, une fenêtre de bienvenue présente les trois endpoints API OpenAI / Anthropic / Gemini, copiables en un clic. Avec une animation de confettis, parce que les développeurs méritent un peu de cérémonie.
🧠 Cache d’affinité fournisseur
Lorsqu’un même utilisateur passe d’un modèle à un autre, la passerelle privilégie le même fournisseur. Le taux de hit du Prompt Cache augmente, les réponses sont plus rapides, le coût plus bas.
🎟️ Programme « Angel Invite »
Système d’invitation complet : interface en cartes, dialogue d’inscription, tableau d’historique d’utilisation. Mécanisme de récompense bidirectionnel, génération en un clic d’un poster de partage personnalisé.
v1.0.20-20260206
🤖 Nouveaux modèles
- Claude Opus 4.6 (Anthropic) — nouveau modèle phare d’Anthropic, qui repousse de nouveau les limites de raisonnement et d’écriture
🌍 Bascule chinois / anglais en un clic
Plus de 1100 traductions : bilinguisme chinois / anglais sans rupture sur toute la plateforme. Vos préférences linguistiques sont mémorisées via cookie.
🔍 Web Search facturé à l’appel
Les invocations de l’outil Web Search sont désormais correctement facturées sur les trois protocoles OpenAI / Anthropic / Gemini.
📊 Refonte du Dashboard
- Salutation personnalisée par nom d’utilisateur sur la page de connexion, en remplacement du « Hi » générique
- Statistiques d’usage passées d’une vue par jour à une vue hebdomadaire
- Affichage des clés API en trois modes commutables : entièrement masqué / masqué partiellement / en clair
💵 Affichage des prix amélioré
$0,6000 est automatiquement affiché $0,6 sans zéros superflus. Les messages d’erreur en cas de solde insuffisant utilisent désormais le format dollar, sans calcul mental nécessaire.
📚 Lancement officiel du site de documentation
- Référence complète des protocoles OpenAI / Anthropic / Gemini
- Plus de 10 guides d’intégration : Claude Code, Codex, Gemini CLI, Zed, Cline, Cherry Studio, OpenClaw, OpenCode et plus, de la configuration au premier appel réussi
v1.0.1 ~ v1.0.9 · 2026-01-20 ~ 02-01 — deux semaines à poser les fondations
Au cours des deux premières semaines suivant le lancement, nous n’avons pas relâché la cadence. Chaque release a rendu la plateforme plus stable, plus précise, plus facile à intégrer.
💻 Adaptation officielle Claude Code
Nous codons nous-mêmes avec Claude Code. Le 21 janvier, la passerelle a été pleinement adaptée à Claude Code — il suffit de pointer l’API Base sur OfoxAI, de remplacer la clé sk-***, et tous les modèles Claude sont immédiatement utilisables.
🧠 Chaînes de raisonnement « Thinking »
Les blocs thinking (le « processus de réflexion » du modèle) de Claude et Gemini sont désormais traversés sans perte sur l’ensemble des protocoles. Vous voyez comment le modèle pense, pas seulement le résultat.
🌐 Support natif du protocole Gemini
Pas seulement le mode compatible OpenAI — l’API native Gemini generateContent est également opérationnelle. Le SDK officiel de Google se connecte directement, sans perte de transcodage.
💵 Paiement Stripe multi-devises
Outre l’USD, de nouvelles entrées ont été ajoutées pour CNY / SGD et autres devises, avec un instantané du taux de change conservé pour chaque commande. Les utilisateurs Asie-Pacifique peuvent régler directement dans leur monnaie locale.
🎯 Facturation à 6 décimales
Mise à niveau de précision au niveau du NanoDollar. Même quand un appel API ne consomme que quelques millicents, tout est enregistré et facturé fidèlement. Les grands comptes ne sont pas lésés, les petits non plus.
v1.0.0 · 2026-01-16 — The Gateway Goes Live
« À partir d’aujourd’hui, 100+ modèles, une seule clé. »
Le jour du lancement officiel de la plateforme OfoxAI .
🚀 Capacités du premier jour
- Compatibilité native sur trois protocoles — OpenAI / Anthropic / Gemini sont supportés directement, votre code existant s’intègre sans aucune modification
- Plus de 100 modèles unifiés — Claude , GPT , Gemini , DeepSeek , Qwen et plus d’une centaine d’autres, accessibles via une seule clé. Catalogue complet : Galerie de modèles
- Routage intelligent — algorithme de routage à granularité Provider × Model, choisit automatiquement le canal le plus rapide et le plus stable. Voir Provider Routing
- Gestion en libre-service des clés API — créez, suspendez, suivez l’usage en un clic depuis le Dashboard
- Facturation à l’usage, 0 % de frais de plateforme — tarification officielle des modèles en accès direct. Consultation : Pricing
- Paiement par carte via Stripe — recharge créditée en temps réel, solde consultable
- Nœuds edge mondiaux — déploiement à Tokyo / Singapour / Francfort, routage au plus près
🌐 Infrastructure sous-jacente
Pas un revendeur, une plateforme. Les requêtes traversent le CDN edge pour atteindre directement les fournisseurs cloud Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Engine.
Day 1 · 2025-12-27 — How It Began
« Permettre aux développeurs d’appeler les modèles les plus intelligents du monde, de la manière la plus simple. »
🦊 La toute première ligne de code
Fin 2025, un petit commit grave la première ligne de code d’OfoxAI :
feat: initialize ofox-studio monorepo⚡ Le moment d’évidence
Trois jours plus tard, nous faisons fonctionner simultanément Claude sur AWS Bedrock et GPT sur Azure — deux grands cloud, deux modèles de premier plan, en accès direct, sans intermédiaire.
Quand les deux premières réponses s’affichent au même instant dans le terminal, nous savons : c’est faisable.
Ce n’est pas une adaptation de niveau démo, c’est un véritable accès direct multi-cloud. Google Cloud, Alibaba Cloud, Z.AI, Moonshot, Volcano Engine viendront ensuite — le positionnement « pas un revendeur, une plateforme » est acté dès le Day 3.
🌱 Point de départ
commit 0001
Une ligne de code, une direction. Rendre l’intelligence la plus brillante du monde accessible à tous.
Allumage des moteurs.