Skip to Content
ChangelogChangelog

Journal des mises à jour

Chaque étape d’OfoxAI — nouveaux modèles, nouvelles fonctionnalités, nouvelles expériences. Mises à jour hebdomadaires.


v1.1.0-20260428

💰 Gestion des budgets — équipe / membre / clé API, trois dimensions

Faire passer la question « combien dépense-t-on ? » d’un accord verbal à une contrainte appliquée par le système. Une organisation peut désormais configurer simultanément des plafonds de consommation sur trois dimensions × trois périodes :

DimensionCas d’usage
Équipe (Organization)Budget global de l’entreprise / du projet
Membre (User)Quota mensuel d’un collaborateur
Clé APIBudget dédié à une application / un service

Chaque dimension peut être configurée indépendamment selon trois périodes — journalier / mensuel / cumulé — et tout dépassement entraîne le rejet automatique des requêtes.

La barre de progression affiche trois seuils d’alerte :

  • 🟢 40 % — utilisation normale
  • 🟡 80 % — approche du plafond
  • 🔴 110 % — dépassement (marge réservée pour absorber les pics de concurrence)

Les contraintes hiérarchiques sont vérifiées automatiquement : plafond clé API ≤ plafond membre ≤ plafond équipe. L’interface affiche en temps réel le quota du niveau parent pour éviter les erreurs de configuration.

Accès : Paramètres → Quotas 

⏱️ Quota RPM au niveau de l’équipe

Nouvelle limite de débit de requêtes par équipe (RPM), qui empêche à la racine que la multiplication des clés API ne sature les quotas du fournisseur en amont.

  • Le RPM est calculé de façon agrégée pour toute l’équipe, et non plus clé par clé
  • Valeur par défaut : 100 RPM. Pour un débit supérieur, contactez [email protected]
  • Les requêtes hors limite renvoient automatiquement un 429 Too Many Requests

Cas d’usage : pics de trafic CI/CD, sécurisation des traitements par lots, limitation unifiée pour les équipes multi-utilisateurs.

🪙 OpenAPI de consultation du solde

Nouveau point d’entrée GET /v1/user/balance : avec n’importe quelle clé API OfoxAI, vous pouvez consulter le solde disponible, le total crédité et le total débité du compte.

Terminal
curl https://api.ofox.ai/v1/user/balance \ -H "Authorization: Bearer $OFOX_API_KEY"

La structure de la réponse est compatible avec des outils tiers comme cc-switch  — utilisable directement comme fournisseur de solde.

🧰 Intégration cc-switch

OfoxAI est désormais nativement compatible avec cc-switch  — il suffit de basculer sur OfoxAI dans cc-switch pour voir l’état du solde en temps réel, sans aucun développement additionnel.

Configuration de la consultation du solde OfoxAI dans cc-switch

Configuration en quatre étapes :

  1. Ouvrir la configuration de consultation d’usage — cliquer sur l’icône 📊 en haut à droite de la carte fournisseur OfoxAI
  2. Activer la consultation d’usage — basculer l’interrupteur
  3. Renseigner la clé API — n’importe quelle clé API utilisateur OfoxAI convient (à créer depuis le Dashboard )
  4. Adresse de la requête — choisir « modèle générique » et saisir https://api.ofox.ai/v1

Une fois enregistrée, la carte fournisseur affiche immédiatement l’état du solde, par exemple Restant : 64,77 USD.

Étapes détaillées : Guide d’intégration cc-switch.


Nouveaux modèles · 2026-04-24

🤖 Nouveaux modèles

  • GPT-5.5 (OpenAI) — nouveau modèle phare pour les charges de travail professionnelles complexes, contexte de plus d’1M de tokens (922K en entrée / 128K en sortie), fiabilité du raisonnement et efficacité des tokens largement améliorées par rapport à GPT-5.4
  • DeepSeek V4 Pro (DeepSeek) — modèle phare MoE de 1,6T de paramètres totaux / 49B activés, contexte de 1M de tokens, optimisé pour le raisonnement avancé, le code et les workflows d’agents à long horizon
  • DeepSeek V4 Flash (DeepSeek) — version accélérée MoE, 284B de paramètres totaux / 13B activés, contexte de 1M de tokens, taillée pour le haut débit et la faible latence avec un rapport qualité-prix imbattable

Nouveaux modèles · 2026-04-21

🤖 Nouveaux modèles

  • Kimi K2.6 (Moonshot AI) — le Kimi le plus puissant à ce jour, mise à niveau complète sur le code, le raisonnement et la compréhension visuelle
  • GPT Image 2 (OpenAI) — nouvelle génération de modèle d’image, davantage de détails, fidélité accrue

Nouveaux modèles · 2026-04-16

🤖 Nouveaux modèles

  • Claude Opus 4.7 (Anthropic) — nouveau modèle phare d’Anthropic, raisonnement et écriture font un saut supplémentaire

Promotion · 2026-04-15

🎁 Cashback GPT d’avril, jusqu’à 250 $ offerts

  • Période — du 15 au 25 avril, 11 jours seulement
  • Cashback — 25 % de cashback sur toute la gamme GPT, 6 paliers au choix, jusqu’à 250 $ offerts
  • Crédit — le montant du cashback est valable à vie et activable en un clic à la fin de l’opération
  • Équipe — la consommation des membres est cumulée automatiquement, vous montez ensemble vers les paliers supérieurs

Page de l’opération : Cashback GPT d’avril .


v1.0.55-20260407

🎁 Système de cartes-cadeaux

Saisissez le code d’une carte-cadeau dans la page Portefeuille  et le solde est crédité instantanément. La façon la plus élégante d’offrir de l’IA à vos amis.

  • Protection de la vie privée — l’historique de transaction n’affiche que les quatre derniers chiffres du numéro
  • Sécurité renforcée — défenses anti-abus en plusieurs couches et chiffrement de bout en bout, chaque carte est protégée

🔍 Outil de vérification d’authenticité des modèles

D’abord un positionnement clair : OfoxAI n’est pas un revendeur intermédiaire.

  • Entité opérationnelle — NICE TALK PTE. LTD. (plateforme internationale de grands modèles)
  • Licences modèles — autorisation officielle des éditeurs de modèles
  • Infrastructure de calcul — fournie directement par Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Engine, etc.
  • Chaîne d’appel — CDN edge en lien direct avec les fournisseurs cloud, sans intermédiaire ni substitution

Pour permettre à chacun de vérifier l’authenticité des modèles servis par n’importe quelle passerelle LLM, nous avons publié un outil gratuit : saisissez l’API Base et la clé, et identifiez en un clic si le modèle a été remplacé.

Accès à l’outil : Vérification de modèle . Compatible avec toutes les plateformes, pas uniquement OfoxAI.


v1.0.54-20260403

💳 Mise à niveau des paiements et de la recharge

  • Nouveau canal de paiement Airwallex — une alternative à Stripe, paiement international plus fluide
  • Prise en charge USD / CNY / SGD — réglez dans la devise qui vous est familière
  • Plafond unitaire de recharge porté à 10 000 $ — les grands comptes ne sont plus bridés
  • 3 $ offerts à la première recharge via parrainage agent — les utilisateurs inscrits via un agent reçoivent automatiquement un bonus de 3 $ à leur premier rechargement

🏢 Page « Services Entreprise », plus vous consommez, plus vous économisez

Cashback automatique dès que la consommation mensuelle atteint le palier, sans demande, sans contact commercial, crédité au début du mois suivant.

PalierSeuil mensuelTaux de cashback
Bronze1 000 $+3 %
Silver5 000 $+4 %
Gold10 000 $+5 %
Platinum20 000 $+7 %

Capacités entreprise complémentaires :

  • 0 % de frais de plateforme — tarification officielle des modèles en accès direct
  • Nœuds d’accélération mondiaux — déploiement à Tokyo / Singapour / Francfort
  • SLA de disponibilité de 99,99 % — redondance multi-régions, basculement automatique
  • Zéro rétention de contenu — prompts et réponses ne sont par défaut ni journalisés ni utilisés pour l’entraînement

Détails : Services Entreprise .

🤖 Nouveaux modèles

  • GLM-5V-Turbo (Zhipu) — version Turbo accélérée de la série multimodale GLM
  • Qwen3.6 Plus (Alibaba Bailian) — la dernière déclinaison Plus de Qwen3.6

v1.0.47-20260327

🏷️ Un modèle, plusieurs noms

Donnez à vos modèles des alias courts ou conservez les anciens IDs : changement de plateforme sans coût de migration. Les alias prennent effet immédiatement, le routeur les reconnaît automatiquement.

Quelques exemples :

ID officielAlias disponibles
anthropic/claude-opus-4.7claude-opus-4.7 · claude-opus-4-7 · claude-opus-4-7-20260416
anthropic/claude-sonnet-4.6claude-sonnet-4.6 · claude-sonnet-4-6 · claude-sonnet-4-6-20260217
openai/gpt-5.4-progpt-5.4-pro
openai/gpt-5.4gpt-5.4
moonshotai/kimi-k2.6kimi-k2.6
z-ai/glm-5.1glm-5.1

La liste complète des alias est consultable via GET https://api.ofox.ai/v1/models, le champ aliases de la réponse est directement exploitable.

🖼️ Génération d’images facturée à l’unité

L’API d’image est désormais facturée par image générée, avec une tarification transparente. Les tailles standard sont automatiquement mappées vers les tailles natives de chaque fournisseur, votre code client n’a rien à modifier.

📊 Visualisation de l’usage d’images

La page d’accueil de la console, l’usage, les coûts et les classements proposent désormais une dimension « Image » : la consommation d’images du mois est visible d’un coup d’œil.

🤖 Nouveaux modèles

  • GLM 5.1 (Zhipu) — nouvelle génération de la série GLM, capacités générales globalement renforcées

🔗 Liens d’invitation plus courts

Les liens d’invitation passent d’une longue chaîne au format /x/votre-code : plus faciles à mémoriser, plus faciles à partager.


v1.0.39-20260320

🔄 Fallback de modèle — bascule automatique en cas de panne du modèle principal

Lorsque le modèle principal renvoie une erreur 4xx/5xx, la passerelle essaye automatiquement les modèles de secours configurés, jusqu’à 3 niveaux de filet de sécurité. Compatible avec les trois protocoles OpenAI / Anthropic / Gemini, sans modification du code client. Voir la documentation Fallback.

⚔️ OfoxAI vs OpenRouter, comparaison point par point

OpenRouter prélève 5,5 % de frais à chaque rechargement, OfoxAI 0 %. Avec une couverture identique de plus de 100 modèles, l’économie globale dépasse 10 % au-delà de 1 000 $ de consommation mensuelle. Comparatif complet : OfoxAI vs OpenRouter .

🤖 Nouveaux modèles

  • GLM-5-Turbo (Zhipu) — version Turbo accélérée de GLM-5
  • GPT-5.4 Mini / Nano (OpenAI) — duo léger de GPT-5.4, coût d’appel fortement réduit
  • MiniMax M2.7 / M2.7 Highspeed — nouvelle génération MiniMax, version Highspeed optimisée pour les usages à faible latence

v1.0.36-20260313

🎊 Cashback Claude de mars

20 % de cashback sur tous les paliers, code promo OFOXAI2603 copiable en un clic depuis la pop-up de l’opération.

RechargeCashbackReçu
20 $4 $24 $
50 $10 $60 $
100 $20 $120 $
200 $40 $240 $
500 $100 $600 $

Page de l’opération : Claude Spring acte 2 .

🤖 Nouveaux modèles

  • GPT-5.4 / GPT-5.4 Pro (OpenAI) — duo phare GPT-5.4, la version Pro offre un plafond de raisonnement plus élevé
  • Gemini Embedding 2 Preview (Google) — nouvelle génération de modèle vectoriel multimodal de Google

🖼️ Vectorisation, couverture multimodale complète

Gemini Embedding prend en charge quatre modalités : texte / image / audio / vidéo. Les vectorisations multimodales Qwen et Volcano Engine sont également disponibles en accès direct.

⚡ Données d’usage, mises à jour toutes les heures

L’agrégation d’usage passe d’un rafraîchissement quotidien à un rafraîchissement horaire : la consommation est rapidement visible dans le Dashboard après l’appel.

💰 Affichage des coupons amélioré

La liste des commandes affiche désormais en clair, pour chaque transaction, le montant de remise et le montant offert.


v1.0.32-20260303

🎉 Lancement de l’opération Claude de mars

Bannière promotionnelle et barre de progression de la consommation ajoutées sur le Dashboard, et localisation bilingue chinois / anglais pour tous les messages d’erreur des coupons. Page de l’opération : Claude Spring acte 1 .

🤖 Nouveaux modèles

  • GPT-5.3 Chat (OpenAI) — version optimisée conversation de GPT-5.3
  • Gemini 3.1 Flash Lite Preview (Google) — version preview légère de Gemini 3.1
  • Nano Banana 2 (Google) — Gemini 3.1 Flash Image Preview, nouvelle génération de modèle de génération d’images

🏷️ Refonte de la navigation


v1.0.30-20260226

🔒 Connexion en un clic via GitHub

Nouveau point d’entrée OAuth GitHub sur la page de connexion : inscription/connexion en un seul clic. Le système retient votre dernière méthode de connexion. La page Paramètres permet désormais de lier, délier et synchroniser l’avatar du compte GitHub.

🤖 Nouveaux modèles

📱 Mode responsive mobile

Les modules Utilisateurs, Organisations et Commandes de la console sont entièrement adaptés au mobile. La barre latérale est repliable, les tableaux se compactent intelligemment, l’expérience reste fluide sur petit écran.


v1.0.27-20260217

📊 Tableau de bord analytique

Trois graphiques interactifs : usage, coûts, requêtes. Tendances mensuelles, classement par modèle, filtres combinables sur Provider / Model / User / Clé API / plage de dates. Quel est votre modèle phare ? La réponse est sous vos yeux.

🤖 Nouveaux modèles

  • Claude Sonnet 4.6 (Anthropic) — nouvelle version de la série Sonnet, le choix du meilleur rapport qualité-prix
  • Qwen3.5 Plus (Alibaba Bailian) — la déclinaison Plus de Qwen3.5
  • Doubao Seed 2.0, quatre déclinaisons (Volcano) — Code  / Lite  / Mini  / Pro , série Doubao Seed 2.0 complète disponible

🌐 Comportement aligné sur OpenAI

Lorsque le paramètre stream n’est pas transmis, chat/completions est désormais non-streaming par défaut, exactement comme l’API OpenAI officielle. Aucun changement nécessaire dans votre code.


v1.0.24-20260212

🤖 Nouveaux modèles

  • GLM-5 (Zhipu) — nouveau modèle phare de la série GLM
  • MiniMax M2.5 / M2.5 Lightning — duo MiniMax, la version Lightning est optimisée pour la faible latence

🎊 Accueil à la première connexion

Lors de la toute première connexion, une fenêtre de bienvenue présente les trois endpoints API OpenAI / Anthropic / Gemini, copiables en un clic. Avec une animation de confettis, parce que les développeurs méritent un peu de cérémonie.

🧠 Cache d’affinité fournisseur

Lorsqu’un même utilisateur passe d’un modèle à un autre, la passerelle privilégie le même fournisseur. Le taux de hit du Prompt Cache augmente, les réponses sont plus rapides, le coût plus bas.

🎟️ Programme « Angel Invite »

Système d’invitation complet : interface en cartes, dialogue d’inscription, tableau d’historique d’utilisation. Mécanisme de récompense bidirectionnel, génération en un clic d’un poster de partage personnalisé.


v1.0.20-20260206

🤖 Nouveaux modèles

  • Claude Opus 4.6 (Anthropic) — nouveau modèle phare d’Anthropic, qui repousse de nouveau les limites de raisonnement et d’écriture

🌍 Bascule chinois / anglais en un clic

Plus de 1100 traductions : bilinguisme chinois / anglais sans rupture sur toute la plateforme. Vos préférences linguistiques sont mémorisées via cookie.

🔍 Web Search facturé à l’appel

Les invocations de l’outil Web Search sont désormais correctement facturées sur les trois protocoles OpenAI / Anthropic / Gemini.

📊 Refonte du Dashboard

  • Salutation personnalisée par nom d’utilisateur sur la page de connexion, en remplacement du « Hi » générique
  • Statistiques d’usage passées d’une vue par jour à une vue hebdomadaire
  • Affichage des clés API en trois modes commutables : entièrement masqué / masqué partiellement / en clair

💵 Affichage des prix amélioré

$0,6000 est automatiquement affiché $0,6 sans zéros superflus. Les messages d’erreur en cas de solde insuffisant utilisent désormais le format dollar, sans calcul mental nécessaire.

📚 Lancement officiel du site de documentation


v1.0.1 ~ v1.0.9 · 2026-01-20 ~ 02-01 — deux semaines à poser les fondations

Au cours des deux premières semaines suivant le lancement, nous n’avons pas relâché la cadence. Chaque release a rendu la plateforme plus stable, plus précise, plus facile à intégrer.

💻 Adaptation officielle Claude Code

Nous codons nous-mêmes avec Claude Code. Le 21 janvier, la passerelle a été pleinement adaptée à Claude Code — il suffit de pointer l’API Base sur OfoxAI, de remplacer la clé sk-***, et tous les modèles Claude sont immédiatement utilisables.

🧠 Chaînes de raisonnement « Thinking »

Les blocs thinking (le « processus de réflexion » du modèle) de Claude et Gemini sont désormais traversés sans perte sur l’ensemble des protocoles. Vous voyez comment le modèle pense, pas seulement le résultat.

🌐 Support natif du protocole Gemini

Pas seulement le mode compatible OpenAI — l’API native Gemini generateContent est également opérationnelle. Le SDK officiel de Google se connecte directement, sans perte de transcodage.

💵 Paiement Stripe multi-devises

Outre l’USD, de nouvelles entrées ont été ajoutées pour CNY / SGD et autres devises, avec un instantané du taux de change conservé pour chaque commande. Les utilisateurs Asie-Pacifique peuvent régler directement dans leur monnaie locale.

🎯 Facturation à 6 décimales

Mise à niveau de précision au niveau du NanoDollar. Même quand un appel API ne consomme que quelques millicents, tout est enregistré et facturé fidèlement. Les grands comptes ne sont pas lésés, les petits non plus.


v1.0.0 · 2026-01-16 — The Gateway Goes Live

« À partir d’aujourd’hui, 100+ modèles, une seule clé. »

Le jour du lancement officiel de la plateforme OfoxAI .

🚀 Capacités du premier jour

  • Compatibilité native sur trois protocolesOpenAI / Anthropic / Gemini sont supportés directement, votre code existant s’intègre sans aucune modification
  • Plus de 100 modèles unifiésClaude , GPT , Gemini , DeepSeek , Qwen  et plus d’une centaine d’autres, accessibles via une seule clé. Catalogue complet : Galerie de modèles 
  • Routage intelligent — algorithme de routage à granularité Provider × Model, choisit automatiquement le canal le plus rapide et le plus stable. Voir Provider Routing
  • Gestion en libre-service des clés API — créez, suspendez, suivez l’usage en un clic depuis le Dashboard 
  • Facturation à l’usage, 0 % de frais de plateforme — tarification officielle des modèles en accès direct. Consultation : Pricing
  • Paiement par carte via Stripe — recharge créditée en temps réel, solde consultable
  • Nœuds edge mondiaux — déploiement à Tokyo / Singapour / Francfort, routage au plus près

🌐 Infrastructure sous-jacente

Pas un revendeur, une plateforme. Les requêtes traversent le CDN edge pour atteindre directement les fournisseurs cloud Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Engine.


Day 1 · 2025-12-27 — How It Began

« Permettre aux développeurs d’appeler les modèles les plus intelligents du monde, de la manière la plus simple. »

🦊 La toute première ligne de code

Fin 2025, un petit commit grave la première ligne de code d’OfoxAI :

feat: initialize ofox-studio monorepo

⚡ Le moment d’évidence

Trois jours plus tard, nous faisons fonctionner simultanément Claude sur AWS Bedrock et GPT sur Azure — deux grands cloud, deux modèles de premier plan, en accès direct, sans intermédiaire.

Quand les deux premières réponses s’affichent au même instant dans le terminal, nous savons : c’est faisable.

Ce n’est pas une adaptation de niveau démo, c’est un véritable accès direct multi-cloud. Google Cloud, Alibaba Cloud, Z.AI, Moonshot, Volcano Engine viendront ensuite — le positionnement « pas un revendeur, une plateforme » est acté dès le Day 3.

🌱 Point de départ

commit 0001

Une ligne de code, une direction. Rendre l’intelligence la plus brillante du monde accessible à tous.

Allumage des moteurs.


Last updated on