Changelog
Jeder Schritt von OfoxAI — neue Modelle, neue Funktionen, neue Erlebnisse. Wöchentliche Updates.
v1.1.0-20260428
💰 Budget-Verwaltung — Team / Mitglied / API-Key in drei Dimensionen
Aus mündlichen Absprachen werden harte System-Limits. Eine Organisation kann gleichzeitig drei Dimensionen × drei Zeiträume an Ausgabenobergrenzen konfigurieren:
| Dimension | Anwendungsfall |
|---|---|
| Team (Organization) | Gesamtbudget für Unternehmen oder Projekt |
| Mitglied (User) | Monatliches Kontingent pro Mitarbeiter |
| API-Key | Eigenständiges Budget pro Anwendung oder Service |
Jede Dimension lässt sich separat mit täglichen / monatlichen / kumulierten Obergrenzen versehen. Bei Überschreitung werden Anfragen automatisch abgelehnt.
Die Fortschrittsanzeige warnt in drei Stufen:
- 🟢 40% — normaler Verbrauch
- 🟡 80% — Annäherung an die Obergrenze
- 🔴 110% — überschritten (Puffer eingebaut, um plötzliche Spitzen bei hoher Parallelität abzufangen)
Hierarchische Constraints werden automatisch geprüft: API-Key-Limit ≤ Mitglieder-Limit ≤ Team-Limit. Das Frontend zeigt das übergeordnete Kontingent in Echtzeit an, damit Fehlkonfigurationen vermieden werden.
Einstieg: Einstellungen → Kontingente
⏱️ Team-weite RPM-Kontingente
Neu hinzugekommen ist das team-weite Rate-Limit (RPM), das verhindert, dass mehrere API-Keys zusammen die Quota des Upstream-Anbieters sprengen.
- RPM wird über das gesamte Team aggregiert berechnet, nicht mehr je Key
- Standardmäßig 100 RPM. Höhere Frequenzen über [email protected]
- Überschreitende Anfragen erhalten automatisch
429 Too Many Requests
Typische Szenarien: CI/CD-Lastspitzen, Batch-Jobs ohne Kontrollverlust, einheitliche Limitierung bei Team-Kollaboration.
🪙 Saldoabfrage per OpenAPI
Neu: GET /v1/user/balance. Mit jedem beliebigen OfoxAI-API-Key lassen sich verfügbares Guthaben, kumulierte Einzahlungen und kumulierter Verbrauch abfragen.
curl https://api.ofox.ai/v1/user/balance \
-H "Authorization: Bearer $OFOX_API_KEY"Das Antwortformat ist mit Drittanbieter-Tools wie cc-switch kompatibel und kann direkt als Saldo-Provider angebunden werden.
🧰 cc-switch-Integration
OfoxAI ist ab sofort nativ mit cc-switch kompatibel. Wer in cc-switch zu OfoxAI wechselt, sieht den Saldo in Echtzeit — ohne zusätzlichen Entwicklungsaufwand.

In vier Schritten konfiguriert:
- Verbrauchsabfrage öffnen — auf der OfoxAI-Provider-Karte oben rechts auf das 📊-Symbol klicken
- Verbrauchsabfrage aktivieren — Schalter umlegen
- API-Key eintragen — beliebiger OfoxAI-Nutzer-API-Key (Erstellung im Dashboard )
- Endpoint — „Universelle Vorlage” auswählen und als Adresse
https://api.ofox.ai/v1eintragen
Nach dem Speichern zeigt die Provider-Karte sofort den Saldo, etwa Verbleibend: 64.77 USD.
Schritt-für-Schritt-Anleitung: cc-switch-Integrationsleitfaden.
Neue Modelle · 24.04.2026
🤖 Neue Modelle
- GPT-5.5 (OpenAI) — neues Flaggschiff für anspruchsvolle Fachworkloads, 1M+ Token Kontext (922K Eingabe / 128K Ausgabe), umfassend verbesserte Reasoning-Zuverlässigkeit und Token-Effizienz gegenüber GPT-5.4
- DeepSeek V4 Pro (DeepSeek) — MoE-Flaggschiff mit 1,6T Gesamt-/49B aktiven Parametern und 1M Token Kontext, optimiert für fortgeschrittenes Reasoning, Code und Long-Range-Agent-Workflows
- DeepSeek V4 Flash (DeepSeek) — beschleunigte MoE-Variante mit 284B Gesamt-/13B aktiven Parametern und 1M Token Kontext, ausgelegt auf hohen Durchsatz, niedrige Latenz und ein Top-Preis-Leistungs-Verhältnis
Neue Modelle · 21.04.2026
🤖 Neue Modelle
- Kimi K2.6 (Moonshot AI) — bislang stärkster Kimi, mit umfassenden Verbesserungen bei Code, Reasoning und Bildverständnis
- GPT Image 2 (OpenAI) — Bildmodell der nächsten Generation mit reicheren Details und höherer Genauigkeit
Neue Modelle · 16.04.2026
🤖 Neue Modelle
- Claude Opus 4.7 (Anthropic) — neues Anthropic-Flaggschiff, das Reasoning- und Schreibqualität noch einmal anhebt
Aktion · 15.04.2026
🎁 GPT-April-Rebate, bis zu $250 zurück
- Zeitraum — 15. bis 25. April, elf Tage limitiert
- Rebate — 25 % Rückerstattung auf den GPT-Verbrauch über alle Modelle, sechs Stufen, bis zu $250
- Gutschrift — Rebate-Guthaben bleibt dauerhaft gültig und lässt sich nach Aktionsende per Klick einlösen
- Teams — Mitglieder-Verbrauch wird automatisch zusammengeführt, um gemeinsam höhere Stufen zu erreichen
Aktionsseite: GPT-April-Rebate .
v1.0.55-20260407
🎁 Geschenkkarten-System ist live
Geschenkkartencode auf der Wallet-Seite eingeben — Guthaben wird sofort gutgeschrieben. Die eleganteste Art, jemandem KI zu schenken.
- Datenschutz — In den Transaktionsdetails sind nur die letzten vier Stellen der Karte sichtbar
- Sicherheit — Mehrstufiger Missbrauchsschutz und Ende-zu-Ende-Verschlüsselung halten jede Karte sicher
🔍 Tool zur Modell-Verifikation
Eine klare Positionierung vorab: OfoxAI ist kein Reseller-Gateway.
- Betreiber — NICE TALK PTE. LTD. (internationale LLM-Plattform)
- Modell-Lizenzierung — offiziell und konform direkt vom Modellanbieter
- Compute — Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Engine, direkt vom Cloud-Anbieter
- Anfrage-Routing — Edge-CDN direkt zu den Cloud-Anbietern, ohne Zwischenstation, ohne Modellaustausch
Damit Nutzer die Authentizität von Modellen bei jedem LLM-Gateway prüfen können, haben wir ein kostenloses Werkzeug veröffentlicht: API-Base und Key eingeben — und sofort sehen, ob das Modell ausgetauscht wurde.
Tool: Modell-Verifikation . Funktioniert mit jeder Plattform, nicht nur OfoxAI.
v1.0.54-20260403
💳 Zahlungen und Top-Ups, neu aufgelegt
- Airwallex zusätzlich zu Stripe — eine weitere Option, internationale Zahlungen werden geschmeidiger
- USD, CNY oder SGD — Abrechnung in der Währung, in der Sie ohnehin denken
- Top-Up-Limit auf $10.000 angehoben — kein Engpass mehr für Großkunden
- $3 Erst-Top-Up-Bonus über Partner-Empfehlung — wer über einen Partner registriert wird, erhält beim ersten Top-Up automatisch $3 zusätzlich
🏢 Enterprise-Seite — wer mehr nutzt, spart mehr
Erreicht der Monatsverbrauch eine Schwelle, gibt es automatisch Rebate. Kein Antrag, kein Sales-Call, Gutschrift am ersten Tag des Folgemonats.
| Stufe | Monatlicher Verbrauch | Rebate |
|---|---|---|
| Bronze | $1.000+ | 3 % |
| Silver | $5.000+ | 4 % |
| Gold | $10.000+ | 5 % |
| Platinum | $20.000+ | 7 % |
Kombinierbar mit unseren Enterprise-Funktionen:
- 0 % Plattformgebühr — Listenpreis des Modellanbieters direkt durchgereicht
- Globale Edge-Knoten — Tokio / Singapur / Frankfurt
- 99,99 % Verfügbarkeits-SLA — Multi-Region-Redundanz mit automatischem Failover
- Keine Inhaltsspeicherung — Prompts und Antworten werden nicht protokolliert und nicht für Trainingszwecke verwendet
Mehr dazu: Enterprise .
🤖 Neue Modelle
- GLM-5V-Turbo (Zhipu) — Turbo-beschleunigte Variante der multimodalen GLM-Reihe
- Qwen3.6 Plus (Alibaba Bailian) — neueste Plus-Stufe von Qwen3.6
v1.0.47-20260327
🏷️ Ein Modell, viele Namen
Kurze Aliase, alte IDs — Modelle lassen sich so ansprechen, wie es im Code steht. Plattformwechsel werden zur Nicht-Aktion. Aliase greifen sofort, der Router erkennt sie automatisch.
Ein paar Beispiele:
| Kanonische ID | Aliase |
|---|---|
anthropic/claude-opus-4.7 | claude-opus-4.7 · claude-opus-4-7 · claude-opus-4-7-20260416 |
anthropic/claude-sonnet-4.6 | claude-sonnet-4.6 · claude-sonnet-4-6 · claude-sonnet-4-6-20260217 |
openai/gpt-5.4-pro | gpt-5.4-pro |
openai/gpt-5.4 | gpt-5.4 |
moonshotai/kimi-k2.6 | kimi-k2.6 |
z-ai/glm-5.1 | glm-5.1 |
Die vollständige Alias-Liste lässt sich über GET https://api.ofox.ai/v1/models abrufen — das Feld aliases in der Antwort ist sofort einsetzbar.
🖼️ Abrechnung pro generiertem Bild
Die Image-API rechnet jetzt pro generiertem Bild ab, mit transparenten Preisen. Standardgrößen werden automatisch auf die nativen Dimensionen jedes Anbieters gemappt — keine Änderungen am Client-Code nötig.
📊 Bild-Verbrauch sichtbar gemacht
Auf der Console-Startseite sowie in Verbrauch, Kosten und Ranglisten gibt es eine neue Dimension „Bild”. Der monatliche Bildverbrauch ist auf einen Blick erkennbar.
🤖 Neue Modelle
- GLM 5.1 (Zhipu) — nächste Generation der GLM-Reihe mit umfassenden Verbesserungen der Allgemeinfähigkeiten
🔗 Kürzere Einladungslinks
Einladungslinks haben jetzt das Format /x/Ihr-Code — leichter zu merken, leichter zu teilen.
v1.0.39-20260320
🔄 Modell-Fallback — automatischer Wechsel bei Fehlern
Wenn das Hauptmodell mit 4xx oder 5xx antwortet, probiert das Gateway automatisch die konfigurierten Fallback-Modelle aus, bis zu drei Stufen tief. Funktioniert übergreifend für OpenAI, Anthropic und Gemini, ohne Änderungen am Client-Code. Details: Fallback-Dokumentation.
⚔️ OfoxAI vs. OpenRouter im direkten Vergleich
OpenRouter berechnet 5,5 % Gebühr pro Top-Up, bei OfoxAI sind es 0 %. Bei gleichem 100+ Modellangebot lassen sich ab $1.000 Monatsverbrauch über 10 % Gesamtkosten sparen. Vollständiger Vergleich: OfoxAI vs. OpenRouter .
🤖 Neue Modelle
- GLM-5-Turbo (Zhipu) — Turbo-beschleunigte Variante von GLM-5
- GPT-5.4 Mini / Nano (OpenAI) — leichtgewichtiges GPT-5.4-Duo, deutlich niedrigere Kosten pro Aufruf
- MiniMax M2.7 / M2.7 Highspeed — neue MiniMax-Generation; Highspeed ist auf niedrige Latenz optimiert
v1.0.36-20260313
🎊 Claude-Rebate im März
Klare 20 % Rebate über alle Stufen. Im Aktions-Pop-up den Coupon-Code OFOXAI2603 mit einem Klick kopieren.
| Top-Up | Rebate | Sie erhalten |
|---|---|---|
| $20 | $4 | $24 |
| $50 | $10 | $60 |
| $100 | $20 | $120 |
| $200 | $40 | $240 |
| $500 | $100 | $600 |
Aktionsseite: Claude Spring, Runde 2 .
🤖 Neue Modelle
- GPT-5.4 / GPT-5.4 Pro (OpenAI) — neues Flaggschiff-Duo, Pro mit höherem Reasoning-Plafond
- Gemini Embedding 2 Preview (Google) — Googles nächste Generation multimodaler Embedding-Modelle
🖼️ Embeddings über alle Modalitäten
Gemini Embedding unterstützt jetzt Text, Bild, Audio und Video. Direkte Anbindungen an Qwen- und Volcengine-Multimodal-Embeddings sind zeitgleich verfügbar.
⚡ Verbrauchsdaten stündlich aktualisiert
Die Aggregation von Verbrauchsdaten erfolgt nun stündlich statt täglich. Der Verbrauch erscheint kurz nach dem Aufruf im Dashboard.
💰 Bessere Coupon-Anzeige
In der Bestellliste werden Rabatt- und Bonusbeträge jetzt für jede Bestellung vollständig angezeigt.
v1.0.32-20260303
🎉 Claude-Aktion im März ist live
Im Dashboard gibt es einen neuen Aktions-Banner und eine Verbrauchs-Fortschrittsanzeige; Coupon-Fehlermeldungen sind jetzt durchgängig auf Deutsch und Chinesisch lokalisiert. Aktionsseite: Claude Spring, Runde 1 .
🤖 Neue Modelle
- GPT-5.3 Chat (OpenAI) — auf Konversation optimierte Variante von GPT-5.3
- Gemini 3.1 Flash Lite Preview (Google) — leichtgewichtige Vorschau von Gemini 3.1
- Nano Banana 2 (Google) — Gemini 3.1 Flash Image Preview, Bildgenerierung der nächsten Generation
🏷️ Frische Navigation
- „Mein Billing” → „Meine Wallet”, passender zur tatsächlichen Nutzung
- „Modelle” → „Model Plaza”, als Katalog zum Stöbern positioniert
- Neuer Blog-Eintrag im Header
v1.0.30-20260226
🔒 GitHub-Login mit einem Klick
Auf der Login-Seite gibt es jetzt einen GitHub-OAuth-Eintrag — Registrierung und Anmeldung in einem Schritt. Das System merkt sich den zuletzt genutzten Anmeldeweg. In den Einstellungen lassen sich GitHub-Konten verknüpfen, lösen und Profilbilder synchronisieren.
🤖 Neue Modelle
- Komplette Qwen3.5-Familie auf einen Schlag (Alibaba Bailian) — Flash / 27B / 35B A3B / 122B A10B / 397B A17B
- GPT-5.3 Codex (OpenAI) — GPT-5.3 für Code-Aufgaben
- Gemini 3.1 Pro Preview (Google) — Vorschau von Gemini 3.1 Pro
- Qwen3 Coder Next (Alibaba Bailian) — neues Code-spezialisiertes Modell aus der Qwen-Reihe
📱 Responsive Mobile-Ansicht
Die Module Nutzer, Organisationen und Bestellungen in der Console sind jetzt vollständig auf Mobilgeräten nutzbar. Die Sidebar lässt sich einklappen, Tabellen passen sich intelligent an, kleine Bildschirme fühlen sich flüssig an.
v1.0.27-20260217
📊 Analyse-Dashboard
Drei interaktive Diagramme für Verbrauch, Kosten und Anfragen. Trends pro Monat, Modell-Rankings, Filter über Provider, Modell, Nutzer, API-Key und Zeitraum frei kombinierbar. Welches Modell ist Ihr Hauptmodell? Auf einen Blick erkennbar.
🤖 Neue Modelle
- Claude Sonnet 4.6 (Anthropic) — neue Sonnet-Version, das pragmatische Preis-Leistungs-Modell
- Qwen3.5 Plus (Alibaba Bailian) — Qwen3.5-Plus-Stufe ist live
- Doubao Seed 2.0 in vier Varianten (Volcengine) — Code / Lite / Mini / Pro , die komplette Doubao-Seed-2.0-Reihe geht zeitgleich live
🌐 Verhalten an OpenAI angeglichen
Wird chat/completions ohne stream aufgerufen, läuft die Antwort jetzt standardmäßig nicht-streamend — exakt wie bei OpenAI. Am Code muss nichts geändert werden.
v1.0.24-20260212
🤖 Neue Modelle
- GLM-5 (Zhipu) — neues Flaggschiff der GLM-Reihe
- MiniMax M2.5 / M2.5 Lightning — MiniMax-Duo, Lightning ist auf niedrige Latenz optimiert
🎊 Willkommen beim ersten Login
Beim ersten Login zeigt das Willkommens-Pop-up alle drei API-Endpoints (OpenAI / Anthropic / Gemini) und unterstützt das Kopieren mit einem Klick. Mit Konfetti-Animation als kleine Geste an Entwickler.
🧠 Provider-Affinity-Cache
Wechselt derselbe Nutzer zwischen verschiedenen Modellen, bevorzugt das Gateway denselben zugrunde liegenden Anbieter. Das erhöht die Trefferquote im Prompt-Cache, beschleunigt Antworten und senkt Kosten.
🎟️ Angel-Einladungssystem
Vollständiges Einladungssystem ist live: kartenbasierte UI, Beitritts-Dialog und Übersichtstabelle der Verwendungen. Beidseitige Belohnungen plus persönliches Einladungs-Poster auf Knopfdruck.
v1.0.20-20260206
🤖 Neue Modelle
- Claude Opus 4.6 (Anthropic) — neues Anthropic-Flaggschiff, hebt Reasoning- und Schreib-Leistung erneut an
🌍 Sprachumschaltung in einem Klick
Über 1.100 Übersetzungs-Strings — die gesamte Plattform wechselt nahtlos zwischen Deutsch, Englisch und Chinesisch. Die Sprachpräferenz wird per Cookie gespeichert.
🔍 Web Search wird pro Aufruf abgerechnet
Web-Search-Tool-Aufrufe in den Protokollen OpenAI, Anthropic und Gemini werden jetzt präzise pro Aufruf abgerechnet.
📊 Aufgefrischtes Dashboard
- Personalisierte Begrüßung mit Benutzernamen statt eines generischen „Hi”
- Verbrauchsstatistik vom Tages- auf Wochensicht umgestellt
- API-Key-Anzeige in drei Modi: vollständig verborgen, maskiert oder im Klartext
💵 Klarere Preisanzeige
$0.6000 lässt jetzt automatisch die Nullen fallen und wird als $0.6 angezeigt. Fehlermeldungen bei zu niedrigem Saldo erscheinen im Dollar-Format — keine Kopfrechnerei mehr nötig.
📚 Dokumentations-Seite ist live
- Vollständige Protokoll-Referenzen für OpenAI, Anthropic und Gemini
- Integrationsleitfäden für 10+ Tools: Claude Code, Codex, Gemini CLI, Zed, Cline, Cherry Studio, OpenClaw, OpenCode und mehr — von der Konfiguration bis zum laufenden Setup vollständig abgedeckt
v1.0.1 ~ v1.0.9 · 20.01. – 01.02.2026 — Zwei Wochen Fundament
In den ersten zwei Wochen nach dem Launch haben wir nicht durchgeatmet. Jedes Release machte die Plattform stabiler, präziser und einfacher anzubinden.
💻 Native Unterstützung für Claude Code
Wir programmieren selbst mit Claude Code. Am 21. Januar haben wir das Gateway vollständig auf Claude Code abgestimmt — API-Base auf OfoxAI ändern, sk-*** einfügen und alle Claude-Modelle laufen sofort.
🧠 Thinking-Reasoning-Chains
Die Thinking-Blöcke (der „Denkprozess” des Modells) von Claude und Gemini werden jetzt protokoll-übergreifend durchgereicht. Sie sehen, wie das Modell denkt — nicht nur, was am Ende dabei herauskommt.
🌐 Natives Gemini-Protokoll
Über die OpenAI-Kompatibilität hinaus läuft jetzt auch Geminis natives generateContent-API. Das offizielle SDK von Google verbindet sich direkt — ohne Übersetzungsverluste.
💵 Mehrwährungs-Stripe
Neben USD gibt es nun CNY, SGD und weitere Währungen. Wechselkurs-Snapshots werden je Bestellung gespeichert. Nutzer im asiatisch-pazifischen Raum zahlen direkt in Lokalwährung.
🎯 Abrechnung mit sechs Nachkommastellen
Präzision auf NanoDollar-Ebene. Selbst wenn ein einzelner API-Aufruf nur Bruchteile eines Cents kostet, wird er exakt erfasst und abgerechnet. Großkunden zahlen nicht zu viel, kleine Kunden nicht zu wenig.
v1.0.0 · 16.01.2026 — The Gateway Goes Live
„Ab heute: 100+ Modelle, ein Key.”
An diesem Tag ist die OfoxAI -Plattform offiziell für die Öffentlichkeit gestartet.
🚀 Launch-Funktionen
- Drei Protokolle nativ — OpenAI / Anthropic / Gemini direkt unterstützt, bestehender Code läuft ohne Änderung
- 100+ Modelle einheitlich angebunden — Claude , GPT , Gemini , DeepSeek , Qwen und über hundert weitere — alle hinter einem Key. Vollständiger Katalog: Model Plaza
- Smartes Routing — Routing-Algorithmen auf Provider × Modell-Ebene wählen automatisch den schnellsten und stabilsten Pfad. Details: Provider Routing
- Self-Service-API-Keys — Im Dashboard lassen sich Keys mit einem Klick erstellen, deaktivieren und ihr Verbrauch verfolgen
- Pay-as-you-go, 0 % Plattformgebühr — Listenpreis des Modellanbieters direkt. Preisinformationen: Pricing
- Stripe-Kreditkartenzahlung — Top-Ups landen in Echtzeit, Saldo jederzeit einsehbar
- Globale Edge-Knoten — Standorte in Tokio, Singapur und Frankfurt sorgen für Routing in der Nähe
🌐 Die Infrastruktur darunter
Kein Reseller-Gateway, sondern eine Plattform. Anfragen fließen über Edge-CDN direkt zu Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Engine.
Day 1 · 27.12.2025 — How It Began
„Entwicklern den einfachsten Weg geben, die klügsten Modelle der Welt aufzurufen.”
🦊 Die erste Zeile Code
Ende 2025 setzte ein kleiner Commit die erste Zeile Code von OfoxAI:
feat: initialize ofox-studio monorepo⚡ Der Aha-Moment
Drei Tage später lief beides parallel: Claude auf AWS Bedrock und GPT auf Azure. Zwei Hyperscaler, zwei Top-Modelle, beide direkt angebunden — ohne Zwischenstation.
Als die ersten Antworten beider Strecken gleichzeitig im Terminal erschienen, wussten wir: Das funktioniert.
Das war kein Demo-Adapter, sondern echte Multi-Cloud-Direktanbindung. Danach kamen Google Cloud, Alibaba Cloud, Z.AI, Moonshot und Volcano Engine dazu — die Positionierung „Kein Reseller-Gateway, sondern eine Plattform” stand schon ab Tag 3 fest.
🌱 Der Startpunkt
commit 0001
Eine Zeile Code, eine Richtung. Die klügste Intelligenz der Welt für jeden erreichbar machen.
Triebwerke, zünden.