Skip to Content
UpdatesChangelog

Changelog

Jeder Schritt von OfoxAI — neue Modelle, neue Funktionen, neue Erlebnisse. Wöchentliche Updates.


v1.1.0-20260428

💰 Budget-Verwaltung — Team / Mitglied / API-Key in drei Dimensionen

Aus mündlichen Absprachen werden harte System-Limits. Eine Organisation kann gleichzeitig drei Dimensionen × drei Zeiträume an Ausgabenobergrenzen konfigurieren:

DimensionAnwendungsfall
Team (Organization)Gesamtbudget für Unternehmen oder Projekt
Mitglied (User)Monatliches Kontingent pro Mitarbeiter
API-KeyEigenständiges Budget pro Anwendung oder Service

Jede Dimension lässt sich separat mit täglichen / monatlichen / kumulierten Obergrenzen versehen. Bei Überschreitung werden Anfragen automatisch abgelehnt.

Die Fortschrittsanzeige warnt in drei Stufen:

  • 🟢 40% — normaler Verbrauch
  • 🟡 80% — Annäherung an die Obergrenze
  • 🔴 110% — überschritten (Puffer eingebaut, um plötzliche Spitzen bei hoher Parallelität abzufangen)

Hierarchische Constraints werden automatisch geprüft: API-Key-Limit ≤ Mitglieder-Limit ≤ Team-Limit. Das Frontend zeigt das übergeordnete Kontingent in Echtzeit an, damit Fehlkonfigurationen vermieden werden.

Einstieg: Einstellungen → Kontingente 

⏱️ Team-weite RPM-Kontingente

Neu hinzugekommen ist das team-weite Rate-Limit (RPM), das verhindert, dass mehrere API-Keys zusammen die Quota des Upstream-Anbieters sprengen.

  • RPM wird über das gesamte Team aggregiert berechnet, nicht mehr je Key
  • Standardmäßig 100 RPM. Höhere Frequenzen über [email protected]
  • Überschreitende Anfragen erhalten automatisch 429 Too Many Requests

Typische Szenarien: CI/CD-Lastspitzen, Batch-Jobs ohne Kontrollverlust, einheitliche Limitierung bei Team-Kollaboration.

🪙 Saldoabfrage per OpenAPI

Neu: GET /v1/user/balance. Mit jedem beliebigen OfoxAI-API-Key lassen sich verfügbares Guthaben, kumulierte Einzahlungen und kumulierter Verbrauch abfragen.

Terminal
curl https://api.ofox.ai/v1/user/balance \ -H "Authorization: Bearer $OFOX_API_KEY"

Das Antwortformat ist mit Drittanbieter-Tools wie cc-switch  kompatibel und kann direkt als Saldo-Provider angebunden werden.

🧰 cc-switch-Integration

OfoxAI ist ab sofort nativ mit cc-switch  kompatibel. Wer in cc-switch zu OfoxAI wechselt, sieht den Saldo in Echtzeit — ohne zusätzlichen Entwicklungsaufwand.

cc-switch Konfiguration der OfoxAI-Saldoabfrage

In vier Schritten konfiguriert:

  1. Verbrauchsabfrage öffnen — auf der OfoxAI-Provider-Karte oben rechts auf das 📊-Symbol klicken
  2. Verbrauchsabfrage aktivieren — Schalter umlegen
  3. API-Key eintragen — beliebiger OfoxAI-Nutzer-API-Key (Erstellung im Dashboard )
  4. Endpoint — „Universelle Vorlage” auswählen und als Adresse https://api.ofox.ai/v1 eintragen

Nach dem Speichern zeigt die Provider-Karte sofort den Saldo, etwa Verbleibend: 64.77 USD.

Schritt-für-Schritt-Anleitung: cc-switch-Integrationsleitfaden.


Neue Modelle · 24.04.2026

🤖 Neue Modelle

  • GPT-5.5 (OpenAI) — neues Flaggschiff für anspruchsvolle Fachworkloads, 1M+ Token Kontext (922K Eingabe / 128K Ausgabe), umfassend verbesserte Reasoning-Zuverlässigkeit und Token-Effizienz gegenüber GPT-5.4
  • DeepSeek V4 Pro (DeepSeek) — MoE-Flaggschiff mit 1,6T Gesamt-/49B aktiven Parametern und 1M Token Kontext, optimiert für fortgeschrittenes Reasoning, Code und Long-Range-Agent-Workflows
  • DeepSeek V4 Flash (DeepSeek) — beschleunigte MoE-Variante mit 284B Gesamt-/13B aktiven Parametern und 1M Token Kontext, ausgelegt auf hohen Durchsatz, niedrige Latenz und ein Top-Preis-Leistungs-Verhältnis

Neue Modelle · 21.04.2026

🤖 Neue Modelle

  • Kimi K2.6 (Moonshot AI) — bislang stärkster Kimi, mit umfassenden Verbesserungen bei Code, Reasoning und Bildverständnis
  • GPT Image 2 (OpenAI) — Bildmodell der nächsten Generation mit reicheren Details und höherer Genauigkeit

Neue Modelle · 16.04.2026

🤖 Neue Modelle

  • Claude Opus 4.7 (Anthropic) — neues Anthropic-Flaggschiff, das Reasoning- und Schreibqualität noch einmal anhebt

Aktion · 15.04.2026

🎁 GPT-April-Rebate, bis zu $250 zurück

  • Zeitraum — 15. bis 25. April, elf Tage limitiert
  • Rebate — 25 % Rückerstattung auf den GPT-Verbrauch über alle Modelle, sechs Stufen, bis zu $250
  • Gutschrift — Rebate-Guthaben bleibt dauerhaft gültig und lässt sich nach Aktionsende per Klick einlösen
  • Teams — Mitglieder-Verbrauch wird automatisch zusammengeführt, um gemeinsam höhere Stufen zu erreichen

Aktionsseite: GPT-April-Rebate .


v1.0.55-20260407

🎁 Geschenkkarten-System ist live

Geschenkkartencode auf der Wallet-Seite  eingeben — Guthaben wird sofort gutgeschrieben. Die eleganteste Art, jemandem KI zu schenken.

  • Datenschutz — In den Transaktionsdetails sind nur die letzten vier Stellen der Karte sichtbar
  • Sicherheit — Mehrstufiger Missbrauchsschutz und Ende-zu-Ende-Verschlüsselung halten jede Karte sicher

🔍 Tool zur Modell-Verifikation

Eine klare Positionierung vorab: OfoxAI ist kein Reseller-Gateway.

  • Betreiber — NICE TALK PTE. LTD. (internationale LLM-Plattform)
  • Modell-Lizenzierung — offiziell und konform direkt vom Modellanbieter
  • Compute — Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Engine, direkt vom Cloud-Anbieter
  • Anfrage-Routing — Edge-CDN direkt zu den Cloud-Anbietern, ohne Zwischenstation, ohne Modellaustausch

Damit Nutzer die Authentizität von Modellen bei jedem LLM-Gateway prüfen können, haben wir ein kostenloses Werkzeug veröffentlicht: API-Base und Key eingeben — und sofort sehen, ob das Modell ausgetauscht wurde.

Tool: Modell-Verifikation . Funktioniert mit jeder Plattform, nicht nur OfoxAI.


v1.0.54-20260403

💳 Zahlungen und Top-Ups, neu aufgelegt

  • Airwallex zusätzlich zu Stripe — eine weitere Option, internationale Zahlungen werden geschmeidiger
  • USD, CNY oder SGD — Abrechnung in der Währung, in der Sie ohnehin denken
  • Top-Up-Limit auf $10.000 angehoben — kein Engpass mehr für Großkunden
  • $3 Erst-Top-Up-Bonus über Partner-Empfehlung — wer über einen Partner registriert wird, erhält beim ersten Top-Up automatisch $3 zusätzlich

🏢 Enterprise-Seite — wer mehr nutzt, spart mehr

Erreicht der Monatsverbrauch eine Schwelle, gibt es automatisch Rebate. Kein Antrag, kein Sales-Call, Gutschrift am ersten Tag des Folgemonats.

StufeMonatlicher VerbrauchRebate
Bronze$1.000+3 %
Silver$5.000+4 %
Gold$10.000+5 %
Platinum$20.000+7 %

Kombinierbar mit unseren Enterprise-Funktionen:

  • 0 % Plattformgebühr — Listenpreis des Modellanbieters direkt durchgereicht
  • Globale Edge-Knoten — Tokio / Singapur / Frankfurt
  • 99,99 % Verfügbarkeits-SLA — Multi-Region-Redundanz mit automatischem Failover
  • Keine Inhaltsspeicherung — Prompts und Antworten werden nicht protokolliert und nicht für Trainingszwecke verwendet

Mehr dazu: Enterprise .

🤖 Neue Modelle

  • GLM-5V-Turbo (Zhipu) — Turbo-beschleunigte Variante der multimodalen GLM-Reihe
  • Qwen3.6 Plus (Alibaba Bailian) — neueste Plus-Stufe von Qwen3.6

v1.0.47-20260327

🏷️ Ein Modell, viele Namen

Kurze Aliase, alte IDs — Modelle lassen sich so ansprechen, wie es im Code steht. Plattformwechsel werden zur Nicht-Aktion. Aliase greifen sofort, der Router erkennt sie automatisch.

Ein paar Beispiele:

Kanonische IDAliase
anthropic/claude-opus-4.7claude-opus-4.7 · claude-opus-4-7 · claude-opus-4-7-20260416
anthropic/claude-sonnet-4.6claude-sonnet-4.6 · claude-sonnet-4-6 · claude-sonnet-4-6-20260217
openai/gpt-5.4-progpt-5.4-pro
openai/gpt-5.4gpt-5.4
moonshotai/kimi-k2.6kimi-k2.6
z-ai/glm-5.1glm-5.1

Die vollständige Alias-Liste lässt sich über GET https://api.ofox.ai/v1/models abrufen — das Feld aliases in der Antwort ist sofort einsetzbar.

🖼️ Abrechnung pro generiertem Bild

Die Image-API rechnet jetzt pro generiertem Bild ab, mit transparenten Preisen. Standardgrößen werden automatisch auf die nativen Dimensionen jedes Anbieters gemappt — keine Änderungen am Client-Code nötig.

📊 Bild-Verbrauch sichtbar gemacht

Auf der Console-Startseite sowie in Verbrauch, Kosten und Ranglisten gibt es eine neue Dimension „Bild”. Der monatliche Bildverbrauch ist auf einen Blick erkennbar.

🤖 Neue Modelle

  • GLM 5.1 (Zhipu) — nächste Generation der GLM-Reihe mit umfassenden Verbesserungen der Allgemeinfähigkeiten

Einladungslinks haben jetzt das Format /x/Ihr-Code — leichter zu merken, leichter zu teilen.


v1.0.39-20260320

🔄 Modell-Fallback — automatischer Wechsel bei Fehlern

Wenn das Hauptmodell mit 4xx oder 5xx antwortet, probiert das Gateway automatisch die konfigurierten Fallback-Modelle aus, bis zu drei Stufen tief. Funktioniert übergreifend für OpenAI, Anthropic und Gemini, ohne Änderungen am Client-Code. Details: Fallback-Dokumentation.

⚔️ OfoxAI vs. OpenRouter im direkten Vergleich

OpenRouter berechnet 5,5 % Gebühr pro Top-Up, bei OfoxAI sind es 0 %. Bei gleichem 100+ Modellangebot lassen sich ab $1.000 Monatsverbrauch über 10 % Gesamtkosten sparen. Vollständiger Vergleich: OfoxAI vs. OpenRouter .

🤖 Neue Modelle

  • GLM-5-Turbo (Zhipu) — Turbo-beschleunigte Variante von GLM-5
  • GPT-5.4 Mini / Nano (OpenAI) — leichtgewichtiges GPT-5.4-Duo, deutlich niedrigere Kosten pro Aufruf
  • MiniMax M2.7 / M2.7 Highspeed — neue MiniMax-Generation; Highspeed ist auf niedrige Latenz optimiert

v1.0.36-20260313

🎊 Claude-Rebate im März

Klare 20 % Rebate über alle Stufen. Im Aktions-Pop-up den Coupon-Code OFOXAI2603 mit einem Klick kopieren.

Top-UpRebateSie erhalten
$20$4$24
$50$10$60
$100$20$120
$200$40$240
$500$100$600

Aktionsseite: Claude Spring, Runde 2 .

🤖 Neue Modelle

🖼️ Embeddings über alle Modalitäten

Gemini Embedding unterstützt jetzt Text, Bild, Audio und Video. Direkte Anbindungen an Qwen- und Volcengine-Multimodal-Embeddings sind zeitgleich verfügbar.

⚡ Verbrauchsdaten stündlich aktualisiert

Die Aggregation von Verbrauchsdaten erfolgt nun stündlich statt täglich. Der Verbrauch erscheint kurz nach dem Aufruf im Dashboard.

💰 Bessere Coupon-Anzeige

In der Bestellliste werden Rabatt- und Bonusbeträge jetzt für jede Bestellung vollständig angezeigt.


v1.0.32-20260303

🎉 Claude-Aktion im März ist live

Im Dashboard gibt es einen neuen Aktions-Banner und eine Verbrauchs-Fortschrittsanzeige; Coupon-Fehlermeldungen sind jetzt durchgängig auf Deutsch und Chinesisch lokalisiert. Aktionsseite: Claude Spring, Runde 1 .

🤖 Neue Modelle

🏷️ Frische Navigation


v1.0.30-20260226

🔒 GitHub-Login mit einem Klick

Auf der Login-Seite gibt es jetzt einen GitHub-OAuth-Eintrag — Registrierung und Anmeldung in einem Schritt. Das System merkt sich den zuletzt genutzten Anmeldeweg. In den Einstellungen lassen sich GitHub-Konten verknüpfen, lösen und Profilbilder synchronisieren.

🤖 Neue Modelle

📱 Responsive Mobile-Ansicht

Die Module Nutzer, Organisationen und Bestellungen in der Console sind jetzt vollständig auf Mobilgeräten nutzbar. Die Sidebar lässt sich einklappen, Tabellen passen sich intelligent an, kleine Bildschirme fühlen sich flüssig an.


v1.0.27-20260217

📊 Analyse-Dashboard

Drei interaktive Diagramme für Verbrauch, Kosten und Anfragen. Trends pro Monat, Modell-Rankings, Filter über Provider, Modell, Nutzer, API-Key und Zeitraum frei kombinierbar. Welches Modell ist Ihr Hauptmodell? Auf einen Blick erkennbar.

🤖 Neue Modelle

  • Claude Sonnet 4.6 (Anthropic) — neue Sonnet-Version, das pragmatische Preis-Leistungs-Modell
  • Qwen3.5 Plus (Alibaba Bailian) — Qwen3.5-Plus-Stufe ist live
  • Doubao Seed 2.0 in vier Varianten (Volcengine) — Code  / Lite  / Mini  / Pro , die komplette Doubao-Seed-2.0-Reihe geht zeitgleich live

🌐 Verhalten an OpenAI angeglichen

Wird chat/completions ohne stream aufgerufen, läuft die Antwort jetzt standardmäßig nicht-streamend — exakt wie bei OpenAI. Am Code muss nichts geändert werden.


v1.0.24-20260212

🤖 Neue Modelle

🎊 Willkommen beim ersten Login

Beim ersten Login zeigt das Willkommens-Pop-up alle drei API-Endpoints (OpenAI / Anthropic / Gemini) und unterstützt das Kopieren mit einem Klick. Mit Konfetti-Animation als kleine Geste an Entwickler.

🧠 Provider-Affinity-Cache

Wechselt derselbe Nutzer zwischen verschiedenen Modellen, bevorzugt das Gateway denselben zugrunde liegenden Anbieter. Das erhöht die Trefferquote im Prompt-Cache, beschleunigt Antworten und senkt Kosten.

🎟️ Angel-Einladungssystem

Vollständiges Einladungssystem ist live: kartenbasierte UI, Beitritts-Dialog und Übersichtstabelle der Verwendungen. Beidseitige Belohnungen plus persönliches Einladungs-Poster auf Knopfdruck.


v1.0.20-20260206

🤖 Neue Modelle

  • Claude Opus 4.6 (Anthropic) — neues Anthropic-Flaggschiff, hebt Reasoning- und Schreib-Leistung erneut an

🌍 Sprachumschaltung in einem Klick

Über 1.100 Übersetzungs-Strings — die gesamte Plattform wechselt nahtlos zwischen Deutsch, Englisch und Chinesisch. Die Sprachpräferenz wird per Cookie gespeichert.

🔍 Web Search wird pro Aufruf abgerechnet

Web-Search-Tool-Aufrufe in den Protokollen OpenAI, Anthropic und Gemini werden jetzt präzise pro Aufruf abgerechnet.

📊 Aufgefrischtes Dashboard

  • Personalisierte Begrüßung mit Benutzernamen statt eines generischen „Hi”
  • Verbrauchsstatistik vom Tages- auf Wochensicht umgestellt
  • API-Key-Anzeige in drei Modi: vollständig verborgen, maskiert oder im Klartext

💵 Klarere Preisanzeige

$0.6000 lässt jetzt automatisch die Nullen fallen und wird als $0.6 angezeigt. Fehlermeldungen bei zu niedrigem Saldo erscheinen im Dollar-Format — keine Kopfrechnerei mehr nötig.

📚 Dokumentations-Seite ist live


v1.0.1 ~ v1.0.9 · 20.01. – 01.02.2026 — Zwei Wochen Fundament

In den ersten zwei Wochen nach dem Launch haben wir nicht durchgeatmet. Jedes Release machte die Plattform stabiler, präziser und einfacher anzubinden.

💻 Native Unterstützung für Claude Code

Wir programmieren selbst mit Claude Code. Am 21. Januar haben wir das Gateway vollständig auf Claude Code abgestimmt — API-Base auf OfoxAI ändern, sk-*** einfügen und alle Claude-Modelle laufen sofort.

🧠 Thinking-Reasoning-Chains

Die Thinking-Blöcke (der „Denkprozess” des Modells) von Claude und Gemini werden jetzt protokoll-übergreifend durchgereicht. Sie sehen, wie das Modell denkt — nicht nur, was am Ende dabei herauskommt.

🌐 Natives Gemini-Protokoll

Über die OpenAI-Kompatibilität hinaus läuft jetzt auch Geminis natives generateContent-API. Das offizielle SDK von Google verbindet sich direkt — ohne Übersetzungsverluste.

💵 Mehrwährungs-Stripe

Neben USD gibt es nun CNY, SGD und weitere Währungen. Wechselkurs-Snapshots werden je Bestellung gespeichert. Nutzer im asiatisch-pazifischen Raum zahlen direkt in Lokalwährung.

🎯 Abrechnung mit sechs Nachkommastellen

Präzision auf NanoDollar-Ebene. Selbst wenn ein einzelner API-Aufruf nur Bruchteile eines Cents kostet, wird er exakt erfasst und abgerechnet. Großkunden zahlen nicht zu viel, kleine Kunden nicht zu wenig.


v1.0.0 · 16.01.2026 — The Gateway Goes Live

„Ab heute: 100+ Modelle, ein Key.”

An diesem Tag ist die OfoxAI -Plattform offiziell für die Öffentlichkeit gestartet.

🚀 Launch-Funktionen

  • Drei Protokolle nativOpenAI / Anthropic / Gemini direkt unterstützt, bestehender Code läuft ohne Änderung
  • 100+ Modelle einheitlich angebundenClaude , GPT , Gemini , DeepSeek , Qwen  und über hundert weitere — alle hinter einem Key. Vollständiger Katalog: Model Plaza 
  • Smartes Routing — Routing-Algorithmen auf Provider × Modell-Ebene wählen automatisch den schnellsten und stabilsten Pfad. Details: Provider Routing
  • Self-Service-API-Keys — Im Dashboard  lassen sich Keys mit einem Klick erstellen, deaktivieren und ihr Verbrauch verfolgen
  • Pay-as-you-go, 0 % Plattformgebühr — Listenpreis des Modellanbieters direkt. Preisinformationen: Pricing
  • Stripe-Kreditkartenzahlung — Top-Ups landen in Echtzeit, Saldo jederzeit einsehbar
  • Globale Edge-Knoten — Standorte in Tokio, Singapur und Frankfurt sorgen für Routing in der Nähe

🌐 Die Infrastruktur darunter

Kein Reseller-Gateway, sondern eine Plattform. Anfragen fließen über Edge-CDN direkt zu Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Engine.


Day 1 · 27.12.2025 — How It Began

„Entwicklern den einfachsten Weg geben, die klügsten Modelle der Welt aufzurufen.”

🦊 Die erste Zeile Code

Ende 2025 setzte ein kleiner Commit die erste Zeile Code von OfoxAI:

feat: initialize ofox-studio monorepo

⚡ Der Aha-Moment

Drei Tage später lief beides parallel: Claude auf AWS Bedrock und GPT auf Azure. Zwei Hyperscaler, zwei Top-Modelle, beide direkt angebunden — ohne Zwischenstation.

Als die ersten Antworten beider Strecken gleichzeitig im Terminal erschienen, wussten wir: Das funktioniert.

Das war kein Demo-Adapter, sondern echte Multi-Cloud-Direktanbindung. Danach kamen Google Cloud, Alibaba Cloud, Z.AI, Moonshot und Volcano Engine dazu — die Positionierung „Kein Reseller-Gateway, sondern eine Plattform” stand schon ab Tag 3 fest.

🌱 Der Startpunkt

commit 0001

Eine Zeile Code, eine Richtung. Die klügste Intelligenz der Welt für jeden erreichbar machen.

Triebwerke, zünden.


Last updated on