Skip to Content
UpdatesChangelog

Changelog

Jeder Schritt von OfoxAI — neue Modelle, neue Funktionen, neue Erlebnisse. Wöchentliche Updates.


Analyse · 16.06.2026

📊 Verbrauch und Kosten in einem Report

Früher lagen „Verbrauch” und „Kosten” auf zwei getrennten Seiten — für den Abgleich musste man ständig hin und her wechseln. Jetzt sind beide zu einer einheitlichen Analyse-Seite zusammengeführt: Wie viel genutzt und wie viel ausgegeben wurde, steht auf einen Blick an einer Stelle.

  • Überblick auf einem Bildschirm — Aufrufzahl, Verbrauchsbetrag, Token und weitere Kennzahlen gebündelt dargestellt
  • Mehrdimensionales Drill-down — mit einem Klick nach Modell, Mitglied, API-Key oder Anwendung umschalten
  • Flexible Filter — frei wählbarer Zeitraum plus kombinierbare Filter; Hauptmodelle und Kostenverteilung sind sofort ersichtlich

Einstieg: Analyse .


v1.2.6-20260605

🔐 IP-Whitelist für API-Keys

Binden Sie einen API-Key an vertrauenswürdige Quell-IPs — selbst wenn der Key geleakt wird, lässt er sich von Adressen außerhalb der Whitelist nicht nutzen.

  • Unterstützt einzelne IPs und CIDR-Bereiche, bis zu 50 Einträge pro Key
  • Anfragen von nicht gelisteten Quellen erhalten direkt 403
  • Leer = keine Einschränkung, bestehende Keys bleiben unberührt

Einstieg: API-Key-Verwaltung  → Detailansicht eines Keys.


v1.2.3-20260603

🟢 Google-Login mit einem Klick

Nach GitHub der zweite Social-Login — für Anmeldung, Registrierung und Konto-Verknüpfung. Gleiche E-Mail-Adressen werden automatisch zusammengeführt, und beim nächsten Mal merkt sich das System den zuletzt genutzten Anmeldeweg.

🎮 Playground ist live

In der Sidebar der Console gibt es jetzt einen Playground-Eintrag: Modelle direkt im Browser ausprobieren, Parameter einstellen und Ergebnisse vergleichen — ohne eine einzige Zeile Code. Einstieg: chat.ofox.ai .

🌐 Sprache folgt dem Konto

Ihre Sprachpräferenz wird im Konto gespeichert — auch beim Gerätewechsel bleibt sie erhalten; sogar System-E-Mails kommen in der von Ihnen gewählten Sprache. In Einstellungen → Konto  gibt es eine neue Sprachkarte.


Neue Modelle · 02.06.2026

🤖 Neue Modelle

  • MiniMax M3 (MiniMax) — neues Flaggschiff von MiniMax
  • Qwen3.7 Plus (Alibaba Bailian) — Qwen3.7-Plus-Stufe, direkt über die Protokolle OpenAI / Anthropic / Gemini
  • xAI-Grok-Reihe ist jetzt liveGrok 4.3  und weitere xAI-Modelle sind im Model Plaza  verfügbar

Aktion · 01.06.2026

🎁 Juni: 15 % Rabatt auf alle GPT-Modelle

Den ganzen Juni über 15 % Rabatt auf die gesamte GPT-Reihe, vom 1.6. bis 1.7. Kein Gutscheincode nötig — der Rabatt wird beim Bezahlen automatisch angewendet. Modellkatalog: GPT-Reihe .


v1.1.9-20260529

🌏 Japanische Oberfläche ist live

Die Plattform-Oberfläche gibt es jetzt auch auf Japanisch (ja) — damit stehen vier Sprachen zur Verfügung: English / 简体中文 / Русский / 日本語. Der Sprachumschalter nutzt nun ein 🌐-Symbol und zeigt jede Sprache in ihrer eigenen Schreibweise an, was die Auswahl intuitiver macht.

🤖 Neue Modelle

  • Claude Opus 4.8 (Anthropic) — neues Anthropic-Flaggschiff, das Reasoning- und Schreibqualität noch einmal anhebt

Neue Modelle · 22.05.2026

🤖 Neue Modelle

  • Qwen3.7 Max (Alibaba Bailian) — stärkste Qwen3.7-Stufe, direkt über die Protokolle OpenAI / Anthropic / Gemini

Neue Modelle · 20.05.2026

🤖 Neue Modelle


v1.1.6-20260519

🧾 Rechnungsadresse selbst bearbeiten, sofort aktualisiert

Rechnungen und Belege sind überarbeitet — über die Rechnungsdaten bestimmen Sie.

  • Rechnungsadresse selbst pflegen — Firmenname, Steuernummer, Adresse und weitere Rechnungsdaten hinterlegen; sie erscheinen automatisch auf der Rechnung. Nach einer Änderung neu generieren, und die neue Rechnung ist sofort aktuell
  • Echte Zahlungsmethode — Belege zeigen die tatsächlich genutzte Zahlungsart wie Visa ····4242 oder WeChat Pay
  • Mehrwährungs-Details — die tatsächliche Abbuchungswährung und der Wechselkurs werden ausgewiesen (z. B. 1 SGD = 5.5654 CNY)
  • Jederzeit exportieren — Rechnungs- und Beleglinks bleiben dauerhaft gültig und lassen sich direkt aus dem Browser als PDF drucken

Einstieg: Wallet-Seite  → Bestellung → Rechnung ansehen; die Rechnungsadresse pflegen Sie unter Einstellungen → Organisation .


v1.1.5-20260514

🔐 Drittanbieter-Apps mit dem OfoxAI-Konto autorisieren (OAuth)

Drittanbieter-Apps und KI-Agenten lassen sich jetzt per Standard-OAuth mit Ihrem OfoxAI-Konto verbinden — Sie müssen ihnen keinen API-Key mehr direkt aushändigen.

  • Einmal autorisieren, sicher aufrufen — nach der Freigabe kann die App in Ihrem Namen Modelle aufrufen sowie Saldo, Verbrauch und Limits abfragen
  • Präzise Zuordnung — jeder Aufruf wird einer konkreten App zugeordnet, Verbrauch und Kosten sind glasklar nachvollziehbar
  • Jederzeit widerrufen — autorisierte Apps in der Console verwalten und Berechtigungen mit einem Klick zurückziehen
  • Auch für Kommandozeilen-Tools — mit Device-Code-Flow melden sich auch CLI- und Terminal-Tools reibungslos an

Damit steht eine einheitliche Login- und Autorisierungsbasis für das Tool- und Agent-Ökosystem rund um OfoxAI.


Neue Funktionen · 07.05.2026

🎙️ Audio-Transkription (Sprache zu Text)

Neu sind die OpenAI-Modelle zur Audio-Transkription — Aufnahmen und Sprache direkt in Text umwandeln, aufrufbar über das gewohnte OpenAI-kompatible Protokoll: GPT-4o Mini Transcribe  und GPT-4o Transcribe Diarize  (mit Sprecher-Diarisierung).


v1.1.4-20260502

🎁 GPT-Bonusmonat im Mai

Cashback auf den Verbrauch der gesamten GPT-Reihe, sechs Stufen, bis zu $250 zurück.

  • Aktionszeitraum — 1.5. bis 15.5.
  • Einlösezeitraum — 16.5. bis 18.5.
  • Abdeckung — die komplette GPT-Reihe, darunter GPT-5.5, die gesamte GPT-5.4-Familie und GPT Image 2
  • Teams — Mitglieder-Verbrauch wird automatisch zusammengeführt, um gemeinsam höhere Stufen zu erreichen

Aktionsseite: GPT-Bonusmonat im Mai .


v1.1.0-20260428

💰 Budget-Verwaltung — Team / Mitglied / API-Key in drei Dimensionen

Aus mündlichen Absprachen werden harte System-Limits. Eine Organisation kann gleichzeitig drei Dimensionen × drei Zeiträume an Ausgabenobergrenzen konfigurieren:

DimensionAnwendungsfall
Team (Organization)Gesamtbudget für Unternehmen oder Projekt
Mitglied (User)Monatliches Kontingent pro Mitarbeiter
API-KeyEigenständiges Budget pro Anwendung oder Service

Jede Dimension lässt sich separat mit täglichen / monatlichen / kumulierten Obergrenzen versehen. Bei Überschreitung werden Anfragen automatisch abgelehnt.

Die Fortschrittsanzeige warnt in drei Stufen:

  • 🟢 40% — normaler Verbrauch
  • 🟡 80% — Annäherung an die Obergrenze
  • 🔴 110% — überschritten (Puffer eingebaut, um plötzliche Spitzen bei hoher Parallelität abzufangen)

Hierarchische Constraints werden automatisch geprüft: API-Key-Limit ≤ Mitglieder-Limit ≤ Team-Limit. Das Frontend zeigt das übergeordnete Kontingent in Echtzeit an, damit Fehlkonfigurationen vermieden werden.

Einstieg: Einstellungen → Kontingente 

⏱️ Team-weite RPM-Kontingente

Neu hinzugekommen ist das team-weite Rate-Limit (RPM), das verhindert, dass mehrere API-Keys zusammen die Quota des Upstream-Anbieters sprengen.

  • RPM wird über das gesamte Team aggregiert berechnet, nicht mehr je Key
  • Standardmäßig 100 RPM. Höhere Frequenzen über [email protected]
  • Überschreitende Anfragen erhalten automatisch 429 Too Many Requests

Typische Szenarien: CI/CD-Lastspitzen, Batch-Jobs ohne Kontrollverlust, einheitliche Limitierung bei Team-Kollaboration.

🪙 Saldoabfrage per OpenAPI

Neu: GET /v1/user/balance. Mit jedem beliebigen OfoxAI-API-Key lassen sich verfügbares Guthaben, kumulierte Einzahlungen und kumulierter Verbrauch abfragen.

Terminal
curl https://api.ofox.ai/v1/user/balance \ -H "Authorization: Bearer $OFOX_API_KEY"

Das Antwortformat ist mit Drittanbieter-Tools wie cc-switch  kompatibel und kann direkt als Saldo-Provider angebunden werden.

🧰 cc-switch-Integration

OfoxAI ist ab sofort nativ mit cc-switch  kompatibel. Wer in cc-switch zu OfoxAI wechselt, sieht den Saldo in Echtzeit — ohne zusätzlichen Entwicklungsaufwand.

cc-switch Konfiguration der OfoxAI-Saldoabfrage

In vier Schritten konfiguriert:

  1. Verbrauchsabfrage öffnen — auf der OfoxAI-Provider-Karte oben rechts auf das 📊-Symbol klicken
  2. Verbrauchsabfrage aktivieren — Schalter umlegen
  3. API-Key eintragen — beliebiger OfoxAI-Nutzer-API-Key (Erstellung im Dashboard )
  4. Endpoint — „Universelle Vorlage” auswählen und als Adresse https://api.ofox.ai/v1 eintragen

Nach dem Speichern zeigt die Provider-Karte sofort den Saldo, etwa Verbleibend: 64.77 USD.

Schritt-für-Schritt-Anleitung: cc-switch-Integrationsleitfaden.


Neue Modelle · 24.04.2026

🤖 Neue Modelle

  • GPT-5.5 (OpenAI) — neues Flaggschiff für anspruchsvolle Fachworkloads, 1M+ Token Kontext (922K Eingabe / 128K Ausgabe), umfassend verbesserte Reasoning-Zuverlässigkeit und Token-Effizienz gegenüber GPT-5.4
  • DeepSeek V4 Pro (DeepSeek) — MoE-Flaggschiff mit 1,6T Gesamt-/49B aktiven Parametern und 1M Token Kontext, optimiert für fortgeschrittenes Reasoning, Code und Long-Range-Agent-Workflows
  • DeepSeek V4 Flash (DeepSeek) — beschleunigte MoE-Variante mit 284B Gesamt-/13B aktiven Parametern und 1M Token Kontext, ausgelegt auf hohen Durchsatz, niedrige Latenz und ein Top-Preis-Leistungs-Verhältnis

Neue Modelle · 21.04.2026

🤖 Neue Modelle

  • Kimi K2.6 (Moonshot AI) — bislang stärkster Kimi, mit umfassenden Verbesserungen bei Code, Reasoning und Bildverständnis
  • GPT Image 2 (OpenAI) — Bildmodell der nächsten Generation mit reicheren Details und höherer Genauigkeit

Neue Modelle · 16.04.2026

🤖 Neue Modelle

  • Claude Opus 4.7 (Anthropic) — neues Anthropic-Flaggschiff, das Reasoning- und Schreibqualität noch einmal anhebt

Aktion · 15.04.2026

🎁 GPT-April-Rebate, bis zu $250 zurück

  • Zeitraum — 15. bis 25. April, elf Tage limitiert
  • Rebate — 25 % Rückerstattung auf den GPT-Verbrauch über alle Modelle, sechs Stufen, bis zu $250
  • Gutschrift — Rebate-Guthaben bleibt dauerhaft gültig und lässt sich nach Aktionsende per Klick einlösen
  • Teams — Mitglieder-Verbrauch wird automatisch zusammengeführt, um gemeinsam höhere Stufen zu erreichen

Aktionsseite: GPT-April-Rebate .


v1.0.55-20260407

🎁 Geschenkkarten-System ist live

Geschenkkartencode auf der Wallet-Seite  eingeben — Guthaben wird sofort gutgeschrieben. Die eleganteste Art, jemandem KI zu schenken.

  • Datenschutz — In den Transaktionsdetails sind nur die letzten vier Stellen der Karte sichtbar
  • Sicherheit — Mehrstufiger Missbrauchsschutz und Ende-zu-Ende-Verschlüsselung halten jede Karte sicher

🔍 Tool zur Modell-Verifikation

Eine klare Positionierung vorab: OfoxAI ist kein Reseller-Gateway.

  • Betreiber — NICE TALK PTE. LTD. (internationale LLM-Plattform)
  • Modell-Lizenzierung — offiziell und konform direkt vom Modellanbieter
  • Compute — Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Engine, direkt vom Cloud-Anbieter
  • Anfrage-Routing — Edge-CDN direkt zu den Cloud-Anbietern, ohne Zwischenstation, ohne Modellaustausch

Damit Nutzer die Authentizität von Modellen bei jedem LLM-Gateway prüfen können, haben wir ein kostenloses Werkzeug veröffentlicht: API-Base und Key eingeben — und sofort sehen, ob das Modell ausgetauscht wurde.

Tool: Modell-Verifikation . Funktioniert mit jeder Plattform, nicht nur OfoxAI.


v1.0.54-20260403

💳 Zahlungen und Top-Ups, neu aufgelegt

  • Airwallex zusätzlich zu Stripe — eine weitere Option, internationale Zahlungen werden geschmeidiger
  • USD, CNY oder SGD — Abrechnung in der Währung, in der Sie ohnehin denken
  • Top-Up-Limit auf $10.000 angehoben — kein Engpass mehr für Großkunden
  • $3 Erst-Top-Up-Bonus über Partner-Empfehlung — wer über einen Partner registriert wird, erhält beim ersten Top-Up automatisch $3 zusätzlich

🏢 Enterprise-Seite — wer mehr nutzt, spart mehr

Erreicht der Monatsverbrauch eine Schwelle, gibt es automatisch Rebate. Kein Antrag, kein Sales-Call, Gutschrift am ersten Tag des Folgemonats.

StufeMonatlicher VerbrauchRebate
Bronze$1.000+3 %
Silver$5.000+4 %
Gold$10.000+5 %
Platinum$20.000+7 %

Kombinierbar mit unseren Enterprise-Funktionen:

  • 0 % Plattformgebühr — Listenpreis des Modellanbieters direkt durchgereicht
  • Globale Edge-Knoten — Tokio / Singapur / Frankfurt
  • 99,99 % Verfügbarkeits-SLA — Multi-Region-Redundanz mit automatischem Failover
  • Keine Inhaltsspeicherung — Prompts und Antworten werden nicht protokolliert und nicht für Trainingszwecke verwendet

Mehr dazu: Enterprise .

🤖 Neue Modelle

  • GLM-5V-Turbo (Zhipu) — Turbo-beschleunigte Variante der multimodalen GLM-Reihe
  • Qwen3.6 Plus (Alibaba Bailian) — neueste Plus-Stufe von Qwen3.6

v1.0.47-20260327

🏷️ Ein Modell, viele Namen

Kurze Aliase, alte IDs — Modelle lassen sich so ansprechen, wie es im Code steht. Plattformwechsel werden zur Nicht-Aktion. Aliase greifen sofort, der Router erkennt sie automatisch.

Ein paar Beispiele:

Kanonische IDAliase
anthropic/claude-opus-4.7claude-opus-4.7 · claude-opus-4-7 · claude-opus-4-7-20260416
anthropic/claude-sonnet-4.6claude-sonnet-4.6 · claude-sonnet-4-6 · claude-sonnet-4-6-20260217
openai/gpt-5.4-progpt-5.4-pro
openai/gpt-5.4gpt-5.4
moonshotai/kimi-k2.6kimi-k2.6
z-ai/glm-5.1glm-5.1

Die vollständige Alias-Liste lässt sich über GET https://api.ofox.ai/v1/models abrufen — das Feld aliases in der Antwort ist sofort einsetzbar.

🖼️ Abrechnung pro generiertem Bild

Die Image-API rechnet jetzt pro generiertem Bild ab, mit transparenten Preisen. Standardgrößen werden automatisch auf die nativen Dimensionen jedes Anbieters gemappt — keine Änderungen am Client-Code nötig.

📊 Bild-Verbrauch sichtbar gemacht

Auf der Console-Startseite sowie in Verbrauch, Kosten und Ranglisten gibt es eine neue Dimension „Bild”. Der monatliche Bildverbrauch ist auf einen Blick erkennbar.

🤖 Neue Modelle

  • GLM 5.1 (Zhipu) — nächste Generation der GLM-Reihe mit umfassenden Verbesserungen der Allgemeinfähigkeiten

Einladungslinks haben jetzt das Format /x/Ihr-Code — leichter zu merken, leichter zu teilen.


v1.0.39-20260320

🔄 Modell-Fallback — automatischer Wechsel bei Fehlern

Wenn das Hauptmodell mit 4xx oder 5xx antwortet, probiert das Gateway automatisch die konfigurierten Fallback-Modelle aus, bis zu drei Stufen tief. Funktioniert übergreifend für OpenAI, Anthropic und Gemini, ohne Änderungen am Client-Code. Details: Fallback-Dokumentation.

⚔️ OfoxAI vs. OpenRouter im direkten Vergleich

OpenRouter berechnet 5,5 % Gebühr pro Top-Up, bei OfoxAI sind es 0 %. Bei gleichem 100+ Modellangebot lassen sich ab $1.000 Monatsverbrauch über 10 % Gesamtkosten sparen. Vollständiger Vergleich: OfoxAI vs. OpenRouter .

🤖 Neue Modelle

  • GLM-5-Turbo (Zhipu) — Turbo-beschleunigte Variante von GLM-5
  • GPT-5.4 Mini / Nano (OpenAI) — leichtgewichtiges GPT-5.4-Duo, deutlich niedrigere Kosten pro Aufruf
  • MiniMax M2.7 / M2.7 Highspeed — neue MiniMax-Generation; Highspeed ist auf niedrige Latenz optimiert

v1.0.36-20260313

🎊 Claude-Rebate im März

Klare 20 % Rebate über alle Stufen. Im Aktions-Pop-up den Coupon-Code OFOXAI2603 mit einem Klick kopieren.

Top-UpRebateSie erhalten
$20$4$24
$50$10$60
$100$20$120
$200$40$240
$500$100$600

Aktionsseite: Claude Spring, Runde 2 .

🤖 Neue Modelle

🖼️ Embeddings über alle Modalitäten

Gemini Embedding unterstützt jetzt Text, Bild, Audio und Video. Direkte Anbindungen an Qwen- und Volcengine-Multimodal-Embeddings sind zeitgleich verfügbar.

⚡ Verbrauchsdaten stündlich aktualisiert

Die Aggregation von Verbrauchsdaten erfolgt nun stündlich statt täglich. Der Verbrauch erscheint kurz nach dem Aufruf im Dashboard.

💰 Bessere Coupon-Anzeige

In der Bestellliste werden Rabatt- und Bonusbeträge jetzt für jede Bestellung vollständig angezeigt.


v1.0.32-20260303

🎉 Claude-Aktion im März ist live

Im Dashboard gibt es einen neuen Aktions-Banner und eine Verbrauchs-Fortschrittsanzeige; Coupon-Fehlermeldungen sind jetzt durchgängig auf Deutsch und Chinesisch lokalisiert. Aktionsseite: Claude Spring, Runde 1 .

🤖 Neue Modelle

🏷️ Frische Navigation


v1.0.30-20260226

🔒 GitHub-Login mit einem Klick

Auf der Login-Seite gibt es jetzt einen GitHub-OAuth-Eintrag — Registrierung und Anmeldung in einem Schritt. Das System merkt sich den zuletzt genutzten Anmeldeweg. In den Einstellungen lassen sich GitHub-Konten verknüpfen, lösen und Profilbilder synchronisieren.

🤖 Neue Modelle

📱 Responsive Mobile-Ansicht

Die Module Nutzer, Organisationen und Bestellungen in der Console sind jetzt vollständig auf Mobilgeräten nutzbar. Die Sidebar lässt sich einklappen, Tabellen passen sich intelligent an, kleine Bildschirme fühlen sich flüssig an.


v1.0.27-20260217

📊 Analyse-Dashboard

Drei interaktive Diagramme für Verbrauch, Kosten und Anfragen. Trends pro Monat, Modell-Rankings, Filter über Provider, Modell, Nutzer, API-Key und Zeitraum frei kombinierbar. Welches Modell ist Ihr Hauptmodell? Auf einen Blick erkennbar.

🤖 Neue Modelle

  • Claude Sonnet 4.6 (Anthropic) — neue Sonnet-Version, das pragmatische Preis-Leistungs-Modell
  • Qwen3.5 Plus (Alibaba Bailian) — Qwen3.5-Plus-Stufe ist live
  • Doubao Seed 2.0 in vier Varianten (Volcengine) — Code  / Lite  / Mini  / Pro , die komplette Doubao-Seed-2.0-Reihe geht zeitgleich live

🌐 Verhalten an OpenAI angeglichen

Wird chat/completions ohne stream aufgerufen, läuft die Antwort jetzt standardmäßig nicht-streamend — exakt wie bei OpenAI. Am Code muss nichts geändert werden.


v1.0.24-20260212

🤖 Neue Modelle

🎊 Willkommen beim ersten Login

Beim ersten Login zeigt das Willkommens-Pop-up alle drei API-Endpoints (OpenAI / Anthropic / Gemini) und unterstützt das Kopieren mit einem Klick. Mit Konfetti-Animation als kleine Geste an Entwickler.

🧠 Provider-Affinity-Cache

Wechselt derselbe Nutzer zwischen verschiedenen Modellen, bevorzugt das Gateway denselben zugrunde liegenden Anbieter. Das erhöht die Trefferquote im Prompt-Cache, beschleunigt Antworten und senkt Kosten.

🎟️ Angel-Einladungssystem

Vollständiges Einladungssystem ist live: kartenbasierte UI, Beitritts-Dialog und Übersichtstabelle der Verwendungen. Beidseitige Belohnungen plus persönliches Einladungs-Poster auf Knopfdruck.


v1.0.20-20260206

🤖 Neue Modelle

  • Claude Opus 4.6 (Anthropic) — neues Anthropic-Flaggschiff, hebt Reasoning- und Schreib-Leistung erneut an

🌍 Sprachumschaltung in einem Klick

Über 1.100 Übersetzungs-Strings — die gesamte Plattform wechselt nahtlos zwischen Deutsch, Englisch und Chinesisch. Die Sprachpräferenz wird per Cookie gespeichert.

🔍 Web Search wird pro Aufruf abgerechnet

Web-Search-Tool-Aufrufe in den Protokollen OpenAI, Anthropic und Gemini werden jetzt präzise pro Aufruf abgerechnet.

📊 Aufgefrischtes Dashboard

  • Personalisierte Begrüßung mit Benutzernamen statt eines generischen „Hi”
  • Verbrauchsstatistik vom Tages- auf Wochensicht umgestellt
  • API-Key-Anzeige in drei Modi: vollständig verborgen, maskiert oder im Klartext

💵 Klarere Preisanzeige

$0.6000 lässt jetzt automatisch die Nullen fallen und wird als $0.6 angezeigt. Fehlermeldungen bei zu niedrigem Saldo erscheinen im Dollar-Format — keine Kopfrechnerei mehr nötig.

📚 Dokumentations-Seite ist live


v1.0.1 ~ v1.0.9 · 20.01. – 01.02.2026 — Zwei Wochen Fundament

In den ersten zwei Wochen nach dem Launch haben wir nicht durchgeatmet. Jedes Release machte die Plattform stabiler, präziser und einfacher anzubinden.

💻 Native Unterstützung für Claude Code

Wir programmieren selbst mit Claude Code. Am 21. Januar haben wir das Gateway vollständig auf Claude Code abgestimmt — API-Base auf OfoxAI ändern, sk-*** einfügen und alle Claude-Modelle laufen sofort.

🧠 Thinking-Reasoning-Chains

Die Thinking-Blöcke (der „Denkprozess” des Modells) von Claude und Gemini werden jetzt protokoll-übergreifend durchgereicht. Sie sehen, wie das Modell denkt — nicht nur, was am Ende dabei herauskommt.

🌐 Natives Gemini-Protokoll

Über die OpenAI-Kompatibilität hinaus läuft jetzt auch Geminis natives generateContent-API. Das offizielle SDK von Google verbindet sich direkt — ohne Übersetzungsverluste.

💵 Mehrwährungs-Stripe

Neben USD gibt es nun CNY, SGD und weitere Währungen. Wechselkurs-Snapshots werden je Bestellung gespeichert. Nutzer im asiatisch-pazifischen Raum zahlen direkt in Lokalwährung.

🎯 Abrechnung mit sechs Nachkommastellen

Präzision auf NanoDollar-Ebene. Selbst wenn ein einzelner API-Aufruf nur Bruchteile eines Cents kostet, wird er exakt erfasst und abgerechnet. Großkunden zahlen nicht zu viel, kleine Kunden nicht zu wenig.


v1.0.0 · 16.01.2026 — The Gateway Goes Live

„Ab heute: 100+ Modelle, ein Key.”

An diesem Tag ist die OfoxAI -Plattform offiziell für die Öffentlichkeit gestartet.

🚀 Launch-Funktionen

  • Drei Protokolle nativOpenAI / Anthropic / Gemini direkt unterstützt, bestehender Code läuft ohne Änderung
  • 100+ Modelle einheitlich angebundenClaude , GPT , Gemini , DeepSeek , Qwen  und über hundert weitere — alle hinter einem Key. Vollständiger Katalog: Model Plaza 
  • Smartes Routing — Routing-Algorithmen auf Provider × Modell-Ebene wählen automatisch den schnellsten und stabilsten Pfad. Details: Provider Routing
  • Self-Service-API-Keys — Im Dashboard  lassen sich Keys mit einem Klick erstellen, deaktivieren und ihr Verbrauch verfolgen
  • Pay-as-you-go, 0 % Plattformgebühr — Listenpreis des Modellanbieters direkt. Preisinformationen: Pricing
  • Stripe-Kreditkartenzahlung — Top-Ups landen in Echtzeit, Saldo jederzeit einsehbar
  • Globale Edge-Knoten — Standorte in Tokio, Singapur und Frankfurt sorgen für Routing in der Nähe

🌐 Die Infrastruktur darunter

Kein Reseller-Gateway, sondern eine Plattform. Anfragen fließen über Edge-CDN direkt zu Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Engine.


Day 1 · 27.12.2025 — How It Began

„Entwicklern den einfachsten Weg geben, die klügsten Modelle der Welt aufzurufen.”

🦊 Die erste Zeile Code

Ende 2025 setzte ein kleiner Commit die erste Zeile Code von OfoxAI:

feat: initialize ofox-studio monorepo

⚡ Der Aha-Moment

Drei Tage später lief beides parallel: Claude auf AWS Bedrock und GPT auf Azure. Zwei Hyperscaler, zwei Top-Modelle, beide direkt angebunden — ohne Zwischenstation.

Als die ersten Antworten beider Strecken gleichzeitig im Terminal erschienen, wussten wir: Das funktioniert.

Das war kein Demo-Adapter, sondern echte Multi-Cloud-Direktanbindung. Danach kamen Google Cloud, Alibaba Cloud, Z.AI, Moonshot und Volcano Engine dazu — die Positionierung „Kein Reseller-Gateway, sondern eine Plattform” stand schon ab Tag 3 fest.

🌱 Der Startpunkt

commit 0001

Eine Zeile Code, eine Richtung. Die klügste Intelligenz der Welt für jeden erreichbar machen.

Triebwerke, zünden.


Last updated on