Changelog

Jeder Schritt von OfoxAI — neue Modelle, neue Funktionen, neue Erlebnisse. Wöchentliche Updates.

Analyse · 16.06.2026

📊 Verbrauch und Kosten in einem Report

Früher lagen „Verbrauch” und „Kosten” auf zwei getrennten Seiten — für den Abgleich musste man ständig hin und her wechseln. Jetzt sind beide zu einer einheitlichen Analyse-Seite zusammengeführt: Wie viel genutzt und wie viel ausgegeben wurde, steht auf einen Blick an einer Stelle.

Überblick auf einem Bildschirm — Aufrufzahl, Verbrauchsbetrag, Token und weitere Kennzahlen gebündelt dargestellt
Mehrdimensionales Drill-down — mit einem Klick nach Modell, Mitglied, API-Key oder Anwendung umschalten
Flexible Filter — frei wählbarer Zeitraum plus kombinierbare Filter; Hauptmodelle und Kostenverteilung sind sofort ersichtlich

Einstieg: Analyse .

v1.2.6-20260605

🔐 IP-Whitelist für API-Keys

Binden Sie einen API-Key an vertrauenswürdige Quell-IPs — selbst wenn der Key geleakt wird, lässt er sich von Adressen außerhalb der Whitelist nicht nutzen.

Unterstützt einzelne IPs und CIDR-Bereiche, bis zu 50 Einträge pro Key
Anfragen von nicht gelisteten Quellen erhalten direkt 403
Leer = keine Einschränkung, bestehende Keys bleiben unberührt

Einstieg: API-Key-Verwaltung → Detailansicht eines Keys.

v1.2.3-20260603

Nach GitHub der zweite Social-Login — für Anmeldung, Registrierung und Konto-Verknüpfung. Gleiche E-Mail-Adressen werden automatisch zusammengeführt, und beim nächsten Mal merkt sich das System den zuletzt genutzten Anmeldeweg.

🎮 Playground ist live

In der Sidebar der Console gibt es jetzt einen Playground-Eintrag: Modelle direkt im Browser ausprobieren, Parameter einstellen und Ergebnisse vergleichen — ohne eine einzige Zeile Code. Einstieg: chat.ofox.ai .

🌐 Sprache folgt dem Konto

Ihre Sprachpräferenz wird im Konto gespeichert — auch beim Gerätewechsel bleibt sie erhalten; sogar System-E-Mails kommen in der von Ihnen gewählten Sprache. In Einstellungen → Konto gibt es eine neue Sprachkarte.

Neue Modelle · 02.06.2026

🤖 Neue Modelle

MiniMax M3 (MiniMax) — neues Flaggschiff von MiniMax
Qwen3.7 Plus (Alibaba Bailian) — Qwen3.7-Plus-Stufe, direkt über die Protokolle OpenAI / Anthropic / Gemini
xAI-Grok-Reihe ist jetzt live — Grok 4.3 und weitere xAI-Modelle sind im Model Plaza verfügbar

Aktion · 01.06.2026

🎁 Juni: 15 % Rabatt auf alle GPT-Modelle

Den ganzen Juni über 15 % Rabatt auf die gesamte GPT-Reihe, vom 1.6. bis 1.7. Kein Gutscheincode nötig — der Rabatt wird beim Bezahlen automatisch angewendet. Modellkatalog: GPT-Reihe .

v1.1.9-20260529

🌏 Japanische Oberfläche ist live

Die Plattform-Oberfläche gibt es jetzt auch auf Japanisch (ja) — damit stehen vier Sprachen zur Verfügung: English / 简体中文 / Русский / 日本語. Der Sprachumschalter nutzt nun ein 🌐-Symbol und zeigt jede Sprache in ihrer eigenen Schreibweise an, was die Auswahl intuitiver macht.

🤖 Neue Modelle

Claude Opus 4.8 (Anthropic) — neues Anthropic-Flaggschiff, das Reasoning- und Schreibqualität noch einmal anhebt

Neue Modelle · 22.05.2026

🤖 Neue Modelle

Qwen3.7 Max (Alibaba Bailian) — stärkste Qwen3.7-Stufe, direkt über die Protokolle OpenAI / Anthropic / Gemini

Neue Modelle · 20.05.2026

🤖 Neue Modelle

Gemini 3.5 Flash (Google) — Highspeed-Variante von Gemini 3.5
Gemini 3.1 Flash Lite (Google) — leichtere und sparsamere Flash-Lite-Stufe

v1.1.6-20260519

🧾 Rechnungsadresse selbst bearbeiten, sofort aktualisiert

Rechnungen und Belege sind überarbeitet — über die Rechnungsdaten bestimmen Sie.

Rechnungsadresse selbst pflegen — Firmenname, Steuernummer, Adresse und weitere Rechnungsdaten hinterlegen; sie erscheinen automatisch auf der Rechnung. Nach einer Änderung neu generieren, und die neue Rechnung ist sofort aktuell
Echte Zahlungsmethode — Belege zeigen die tatsächlich genutzte Zahlungsart wie Visa ····4242 oder WeChat Pay
Mehrwährungs-Details — die tatsächliche Abbuchungswährung und der Wechselkurs werden ausgewiesen (z. B. 1 SGD = 5.5654 CNY)
Jederzeit exportieren — Rechnungs- und Beleglinks bleiben dauerhaft gültig und lassen sich direkt aus dem Browser als PDF drucken

Einstieg: Wallet-Seite → Bestellung → Rechnung ansehen; die Rechnungsadresse pflegen Sie unter Einstellungen → Organisation .

v1.1.5-20260514

🔐 Drittanbieter-Apps mit dem OfoxAI-Konto autorisieren (OAuth)

Drittanbieter-Apps und KI-Agenten lassen sich jetzt per Standard-OAuth mit Ihrem OfoxAI-Konto verbinden — Sie müssen ihnen keinen API-Key mehr direkt aushändigen.

Einmal autorisieren, sicher aufrufen — nach der Freigabe kann die App in Ihrem Namen Modelle aufrufen sowie Saldo, Verbrauch und Limits abfragen
Präzise Zuordnung — jeder Aufruf wird einer konkreten App zugeordnet, Verbrauch und Kosten sind glasklar nachvollziehbar
Jederzeit widerrufen — autorisierte Apps in der Console verwalten und Berechtigungen mit einem Klick zurückziehen
Auch für Kommandozeilen-Tools — mit Device-Code-Flow melden sich auch CLI- und Terminal-Tools reibungslos an

Damit steht eine einheitliche Login- und Autorisierungsbasis für das Tool- und Agent-Ökosystem rund um OfoxAI.

Neue Funktionen · 07.05.2026

🎙️ Audio-Transkription (Sprache zu Text)

Neu sind die OpenAI-Modelle zur Audio-Transkription — Aufnahmen und Sprache direkt in Text umwandeln, aufrufbar über das gewohnte OpenAI-kompatible Protokoll: GPT-4o Mini Transcribe und GPT-4o Transcribe Diarize (mit Sprecher-Diarisierung).

v1.1.4-20260502

🎁 GPT-Bonusmonat im Mai

Cashback auf den Verbrauch der gesamten GPT-Reihe, sechs Stufen, bis zu $250 zurück.

Aktionszeitraum — 1.5. bis 15.5.
Einlösezeitraum — 16.5. bis 18.5.
Abdeckung — die komplette GPT-Reihe, darunter GPT-5.5, die gesamte GPT-5.4-Familie und GPT Image 2
Teams — Mitglieder-Verbrauch wird automatisch zusammengeführt, um gemeinsam höhere Stufen zu erreichen

Aktionsseite: GPT-Bonusmonat im Mai .

v1.1.0-20260428

💰 Budget-Verwaltung — Team / Mitglied / API-Key in drei Dimensionen

Aus mündlichen Absprachen werden harte System-Limits. Eine Organisation kann gleichzeitig drei Dimensionen × drei Zeiträume an Ausgabenobergrenzen konfigurieren:

Dimension	Anwendungsfall
Team (Organization)	Gesamtbudget für Unternehmen oder Projekt
Mitglied (User)	Monatliches Kontingent pro Mitarbeiter
API-Key	Eigenständiges Budget pro Anwendung oder Service

Jede Dimension lässt sich separat mit täglichen / monatlichen / kumulierten Obergrenzen versehen. Bei Überschreitung werden Anfragen automatisch abgelehnt.

Die Fortschrittsanzeige warnt in drei Stufen:

🟢 40% — normaler Verbrauch
🟡 80% — Annäherung an die Obergrenze
🔴 110% — überschritten (Puffer eingebaut, um plötzliche Spitzen bei hoher Parallelität abzufangen)

Hierarchische Constraints werden automatisch geprüft: API-Key-Limit ≤ Mitglieder-Limit ≤ Team-Limit. Das Frontend zeigt das übergeordnete Kontingent in Echtzeit an, damit Fehlkonfigurationen vermieden werden.

Einstieg: Einstellungen → Kontingente

⏱️ Team-weite RPM-Kontingente

Neu hinzugekommen ist das team-weite Rate-Limit (RPM), das verhindert, dass mehrere API-Keys zusammen die Quota des Upstream-Anbieters sprengen.

RPM wird über das gesamte Team aggregiert berechnet, nicht mehr je Key
Standardmäßig 100 RPM. Höhere Frequenzen über [email protected]
Überschreitende Anfragen erhalten automatisch 429 Too Many Requests

Typische Szenarien: CI/CD-Lastspitzen, Batch-Jobs ohne Kontrollverlust, einheitliche Limitierung bei Team-Kollaboration.

🪙 Saldoabfrage per OpenAPI

Neu: GET /v1/user/balance. Mit jedem beliebigen OfoxAI-API-Key lassen sich verfügbares Guthaben, kumulierte Einzahlungen und kumulierter Verbrauch abfragen.

Terminal


curl https://api.ofox.ai/v1/user/balance \
  -H "Authorization: Bearer $OFOX_API_KEY"

Das Antwortformat ist mit Drittanbieter-Tools wie cc-switch kompatibel und kann direkt als Saldo-Provider angebunden werden.

🧰 cc-switch-Integration

OfoxAI ist ab sofort nativ mit cc-switch kompatibel. Wer in cc-switch zu OfoxAI wechselt, sieht den Saldo in Echtzeit — ohne zusätzlichen Entwicklungsaufwand.

cc-switch Konfiguration der OfoxAI-Saldoabfrage

In vier Schritten konfiguriert:

Verbrauchsabfrage öffnen — auf der OfoxAI-Provider-Karte oben rechts auf das 📊-Symbol klicken
Verbrauchsabfrage aktivieren — Schalter umlegen
API-Key eintragen — beliebiger OfoxAI-Nutzer-API-Key (Erstellung im Dashboard )
Endpoint — „Universelle Vorlage” auswählen und als Adresse https://api.ofox.ai/v1 eintragen

Nach dem Speichern zeigt die Provider-Karte sofort den Saldo, etwa Verbleibend: 64.77 USD.

Schritt-für-Schritt-Anleitung: cc-switch-Integrationsleitfaden.

Neue Modelle · 24.04.2026

🤖 Neue Modelle

GPT-5.5 (OpenAI) — neues Flaggschiff für anspruchsvolle Fachworkloads, 1M+ Token Kontext (922K Eingabe / 128K Ausgabe), umfassend verbesserte Reasoning-Zuverlässigkeit und Token-Effizienz gegenüber GPT-5.4
DeepSeek V4 Pro (DeepSeek) — MoE-Flaggschiff mit 1,6T Gesamt-/49B aktiven Parametern und 1M Token Kontext, optimiert für fortgeschrittenes Reasoning, Code und Long-Range-Agent-Workflows
DeepSeek V4 Flash (DeepSeek) — beschleunigte MoE-Variante mit 284B Gesamt-/13B aktiven Parametern und 1M Token Kontext, ausgelegt auf hohen Durchsatz, niedrige Latenz und ein Top-Preis-Leistungs-Verhältnis

Neue Modelle · 21.04.2026

🤖 Neue Modelle

Kimi K2.6 (Moonshot AI) — bislang stärkster Kimi, mit umfassenden Verbesserungen bei Code, Reasoning und Bildverständnis
GPT Image 2 (OpenAI) — Bildmodell der nächsten Generation mit reicheren Details und höherer Genauigkeit

Neue Modelle · 16.04.2026

🤖 Neue Modelle

Claude Opus 4.7 (Anthropic) — neues Anthropic-Flaggschiff, das Reasoning- und Schreibqualität noch einmal anhebt

Aktion · 15.04.2026

🎁 GPT-April-Rebate, bis zu $250 zurück

Zeitraum — 15. bis 25. April, elf Tage limitiert
Rebate — 25 % Rückerstattung auf den GPT-Verbrauch über alle Modelle, sechs Stufen, bis zu $250
Gutschrift — Rebate-Guthaben bleibt dauerhaft gültig und lässt sich nach Aktionsende per Klick einlösen
Teams — Mitglieder-Verbrauch wird automatisch zusammengeführt, um gemeinsam höhere Stufen zu erreichen

Aktionsseite: GPT-April-Rebate .

v1.0.55-20260407

🎁 Geschenkkarten-System ist live

Geschenkkartencode auf der Wallet-Seite eingeben — Guthaben wird sofort gutgeschrieben. Die eleganteste Art, jemandem KI zu schenken.

Datenschutz — In den Transaktionsdetails sind nur die letzten vier Stellen der Karte sichtbar
Sicherheit — Mehrstufiger Missbrauchsschutz und Ende-zu-Ende-Verschlüsselung halten jede Karte sicher

🔍 Tool zur Modell-Verifikation

Eine klare Positionierung vorab: OfoxAI ist kein Reseller-Gateway.

Betreiber — NICE TALK PTE. LTD. (internationale LLM-Plattform)
Modell-Lizenzierung — offiziell und konform direkt vom Modellanbieter
Compute — Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Engine, direkt vom Cloud-Anbieter
Anfrage-Routing — Edge-CDN direkt zu den Cloud-Anbietern, ohne Zwischenstation, ohne Modellaustausch

Damit Nutzer die Authentizität von Modellen bei jedem LLM-Gateway prüfen können, haben wir ein kostenloses Werkzeug veröffentlicht: API-Base und Key eingeben — und sofort sehen, ob das Modell ausgetauscht wurde.

Tool: Modell-Verifikation . Funktioniert mit jeder Plattform, nicht nur OfoxAI.

v1.0.54-20260403

💳 Zahlungen und Top-Ups, neu aufgelegt

Airwallex zusätzlich zu Stripe — eine weitere Option, internationale Zahlungen werden geschmeidiger
USD, CNY oder SGD — Abrechnung in der Währung, in der Sie ohnehin denken
Top-Up-Limit auf $10.000 angehoben — kein Engpass mehr für Großkunden
$3 Erst-Top-Up-Bonus über Partner-Empfehlung — wer über einen Partner registriert wird, erhält beim ersten Top-Up automatisch $3 zusätzlich

🏢 Enterprise-Seite — wer mehr nutzt, spart mehr

Erreicht der Monatsverbrauch eine Schwelle, gibt es automatisch Rebate. Kein Antrag, kein Sales-Call, Gutschrift am ersten Tag des Folgemonats.

Stufe	Monatlicher Verbrauch	Rebate
Bronze	$1.000+	3 %
Silver	$5.000+	4 %
Gold	$10.000+	5 %
Platinum	$20.000+	7 %

Kombinierbar mit unseren Enterprise-Funktionen:

0 % Plattformgebühr — Listenpreis des Modellanbieters direkt durchgereicht
Globale Edge-Knoten — Tokio / Singapur / Frankfurt
99,99 % Verfügbarkeits-SLA — Multi-Region-Redundanz mit automatischem Failover
Keine Inhaltsspeicherung — Prompts und Antworten werden nicht protokolliert und nicht für Trainingszwecke verwendet

Mehr dazu: Enterprise .

🤖 Neue Modelle

GLM-5V-Turbo (Zhipu) — Turbo-beschleunigte Variante der multimodalen GLM-Reihe
Qwen3.6 Plus (Alibaba Bailian) — neueste Plus-Stufe von Qwen3.6

v1.0.47-20260327

🏷️ Ein Modell, viele Namen

Kurze Aliase, alte IDs — Modelle lassen sich so ansprechen, wie es im Code steht. Plattformwechsel werden zur Nicht-Aktion. Aliase greifen sofort, der Router erkennt sie automatisch.

Ein paar Beispiele:

Kanonische ID	Aliase
`anthropic/claude-opus-4.7`	`claude-opus-4.7` · `claude-opus-4-7` · `claude-opus-4-7-20260416`
`anthropic/claude-sonnet-4.6`	`claude-sonnet-4.6` · `claude-sonnet-4-6` · `claude-sonnet-4-6-20260217`
`openai/gpt-5.4-pro`	`gpt-5.4-pro`
`openai/gpt-5.4`	`gpt-5.4`
`moonshotai/kimi-k2.6`	`kimi-k2.6`
`z-ai/glm-5.1`	`glm-5.1`

Die vollständige Alias-Liste lässt sich über GET https://api.ofox.ai/v1/models abrufen — das Feld aliases in der Antwort ist sofort einsetzbar.

🖼️ Abrechnung pro generiertem Bild

Die Image-API rechnet jetzt pro generiertem Bild ab, mit transparenten Preisen. Standardgrößen werden automatisch auf die nativen Dimensionen jedes Anbieters gemappt — keine Änderungen am Client-Code nötig.

📊 Bild-Verbrauch sichtbar gemacht

Auf der Console-Startseite sowie in Verbrauch, Kosten und Ranglisten gibt es eine neue Dimension „Bild”. Der monatliche Bildverbrauch ist auf einen Blick erkennbar.

🤖 Neue Modelle

GLM 5.1 (Zhipu) — nächste Generation der GLM-Reihe mit umfassenden Verbesserungen der Allgemeinfähigkeiten

🔗 Kürzere Einladungslinks

Einladungslinks haben jetzt das Format /x/Ihr-Code — leichter zu merken, leichter zu teilen.

v1.0.39-20260320

🔄 Modell-Fallback — automatischer Wechsel bei Fehlern

Wenn das Hauptmodell mit 4xx oder 5xx antwortet, probiert das Gateway automatisch die konfigurierten Fallback-Modelle aus, bis zu drei Stufen tief. Funktioniert übergreifend für OpenAI, Anthropic und Gemini, ohne Änderungen am Client-Code. Details: Fallback-Dokumentation.

⚔️ OfoxAI vs. OpenRouter im direkten Vergleich

OpenRouter berechnet 5,5 % Gebühr pro Top-Up, bei OfoxAI sind es 0 %. Bei gleichem 100+ Modellangebot lassen sich ab $1.000 Monatsverbrauch über 10 % Gesamtkosten sparen. Vollständiger Vergleich: OfoxAI vs. OpenRouter .

🤖 Neue Modelle

GLM-5-Turbo (Zhipu) — Turbo-beschleunigte Variante von GLM-5
GPT-5.4 Mini / Nano (OpenAI) — leichtgewichtiges GPT-5.4-Duo, deutlich niedrigere Kosten pro Aufruf
MiniMax M2.7 / M2.7 Highspeed — neue MiniMax-Generation; Highspeed ist auf niedrige Latenz optimiert

v1.0.36-20260313

🎊 Claude-Rebate im März

Klare 20 % Rebate über alle Stufen. Im Aktions-Pop-up den Coupon-Code OFOXAI2603 mit einem Klick kopieren.

Top-Up	Rebate	Sie erhalten
$20	$4	$24
$50	$10	$60
$100	$20	$120
$200	$40	$240
$500	$100	$600

Aktionsseite: Claude Spring, Runde 2 .

🤖 Neue Modelle

GPT-5.4 / GPT-5.4 Pro (OpenAI) — neues Flaggschiff-Duo, Pro mit höherem Reasoning-Plafond
Gemini Embedding 2 Preview (Google) — Googles nächste Generation multimodaler Embedding-Modelle

🖼️ Embeddings über alle Modalitäten

Gemini Embedding unterstützt jetzt Text, Bild, Audio und Video. Direkte Anbindungen an Qwen- und Volcengine-Multimodal-Embeddings sind zeitgleich verfügbar.

⚡ Verbrauchsdaten stündlich aktualisiert

Die Aggregation von Verbrauchsdaten erfolgt nun stündlich statt täglich. Der Verbrauch erscheint kurz nach dem Aufruf im Dashboard.

💰 Bessere Coupon-Anzeige

In der Bestellliste werden Rabatt- und Bonusbeträge jetzt für jede Bestellung vollständig angezeigt.

v1.0.32-20260303

🎉 Claude-Aktion im März ist live

Im Dashboard gibt es einen neuen Aktions-Banner und eine Verbrauchs-Fortschrittsanzeige; Coupon-Fehlermeldungen sind jetzt durchgängig auf Deutsch und Chinesisch lokalisiert. Aktionsseite: Claude Spring, Runde 1 .

🤖 Neue Modelle

GPT-5.3 Chat (OpenAI) — auf Konversation optimierte Variante von GPT-5.3
Gemini 3.1 Flash Lite Preview (Google) — leichtgewichtige Vorschau von Gemini 3.1
Nano Banana 2 (Google) — Gemini 3.1 Flash Image Preview, Bildgenerierung der nächsten Generation

„Mein Billing” → „Meine Wallet”, passender zur tatsächlichen Nutzung
„Modelle” → „Model Plaza”, als Katalog zum Stöbern positioniert
Neuer Blog-Eintrag im Header

v1.0.30-20260226

Auf der Login-Seite gibt es jetzt einen GitHub-OAuth-Eintrag — Registrierung und Anmeldung in einem Schritt. Das System merkt sich den zuletzt genutzten Anmeldeweg. In den Einstellungen lassen sich GitHub-Konten verknüpfen, lösen und Profilbilder synchronisieren.

🤖 Neue Modelle

Komplette Qwen3.5-Familie auf einen Schlag (Alibaba Bailian) — Flash / 27B / 35B A3B / 122B A10B / 397B A17B
GPT-5.3 Codex (OpenAI) — GPT-5.3 für Code-Aufgaben
Gemini 3.1 Pro Preview (Google) — Vorschau von Gemini 3.1 Pro
Qwen3 Coder Next (Alibaba Bailian) — neues Code-spezialisiertes Modell aus der Qwen-Reihe

📱 Responsive Mobile-Ansicht

Die Module Nutzer, Organisationen und Bestellungen in der Console sind jetzt vollständig auf Mobilgeräten nutzbar. Die Sidebar lässt sich einklappen, Tabellen passen sich intelligent an, kleine Bildschirme fühlen sich flüssig an.

v1.0.27-20260217

📊 Analyse-Dashboard

Drei interaktive Diagramme für Verbrauch, Kosten und Anfragen. Trends pro Monat, Modell-Rankings, Filter über Provider, Modell, Nutzer, API-Key und Zeitraum frei kombinierbar. Welches Modell ist Ihr Hauptmodell? Auf einen Blick erkennbar.

🤖 Neue Modelle

Claude Sonnet 4.6 (Anthropic) — neue Sonnet-Version, das pragmatische Preis-Leistungs-Modell
Qwen3.5 Plus (Alibaba Bailian) — Qwen3.5-Plus-Stufe ist live
Doubao Seed 2.0 in vier Varianten (Volcengine) — Code / Lite / Mini / Pro , die komplette Doubao-Seed-2.0-Reihe geht zeitgleich live

🌐 Verhalten an OpenAI angeglichen

Wird chat/completions ohne stream aufgerufen, läuft die Antwort jetzt standardmäßig nicht-streamend — exakt wie bei OpenAI. Am Code muss nichts geändert werden.

v1.0.24-20260212

🤖 Neue Modelle

GLM-5 (Zhipu) — neues Flaggschiff der GLM-Reihe
MiniMax M2.5 / M2.5 Lightning — MiniMax-Duo, Lightning ist auf niedrige Latenz optimiert

Beim ersten Login zeigt das Willkommens-Pop-up alle drei API-Endpoints (OpenAI / Anthropic / Gemini) und unterstützt das Kopieren mit einem Klick. Mit Konfetti-Animation als kleine Geste an Entwickler.

🧠 Provider-Affinity-Cache

Wechselt derselbe Nutzer zwischen verschiedenen Modellen, bevorzugt das Gateway denselben zugrunde liegenden Anbieter. Das erhöht die Trefferquote im Prompt-Cache, beschleunigt Antworten und senkt Kosten.

🎟️ Angel-Einladungssystem

Vollständiges Einladungssystem ist live: kartenbasierte UI, Beitritts-Dialog und Übersichtstabelle der Verwendungen. Beidseitige Belohnungen plus persönliches Einladungs-Poster auf Knopfdruck.

v1.0.20-20260206

🤖 Neue Modelle

Claude Opus 4.6 (Anthropic) — neues Anthropic-Flaggschiff, hebt Reasoning- und Schreib-Leistung erneut an

🌍 Sprachumschaltung in einem Klick

Über 1.100 Übersetzungs-Strings — die gesamte Plattform wechselt nahtlos zwischen Deutsch, Englisch und Chinesisch. Die Sprachpräferenz wird per Cookie gespeichert.

🔍 Web Search wird pro Aufruf abgerechnet

Web-Search-Tool-Aufrufe in den Protokollen OpenAI, Anthropic und Gemini werden jetzt präzise pro Aufruf abgerechnet.

📊 Aufgefrischtes Dashboard

Personalisierte Begrüßung mit Benutzernamen statt eines generischen „Hi”
Verbrauchsstatistik vom Tages- auf Wochensicht umgestellt
API-Key-Anzeige in drei Modi: vollständig verborgen, maskiert oder im Klartext

💵 Klarere Preisanzeige

$0.6000 lässt jetzt automatisch die Nullen fallen und wird als $0.6 angezeigt. Fehlermeldungen bei zu niedrigem Saldo erscheinen im Dollar-Format — keine Kopfrechnerei mehr nötig.

📚 Dokumentations-Seite ist live

Vollständige Protokoll-Referenzen für OpenAI, Anthropic und Gemini
Integrationsleitfäden für 10+ Tools: Claude Code, Codex, Gemini CLI, Zed, Cline, Cherry Studio, OpenClaw, OpenCode und mehr — von der Konfiguration bis zum laufenden Setup vollständig abgedeckt

v1.0.1 ~ v1.0.9 · 20.01. – 01.02.2026 — Zwei Wochen Fundament

In den ersten zwei Wochen nach dem Launch haben wir nicht durchgeatmet. Jedes Release machte die Plattform stabiler, präziser und einfacher anzubinden.

💻 Native Unterstützung für Claude Code

Wir programmieren selbst mit Claude Code. Am 21. Januar haben wir das Gateway vollständig auf Claude Code abgestimmt — API-Base auf OfoxAI ändern, sk-*** einfügen und alle Claude-Modelle laufen sofort.

🧠 Thinking-Reasoning-Chains

Die Thinking-Blöcke (der „Denkprozess” des Modells) von Claude und Gemini werden jetzt protokoll-übergreifend durchgereicht. Sie sehen, wie das Modell denkt — nicht nur, was am Ende dabei herauskommt.

🌐 Natives Gemini-Protokoll

Über die OpenAI-Kompatibilität hinaus läuft jetzt auch Geminis natives generateContent-API. Das offizielle SDK von Google verbindet sich direkt — ohne Übersetzungsverluste.

💵 Mehrwährungs-Stripe

Neben USD gibt es nun CNY, SGD und weitere Währungen. Wechselkurs-Snapshots werden je Bestellung gespeichert. Nutzer im asiatisch-pazifischen Raum zahlen direkt in Lokalwährung.

🎯 Abrechnung mit sechs Nachkommastellen

Präzision auf NanoDollar-Ebene. Selbst wenn ein einzelner API-Aufruf nur Bruchteile eines Cents kostet, wird er exakt erfasst und abgerechnet. Großkunden zahlen nicht zu viel, kleine Kunden nicht zu wenig.

v1.0.0 · 16.01.2026 — The Gateway Goes Live

„Ab heute: 100+ Modelle, ein Key.”

An diesem Tag ist die OfoxAI -Plattform offiziell für die Öffentlichkeit gestartet.

🚀 Launch-Funktionen

Drei Protokolle nativ — OpenAI / Anthropic / Gemini direkt unterstützt, bestehender Code läuft ohne Änderung
100+ Modelle einheitlich angebunden — Claude , GPT , Gemini , DeepSeek , Qwen und über hundert weitere — alle hinter einem Key. Vollständiger Katalog: Model Plaza
Smartes Routing — Routing-Algorithmen auf Provider × Modell-Ebene wählen automatisch den schnellsten und stabilsten Pfad. Details: Provider Routing
Self-Service-API-Keys — Im Dashboard lassen sich Keys mit einem Klick erstellen, deaktivieren und ihr Verbrauch verfolgen
Pay-as-you-go, 0 % Plattformgebühr — Listenpreis des Modellanbieters direkt. Preisinformationen: Pricing
Stripe-Kreditkartenzahlung — Top-Ups landen in Echtzeit, Saldo jederzeit einsehbar
Globale Edge-Knoten — Standorte in Tokio, Singapur und Frankfurt sorgen für Routing in der Nähe

🌐 Die Infrastruktur darunter

Kein Reseller-Gateway, sondern eine Plattform. Anfragen fließen über Edge-CDN direkt zu Azure / AWS / Google Cloud / Alibaba Cloud / Z.AI / Moonshot / Volcano Engine.

Day 1 · 27.12.2025 — How It Began

„Entwicklern den einfachsten Weg geben, die klügsten Modelle der Welt aufzurufen.”

🦊 Die erste Zeile Code

Ende 2025 setzte ein kleiner Commit die erste Zeile Code von OfoxAI:


feat: initialize ofox-studio monorepo

⚡ Der Aha-Moment

Drei Tage später lief beides parallel: Claude auf AWS Bedrock und GPT auf Azure. Zwei Hyperscaler, zwei Top-Modelle, beide direkt angebunden — ohne Zwischenstation.

Als die ersten Antworten beider Strecken gleichzeitig im Terminal erschienen, wussten wir: Das funktioniert.

Das war kein Demo-Adapter, sondern echte Multi-Cloud-Direktanbindung. Danach kamen Google Cloud, Alibaba Cloud, Z.AI, Moonshot und Volcano Engine dazu — die Positionierung „Kein Reseller-Gateway, sondern eine Plattform” stand schon ab Tag 3 fest.

🌱 Der Startpunkt

commit 0001

Eine Zeile Code, eine Richtung. Die klügste Intelligenz der Welt für jeden erreichbar machen.

Triebwerke, zünden.

Changelog

Analyse · 16.06.2026

📊 Verbrauch und Kosten in einem Report

v1.2.6-20260605

🔐 IP-Whitelist für API-Keys

v1.2.3-20260603

🟢 Google-Login mit einem Klick

🎮 Playground ist live

🌐 Sprache folgt dem Konto

Neue Modelle · 02.06.2026

🤖 Neue Modelle

Aktion · 01.06.2026

🎁 Juni: 15 % Rabatt auf alle GPT-Modelle

v1.1.9-20260529

🌏 Japanische Oberfläche ist live

🤖 Neue Modelle

Neue Modelle · 22.05.2026

🤖 Neue Modelle

Neue Modelle · 20.05.2026

🤖 Neue Modelle

v1.1.6-20260519

🧾 Rechnungsadresse selbst bearbeiten, sofort aktualisiert

v1.1.5-20260514

🔐 Drittanbieter-Apps mit dem OfoxAI-Konto autorisieren (OAuth)

Neue Funktionen · 07.05.2026

🎙️ Audio-Transkription (Sprache zu Text)

v1.1.4-20260502

🎁 GPT-Bonusmonat im Mai

v1.1.0-20260428

💰 Budget-Verwaltung — Team / Mitglied / API-Key in drei Dimensionen

⏱️ Team-weite RPM-Kontingente

🪙 Saldoabfrage per OpenAPI

🧰 cc-switch-Integration

Neue Modelle · 24.04.2026

🤖 Neue Modelle

Neue Modelle · 21.04.2026

🤖 Neue Modelle

Neue Modelle · 16.04.2026

🤖 Neue Modelle

Aktion · 15.04.2026

🎁 GPT-April-Rebate, bis zu $250 zurück

v1.0.55-20260407

🎁 Geschenkkarten-System ist live

🔍 Tool zur Modell-Verifikation

v1.0.54-20260403

💳 Zahlungen und Top-Ups, neu aufgelegt

🏢 Enterprise-Seite — wer mehr nutzt, spart mehr

🤖 Neue Modelle

v1.0.47-20260327

🏷️ Ein Modell, viele Namen

🖼️ Abrechnung pro generiertem Bild

📊 Bild-Verbrauch sichtbar gemacht

🤖 Neue Modelle

🔗 Kürzere Einladungslinks

v1.0.39-20260320

🔄 Modell-Fallback — automatischer Wechsel bei Fehlern

⚔️ OfoxAI vs. OpenRouter im direkten Vergleich

🤖 Neue Modelle

v1.0.36-20260313

🎊 Claude-Rebate im März

🤖 Neue Modelle

🖼️ Embeddings über alle Modalitäten

⚡ Verbrauchsdaten stündlich aktualisiert

💰 Bessere Coupon-Anzeige

v1.0.32-20260303

🎉 Claude-Aktion im März ist live

🤖 Neue Modelle

🏷️ Frische Navigation

v1.0.30-20260226

🔒 GitHub-Login mit einem Klick

🤖 Neue Modelle

📱 Responsive Mobile-Ansicht

v1.0.27-20260217

📊 Analyse-Dashboard

🤖 Neue Modelle

🌐 Verhalten an OpenAI angeglichen

v1.0.24-20260212

🤖 Neue Modelle

🎊 Willkommen beim ersten Login

🧠 Provider-Affinity-Cache