更新日誌

OfoxAI 的每一步——新模型、新功能、新體驗。按週更新。

數據分析 · 2026-06-16

📊 用量與費用，合併成一張報表

以前「用量」和「費用」分兩個頁面看，對帳得來回切。現在合併為統一的數據分析頁，「用了多少」和「花了多少」在同一處一眼看全。

概覽同頁 — 呼叫量、消耗金額、Token 等關鍵指標集中展示
多維鑽取 — 按模型 / 成員 / API Key / 應用一鍵切換查看
彈性篩選 — 自訂時間範圍 + 組合篩選，主力模型與成本分布一目了然

入口：數據分析。

v1.2.6-20260605

🔐 API Key IP 白名單

為 API Key 綁定可信來源 IP，即使 Key 外洩，非白名單的位址也無法呼叫。

支援 單一 IP + CIDR 網段，每個 Key 最多 50 條
非白名單來源請求直接回傳 403
留空 = 不限制，現有 Key 不受影響

入口：API Key 管理 → 個別 Key 詳情。

v1.2.3-20260603

🟢 Google 一鍵登入

繼 GitHub 之後第二個社群登入入口，支援登入 / 註冊 / 帳號綁定。同信箱自動關聯，下次自動記住上次的登入方式。

🎮 Playground 上線

控制台側邊欄新增 Playground 入口，瀏覽器裡直接試模型、調參數、比較效果，不用寫一行程式碼。入口：chat.ofox.ai 。

🌐 介面語言跟著帳號走

語言偏好記到帳戶裡，換裝置也記得；連系統郵件也會用你設定的語言寄送。設定 → 帳戶新增語言卡片。

新模型 · 2026-06-02

🤖 新模型

MiniMax M3（MiniMax）— MiniMax 新一代旗艦
Qwen3.7 Plus（阿里百煉）— Qwen3.7 Plus 規格，三協定直連
xAI Grok 系列現已上線 — Grok 4.3 等 xAI 模型已進入模型廣場

活動 · 2026-06-01

🎁 6 月 GPT 全站 85 折

整月 GPT 全系列 85 折（結帳自動折抵，全 GPT 系列），6/1 ~ 7/1。無需優惠碼，下單自動生效。模型目錄：GPT 系列。

v1.1.9-20260529

🌏 日語介面上線

平台介面新增日語 (ja)，現已支援 English / 简体中文 / Русский / 日本語 四語。語言切換器改用 🌐 圖示 + 母語全名顯示，切換更直覺。

🤖 新模型

Claude Opus 4.8（Anthropic）— Anthropic 新一代旗艦，推理與寫作能力再上台階

新模型 · 2026-05-22

🤖 新模型

Qwen3.7 Max（阿里百煉）— Qwen3.7 最強規格，OpenAI / Anthropic / Gemini 三協定直連

新模型 · 2026-05-20

🤖 新模型

Gemini 3.5 Flash（Google）— Gemini 3.5 高速版
Gemini 3.1 Flash Lite（Google）— 更輕更省的 Flash Lite 規格

v1.1.6-20260519

🧾 發票抬頭自己改，改完即時更新

發票與收據升級，帳單資訊你說了算。

抬頭自己填 — 維護公司名稱、統一編號、地址等帳單資訊，發票自動帶上；改完重新產生，新發票即時更新
真實付款方式 — 收據如實顯示 Visa ····4242、微信支付 等實際付款方式
跨幣別明細 — 標明真實扣款幣別與匯率（如 1 SGD = 5.5654 CNY）
隨時匯出 — 發票 / 收據連結長期有效，瀏覽器直接列印成 PDF

入口：錢包頁 → 訂單 → 查看發票；帳單抬頭在設定 → 組織維護。

v1.1.5-20260514

🔐 用 OfoxAI 帳號授權第三方應用程式（OAuth）

第三方應用程式和 AI Agent 現在可以透過標準 OAuth 授權接入你的 OfoxAI 帳號——不用再把 API Key 直接交給它們。

一次授權，安全呼叫 — 授權後應用程式即可代你呼叫模型，並查詢餘額、用量與額度
精確歸屬 — 每一筆呼叫都對應到具體應用程式，用量與花費看得清清楚楚
隨時撤銷 — 在控制台管理已授權的應用程式，一鍵收回權限
涵蓋命令列工具 — 支援裝置碼授權，CLI / 終端機類工具也能順暢登入

為接入 OfoxAI 的工具與 Agent 生態打下統一的登入與授權基礎。

新功能 · 2026-05-07

🎙️ 音訊轉錄（語音轉文字）

新增 OpenAI 音訊轉錄模型，把錄音 / 語音直接轉成文字，沿用 OpenAI 相容協定即可呼叫：GPT-4o Mini Transcribe 、GPT-4o Transcribe Diarize （帶語者分離）。

v1.1.4-20260502

🎁 5 月 GPT 狂歡月

GPT 全系列消費回饋，6 檔最高送 $250。

活動期 — 5/1 ~ 5/15
兌換期 — 5/16 ~ 5/18
涵蓋 — GPT-5.5 / GPT-5.4 全家族 / GPT Image 2 等全系列
團隊 — 成員消費自動合併，一起衝更高檔位

活動頁：5 月 GPT 狂歡月。

v1.1.0-20260428

💰 預算管理上線 — 團隊 / 成員 / API Key 三維度

把「花多少錢」從口頭約定變成系統強約束。一個組織可同時設定 三個維度 × 三種週期 的消費上限：

維度	適用情境
團隊（Organization）	公司／專案總預算
成員（User）	單一員工的月度配額
API Key	單一應用／服務的獨立預算

每個維度均可分別設定 每日 / 每月 / 累計 三種週期上限，越界時自動拒絕請求。

進度條提示三檔預警：

🟢 40% — 用量正常
🟡 80% — 接近上限
🔴 110% — 已超出（預留緩衝，避免高並發瞬時擊穿）

層級約束自動校驗：API Key 上限 ≤ 成員上限 ≤ 團隊上限。前端即時提示父層配額，避免誤設。

入口：設定 → 配額

⏱️ 團隊級 RPM 配額

新增 團隊級請求速率限制（RPM），從根源防止多 API Key 疊加擊穿上游供應商配額。

整個團隊聚合計算 RPM，不再按單一 Key 分別計算
預設 100 RPM，需要更高頻率請聯絡 [email protected]
超限請求自動回傳 429 Too Many Requests

適用情境：CI/CD 突發流量、批次處理任務防失控、多人協作團隊的統一限速。

🪙 餘額查詢 OpenAPI

新增 GET /v1/user/balance，使用任一 OfoxAI API Key 即可查詢帳戶的可用餘額、累計入帳與累計扣費。

Terminal


curl https://api.ofox.ai/v1/user/balance \
  -H "Authorization: Bearer $OFOX_API_KEY"

回應結構與 cc-switch 等第三方工具相容，可直接作為餘額提供方接入。

🧰 cc-switch 整合支援

OfoxAI 現已原生相容 cc-switch — 在 cc-switch 中切換到 OfoxAI 即可看到即時餘額狀態，無需額外開發。

cc-switch 設定 OfoxAI 餘額查詢

四步完成設定：

開啟用量查詢設定 — 在 OfoxAI 供應商卡片右上角點擊 📊 圖示
啟用用量查詢 — 開啟開關
填入 API Key — 任一 OfoxAI 使用者級 API Key 即可（在 Dashboard 建立）
請求位址 — 選擇「通用範本」，位址填 https://api.ofox.ai/v1

儲存後，供應商卡片即時顯示 剩餘: 64.77 USD 等餘額狀態。

詳細接入步驟：cc-switch 整合指南。

新模型 · 2026-04-24

🤖 新模型

GPT-5.5（OpenAI）— 面向複雜專業工作負載的新旗艦，1M+ token 上下文（922K 輸入 / 128K 輸出），推理可靠性與 token 效率較 GPT-5.4 全面提升
DeepSeek V4 Pro（DeepSeek）— 1.6T 總參數 / 49B 啟用的 MoE 旗艦，1M token 上下文，專為進階推理、程式碼與長程 Agent 工作流最佳化
DeepSeek V4 Flash（DeepSeek）— 284B 總參數 / 13B 啟用的 MoE 加速版，1M token 上下文，主打高吞吐與低延遲，性價比極致

新模型 · 2026-04-21

🤖 新模型

Kimi K2.6（Moonshot AI）— 迄今最強的 Kimi，在程式碼、推理與視覺理解上全面升級
GPT Image 2（OpenAI）— 新一代影像模型，細節更豐富、還原更精準

新模型 · 2026-04-16

🤖 新模型

Claude Opus 4.7（Anthropic）— Anthropic 新旗艦，推理與寫作能力再上一個台階

活動 · 2026-04-15

🎁 GPT 四月消耗返贈，最高送 $250

時間 — 4 月 15 日 ~ 25 日，11 天限時
返贈 — GPT 全系列消耗 25% 返贈，6 檔可選，最高送 $250
到帳 — 返贈額度永久有效，活動結束後一鍵兌換
團隊 — 成員消耗自動合併，一起衝更高檔位

活動頁：GPT 四月消耗返贈。

v1.0.55-20260407

🎁 禮品卡系統上線

在錢包頁輸入禮品卡碼，餘額即時到帳。把 AI 作為禮物送給朋友的最優雅方式。

隱私保護 — 交易紀錄僅顯示卡號末四位
安全保障 — 多層反濫用與端對端加密，每張卡都安全

🔍 模型驗真工具上線

先明確定位：OfoxAI 不是中轉站。

營運主體 — NICE TALK PTE. LTD.（國際化大模型平台）
模型授權 — 官方模型廠商合規授權
底層算力 — Azure / AWS / Google Cloud / 阿里雲 / Z.AI / Moonshot / 火山雲等雲端廠商直接提供
呼叫鏈路 — 邊緣 CDN 直連雲端廠商，無中轉、無替換

為了讓使用者對任何 LLM Gateway 都能驗證模型真實性，我們發布了免費檢測工具：輸入 API Base + Key，一鍵驗出模型是否被替換。

工具入口：模型驗真。支援任意平台，不限 OfoxAI。

v1.0.54-20260403

💳 付款與儲值升級

新增 Airwallex 付款渠道 — Stripe 之外多一種選擇，海外付款更順暢
支援美元 / 人民幣 / 新加坡幣 — 用你熟悉的貨幣結算
單筆儲值上限提至 $10,000 — 大客戶不再受限
代理商推薦首充贈 $3 — 透過代理商邀請註冊的使用者，首次儲值自動加贈 $3

🏢 企業服務頁上線，用得越多省得越多

月消耗達標自動返利，無需申請、無需對接，次月初到帳。

檔位	月消耗門檻	返利比例
Bronze	$1,000+	3%
Silver	$5,000+	4%
Gold	$10,000+	5%
Platinum	$20,000+	7%

疊加的企業級能力：

0% 平台手續費 — 模型官方定價直通
全球加速節點 — 東京 / 新加坡 / 法蘭克福多地部署
99.99% 可用性 SLA — 多區域冗餘，自動故障轉移
零內容留存 — Prompt 與回應預設不記錄、不訓練

詳情：企業服務。

🤖 新模型

GLM-5V-Turbo（智譜）— GLM 多模態系列的 Turbo 加速版
Qwen3.6 Plus（阿里百煉）— Qwen3.6 最新 Plus 規格

v1.0.47-20260327

🏷️ 一個模型，多種叫法

給模型取短名、保留舊 ID，切換平台零遷移成本。別名即生效，路由自動辨識。

舉幾個例子：

正式 ID	可用別名
`anthropic/claude-opus-4.7`	`claude-opus-4.7` · `claude-opus-4-7` · `claude-opus-4-7-20260416`
`anthropic/claude-sonnet-4.6`	`claude-sonnet-4.6` · `claude-sonnet-4-6` · `claude-sonnet-4-6-20260217`
`openai/gpt-5.4-pro`	`gpt-5.4-pro`
`openai/gpt-5.4`	`gpt-5.4`
`moonshotai/kimi-k2.6`	`kimi-k2.6`
`z-ai/glm-5.1`	`glm-5.1`

完整別名列表透過 GET https://api.ofox.ai/v1/models 查詢，回應裡 aliases 欄位直接可用。

🖼️ 生圖按張計費

影像 API 改為按生成張數計費，每張透明定價。標準尺寸自動對應到各供應商的原生尺寸，用戶端程式碼零改動。

📊 影像用量視覺化

控制台首頁、用量、成本、排行榜新增「影像」維度統計，每月影像消耗一目了然。

🤖 新模型

GLM 5.1（智譜）— GLM 系列下一代，通用能力全面升級

🔗 更短的邀請連結

邀請連結從長串改為 /x/你的碼，更易記、更易分享。

v1.0.39-20260320

🔄 模型 Fallback — 主模型故障自動切換

主模型回傳 4xx/5xx 錯誤時，Gateway 自動嘗試你設定的備用模型，最多 3 層保底。OpenAI / Anthropic / Gemini 三協定通用，用戶端程式碼零改動。詳見 Fallback 文件。

⚔️ OfoxAI vs OpenRouter，逐項比較

OpenRouter 每次儲值收取 5.5% 手續費，OfoxAI 為 0%。同樣涵蓋 100+ 模型，月消耗 $1,000 以上可多節省 10% 以上綜合成本。完整比較：OfoxAI vs OpenRouter 。

🤖 新模型

GLM-5-Turbo（智譜）— GLM-5 的 Turbo 加速版
GPT-5.4 Mini / Nano（OpenAI）— GPT-5.4 輕量雙規格，大幅降低呼叫成本
MiniMax M2.7 / M2.7 Highspeed — MiniMax 新一代，Highspeed 版專為低延遲場景最佳化

v1.0.36-20260313

🎊 三月 Claude 返贈

全檔位 20% 返贈，活動彈窗一鍵複製優惠碼 OFOXAI2603。

儲值	返贈	實得
$20	$4	$24
$50	$10	$60
$100	$20	$120
$200	$40	$240
$500	$100	$600

活動頁：Claude Spring 二彈。

🤖 新模型

GPT-5.4 / GPT-5.4 Pro（OpenAI）— GPT-5.4 新旗艦雙規格，Pro 提供更高推理上限
Gemini Embedding 2 Preview（Google）— Google 下一代多模態向量模型

🖼️ 向量化，覆蓋全模態

Gemini Embedding 支援文字 / 影像 / 音訊 / 影片四種模態。Qwen、火山多模態向量化同步直連。

⚡ 用量資料，按小時更新

用量聚合從每日一次升級為每小時一次，消耗發生後很快可在 Dashboard 查看。

💰 優惠券顯示最佳化

訂單列表完整顯示每筆訂單的折扣金額與贈送金額。

v1.0.32-20260303

🎉 三月 Claude 活動上線

Dashboard 新增活動橫幅與消耗進度條，優惠券錯誤提示全面中英雙語在地化。活動頁：Claude Spring 首彈。

🤖 新模型

GPT-5.3 Chat（OpenAI）— GPT-5.3 對話最佳化版
Gemini 3.1 Flash Lite Preview（Google）— Gemini 3.1 輕量預覽版
Nano Banana 2（Google）— Gemini 3.1 Flash Image Preview，新一代影像生成模型

🏷️ 導覽煥新

「我的帳單」 → 「我的錢包」，更符合使用情境
「模型」 → 「模型廣場」，突顯目錄式瀏覽
Header 新增 Blog 入口

v1.0.30-20260226

🔒 GitHub 一鍵登入

登入頁新增 GitHub OAuth 入口，一鍵完成註冊／登入。系統會記住上次使用的登入方式。設定頁支援 GitHub 帳號的綁定、解綁與頭像同步。

🤖 新模型

Qwen3.5 全家桶五款同步上線（阿里百煉）— Flash / 27B / 35B A3B / 122B A10B / 397B A17B
GPT-5.3 Codex（OpenAI）— GPT-5.3 程式碼專用模型
Gemini 3.1 Pro Preview（Google）— Gemini 3.1 Pro 預覽版
Qwen3 Coder Next（阿里百煉）— Qwen 程式碼專用新模型

📱 行動裝置 RWD

控制台的使用者、組織、訂單模組完整適配行動裝置。側邊欄支援收合，表格智慧收起，小螢幕使用體驗流暢。

v1.0.27-20260217

📊 數據分析儀表板

用量、成本、請求三張互動式圖表。按月查看趨勢，按模型產生排行榜，篩選器支援 Provider / Model / User / API Key / 時間範圍任意組合。你的主力模型是哪一個？一目了然。

🤖 新模型

Claude Sonnet 4.6（Anthropic）— Sonnet 系列新版本，性價比之選
Qwen3.5 Plus（阿里百煉）— Qwen3.5 Plus 規格上線
Doubao Seed 2.0 四規格（火山）— Code / Lite / Mini / Pro ，豆包 Seed 2.0 完整系列同步上線

🌐 行為對齊 OpenAI

chat/completions 不傳 stream 時預設非串流，與 OpenAI 官方完全一致。你的程式碼什麼都不用改。

v1.0.24-20260212

🤖 新模型

GLM-5（智譜）— GLM 系列新一代旗艦
MiniMax M2.5 / M2.5 Lightning — MiniMax 雙規格，Lightning 版專為低延遲最佳化

🎊 首次登入歡迎

首次登入時，歡迎彈窗完整展示 OpenAI / Anthropic / Gemini 三個 API 端點，支援一鍵複製。搭配禮花動效，給開發者一點儀式感。

🧠 供應商親和性快取

同一使用者在不同模型之間切換時，Gateway 優先選擇同一家供應商。Prompt Cache 命中率提升，回應更快，成本更低。

🎟️ 天使邀請碼系統

完整邀請碼體系上線：卡片式 UI、加入對話框、使用紀錄表格一覽。雙向獎勵機制，一鍵產生專屬分享海報。

v1.0.20-20260206

🤖 新模型

Claude Opus 4.6（Anthropic）— Anthropic 新旗艦，再次刷新推理與寫作能力上限

🌍 一鍵切中英

1100+ 條翻譯，全平台中英雙語無縫切換。語言偏好 Cookie 幫你記住。

🔍 Web Search 按次計費

OpenAI / Anthropic / Gemini 三協定的 Web Search 工具呼叫全部精準計費。

📊 Dashboard 煥新

登入頁按使用者名稱個性化問候，取代通用「Hi」
用量統計從單日視角升級為週維度
API Key 顯示三檔可切換：全隱藏 / 打碼 / 全明文

💵 價格顯示最佳化

$0.6000 自動去除尾零顯示為 $0.6。餘額不足的錯誤訊息改用美元格式，無需心算換算。

📚 文件站正式上線

完整的 OpenAI / Anthropic / Gemini 協定參考
10+ 工具接入指南全覆蓋：Claude Code、Codex、Gemini CLI、Zed、Cline、Cherry Studio、OpenClaw、OpenCode 等，從設定到跑通完整覆蓋

v1.0.1 ~ v1.0.9 · 2026-01-20 ~ 02-01 — 打地基的兩週

發布後的第一個兩週，我們沒有喘氣。每一次發版都讓平台更穩、更準、更好接入。

💻 Claude Code 官方適配

我們自己就用 Claude Code 寫程式碼。 1 月 21 日，Gateway 針對 Claude Code 做了完整適配——把 API Base 指向 OfoxAI，sk-*** Key 替換，所有 Claude 模型立即可用。

🧠 Thinking 推理鏈

Claude 和 Gemini 的 thinking block（模型的「推理過程」）全協定貫通。看得到模型在怎麼想，而不只是結果。

🌐 Gemini 原生協定支援

不只是 OpenAI 相容模式——Gemini 原生 API generateContent 也跑通了。Google 官方 SDK 直連，無轉譯耗損。

💵 多幣別 Stripe 付款

在 USD 之外新增 CNY / SGD 等多幣別入口，匯率快照隨訂單留存。亞太使用者可直接以本幣結算。

🎯 帳單精度 6 位小數

NanoDollar 級精度升級。單次 API 呼叫哪怕只消耗幾毫美分，都被準確記錄、如實計費。大客戶不吃虧，小客戶不委屈。

v1.0.0 · 2026-01-16 — The Gateway Goes Live

「從今天起，100+ 模型，一個 Key。」

這是 OfoxAI 平台對外正式發布的日子。

🚀 平台首發能力

三協定原生相容 — OpenAI / Anthropic / Gemini 三大協定直接支援，現有程式碼零改動接入
100+ 模型統一接入 — Claude 、GPT 、Gemini 、DeepSeek 、Qwen 等百餘模型一個 Key 打通。完整目錄：模型廣場
智慧路由 — Provider × Model 粒度的路由演算法，自動選擇最快、最穩的通道。詳見 Provider Routing
自助 API Key 管理 — Dashboard 一鍵建立、啟停、用量追蹤
按量計費，0% 平台費 — 模型官方定價直通。價格查詢：Pricing
Stripe 信用卡付款 — 儲值即時到帳，餘額可查
全球邊緣節點 — 東京 / 新加坡 / 法蘭克福多地部署，就近路由

🌐 底層基礎設施

不是中轉站，是平台。請求經邊緣 CDN 直達 Azure / AWS / Google Cloud / 阿里雲 / Z.AI / Moonshot / 火山雲 等雲端廠商。

Day 1 · 2025-12-27 — How It Began

「讓開發者用最簡單的方式，呼叫全世界最聰明的模型。」

🦊 第一行程式碼

2025 年底，一個小小的 commit 敲下了 OfoxAI 的第一行程式碼：


feat: initialize ofox-studio monorepo

⚡ 頓悟時刻

三天後，我們同時跑通了 AWS Bedrock 上的 Claude 和 Azure 上的 GPT——兩大雲端廠商、兩個頂級模型，直連不中轉。

當兩條鏈路的首次回應同時印在終端機上，我們知道：這事能做。

這不是 demo 級的適配，而是真正的多雲直連。此後 Google Cloud、阿里雲、Z.AI、Moonshot、火山雲相繼接入——「不是中轉站，是平台」 的定位，從 Day 3 起便已確立。

🌱 起點

commit 0001

一行程式碼，一個方向。 讓全世界最聰明的智能，觸手可及。

引擎點火。