更新日誌
OfoxAI 的每一步——新模型、新功能、新體驗。按週更新。
數據分析 · 2026-06-16
📊 用量與費用,合併成一張報表
以前「用量」和「費用」分兩個頁面看,對帳得來回切。現在合併為統一的數據分析頁,「用了多少」和「花了多少」在同一處一眼看全。
- 概覽同頁 — 呼叫量、消耗金額、Token 等關鍵指標集中展示
- 多維鑽取 — 按模型 / 成員 / API Key / 應用一鍵切換查看
- 彈性篩選 — 自訂時間範圍 + 組合篩選,主力模型與成本分布一目了然
入口:數據分析 。
v1.2.6-20260605
🔐 API Key IP 白名單
為 API Key 綁定可信來源 IP,即使 Key 外洩,非白名單的位址也無法呼叫。
- 支援 單一 IP + CIDR 網段,每個 Key 最多 50 條
- 非白名單來源請求直接回傳
403 - 留空 = 不限制,現有 Key 不受影響
入口:API Key 管理 → 個別 Key 詳情。
v1.2.3-20260603
🟢 Google 一鍵登入
繼 GitHub 之後第二個社群登入入口,支援登入 / 註冊 / 帳號綁定。同信箱自動關聯,下次自動記住上次的登入方式。
🎮 Playground 上線
控制台側邊欄新增 Playground 入口,瀏覽器裡直接試模型、調參數、比較效果,不用寫一行程式碼。入口:chat.ofox.ai 。
🌐 介面語言跟著帳號走
語言偏好記到帳戶裡,換裝置也記得;連系統郵件也會用你設定的語言寄送。設定 → 帳戶 新增語言卡片。
新模型 · 2026-06-02
🤖 新模型
- MiniMax M3(MiniMax)— MiniMax 新一代旗艦
- Qwen3.7 Plus(阿里百煉)— Qwen3.7 Plus 規格,三協定直連
- xAI Grok 系列現已上線 — Grok 4.3 等 xAI 模型已進入模型廣場
活動 · 2026-06-01
🎁 6 月 GPT 全站 85 折
整月 GPT 全系列 85 折(結帳自動折抵,全 GPT 系列),6/1 ~ 7/1。無需優惠碼,下單自動生效。 模型目錄:GPT 系列 。
v1.1.9-20260529
🌏 日語介面上線
平台介面新增日語 (ja),現已支援 English / 简体中文 / Русский / 日本語 四語。語言切換器改用 🌐 圖示 + 母語全名顯示,切換更直覺。
🤖 新模型
- Claude Opus 4.8(Anthropic)— Anthropic 新一代旗艦,推理與寫作能力再上台階
新模型 · 2026-05-22
🤖 新模型
- Qwen3.7 Max(阿里百煉)— Qwen3.7 最強規格,OpenAI / Anthropic / Gemini 三協定直連
新模型 · 2026-05-20
🤖 新模型
- Gemini 3.5 Flash(Google)— Gemini 3.5 高速版
- Gemini 3.1 Flash Lite(Google)— 更輕更省的 Flash Lite 規格
v1.1.6-20260519
🧾 發票抬頭自己改,改完即時更新
發票與收據升級,帳單資訊你說了算。
- 抬頭自己填 — 維護公司名稱、統一編號、地址等帳單資訊,發票自動帶上;改完重新產生,新發票即時更新
- 真實付款方式 — 收據如實顯示
Visa ····4242、微信支付等實際付款方式 - 跨幣別明細 — 標明真實扣款幣別與匯率(如
1 SGD = 5.5654 CNY) - 隨時匯出 — 發票 / 收據連結長期有效,瀏覽器直接列印成 PDF
入口:錢包頁 → 訂單 → 查看發票;帳單抬頭在 設定 → 組織 維護。
v1.1.5-20260514
🔐 用 OfoxAI 帳號授權第三方應用程式(OAuth)
第三方應用程式和 AI Agent 現在可以透過標準 OAuth 授權接入你的 OfoxAI 帳號——不用再把 API Key 直接交給它們。
- 一次授權,安全呼叫 — 授權後應用程式即可代你呼叫模型,並查詢餘額、用量與額度
- 精確歸屬 — 每一筆呼叫都對應到具體應用程式,用量與花費看得清清楚楚
- 隨時撤銷 — 在控制台管理已授權的應用程式,一鍵收回權限
- 涵蓋命令列工具 — 支援裝置碼授權,CLI / 終端機類工具也能順暢登入
為接入 OfoxAI 的工具與 Agent 生態打下統一的登入與授權基礎。
新功能 · 2026-05-07
🎙️ 音訊轉錄(語音轉文字)
新增 OpenAI 音訊轉錄模型,把錄音 / 語音直接轉成文字,沿用 OpenAI 相容協定即可呼叫:GPT-4o Mini Transcribe 、GPT-4o Transcribe Diarize (帶語者分離)。
v1.1.4-20260502
🎁 5 月 GPT 狂歡月
GPT 全系列消費回饋,6 檔最高送 $250。
- 活動期 — 5/1 ~ 5/15
- 兌換期 — 5/16 ~ 5/18
- 涵蓋 — GPT-5.5 / GPT-5.4 全家族 / GPT Image 2 等全系列
- 團隊 — 成員消費自動合併,一起衝更高檔位
活動頁:5 月 GPT 狂歡月 。
v1.1.0-20260428
💰 預算管理上線 — 團隊 / 成員 / API Key 三維度
把「花多少錢」從口頭約定變成系統強約束。一個組織可同時設定 三個維度 × 三種週期 的消費上限:
| 維度 | 適用情境 |
|---|---|
| 團隊(Organization) | 公司/專案總預算 |
| 成員(User) | 單一員工的月度配額 |
| API Key | 單一應用/服務的獨立預算 |
每個維度均可分別設定 每日 / 每月 / 累計 三種週期上限,越界時自動拒絕請求。
進度條提示三檔預警:
- 🟢 40% — 用量正常
- 🟡 80% — 接近上限
- 🔴 110% — 已超出(預留緩衝,避免高並發瞬時擊穿)
層級約束自動校驗:API Key 上限 ≤ 成員上限 ≤ 團隊上限。前端即時提示父層配額,避免誤設。
入口:設定 → 配額
⏱️ 團隊級 RPM 配額
新增 團隊級請求速率限制(RPM),從根源防止多 API Key 疊加擊穿上游供應商配額。
- 整個團隊聚合計算 RPM,不再按單一 Key 分別計算
- 預設 100 RPM,需要更高頻率請聯絡 [email protected]
- 超限請求自動回傳
429 Too Many Requests
適用情境:CI/CD 突發流量、批次處理任務防失控、多人協作團隊的統一限速。
🪙 餘額查詢 OpenAPI
新增 GET /v1/user/balance,使用任一 OfoxAI API Key 即可查詢帳戶的可用餘額、累計入帳與累計扣費。
curl https://api.ofox.ai/v1/user/balance \
-H "Authorization: Bearer $OFOX_API_KEY"回應結構與 cc-switch 等第三方工具相容,可直接作為餘額提供方接入。
🧰 cc-switch 整合支援
OfoxAI 現已原生相容 cc-switch — 在 cc-switch 中切換到 OfoxAI 即可看到即時餘額狀態,無需額外開發。

四步完成設定:
- 開啟用量查詢設定 — 在 OfoxAI 供應商卡片右上角點擊 📊 圖示
- 啟用用量查詢 — 開啟開關
- 填入 API Key — 任一 OfoxAI 使用者級 API Key 即可(在 Dashboard 建立)
- 請求位址 — 選擇「通用範本」,位址填
https://api.ofox.ai/v1
儲存後,供應商卡片即時顯示 剩餘: 64.77 USD 等餘額狀態。
詳細接入步驟:cc-switch 整合指南。
新模型 · 2026-04-24
🤖 新模型
- GPT-5.5(OpenAI)— 面向複雜專業工作負載的新旗艦,1M+ token 上下文(922K 輸入 / 128K 輸出),推理可靠性與 token 效率較 GPT-5.4 全面提升
- DeepSeek V4 Pro(DeepSeek)— 1.6T 總參數 / 49B 啟用的 MoE 旗艦,1M token 上下文,專為進階推理、程式碼與長程 Agent 工作流最佳化
- DeepSeek V4 Flash(DeepSeek)— 284B 總參數 / 13B 啟用的 MoE 加速版,1M token 上下文,主打高吞吐與低延遲,性價比極致
新模型 · 2026-04-21
🤖 新模型
- Kimi K2.6(Moonshot AI)— 迄今最強的 Kimi,在程式碼、推理與視覺理解上全面升級
- GPT Image 2(OpenAI)— 新一代影像模型,細節更豐富、還原更精準
新模型 · 2026-04-16
🤖 新模型
- Claude Opus 4.7(Anthropic)— Anthropic 新旗艦,推理與寫作能力再上一個台階
活動 · 2026-04-15
🎁 GPT 四月消耗返贈,最高送 $250
- 時間 — 4 月 15 日 ~ 25 日,11 天限時
- 返贈 — GPT 全系列消耗 25% 返贈,6 檔可選,最高送 $250
- 到帳 — 返贈額度永久有效,活動結束後一鍵兌換
- 團隊 — 成員消耗自動合併,一起衝更高檔位
活動頁:GPT 四月消耗返贈 。
v1.0.55-20260407
🎁 禮品卡系統上線
在錢包頁 輸入禮品卡碼,餘額即時到帳。把 AI 作為禮物送給朋友的最優雅方式。
- 隱私保護 — 交易紀錄僅顯示卡號末四位
- 安全保障 — 多層反濫用與端對端加密,每張卡都安全
🔍 模型驗真工具上線
先明確定位:OfoxAI 不是中轉站。
- 營運主體 — NICE TALK PTE. LTD.(國際化大模型平台)
- 模型授權 — 官方模型廠商合規授權
- 底層算力 — Azure / AWS / Google Cloud / 阿里雲 / Z.AI / Moonshot / 火山雲等雲端廠商直接提供
- 呼叫鏈路 — 邊緣 CDN 直連雲端廠商,無中轉、無替換
為了讓使用者對任何 LLM Gateway 都能驗證模型真實性,我們發布了免費檢測工具:輸入 API Base + Key,一鍵驗出模型是否被替換。
工具入口:模型驗真 。支援任意平台,不限 OfoxAI。
v1.0.54-20260403
💳 付款與儲值升級
- 新增 Airwallex 付款渠道 — Stripe 之外多一種選擇,海外付款更順暢
- 支援美元 / 人民幣 / 新加坡幣 — 用你熟悉的貨幣結算
- 單筆儲值上限提至 $10,000 — 大客戶不再受限
- 代理商推薦首充贈 $3 — 透過代理商邀請註冊的使用者,首次儲值自動加贈 $3
🏢 企業服務頁上線,用得越多省得越多
月消耗達標自動返利,無需申請、無需對接,次月初到帳。
| 檔位 | 月消耗門檻 | 返利比例 |
|---|---|---|
| Bronze | $1,000+ | 3% |
| Silver | $5,000+ | 4% |
| Gold | $10,000+ | 5% |
| Platinum | $20,000+ | 7% |
疊加的企業級能力:
- 0% 平台手續費 — 模型官方定價直通
- 全球加速節點 — 東京 / 新加坡 / 法蘭克福多地部署
- 99.99% 可用性 SLA — 多區域冗餘,自動故障轉移
- 零內容留存 — Prompt 與回應預設不記錄、不訓練
詳情:企業服務 。
🤖 新模型
- GLM-5V-Turbo(智譜)— GLM 多模態系列的 Turbo 加速版
- Qwen3.6 Plus(阿里百煉)— Qwen3.6 最新 Plus 規格
v1.0.47-20260327
🏷️ 一個模型,多種叫法
給模型取短名、保留舊 ID,切換平台零遷移成本。別名即生效,路由自動辨識。
舉幾個例子:
| 正式 ID | 可用別名 |
|---|---|
anthropic/claude-opus-4.7 | claude-opus-4.7 · claude-opus-4-7 · claude-opus-4-7-20260416 |
anthropic/claude-sonnet-4.6 | claude-sonnet-4.6 · claude-sonnet-4-6 · claude-sonnet-4-6-20260217 |
openai/gpt-5.4-pro | gpt-5.4-pro |
openai/gpt-5.4 | gpt-5.4 |
moonshotai/kimi-k2.6 | kimi-k2.6 |
z-ai/glm-5.1 | glm-5.1 |
完整別名列表透過 GET https://api.ofox.ai/v1/models 查詢,回應裡 aliases 欄位直接可用。
🖼️ 生圖按張計費
影像 API 改為按生成張數計費,每張透明定價。標準尺寸自動對應到各供應商的原生尺寸,用戶端程式碼零改動。
📊 影像用量視覺化
控制台首頁、用量、成本、排行榜新增「影像」維度統計,每月影像消耗一目了然。
🤖 新模型
- GLM 5.1(智譜)— GLM 系列下一代,通用能力全面升級
🔗 更短的邀請連結
邀請連結從長串改為 /x/你的碼,更易記、更易分享。
v1.0.39-20260320
🔄 模型 Fallback — 主模型故障自動切換
主模型回傳 4xx/5xx 錯誤時,Gateway 自動嘗試你設定的備用模型,最多 3 層保底。OpenAI / Anthropic / Gemini 三協定通用,用戶端程式碼零改動。 詳見 Fallback 文件。
⚔️ OfoxAI vs OpenRouter,逐項比較
OpenRouter 每次儲值收取 5.5% 手續費,OfoxAI 為 0%。同樣涵蓋 100+ 模型,月消耗 $1,000 以上可多節省 10% 以上綜合成本。 完整比較:OfoxAI vs OpenRouter 。
🤖 新模型
- GLM-5-Turbo(智譜)— GLM-5 的 Turbo 加速版
- GPT-5.4 Mini / Nano(OpenAI)— GPT-5.4 輕量雙規格,大幅降低呼叫成本
- MiniMax M2.7 / M2.7 Highspeed — MiniMax 新一代,Highspeed 版專為低延遲場景最佳化
v1.0.36-20260313
🎊 三月 Claude 返贈
全檔位 20% 返贈,活動彈窗一鍵複製優惠碼 OFOXAI2603。
| 儲值 | 返贈 | 實得 |
|---|---|---|
| $20 | $4 | $24 |
| $50 | $10 | $60 |
| $100 | $20 | $120 |
| $200 | $40 | $240 |
| $500 | $100 | $600 |
活動頁:Claude Spring 二彈 。
🤖 新模型
- GPT-5.4 / GPT-5.4 Pro(OpenAI)— GPT-5.4 新旗艦雙規格,Pro 提供更高推理上限
- Gemini Embedding 2 Preview(Google)— Google 下一代多模態向量模型
🖼️ 向量化,覆蓋全模態
Gemini Embedding 支援文字 / 影像 / 音訊 / 影片四種模態。Qwen、火山多模態向量化同步直連。
⚡ 用量資料,按小時更新
用量聚合從每日一次升級為每小時一次,消耗發生後很快可在 Dashboard 查看。
💰 優惠券顯示最佳化
訂單列表完整顯示每筆訂單的折扣金額與贈送金額。
v1.0.32-20260303
🎉 三月 Claude 活動上線
Dashboard 新增活動橫幅與消耗進度條,優惠券錯誤提示全面中英雙語在地化。 活動頁:Claude Spring 首彈 。
🤖 新模型
- GPT-5.3 Chat(OpenAI)— GPT-5.3 對話最佳化版
- Gemini 3.1 Flash Lite Preview(Google)— Gemini 3.1 輕量預覽版
- Nano Banana 2(Google)— Gemini 3.1 Flash Image Preview,新一代影像生成模型
🏷️ 導覽煥新
v1.0.30-20260226
🔒 GitHub 一鍵登入
登入頁新增 GitHub OAuth 入口,一鍵完成註冊/登入。系統會記住上次使用的登入方式。設定頁支援 GitHub 帳號的綁定、解綁與頭像同步。
🤖 新模型
- Qwen3.5 全家桶五款同步上線(阿里百煉)— Flash / 27B / 35B A3B / 122B A10B / 397B A17B
- GPT-5.3 Codex(OpenAI)— GPT-5.3 程式碼專用模型
- Gemini 3.1 Pro Preview(Google)— Gemini 3.1 Pro 預覽版
- Qwen3 Coder Next(阿里百煉)— Qwen 程式碼專用新模型
📱 行動裝置 RWD
控制台的使用者、組織、訂單模組完整適配行動裝置。側邊欄支援收合,表格智慧收起,小螢幕使用體驗流暢。
v1.0.27-20260217
📊 數據分析儀表板
用量、成本、請求三張互動式圖表。按月查看趨勢,按模型產生排行榜,篩選器支援 Provider / Model / User / API Key / 時間範圍任意組合。你的主力模型是哪一個?一目了然。
🤖 新模型
- Claude Sonnet 4.6(Anthropic)— Sonnet 系列新版本,性價比之選
- Qwen3.5 Plus(阿里百煉)— Qwen3.5 Plus 規格上線
- Doubao Seed 2.0 四規格(火山)— Code / Lite / Mini / Pro ,豆包 Seed 2.0 完整系列同步上線
🌐 行為對齊 OpenAI
chat/completions 不傳 stream 時預設非串流,與 OpenAI 官方完全一致。你的程式碼什麼都不用改。
v1.0.24-20260212
🤖 新模型
- GLM-5(智譜)— GLM 系列新一代旗艦
- MiniMax M2.5 / M2.5 Lightning — MiniMax 雙規格,Lightning 版專為低延遲最佳化
🎊 首次登入歡迎
首次登入時,歡迎彈窗完整展示 OpenAI / Anthropic / Gemini 三個 API 端點,支援一鍵複製。搭配禮花動效,給開發者一點儀式感。
🧠 供應商親和性快取
同一使用者在不同模型之間切換時,Gateway 優先選擇同一家供應商。Prompt Cache 命中率提升,回應更快,成本更低。
🎟️ 天使邀請碼系統
完整邀請碼體系上線:卡片式 UI、加入對話框、使用紀錄表格一覽。雙向獎勵機制,一鍵產生專屬分享海報。
v1.0.20-20260206
🤖 新模型
- Claude Opus 4.6(Anthropic)— Anthropic 新旗艦,再次刷新推理與寫作能力上限
🌍 一鍵切中英
1100+ 條翻譯,全平台中英雙語無縫切換。語言偏好 Cookie 幫你記住。
🔍 Web Search 按次計費
OpenAI / Anthropic / Gemini 三協定的 Web Search 工具呼叫全部精準計費。
📊 Dashboard 煥新
- 登入頁按使用者名稱個性化問候,取代通用「Hi」
- 用量統計從單日視角升級為週維度
- API Key 顯示三檔可切換:全隱藏 / 打碼 / 全明文
💵 價格顯示最佳化
$0.6000 自動去除尾零顯示為 $0.6。餘額不足的錯誤訊息改用美元格式,無需心算換算。
📚 文件站正式上線
- 完整的 OpenAI / Anthropic / Gemini 協定參考
- 10+ 工具接入指南全覆蓋:Claude Code、Codex、Gemini CLI、Zed、Cline、Cherry Studio、OpenClaw、OpenCode 等,從設定到跑通完整覆蓋
v1.0.1 ~ v1.0.9 · 2026-01-20 ~ 02-01 — 打地基的兩週
發布後的第一個兩週,我們沒有喘氣。每一次發版都讓平台更穩、更準、更好接入。
💻 Claude Code 官方適配
我們自己就用 Claude Code 寫程式碼。 1 月 21 日,Gateway 針對 Claude Code 做了完整適配——把 API Base 指向 OfoxAI,sk-*** Key 替換,所有 Claude 模型立即可用。
🧠 Thinking 推理鏈
Claude 和 Gemini 的 thinking block(模型的「推理過程」)全協定貫通。看得到模型在怎麼想,而不只是結果。
🌐 Gemini 原生協定支援
不只是 OpenAI 相容模式——Gemini 原生 API generateContent 也跑通了。Google 官方 SDK 直連,無轉譯耗損。
💵 多幣別 Stripe 付款
在 USD 之外新增 CNY / SGD 等多幣別入口,匯率快照隨訂單留存。亞太使用者可直接以本幣結算。
🎯 帳單精度 6 位小數
NanoDollar 級精度升級。單次 API 呼叫哪怕只消耗幾毫美分,都被準確記錄、如實計費。大客戶不吃虧,小客戶不委屈。
v1.0.0 · 2026-01-16 — The Gateway Goes Live
「從今天起,100+ 模型,一個 Key。」
這是 OfoxAI 平台對外正式發布的日子。
🚀 平台首發能力
- 三協定原生相容 — OpenAI / Anthropic / Gemini 三大協定直接支援,現有程式碼零改動接入
- 100+ 模型統一接入 — Claude 、GPT 、Gemini 、DeepSeek 、Qwen 等百餘模型一個 Key 打通。完整目錄:模型廣場
- 智慧路由 — Provider × Model 粒度的路由演算法,自動選擇最快、最穩的通道。詳見 Provider Routing
- 自助 API Key 管理 — Dashboard 一鍵建立、啟停、用量追蹤
- 按量計費,0% 平台費 — 模型官方定價直通。價格查詢:Pricing
- Stripe 信用卡付款 — 儲值即時到帳,餘額可查
- 全球邊緣節點 — 東京 / 新加坡 / 法蘭克福多地部署,就近路由
🌐 底層基礎設施
不是中轉站,是平台。請求經邊緣 CDN 直達 Azure / AWS / Google Cloud / 阿里雲 / Z.AI / Moonshot / 火山雲 等雲端廠商。
Day 1 · 2025-12-27 — How It Began
「讓開發者用最簡單的方式,呼叫全世界最聰明的模型。」
🦊 第一行程式碼
2025 年底,一個小小的 commit 敲下了 OfoxAI 的第一行程式碼:
feat: initialize ofox-studio monorepo⚡ 頓悟時刻
三天後,我們同時跑通了 AWS Bedrock 上的 Claude 和 Azure 上的 GPT——兩大雲端廠商、兩個頂級模型,直連不中轉。
當兩條鏈路的首次回應同時印在終端機上,我們知道:這事能做。
這不是 demo 級的適配,而是真正的多雲直連。此後 Google Cloud、阿里雲、Z.AI、Moonshot、火山雲相繼接入——「不是中轉站,是平台」 的定位,從 Day 3 起便已確立。
🌱 起點
commit 0001
一行程式碼,一個方向。 讓全世界最聰明的智能,觸手可及。
引擎點火。