更新日誌
OfoxAI 的每一步——新模型、新功能、新體驗。按週更新。
v1.1.0-20260428
💰 預算管理上線 — 團隊 / 成員 / API Key 三維度
把「花多少錢」從口頭約定變成系統強約束。一個組織可同時設定 三個維度 × 三種週期 的消費上限:
| 維度 | 適用情境 |
|---|---|
| 團隊(Organization) | 公司/專案總預算 |
| 成員(User) | 單一員工的月度配額 |
| API Key | 單一應用/服務的獨立預算 |
每個維度均可分別設定 每日 / 每月 / 累計 三種週期上限,越界時自動拒絕請求。
進度條提示三檔預警:
- 🟢 40% — 用量正常
- 🟡 80% — 接近上限
- 🔴 110% — 已超出(預留緩衝,避免高並發瞬時擊穿)
層級約束自動校驗:API Key 上限 ≤ 成員上限 ≤ 團隊上限。前端即時提示父層配額,避免誤設。
入口:設定 → 配額
⏱️ 團隊級 RPM 配額
新增 團隊級請求速率限制(RPM),從根源防止多 API Key 疊加擊穿上游供應商配額。
- 整個團隊聚合計算 RPM,不再按單一 Key 分別計算
- 預設 100 RPM,需要更高頻率請聯絡 [email protected]
- 超限請求自動回傳
429 Too Many Requests
適用情境:CI/CD 突發流量、批次處理任務防失控、多人協作團隊的統一限速。
🪙 餘額查詢 OpenAPI
新增 GET /v1/user/balance,使用任一 OfoxAI API Key 即可查詢帳戶的可用餘額、累計入帳與累計扣費。
curl https://api.ofox.ai/v1/user/balance \
-H "Authorization: Bearer $OFOX_API_KEY"回應結構與 cc-switch 等第三方工具相容,可直接作為餘額提供方接入。
🧰 cc-switch 整合支援
OfoxAI 現已原生相容 cc-switch — 在 cc-switch 中切換到 OfoxAI 即可看到即時餘額狀態,無需額外開發。

四步完成設定:
- 開啟用量查詢設定 — 在 OfoxAI 供應商卡片右上角點擊 📊 圖示
- 啟用用量查詢 — 開啟開關
- 填入 API Key — 任一 OfoxAI 使用者級 API Key 即可(在 Dashboard 建立)
- 請求位址 — 選擇「通用範本」,位址填
https://api.ofox.ai/v1
儲存後,供應商卡片即時顯示 剩餘: 64.77 USD 等餘額狀態。
詳細接入步驟:cc-switch 整合指南。
新模型 · 2026-04-24
🤖 新模型
- GPT-5.5(OpenAI)— 面向複雜專業工作負載的新旗艦,1M+ token 上下文(922K 輸入 / 128K 輸出),推理可靠性與 token 效率較 GPT-5.4 全面提升
- DeepSeek V4 Pro(DeepSeek)— 1.6T 總參數 / 49B 啟用的 MoE 旗艦,1M token 上下文,專為進階推理、程式碼與長程 Agent 工作流最佳化
- DeepSeek V4 Flash(DeepSeek)— 284B 總參數 / 13B 啟用的 MoE 加速版,1M token 上下文,主打高吞吐與低延遲,性價比極致
新模型 · 2026-04-21
🤖 新模型
- Kimi K2.6(Moonshot AI)— 迄今最強的 Kimi,在程式碼、推理與視覺理解上全面升級
- GPT Image 2(OpenAI)— 新一代影像模型,細節更豐富、還原更精準
新模型 · 2026-04-16
🤖 新模型
- Claude Opus 4.7(Anthropic)— Anthropic 新旗艦,推理與寫作能力再上一個台階
活動 · 2026-04-15
🎁 GPT 四月消耗返贈,最高送 $250
- 時間 — 4 月 15 日 ~ 25 日,11 天限時
- 返贈 — GPT 全系列消耗 25% 返贈,6 檔可選,最高送 $250
- 到帳 — 返贈額度永久有效,活動結束後一鍵兌換
- 團隊 — 成員消耗自動合併,一起衝更高檔位
活動頁:GPT 四月消耗返贈 。
v1.0.55-20260407
🎁 禮品卡系統上線
在錢包頁 輸入禮品卡碼,餘額即時到帳。把 AI 作為禮物送給朋友的最優雅方式。
- 隱私保護 — 交易紀錄僅顯示卡號末四位
- 安全保障 — 多層反濫用與端對端加密,每張卡都安全
🔍 模型驗真工具上線
先明確定位:OfoxAI 不是中轉站。
- 營運主體 — NICE TALK PTE. LTD.(國際化大模型平台)
- 模型授權 — 官方模型廠商合規授權
- 底層算力 — Azure / AWS / Google Cloud / 阿里雲 / Z.AI / Moonshot / 火山雲等雲端廠商直接提供
- 呼叫鏈路 — 邊緣 CDN 直連雲端廠商,無中轉、無替換
為了讓使用者對任何 LLM Gateway 都能驗證模型真實性,我們發布了免費檢測工具:輸入 API Base + Key,一鍵驗出模型是否被替換。
工具入口:模型驗真 。支援任意平台,不限 OfoxAI。
v1.0.54-20260403
💳 付款與儲值升級
- 新增 Airwallex 付款渠道 — Stripe 之外多一種選擇,海外付款更順暢
- 支援美元 / 人民幣 / 新加坡幣 — 用你熟悉的貨幣結算
- 單筆儲值上限提至 $10,000 — 大客戶不再受限
- 代理商推薦首充贈 $3 — 透過代理商邀請註冊的使用者,首次儲值自動加贈 $3
🏢 企業服務頁上線,用得越多省得越多
月消耗達標自動返利,無需申請、無需對接,次月初到帳。
| 檔位 | 月消耗門檻 | 返利比例 |
|---|---|---|
| Bronze | $1,000+ | 3% |
| Silver | $5,000+ | 4% |
| Gold | $10,000+ | 5% |
| Platinum | $20,000+ | 7% |
疊加的企業級能力:
- 0% 平台手續費 — 模型官方定價直通
- 全球加速節點 — 東京 / 新加坡 / 法蘭克福多地部署
- 99.99% 可用性 SLA — 多區域冗餘,自動故障轉移
- 零內容留存 — Prompt 與回應預設不記錄、不訓練
詳情:企業服務 。
🤖 新模型
- GLM-5V-Turbo(智譜)— GLM 多模態系列的 Turbo 加速版
- Qwen3.6 Plus(阿里百煉)— Qwen3.6 最新 Plus 規格
v1.0.47-20260327
🏷️ 一個模型,多種叫法
給模型取短名、保留舊 ID,切換平台零遷移成本。別名即生效,路由自動辨識。
舉幾個例子:
| 正式 ID | 可用別名 |
|---|---|
anthropic/claude-opus-4.7 | claude-opus-4.7 · claude-opus-4-7 · claude-opus-4-7-20260416 |
anthropic/claude-sonnet-4.6 | claude-sonnet-4.6 · claude-sonnet-4-6 · claude-sonnet-4-6-20260217 |
openai/gpt-5.4-pro | gpt-5.4-pro |
openai/gpt-5.4 | gpt-5.4 |
moonshotai/kimi-k2.6 | kimi-k2.6 |
z-ai/glm-5.1 | glm-5.1 |
完整別名列表透過 GET https://api.ofox.ai/v1/models 查詢,回應裡 aliases 欄位直接可用。
🖼️ 生圖按張計費
影像 API 改為按生成張數計費,每張透明定價。標準尺寸自動對應到各供應商的原生尺寸,用戶端程式碼零改動。
📊 影像用量視覺化
控制台首頁、用量、成本、排行榜新增「影像」維度統計,每月影像消耗一目了然。
🤖 新模型
- GLM 5.1(智譜)— GLM 系列下一代,通用能力全面升級
🔗 更短的邀請連結
邀請連結從長串改為 /x/你的碼,更易記、更易分享。
v1.0.39-20260320
🔄 模型 Fallback — 主模型故障自動切換
主模型回傳 4xx/5xx 錯誤時,Gateway 自動嘗試你設定的備用模型,最多 3 層保底。OpenAI / Anthropic / Gemini 三協定通用,用戶端程式碼零改動。 詳見 Fallback 文件。
⚔️ OfoxAI vs OpenRouter,逐項比較
OpenRouter 每次儲值收取 5.5% 手續費,OfoxAI 為 0%。同樣涵蓋 100+ 模型,月消耗 $1,000 以上可多節省 10% 以上綜合成本。 完整比較:OfoxAI vs OpenRouter 。
🤖 新模型
- GLM-5-Turbo(智譜)— GLM-5 的 Turbo 加速版
- GPT-5.4 Mini / Nano(OpenAI)— GPT-5.4 輕量雙規格,大幅降低呼叫成本
- MiniMax M2.7 / M2.7 Highspeed — MiniMax 新一代,Highspeed 版專為低延遲場景最佳化
v1.0.36-20260313
🎊 三月 Claude 返贈
全檔位 20% 返贈,活動彈窗一鍵複製優惠碼 OFOXAI2603。
| 儲值 | 返贈 | 實得 |
|---|---|---|
| $20 | $4 | $24 |
| $50 | $10 | $60 |
| $100 | $20 | $120 |
| $200 | $40 | $240 |
| $500 | $100 | $600 |
活動頁:Claude Spring 二彈 。
🤖 新模型
- GPT-5.4 / GPT-5.4 Pro(OpenAI)— GPT-5.4 新旗艦雙規格,Pro 提供更高推理上限
- Gemini Embedding 2 Preview(Google)— Google 下一代多模態向量模型
🖼️ 向量化,覆蓋全模態
Gemini Embedding 支援文字 / 影像 / 音訊 / 影片四種模態。Qwen、火山多模態向量化同步直連。
⚡ 用量資料,按小時更新
用量聚合從每日一次升級為每小時一次,消耗發生後很快可在 Dashboard 查看。
💰 優惠券顯示最佳化
訂單列表完整顯示每筆訂單的折扣金額與贈送金額。
v1.0.32-20260303
🎉 三月 Claude 活動上線
Dashboard 新增活動橫幅與消耗進度條,優惠券錯誤提示全面中英雙語在地化。 活動頁:Claude Spring 首彈 。
🤖 新模型
- GPT-5.3 Chat(OpenAI)— GPT-5.3 對話最佳化版
- Gemini 3.1 Flash Lite Preview(Google)— Gemini 3.1 輕量預覽版
- Nano Banana 2(Google)— Gemini 3.1 Flash Image Preview,新一代影像生成模型
🏷️ 導覽煥新
v1.0.30-20260226
🔒 GitHub 一鍵登入
登入頁新增 GitHub OAuth 入口,一鍵完成註冊/登入。系統會記住上次使用的登入方式。設定頁支援 GitHub 帳號的綁定、解綁與頭像同步。
🤖 新模型
- Qwen3.5 全家桶五款同步上線(阿里百煉)— Flash / 27B / 35B A3B / 122B A10B / 397B A17B
- GPT-5.3 Codex(OpenAI)— GPT-5.3 程式碼專用模型
- Gemini 3.1 Pro Preview(Google)— Gemini 3.1 Pro 預覽版
- Qwen3 Coder Next(阿里百煉)— Qwen 程式碼專用新模型
📱 行動裝置 RWD
控制台的使用者、組織、訂單模組完整適配行動裝置。側邊欄支援收合,表格智慧收起,小螢幕使用體驗流暢。
v1.0.27-20260217
📊 數據分析儀表板
用量、成本、請求三張互動式圖表。按月查看趨勢,按模型產生排行榜,篩選器支援 Provider / Model / User / API Key / 時間範圍任意組合。你的主力模型是哪一個?一目了然。
🤖 新模型
- Claude Sonnet 4.6(Anthropic)— Sonnet 系列新版本,性價比之選
- Qwen3.5 Plus(阿里百煉)— Qwen3.5 Plus 規格上線
- Doubao Seed 2.0 四規格(火山)— Code / Lite / Mini / Pro ,豆包 Seed 2.0 完整系列同步上線
🌐 行為對齊 OpenAI
chat/completions 不傳 stream 時預設非串流,與 OpenAI 官方完全一致。你的程式碼什麼都不用改。
v1.0.24-20260212
🤖 新模型
- GLM-5(智譜)— GLM 系列新一代旗艦
- MiniMax M2.5 / M2.5 Lightning — MiniMax 雙規格,Lightning 版專為低延遲最佳化
🎊 首次登入歡迎
首次登入時,歡迎彈窗完整展示 OpenAI / Anthropic / Gemini 三個 API 端點,支援一鍵複製。搭配禮花動效,給開發者一點儀式感。
🧠 供應商親和性快取
同一使用者在不同模型之間切換時,Gateway 優先選擇同一家供應商。Prompt Cache 命中率提升,回應更快,成本更低。
🎟️ 天使邀請碼系統
完整邀請碼體系上線:卡片式 UI、加入對話框、使用紀錄表格一覽。雙向獎勵機制,一鍵產生專屬分享海報。
v1.0.20-20260206
🤖 新模型
- Claude Opus 4.6(Anthropic)— Anthropic 新旗艦,再次刷新推理與寫作能力上限
🌍 一鍵切中英
1100+ 條翻譯,全平台中英雙語無縫切換。語言偏好 Cookie 幫你記住。
🔍 Web Search 按次計費
OpenAI / Anthropic / Gemini 三協定的 Web Search 工具呼叫全部精準計費。
📊 Dashboard 煥新
- 登入頁按使用者名稱個性化問候,取代通用「Hi」
- 用量統計從單日視角升級為週維度
- API Key 顯示三檔可切換:全隱藏 / 打碼 / 全明文
💵 價格顯示最佳化
$0.6000 自動去除尾零顯示為 $0.6。餘額不足的錯誤訊息改用美元格式,無需心算換算。
📚 文件站正式上線
- 完整的 OpenAI / Anthropic / Gemini 協定參考
- 10+ 工具接入指南全覆蓋:Claude Code、Codex、Gemini CLI、Zed、Cline、Cherry Studio、OpenClaw、OpenCode 等,從設定到跑通完整覆蓋
v1.0.1 ~ v1.0.9 · 2026-01-20 ~ 02-01 — 打地基的兩週
發布後的第一個兩週,我們沒有喘氣。每一次發版都讓平台更穩、更準、更好接入。
💻 Claude Code 官方適配
我們自己就用 Claude Code 寫程式碼。 1 月 21 日,Gateway 針對 Claude Code 做了完整適配——把 API Base 指向 OfoxAI,sk-*** Key 替換,所有 Claude 模型立即可用。
🧠 Thinking 推理鏈
Claude 和 Gemini 的 thinking block(模型的「推理過程」)全協定貫通。看得到模型在怎麼想,而不只是結果。
🌐 Gemini 原生協定支援
不只是 OpenAI 相容模式——Gemini 原生 API generateContent 也跑通了。Google 官方 SDK 直連,無轉譯耗損。
💵 多幣別 Stripe 付款
在 USD 之外新增 CNY / SGD 等多幣別入口,匯率快照隨訂單留存。亞太使用者可直接以本幣結算。
🎯 帳單精度 6 位小數
NanoDollar 級精度升級。單次 API 呼叫哪怕只消耗幾毫美分,都被準確記錄、如實計費。大客戶不吃虧,小客戶不委屈。
v1.0.0 · 2026-01-16 — The Gateway Goes Live
「從今天起,100+ 模型,一個 Key。」
這是 OfoxAI 平台對外正式發布的日子。
🚀 平台首發能力
- 三協定原生相容 — OpenAI / Anthropic / Gemini 三大協定直接支援,現有程式碼零改動接入
- 100+ 模型統一接入 — Claude 、GPT 、Gemini 、DeepSeek 、Qwen 等百餘模型一個 Key 打通。完整目錄:模型廣場
- 智慧路由 — Provider × Model 粒度的路由演算法,自動選擇最快、最穩的通道。詳見 Provider Routing
- 自助 API Key 管理 — Dashboard 一鍵建立、啟停、用量追蹤
- 按量計費,0% 平台費 — 模型官方定價直通。價格查詢:Pricing
- Stripe 信用卡付款 — 儲值即時到帳,餘額可查
- 全球邊緣節點 — 東京 / 新加坡 / 法蘭克福多地部署,就近路由
🌐 底層基礎設施
不是中轉站,是平台。請求經邊緣 CDN 直達 Azure / AWS / Google Cloud / 阿里雲 / Z.AI / Moonshot / 火山雲 等雲端廠商。
Day 1 · 2025-12-27 — How It Began
「讓開發者用最簡單的方式,呼叫全世界最聰明的模型。」
🦊 第一行程式碼
2025 年底,一個小小的 commit 敲下了 OfoxAI 的第一行程式碼:
feat: initialize ofox-studio monorepo⚡ 頓悟時刻
三天後,我們同時跑通了 AWS Bedrock 上的 Claude 和 Azure 上的 GPT——兩大雲端廠商、兩個頂級模型,直連不中轉。
當兩條鏈路的首次回應同時印在終端機上,我們知道:這事能做。
這不是 demo 級的適配,而是真正的多雲直連。此後 Google Cloud、阿里雲、Z.AI、Moonshot、火山雲相繼接入——「不是中轉站,是平台」 的定位,從 Day 3 起便已確立。
🌱 起點
commit 0001
一行程式碼,一個方向。 讓全世界最聰明的智能,觸手可及。
引擎點火。