更新日志
OfoxAI 的每一步——新模型、新功能、新体验。按周更新。
v1.1.0-20260428
💰 预算管理上线 — 团队 / 成员 / API Key 三维度
把”花多少钱”从口头约定变成系统强约束。一个组织可同时配置 三个维度 × 三种周期 的消费上限:
| 维度 | 适用场景 |
|---|---|
| 团队(Organization) | 公司/项目总预算 |
| 成员(User) | 单个员工的月度配额 |
| API Key | 单个应用 / 服务的独立预算 |
每个维度均可分别设置 每日 / 每月 / 累计 三种周期上限,越界自动拒绝请求。
进度条提示三档预警:
- 🟢 40% — 用量正常
- 🟡 80% — 接近上限
- 🔴 110% — 已超出(预留缓冲,避免高并发瞬时击穿)
层级约束自动校验:API Key 上限 ≤ 成员上限 ≤ 团队上限。前端实时提示父级配额,避免误配。
入口:设置 → 配额
⏱️ 团队级 RPM 配额
新增 团队级请求速率限制(RPM),从根源防止多 API Key 叠加击穿上游供应商配额。
- 整个团队聚合计算 RPM,不再按单 Key 分别计算
- 默认 100 RPM,需要更高频率请联系 [email protected]
- 超限请求自动返回
429 Too Many Requests
适用场景:CI/CD 突发流量、批处理任务防失控、多人协作团队的统一限速。
🪙 余额查询 OpenAPI
新增 GET /v1/user/balance,使用任一 OfoxAI API Key 即可查询账户的可用余额、累计入账与累计扣费。
curl https://api.ofox.ai/v1/user/balance \
-H "Authorization: Bearer $OFOX_API_KEY"响应结构与 cc-switch 等第三方工具兼容,可直接作为余额提供方接入。
🧰 cc-switch 集成支持
OfoxAI 现已原生兼容 cc-switch — 在 cc-switch 中切换到 OfoxAI 即可看到实时余额状态,无需额外开发。

四步完成配置:
- 打开用量查询配置 — 在 OfoxAI 供应商卡片右上角点击 📊 图标
- 启用用量查询 — 打开开关
- 填入 API Key — 任一 OfoxAI 用户级 API Key 即可(在 Dashboard 创建)
- 请求地址 — 选择”通用模板”,地址填
https://api.ofox.ai/v1
保存后,供应商卡片即时显示 剩余: 64.77 USD 等余额状态。
详细接入步骤:cc-switch 集成指南。
新模型 · 2026-04-24
🤖 新模型
- GPT-5.5(OpenAI)— 面向复杂专业工作负载的新旗舰,1M+ token 上下文(922K 输入 / 128K 输出),推理可靠性与 token 效率较 GPT-5.4 全面提升
- DeepSeek V4 Pro(DeepSeek)— 1.6T 总参数 / 49B 激活的 MoE 旗舰,1M token 上下文,专为高级推理、代码与长程 Agent 工作流优化
- DeepSeek V4 Flash(DeepSeek)— 284B 总参数 / 13B 激活的 MoE 加速版,1M token 上下文,主打高吞吐与低延迟,性价比极致
新模型 · 2026-04-21
🤖 新模型
- Kimi K2.6(Moonshot AI)— 迄今最强的 Kimi,在代码、推理与视觉理解上全面升级
- GPT Image 2(OpenAI)— 新一代图像模型,细节更丰富、还原更准确
新模型 · 2026-04-16
🤖 新模型
- Claude Opus 4.7(Anthropic)— Anthropic 新旗舰,推理与写作能力再上一个台阶
活动 · 2026-04-15
🎁 GPT 四月消耗返赠,最高送 $250
- 时间 — 4 月 15 日 ~ 25 日,11 天限时
- 返赠 — GPT 全系列消耗 25% 返赠,6 档可选,最高送 $250
- 到账 — 返赠额度永久有效,活动结束后一键兑换
- 团队 — 成员消耗自动合并,一起冲更高档位
活动页:GPT 四月消耗返赠 。
v1.0.55-20260407
🎁 礼品卡系统上线
在钱包页 输入礼品卡码,余额即时到账。把 AI 作为礼物送给朋友的最优雅方式。
- 隐私保护 — 交易记录仅显示卡号末四位
- 安全保障 — 多层反滥用与端到端加密,每张卡都安全
🔍 模型验真工具上线
先明确定位:OfoxAI 不是中转站。
- 运营主体 — NICE TALK PTE. LTD.(国际化大模型平台)
- 模型授权 — 官方模型厂商合规授权
- 底层算力 — Azure / AWS / Google Cloud / 阿里云 / Z.AI / Moonshot / 火山云等云厂商直接提供
- 调用链路 — 边缘 CDN 直连云厂商,无中转、无替换
为了让用户对任何 LLM 网关都能验证模型真实性,我们发布了免费检测工具:输入 API Base + Key,一键验出模型是否被替换。
工具入口:模型验真 。支持任意平台,不限 OfoxAI。
v1.0.54-20260403
💳 支付与充值升级
- 新增 Airwallex 支付渠道 — Stripe 之外多一种选择,海外支付更顺畅
- 支持美元 / 人民币 / 新加坡元 — 用你熟悉的货币结算
- 单笔充值上限提至 $10,000 — 大客户不再受限
- 代理商推荐首充赠 $3 — 通过代理商邀请注册的用户,首次充值自动加赠 $3
🏢 企业服务页上线,用得越多省得越多
月消耗达标自动返利,无需申请、无需对接,次月初到账。
| 档位 | 月消耗门槛 | 返利比例 |
|---|---|---|
| Bronze | $1,000+ | 3% |
| Silver | $5,000+ | 4% |
| Gold | $10,000+ | 5% |
| Platinum | $20,000+ | 7% |
叠加的企业级能力:
- 0% 平台手续费 — 模型官方定价直通
- 全球加速节点 — 东京 / 新加坡 / 法兰克福多地部署
- 99.99% 可用性 SLA — 多区域冗余,自动故障转移
- 零内容留存 — Prompt 与返回默认不记录、不训练
详情:企业服务 。
🤖 新模型
- GLM-5V-Turbo(智谱)— GLM 多模态系列的 Turbo 加速版
- Qwen3.6 Plus(阿里百炼)— Qwen3.6 最新 Plus 规格
v1.0.47-20260327
🏷️ 一个模型,多种叫法
给模型起短名、留旧 ID,切换平台零迁移成本。别名即生效,路由自动识别。
举几个例子:
| 正式 ID | 可用别名 |
|---|---|
anthropic/claude-opus-4.7 | claude-opus-4.7 · claude-opus-4-7 · claude-opus-4-7-20260416 |
anthropic/claude-sonnet-4.6 | claude-sonnet-4.6 · claude-sonnet-4-6 · claude-sonnet-4-6-20260217 |
openai/gpt-5.4-pro | gpt-5.4-pro |
openai/gpt-5.4 | gpt-5.4 |
moonshotai/kimi-k2.6 | kimi-k2.6 |
z-ai/glm-5.1 | glm-5.1 |
完整别名列表通过 GET https://api.ofox.ai/v1/models 查询,响应里 aliases 字段直接可用。
🖼️ 生图按张计费
图像 API 改为按生成张数计费,每张透明定价。标准尺寸自动映射到各供应商的原生尺寸,客户端代码零改动。
📊 图像用量可视化
控制台首页、用量、成本、排行榜新增”图像”维度统计,每月图像消耗一目了然。
🤖 新模型
- GLM 5.1(智谱)— GLM 系列下一代,通用能力全面升级
🔗 更短的邀请链接
邀请链接从长串改为 /x/你的码,更易记、更易分享。
v1.0.39-20260320
🔄 模型 Fallback — 主模型故障自动切换
主模型返回 4xx/5xx 错误时,网关自动尝试你配置的备用模型,最多 3 层保底。OpenAI / Anthropic / Gemini 三协议通用,客户端代码零改动。 详见 Fallback 文档。
⚔️ OfoxAI vs OpenRouter,逐项对比
OpenRouter 每次充值收取 5.5% 手续费,OfoxAI 为 0%。同样覆盖 100+ 模型,月消耗 $1,000 以上可多节省 10% 以上综合成本。 完整对比:OfoxAI vs OpenRouter 。
🤖 新模型
- GLM-5-Turbo(智谱)— GLM-5 的 Turbo 加速版
- GPT-5.4 Mini / Nano(OpenAI)— GPT-5.4 轻量双规格,大幅降低调用成本
- MiniMax M2.7 / M2.7 Highspeed — MiniMax 新一代,Highspeed 版专为低延迟场景优化
v1.0.36-20260313
🎊 三月 Claude 返赠
全档位 20% 返赠,活动弹窗一键复制优惠码 OFOXAI2603。
| 充值 | 返赠 | 实得 |
|---|---|---|
| $20 | $4 | $24 |
| $50 | $10 | $60 |
| $100 | $20 | $120 |
| $200 | $40 | $240 |
| $500 | $100 | $600 |
活动页:Claude Spring 二弹 。
🤖 新模型
- GPT-5.4 / GPT-5.4 Pro(OpenAI)— GPT-5.4 新旗舰双规格,Pro 提供更高推理上限
- Gemini Embedding 2 Preview(Google)— Google 下一代多模态向量模型
🖼️ 向量化,覆盖全模态
Gemini Embedding 支持文本 / 图像 / 音频 / 视频四种模态。Qwen、火山多模态向量化同步直连。
⚡ 用量数据,按小时更新
用量聚合从每日一次升级为每小时一次,消耗发生后很快可在 Dashboard 查看。
💰 优惠券展示优化
订单列表完整展示每笔订单的折扣金额与赠送金额。
v1.0.32-20260303
🎉 三月 Claude 活动上线
Dashboard 新增活动横幅与消耗进度条,优惠券错误提示全面中英双语本地化。 活动页:Claude Spring 首弹 。
🤖 新模型
- GPT-5.3 Chat(OpenAI)— GPT-5.3 对话优化版
- Gemini 3.1 Flash Lite Preview(Google)— Gemini 3.1 轻量预览版
- Nano Banana 2(Google)— Gemini 3.1 Flash Image Preview,新一代图像生成模型
🏷️ 导航焕新
v1.0.30-20260226
🔒 GitHub 一键登录
登录页新增 GitHub OAuth 入口,一键完成注册/登录。系统会记住上次使用的登录方式。设置页支持 GitHub 账号的绑定、解绑与头像同步。
🤖 新模型
- Qwen3.5 全家桶五款同步上线(阿里百炼)— Flash / 27B / 35B A3B / 122B A10B / 397B A17B
- GPT-5.3 Codex(OpenAI)— GPT-5.3 代码专用模型
- Gemini 3.1 Pro Preview(Google)— Gemini 3.1 Pro 预览版
- Qwen3 Coder Next(阿里百炼)— Qwen 代码专用新模型
📱 移动端响应式
控制台的用户、组织、订单模块完整适配移动端。侧边栏支持折叠,表格智能收起,小屏幕使用体验流畅。
v1.0.27-20260217
📊 数据分析仪表盘
用量、成本、请求三张交互式图表。按月查看趋势,按模型生成排行榜,筛选器支持 Provider / Model / User / API Key / 时间范围任意组合。你的主力模型是哪一个?一目了然。
🤖 新模型
- Claude Sonnet 4.6(Anthropic)— Sonnet 系列新版本,性价比之选
- Qwen3.5 Plus(阿里百炼)— Qwen3.5 Plus 规格上线
- Doubao Seed 2.0 四规格(火山)— Code / Lite / Mini / Pro ,豆包 Seed 2.0 完整系列同步上线
🌐 行为对齐 OpenAI
chat/completions 不传 stream 时默认非流式,与 OpenAI 官方完全一致。你的代码什么都不用改。
v1.0.24-20260212
🤖 新模型
- GLM-5(智谱)— GLM 系列新一代旗舰
- MiniMax M2.5 / M2.5 Lightning — MiniMax 双规格,Lightning 版专为低延迟优化
🎊 首次登录欢迎
首次登录时,欢迎弹窗完整展示 OpenAI / Anthropic / Gemini 三个 API 端点,支持一键复制。配合礼花动效,给开发者一点仪式感。
🧠 供应商亲和性缓存
同一用户在不同模型之间切换时,网关优先选择同一家供应商。Prompt Cache 命中率提升,响应更快,成本更低。
🎟️ 天使邀请码系统
完整邀请码体系上线:卡片式 UI、加入对话框、使用记录表格一览。双向奖励机制,一键生成专属分享海报。
v1.0.20-20260206
🤖 新模型
- Claude Opus 4.6(Anthropic)— Anthropic 新旗舰,再次刷新推理与写作能力上限
🌍 一键切中英
1100+ 条翻译,全平台中英双语无缝切换。语言偏好 Cookie 帮你记住。
🔍 Web Search 按次计费
OpenAI / Anthropic / Gemini 三协议的 Web Search 工具调用全部准确计费。
📊 Dashboard 焕新
- 登录页按用户名个性化问候,替代通用”Hi”
- 用量统计从单日视角升级为周维度
- API Key 显示三档可切换:全隐藏 / 打码 / 全明文
💵 价格显示优化
$0.6000 自动去除尾零显示为 $0.6。余额不足的错误消息改用美元格式,无需心算换算。
📚 文档站正式上线
- 完整的 OpenAI / Anthropic / Gemini 协议参考
- 10+ 工具接入指南全覆盖:Claude Code、Codex、Gemini CLI、Zed、Cline、Cherry Studio、OpenClaw、OpenCode 等,从配置到跑通完整覆盖
v1.0.1 ~ v1.0.9 · 2026-01-20 ~ 02-01 — 打地基的两周
发布后的第一个两周,我们没有喘气。每一次发版都让平台更稳、更准、更好接入。
💻 Claude Code 官方适配
我们自己就用 Claude Code 写代码。 1 月 21 日,网关针对 Claude Code 做了完整适配——把 API Base 指向 OfoxAI,sk-*** Key 替换,所有 Claude 模型立即可用。
🧠 Thinking 推理链
Claude 和 Gemini 的 thinking block(模型的”推理过程”)全协议贯通。看得到模型在怎么想,而不只是结果。
🌐 Gemini 原生协议支持
不止 OpenAI 兼容模式——Gemini 原生 API generateContent 也跑通了。Google 官方 SDK 直连,无转译损耗。
💵 多币种 Stripe 支付
在 USD 之外新增 CNY / SGD 等多币种入口,汇率快照随订单留存。亚太用户可直接以本币结算。
🎯 账单精度 6 位小数
NanoDollar 级精度升级。单次 API 调用哪怕只消耗几毫美分,都被准确记录、如实计费。大客户不吃亏,小客户不委屈。
v1.0.0 · 2026-01-16 — The Gateway Goes Live
“从今天起,100+ 模型,一个 Key。”
这是 OfoxAI 平台对外正式发布的日子。
🚀 平台首发能力
- 三协议原生兼容 — OpenAI / Anthropic / Gemini 三大协议直接支持,现有代码零改动接入
- 100+ 模型统一接入 — Claude 、GPT 、Gemini 、DeepSeek 、Qwen 等百余模型一个 Key 打通。完整目录:模型广场
- 智能路由 — Provider × Model 粒度的路由算法,自动选择最快、最稳的通道。详见 Provider Routing
- 自助 API Key 管理 — Dashboard 一键创建、启停、用量追踪
- 按量计费,0% 平台费 — 模型官方定价直通。价格查询:Pricing
- Stripe 信用卡支付 — 充值实时到账,余额可查
- 全球边缘节点 — 东京 / 新加坡 / 法兰克福多地部署,就近路由
🌐 底层基础设施
不是中转站,是平台。请求经边缘 CDN 直达 Azure / AWS / Google Cloud / 阿里云 / Z.AI / Moonshot / 火山云 等云厂商。
Day 1 · 2025-12-27 — How It Began
“让开发者用最简单的方式,调用全世界最聪明的模型。”
🦊 第一行代码
2025 年底,一个小小的 commit 敲下了 OfoxAI 的第一行代码:
feat: initialize ofox-studio monorepo⚡ 顿悟时刻
三天后,我们同时跑通了 AWS Bedrock 上的 Claude 和 Azure 上的 GPT——两大云厂商、两个顶级模型,直连不中转。
当两条链路的首次响应同时打印在终端上,我们知道:这事能做。
这不是 demo 级的适配,而是真正的多云直连。此后 Google Cloud、阿里云、Z.AI、Moonshot、火山云相继接入——“不是中转站,是平台” 的定位,从 Day 3 起便已确立。
🌱 起点
commit 0001
一行代码,一个方向。 让全世界最聪明的智能,触手可达。
引擎点火。