Codex 周限额一天清零:5 种应对方案与按量计费 API 配置(2026)
2026 年 5 月 17 日,一位 Plus 用户眼看着 Codex 周计数器一天从剩余 96% 掉到 0%——而承认这起事件的 OpenAI 工程师,仍然没法保证计数器在下一个周窗口前会重置。如果你的周限额每个月清零两次,2026 年正确的做法不是反复刷 /status,而是把 Codex CLI 接到按量计费的端点上,让钱包封顶替代日历封顶。
本文走的是周限额耗尽场景下的具体修复路径:用一段 ~/.codex/config.toml 配置直连 OpenAI Responses 兼容的 API,再配三种把月度账单压在边界内的玩法。完整的配置参考(自定义服务商、请求头、模型标识符)见《用自定义 API 端点配置 Codex CLI》。
你的 Codex 配额真的用完了吗?30 秒诊断
在改任何东西之前,先确认问题真的出在计量器上,而不是连接错误或模型错误伪装成的配额错误。
| 症状 | /status 显示 | 实际含义 | 第一步操作 |
|---|---|---|---|
| 横幅:“You’ve hit your weekly limit” | weekly: 0% remaining | 周封顶耗尽,5 小时可能仍有余量 | 走非周限额路径(直连 API)或花掉储蓄重置 |
| 横幅:“5-hour limit reached” | 5h: 0% remaining / weekly > 0% | 仅短窗口限流 | 等一等、换非 CLI 工作,或把同一提示走直连 API |
错误:usage_limit_reached | weekly 和 5h 都 > 0% | 计数器异步 bug(2026 年 5 月已知问题) | 重启 CLI;持续不消失就上 OpenAI status 反馈并切直连兜底 |
错误:Unsupported wire_api | 服务商不匹配 | 自定义服务商不支持 Responses API | 换模型或加 Responses 转译层 |
先用 codex 启动 REPL,在提示符下输入 /status。如果周计数器明明非零却进不去会话,那你看到的就是 OpenAI 的 Tibo 2026 年 5 月在 X 上公开承认的计数器异步 bug——这种时候切直连 API 比等对账快得多。
何时应用这些修复(什么时候只需要等)
不是每次清零都值得改配置。动 config.toml 之前,先过一遍这个决策门。
现在就修(配置直连 API):
- 你的周计数器一个月内死掉超过一次,而且正在赶发布。
- 周五下午刚撞上封顶,而自然重置要到下个 sprint 结束才到。
- 你是 Plus 用户,刚刚一次重置后立刻看到
5h: 0% remaining——典型的 2026 年 5 月异步症状。
等一等:
- 距离自然周重置已经不到 24 小时,而且工作不紧急。
- 你有一次储蓄的重置可用(第三方报告显示,2026 年 6 月 12 日左右起符合条件的账户都有),剩余工作能在一个窗口内做完。
- 你是 Pro 用户,且周限额下降幅度小于 25%——Pro 的吞吐余量通常足以吸收单 sprint 的尖峰。
止损线: 如果你的月度 Codex 应付折算金额(订阅+溢出)超过两个 Pro 席位,就该长期切到按量计费 API,而不是在订阅档之间反复横跳。先读定价测算那一节——如果数学结论已经明确,下面的可以略过。
理解 Codex 用量限额:5 小时、周限额与 credits
Codex 叠了四层计量器,故障模式取决于哪一层先亮红灯。
| 计量器 | 范围 | 重置节奏 | 谁会消耗它 |
|---|---|---|---|
| 5 小时窗口 | CLI + 云端任务消息 | 滚动 5 小时 | 突发活跃会话、多轮重构 |
| 周封顶 | 同一池,更宽窗口 | 滚动 7 天 | 持续日常工作、长时自主运行 |
| Credits | 计划相关、账户侧 | 按计划条款补充 | 在计划支持时延长周限额 |
| 储蓄式速率限制重置 | 账户侧 token | 用掉一次后通过邀请或计划授予回填 | 一次性清零计数 |
官方文档只是隐约提到的几个细节:
- 单次提示的杀伤力:2025 年 11 月一个社区帖《单次提示吃掉 7% 周限额》里,Plus 用户实测某些模型变种下单次 Codex CLI 调用平均吃掉周限额约 7%。这个比例在下面 2026 年 5 月的事件里仍然成立——一周 14 个这种提示,你就清零了。
- 不用云端也救不了你:《明明没碰 5 小时限额,周限额却用完了》这条帖子证明周限额能在 5 小时活动为零的情况下用完——两套计量是独立的,周限额按累计总量触发。
- Credits 不是”重置按钮”:OpenAI 明确没把 credits 定位成通用的封顶补充。它只延长被支持的工作流,而不是绕过任何安全边界。
想看完整计量分解,参考《Codex 用量限额是怎么运作的》。
为什么周限额比 5 小时掉得快
2026 年 Codex 计量曲线最反直觉的一点是:让你措手不及的是周限额,不是 5 小时。三个结构性原因:
云端任务的计费方式不同。 Codex CLI 会话改本地文件的一个小请求只占很小一片。同一个提示走云端任务、带多步规划和工具调用,可以让周折算量翻好几倍而完全不碰 5 小时上限——因为云端工作发生在滚动本地窗口之外,但仍计入周累加器。
重推理变种会复利消耗。 那些重构跑分最高的 Codex 调优变种——也就是周五下午活儿要紧时你会去选的那些——也是单次最烧的。一次 30 分钟以上的自主运行用旗舰变种,在周预算口径上可能等于几十条普通 Plus 消息。
计量器是异步对账的。 5 小时反映的是本地意图,周限额反映的是 credits、云任务和计划侧调整之后的服务端对账。OpenAI 公开承认的 2026 年 5 月异步事件,就是这套对账机制的可见失败;但日常使用中也会出现轻微同步缺口,偶尔累加就成了”我这周 30% 哪去了”的瞬间。
实战要点:别用 5 小时观察来做预算。把周计量当成真实的天花板来读,5 小时当成每次突发的速率限流护栏。如果你从第一天就把周计量当作规划单位,到周三就不会再被惊吓。
周限额耗尽后如何恢复(按档位)
免费版 / Go 档
flowchart LR
A[周限额清零] --> B{有储蓄重置吗?}
B -->|有| C[现在用掉]
B -->|没有| D{在邀请活动期内<br/>2026 年 6 月 11–24 日?}
D -->|是| E[邀请最多 3 位好友]
D -->|否| F[把 CLI 切到直连 API]
C --> G[继续干活]
E --> G
F --> G
Go 档周封顶最小。符合条件账户附带的免费储蓄重置是你单笔杠杆最高的操作——留给一个你不能推迟的会话。
Plus 档
| 操作 | 何时选 | 工时 |
|---|---|---|
| 用掉储蓄重置 | 你有一次重置且剩余工作能在一个周窗口内做完 | 5 秒 |
| 激活符合条件的 credits | 控制台上显示有 credits | 30 秒 |
| 切到直连 API | 一个月内清零两次或更多 | 一次性 3 分钟配置 |
| 升级到 Pro | 重置后 3 天内就稳定耗尽周限额 | 见 OpenAI 计划页 |
Plus 是最容易被 2026 年 5 月异步事件波及的档位——《一天从 96% 掉到 0%》那条帖子里 Plus 用户的反馈占绝大多数。如果这个模式反复出现,直连 API 别再当兜底,把它当主路径。
Pro 档
Pro 的周余量最高,但不是免疫。同一起 2026 年 5 月事件中,有 Pro 用户报告在没有重活儿的情况下周限额一小时从 100% 掉到 60%。恢复路径和 Plus 一致,区别只是 Pro 20x 档对单次提示杀伤更扛打。
要核对账户侧状态,运行 codex 后输入 /status 查会话内的 5h / weekly 计数,再去 platform.openai.com/usage 的控制台比对。会话内是客户端视角,控制台是服务端对账。当两边偏差超过 10 个百分点,看到的就是 OpenAI 的 Tibo 在 2026 年 5 月承认过的异步症状——先重启 CLI,差距还在就切到下面的直连 API 路径,别再等对账。
2026 年 Codex 周限额事件:到底什么掉得更快
| 日期 | 计划 | 发生了什么 | 来源 |
|---|---|---|---|
| 2026 年 4 月 28 日 | 全部付费计划 | 全账户范围速率限制重置事件(有计划) | OpenAI 社区公告 |
| 2026 年 5 月 17 日 | Plus | 用户 afaqak:周限额几乎没用就一天从 96% 掉到 0% | 社区帖 #1381172 |
| 2026 年 5 月 18 日 | Pro | 用户 3rtech:没干重活,周限额一小时从 100% 掉到 60% | 同帖 |
| 2026 年 5 月 18 日 | Plus | 用户 Brian_Henderson:重启后 5 小时窗口直接 0% | 同帖 |
| 2026 年 5 月 20 日 | Plus | 用户 minifi:清零仅出现在一个 Codex 调优模型变种上 | 同帖 |
| 约 2026 年 6 月 12 日(第三方报告) | Go / Plus / Pro / Business | 储蓄式重置功能开始铺开——据称每账户获 1 次免费重置;尚未找到 OpenAI 第一方公告 | Pasquale Pillitteri 新闻简报 |
规律:计量器在服务端对账,计数器异步是你最常踩到的故障模式。直连 API 干脆把这种故障模式消除了——计量在你自己的钱包里。
直连 API 修复:5 行配置好 Codex CLI
2026 年 2 月的 wire 协议变更在这里很关键:Codex CLI 弃用了 Chat Completions 支持,现在只说 OpenAI Responses API。你接的任何服务商都必须暴露 /v1/responses。ofox.ai 的官方 Codex 集成文档把 wire_api = "responses" 写死,正是因为这个约束。
第 1 步:拿到 API key
登录你的服务商,创建 key 并 export 出来。
export OPENAI_API_KEY="ofx_live_..."
第 2 步:编辑 ~/.codex/config.toml
加一段 [model_providers.<id>]。openai 这个 provider id 被保留——用任何其他标签都行。
model = "openai/gpt-5.4-mini"
model_provider = "ofox"
[model_providers.ofox]
name = "ofox.ai Responses API"
base_url = "https://api.ofox.ai/v1"
wire_api = "responses"
env_key = "OPENAI_API_KEY"
第 3 步:用 /status 和一次调用验证
启动 REPL 查活跃模型和计量器,再以非交互的 exec 模式跑一次单发:
codex # 打开 REPL,在提示符下输入 /status
codex exec "print hello in python"
单发成功就说明 wire 协议匹配。如果看到 Unsupported wire_api,说明你选的模型不支持 Responses——从 ofox 模型广场挑一个标了 Responses 的 Codex 调优变种,或读更深入的《如何在 Codex CLI 上跑任意模型》。
第 4 步:设置 session 级模型覆盖(可选)
针对一次性的复杂重构,不改配置就换模型(Codex CLI 支持 -m / --model,配合 exec 跑一次非交互调用):
codex exec -m openai/gpt-5.5 "refactor the auth middleware"
需要每个配置字段都讲清楚,参考《Codex CLI config.toml 深度详解》;只用环境变量、不写 TOML 的路径见《Codex CLI 自定义 API 端点配置指南》。
配置过程中常见报错
| 报错 | 原因 | 解法 |
|---|---|---|
Unsupported wire_api | 模型没实现 /v1/responses | 选 Codex 调优变种;广场上有 Responses 支持标签 |
Authentication failed | base_url 尾随斜杠或环境变量写错 | 严格用 https://api.ofox.ai/v1;确认 env_key 与 export 的变量一致 |
Provider id reserved | 用了 openai、ollama 或 lmstudio 当 block 标签 | 改个名字,比如 [model_providers.ofox] |
Model not found | 缺少服务商前缀 | 模型 id 必须带服务商前缀,比如 openai/gpt-5.4-mini,不是 gpt-5.4-mini |
Connection reset | CLI 到端点的网络/代理问题 | 测试时去掉企业 CA 代理;摘掉 VPN 重试 |
订阅与直连之间切换的小坑
有几个反直觉的行为只在你头一次来回切换时才会显现:
/status报的还是订阅计量器——即使model_provider已经指向直连。CLI 不会在/status里显示直连账户余额——去你服务商的控制台看。如果控制台显示余额正常但/status显示周限额 0%,你看的是订阅计量器,不是直连的。- 同一个环境变量承担多重身份。如果你把 OpenAI key 留在
OPENAI_API_KEY,又用同一个变量切到直连 key,那之后每次 CLI 调用都走直连直到你切回来,全程没有警告。每天来回切的话用不同 shell alias(use-plus、use-ofox)。 - 项目级配置覆盖全局配置。项目根目录的
./codex.toml会覆盖~/.codex/config.toml。把团队直连配置提交在项目根目录,工程师就没法在调试共享代码时不经意路由到自己的 Plus 上。 - 会话中途换模型不会刷新工具描述。会话里
/model弹窗选了另一个变种(比如openai/gpt-5.5),新模型接住上文继续跑,但缓存的工具描述不会重新生成。旗舰级别的切换之后看到工具调用退化,重启会话。
给直连 API 加封顶的 3 种玩法
按量计费要真正比订阅划算,前提是你得真把账单压在边界内。下面三种玩法,按强制力从硬到软排。
玩法 1 — 预付钱包硬封顶(最硬的止损)
给账户充一笔固定金额(比如 20 美元)。钱包归零,API 自动拒绝调用。这是唯一能扛得住操作失误的修复——止损强制在上游执行,不在你本地配置里。
每次充值前用服务商控制台核对余额,别用本地脚本——控制台数字才是权威的,能避免本地缓存和账户状态之间漂移。
玩法 2 — 按任务降配
每个任务用足够便宜的模型。Codex CLI 的 model 标志是按调用生效的,所以一个按命令意图选档位的 wrapper 脚本能把每次调用成本压得很实在。
codex_tiered() {
case "$1" in
refactor|migrate) codex exec -m openai/gpt-5.5 "${@:2}" ;;
*) codex exec -m openai/gpt-5.4-mini "${@:2}" ;;
esac
}
降配对代码库完全透明——全部在 shell 层。
玩法 3 — 日预算 cron
用本地累加器做日预算。累加器每天 0 点通过 cron 重置,wrapper 在到达单日上限后中止调用。
# ~/.codex/budget.sh
TODAY=$(date +%F)
SPENT_FILE=~/.codex/spent.$TODAY
DAY_CAP_USD="${DAY_CAP_USD:-3.00}"
spent=$(cat "$SPENT_FILE" 2>/dev/null || echo 0)
awk -v s="$spent" -v c="$DAY_CAP_USD" 'BEGIN{exit !(s<c)}' || {
echo "Codex daily cap $DAY_CAP_USD reached. Wait or raise DAY_CAP_USD." >&2
exit 1
}
codex "$@"
数学只有在你真的把每次调用成本写回 $SPENT_FILE 时才成立——挂个调用后 hook 把它做了。
| 玩法 | 止损强制点 | 超支风险 | 适合谁 |
|---|---|---|---|
| 预付钱包 | 上游账户 | 无(硬封顶) | 个人开发者,固定月预算 |
| 按任务降配 | 调用时的模型标志 | 中(无总量天花板) | 混合任务工作流 |
| 日预算 cron | 本地 shell wrapper | 高(仅本地、可绕过) | 团队共享 shell,需要可追责 |
三选一怎么挑
只采用一种的话,选预付。这是唯一能扛过糟糕日子的机制——Slack 一堆窗口、终端被忘了、周五度假前死循环跑飞。钱包封顶不依赖未来的你自律,是你未来的自己在压力下也无法覆盖的上游强制。
其他两种叠在上面:
- 预付钱包单独能挡”我忘了看计量”这种故障模式。
- 预付 + 降配能挡”这个任务不需要旗舰变种”,实战中能把钱包延长 3-5 倍。
- 三个一起就构成了一个能在当天就暴露异常的软日限,同时把钱包当硬兜底信任。这套组合是任何 Codex 关键路径团队的推荐配置。
特别说一句降配:重构任务不要追最便宜的模型。最小 Codex 调优变种和旗舰之间的差价,往往不如因为响应质量降级多耗一轮调试。重构和迁移用旗舰,小变种留给样板代码生成、格式化和单行编辑——这些场景下质量差距很少显现。
团队/多开发者配置
上面这些玩法在团队层也能 scale,方法是把封顶上移到服务商账户,而不是落在每个工程师的 shell 上。三个值得固化的习惯:
- 一个团队共用一个 ofox 账户、每个工程师一个独立 API key——可以单独撤销谁而不用全员轮转,钱包封顶覆盖整个池子。
- 把团队
config.toml钉到 dotfiles——把脱敏版本提交到团队dotfiles仓库,让每位工程师的 Codex CLI 落在同一组服务商/wire/模型默认值上;只有 API key 留在每人的~/.config/credentials(不进仓库)。 - 每周开销摘要——把服务商的用量导出做成 Slack 周一摘要,尖峰几天内就能浮出水面,而不是月底才发现。这套接通后,你再也不用调试一笔 400 美元的幽灵账单。
如果你团队有 5+ 工程师共用 Codex 池,《用自定义 API 端点配置 Codex CLI》讲了”只用环境变量”的版本,用 Ansible 部署比走 TOML 容易。
项目进行中如何零停摆迁移
实际团队情况大致是这样:一半工程师正在用各自的 Plus 订阅跑 Codex CLI,团队 Pro 账户刚撞上周限额。你没法让所有人停下来重新配置。三步保住 sprint:
- 把团队 API key 升级成个人环境变量覆盖——工程师在 shell rc 加
export OPENAI_API_KEY=$TEAM_OFOX_KEY和export OPENAI_BASE_URL=https://api.ofox.ai/v1,不用动 config.toml。Codex CLI 的环境变量路径会在 session 内覆盖个人订阅。 - 旗舰模型留给最长重构任务的那位——其他人用 Codex 小调优变种。这是单 sprint 日成本最低的恢复姿态。
- 明早盘点哪些会话真正需要溢出——如果团队周限额清零是一次性事件(某位工程师的自主运行),把环境变量撤回去、继续走订阅。如果这就是常态,下次站会上把团队
config.toml提交到 dotfiles,停止反复横跳。
大多团队的错误是把直连 API 当成应急动作,等周限额一重置立刻撤回去。正确的取景框是反过来的:订阅是可预测的个人工作的默认路径,按量计费 API 是持续团队工作的默认路径。周限额清零只是一个信号——你的默认路径选错了。
直连 API 也宕机时:当下能用的备选
| 备选 | wire 协议 | Codex CLI 就绪 | 何时选 |
|---|---|---|---|
| ofox.ai | Responses + Chat Completions | 是,广场会标注支持 Responses 的模型 | 混合编码工作流,按 token 计费且单模型价格透明(Codex 集成文档) |
| OpenRouter | 通过路由器暴露 Responses 面 | 是 | 想一张账单覆盖多家服务商,能接受路由器加价 |
| 直连 OpenAI API | 原生 Responses | 是 | 想拿到和 ChatGPT 完全相同的模型身份,能接受零售全价 |
| 自托管(LiteLLM 网关) | Chat→Responses 转译 | 通过转译层 | 你已经跑着网关,需要从任意只支持 Chat 的后端路由 |
| 等自然重置 | 不适用 | 不适用 | 你的工作量能在下一个周窗口(含储蓄重置余量)内完成 |
跨服务商故障转移的路由层深入,参考《用自定义 API 端点配置 Codex CLI》和《如何在 Codex CLI 上跑任意模型》。
如何监控 Codex 状态并设置告警
三层,由粗到细。
- 官方状态页:收藏 status.openai.com——计量异步事件通常在社区报告后几小时内会被挂出。
- 会话内
/status:启动codex后在 REPL 提示符下输入,可打印活跃模型、5h、weekly余量。开销极低;每个长任务前跑一次。 - 账户控制台轮询:5 分钟 cron 打你的用量接口,能抓到
/status和服务端计数器之间的漂移(2026 年 5 月的异步症状)。weekly < 10%时管道到 Slack。
更深的轮询,OpenAI 用量接口暴露了每账户的累计消耗,可以挂 cron 抓——控制台视图见 platform.openai.com/usage,每个计量器具体代表什么参考 OpenAI 帮助中心关于 Codex 计划限额的说明。把控制台和会话内 /status 交叉核对,是早期发现 2026 年 5 月对账缺口最有用的信号。
本文不覆盖的范围
几个范围边界,方便你导流到正确的参考:
- Codex CLI 安装问题:先读《Codex command not found:npm install 修复》。
AGENTS.md在 symlink 工作区里加载不到:这篇修复指南。- 跨工具对比(Codex vs Claude Code vs Cursor):这篇 benchmark覆盖了权衡。
如果你的 Codex 周限额一个月清零两次,切到按量计费 API 并给预付钱包封顶不是降级——这是从自助餐厅切到点单外卖:你只为真正点的菜付钱,计量器只在真正出活的工作上跳。
本次刷新核查的来源
- OpenAI 开发者文档 — Codex 配置参考(2026-06-15 已核对)
- OpenAI 帮助中心 — 在 ChatGPT 计划中使用 Codex(2026-06-15 已核对)
- OpenAI 社区帖 — Codex 周限额一天从 96% 掉到 0%(2026 年 5 月 17–20 日)
- OpenAI 社区帖 — 单次提示吃掉 7% 周限额(Plus 档)
- OpenAI 社区帖 — 明明没碰 5 小时限额,周限额却用完了
- OpenAI 社区公告 — 2026 年 4 月 28 日全部付费计划速率限制重置
- Pasquale Pillitteri — Codex 现在允许储蓄速率限制重置(2026 年 6 月 12 日)
- ofox.ai Codex CLI 集成文档(2026-06-15 已核对)
- ofox.ai 模型广场快照,2026-06-15


