Codex 周限额一天清零:5 种应对方案与按量计费 API 配置(2026)
(updated )

Codex 周限额一天清零:5 种应对方案与按量计费 API 配置(2026)

2026 年 5 月 17 日,一位 Plus 用户眼看着 Codex 周计数器一天从剩余 96% 掉到 0%——而承认这起事件的 OpenAI 工程师,仍然没法保证计数器在下一个周窗口前会重置。如果你的周限额每个月清零两次,2026 年正确的做法不是反复刷 /status,而是把 Codex CLI 接到按量计费的端点上,让钱包封顶替代日历封顶。

本文走的是周限额耗尽场景下的具体修复路径:用一段 ~/.codex/config.toml 配置直连 OpenAI Responses 兼容的 API,再配三种把月度账单压在边界内的玩法。完整的配置参考(自定义服务商、请求头、模型标识符)见《用自定义 API 端点配置 Codex CLI》

你的 Codex 配额真的用完了吗?30 秒诊断

在改任何东西之前,先确认问题真的出在计量器上,而不是连接错误或模型错误伪装成的配额错误。

症状/status 显示实际含义第一步操作
横幅:“You’ve hit your weekly limit”weekly: 0% remaining周封顶耗尽,5 小时可能仍有余量走非周限额路径(直连 API)或花掉储蓄重置
横幅:“5-hour limit reached”5h: 0% remaining / weekly > 0%仅短窗口限流等一等、换非 CLI 工作,或把同一提示走直连 API
错误:usage_limit_reachedweekly 和 5h 都 > 0%计数器异步 bug(2026 年 5 月已知问题)重启 CLI;持续不消失就上 OpenAI status 反馈并切直连兜底
错误:Unsupported wire_api服务商不匹配自定义服务商不支持 Responses API换模型或加 Responses 转译层

先用 codex 启动 REPL,在提示符下输入 /status。如果周计数器明明非零却进不去会话,那你看到的就是 OpenAI 的 Tibo 2026 年 5 月在 X 上公开承认的计数器异步 bug——这种时候切直连 API 比等对账快得多。

何时应用这些修复(什么时候只需要等)

不是每次清零都值得改配置。动 config.toml 之前,先过一遍这个决策门。

现在就修(配置直连 API):

  • 你的周计数器一个月内死掉超过一次,而且正在赶发布。
  • 周五下午刚撞上封顶,而自然重置要到下个 sprint 结束才到。
  • 你是 Plus 用户,刚刚一次重置后立刻看到 5h: 0% remaining——典型的 2026 年 5 月异步症状。

等一等:

  • 距离自然周重置已经不到 24 小时,而且工作不紧急。
  • 你有一次储蓄的重置可用(第三方报告显示,2026 年 6 月 12 日左右起符合条件的账户都有),剩余工作能在一个窗口内做完。
  • 你是 Pro 用户,且周限额下降幅度小于 25%——Pro 的吞吐余量通常足以吸收单 sprint 的尖峰。

止损线: 如果你的月度 Codex 应付折算金额(订阅+溢出)超过两个 Pro 席位,就该长期切到按量计费 API,而不是在订阅档之间反复横跳。先读定价测算那一节——如果数学结论已经明确,下面的可以略过。

理解 Codex 用量限额:5 小时、周限额与 credits

Codex 叠了四层计量器,故障模式取决于哪一层先亮红灯。

计量器范围重置节奏谁会消耗它
5 小时窗口CLI + 云端任务消息滚动 5 小时突发活跃会话、多轮重构
周封顶同一池,更宽窗口滚动 7 天持续日常工作、长时自主运行
Credits计划相关、账户侧按计划条款补充在计划支持时延长周限额
储蓄式速率限制重置账户侧 token用掉一次后通过邀请或计划授予回填一次性清零计数

官方文档只是隐约提到的几个细节:

  • 单次提示的杀伤力:2025 年 11 月一个社区帖《单次提示吃掉 7% 周限额》里,Plus 用户实测某些模型变种下单次 Codex CLI 调用平均吃掉周限额约 7%。这个比例在下面 2026 年 5 月的事件里仍然成立——一周 14 个这种提示,你就清零了。
  • 不用云端也救不了你《明明没碰 5 小时限额,周限额却用完了》这条帖子证明周限额能在 5 小时活动为零的情况下用完——两套计量是独立的,周限额按累计总量触发。
  • Credits 不是”重置按钮”:OpenAI 明确没把 credits 定位成通用的封顶补充。它只延长被支持的工作流,而不是绕过任何安全边界。

想看完整计量分解,参考《Codex 用量限额是怎么运作的》

为什么周限额比 5 小时掉得快

2026 年 Codex 计量曲线最反直觉的一点是:让你措手不及的是周限额,不是 5 小时。三个结构性原因:

云端任务的计费方式不同。 Codex CLI 会话改本地文件的一个小请求只占很小一片。同一个提示走云端任务、带多步规划和工具调用,可以让周折算量翻好几倍而完全不碰 5 小时上限——因为云端工作发生在滚动本地窗口之外,但仍计入周累加器。

重推理变种会复利消耗。 那些重构跑分最高的 Codex 调优变种——也就是周五下午活儿要紧时你会去选的那些——也是单次最烧的。一次 30 分钟以上的自主运行用旗舰变种,在周预算口径上可能等于几十条普通 Plus 消息。

计量器是异步对账的。 5 小时反映的是本地意图,周限额反映的是 credits、云任务和计划侧调整之后的服务端对账。OpenAI 公开承认的 2026 年 5 月异步事件,就是这套对账机制的可见失败;但日常使用中也会出现轻微同步缺口,偶尔累加就成了”我这周 30% 哪去了”的瞬间。

实战要点:别用 5 小时观察来做预算。把周计量当成真实的天花板来读,5 小时当成每次突发的速率限流护栏。如果你从第一天就把周计量当作规划单位,到周三就不会再被惊吓。

周限额耗尽后如何恢复(按档位)

免费版 / Go 档

flowchart LR
    A[周限额清零] --> B{有储蓄重置吗?}
    B -->|有| C[现在用掉]
    B -->|没有| D{在邀请活动期内<br/>2026 年 6 月 11–24 日?}
    D -->|是| E[邀请最多 3 位好友]
    D -->|否| F[把 CLI 切到直连 API]
    C --> G[继续干活]
    E --> G
    F --> G

Go 档周封顶最小。符合条件账户附带的免费储蓄重置是你单笔杠杆最高的操作——留给一个你不能推迟的会话。

Plus 档

操作何时选工时
用掉储蓄重置你有一次重置且剩余工作能在一个周窗口内做完5 秒
激活符合条件的 credits控制台上显示有 credits30 秒
切到直连 API一个月内清零两次或更多一次性 3 分钟配置
升级到 Pro重置后 3 天内就稳定耗尽周限额见 OpenAI 计划页

Plus 是最容易被 2026 年 5 月异步事件波及的档位——《一天从 96% 掉到 0%》那条帖子里 Plus 用户的反馈占绝大多数。如果这个模式反复出现,直连 API 别再当兜底,把它当主路径。

Pro 档

Pro 的周余量最高,但不是免疫。同一起 2026 年 5 月事件中,有 Pro 用户报告在没有重活儿的情况下周限额一小时从 100% 掉到 60%。恢复路径和 Plus 一致,区别只是 Pro 20x 档对单次提示杀伤更扛打。

要核对账户侧状态,运行 codex 后输入 /status 查会话内的 5h / weekly 计数,再去 platform.openai.com/usage 的控制台比对。会话内是客户端视角,控制台是服务端对账。当两边偏差超过 10 个百分点,看到的就是 OpenAI 的 Tibo 在 2026 年 5 月承认过的异步症状——先重启 CLI,差距还在就切到下面的直连 API 路径,别再等对账。

2026 年 Codex 周限额事件:到底什么掉得更快

日期计划发生了什么来源
2026 年 4 月 28 日全部付费计划全账户范围速率限制重置事件(有计划)OpenAI 社区公告
2026 年 5 月 17 日Plus用户 afaqak:周限额几乎没用就一天从 96% 掉到 0%社区帖 #1381172
2026 年 5 月 18 日Pro用户 3rtech:没干重活,周限额一小时从 100% 掉到 60%同帖
2026 年 5 月 18 日Plus用户 Brian_Henderson:重启后 5 小时窗口直接 0%同帖
2026 年 5 月 20 日Plus用户 minifi:清零仅出现在一个 Codex 调优模型变种上同帖
约 2026 年 6 月 12 日(第三方报告)Go / Plus / Pro / Business储蓄式重置功能开始铺开——据称每账户获 1 次免费重置;尚未找到 OpenAI 第一方公告Pasquale Pillitteri 新闻简报

规律:计量器在服务端对账,计数器异步是你最常踩到的故障模式。直连 API 干脆把这种故障模式消除了——计量在你自己的钱包里。

直连 API 修复:5 行配置好 Codex CLI

2026 年 2 月的 wire 协议变更在这里很关键:Codex CLI 弃用了 Chat Completions 支持,现在只说 OpenAI Responses API。你接的任何服务商都必须暴露 /v1/responses。ofox.ai 的官方 Codex 集成文档把 wire_api = "responses" 写死,正是因为这个约束。

第 1 步:拿到 API key

登录你的服务商,创建 key 并 export 出来。

export OPENAI_API_KEY="ofx_live_..."

第 2 步:编辑 ~/.codex/config.toml

加一段 [model_providers.<id>]openai 这个 provider id 被保留——用任何其他标签都行。

model = "openai/gpt-5.4-mini"
model_provider = "ofox"

[model_providers.ofox]
name = "ofox.ai Responses API"
base_url = "https://api.ofox.ai/v1"
wire_api = "responses"
env_key = "OPENAI_API_KEY"

第 3 步:用 /status 和一次调用验证

启动 REPL 查活跃模型和计量器,再以非交互的 exec 模式跑一次单发:

codex            # 打开 REPL,在提示符下输入 /status
codex exec "print hello in python"

单发成功就说明 wire 协议匹配。如果看到 Unsupported wire_api,说明你选的模型不支持 Responses——从 ofox 模型广场挑一个标了 Responses 的 Codex 调优变种,或读更深入的《如何在 Codex CLI 上跑任意模型》

第 4 步:设置 session 级模型覆盖(可选)

针对一次性的复杂重构,不改配置就换模型(Codex CLI 支持 -m / --model,配合 exec 跑一次非交互调用):

codex exec -m openai/gpt-5.5 "refactor the auth middleware"

需要每个配置字段都讲清楚,参考《Codex CLI config.toml 深度详解》;只用环境变量、不写 TOML 的路径见《Codex CLI 自定义 API 端点配置指南》

配置过程中常见报错

报错原因解法
Unsupported wire_api模型没实现 /v1/responses选 Codex 调优变种;广场上有 Responses 支持标签
Authentication failedbase_url 尾随斜杠或环境变量写错严格用 https://api.ofox.ai/v1;确认 env_key 与 export 的变量一致
Provider id reserved用了 openaiollamalmstudio 当 block 标签改个名字,比如 [model_providers.ofox]
Model not found缺少服务商前缀模型 id 必须带服务商前缀,比如 openai/gpt-5.4-mini,不是 gpt-5.4-mini
Connection resetCLI 到端点的网络/代理问题测试时去掉企业 CA 代理;摘掉 VPN 重试

订阅与直连之间切换的小坑

有几个反直觉的行为只在你头一次来回切换时才会显现:

  • /status 报的还是订阅计量器——即使 model_provider 已经指向直连。CLI 不会在 /status 里显示直连账户余额——去你服务商的控制台看。如果控制台显示余额正常但 /status 显示周限额 0%,你看的是订阅计量器,不是直连的。
  • 同一个环境变量承担多重身份。如果你把 OpenAI key 留在 OPENAI_API_KEY,又用同一个变量切到直连 key,那之后每次 CLI 调用都走直连直到你切回来,全程没有警告。每天来回切的话用不同 shell alias(use-plususe-ofox)。
  • 项目级配置覆盖全局配置。项目根目录的 ./codex.toml 会覆盖 ~/.codex/config.toml。把团队直连配置提交在项目根目录,工程师就没法在调试共享代码时不经意路由到自己的 Plus 上。
  • 会话中途换模型不会刷新工具描述。会话里 /model 弹窗选了另一个变种(比如 openai/gpt-5.5),新模型接住上文继续跑,但缓存的工具描述不会重新生成。旗舰级别的切换之后看到工具调用退化,重启会话。

给直连 API 加封顶的 3 种玩法

按量计费要真正比订阅划算,前提是你得真把账单压在边界内。下面三种玩法,按强制力从硬到软排。

玩法 1 — 预付钱包硬封顶(最硬的止损)

给账户充一笔固定金额(比如 20 美元)。钱包归零,API 自动拒绝调用。这是唯一能扛得住操作失误的修复——止损强制在上游执行,不在你本地配置里。

每次充值前用服务商控制台核对余额,别用本地脚本——控制台数字才是权威的,能避免本地缓存和账户状态之间漂移。

玩法 2 — 按任务降配

每个任务用足够便宜的模型。Codex CLI 的 model 标志是按调用生效的,所以一个按命令意图选档位的 wrapper 脚本能把每次调用成本压得很实在。

codex_tiered() {
  case "$1" in
    refactor|migrate) codex exec -m openai/gpt-5.5 "${@:2}" ;;
    *) codex exec -m openai/gpt-5.4-mini "${@:2}" ;;
  esac
}

降配对代码库完全透明——全部在 shell 层。

玩法 3 — 日预算 cron

用本地累加器做日预算。累加器每天 0 点通过 cron 重置,wrapper 在到达单日上限后中止调用。

# ~/.codex/budget.sh
TODAY=$(date +%F)
SPENT_FILE=~/.codex/spent.$TODAY
DAY_CAP_USD="${DAY_CAP_USD:-3.00}"
spent=$(cat "$SPENT_FILE" 2>/dev/null || echo 0)
awk -v s="$spent" -v c="$DAY_CAP_USD" 'BEGIN{exit !(s<c)}' || {
  echo "Codex daily cap $DAY_CAP_USD reached. Wait or raise DAY_CAP_USD." >&2
  exit 1
}
codex "$@"

数学只有在你真的把每次调用成本写回 $SPENT_FILE 时才成立——挂个调用后 hook 把它做了。

玩法止损强制点超支风险适合谁
预付钱包上游账户无(硬封顶)个人开发者,固定月预算
按任务降配调用时的模型标志中(无总量天花板)混合任务工作流
日预算 cron本地 shell wrapper高(仅本地、可绕过)团队共享 shell,需要可追责

三选一怎么挑

只采用一种的话,选预付。这是唯一能扛过糟糕日子的机制——Slack 一堆窗口、终端被忘了、周五度假前死循环跑飞。钱包封顶不依赖未来的你自律,是你未来的自己在压力下也无法覆盖的上游强制。

其他两种叠在上面:

  • 预付钱包单独能挡”我忘了看计量”这种故障模式。
  • 预付 + 降配能挡”这个任务不需要旗舰变种”,实战中能把钱包延长 3-5 倍。
  • 三个一起就构成了一个能在当天就暴露异常的软日限,同时把钱包当硬兜底信任。这套组合是任何 Codex 关键路径团队的推荐配置。

特别说一句降配:重构任务不要追最便宜的模型。最小 Codex 调优变种和旗舰之间的差价,往往不如因为响应质量降级多耗一轮调试。重构和迁移用旗舰,小变种留给样板代码生成、格式化和单行编辑——这些场景下质量差距很少显现。

团队/多开发者配置

上面这些玩法在团队层也能 scale,方法是把封顶上移到服务商账户,而不是落在每个工程师的 shell 上。三个值得固化的习惯:

  1. 一个团队共用一个 ofox 账户、每个工程师一个独立 API key——可以单独撤销谁而不用全员轮转,钱包封顶覆盖整个池子。
  2. 把团队 config.toml 钉到 dotfiles——把脱敏版本提交到团队 dotfiles 仓库,让每位工程师的 Codex CLI 落在同一组服务商/wire/模型默认值上;只有 API key 留在每人的 ~/.config/credentials(不进仓库)。
  3. 每周开销摘要——把服务商的用量导出做成 Slack 周一摘要,尖峰几天内就能浮出水面,而不是月底才发现。这套接通后,你再也不用调试一笔 400 美元的幽灵账单。

如果你团队有 5+ 工程师共用 Codex 池,《用自定义 API 端点配置 Codex CLI》讲了”只用环境变量”的版本,用 Ansible 部署比走 TOML 容易。

项目进行中如何零停摆迁移

实际团队情况大致是这样:一半工程师正在用各自的 Plus 订阅跑 Codex CLI,团队 Pro 账户刚撞上周限额。你没法让所有人停下来重新配置。三步保住 sprint:

  1. 把团队 API key 升级成个人环境变量覆盖——工程师在 shell rc 加 export OPENAI_API_KEY=$TEAM_OFOX_KEYexport OPENAI_BASE_URL=https://api.ofox.ai/v1,不用动 config.toml。Codex CLI 的环境变量路径会在 session 内覆盖个人订阅。
  2. 旗舰模型留给最长重构任务的那位——其他人用 Codex 小调优变种。这是单 sprint 日成本最低的恢复姿态。
  3. 明早盘点哪些会话真正需要溢出——如果团队周限额清零是一次性事件(某位工程师的自主运行),把环境变量撤回去、继续走订阅。如果这就是常态,下次站会上把团队 config.toml 提交到 dotfiles,停止反复横跳。

大多团队的错误是把直连 API 当成应急动作,等周限额一重置立刻撤回去。正确的取景框是反过来的:订阅是可预测的个人工作的默认路径,按量计费 API 是持续团队工作的默认路径。周限额清零只是一个信号——你的默认路径选错了。

直连 API 也宕机时:当下能用的备选

备选wire 协议Codex CLI 就绪何时选
ofox.aiResponses + Chat Completions是,广场会标注支持 Responses 的模型混合编码工作流,按 token 计费且单模型价格透明(Codex 集成文档
OpenRouter通过路由器暴露 Responses 面想一张账单覆盖多家服务商,能接受路由器加价
直连 OpenAI API原生 Responses想拿到和 ChatGPT 完全相同的模型身份,能接受零售全价
自托管(LiteLLM 网关)Chat→Responses 转译通过转译层你已经跑着网关,需要从任意只支持 Chat 的后端路由
等自然重置不适用不适用你的工作量能在下一个周窗口(含储蓄重置余量)内完成

跨服务商故障转移的路由层深入,参考《用自定义 API 端点配置 Codex CLI》《如何在 Codex CLI 上跑任意模型》

如何监控 Codex 状态并设置告警

三层,由粗到细。

  1. 官方状态页:收藏 status.openai.com——计量异步事件通常在社区报告后几小时内会被挂出。
  2. 会话内 /status:启动 codex 后在 REPL 提示符下输入,可打印活跃模型、5hweekly 余量。开销极低;每个长任务前跑一次。
  3. 账户控制台轮询:5 分钟 cron 打你的用量接口,能抓到 /status 和服务端计数器之间的漂移(2026 年 5 月的异步症状)。weekly < 10% 时管道到 Slack。

更深的轮询,OpenAI 用量接口暴露了每账户的累计消耗,可以挂 cron 抓——控制台视图见 platform.openai.com/usage,每个计量器具体代表什么参考 OpenAI 帮助中心关于 Codex 计划限额的说明。把控制台和会话内 /status 交叉核对,是早期发现 2026 年 5 月对账缺口最有用的信号。

本文不覆盖的范围

几个范围边界,方便你导流到正确的参考:

如果你的 Codex 周限额一个月清零两次,切到按量计费 API 并给预付钱包封顶不是降级——这是从自助餐厅切到点单外卖:你只为真正点的菜付钱,计量器只在真正出活的工作上跳。

本次刷新核查的来源