Codex 周限额用完后会怎样？

Codex CLI 会返回 usage-limit 错误，拒绝启动新任务，直到滚动的周窗口过期。5 小时窗口可能还有余量，但周限额耗尽后新会话不再从中扣除。可选方案只有四个：等自然重置、花掉储蓄的重置额度、用账户里的 credits（如计划支持）、或把 Codex CLI 指向按量计费的 API 端点。

Codex 周限额怎么手动重置？

社区报告（Pasquale Pillitteri 的新闻简报及后续 X 讨论）显示，储蓄式重置功能在 2026 年 6 月 12 日左右开始向 Go、Plus、Pro、Business 计划推送：每个符合条件的账户初始获得 1 次免费重置，可随时清零计数器；另外 2026 年 6 月 11–24 日的邀请活动还能再赚最多 3 次（每邀请 1 人 +1 次）。撰写本文时 OpenAI 还没发官方公告，时间以你自己的控制台为准。除此之外，周计数器只能等 7 天滚动窗口自然刷新。

不订阅 ChatGPT Plus 也能用 Codex CLI 吗？

可以。从 2026 年 2 月起，Codex CLI 只支持 OpenAI Responses API，所以任何提供 `/v1/responses` 端点的服务商都能驱动它。在 `~/.codex/config.toml` 里把 `model_provider` 指向自定义块，设置 `wire_api = "responses"` 和你服务商的 `base_url`，CLI 就完全绕开了 ChatGPT 订阅的计量。

Codex 5 小时限额和周限额有什么区别？

5 小时窗口是 CLI 消息和云端任务共用的滚动本地+云端配额——它持续重置。周限额是单独的封顶，针对长期工作负载，每 7 天才滚动一次。完全可能在周限额耗尽时 5 小时窗口都没满，这就是 2026 年最常见的「配额突然清零」场景。

为什么我的 Codex 周限额掉得这么快？

2026 年有两类已知原因。一是 2026 年 5 月 OpenAI 的 Tibo 公开承认过一次计数器异步事件——部分 Plus 用户的剩余额度一天内从 96% 掉到 0%。二是某些 Codex 调优变种的单次提示词，在触发长推理链或大规模云任务展开时，可以一次吃掉周限额的 7%。

能不能按 token 付费用 Codex CLI？

可以。在 `~/.codex/config.toml` 配一个自定义 `model_provider`，指向任意兼容 OpenAI Responses 的端点。像 ofox.ai 这种直连入口按 token 计费而非按订阅，开支封顶在钱包，不必盯着每周窗口。

ChatGPT Plus 包含无限 Codex 使用吗？

不包含。Plus 包含 Codex 使用权，但被 5 小时滚动窗口 + 周封顶限制。本地 CLI 消息和云端任务共用同一组计量。符合条件的 Plus 账户可以用 credits 延长部分 Codex 工作，但 credits 不会每次都补满周限额，OpenAI 也明确不把它定位成「重置按钮」。

Codex 周限额一天清零：5 种应对方案与按量计费 API 配置（2026）

Q: ofox.ai 可以直接驱动 Codex CLI 吗？

对于在 ofox 模型广场上标注支持 Responses 协议的模型，可以。在 `~/.codex/config.toml` 里设 `base_url = "https://api.ofox.ai/v1"`、`wire_api = "responses"`、`env_key = "OPENAI_API_KEY"`，再 `export OPENAI_API_KEY= ` 即可。没有 Responses 标签的模型（部分开源模型）会报协议错误——从目录里挑一个 Codex 调优变种就行。

2026 年 5 月 17 日，一位 Plus 用户眼看着 Codex 周计数器一天从剩余 96% 掉到 0%——而承认这起事件的 OpenAI 工程师，仍然没法保证计数器在下一个周窗口前会重置。如果你的周限额每个月清零两次，2026 年正确的做法不是反复刷 /status，而是把 Codex CLI 接到按量计费的端点上，让钱包封顶替代日历封顶。

本文走的是周限额耗尽场景下的具体修复路径：用一段 ~/.codex/config.toml 配置直连 OpenAI Responses 兼容的 API，再配三种把月度账单压在边界内的玩法。完整的配置参考（自定义服务商、请求头、模型标识符）见《用自定义 API 端点配置 Codex CLI》。

你的 Codex 配额真的用完了吗？30 秒诊断

在改任何东西之前，先确认问题真的出在计量器上，而不是连接错误或模型错误伪装成的配额错误。

症状	`/status` 显示	实际含义	第一步操作
横幅：“You’ve hit your weekly limit”	`weekly: 0% remaining`	周封顶耗尽，5 小时可能仍有余量	走非周限额路径（直连 API）或花掉储蓄重置
横幅：“5-hour limit reached”	`5h: 0% remaining` / weekly > 0%	仅短窗口限流	等一等、换非 CLI 工作，或把同一提示走直连 API
错误：`usage_limit_reached`	weekly 和 5h 都 > 0%	计数器异步 bug（2026 年 5 月已知问题）	重启 CLI；持续不消失就上 OpenAI status 反馈并切直连兜底
错误：`Unsupported wire_api`	服务商不匹配	自定义服务商不支持 Responses API	换模型或加 Responses 转译层

先用 codex 启动 REPL，在提示符下输入 /status。如果周计数器明明非零却进不去会话，那你看到的就是 OpenAI 的 Tibo 2026 年 5 月在 X 上公开承认的计数器异步 bug——这种时候切直连 API 比等对账快得多。

何时应用这些修复（什么时候只需要等）

不是每次清零都值得改配置。动 config.toml 之前，先过一遍这个决策门。

现在就修（配置直连 API）：

你的周计数器一个月内死掉超过一次，而且正在赶发布。
周五下午刚撞上封顶，而自然重置要到下个 sprint 结束才到。
你是 Plus 用户，刚刚一次重置后立刻看到 5h: 0% remaining——典型的 2026 年 5 月异步症状。

等一等：

距离自然周重置已经不到 24 小时，而且工作不紧急。
你有一次储蓄的重置可用（第三方报告显示，2026 年 6 月 12 日左右起符合条件的账户都有），剩余工作能在一个窗口内做完。
你是 Pro 用户，且周限额下降幅度小于 25%——Pro 的吞吐余量通常足以吸收单 sprint 的尖峰。

止损线： 如果你的月度 Codex 应付折算金额（订阅+溢出）超过两个 Pro 席位，就该长期切到按量计费 API，而不是在订阅档之间反复横跳。先读定价测算那一节——如果数学结论已经明确，下面的可以略过。

理解 Codex 用量限额：5 小时、周限额与 credits

Codex 叠了四层计量器，故障模式取决于哪一层先亮红灯。

计量器	范围	重置节奏	谁会消耗它
5 小时窗口	CLI + 云端任务消息	滚动 5 小时	突发活跃会话、多轮重构
周封顶	同一池，更宽窗口	滚动 7 天	持续日常工作、长时自主运行
Credits	计划相关、账户侧	按计划条款补充	在计划支持时延长周限额
储蓄式速率限制重置	账户侧 token	用掉一次后通过邀请或计划授予回填	一次性清零计数

官方文档只是隐约提到的几个细节：

单次提示的杀伤力：2025 年 11 月一个社区帖《单次提示吃掉 7% 周限额》里，Plus 用户实测某些模型变种下单次 Codex CLI 调用平均吃掉周限额约 7%。这个比例在下面 2026 年 5 月的事件里仍然成立——一周 14 个这种提示，你就清零了。
不用云端也救不了你：《明明没碰 5 小时限额，周限额却用完了》这条帖子证明周限额能在 5 小时活动为零的情况下用完——两套计量是独立的，周限额按累计总量触发。
Credits 不是”重置按钮”：OpenAI 明确没把 credits 定位成通用的封顶补充。它只延长被支持的工作流，而不是绕过任何安全边界。

想看完整计量分解，参考《Codex 用量限额是怎么运作的》。

为什么周限额比 5 小时掉得快

2026 年 Codex 计量曲线最反直觉的一点是：让你措手不及的是周限额，不是 5 小时。三个结构性原因：

云端任务的计费方式不同。 Codex CLI 会话改本地文件的一个小请求只占很小一片。同一个提示走云端任务、带多步规划和工具调用，可以让周折算量翻好几倍而完全不碰 5 小时上限——因为云端工作发生在滚动本地窗口之外，但仍计入周累加器。

重推理变种会复利消耗。 那些重构跑分最高的 Codex 调优变种——也就是周五下午活儿要紧时你会去选的那些——也是单次最烧的。一次 30 分钟以上的自主运行用旗舰变种，在周预算口径上可能等于几十条普通 Plus 消息。

计量器是异步对账的。 5 小时反映的是本地意图，周限额反映的是 credits、云任务和计划侧调整之后的服务端对账。OpenAI 公开承认的 2026 年 5 月异步事件，就是这套对账机制的可见失败；但日常使用中也会出现轻微同步缺口，偶尔累加就成了”我这周 30% 哪去了”的瞬间。

实战要点：别用 5 小时观察来做预算。把周计量当成真实的天花板来读，5 小时当成每次突发的速率限流护栏。如果你从第一天就把周计量当作规划单位，到周三就不会再被惊吓。

周限额耗尽后如何恢复（按档位）

免费版 / Go 档

flowchart LR
    A[周限额清零] --> B{有储蓄重置吗？}
    B -->|有| C[现在用掉]
    B -->|没有| D{在邀请活动期内<br/>2026 年 6 月 11–24 日？}
    D -->|是| E[邀请最多 3 位好友]
    D -->|否| F[把 CLI 切到直连 API]
    C --> G[继续干活]
    E --> G
    F --> G

Go 档周封顶最小。符合条件账户附带的免费储蓄重置是你单笔杠杆最高的操作——留给一个你不能推迟的会话。

Plus 档

操作	何时选	工时
用掉储蓄重置	你有一次重置且剩余工作能在一个周窗口内做完	5 秒
激活符合条件的 credits	控制台上显示有 credits	30 秒
切到直连 API	一个月内清零两次或更多	一次性 3 分钟配置
升级到 Pro	重置后 3 天内就稳定耗尽周限额	见 OpenAI 计划页

Plus 是最容易被 2026 年 5 月异步事件波及的档位——《一天从 96% 掉到 0%》那条帖子里 Plus 用户的反馈占绝大多数。如果这个模式反复出现，直连 API 别再当兜底，把它当主路径。

Pro 档

Pro 的周余量最高，但不是免疫。同一起 2026 年 5 月事件中，有 Pro 用户报告在没有重活儿的情况下周限额一小时从 100% 掉到 60%。恢复路径和 Plus 一致，区别只是 Pro 20x 档对单次提示杀伤更扛打。

要核对账户侧状态，运行 codex 后输入 /status 查会话内的 5h / weekly 计数，再去 platform.openai.com/usage 的控制台比对。会话内是客户端视角，控制台是服务端对账。当两边偏差超过 10 个百分点，看到的就是 OpenAI 的 Tibo 在 2026 年 5 月承认过的异步症状——先重启 CLI，差距还在就切到下面的直连 API 路径，别再等对账。

2026 年 Codex 周限额事件：到底什么掉得更快

日期	计划	发生了什么	来源
2026 年 4 月 28 日	全部付费计划	全账户范围速率限制重置事件（有计划）	OpenAI 社区公告
2026 年 5 月 17 日	Plus	用户 afaqak：周限额几乎没用就一天从 96% 掉到 0%	社区帖 #1381172
2026 年 5 月 18 日	Pro	用户 3rtech：没干重活，周限额一小时从 100% 掉到 60%	同帖
2026 年 5 月 18 日	Plus	用户 Brian_Henderson：重启后 5 小时窗口直接 0%	同帖
2026 年 5 月 20 日	Plus	用户 minifi：清零仅出现在一个 Codex 调优模型变种上	同帖
约 2026 年 6 月 12 日（第三方报告）	Go / Plus / Pro / Business	储蓄式重置功能开始铺开——据称每账户获 1 次免费重置；尚未找到 OpenAI 第一方公告	Pasquale Pillitteri 新闻简报

规律：计量器在服务端对账，计数器异步是你最常踩到的故障模式。直连 API 干脆把这种故障模式消除了——计量在你自己的钱包里。

直连 API 修复：5 行配置好 Codex CLI

2026 年 2 月的 wire 协议变更在这里很关键：Codex CLI 弃用了 Chat Completions 支持，现在只说 OpenAI Responses API。你接的任何服务商都必须暴露 /v1/responses。ofox.ai 的官方 Codex 集成文档把 wire_api = "responses" 写死，正是因为这个约束。

第 1 步：拿到 API key

登录你的服务商，创建 key 并 export 出来。

export OPENAI_API_KEY="ofx_live_..."

第 2 步：编辑 `~/.codex/config.toml`

加一段 [model_providers.<id>]。openai 这个 provider id 被保留——用任何其他标签都行。

model = "openai/gpt-5.4-mini"
model_provider = "ofox"

[model_providers.ofox]
name = "ofox.ai Responses API"
base_url = "https://api.ofox.ai/v1"
wire_api = "responses"
env_key = "OPENAI_API_KEY"

第 3 步：用 `/status` 和一次调用验证

启动 REPL 查活跃模型和计量器，再以非交互的 exec 模式跑一次单发：

codex            # 打开 REPL，在提示符下输入 /status
codex exec "print hello in python"

单发成功就说明 wire 协议匹配。如果看到 Unsupported wire_api，说明你选的模型不支持 Responses——从 ofox 模型广场挑一个标了 Responses 的 Codex 调优变种，或读更深入的《如何在 Codex CLI 上跑任意模型》。

第 4 步：设置 session 级模型覆盖（可选）

针对一次性的复杂重构，不改配置就换模型（Codex CLI 支持 -m / --model，配合 exec 跑一次非交互调用）：

codex exec -m openai/gpt-5.5 "refactor the auth middleware"

需要每个配置字段都讲清楚，参考《Codex CLI config.toml 深度详解》；只用环境变量、不写 TOML 的路径见《Codex CLI 自定义 API 端点配置指南》。

配置过程中常见报错

报错	原因	解法
`Unsupported wire_api`	模型没实现 `/v1/responses`	选 Codex 调优变种；广场上有 Responses 支持标签
`Authentication failed`	`base_url` 尾随斜杠或环境变量写错	严格用 `https://api.ofox.ai/v1`；确认 `env_key` 与 export 的变量一致
`Provider id reserved`	用了 `openai`、`ollama` 或 `lmstudio` 当 block 标签	改个名字，比如 `[model_providers.ofox]`
`Model not found`	缺少服务商前缀	模型 id 必须带服务商前缀，比如 `openai/gpt-5.4-mini`，不是 `gpt-5.4-mini`
`Connection reset`	CLI 到端点的网络/代理问题	测试时去掉企业 CA 代理；摘掉 VPN 重试

订阅与直连之间切换的小坑

有几个反直觉的行为只在你头一次来回切换时才会显现：

/status 报的还是订阅计量器——即使 model_provider 已经指向直连。CLI 不会在 /status 里显示直连账户余额——去你服务商的控制台看。如果控制台显示余额正常但 /status 显示周限额 0%，你看的是订阅计量器，不是直连的。
同一个环境变量承担多重身份。如果你把 OpenAI key 留在 OPENAI_API_KEY，又用同一个变量切到直连 key，那之后每次 CLI 调用都走直连直到你切回来，全程没有警告。每天来回切的话用不同 shell alias（use-plus、use-ofox）。
项目级配置覆盖全局配置。项目根目录的 ./codex.toml 会覆盖 ~/.codex/config.toml。把团队直连配置提交在项目根目录，工程师就没法在调试共享代码时不经意路由到自己的 Plus 上。
会话中途换模型不会刷新工具描述。会话里 /model 弹窗选了另一个变种（比如 openai/gpt-5.5），新模型接住上文继续跑，但缓存的工具描述不会重新生成。旗舰级别的切换之后看到工具调用退化，重启会话。

给直连 API 加封顶的 3 种玩法

按量计费要真正比订阅划算，前提是你得真把账单压在边界内。下面三种玩法，按强制力从硬到软排。

玩法 1 — 预付钱包硬封顶（最硬的止损）

给账户充一笔固定金额（比如 20 美元）。钱包归零，API 自动拒绝调用。这是唯一能扛得住操作失误的修复——止损强制在上游执行，不在你本地配置里。

每次充值前用服务商控制台核对余额，别用本地脚本——控制台数字才是权威的，能避免本地缓存和账户状态之间漂移。

玩法 2 — 按任务降配

每个任务用足够便宜的模型。Codex CLI 的 model 标志是按调用生效的，所以一个按命令意图选档位的 wrapper 脚本能把每次调用成本压得很实在。

codex_tiered() {
  case "$1" in
    refactor|migrate) codex exec -m openai/gpt-5.5 "${@:2}" ;;
    *) codex exec -m openai/gpt-5.4-mini "${@:2}" ;;
  esac
}

降配对代码库完全透明——全部在 shell 层。

玩法 3 — 日预算 cron

用本地累加器做日预算。累加器每天 0 点通过 cron 重置，wrapper 在到达单日上限后中止调用。

# ~/.codex/budget.sh
TODAY=$(date +%F)
SPENT_FILE=~/.codex/spent.$TODAY
DAY_CAP_USD="${DAY_CAP_USD:-3.00}"
spent=$(cat "$SPENT_FILE" 2>/dev/null || echo 0)
awk -v s="$spent" -v c="$DAY_CAP_USD" 'BEGIN{exit !(s<c)}' || {
  echo "Codex daily cap $DAY_CAP_USD reached. Wait or raise DAY_CAP_USD." >&2
  exit 1
}
codex "$@"

数学只有在你真的把每次调用成本写回 $SPENT_FILE 时才成立——挂个调用后 hook 把它做了。

玩法	止损强制点	超支风险	适合谁
预付钱包	上游账户	无（硬封顶）	个人开发者，固定月预算
按任务降配	调用时的模型标志	中（无总量天花板）	混合任务工作流
日预算 cron	本地 shell wrapper	高（仅本地、可绕过）	团队共享 shell，需要可追责

三选一怎么挑

只采用一种的话，选预付。这是唯一能扛过糟糕日子的机制——Slack 一堆窗口、终端被忘了、周五度假前死循环跑飞。钱包封顶不依赖未来的你自律，是你未来的自己在压力下也无法覆盖的上游强制。

其他两种叠在上面：

预付钱包单独能挡”我忘了看计量”这种故障模式。
预付 + 降配能挡”这个任务不需要旗舰变种”，实战中能把钱包延长 3-5 倍。
三个一起就构成了一个能在当天就暴露异常的软日限，同时把钱包当硬兜底信任。这套组合是任何 Codex 关键路径团队的推荐配置。

特别说一句降配：重构任务不要追最便宜的模型。最小 Codex 调优变种和旗舰之间的差价，往往不如因为响应质量降级多耗一轮调试。重构和迁移用旗舰，小变种留给样板代码生成、格式化和单行编辑——这些场景下质量差距很少显现。

团队/多开发者配置

上面这些玩法在团队层也能 scale，方法是把封顶上移到服务商账户，而不是落在每个工程师的 shell 上。三个值得固化的习惯：

一个团队共用一个 ofox 账户、每个工程师一个独立 API key——可以单独撤销谁而不用全员轮转，钱包封顶覆盖整个池子。
把团队 config.toml 钉到 dotfiles——把脱敏版本提交到团队 dotfiles 仓库，让每位工程师的 Codex CLI 落在同一组服务商/wire/模型默认值上；只有 API key 留在每人的 ~/.config/credentials（不进仓库）。
每周开销摘要——把服务商的用量导出做成 Slack 周一摘要，尖峰几天内就能浮出水面，而不是月底才发现。这套接通后，你再也不用调试一笔 400 美元的幽灵账单。

如果你团队有 5+ 工程师共用 Codex 池，《用自定义 API 端点配置 Codex CLI》讲了”只用环境变量”的版本，用 Ansible 部署比走 TOML 容易。

项目进行中如何零停摆迁移

实际团队情况大致是这样：一半工程师正在用各自的 Plus 订阅跑 Codex CLI，团队 Pro 账户刚撞上周限额。你没法让所有人停下来重新配置。三步保住 sprint：

把团队 API key 升级成个人环境变量覆盖——工程师在 shell rc 加 export OPENAI_API_KEY=$TEAM_OFOX_KEY 和 export OPENAI_BASE_URL=https://api.ofox.ai/v1，不用动 config.toml。Codex CLI 的环境变量路径会在 session 内覆盖个人订阅。
旗舰模型留给最长重构任务的那位——其他人用 Codex 小调优变种。这是单 sprint 日成本最低的恢复姿态。
明早盘点哪些会话真正需要溢出——如果团队周限额清零是一次性事件（某位工程师的自主运行），把环境变量撤回去、继续走订阅。如果这就是常态，下次站会上把团队 config.toml 提交到 dotfiles，停止反复横跳。

大多团队的错误是把直连 API 当成应急动作，等周限额一重置立刻撤回去。正确的取景框是反过来的：订阅是可预测的个人工作的默认路径，按量计费 API 是持续团队工作的默认路径。周限额清零只是一个信号——你的默认路径选错了。

直连 API 也宕机时：当下能用的备选

备选	wire 协议	Codex CLI 就绪	何时选
ofox.ai	Responses + Chat Completions	是，广场会标注支持 Responses 的模型	混合编码工作流，按 token 计费且单模型价格透明（Codex 集成文档）
OpenRouter	通过路由器暴露 Responses 面	是	想一张账单覆盖多家服务商，能接受路由器加价
直连 OpenAI API	原生 Responses	是	想拿到和 ChatGPT 完全相同的模型身份，能接受零售全价
自托管（LiteLLM 网关）	Chat→Responses 转译	通过转译层	你已经跑着网关，需要从任意只支持 Chat 的后端路由
等自然重置	不适用	不适用	你的工作量能在下一个周窗口（含储蓄重置余量）内完成

跨服务商故障转移的路由层深入，参考《用自定义 API 端点配置 Codex CLI》和《如何在 Codex CLI 上跑任意模型》。

如何监控 Codex 状态并设置告警

三层，由粗到细。

官方状态页：收藏 status.openai.com——计量异步事件通常在社区报告后几小时内会被挂出。
会话内 /status：启动 codex 后在 REPL 提示符下输入，可打印活跃模型、5h、weekly 余量。开销极低；每个长任务前跑一次。
账户控制台轮询：5 分钟 cron 打你的用量接口，能抓到 /status 和服务端计数器之间的漂移（2026 年 5 月的异步症状）。weekly < 10% 时管道到 Slack。

更深的轮询，OpenAI 用量接口暴露了每账户的累计消耗，可以挂 cron 抓——控制台视图见 platform.openai.com/usage，每个计量器具体代表什么参考 OpenAI 帮助中心关于 Codex 计划限额的说明。把控制台和会话内 /status 交叉核对，是早期发现 2026 年 5 月对账缺口最有用的信号。

本文不覆盖的范围

几个范围边界，方便你导流到正确的参考：

Codex CLI 安装问题：先读《Codex command not found：npm install 修复》。
Codex 官网打不开 / 国内访问：见 Codex 官网入口 + 国内访问安装教程。
AGENTS.md 在 symlink 工作区里加载不到：这篇修复指南。
跨工具对比（Codex vs Claude Code vs Cursor）：这篇 benchmark覆盖了权衡。

如果你的 Codex 周限额一个月清零两次，切到按量计费 API 并给预付钱包封顶不是降级——这是从自助餐厅切到点单外卖：你只为真正点的菜付钱，计量器只在真正出活的工作上跳。