Codex Chrome 扩展 + Codex App 国内教程:5/7 新功能怎么用、用不了又该怎么办(2026)
TL;DR — OpenAI 5 月 7 日给 Codex 发了 Chrome 扩展,Codex App 现在能直接接管你已经登录好的 Chrome,跨 LinkedIn、Salesforce、Gmail 跑跨 tab 任务,调 DevTools,开多线程会话。国内用户照例卡在三个地方:ChatGPT 账号、海外信用卡、api.openai.com 握手。能凑齐三件套就走官方;凑不齐用 Codex CLI + ofox 网关 + Playwright MCP 自己拼一套,能力替代到 80%,剩下 20% 是”接管已登录 Chrome”这一刀,目前没有完全等价方案。
5/7 发了什么:Codex Chrome 扩展的具体能力
事件本身简单:太平洋时间 5 月 7 日,OpenAI 在 Codex Developers 文档和官方 X 账号同步推送了 Codex Chrome 扩展。功能挂在 Codex App(桌面 macOS/Windows 客户端)的 Plugins 里,名字就叫 Chrome。安装路径是:进 Codex App → Plugins → 加 Chrome plugin → 跟着授权流程走 → 在 Chrome 里看到扩展显示 Connected。
但比安装更值得关注的是它把 Codex 的能力推到了一条之前没有的轨道上。在这之前,Codex App 里也带浏览器,但是个内置的沙箱浏览器,从零起会话,没有登录态。这意味着如果你让 Codex 去 Salesforce 里更新一个 lead,它会卡在登录页让你重输密码;让它去 Gmail 里读未读邮件,它根本看不到收件箱。
Chrome 扩展接管的是另一回事,是你日常用的、已经登录好的 Chrome 实例。一旦扩展握手完成,Codex 可以:
- 跨多个 tab 拼上下文,比如同时读你打开的 Linear ticket、GitHub PR 和 Notion spec
- 调 Chrome DevTools,看 network 面板、改 DOM、跑 JS 调试
- 用你已经登录的 Salesforce / LinkedIn / Gmail / 内部工具会话,按你的身份执行操作
- 直接接收 prompt 里的
@Chromemention,比如 “@Chrome open Salesforce and update the account from these call notes” - 在 Chrome 的 tab group 里组织会话,不同 thread 自动分组
OpenAI 同步披露了一个数字:Codex 周活已经过 400 万,年初到现在涨了 8 倍。这个量是为什么这次推扩展——大部分常用工作流都已经发生在浏览器里,沙箱浏览器接不住。
可用区域目前明确:macOS / Windows 都有,欧盟和英国不开通,剩下”全球”。中国大陆没在白名单也没在黑名单里——这就是麻烦的开始。
国内的三道墙
实测下来,国内用 Codex App + Chrome 扩展会撞到三个独立的卡点。任何一个倒了都用不了。
第一道墙:ChatGPT 账号。Codex App 桌面端可以用 ChatGPT 账号或 OpenAI API Key 登录,但 Chrome 扩展、cloud threads、fast mode 这类靠 ChatGPT 积分的功能必须走 ChatGPT 账号那条路(API Key 登录走的是 API 计费,不享有这些)。账号本身免费可注册,但跑 Codex 任务需要 ChatGPT Plus(20 美元/月)或 Pro 订阅。Pro 现在分两档:100 美元/月那档 4 月 9 日新增,给 Plus 五倍 Codex 用量;200 美元/月那档原有,给 Plus 二十倍用量。免费档不开放 Codex。
第二道墙:海外支付。ChatGPT 订阅只收 Visa / Master / AmEx 这类海外发卡方,国内主流双标卡(万事达 + 银联)大多被风控。Apple ID 改区 + 礼品卡是社区里跑通最多的路径,但这两年苹果对礼品卡跨区也在收紧。Stripe 直接刷国内卡 90% 概率被判 fraud。
第三道墙:网络。Codex App 启动后会向 api.openai.com、chatgpt.com、developers.openai.com 这几个域名发握手请求。这三个域在国内出口都不稳。即使梯子选对线路,DevTools 里看到的 latency 也会随时蹦到几秒。Codex 是常驻进程,每个请求都要走一次握手,这种抖动落到编程会话上就是”模型回复到一半断了,下一句话还得重打”。
第三道墙是最隐蔽的。前两道你装之前就知道过不过得去,第三道是装完跑了半小时才发觉网络不稳。
凑得齐三件套:走官方路径
如果三道墙你都翻得过去(有 Plus / Pro 订阅、海外卡能续费、有稳定梯子),官方路径是最省心的,毕竟扩展是 OpenAI 自己做的,跟 Codex App 的集成最深。
下载 Codex App:macOS 用 Homebrew brew install --cask codex-app(注意是 codex-app 这个 cask,codex 那个是 CLI),或者 developers.openai.com/codex 拿安装包(Apple Silicon 和 Intel 各有一份);Windows 在 Microsoft Store 搜 “Codex” 装。装完登录 ChatGPT 账号,订阅档位 Plus(20 美元/月)以上才能跑 Codex 任务,新出的 100 美元/月 Pro 档(4/9 上线)能拿到 Plus 五倍的 Codex 用量。
装 Chrome 扩展:
Codex App → 左下 Settings → Plugins → Add → Chrome
跟着走授权流程。Codex 会把你导到 Chrome Web Store 装扩展(包名是 OpenAI 官方发布的 Codex),然后回 Codex App 完成 pairing。pairing 完成后扩展图标会显示蓝色 “Connected”,Codex App 里 Plugins 面板那一行也会变成绿色。
测一下扩展是不是真的握上了。在 Codex App 里随便起个会话,问:
@Chrome 现在打开了几个 tab,挑一个截图给我看
如果扩展工作正常,模型会列出所有 tab 的 title 和 URL,截一张当前活跃 tab 的图回来。如果它去开内置浏览器或者抱怨 “no Chrome session connected”,回 Plugins 面板看连接状态,多半是 pairing 在某一步授权没给全(最常见的是没勾 “Allow access to all sites”)。
值得提一句:扩展默认会在你启动 Codex 会话时主动接管 Chrome,但如果你担心隐私,可以在 Settings → Privacy 里把 Chrome 扩展设为”按 prompt 触发”,只有你显式 @Chrome 调用时它才上线。
凑不齐三件套:用 Codex CLI + ofox + Browser MCP 自己拼一套
凑不齐就要看清楚自己到底想要什么。Chrome 扩展给的是两件事:OpenAI 同款编程模型,加上对你已登录 Chrome 的接管。前者完全可以本地化,后者得自己拼一个等价件。
模型这边走 ofox。Codex CLI 支持自定义 base_url,把请求改向 OpenAI 兼容网关后整条链路不再碰 openai.com。先确认 Codex CLI 装好(Node ≥ 22):
npm install -g @openai/codex
codex --version
然后写 ~/.codex/config.toml:
model = "openai/gpt-5.3-codex"
model_provider = "ofoxai"
preferred_auth_method = "apikey"
[model_providers.ofoxai]
name = "ofox.ai"
base_url = "https://api.ofox.ai/v1"
env_key = "OFOX_API_KEY"
wire_api = "responses"
OFOX_API_KEY 在 ofox.ai 控制台 里 Create new key 拿到,shell 里 export OFOX_API_KEY=sk-... 或者扔 .envrc。wire_api = "responses" 不是可选项,Codex CLI 在 2026-02 已经把 chat 标记为弃用,现在写 chat 会被忽略或报错。这部分配置和老 Codex 接入大体一致,不熟可以先看 Codex 官网国内访问 + 完整安装教程 把 base 跑通。
至此你已经拿到了和 Codex App 同档位的模型能力。下一件事是浏览器。
Codex CLI 通过 MCP(Model Context Protocol)接外部能力,浏览器控制有两个主流选择:
Playwright MCP(推荐):跑 headless / headed Chromium,登录态可持久化(用 --user-data-dir 指向你日常 Chrome 的 profile,cookies 能继承),支持截图、DOM 操作、network 拦截、表单填写。
[mcp_servers.playwright]
command = "npx"
args = ["-y", "@playwright/mcp@latest", "--user-data-dir", "/Users/你/Library/Application Support/Google/Chrome/Default"]
enabled = true
注意:直接指向日常 Chrome 的 profile 之前,关掉运行中的 Chrome 实例(不然 SQLite 锁会让 Playwright 启不来)。或者复制一份 profile 到独立目录,让 MCP 用副本。
chrome-devtools MCP:直接挂到现有 Chrome DevTools Protocol 端口,控制粒度更细,看 network、改 DOM、跑 perf trace 都可以。需要先用 --remote-debugging-port=9222 启动 Chrome:
# macOS
"/Applications/Google Chrome.app/Contents/MacOS/Google Chrome" \
--remote-debugging-port=9222 \
--user-data-dir="$HOME/.chrome-mcp-profile"
然后 config 里(注意 chrome-devtools-mcp 用的是 --browser-url,不是 --debug-port):
[mcp_servers.chrome-devtools]
command = "npx"
args = ["-y", "chrome-devtools-mcp@latest", "--browser-url=http://127.0.0.1:9222"]
enabled = true
也可以省掉手动起 Chrome 这步,直接让 chrome-devtools-mcp 自己拉一个:去掉 --browser-url,加 --headless 或者什么都不加(它默认会开一个新 Chrome 实例)。
两个 MCP 可以同时挂。Playwright 适合”按指令操作页面”,chrome-devtools 适合”调试现有页面”,Codex 会根据 prompt 自己挑用哪个。
跑一个验证用例:
codex
> 帮我打开 ofox.ai 首页,截图,然后把 H1 文字读出来
模型应该走 Playwright MCP(开页面 + 截图 + 提取 DOM)。如果它说 “I don’t have browser tools available”,到 ~/.codex/log/ 看 MCP server 的 stderr,常见是 npx 拉包失败(国内 npm 走不通就改 npm registry 到淘宝镜像,或者预先 npm install -g @playwright/mcp)。
两条路径放一起:能力对照表
| 能力 | 官方 Codex Chrome 扩展 | Codex CLI + ofox + Browser MCP |
|---|---|---|
| 编程模型 | OpenAI Codex(GPT-5.3 Codex 系) | openai/gpt-5.3-codex 同档 |
| 接管已登录 Chrome | 原生 | 需复制 profile 或重启 Chrome 加 debug port |
| 跨 tab 上下文 | 自动 | Playwright tab().forEach() 手动遍历 |
| DevTools 调试 | @Chrome 自动调用 | chrome-devtools MCP 等价 |
| 商业账号合规 | OpenAI 官方背书 | 需自己评估 ToS |
| 国内可用性 | 三道墙都得过 | 只过网络层(ofox.ai 国内可达) |
| 单月成本(中度使用) | $20-200 订阅 | $5-30 token 用量 |
| 上手时间 | 5 分钟(如果三件套齐) | 30-60 分钟 |
最大的不可替代项还是合规。如果你是企业账号要在 Salesforce 里跑代理任务,公司安全策略大概率只接受 OpenAI 官方扩展,不会接受第三方 MCP 方案,这种场景就别折腾本地拼,直接补三件套。
反过来,个人开发者做编程辅助、网页爬数据、跨 tab 信息整合,CLI + MCP 这条路成本是订阅的零头,灵活度反而更高。MCP server 是开源的,要加自定义浏览器工具直接 fork 一份改。
哪些场景选 Chrome 扩展,哪些场景换 CLI
不是所有 Codex 任务都需要浏览器接管。看自己干的活落在哪类。
Chrome 扩展真正不可替代的是登录态。内部企业系统操作(Salesforce / Workday / 内部 admin 后台)、跨 SaaS 拼 workflow(Linear → Notion → Slack)、需要 Chrome 已登录态的自动化、商业场景里要 OpenAI 官方背书,这些场合走扩展最稳。
纯本地代码改动其实用不到浏览器,CLI 自己就够。这本来就是 Codex CLI 强项,参考 Codex CLI 真实编程工作流。CI / 服务器上跑 codex exec、跨终端 SSH 操作远端、需要严格 sandbox 控制写入范围,也都是 CLI 路线。
中间还有一类活:从公开网站爬数据、跑端到端测试、调试线上页面、临时 web scraping。这些活不需要”登录态接管”,CLI + Browser MCP 起一个干净的 Chromium 实例就够,比扩展省事。
如果你两边都想要,既要省钱又要 Chrome 扩展同款体验,一个折中做法是平时 CLI + MCP,遇到必须用真实登录态的任务再切到 Chrome 扩展(前提是凑得齐三件套)。两套配置不冲突,~/.codex/config.toml 是 CLI 用的,Codex App 用自己的 settings,互不影响。
常见报错速查
Codex App 启动转圈,进度条不动:Plus 订阅页可以打开,但 Codex 入口卡在 loading,多半是 chatgpt.com/codex 路由没握上。换梯子节点,优先选 cf 系出口(不要走 anycast)。
Chrome 扩展显示 Disconnected:Codex App 里 Plugins 面板点 Reconnect。如果 Chrome 那边扩展图标灰色,去 chrome://extensions/ 看是不是被自动禁用(Chrome 偶尔会因策略组禁用未签名扩展),手动 enable + 重新 pair。
@Chrome 调用没反应,模型只回复纯文本:扩展安装时 site permission 没给全。Chrome 扩展 → Codex → Site access → 改成 “On all sites”。这步官方安装流程经常一笔带过,但不给”all sites”很多内部系统的 URL 模式扩展看不见。
CLI 报 401 Unauthorized:OFOX_API_KEY 没 export,或者 key 跑去了 placeholder。echo $OFOX_API_KEY 确认有值。还报错就 ofox 控制台 regenerate 一个新 key。
Playwright MCP 起不来,stderr 报 SQLite locked:日常 Chrome 还开着,关掉 Chrome 重启 Codex 即可。或者改 config 让 MCP 用一个独立的 user-data-dir,别和日常 Chrome 共享 profile。
chrome-devtools MCP 连不上 9222:Chrome 启动时 --remote-debugging-port=9222 只对该实例生效。如果你之前已经开了 Chrome,新窗口的 flag 不会生效,需要彻底 quit Chrome(pkill -f "Google Chrome")再用带 flag 的命令重启。
怎么挑下一步
国内用户四种典型画像,对应四种走法:
- 个人开发者,没订阅没海外卡,但有 ofox API key → 直接走 CLI + ofox + Playwright MCP,30 分钟拼好,月成本 $5-15
- 创业团队,有海外业务有海外卡 → 给关键开发者上 Plus($20)跑 Chrome 扩展,其他人 CLI 路线
- 大厂内部,有合规要求 → 拿 OpenAI Enterprise 走官方扩展,IT 那边走对公采购
- 学习 / 评估 → 先 CLI 跑通看模型水平,再决定要不要补订阅
如果你在 AI 编程工具大横评 里看完还在 Codex / Claude Code / Cursor 之间纠结,5/7 这次更新值得把 Codex 的优先级往上挪一档,浏览器接管是 Cursor 和 Claude Code 目前都还没补上的能力。当然 Claude Code 那边走的是另一套生态,参考 Claude Code 国内使用 + Opus 4.6 编程体验,看哪边更贴你日常工作流。
最后一条:Codex App 和 Codex CLI 共用一份 ~/.codex/config.toml,但登录态彼此独立。两边都支持 ChatGPT 账号和 API Key 两种登录方式,所以你可以让 Codex App 走 ChatGPT 账号那条路(拿 Chrome 扩展、cloud threads 这些 ChatGPT 积分功能),CLI 走 ofox API Key 那条路(不碰 openai.com),两边各跑各的会话,互不打架。


