返回工具研究所
工具教程转载5 分钟阅读

Codex Chrome 扩展完全指南:让 AI 直接接管你的浏览器

本文详解 OpenAI Codex Chrome 扩展的核心能力,包括复用登录态、跨标签页上下文理解及 DevTools 调用。内容涵盖完整安装流程、权限配置与典型自动化场景,并针对国内使用障碍提供基于 CLI 与 MCP 协议的平替方案,助力用户快速上手浏览器级 AI Agent 工作流。

2026/05/17查看来源

来源:微信公众号「AI教员」
作者:AI教员
原文链接:https://mp.weixin.qq.com/s/ZdWGe8_CmzA1VPF87Gs4CA
原文日期:2026-05-10



一、什么是 Codex Chrome 扩展?

2026年5月7日,OpenAI 正式推出了 Codex for Chrome 扩展程序,这是 Codex 桌面应用的重要补充功能。与之前 Codex 内置的沙箱浏览器不同,这个扩展允许 Codex AI 直接接管你日常使用的 Chrome 浏览器,复用你已登录的会话状态,真正实现 AI 在真实浏览器环境中的操作能力。

简单来说,这是 AI 从"回答问题"到"帮你操作电脑"的重要跨越。

核心数据:OpenAI 披露 Codex 周活跃用户已突破 400 万,年初至今增长 8 倍,且 80% 的用户工作流发生在浏览器中——这正是该扩展诞生的核心背景。


二、核心功能与优势

1. 登录态网站操作

传统 AI 插件基本无法操作需要登录的网站,而 Codex Chrome 扩展可以直接复用你已登录的 Chrome 会话,支持操作:

  • • LinkedIn、Salesforce、Gmail 等 SaaS 平台
  • • 企业内部管理系统
  • • 任何需要身份验证的网站

示例指令

@Chrome open Salesforce and update the account from these call notes

2. 跨标签页上下文理解

这是该扩展的杀手级功能。Codex 可以同时读取多个标签页的内容,组合多页面上下文完成任务。

典型工作流示例

    1. 从 Gmail 读取客户邮件
    1. 打开 CRM 系统更新客户信息
    1. 下载邮件附件并整理归档

整个过程自动完成,且同一任务的所有标签页会被自动分组到 Chrome 的 Tab 组中,避免混乱。

3. 调用 Chrome DevTools

扩展支持调用 Chrome DevTools 的完整能力:

  • • 查看 Network 面板
  • • 修改 DOM 结构
  • • 执行 JavaScript 调试
  • • 监控页面请求

这使得 Codex 可以自动测试 Web 应用、检查页面错误、验证功能完整性。

4. 与传统 AI 插件对比

能力传统 AI 插件Codex Chrome 扩展
读取网页部分支持深度支持
操作网页基本不支持支持
DevTools 调试不支持支持
跨标签页上下文不支持支持
登录态网站操作不支持支持

三、安装步骤详解

前置要求

    1. 已安装 Codex 桌面应用
  • • macOS:执行 brew install --cask codex-app 或从官网下载
  • • Windows:在 Microsoft Store 搜索"Codex"安装
  • • ⚠️ 注意:不是 CLI 版的 codex
    1. 账号与订阅
  • • 必须使用 ChatGPT 账号登录(API Key 登录无法使用扩展)
  • • 需要订阅 Plus(20美元/月)或 Pro 档位
  • • 免费档账号不开放任何 Codex 功能

安装流程

    1. 打开 Codex 桌面应用
    1. 点击左下角 Settings → 选择 Plugins
    1. 点击 Add → 选择 Chrome
    1. 跟随授权流程跳转至 Chrome Web Store
    1. 安装 OpenAI 官方发布的 Codex 扩展
    1. 返回 Codex App 完成配对

验证安装是否成功

  • • Chrome 扩展图标显示蓝色 "Connected"
  • • Codex App 的 Plugins 面板中 Chrome 对应条目变为绿色

测试指令(在 Codex App 中输入):

@Chrome 现在打开了几个 tab,挑一个截图给我看

四、使用方法与权限配置

基础调用方式

  • 显式调用:在 prompt 中输入 @Chrome 指定调用扩展
  • 自动接管:在设置中开启默认自动接管 Chrome

权限配置(重要)

安装时必须勾选 "Allow access to all sites(允许访问所有网站)",否则扩展无法访问内部系统、私有域名等非公开 URL。

如果安装时未正确授权

    1. 进入 chrome://extensions/
    1. 找到 Codex 扩展
    1. 将 "Site access" 改为 "On all sites"

隐私设置建议

若担心隐私泄露,可进入 Codex App 的 Settings → Privacy,将 Chrome 扩展设置为"按 prompt 触发",仅当显式使用 @Chrome 调用时扩展才会激活。


五、典型使用场景

场景 1:企业应用自动化

@Chrome 打开 Salesforce,根据这份通话记录更新客户账户信息

场景 2:跨平台信息整合

@Chrome 从 Gmail 读取今天收到的简历邮件,提取候选人信息并整理成表格

场景 3:前端开发测试

@Chrome 打开 localhost:3000,检查登录页面的表单验证是否正常工作

场景 4:日常办公自动化

@Chrome 打开 Gmail,整理未读邮件,将重要邮件标记并分类

六、国内用户使用指南

三道核心障碍

国内用户使用官方扩展需要突破三个独立卡点:

    1. 账号障碍
  • • 需要订阅 Plus 及以上档位的 ChatGPT 账号
  • • API Key 登录无法使用扩展相关功能
    1. 支付障碍
  • • ChatGPT 订阅仅支持海外发行的 Visa/Master/AmEx 卡
  • • 国内双标卡大多被风控
  • • 可行方案:Apple ID 改区 + 礼品卡充值
    1. 网络障碍
  • • 需要稳定访问 api.openai.comchatgpt.comdevelopers.openai.com
  • • 建议使用 cf 系出口节点,避免使用 anycast 线路

替代方案:Codex CLI + ofox 网关 + Browser MCP

如果无法凑齐"ChatGPT 订阅 + 海外支付 + 稳定网络"三件套,可以通过以下方案实现近似能力(覆盖官方扩展 80% 功能):

组件作用
Codex CLI命令行版本的 Codex
ofox 网关提供 OpenAI 兼容的 API 网关,无需访问官方域名
Browser MCP通过 MCP 协议接入 Playwright 或 chrome-devtools,实现浏览器控制

成本对比

  • • 官方路径:20-200 美元/月
  • • 替代方案:5-30 美元/月

七、常见问题排查

问题 1:Codex App 启动后卡在加载页

原因chatgpt.com/codex 路由无法握手
解决:更换梯子节点,使用 cf 系出口

问题 2:Chrome 扩展显示"Disconnected"

解决步骤

    1. 进入 Codex App 的 Plugins 面板点击 "Reconnect"
    1. 检查 Chrome 是否自动禁用了扩展
    1. 进入 chrome://extensions/ 手动启用

问题 3:输入 @Chrome 后扩展无响应

原因:扩展的站点权限未开全
解决:将 Codex 扩展的 "Site access" 改为 "On all sites"

问题 4:提示"no Chrome session connected"

解决:重新走安装授权流程


八、总结

Codex Chrome 扩展的推出标志着 AI Agent 真正进入了浏览器操作层。它不再是简单的"AI 插件",而是能够理解复杂工作流、操作真实登录态网站、调用开发者工具的智能助手。

适用人群

  • • 企业开发者需要操作内部系统
  • • 前端开发者需要自动化测试
  • • 办公人员希望自动化处理跨平台任务
  • • AI 爱好者想体验最前沿的 Agent 能力

虽然国内用户面临一些使用障碍,但随着替代方案的成熟,这波 AI 浏览器自动化的浪潮已经不可阻挡。


相关资源