Codex 简介

Codex 是什么？

Codex 是 OpenAI 推出的 AI 编程 Agent（智能体），而不只是一个「补全代码的模型」。给它一个任务，它可以在你的工作区里：

读代码库与文档
改文件、运行命令、跑测试
看与操控桌面应用与浏览器（Computer Use）
验证结果（测试、lint、构建）
迭代直到任务完成或需要你确认

如今 Codex 最主流的使用方式是 桌面应用（Codex App）——一个把对话、代码 Diff、Git、并行任务、自动化和插件整合在一起的图形界面。命令行（CLI）、IDE 扩展与云端版本则共享同一套 Agent 能力，按场景互补。

Codex 桌面应用：工作中的对话与 Diff 审查

一次真实任务：左侧是对话与改动的文件列表，右侧是逐行 Diff 审查面板。

从代码补全到编程 Agent

阶段	代表形态	特点
2021–2023	Codex API / 早期 Copilot	以代码补全为主，模型在云端推理
2025	Codex CLI（开源，Rust）	终端 Agent：读写文件、执行 Shell、接入 MCP
2026 起	Codex 桌面应用 + IDE + Cloud	多入口统一体验，新增 Computer Use、插件市场、自动化、Goal 模式

桌面应用于 2026 年初登陆 macOS，随后支持 Windows；2026 年的几次重要更新带来了 Computer Use（电脑操控）、应用内浏览器、图像生成、记忆（Memories）、插件市场（90+ 插件） 与 Goal 模式。

产品矩阵：四个入口，一套 Agent 能力

                    ┌─────────────────────────────────────┐
                    │      OpenAI Codex（同一套 Agent）      │
                    └─────────────────────────────────────┘
        ┌──────────────┬──────────────┬─────────────┬──────────────┐
        │  桌面应用     │   CLI        │  IDE 扩展    │   Cloud      │
        │  本教程主线   │  终端 TUI    │  VS Code 等  │  浏览器 / PR  │
        └──────────────┴──────────────┴─────────────┴──────────────┘
            本地工作区（Local）  +  云端环境（Cloud）+ GitHub

1. Codex 桌面应用（本教程主线）

macOS / Windows 原生应用，可视化 Diff、Git、并行线程、worktree
Local 模式在本机执行，Cloud 模式委派到云端
集成 Computer Use、应用内浏览器、自动化、插件市场
适合：大多数日常开发、需要可视化与多任务并行的人

2. Codex CLI

开源（github.com/openai/codex），Rust 实现，启动快
交互 TUI + codex exec 非交互
适合：终端重度用户、脚本自动化、CI、服务器/远程开发

3. IDE 扩展

VS Code、Cursor、Windsurf 等
侧边栏 Agent，结合编辑器上下文做小步修改，可一键 Hand off 到 Cloud

4. Codex Cloud（Web）

访问 chatgpt.com/codex，连接 GitHub 仓库
云端环境后台并行跑任务、产出 PR；GitHub 中 @codex 委派任务
ChatGPT 移动端也可使用

四个入口之间可通过 Hand off 与 codex apply 互相衔接，且 AGENTS.md / Skills / MCP / 配置在多入口间通用。

五层定制能力（Customization Stack）

OpenAI 把「让 Agent 按你/团队的方式工作」拆成五个互补的层次：

层级	作用	典型位置
AGENTS.md	持久项目规范（构建、测试、风格）	仓库根 / 子目录
Memories	从过往任务学到的上下文	Codex 内部（本地）
Skills	可复用工作流（SKILL.md + 脚本）	`~/.agents/skills` 或 `.agents/skills`
MCP / 插件	外部工具与数据源	`config.toml`、插件市场
Subagents	专责子代理（审查、探索等）	配置 + 提示词

理解这五层，是从「会用」到「用好」的分水岭，后续章节逐层展开（见核心概念）。

适用与谨慎场景

适合：

在熟悉仓库上做功能开发、修 bug、补测试
批量重构、迁移、文档同步
本地 Code Review（独立审查子代理）
把重复流程固化为 Skills、Automations 或 codex exec 脚本
用 Computer Use 复现只在 GUI 里出现的 bug

需谨慎：

生产密钥、未隔离的敏感环境（务必用沙箱 + 审批 + 规则）
无测试、无 lint 的「裸奔」仓库（Agent 容易反复犯错）
完全无人审查的自动合并（建议 PR + 人工把关）

与其他工具的比较（简要）

维度	Codex	Claude Code	GitHub Copilot
形态	App + CLI + IDE + Cloud	以 CLI/IDE 为主	IDE 补全 + Agent 模式
桌面 GUI	✅ 原生应用，强	第三方/有限	IDE 内
开源 CLI	✅ Rust	✅	❌
项目指令	AGENTS.md（开放标准）	CLAUDE.md / 规则	因产品而异
Skills	SKILL.md（跨工具开放标准）	Agent Skills	扩展能力
电脑操控	✅ Computer Use	有限	❌
沙箱/规则	OS 级沙箱 + Starlark 规则 + Hooks	权限/沙箱	依 IDE

选型建议： 若你想要 可视化桌面应用 + 本地/云端并行 + 开放 AGENTS.md 标准 + 电脑操控，Codex 是当前最完整的方案；深度使用 Anthropic 生态则 Claude Code 更顺；只要 IDE 内补全则 Copilot 更轻。

计费与账号

ChatGPT Plus / Pro / Business / Edu / Enterprise 套餐通常包含 Codex 使用额度
也可使用 OpenAI API Key 登录（部分 ChatGPT 专属功能可能受限）
部分研究预览模型（如 Codex Spark）仅限特定套餐

具体额度与可用模型以 OpenAI Codex 官方说明为准。

下一步

核心概念：先建立心智模型，再上手不迷路
安装与使用：下载桌面应用、安装 CLI 并登录
桌面应用：从添加项目到完成第一个任务

#Codex 简介

#Codex 是什么？

#从代码补全到编程 Agent

#产品矩阵：四个入口，一套 Agent 能力

#1. Codex 桌面应用（本教程主线）

#2. Codex CLI

#3. IDE 扩展

#4. Codex Cloud（Web）

#五层定制能力（Customization Stack）

#适用与谨慎场景

#与其他工具的比较（简要）

#计费与账号

#下一步