Codex 简介

Codex 是什么?

Codex 是 OpenAI 推出的 AI 编程 Agent(智能体),而不仅仅是一个「补全代码的模型」。它可以在你的本地工作区中:

  • 代码库与文档
  • 文件并运行命令
  • 验证 结果(测试、lint、构建)
  • 迭代 直到任务完成或需要你确认

从时间线看,Codex 经历了两次重要跃迁:

阶段代表产品特点
2021–2023Codex API / GitHub Copilot 早期代码补全为主,模型在云端推理
2025 起Codex CLI(开源,Rust)终端 Agent,可读写文件、执行 Shell、接入 MCP
2025–2026Codex App / IDE / Cloud多入口统一体验,Cloud 可对接 GitHub PR

本教程以 Codex CLI 为核心(与 Claude Code 同类),并覆盖 App、IDE 扩展与 Cloud 的协作方式。


产品矩阵:四个入口,一套 Agent 能力

                    ┌─────────────────────────────────┐
                    │     OpenAI Codex(同一套能力)      │
                    └─────────────────────────────────┘
           ┌────────────┬────────────┬────────────┬────────────┐
           │  Codex CLI │  Codex App │ IDE 扩展   │ Codex Cloud│
           │  终端 TUI  │ 桌面 GUI   │ VS Code 等 │ 浏览器/PR  │
           └────────────┴────────────┴────────────┴────────────┘
                    本地工作区              远程环境 + GitHub

1. Codex CLI(本教程重点)

  • 开源:github.com/openai/codex
  • Rust 实现,启动快、资源占用低
  • 支持交互 TUI、codex exec 非交互、沙箱与审批策略
  • 适合:日常开发、脚本自动化、CI 辅助

2. Codex App

  • macOS / Windows 桌面应用
  • 选择项目目录,Local 模式下在本地执行
  • 适合:不习惯终端、需要可视化 diff 的开发者

3. IDE 扩展

  • 支持 VS Code、Cursor、Windsurf 等
  • 侧边栏 Agent 模式,默认具备读写与运行权限(可配置)
  • 适合:边写边问、小范围修改

4. Codex Cloud

  • 访问 chatgpt.com/codex
  • 连接 GitHub 仓库,在云端环境跑任务,产出 PR
  • GitHub PR 评论中 @codex 可委派任务
  • 适合:异步长任务、跨时区协作

核心能力一览

代码理解与生成

  • 按自然语言描述生成或修改代码
  • 跨文件重构、补测试、写文档
  • 支持图片输入(截图、设计稿)与 图像生成/编辑(CLI 能力)

Agent 工具链

Codex 通过内置工具与扩展协议完成工作,典型包括:

  • 文件读写与 patch 应用
  • Shell 命令(在沙箱策略内)
  • 代码搜索(glob、grep 等)
  • Web 搜索(cached / live 模式)
  • MCP:连接 Linear、GitHub、文档服务等外部系统

可定制层(Customization Stack)

OpenAI 将「让 Agent 按团队方式工作」拆成五层,互补而非互斥

层级作用典型位置
AGENTS.md持久项目规范(构建、测试、风格)仓库根 / 子目录
Memories从过往任务学到的上下文Codex 内部
Skills可复用工作流(SKILL.md + 脚本)~/.agents/skills.agents/skills
MCP外部工具与数据源config.toml[mcp_servers]
Subagents专责子代理(审查、探索等)配置 + 提示词

理解这五层,是从「会用」到「用好」的分水岭。后续章节会逐层展开。


适用场景

适合:

  • 在熟悉仓库上做功能开发、修 bug、补测试
  • 批量重构、迁移、文档同步
  • 本地 Code Review(独立审查 Agent)
  • 将重复流程固化为 Skills 或 codex exec 脚本

需谨慎:

  • 生产密钥、未隔离的敏感环境(务必用沙箱 + 审批)
  • 无测试、无 lint 的「裸奔」仓库(Agent 容易反复犯错)
  • 完全无人审查的自动合并(建议 PR + 人工把关)

与其他工具的比较(简要)

维度CodexClaude CodeGitHub Copilot
形态CLI + App + IDE + Cloud以 CLI/IDE 为主IDE 补全 + Agent 模式
开源 CLI✅ Rust 开源
项目指令AGENTS.md(开放标准)CLAUDE.md / 规则因产品而异
SkillsSKILL.md(跨工具开放标准)Agent Skills扩展能力
MCP✅ TOML 配置✅ JSON 配置逐步支持
沙箱OS 级 + 可配置策略权限/沙箱依 IDE 集成

选型建议: 若团队已订阅 ChatGPT Plus/Pro 且希望 本地 Agent + Cloud PR + 开放 AGENTS.md 标准,Codex 是完整方案;若深度使用 Anthropic 生态,Claude Code 更顺;若只需 IDE 内补全,Copilot 更轻。


计费与账号

  • ChatGPT Plus / Pro / Business / Edu / Enterprise 套餐通常包含 Codex 使用额度
  • 也可使用 OpenAI API Key 登录(部分功能可能受限)
  • CLI 支持 ChatGPT 登录 自动配置 API Key,免去手动粘贴

具体额度以 OpenAI Codex 官方说明 为准。


下一步