Tracks
OpenAI 的 Codex 是一个驻留在 ChatGPT 内的编码代理:您用自然语言描述任务,它会在自己的沙盒中完成工作,然后将完成的修改作为一个可供您审阅的拉取请求提交回来。它的目标是帮您处理日常工程工作,而不仅仅是偶尔自动补全一两行代码。
在本教程中,我将带您在 ChatGPT 中使用 Codex 对一个 GitHub 仓库开展实际工作,即使您不是专业开发者也能上手。我们将用它来:
- 应用代码修复并生成拉取请求。
- 解释代码库中的复杂函数。
- 基于问答式提示识别并解决一个错误。
过程中,您将看到 Codex 如何在安全沙盒中运行并产出可验证的更改,全程无需离开 ChatGPT。
要点速览
-
OpenAI Codex 是一款云端的软件工程代理,可在 ChatGPT 内使用(适用于 Plus、Pro、Team 和 Enterprise 方案)
-
将 Codex 连接到 GitHub 仓库,然后分配任务:修复错误、打补丁、生成测试或解释代码
-
每个任务都在隔离的沙盒中运行;Codex 会打开一个拉取请求,您在合并前进行审阅
-
使用
AGENTS.md文件定义编码规范,Codex 将在每项任务中遵循 -
Codex 也可通过 Codex CLI 在终端中运行,并提供 VS Code 扩展
什么是 OpenAI 的 Codex?
OpenAI Codex 是一个云端软件工程代理,能够编写和编辑代码、运行测试、修复错误,甚至发起拉取请求。每个任务都在其独立的沙盒环境中执行。
Codex 由 OpenAI 最新的前沿模型驱动,注重安全性、可测试性与开发者效率。您可以通过 AGENTS.md 文件为 Codex 提供指导,或直接在 ChatGPT 侧边栏与其交互。
借助 Codex CLI,您还可以在终端中直接使用这些能力。
Codex 的使用方式一览:
| 方式 | 位置 | 适用场景 |
|---|---|---|
| ChatGPT 侧边栏 | chatgpt.com | 连接 GitHub 的任务队列(本教程) |
| 独立 Mac 应用 | chatgpt.com/codex | 更丰富的界面、自动化和插件连接器 |
| VS Code 扩展 | VS Code marketplace | 在编辑器内委派任务 |
| Codex CLI | 终端 | 脚本化流程、CI 集成 |
设置 OpenAI 的 Codex
设置 Codex 只需几分钟。下面是一步步的入门指南。
步骤 1:找到 Codex 工具
首先登录 ChatGPT。在左侧工具栏查找 Codex。最初上线时,Codex 面向 ChatGPT Pro、Business 和 Enterprise 用户推出。现在已包含在所有方案中(不过 Free 和 Go 的访问非常受限)。

步骤 2:开始使用 Codex
点击 Codex,会跳转到一个新标签页进行初始设置。点击“Get Started(开始)”,并按照下一步所示完成认证流程。

步骤 3:多重身份验证
点击“Set up MFA to continue(设置 MFA 以继续)”,并使用您常用的认证应用(如 Google Authenticator 或 Authy)扫描二维码。输入验证码完成验证即可!

步骤 4:连接 GitHub
完成多重身份验证后,我们将 Codex 连接到 GitHub。

步骤 4.1:授权 GitHub 连接器
点击“Connect to GitHub(连接到 GitHub)”后会弹出授权 GitHub 连接器的窗口。阅读并授权。

步骤 4.2:添加您的 GitHub 账户
GitHub 连接完成后,需要添加您的账户。在 GitHub organization 选项卡下,选择“Add a GitHub account(添加 GitHub 账户)”。


接着会弹出“Install and Authorize(安装并授权)”窗口。点击授权,您的所有仓库便会出现在 ChatGPT 界面中。您也可以只授权选定的仓库。

步骤 4.3:创建环境
选择您要处理的仓库并点击“Create environment(创建环境)”。

接着会进入“Data Controls(数据控制)”。Codex 仍在积极开发中,您可能会看到一个可选提示,允许将数据用于模型改进。您可以将其关闭并继续。

现在,您的环境已经可以开始探索。Codex 允许用户并行启动任务,也提供预选任务。

只需点击“Start tasks(开始任务)”,或根据您的需求选择任务。这会带您进入一个界面,您可以在其中提问,或让该代理为您开发某个功能。


当所有任务就绪后,选择您想要处理的任务,或并行处理多个任务。
步骤 5:AGENTS.md 文件(可选)
AGENTS.md 是 OpenAI 为 Codex 平台引入的特殊配置文件,专为指导 AI 代理在您的代码库中工作而设计。您可以把它看作是面向 AI 队友的开发者手册,类似 README.md,但重点是为自主代理提供指令。以下是一个示例 AGENTS.md 文件:
# AGENTS.md
## Code Style
- Use Black for Python formatting.
- Avoid abbreviations in variable names.
## Testing
- Run pytest tests/ before finalizing a PR.
- All commits must pass lint checks via flake8.
## PR Instructions
- Title format: [Fix] Short description
- Include a one-line summary and a "Testing Done" section
当 Codex 在您的代码库上运行任务时,它会:
- 搜索作用域覆盖其修改文件的
AGENTS.md文件。 - 依据这些文件中的说明对其更改进行格式化、测试和文档编写。
- 当有多个文件适用时,优先采用嵌套更深的指令(类似级联配置)。
若想更全面地了解如何构建能跨工具与 API 采取行动的系统,请参阅我们的 OpenAI Agents SDK 教程。
OpenAI 的 Codex:三个实用示例
我们通过我在一个仓库上运行的三个示例,来看看 Codex 如何在真实开发中助您一臂之力。
示例 1:基础修复与拼写错误
Codex 有时会把一个请求拆分为子任务,例如修正拼写错误、改进 README 或编写测试,且都在同一工作空间内完成。


您可以基于初步审查在现有任务中启动一个新任务,要求对既有代码库进行修改,或通过文本框提出问题。要扩展任务或修复新问题,点击“Code(编码)”,直接启动一个新的子任务。

对更改满意后,点击“Push(推送)”,系统会创建一个新的拉取请求。几秒钟后,您可以点击“View Pull Request(查看拉取请求)”以访问并将其合并到主分支。
示例 2:代码库解释
接着,我用 Codex 做了一个非编辑类任务:探索代码库并询问接下来可以做什么。这对新加入项目、需要快速上手,或卡在理解某个函数如何工作时尤其有用。

Codex 浏览了项目,并提供了清晰、对初学者友好的代码库结构拆解。Codex 不是简单罗列文件,而是按用途分组:
- 它指出
qwen3_demo.py是主脚本,会启动两个基于 Gradio 的界面——一个用于推理模式切换,另一个用于多语言翻译。 - 它将
qwen3_demo.ipynb识别为交互式笔记本的替代方案。 - 它指出
test_qwen3_demo.py用于单元测试,README.md提供文档与视频演示。
此外,Codex 还列出了“关键信息”,例如依赖(Ollama CLI)、_run_ollama 函数的作用,以及扩展界面的提示。它甚至给出下一步建议,如探索模型版本、改进 UI、增加错误处理等。
示例 3:查找并修复错误
Codex 能扫描整个代码库,识别错误、提出修复方案,并向您展示更改预览。这个流程与 GitHub 上的代码变更审查类似。

您可以查看日志来了解更改背后的执行过程,方法是点击“Logs(日志)”。

Codex 会返回更改摘要,以及因更改而创建或受影响的文件。您也可以就这些更改提问,或让 Codex 编写新代码以增强当前实现。


对代码修复满意后,点击“Push(推送)”和“Create New PR(创建新 PR)”以打开一个新的拉取请求。

几秒钟后,您可以点击“View Pull Request(查看拉取请求)”以访问并将其合并到主分支。

借助 Codex,您只需点击几下就能完成合并。


更改会在数秒内出现在主分支。

为什么 Codex 很重要?
Codex 是协作型代理,而非被动的代码生成器。您可以让它编写、重构、测试、调试或解释,它会在每一步展示终端日志、引用和输出。
以下是我观察到的一些实际收益:
- 任务可追溯、可验证。
- Codex 可并行工作,您可以排队提交多项更改。
- 它会尊重您的开发配置,尤其是在通过
AGENTS.md设定了约定时。 - 它符合人工 PR 标准,并能通过 CI 测试。
在我看来,这就像 OpenAI 刚刚发布了一位软件工程实习生。
结语
我们了解了 Codex 如何修复错误、应用功能补丁并解释代码逻辑,同时还能生成拉取请求、运行测试,并通过终端日志和 diff 引用其操作。
这一动手演示说明了 Codex 如何改进您的日常开发流程,无论您是在调试遗留代码、上手新仓库,还是分流维护任务。
随着 Codex 的发展,我预计它将与 IDE、CI 流水线和任务规划器进行更深度集成,成为任何工程流程中的实用补充。要进一步了解 Codex,请阅读官方发布博文,您也可以在OpenAI 的 YouTube 频道找到示例用例。
若想更深入了解 OpenAI 面向工程的模型与工具,我推荐以下博文:
常见问题
Codex 与 ChatGPT 有何不同?
是的,Codex 是专为软件工程打造的专业代理,针对 Git 仓库中的任务执行进行了优化。
我需要安装 Codex 吗?
如果您在 ChatGPT 应用内使用 Codex,无需安装。但若要在终端中使用,则必须安装 Codex CLI。
OpenAI 的 Codex 安全吗?
Codex 在安全、隔离的容器中运行。默认情况下,任务执行期间无法访问互联网,但您可以按环境选择性启用网络访问,并通过域名允许列表与允许的 HTTP 方法加以限制。
哪些 ChatGPT 方案包含 Codex?
Codex 涵盖 ChatGPT 的 Free、Go、Plus、Pro、Business、Edu 和 Enterprise 各类方案,但 Free 和 Go 的访问非常有限。要查看当前定价和可用性,请访问 openai.com/chatgpt/pricing。
OpenAI Codex 与 GitHub Copilot 有何比较?
GitHub Copilot 在 IDE 中随输入进行内联代码补全,而 Codex 是一个基于任务的代理,您将工作分配给它。Copilot 帮助您更快编写代码;Codex 则在隔离沙盒中自主执行多步骤任务(修复错误、运行测试、打开 PR)。两者是互补关系,而非互相替代。
Codex 支持哪些编程语言?
Codex 适用于您的 GitHub 仓库使用的任何语言。它会读取现有代码库上下文,以匹配您项目的约定。Python、JavaScript、TypeScript、Go、Rust 和 Ruby 都有良好支持。对于拥有大型开源训练语料的语言,表现最为强劲。