可复制开发环境,单任务耗时最长 30 分钟……
OpenAI 近日发布了一款名为 Codex 的 AI 编程代理工具,以“研究预览”形式开放体验。这款工具专为有经验的开发者设计,旨在帮助他们将重复性高、相对简单的编程任务交由 AI 完成,自动生成可用于生产环境的代码,并在执行过程中清晰展示其推理过程。
请注意,这个 Codex 与上个月 OpenAI 推出的 Codex CLI 工具不同。它是一个全新的用户界面,嵌入在 ChatGPT 网页应用的侧边栏中。用户可输入提示词,并点击 “code”(生成代码)或 “ask”(提出问题/获取建议)按钮开始互动。
每当 Codex 被指派一个任务,它会在一个独立的容器中运行,这个容器预加载了用户的代码库,尽可能真实地模拟用户的开发环境。
为了让 Codex 更加有效,开发者可以在项目代码库中添加名为 AGENTS.md 的文件,类似于 README.md,但它是为 AI 代理准备的。该文件可用于提供上下文、解释代码结构,或传达代码规范与风格指南。
Codex 构建于 codex-1 模型之上,该模型是在 OpenAI 的 o3 推理模型基础上进行强化学习微调而成,涵盖了各种编程任务,具备生成代码、运行测试、调试改进等能力。
OpenAI 在其公告中回应了许多开发者对 AI 编程代理的常见质疑。此前的许多 LLM 编程工具存在生成代码不符合规范、可读性差、难以调试甚至存在安全隐患等问题,尤其是在“AI 自由发挥”而非用于代码补全或建议的场景中。
Codex 的微调训练正是为了解决这些问题。它会在执行任务的过程中逐步展示其推理与工作流程,每个任务用时从 1 到 30 分钟不等。但 OpenAI 也明确指出:“用户在集成和执行任何 AI 生成的代码前,仍需进行手动审查与验证。”
目前 Codex 以研究预览形式上线,所有 ChatGPT Pro、Enterprise(企业版)和 Team 用户均可使用。Plus 和 Edu(教育版)用户将在未来开放。
在接下来的几周里,OpenAI 将“免费慷慨地开放使用权限”,鼓励用户探索 Codex 的能力。不过未来 OpenAI 将推出新的使用限制与计费体系。
Codex 可能标志着 AI 进入“任务驱动”型开发助手的新阶段,但也同时对开发者的监督能力提出了更高要求。
(举报)