来源:DeepTech深科技
当地时间 5 月 16 日,OpenAI 正式推出了其最强大的云端软件工程智能体 Codex,有望重塑软件开发流程的效率与分工方式。
用 OpenAI 的 CEO 山姆·奥特曼(Same Altman)的话来说,Codex 可以让一个人在编程时“只管去做自己想做的事”,创造各种各样的软件。
山姆·奥特曼(Same Altman)对 Codex 的评价(来源:X)
目前,Codex 已经接入 ChatGPT,对 Pro、Team 和 Enterprise 用户开放,预计不久后将支持 Plus 和 Edu 用户。值得注意的是,Codex 对计算资源和安全隔离要求较高,因此其主要运行于 OpenAI 的云平台,暂不支持本地部署。
Codex 由 OpenAI 专为软件工程优化的 codex-1 模型提供支持,该模型是基于 o3 AI 推理模型打造的。与标准 o3 模型相比,codex-1 能够生成更干净的代码,更精确地遵循指令,并能迭代运行测试直到获得想要的结果。
图 | codex-1 模型的编程水平对比(来源:OpenAI)OpenAI 产品团队成员亚历山大·恩比里科斯(Alexander Embiricos)表示:“我们即将经历一场关于开发者如何被 AI 助手加速的重大转变。”这种转变不仅仅是提高生产力,更是软件开发方式的根本性变革。
与 GitHub Copilot 等传统 AI 编程助手不同,Codex 并非只是一个“代码补全工具”,而是具备完整任务执行链条的智能体。
它能够主动分析用户需求,调用必要的代码、终端命令,甚至运行测试、提交 Pull Request,让开发者从重复性劳动中彻底解放出来。
OpenAI 表示,Codex 设计之初的目标就是成为一个“真实可用的自动化工程助手”,不仅能够生成语法正确的代码,还能在复杂项目中导航文件结构、执行构建和测试任务,真正参与到软件生命周期的各个环节中。
图 | 已经有人开始设想 Codex 会给开发者带来怎样的改变(来源:X)Codex 在一个沙盒化的云端虚拟计算机中运行,通过与 GitHub 连接,可以预先加载代码仓库。
用户可以通过 ChatGPT 侧边栏访问 Codex,通过输入提示并点击 Code 按钮来安排新的编码任务,或者点击 Ask 按钮向 Codex 询问关于代码库的问题。
每个任务都会在一个隔离的、沙箱化的云端环境中运行,Codex 可以访问整个代码库,包括代码文件、文档和配置文件等,并拥有运行 shell 命令的权限。
这一机制让 Codex 能够具备“类开发者”的工作环境,从而实现从问题分析、代码修改,到测试运行、结果反馈的闭环。
图 | Codex 生成 Diff 并执行测试(来源:OpenAI)Codex 收到任务后,会在后台执行一系列操作,包括查找相关代码、修改文件、运行测试套件,并在任务完成后将结果(包括代码 diff、终端输出、日志等)展示给用户。
整个过程是自动完成的,无需用户手动干预。根据任务复杂度,完成时间通常在 1 到 30 分钟之间,用户可以实时监控 Codex 的工作进度。
值得一提的是,为了更好地适应项目环境,用户还可以在代码仓库中添加一个名为 AGENTS.md 的文件,告诉 Codex 各种定制化指令,包括如何运行测试、哪类命名规范应遵循、有哪些依赖注意事项等,类似于工作指南。
Codex 能够同时执行多项软件工程任务,并且工作期间不会限制用户使用计算机和浏览器。但是,在任务执行期间,Codex 无法访问互联网,交互仅限于通过 GitHub 存储库明确提供的代码和用户通过设置脚本配置的预安装依赖项。
当遇到不确定性或测试失败时,Codex 会向用户反馈这些问题,并由用户做出决定。为了防止滥用,Codex 经过了特殊训练,可以识别并精确拒绝旨在开发恶意软件的请求。
OpenAI 内部技术团队已经开始将 Codex 作为常用工具。工程师们主要用它来执行重复的、范围明确的任务,如重构、重命名和编写测试。它同样适用于搭建新功能、连接组件、修复 bug 和起草文档。
(来源:OpenAI)OpenAI 强调,Codex 只是编程智能体愿景的开始,未来他们计划将其与更多上下游工具集成,包括版本控制平台(GitHub)、云平台(Vercel、AWS)、测试平台(CircleCI)等,进一步打造 AI 驱动的全流程 DevOps 体系。
随着 AI 编程工具的热度持续攀升,Vibe Coding(开发者通过自然语言向大模型提出编程需求并由其生成代码)正迅速流行起来,各家科技公司也在抓紧布局。
今年 2 月,Anthropic 发布了其自己的代理编码工具 Claude Code。4 月,谷歌更新了其 AI 编码助手 Gemini Code Assist,赋予其更多智能体能力。
这使得 AI 编程公司成为了科技领域增长最快的公司之一。作为最受欢迎的 AI 编码工具之一的 Cursor,今年 4 月的年化收入达到约 3 亿美元,据传其正以 90 亿美元的估值融资。
现在,OpenAI 也加入了战场。它不仅发布了 Codex,更是准备斥资 30 亿美元收购 AI 编程初创公司 Windsurf。
软件开发领域的变革或许才刚刚开始。
参考资料:
index/introducing-codex/
2025/05/16/openai-launches-codex-an-ai-coding-agent-in-chatgpt/
排版:刘雅坤
0 条