前Anthropic成员:让Codex写/goal,人类定意图,其余它搞定
从头到尾,人类只用在最开始说出自己的意图,剩下的拆解、调度、收尾,模型自己都能安排得明明白白。到现在,索性连「目标」都不写了。所以官方反复强调一件事:目标一定要写到Codex能判断「做完没有」,要避免「优化一下」「完善一下」这种虚词。如今连「把目标盘问清楚」这一步,都有人做成工具替你包办了。
一句话目标就能启动整个项目
曾几何时, 写代码需逐行去敲, 写提示词得句句去琢磨, 然而当下有人将玩法全然改变。他并非亲手书写那份/goal指令, 而是让Codex自行给自己生成一份, 并且为每个派生出的子智能体分别撰写一份。他仅仅把高层意图传递过去, Codex便会自动对任务予以拆解、规划并行步骤、最终汇总结果, 整个过程无需人工进行干预。此变化的关键之处在于, 人类交付出去的不再是体力劳动, 而是判断力: 往昔开发者告知AI“该如何去写”, 如今仅告知它“写什么”。
模型接管了目标本身
别看轻这句“给个目标就行”, 其背后是元提示(meta – prompt)的升级, 你并非直接去写指令, 而是要让模型协助你把指令写得更为出色, Codex并非将你的话语润色成更美观的提示词, 它直接接管了“目标”本身, 即你给出意图, 它来写/goal, 开发者圈给这套流程取了个外号叫“Ralph循环”, 也就是要规划、执行、测试、复查、迭代, 持续自转, 不达目标不罢休。这与普通对话提示词最为显著的区别在于, goal这段文字, 它同时兼具起始指令的作用, 还担任着“完成审计”标准的角色。
子智能体自动孵化分工
有开发者Pablo, 将其制作成了模板, 给出了“Build + 功能 + 风格”这样的提示词框架, 使得Codex依照此框架自动生成goal, 进而孵化出对应的子智能体。有人进行了实际测试: 给Codex一个高层目标, 并把.md文件里的18个功能全部交付, 随后人就离开了。大约18小时后返回, Codex已经自主实现其中14个, 每一处改动都经过了测试, 在CI里完成了合并, 整个过程没有一次需要人工点头认可。Codex这样表述: “鉴于你明确表示需要并行智能体, 所以我采用多智能体工具”, 右侧面板上, 首个分身Gibbs已然呈现。首个分身Gibbs在右侧面板上出现。
目标写法直接决定成败
官方多次着重强调一件事情, 那就是目标必须要写到让Codex能够判定有没有完成, 进而避免出现像是“优化一下”“完善一下”这类虚词。社区当中存在一个名为goal的skill, 在正式发起/goal之前, 它会先以相反的方式来采访你, 也就是把一个模糊不清的目标追问成具体的、能够进行验证的契约。换一种说法来讲,goal模式运行得好不好, 原本就是由目标写得是否足够具体所决定的。如今甚至连迈出“把目标问清楚”这一步, 都已经有人制作成工具来替你包揽完成了,门槛又进一步降低了。
三家平台同时推出自治功能
几乎是在同一个时间窗口当中, 三家主流编程智能体毫无商量地一同推出了“让AI自行拆解任务、自行派遣智能体”的功能。社区里的网友迅速把这项功能与.md文件放在一块作比较, 情况是同样朝着让智能体去读一份“写给自身看的说明”, 然后依据这个说明来采取行动。当Codex能够给自己以及一群子智能体派发工作任务时, 此时它就不单单只是一个用于编写代码的助手, 而是更类似于一个运行在后台的任务调度器。编写代码仅仅是它顺手就能够做到的其中一件事情, 它所要达成的目标范畴远比对“帮人编写代码”要大得多。
自治虽爽但代价与风险并存
自己去撰写目标, 自己去派遣agent, 这样子听起来的确是相当令人感到畅快的, 并且代价就是极有可能会将你的token账单刷爆。a16z的Chen将/goal运用在一个实际存在的eGPU加上Mac设备驱动项目之上持续运行了一整个夜晚, 历经14个小时过去它仍旧在持续推进。官方乃至也在教导人去踩刹车予以注意: 提议在goal的末尾添加一句token预算方面的内容, 而且也不要一开始就直接发送/goal, 而是要先把项目运行出一个初步的雏形之后再说。网友nick发出吐槽, 表示要是再让它进行递归派生几层的话, Codex的最为首要 的目标恐怕就会变成把我们给重构排除在外了。关于那个表明“只派一层”的限制说明, 今日所提及的所谓自治, 更像是一种设有护栏的放权行为, 是这种情况。
在代码、任务以及意图逐一递出去以后, 程序员该怎么去重新界定自己的角色呢? 你乐意将项目的全部规划交付给AI吗? 在评论区讲讲你的看法, 点个赞使得更多人瞧见这个趋势。