新闻资讯

AI能力像锯齿:能改10万行代码,却让你走路去洗车

更新时间:2026-05-03 13:56

【导读】能重构10万行代码的顶尖模型,却会建议你走路去洗车店洗车?能改10万行代码10万行代码已经足以构成一个相当复杂的软件项目,而「走路去洗车店」呢?你想洗的是车,车不能走路,所以人走路去洗车店是一个毫无意义的建议。一个能改10万行代码的模型,就在这种小学生级别的常识题上崩了。

最近,在AI圈里,出现了一个特别矛盾的画面,最先进的大模型,具备一口气重构一个10万行代码库的能力,然而,当你想要洗车的时候,它却建议你走路去50米外的洗车店。

这是源于AI 2026炉边谈话里的真实事例。之前Tesla AI负责人、Vibe Coding词语创造者借助此例子,把大模型的能力阐释得极为透彻:AI的能力并非呈均匀上升态势,而是如同锯齿一般,有着凹凸不平的状况。

大模型打开了三条新地平线

以往,我们一直觉得AI仅仅是在促使已存在的工作进程加快,就好比能让编写代码的速度变得更快这样,然而如今看来,情况根本不是如此这般,大模型正在开展一些以前绝对不可能做到的事情。

像重新构建10万行代码库这种情况,以往要靠一个完整的工程团队花费几周时间方可达成,如今却被压缩成了模型的一次输出,与此同时,一些原本被视作必要的事情开始变得多余起来。

新机会涵盖三个方向,其一,将大型工程任务转变为一次模型输出;其二,使知识能够如同代码那般积累维护;其三,出现了名为“智能体经济”的新事物。这三件事情共同指向一个判断,即AI已并非“写代码更快”这般简单了。

锯齿状智能到底是怎么回事

为何一项具备可修改十万行代码能力的模型,于这类小学生水准之常识问题上出现差错呢?运用“锯齿状智能”予以阐释,其于某些能力层面远远超越人类,然而在某些方面却愚笨至极。

这背后存在着两股发挥作用的力量,第一股力量是“可验证性”,一个领域能否被自动验证其对错,决定了模型能否实现快速进化,代码能否正常运行、数学题答案的正确与否,皆能够被自动验证,故而模型学习速度较快。

这第二股力量名为“经济激励”,在存在规模庞大的市场、用户乐意掏钱付费的领域当中,前沿实验室会投入大量精力去开展训练,像洗车这类小事,由于无人愿意投入资金,所以模型自然无法学会,故而可以说,正是“可验证且有钱赚”这种状况,将模型能力雕琢成了当前这般呈锯齿状的形态。

想做AI创业就去建验证环境

在炉边谈话当中给出了一项颇为具体的建议,要是你打算开展AI创业,那就别去跟大厂争抢热门方向,你得寻觅一个能够验证、然而大公司尚未顾及到的小领域。

接着自行构架强化学习环境,自行去进行模型的微调。例如针对某一专业领域方面的问题,那个确切答案能够被自动判定,然而在市面上还不存在好用的人工智能方案,这便是机会。

能获取下一波成功的AI公司,或许会是那些率先界定出验证规则的公司 ,谁能够搭建起有效的奖励循环 ,积累起充足数量的边缘案例,谁便掌控了真正的底牌 ,这并非单纯只是技术方面的问题 ,更是一门工程经济学。

氛围编程和智能体工程不是一回事

2025年2月,有个词被发明出来,称作“Vibe Coding”,其指的是一种开发方式,这种开发方式高度依赖AI,且几乎不亲手写代码。一年之后,他对这个词进行了升级,升级之后的词叫做“智能体工程”。

这两者之间的区别具备相当关键的性质:Vibe Coding所达成的是将地板抬高,从而使得每一个人都能够进行软件编写工作。例如那些业余爱好者借助AI也能够制作出可以运行的网页应用程序。然而智能体工程所致力于达成的则是保住天花板,以此避免专业软件由于AI而出现水准下降的情况。

由于今日AI撰写出的代码,于专业开发者看来显得极为臃肿,有着诸多复制粘贴之处,抽象得怪异且脆弱,虽能运行但着实糟糕。故而氛围编程仅适用于原型及个人项目,真正的专业开发需要智能体工程。

专业开发者要学会管住智能体

就如同他的智能体处于一个系统之中,竟然尝试运用邮箱地址去进行用户匹配,并非采用一个持久化的用户 ID,将其举成示例来讲,任何一位存有经验的工程师都不会犯下这样的错误。

就如同实习生尽管具备一定作用,然而你绝不能够让他们单独去上线进行代码生产。那么能够在智能体时代得以存活下来的工程师,并非是编写速度最为快捷的,而是能够对智能体实施有效管控的。

即便你并非亲手去编写每一行代码,然而你得清楚这个产品应呈现出怎样的模样,要明白为何这般相较于那般更为优良,还要晓得上线之后会出现何种状况。你所从事的是导演的角色,而非演员的身份。这称作外包思考,不过绝不能外包理解。

AI不是动物,是“召唤出来的幽灵”

于炉边谈话之际,询问了一个令所有人都为之焦虑的问题,这个问题是,当智能体具备能够编写代码之能力,具备能够进行调度之能力,还具备能够自行安装软件之能力时,人类究竟还剩下些什么呢?对此的回答表明,前沿大模型并非是在着手创造动物,而是在“召唤幽灵”。

有着内在动机这类情况的动物,例如饿了之时会去寻觅吃的。然而AI却不存在此事,它仅仅是经由数据与奖励塑造而成的智能模拟,属于一个全新的物种。你没办法如同对待人那般去对待智能体,并且也不能像对待传统软件那样去对待智能体。

这表明我们需要再度思索人与人工智能之间的关系,在未来的某一个时间点,神经网络将会转变为主进程,而中央处理器反倒会沦为协处理器,这并非是毫无根据的耸人听闻,而是正在切实发生的技术变革。

阅读完这篇文章之后,你来思考一下,在你所从事的工作范畴之内,哪些相应的任务能够安心地交付给智能体去处理,而哪些又是绝对需要你自身亲自去把控的呢?欢迎你在评论区域分享出你个人的看法,同时也千万不要忘记去给它点赞,并且转发给那些正处于焦虑状态,担心AI会取代自己工作岗位的朋友们哦。