AI能力像锯齿：能改10万行代码，却让你走路去洗车

【导读】能重构10万行代码的顶尖模型，却会建议你走路去洗车店洗车？能改10万行代码10万行代码已经足以构成一个相当复杂的软件项目，而「走路去洗车店」呢？你想洗的是车，车不能走路，所以人走路去洗车店是一个毫无意义的建议。一个能改10万行代码的模型，就在这种小学生级别的常识题上崩了。

最近，在AI圈里，出现了一个特别矛盾的画面，最先进的大模型，具备一口气重构一个10万行代码库的能力，然而，当你想要洗车的时候，它却建议你走路去50米外的洗车店。

这是源于AI 2026炉边谈话里的真实事例。之前Tesla AI负责人、Vibe Coding词语创造者借助此例子，把大模型的能力阐释得极为透彻：AI的能力并非呈均匀上升态势，而是如同锯齿一般，有着凹凸不平的状况。

大模型打开了三条新地平线

以往，我们一直觉得AI仅仅是在促使已存在的工作进程加快，就好比能让编写代码的速度变得更快这样，然而如今看来，情况根本不是如此这般，大模型正在开展一些以前绝对不可能做到的事情。

像重新构建10万行代码库这种情况，以往要靠一个完整的工程团队花费几周时间方可达成，如今却被压缩成了模型的一次输出，与此同时，一些原本被视作必要的事情开始变得多余起来。

新机会涵盖三个方向，其一，将大型工程任务转变为一次模型输出；其二，使知识能够如同代码那般积累维护；其三，出现了名为“智能体经济”的新事物。这三件事情共同指向一个判断，即AI已并非“写代码更快”这般简单了。

为何一项具备可修改十万行代码能力的模型，于这类小学生水准之常识问题上出现差错呢？运用“锯齿状智能”予以阐释，其于某些能力层面远远超越人类，然而在某些方面却愚笨至极。

这背后存在着两股发挥作用的力量，第一股力量是“可验证性”，一个领域能否被自动验证其对错，决定了模型能否实现快速进化，代码能否正常运行、数学题答案的正确与否，皆能够被自动验证，故而模型学习速度较快。

这第二股力量名为“经济激励”，在存在规模庞大的市场、用户乐意掏钱付费的领域当中，前沿实验室会投入大量精力去开展训练，像洗车这类小事，由于无人愿意投入资金，所以模型自然无法学会，故而可以说，正是“可验证且有钱赚”这种状况，将模型能力雕琢成了当前这般呈锯齿状的形态。

在炉边谈话当中给出了一项颇为具体的建议，要是你打算开展AI创业，那就别去跟大厂争抢热门方向，你得寻觅一个能够验证、然而大公司尚未顾及到的小领域。

接着自行构架强化学习环境，自行去进行模型的微调。例如针对某一专业领域方面的问题，那个确切答案能够被自动判定，然而在市面上还不存在好用的人工智能方案，这便是机会。

能获取下一波成功的AI公司，或许会是那些率先界定出验证规则的公司，谁能够搭建起有效的奖励循环，积累起充足数量的边缘案例，谁便掌控了真正的底牌，这并非单纯只是技术方面的问题，更是一门工程经济学。

2025年2月，有个词被发明出来，称作“Vibe Coding”，其指的是一种开发方式，这种开发方式高度依赖AI，且几乎不亲手写代码。一年之后，他对这个词进行了升级，升级之后的词叫做“智能体工程”。

这两者之间的区别具备相当关键的性质：Vibe Coding所达成的是将地板抬高，从而使得每一个人都能够进行软件编写工作。例如那些业余爱好者借助AI也能够制作出可以运行的网页应用程序。然而智能体工程所致力于达成的则是保住天花板，以此避免专业软件由于AI而出现水准下降的情况。

由于今日AI撰写出的代码，于专业开发者看来显得极为臃肿，有着诸多复制粘贴之处，抽象得怪异且脆弱，虽能运行但着实糟糕。故而氛围编程仅适用于原型及个人项目，真正的专业开发需要智能体工程。

就如同他的智能体处于一个系统之中，竟然尝试运用邮箱地址去进行用户匹配，并非采用一个持久化的用户 ID，将其举成示例来讲，任何一位存有经验的工程师都不会犯下这样的错误。

就如同实习生尽管具备一定作用，然而你绝不能够让他们单独去上线进行代码生产。那么能够在智能体时代得以存活下来的工程师，并非是编写速度最为快捷的，而是能够对智能体实施有效管控的。

即便你并非亲手去编写每一行代码，然而你得清楚这个产品应呈现出怎样的模样，要明白为何这般相较于那般更为优良，还要晓得上线之后会出现何种状况。你所从事的是导演的角色，而非演员的身份。这称作外包思考，不过绝不能外包理解。

于炉边谈话之际，询问了一个令所有人都为之焦虑的问题，这个问题是，当智能体具备能够编写代码之能力，具备能够进行调度之能力，还具备能够自行安装软件之能力时，人类究竟还剩下些什么呢？对此的回答表明，前沿大模型并非是在着手创造动物，而是在“召唤幽灵”。

有着内在动机这类情况的动物，例如饿了之时会去寻觅吃的。然而AI却不存在此事，它仅仅是经由数据与奖励塑造而成的智能模拟，属于一个全新的物种。你没办法如同对待人那般去对待智能体，并且也不能像对待传统软件那样去对待智能体。

这表明我们需要再度思索人与人工智能之间的关系，在未来的某一个时间点，神经网络将会转变为主进程，而中央处理器反倒会沦为协处理器，这并非是毫无根据的耸人听闻，而是正在切实发生的技术变革。

阅读完这篇文章之后，你来思考一下，在你所从事的工作范畴之内，哪些相应的任务能够安心地交付给智能体去处理，而哪些又是绝对需要你自身亲自去把控的呢？欢迎你在评论区域分享出你个人的看法，同时也千万不要忘记去给它点赞，并且转发给那些正处于焦虑状态，担心AI会取代自己工作岗位的朋友们哦。