物理AI爆发!自动驾驶公司靠预测下帧理解世界,重写行业底座
这家公司也在用世界模型做着同样的事:靠预测下一帧理解世界,重写自动驾驶的底座。自动驾驶的方法,就是世界模型。一个靠预测下一个词压缩语言常识,一个靠预测下一帧压缩物理规律。Momenta的路径几乎是Anthropic的镜像——先在自动驾驶站稳,再把能力复制到更广阔的物理世界。
十年的驾车经历,或许你尚未碰到过真正具备危险性的情景, 然而人工智能已然透过世界模型, 于虚拟世界当中开展了上万次的模拟。
称作“模仿学习”的自动驾驶旧路, 如同使AI沿袭人类老司机的操作录像去学开车。然而, 这条路在2023年遭遇了瓶颈——AI仅仅能够复制动作, 始终弄不明白为何要于湿滑路面提前刹车, 还有为何行人低头看手机之际需减速让行。机器学不会人类对物理世界的直觉。
世界模型突然成为AI最热赛道
2026年, “世界模型”一词, 先是在学术界引发热度, 而后进一步蔓延至产业界。全球范围内, 顶尖实验室与车企, 都将目光投向了同一个方向, 什么方向呢? 那就是, 以往通过预测下一个词, 以此来理解语言的大语言模型。当下, 要依靠预测下一帧画面, 从而去理解物理世界。其中的共识并不复杂, 简单来说, 数字AI的底座已然催生出万亿美元规模的市场。然而, 物理AI的底座才刚刚拉开发展的序幕。并且, 自动驾驶是物理AI最先能够实现成果落地的应用场景。
量产上车才是真功夫
做研究属于一种情况, 进行量产则是另外一种情况。杨立昆讲自己所带领的 AMI Labs 也许需耗时五年方可推出产品, 李飞飞的 World Labs 才刚刚涉足于 3D 世界生成领域。Tesla 的 FSD V14 在端到端方面运行时速度是最快的, 然而其仅为自家车型提供服务,相关技术并不向整个行业展开开放。于开放阵营当中, 在那些真正达成世界模型量产并应用到车辆上的公司里面, 存在着一家来自中国的公司, 这家公司于今年 4 月正式完成了 R7 世界模型的交付。
三层架构炼出物理常识
把一辆辆量产车, 共计90万辆, 行驶超100亿公里的实车里程, 从中提纯出具1亿段黄金数据, 以让模型领会如同物体具备质量和惯性、前车急刹车易引发追尾这类基本物理性规律从而形成底层架构, 而采用真实数据生成虚拟世界, 借由实车与仿真一致做校准, 将极端场景测试效率相较于实车路测以高出上万倍并由世界模型自行“想象”构成中间一层架构设置, 于仿真出例如鬼探头或行人横穿等类似场景中不断反复试错, 依靠奖惩机制推动模型自主进化, 不再是以模仿人的动作, 而是在物理约束条件下探寻最优解, 依此形成顶层架构, R7的架构就被分成了这样的三层。
一套底座吃透千亿赛道
要是世界模型仅是使辅助驾驶的好用程度得以提升, 那故事在这儿便已终结。然而行业已然有过经验教训: 福特与大众携手舍弃的Argo AI, 那些只热衷于做Robotaxi的公司, 其数据需依靠小车队去采集, 成本高昂并且商业化之路遥遥没有尽头。能够存活下来的公司得与此同时把数据的来源搞清楚, 得把资金的来源弄明白才行。世界模型所探讨与学习的并非是某一种车型的驾驶习惯, 而是惯性、运动以及因果这些具备通用性的规则, 在轿车里所学到的物理方面的常识, 放置到卡车上同样能够起到作用的。设在这个逻辑之上的, 是这般情况: 有一家公司的All-in-One平台, 它有着一套底座, 这套底座对乘用车L2++、物流车、Robotaxi这四个场景予以覆盖。
数据飞轮转出了42倍收入增长
即便核心技术具备复用性, 这意味着场景一旦递增使数据交叉愈加密集。乘用车日常里程输送至世界模型, 所面对的极端场景反过来提高乘用车安全性。量产车队每天涌现真实驾驶数据注入模型进行预训练, 模型进化后经由OTA推送回车端。更优质产品获取更多OEM客户, 更多客户造就更大车队, 更大车队又反过来为数据提供支持。如今此循环已然运转起来——不仅许可收入三年间增长达42倍, 甚至于在同一时间有七家互为竞争关系的车企都成为了它的股东。
物理AI的GPT时刻正在到来
数字AI的格局花费三年得以定型, 在此期间, 从事Code的公司寻找到了编程这一价值密度顶级、反馈最为迅速的场景, 在一年之内ARR突破了25亿美元。自动驾驶在物理AI里所扮演的角色近乎相同, 经由明确的安全指标当作验证标准, 借助海量实时数据作为反馈循环依照OEM量产进行商业闭环构成。而这家公司的路径差不多便是Code的镜像, 首先于自动驾驶立足稳固, 然后将能力复制至更为广阔的物理世界之中。在R7敲响港交所钟声之时, 物理AI大规模量产的序幕已然被拉开, 真正的“GPT时刻”大概不再遥远。
你可曾思索过, 当人工智能能够如同人类那般领会物理世界的因果关系与风险之时, 自动驾驶真正得以广泛应用的那一日, 你的出行方式将会产生何等巨大的改变呢? 欢迎于评论区畅谈你的见解, 点赞并分享以便让更多人目睹这场正在悄然发生的变革。