新闻资讯
GPT帝国缔造者称Transformer将死,下一代架构突破已在路上
未来一定会诞生全新的底层架构,性能跃升不亚于当年Transformer对LSTM的降维打击。意思是,找到下一代架构这件事本身,已经可以让AI来帮忙了。回顾历史,从LSTM到Transformer的每一次架构级迁徙,都释放了一个数量级以上的能力增长,同时也诞生了定义时代的伟大公司。
当你仍在借助AI撰写周报之际,OpenAI的创办人山姆·奥特曼已然促使AI自行寻觅可将其取而代之的下一代技术架构了。这听闻起来仿若科幻,然而逻辑极为明晰:鉴于现有的大模型具备十足的聪慧,那就运用它去攻克“怎样设计更为聪慧的模型”这一科研难题。在这场访谈当中,他披露了大量违背常识的判断以及鲜有人知的创业细节。
用当下的AI 亲手推翻自己
奥特曼的核心判断是,现有的高阶大模型已然具备了辅助科研的认知力,这表明找到下一代AI架构这件事情自身,能够交给AI来予以协助。这种“用自身取代自身”的思路,源自他多年对于范式转换的敏感嗅觉。他在大一暑假于斯坦福AI实验室打工之际,认为当时的AI“根本毫无希望”,回头去做别的事情了。然而他始终维持“抬头审视全局”的习惯,直至深度学习模型越做越强大,他感觉这事物如同一颗逐渐靠近的小行星,疯狂却无人予以重视。
自那个时候始,他确立下一条核心信念,即把深度学习的规模不顾一切地往极致去推进,瞧瞧能够出现什么状况。那时声称要构建AGI实验室,行业里的前辈均认为他们简直是疯了,甚而议论他们是在行骗。然而GPT - 2使他头一回目睹计算机做出了此前从未有过的事情,GPT - 3令世界为之惊艳,GPT - 4更是达到了更高的水准。他的思维逻辑是,立足于一个正确的范式之上坚持不懈地钻研,收获的回报将会呈现指数级增长。如今他提议研究者高度依赖大模型以此作为科研助手,去探寻“核弹级突破”。
从白板到信仰的转折点
OpenAI创立的首个一周,未来四年的关键理念大多被书写于一块白板之上。只不过,真正令奥特曼确立起信仰的,乃是GPT - 2。他坦承事后看来有些过度审慎,然而面对AI的每一个新能力层级,他认为倾向于审慎并无弊端。他再三着重强调一个反差,即要是企业不以足够快的速度去接纳AI,就会被完全实现自治的AI公司所淘汰,那才是实实在在的灾难。
在此次访谈期间,除开架构预言以及创业往事之外,奥特曼还极为密集地输出了数量众多的观点。他觉得人类的底层驱动力不会产生变化,你依旧需要去搬家,还要去找工作,并且要成家立业,不过科学研究将会被高度自动化,创办初创公司所具有的意义以及去大厂打工所具备的意义都将会被彻底改写。他特别着重强调,编程智能体乃是下一个时刻,在其之后但还没有完全引发轰动的,是AI在所有知识型工作里执行任务的等同能力。
微型公司与AI CEO的赛跑
预测未来会出现大量微型初创公司,这些公司有的是一个人,有的是六个合伙人,其影响力和营收能与当下中大型企业相抗衡,奥特曼如此说道。他讲移动互联网出现可算一次机会,然而此次更为强劲,不但能做以往不敢设想之事,还能用极少人力极其迅速地搭建起产品与公司。他甚至说了句意味深长的话:他绝对不会自欺欺人地觉得,在不太遥远的未来不会诞生一个比他更适宜执掌OpenAI的AI CEO。
倘若存在一些公司或者国家接纳了人工智能,然而其他的却并未如此,那么竞争力之间的差距将会呈现出碾压般的态势。不过,他同样尝试着去减轻焦虑:通用人工智能听起来好似会对社会进行彻底的颠覆,可是身处其中所感受到的却不会如同其听起来那般令人惊悚,顶多在最初的几天会让人觉得有一些懵懂。人类怀有对彼此具备价值的渴望,怀有对竞争的渴望,怀有对创造的渴望,怀有对表达的渴望,这些处于底层的驱动力是不会消逝的。或许在100年之后的职业与现今毫无相似之处,但是人始终会有事情可做,并且也始终会在意人与人之间的联系。
烧钱速度与终极巨头的坦诚
被问到“变成终极巨头怎么办”时,奥特曼的回答,出人意料地坦诚,当年所有人都说,不可能跟谷歌打,结果他们打出来了,他相信,总有一天,会有比OpenAI更大更成功的公司诞生,而且绝对不会走一模一样的路,面对“烧钱速度恐怖”的尖锐提问,他也很淡定,烧钱确实快,但如果今年砸10亿是为了明年赚30亿,世界上大把资本排队想做这笔买卖。
首先,在具体战略当中,奥特曼表明自研芯片这件事情是认真对待,切实深入研究思考的,然而,对于自建数据中心,他觉得这简直就是那种“真的一万个不想去做”的苦力性质的工作。即便被形势逼迫到了那种地步,也会去着手开展,不过,最好的情况是能够把服务器机架的设计做到一种极致的状态,将那些又脏又累的活儿,让其他的人或者团队去完成。他持有这样一种观点,那就是AI所蕴含的机会,远远不只是简单地给现有的软件“塞个AI进去”而已,就像社交产品而言,可以通过构思设计,使其变成由一堆AI智能体来代表用户,在虚拟空间当中自主地进行聊天交流,他觉得这才是对于底层逻辑的一种颠覆性的改变。
更难的工作与失控的CEO
奥特曼点明了一个极为深刻难解难明的貌似自相矛盾的情况:获取知识这件事变得越发相当轻易简便,做成事情这一行为尽管同样也变得相对容易起来了,然而这是针对每一个人来说的——你必须得跟整个世界一同卷入那种高强度竞争的状态之中。他所认识的那些将AI工具运用得最为娴熟厉害的处于顶尖水平的高手们,都感觉自己所从事的工作从来都没有像当下这般困难重重。工具强大到超乎想象的程度了,可是要把它们运用得恰到好处从而维持住顶尖的竞争能力也是前所未有的艰难无比。
对于他自身而言,这是一位CEO,每天早上8点以后,其人生便会彻底陷入失控状态:先是工作几个小时,接着陪伴孩子一小时,随后前往公司,而后便是全然的兵荒马乱。按照他的说法,没有任何一家公司会像OpenAI这般运行速度迅猛、内部状况混乱不堪,且还顽强地处于所有人的枪口之下。针对技术竞赛,他明确指出,“后Transformer”的竞赛已然早早拉开帷幕,进展速度比绝大多数人所想象的要快得多,就像Mamba架构能够以线性时间完成推理,吞吐量一下子快了5倍。
未来创始人与历史的回响
还有更野的方向,是AI搞出的液态神经网络,其灵感源自一条包含仅302个神经元的线虫。回顾往昔,从LSTM到Transformer的每一回架构级别的迁徙,均释放出一个数量级往上的能力增长,与此同时,还诞生了定义时代的伟大公司。奥特曼自己讲了:终有一日会有比OpenAI规模更大且更为成功的公司现身。
或许当下,那个将来的创始人正身处某个宿舍当中,面对由亚马逊紧急运送而至的一块白板,记下头一个不太靠谱的念头。当人工智能能够助力人类推开下一代技术范式的那扇大门之际,你认为那个能够把握住下一波潮流的创始人,会是现今正在阅读这篇文章的你么?欢迎于评论区说说你的见解。


