谷歌升级Gemini 3 Deep Think，扩大范围推智能前沿发展

进行重大升级，号称是专门针对科学、研究与工程场景的开发的“推理模式”，旨在推动智能前沿发展。由谷歌开发人员与各行业科学家、研究人员共同合作完成，目标是应对真实科研环境中的常见复杂问题：缺少清晰边界、未必存在唯一解，且数据往往杂乱或不完整。在数学、算法与编程等高难推理任务上继续提升。

深夜时分，谷歌搞出了个轰动之举，为科学家以及工程师量身打造的“推理模式”Deep Think迎来了重大的升级，这并非是那种平常的版本更新，而是要在难度颇高的科研场景当中来真刀真枪地干一场了。

那新版Deep Think最为特别之处，在于其从起始便没打算仅当个“考试型选手”。谷歌的工程师，与来自各个行业的科学家、研究人员相聚一处，深入知晓了真实科研环境究竟有着怎样错综复杂的状况。那些问题常常是边界模糊不清的，数据有可能呈现出杂乱无章的态势，甚至压根儿就不存在所谓的标准答案。

这种合作模式保证了模型的进化走向并非是刷分，而是去解决实际问题，它需学会在信息不完备的状况下，为研究者整理思路，甚至从繁杂的数据海洋之中捞出有价值的线索，这相较于单纯求解一道有着标准答案的数学题而言，要困难得多。

将时间回溯到2月12日，此次那更新后展现出强大效能的功能，已然朝着身为AI Ultra订阅用户的群体予以开放。倘若你已然是付费的用户，那么当下就能够于应用里着手尝试这般全新的Deep Think，去体会它针对复杂问题进行处理的能力。

对普通用户而言，这或许暗示着未来智能助手那个“智商天花板”又被大幅抬高了。谷歌正将最前沿的推理能力，借由订阅服务这个途径，预先交到乐意给深度价值付费的用户手里。

为终端用户之外，谷歌再次踏出关键一步，借助 APIs给到外部的研究员、工程师再加企业深度思维做通道开放。然而当下仅是“早期访问计划”，需感兴趣的团队呈上申请，经审核方可接入。

这仿佛开启了一道大门，致使顶尖的科研工具不再唯谷歌内部的“黑科技”是举。外部团队借此强悍的推理引擎，能够用以开发自身的科学计算工具，能够用以打造自身的数据分析平台，或者能够用以构建复杂的工程模拟软件。

在能力展现方面，新版的Deep Think交出了一份令人瞩目的成绩清单。在不借助任何外在工具之情形下，它于涵盖多门学科的终极人类考核上取得了48.4%的分值，在衡量通用推理能力的ARC - AGI - 2测试里更是高达84.6%。

在编程以及数学领域，会有一项惊人之处，便是它于竞赛编程 benchmarks 上的 Elo 评分，达到了 3455，此评分所代表的可是顶尖程序员的水准。并且，在 2025 年的国际数学奥林匹克竞赛内里，它的表现同样达到了金牌选手这样的标准，其推理能力由此便能够明显显现出来了。

谷歌并未将目光限定于数学以及代码之上，官方所提供的数据表明，新版的Deep Think在2025年举办的国际物理奥林匹克竞赛和国际化学奥林匹克竞赛的笔试环节当中，同样给出了金牌等级的答卷，这意味着它不但能够领会公式，而且还能够解决繁杂的理论问题。

于更深奥的理论物理范畴之中，像是在一个称作CMT-的测试集合之上，它亦获取了50.5%的分数。这意味着模型开始有能力去处理某些前沿的科学观念，对研究人员而言，它也许会变成一个挺好的“外部大脑”，协助从全新角度去审视数据。

谷歌着重突出，表示这次升级主要意图在于促使实际运用得以推进，他们期望Deep Think能够切实有助处于工作首位的人员，像是使得研究人员运用它去阐释繁杂的实验数据，又或者协助工程师借助编写代码对物理系统开展高精度建模。

借由API展开早期访问，恰是达成此目标的关键一步，往后，谷歌会将该能力送至科研工作者最为急需之处，不管是剖析基因序列，还是模拟气候变化，这已非实验室中的演示，而是迈向工厂以及实验室的生产力工具。

瞧见谷歌的Deep Think于物理领域，于化学范畴，甚至在理论物理方面都获取了金牌级别的表现，你认为未来科学家的工作方式会产生怎样的变化，欢迎在评论区域分享你的见解，要是你觉得这篇文章对你有所助益，可别忘了点个赞并分享给更多的人！