AI资讯

科学家两年综述几周写完,Claude Science让AI提速科研

智能摘要

Lecoq和他的团队,把一篇长篇综述的写作时间,从将近2年压到了几周。据Anthropic介绍,这套活儿过去这位科学家和他的团队要干两年。而可复现,长期是科研最大的痛点之一,代码丢了,环境变了,几个月后连作者自己都跑不出当初那张图。

痛点:一篇综述写两年太慢

以往, 科研人员撰写一篇长篇综述时, 从开展文献检索起, 到逐句核对引用, 再到反复进行修改, 常常要耗费近两年的时间。神经科学家Jérôme Lecoq手头积累了大约10篇综述, 其中不少篇幅超过100页, 每一条引用都必须由他自己逐页去核实。如此这般的低效情形, 不但拖慢了科研产出的速度, 还致使许多有价值的想法, 在尚未熬到发表之时就已然过时了。

对于Lecoq团队而言, 时间可是实验室里最为昂贵的成本, 在2026年, 他们将一篇长篇综述的写作时间, 从差不多将近2年抑制到了仅仅几周, 为此他们运用了一款特定的、专门为科学家设计的、并非通用聊天机器人的AI工作台。

核心理念:AI不是更聪明的模型

所给予的定位, 并不是一个更为聪慧的科研模型, 而是一个针对于科学家所打造的AI工作台。其真正有所突破的地方在于: 算得上是第一次将科研这个事宜, 拆分成了一条能够被逐步予以审计核查的流水线。往昔的时候科学家于多个工具之间进行来回轮流切换, 其中涵盖了查阅文献、运行代码、做数据统计以及提交计算任务等, 然而在每个环节当中都极易出现毛病、产生差错。

使用一个actor – 配对结构的Lecoq团队, 其中一个智能体专门负责写作, 另一个专门评判其准确性以及引用是否真实, 这一套结构已然具备了些许“AI内部同行评审”的初步形态。然而,有一条边界必须清晰阐明, 即全程有着人参与其中(human – in – the – loop)。它所实现自动化的是流程, 而绝非自动代劳让你去完成科学发现。

场景:一个项目几十个数据库来回跳

有一个项目, 需要在几十个数据库之间反复来回跳转, 每个数据库都具备自身独特的查询语言。文件格式繁杂多样, 每一种都必须当下搭建管线, 当下寻觅查看器。手头还摆放着一排工具, 有用于查阅文献的, 有运行代码的, 有用R进行统计的, 有通过集群终端提交任务的。这样一种碎片化的工作流程, 致使研究者每日耗费大量时间在工具切换方面。

将这所有的一切予以整合了, 其中涵盖文献分析, 经历多步计算, 进行图表打磨, 直至论文成稿, 所有这些阶段都在同一个环境之中完成, 你无需再因为更换一个工具而致使思路中段。它能够运行在你本地的macOS系统或者Linux系统之上, 也能够借助SSH连接到远程的机器, 又或者挂载在高性能计算即HPC的登录节点上。在2026年4月的时候, 它推出了GPT-, 这是一个专门为生物推理以及药物发现所打造的前沿模型。

流程:从计划到执行全程可审计

原先是研究者亲自去做折叠一个蛋白质, 或者在海量数据上跑一条基因组管线这样的大工作: 搭建计算任务, 排队去等集群工作, 关注是成功还是失败, 再把结果拉回来, 忙活一趟半天时间就没了。现在把这一整套流程接管过来: 首先起草一个计划, 在碰到新资源前先跟你询问一下, 在完成写任务、提交任务操作之前都要让你能够进行审查或者撤销操作。

将分析从单个 GPU 逐步扩展至数百个, 一次把 8 组 scVI 超参扫描分配到实验室 A100 集群去运行, 右侧与智能体共同使用同一个实时内核, 变量以及状态进行实时同步, 更为关键的一点是, 敏感数据不会离开原系统, 仅仅每一步真正所需的上下文才会予以发送, 这样的设计使得科研机构有胆量运用它来处理像基因组数据这类敏感信息。

图表:代码和环境一起打包

从事科研这一领域, 从一开始就天然地要与各类图有所关联: 像是蛋白质呈现出的三维结构模样, 还有基因组浏览器所展示的轨道形态, 以及化学物质所具备的结构式形态, 这些实际上统统都属于图的范畴。依据这样的情况, 在完成出图以及出稿的过程当中, 要将生成这些图的对应代码一同交出去, 并且能够将它们以原生的状态进行渲染呈现出来。每一次生成一张图的时候, 它会准确无误地把生成这张图所确切用到的代码、它独特稳定的运行环境所蕴含的各项要素、使用的纯粹语言所阐述明白的详细说明以及一整个完整的对话历史记录, 全部整合在一块“一并收纳进袋子”的方式“钉”在这张图上。

一张位于左侧的、跨越一百三十八个物种的细胞图, 右侧同屏悬挂着的是生成该细胞图的、确切的代码, 圈注一个句子就能使得智能体去修改图片。几个月之后, 当审稿人要求你重新运行某一张图时,你能够极具轻松地将输入、过程以及结果的整条链条当场进行复现。仅仅直接说话即可——「把网格线去除掉」「将纵轴替换为对数」, 智能体直接去修改自身所编写的代码。

协作:多智能体分工与验证

你所面对的, 是一个具备统筹能力的协调智能体, 它手中持有60多个分别为基因组、单细胞、蛋白质组、结构生物学、化学信息学预配好的技能以及连接器。一旦活计增多起来, 它自身能够派生出更多智能体用以分工, 并且也可以随时调用由你亲手创建出来的专家智能体。这样一种多智能体架构, 使得复杂的科研项目能够并行推进。

它专门去核查引用以及计算, 将错误的引用揪出来, 把追不到出处的数字找出来, 把对不上代码的图识别出来, 一旦发现就进行标注, 然后自己予以改正。在Allen那个案例当中, 团队所采用的正是actor – 配对方式, 一个智能体负责书写, 另外一个则专门评判它的准确性以及引用是否真实。这样一套结构, 已然具备了些许「AI内部同行评审」的初步形态。它还接入了Agent, 能够原生连接上Evo 2、Boltz – 2、这些生命科学模型。

验证:独立复核确认提速10倍

它们用以提名最新实验的靶点, 针对每一个组织以及靶点, 逐个评估表面表达、运输以及安全性, 接着依据公司从自身数据里所学到的标准对候选进行排序。讲, 普通编程助手无法做到这一点, 能够从头到尾完整地完成, 拿取精准数据, 做出正确判断, 并且还具备过往项目的相关背景信息。这套种系分析, 仅仅花费了过去大约十分之一的时间便完成了。

他所带领的团队, 还曾独立自主地对结果进行过复核, 证实其速度极快且稳定性超强。毕竟呀, 那些获得了10倍速度提升表现的场景, 目前仅仅被限定于综述撰写、基因组解析以及特定管线自动化这些方面, 这可不意味着「科研整体的速度能提升10倍」。往昔若要评判一项研究是否可靠, 得看同行评审的情况, 还要看是否能够被其他人成功复现。然而, 能够实现复现这一点, 长久以来一直都是科研领域最大的痛点之一: 代码丢失了, 环境发生了变化, 几个月之后, 就连作者本人都无法再次跑出当初的那张图表了。

边界:人始终在回路中

有可追溯代码在每张图之中, 连着它的环境与历史的是每个结果。它刚刚推出了 -Pro, 专门测试模型能否像计算生物学家般做判断: 有129道题, 从基因组学铺展到群体遗传, 再一路延伸至临床诊断, 专门测试“数据是否撑得起这个问题”“哪一步应当推翻重来”的手感。而处于人类科学家位置的, 恰恰是那解不开的部分。

模型能够开启起始环节,却无法完成收尾的最后一种情况: 像是应不应该剔除一部分异常数据、假设被推翻之后怎样调整方向, 这类判定还得由科学家亲自做出决策。并且没有避开这一问题, 将方案交给人员审阅、每个决策留给人员撤销, 它实现自动化的是流程, 判断的权力并非交给模型, 人类始终处于这个环节之中。对于像Lecoq这样的科学家而言, 一篇综述能不能被重现、几个月之后是否依然站得住脚, 原本就比榜单上多零点几个百分点更为重要。

最后向您询问一个问题, 倘若您手头存在一篇撰写达半年之久的综述, 您有没有胆量将其交给AI进行缩短处理, 使其缩短至两周时间呢? 欢迎在评论区留下您的观点, 讲述一下您切实存在的顾虑或者成功的经验, 点赞并分享, 从而让更多的同行能够看到这个全新的工具。

相关文章