百川智能发布Baichuan-M3 Plus,低幻觉率免费开放给中国医疗服务机构

形式,免费开放给中国医疗服务机构。在医疗场景的规模化应用扫清了关键障碍。向行业伙伴免费开放怎么嵌入医疗流程、怎么做证据呈现、怎么做风险提示、怎么支持年轻医生成长。能力直接交到生态伙伴手里。

在AI医疗建议屡屡出现差错之际,患者拿着可信度存疑的答复去责问医生,一场围绕信任的危机正暗暗地扩散开来。这不但使医患双方陷入困扰,更对医疗AI技术的可信程度提出了严峻的审问 。

核心问题在于幻觉率过高

当下,好多患者惯于运用通用AI模型去咨询健康方面的问题,这些模型虽说能够生成语句通顺的句子,然而其给出的回答欠缺切实可靠的医学证据作为支撑,错误的概率一直处于较高的水平,医生们时常得花费大量的时间去纠正这些不准确乃至有害的建议,消耗了宝贵的临床精力 。

那些过高存在的“幻觉”,致使AI在严肃至极的医疗领域之内相当难以被给予信任。误诊情形下所做出的那种建议,极有可能延误病情的发展,然因引用的竟是模糊不清的文献来源,这令医生毫无办法去进行核实。如此这般的状况,导致好多原本能够用来提升效率的工具,反倒摇身一变成为了医疗流程之中新添的一种负担。

六源循证技术与M3基座的突破

百川智能把独创的六源循证范式跟M3基座模型深度融合,目的在于从源头降低错误,这种做法确保模型在训练以及推理的时候,其知识得来自权威且专业的医学证据库,这在根本层面改变了模型的“思考”方式。

具体来说的时候,在模型生成任何医学方面的建议的之前,都得要在六大类证据源之中去寻找支持,这其中涵盖了最新的临床研究论文,还有权威诊疗指南以及药品说明书等,借助这种强制约束,M3 Plus模型把幻觉率成功地降低到了2.6%的全球领先水准。

证据锚定实现结论可追溯

只是给出文献引用,这远远是不够的。百川率先创造的“证据锚定”技术,要求模型生成的每一句医学方面的结论。都一定要精准对应到原始论文里的具体段落。这就如同给AI的每一句话都标记了精确的“坐标”。

团队在技术实现方面,把“证据锚定”设定成独立的训练目标,若模型出现错误引用或者没有办法准确定位证据的情况,就会遭受惩罚,历经大量训练后,结论跟证据段落的匹配准确率超出了95%,切实达成了可核验、可追责。

Fact-Aware RL强化学习范式

对于底层技术路径这一方面,百川追寻探索了那种不需要去依赖外部工具的降幻觉办法。它所拥有的Fact - Aware强化学习状态模式,使得模型自身原本也就是对于事实的精确性有着相当高的敏感度。这样的一种训练致使基础模型哪怕是在单独进行运行的时候,同样能够维持处于极低的幻觉程度。

这一范式和单纯增添检索模块不一样,它在模型认知层面予以优化,让其本质上趋向于生成有依据能查证的内容,这给构建高可靠性AI提供了全新的技术思路,是一次降低幻觉的成功实践。

降低使用成本推动临床落地

不论技术何等优良,一旦成本处于高昂状态,那便无法使大众得到实惠。对于百川而言,有着深刻的认知,即唯有让AI达成“能够被使用得起”的状况,才能够切实进入医院跟诊所里。调用费用处于高昂情形,曾经是对优异医疗AI进行规模化应用所形成的主要阻碍门槛。

鉴于此,公司推行了名为“海纳百川” 的计划,此计划会把那套处于全球领先地位的低幻觉循证医疗大模型,通过API的形式免费向中国的医疗服务机构予以开放,这般举措的目的在于消除经济方面的壁垒,促使技术在实际的医疗场景里能够加快渗透以及应用 。

共同打磨临床实用场景

在于解决实际问题乃是技术的最终价值所在,于高压的临床环境里,AI进行风险提示的方式,AI辅助教学的方式,AI将如何嵌入现有的工作流程,以及AI清晰呈现证据的方式,均需深入地探索,这绝非单纯凭借 single company 所能达成的任务 。

百川期望跟许多行业伙伴一起,于真实的门诊、病房、教学场景里不断打磨产品。唯有借助广博的实际运用与反馈迭代,方可使AI从一项技术变成医生信赖、患者受益的日常工具。您觉得,AI若想切实获取医生的信任,最需跨越的障碍是什么?欢迎分享您的看法,并点赞支持本文。