新闻资讯

AI搜索被投毒怎么破?CMU新研究给出第三条路

更新时间:2026-04-01 13:44

龙虾热背后,3000元就能让AI搜索信口开河,离全面「瞎说」还有多远?除了「卖广告」和「投毒」,AI搜索商业化到底有没有第三条路?AI搜索商业化的三条路AutoGEO的论文用数据证明了第三条路的可行。如果整个行业都走前两条路(卖广告+对抗式投毒),AI搜索的可信度确实会持续下降。

今年年初的时候,全民养“虾”的那个热潮还没有消退掉,然而AI搜索的可信度却连续遭受了两次沉重打击。先是平台自己亲自下场去售卖广告,紧接着315晚会又揭露了只需3000元就能够给AI搜索“投毒”的灰色产业链条。当AI给出的回答当中既有广告又有经过仔细伪造的虚假信息时,我们还能够指望它说出真话来吗?

平台卖广告 老路翻出新隐患

于今年2月起始之时,众多用户于若干主流AI搜索平台之上会发觉,答案下方出现了独立模块形式的广告位。此举措乃是平台方模仿传统搜索引擎之举,将广告以直接嵌入方式放进了AI交互场景。从商业层面分析来看,这的确是一条具备透明度的变现途径,平台能够直接获取到相应的收入。

但是,随之就出现了问题。当广告呈现在AI回答的下方之时,用户特别难以判定回答自身的客观性是不是受到了广告主的影响。一旦广告的权重被提升,致使搜索结果的排序偏离了真实性与准确性,那么用户对于AI搜索的信任就会如同沙堡那般缓缓地崩塌。

对抗式投毒 三千元掀起的暗流

今年参与315晚会被曝光的,是一条更为隐蔽的产业链。有一些GEO服务商宣称,只要起步价3000元,就能借助批量于互联网上发布特定内容的方式,或者朝着文档里注入干扰指令,借此让AI模型做出回答时,优先去推荐虚构的产品或者信息。

被称作“对抗式GEO”的这种做法,其本质是一场欺骗,经由大量制造虚假信号,强行“喂”给AI模型,使得服务商赚到了钱,某些产品获得了曝光,然而代价是整个AI搜索生态被注入了大量垃圾信息,,用户的每一次提问可能被导向精心设计的陷阱。

合作式GEO 被学术证明的第三条路

迎面而来的是前两条路所引发的信任危机,于此情形下,一篇源自CMU在ICLR 2026上发表的论文给出了与众不同的答案。有研究者提出了一种名为“合作式GEO”的思路,该思路并非是去欺骗AI,而是以系统性的方式去研究AI引擎究竟偏好什么样的内容。

关于这种方法,其核心之处在于,要使得大模型,能够从数量众多的引擎行为数据里,自行提取出一套条理清晰的偏好规则。对于内容创作者而言,只需依照这套规则去对自身内容予以优化,便能够让优质信息,可以被AI更良好地“看见”,而并非依靠“投毒”这种方式来获取关注。

数据对比 损人利己与利己不损人

论文里头的对比数据是极为直观的。和对抗式GEO方法相比较而言,合作式GEO在使得内容可见度得到提升之际,对于搜索引擎的实用性并未引发任何损害行为。简而言之,对抗式做法的逻辑是在短期内可起到某种效果但从长时间来看是具有危害性质的,这属于典型的那种“损人利己”情况。

具有合作性质的GEO,于三个不一样数据集合之上的测试成果表明,其在内容可见程度方面,最高实现了百分之五十点九九的提升幅度。更为关键之处在于,于精确度、召回率以及清晰度等诸多搜索质量衡量标准上,它全部均保持于基线水准,甚至还稍有提高。这所表达的意思就是内容提供方获取了益处,然而用户的搜索体验并未遭受到损害。

内容创作者的启示 AI偏好有迹可循

就内容创作者而言,这项研究传递出一个清晰的信号。规则表明了一种有意思的现象,冒号。不同AI引擎之间的偏好呈现出高度的重叠,逗号。重叠率近乎达到八成。这意味着并不存在所谓的“黑盒”秘诀,逗号。优质内容有着相通的通用标准,在不同AI平台上都是一致的。

同时,不同领域之间在偏好方面存在着很大的差异,举例来说,在研究类问题这个范畴当中,AI 所偏爱的是深度解释以及因果分析,然而在电商领域里,它更为喜欢的则是具备可操作性的步骤以及模块化的信息,与其耗费钱财去实施像搞“投毒”这种属于短期性质的行为,倒不如静下心来理解规则,这才是能够实现长期提升曝光度的正确途径。

信任重建需要跳出零和博弈

返回最开始的那个问题,当人工智能搜索同时遭受广告以及投毒这两方面的冲击,它距离全面“乱说一通”还差多远呢?要是整个行业都顺着平台售卖广告以及对抗式投毒这样的两条路径走下去,人工智能搜索的可靠性确确实实会接连下降。

然而,CMU所开展的此项研究,使我们察觉到了另外一条途径,合作式GEO证实了,商业利益与用户体验并非绝对无法协调的矛盾,它凭借具有说服力的数据向我们表明,恰当的优化乃是促使优质内容获取理应得到的曝光机会,而绝非借助污染信息池的方式来达成目标,这不仅仅是一项学术层面的结论,更是关乎AI搜索生态能否实现健康发展的关键所在。

在你的认知范畴内,AI搜索平台究竟适于将广告做得更为隐蔽,还是如同这项研究给出的建议那样,优先去构建一套能够使得优质内容自然而然浮现出来的规则呢?欢迎于评论区交流探讨你的观点看法。