新闻资讯

大英百科全书联合韦氏词典起诉OpenAI,称ChatGPT侵权

更新时间:2026-03-25 13:48

3月16日,大英百科全书联合旗下的韦氏词典,对OpenAI提起诉讼。它旗下近10万篇在线文章、百科条目和词典释义,覆盖从科学、历史到文学的几乎所有主要知识领域。World统计显示,这已是针对OpenAI的第63起版权诉讼。

大英百科全书此次发起起诉,将与AI生成内容相关的一整条链路全都呈现在法庭之上,这条链路涵盖从训练数据抓取层面,到模型输出环节,甚至实时检索部分都未被放过。在AI版权诉讼历史当中,这是首次有人尝试把“侵权”这一概念,从起始源头一直贯穿至最终结果。

三层指控层层递进

大英百科所呈诉状将侵权划分成三个层次 ,第一层是训练数据抓取情况 ,它认定未经许可就取走旗下将近10万篇文章用于训练GPT - 4 ,此行为本身即为侵权之举 ;第二层次指向模型输出 ,据报道GPT - 4能够逐字默写大英百科的原文 ,这并非风格相似 ,乃是精确复制 ;第三层最具争议性 ,大英百科觉得即便内容未进入训练集 ,只要在RAG实时检索中被调用且生成回答 ,同样构成侵权。

这种以三层递进形式呈现的指控方式,在AI版权诉讼里是前所未有的,以往原告一般只是针对训练数据这一环节,然而大英百科却企图将从数据收集一直到最终输出的每一个节点都判定为侵权行为,这就意味着即便AI公司运用不存储版权内容的技术方案,只要生成结果涉及原文,便都有可能面临法律风险。

商标侵权这条新路

版权问题之外,大英百科又追加了《兰纳姆法》商标侵权指控,这条指控逻辑挺有趣味,AI模型有时会出现幻觉,编造出错误信息,接着在回答里宣称这些信息源自大英百科或者韦氏词典,大英百科觉得,这并非单纯内容被盗用的情况,而是品牌信誉遭绑架的问题。

当用户瞅见一段呈现错误状况且被标明是来自大英百科的信息时,他们就会对这个历经百年岁月的品牌的可靠之处有所怀疑。大英百科于诉状里着重指出,这般情形危及公众持续去获取具备高质量、值得信赖的在线信息的能力。这种关于商标侵权的诉讼思路,将AI幻觉问题从技术存在的缺陷提升到了关乎品牌损害的法律层面上。

模型记住的远比你想象的多

来自技术层面证据的是大英百科起诉的底气 ,斯坦福以及耶鲁的研究团队开展过实验,自主流的大模型之中提取《哈利·波特》原文,最高的提取率达96% ,这表明训练数据之中的内容存在相当一部分被编码于模型权重里,在特定提示词的诱导之下能够近乎原样予以还原。

使得GPT-4能够逐字输出大英百科内容的,正是背后的这个技术原理,模型并非在学习知识规律,而是在记忆原文,这种记忆的程度已然超出了合理使用的范畴,从而进入了复制传播的领域,大英百科旗下近10万篇经专业编辑和学科专家积累数十年才形成的内容,或许都已以这种形式存在于模型参数之中了。

全球法院各说各话

这场官司的关键棘手问题在于,全球司法领域对于AI训练是否算作侵权压根不存在统一的答案。德国慕尼黑法院在GEMA诉案里判定,只要在模型权重当中能够还原出作品,那就构成版权范畴内的复制,能够提出禁令以及赔偿的请求。然而在英国,高等法院于Getty诉AI案中得出的是全然相反的结论,觉得AI模型权重既不涵盖也不复制版权作品自身。

美国此地更为繁杂,联邦法官阿尔苏普,于版权诉讼里判定,把内容用作训练数据具备转化性,能够适用合理使用原则,然而他又认定,非法下载数百万册书籍而非付费获取属于违法,最终促使达成了1.5亿美元的集体和解,此案件在纽约提起,适用美国联邦法律,但其结果在很大程度上取决于具体法官的认定逻辑。

RAG这条红线可能改变行业格局

不列颠百科全书针对RAG实时检索的指责 ,或许是整个诉讼里对行业影响最为重大的一项条款 且RAG作为当下AI搜索产品的关键技术 它借助扫描外部数据库来得到最新信息进而辅助生成 不列颠百科全书觉得 只要内容于实时检索里出现且被运用 就算未进入训练集 同样属于侵权行为。

倘若法院认同这个逻辑,那整个AI搜索行业都得重新进行洗牌,所有以联网搜索加AI生成为核心模式的公司,都得为每一次检索调用再次谈判授权。大英百科先是选取起诉以RAG模式为主的AI搜索公司Perplexity,现下又将同样的逻辑复制到OpenAI身上,这显然是在做法律方面的预演。

250年老牌百科的最后防线

大英百科在1768年创立,它属于英文世界里持续时长最长的百科全书品牌,它曾经是人类知识整理传统的象征,后来被维基百科搞得几乎难以寻觅到存在感,依靠转型为数字订阅平台才再度稳固地位。如今AI出现使它又一次面临被替代的威胁,并非被更出色的百科所替代,而是被一个利用它的内容训练出来、却不给它任何钱财的模型所替代。

在诉状之中,有一番表述极为简洁浅显:借助生成用以替代出版商所产出内容的回应,从而掠取了出版商的流量。这构成了商业模式方面的正面冲突。一直到2026年3月,专门对AI版权诉讼予以追踪的网站所进行的统计表明,这已然是针对OpenAI的第63起版权诉讼。大英百科正尝试凭借一份诉状,去为AI的边界设定一条界限,而这条界限最终将会划定于何处,或许就决定了知识内容产业在AI时代的生存空间。

对于大英百科此次针对RAG实时检索所发起的指控,你认为法院是否应当予以支持?将你的看法留在评论区,同时也别忘记点赞并分享,从而让更多人能够看到这场与AI内容生态紧密相关的关键诉讼。