新闻资讯
大英百科全书起诉OpenAI:滥用参考资料训练AI,侵犯版权与商标
OpenAI,指控后者滥用其参考资料训练人工智能模型。生成其内容摘要,“蚕食”了大英百科全书的网站流量。虚假“幻觉”中不当引用大英百科全书。大英百科全书要求金额未明确的经济赔偿,并请求法院下达禁令,禁止上述侵权行为。
这回,大英百科全书是真着急起来了。面对AI公司未经许可就“白嫖”其耗费上百年所积累的知识产权,这家老牌出版商在曼哈顿联邦法院果断选择正面硬刚,将微软支持的OpenAI告上了法庭。这起诉讼可不只是单纯索赔,还触及到了AI时代内容生产者生死存亡的核心要点:你的知识库变成别人的训练数据,你的网站流量被对方的AI摘要抢走,这种情况该如何定性呢?
核心指控:十万篇文章被非法复制
诉状里,大英百科全书明确写道,OpenAI未经其授权,复制了近十万篇在线文章、百科词条以及韦氏词典的条目,用于训练GPT大语言模型。这个数字并非凭空捏造,而是借助技术手段比对得出的。诉讼中提及,这些内容被直接喂给了AI模型,成为其生成答案的重要依据。十万篇相当于大英百科全书相当一部分核心知识资产,这种规模的使用,很难用“偶发”或“微量”来解释。

关键之所在竟是,大英百科全书觉得此并非单纯的数据抓取问题。诉状着重指出OpenAI是“蓄意”施行系统性复制,其目的乃在于打造一款能够与大英百科全书形成直接竞争态势的产品。这般于内容源头践行“拿来主义”的行径,径直对传统出版商的商业模式构成了冲击。就依靠知识付费以及内容授权得以存续的大英百科全书而言,这无异于是在撼动其商业根基了。
逐字相同:AI生成内容与原作的高度重合
《大英百科全书》于诉讼里表明,OpenAI所生成的内容,跟其词条、词典释义以及其他内容,有着“几乎逐字相同”的状况,这般存在意味着AI并非单纯学习了知识或者概念,在表明这一点之后,而是径直复制了原文的表达方式以及具体措辞,就好比某些专业术语的解释、历史事件的描述方式,甚至例句的选择,居然都跟原本著作非常一致,这种情况在版权法上构成了直接侵权。
使得这种高度重合所造成的后果极为现实,当用户于OpenAI的聊天机器人之中进行问题询问时,兴许所获取的答案会与大英百科全书官网之上的内容毫无二致,然而他们却不会再度点击进入原本的网站,那本应收归大英百科全书的流量遭到了截断,进而致使网站的广告收入以及付费订阅一并遭受损失,大英百科全书耗费了长达上百年时间所积累起来的内容,现如今竟被AI公司用以争抢自身的用户,这无论换做是谁都是难以予以接受的。
商标侵权:AI公司暗示虚假授权关系
大英百科全书指控OpenAI侵犯其商标权,除了版权问题之外。诉状表明,OpenAI在一定程度上暗示自身获得了大英百科全书的授权,致使用户误以为双方存在合作的关系。这种暗示可能经由AI生成内容的呈现方式、引用格式或者产品宣传而传递出来,极易让公众产生混淆。
越发严重的是,AI“幻觉”问题。大英百科全书有所提及,OpenAI的聊天机器人在生成内容之际,会不适当地引用大英百科全书,将一些根本不存在或者错误的信息强行加于这家老牌出版商。比如说,AI有可能编造一个词条,随后标注来源为大英百科全书,这不但误导用户,还损害了大英百科全书的品牌声誉。在知识传播领域,准确性着实是生命线,这种虚假引用对品牌的伤害难以估计。
流量被蚕食:用户不再访问原始网站
使用一个词来形容 AI 对大英百科全书网站的影响,在诉状里是“蚕食”。这个词形象至极,AI 生成的内容摘要,正将原本会访问网站的流量,一点一点地给吞噬掉。往昔用户若要查某个词条,或者查某个历史事件,会径直打开大英百科全书的网站。如今他们仅需在聊天机器人里输入问题,几秒钟便可获得答案,并且很大概率这个答案是基于大英百科全书的内容生成的。
流量,那可是内容网站的生命线呢。大英百科全书,它依靠网站的访问量,来获取广告收入,还要推广付费订阅服务。当用户习惯借助AI去获取知识摘要后,网站的独立访客数量,肯定会下降。这种下降,可不是一次性的,而是持续不断的,是累积起来的。更具讽刺意味的是,AI公司利用大英百科全书的内容去训练模型,反过来却又抢走了大英百科全书赖以生存的流量,这种竞争关系,从一开始就是不对等的。
合理使用争议:AI公司的核心辩护理由
面临这些指控,OpenAI等AI公司存在一个核心辩护理由,即合理使用,他们觉得,借助受版权保护的内容训练AI系统属于二次创作转化,是对原作品的创新性运用,不构成侵权,这个理由在以往的一些科技版权案件中曾被法院采纳,像搜索引擎抓取网页内容用于索引就被判定为合理使用。
但大英百科全书明显不认可这个逻辑,他们于诉状里表明,AI生成的内容并非单纯的转化性使用,而是直接取代了原作的市场需求,要是用户无需再访问原始网站便能获取近乎相同的内容,这便不符合合理使用的法律精神,这场诉讼的最终裁决,极有可能会为整个AI行业确立一个关键的先例,对所有内容生产者以及AI公司的博弈格局产生影响。
诉讼诉求:赔偿与禁令的双重目标
在诉讼里头,大英百科全书提出来了两个核心诉求。其一,求的是金额没明确说的经济赔偿,这一些赔偿,有可能是依据OpenAI因为侵权行为而得到的利润,又或许是基于大英百科全书所以遭受的损失。具体的数额,得靠着法庭审理期间的证据交换以及计算才能够确定,可要是考量OpenAI的规模跟影响力,那这笔赔偿金极有可能会是个巨大的数目。
首先是第二点,即请求法院下达禁令,此禁令旨在禁止OpenAI持续施行侵权行为。这表明大英百科全书并不单单意在要钱 ,更是期望从根源上遏制AI公司未经许可便使用其内容的行径。倘若禁令得以获批,那么OpenAI在未来便不能再把大英百科全书的内容用于训练,而且已经训练好的模型或许也得进行清理或者调整。对于依赖海量数据来训练大模型的AI公司而言,这将会是一次沉重的打击。
对于AI公司运用受版权保护的内容去训练模型这般情况,你持有怎样的看法——它究竟是属于合理范畴的技术创新行为,还是属于那种毫无遮掩的知识产权掠夺行径?欢迎于评论区之中分享你所秉持的观点,同时也千万不要忘记去点赞,并且转发给更多关注AI与版权问题的友人。
