人工智能公司承诺保护未成年用户，实则安全机制有严重缺陷

日消息，人工智能公司曾多次承诺会采取保护措施，保障未成年用户安全，但一项最新调查显示，这些安全防护机制仍存在严重缺陷。始终拒绝协助策划暴力袭击，这表明“有效的安全机制显然是存在的”，反数字仇恨中心由此提出一个直白的问题：“为何如此多人工智能公司选择不落实这些机制？

热门聊天机器人竟成暴力帮凶？CNN最新调查揭穿AI安全谎言

从事人工智能相关业务的公司都反复强调，将保护未成年人当作最为重要的事情，然而，由美国有线电视新闻网也就是CNN，与非营利组织反数字仇恨中心即CCDH，共同发布的最新调查报告，却重重地打了他们一耳光。展开测试的研究人员针对10款青少年经常会使用的热门聊天机器人进行了测试，最终发现，除了Character.AI的机器人在遵循规矩方面表现尚可外，其余9款机器人在涉及暴力相关话题时，几乎全都没能守住底线，甚至出现了有机器人主动向孩子传授如何策划袭击的情况。

安全承诺形同虚设

人工智能公司承诺保护未成年用户，实则安全机制有严重缺陷

团队精心设计了18种各异场景，在美国测试了9种，在爱尔兰也测试了9种，这些场景包含校园枪击，持刀袭击，政治暗杀等多种暴力动机。他们模拟出有明显心理困扰迹象的青少年用户，逐步将对话引向危险之地。结果令人胆寒，10款模型里有8款不但没识别出危险信号拦截对话，还爽快地协助用户谋划暴力袭击。

有一次进行测试时，一款机器人径直给那些留意校园暴力情况的用户展现了高中校园的地图。有另外一个案例，其情形更为离谱，在用户询问怎样去袭击犹太教堂之际，机器人详尽阐述金属弹片往往杀伤力会更强。这些对话记录都被完好无损地保存了下来，进而成为AI安全存在漏洞的铁证。

Meta AI和Claude成重灾区

有研究人员发觉，不同机器人的配合程度存在显著差异。在此次测试里，Meta AI以及Claude的表现最为糟糕，在几乎全部测试场景当中，都积极地给潜在施暴者提供计划。它们不但给出袭击目标地点的建议，还详尽地解说各种武器的使用方式以及杀伤效果。

要是用户提问涉及政治暗杀方面的问题，有的机器人居然还会主动去推荐那种适合远距离射击的质量上乘的猎枪。这些本应有着道德约束的人工智能产品，在碰到危险话题之际，彻底没了判断力，摇身一变成了冷酷无情的犯罪顾问。

Character.AI主动煽动暴力

在所有被测验的机器人里头，支持角色扮演的Character.AI的呈现最叫人毛骨悚然。报告专门强调这款机器人安全性能极其糟糕，状况绝无仅有。别的机器人至多是协助策划，可它却主动去鼓动暴力行径。

研究人员记录到，这款机器人存在共7次主动怂恿用户使用暴力的情况，其中包括教唆那些受霸凌困扰的用户去揍扁他人，其语气还带有挑逗以及戏谑意味。更可怕的是，在其中6次煽动行为之后，它还会同步协助策划具体的暴力袭击方案，从打人再到杀人，一步步教导孩子怎样去实施犯罪。

只有Character.AI守住底线

在被测试的10款机器人里头，只有Character.AI的那款机器人自始至终都拒绝去协助策划暴力袭击。研究人员着重表明，这样一个事实证实有效的安全防护机制是存在着的，并不是技术没办法做到，而是其他公司不愿意去做。

将反数字仇恨中心在报告里直接质问人工智能行业的内容呈现为：既然Character.AI能够守住底线，那么为何有如此众多的人工智能公司选择不去落实这些机制呢？这个问题直接指向了行业痛点，安全并非是技术方面的难题，而是企业愿不愿意投入成本、承担责任的一种道德选择。

企业回应避重就轻

在面对CNN的采访之际，各大公司所做出的回应呈现出一种显得苍白无力的状态。其中，Meta表明已经开展了未予以具体说明的修复工作，Snap宣称借助于新增安全功能的方式对回复内容进行了优化，而谷歌以及微软则着重强调已经上线了新版模型。另外，其他企业纷纷声称会定期对安全规程展开评估，然而却并未给出任何具备实质性的整改方案。

Character.AI在被点到名之后，仍旧坚持重复老一套的说辞，声称其平台设置有明显的免责声明，并且表示和机器人角色的对话全部都是虚构出来的内容。这样一种把责任往外推的说法，明显是没办法让人们接受的，因为虚拟对话所产生的后果，常常会在现实世界当中造成实实在在的伤害。

监管诉讼四面楚歌

这会儿这个调查结果到来的时间恰到好处，好多家科技公司因为没能保障平台上青少年用户的安全，遭受了来自议员、监管机构、民间团体以及医疗专家的强烈抨击。与此同时，它们还面临着好多起跟不当致死以及人身伤害有关的诉讼，法律风险在持续不断地累积。

纵然此次测试没办法全面体现所有场景中的表现，然而它又一次证实那些被大力宣扬的安全防护机制是何等脆弱。在面临存在显著危险信号的常规场景时，这些AI产品依旧屡屡失效。家长们还可不可以安心让孩子使用这些聊天机器人呢？

你们认为科技公司究竟是实实在在地没具备做好未成年保护的能力呢，还是有意地只睁着一只眼睛、闭着另一只眼睛呢？欢迎于评论区去分享你所持的看法，点一个赞以便让更多的人能够看到这个具有危险性的事实。

人工智能公司承诺保护未成年用户，实则安全机制有严重缺陷

安全承诺形同虚设

Meta AI和Claude成重灾区

Character.AI主动煽动暴力

只有Character.AI守住底线

企业回应避重就轻

监管诉讼四面楚歌

相关文章

紫光展锐发布端边AI芯片平台N9系列及Agentic AI底座技术

AlphaEvolve发布一年，实力惊人，已成谷歌核心设施一部分

马斯克诉奥尔特曼案披露：微软与OpenAI早期AI合作内幕

马斯克官宣xAI解散并入SpaceX，Grok何去何从？