AI资讯

DeepSeek识图上线:能认出雷军,却把创始人认成董宇辉

智能摘要

创始人梁文锋的照片。识图模式始终无法正确识别为梁文锋,而是识别为董宇辉、张雪峰,甚至识别为雷军。准确识别出了多张雷军照片。至于为什么无法识别梁文锋,一种解释是梁文锋行事非常低调,网络公开照片和信息较少,模型难以形成稳定识别特征。没有针对自家老板进行特殊识别优化。

一场识图测试引发的意外结果

6月18日, 识图模式在App正式上线, 识图模式同时在网页端上线。过程中, 澎湃新闻意外发现如此情况, 在测试里该功能无法准确识别照片, 照片乃创始人梁文锋之照。测试阶段, 测试人员上传一张照片, 此照片是梁文锋目前流传最广的那一张。紧接着系统不同寻常, 接连给出识别结果、给出令人惊愣之识别结果, 识别结果为董宇辉、张雪峰, 甚至雷军。这一结果致使许多人感到意外, 毕竟这是自家公司研发构成的产品, 自家公司的产品却连老板都认不出来。

同一时间, 网上传言雷军的相片没办法发送出去, 给出的提示是或许违反了使用规范。然而实际去测试的时候发现, 雷军的照片能够正常上传, 而且系统明确无误地识别出了多张不同的雷军照片。这一批对比测试更突出地显示了梁文锋识别问题的独特特别之处。为何一家公司的创始人, 反倒会被自家的AI系统误认作是其他人呢?

低调行事导致训练数据匮乏

梁文锋于公众视野之内始终维持低调态势, 网络之上公开的照片数量极其稀少。他甚少接纳媒体采访, 并且在公开空间露面频率极低, 如此这般干脆造成训练数据里涉及他的图像样本极为有限。模型要借助大宗、多视角的照片方可塑造出稳固的识别特性, 然而梁文锋那稀缺的照片明显难以契合这一需求。

DeepSeek识图上线:能认出雷军,却把创始人认成董宇辉

相比于其他情况, 董宇辉、张雪峰、雷军等人皆是在社交媒体以及新闻报道里高频现身的公众人物, 他们所拥有的照片数量众多, 角度极为丰富, 如此一来模型自然而然地更易于准确进行识别, 然而梁文锋具备的低调特性, 却反倒成为了AI识别系统的一项难题, 这也就阐释了为何系统会将他错误认作其他人。

没有特殊优化是技术公平性的表现

DeepSeek识图上线:能认出雷军,却把创始人认成董宇辉

置身于技术层面以观之, 识图模式针对于自家老板并未予以特殊化层面的优化, 这样的情形所映射出来的是一种技术范畴之内的公平属性之感。设若系统针对内里的相关人员施行特殊化的操作处置, 反而可能因之对识别算法的通用性质以及客观特质造成破坏之虞。诸多的人工智能公司于开展训练模型的相关工作之际, 皆是会规避从人为角度去增添特定人物的识别权力度, 以此来确保产品面向所有用户能够达成公平之态。

这种不搞特殊化行径, 实则值得予以肯定, 它表明团队于开发进程里遵循了技术中立准则, 未曾因梁文锋身为创始人便为其大开方便之门。然而这也暴露出一个现实情形, 当训练数据匮乏时, 即便针对公司创始人, AI亦无法达成精准识别, 技术的短处, 在任何人跟前都一视同仁。

识别错误暴露了数据多样性的短板

此次事件还将训练数据多样性欠缺的问题给暴露了出来, 梁文锋的低调在一定程度上乃是数据稀缺酿成结果的因为, 然而这并不是他独自一个人的问题, 许多并非公众人物身份的人在AI系统当中都极有可能遭遇识别失败的那种风险, 要是用户把自本身边普通平常之人的照片给上传上去的话, 系统大概率同样没法做到 accurately识别。

将大量网红、明星、企业家的照片, 单独作为训练集, 用于训练识别普通人, 这会使识别能力严重下降, 因为数据多样性对AI模型性能起着关键作用。既然识别人脸的这种常见应用很实用, 那为了提升整体识别能力, 一定得扩大训练数据覆盖范围, 纳入更多不同职业、不同风格、不同生活状态的人物样本作训练。此次误认事件, 恰好给数据多样性敲响了警钟。

公众人物识别的商业价值与风险并存

先说公众人物识别这事儿, AI系统之于它, 有着商业价值, 同时里面也潜藏着风险 ,辨识企业家、明星这些公众人物, 以及政治人物, 能够应用于搜索引擎优化、社交媒体推荐、品牌监控等好些场景 , 然而一旦识别有误, 就象把梁文锋认成了董宇辉这样, 那就兴许会引发误解, 甚至还会产生争议 , 这便是好多公司对公众人物识别持谨慎态度的缘由。

假设系统针对某些人物设定特殊规则, 像是不将雷军照片加以过滤, 如此一来又兴许会被视作存在偏见。在测试期间, 雷军照片能够正常上传并且被精准识别, 这自身不存在问题, 然而要是对比梁文锋的识别失败情况, 便容易引发他人联想。商业公司于处理公众人物数据之际, 需要对准确性与公平性予以平衡, 这可是一项颇具难度的挑战。

技术迭代需要更多真实场景的反馈

刚刚上线的识图模式, 出现识别错误没啥可奇怪的。任何AI产品都得经由用户反馈才能持续优化。关于梁文锋识别失败的这次事件, 恰恰就是产品迭代进程里一个珍贵的测试案例。团队能够依据这类错误, 去调整模型参数, 去补充训练数据, 去优化特征提取算法。

于未来, 识图模式所需凭借更多真实用户所提供的测试数据来促使性能得以提升, 用户上传的照片数量越多, 并且场景越丰富多样, 模型学习所达成的效果也就会越好, 与此同时, 团队还需要构建更为完善的反馈机制, 以便让用户能够轻松做到报告识别错误, 进而加速改进这一过程, 技术并非是完美无瑕的, 然而持续不断地进行迭代能够带来更为优质的体验。

对于那项识图功能, 你有去做过测试吗, 倘若把你自身的照片实施上传, 你认为它能够精准地将你辨认出来吗, 欢迎于评论区把你的测试结果予以分享, 通过点赞与转发促使更多的人一同加入到讨论之中来!

相关文章