AI资讯

亚马逊AI芯片Trainium将直接出售,企业自建数据中心算力新选择

智能摘要

ASIC实体芯片进行深度商谈。Trainium作为亚马逊自主研发的AI专用芯片,在过去一段时间里一直通过其云计算平台提供给外部开发者使用。通过销售实体芯片,亚马逊能够触达更多元化的客户群体,进一步巩固其在AI硬件生态中的话语权。

亚马逊为何突然要卖芯片

过去, 亚马逊自行研发的AI芯片Trainium以及Inferentia, 一直都仅仅是借由云服务AWS出租给用户使用。然而, 最近亚马逊的AI主管彼得·德桑蒂斯对外宣称, 正在跟多家企业洽谈关于直接售卖实体芯片的事宜。这就表明, 在未来你能够将这些芯片购置回来, 放置到自身的数据中心去运行AI任务, 而并非像之前那样每次都需依赖亚马逊的云。

背后有着算力需求爆炸的这个转变, 亚马逊CEO安迪·贾西于今年4月有所透露, Trainium芯片在云端已然处于供不应求的态势, 当前版本儿几乎都卖光了, 下一代产品还没得以上市就引发了热议, 亚马逊明显是不想仅仅把这块蛋糕留在云上才吃掉的。

卖芯片会不会搞垮自己的云业务

外界首要的一个疑问便是可, 那就是亚马逊售卖芯片, 会不会把它自己云服务AWS的生意给抢走? 毕竟AWS是亚马逊极为赚钱的业务当中的一项, 并且芯片往昔是吸引客户前往上云的关键卖点。要是客户直接去购置芯片自行建设数据中心, 这不就等同于自己断掉财路了?

德桑蒂斯针对此持有乐观的态度, 他觉得全球人工智能算力这个市场实在是规模特别巨大, 大到亚马逊完全没有办法全部囊括, 售卖芯片能够涵盖那些并不想接入云端的企业, 像是金融、医疗等对数据敏感的领域, 它们更加倾向于自行搭建算力, 所以这并非是自己和自己较量, 而是以两种不同方式并行发展。

芯片长什么样性能如何

亚马逊当下重点推行的AI芯片属于Trainium和Inferentia系列, Trainium2是在2024年正式面向外界予以提供的, 它是专门为大模型训练而设计的, 其单芯片的算力相较于上一代提升了4倍, 而Inferentia2主要侧重于推理场景, 适宜部署那已经训练完毕的模型去进行实时预测。

并非这些芯片独自开展工作, 亚马逊将它们构建成服务器集群, 举例而言, Trn2实例是由16颗Trainium2芯片组合而成, 其总的计算能力高达20.8 petaflops , 倘若企业购买回去, 能够径直按照同样的构架建成自身的AI集群, 软件栈也是存在的。

实体芯片卖给谁用在哪

亚马逊所瞄准的客户画像清晰明确: 是那些已然拥有自建数据中心的公司, 像是大型银行、保险公司、医疗机构, 它们对于数据合规方面有着极高的要求, 并不愿意将核心数据送往云端进行训练, 还有电信运营商以及政府部门, 它们需要能够在本地进行部署的算力去支撑AI应用。

还有一个目标群体是AI初创公司, 这些公司在早期的时候上云这件事是比较便利的, 然而当规模变大之后/cloud成本会呈现飞速地膨胀/要是能够进行一次买断芯片的操作/从长期的角度来看是能够省下一大笔租金的/亚马逊甚至还有可能提出一种芯片加服务器的打包形式。从而降低企业进行自建的门槛。

对竞争对手意味着什么

在亚马逊售卖芯片这件事上, 直接受到冲击影响的是英伟达, 英伟达所生产的GPU在当下AI芯片市场里, 占据着超过80%的份额, 其中一颗H100的售价高达3万美元, 而亚马逊Trainium在性价比方面一直以来具备优势, 要是放开其销售渠道, 极有可能会使一部分对于成本较为敏感的大客户被分走。

与此同时, 谷歌会紧张, 微软也会紧张。谷歌拥有自己研发的TPU却不对外售卖, 微软依靠英伟达芯片再加上自主研制芯片Maia。一旦亚马逊毫无保留地售卖芯片, 那就等同于在硬件方面和谷歌、微软直接争抢客户, 并且亚马逊还有AWS的软件生态作为后盾。

未来格局会怎么变

亚马逊, 从单纯做云服务的商家, 转变为兼顾硬件售卖的复杂参与者, 此趋势不可逆转。能够预见到, 往后会有更多科技公司选择走类似路径: 自主研究制造芯片, 先提供云服务, 然后开展开放销售。算力供应的链条, 将从原有的“单一进行出租”变为“出租与售卖同时推进”。

而实际存在的关键问题在于, 企业购置芯片用于自行构建数据中心, 对于运维以及是否能够很好地进行优化, 这能行吗? 亚马逊势必要给出简便易用的软件工具以及运维方面的支持, 不然的话, 客户即便购买了芯片却不晓得如何使用, 最终还是会再度回到云端。这里面所涉及的平衡, 将会是亚马逊后续面临的重大考验。

你认为企业选择租用云算力会更具划算性, 还是购置芯片自行构建会更具划算性? 欢迎于评论区域交流阐述你的观点看法, 对这篇文章进行点赞并予以收藏, 使得更多的人得以瞧见AI芯片市场的全新变局情况。

相关文章