英特尔AI推理显卡Crescent Island:480GB内存350W功耗,主打每瓦性能
进行了进一步的介绍。设计。(Token/W),拥有可靠的开源软件生态堆栈。PC”芯片。
台北电脑展前夕英特尔亮出AI推理新武器
在2026年6月1日,台北国际电脑展即将拉开帷幕之时, 英特尔特地提前披露了一款针对AI推理工作负载进行优化的数据中心GPU。这款显卡的代号还没有公开, 它主要突出每瓦所具备的性能, 其目标致力于在能耗以及效率方面战胜竞争对手。英特尔有所透露, 该卡会在今年较晚的时候才正式上市, 它配置具备高达480GB的HBM内存, 整卡的功耗被控制在350W以内, 它采用的是PCIe AIC标准设计。
全面支持从FP4到FP64的混合精度计算
这款新的GPU, 其最大的亮点在于能够支持, 从原生的FP4、MXFP4一直到FP64的完整数据类型, 这也就意味着, 它能够灵活地处理不同精度的AI推理任务, 从低精度加速直到高精度计算, 一张卡就能全部搞定, 英特尔宣称, FF4和MXFP4数据类型, 格外适合低延迟、高吞吐的推理场景, 能够显著地提升每瓦性能, 相比较而言, 竞争对手的产品, 往往只是覆盖了FP8到范围FP32 , 英特尔所覆盖的广度, 更为突出。
开源软件生态堆栈成为核心竞争力

英特尔着重表明, 这款GPU具备可靠的开源软件生态堆栈, 开发者能够轻易接入常用的AI框架。当下, 该卡已与PyTorch、TensorFlow等主流工具相兼容, 并且支持ONNX Runtime和OpenVINO。英特尔内部所做的测试显示, 开源堆栈的优化使得模型部署时间缩短幅度超过了30%。这种开放性旨在降低企业迁移成本, 借此吸引更多用户从闭源平台转向英特尔生态。
Xe3P架构将横跨四大市场领域
英特尔同时予以确认, 这款GPU采用了全新的“Xe3P”架构, 该架构并非仅用于数据中心, 也会应用于PC、适用于边缘计算、还会作用于工作站这四大领域, 具体而言, Xe3P架构将会被集成到英特尔的“下一代PC”芯片之中, 覆盖范围是从笔记本直至服务器的全场景, 这种统一架构设计能够简化软件开发, 使得同一套代码在不同硬件上得以运行, 进而减少企业适配工作量。
480GB大内存如何应对AI推理挑战
此卡配置了高达480GB的HBM内存, 这可比当下主流AI推理卡的内存容量远远超出。大内存能使模型参数完整地驻留着, 防止频繁地从硬盘去加载数据, 进而极大地降低推理滞后时间。比如说, 在运行有着1750亿参数的GPT – 3模型之际, 480GB容量足够把整个模型以及其中间的数据包容下。英特尔的产品经理透露了, 这样的设计对准了大规模语言模型以及推荐系统的实时推理需求。

350W功耗下的每瓦性能竞赛
英特尔对能耗比有着极致追求, 从而设计出整卡350W功耗的产品。英伟达旗舰AI卡功耗在400W以上, 与之相比, 英特尔把功耗压缩了12%以上, 并且将性能目标定位为每瓦Token数领先。数据中心运营商对电费较为敏感, 故低功耗意味着能有更低的运营成本以及更好的散热效率。英特尔宣称, 在主流推理工作负载状态下, 该卡的Token/W指标会超过现有产品20%。
目标客户:云服务商和AI企业
这款GPU的主要目标客户是云服务商, 这款GPU的主要目标客户是AI企业, 他们所需求的是低功耗的推理硬件, 他们所需求的是高吞吐的推理硬件, 他们所需求的是易部署的推理硬件, 而并非训练卡, 英特尔构建PCIe AIC标准设计, 英特尔构建的这种设计便利客户直接插入现有服务器, 英特尔构建的这种设计即便不更改机架结构也能操作, 另外, 装有480GB内存, 另外, 拥有开源生态, 其降低了模型迁移门槛, 其让客户能够快速从测试迈向生产环境。
你认为英特尔现下这款GPU, 在步入AI推理市场之后, 能够追赶上英伟达吗, 欢迎于评论区分享出你的看法, 点赞并且转发送给关注硬件方面的朋友!