英特尔AI推理显卡Crescent Island：480GB内存350W功耗，主打每瓦性能

台北电脑展前夕英特尔亮出AI推理新武器

在2026年6月1日，台北国际电脑展即将拉开帷幕之时, 英特尔特地提前披露了一款针对AI推理工作负载进行优化的数据中心GPU。这款显卡的代号还没有公开, 它主要突出每瓦所具备的性能, 其目标致力于在能耗以及效率方面战胜竞争对手。英特尔有所透露, 该卡会在今年较晚的时候才正式上市, 它配置具备高达480GB的HBM内存, 整卡的功耗被控制在350W以内, 它采用的是PCIe AIC标准设计。

全面支持从FP4到FP64的混合精度计算

这款新的GPU, 其最大的亮点在于能够支持, 从原生的FP4、MXFP4一直到FP64的完整数据类型, 这也就意味着, 它能够灵活地处理不同精度的AI推理任务, 从低精度加速直到高精度计算, 一张卡就能全部搞定, 英特尔宣称, FF4和MXFP4数据类型, 格外适合低延迟、高吞吐的推理场景, 能够显著地提升每瓦性能, 相比较而言, 竞争对手的产品, 往往只是覆盖了FP8到范围FP32 , 英特尔所覆盖的广度, 更为突出。

开源软件生态堆栈成为核心竞争力

英特尔AI推理显卡Crescent Island：480GB内存350W功耗，主打每瓦性能

英特尔着重表明, 这款GPU具备可靠的开源软件生态堆栈, 开发者能够轻易接入常用的AI框架。当下, 该卡已与PyTorch、TensorFlow等主流工具相兼容, 并且支持ONNX Runtime和OpenVINO。英特尔内部所做的测试显示, 开源堆栈的优化使得模型部署时间缩短幅度超过了30%。这种开放性旨在降低企业迁移成本, 借此吸引更多用户从闭源平台转向英特尔生态。

Xe3P架构将横跨四大市场领域

英特尔同时予以确认, 这款GPU采用了全新的“Xe3P”架构, 该架构并非仅用于数据中心, 也会应用于PC、适用于边缘计算、还会作用于工作站这四大领域, 具体而言, Xe3P架构将会被集成到英特尔的“下一代PC”芯片之中, 覆盖范围是从笔记本直至服务器的全场景, 这种统一架构设计能够简化软件开发, 使得同一套代码在不同硬件上得以运行, 进而减少企业适配工作量。

480GB大内存如何应对AI推理挑战

此卡配置了高达480GB的HBM内存, 这可比当下主流AI推理卡的内存容量远远超出。大内存能使模型参数完整地驻留着, 防止频繁地从硬盘去加载数据, 进而极大地降低推理滞后时间。比如说, 在运行有着1750亿参数的GPT – 3模型之际, 480GB容量足够把整个模型以及其中间的数据包容下。英特尔的产品经理透露了, 这样的设计对准了大规模语言模型以及推荐系统的实时推理需求。

英特尔AI推理显卡Crescent Island：480GB内存350W功耗，主打每瓦性能

350W功耗下的每瓦性能竞赛

英特尔对能耗比有着极致追求, 从而设计出整卡350W功耗的产品。英伟达旗舰AI卡功耗在400W以上, 与之相比, 英特尔把功耗压缩了12%以上, 并且将性能目标定位为每瓦Token数领先。数据中心运营商对电费较为敏感, 故低功耗意味着能有更低的运营成本以及更好的散热效率。英特尔宣称, 在主流推理工作负载状态下, 该卡的Token/W指标会超过现有产品20%。

目标客户：云服务商和AI企业

这款GPU的主要目标客户是云服务商, 这款GPU的主要目标客户是AI企业, 他们所需求的是低功耗的推理硬件, 他们所需求的是高吞吐的推理硬件, 他们所需求的是易部署的推理硬件, 而并非训练卡, 英特尔构建PCIe AIC标准设计, 英特尔构建的这种设计便利客户直接插入现有服务器, 英特尔构建的这种设计即便不更改机架结构也能操作, 另外, 装有480GB内存, 另外, 拥有开源生态, 其降低了模型迁移门槛, 其让客户能够快速从测试迈向生产环境。

你认为英特尔现下这款GPU, 在步入AI推理市场之后, 能够追赶上英伟达吗, 欢迎于评论区分享出你的看法, 点赞并且转发送给关注硬件方面的朋友！

台北电脑展前夕英特尔亮出AI推理新武器

全面支持从FP4到FP64的混合精度计算

开源软件生态堆栈成为核心竞争力

Xe3P架构将横跨四大市场领域

480GB大内存如何应对AI推理挑战

350W功耗下的每瓦性能竞赛

目标客户：云服务商和AI企业

Nothing转型AI优先公司 9月推音频穿戴新品

谷歌地球AI改图功能上线一天即下线，因被滥用生成虚假卫星图

AI接管实验室做科研，中国科大实现自主科学发现

欧盟AI新规8月2日生效：聊天机器人须自曝身份，深度伪造内容需标识