新闻资讯

韩国FuriosaAI:AI芯片进展及未来规划,性能功耗超英伟达

更新时间:2026-04-04 19:23

推理芯片产品线的一系列进展。2.2~HBM3E,从内存侧增强推理性能。年初发布。

4月2日,韩国的芯片企业叫Rebellions,它在首届峰会上,放出了重磅数据,这数据跟AI芯片市场有关,这个市场迎来了新变局。该企业的第二代AI推理芯片是RNGD,在特定任务方面,表现得惊人,在相同功耗的情形下,它所能够服务的用户数量,是英伟达RTX PRO 6000的2.2到7.4倍,并且其总拥有成本,仅仅是后者的40%。这样的对比,直接对英伟达在AI推理领域的统治地位,产生了冲击。

RNGD芯片真实跑分对比

由Rebellions官方所提供的数据,进行测试时用的是Qwen3 - 32B模型,其数据精度是FP8。RNGD芯片在相同功耗状况下,能够支撑的并发推理用户数远远超过英伟达的RTX PRO 6000显卡。最低为2.2倍,最高能达到7.4倍,这样的差距在AI推理场景里极为明显。对于那些需要大规模部署AI服务的公司而言,这意味着同样的电费可以服务更多用户。

韩国FuriosaAI:AI芯片进展及未来规划,性能功耗超英伟达

成本方面优势愈发显著,RNGD芯片总拥有成本仅为英伟达产品的百分之四十,总拥有成本涵盖采购价格、运行电费、散热维护等诸多长期开支。以一家部署一千颗芯片的数据中心来讲,选择RNGD相较于英伟达方案,五年时间能节省数千万元运营费用,这对正控制成本的互联网公司以及AI初创企业颇具吸引力。

量产规模翻五倍

在今年1月,Rebellions完成了首批4000颗RNGD芯片的量产,公司计划于2026年把总产能规模提升至20000颗,相较于首批产量增长了五倍,此产能扩张速度展现出公司对市场需求的充足自信,若两万颗芯片全部得以售出,依据行业平均价格进行估算,将会带来数亿美元的收入。

产能有所提升之际,RNGD芯片自身也处于升级进程。在短时间范围之内,RNGD会从最初版本的48GB HBM3内存朝着72GB HBM3E进行升级,HBM3E属于新一代具备更快数据传输速度的高带宽内存。此次升级主要是针对推理性能之中的内存瓶颈状况。对于运行大语言模型而言,更大的显存意味着能够装载有着更大参数的模型,或者是支持更长的上下文窗口。

三代芯片路线图

2028年,Rebellions计划推出第三代芯片,该芯片基于RNGD后续架构,新一代芯片会进一步提升计算性能以及能效比,公司虽未透露具体参数,不过按照行业惯例,通常新一代芯片在算力、内存带宽以及互联速度上会有全面提升,届时RNGDxKc系列将有能力挑战更大规模的AI训练任务。

彼时,Rebellions正筹划一款针对PC与工作站的轻量化芯片,为此芯片取名为RNGD S。该产品预计发布时段为2026年末至2027年初。RNGD S的问世表明AI推理芯片会从数据中心向个人设备延伸。往后用户于自身的台式机或者笔记本上便能够运行百亿参数规模的大模型,而无需通过联网调用云端API。

对英伟达的市场冲击

于AI训练市场可占据绝对优势的英伟达的GPU而言,在推理侧,特别是数据中心推理场景,正面临着越来越多的挑战。RNGD芯片于特定模型以及精度下所展现出的性价比优势,会使得诸多企业重新来评估采购决策。特别是那些主要从事AI推理服务、对成本敏感的公司,诸如AI绘画网站、聊天机器人服务商、推荐系统运营商。

虽然英伟达存在其自身的护城河,然而这便是CUDA软件生态。众多的AI开发框架以及工具链均是以CUDA为基础进行优化的。Rebellions必须要证实自身的软件栈足够成熟,迁移成本足够低。依据现今的信息而言,RNGD芯片兼容主流AI框架,可是在实际迁移过程中或许还需要工程师花费时间予以调优。这是韩国芯片公司亟待尽快补足的短板。

韩国FuriosaAI:AI芯片进展及未来规划,性能功耗超英伟达

数据中心客户的实际选择

于数据中心运营商而言,挑选AI芯片所看重的并非仅仅是峰值算力,更是每瓦性能以及服务质量。RNGD芯片于同等功耗状况下能够服务更多用户,这就意味着机柜密度能够做得更高,每平方米机房的产出则更高。在诸如北上广深这般的一线城市里,数据中心场地与电力配额均极为昂贵,RNGD的优势将会愈发显著。

当下,已有好些韩国本土互联网公司在对RNGD芯片展开测试,要是测试呈现的效果合乎理想,这些公司极有可能于今年下半年着手进行批量采购,Rebellions尚需去拓展海外市场,特别是中国与美国这俩全球规模最为庞大的AI应用市场,对于中国客户而言,除开性能之外,供应链安全以及地缘政治因素同样会对采购决断产生影响。

轻量化芯片的想象空间

RNGD S芯片所瞄准的,是PC以及工作站市场,这可是个全然不同的战场。当下,个人设备运行大模型主要依靠云端,本地运行的话,要么速度迟缓,要么就得配备昂贵的专业显卡。倘若RNGD S能够以合理之价格提供充足的推理性能,那么就能够使AI应用切实脱离网络。举例来说,在飞机上可离线使用AI助手,又或者在公司内部进行私有化部署AI时无需担忧数据外泄。

发布时间被设定于2026年的末尾阶段一直到2027年开始的初始时期,这样的一个时间节点极为关键。在那个时候,下一代的PC处理器以及操作系统都会针对AI具备更为优良的支持。RNGD S要是可以被嵌入到主流品牌打造的主板或者显卡里面,就存在着成为新一代AI PC标准配备元件的可能性。然而这是需要Rebellions同英特尔、AMD、联想、惠普等诸多厂商构建合作关系的,面临的挑战不容小觑。

瞧完这篇剖析,你会思索于公司的AI推理业务里试着应用韩国RNGD芯片,还是持续笃定地力守英伟达的方案呢?欢迎于评论区去分享你的见解,点赞并转发以使更多人知悉AI芯片的最新态势。