Meta向谷歌申请算力超供,多项AI项目进度受阻被迫延期
多项内部人工智能项目进度受阻、被迫延期。因对谷歌大模型的需求规模格外庞大,受冲击最为严重。尽管各大科技企业持续投入数十亿美元采购芯片、建设数据中心,却仍难以获取充足算力,以匹配市场持续增长的人工智能服务需求。皮查伊表示,算力供给瓶颈制约了云业务实现更高增速,同时令云部门积压订单量环比近乎翻倍。
谷歌算力告急 Meta首当其冲
2024年3月, 谷歌母公司Alphabet正式向Meta告知, 无法满足它那庞大的算力需求。这消息源自英国《金融时报》的报道, 揭示出全球科技巨头在人工智能算力争夺战里的激烈竞争行为。Meta身为谷歌云的大客户, 其内部多项人工智能项目直接停止运转, 进度致使被迫延期。
谷歌的云计算服务, 在Meta开发人工智能大模型时, 使Meta处于极度依赖状态。这种依赖关系的形成, 是因为Meta自身算力储备不足, 所以不得不向外部寻求帮助。因算力存在缺口, 致使Meta在模型训练以及推理优化等关键环节受到阻碍, 多个原计划在2024年第二季度上线的新功能, 被无限期推迟了。
巨额投资仍不够用
即便众多大型科技企业不间断投入高达数十亿美元用于采购芯片以及建设数据中心, 然而算力的供给始终难以跟得上需求。截止到2024年3月所在的那个一季度, 谷歌云的营收达成了200亿美元, 换算成人民币大约是1362亿元。不过谷歌CEO桑达尔·皮查伊坦率表示, 算力方面存在的瓶颈对云业务达成更进一步增长速度形成了限制。

谷歌并非未曾使劲, 他们于全球布置了数十枚数据中心, 购进了数百万片NVIDIA的H100显卡。然而这些投入依旧没法契合全域客户的需求。算力供应欠缺已然成为整个行业的普遍病症, 并不仅仅是谷歌一家面临的问题。
Meta员工被迫省着用
据报道呈现, Meta已向员工提出要求, 要节约使用AI词元。词元乃是用于衡量人工智能服务消耗量的一种基础计量单位, 而且每个词元都代表着一次模型调用, 或者代表着一次计算运算。这样的一种内部节约措施, 充分反映出了Meta算力紧张所达到的严重程度。
据Meta内部员工透露, 他们每日都得监控词元使用量, 一旦超额使用, 账户会被自动锁定。部分团队甚至被要求把模型训练时间安排在夜间或者周末, 借此错峰使用算力资源。这种限制对研发效率产生了直接影响。
其他客户也遭波及
受谷歌波及的, 还有其他多家云客户, 只是影响程度相对较轻。Meta因对谷歌大模型需求规模极为庞大, 所以成为受冲击最为严重的企业。谷歌的算力分配机制将保障首先抛向小型客户以及自有业务。
有一位曾在谷歌云部门工作过的员工讲, 公司里头存在着一套繁杂的算力分配算法, 该算法会依据客户过往的使用量、合同涉及的金额、项目方面的紧急程度等诸多因素来进行动态调整。像Meta这样的新客户, 它的合同金额尽管很大可是其历史使用量并未达要求, 所以在优先级方面反倒比较低。
算力缺口暴露行业痛点
这一场算力方面的危机, 暴露出了人工智能这个行业的深层次问题,算力基础设施建设的速度, 远远落后于需求增长的速度。谷歌、微软、亚马逊等这些云服务商, 都在疯狂地进行数据中心的建设, 然而芯片供应链、电力供应、冷却系统等这些环节, 都存在着瓶颈。
行业分析师表明, 一个典型的大型语言模型开展训练,要数千块高端GPU持续运行好多周, 所消耗的电力等同于一个小型城市家庭的用电。这般夸张的资源消耗, 使得便是财力雄厚的科技巨头都会觉得吃力。
未来趋势不容乐观
皮查伊宣称, 算力提供方面的瓶颈致使云部门积压的订单数量, 相较于上一时期的环比数值, 几乎达到了翻倍的状态, 这暗示着众多客户对于算力的需求没办法得到满足, 订单只能处于排队等候的状况, 谷歌预估该积压问题起码得历经12至18个月才可以得到缓和。
对Meta来讲, 短期内的解决办法仅存在两条途径, 其一为加快自行构建算力中心, 其二是转而投向其他云服务提供商或者开展自研芯片, 可不管选取哪一条途径, 均需数额巨大的资金以及耗时漫长的技术积累。
读完这则报道之后, 你认为在算力匮乏的整体环境之中, Meta是不是会被逼迫着舍弃一些人工智能项目, 欢迎于评论区域分享你的见解, 对更多关注科技领域的友人点赞并转发!