好意思东时间1月13日周一,据《The Information》报谈,最新一代东谈主工智能芯片Blackwell在部署至数据中心时碰到了技艺问题,主要包括做事器机架过热和芯片畅达特别。
这些问题对数据中心的部署程度变成紧闭,英伟达多家客户(包括、亚马逊旗下AWS、谷歌、Meta)最近砍掉了部分Blackwell GB200机架的订单。
因蔓延请托,微软蓝本贪图安设大王人GB200的凤凰城数据中心现时也曾装满了H200芯片。有音信东谈主士显现,如若英伟达无法惩办这些问题,其性能可能会低于公司开心的水平。
音信公布后,英伟达好意思股早盘一度跌超4.7%。
主要客户削减订单,寻求替代决策
Blackwell芯片以其非凡性能和高能效广受期待。与上一代产物Hopper比较,Blackwell的动力后果扶助了四倍,诱惑了微软、、谷歌和Meta等科技巨头。每家公司为此下达了价值逾100亿好意思元的订单。
然则,将多个高功耗芯片集成到一个做事器机架中比预期更具挑战。每个Blackwell机架比家用雪柜还高,分量接近一辆本田念念域汽车。由于测度打算密度极高,机架必须禁受水冷系统,而非传统的风冷系统。关于多数AI设备商和数据中心运营商而言,部署这种特殊机架是全新且复杂的任务。此外,并非所特殊据中心王人能满足这些机架的环境需求,客户必须重新贪图部署决策。
因过热和畅达问题,部分客户削减了Blackwell GB200机架的订单。举例,有客户遴荐恭候可能在本年下半年推出的改动版块,另一些则贪图采购英伟达的旧款AI芯片看成替代决策。固然英伟达保举整机架决策,但部分客户可能改为单独购买Blackwell芯片以便自行拼装。
尽管面对挑战,英伟达仍有契机支持方位。如若能够实时惩办这些技艺问题,客户能够会重新加多订单。此外,尽管机架存在问题,Blackwell芯片的性能仍然优于上一代产物,英伟达可能会为问题机架找到其他买家。
英伟达昨年11月曾掂量,新一代AI芯片Blackwell将在本年第一季度为公司带来数十亿好意思元的收入,并助推其全年数据中心芯片收入从475亿好意思元增长至1500亿好意思元。Blackwell芯片的高能效本是诱惑云做事提供商的要道成分,这些供应商但愿在固定动力要求下兑现更高的测度打算后果。
芯片蔓延影响数据中心部署贪图
据知情东谈主士显现,看成OpenAI的做事器提供商,微软原贪图在其凤凰城的一个步调中安设至少包含5万枚Blackwell芯片的GB200机架。然则,由于Blackwell芯片从昨年开动蔓延请托,OpenAI要求微软尽早为其提供上一代英伟达H200芯片。这一变化导致蓝本贪图安设大王人GB200的凤凰城数据中心现时也曾装满了H200芯片。
据知情东谈主士显现,微软现时贪图在本年3月在凤凰城的一个步调中安设包含12000枚Blackwell芯片的GB200机架,这一数目约为启航点贪图的四分之一。另一位与微软调解的东谈主士示意,该公司还贪图在本年晚些时候GB300 Blackwell机架上市时进行采购。
英伟达蓝本贪图在昨年年底开动向客户请托Blackwell机架,但由于芯片联想弱势导致初期蔓延了三个月。尽管英伟达也曾建造了这一问题,但到11月份时,客户开动挂念机架的过热问题。为此,英伟达屡次要求供应商鼎新联想。
然则,问题并未取得完满惩办。据参与机架测试的三位东谈主士显现,客户还发现芯片之间数据传输(即收罗)存在不一致的情况。这些问题可能导致Blackwell机架的建树时间比预期更长,如若英伟达无法惩办这些问题,其性能可能会低于公司开心的水平。