首页 > 科技快讯 > 华为昇腾 384 卡掀桌!国产算力撕破英伟达垄断 这局必须赢!

华为昇腾 384 卡掀桌!国产算力撕破英伟达垄断 这局必须赢!

最近AI圈最热闹的事儿,不是谁家大模型又多聪明了,而是一群国产芯片厂商扛着“超级服务器”满场跑——华为昇腾的384张卡超节点像个“钢铁巨兽”占了展台C位,沐曦的64张卡超节点旁边围满了拍照的,摩尔线程的技术人员扯着嗓子喊“我们这能搭万卡集群”。要知道,半年前大家还在愁“万张卡够不够用”,现在直接卷到“十万张卡怎么连”。为啥?因为AI算力这东西,现在比夏天的空调还刚需,而全球能上桌打牌的,以前基本只有英伟达一家。现在国产厂商揣着“超节点”这张新牌,终于敢拍桌子:“洗牌!这把我们也得坐庄!”

一、超节点:给AI大模型建“超级厨房”,少了它连锅都端不起来

先得说清楚,“超节点”这玩意儿到底是个啥?要是用专家的话说,得扯“高速互联网络”“低时延总线”“集群算力调度”,听着就头大。咱用大白话讲:你家厨房要是只有一个电磁炉,煮碗面还行,想同时炒十个菜、蒸馒头、烤蛋糕,根本忙不过来。AI大模型现在就是个“超级吃货”——训练一个千亿参数的模型,得喂进去几百万亿次计算,普通服务器那点算力,跟拿勺子给大象喂水没啥区别。

超节点干的就是“建超级厨房”的活儿:把几十张、上百张算力卡(相当于小电磁炉)用特殊的“高速水管”(互联技术)连起来,变成一个能同时干几百个活儿的“超级灶台”。英伟达最早玩这手,搞出个NVL72超节点,把72张最新的Blackwell 200 GPU连一起,算力直接干到几百PFlops(每秒几亿亿次计算),成了全球十万卡算力中心的标配。

为啥国产厂商现在疯了似的搞超节点?因为“万张卡”已经不够看了。去年大家还在喊“万卡是门槛”,寒武纪、昆仑芯这些厂商天天发公告“我们万卡集群部署成功”。结果今年AI大模型一升级,十万卡才勉强够一个大厂玩——比如训练个GPT-5级别的模型,没十万张高端卡,根本连门都摸不着。而十万卡的市场,以前基本是英伟达的“自留地”,国产厂商连个摊位都没有。

现在华为昇腾384超节点跳出来说“我们单集群算力300 PFlops,跟英伟达NVL72差不多”,这就有意思了。相当于以前人家用大碗吃饭,咱用小碗,现在终于端上了一样大的碗。更关键的是,这碗还能拼——华为说这超节点能支持建“万张卡、十万张卡的数据中心”,等于告诉国央企、运营商这些“大户”:“以后不用只盯着英伟达了,咱自家也能搭起这么大的灶台。”

二、从“凑数”到“叫板”:国产厂商的超节点军备竞赛

华为昇腾这次算是“炸场”了,但不是孤军奋战。整个WAIC逛下来,你会发现国产芯片厂商几乎人手一个“超节点”招牌,活像小学生期末考试后扎堆晒成绩单。

沐曦直接把超节点和“机柜”摆到了一起:64张曦云C550 GPU连起来的耀龙S8000 G2超节点,旁边还有个叫“Shang Hai Cube”的高密度机柜,塞了128张卡。展台小哥拍着胸脯说“支持超大算力中心”,虽然卡数比华为少点,但胜在跟硬件厂商联合搞了“一体化方案”——以前可能芯片是自家的,机柜得找别人拼,现在直接“买一送一”,等于给客户省了“拼乐高”的功夫。

摩尔线程更会讲故事,CEO张建中把超节点集群叫“AI Foundry”,说建这玩意儿难度堪比芯片厂。他们的KUAE夸娥集群系统,不光说能搭万卡集群,还特意强调“适配DeepSeek、通义千问这些主流大模型”。这就戳中了客户的痛点:以前国产芯片常被吐槽“硬件还行,软件拉胯”,模型跑不起来等于白搭。现在直接把“已适配”写在脸上,等于告诉客户“咱这灶台不光火力大,还能炒你家常用的菜”。

最猛的是燧原科技,直接甩出“对标英伟达H20”的新芯片L600。要知道H20是英伟达刚解禁的“王牌”,之前被禁了半年,国内厂商眼馋得不行。燧原说自家L600算力“大幅超越H20”,这话听着像放卫星,但展台技术人员偷偷透露:“我们用的是最新的互联协议,卡与卡之间数据跑得比H20还快。”不管真假,这股“叫板”的劲儿,以前国产厂商可少见——以前可能还藏着掖着“我们跟英伟达某款老产品性能差不多”,现在直接敢说“超越最新款”,至少气势上先赢了。

但热闹归热闹,得清醒看:这些超节点大多还停留在“展示”阶段。华为昇腾384超节点虽然能通过华为云订购,但实际落地的十万卡数据中心有几个?沐曦、摩尔线程的万卡集群,真要跑起来稳定性如何?燧原的L600芯片,量产能跟得上吗?就像学生说“我这次模拟考能考90分”,跟真上考场考90分,完全是两码事。

三、“上牌桌”不只是有牌:英伟达的“护城河”到底有多深?

为啥国产厂商憋足了劲儿要搞超节点?因为这是“上牌桌”的门票。但打牌这事儿,光有牌(硬件)不够,还得会打牌(生态),不然手握四个2也能打输。英伟达能垄断十万卡市场,靠的从来不止是GPU性能。

第一层护城河是“软件生态”。就像你买个手机,不光看芯片多强,还得看APP全不全。英伟达的CUDA生态搞了十几年,全球开发者都在用它写AI模型代码,大模型训练框架TensorFlow、PyTorch默认支持英伟达GPU。国产芯片厂商呢?沐曦有MXMAC,燧原有GPGPU软件栈,摩尔线程有MTIA,但都还在“拉新”阶段。有个互联网大厂的AI工程师私下吐槽:“用国产芯片跑模型,光适配环境就得折腾一周,出了bug都找不到人问,不如直接用英伟达省心。”

第二层是“集群经验”。十万张卡连在一起,不是简单“插排多插几个头”就行。得解决“堵车”问题——数据在卡之间传输不能卡壳;“供电”问题——这么多卡一起工作,机房供电散热扛得住吗;“容错”问题——一张卡坏了,整个集群不能崩。英伟达从V100到A100再到Blackwell,搞了十几年超节点,客户案例遍布全球,而国产厂商的万卡集群去年才刚突破,十万卡基本是“纸上谈兵”。就像开车,英伟达是老司机,跑过几百次长途,国产厂商刚拿到驾照,说“我能开长途”,客户敢坐吗?

第三层是“客户信任”。金融、运营商这些大客户买算力,不光看性能,更看“不出事”。英伟达的卡就算贵,至少“稳定不翻车”,国产芯片一旦出问题,耽误了大模型训练,损失可不是小钱。有个国央企的技术负责人直言:“我们现在试点可以用国产芯片,但核心业务还得是英伟达,不是不信任,是输不起。”

所以华为昇腾说“性能接近NVL72”,这话不假,但“接近”不代表“替代”。就像两辆汽车,发动机功率差不多,但一辆有完善的4S店、配件齐全,另一辆刚上市,坏了可能得等厂家寄零件,你选哪个?国产厂商要上牌桌,硬件性能是“敲门砖”,但生态、经验、信任这三道坎,才是真正的“鬼门关”。

四、H20解禁成“照妖镜”:国产厂商是“真崛起”还是“虚胖”?

就在国产厂商秀超节点的节骨眼上,英伟达H20 GPU突然解禁了。这事儿好比大家正憋着劲儿赛跑,突然发现领跑的把速度降下来等你,是机会还是陷阱?

有人觉得是“利空”:H20毕竟是英伟达的新货,性能强、生态成熟,客户会不会又跑去买H20,国产超节点白折腾了?但换个角度看,这反而是面“照妖镜”——以前国产厂商说“我们进步快”,没参照物,现在直接跟H20同台竞技,是骡子是马拉出来遛遛。

燧原敢说L600“超越H20”,就得拿出真本事。比如H20的互联带宽是多少?L600能不能公开测一测?H20跑GPT-4训练要多久?L600能不能拉出来比一比?客户不是傻子,光喊口号没用,得真刀真枪比性能、比成本、比服务。

华为昇腾384超节点更关键。既然说“性能与NVL72相当”,那价格呢?英伟达的超节点服务向来不便宜,要是华为能把价格压下来,同时保证稳定性,国央企这些“不差钱但讲政治”的客户,说不定真会多订几单。毕竟“自主可控”是刚需,以前没得选才买英伟达,现在有了性能差不多的国产货,哪怕贵一点,也可能优先考虑。

更重要的是,H20解禁倒逼国产厂商“不能只卷硬件”。以前可能觉得“只要卡数够多、算力够强就行”,现在发现客户还要“模型跑得顺、服务跟得上”。沐曦联合搞机柜、摩尔线程强调适配模型,本质上都是在补生态短板。就像考试突然加了附加题,以前只考硬件的60分,现在得考软件、服务的100分,虽然难,但能逼大家真正进步。

五、从“追着跑”到“并排跑”:这场竞赛才刚过起跑线

说到底,国产厂商扛着超节点满场跑,不是为了“秀肌肉”,而是真的被逼到了墙角。AI算力需求现在是“指数级暴涨”——去年还在说“万卡够用”,今年某大厂直接下单十万卡;以前训练个百亿参数模型算大事,现在千亿参数模型遍地走。英伟达就算敞开卖H20,也不可能满足所有需求,这就给了国产厂商“插队”的机会。

华为昇腾384超节点的意义,不在于“已经追上英伟达”,而在于“证明国产能做到这个水平”。就像中国高铁刚起步时,国外说“你们造不出高速列车”,结果咱们不仅造出来了,还成了全球标杆。现在超节点就是“算力高铁”,384张卡的互联技术、300 PFlops的算力,这些数字背后是国产芯片从“单点突破”到“系统整合”的跨越——以前可能某块芯片性能不错,但连不成集群等于白搭,现在终于能把一堆芯片拼成“超级引擎”,这才是真正的进步。

其他厂商也一样,沐曦的机柜整合、摩尔线程的生态适配、燧原的直接对标,都是在“补短板”。以前国产芯片行业像个“瘸子”,硬件一条腿长,软件一条腿短,现在终于开始练“两条腿走路”。虽然走得还不稳,但总比以前蹦着走强。

当然,差距依然明显。英伟达的十万卡集群已经跑了好几年,国产厂商还在实验室里调试;CUDA生态有几百万开发者,国产软件栈可能只有几万;客户信任需要时间积累,不是靠一场展会就能扭转。但至少,我们看到了“上牌桌”的希望——以前人家打牌,我们只能在旁边看,现在终于能摸到牌了。

未来几年,这场算力竞赛会更热闹:华为可能会推出更多卡数的超节点,沐曦、摩尔线程会加速生态适配,燧原的L600真产能落地后可能会搅动市场。而英伟达也不会坐以待毙,说不定会放出更强的超节点。但对国产厂商来说,这不是“你死我活”的战争,而是“不进则退”的生存战——AI算力就像工业时代的电力,谁掌握了算力自主权,谁就掌握了未来的话语权。

最后说句实在话:现在吹“国产算力已经超越英伟达”,那是瞎扯;但要说“国产算力永远追不上英伟达”,那也是短视。至少在WAIC的展台上,我们看到了一群敢扛着“超级服务器”跟巨头叫板的中国公司——他们可能还带着青涩,可能还会摔跤,但至少他们站在了赛道上,朝着终点在跑。这场比赛,才刚过起跑线,好戏还在后头呢。

发布于:陕西

相关推荐

华为昇腾 384 卡掀桌!国产算力撕破英伟达垄断 这局必须赢!
算力重回市场中心?华为昇腾引发国产AI算力热潮,概念股盘点!
模型推理推动算力需求百倍增长,国产厂商如何进行AI基建?
华为突破制裁的密码,藏在“384超节点”中
华为将首次展出“算力核弹”真机
华为“算力核弹”炸场WAIC:1台顶1000台电脑,这波“反杀”多狠
共建国产自主AI算力 华为将扩展鲲鹏昇腾朋友圈
英伟达“丢掉”的1000亿,国产平替还能继续赚吗?
华为昇腾“朋友圈”持续扩大,AI算力未来是星辰大海?
面对英伟达的挑战,中国的国产算力地图正在形成

网址: 华为昇腾 384 卡掀桌!国产算力撕破英伟达垄断 这局必须赢! http://m.xishuta.com/newsview139590.html

所属分类:行业热点