-
華為云CEO:384超節(jié)點(diǎn)每卡性能可達(dá)英偉達(dá)H20三倍
-
呂棟lvdong@guancha.cn
最后更新: 2025-08-30 12:35:02(文/觀察者網(wǎng) 呂棟 編輯/張廣凱)
“芯片重不重要?重要。但更重要的是,能夠提供客戶所需要的計(jì)算結(jié)果?!?月28日,在中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式上,華為常務(wù)董事、華為云計(jì)算CEO張平安說(shuō)道。
這是華為云被傳出組織架構(gòu)大調(diào)整后,張平安首次公開(kāi)發(fā)聲。他表示,華為云正在堅(jiān)定不移地造算力黑土地,通過(guò)昇騰AI云服務(wù)和Tokens服務(wù)滿足客戶的“最終計(jì)算結(jié)果”。
在當(dāng)下,大模型發(fā)展對(duì)AI基礎(chǔ)設(shè)施提出了更高要求,未來(lái)十年,算力的需求可能會(huì)有數(shù)萬(wàn)倍的增長(zhǎng)。但是相比英偉達(dá)、AMD等海外廠商,國(guó)產(chǎn)芯片的發(fā)展受到美國(guó)層層圍堵。
在芯片工藝受限的情況下,中國(guó)如何提升算力性能和規(guī)模?張平安表示,華為可以發(fā)揮“大雜燴”的優(yōu)勢(shì)——綜合在光通信、網(wǎng)絡(luò)、供電等多方面的技術(shù),以系統(tǒng)補(bǔ)單點(diǎn),以空間換算力,以帶寬換算力,以能源換算力,通過(guò)云上算力集群,獲得規(guī)模優(yōu)勢(shì)和提升性能。
今年4月,華為云發(fā)布了CloudMatrix384超節(jié)點(diǎn),將384顆昇騰NPU和192顆鯤鵬CPU,通過(guò)全新高速網(wǎng)絡(luò)MatrixLink全對(duì)等互聯(lián),形成一臺(tái)超級(jí)“AI服務(wù)器”,算力規(guī)模達(dá)到300 PFlops。此外,對(duì)于萬(wàn)億、十萬(wàn)億參數(shù)的大模型訓(xùn)練任務(wù),可以通過(guò)橫向擴(kuò)展方式,將432個(gè)超節(jié)點(diǎn)連在一起,組成一個(gè)16萬(wàn)卡的AI集群。如果這個(gè)集群用于訓(xùn)練千億參數(shù)大模型,可以同時(shí)支持1300個(gè)。
在這次大會(huì)上,華為云宣布其Tokens服務(wù)接入CloudMatrix384超節(jié)點(diǎn),通過(guò)xDeepServe架構(gòu)創(chuàng)新,單芯片最高可實(shí)現(xiàn)2400TPS、50msTPOT的高吞吐、低時(shí)延,超過(guò)業(yè)界水平。
觀察者網(wǎng)從現(xiàn)場(chǎng)了解到,xDeepServe是以Transformerless的極致分離架構(gòu),把MoE大模型拆成可獨(dú)立伸縮的Attention、FFN、Exper三個(gè)微模塊,相當(dāng)于在一臺(tái)CloudMatrix384上把“大模型”拆成“積木”,并分派到不同的NPU上同步處理任務(wù)。之后,再用基于內(nèi)存語(yǔ)義的微秒級(jí)XCCL通信庫(kù)與FlowServe自研推理引擎,把它們重新拼成一個(gè)超高吞吐的LLM服務(wù)平臺(tái),即Tokens的“超高速流水線”。通過(guò)xDeepServe不斷調(diào)優(yōu),最終實(shí)現(xiàn)了從非超節(jié)點(diǎn)單卡吞吐600tokens/s至超節(jié)點(diǎn)單卡吞吐2400tokens/s的提升。
“昇騰AI云服務(wù),我們可以稱之為國(guó)產(chǎn)的,我們不在意它是7納米、5納米還是10納米,我們?cè)谝獾氖沁@樣的AI云服務(wù),能夠?yàn)榭蛻籼峁┧懔Ψ?wù),提供Token服務(wù),來(lái)服務(wù)客戶的最終計(jì)算結(jié)果。很高興告訴大家,現(xiàn)在我們超節(jié)點(diǎn)的Token服務(wù),在50ms時(shí)延下,每卡可以生產(chǎn)出2400個(gè)Token,這個(gè)效率是H20的三倍。除盤古外,我們還支持主流的DeepSeek、Kimi等開(kāi)源大模型?!睆埰桨苍诖髸?huì)上表示。
CloudMatrix384超節(jié)點(diǎn)
根據(jù)大會(huì)上的信息,目前華為云正圍繞貴安、烏蘭察布、和林格爾、蕪湖三大核心樞紐,打造“全國(guó)算力一張網(wǎng)”,其中在貴州已部署超40套CloudMatrix384超節(jié)點(diǎn)。相比去年同期,華為云整體算力規(guī)模增長(zhǎng)接近250%,昇騰AI云服務(wù)客戶從從去年的321家增長(zhǎng)到今年1714家,重大事故為零的記錄連續(xù)保持了756天。
與此同時(shí),華為云圍繞智能駕駛領(lǐng)域集中發(fā)布CloudVeo智能駕駛云服務(wù)等解決方案和成果,華為云貴安汽車專區(qū)正式上線,長(zhǎng)安天樞智駕搭載華為云CloudMatrix 384超節(jié)點(diǎn)也同步亮相。
華為云透露,中國(guó)最大的智能駕駛(輔助)企業(yè)引望已經(jīng)跑在昇騰上。多個(gè)項(xiàng)目的實(shí)際測(cè)試結(jié)果顯示,在典型感知模型、E2E、VLA模型上,CloudMatrix 384超節(jié)點(diǎn)可以達(dá)到或者超過(guò)H1002.5-3倍。
就在這次大會(huì)前,華為云組織架構(gòu)調(diào)整引發(fā)諸多關(guān)注。市場(chǎng)傳言稱,華為云多個(gè)部門被裁撤整合。調(diào)整后,華為云將聚焦3+2+1業(yè)務(wù):3包括通算、智算、存儲(chǔ);2包括AI PaaS、數(shù)據(jù)庫(kù);1則主要為安全業(yè)務(wù)。
Canalys數(shù)據(jù)顯示,今年一季度,華為云在中國(guó)大陸云服務(wù)市場(chǎng)中排名第二,占據(jù)18%的份額,與阿里云33%的份額仍有差距。而阿里云AI相關(guān)工作負(fù)載已連續(xù)七個(gè)季度實(shí)現(xiàn)三位數(shù)增長(zhǎng),成為其云業(yè)務(wù)的核心引擎。
在分析人士看來(lái),市場(chǎng)主流需求已從“上云”轉(zhuǎn)向“上AI”,客戶對(duì)AI的旺盛需求正重塑云計(jì)算應(yīng)用方式。華為云此次組織“陣痛”是一次必然的戰(zhàn)略抉擇,就是通過(guò)砍掉協(xié)同效應(yīng)弱、資源消耗大的外圍研發(fā),將所有力量都集中到能最大化“昇騰AI+盤古”組合優(yōu)勢(shì)的核心場(chǎng)景上。
這次大會(huì)上,華為副總裁、中國(guó)云業(yè)務(wù)部部長(zhǎng)陳林也談到組織架構(gòu)調(diào)整一事。他表示,“原因很簡(jiǎn)單,就是聚焦AI飽和投入。當(dāng)前是人工智能應(yīng)用行業(yè)落地的加速期,中國(guó)擁有千行萬(wàn)業(yè)的業(yè)務(wù)場(chǎng)景,各行各業(yè)都在積極的擁抱AI,中國(guó)非常有機(jī)會(huì)在各行業(yè)構(gòu)筑起全球領(lǐng)先的優(yōu)勢(shì)?!?
“我們希望大模型能在昇騰云上跑的更快更好?!睆埰桨惨蔡岬?,在蒸汽機(jī)發(fā)明的時(shí)候,人們?cè)?jīng)嘗試著給三輪車裝上蒸汽機(jī),這讓火車的發(fā)明推遲了四十年,因此,在AI時(shí)代來(lái)臨的時(shí)候,要積極擁抱AI原生思維,用AI原生的思維來(lái)構(gòu)筑AI,圍繞AI重新構(gòu)建應(yīng)用、數(shù)據(jù)、流程、人員。
“今天是硅基輔助人來(lái)干活,AI是工具;未來(lái)AI可能會(huì)成為執(zhí)行任務(wù)的主體,人的任務(wù)就是管理AI,控制AI的開(kāi)關(guān)。對(duì)于希望用AI構(gòu)筑領(lǐng)先優(yōu)勢(shì)的企業(yè)來(lái)說(shuō),只有通過(guò)AI原生思維來(lái)?yè)肀I,才能充分發(fā)揮AI的潛力,提高效率,創(chuàng)新業(yè)務(wù)模式,抓住智能時(shí)代機(jī)遇,實(shí)現(xiàn)智能躍遷?!彼硎?。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 呂棟 
-
凈利潤(rùn)同比增長(zhǎng)500倍!“好想來(lái)”的“神話”還能說(shuō)多久?
2025-08-30 10:36 財(cái)務(wù)紅綠燈 -
-
茶百道:半年門店僅增59家,業(yè)績(jī)修復(fù)可持續(xù)嗎?
2025-08-29 22:37 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
霸王茶姬Q2:海外門店208家,凈增52家
2025-08-29 22:27 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
奈雪的茶上半年收入下滑超14%,關(guān)店160家仍難扭虧
2025-08-29 19:57 觀茶咖 -
Apple Store 官方旗艦店正式入駐抖音商城
2025-08-29 19:55 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
華為凈利潤(rùn)下滑,需要過(guò)度擔(dān)憂嗎?
2025-08-29 19:23 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
多國(guó)售罄!迷你版Labubu再次成為跨境電商熱詞
2025-08-29 18:13 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
盒馬NB升級(jí)成“超盒算NB”,門店數(shù)已近300家
2025-08-29 18:13 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
收購(gòu)加拿大鵝?波司登否認(rèn),已有“小剪刀”
2025-08-29 17:12 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
A股三大指數(shù)集體上漲,鋰電池、軍工發(fā)力
2025-08-29 15:39 金融觀察 -
-
國(guó)產(chǎn)替代加速,良信股份“兩智一新”成果顯現(xiàn)
2025-08-29 14:54 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
上半年凈賺6.7億元的毛戈平,股價(jià)卻跌了近3成
2025-08-29 13:07 財(cái)務(wù)紅綠燈 -
-
中報(bào)業(yè)績(jī)會(huì)直擊|金茂煥新進(jìn)行時(shí)
2025-08-29 13:03 -
安踏半年?duì)I收368億,近乎阿迪耐克大中華區(qū)之和
2025-08-29 13:01 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
相關(guān)推薦 -
-
“有個(gè)‘壞習(xí)慣’,我進(jìn)工廠戒不掉,孩子也染上” 評(píng)論 28美國(guó)又下黑手:撤銷三星、SK海力士在華工廠豁免 評(píng)論 195外媒又炒作中國(guó)赴烏維和部隊(duì),白宮回應(yīng) 評(píng)論 177白忙活了?“特朗普大發(fā)雷霆,怒噴烏歐不切實(shí)際” 評(píng)論 141“收獲季到了,美國(guó)大豆卻又遭‘當(dāng)頭一棒’” 評(píng)論 73最新聞 Hot
-
“有個(gè)‘壞習(xí)慣’,我進(jìn)工廠戒不掉,孩子也染上”
-
“股王爭(zhēng)奪戰(zhàn)”后,貴州茅臺(tái)發(fā)布兩公告
-
沙利文都麻了:4年白干,當(dāng)初拉來(lái)遏華的盟友現(xiàn)在罵美國(guó)是“馬桶”
-
馬克龍拱火:要是這樣,特朗普就又被普京“玩”了
-
美國(guó)上訴法院裁定關(guān)稅非法,特朗普:你們?cè)诖輾绹?guó)
-
英國(guó)“準(zhǔn)備好介入臺(tái)海”?英防相否認(rèn)
-
外媒又炒作中國(guó)赴烏維和部隊(duì),白宮回應(yīng)
-
美國(guó)又下黑手:撤銷三星、SK海力士在華工廠豁免
-
美歐持續(xù)重壓,最后一刻西班牙“毀約”
-
對(duì)華問(wèn)題,普京最新表態(tài)
-
投訴“魯迅夾煙墻畫”當(dāng)事人,道歉了
-
民生銀行半年報(bào):凈利潤(rùn)下降4.87%、資產(chǎn)總額下降0.59%
-
光大銀行半年報(bào):營(yíng)收下降5.57%,但凈利潤(rùn)增長(zhǎng)0.55%
-
俄方:普京與金正恩會(huì)晤正在醞釀中
-
“意在制衡中國(guó)”,中方警告美日
-
鳩山將出席九三閱兵,日本政府回應(yīng)
快訊- 華為徐直軍:感謝騰訊、字節(jié)、阿里等對(duì)鴻蒙生態(tài)的支持
- 習(xí)近平會(huì)見(jiàn)緬甸代總統(tǒng)敏昂萊
- 孫女士被封號(hào),微博回應(yīng)
- 大悅城2025年中期凈利7.48億,現(xiàn)金流增長(zhǎng)超38%
- 稅友股份:重磅發(fā)布行業(yè)首個(gè)Agentic平臺(tái),引領(lǐng)數(shù)智財(cái)稅新未來(lái)
- 習(xí)近平會(huì)見(jiàn)柬埔寨首相洪瑪奈
- “魯迅抽煙墻畫”投訴人貼出景區(qū)回復(fù):禁煙標(biāo)識(shí)已覆蓋景區(qū)
- 習(xí)近平會(huì)見(jiàn)聯(lián)合國(guó)秘書長(zhǎng)古特雷斯
-