-
從DS這串“亂碼”到寒武紀(jì)爆發(fā),更大驚喜是……
DeepSeek V3.1提及的UE8M0 FP8引爆了輿論,但我們也要清醒看到,其意義并非在于技術(shù)上的原創(chuàng)性突破,而是標(biāo)志著國產(chǎn)AI產(chǎn)業(yè)鏈協(xié)同邁入新階段。它的核心意圖在于串聯(lián)起芯片廠商適配、大模型工具鏈優(yōu)化,打破“單點(diǎn)創(chuàng)新”困局。盡管國產(chǎn)算力仍有短板,但上下游企業(yè)從協(xié)同設(shè)計(jì)到生態(tài)聯(lián)盟的探索,正以“1+1>2”的合力,為中國AI全產(chǎn)業(yè)鏈突圍筑牢根基。
最近一周,半導(dǎo)體成為A股表現(xiàn)最強(qiáng)的板塊。上半年利潤僅10億的寒武紀(jì),以超過6000億的市值躍居科創(chuàng)板首位,滾動(dòng)市盈率高達(dá)500余倍,股價(jià)也一度超過茅臺(tái)成為A股“股王”。
引爆市場情緒的,是上周DeepSeek V3.1的發(fā)布——準(zhǔn)確來說,甚至不是這款模型的能力本身,而是短短不到20個(gè)字的一則官方留言:“UE8M0 FP8是針對(duì)即將發(fā)布的下一代國產(chǎn)芯片設(shè)計(jì)?!?
UE8M0 FP8,立即成了國產(chǎn)AI技術(shù)突破的最新代名詞。
在一周高漲的情緒之后,今天的市場出現(xiàn)正?;芈洹6c之相伴的,是中芯國際冷暖參半的半年報(bào)——上半年?duì)I收增長22%,Q2產(chǎn)能利用率高達(dá)92.5%,中國區(qū)收入占比提升至84.2%;但單看二季度,凈利潤和毛利潤都出現(xiàn)下滑。
事實(shí)上,如果把DeepSeek、寒武紀(jì)、中芯國際們近期的一系列信息串聯(lián)起來,我們在欣喜于其進(jìn)步之余,也能夠看到國產(chǎn)AI生態(tài)仍受到嚴(yán)重限制,距離世界先進(jìn)水平仍有差距。
但更大的驚喜在于,中國產(chǎn)業(yè)鏈的協(xié)同程度正在迅速提升。
DeepSeek到底干了什么
UE8M0 FP8,這串如同亂碼一般的字符,究竟有什么魔力?
我們不妨先從FP8說起。
FP8是一種8位浮點(diǎn)數(shù),其基本原理是用較少的字符來表示更復(fù)雜的數(shù)字,這對(duì)于使用二進(jìn)制語言的計(jì)算機(jī)來說是非常重要的。
這是因?yàn)椋M(jìn)制數(shù)字只有0和1兩個(gè)字符,一個(gè)較短的十進(jìn)制數(shù)字,寫成二進(jìn)制可能會(huì)變得很長。舉個(gè)例子,一個(gè)隨機(jī)的十進(jìn)制數(shù)字56.89,如果直接轉(zhuǎn)化計(jì)算機(jī)使用的二進(jìn)制數(shù)字,是111000.11100011,字符非常多,也就意味著會(huì)占用更多存儲(chǔ)空間。
那么為了節(jié)省字符,人們發(fā)明了浮點(diǎn)數(shù)。
具體來說,所謂浮點(diǎn)數(shù),是指一種特殊的數(shù)字表示格式,其基本格式是把數(shù)字a寫成m×b^e的形式。
例如,上述的111000.11100011,可以寫成1.1100011100011×2?。如果我們愿意損失一定的精度,規(guī)定小數(shù)點(diǎn)后只保留3位,就約等于1.110×2?。這樣一來,只需要記錄下小數(shù)點(diǎn)后的110和5次冪這兩個(gè)信息,就能還原出原來的數(shù)字了,存儲(chǔ)空間占用量大大減少。
FP8就是這樣一種記錄方式,規(guī)定用8位二進(jìn)制數(shù)來記錄上述信息。例如拿出4位數(shù)記錄冪值,另外3位數(shù)來記錄110,剩下1位數(shù)記錄正負(fù)。這種格式叫做E4M3 FP8。
但是這里面仍然有個(gè)問題:當(dāng)數(shù)字比較大時(shí),冪值會(huì)變大,而4位二進(jìn)制數(shù)最大僅相當(dāng)于十進(jìn)制的15,更大冪值就無法記錄。E4M3 FP8最大就只能記錄十進(jìn)制-480到+480之間的數(shù)字。
想要表示更大數(shù)字,就要增加用于記錄冪值的字符,減少記錄前面數(shù)字的字符,但這會(huì)導(dǎo)致精確度繼續(xù)變差。
而UE8M0 FP8,就意味著把全部8位數(shù)字都用來記錄冪值,而完全舍棄小數(shù)點(diǎn)后的信息,以及正負(fù)值。
換句話說,UE8M0 FP8只能記錄2,4,8,16……這樣2的整數(shù)次冪,其它數(shù)字都只能近似成這些數(shù)字,極大地犧牲了精度,以換取存儲(chǔ)范圍。
理解了這一點(diǎn),我們就可以來討論DeepSeek為什么要使用UE8M0 FP8。
大模型的基本原理,是把文字、圖像等信息,全部用數(shù)字來表示,并預(yù)測哪些數(shù)字的相關(guān)性更高。
這些數(shù)字,就是人們常說的參數(shù),而參數(shù)自然是范圍越大、越精確越好。
想要范圍和精度兩者兼得,就需要用更多的二進(jìn)制字符來記錄。因此,過去很多大模型會(huì)使用FP16、FP32等格式,這意味著更大的存儲(chǔ)量和算力消耗。
而DeepSeek V3和R1這樣的模型,之所以能夠降低算力成本,就是因?yàn)槭褂昧薋P8,以犧牲精度來換取速度。
但是,這種犧牲真的不可避免嗎?這就要說到UE8M0了。
事實(shí)上,DeepSeek并非所有數(shù)據(jù)都使用UE8M0格式。如前所述,UE8M0的極端取舍,導(dǎo)致精度極差,是難以滿足大模型訓(xùn)練需求的。
DeepSeek所做的,是引入U(xiǎn)E8M0作為“縮放因子”,使用了microscaling的方法。簡單理解,其參數(shù)仍然以E4M3 FP8等格式存儲(chǔ),以保證精度,并通過與另一個(gè)UE8M0 FP8數(shù)字相乘的方式,實(shí)現(xiàn)類似FP32的效果,并節(jié)省75%的存儲(chǔ)需求。
這種做法盡管增加了算法的復(fù)雜程度,但是僅僅在必要時(shí)才去做計(jì)算,仍然能夠大大節(jié)省算力和通信帶寬需求。
這對(duì)于算力受到嚴(yán)重限制的國內(nèi)大模型行業(yè)來說,自然是極為契合的思路。
國產(chǎn)芯片“補(bǔ)課”
但是,我們也無需過度拔高DeepSeek V3.1的獨(dú)創(chuàng)程度。
早在2023年,Meta、英特爾、谷歌等科技巨頭推動(dòng)的“開放計(jì)算項(xiàng)目(OCP)”就提出了MXFP8的microscaling數(shù)據(jù)格式標(biāo)準(zhǔn),以UE8M0作為縮放因子,而英偉達(dá)顯卡也早已支持UE8M0。國內(nèi)的阿里、騰訊、百度等頭部大廠,也都參與了這個(gè)項(xiàng)目。
2023年10月,OCP全球峰會(huì)在美國加州圣何塞舉辦
2023年,英偉達(dá)首席科學(xué)家比爾·戴利曾指出,驅(qū)動(dòng)英偉達(dá)芯片性能大幅提升的秘密,已經(jīng)不是芯片制程驅(qū)動(dòng)的“摩爾定律”,而是數(shù)據(jù)格式等因素共同驅(qū)動(dòng)的“黃氏定律”,即通過引入較低精度的數(shù)字表示法,來減少對(duì)存儲(chǔ)空間和計(jì)算資源的消耗,從而可以加快計(jì)算速度和效率。英偉達(dá)H100等顯卡,就已經(jīng)開始支持FP8格式。
如果把目光放到學(xué)術(shù)界,英偉達(dá)和加州理工的研究人員更是在2021年時(shí)就曾經(jīng)發(fā)表過一篇論文《LNS-Madam:在對(duì)數(shù)數(shù)值系統(tǒng)中采用乘法式權(quán)重更新的低精度訓(xùn)練》,提出了類似的數(shù)據(jù)轉(zhuǎn)換方法。
DeepSeek今年2月發(fā)布的高性能計(jì)算庫DeepGEMM中,也使用了UE8M0縮放因子。DeepGEMM正是針對(duì)英偉達(dá)顯卡所做的優(yōu)化,而國產(chǎn)顯卡當(dāng)時(shí)卻普遍并不支持這種格式。
以至于當(dāng)DeepSeek V3和R1問世時(shí),國產(chǎn)顯卡需要借助軟件優(yōu)化將FP8格式轉(zhuǎn)化成FP16,適配效果大打折扣。
因此,DeepSeek此次透露的信息,或許重點(diǎn)并不在前半部分的UE8M0,而是后半部分的“針對(duì)下一代國產(chǎn)芯片設(shè)計(jì)”。
近期,摩爾線程、芯原等國產(chǎn)芯片廠商也同步釋放了適配UE8M0 FP8的消息。
摩爾線程對(duì)觀察者網(wǎng)指出,其旗艦產(chǎn)品MTT S5000是國內(nèi)首批原生支持FP8并已大規(guī)模量產(chǎn)的GPU。摩爾線程的MUSA架構(gòu)原生支持硬件FP8張量加速計(jì)算,能夠完美支持UE8M0 FP8 Scale,利用硬件原生FP8,相對(duì)于傳統(tǒng)的FP16計(jì)算能夠?qū)崿F(xiàn)兩倍的浮點(diǎn)算力提升、訪存和通信帶寬效率提升和存儲(chǔ)容量利用率提升,同時(shí)最優(yōu)化張量表達(dá)精度。
摩爾線程在WAIC 2025上發(fā)布了MTT S5000
但需要注意的是,盡管國產(chǎn)芯片逐步開始支持FP8格式,由于不同品牌顯卡在底層硬件架構(gòu)上的差異,原本針對(duì)英偉達(dá)顯卡設(shè)計(jì)的算法也并非可以直接移植到國產(chǎn)芯片上。因此,大模型針對(duì)國產(chǎn)芯片的適配調(diào)整仍是一項(xiàng)重要工作。
“補(bǔ)課”,或許才是對(duì)現(xiàn)階段工作更合適的表述。
這或許也解釋了為什么DeepSeek R2延宕許久尚未問世。
因此,DeepSeek V3.1真正的意義,應(yīng)該不是對(duì)UE8M0 FP8這種數(shù)據(jù)格式本身的應(yīng)用,而是類似于DeepGEMM這樣針對(duì)國產(chǎn)芯片的工具鏈設(shè)計(jì)。
而且,DeepSeek特意提到是針對(duì)“下一代國產(chǎn)芯片”,這意味著國產(chǎn)大模型廠商與芯片廠商之間的協(xié)同配合達(dá)到了更高的層次,雙方可以在硬件開發(fā)階段就共同參與優(yōu)化。
摩爾線程對(duì)觀察者網(wǎng)表示,此舉能夠充分發(fā)揮出已量產(chǎn)的國產(chǎn)芯片架構(gòu)特性,通過國產(chǎn)大模型和國產(chǎn)芯片協(xié)同設(shè)計(jì)優(yōu)化,實(shí)現(xiàn)1+1>2。
生態(tài)協(xié)同新高度
事實(shí)上,談到國產(chǎn)大模型與芯片的協(xié)同開發(fā),DeepSeek也不是唯一的參與者。
一方面,頭部大廠往往已經(jīng)通過自建生態(tài)的方式,早早布局軟硬件協(xié)同,如華為昇騰、阿里平頭哥、百度昆侖芯等。
本周,百度發(fā)布了百舸AI計(jì)算平臺(tái)5.0,基于昆侖芯實(shí)現(xiàn)超節(jié)點(diǎn),并針對(duì)DeepSeek引領(lǐng)的強(qiáng)化學(xué)習(xí)風(fēng)潮,推出強(qiáng)化學(xué)習(xí)框架,極致壓榨算力資源。
2025百度云智大會(huì)上,百度智能云正式發(fā)布百度百舸AI計(jì)算平臺(tái)5.0全新版本。
而更多的大模型初創(chuàng)公司,則通過與芯片廠商聯(lián)合的方式來提升適配效率。
今年7月,階躍星辰聯(lián)合近10家芯片及基礎(chǔ)設(shè)施廠商發(fā)起“模芯生態(tài)創(chuàng)新聯(lián)盟”,首批成員包括華為昇騰、沐曦、壁仞科技、燧原科技、天數(shù)智芯、無問芯穹、寒武紀(jì)、摩爾線程、硅基流動(dòng)等。
階躍星辰聯(lián)合創(chuàng)始人、副總裁朱亦博對(duì)觀察者網(wǎng)指出,一款芯片的開發(fā)周期需要兩年以上,而如今模型迭代的速度只有半年到一年,如果讓芯片廠商去適配模型,必然是低效的。如今,階躍星辰希望在國產(chǎn)芯片的開發(fā)階段,就主動(dòng)去進(jìn)行適配,是一種更高效的方式。
但我們也要清醒地看到,國產(chǎn)算力生態(tài)仍然處于一種“帶著鐐銬跳舞”的狀態(tài)。
從中芯國際的財(cái)報(bào)可以看到,盡管國內(nèi)旺盛的需求推動(dòng)其產(chǎn)能利用率不斷攀升,并且還有大規(guī)模擴(kuò)產(chǎn)計(jì)劃,但是其主要業(yè)務(wù)仍來自成熟制程。因此,其業(yè)績并如臺(tái)積電那樣未充分受益于當(dāng)下的算力熱潮。
包括制程能力、HBM技術(shù)等限制,也讓國產(chǎn)AI產(chǎn)業(yè)往往采用極限創(chuàng)新的方式,在硬件受限的情況下用更高的成本、更復(fù)雜的算法來壓榨效率。
例如,華為不得不使用384個(gè)超多節(jié)點(diǎn)、昂貴的光通信等方式來對(duì)標(biāo)英偉達(dá)的NVLink72。其AI推理加速“黑科技”UCM,也是在HBM受限的情況下,主要針對(duì)“節(jié)流”進(jìn)行的創(chuàng)新;而原理類似的英偉達(dá)Dynamo,則更多聚焦于發(fā)揮高端算力集群的能力。
近期華為盤古大模型遭遇的爭議和收縮,也顯示出中國企業(yè)尚難以憑借單打獨(dú)斗去全方位贏得全球AI競爭。以開放和協(xié)同的方式匯聚國內(nèi)全部力量,才是更好的突圍之道。
因此,近期國產(chǎn)AI產(chǎn)業(yè)一系列突破固然令人欣喜,但仍然要看到,其真正意義并非在于單點(diǎn)的進(jìn)步,而是在于產(chǎn)業(yè)鏈上下游的信任和協(xié)作達(dá)到了一個(gè)新的高度,為未來中國全產(chǎn)業(yè)鏈的領(lǐng)先打下堅(jiān)實(shí)基礎(chǔ)。
本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個(gè)人觀點(diǎn),不代表平臺(tái)觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
標(biāo)簽 deepseek- 原標(biāo)題:從DS這串“亂碼”到寒武紀(jì)爆發(fā),更大驚喜是…… 本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯: 萬肇生 
-
“人工智能+”的試卷,AI釘釘搶答
2025-08-30 19:22 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
華為徐直軍:感謝騰訊、字節(jié)、阿里等對(duì)鴻蒙生態(tài)的支持
2025-08-30 17:20 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
阿里美股漲超12%,外賣大戰(zhàn)“期中考”放榜
2025-08-30 12:37 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
-
凈利潤同比增長500倍!“好想來”的“神話”還能說多久?
2025-08-30 10:36 財(cái)務(wù)紅綠燈 -
營收利潤雙降,卓越商企服務(wù)2025年上半年業(yè)績承壓
2025-08-30 10:34 觀網(wǎng)財(cái)經(jīng)-房產(chǎn) -
茶百道:半年門店僅增59家,業(yè)績修復(fù)可持續(xù)嗎?
2025-08-29 22:37 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
霸王茶姬Q2:海外門店208家,凈增52家
2025-08-29 22:27 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
奈雪的茶上半年收入下滑超14%,關(guān)店160家仍難扭虧
2025-08-29 19:57 觀茶咖 -
Apple Store 官方旗艦店正式入駐抖音商城
2025-08-29 19:55 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
華為凈利潤下滑,需要過度擔(dān)憂嗎?
2025-08-29 19:23 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
多國售罄!迷你版Labubu再次成為跨境電商熱詞
2025-08-29 18:13 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
盒馬NB升級(jí)成“超盒算NB”,門店數(shù)已近300家
2025-08-29 18:13 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
收購加拿大鵝?波司登否認(rèn),已有“小剪刀”
2025-08-29 17:12 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
A股三大指數(shù)集體上漲,鋰電池、軍工發(fā)力
2025-08-29 15:39 金融觀察 -
-
國產(chǎn)替代加速,良信股份“兩智一新”成果顯現(xiàn)
2025-08-29 14:54 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
上半年凈賺6.7億元的毛戈平,股價(jià)卻跌了近3成
2025-08-29 13:07 財(cái)務(wù)紅綠燈 -
海瀾之家2025年上半年?duì)I收115億,扣非凈利同比增長3.83%
2025-08-29 13:05 觀網(wǎng)財(cái)經(jīng)-消費(fèi)
相關(guān)推薦 -
從DS這串“亂碼”到寒武紀(jì)爆發(fā),更大驚喜是…… 評(píng)論 7“干涉內(nèi)政!”日本忍不了了,最后一刻取消訪美 評(píng)論 85“有個(gè)‘壞習(xí)慣’,我進(jìn)工廠戒不掉,孩子也染上” 評(píng)論 74美國又下黑手:撤銷三星、SK海力士在華工廠豁免 評(píng)論 206外媒又炒作中國赴烏維和部隊(duì),白宮回應(yīng) 評(píng)論 188最新聞 Hot
-
行程披露!“普京在華停留如此之久,實(shí)屬罕見”
-
“干涉內(nèi)政!”日本忍不了了,最后一刻取消訪美
-
烏克蘭前議長遭槍殺,澤連斯基發(fā)聲
-
“印度不會(huì)屈服”
-
泰國任命代總理
-
孫女士被封號(hào),微博回應(yīng)
-
“有個(gè)‘壞習(xí)慣’,我進(jìn)工廠戒不掉,孩子也染上”
-
“股王爭奪戰(zhàn)”后,貴州茅臺(tái)發(fā)布兩公告
-
沙利文都麻了:4年白干,當(dāng)初拉來遏華的盟友現(xiàn)在罵美國是“馬桶”
-
馬克龍拱火:要是這樣,特朗普就又被普京“玩”了
-
美國上訴法院裁定關(guān)稅非法,特朗普:你們在摧毀美國
-
英國“準(zhǔn)備好介入臺(tái)海”?英防相否認(rèn)
-
外媒又炒作中國赴烏維和部隊(duì),白宮回應(yīng)
-
美國又下黑手:撤銷三星、SK海力士在華工廠豁免
-
美歐持續(xù)重壓,最后一刻西班牙“毀約”
-
對(duì)華問題,普京最新表態(tài)
-