-
訊飛劉慶峰:今天,中國的大模型底座能力到底怎么樣?
推動萬物互聯(lián)時代人機交互革命
我們觀察到GPT-4o的發(fā)布,全世界都在進一步關注語音,其實在去年11月份的時候,Whisper已經(jīng)發(fā)了他們OpenAI的整體語音技術,并把語音做成一個非常重要的方向。最近蘋果的手機大家也看到了語音技術的進步,手機廠商對語音技術進一步產(chǎn)生了更大的關注,而且要用它來改變所有人機交互的方式。
人類社會進入到了萬物智能互聯(lián)的時代,越來越多的設備沒有屏幕,離我們幾米之外,不方便用鍵盤,不方便觸摸。在越來越多的時候,我們需要更自然的人機對話,用戶才能夠得到更好地體驗,更迅速地學習,獲得相關生活中的幫助,我們更需要語音。
星火語音大模型再次升級,會使得萬物互聯(lián)時代下人機交互的革命進一步落得更透,這也是科大訊飛在1999年創(chuàng)業(yè)時就提出來了要實現(xiàn)人機信息溝通的無障礙。過去10年,從深度神經(jīng)網(wǎng)絡出臺之后,科大訊飛一直引領著語音技術的發(fā)展。我們是全世界第一個讓語音識別超過了專業(yè)速記員水平的公司,像這種會議轉寫的情況,機器翻譯超過了99%的大學六級考生,通過了國家翻譯師資格考試;個性化語音合成也給央視的節(jié)目進行配音;我們的多語種技術在2020年代表中國,在美國把訊飛列入實體清單之后,對中國極限施壓的背景下,多語種技術依然保持了全球領先,解決了我們的汽車、手機、智能家居等出?!翱ú弊印眴栴}。
我們非常榮幸在幾天前獲得了國家科技進步獎一等獎,這也是中國人工智能領域在深度神經(jīng)網(wǎng)絡之后的第一個國家科技進步獎一等獎,當然也有中國科學技術大學、清華大學、華為、中國移動等合作伙伴共同努力的結果。
技術進一步發(fā)展使得我們在萬物互聯(lián)時代的人機交互標準被重新定義,它應該要實現(xiàn)多語言多方言的交互,在遠距離、高噪音場合下也能夠識別,能夠全雙工隨時隨地可以打斷,可以支持多模態(tài),語音、手勢、嘴型等結合。大家關注的Open AI發(fā)布的GPT-4o中最重要的一個全雙工功能,實際上使用的是科大訊飛2020年就在國際會議上提出來,在去年5月正式發(fā)布的國際標準。
目前,我們的語音識別在最主流的語種上已經(jīng)繼續(xù)保持了全球領先,這是多語種多方言免切換的演示,在相對安靜的手機等各種場景下,還有更極限的場合,例如強干擾情況下“雞尾酒會”的語音識別場景都能進行識別。
伴隨著技術的最新進步,我們也有個專門的訊飛同傳軟硬一體的翻譯系統(tǒng),這個系統(tǒng)戴上去,我在上面講話,你聽到的就是英語,當然我們還有更多語種。同時,這個翻譯系統(tǒng)是軟硬一體化的,我在后臺講話,通過語音識別、翻譯、語音合成,每個人戴著耳機就可以聽到,從而實現(xiàn)大會同傳、展廳同傳以及各種旅游同傳。一個人講話所有人聽,我們還會推出軟硬一體化的設備,讓各種語言混雜在一起可以隨意開會,要把整個軟件和硬件結合在一起,來解決現(xiàn)在社會的剛需。
將來,我們?nèi)粘5臋C器人進入到各種高噪音環(huán)境下,在各種各樣的服務場景下,有這樣的能力,我們就不怕機器聽不懂了。語音識別進入到規(guī)?;褂?,當年我們在手機輸入法上,在全球率先提出手機語音聽寫時代開始到來,它的標志是85%以上的準確率,到89%就可以全面使用了,現(xiàn)在我們的識別中,兩個人混疊場景準確率已經(jīng)到了91%,遠超國際競品,三混疊場景準確率更是完全不一樣,我們準確率已經(jīng)到了85%以上,但其他的只有20%多。在-5dB的高噪場景,噪音已經(jīng)比我們?nèi)酥v話還要高不少的情況下,我們依然能做到90%以上的準確率。
因為這些技術進步,我們從去年底到今年的國際連續(xù)最權威的語音識別比賽,一個是國際多通道語音分離和識別大賽CHiME-7,我們繼續(xù)拿了全球第一;另一個是今年的上半年國際聲學、語音和信號處理會議ICASSP 2024(International Conference on Acoustics, Speech, and Signal Processing)的旗艦賽事——國際車載多通道語音識別挑戰(zhàn)賽(In-Car Multi-Channel Automatic Speech Recognition Challenge,ICMC-ASR) ,科大訊飛是全球第一,這個不是中文的,是英文和多語種的比賽。
今天,我們的語音交互已經(jīng)搭載了5700多萬輛的汽車,去年中國500多萬輛汽車出海,成為中國出海的“新三樣”,其中的多語種智能語音技術幾乎全是科大訊飛提供的。不僅僅是語音,我們還將語音與大模型結合,與紅旗、奇瑞、廣汽合作,包括最近又和一汽簽訂了戰(zhàn)略合作協(xié)議,越來越多的車企開始用我們“能聽會說、能理解會思考”的汽車方案。
- 責任編輯: 沐梵 
-
專稿|任正非說的“鹽堿地”,中國光伏的希望田野
2024-06-28 09:50 -
OpenAI終止對中國提供API服務,周鴻祎發(fā)聲
2024-06-26 13:53 人工智能 -
首次!我國科學家實現(xiàn)獼猴全腦尺度神經(jīng)活動監(jiān)測
2024-06-25 18:20 科技前沿 -
習近平代表黨中央、國務院和中央軍委致電祝賀
2024-06-25 14:50 航空航天 -
專稿|不顧一切的脫鉤:美國國會為何瞄準這家中國企業(yè)
2024-06-25 09:54 -
2023年度國家科學技術獎勵名單公布
2024-06-24 17:46 -
“NASA和波音早就知道這個問題,但仍發(fā)射了火箭”
2024-06-24 16:23 -
李德仁、薛其坤獲2023國家最高科技獎
2024-06-24 10:32 科技前沿 -
我國科研人員在月壤樣本中首次發(fā)現(xiàn)天然石墨烯
2024-06-24 09:19 嫦娥奔月 -
我國重復使用運載火箭首次10公里級垂直起降飛行試驗成功
2024-06-23 14:58 航空航天 -
純度達99.9%!中國團隊實現(xiàn)海上風電驅動海水制氫
2024-06-23 08:07 觀察者頭條 -
全球首臺!這一重要裝備研制成功
2024-06-22 13:09 中國精造 -
專稿丨鴻蒙與安卓徹底切割,未來勝算幾何?
2024-06-21 19:35 華為 -
“加拿大決定跟,但也怕…”
2024-06-21 18:08 -
中國科學家發(fā)現(xiàn)治療免疫性血小板減少癥突破性新療法
2024-06-21 07:27 -
2024世界人工智能大會7月4日開幕,特色亮點搶先看!
2024-06-20 16:00 2024世界人工智能大會 -
我國首個工業(yè)用途核能供汽項目正式建成投產(chǎn)
2024-06-19 15:17 能源戰(zhàn)略 -
“千里眼”最大“角膜”:相當于把北京五環(huán)內(nèi)地面平整到高低差小于1毫米
2024-06-19 09:10 中國精造 -
全球首臺全高溫超導托卡馬克裝置在上海建成運行
2024-06-19 08:15 -
“美國在核電技術上落后中國10-15年”
2024-06-18 16:42
相關推薦 -
“有個‘壞習慣’,我進工廠戒不掉,孩子也染上” 評論 28美國又下黑手:撤銷三星、SK海力士在華工廠豁免 評論 201外媒又炒作中國赴烏維和部隊,白宮回應 評論 181白忙活了?“特朗普大發(fā)雷霆,怒噴烏歐不切實際” 評論 142“收獲季到了,美國大豆卻又遭‘當頭一棒’” 評論 73最新聞 Hot
-
“有個‘壞習慣’,我進工廠戒不掉,孩子也染上”
-
“股王爭奪戰(zhàn)”后,貴州茅臺發(fā)布兩公告
-
沙利文都麻了:4年白干,當初拉來遏華的盟友現(xiàn)在罵美國是“馬桶”
-
馬克龍拱火:要是這樣,特朗普就又被普京“玩”了
-
美國上訴法院裁定關稅非法,特朗普:你們在摧毀美國
-
英國“準備好介入臺?!??英防相否認
-
外媒又炒作中國赴烏維和部隊,白宮回應
-
美國又下黑手:撤銷三星、SK海力士在華工廠豁免
-
美歐持續(xù)重壓,最后一刻西班牙“毀約”
-
對華問題,普京最新表態(tài)
-
投訴“魯迅夾煙墻畫”當事人,道歉了
-
民生銀行半年報:凈利潤下降4.87%、資產(chǎn)總額下降0.59%
-
光大銀行半年報:營收下降5.57%,但凈利潤增長0.55%
-
俄方:普京與金正恩會晤正在醞釀中
-
“意在制衡中國”,中方警告美日
-
鳩山將出席九三閱兵,日本政府回應
-