-
訊飛劉慶峰:今天,中國的大模型底座能力到底怎么樣?
推動萬物互聯(lián)時代人機交互革命
我們觀察到GPT-4o的發(fā)布,全世界都在進一步關注語音,其實在去年11月份的時候,Whisper已經(jīng)發(fā)了他們OpenAI的整體語音技術,并把語音做成一個非常重要的方向。最近蘋果的手機大家也看到了語音技術的進步,手機廠商對語音技術進一步產(chǎn)生了更大的關注,而且要用它來改變所有人機交互的方式。
人類社會進入到了萬物智能互聯(lián)的時代,越來越多的設備沒有屏幕,離我們幾米之外,不方便用鍵盤,不方便觸摸。在越來越多的時候,我們需要更自然的人機對話,用戶才能夠得到更好地體驗,更迅速地學習,獲得相關生活中的幫助,我們更需要語音。
星火語音大模型再次升級,會使得萬物互聯(lián)時代下人機交互的革命進一步落得更透,這也是科大訊飛在1999年創(chuàng)業(yè)時就提出來了要實現(xiàn)人機信息溝通的無障礙。過去10年,從深度神經(jīng)網(wǎng)絡出臺之后,科大訊飛一直引領著語音技術的發(fā)展。我們是全世界第一個讓語音識別超過了專業(yè)速記員水平的公司,像這種會議轉寫的情況,機器翻譯超過了99%的大學六級考生,通過了國家翻譯師資格考試;個性化語音合成也給央視的節(jié)目進行配音;我們的多語種技術在2020年代表中國,在美國把訊飛列入實體清單之后,對中國極限施壓的背景下,多語種技術依然保持了全球領先,解決了我們的汽車、手機、智能家居等出海“卡脖子”問題。
我們非常榮幸在幾天前獲得了國家科技進步獎一等獎,這也是中國人工智能領域在深度神經(jīng)網(wǎng)絡之后的第一個國家科技進步獎一等獎,當然也有中國科學技術大學、清華大學、華為、中國移動等合作伙伴共同努力的結果。
技術進一步發(fā)展使得我們在萬物互聯(lián)時代的人機交互標準被重新定義,它應該要實現(xiàn)多語言多方言的交互,在遠距離、高噪音場合下也能夠識別,能夠全雙工隨時隨地可以打斷,可以支持多模態(tài),語音、手勢、嘴型等結合。大家關注的Open AI發(fā)布的GPT-4o中最重要的一個全雙工功能,實際上使用的是科大訊飛2020年就在國際會議上提出來,在去年5月正式發(fā)布的國際標準。
目前,我們的語音識別在最主流的語種上已經(jīng)繼續(xù)保持了全球領先,這是多語種多方言免切換的演示,在相對安靜的手機等各種場景下,還有更極限的場合,例如強干擾情況下“雞尾酒會”的語音識別場景都能進行識別。
伴隨著技術的最新進步,我們也有個專門的訊飛同傳軟硬一體的翻譯系統(tǒng),這個系統(tǒng)戴上去,我在上面講話,你聽到的就是英語,當然我們還有更多語種。同時,這個翻譯系統(tǒng)是軟硬一體化的,我在后臺講話,通過語音識別、翻譯、語音合成,每個人戴著耳機就可以聽到,從而實現(xiàn)大會同傳、展廳同傳以及各種旅游同傳。一個人講話所有人聽,我們還會推出軟硬一體化的設備,讓各種語言混雜在一起可以隨意開會,要把整個軟件和硬件結合在一起,來解決現(xiàn)在社會的剛需。
將來,我們日常的機器人進入到各種高噪音環(huán)境下,在各種各樣的服務場景下,有這樣的能力,我們就不怕機器聽不懂了。語音識別進入到規(guī)?;褂?,當年我們在手機輸入法上,在全球率先提出手機語音聽寫時代開始到來,它的標志是85%以上的準確率,到89%就可以全面使用了,現(xiàn)在我們的識別中,兩個人混疊場景準確率已經(jīng)到了91%,遠超國際競品,三混疊場景準確率更是完全不一樣,我們準確率已經(jīng)到了85%以上,但其他的只有20%多。在-5dB的高噪場景,噪音已經(jīng)比我們人講話還要高不少的情況下,我們依然能做到90%以上的準確率。
因為這些技術進步,我們從去年底到今年的國際連續(xù)最權威的語音識別比賽,一個是國際多通道語音分離和識別大賽CHiME-7,我們繼續(xù)拿了全球第一;另一個是今年的上半年國際聲學、語音和信號處理會議ICASSP 2024(International Conference on Acoustics, Speech, and Signal Processing)的旗艦賽事——國際車載多通道語音識別挑戰(zhàn)賽(In-Car Multi-Channel Automatic Speech Recognition Challenge,ICMC-ASR) ,科大訊飛是全球第一,這個不是中文的,是英文和多語種的比賽。
今天,我們的語音交互已經(jīng)搭載了5700多萬輛的汽車,去年中國500多萬輛汽車出海,成為中國出海的“新三樣”,其中的多語種智能語音技術幾乎全是科大訊飛提供的。不僅僅是語音,我們還將語音與大模型結合,與紅旗、奇瑞、廣汽合作,包括最近又和一汽簽訂了戰(zhàn)略合作協(xié)議,越來越多的車企開始用我們“能聽會說、能理解會思考”的汽車方案。
- 責任編輯: 沐梵 
-
專稿|任正非說的“鹽堿地”,中國光伏的希望田野
2024-06-28 09:50 -
OpenAI終止對中國提供API服務,周鴻祎發(fā)聲
2024-06-26 13:53 人工智能 -
首次!我國科學家實現(xiàn)獼猴全腦尺度神經(jīng)活動監(jiān)測
2024-06-25 18:20 科技前沿 -
習近平代表黨中央、國務院和中央軍委致電祝賀
2024-06-25 14:50 航空航天 -
專稿|不顧一切的脫鉤:美國國會為何瞄準這家中國企業(yè)
2024-06-25 09:54 -
2023年度國家科學技術獎勵名單公布
2024-06-24 17:46 -
“NASA和波音早就知道這個問題,但仍發(fā)射了火箭”
2024-06-24 16:23 -
李德仁、薛其坤獲2023國家最高科技獎
2024-06-24 10:32 科技前沿 -
我國科研人員在月壤樣本中首次發(fā)現(xiàn)天然石墨烯
2024-06-24 09:19 嫦娥奔月 -
我國重復使用運載火箭首次10公里級垂直起降飛行試驗成功
2024-06-23 14:58 航空航天 -
純度達99.9%!中國團隊實現(xiàn)海上風電驅動海水制氫
2024-06-23 08:07 觀察者頭條 -
全球首臺!這一重要裝備研制成功
2024-06-22 13:09 中國精造 -
專稿丨鴻蒙與安卓徹底切割,未來勝算幾何?
2024-06-21 19:35 華為 -
“加拿大決定跟,但也怕…”
2024-06-21 18:08 -
中國科學家發(fā)現(xiàn)治療免疫性血小板減少癥突破性新療法
2024-06-21 07:27 -
2024世界人工智能大會7月4日開幕,特色亮點搶先看!
2024-06-20 16:00 2024世界人工智能大會 -
我國首個工業(yè)用途核能供汽項目正式建成投產(chǎn)
2024-06-19 15:17 能源戰(zhàn)略 -
“千里眼”最大“角膜”:相當于把北京五環(huán)內地面平整到高低差小于1毫米
2024-06-19 09:10 中國精造 -
全球首臺全高溫超導托卡馬克裝置在上海建成運行
2024-06-19 08:15 -
“美國在核電技術上落后中國10-15年”
2024-06-18 16:42
相關推薦 -
“全球都將研究,中國與西方最強大武器直接對決” 評論 188美國官員:殲-10擊落陣風,沒用F-16 評論 356“印巴沖突是敘事之戰(zhàn),中國裝備重要性凸顯” 評論 199特朗普故弄玄虛稱“和某大國達成協(xié)議”,就這? 評論 167最新聞 Hot
-
“全球都將研究,中國與西方最強大武器直接對決”
-
許紅兵,主動投案
-
美國官員:殲-10擊落陣風,沒用F-16
-
特朗普:對華關稅145%到頂了,要降
-
美大使污蔑“中國不是好盟友”,我駐巴拿馬使館駁斥
-
印度稱軍事基地遭巴基斯坦襲擊,巴方否認
-
特朗普:可能找中國幫忙
-
大搞家庭式腐敗,甘肅省原副省長趙金云被決定逮捕
-
蓋茨怒懟:馬斯克就是在殺死兒童
-
微軟總裁瞎操心:不讓員工用DeepSeek
-
特朗普:美國與烏克蘭達成稀土協(xié)議
-
特朗普祝賀:歷史性時刻,美國的莫大榮耀
-
100多架飛機大戰(zhàn)后,印巴局勢怎么走?
-
美國又炒作“中國在古巴進行間諜活動”,我大使駁斥
-
美英談成了,“英國讓步”
-
沖突愈演愈烈,莫迪首發(fā)聲
-