-
專訪科大訊飛劉慶峰、胡郁:掌握人工智能主導(dǎo)權(quán)就是在全球處于價值鏈高端
關(guān)鍵字: 科大訊飛人工智能中文語音以下是劉慶峰在科大訊飛年會上的講話(全文),觀察者網(wǎng)特別刊發(fā)以饗讀者:
尊敬的劉利民部長、郭傳杰書記、吾守爾院士、各位領(lǐng)導(dǎo)、各位來賓,女士們、先生們大家下午好!今天是周一,又恰逢圣誕節(jié)和元旦即將到來之際,這么多的來賓能夠在百忙之中抽空參加我們的發(fā)布會,還有非常多的朋友通過高清視頻直播和圖文直播在觀看我們的現(xiàn)場直播。充分表達(dá)了大家對人工智能的一下內(nèi)容關(guān)注,對科大訊飛的信任和期待,在此我要代表科大訊飛公司對各位的到來表示衷心的感謝和熱烈的歡迎!
我們經(jīng)常說到人工智能讓機(jī)器具備像人一樣的智能,應(yīng)該說是人類在科技和產(chǎn)業(yè)界最偉大的夢想之一。而要把這個夢想照進(jìn)現(xiàn)實(shí)除了有激情有堅(jiān)定不移的長期的激情堅(jiān)守之外,還需要腳踏實(shí)地一步一個腳印踏踏實(shí)實(shí)的科技創(chuàng)新,和與之相匹配的各個階段令人尖叫的產(chǎn)品。
那么科大訊飛我們在2010年,首次發(fā)布了科大訊飛的語音云平臺,宣告手機(jī)的語音聽寫時代開始來臨。過去5年中,隨著我們技術(shù)的不斷進(jìn)步,到了2015年,到了這個月我們每天的日訪問在訊飛語音云平臺上已經(jīng)有10億人次之多。那么,圍繞訊飛僅僅是一個輸入法,就有2.8億的用戶、每天5000萬人在使用。越來越多的輸入法,越來越多的移動app的工具開始使用我們的語音技術(shù)。
在輸入的同時,很多的朋友都在問,說在輸入法中你們已經(jīng)做到了95%的準(zhǔn)確率,甚至達(dá)到98%,能不能在這樣的一個大會的過程中、在老師講課的講堂上能夠同步的把語音也給轉(zhuǎn)成文字,便于大家事后檢索與學(xué)習(xí)。但是我想告訴大家,這樣一個技術(shù)其實(shí)是很有難度的。為什么?因?yàn)槭謾C(jī)是近講,是我們對著機(jī)器的說話方式、同時噪音也不是很大。但這樣的幾千人的會場,這樣激情澎湃的演講再加上環(huán)境背景的回聲噪音等等,在業(yè)界要把它做到實(shí)用是非常難的問題。但是今天我想給大家的第一個驚喜就是科大訊飛在全球率先突破了這一技術(shù)。所以,我們今天的全程演講,請大家看兩邊的大屏幕,都是同步實(shí)時轉(zhuǎn)寫出來的。
好,我們回歸到今天的發(fā)布會的主題,其實(shí)我們在談到了人工智能60年的發(fā)展之后,現(xiàn)在面臨著全新的發(fā)展機(jī)遇。那么今天我們的發(fā)布會我想一方面要跟各位嘉賓包括網(wǎng)上直播的各位朋友們,我們來分享科大訊飛對于人工智能產(chǎn)業(yè)發(fā)展的全景性的思考。對于未來人工智能究竟在哪些關(guān)鍵領(lǐng)域要取得突破而不是單點(diǎn)技術(shù)系統(tǒng)性的成長,哪些是最關(guān)鍵的方向以及我們今天的三大年度新產(chǎn)品的發(fā)布。
首先我要向60年以前在達(dá)特茅斯會議上正式提出人工智能概念的這些前輩專家們表達(dá)我們的敬意。當(dāng)年,就是因?yàn)辂溈ㄥa第一個提出了人工智能的概念,使AI成為了人工智能行業(yè)的名稱,而且發(fā)布了第一個人工智能的系統(tǒng)語言。那么在此基礎(chǔ)上我們看到計(jì)算機(jī)的人工智在五六十年代就已經(jīng)能夠證明數(shù)學(xué)原理里的38項(xiàng)。那么在此基礎(chǔ)上另外一位計(jì)算機(jī)大師也是圖靈獎獲得者明斯基,他明確的提出了一套算法,能夠證明第一代神經(jīng)網(wǎng)絡(luò)到底能夠干哪些事情,又有什么樣的缺陷。所以我想人工智能絕不僅僅是人類大腦的冒出來的一個,突然的空幻的夢想,而是有著嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)理論做支撐,有著計(jì)算機(jī)的頂級專家共同推動的。還有兩位大師我們可以看到,在人類歷史上可以說非常耀眼的一個跨學(xué)科的專家,既獲得諾貝爾獎也獲得了圖靈獎的西蒙。還有信息論的創(chuàng)始人,也是現(xiàn)在通訊技術(shù)的奠基人香農(nóng)。就是這些專家,我們可以看到,從計(jì)算機(jī),從數(shù)學(xué),從經(jīng)濟(jì)學(xué),從通訊,從信息論的角度聯(lián)合的產(chǎn)業(yè)跨界,共同的創(chuàng)新,才推出了人工智能的橫空出世。才有了我們今天在這樣一個全新的時點(diǎn)上來探討,60年之后,人工智能究竟能給我們帶來什么樣的驚喜和什么樣的挑戰(zhàn)。
任何事物都是波浪式發(fā)展,那么從人工智能1956年第一次提出來,當(dāng)?shù)谝淮蔚娜斯ぶ悄艿乃惴ㄕZ言和第一次人工智能可以證明數(shù)學(xué)原理之后,明斯基在1970年非常興奮的宣告說未來3到8年計(jì)算機(jī)的智能就可以達(dá)到人類的平均水平。那么顯然是非常的樂觀的,但也正是因?yàn)樗岢鲞@樣一個設(shè)想,所以他開始證明說人工智能是不是真的可以。結(jié)果它通過在感知論中證明了第一代神經(jīng)網(wǎng)絡(luò)是有缺陷的。也是這樣一個極力鼓吹人工智能的人最后發(fā)現(xiàn)了科學(xué)的缺陷最后導(dǎo)致第一代人工智能到1980年出現(xiàn)第一個低潮,可以看到這些大師們求真務(wù)實(shí)的精神。
第一次低潮過后,1982年,大家可以看到這個圖上的霍普菲爾德網(wǎng)絡(luò)的,出現(xiàn)到1986年BP算法的出現(xiàn),使得大規(guī)模神經(jīng)網(wǎng)絡(luò)的訓(xùn)練成為可能人們再次看到了神經(jīng)網(wǎng)絡(luò)人工智能的希望。因此日本雄心勃勃的推出來第五代計(jì)算機(jī)的計(jì)劃,希望未來能夠推出人工智能計(jì)算機(jī)。大家知道計(jì)算機(jī)從電子管到晶體管到集成電路到大規(guī)模集成電路第五代就希望做人工智能計(jì)算機(jī)。但是隨后我們認(rèn)為事物確實(shí)發(fā)展都不是一帆風(fēng)順的,由于這些算法計(jì)算機(jī)的運(yùn)算能力的限制和算法的難以收斂導(dǎo)致了直接到2000年第二次AI冬天的到來。第五代計(jì)算機(jī)宣告失敗DARPA削減投入。那么,再往后,一直到2006年深度學(xué)習(xí)的概念被正式提出來,首次證明用這種方法可以進(jìn)行大規(guī)模深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)。學(xué)習(xí)能力有了,那么有了這個學(xué)習(xí)能力之后一系列的算法包括在深度神經(jīng)網(wǎng)絡(luò)方面的卷積神經(jīng)網(wǎng)絡(luò)遞歸神經(jīng)網(wǎng)絡(luò)等等辦法,不斷地在語音合成語音識別方面取得突破。
稍后我們訊飛研究院院長還會給大家分享我們科大訊飛在核心源頭技術(shù)方面我們做了哪些創(chuàng)新。正是神經(jīng)網(wǎng)絡(luò)的不斷的創(chuàng)新,再加上今天移動互聯(lián)網(wǎng)時代大數(shù)據(jù)云計(jì)算的興起,再加上無線互聯(lián)網(wǎng)可以使數(shù)10億的用戶的數(shù)據(jù)源源不斷的匯聚到后臺供我們的神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)和訓(xùn)練。所以大家都認(rèn)為,人工智能在經(jīng)歷了60年一甲子之后經(jīng)歷了兩次起伏現(xiàn)在已經(jīng)進(jìn)入到真正的爆發(fā)的前夜。而我們覺得非常幸運(yùn)的是,前60年中國人基本上絕大部分時間是缺席全球人工智能這個盛宴的。但是今天,有了科大訊飛有了我們一批的合作伙伴,以產(chǎn)學(xué)研用相結(jié)合的方式我們開始在很多領(lǐng)域走在了全球的風(fēng)口浪尖之上。
我們在這可以看一下,不光是科大訊飛這樣認(rèn)識,當(dāng)前的一些大師們都怎么看?著名的硅谷的思想家凱文凱利,寫了失控這本書,最近又寫了必然這本書。他就明確說,如果你問我未來20年最重要的技術(shù)是什么?毫無疑問,我會告訴你就是人工智能?;艚疬@位大科學(xué)家除了科學(xué)研究和思考幾乎什么都不干,但是霍金說人工智能可能在接下來的100年之中將人類取而代之。一方面對人工智能未來的前景充滿信息,另外一方面給大家拋出另外一個話題,人工智能對人類是喜還是憂,會不會替代掉我們?nèi)祟悾踔習(xí)谖磥碇髟孜覀內(nèi)祟悺?
今天的全球首富孫正義,在今年提出的一個著名的公式叫孫正義公式。他認(rèn)為未來決定一個國家的GDP排名的不是人口。軟銀一家就要有3000萬個機(jī)器人。未來機(jī)器人的數(shù)量和智能化程度,決定了GDP的全球排名。所以日本把人工智能提到了非常高的高度。今天人工智能真的已經(jīng)關(guān)乎到絕不是一個企業(yè)或者一個產(chǎn)業(yè)的事,而是國家全局性的戰(zhàn)略任務(wù)。在移動互聯(lián)網(wǎng)時代,掌握住人工智能的主導(dǎo)權(quán),我們就在全球處于價值鏈的高端,如果丟失掉,我們會繼續(xù)像前30年一樣淪為最低端的制造。
我們可以看一下人工智能因此而開始上升為各個國家的國家戰(zhàn)略。美國奧巴馬政府明確提出大腦活動圖譜計(jì)劃,把他列到跟人類基因組計(jì)劃一樣的高度,歐盟也推出了同樣的計(jì)劃。中國在去年啟動了人工智能的重大專項(xiàng)之后,正在積極醞釀準(zhǔn)備啟動中國腦計(jì)劃。那么應(yīng)該說這樣一個國家戰(zhàn)略已經(jīng)在全世界范圍內(nèi)被越來越多的科技界企業(yè)界和政府認(rèn)同。
那么我們今天要問,在這樣一個戰(zhàn)略的基礎(chǔ)上,我們?nèi)斯ぶ悄艿降资菣C(jī)器具備什么樣的智能,怎么樣劃分?大家五花八門想到的各種類型怎么樣對它進(jìn)行界定?其實(shí)科大訊飛,在去年8月20號我們訊飛超腦計(jì)劃的首次發(fā)布時,我們就對人工智能做了一個清晰的分割和界定,把它分成3個層面。第一個層面運(yùn)算智能,讓機(jī)器具備了能存會算的能力。那么這能存會算呢,剛剛我們在這個短片中看到了,在1997年,計(jì)算機(jī)下象棋超過了人類象棋大師。因?yàn)樗倪\(yùn)算能力強(qiáng),所有能便利結(jié)果的東西機(jī)器已經(jīng)超過人工了。第二個,感知智能,讓機(jī)器能聽會說能看會認(rèn)。我們知道人類的視覺看到是可見光,但是機(jī)器現(xiàn)在可以到紅外可以到紫外。我們的聽覺20赫茲到2萬赫茲,但機(jī)器可以聽超聲波可以聽次聲波。
今天科大訊飛的語音合成在英文中已經(jīng)達(dá)到4.2分,超過了普通人4.0的水平。在中文達(dá)到4.5分,機(jī)器在合成在識別在很多方面也已經(jīng)達(dá)到人工的水平。這叫感知智能的發(fā)展。但是最有挑戰(zhàn)性的,也是我們?nèi)藚^(qū)隔于動物的最大的能力,就是我們的認(rèn)知智能。認(rèn)識和知道能理解會思考。這樣一個能力,今天我們怎么來突破它?
那么突破人工智能特別是認(rèn)知智能切入點(diǎn)應(yīng)該是什么?其實(shí)呢,當(dāng)年人工智能在60年前提出來,我認(rèn)為就本身帶著對人類本身發(fā)展的站在原點(diǎn)上的一些哲學(xué)思考,那我們今天考慮人類發(fā)展。
《人類簡史》最近在各大主流媒體和科技界,考古學(xué)家和歷史界都在傳誦。這本書上提到了,類人生命,200萬年前誕生。但是今天主宰地球的,智人的誕生,是在7萬年前。七萬年前是什么因素,導(dǎo)致了我們目前的智能,我們的祖先,能夠在這個大路上,能夠在地球上一統(tǒng)天下呢?考古學(xué)發(fā)現(xiàn),各方面的證據(jù)都匯在一起,語言使得我們能夠反饋周邊的環(huán)境信息,因?yàn)橛辛苏Z言才使得我們能夠反饋環(huán)境信息更上的社會信息,才使得我們可以虛構(gòu)概念可以有理想可以有主意可以有組織可以有夢想。那么這是沒有語言的廣泛使用就沒有人類的交流就沒有智慧的碰撞和產(chǎn)生就沒有今天我們?nèi)祟愖陨淼恼J(rèn)知智能。
因此我們認(rèn)為人工智能發(fā)展有一條必由之路,就是由語音和語言為入口的認(rèn)知智能的革命。這是我們今天所面臨的機(jī)會,也是我們已經(jīng)找到的路徑。
那么在這個路徑上我們可以看到今天我們有幸的是,科大訊飛為代表的中國科技產(chǎn)業(yè)界我們在語音和語言上已經(jīng)有了哪些非常好的積累??拼笥嶏w九九年創(chuàng)業(yè)九八年開始籌備創(chuàng)業(yè),我們的語音合成技術(shù)中文就是業(yè)界第一名。那么隨著我們的發(fā)展,那么在2006年我們第一次獲得了全球英文大賽的第一名,更到2012年讓英語合成我們在全世界首次超過了真人說話水平,今天呢我們英語比美國人英國人做的英語要好。我們的印地語印度人說話的印地語,剛剛的2014年底和2015年的比賽結(jié)果科大訊飛代表中國超過了印度人做的印地語。目前我們已經(jīng)有了26個主要語種的語音合成。
語音評測,讓機(jī)器可以評測我們的普通話,我們的英語發(fā)音是否標(biāo)準(zhǔn),錯在什么地方,怎么改正,進(jìn)而現(xiàn)在對音樂唱歌都能進(jìn)行評價。這項(xiàng)技術(shù)我們不僅在2006年,超過了國家級測試員的水平,現(xiàn)在已經(jīng)大規(guī)模的在普通話等級考試,在海外漢語口語考試,包括在我們高考改革現(xiàn)在的英語考試中廣泛使用,有效地推動我們的高考改革。
2008年第一次在全球說話人識別大賽中獲得第一名,2010年我們首次發(fā)布了圍繞云計(jì)算和移動互聯(lián)網(wǎng)的訊飛語音云平臺。那剛才我說到截止到現(xiàn)在用戶日訪問量去年這個時候不到5億人次。7月10號我們給李克強(qiáng)總理匯報的時候7.6億人次,而今天,突破了10億人次,可以看到快速發(fā)展的態(tài)勢。
有了嘴巴有耳朵還要有個語言的理解。這個理解技術(shù),在2010年開始成功應(yīng)用到電信和金融行業(yè)。今天已經(jīng)可以替代掉中國移動,中國聯(lián)通和電信的客戶服務(wù)30%的人工,是全行業(yè)獨(dú)家可以真正用機(jī)器代替人工的。同樣支撐了我們靈犀助手的幾十種不同的應(yīng)用。而這樣的自然語言理解,又使得我們在2014年底和一五年初的,兩次全球最著名的國際翻譯大賽,漢語和英語,英語和漢語的評比,以及美國國家標(biāo)準(zhǔn)技術(shù)研究院組織歷史的國際測試,都是全球第一名。大家知道嗎?2014年底之前,國際這兩項(xiàng)比賽,漢語到英語的翻譯比賽,是日本人全球第一,英語到漢語的翻譯比賽是美國人全球第一。但是伴隨著訊飛自然語言理解的進(jìn)步,到2014年底我們改寫了這個歷史。
那么有了上述的語音和語言技術(shù)的不斷的突破和發(fā)展,我們還有一個支撐我們未來做認(rèn)知計(jì)算的非常重要的基礎(chǔ)就是我們海量用戶的誕生。我們可以看到今天的訊飛輸入法已經(jīng)擁有了2.8億用戶,是業(yè)界口碑最好的輸入法。我還想告訴大家一個秘密,就在一個月前我們推出來了中間的叫做隨聲譯的功能。說漢語同步可以出英語,所以很多大學(xué)生和高中生現(xiàn)在寫英語文章變得非常之簡單,受到很大的歡迎。
那么,在靈犀中我們有1.2億用戶可以打電話發(fā)短信問天氣航班股票還可以閑聊,那么大家知道最近有很多語音助手推出來,但是我想告訴大家在中國移動做的官方統(tǒng)計(jì)12個主流應(yīng)用商店的下載中,我們靈犀一家超過了前5名中另外4家的總和。
那么,這是我們自己的輸入法和靈犀的移動互聯(lián)網(wǎng)產(chǎn)品,但科大訊飛就像當(dāng)年劉利民部長支持我們大學(xué)生創(chuàng)業(yè)一樣。那么我們教育部支持我們學(xué)生創(chuàng)業(yè),我們今天也把我們的語音云開放給所有的創(chuàng)業(yè)者。那么這個創(chuàng)業(yè)者呢正在蓬勃發(fā)展,尤其趕上中國的雙創(chuàng)大眾創(chuàng)業(yè)萬眾創(chuàng)新。我們可以看到去年這個時候,我們的用戶數(shù)是4個多億,到了今天已經(jīng)達(dá)到7個億。這個用戶數(shù)4.4億現(xiàn)在到7億,這個數(shù)據(jù)是什么呢?總下載量已經(jīng)超過了10個億了。那么,我們考慮因?yàn)檎J謾C(jī)使用壽命18個月,所以只算前18個月的,一共是現(xiàn)在有7個億的用戶,增長60%。但是現(xiàn)在有很多應(yīng)用號稱用戶數(shù)很大忽悠的概率很高,沒有人每天真的用那這就是個問題。每天的訪問人次才是關(guān)鍵,所以大家可以看到,我們今天和去年同期相比都是11月底的數(shù)據(jù)。從4.8億人次,每人用一次算一個人次,漲到了10億人次,上漲109%。而圍繞我們語音云的開發(fā)伙伴呢,從4.3萬家增長到了11萬家,增長了156%。這個數(shù)據(jù)另外能看到一個什么趨勢呢?
總用戶增加,日訪問人次比總用戶增加快,說明我們的使用頻率越來越高。而我們的開發(fā)伙伴數(shù)增加比日訪問人次提高的快說明有越來越多的合作伙伴正在開發(fā)還沒有推向市場。未來的量會增長更快,潛力更在后面。所以這就是為什么我們說在萬物互聯(lián)時代以語音為主以鍵盤和觸摸為輔住的人機(jī)交互時代正在到來。那我們再看在車載領(lǐng)域的應(yīng)用,對吧,大家知道馬上也月份又要開全球消費(fèi)類電子展。去年的拉斯維加斯消費(fèi)電子展最火的參加最熱烈的不是手機(jī)也不是電腦是汽車廠商。大家都認(rèn)為隨著無人駕駛汽車智能汽車的發(fā)展,在車內(nèi)打電話發(fā)短信不用手,然后導(dǎo)航直接說話,聽音樂一說歌曲馬上調(diào)出來本地沒有從后臺幾百萬首歌曲去調(diào)取。那么這樣的應(yīng)用是剛需因?yàn)槠囄磥碓絹碓綍蔀橐粋€移動的娛樂和辦公的平臺。
但是在車內(nèi),語音的應(yīng)用難度非常之大,因?yàn)橛性胍糨喬ピ胍糗嚧霸胍艨照{(diào)噪音,再加上我們坐在座位上設(shè)備放在方向盤或者后視鏡有一定的距離,所以很難做到實(shí)用。但我很高興的告訴大家就在今年的4月份,歐洲的頂級車廠,寶馬汽車的國際比賽,我們是全世界唯一達(dá)到實(shí)用。因?yàn)?5%是大家認(rèn)為可用的門檻,大家看到這個比賽結(jié)果科大訊飛是百分之八十六點(diǎn)幾,而全世界第二名,美國公司才75%。所以,為什么有這么多的國際頂尖車廠都在用我們的技術(shù)。奧迪、奔馳、寶馬、沃爾沃、福特包括最近日系的雷克薩斯最高端的人也都要上,當(dāng)然我們跟國內(nèi)的從吉利江淮奇瑞以及長安等越來越多的國內(nèi)車廠也在開始進(jìn)行展開深入合作,這個技術(shù)我們已經(jīng)走在全球最前面。
伴隨前面這些進(jìn)步,我們也開始做軟硬件一體化的產(chǎn)品。在今年的,第三季度末,我們推出了,帶語音遠(yuǎn)場識別控制,并且不光能聽音樂,還可以操控家居的叮咚音箱。這個叮咚音箱一出來,就在整個中國WIFI音箱銷量中排名第一。不僅如此,它的銷量超過了后9名的總和。然后我們又在年底,推出了業(yè)界第一款,能夠全程用語音控制,而且還可以給孩子講故事、可以翻譯、可以詩歌對答、可以算數(shù)等等陪伴功能的兒童手表。大家可以看到這個圖上,這就我們最新的產(chǎn)品。這些呢,都是表明了科大訊飛把我們的技術(shù)推動,到我們老百姓耳熟能詳?shù)纳磉叺囊粋€目標(biāo)。我們也會跟我們的合作伙伴,做更多的有益的嘗試。
通過我們的語音和語言技術(shù)再加上我們的大數(shù)據(jù)和人工智能我們實(shí)現(xiàn)的從教育的評價到考試到課堂教學(xué)到課后的練習(xí)已經(jīng)有8000萬的老師和學(xué)生。剛剛我們的總書記到了新加坡。大家知道嗎?新加坡教育這么發(fā)達(dá)的國度,94%的中小學(xué)都裝了科大訊飛的系統(tǒng),不僅是教漢語,還有英語和其他學(xué)科。
正是因?yàn)橛辛宋覀兦懊嫠f的,語音和語言技術(shù)的核心技術(shù)突破,有了我們每天10億人次的訪問所帶來的機(jī)器可學(xué)習(xí)的數(shù)據(jù)來源,使得我們今天科大訊飛在2014年的八月份我們可以正式發(fā)布,中國第一個,叫中國超腦計(jì)劃;承擔(dān)了科技部人工智能領(lǐng)域,第一個示范性的標(biāo)準(zhǔn)的重大項(xiàng)目,叫類人答題機(jī)器人的項(xiàng)目。這個項(xiàng)目中我們訊飛超腦的目標(biāo)就是要讓機(jī)器,能聽會說到能理解會思考,真正的要開啟認(rèn)知計(jì)算全新的大門。我們前面已經(jīng)提到了認(rèn)知計(jì)算,以語音和語言為入口的認(rèn)知計(jì)算,是我們當(dāng)前必由的道路,也是我們非常重要的切入點(diǎn)。那么在這樣一個切入點(diǎn)中,到底認(rèn)知計(jì)算未來我們能做到什么程度?現(xiàn)在有很多的各種各樣的單點(diǎn)技術(shù)突破,也有很多人從各個角度說,我的系統(tǒng)很牛,到底怎么比?今天呢其實(shí)我們可以看到在全世界的人工智能專家都看到了另外一個比較的方式,就是你不要在某個單點(diǎn)要比就放在高考這個點(diǎn)。我們都很討厭高考,但我想在座的很多人都是由高考選拔出來的優(yōu)秀人才。那么因?yàn)楦呖歼@個點(diǎn)是最公平的,是最能看到你對知識的綜合表達(dá)能力,你的學(xué)習(xí)能力和推理能力的,因此大家說不要說人工智能在設(shè)定了某個領(lǐng)域能干什么事,是告訴我在開放式的高考中跟人PK到底會怎么樣。所以我們可以看到全球的科學(xué)家們,在美國華盛頓大學(xué)的圖靈中心,圖靈中心現(xiàn)在已經(jīng)升格為叫AI實(shí)驗(yàn)室,它的目標(biāo)是什么?
讓計(jì)算機(jī)未來高考要通過美國的生物學(xué)的大學(xué)入門考試。而日本機(jī)器人,他的目標(biāo)是未來機(jī)器要考上大學(xué),甚至希望在2021年機(jī)器能夠考上東京大學(xué)。那么我們中國啟動的科大訊飛總牽頭的人工智能計(jì)劃類人答題機(jī)器人目標(biāo)也是3到5年之內(nèi)讓機(jī)器高考能考上一本。什么概念?機(jī)器高考考及格很容易,因?yàn)樗泻軓?qiáng)的記憶能力。而機(jī)器高考要能考上三本,比50%人強(qiáng)就很難。我們的目標(biāo)是未來機(jī)器要能跟100個學(xué)生,機(jī)器要考前20。不僅僅是在考試這個點(diǎn),關(guān)鍵是相關(guān)技術(shù)成果它可以在過程中對我們的學(xué)習(xí)起到非常大的幫助,而同樣成果可以用在醫(yī)療用在客服用在越來越多的領(lǐng)域,它這個核心源頭技術(shù)和算法的突破。那么關(guān)鍵要解決的知識的表達(dá)推理和學(xué)習(xí)的能力。
那么今天呢,我們在前面已經(jīng)看到了,訊飛超腦我們要做的事情。我們認(rèn)為未來的認(rèn)知革命最核心的三大基礎(chǔ)能力,第一個我們可以看到,就是人機(jī)交互能力。只有有了人機(jī)交互,才可以使得人類的智慧不斷的送到后臺,才能使得我們后臺能力不斷服務(wù)人類。第二個知識管理。只有把海量的知識,互聯(lián)網(wǎng)上大量的甚至是垃圾信息,變成結(jié)構(gòu)化變得有用,才能夠獲得智慧的源源不斷的來源。只有在這基礎(chǔ)上,真的自己有推理和學(xué)習(xí),才能形成我們認(rèn)知革命的基本部分。我們今天看到很多人從各個層面去做,而我們認(rèn)為基本的人工智能的邏輯關(guān)系,就是這3塊:人機(jī)交互,知識管理,推理學(xué)習(xí)。我們的所有關(guān)鍵技術(shù)都圍繞這3個基礎(chǔ)點(diǎn)來展開。
那么,剛才講了這么多,下面就進(jìn)入到我們今天的正式發(fā)布環(huán)節(jié)。那么我們怎么樣圍繞剛才3個最基本的能力來展開我們的研發(fā)?而在2015年年底之際,在中國人工智能元年之際,我們給大家有一個什么樣的答案什么樣的答卷。
首先我們看看,我們給大家提出來什么叫做真正最自然的人機(jī)交互?面向萬物互聯(lián),面向越來越多的機(jī)器人,到底我們新的技術(shù)是怎么展現(xiàn)的?
很有趣的一段視頻,那么應(yīng)該說呢,在今年的春節(jié)很多人在傳這個視頻,對吧。也有很多人問我說是不是科大訊飛做的,我說我們的技術(shù)比這樣好,但是也不能解決所有問題。這里面的方言口音,在過程中的多輪交互上下文語義的理解,那么很多很多的關(guān)鍵技術(shù),都是在2015年年初所沒有解決的。我們現(xiàn)在看到在手機(jī)中輸入法按一下我們開始說話,在各種各樣的助手中,大家按一下屏幕,然后跟他說話,然后他結(jié)束再按一下才可以。就沒有上下文的理解沒有多輪交互更不支持你隨時打斷他。那么這個中間呢看到一個有趣的視頻,可是跟我們的技術(shù)如果展開來它主要包括哪些方面呢?首先我們再看一個場景。
這是我們一個典型的,我們說現(xiàn)在的人工智能。下一步要進(jìn)入到智能家居,它要解決哪些問題?我們可以看到,如果在我們的廚房,你要用語音來操控整個廚房的家居,必須要有噪聲抑制功能。如果面對電視,或者我們的音響,我們要說話,一定要解決回聲消除問題,因?yàn)樗约罕旧砭驮诖舐曊f話。當(dāng)我們要遠(yuǎn)距離操控,我坐在沙發(fā)上要控制空調(diào)的時候,我們要五米到八米的遠(yuǎn)場識別。另外呢,當(dāng)我坐在沙發(fā)上,也可以在其它的位置,站在陽臺上隨時說話,它都能聽見,需要360度的精確定位。這幾項(xiàng)技術(shù),如果不解決,我們就沒有辦法進(jìn)入到我們的智能家居的,真正的實(shí)用場合。
那么還有方言,對吧。目前呢,我們的方言其實(shí)已經(jīng)有17種語言了,那么已經(jīng)有了3種主要的少數(shù)民族語言,維語。我們吾守爾院士在,我們在新疆大學(xué)就是跟吾守爾院士共建聯(lián)合實(shí)驗(yàn)室,有藏語有維語。有7億用戶每天提供各種方言來跟我們的系統(tǒng)學(xué)習(xí)和訓(xùn)練,所以說沒有方言支撐,我們買一個最酷的機(jī)器人回家陪伴我們的父母親陪伴我們的爺爺奶奶,他有時候真的搞不定對吧。所以方言那我們現(xiàn)在已經(jīng)有了全行業(yè),大家看各種輸入設(shè)備只有科大訊飛提供了方言,而且十幾種了。那么還有,一些非常需要突破的技術(shù),我給大家再看一個簡單的對話,就我們?nèi)烁酥g是怎么完成一次相互的溝通的?
大家可以看,這樣一個簡單的,我們的秘書或者助手辦理事情的過程涉及到這么多的關(guān)鍵技術(shù)。主動提問、插話打斷、背景知識長時記憶,然后持續(xù)聆聽、上下文理解等等,只有這些才真正解決了,我們說人工智能時代或者萬物互聯(lián)時代,我們的語音才真的可以進(jìn)入到我們的億萬家庭。因?yàn)榻裉?,沒有屏幕了,我們離設(shè)備又很遠(yuǎn),假如還是在PC中的鍵盤鼠標(biāo),還是在手機(jī)中的多點(diǎn)觸控和語音為輔,解決不了當(dāng)前萬物互聯(lián)時代的需求。為此過去一年我們做了非常多的創(chuàng)新,請大家看我們現(xiàn)在真實(shí)版本的演示。
有請工作人員我們要演示的具體一個設(shè)備,就是我們已經(jīng)在市面上銷售的DingDong音箱。以它為載體,可以聽音樂、可以操控家居、還可以幫助我們完成我們想要完成的各種助理的事物。
好有請我們同事為大家演示。好,大家可以看到,它不光完全這些功能,它還能聽懂我是它的主人,所以我說話他優(yōu)先就響應(yīng),也不問你是誰。
有了我們真正最新的語音和語言技術(shù),它就可以真的像一個聰明的助手,要幫助我們完成我們所需要的各種工作。那么在這里面我們再給大家看一下,其實(shí)我們原來的所有交互,可以說我們今天在市場上所看到的所有的助手類的都是單工單輪為主的。單工就是摁一次才能操作,雙工是他隨時隨地在聽你你可以隨時打斷。那么單輪就是上下文,我問一次比如說北京明天天氣,然后下面再問你可以問他上海明天天氣,而現(xiàn)在我可以問北京明天天氣你可以直接說上海的呢,他馬上就知道上下文相關(guān),那么這個就是要多輪交互和對話。那么通過我們的基于人工智能全新的交互控制的算法,我們在業(yè)界首次真正實(shí)現(xiàn)了全雙工多輪交互系統(tǒng)。
在萬物互聯(lián)在新的機(jī)器人的交互情況下,如果是單工系統(tǒng),識別準(zhǔn)確率完成只有40%,而做到全雙工就可以達(dá)到90%。其實(shí)我們最近看到了不少由于人工智能的蓬勃發(fā)展,在互聯(lián)網(wǎng)上有很多視頻在流傳。我想告訴大家今天看到的是第一個真實(shí)版的全雙工對話,那一些都是有人在后臺操控的。那么有人要不在后臺編輯,表面上他一定要在手機(jī)和近講,結(jié)果在嘈雜下是有人在后臺輸入,然后輸入文字前端回答。甚至我們最近在機(jī)器人大會上看到有個美女機(jī)器人的視頻,其實(shí)就是躲在另外一個房間,是另外一個美女在回答問題。但是它的形態(tài),今天機(jī)器人的軀干,外形已經(jīng)很好了,最缺的就是理解和預(yù)測思考的大腦。而訊飛我們把這個變成了現(xiàn)實(shí),所以大家才可以看到在深圳高交會,在北京的機(jī)器人世界大會上,基本上最有名最有特色的機(jī)器人全是科大訊飛的合作伙伴。
那么我想告訴大家,通過訊飛技術(shù)的進(jìn)步,我們可以看到,在萬物互聯(lián)時代,什么叫做真正的能夠?qū)崿F(xiàn)人機(jī)交互?因?yàn)槟闩霾坏狡聊涣耍x你很遠(yuǎn),不方便用手和鍵盤來操控的時候。第一個就是遠(yuǎn)場降噪,第二個方言識別,第三全雙工,隨時隨地在聽,第四個自動糾錯,主動糾錯,你可以打斷它,然后多輪對話,上下文相關(guān)。只有這些都具備,我們認(rèn)為,才是萬物互聯(lián)時代真正的人機(jī)語音交互系統(tǒng)。所以今天我可以很自豪的告訴大家,是中國人重新定義了萬物互聯(lián)時代,真正的人機(jī)語音交互!
那么在這個基礎(chǔ)上我們又進(jìn)一步以語音為主把圖像把視覺把手寫,大家知道我們在輸入法中的手寫識別也是業(yè)界最好的,整個的更多的人工智能的功能集成在一起,推出了業(yè)界首個人工智能的用戶交互界面:AIUI。
那么這個AIUI呢,一方面通過統(tǒng)一的交互接口,我們可以讓各種各樣的人工智能的能力,非常方便的被我們的用戶和我們已經(jīng)有的11萬個開發(fā)伙伴、未來更多的開發(fā)伙伴來使用。統(tǒng)一簡潔的交互接口,然后靈活的能力搭配,可以有離線的,可以是在線的也可以是各種各樣的類型的人工智能,而且具備很強(qiáng)的服務(wù)拓展的功能。未來最新的人工智能成果,都可以放到AIUI的統(tǒng)一界面下。
我們可以看到我們怎么樣能夠讓這樣一個思路能夠變成現(xiàn)實(shí)?
有3個關(guān)鍵:
第一是軟硬件一體化,我們的智能家居我們的機(jī)器人可以直接采購訊飛的各種類型的麥克風(fēng)陣列,使它360度使它五到八米之外都可以方便的來操控這個設(shè)備,所以首先是軟硬件一體化。其次是云和端一體,什么概念呢?有越來越多的家電設(shè)備智能家居它不聯(lián)網(wǎng),那么能聯(lián)網(wǎng)我們的能力在后臺,如果不能聯(lián)網(wǎng)或者我們要節(jié)約后臺運(yùn)算資源可以直接有端的解決方案。就像我們在輸入法中第一次這個提供了業(yè)界最好的輕量級的手機(jī)的輸入法,不需要聯(lián)網(wǎng)直接說話就可以變成文字。那么第三個是技術(shù)服務(wù)一體化,通過這個AIUI的界面我們可以給各個開發(fā)伙伴各種應(yīng)用差異化的定制,可以定制不同聲音。就像我們定義了林志玲的聲音對吧,我們可以訂今年又推出郭德綱的聲音。
我在今年兩會在中央人民廣播電臺竟然有個小伙子真實(shí)版的故事,因?yàn)槲覀冏隽肆种玖岬氖虑樗詾槭钦娴?,結(jié)果當(dāng)天買了導(dǎo)航系統(tǒng)回家,到家門口他也沒停車?yán)^續(xù)開了幾十公里,就是為了想聽志玲姐姐說前方多少米左轉(zhuǎn)右轉(zhuǎn)。那么這是一個真實(shí)的故事,大家可以去考證,在央視今年的兩會我去做了節(jié)目,還有其他的互聯(lián)網(wǎng)大佬就他們這個里面的,這個一個真實(shí)的小帥哥。那么,當(dāng)然4我們也可以各種語音識別的場景,包括后臺的語義定制可以實(shí)現(xiàn)技術(shù)服務(wù)一體化。在這3個基礎(chǔ)上我們提供了統(tǒng)一的AIUI的標(biāo)準(zhǔn),就真正的定義人工智能時代的人機(jī)交互的標(biāo)準(zhǔn),有了這個統(tǒng)一的標(biāo)準(zhǔn)未來在我們平臺上的各種各樣的設(shè)備,各種各樣的服務(wù),都是可以互聯(lián)互通相互分享支持相互去碰撞去學(xué)習(xí)的。
這個AIUI呢其實(shí)也非常方便,很容易被大家使用。聽起來很高大上的概念,用起來就4個簡單步驟。第一步,一鍵獲取方案,第二步安裝麥克風(fēng)陣列,第三步,集成我們SDK,然后再申請,如果不需要就通用,也可以申請差異化的定制。有了之后,我們的設(shè)備就可以跟人一樣。這個就是,大家非常簡單的,可以來使用我們的平臺。就分這四步,那么這個AIUI呢現(xiàn)在可以支持穿戴式設(shè)備,可以支持智能家居,可以支持機(jī)器人,可以支持我們各種智能硬件的設(shè)備。那么應(yīng)該說句都具備非常強(qiáng)的普適性和非常方便的調(diào)動性,那么AIUI呢,應(yīng)該是人工智能時代,我們終于有了一個專門針對人工智能和萬物互聯(lián)的人機(jī)交互的專門的界面。
這是我們今天的第一個發(fā)布。那么,今天的第二個發(fā)布是高效的知識管理。我們剛才說了首先有了人機(jī)交互,語音和語言作為入口,我們才可以獲得了無窮無盡的知識,那么,但是這些入口之后我們的知識該如何管理?隨著無線互聯(lián)網(wǎng)4G的發(fā)展大量的數(shù)字音視頻錄音的材料在網(wǎng)上流行,但是很多時候這些數(shù)據(jù)在這,可是我們?nèi)〔坏剑驗(yàn)樗欠墙Y(jié)構(gòu)化的,因?yàn)檗D(zhuǎn)寫一小時的錄音的內(nèi)容,專業(yè)人士我們的媒體記者平均需要7個小時。所以很多錄音,假如今天沒有我們現(xiàn)場轉(zhuǎn)寫,有可能大家在會場會錄一段聲音,但是回去以后我相信一放可能幾個月不會再去看他,因?yàn)槟阒匦氯z索它實(shí)在太困難。那么我們再給大家看一段視頻。
事實(shí)上呢,這個中間有幾個關(guān)鍵痛點(diǎn),大家可以看到。對于一個文字工作者或者每一個用戶來說,語音轉(zhuǎn)寫,工作量太大?;芈犖覀兊匿浺?,我們要想去重新提取和學(xué)習(xí),沒有字音同步,所以沒法檢索。兩小時錄音,必須聽完才知道我感興趣的那一段,關(guān)于最新人工智能的演示是在第1小時20分鐘。沒有能夠自動幫你做要素提取,因?yàn)樗欠墙Y(jié)構(gòu)化的。今天呢我們要通過語音技術(shù),真正的能夠解決這些問題,就首先要進(jìn)行混響降噪,能夠把中間的混響,把噪音去掉。我們要解決人和機(jī)器交談準(zhǔn)確率比較高,可是人跟人自由交流、閑聊對話、開會討論、吵架的過程中,各種各樣的口音怎么解決?還有怎么樣把2萬字的內(nèi)容,變成200字的摘要。看完以后根據(jù)興趣,我再看后面內(nèi)容。這些就是我們今天的第二個發(fā)布,如何進(jìn)行高效的知識管理。
那么,首先可以看一下三大技術(shù)難題,混響降噪。其實(shí)我們有非常多的現(xiàn)在有的音頻內(nèi)容是通過原來的手機(jī)或錄音筆錄下來的,當(dāng)然包括視頻里面的都是單麥克風(fēng)的。現(xiàn)在慢慢的有些手機(jī)有雙麥克風(fēng),單麥克風(fēng)陣列的錄下來的聲音一般來說,語音轉(zhuǎn)寫準(zhǔn)確率只有多少呢,40%多一點(diǎn)。所以根本沒法給你使用,10個字錯6個,主要內(nèi)容可能都沒了。那么通過我們最新的單麥克風(fēng)的這個解混響的技術(shù),那么我們可以把它的準(zhǔn)確率提升到87.9%。那么如果說10個字有將近9個字對,基本上我們做檢索做摘要做字音同步就已經(jīng)差不多可以用。那如果用我們專門的多麥克風(fēng)陣列又可以把它做到90%以上,那么這是一個我們在混響降噪方面的進(jìn)步。
那么還有呢?通過我們對口語交談的文本,在篇章。更大的這個域,不是一個字也不是一個句,而是整個篇章的理解,然后再加上口語化的建模,我們可以對口語化的轉(zhuǎn)寫有個很大的提升。再經(jīng)過我們的文本后處理,對標(biāo)點(diǎn)預(yù)測,內(nèi)容的順滑,把不相關(guān)的內(nèi)容去掉,還可以做摘要。這樣我們可以看到多場景的轉(zhuǎn)寫,演講已經(jīng)達(dá)到93.2%,就像我今天這樣。其實(shí)我想在座的很多人,口音都比我標(biāo)準(zhǔn)。比我們喝長江中下游水長大,nl不分卷翹舌不分等等。然后即興發(fā)言接近90%,自由討論也能將近80%。這樣就使得我們真的人類所產(chǎn)生的這么多寶貴的資料,內(nèi)容不再是垃圾內(nèi)容,而是可以被結(jié)構(gòu)化被分析被處理。
那么在這個基礎(chǔ)上我們推出了今天的第二個要發(fā)布的產(chǎn)品,是一個組合。有手機(jī)上的軟件,叫我們的錄音寶;有專門的硬件,我們的專門的聽見錄音筆;也有專門提供服務(wù)的網(wǎng)站。
我們的手機(jī)錄音寶,雖然說推出時間很短,現(xiàn)在已經(jīng)有了100多萬的用戶。在這個中間,第一,這個錄音寶在手機(jī)中錄下來的聲音,比其他的錄音軟件要明顯的,音質(zhì)要好。第二,很容易,什么叫容易聽?你錄完以后,用我們的工具,馬上就可以把聲音和文字做對應(yīng)。你去重新去聽,重新回去以后去整理,所以就出來了。然后,把他送到我們的互聯(lián)網(wǎng)平臺上,聽見網(wǎng)站馬上就可以把文字轉(zhuǎn)給你。今天我們開完會,回到家里吃完飯,兩三個小時以后文字就給你了。這是我們的錄音寶的軟件。
那么還有一個一款神奇的錄音筆,這個錄音筆首先是音質(zhì)很好,第二個同樣具備了我們剛才講的手機(jī)軟件的自動的音字對齊,同時也可以提交服務(wù)到我們的網(wǎng)站上。那買這個錄音筆的硬件設(shè)備的可以獲得很多的VIP的網(wǎng)站的服務(wù)。
第三個,就是我們的網(wǎng)站訊飛聽見網(wǎng)站??梢宰龅铰曃木庉?,自動的聲音和文字對應(yīng)的編輯,字音同步索引。然后視頻字幕。我們一段視頻拍下來,馬上可以自動給你產(chǎn)生字幕,可以對應(yīng)。這個是我們利明部長,我專門邀請他,一定要到現(xiàn)場來給我們指導(dǎo)。因?yàn)樵谥行W(xué),一,有非常多的現(xiàn)在一思一優(yōu)課,一課一名師。需要把老師上課的內(nèi)容跟字幕對應(yīng),讓孩子可以有針對性的去挑選,對應(yīng)的知識點(diǎn)來聽取。然后語音秒轉(zhuǎn)成文字,同時我們可以雙屏,一邊是原始錄音,一邊是整理的界面,快速的編輯。然后這個就是我們現(xiàn)在的訊飛聽見的網(wǎng)站,這3塊組成了我們要發(fā)布的,今天的第二個產(chǎn)品。另外我還想告訴大家,因?yàn)榻裉?,我們剛剛開場的時候給大家的驚喜這樣,我們在全球第一次在這樣幾千人的會場上大會的我們的演講,大會的產(chǎn)品發(fā)布,可以同步的語音自動轉(zhuǎn)寫,然后在大屏上顯示。這一套方案,就放在這里已經(jīng)成型了。如果你在意你的服務(wù)的質(zhì)量,你希望未來大會的報告能夠被更多的人當(dāng)場分享或者事后獲取,那么只要你愿意花錢方案就在這里。關(guān)于我們的內(nèi)容服務(wù)的第二大創(chuàng)新,有了交互的入口,回來的這么多數(shù)據(jù)我又有了內(nèi)容來進(jìn)行給他快速的整理,當(dāng)然訊飛聽見,這句話我認(rèn)為非常好,是給聲音插上文字的翅膀。因?yàn)槁曇粼瓉硎遣荒芸粗荒苈牭?,現(xiàn)在一小時聲音5分鐘讓你看就可以。
那么第三個我們智能的推理和學(xué)習(xí),我在前面已經(jīng)給大家報告到了,說科技界人工智能界現(xiàn)在說我們的人工智能認(rèn)知計(jì)算到什么程度,非常重要的一個點(diǎn)就是在高考這個點(diǎn)機(jī)器跟人相比。那么我想跟大家說的是高考包括了很多學(xué)科,數(shù)學(xué)物理化學(xué)等等歷史地理語文英語。那么在這個中間,其實(shí)由于現(xiàn)在的神經(jīng)網(wǎng)絡(luò)的主要算法是基于數(shù)學(xué)統(tǒng)計(jì)建模的,因此我們的計(jì)算機(jī)在高考中考上數(shù)學(xué)物理化學(xué)這些相對比較容易。所以在日本的高考機(jī)器人在數(shù)學(xué)和物理的填空題和選擇題上已經(jīng)達(dá)到學(xué)生的平均水平。最難的是什么?自然語言理解。你要理解題目意思,所以他沒法做大的應(yīng)用題,那么在作文在政治歷史題問答中是最難的。而科大訊飛所承擔(dān)的中國科技部第一個人工智能的重大項(xiàng)目,高考機(jī)器人,我們首先就把它放在了最難的自然語言處理方面。
那么下面我就會告訴大家,我們在這方面有什么成果?而這些成果呢,不僅僅目標(biāo)是奔著3到5年考大學(xué)。更重要的是這些成果今天已經(jīng)可以為我們的教育,帶來巨大的革命。我們可以看一下現(xiàn)在教育的大趨勢。在座的很多教育界的領(lǐng)導(dǎo)和專家。我簡單看一下,其實(shí)現(xiàn)在強(qiáng)調(diào)的就是如何以學(xué)習(xí)者為中心,如何因材施教,如果真的實(shí)現(xiàn)個性化?我們都知道老師上課,一個班同學(xué)。因?yàn)榛A(chǔ)教育,義務(wù)教育是普惠的。如果要讓全班同學(xué)70%同學(xué)能夠聽的比較適度的話,一定有10%到20的同學(xué)吃不飽,10%到20同學(xué)聽不懂。沒辦法兼顧了高端,可能一大半人都聽不懂。兼顧了低端,所有人都浪費(fèi)時間,所以只能普惠。怎么樣把老師的能力延伸,人工智能才可以真的做到,對每一個人單獨(dú)的提供幫助。另外,聽說讀寫能力。伴隨著高考改革大家對英語教學(xué)一直有很多爭論。確實(shí)覺得中國孩子學(xué)英語花的時間太多,而最后我們的英語口語的表達(dá)能力又偏弱。
其實(shí)如果用一個好的機(jī)器,營造真正的英語聽說讀寫的環(huán)境,可以使我們孩子的英語學(xué)習(xí)時間,至少減輕一半以上。那要釋放掉中國未來多少寶貴的聰明智慧,用在鍛煉身體,用在開放他的啟發(fā)式思維能力。在這兩個能力上,我們再看,今天我們能做哪些事?
那么大趨勢上我們看到了還有一個現(xiàn)狀也是這樣。老師上課,他在講課過程中講解到一個知識點(diǎn)之后他不知道同學(xué)們是不是掌握了,那么如果繼續(xù)重復(fù)聽懂的同學(xué)就會很煩,而繼續(xù)往下講沒聽懂的同學(xué)又覺得前面一個知識點(diǎn)沒掌握,這是老師的痛點(diǎn)。那么甚至今天布置完作業(yè)等我明天上課的時候我不知道同學(xué)們昨天作業(yè)今天早晨交過來他到底完成的怎么樣,所以我不知道應(yīng)該重點(diǎn)講昨天的講課中哪幾個知識點(diǎn)。只能等到第二天晚上改完后天上午才知道如何再進(jìn)行復(fù)習(xí),所以教學(xué)的反饋它是割裂的。
可能我們大家都是高考走過來的,至少高三這一年80%的訓(xùn)練是無效和重復(fù)的。當(dāng)年我的數(shù)學(xué)老師就跟我跟我們班同學(xué)說,說今天一天如果你們做的所有題目都對了,千萬別高興,因?yàn)槟氵@一天白過了,一點(diǎn)進(jìn)步都沒有。我們有多少同學(xué)被這樣的重復(fù)訓(xùn)練耽誤了時間,而還有些同學(xué)如果他這一題是附加題根本花兩天都做不會,他就沒必要去學(xué)去做,做了打擊他信心浪費(fèi)他時間,應(yīng)該讓他做跳起來夠得著的題目。所以這個就是我們今天說課后作業(yè),怎么樣給大家更好的幫助。沒有這一些,只能是學(xué)校一本教輔,家長又找第二本第三本第四本讓孩子們整個的課余時間全部被壓掉。那么當(dāng)然口語學(xué)習(xí)非常重要的是沒有課后環(huán)境。
今天用我們的兩項(xiàng)關(guān)鍵技術(shù),可以把這個問題得到歷史性的突破。第一個關(guān)鍵的問題,就是我們怎么樣真的知道每個孩子,在上課的過程中,課后的作業(yè)以及每一次考試和訓(xùn)練過程中,他的知識掌握情況?怎么樣把數(shù)據(jù)匯聚上來?匯聚上來以后,怎么樣能夠自動的評閱,分析出他的知識薄弱環(huán)節(jié)?這是兩個關(guān)鍵的點(diǎn)。這個關(guān)鍵點(diǎn)中,我們再看我們怎么解決的。第一個自動手寫識別。在業(yè)界大家知道嗎?學(xué)生像這個涂改這么多的英語或者語文作文,我的字就寫得很差。
我估計(jì)機(jī)器現(xiàn)在的自動的識別因?yàn)槲覀円寵C(jī)器分析他的薄弱環(huán)節(jié),對知識點(diǎn)進(jìn)行習(xí)得順序的分析,首先要把它的這些東西數(shù)據(jù)把匯聚上來。而這種平均學(xué)生的作業(yè)和考試的手寫準(zhǔn)確率,行業(yè)只有70%平均準(zhǔn)確率。只有做到95%以上甚至98%才能試用。那么不光是語文,對于數(shù)學(xué)理科也是。版面分析相對簡單,更重要的是高清晰度的手寫體識別。那么今天呢科大訊飛的ocr識別在業(yè)界已經(jīng)獨(dú)家率先達(dá)到實(shí)用。這個實(shí)用不是我們說的,是經(jīng)過了專門在中考和高考的畢業(yè)會考中,幾萬份幾十萬份的試卷,機(jī)器跟人的對比中得到的結(jié)論。
那么第二個就是,我們要能夠自動的評分。
數(shù)據(jù)上來了,機(jī)器能不能自動評分?自動評分,就涉及到我剛才講的自然語言理解。我們可以看到這兩個非常重要的數(shù)據(jù)。
一個是我們在安徽,今年7月份,在合肥和安慶,兩個教育非常發(fā)達(dá)的地方,做得針對初三學(xué)生的,漢語和英語的作文。由老師按照傳統(tǒng)方法來打分,然后機(jī)器再來改分。機(jī)器改分有兩條,先自動ocr掃描識別,然后再用我們?nèi)斯ぶ悄茉倥蟹?。結(jié)果出來大家看到,機(jī)器評分跟人比,無論是一致性還是準(zhǔn)確性上。一致性代表了公平性,準(zhǔn)確性代表了精確性。機(jī)器都排第一。
統(tǒng)計(jì)數(shù)據(jù)上,人改完卷子以后由機(jī)器再改,兩者有差距的,再由人工專家組評議最終結(jié)果是80%多,機(jī)器比人要準(zhǔn)。當(dāng)然現(xiàn)在,人已經(jīng)是比較準(zhǔn),能夠滿足教育的要求。但是機(jī)器比人還要更加的公平可信。這個是一個極大的進(jìn)步。更重要是通過他的評價,我們機(jī)器就可以隨時隨地反饋實(shí)現(xiàn)我們的已測數(shù)據(jù)。智能評測也是這樣。在廣東高考15分的英語口語,不光是翻譯的標(biāo)準(zhǔn)化程度,連學(xué)生開放式口語作文,在今年廣東高考都是我們機(jī)器打分超過了廣東最好的口語老師。所以在廣東高考,已經(jīng)由機(jī)器代替老師進(jìn)行口語開放式作文的評分。大家知道,每一分都決定孩子未來。能不能上清華北大科大一分都決定你,那么一定要機(jī)器比人準(zhǔn)。
我們是經(jīng)過了跟各種各樣的國際技術(shù)比賽,只有我們獨(dú)家能使用。有了這些技術(shù),我們就能通過自動閱卷,給出孩子分析的薄弱環(huán)節(jié)。再往下,我們的知識圖譜分析一個知識的習(xí)得順序,然后就可以給孩子有針對性的推薦了。比如說我們看中間這個圖,如果一個孩子一元二次方程沒掌握,或者他可能是二次根式就沒掌握,如果你只跟他講一元二次方程,這個孩子怎么練他都沒用,老師怎么講他還是學(xué)不會。要分析出他的前端的二次根式他是沒太掌握的,有理數(shù)化運(yùn)算掌握了一點(diǎn)點(diǎn),那么有理數(shù)運(yùn)算也有點(diǎn)沒太熟。要順藤摸瓜,把他的基礎(chǔ)環(huán)節(jié)給他做出給他不斷的培訓(xùn)他才能夠不斷地往前進(jìn)。因?yàn)橹R的學(xué)習(xí)是有規(guī)律的,而這個知識點(diǎn)的習(xí)得順序,可以說以前我們沒有看到任何一家公司去做。
因?yàn)橛嶏w有了真正的能夠采集到學(xué)生的數(shù)據(jù),有了人工智能自動判卷使我們有了基礎(chǔ)來做知識圖譜和學(xué)情的診斷。那么這些技術(shù)的出現(xiàn),就會使我們剛才講的個性化學(xué)習(xí)上課的課堂教學(xué)的提升真的成為可能。那么下面我們請大家簡單看一下我們的具體的技術(shù)產(chǎn)品的演示。那么在我們剛才講到的這些技術(shù)突破的技術(shù)上,我們今天已經(jīng)給大家呈現(xiàn)了兩個已經(jīng)具體可用的產(chǎn)品,而且已經(jīng)在一線的老師和學(xué)生的使用中已經(jīng)取得了初步成效。一個是智學(xué)網(wǎng)讓學(xué)生的學(xué)習(xí)變得更加智慧。分析診斷,提供一個學(xué)習(xí)的平臺。一個是E聽說,就是我們的英語聽說的智能教學(xué)系統(tǒng)。
我們分別看一下那么智學(xué)網(wǎng)中,首先可以進(jìn)行自動的分析智能診斷,從過程化的作業(yè)或者單元訓(xùn)練或者考試中能夠給老師在備課在課中授課中提供非常多的這個依據(jù)。同學(xué)們?nèi)绻f大約90%都了解老師上課就不用說了,錄一個簡單微課讓個別學(xué)生回家去看。小于30%的正確率大部分人沒掌握較重點(diǎn)備課,這是一個簡單的示意。
課中老師每講完一個知識點(diǎn),同學(xué)們可以通過我們的答題器或者Pad或者手機(jī)上傳數(shù)據(jù),自動分析然后給出來他需不需要,在這個過程中這個知識點(diǎn)再講一遍,需不需要這個直接講下一個知識點(diǎn)。等到下課的時候他就知道針對全班同學(xué)怎么樣布置不同的有針對性的作業(yè)。那么孩子回到家也可以自主性的去學(xué)習(xí),那么這樣的一套方法從理論走到實(shí)踐我們已經(jīng)看到。
現(xiàn)在已經(jīng)比如說合肥一中我給大家舉個例子,這就是提高老師課堂效率的。同樣一個老師教數(shù)學(xué)課,在高二下學(xué)期,就是我們剛剛做的驗(yàn)證。因?yàn)楹戏室恢惺前不站C合實(shí)力最好的學(xué)校,它的年級有幾十個班級,30多個班級。這個老師帶著有個班數(shù)學(xué)是第12名,用了半學(xué)期到了高三,就是全年級第一名。
我們再看蚌埠二中,今年安徽高考的狀元是蚌埠二中的。他在高考成績還沒出來之前,教育部在那邊開現(xiàn)場會,他們的校長就說,我用了科大訊飛的智學(xué)網(wǎng),原本一個課堂的習(xí)題和訓(xùn)練講解,45分鐘,現(xiàn)在只要15分鐘,剩下30分鐘來進(jìn)行啟發(fā)式拓展性教學(xué)。所以我們學(xué)生的學(xué)習(xí)效率大幅提升。不光是在安徽,在深圳中學(xué),在越來越多的城市?,F(xiàn)在全國已經(jīng)有12個省120個城市的,超過3000所學(xué)校,在持續(xù)的應(yīng)用深化。我們越來越多的成果,將真的能夠推動,我們孩子學(xué)得更愉快,花的時間更少,知識掌握的還更加牢固。
那么另外呢我們E聽說——是教孩子學(xué)英語的,在廣東高考中已經(jīng)開始用第一個用,在江蘇中考也所有的學(xué)生都在用。那么可以通過,專家和我們的人工智能系統(tǒng)相互之間的校驗(yàn)和分析給出了專門的訓(xùn)練。然后在訓(xùn)練基礎(chǔ)上有針對性的給出學(xué)生的口語練習(xí),根據(jù)他的興趣圖譜他感興趣他會學(xué)的更快。根據(jù)它的因?yàn)槲覀兛梢酝扑]各種不同的大片,他的薄弱環(huán)節(jié)來練習(xí),最終使得學(xué)生在趣味性的訓(xùn)練中口語能力得到了提升。那么這個我們可以給大家看一下,目前已經(jīng)有這么多地方,其實(shí)全國已經(jīng)有幾十個省市,開始在試點(diǎn)應(yīng)用
。在廣東省,就在今年高考前,因?yàn)閺V東英語口語考試是4月份。在廣州市天河區(qū)一個區(qū)的同學(xué),通過我們的平臺訓(xùn)練了一個多月,平均成績提高了將近20%。這個充分看到,新技術(shù)手段給大家?guī)淼膸椭?。那所以我就告訴大家的就是我們新推出的智學(xué)網(wǎng)和E聽說,可以為我們少年兒童真正的開心成長開心學(xué)習(xí)和快樂成長提供最好的人工智能技術(shù)的保障。那么我們教育部有了非常好的教育改革發(fā)展的理念。那么所有家長和孩子都有的期待,但是沒有好的技術(shù)做支撐,這些理念是很難落到實(shí)處的。今天我非常高興的給我們在座的各位教育部的領(lǐng)導(dǎo)教育口的專家和老師們匯報,今天科大訊飛在這里我覺得又邁出了堅(jiān)實(shí)的一步。
其實(shí)我們在前面的這些分析中,剛剛就已經(jīng)介紹完了我們今天的三大發(fā)布。都是圍繞著人工智能認(rèn)知計(jì)算三大最核心的能力:交互,知識的管理,學(xué)習(xí)和推理。我覺得隨著這些技術(shù)的進(jìn)步,我們可以明確做一些判斷。第一,在萬物互聯(lián)的浪潮下,以語音為主,以鍵盤觸摸為輔的人機(jī)交互時代已經(jīng)到來。我們在手機(jī)上,因?yàn)橛衅粒驗(yàn)橛薪v,可是在未來3到5年,我們周圍的90%的設(shè)備,將不是手機(jī),而是穿戴式設(shè)備、智能家居以及可能是服務(wù)機(jī)器人。這時候沒有屏幕離你很遠(yuǎn),不可能觸摸它,而語音為主的時代正在到來。今天我們已經(jīng)做好了準(zhǔn)備。那么第二個,人工智能未來一定會像水和電一樣無所不在,廣泛而深入到影響到我們每一個人生活。我們甚至認(rèn)為在未來5年之內(nèi)在這樣的會場,一定會有機(jī)器人在給大家端茶倒水,否則大家會覺得這樣一個發(fā)布會實(shí)在是太沒有科技含量。那么第三,就是以語音和語言為入口的認(rèn)知革命,將推動人工智能夢想成真,這是一條人工智能走認(rèn)知計(jì)算的必由之路。而非常幸運(yùn)的是,中國企業(yè)和科技界,以科大訊飛為代表,我們在語音和語言技術(shù)上,已經(jīng)做到了全球最領(lǐng)先。
所以我想在今天的結(jié)束之前想還跟大家做一個分享,那么今天呢我們?nèi)祟愓驹诹艘粋€全新的起點(diǎn)上。人工智能專家一直在討論和分析,說人工智能究竟是替代掉我們?nèi)祟?,是將來要主宰這個地球,還是說人工智能是為我們?nèi)祟惙?wù)的。
我們科大訊飛作為這個產(chǎn)業(yè)中最前沿的科技產(chǎn)學(xué)研合作的典型代表,我們堅(jiān)定不移地認(rèn)為人工智能一定是為人類服務(wù)的,是用來延展我們?nèi)祟惖哪芰Φ?。那么隨著我們?nèi)祟惖哪芰νㄟ^萬物互聯(lián)時代的語音和語言交互,使我們的智慧可以在后臺進(jìn)行碰撞進(jìn)行比對相互啟發(fā)獲得靈感,我們?nèi)祟惖娜后w智慧會上一個巨大的臺階。
到那個時候不是奇點(diǎn)臨近,不是人類末日的到來,而是人類一個全新時代的開始。因?yàn)槿祟惐旧砭筒皇浅錾鸀榱斯ぷ鞯模覀冇欣碛梢盐覀兊母嗟膶氋F的時間和精力在我們最黃金的工作時間用來思考更偉大的事情,用來探索更幸福更美好的未來。我想科大訊飛就是要跟各位一道來開啟用人工智能改變世界的全新的征程。謝謝大家!
標(biāo)簽 科技創(chuàng)新- 責(zé)任編輯:關(guān)一丁
-
最新聞 Hot
-
特朗普要“幫忙”,印度拒絕了
-
“他想在大馬士革建特朗普大廈”
-
中美日內(nèi)瓦經(jīng)貿(mào)會談聯(lián)合聲明
-
中方嚴(yán)管稀土出口,印度也“慌了”
-
“他有望在獄中贏得市長選舉”
-
石破茂再強(qiáng)硬表態(tài):美國,還不降
-
美方吹風(fēng)會:中美都不想“脫鉤”,同意稅率下調(diào)115%
-
卡塔爾送大禮引爭議,特朗普:免費(fèi)的也罵?
-
美國小企業(yè)苦苦掙扎:利潤蒸發(fā)甚至變?yōu)樨?fù)數(shù),最糟的時刻還未到來
-
特朗普施壓后,澤連斯基表態(tài):我去土耳其等普京
-
日車企利潤暴跌超20%,“與中國競爭加劇”
-
中美會談結(jié)束后,美國股指期貨應(yīng)聲上漲
-
“特朗普夜不能寐,搞定全球問題比想象難得多”
-
靠岸中國貨船數(shù)“歸零”,美西港口官員驚到了
-
“出軌女下屬”,英國海軍一把手被免職
-
“聽加州的,否則美國最大經(jīng)濟(jì)體地位不?!?/a>
-