-
孫凝暉:拼算法還是拼新型基礎(chǔ)設(shè)施?中國如何選擇智能計算發(fā)展道路
智能計算發(fā)展的第四階段是大模型計算系統(tǒng)(2020年)。在人工智能大模型技術(shù)的推動下,智能計算邁向新的高度。2020年,AI從“小模型+判別式”轉(zhuǎn)向“大模型+生成式”,從傳統(tǒng)的人臉識別、目標檢測、文本分類,升級到如今的文本生成、3D數(shù)字人生成、圖像生成、語音生成、視頻生成。大語言模型在對話系統(tǒng)領(lǐng)域的一個典型應(yīng)用是OpenAI公司的ChatGPT,它采用預(yù)訓(xùn)練基座大語言模型GPT-3,引入3000億單詞的訓(xùn)練語料,相當于互聯(lián)網(wǎng)上所有英語文字的總和。其基本原理是:通過給它一個輸入,讓它預(yù)測下一個單詞來訓(xùn)練模型,通過大量訓(xùn)練提升預(yù)測精確度,最終達到向它詢問一個問題,大模型產(chǎn)生一個答案,與人即時對話。在基座大模型的基礎(chǔ)上,再給它一些提示詞進行有監(jiān)督的指令微調(diào),通過人類的<指令,回復(fù)>對逐漸讓模型學(xué)會如何與人進行多輪對話;最后,通過人為設(shè)計和自動生成的獎勵函數(shù)來進行強化學(xué)習迭代,逐步實現(xiàn)大模型與人類價值觀的對齊。
大模型的特點是以“大”取勝,其中有三層含義,(1)參數(shù)大,GPT-3就有1700億個參數(shù);(2)訓(xùn)練數(shù)據(jù)大,ChatGPT大約用了3000億個單詞,570GB訓(xùn)練數(shù)據(jù);(3)算力需求大,GPT-3大約用了上萬塊V100 GPU進行訓(xùn)練。為滿足大模型對智能算力爆炸式增加的需求,國內(nèi)外都在大規(guī)模建設(shè)耗資巨大的新型智算中心,英偉達公司也推出了采用256個H100芯片,150TB海量GPU內(nèi)存等構(gòu)成的大模型智能計算系統(tǒng)。
大模型的出現(xiàn)帶來了三個變革。
一是技術(shù)上的規(guī)模定律(Scaling Law),即很多AI模型的精度在參數(shù)規(guī)模超過某個閾值后模型能力快速提升,其原因在科學(xué)界還不是非常清楚,有很大的爭議。AI模型的性能與模型參數(shù)規(guī)模、數(shù)據(jù)集大小、算力總量三個變量成“對數(shù)線性關(guān)系”,因此可以通過增大模型的規(guī)模來不斷提高模型的性能。目前最前沿的大模型GPT-4參數(shù)量已經(jīng)達到了萬億到十萬億量級,并且仍在不斷增長中;
二是產(chǎn)業(yè)上算力需求爆炸式增長,千億參數(shù)規(guī)模大模型的訓(xùn)練通常需要在數(shù)千乃至數(shù)萬GPU卡上訓(xùn)練2-3個月時間,急劇增加的算力需求帶動相關(guān)算力企業(yè)超高速發(fā)展,英偉達的市值接近兩萬億美元,對于芯片企業(yè)以前從來沒有發(fā)生過;
三是社會上沖擊勞動力市場,北京大學(xué)國家發(fā)展研究院與智聯(lián)招聘聯(lián)合發(fā)布的《AI大模型對我國勞動力市場潛在影響研究》報告指出,受影響最大的20個職業(yè)中財會、銷售、文書位于前列,需要與人打交道并提供服務(wù)的體力勞動型工作,如人力資源、行政、后勤等反而相對更安全。
人工智能的技術(shù)前沿將朝著以下四個方向發(fā)展。
第一個前沿方向為多模態(tài)大模型。從人類視角出發(fā),人類智能是天然多模態(tài)的,人擁有眼、耳、鼻、舌、身、嘴(語言),從AI視角出發(fā),視覺,聽覺等也都可以建模為token②的序列,可采取與大語言模型相同的方法進行學(xué)習,并進一步與語言中的語義進行對齊,實現(xiàn)多模態(tài)對齊的智能能力。
第二個前沿方向為視頻生成大模型。OpenAI于2024年2月15日發(fā)布文生視頻模型SORA,將視頻生成時長從幾秒鐘大幅提升到一分鐘,且在分辨率、畫面真實度、時序一致性等方面都有顯著提升。SORA的最大意義是它具備了世界模型的基本特征,即人類觀察世界并進一步預(yù)測世界的能力。世界模型是建立在理解世界的基本物理常識(如,水往低處流等)之上,然后觀察并預(yù)測下一秒將要發(fā)生什么事件。雖然SORA要成為世界模型仍然存在很多問題,但可以認為SORA學(xué)會了畫面想象力和分鐘級未來預(yù)測能力,這是世界模型的基礎(chǔ)特征。
第三個前沿方向為具身智能。具身智能指有身體并支持與物理世界進行交互的智能體,如機器人、無人車等,通過多模態(tài)大模型處理多種傳感數(shù)據(jù)輸入,由大模型生成運動指令對智能體進行驅(qū)動,替代傳統(tǒng)基于規(guī)則或者數(shù)學(xué)公式的運動驅(qū)動方式,實現(xiàn)虛擬和現(xiàn)實的深度融合。因此,具有具身智能的機器人,可以聚集人工智能的三大流派:以神經(jīng)網(wǎng)絡(luò)為代表的連接主義,以知識工程為代表的符號主義和控制論相關(guān)的行為主義,三大流派可以同時作用在一個智能體,這預(yù)期會帶來新的技術(shù)突破。
第四個前沿方向是AI4R(AI for Research)成為科學(xué)發(fā)現(xiàn)與技術(shù)發(fā)明的主要范式。當前科學(xué)發(fā)現(xiàn)主要依賴于實驗和人腦智慧,由人類進行大膽猜想、小心求證,信息技術(shù)無論是計算和數(shù)據(jù),都只是起到一些輔助和驗證的作用。相較于人類,人工智能在記憶力、高維復(fù)雜、全視野、推理深度、猜想等方面具有較大優(yōu)勢,是否能以AI為主進行一些科學(xué)發(fā)現(xiàn)和技術(shù)發(fā)明,大幅提升人類科學(xué)發(fā)現(xiàn)的效率,比如主動發(fā)現(xiàn)物理學(xué)規(guī)律、預(yù)測蛋白質(zhì)結(jié)構(gòu)、設(shè)計高性能芯片、高效合成新藥等。因為人工智能大模型具有全量數(shù)據(jù),具備上帝視角,通過深度學(xué)習的能力,可以比人向前看更多步數(shù),如能實現(xiàn)從推斷(inference)到推理(reasoning)的躍升,人工智能模型就有潛力具備愛因斯坦一樣的想象力和科學(xué)猜想能力,極大提升人類科學(xué)發(fā)現(xiàn)的效率,打破人類的認知邊界。這才是真正的顛覆所在。
最后,通用人工智能③(Artificial General Intelligence,簡稱AGI)是一個極具挑戰(zhàn)的話題,極具爭論性。曾經(jīng)有一個哲學(xué)家和一個神經(jīng)科學(xué)家打賭:25年后(即2023年)科研人員是否能夠揭示大腦如何實現(xiàn)意識?當時關(guān)于意識有兩個流派,一個叫集成信息理論,一個叫全局網(wǎng)絡(luò)工作空間理論,前者認為意識是由大腦中特定類型神經(jīng)元連接形成的“結(jié)構(gòu)”,后者指出意識是當信息通過互連網(wǎng)絡(luò)傳播到大腦區(qū)域時產(chǎn)生的。2023年,人們通過六個獨立實驗室進行了對抗性實驗,結(jié)果與兩種理論均不完全匹配,哲學(xué)家贏了,神經(jīng)科學(xué)家輸了。通過這一場賭約,可以看出人們總是希望人工智能能夠了解人類的認知和大腦的奧秘。從物理學(xué)的視角看,物理學(xué)是對宏觀世界有了透徹理解后,從量子物理起步開啟了對微觀世界的理解。智能世界與物理世界一樣,都是具有巨大復(fù)雜度的研究對象,AI大模型仍然是通過數(shù)據(jù)驅(qū)動等研究宏觀世界的方法,提高機器的智能水平,對智能宏觀世界理解并不夠,直接到神經(jīng)系統(tǒng)微觀世界尋找答案是困難的。人工智能自誕生以來,一直承載著人類關(guān)于智能與意識的種種夢想與幻想,也激勵著人們不斷探索。
中國:人工智能企業(yè)以AI“國家隊”和創(chuàng)業(yè)獨角獸為主,其中“國家隊”多綜合布局技術(shù)與應(yīng)用領(lǐng)域,創(chuàng)業(yè)獨角獸多深耕垂直技術(shù)與應(yīng)用市場
美國:人工智能廠商較多,軟硬實力兼具,大型廠商多綜合布局AI產(chǎn)業(yè),創(chuàng)業(yè)公司遍布基礎(chǔ)層、技術(shù)層和應(yīng)用層
03 人工智能的安全風險
人工智能的發(fā)展促進了當今世界科技進步的同時,也帶來了很多安全風險,要從技術(shù)與法規(guī)兩方面加以應(yīng)對。
首先是互聯(lián)網(wǎng)虛假信息泛濫。這里列舉若干場景:
一是數(shù)字分身。AI Yoon是首個使用 DeepFake 技術(shù)合成的官方“候選人”,這個數(shù)字人以韓國國民力量黨候選人尹錫悅(Yoon Suk-yeol)為原型,借助尹錫悅 20 小時的音頻和視頻片段、以及其專門為研究人員錄制的 3000 多個句子,由當?shù)匾患?DeepFake 技術(shù)公司創(chuàng)建了虛擬形象 AI Yoon,并在網(wǎng)絡(luò)上迅速走紅。實際上 AI Yoon 表達的內(nèi)容是由競選團隊撰寫的,而不是候選人本人。
二是偽造視頻。尤其是偽造領(lǐng)導(dǎo)人視頻引起國際爭端,擾亂選舉秩序,或引起突發(fā)輿情事件,如偽造尼克松宣布第一次登月失敗,偽造烏克蘭總統(tǒng)澤連斯基宣布“投降”的信息,這些行為導(dǎo)致新聞媒體行業(yè)的社會信任衰退。
三是偽造新聞。主要通過虛假新聞自動生成牟取非法利益,使用ChatGPT生成熱點新聞,賺取流量,截至2023年6月30日全球生成偽造新聞網(wǎng)站已達277個,嚴重擾亂社會秩序。
四是換臉變聲,用于詐騙。如由于AI語音模仿了企業(yè)高管的聲音,一家香港國際企業(yè)因此被騙3500萬美元。
五是生成不雅圖片,特別是針對公眾人物。如影視明星的色情視頻制作,造成不良社會影響。因此,迫切需要發(fā)展互聯(lián)網(wǎng)虛假信息的偽造檢測技術(shù)。
其次,AI大模型面臨嚴重可信問題。這些問題包括:(1)“一本正經(jīng)胡說八道”的事實性錯誤;(2)以西方價值觀敘事,輸出政治偏見和錯誤言論;(3)易被誘導(dǎo),輸出錯誤知識和有害內(nèi)容;(4)數(shù)據(jù)安全問題加重,大模型成為重要敏感數(shù)據(jù)的誘捕器,ChatGPT將用戶輸入納入訓(xùn)練數(shù)據(jù)庫,用于改善ChatGPT,美方能夠利用大模型獲得公開渠道覆蓋不到的中文語料,掌握我們自己都可能不掌握的“中國知識”。因此,迫切需要發(fā)展大模型安全監(jiān)管技術(shù)與自己的可信大模型。
除了技術(shù)手段外,人工智能安全保障需要相關(guān)立法工作。2021年科技部發(fā)布《新一代人工智能倫理規(guī)范》,2022年8月,全國信息安全標準化技術(shù)委員會發(fā)布《信息安全技術(shù)機器學(xué)習算法安全評估規(guī)范》,2022-2023年,中央網(wǎng)信辦先后發(fā)布《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》《生成式人工智能服務(wù)管理辦法》等。歐美國家也先后出臺法規(guī),2018年5月25日,歐盟出臺《通用數(shù)據(jù)保護條例》,2022年10月4日,美國發(fā)布《人工智能權(quán)利法案藍圖》,2024年3月13日,歐洲議會通過了歐盟《人工智能法案》。
我國應(yīng)加快推進《人工智能法》出臺,構(gòu)建人工智能治理體系,確保人工智能的發(fā)展和應(yīng)用遵循人類共同價值觀,促進人機和諧友好;創(chuàng)造有利于人工智能技術(shù)研究、開發(fā)、應(yīng)用的政策環(huán)境;建立合理披露機制和審計評估機制,理解人工智能機制原理和決策過程;明確人工智能系統(tǒng)的安全責任和問責機制,可追溯責任主體并補救;推動形成公平合理、開放包容的國際人工智能治理規(guī)則。
- 原標題:人工智能與智能計算的發(fā)展 本文僅代表作者個人觀點。
- 責任編輯: 史岱君 
-
韓國宇宙航空廳正式成立
2024-05-27 16:15 航空航天 -
丁薛祥出席2024年全國科技活動周暨北京科技周主場活動
2024-05-26 20:12 -
我國首艘海島(礁)綜合地質(zhì)調(diào)查船正式列裝
2024-05-25 07:22 南海局勢 -
猶如“火車變軌”,全球首例古潛山裸眼側(cè)鉆分支井技術(shù)成功應(yīng)用
2024-05-19 19:37 能源戰(zhàn)略 -
我國種豬有了“國產(chǎn)芯”!打破高度依賴國外局面
2024-05-18 15:02 聚焦三農(nóng) -
北京:擬探索分體式飛行汽車城際通勤+城內(nèi)擺渡應(yīng)用新業(yè)態(tài)
2024-05-16 18:03 -
我國量子計算機重大突破!這根“線”一度被日本壟斷…...
2024-05-16 10:15 科技前沿 -
世界最長海底高鐵隧道怎么建?要攻克三大難題
2024-05-16 10:10 超級工程 -
“超級顯微鏡”升級!上海光源線站工程通過國家驗收
2024-05-15 17:02 科技前沿 -
谷歌放大招,AI搜索引擎來了
2024-05-15 08:41 大公司 -
硬剛!“中企起訴美國防部”
2024-05-14 17:34 -
“類人速度”新模型來了,AI進入《她》時代?
2024-05-14 10:02 人工智能 -
刷新紀錄!我國科研團隊破解工程建設(shè)哥德巴赫猜想
2024-05-12 20:24 超級工程 -
“中國天眼”發(fā)現(xiàn)迄今最遠中性氫星系
2024-05-11 16:27 -
高鐵崇明站預(yù)計年內(nèi)開工建設(shè)
2024-05-11 13:56 高鐵世紀 -
小模型技術(shù)是中國企業(yè)率先導(dǎo)入裝備中,大模型也不會例外
2024-05-09 08:42 -
國際首次!“量子模擬的圣杯之一”,我國科學(xué)家取得重大進展
2024-05-06 12:12 科技前沿 -
嫦娥六號成功發(fā)射!開啟人類首次月球背面取樣之旅
2024-05-03 17:19 航空航天 -
環(huán)環(huán)相扣、步步關(guān)鍵!嫦娥六號月背出差之旅日程表
2024-05-03 16:22 航空航天 -
今天上午太陽爆發(fā)強耀斑,對我國上空電離層產(chǎn)生影響
2024-05-03 14:09 天文
相關(guān)推薦 -
“印巴沖突是敘事之戰(zhàn),中國裝備重要性凸顯” 評論 103特朗普故弄玄虛稱“和某大國達成協(xié)議”,就這? 評論 152巴外長證實:殲-10擊落印軍“陣風” 評論 708美財長:這些嬰童用品從中國進口,考慮降稅 評論 159最新聞 Hot
-
沖突愈演愈烈,莫迪首發(fā)聲
-
挪威發(fā)布國家安全戰(zhàn)略:美國不可靠,需要跟歐洲抱團
-
印度兩座水電站已重新開閘
-
“印巴沖突是敘事之戰(zhàn),中國裝備重要性凸顯”
-
夸大對華關(guān)稅效果,她被打假了
-
突發(fā)!巴稱擊斃約50名印士兵,印稱摧毀巴第二大城市防空系統(tǒng)
-
彈射座椅大廠泄露了印巴空戰(zhàn)戰(zhàn)損“天機”?
-
巴總理:關(guān)鍵時刻,感謝“親愛的兄弟”埃爾多安
-
日本地鐵出現(xiàn)隨機殺人事件,男子揮20厘米菜刀砍傷2人
-
“斯洛伐克幾分鐘前才被通知…現(xiàn)在知道國際政治是啥了吧”
-
“俄羅斯要價太高,但...”
-
烏克蘭議會批準美烏礦產(chǎn)協(xié)議
-
“特朗普稱要把這改叫阿拉伯灣”,伊朗譴責:我們也沒反對阿拉伯海
-
巴外長證實:殲-10擊落印軍“陣風”
-
“中國遠落后于美國的時代已終結(jié)”
-
“接到指示,美情報機構(gòu)加強搜集力度”
-