-
孫凝暉:拼算法還是拼新型基礎(chǔ)設(shè)施?中國(guó)如何選擇智能計(jì)算發(fā)展道路
04 中國(guó)智能計(jì)算發(fā)展困境
人工智能技術(shù)與智能計(jì)算產(chǎn)業(yè)處于中美科技競(jìng)爭(zhēng)的焦點(diǎn),我國(guó)在過(guò)去幾年雖然取得了很大的成績(jī),但依然面臨諸多發(fā)展困境,特別是由美國(guó)的科技打壓政策帶來(lái)的困難。
困境一為美國(guó)在AI核心能力上長(zhǎng)期處于領(lǐng)先地位,中國(guó)處于跟蹤模式。中國(guó)在AI高端人才數(shù)量、AI基礎(chǔ)算法創(chuàng)新、AI底座大模型能力(大語(yǔ)言模型、文生圖模型、文生視頻模型)、底座大模型訓(xùn)練數(shù)據(jù)、底座大模型訓(xùn)練算力等,都與美國(guó)存在一定的差距,并且這種差距還將持續(xù)很長(zhǎng)一段時(shí)間。
困境二為高端算力產(chǎn)品禁售,高端芯片工藝長(zhǎng)期被卡。A100,H100,B200等高端智算芯片對(duì)華禁售。華為、龍芯、寒武紀(jì)、曙光、海光等企業(yè)都進(jìn)入實(shí)體清單,它們芯片制造的先進(jìn)工藝④受限,國(guó)內(nèi)可滿足規(guī)模量產(chǎn)的工藝節(jié)點(diǎn)落后國(guó)際先進(jìn)水平2-3代,核心算力芯片的性能落后國(guó)際先進(jìn)水平2-3代。
困境三為國(guó)內(nèi)智能計(jì)算生態(tài)孱弱,AI開發(fā)框架滲透率不足。英偉達(dá)CUDA⑤(Compute Unified Device Architecture, 通用計(jì)算設(shè)備架構(gòu))生態(tài)完備,已形成了事實(shí)上的壟斷。國(guó)內(nèi)生態(tài)孱弱,具體表現(xiàn)在:一是研發(fā)人員不足,英偉達(dá)CUDA生態(tài)有近2萬(wàn)人開發(fā),是國(guó)內(nèi)所有智能芯片公司人員總和的20倍;二是開發(fā)工具不足,CUDA有550個(gè)SDK(Software Development Kit, 軟件開發(fā)工具包),是國(guó)內(nèi)相關(guān)企業(yè)的上百倍;三是資金投入不足,英偉達(dá)每年投入50億美元,是國(guó)內(nèi)相關(guān)公司的幾十倍;四是AI開發(fā)框架TensorFlow占據(jù)工業(yè)類市場(chǎng),PyTorch占據(jù)研究類市場(chǎng),百度飛槳等國(guó)產(chǎn)AI開發(fā)框架的開發(fā)人員只有國(guó)外框架的1/10。更為嚴(yán)重的是國(guó)內(nèi)企業(yè)之間山頭林立,無(wú)法形成合力,從智能應(yīng)用、開發(fā)框架、系統(tǒng)軟件、智能芯片,雖然每層都有相關(guān)產(chǎn)品,但各層之間沒有深度適配,無(wú)法形成一個(gè)有競(jìng)爭(zhēng)力的技術(shù)體系。
困境四為AI應(yīng)用于行業(yè)時(shí)成本、門檻居高不下。當(dāng)前我國(guó)AI應(yīng)用主要集中在互聯(lián)網(wǎng)行業(yè)和一些國(guó)防領(lǐng)域。AI技術(shù)推廣應(yīng)用于各行各業(yè)時(shí),特別是從互聯(lián)網(wǎng)行業(yè)遷移到非互聯(lián)網(wǎng)行業(yè),需要進(jìn)行大量的定制工作,遷移難度大,單次使用成本高。最后,我國(guó)在AI領(lǐng)域的人才數(shù)量與實(shí)際需求相比也明顯不足。
05 中國(guó)如何發(fā)展智能計(jì)算的道路選擇
人工智能發(fā)展的道路選擇對(duì)我國(guó)至關(guān)重要,關(guān)系到發(fā)展的可持續(xù)性與最終的國(guó)際競(jìng)爭(zhēng)格局。當(dāng)前人工智能的使用成本十分高昂,微軟Copilot套件要支付每月10美元的使用費(fèi)用,ChatGPT每天消耗50萬(wàn)千瓦時(shí)的電力,英偉達(dá)B200芯片價(jià)格高達(dá)3萬(wàn)美元以上。總體來(lái)說(shuō),我國(guó)應(yīng)發(fā)展用得起、安全可信的人工智能技術(shù),消除我國(guó)信息貧困人口、并造?!耙粠б宦贰眹?guó)家;低門檻地賦能各行各業(yè),讓我國(guó)的優(yōu)勢(shì)產(chǎn)業(yè)保持競(jìng)爭(zhēng)力,讓相對(duì)落后的產(chǎn)業(yè)能夠大幅地縮小差距。
選擇一:統(tǒng)一技術(shù)體系走閉源封閉,還是開源開放的道路?
支撐智能計(jì)算產(chǎn)業(yè)的是一個(gè)相互緊耦合的技術(shù)體系,即由一系列技術(shù)標(biāo)準(zhǔn)和知識(shí)產(chǎn)權(quán)將材料、器件、工藝、芯片、整機(jī)、系統(tǒng)軟件、應(yīng)用軟件等密切聯(lián)系在一起的技術(shù)整體。我國(guó)發(fā)展智能計(jì)算技術(shù)體系存在三條道路:
一是追趕兼容美國(guó)主導(dǎo)的A體系。我國(guó)大多數(shù)互聯(lián)網(wǎng)企業(yè)走的是GPGPU/CUDA兼容道路,很多芯片領(lǐng)域的創(chuàng)業(yè)企業(yè)在生態(tài)構(gòu)建上也是盡量與CUDA兼容,這條道路較為現(xiàn)實(shí)。由于在算力方面美國(guó)對(duì)我國(guó)工藝和芯片帶寬的限制,在算法方面國(guó)內(nèi)生態(tài)林立很難形成統(tǒng)一,生態(tài)成熟度嚴(yán)重受限,在數(shù)據(jù)方面中文高質(zhì)量數(shù)據(jù)匱乏,這些因素會(huì)使得追趕者與領(lǐng)先者的差距很難縮小,一些時(shí)候還會(huì)進(jìn)一步拉大?! ?
二是構(gòu)建專用封閉的B體系。在軍事、氣象、司法等專用領(lǐng)域構(gòu)建企業(yè)封閉生態(tài),基于國(guó)產(chǎn)成熟工藝生產(chǎn)芯片,相對(duì)于底座大模型更加關(guān)注特定領(lǐng)域垂直類大模型,訓(xùn)練大模型更多采用領(lǐng)域?qū)S懈哔|(zhì)量數(shù)據(jù)等。這條道路易于形成完整可控的技術(shù)體系與生態(tài),我國(guó)一些大型骨干企業(yè)走的是這條道路,它的缺點(diǎn)是封閉,無(wú)法凝聚國(guó)內(nèi)大多數(shù)力量,也很難實(shí)現(xiàn)全球化?! ?
三是全球共建開源開放的C體系。用開源打破生態(tài)壟斷,降低企業(yè)擁有核心技術(shù)的門檻,讓每個(gè)企業(yè)都能低成本地做自己的芯片,形成智能芯片的汪洋大海,滿足無(wú)處不在的智能需求。用開放形成統(tǒng)一的技術(shù)體系,我國(guó)企業(yè)與全球化力量聯(lián)合起來(lái)共建基于國(guó)際標(biāo)準(zhǔn)的統(tǒng)一智能計(jì)算軟件棧。形成企業(yè)競(jìng)爭(zhēng)前共享機(jī)制,共享高質(zhì)量數(shù)據(jù)庫(kù),共享開源通用底座大模型。對(duì)于全球開源生態(tài),我國(guó)企業(yè)在互聯(lián)網(wǎng)時(shí)代收益良多,我國(guó)更多的是使用者,是參與者,在智能時(shí)代我國(guó)企業(yè)在RISC-V⑥+AI開源技術(shù)體系上應(yīng)更多地成為主力貢獻(xiàn)者,成為全球化開放共享的主導(dǎo)力量。
選擇二:拼算法模型,還是拼新型基礎(chǔ)設(shè)施?
人工智能技術(shù)要賦能各行各業(yè),具有典型的長(zhǎng)尾效應(yīng)⑦。我國(guó)80%的中小微企業(yè),需要的是低門檻、低價(jià)格的智能服務(wù)。因此,我國(guó)智能計(jì)算產(chǎn)業(yè)必須建立在新的數(shù)據(jù)空間基礎(chǔ)設(shè)施之上,其中關(guān)鍵是我國(guó)應(yīng)率先實(shí)現(xiàn)智能要素即數(shù)據(jù)、算力、算法的全面基礎(chǔ)設(shè)施化。這項(xiàng)工作可比肩二十世紀(jì)初美國(guó)信息高速公路計(jì)劃(即信息基礎(chǔ)設(shè)施建設(shè))對(duì)互聯(lián)網(wǎng)產(chǎn)業(yè)的歷史作用。
信息社會(huì)最核心的生產(chǎn)力是網(wǎng)絡(luò)空間(Cyberspace)。網(wǎng)絡(luò)空間的演進(jìn)過(guò)程是:從機(jī)器一元連接構(gòu)成的計(jì)算空間,演進(jìn)到人機(jī)信息二元連接構(gòu)成的信息空間,再演進(jìn)到人機(jī)物數(shù)據(jù)三元連接構(gòu)成的數(shù)據(jù)空間。從數(shù)據(jù)空間看,人工智能的本質(zhì)是數(shù)據(jù)的百煉成鋼,大模型就是對(duì)互聯(lián)網(wǎng)全量數(shù)據(jù)進(jìn)行深度加工后的產(chǎn)物。在數(shù)字化時(shí)代,在互聯(lián)網(wǎng)上傳輸?shù)氖切畔⒘鳎撬懔?duì)數(shù)據(jù)進(jìn)行粗加工后的結(jié)構(gòu)化抽象;在智能時(shí)代,在互聯(lián)網(wǎng)上傳輸?shù)氖侵悄芰?,是算力?duì)數(shù)據(jù)進(jìn)行深度加工與精煉后的模型化抽象。智能計(jì)算的一個(gè)核心特征就是用數(shù)值計(jì)算、數(shù)據(jù)分析、人工智能等算法,在算力池中加工海量數(shù)據(jù)件,得到智能模型,再嵌入到信息世界、物理世界的各個(gè)過(guò)程中。
我國(guó)政府已經(jīng)前瞻性地提前布局了新型基礎(chǔ)設(shè)施,在世界各國(guó)競(jìng)爭(zhēng)中搶占了先機(jī)。
首先,數(shù)據(jù)已成為國(guó)家戰(zhàn)略信息資源。數(shù)據(jù)具有資源要素與價(jià)值加工兩重屬性,數(shù)據(jù)的資源要素屬性包括生產(chǎn)、獲取、傳輸、匯聚、流通、交易、權(quán)屬、資產(chǎn)、安全等各個(gè)環(huán)節(jié),我國(guó)應(yīng)繼續(xù)加大力度建設(shè)國(guó)家數(shù)據(jù)樞紐與數(shù)據(jù)流通基礎(chǔ)設(shè)施。
其次,AI大模型就是數(shù)據(jù)空間的一類算法基礎(chǔ)設(shè)施。以通用大模型為基座,構(gòu)建大模型研發(fā)與應(yīng)用的基礎(chǔ)設(shè)施,支撐廣大企業(yè)研發(fā)領(lǐng)域?qū)S么竽P?,服?wù)于機(jī)器人、無(wú)人駕駛、可穿戴設(shè)備、智能家居、智能安防等行業(yè),覆蓋長(zhǎng)尾應(yīng)用。
最后,全國(guó)一體化算力網(wǎng)建設(shè)在推動(dòng)算力的基礎(chǔ)設(shè)施化上發(fā)揮了先導(dǎo)作用。算力基礎(chǔ)設(shè)施化的中國(guó)方案,應(yīng)在大幅度降低算力使用成本和使用門檻的同時(shí),為最廣范圍覆蓋人群提供高通量、高品質(zhì)的智能服務(wù)。算力基礎(chǔ)設(shè)施的中國(guó)方案需要具備“兩低一高”,即在供給側(cè),大幅度降低算力器件、算力設(shè)備、網(wǎng)絡(luò)連接、數(shù)據(jù)獲取、算法模型調(diào)用、電力消耗、運(yùn)營(yíng)維護(hù)、開發(fā)部署的總成本,讓廣大中小企業(yè)都消費(fèi)得起高品質(zhì)的算力服務(wù),有積極性開發(fā)算力網(wǎng)應(yīng)用;在消費(fèi)側(cè),大幅度降低廣大用戶的算力使用門檻,面向大眾的公共服務(wù)必須做到易獲取、易使用,像水電一樣即開即用,像編寫網(wǎng)頁(yè)一樣輕松定制算力服務(wù),開發(fā)算力網(wǎng)應(yīng)用。在服務(wù)效率側(cè),中國(guó)的算力服務(wù)要實(shí)現(xiàn)低熵高通量,其中高通量是指在實(shí)現(xiàn)高并發(fā)⑧度服務(wù)的同時(shí),端到端服務(wù)的響應(yīng)時(shí)間可滿足率高;低熵是指在高并發(fā)負(fù)載中出現(xiàn)資源無(wú)序競(jìng)爭(zhēng)的情況下,保障系統(tǒng)通量不急劇下降。保障“算得多”對(duì)中國(guó)尤其重要?! ?
選擇三:AI+著重賦能虛擬經(jīng)濟(jì),還是發(fā)力實(shí)體經(jīng)濟(jì)?
“AI+”的成效是人工智能價(jià)值的試金石。次貸危機(jī)后,美國(guó)制造業(yè)增加值占GDP的比重從1950年的28%降低為2021年的11%,美國(guó)制造業(yè)在全行業(yè)就業(yè)人數(shù)占比從1979年的35%降低為2022年的8%,可見美國(guó)更傾向于回報(bào)率更高的虛擬經(jīng)濟(jì),輕視投資成本高且經(jīng)濟(jì)回報(bào)率低的實(shí)體經(jīng)濟(jì)。中國(guó)傾向于實(shí)體經(jīng)濟(jì)與虛擬經(jīng)濟(jì)同步發(fā)展,更加重視發(fā)展裝備制造、新能源汽車、光伏發(fā)電、鋰電池、高鐵、5G等實(shí)體經(jīng)濟(jì)?! ?
相應(yīng)地美國(guó)AI主要應(yīng)用于虛擬經(jīng)濟(jì)和IT基礎(chǔ)工具,AI技術(shù)也是“脫實(shí)向虛”,自2007年以來(lái)硅谷不斷炒作虛擬現(xiàn)實(shí)(Virtual Reality,VR)、元宇宙、區(qū)塊鏈、Web3.0、深度學(xué)習(xí)、AI大模型等,是這個(gè)趨勢(shì)的反映?! ?
我國(guó)的優(yōu)勢(shì)在實(shí)體經(jīng)濟(jì),制造業(yè)全球產(chǎn)業(yè)門類最齊全,體系最完整,特點(diǎn)是場(chǎng)景多、私有數(shù)據(jù)多。我國(guó)應(yīng)精選若干行業(yè)加大投入,形成可低門檻全行業(yè)推廣的范式,如選擇裝備制造業(yè)作為延續(xù)優(yōu)勢(shì)代表性行業(yè),選擇醫(yī)藥業(yè)作為快速縮短差距的代表性行業(yè)。賦能實(shí)體經(jīng)濟(jì)的技術(shù)難點(diǎn)是AI算法與物理機(jī)理的融合。
人工智能技術(shù)成功的關(guān)鍵是能否讓一個(gè)行業(yè)或一個(gè)產(chǎn)品的成本大幅下降,從而將用戶數(shù)與產(chǎn)業(yè)規(guī)模擴(kuò)大10倍,產(chǎn)生類似于蒸汽機(jī)對(duì)于紡織業(yè),智能手機(jī)對(duì)于互聯(lián)網(wǎng)業(yè)的變革效果。
我國(guó)應(yīng)走出適合自己的人工智能賦能實(shí)體經(jīng)濟(jì)的高質(zhì)量發(fā)展道路。
注釋:
①模式識(shí)別是指用計(jì)算的方法根據(jù)樣本的特征將樣本劃分到一定的類別中去,是通過(guò)計(jì)算機(jī)用數(shù)學(xué)方法來(lái)研究模式的自動(dòng)處理和判讀,把環(huán)境與客體統(tǒng)稱為“模式”。以圖像處理與計(jì)算機(jī)視覺、語(yǔ)音語(yǔ)言信息處理、腦網(wǎng)絡(luò)組、類腦智能等為主要研究方向?! ?/span>
②Token可翻譯為詞元,指自然語(yǔ)言處理過(guò)程中用來(lái)表示單詞或短語(yǔ)的符號(hào)。token可以是單個(gè)字符,也可以是多個(gè)字符組成的序列?! ?/span>
③通用人工智能是指擁有與人類相當(dāng)甚至超過(guò)人類智能的人工智能類型。通用人工智能不僅能像人類一樣進(jìn)行感知、理解、學(xué)習(xí)和推理等基礎(chǔ)思維能力,還能在不同領(lǐng)域靈活應(yīng)用、快速學(xué)習(xí)和創(chuàng)造性思考。通用人工智能的研究目標(biāo)是尋求統(tǒng)一的理論框架來(lái)解釋各種智能現(xiàn)象。
④芯片制造工藝指制造CPU或GPU的制程,即晶體管門電路的尺寸,單位為納米,目前國(guó)際上實(shí)現(xiàn)量產(chǎn)的最先進(jìn)工藝以臺(tái)積電的3nm為代表。更先進(jìn)的制造工藝可以使CPU與GPU內(nèi)部集成更多的晶體管,使處理器具有更多的功能以及更高的性能,面積更小,成本更低等?! ?/span>
⑤CUDA是英偉達(dá)公司設(shè)計(jì)研發(fā)一種并行計(jì)算平臺(tái)和編程模型,包含了CUDA指令集架構(gòu)以及GPU內(nèi)部的并行計(jì)算引擎。開發(fā)人員可以使用C語(yǔ)言來(lái)為CUDA架構(gòu)編寫程序,所編寫出的程序可以在支持CUDA的處理器上以超高性能運(yùn)行?! ?/span>
⑥RISC-V(發(fā)音為“risk-five”)是一個(gè)由美國(guó)加州大學(xué)伯克利分校發(fā)起的開放通用指令集架構(gòu),相比于其他付費(fèi)指令集,RISC-V允許任何人免費(fèi)地使用RISC-V指令集設(shè)計(jì)、制造和銷售芯片和軟件?! ?/span>
⑦長(zhǎng)尾效應(yīng)是指那些原來(lái)不受到重視的銷量小但種類多的產(chǎn)品或服務(wù)由于總量巨大,累積起來(lái)的總收益超過(guò)主流產(chǎn)品的現(xiàn)象。在互聯(lián)網(wǎng)領(lǐng)域,長(zhǎng)尾效應(yīng)尤為顯著?! ?/span>
⑧高并發(fā)通常指通過(guò)設(shè)計(jì)保證系統(tǒng)能夠同時(shí)并行處理很多請(qǐng)求。
- 原標(biāo)題:人工智能與智能計(jì)算的發(fā)展 本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯: 史岱君 
-
韓國(guó)宇宙航空廳正式成立
2024-05-27 16:15 航空航天 -
丁薛祥出席2024年全國(guó)科技活動(dòng)周暨北京科技周主場(chǎng)活動(dòng)
2024-05-26 20:12 -
我國(guó)首艘海島(礁)綜合地質(zhì)調(diào)查船正式列裝
2024-05-25 07:22 南海局勢(shì) -
猶如“火車變軌”,全球首例古潛山裸眼側(cè)鉆分支井技術(shù)成功應(yīng)用
2024-05-19 19:37 能源戰(zhàn)略 -
我國(guó)種豬有了“國(guó)產(chǎn)芯”!打破高度依賴國(guó)外局面
2024-05-18 15:02 聚焦三農(nóng) -
北京:擬探索分體式飛行汽車城際通勤+城內(nèi)擺渡應(yīng)用新業(yè)態(tài)
2024-05-16 18:03 -
我國(guó)量子計(jì)算機(jī)重大突破!這根“線”一度被日本壟斷…...
2024-05-16 10:15 科技前沿 -
世界最長(zhǎng)海底高鐵隧道怎么建?要攻克三大難題
2024-05-16 10:10 超級(jí)工程 -
“超級(jí)顯微鏡”升級(jí)!上海光源線站工程通過(guò)國(guó)家驗(yàn)收
2024-05-15 17:02 科技前沿 -
谷歌放大招,AI搜索引擎來(lái)了
2024-05-15 08:41 大公司 -
硬剛!“中企起訴美國(guó)防部”
2024-05-14 17:34 -
“類人速度”新模型來(lái)了,AI進(jìn)入《她》時(shí)代?
2024-05-14 10:02 人工智能 -
刷新紀(jì)錄!我國(guó)科研團(tuán)隊(duì)破解工程建設(shè)哥德巴赫猜想
2024-05-12 20:24 超級(jí)工程 -
“中國(guó)天眼”發(fā)現(xiàn)迄今最遠(yuǎn)中性氫星系
2024-05-11 16:27 -
高鐵崇明站預(yù)計(jì)年內(nèi)開工建設(shè)
2024-05-11 13:56 高鐵世紀(jì) -
小模型技術(shù)是中國(guó)企業(yè)率先導(dǎo)入裝備中,大模型也不會(huì)例外
2024-05-09 08:42 -
國(guó)際首次!“量子模擬的圣杯之一”,我國(guó)科學(xué)家取得重大進(jìn)展
2024-05-06 12:12 科技前沿 -
嫦娥六號(hào)成功發(fā)射!開啟人類首次月球背面取樣之旅
2024-05-03 17:19 航空航天 -
環(huán)環(huán)相扣、步步關(guān)鍵!嫦娥六號(hào)月背出差之旅日程表
2024-05-03 16:22 航空航天 -
今天上午太陽(yáng)爆發(fā)強(qiáng)耀斑,對(duì)我國(guó)上空電離層產(chǎn)生影響
2024-05-03 14:09 天文
相關(guān)推薦 -
“印巴沖突是敘事之戰(zhàn),中國(guó)裝備重要性凸顯” 評(píng)論 103特朗普故弄玄虛稱“和某大國(guó)達(dá)成協(xié)議”,就這? 評(píng)論 152巴外長(zhǎng)證實(shí):殲-10擊落印軍“陣風(fēng)” 評(píng)論 708美財(cái)長(zhǎng):這些嬰童用品從中國(guó)進(jìn)口,考慮降稅 評(píng)論 159最新聞 Hot
-
沖突愈演愈烈,莫迪首發(fā)聲
-
挪威發(fā)布國(guó)家安全戰(zhàn)略:美國(guó)不可靠,需要跟歐洲抱團(tuán)
-
印度兩座水電站已重新開閘
-
“印巴沖突是敘事之戰(zhàn),中國(guó)裝備重要性凸顯”
-
夸大對(duì)華關(guān)稅效果,她被打假了
-
突發(fā)!巴稱擊斃約50名印士兵,印稱摧毀巴第二大城市防空系統(tǒng)
-
彈射座椅大廠泄露了印巴空戰(zhàn)戰(zhàn)損“天機(jī)”?
-
巴總理:關(guān)鍵時(shí)刻,感謝“親愛的兄弟”埃爾多安
-
日本地鐵出現(xiàn)隨機(jī)殺人事件,男子揮20厘米菜刀砍傷2人
-
“斯洛伐克幾分鐘前才被通知…現(xiàn)在知道國(guó)際政治是啥了吧”
-
“俄羅斯要價(jià)太高,但...”
-
烏克蘭議會(huì)批準(zhǔn)美烏礦產(chǎn)協(xié)議
-
“特朗普稱要把這改叫阿拉伯灣”,伊朗譴責(zé):我們也沒反對(duì)阿拉伯海
-
巴外長(zhǎng)證實(shí):殲-10擊落印軍“陣風(fēng)”
-
“中國(guó)遠(yuǎn)落后于美國(guó)的時(shí)代已終結(jié)”
-
“接到指示,美情報(bào)機(jī)構(gòu)加強(qiáng)搜集力度”
-