-
中國工程院院士高文:什么時(shí)候中國算力超越美國,GDP也就有望超越美國了
-
呂棟lvdong@guancha.cn
最后更新: 2023-07-09 10:49:38各位專家、各位領(lǐng)導(dǎo),大家下午好!
前面的領(lǐng)導(dǎo)都講的很好,算力是非常重要的一件事,今天上午陳書記也講到,上海要抓三件大事,人工智能領(lǐng)域,算力建設(shè)是非常重要的一方面,就像電力一樣,原來李克強(qiáng)總理抓經(jīng)濟(jì)的時(shí)候,有一個(gè)很重要的指數(shù)就是“克強(qiáng)指數(shù)”,是靠電力消耗看整個(gè)經(jīng)濟(jì)發(fā)展順不順利,或者是正常不正常。
從現(xiàn)在開始,算力也是數(shù)字經(jīng)濟(jì)發(fā)展的一個(gè)指數(shù)。算力夠,數(shù)字經(jīng)濟(jì)就能發(fā)展好,不夠就發(fā)展不好。所以,算力建設(shè)尤其是智能算力建設(shè)就非常關(guān)鍵。我在這里,跟大家分享關(guān)于鵬城云腦的智算平臺,另外是分享一下,在這個(gè)平臺上做的鵬城腦海大模型。
首先算力很重要,但重要到什么程度呢?清華大學(xué)一個(gè)2022年的咨詢報(bào)告提到,經(jīng)過統(tǒng)計(jì),算力指數(shù)和GDP是正相關(guān)的,一個(gè)國家算力越強(qiáng),GDP就越強(qiáng)。美國現(xiàn)在算力指數(shù)排第一,比我們大概多了20%-30%的算力,GDP也比我們多20%-30%,什么時(shí)候我們的算力超越美國,咱們的GDP也就有望超越美國了。
正是因?yàn)樗懔@么重要,所以發(fā)展人工智能和數(shù)字經(jīng)濟(jì),沒有匹配的算力是不可能的。要有算力,就要有芯片,芯片做成機(jī)器,才能用這個(gè)機(jī)器訓(xùn)練模型。
為了做這件事,我們2020年在深圳做了一臺機(jī)器叫鵬城云腦Ⅱ。在2020年,這臺機(jī)器的算力是全世界做人工智能訓(xùn)練最強(qiáng)的,比當(dāng)時(shí)微軟、谷歌的機(jī)器都要強(qiáng),相當(dāng)于4000塊英偉達(dá)A100 GPU的算力,而且這臺機(jī)器是用全光網(wǎng)絡(luò)連接的,節(jié)點(diǎn)之間延遲非常低。
因?yàn)橛辛诉@臺機(jī)器,我們就可以做很多事,包括做科學(xué)研究、產(chǎn)業(yè)應(yīng)用還有關(guān)鍵技術(shù)的研發(fā)。這臺機(jī)器剛剛我說有4000塊卡,其中一方面是鯤鵬CPU,另外是昇騰NPU,都是華為的。
圖源:觀察者網(wǎng)
那么這臺機(jī)器的性能行不行呢?我們就參加世界TOP500的超算打榜,整個(gè)超算打榜也有其他的賽道,我們參加的是IO500的賽道,是一條考驗(yàn)輸出和輸入能力的賽道,從2020年10月份這臺機(jī)器做出來以后,我們11月份就參加打榜,連續(xù)6次第一,每半年有一次打榜,全節(jié)點(diǎn)連續(xù)兩次第一。
所以做人工智能訓(xùn)練這件事,別人沒辦法和這臺機(jī)器比。這臺機(jī)器不僅硬件強(qiáng),接口能力和網(wǎng)絡(luò)也非常強(qiáng),同時(shí)上面的軟件也配備得比較完備,包括怎么樣做分布式計(jì)算,怎么樣做命令調(diào)優(yōu)、自研調(diào)度規(guī)劃等等。
也許有的專家聽到過,有人說全世界能在1000塊卡上同時(shí)訓(xùn)練一個(gè)模型的只有幾千人,能在4000塊卡上訓(xùn)練的不超過100個(gè)人,在10000塊卡上訓(xùn)練模型的人數(shù)更少了。在大規(guī)模的卡上一起做事,對于軟件規(guī)劃、資源調(diào)度挑戰(zhàn)非常大。
我們不僅是把鵬城云腦Ⅱ用好,同時(shí)也承擔(dān)了國家發(fā)改委的任務(wù),把華為生態(tài)包括昇騰AI集群的算力,不論是100P或900P的算力結(jié)點(diǎn),用網(wǎng)絡(luò)把資源連起來,可以向外界提供。同時(shí)按照發(fā)改委的要求,希望這是異構(gòu)的算力網(wǎng)平臺,我們在華為生態(tài)以外,也選擇了部分其他廠商的算力,在2022年6月這個(gè)項(xiàng)目驗(yàn)收的時(shí)候,已經(jīng)聚合的智能算力達(dá)到2300P,鵬城云腦Ⅱ只是1000P,而這個(gè)系統(tǒng)已經(jīng)聚集了2300P的智能算力。
有了鵬城云腦Ⅱ可以訓(xùn)練大模型了,但訓(xùn)練大模型還是很費(fèi)算力的,即使可以訓(xùn)練大模型,現(xiàn)在的算力供給根本不夠用,因此我們正在規(guī)劃做鵬城云腦Ⅲ。
下面我說說大模型。
鵬城實(shí)驗(yàn)室正在做一個(gè)2000億參數(shù)的大模型,也就是200B的參數(shù),為什么做這件事呢?因?yàn)橛蠧hatGPT和類ChatGPT大模型在不停涌現(xiàn),同時(shí)現(xiàn)在很多公司都用這個(gè)東西做產(chǎn)業(yè)應(yīng)用,去做服務(wù)。所以現(xiàn)在模型變得很重要了,但現(xiàn)在有錢的公司可以砸?guī)讉€(gè)億做這樣的機(jī)器,甚至十幾個(gè)億和幾十個(gè)億,而大多數(shù)公司是做不了的。
圖源:觀察者網(wǎng)
這個(gè)領(lǐng)域需求這么大,怎么辦?鵬城實(shí)驗(yàn)室可以做一個(gè)底座,把模型訓(xùn)練完開放出去,大家在這個(gè)底座上做垂直應(yīng)用。按照這樣的思路,我們首先有鵬城云腦Ⅱ的算力,前一階段我們積累了很多數(shù)據(jù),這一段時(shí)間我們通過各個(gè)渠道,包括購買,拿到數(shù)據(jù)先做清洗,清洗數(shù)據(jù)的工作很重,可能拿到100個(gè)數(shù)據(jù),清洗完就剩幾個(gè)了,因?yàn)橛泻芏嗍侵貜?fù)和不規(guī)范的數(shù)據(jù),這些東西拿掉后,數(shù)據(jù)量就變得很小。雖然拿了很多數(shù)據(jù),但是真正用來做訓(xùn)練的數(shù)據(jù)只有1%-5%。有了這些數(shù)據(jù),我們就可以做大模型底座。
這個(gè)大模型底座用的就是生成式預(yù)訓(xùn)練模型,也就是和GPT完全類似的底層。現(xiàn)在這個(gè)2000億參數(shù)規(guī)模的大模型訓(xùn)練出來以后,我們希望把它給到合作伙伴那里,而且提供相應(yīng)的指令微調(diào)和相應(yīng)的人工增強(qiáng)學(xué)習(xí)的工具,甚至在一兩個(gè)垂直領(lǐng)域作為垂直應(yīng)用樣板。因?yàn)槿A為在這方面很有經(jīng)驗(yàn),我們建議誰想做垂直應(yīng)用,可以找華為獲得一些咨詢。
我們希望能快速把這個(gè)模型做完推向社會,讓業(yè)界在這個(gè)模型上,開發(fā)中國自己的人工智能大模型應(yīng)用系統(tǒng)。現(xiàn)在我們正在緊鑼密鼓地往前推,應(yīng)該是8月底第一次訓(xùn)練就完成了,9月份就會把模型開放出去。
現(xiàn)在訓(xùn)練的數(shù)據(jù)有多大呢?我們說的是喂數(shù)據(jù),每天喂10個(gè)B,但是最重要的是喂一個(gè)T的數(shù)據(jù),而一個(gè)T是由幾百個(gè)T清洗來的,現(xiàn)在數(shù)據(jù)都是中文和代碼數(shù)據(jù),4000多塊卡的機(jī)器每天可以吃掉10個(gè)B,100天就能吃掉1000個(gè)B,也就是一個(gè)T,因此訓(xùn)練2000億參數(shù)的模型,需要4000塊卡訓(xùn)練100天。
這就是算力的重要性,如果算力不足的話,做一個(gè)模型還是很辛苦的,而且現(xiàn)在這個(gè)模型才訓(xùn)練一個(gè)T的數(shù)據(jù),如果訓(xùn)練兩到三個(gè)T的話,還要加兩到三個(gè)100天,沒有大算力做大模型就是天方夜譚。實(shí)際上這就和電力是一樣的,想靠省電做出什么產(chǎn)品來,真正懂行的人聽了都不信,一定要有算力作為基礎(chǔ)。
圖源:觀察者網(wǎng)
怎么樣把數(shù)據(jù)做好、訓(xùn)練的快,我們有一套體系。
有個(gè)開源社區(qū)叫啟智開源社區(qū),這里有很多工程師在做飛輪數(shù)據(jù)工程,可以使清洗數(shù)據(jù)做得非???,有很多自動和半自動的清洗數(shù)據(jù)。同時(shí)我們要考慮應(yīng)用的時(shí)候有隱私數(shù)據(jù),有一些數(shù)據(jù)應(yīng)用者,希望到這個(gè)模型應(yīng)用一下,但是不希望自己的數(shù)據(jù)被丟掉或者是被看到,我們也提供了隱私數(shù)據(jù)保護(hù)的模塊。
我們希望鵬城腦海大模型訓(xùn)練出來以后,可以快速向社會賦能,可以讓大家做數(shù)字政府、一帶一路、智能制造、智慧金融、智慧醫(yī)療等各種各樣的應(yīng)用。而且我們還有完整的教育計(jì)劃、人才計(jì)劃,希望通過高校和合作伙伴培養(yǎng)更多AI人才,能讓中國的大模型應(yīng)用快速啟動。
總結(jié)一下,鵬城實(shí)驗(yàn)室在鵬城云腦Ⅱ硬件平臺和鵬城腦海大模型這兩件事上,都在和華為合作往前推進(jìn),希望可以對中國人工智能大模型的應(yīng)用貢獻(xiàn)一點(diǎn)力量。作為一個(gè)基石,希望大家多關(guān)心、多參與。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 呂棟 
-
“法國人殖民了我們132年,現(xiàn)在該輪到我們殖民他們了”
2023-07-08 15:00 法國見聞 -
-
華為盤古大模型3.0,“沒時(shí)間作詩”
2023-07-07 17:35 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
這家IPO公司主營豬飼料,一年收入超百億
2023-07-07 17:33 觀網(wǎng)財(cái)經(jīng)-金融 -
泰國努力吸引中國游客:上半年接待140萬人次,僅為2019年同期1/4
2023-07-07 14:28 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
歐盟加塞烏克蘭議程,“被拉美國家刪光了...”
2023-07-07 14:11 烏克蘭之殤 -
李強(qiáng)主持召開經(jīng)濟(jì)形勢專家座談會
2023-07-06 19:54 觀網(wǎng)財(cái)經(jīng)-宏觀 -
唱空中國銀行股?高盛回應(yīng)
2023-07-06 18:25 觀網(wǎng)財(cái)經(jīng)-金融 -
美國就業(yè)一片大好?美聯(lián)儲暗示數(shù)據(jù)失真
2023-07-06 18:11 觀網(wǎng)財(cái)經(jīng)-宏觀 -
光刻機(jī)巨頭:沒有向中國市場推出特別版光刻機(jī)
2023-07-06 17:05 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
廈門國際投資擬港股上市:在港澳均有銀行,凈利潤同比下降34.55%
2023-07-06 16:51 觀網(wǎng)財(cái)經(jīng)-金融 -
馬云現(xiàn)身巴基斯坦,下一站是這個(gè)國家
2023-07-06 15:48 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
斷開社交媒體?馬克龍這個(gè)提議激起軒然大波
2023-07-06 10:24 法國見聞 -
他看到了中國市場的紅利,卻忽視了對中國市場的尊重
2023-07-05 18:57 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
國有銀行將向城投發(fā)放25年期貸款?或?yàn)椴粚?shí)消息
2023-07-05 17:59 觀網(wǎng)財(cái)經(jīng)-金融 -
鋰電池企業(yè)瑞浦蘭鈞IPO:毛利率遠(yuǎn)低于寧德時(shí)代,近三年皆虧損
2023-07-05 17:00 觀網(wǎng)財(cái)經(jīng)-金融 -
多家銀行下調(diào)美元存款利率,有何影響?
2023-07-05 15:58 觀網(wǎng)財(cái)經(jīng)-金融 -
小米再對華為專利提無效宣告請求
2023-07-04 20:59 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
專利戰(zhàn):OPPO與諾基亞隔空互嗆
2023-07-04 17:53 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
?中國管制關(guān)鍵金屬鎵、鍺出口,美國半導(dǎo)體公司已著手申請
2023-07-04 17:51 觀網(wǎng)財(cái)經(jīng)-評論
相關(guān)推薦 -
-
中方同意接觸,美媒緊盯:事關(guān)重大、令人鼓舞 評論 110最新聞 Hot
-
“特朗普稱要把這改叫阿拉伯灣”,伊朗譴責(zé):我們也沒反對阿拉伯海
-
巴外長證實(shí):殲-10擊落印軍“陣風(fēng)”
-
“中國遠(yuǎn)落后于美國的時(shí)代已終結(jié)”
-
“接到指示,美情報(bào)機(jī)構(gòu)加強(qiáng)搜集力度”
-
“雙方出動125架戰(zhàn)機(jī),交火距離一度超過160公里”
-
門票價(jià)格從10元上漲到85元?西安碑林博物館回應(yīng)
-
美財(cái)長:這些嬰童用品從中國進(jìn)口,考慮降稅
-
烏克蘭央行行長:考慮放棄美元
-
美聯(lián)儲:就是不降息
-
法方證實(shí):至少一架陣風(fēng)戰(zhàn)斗機(jī)被擊落
-
特朗普:愿意出面
-
“敵人哀嚎,印軍引以為傲5架戰(zhàn)機(jī),化為灰燼”
-
“軟實(shí)力”概念提出者約瑟夫·奈去世,享年88歲
-
戴維·珀杜宣誓就任美國駐華大使,特朗普出席就職典禮
-
教皇選舉首輪投票結(jié)果出爐:是黑煙
-
“荒謬言論”,默茨:我會跟特朗普談?wù)?/a>
-