-
科大訊飛攜手華為,實(shí)現(xiàn)基于國(guó)產(chǎn)算力的MoE模型推理方案
3月11日,據(jù)“科大訊飛研究院”公眾號(hào),近日,科大訊飛攜手華為在國(guó)產(chǎn)算力領(lǐng)域取得重大進(jìn)展,雙方聯(lián)合團(tuán)隊(duì)率先突破國(guó)產(chǎn)算力集群上MoE模型的大規(guī)模跨節(jié)點(diǎn)專家并行集群推理,這是繼DeepSeek公布其MoE模型訓(xùn)練推理方案后,業(yè)界首個(gè)基于國(guó)產(chǎn)算力的全新解決方案。
科大訊飛介紹,聯(lián)合團(tuán)隊(duì)通過軟硬件的深度協(xié)同創(chuàng)新,在多個(gè)關(guān)鍵技術(shù)層面深挖硬件潛力,完成昇騰集群上的驗(yàn)證和部署。在算子融合方面,團(tuán)隊(duì)在MLA預(yù)處理階段通過Vector與Cube異構(gòu)計(jì)算單元并行流水,并將多個(gè)小算子融合重構(gòu)為原子級(jí)計(jì)算單元,消除小算子下發(fā)開銷,MLA前處理時(shí)延降低50%+,實(shí)現(xiàn)性能的顯著提升。
在混合并行策略和通信計(jì)算并行優(yōu)化方面,團(tuán)隊(duì)構(gòu)建了TP(張量并行)+EP(專家并行)混合范式:對(duì)MLA計(jì)算層采用機(jī)內(nèi)TP并行,發(fā)揮機(jī)內(nèi)高速互聯(lián)優(yōu)勢(shì),降低跨機(jī)通信損耗;創(chuàng)新MoE專家分層調(diào)度,64卡均衡分配專家計(jì)算節(jié)點(diǎn),定制AllToAll通信協(xié)議,專家數(shù)據(jù)交換效率提升40%,構(gòu)建跨機(jī)/機(jī)內(nèi)雙層通信架構(gòu),通過分層優(yōu)化降低跨機(jī)流量60%;同時(shí)研發(fā)路由專家負(fù)載均衡算法,實(shí)現(xiàn)卡間負(fù)載差異小于10%,集群吞吐提升30%。
通過分布式架構(gòu)創(chuàng)新與算法協(xié)同優(yōu)化,聯(lián)合團(tuán)隊(duì)在國(guó)產(chǎn)算力上實(shí)現(xiàn)了顯著的性能提升。單卡靜態(tài)內(nèi)存占用縮減至雙機(jī)部署的1/4,效率提升75%,專家計(jì)算密度增加4倍,推理吞吐提升3.2倍,端到端時(shí)延降低50%。
科大訊飛稱,這一突破性的解決方案也將應(yīng)用于訊飛星火深度推理模型的訓(xùn)練加速,預(yù)期訓(xùn)練時(shí)推理效率將提升200%。同時(shí),基于該方案的推理引擎也實(shí)現(xiàn)了國(guó)產(chǎn)算力上DeepSeek V3和R1的高效推理。
近期,科大訊飛深度推理大模型星火X1也完成升級(jí),在模型參數(shù)量比業(yè)界同行少一個(gè)數(shù)量級(jí)的情況下,星火X1的數(shù)學(xué)能力全面對(duì)標(biāo)DeepSeek R1和OpenAI o1,在中文數(shù)學(xué)各項(xiàng)任務(wù)中均實(shí)現(xiàn)領(lǐng)先??拼笥嶏w始終堅(jiān)定走國(guó)產(chǎn)化道路,星火X1也是當(dāng)前唯一采用全國(guó)產(chǎn)算力訓(xùn)練的深度推理大模型。
- 責(zé)任編輯: 連政 
-
《哪吒2》將在歐洲37個(gè)國(guó)家上映
2025-03-11 16:02 -
-
-
“高貴的”昂跑和lululemon,也有了高貴的煩惱
2025-03-11 14:03 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
稚暉君發(fā)布靈犀X2機(jī)器人:毫秒級(jí)交互反應(yīng)能力
2025-03-11 13:14 -
-
美股大幅低開,特斯拉大跌9%較歷史最高位“腰斬”
2025-03-10 23:06 -
方便面“老二”地位動(dòng)搖,統(tǒng)一靠飲料撐起業(yè)績(jī)
2025-03-10 21:49 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
出海!宇樹在速賣通開設(shè)官方店鋪
2025-03-10 21:15 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
這些年輕的面孔,都是中國(guó)科創(chuàng)的功臣
2025-03-10 21:06 觀察者頭條 -
17歲男孩“在海底撈”醉酒撒尿,賣酒的人該擔(dān)責(zé)嗎?
2025-03-10 19:35 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
馬來西亞運(yùn)營(yíng)商與華為中興簽約,將在5G與AI方面合作
2025-03-10 18:12 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
東茅街茶館會(huì)成為下一個(gè)文和友嗎?
2025-03-10 18:11 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
層高至少3米!住建部將從這三個(gè)方向落實(shí)“好房子”標(biāo)準(zhǔn)
2025-03-10 18:11 2025兩會(huì) -
到海外買礦!坐擁7座金礦的赤峰黃金港股再上市
2025-03-10 18:02 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
網(wǎng)易回應(yīng)“將關(guān)閉公有云”
2025-03-10 16:10 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
蘋果折疊屏被曝將搭載硅碳負(fù)極電池,寧德新能源獨(dú)供
2025-03-10 15:46 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
登頂熱搜,美的被曝強(qiáng)制18點(diǎn)20下班?官方回應(yīng),網(wǎng)友吵翻
2025-03-10 14:24 大公司 -
相關(guān)推薦 -
后院起火?加拿大“最保守省”醞釀“獨(dú)立公投” 評(píng)論 73印外長(zhǎng)懟歐盟:這么依賴中美俄,還想戰(zhàn)略自主… 評(píng)論 119“美國(guó)買家缺席,結(jié)果很意外!” 評(píng)論 75特朗普又開新戰(zhàn)線,“只會(huì)鼓勵(lì)各國(guó)像中國(guó)一樣反制” 評(píng)論 131最新聞 Hot
-
“如果談判失敗,歐盟計(jì)劃對(duì)1000億歐元美國(guó)商品征收關(guān)稅”
-
后院起火?加拿大“最保守省”醞釀“獨(dú)立公投”
-
日本先談判先遇挫,特朗普政府又臭又硬、寸步不讓
-
美財(cái)長(zhǎng)賣力為關(guān)稅洗地,臺(tái)下高管們只關(guān)注中國(guó)
-
特朗普又開新戰(zhàn)線,“只會(huì)鼓勵(lì)各國(guó)像中國(guó)一樣反制”
-
印外長(zhǎng)懟歐盟:這么依賴中美俄,還想戰(zhàn)略自主…
-
“美國(guó)買家缺席,結(jié)果很意外!”
-
日本想“跪”,被警告:政府將垮臺(tái)
-
特朗普:最初是我“炸”了它
-
“關(guān)稅將抹掉15億美元利潤(rùn)”,福特撤回了一個(gè)預(yù)期
-
縣長(zhǎng)張漢坤官宣被查,公安局長(zhǎng)落馬后“消失”4個(gè)月
-
今年第三次議息,美聯(lián)儲(chǔ)“將無視特朗普,維持不變”
-
在他嘴里,加拿大都成了“靠美國(guó)養(yǎng)活的社會(huì)主義政權(quán)”
-
越南總理:越美首輪談判本周三舉行,維持全年8%增長(zhǎng)目標(biāo)
-
“最美教師”鄧瀅,履新職
-
五一出游哪里人最多?河南接待游客6450.3萬人次
快訊 -