-
阿里“最強(qiáng)開(kāi)源模型”,昇騰、海光已適配
最后更新: 2025-04-29 14:30:26(文/楊依婷 編輯/呂棟)
4月29日凌晨,阿里新一代通義千問(wèn)模型Qwen3發(fā)布并開(kāi)源,它的參數(shù)量?jī)H為DeepSeek-R1的1/3,但成本大幅下降,性能超越R1、OpenAI-o1等全球頂尖模型,被媒體稱為“全球最強(qiáng)開(kāi)源模型”。
隨后,華為計(jì)算官方發(fā)文稱,此次Qwen3系列一經(jīng)發(fā)布開(kāi)源,即在MindSpeed和MindIE中開(kāi)箱即用,實(shí)現(xiàn)Qwen3的0Day適配。海光信息方面也表示,海光DCU迅速完成對(duì)全部8款模型的無(wú)縫適配+調(diào)優(yōu)。
根據(jù)阿里云官方信息,此次開(kāi)源包括兩款MoE模型:Qwen3-235B-A22B(2350多億總參數(shù)、 220多億激活參),以及Qwen3-30B-A3B(300億總參數(shù)、30億激活參數(shù));以及六個(gè)Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。
其中的旗艦?zāi)P蚎wen3-235B-A22B在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測(cè)試中,與DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等頂級(jí)模型相比,表現(xiàn)出極具競(jìng)爭(zhēng)力的結(jié)果。
此外,小型MoE模型Qwen3-30B-A3B的激活參數(shù)數(shù)量是QwQ-32B的10%,表現(xiàn)更勝一籌,甚至像Qwen3-4B這樣的小模型也能匹敵Qwen2.5-72B-Instruct的性能。
Qwen3是國(guó)內(nèi)首個(gè)“混合推理模型”,模型支持兩種思考模式:思考模式:在這種模式下,模型會(huì)逐步推理,經(jīng)過(guò)深思熟慮后給出最終答案。這種方法適合需要深入思考的復(fù)雜問(wèn)題。非思考模式:在此模式中,模型提供快速、近乎即時(shí)的響應(yīng),適用于那些對(duì)速度要求高于深度的簡(jiǎn)單問(wèn)題。
在預(yù)訓(xùn)練方面,Qwen3的數(shù)據(jù)集相比Qwen2.5有了顯著擴(kuò)展。Qwen2.5是在18萬(wàn)億個(gè)token上進(jìn)行預(yù)訓(xùn)練的,而Qwen3使用的數(shù)據(jù)量幾乎是其兩倍,達(dá)到了約36萬(wàn)億個(gè)token,涵蓋了119種語(yǔ)言和方言。
從官方數(shù)據(jù)來(lái)看,在考察代碼能力的LiveCodeBench評(píng)測(cè)中,Qwen3突破70分大關(guān),表現(xiàn)甚至超過(guò)Grok3;在評(píng)估模型人類偏好對(duì)齊的ArenaHard的測(cè)評(píng)中,Qwen3分別以95.6分超越了OpenAI-o1及DeepSeek-R1;在評(píng)估奧數(shù)水平的AIME25測(cè)評(píng)中,Qwen3以81.5分刷新開(kāi)源記錄。
Qwen3發(fā)布后,華為計(jì)算方面發(fā)文稱,此前昇騰MindSpeed和MindIE一直同步支持Qwen系列模型,此次Qwen3系列一經(jīng)發(fā)布開(kāi)源,即在MindSpeed和MindIE中開(kāi)箱即用,實(shí)現(xiàn)Qwen3的0Day適配。
隨后海光信息也表示,在“深算智能”戰(zhàn)略引領(lǐng)下,海光DCU迅速完成對(duì)全部8款模型的無(wú)縫適配+調(diào)優(yōu),覆蓋235B/32B/30B/14B/8B/4B/1.7B/0.6B,實(shí)現(xiàn)零報(bào)錯(cuò)、零兼容性問(wèn)題的秒級(jí)部署。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 楊依婷 
-
美的格力隔空打架,誰(shuí)是“家用空調(diào)線上零售第一”?
2025-04-29 13:58 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
特朗普發(fā)動(dòng)單邊貿(mào)易霸凌后,比交易更“藝術(shù)”的事情出現(xiàn)了…
2025-04-29 13:18 -
-
-
-
截至3月末,全國(guó)地方政府債務(wù)余額501650億元
2025-04-29 08:46 -
茶咖日?qǐng)?bào)|滬上阿姨5月8日起在港交所交易
2025-04-28 19:55 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
-
-
加碼多模態(tài)能力,夸克發(fā)布全新“AI相機(jī)”
2025-04-28 17:24 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
-
-
美債下跌會(huì)否影響中國(guó)的美元資產(chǎn)收益?央行回應(yīng)
2025-04-28 10:59 金融觀察 -
穩(wěn)健領(lǐng)跑,濱江集團(tuán)首進(jìn)全國(guó)前十
2025-04-28 10:36 觀網(wǎng)財(cái)經(jīng)-房產(chǎn) -
歐菲光一季度再虧5895萬(wàn):手機(jī)汽車都卷,怎么辦?
2025-04-28 09:49 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
五糧液2024年?duì)I收近900億元,毛利率超82%
2025-04-27 20:53 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
超越DeepSeek,中國(guó)開(kāi)源“集團(tuán)軍”重塑全球AI生態(tài)
2025-04-27 20:47 觀察者頭條 -
“落寞網(wǎng)紅”綠茶,為IPO愛(ài)上下沉市場(chǎng)
2025-04-27 18:55 觀網(wǎng)財(cái)經(jīng)-消費(fèi)
相關(guān)推薦 -
印外長(zhǎng)懟歐盟:這么依賴中美俄,還想戰(zhàn)略自主… 評(píng)論 0“美國(guó)買家缺席,結(jié)果很意外!” 評(píng)論 33“特朗普此舉,是怕好萊塢沒(méi)涼透啊” 評(píng)論 172最新聞 Hot
-
美財(cái)長(zhǎng)賣力為關(guān)稅洗地,臺(tái)下高管們只關(guān)注中國(guó)
-
特朗普又開(kāi)新戰(zhàn)線,“只會(huì)鼓勵(lì)各國(guó)像中國(guó)一樣反制”
-
印外長(zhǎng)懟歐盟:這么依賴中美俄,還想戰(zhàn)略自主…
-
“美國(guó)買家缺席,結(jié)果很意外!”
-
日本想“跪”,被警告:政府將垮臺(tái)
-
特朗普:最初是我“炸”了它
-
“關(guān)稅將抹掉15億美元利潤(rùn)”,福特撤回了一個(gè)預(yù)期
-
縣長(zhǎng)張漢坤官宣被查,公安局長(zhǎng)落馬后“消失”4個(gè)月
-
今年第三次議息,美聯(lián)儲(chǔ)“將無(wú)視特朗普,維持不變”
-
在他嘴里,加拿大都成了“靠美國(guó)養(yǎng)活的社會(huì)主義政權(quán)”
-
越南總理:越美首輪談判本周三舉行,維持全年8%增長(zhǎng)目標(biāo)
-
“最美教師”鄧瀅,履新職
-
五一出游哪里人最多?河南接待游客6450.3萬(wàn)人次
-
美防長(zhǎng)“動(dòng)刀”美軍高層,至少砍20%
-
以色列要全面占領(lǐng)加沙?“等特朗普結(jié)束中東之行……”
-
特朗普“殺得興起”,歐洲想“刀下?lián)屓恕?/a>
快訊- 不再只是“所有女生”,李佳琦想讓“所有爸媽”重返二十歲
- 18名議員跑票,默茨意外未能當(dāng)選德國(guó)總理
- 美CIA發(fā)布視頻“招募中國(guó)官員竊取機(jī)密”,外交部回應(yīng)
- 雅詩(shī)蘭黛 2025 財(cái)年第三季度財(cái)報(bào)出爐,“重塑美妝新境” 戰(zhàn)略穩(wěn)步推進(jìn)
- 4月西班牙電車銷量猛增,特斯拉大幅下滑
- 習(xí)近平同馮德萊恩就中歐建交50周年互致賀電
- 宮頸癌、高危產(chǎn)婦論文現(xiàn)男性病例,《中國(guó)醫(yī)藥指南》致歉
- “全球店王”確認(rèn)出售,博裕資本將拿下42%-45%股權(quán)
-