打開網(wǎng)易新聞 查看精彩圖片

從4月中旬就在傳聞將上線的阿里新一代通義千問模型Qwen3,終于在4月29日凌晨發(fā)布了。

Qwen3可以說是阿里大模型的集大成者,在全球開發(fā)者社區(qū)GitHub發(fā)布四個(gè)小時(shí)后,便獲得了1.7萬個(gè)星標(biāo),刷新了開源大模型的熱度紀(jì)錄。

此次Qwen3一共開源了8款“混合推理模型”。其中包括兩款MoE(混合專家)模型:Qwen3-235B-A22B(2350多億總參數(shù)、 220多億激活參),以及Qwen3-30B-A3B(300億總參數(shù)、30億激活參數(shù))。以及六個(gè)Dense(稠密)模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

其中,Qwen3-235B-A22B是Qwen3系列模型中性能最強(qiáng)的。阿里Qwen3技術(shù)文檔披露,它在基準(zhǔn)測(cè)試中的得分,和DeepSeek-R1、OpenAI旗下的o1、o3-mini,谷歌的 Gemini-2.5-Pro等全球一流大模型不相上下。

打開網(wǎng)易新聞 查看精彩圖片

作為一款“混合推理模型”,Qwen3將“快思考”與“慢思考”集成進(jìn)同一個(gè)模型,對(duì)簡(jiǎn)單需求可低算力“秒回”答案。特別是對(duì)復(fù)雜問題可多步驟“深度思考”,節(jié)省算力消耗。

Qwen3總參數(shù)量235B,激活僅需22B。阿里稱,僅需4張H20即可部署Qwen3滿血版,顯存占用僅為性能相近模型的三分之一。

同時(shí),Qwen3模型也支持119種語言和方言,意味著Qwen 3瞄準(zhǔn)了國(guó)際應(yīng)用。

Qwen3也為即將到來的智能體Agent和大模型應(yīng)用爆發(fā)提供了更好的支持。在評(píng)估模型Agent能力的BFCL評(píng)測(cè)中,Qwen3創(chuàng)下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等頂尖模型,這將大幅降低Agent調(diào)用工具的門檻。

同時(shí),Qwen3也原生支持MCP協(xié)議,并具備強(qiáng)大的工具調(diào)用能力,結(jié)合封裝了工具調(diào)用模板和工具調(diào)用解析器的Qwen-Agent框架。這將大大降低編碼復(fù)雜性,實(shí)現(xiàn)高效的手機(jī)及電腦Agent操作等任務(wù)。