阿里云突襲上線新一代通義千問模型Qwen3，部署成本極大降低

財(cái)天COVER

2025-04-29 11:41 ·北京

從4月中旬就在傳聞將上線的阿里新一代通義千問模型Qwen3，終于在4月29日凌晨發(fā)布了。

Qwen3可以說是阿里大模型的集大成者，在全球開發(fā)者社區(qū)GitHub發(fā)布四個(gè)小時(shí)后，便獲得了1.7萬個(gè)星標(biāo)，刷新了開源大模型的熱度紀(jì)錄。

此次Qwen3一共開源了8款“混合推理模型”。其中包括兩款MoE（混合專家）模型：Qwen3-235B-A22B（2350多億總參數(shù)、 220多億激活參），以及Qwen3-30B-A3B（300億總參數(shù)、30億激活參數(shù)）。以及六個(gè)Dense（稠密）模型：Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

其中，Qwen3-235B-A22B是Qwen3系列模型中性能最強(qiáng)的。阿里Qwen3技術(shù)文檔披露，它在基準(zhǔn)測(cè)試中的得分，和DeepSeek-R1、OpenAI旗下的o1、o3-mini，谷歌的 Gemini-2.5-Pro等全球一流大模型不相上下。

作為一款“混合推理模型”，Qwen3將“快思考”與“慢思考”集成進(jìn)同一個(gè)模型，對(duì)簡(jiǎn)單需求可低算力“秒回”答案。特別是對(duì)復(fù)雜問題可多步驟“深度思考”，節(jié)省算力消耗。

Qwen3總參數(shù)量235B，激活僅需22B。阿里稱，僅需4張H20即可部署Qwen3滿血版，顯存占用僅為性能相近模型的三分之一。

同時(shí)，Qwen3模型也支持119種語言和方言，意味著Qwen 3瞄準(zhǔn)了國(guó)際應(yīng)用。

Qwen3也為即將到來的智能體Agent和大模型應(yīng)用爆發(fā)提供了更好的支持。在評(píng)估模型Agent能力的BFCL評(píng)測(cè)中，Qwen3創(chuàng)下70.8的新高，超越Gemini2.5-Pro、OpenAI-o1等頂尖模型，這將大幅降低Agent調(diào)用工具的門檻。

同時(shí)，Qwen3也原生支持MCP協(xié)議，并具備強(qiáng)大的工具調(diào)用能力，結(jié)合封裝了工具調(diào)用模板和工具調(diào)用解析器的Qwen-Agent框架。這將大大降低編碼復(fù)雜性，實(shí)現(xiàn)高效的手機(jī)及電腦Agent操作等任務(wù)。

打開網(wǎng)易新聞體驗(yàn)更佳