
從4月中旬就在傳聞將上線的阿里新一代通義千問模型Qwen3,終于在4月29日凌晨發(fā)布了。
Qwen3可以說是阿里大模型的集大成者,在全球開發(fā)者社區(qū)GitHub發(fā)布四個小時后,便獲得了1.7萬個星標,刷新了開源大模型的熱度紀錄。
此次Qwen3一共開源了8款“混合推理模型”。其中包括兩款MoE(混合專家)模型:Qwen3-235B-A22B(2350多億總參數(shù)、 220多億激活參),以及Qwen3-30B-A3B(300億總參數(shù)、30億激活參數(shù))。以及六個Dense(稠密)模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。
其中,Qwen3-235B-A22B是Qwen3系列模型中性能最強的。阿里Qwen3技術文檔披露,它在基準測試中的得分,和DeepSeek-R1、OpenAI旗下的o1、o3-mini,谷歌的 Gemini-2.5-Pro等全球一流大模型不相上下。

作為一款“混合推理模型”,Qwen3將“快思考”與“慢思考”集成進同一個模型,對簡單需求可低算力“秒回”答案。特別是對復雜問題可多步驟“深度思考”,節(jié)省算力消耗。
Qwen3總參數(shù)量235B,激活僅需22B。阿里稱,僅需4張H20即可部署Qwen3滿血版,顯存占用僅為性能相近模型的三分之一。
同時,Qwen3模型也支持119種語言和方言,意味著Qwen 3瞄準了國際應用。
Qwen3也為即將到來的智能體Agent和大模型應用爆發(fā)提供了更好的支持。在評估模型Agent能力的BFCL評測中,Qwen3創(chuàng)下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等頂尖模型,這將大幅降低Agent調(diào)用工具的門檻。
同時,Qwen3也原生支持MCP協(xié)議,并具備強大的工具調(diào)用能力,結合封裝了工具調(diào)用模板和工具調(diào)用解析器的Qwen-Agent框架。這將大大降低編碼復雜性,實現(xiàn)高效的手機及電腦Agent操作等任務。
熱門跟貼