4月29日凌晨,阿里云正式開源Qwen3系列大模型,包括2個MoE模型和6個稠密模型。發(fā)布僅2小時,Qwen3已在GitHub收獲超16.9k顆Star。

據(jù)介紹,旗艦?zāi)P蚎wen3-235B-A22B在編程、數(shù)學(xué)、通用能力等基準測試中登頂全球,超越DeepSeek-R1、OpenAI o1、Grok-3等主流模型。

打開網(wǎng)易新聞 查看精彩圖片

Qwen3系列是全球首個開源的混合推理(混合思考模式)大模型。也就是說它可根據(jù)任務(wù)自由切換“思考模式”和“非思考模式”,在不同推理深度下優(yōu)化輸出效果和效率。

新一代Qwen3提供8個不同尺寸的模型,覆蓋0.6B到235B參數(shù)規(guī)模,幾乎適配從輕量端到旗艦部署的各類應(yīng)用場景。旗艦?zāi)P蚎wen3-235B-A22B在推理成本上也顯著優(yōu)化,部署成本僅為DeepSeek R1的三分之一。

此外,在功能擴展上,Qwen3全面支持MCP(模型上下文協(xié)議),使大模型能夠與外部數(shù)據(jù)源、工具系統(tǒng)深度集成,提升Agent復(fù)雜任務(wù)處理能力。

同時,Qwen3模型支持119種語言和方言,進一步強化了全球適配性。

目前,Qwen3系列已在Hugging Face、ModelScope和Kaggle等平臺開源,遵循Apache 2.0協(xié)議。(袁寧)