每經(jīng)AI快訊,4月29日,阿里巴巴發(fā)布Qwen3系列模型,這是Qwen系列大型語言模型的最新成員。旗艦?zāi)P蚎wen3-235B-A22B在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測(cè)試中,與DeepSeek-R1、OpenAI的(o1、o3-mini)、馬斯克的Grok-3和谷歌公司Gemini-2.5-Pro等頂級(jí)模型相比,表現(xiàn)出極具競爭力的結(jié)果。此外,小型MoE模型Qwen3-30B-A3B的激活參數(shù)數(shù)量是QwQ-32B的10%,表現(xiàn)更勝一籌,甚至像Qwen3-4B這樣的小模型也能匹敵Qwen2.5-72B-Instruct的性能。
阿里發(fā)布Qwen3

熱門跟貼