【4 月 29 日,阿里巴巴開(kāi)源新一代通義千問(wèn)模型 Qwen3,登頂全球開(kāi)源模型】在多個(gè)權(quán)威基準(zhǔn)測(cè)試中,千問(wèn) 3 全面超越 R1、OpenAI-o1 等全球頂尖模型。在奧數(shù)水平的 AIME25 測(cè)評(píng)中,千問(wèn) 3 獲 81.5 分,刷新開(kāi)源紀(jì)錄。在考察代碼能力的 LiveCodeBench 測(cè)評(píng)中,千問(wèn) 3 突破 70 分大關(guān),表現(xiàn)超 Grok3。在評(píng)估模型人類(lèi)偏好對(duì)齊的 ArenaHard 測(cè)評(píng)中,千問(wèn) 3 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。千問(wèn) 3 采用混合專(zhuān)家架構(gòu),總參數(shù)量為 235B,激活參數(shù)量?jī)H需 22B,在多方面大幅增強(qiáng)。千問(wèn) 3 有多個(gè)亮點(diǎn),如“快思考”與“慢思考”結(jié)合,能在不同模式間無(wú)縫切換,節(jié)省算力消耗。其提供 8 種參數(shù)大小的模型,為不同場(chǎng)景與任務(wù)提供滿(mǎn)足要求的尺寸模型,平衡性能與成本。推理能力顯著提升,在數(shù)學(xué)、代碼生成和常識(shí)邏輯推理方面超越 QwQ 和 Qwen2.5instructmodels。支持 MCP 協(xié)議,具備強(qiáng)大工具調(diào)用能力,在 BFCL 評(píng)測(cè)中拿下 70.8 的新高。部署成本大幅下降,千問(wèn) 3 旗艦?zāi)P偷牟渴鸪杀緝H為滿(mǎn)血版 DeepSeek-R1 的 25%—35%。千問(wèn) 3 系列模型采用寬松的 Apache2.0 協(xié)議開(kāi)源,支持 119 多種語(yǔ)言,已上線(xiàn)多個(gè)平臺(tái),全球開(kāi)發(fā)者等均可免費(fèi)下載商用。個(gè)人用戶(hù)可通過(guò)通義 APP 直接體驗(yàn),夸克也即將全線(xiàn)接入。通義千問(wèn)團(tuán)隊(duì)稱(chēng),千問(wèn) 3 的發(fā)布和開(kāi)源將推動(dòng)大型基礎(chǔ)模型研究與開(kāi)發(fā)。通義千問(wèn)團(tuán)隊(duì)技術(shù)負(fù)責(zé)人林俊旸表示,團(tuán)隊(duì)正邁向下一階段,關(guān)注現(xiàn)實(shí)世界任務(wù)。阿里通義已開(kāi)源 200 余個(gè)模型,全球下載量超 3 億次,千問(wèn)衍生模型數(shù)超 10 萬(wàn)個(gè),成全球第一開(kāi)源模型,增強(qiáng)中國(guó)在全球開(kāi)源 AI 生態(tài)中的影響力。
阿里巴巴:千問(wèn) 3 開(kāi)源,性能卓越成本低

熱門(mén)跟貼