打開網(wǎng)易新聞 查看精彩圖片

阿里千問3登頂全球最強(qiáng)開源模型

阿里大模型又甩出一張王炸。

4月29日凌晨,阿里新一代通義千問模型Qwen3(簡(jiǎn)稱千問3)開源,一發(fā)布就直接登頂全球最強(qiáng)開源模型。隨即相關(guān)話題引發(fā)全網(wǎng)關(guān)注。

圖源:微博
打開網(wǎng)易新聞 查看精彩圖片
圖源:微博

這款讓全世界震撼的模型,有何特別之處?據(jù)了解,Qwen3是國(guó)內(nèi)首個(gè)“混合推理模型”,它將“快思考”和“慢思考”集成進(jìn)同一個(gè)模型,能快速低算力處理簡(jiǎn)單問題,也能通過多步驟深度推理解決復(fù)雜問題,有效降低算力消耗。

目前,Qwen3系列模型一共開源了8款“混合推理模型”,包括兩款MoE(混合專家)模型Qwen3-235B-A22B和Qwen3-30B-A3B,以及六個(gè)Dense(稠密)模型32B、14B、8B、4B、1.7B和0.6B。

圖源:阿里云
打開網(wǎng)易新聞 查看精彩圖片
圖源:阿里云

那么,Qwen3又強(qiáng)在哪里?首要原因是算力成本大幅降低,直接碾壓全球各個(gè)頂尖大模型

比如旗艦?zāi)P蚎wen3-235B-A22B參數(shù)量?jī)H為DeepSeek-R1的1/3,總參數(shù)量235B,激活僅需22B。

據(jù)市場(chǎng)多方消息,僅需4張H20即可部署Qwen3滿血版,而且Qwen3旗艦?zāi)P偷牟渴鸪杀臼?strong>滿血版R1的25%~35%,部署成本大降75%~65%,顯存占用僅為性能相近模型的三分之一。

其次,Qwen3大模型的性能也比同類大模型更強(qiáng),在多個(gè)基準(zhǔn)測(cè)試中表現(xiàn)出色,甚至超過了DeepSeek-R1和OpenAI o1等頂級(jí)模型。

在Qwen3系列模型中,旗艦版本Qwen3-235B-A22B是性能最強(qiáng)的。據(jù)阿里云披露的Qwen3基準(zhǔn)測(cè)試結(jié)果,這款開源模型在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測(cè)試中,與一眾頂級(jí)模型相比極具競(jìng)爭(zhēng)優(yōu)勢(shì),與DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro等模型不相上下,甚至有趕超的趨勢(shì)。

Qwen3基準(zhǔn)測(cè)試結(jié)果 圖源:阿里云
打開網(wǎng)易新聞 查看精彩圖片
Qwen3基準(zhǔn)測(cè)試結(jié)果 圖源:阿里云

具體來看,比如,在奧數(shù)水平的AIME25測(cè)評(píng)中,千問3取得了81.5分,刷新開源紀(jì)錄;在考察代碼能力的LiveCodeBench評(píng)測(cè)中,千問3得分超過70分,表現(xiàn)優(yōu)于Grok3;在評(píng)估模型人類偏好對(duì)齊的ArenaHard測(cè)評(píng)中,千問3以95.6分超越了OpenAI-o1及DeepSeek-R1。

另外,在評(píng)估模型Agent能力的BFCL評(píng)測(cè)中,Qwen3取得了70.8分的成績(jī),刷新了該評(píng)測(cè)的記錄,并超越了Gemini2.5-Pro、OpenAI-o1等頂尖模型。

值得一提的是,Qwen3模型還支持全球119種語(yǔ)言和方言,意味著Qwen 3試圖開辟更多的國(guó)際市場(chǎng)。

不得不說,Qwen3模型的各項(xiàng)表現(xiàn)極為亮眼。當(dāng)然,如果拿阿里自身來比較,Qwen3模型取得的成績(jī)就理所當(dāng)然和不足為奇。

因?yàn)榘⒗锎竽P投己苣苣玫贸鍪?,去?月底,通義千問第二代開源模型Qwen2-72B亮相即登頂。

當(dāng)時(shí)全球著名開源平臺(tái)Hugging Face(笑臉)的聯(lián)合創(chuàng)始人兼首席執(zhí)行官在社交平臺(tái)透露,通義千問第二代開源模型Qwen2-72B拿下全球開源第一,力壓Meta、Mistralai等海外科技巨頭。

圖源:微博
打開網(wǎng)易新聞 查看精彩圖片
圖源:微博

緊接著今年3月3日,阿里的另一款大模型“萬相2.1(Wan2.1)”也取得了優(yōu)異成績(jī)。

當(dāng)時(shí)開源社區(qū)Hugging Face最新榜單顯示,阿里大模型“萬相2.1(Wan2.1)”登頂模型熱榜和模型空間榜,成為近期全球開源社區(qū)最受歡迎的大模型。

圖源:通義萬相Wan公眾號(hào)
打開網(wǎng)易新聞 查看精彩圖片
圖源:通義萬相Wan公眾號(hào)

如今,阿里大模型登頂全球最強(qiáng)開源模型,對(duì)阿里來說,又是一次重大的技術(shù)突破和戰(zhàn)略布局。

打開網(wǎng)易新聞 查看精彩圖片

阿里巴巴要全面AI化

阿里大模型能取得如此突破,與阿里在資源上的大力投入密不可分。

在戰(zhàn)略層面,阿里巴巴對(duì)AI業(yè)務(wù)的重視提高到了前所未有的高度。在上個(gè)月的財(cái)報(bào)電話會(huì)議上,阿里巴巴集團(tuán)CEO吳泳銘明確指出,阿里巴巴將持續(xù)聚焦國(guó)內(nèi)外電商業(yè)務(wù)、AI+云計(jì)算的科技業(yè)務(wù)、互聯(lián)網(wǎng)平臺(tái)產(chǎn)品這三大業(yè)務(wù)類型。

而對(duì)于大模型,吳泳銘強(qiáng)調(diào),未來三年,阿里將圍繞AI這個(gè)戰(zhàn)略核心,在AI基礎(chǔ)設(shè)施、基礎(chǔ)模型平臺(tái)及AI原生應(yīng)用、現(xiàn)有業(yè)務(wù)的AI轉(zhuǎn)型等三方面加大投入。

顯而易見,阿里巴巴正加速?gòu)膫鹘y(tǒng)電商公司向AI技術(shù)驅(qū)動(dòng)的科技公司轉(zhuǎn)型,這是隨著AI戰(zhàn)略深入推進(jìn)的必然結(jié)果,也是兩年前吳泳銘提出的“用戶為先、AI驅(qū)動(dòng)”戰(zhàn)略的延續(xù)。

要知道過去兩年,阿里深受電商低價(jià)競(jìng)爭(zhēng)和市場(chǎng)格局變化的困擾,亟需借助AI的力量來打開新的局面。

去年4月正值阿里變革一周年,馬云在內(nèi)部會(huì)議上激情澎湃地表示:“AI時(shí)代剛剛到來,一切才剛開始,我們正當(dāng)其時(shí)!”

同年12月,在螞蟻集團(tuán)20周年慶典上,馬云再次現(xiàn)身并分享了他對(duì)未來20年AI時(shí)代的深刻見解,他強(qiáng)調(diào)了AI技術(shù)將如何重塑各行各業(yè),并鼓勵(lì)螞蟻集團(tuán)抓住這一歷史機(jī)遇。

今年4月,馬云發(fā)表最新演講,再次大談AI

打開網(wǎng)易新聞 查看精彩圖片

顯然,馬云對(duì)AI戰(zhàn)略的重視程度非同一般,將其視為阿里巴巴未來發(fā)展的核心驅(qū)動(dòng)力。

為支撐這一戰(zhàn)略,阿里巴巴在資源投入上展現(xiàn)出驚人魄力。

去年,阿里接連出售銀泰百貨、大潤(rùn)發(fā)、高鑫零售等非核心資產(chǎn),同時(shí)阿里還頻繁減持快狗打車、B站、陌陌、網(wǎng)易云音樂等長(zhǎng)期虧損的非核心業(yè)務(wù)。

這些動(dòng)作背后與其聚焦電商、云計(jì)算等核心主業(yè)的戰(zhàn)略目標(biāo)息息相關(guān)。

除了減輕非核心業(yè)務(wù)的負(fù)擔(dān),阿里還加大與云計(jì)算有關(guān)的AI投入。

比如加大AI人才招聘力度。在3月25日的匯豐全球投資峰會(huì)上,阿里巴巴主席蔡崇信表示,經(jīng)歷了幾輪裁員之后,阿里的員工數(shù)量已經(jīng)觸底了。接下來,阿里將重新開啟招聘。

緊接著4月,阿里國(guó)際隨即傳出,首次啟動(dòng)一項(xiàng)面向全球的頭部AI科技人才培養(yǎng)計(jì)劃“Bravo 102”,打破傳統(tǒng)的校招體系,面試通過后可反選項(xiàng)目和團(tuán)隊(duì)。另?yè)?jù)阿里國(guó)際招聘官網(wǎng),2026屆校招中80%為AI崗位,包括AI算法、研發(fā)、AI產(chǎn)品經(jīng)理等。

圖源:阿里國(guó)際招聘
打開網(wǎng)易新聞 查看精彩圖片
圖源:阿里國(guó)際招聘

今年2月,阿里還挖來全球頂尖AI科學(xué)家、前Salesforce副總裁許主洪(Steven Hoi),為AI業(yè)務(wù)助力。

在資金投入方面,阿里也毫不含糊。吳泳銘直接放話,未來三年,阿里將投入超過3800億元用于建設(shè)云和AI硬件基礎(chǔ)設(shè)施,總額超過過去十年總和。

這一連串的動(dòng)作,正在把阿里AI業(yè)務(wù)推向高潮。

打開網(wǎng)易新聞 查看精彩圖片

互聯(lián)網(wǎng)大廠掀起新一輪AI大戰(zhàn)

AI熱潮已經(jīng)持續(xù)了兩年,今年年初DeepSeek的橫空出世再次引爆了整個(gè)AI圈,新一輪的競(jìng)賽已然拉開帷幕。無論國(guó)內(nèi)還是國(guó)外,各大模型公司都在加速布局,競(jìng)相角逐。

當(dāng)我們聚焦于阿里、抖音、騰訊、百度等國(guó)內(nèi)互聯(lián)網(wǎng)大廠,他們都以各自的方式鋪開業(yè)務(wù)。

阿里利用開源大模型打開市場(chǎng),自2023年8月開始,阿里云便開始大規(guī)模開源其大模型系列,成為我國(guó)首家大規(guī)模開源的大廠,并屢獲佳績(jī)。

同時(shí),阿里AI業(yè)務(wù)有了新變化,從過去的側(cè)重面向B端,轉(zhuǎn)而向C端用戶傾斜。上個(gè)月夸克上線全新功能“AI超級(jí)框”,以及通義APP的持續(xù)升級(jí)改版,都是針對(duì)C端用戶側(cè)的調(diào)整。

AI大模型技術(shù)正在快速成熟,應(yīng)用場(chǎng)景從B端向個(gè)人用戶擴(kuò)展,C端用戶對(duì)AI產(chǎn)品的需求日益多樣化,由此,C端市場(chǎng)已成為阿里爭(zhēng)奪的新戰(zhàn)場(chǎng)。

抖音方面,則選擇采取了“廣撒網(wǎng)”式的戰(zhàn)略打法,先構(gòu)建起龐大的AI產(chǎn)品矩陣,并采用 “賽馬機(jī)制”,鼓勵(lì)內(nèi)部團(tuán)隊(duì)圍繞同類產(chǎn)品進(jìn)行差異化開發(fā)。

通過多版本并行測(cè)試、數(shù)據(jù)實(shí)時(shí)反饋,篩選出最具潛力的產(chǎn)品方向,并快速迭代升級(jí)。

自2023 年起,抖音在國(guó)內(nèi)市場(chǎng)加速AI產(chǎn)品的落地節(jié)奏。據(jù)不完全統(tǒng)計(jì),短短兩年間,其在移動(dòng)端推出近10款A(yù)I應(yīng)用,形成了覆蓋聊天、社交、辦公、教育、圖像、視頻、音樂全場(chǎng)景的產(chǎn)品生態(tài)。

目前來看,各大互聯(lián)網(wǎng)公司都力圖構(gòu)建自身的AI護(hù)城河,搶占先機(jī),重塑行業(yè)競(jìng)爭(zhēng)格局。

作者 |木易