海外徹底沸騰!中美大模型戰(zhàn)場(chǎng)又被投下一枚炸彈!

3月6日凌晨,阿里巴巴發(fā)布了通義千問QwQ-32B模型。這跟DeepSeek R1一樣屬于推理模型。而且這一320參數(shù)的新模型比肩滿血版DeepSeek,被老外們玩瘋了!

打開網(wǎng)易新聞 查看精彩圖片

可以說是放了個(gè)大招,讓海外開發(fā)者震驚不已,要知道,后者比QwQ-32B的參數(shù)量要大出20倍有余。

老外曬出了QwQ-32B在M4芯片蘋果MacBook上運(yùn)行飛快的推理速度,感嘆太瘋狂??萍即罄?、Hyperbolic Labs聯(lián)合創(chuàng)始人兼首席技術(shù)官Yuchen Jin則寫道:“小模型太強(qiáng)大了!”

打開網(wǎng)易新聞 查看精彩圖片

在測(cè)試數(shù)學(xué)能力的AIME24評(píng)測(cè)集上,以及評(píng)估代碼能力的LiveCodeBench中,QwQ-32B表現(xiàn)與DeepSeek-R1相當(dāng),遠(yuǎn)勝于o1-mini及相同尺寸的R1蒸餾模型!

QwQ-32B打了一場(chǎng)漂亮的翻身仗,閉源的o1-mini可是OpenAI的王牌推理模型。去年o1-mini發(fā)布時(shí),OpenAI的CEO Sam Altman在社交媒體上表示:AI的“耐心時(shí)刻”已經(jīng)結(jié)束。誰成想沒過半年,o1-mini就被開源的QwQ-32B全方位碾壓。

有心急的海外開發(fā)者連夜@各大第三方API托管方,別睡了起來嗨!趕緊起來干活了!

打開網(wǎng)易新聞 查看精彩圖片

外網(wǎng)徹底沸騰,中國(guó)AI儼然成為科技明星,無比震驚的老外們稱QwQ-32B又是一項(xiàng)“瘋狂”的進(jìn)步。

海外網(wǎng)友為之瘋狂也是可以理解的,QwQ-32B性能強(qiáng)大就不說了,關(guān)鍵是性價(jià)比太香了!同其他部署昂貴的頭部大模型比,QwQ-32B在消費(fèi)級(jí)顯卡上就能實(shí)現(xiàn)本地部署。如果將QwQ-32B添加到代碼能力與輸出token成本的圖表中,它用約1/10的成本就能達(dá)到DeepSeek-R1與o3-mini-high之間的性能,這樣極致的性價(jià)比前所未有!

打開網(wǎng)易新聞 查看精彩圖片

還有科技博主做了評(píng)測(cè),671B滿血版DeepSeek R1在FP16精度下需要1400G的顯存,QwQ-32B只需4張4090就能跑,將近15倍的差距,大大降低了門檻。更值得注意的是,阿里云采用了寬松的Apache2.0協(xié)議,將QwQ-32B模型向全球開源,所有人都可免費(fèi)下載及商用。

這對(duì)于很多普通企業(yè)、個(gè)人開發(fā)者、創(chuàng)業(yè)團(tuán)隊(duì)或者專業(yè)做AI應(yīng)用的公司來說,無異于天降神兵。畢竟,對(duì)于大多數(shù)的企業(yè)垂直場(chǎng)景,一個(gè)優(yōu)秀的32B的模型真的已經(jīng)足以應(yīng)付很很多,沒必要非得上600多億參數(shù)。用中等成本,拿到一個(gè)足以對(duì)標(biāo)DeepSeek R1的邏輯推理、數(shù)學(xué)推理、代碼思考能力的開源大模型,還能在自家環(huán)境中任意調(diào)試、微調(diào)、二次開發(fā),這簡(jiǎn)直太香了!

阿里云這次開源QwQ-32B,提振了人們對(duì)開源模型的信心,中國(guó)不必搞天價(jià)設(shè)備和超大規(guī)模,一樣可以跟國(guó)際頂流較量。阿里云這是給中國(guó)企業(yè)送上了超強(qiáng)外掛啊,好樣的!中國(guó)AI問鼎全球,指日可待了!