一覺醒來,全球開源的王座更替了,不是 R2。好消息是,中國用戶依然是最大的受益者。
今天凌晨,阿里開源了新一代自研模型 Qwen 3(千問 3),性能全面超越 DeepSeek-R1、OpenAI o1 模型,一上線就登頂全球開源模型王座。

千問 3 也是國內(nèi)首個「混合推理模型」,同時擁有閃電俠的反應(yīng)和福爾摩斯的深思熟慮,雙核驅(qū)動,同時在推理能力、指令遵循、工具調(diào)用、代碼、多語言能力等方面均大幅增強。
目前在通義 APP 以及通義網(wǎng)頁版 tongyi.com,就能直接體驗這個全球最強的開源模型。
APPSO 也第一時間上手體驗了通義 APP,而體驗的第一感受是:不止快和準,還有種久違的底氣感。
國產(chǎn) AI 終于可以和「弱智吧」大戰(zhàn) 300 回合
需要特別說明的是,目前通義 APP 默認搭載的是 Qwen3-235B-A22B 模型。
這是一款主打「混合推理」性能的旗艦級模型。如果你有不同需求,也可以在模型選擇器中切換至穩(wěn)定高效、適合企業(yè)部署的 Qwen 3-32B,或者支持高性能深度思考的 QWQ-32B。
先來一道經(jīng)典的推理題,看看目前搭載 Qwen3-235B-A22B 的通義 APP,是否已經(jīng)能夠解答我們之前碰到的一些「疑難雜癥」。
有個國王想將公主嫁給三個公子里面最聰明的一個。國王出了一個絕對公平的測試去分辨出誰是最聰明。 三個公子在一個房間里繞圈對坐著,國王向他們展示 5 頂帽子,2 頂黑色,3 頂白色。然后他們被蒙上眼,他們各人的頭上都被蓋上了一頂帽子,另外兩頂帽子就放在另外一間房間中。都戴好帽子并且摘下眼罩后,國王告訴他們誰能夠最快推論到自己頭上帽子的顏色,他就能娶下公主。 現(xiàn)在你就是其中一個公子,你看到 2 頂白色的帽子在其他公子頭上。而過了一些時間,你察覺到其他公子都未能推能或不敢猜測。假設(shè)你知道其他公子也是非常聰明的,那么,你的帽子是白色還是黑色?





為測試其純粹推理能力,我們事先關(guān)閉了聯(lián)網(wǎng)搜索功能,僅使用旗艦?zāi)P?。提出問題后,千問 3 僅用 24 秒,便靠自身硬推理能力得出了正確答案。
細節(jié)上更值得一提的是,回答完成后,通義還會自動配上語音朗讀——音色自然、節(jié)奏流暢,聽起來頗為舒適。當然,嫌打擾的話,也可以一鍵關(guān)閉右上角小喇叭。

沒有藏著掖著,千問 3 的思考過程也是可見的,從回答邏輯來看,整個推理過程清晰可見,思路層層遞進,條理分明,以及甚至還會反復(fù)驗證回答的準確性。
作為國內(nèi)首個「混合推理模型」,千問 3 實現(xiàn)了推理模式與普通對話模式的自由切換。不過實測,當你向它提出一個簡單問題「10-5=?」時,它依然會本著嚴謹態(tài)度進行深度思考,但生成速度并不會因此拖慢,很快就能給出答案。
上點難度,來一道更復(fù)雜的。蛇年蛇月蛇日蛇時即將到來,2025 年會出現(xiàn)幾次這種特殊時間節(jié)點?
這是一道結(jié)合了農(nóng)歷、干支紀年等傳統(tǒng)歷法知識的數(shù)據(jù)推理題。即便是對中國文化體系較熟悉的人,解答這道題也需多輪推算與核對,稍有不慎便會出錯。








而對于不熟悉農(nóng)歷體系的 AI,更是挑戰(zhàn)巨大,但千問 3 幾乎沒有猶豫,快速且準確地給出了答案:3 次。
此外,我們還拋出了終極概率問題:讓一只猴子在打字機上隨機敲擊,時間無窮,是否能打出完整的莎士比亞全集?在這一問題下,千問 3 不僅給出了數(shù)學推導(dǎo),還在下方自然生成了延伸追問,貼合主題,引發(fā)進一步思考。

「弱智吧」被認證為最佳中文 AI 訓(xùn)練庫,是人類面對 AI 大軍的最后堡壘,那「玉皇大帝住的是平流層還是對流層?」這是一個讓人會心一笑的題目,卻也是檢驗千問 3 模型幽默感與文化常識結(jié)合力的絕佳切口。
它先嚴謹?shù)匾蒙裨捗枋觯鞔_指出玉皇大帝居住在天宮,并解釋了天宮與大氣層的物理區(qū)別;緊接著又補充了網(wǎng)絡(luò)趣味解讀(非正統(tǒng)觀點),既正經(jīng)回答,但也適度皮一下。
當然,千問 3 的回答也全非毫無依據(jù),底部附上的參考來源也增添了幾分說服力。



京劇版《哈利波特》?跨界創(chuàng)作有驚喜
生成式 AI 最高頻的應(yīng)用,仍是案頭內(nèi)容生成。
那換個角度,能否讓千問 3 生成京劇版的《哈利波特與魔法石》的劇本?千問 3 哐哐一頓開寫,劇本中融入了西皮、二黃、快板等多種京劇唱腔,情緒變化與傳統(tǒng)程式一脈相承。
而唱詞則采用對仗工整、押韻自然的古典文風,既符合京劇語言,又不失哈利波特故事的奇幻感。








當然,文化跨界,最怕水土不服,諸如「獅鷲騰躍震四隅」等唱詞來翻譯霍格沃茨四大學院,既保留了意象張力,又避免了直接照搬西方術(shù)語的生硬感。
作為一個習慣于收藏優(yōu)質(zhì) AI 回答的用戶,我十分喜歡通義 APP 「添加至隨手記」的功能,只需長按內(nèi)容,便可一鍵收藏,而如果想與好友分享,也可以直接生成跳轉(zhuǎn)鏈接,輕松傳遞。

「煙鎖池塘柳」之所以被譽為千古絕對,很大程度也是因為暗含「金木水火土」五行,通過調(diào)用知識庫的能力,千問 3 給出的回答是,炮鎮(zhèn)海城樓,字數(shù)相同,平仄相對。
在語言理解方面,Qwen3 模型支持高達 119 種語言和方言。
處理經(jīng)典句子「Love loves to love love 」時,普通翻譯很容易淪為生硬堆砌,但千問 3 給出了更優(yōu)雅的版本:「愛之深契,恒慕所愛之真」,既保留了英文原句的疊詞美感,又在中文中構(gòu)建出了詩意的空間,完美體現(xiàn)了「信、達、雅」的翻譯標準。







一句話編程,我用通義做了一個寶可夢風的俄羅斯方塊游戲
代碼是千問 3 此次改進的一大亮點。
在網(wǎng)頁版界面,只需打開頁面下方的「代碼模式」,輸入你的需求,它便能一鍵生成代碼。不僅如此,千問 3 還配備了指令優(yōu)化和應(yīng)用廣場,可以幫助你一邊寫一邊調(diào),一邊學一邊用。

我的本意是想讓千問 3 創(chuàng)建一個偏寶可夢風格的俄羅斯方塊小游戲。沒想到,千問 3 在生成初版代碼的同時,自帶的「潤色功能」幫助優(yōu)化了我的原始指令。
創(chuàng)建一個基于 HTML/CSS/avaScript 的單文件俄羅斯方塊游戲,其中方塊元素設(shè)計成寶可夢風格。 游戲包含以下功能: 游戲界面:游戲區(qū)域為 400×600 像素的畫布,使用 CSS 設(shè)置背景色和邊框樣式。
不過,也許是出于版權(quán)敏感,生成的代碼并沒有直接使用寶可夢角色,而是巧妙地將方塊顏色設(shè)計帶有寶可夢的配色風格。
盡管如此,運行體驗依舊絲滑流暢。

不止于此,我又提出了另一個要求,希望通義幫我做一個帶有動畫效果的天氣卡片,要求是使用 HTML、CSS 和基礎(chǔ) JavaScript,實現(xiàn)時間和天氣信息的動態(tài)更新。

通義給出的結(jié)果,再次讓人眼前一亮,不僅實現(xiàn)了功能需求,還在細節(jié)設(shè)計上加了小彩蛋,比如天氣變化時背景色漸變等。
體驗到這里,我們得出的結(jié)論是:相比以往只注重「對錯」的模型,通義更像一個真正懂你需求的「第二大腦」。無論是推理、創(chuàng)作,還是編程,都能以一種兼具邏輯性與創(chuàng)造力的方式回應(yīng)。
對于大多數(shù)用戶來說,其實并不關(guān)注大模型的參數(shù)規(guī)格和各種榜單,只關(guān)心是否「好用」。
這里「好用」標準通常有兩個層面,首先還是得依托基座模型的能力,另外更重要的是怎么將模型能力產(chǎn)品化,帶給用戶更友好的交互體驗。
正如 OpenAI 研究員姚順雨最近在博客中提到的觀點:「我們需要重新思考如何訓(xùn)練 AI 以及如何衡量進展,這可能需要更接近產(chǎn)品經(jīng)理的思維方式?!?/p>
這一晚的實測下來,APPSO 認為目前通義 APP 比較好地兼顧了這兩方面,跑得快、答得準、夠聰明,在一些容易遇到門檻的地方(比如編程指令自動潤色)會自然看到合適的交互細節(jié),這一種少見的厚重感和生長力。
上一個長假前夕,DeepSeek R1 引爆了全球開源模型。這次五一假期之前,我們又迎來了千問 3,除了更強的模型,也有了交互更好的應(yīng)用,將中國這股 AI 浪潮延續(xù)下去。
歡迎大家前往通義 APP 體驗千問 3,在留言區(qū)與我們分享更多有趣的玩法。
作者:李超凡、莫崇宇
熱門跟貼