當下,以Qwen、DeepSeek等為代表的中國開源模型在國際舞臺上綻放異彩,以更加開放的姿態(tài),實現(xiàn)先進模型的參數(shù)權(quán)重、推理邏輯和工具鏈條的全開源,正在打開了人工智能商用的新局面,也同樣推動全球大模型的開源路線。

清華大學(xué)人工智能研究院常務(wù)副院長、歐洲科學(xué)院外籍院士孫茂松4月28日在接受媒體采訪時稱,中國科技公司在大模型領(lǐng)域掀起的開源浪潮向全球發(fā)出了中國“強音”,其技術(shù)在獲得國際認可的同時,更重要的是在悄然改變并扭轉(zhuǎn)全球大模型文化。

中國大模型領(lǐng)域已然掀起開源熱潮。孫茂松表示,近年來在人工智能領(lǐng)域尤其是大模型的發(fā)展上,發(fā)出了很強烈的中國的聲音,DeepSeek的出現(xiàn)以及通義千問的系列開源產(chǎn)品極大推動了國際大模型的開源路線,這對突破技術(shù)壟斷,促進技術(shù)平權(quán),提升人工智能的普惠性,無疑具有十分重要的作用。

打開網(wǎng)易新聞 查看精彩圖片

圖片來源:中新社

但孫茂松也直言,長期以來,在國際學(xué)術(shù)界,英語及以其為載體的文化作為強勢語言和文化在國際上占據(jù)主導(dǎo)地位,中文內(nèi)容常常處于相對弱勢。"要獲得國際認可,你必須做得比他好很多,人家才會認可你。"

孫茂松表示,在同等條件下,國際上更習慣使用西方開源的基座模型,而不太會選擇中國開發(fā)的模型。這種“文化差異”造成的環(huán)境挑戰(zhàn),需要付出加倍的技術(shù)努力才能克服。

不過上述局面在過去一年發(fā)生了顯著改變。"近年來國際開源界比較知名的是LLaMA(Meta公司旗下人工智能模型) ,但是從去年開始,我覺得

他進一步說,目前從學(xué)術(shù)論文的角度來看,國際上很多研究都是基于千問進行。在同樣尺寸的模型比較中,有些效果在LLaMA上可能無法實現(xiàn),但在阿里千問上卻可以做出來,這也充分說明千問的小模型性能更優(yōu)。

從這個典型例子來看,孫茂松認為,這意味著中國的大模型的“文化”在國際上得到了認可,實際上是在文化層面有某種扭轉(zhuǎn)。這一點表面看上去似乎“波瀾不驚”,但其實非常難能可貴,意味著國際上已經(jīng)“打心眼兒里”認可了中國大模型的發(fā)展和技術(shù)水平。

最新消息顯示,4月29日凌晨,新一代通義千問模型Qwen3(千問3)宣布開源,總共涉及8款不同尺寸的千問3模型。據(jù)悉,阿里通義已開源200余個模型,全球下載量超3億次,其衍生模型數(shù)超10萬個,超越美國Llama,成為全球第一開源模型。

孫茂松還特別強調(diào)了小模型的重要價值。從應(yīng)用的角度,小模型可降低成本,拓展應(yīng)用的普及度;從研究的角度,小模型可有助于高??蒲袡C構(gòu)應(yīng)對資源約束帶來的研究挑戰(zhàn),這些都有很強的必要性。

他認為,大模型做得越好,能夠衍生出更優(yōu)秀的小模型;而在小尺度模型上的深入研究,也能為大模型的發(fā)展提供重要啟發(fā)。

“我一直說基礎(chǔ)模型必須要有靈性,說得好聽一點要有慧根?!睂O茂松進一步稱,就好比一個人比較聰穎、機靈,稍微點撥兩句就能領(lǐng)悟,基礎(chǔ)模型有靈性,才能比較容易地達至“孺子可教也”的成效,不管是進行更高層次的學(xué)習還是應(yīng)用都會更為順暢。

對于未來發(fā)展,孫茂松認為,中國AI領(lǐng)域?qū)⒃诟邔哟紊厦媾R能力上的重要考驗。"當你追趕到并駕齊驅(qū)的位置時,下一步該往哪里走?這呼喚我們在基礎(chǔ)研究方面提出更深刻的學(xué)術(shù)思想和更具根本性的解決方案。"他強調(diào),中國必須在保持關(guān)鍵技術(shù)創(chuàng)新的同時,更加注重“從0到1”的原創(chuàng)性思想的培育和激發(fā)。