
杭州的程序員們贏麻了。
昨天,全球最大AI開源社區(qū)HuggingFace發(fā)布的最新趨勢榜單,排在前三的分別是DeepSeek-V3-0324、群核SpatialLM,以及通義千問Qwen2.5-Omni-7B。
此前有網友戲稱:在開源大模型領域,杭州正在“挑戰(zhàn)”杭州。現(xiàn)在,杭州成了全球范圍內少有的,同時擁有三個世界頂級開源模型的城市。

老手發(fā)揮穩(wěn)定
新力量迅速崛起
排名第一和第三的開源大模型大家比較眼熟,分別來自深度求索和阿里巴巴。
排第一位的DeepSeek-V3-0324,是3月26日凌晨由DeepSeek將此前熱門的基座模型DeepSeek-V3進行全新小版本迭代而來。
DeepSeek-V3-0324在推理能力、代碼生成、中文寫作、搜索能力等方面都實現(xiàn)了顯著提升。根據官方報告,它不僅全面超越Claude-3.7-Sonnet和與Qwen-Max等同類型優(yōu)質模型,在數學、代碼類等相關評測集上勝過GPT-4.5。經過這些天的測試,有人發(fā)現(xiàn),它的代碼能力甚至已經超過了DeepSeek-R1。

新版 V3 模型的百科知識(MMLU-Pro, GPQA)、數學(MATH-500, AIME 2024)和代碼任務(LiveCodeBench)表現(xiàn)均有提升
24小時后,阿里開源了首個端到端全模態(tài)大模型通義千問Qwen2.5-Omni-7B,可以同時處理文本、圖像、音頻和視頻等多種輸入,并實時生成文本與自然語音合成輸出。
Qwen2.5-Omni-7B可以接近人類的多感官方式“立體”認知世界并與之實時交互。你可以像打電話或視頻通話一樣與Qwen聊天,他甚至還能識別音視頻中人物情緒。在復雜任務中進行更智能、更自然的反饋與決策。
在權威的多模態(tài)融合任務OmniBench等測評中,Qwen2.5-Omni-7B刷新業(yè)界紀錄,全維度遠超Google的Gemini-1.5-Pro等同類模型。從開源到登上榜單前三,只用了一天時間。
相比排在第一位的DeepSeek和第三位的Qwen,SpatialLM是個新兵蛋子。
SpatialLM來自于因為“杭州六小龍”火出圈的群核科技。雖然在大模型領域資歷是個新手,不過從發(fā)布、開源到登上榜單第二,也只用了不到10天的時間。
SpatialLM最早亮相于3月20日的英偉達GTC2025大會上,是群核科技自主研發(fā)的空間理解模型,能讓AI更好地認識真實的三維世界。
SpatialLM基于視覺重建的3D結構化場景
比如,給SpatialLM“刷”一段視頻,它就能生成物理正確的3D場景布景,像人類環(huán)顧四周環(huán)境就能理解背后的空間結構一樣,能夠基于從視頻中提取的點云數據,準確認知和理解其中的結構化場景信息,并將它以腳本語言的形式呈現(xiàn)出來。
它的意義在于,突破了大語言模型對物理世界幾何與空間關系的理解局限,讓機器具備空間認知與推理能力,可以為時下火熱的具身智能提供訓練的虛擬空間。

SpatialLM運行原理

相互追趕也相互成就
在全球大模型圈,杭州一直是你追我趕的優(yōu)等生一樣的存在。
今年1月至今,DeepSeek發(fā)布并開源了兩款大模型,分別火到全球的DeepSeek-R1,以及DeepSeek-V3更新而來的0324版本。很多網友開始在線催更V4和R2。
大廠出身的通義千的更新速度到了令海外開發(fā)者震驚的程度。1月至今,已經發(fā)布并開源了7款大模型。為了照顧海外的開發(fā)者,無一例外地,發(fā)布時間都選擇了凌晨。
Qwen2.5-max上線時,有網友驚呼:一天一個模型,太瘋狂了……

全球知名AI平臺HuggingFace的工程師王鐵震就曾發(fā)文:Qwen霸屏了HuggingFace開源大模型榜單前十。

實際上,阿里云是國內最早也是唯一開源自研大模型的大廠,也是全球唯一一家積極研發(fā)先進AI模型并且全方位開源的云計算廠商。
自2023年8月以來,通義累計推出數十款不同類型的大模型,囊括大語言模型、多模態(tài)模型、數學模型和代碼模型,多次登頂HuggingFace的Open LLM Leaderboard、司南OpenCompass等多個國內外權威大模型榜單,并多次沖上HuggingFace、Github的trending趨勢榜單。
目前,海內外開源社區(qū)中Qwen的衍生模型數量已突破9萬,超越了Meta(原Facebook公司)Llama系列衍生模型,是目前世界最大的生成式語言模型族群。
不過,杭州的大模型圈雖然很卷,但互相追逐、一起探索前沿技術的同時,其實也是相互成就的過程。
DeepSeek官方曾透露,為了證明R1強大的推理能力可以快速移植到更小尺寸的模型上,將DeepSeek-R1的推理能力蒸餾給6個開源模型生成新模型。其中,4個模型就來自Qwen。基于Qwen-32B蒸餾的模型,在多項能力上實現(xiàn)了對標o1-mini的效果。
也正是因為DeepSeek的出圈,阿里巴巴在開源大模型領域的努力和沉淀,才被更多的人關注到。
這何嘗不是一種相互成就。


打開技術大門
收獲聰明人的禮物
開源,簡單來說,就是把軟件的源代碼公開,為的是讓更多人參與進來,共同去創(chuàng)造一個復雜軟件。最典型的代表就是Linux操作系統(tǒng)和安卓系統(tǒng)。前者持續(xù)更新了近30年,涉及上千個國家和公司,前后有數萬人參與。
在科技領域,開源不僅是一種行為,還成了精神圖騰和文化現(xiàn)象,互聯(lián)網平等、開放、合作、共享等特點就來自程序員們對開源精神孜孜不倦地追求。
對很多初創(chuàng)的科技公司來說,開源最直接的好處就是輕松“跳到巨人的肩膀上”。
比如,誕生在杭州的有鹿機器人就是典型。給清掃機器人裝上“大腦”,這是浙江有鹿機器人科技有限公司創(chuàng)始人及CEO陳俊波的大膽創(chuàng)意,這個大腦就是基于Qwen-7B開發(fā)的。
陳俊波說,接入Qwen,能很快讓機器人有語言交互和任務拆解執(zhí)行能力,同時通過LLM的語言特征表達增強物理世界特征表達,從而讓清掃機器人做高層的邏輯分析和任務規(guī)劃,完成清潔任務。
這只是開源模型滋養(yǎng)的一個小小應用。截至去年9月中旬,通義千問開源模型Qwen系列的全球下載量超過4000萬。
而在DeepSeek開源后,大量AI生態(tài)鏈上的企業(yè)可以低成本調用全球頂尖大模型的能力,加快對自身垂直模型的打磨,一舉推動了全球AI產業(yè)的發(fā)展。同時,為印度等AI基礎較弱的國家?guī)砹思夹g變革的可能。在人類追逐AGI的漫長歷程里,都是極具里程碑意義的一件事。
正如浙江大學上海高等研究院常務副院長、浙江大學本科生院院長吳飛所說,DeepSeek的開源之舉將使得AI像水和電一樣觸手可及,為實現(xiàn)“時時、處處、人人可用的普遍智能”帶來曙光。
對開源的科技公司來說,開源的好處可以用一句話來歸納:當你慷慨地打開技術大門后,全世界最聰明的大腦都會帶著禮物來敲門。
這份禮物的核心是圍著你轉的全球生態(tài)。以人才資源為例,全球最大開源平臺GitHub統(tǒng)計顯示,頂尖開源項目貢獻者最終加入原公司的比例高達43%。許多技術大牛為因為開源慕名而來,很可能因為某項重大貢獻被開源方看中,從一個“編外人員”變成“全職高手”。
對阿里來說,一份開源禮物就來自于蘋果。借助Qwen,蘋果可以為中國用戶訓練專屬模型,提升硬件體驗。

一座冉冉升起的
“開源大模型之城”?
如果說,此前的杭州是DeepSeek和阿里云Qwen兩個世界級開源大模型的你追我趕,如今加上群核科技,一個剛加入大模型游戲就表現(xiàn)不俗的小弟,這場競賽似乎越來越好玩了。
除了這三家,“六小龍”里的宇樹科技去年年底開始就持續(xù)面向全球開源強化學習代碼,以及Unitree G1機器人操作數據集,包括數據采集、學習算法、數據集和模型。
很早之前,宇樹科技官方旗艦店就售賣他們自己編寫的“國內首部四足機器人研究書籍”《四足機器人控制算法——建模、控制與實踐》一書,配套有完整的開源代碼。

除了這些在聚光燈下的科技公司,因為濃厚的程序員文化和由此帶來的開源精神,在另外一個維度里,杭州本身就是一座具有開源精神的城市。
2002年,杭州提出“還湖于民”的口號,拆除了西湖景區(qū)的圍墻,從此游客可以“自由訪問”西湖。在做決策前,杭州市政府算過一筆賬,得出了“241算法”,即游客多停留24小時,可以增加100億綜合收入,和開源里的“流量思維”不謀而合。

此后,西湖成了“共享共建共治”的典范,游客數量的上升激活了周邊旅游產業(yè),產生了生態(tài)協(xié)同效應。
得益于阿里、網易、??低暤阮^部科技企業(yè),杭州也是開發(fā)者和AI創(chuàng)業(yè)者最聚集的城市之一。
每年的云棲大會,已經成為全球幾萬名開發(fā)者的線下狂歡。而在線上,早已形成了服務超過800萬開發(fā)者的AI大模型社區(qū)和精神家園。
2022年11月的云棲大會上,阿里云聯(lián)合CCF開源發(fā)展委員會共同推出AI模型社區(qū)魔搭ModelScope,初衷是通過開源開放、社區(qū)共建的方式,降低AI模型使用門檻,推動中國大模型生態(tài)建設。
截至今年年2月中旬,魔搭社區(qū)模型總量超過4萬個,涵蓋LLM、對話、語音、文生圖、圖生視頻、AI作曲等多個領域。并且,魔搭已經服務超過1000萬開發(fā)者——這一數據差不多是去年同期的3倍。
其中就包括百川智能、智譜AI、零一萬物、度小滿、Bilibili、小紅書、Vivo、上海人工智能實驗室、IDEA研究院、OpenI啟智社區(qū)、浙江大學、東北大學、大連理工大學、華東理工大學、南方科技大學、北京智源研究院、北京大學袁粒項目組、香港中文大學openmmlab等。
文 | 沈積慧
熱門跟貼