打開網(wǎng)易新聞 查看精彩圖片

這是一場(chǎng)鏖戰(zhàn),也是巨變的起點(diǎn)??吭鯓拥臋C(jī)制與模式搶占世界人工智能高地?浙江杭州的“三劍客”也許具有樣本解析價(jià)值。

文|徐鑫

編|任曉漁

中國的基礎(chǔ)模型開源旋風(fēng)已持續(xù)數(shù)月。

前幾天,DeepSeek聯(lián)合清華發(fā)布關(guān)于推理時(shí)Scaling的新研究論文,外界紛紛推測(cè)距離DeepSeek-R2發(fā)布或許近了。這家開年后以開源模型名聲大震的創(chuàng)業(yè)公司有個(gè)外號(hào)——“真正的Open AI”。DeepSeek-V3和DeepSeek-R1兩大模型在開源社區(qū)GitHub的Star數(shù)量發(fā)布不到2個(gè)月就超越了OpenAI的明星項(xiàng)目Whisper。

擁有如此大的影響力除了模型不俗的表現(xiàn)和更低的成本,還在于DeepSeek的開源姿態(tài)。它開源了最先進(jìn)的模型,采取的MIT協(xié)議是應(yīng)用許可最寬松的協(xié)議之一,詳細(xì)公布了技術(shù)原理,并持續(xù)釋放出計(jì)算、通信、存儲(chǔ)到系統(tǒng)架構(gòu)等各個(gè)層面的優(yōu)化工具。

無獨(dú)有偶,國內(nèi)另一家開源巨頭阿里云的口碑也已破圈。文生視頻模型萬相2.1(Wan2.1)在發(fā)布6天后Hugging Face及魔搭社區(qū)總下載量就超百萬。同時(shí),截至2月底,整個(gè)通義千問(Qwen)系列模型的下載量達(dá)到1.8億,累計(jì)衍生模型總數(shù)9萬個(gè),超越海外開源大模型鼻祖Meta的Llama系列,成為全球第一大開源模型系列。阿里上個(gè)月還發(fā)布了QwQ-32B模型,本月?lián)Q還將發(fā)布今年上半年最重要的模型Qwen3。

此外國內(nèi)的大模型公司階躍星辰、MiniMax、智譜、百度等也接連發(fā)布開源成果發(fā)布。在人工智能最關(guān)鍵戰(zhàn)場(chǎng),中國正崛起為一支不可忽視的開源力量。

開源的動(dòng)作不局限在產(chǎn)業(yè)界。在科學(xué)創(chuàng)新中,中國的新型研發(fā)機(jī)構(gòu)也在積極響應(yīng)由聯(lián)合國教科文組織193 個(gè)國家一致通過《開放科學(xué)建議書》,包括數(shù)據(jù)共享在內(nèi),開源也是開放科學(xué)重要原則。

之江實(shí)驗(yàn)室去年開始在全球范圍內(nèi)邀請(qǐng)公測(cè)地學(xué)基礎(chǔ)模型GeoGPT。GeoGPT在2023年初發(fā)起時(shí)就是一個(gè)開源項(xiàng)目,本月將正式面向全球科學(xué)界發(fā)布,并同步開源模型架構(gòu)、訓(xùn)練模型的數(shù)據(jù)列表。未來還將開源包括數(shù)據(jù)標(biāo)注技術(shù)報(bào)告、代碼等更多成果,為全球AI4S領(lǐng)域的創(chuàng)新協(xié)作提供助力。

GeoGPT不僅為全球地學(xué)研究提供了文獻(xiàn)解析、地質(zhì)圖識(shí)別及生成、學(xué)科知識(shí)圖譜等強(qiáng)大研究工具。它開放資源的態(tài)度也極為徹底,更重要的是由此形成了科學(xué)基礎(chǔ)模型的系統(tǒng)架構(gòu)

基礎(chǔ)模型競(jìng)技場(chǎng),正因中國模型開源迎來前所未有的信息透明度更多元的角色有機(jī)會(huì)加入創(chuàng)新,獲得發(fā)展權(quán)。一個(gè)以開源模型為基石的世界創(chuàng)新生態(tài)網(wǎng)有望加速形成,就像硅谷形容DeepSeek一樣,這支開源力量可能也是一份中國“給世界的禮物”。

值得一提的是,浙江杭州在中國開源戰(zhàn)略里展現(xiàn)出極強(qiáng)的存在感。新銳創(chuàng)業(yè)企業(yè)DeepSeek、科技龍頭阿里云和承擔(dān)國家科技使命的非營利性新型研究機(jī)構(gòu)之江實(shí)驗(yàn)室,形成創(chuàng)新“三劍客,以不同的機(jī)制全面呼應(yīng)這一浪潮。

這是一場(chǎng)鏖戰(zhàn),也是巨變的起點(diǎn)??吭鯓拥臋C(jī)制與模式搶占世界人工智能高地?中國在接下來的人工智能發(fā)展浪潮中如何持續(xù)創(chuàng)新?浙江杭州的“三劍客”也許具有樣本解析價(jià)值。(歡迎加作者微信,進(jìn)群交流,微信號(hào)moonfly713)

01

給世界的禮物

“這不是你們的戰(zhàn)場(chǎng)?!?/p>

大模型浪潮的開啟者,OpenAI的CEO山姆·奧特曼2023年6月7日,在環(huán)球巡演到達(dá)德里時(shí),給印度人民發(fā)展人工智能的熱情潑了一盆冷水。

有人問,“3名工程師有1000萬美元,是否可以構(gòu)建類似OpenAI創(chuàng)新?”山姆·奧特曼非常冷酷地勸退——“我們要告訴你,在訓(xùn)練基礎(chǔ)模型方面與我們競(jìng)爭(zhēng),完全沒有希望。你不應(yīng)該嘗試?!?/p>

打開網(wǎng)易新聞 查看精彩圖片

山姆·奧特曼備受爭(zhēng)議的發(fā)言現(xiàn)場(chǎng)視頻截圖。

這引發(fā)了軒然大波,隨即OpenAI以回答被斷章取義來安撫印度人的憤怒。他們解釋稱,山姆真正想說的是,“用1000萬美元與OpenAI競(jìng)爭(zhēng)是真的行不通。正確的問題是,初創(chuàng)公司應(yīng)該做些什么以前做不了的事,給世界帶來新東西。”

這一風(fēng)波其實(shí)很好地概括了過去兩年絕大多數(shù)時(shí)刻,人工智能全球發(fā)展格局和根植于其中的結(jié)構(gòu)性沖突——大模型世界正呈現(xiàn)出硅谷閉源寡頭主導(dǎo)的局面,天量資本投入拉高了參與門檻,世界上許多地區(qū)和領(lǐng)域無法參與這場(chǎng)創(chuàng)新。

斯坦福大學(xué)每年會(huì)發(fā)布AI Index追蹤全球AI發(fā)展趨勢(shì),2024年報(bào)告提及的一系列趨勢(shì)基本呼應(yīng)了上述判斷:大模型訓(xùn)練成本正以飛快的速度急劇攀升;AI在全球區(qū)域發(fā)展極度不平衡,美國、歐盟、中國之外,這份報(bào)告中看不到其他地域參與者的身影;學(xué)術(shù)界也漸漸在這場(chǎng)創(chuàng)新中落在后面。

山姆·奧特曼不知道,在他的斷言發(fā)出的那個(gè)月底,一個(gè)“瘋狂的”中國人公開宣告了對(duì)這種權(quán)力結(jié)構(gòu)的挑戰(zhàn)。

“后邊可以把我們的訓(xùn)練結(jié)果大部分公開共享……而不是技術(shù)只掌握在一部分人和公司手中,形成壟斷。”梁文鋒在那個(gè)6月第一次接受媒體專訪時(shí)說。

當(dāng)時(shí)把這個(gè)宣言當(dāng)回事的人很少。一方面,雖然中國在大模型領(lǐng)域加速追趕,世界當(dāng)時(shí)并不認(rèn)可和獎(jiǎng)勵(lì)來自中國的創(chuàng)新。2023年11月29日,頂著中國電商頭號(hào)玩家加上中國最大云計(jì)算公司并且發(fā)布了通用模型等若干頭銜的企業(yè)加起來市值,第一次比不上拼多多。人們還總用前一天去世的芒格老爺子的話調(diào)侃,“他們?nèi)匀皇且粋€(gè)該死的零售商?!?。

更何況,DeepSeek是中國大模型創(chuàng)新生態(tài)里的邊緣角色,當(dāng)時(shí)梁文鋒說的很多話也讓人心生疑竇。一家從量化基金脫胎出來的小創(chuàng)業(yè)團(tuán)隊(duì),憑什么也要做AGI??恐闷嫘尿?qū)使去探索,它怎么活下去?

不要怪普通人辨別不出來DeepSeek的屬性。理想主義者一腔熱血但沒有然后的故事太多了。一個(gè)在杭州獵頭圈流傳的段子是,獵頭幫DeepSeek挖人經(jīng)常收到一句,“謝謝,不考慮,這個(gè)賽道沒有初創(chuàng)公司的機(jī)會(huì)?!?/p>

可以說,新一波人工智能發(fā)展浪潮里,世界都籠罩在一個(gè)陰影之下,OpenAI所代表的硅谷閉源模型領(lǐng)先和定義規(guī)則,機(jī)會(huì)不屬于其他任何人。

從這個(gè)意義上,也許能更好理解DeepSeek開源并被世界認(rèn)可的語境——一家在美國之外的企業(yè),性能比肩一線閉源模型,成本卻只是同行幾十分之一,以最開放的態(tài)度,給了開發(fā)者常寬松的許可,在技術(shù)堆棧上有非常深度的優(yōu)化,并且不吝于分享。它對(duì)全球的AI開放創(chuàng)新生態(tài)價(jià)值不言而喻。

就像Meta首席科學(xué)家楊立昆(Yann LeCun)所言,這是開源的勝利。開源模型從開源汲取力量也會(huì)回饋開源運(yùn)動(dòng)。比如DeepSeek模型采用的MOE架構(gòu)就不是新事物,此前歐洲的大模型公司Mistral發(fā)布的開源模型就采用這一架構(gòu)。

前所未有的信息透明度,引發(fā)了新的開源浪潮。截至2月底,阿里云、階躍星辰、月之暗面、MiniMax、商湯、豆包、百度等多家公司都有開源消息傳出。DeepSeek自身也繼續(xù)加大開源步伐,中國的開源力量在進(jìn)一步壯大。

此前游戲的“配角”們對(duì)開源力量的熱情溢于言表?!蹲匀弧冯s志在一個(gè)星期以內(nèi)發(fā)表了五篇文章來關(guān)注DeepSeek。印度的技術(shù)論壇圍繞著DeepSeek熱議了一個(gè)多月。

在2月中旬舉行的巴黎人工智能行動(dòng)峰會(huì)上,DeepSeek也是討論熱門。Mistral公司聯(lián)合創(chuàng)始人Arthur Mensch稱之為“中國的Mistral”,認(rèn)為它印證了開源的正確性,并給了Mistral繼續(xù)發(fā)展的靈感。

打開網(wǎng)易新聞 查看精彩圖片

巴黎人工智能行動(dòng)峰會(huì)上DeepSeek備受關(guān)注。

AI應(yīng)用熱潮也因?yàn)檫@股開源浪潮正迎來爆發(fā)。大模型就像電力,現(xiàn)在小企業(yè)、小團(tuán)隊(duì)和科研部門能更方便下載和本地部署,接入到千行百業(yè)的場(chǎng)景應(yīng)用中去。

就像硅谷知名風(fēng)險(xiǎn)投資家馬克·安德森所說的那樣,“作為開源模型,它是對(duì)世界的深遠(yuǎn)禮物”。

02

基礎(chǔ)模型:人工智能新時(shí)代的一場(chǎng)團(tuán)戰(zhàn)

2月10日,OpenAI花了1400萬美元在美國關(guān)注度最高的橄欖球決賽做了1分鐘廣告,致敬人類文明里的一系列里程碑。大模型最后出場(chǎng),被OpenAI定義為人類最偉大的創(chuàng)新之一。

打開網(wǎng)易新聞 查看精彩圖片

OpenAI廣告中致敬登月的畫面。

這個(gè)廣告不算夸大其詞。ChatGPT除了是一個(gè)成功的商品,更是人工智能新時(shí)代的召喚師。

英偉達(dá)CEO黃仁勛稱,ChatGPT是人工智能的iPhone時(shí)刻。這個(gè)說法很清晰解釋了GPT基礎(chǔ)模型對(duì)人工智能產(chǎn)業(yè)的改變。iPhone誕生后,手機(jī)不再是打電話的工具,而變成了一個(gè)入口。之后,移動(dòng)互聯(lián)網(wǎng)時(shí)代跟著它來了。

類比手機(jī)的iPhone時(shí)刻,OpenAI推出ChatGPT后,大眾感知到的人工智能也不是上一代的人工智能。而基于Transformer架構(gòu)的“基礎(chǔ)模型”是這個(gè)新時(shí)代的策源和驅(qū)動(dòng)。

創(chuàng)新的種子在更早的2017年種下。從不那么正規(guī)的論文名字《Attention is All you Need》出自論文作者之一喜愛的披頭士樂隊(duì);到論文署名時(shí)作者是排序隨機(jī)排列;再到論文誕生的過程,8名不同背景和來歷的員工從走廊上的偶遇和午餐時(shí)不經(jīng)意的對(duì)話和許多靈機(jī)一動(dòng)中創(chuàng)造了新架構(gòu)——你能看到一切都那么有偶然性。

它帶來的深遠(yuǎn)影響,當(dāng)下似乎也很難描摹全貌。

ChatGPT是其中的重要瞬間,而高光時(shí)刻少不了2024年諾貝爾獎(jiǎng)。物理學(xué)獎(jiǎng)表彰了Geoffrey Hinton通過人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器學(xué)習(xí)的奠基性發(fā)明,化學(xué)獎(jiǎng)名單里則有谷歌旗下DeepMind公司用人工智能來解決蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的AlphaFold2的發(fā)明者。人們意識(shí)到,人工智能還在變革科學(xué)發(fā)現(xiàn)。AlphaFold2就是基于Transformer架構(gòu)的。

大眾察覺不到之處,若干行業(yè)在上演的“殺死你的,與你無關(guān)”戲碼,都與這場(chǎng)變革有隱秘的聯(lián)系。以機(jī)器人領(lǐng)域?yàn)槔捎赥ransformer架構(gòu)的新技術(shù)路線出現(xiàn),機(jī)器人的核心能力點(diǎn)不再是機(jī)器人的機(jī)械結(jié)構(gòu),波士頓動(dòng)力積累了20年的機(jī)械能力優(yōu)勢(shì),在行業(yè)轉(zhuǎn)向?qū)C(jī)器人大腦和軟件算法的追逐中變得毫無意義。有人將這場(chǎng)變革影響總結(jié)為“馬斯克殺死了波士頓動(dòng)力”,而線索源頭則又回到了2017年。

可以說,“基礎(chǔ)模型”已經(jīng)成為當(dāng)前人工智能領(lǐng)域最關(guān)鍵戰(zhàn)場(chǎng)。它影響的不只是狹義的人工智能產(chǎn)業(yè),還會(huì)顛覆科技創(chuàng)新本身。

阿里云創(chuàng)始人,之江實(shí)驗(yàn)室主任王堅(jiān)博士比喻,它就像文明發(fā)展歷程里的長江和黃河,有了這兩條大河,才有沿著河流繁衍生息的文明和生態(tài)。

基礎(chǔ)模型的基礎(chǔ)性和深遠(yuǎn)影響,也讓圍繞著基礎(chǔ)模型的競(jìng)爭(zhēng),變成了國家和區(qū)域在人工時(shí)代發(fā)展權(quán)的競(jìng)爭(zhēng)。參與這場(chǎng)全球競(jìng)爭(zhēng)的必要性不言而喻,以DeepSeek、阿里云、之江實(shí)驗(yàn)室為代表的中國開源力量對(duì)全球科技平權(quán),消除發(fā)展鴻溝的價(jià)值也更為突出。

如何在這場(chǎng)競(jìng)爭(zhēng)中獲得更大主動(dòng)?有必要回溯創(chuàng)新在美國的發(fā)生過程——從一篇論文到一個(gè)影響國家命運(yùn)的產(chǎn)業(yè)育成,背后其實(shí)是不同組織形態(tài),不同創(chuàng)新機(jī)制的合力結(jié)果。它誕生于眾多偶然中。

種子出自谷歌的8人臨時(shí)小組,其中不乏天馬行空的想法和不同創(chuàng)意碰撞后的化學(xué)反應(yīng)。

打開網(wǎng)易新聞 查看精彩圖片

英偉達(dá)在一場(chǎng)活動(dòng)上邀請(qǐng)了Transformer論文的八名作者。

之后OpenAI這樣一家以反谷歌的名義集結(jié)的創(chuàng)業(yè)公司接下了火種。當(dāng)時(shí)山姆·奧特曼和馬斯克還在同一個(gè)陣營奮斗,他們希望更強(qiáng)大的人工智能不能出自谷歌。

由于不知道投入會(huì)產(chǎn)出什么,這件事也沒有由已有的大公司來完成,谷歌自己就沒能吸收論文的思路搶占先機(jī)。甚至組織形態(tài)上也不能完全按照此前的形式,于是非營利性組織OpenAI創(chuàng)立,由馬斯克主要投資,它是硅谷風(fēng)投創(chuàng)新機(jī)制之外的物種。

而OpenAI長成,又不只是創(chuàng)業(yè)公司的神跡。背后有2019年與云計(jì)算巨頭微軟秘密接觸對(duì)方量身打造的超級(jí)計(jì)算基礎(chǔ)設(shè)施。直到今天OpenAI身后也站著巨頭微軟。

對(duì)任何想要參與這場(chǎng)戰(zhàn)爭(zhēng)的國家、地區(qū),這是一場(chǎng)團(tuán)戰(zhàn),需要以符合科技競(jìng)爭(zhēng)和創(chuàng)新發(fā)生的邏輯來參與。

從這個(gè)意義看,浙江涌現(xiàn)出了由夢(mèng)想驅(qū)動(dòng)的創(chuàng)業(yè)公司DeepSeek、云計(jì)算龍頭阿里云和非營利屬性的新型研發(fā)機(jī)構(gòu)之江實(shí)驗(yàn)室,無意吻合了大模型時(shí)代多元主體參與的創(chuàng)新邏輯。

多元主體,不同創(chuàng)新機(jī)制構(gòu)成的“鐵三角”,形成的機(jī)制互補(bǔ)特性,為中國參與這場(chǎng)基礎(chǔ)模型競(jìng)爭(zhēng)貢獻(xiàn)了獨(dú)特的浙江力量。解析浙江基礎(chǔ)模型“三劍客”這一樣本,也有利于在這場(chǎng)基礎(chǔ)模型戰(zhàn)爭(zhēng)中走得更遠(yuǎn)。

03

創(chuàng)新從哪里來?

估計(jì)很多人沒有留意孕育DeepSeek的母體,幻方的英文名,high-flyer,登錄官網(wǎng)就能看到這個(gè)詞。遠(yuǎn)大抱負(fù)的人。

對(duì)于事后想要尋找創(chuàng)新來路的人,這可能是另一個(gè)線索。梁文鋒自己說的是,要做最難最正確的事。

它們表達(dá)了同樣的意思,中國人要參與全球競(jìng)爭(zhēng),中國人要參與全球創(chuàng)新。就像錢學(xué)森幾十年前的那句反問,“中國人為什么不行?”

浙江的三劍客,都有這種參與全球競(jìng)爭(zhēng)的眼界和勇氣。杭州城的另一個(gè)開源巨頭阿里云,成立之初瞄準(zhǔn)的就是全球云計(jì)算產(chǎn)業(yè)的競(jìng)爭(zhēng),它幾乎與硅谷巨頭前后腳邁出步伐。

打開網(wǎng)易新聞 查看精彩圖片

云棲小鎮(zhèn)孕育了阿里云。

而發(fā)布地學(xué)開源模型GeoGPT的之江實(shí)驗(yàn)室,心里想著的目標(biāo)也是要為全球科學(xué)研究提供公共產(chǎn)品。

這是中國新一代創(chuàng)新者必然要走的路。這些角色批量出現(xiàn)在浙江也很好理解,這里市場(chǎng)經(jīng)濟(jì)最發(fā)達(dá),企業(yè)實(shí)力雄厚,更有條件去參與全球硬核創(chuàng)新。同時(shí),浙江本來就有義烏這樣鏈接世界需求的市場(chǎng),在傳統(tǒng)產(chǎn)業(yè)競(jìng)爭(zhēng)變得更激烈的背景下,整個(gè)社會(huì)更早體悟到要參與全球創(chuàng)新浪潮的必要性。

“信仰者會(huì)之前就在這里,之后也在這里。”梁文鋒此前認(rèn)為可以用這種方式識(shí)別AI信仰者。某種程度上,它可能還能解釋為什么杭州在這波開源浪潮里得以形成“三劍客”格局。

2009年時(shí),梁文鋒就開始研究GPU計(jì)算,探索用模型來給市場(chǎng)定價(jià)。由于堅(jiān)定相信計(jì)算可以改變世界,幻方在2021年早早投資AI算力,這為后來DeepSeek能參與大模型競(jìng)爭(zhēng)奠定了堅(jiān)實(shí)的基礎(chǔ)。

阿里云押注云計(jì)算浪潮也始于2009年,經(jīng)過多年積累成為全球云計(jì)算市場(chǎng)前四的玩家,并且2021年就開始了大模型的研發(fā)。而承擔(dān)國家科技使命的之江實(shí)驗(yàn)室也早已調(diào)整規(guī)劃,聚焦智能計(jì)算,構(gòu)建了智算集群,在最后關(guān)鍵時(shí)刻趕上了大模型時(shí)代的班車。

打開網(wǎng)易新聞 查看精彩圖片

承擔(dān)國家科技使命的之江實(shí)驗(yàn)室在2023年調(diào)整規(guī)劃,聚焦智能計(jì)算。

在這波浪潮里能站到前列看起來需要點(diǎn)運(yùn)氣,但本質(zhì)上,球滾到了長期主義者們的腳下。

這波創(chuàng)新者們還有一個(gè)有趣的特質(zhì),他們的驅(qū)動(dòng)力很少與商業(yè)數(shù)據(jù)掛鉤,甚至充滿感性色彩。

梁文鋒此前提及,顛覆性技術(shù)面前,閉源形成的護(hù)城河是短暫的。開源發(fā)論文其實(shí)沒有失去什么,價(jià)值可以沉淀在團(tuán)隊(duì)上,進(jìn)而形成創(chuàng)新的組織和文化?;梅竭€在進(jìn)軍AGI的公告中寫著,“好奇心,是最大的時(shí)代精神”。

肩負(fù)國家科技使命的之江實(shí)驗(yàn)室,研發(fā)團(tuán)隊(duì)在打磨GeoGPT時(shí)目標(biāo)也非常樸素,他們提出要做出能讓自己感到驕傲的產(chǎn)品,為全球的地球科學(xué)家服務(wù)。

另外,Transformer的發(fā)明歷程充滿了跨領(lǐng)域的碰撞和偶然。論文發(fā)布五年后能被大眾感知到的ChatGPT才出現(xiàn)——這意味著創(chuàng)新需要生長空隙,才能走到大眾面前。

而DeepSeek的發(fā)展歷程也頗具偶然性,同時(shí)這種偶然里又有某種必然。因?yàn)橹挥惺袌?chǎng)經(jīng)濟(jì)發(fā)達(dá)的地方才能理解“資本”這種生產(chǎn)要素的重要性。

也只有市場(chǎng)經(jīng)濟(jì)發(fā)達(dá),老百姓手里才有閑錢。這些錢可以投進(jìn)互金平臺(tái),成就中國互聯(lián)網(wǎng)金融之都;可以投資創(chuàng)業(yè)公司,讓杭州成為“天使之城”,也可以流向中國第一家互聯(lián)網(wǎng)銀行或者中國最知名的量化基金。在幻方這種用計(jì)算給市場(chǎng)定價(jià)的量化操作模式賺到大錢后,大家也不覺得它是異端,這才有了后面的DeepSeek。

打開網(wǎng)易新聞 查看精彩圖片

幻方量化成立于2015年,很快就躋身百億私募。

十幾年前,同樣的故事也在這座城市上演過。云計(jì)算浪潮開啟之際,杭州和阿里,也是全國為數(shù)不多沒有把云計(jì)算當(dāng)成騙子的城市和公司。而寬容和開放的環(huán)境下,十幾年前的投資,最終也讓阿里和杭州在大模型時(shí)代能手握全球前四的云計(jì)算公司這張牌。

浙江杭州是個(gè)愿意給“偶然”留出空隙的地方,這對(duì)這波開源創(chuàng)新浪潮在浙江涌現(xiàn)至關(guān)重要。

04

犄角之勢(shì)

這一波人工智能發(fā)展浪潮,浙江既不算傳統(tǒng)科教重鎮(zhèn),沒有高端國際化人才優(yōu)勢(shì),產(chǎn)業(yè)鏈完備程度也不占優(yōu)勢(shì),能成為開源創(chuàng)新的重要節(jié)點(diǎn),三劍客以不同的創(chuàng)新機(jī)制,扮演了不一樣的角色。

打響這場(chǎng)開源戰(zhàn)爭(zhēng)的創(chuàng)業(yè)企業(yè)DeepSeek,不是傳統(tǒng)的創(chuàng)業(yè)企業(yè)。

據(jù)說,它定義自己是“披著公司外衣的實(shí)驗(yàn)室”。這估計(jì)是強(qiáng)調(diào)理想主義色彩、基礎(chǔ)模型的研究定位。阿里云創(chuàng)始人王堅(jiān)博士則認(rèn)為,這家公司的更好的定義是“拿著閑錢搞創(chuàng)新的創(chuàng)業(yè)公司”。

二者結(jié)合一下,也許能看明白它如何以不同于一般創(chuàng)業(yè)公司的創(chuàng)新機(jī)制來引爆開源浪潮。

用閑錢創(chuàng)業(yè),能讓DeepSeek能做出那個(gè)不顧商業(yè)模式追問的決定,選擇最開放的MIT開源協(xié)議。那些對(duì)技術(shù)平權(quán),科技普惠有巨大需求和渴望的地域、群體和組織,會(huì)因?yàn)檫@個(gè)最開放的協(xié)議傳遞出的普惠善意,積極擁抱和參與DeepSeek的開源生態(tài)。

打開網(wǎng)易新聞 查看精彩圖片

Deepseek創(chuàng)始人梁文鋒出席活動(dòng)演講圖。

而不同于傳統(tǒng)創(chuàng)投模式的資金結(jié)構(gòu)和形態(tài),也為梁文鋒和圍繞著他的技術(shù)理想主義者們打造一個(gè)更純粹簡(jiǎn)單的環(huán)境。他不用回復(fù)朱嘯虎們的PMF拷問,也不用太糾結(jié)APP日活有多少。就像目前這一波開源,所有自有部署的流量,他轉(zhuǎn)手全送了。

行業(yè)龍頭阿里云的創(chuàng)新路徑和模式與創(chuàng)業(yè)公司DeepSeek不同,對(duì)區(qū)域創(chuàng)新的價(jià)值也存在差異。

就像OpenAI背后有微軟Azure的云計(jì)算巨頭那樣,目前美國主流的模型廠商都與頭部的云計(jì)算公司形成了合作。依托于云計(jì)算基礎(chǔ)設(shè)施來完成基礎(chǔ)模型創(chuàng)新,已經(jīng)是行業(yè)內(nèi)通行做法。

阿里云作為國內(nèi)云計(jì)算頭號(hào)玩家,Qwen開源模型已經(jīng)形成了廣泛影響力,“云+AI”的組合,加上阿里的雄厚資金實(shí)力,能長久、穩(wěn)健地推進(jìn)大模型朝向全場(chǎng)景全模態(tài)全尺寸方向發(fā)展。

這里要說一句,杭州是國內(nèi)為數(shù)不多云計(jì)算與基礎(chǔ)模型都能參與全球競(jìng)爭(zhēng)的玩家,而浙江杭州能握住這張牌,背后又是體制機(jī)制創(chuàng)新的結(jié)果。特色小鎮(zhèn)的起點(diǎn)在云棲小鎮(zhèn),也是阿里云成長的地方。今天阿里能完成AI轉(zhuǎn)型,三劍客里有阿里云的身影,十幾年前云棲小鎮(zhèn)時(shí)代就埋下了種子。

阿里云擁有海量的云計(jì)算用戶,背靠阿里的消費(fèi)電商場(chǎng)景積累的平臺(tái)數(shù)據(jù),也能為基礎(chǔ)模型走向產(chǎn)業(yè)應(yīng)用打開了通道。你甚至能從一些被外界視作“失敗”案例里看到龍頭型企業(yè)在推進(jìn)前沿技術(shù)落地場(chǎng)景的作用和價(jià)值。

比如新零售領(lǐng)域,過去兩年阿里堅(jiān)決從這一領(lǐng)域撤退。但這些經(jīng)過數(shù)字化技術(shù)徹底改造的企業(yè),已經(jīng)打造了一個(gè)數(shù)字底座,沉淀出了大量的場(chǎng)景數(shù)據(jù)?;A(chǔ)模型進(jìn)步的成果也更容易被這些企業(yè)所吸收。比如插班生銀泰百貨,到阿里之后又退學(xué),現(xiàn)在可能已經(jīng)是國內(nèi)商場(chǎng)零售領(lǐng)域最先用上Qwen和DeepSeek的企業(yè)。

從這個(gè)意義看,“失敗”這個(gè)詞對(duì)城市創(chuàng)新有著超越單一企業(yè)商業(yè)得失的價(jià)值。

而中小企業(yè)活力強(qiáng)勁,民營經(jīng)濟(jì)活躍,應(yīng)用場(chǎng)景豐富,也讓浙江具備從六七萬家企業(yè)里長出六七條龍的可能性。這是“有效市場(chǎng)”的真正含義——?jiǎng)?chuàng)新充斥著偶然和不確定性,許多參與者會(huì)在黎明到來前死去。死得多了,土地才會(huì)肥沃,它們會(huì)成為新物種的養(yǎng)分。

打開網(wǎng)易新聞 查看精彩圖片

浙江杭州市場(chǎng)經(jīng)濟(jì)發(fā)達(dá),民營企業(yè)眾多。

三劍客里,之江實(shí)驗(yàn)室作為國家戰(zhàn)略科技力量,它的領(lǐng)域和機(jī)制又與商業(yè)公司不同。

作為一家非營利性的新型研發(fā)機(jī)構(gòu),之江實(shí)驗(yàn)室承擔(dān)了國家的使命,能以重投入、重人才的方式大兵團(tuán)作戰(zhàn)。就像此前OpenAI的非營利屬性一樣,這種投入模式不用考慮短期的商業(yè)變現(xiàn),可以從全社會(huì)的大盤子里來考量成果和價(jià)值。無疑,非營利屬性和開放科學(xué)原則,讓之江實(shí)驗(yàn)室能將這類成果奉獻(xiàn)給全球科學(xué)界。

有人說,目前在全球科研領(lǐng)域由中國科學(xué)家主導(dǎo)的公共產(chǎn)品鳳毛麟角。當(dāng)下之江實(shí)驗(yàn)室的開放資源的整合和創(chuàng)新機(jī)制,正讓浙江有機(jī)會(huì)參與到基于人工智能去改變科學(xué)研究體系和科學(xué)研究方式的全球大討論中去。

可以說,從創(chuàng)新領(lǐng)域、機(jī)制、策源-賦能效應(yīng)等多個(gè)維度,三劍客形成了一種犄角之勢(shì),互補(bǔ)協(xié)同,有機(jī)會(huì)與區(qū)域此前的稟賦如數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)鏈、應(yīng)用場(chǎng)景、產(chǎn)學(xué)研資源和數(shù)量龐大的中小企業(yè)等,構(gòu)成浙江發(fā)展新一代人工智能的綜合集成優(yōu)勢(shì)。

結(jié)語

像劍客一樣,去戰(zhàn)斗吧

“我們將以完全透明的方式分享微小而真誠的進(jìn)步”,DeepSeek此前預(yù)告開源周十分謙卑真誠。它的開源成果也引起了全球技術(shù)社區(qū)的廣泛關(guān)注。

2月底,阿里云開源了視覺生成基座模型萬相2.1(Wan),采用了最寬松的Apache2.0開源協(xié)議。上個(gè)月阿里又推出了通義千問QwQ-32B推理模型。阿里云的全模態(tài)、全尺寸大模型開源之路還在繼續(xù)。

中國的開源新勢(shì)力正在以更徹底的姿態(tài)擁抱開放創(chuàng)新。這種前所未有的信息透明度,為全球人工智能的發(fā)展開辟了新的路徑。它促使了原本封閉的基礎(chǔ)模型廠商們?cè)谒伎己驼{(diào)整策略,比如山姆·奧特曼就表示重新考量開源方式,最近OpenAI還預(yù)告將開源一款模型。

同時(shí),它可能也會(huì)激勵(lì)許多國家重新規(guī)劃人工智能的發(fā)展。

日經(jīng)新聞報(bào)道,日本AI研究第一人東京大學(xué)松尾豐教授稱,“日本也需要努力開發(fā)生成式AI模型。像DeepSeek這樣并非大型科技企業(yè)、也沒有雄厚資本的公司,能夠?qū)崿F(xiàn)世界最先進(jìn)的精度,這對(duì)日本的初創(chuàng)企業(yè)來說也是一種鼓舞”。

今年2月在巴黎舉行的人工智能行動(dòng)峰會(huì)上,加納AI戰(zhàn)略專家、rAIma首席執(zhí)行官Rashida Musa稱,他們觀察到DeepSeek無法獲得最優(yōu)越性能的芯片卻突破困境進(jìn)行創(chuàng)新?!斑@也是我們非洲必須要做的事。有了開源模型,我們可以更好地創(chuàng)新。對(duì)于未來,我很期待看到非洲的年輕人不再只著眼于商業(yè)成功,而是思考創(chuàng)造力、激情和影響力?!?/p>

在那些人工智能前沿創(chuàng)新逐漸沉寂的土地上,槍聲正在次第響起。

打開網(wǎng)易新聞 查看精彩圖片

劇照截圖,圖文無關(guān)。

對(duì)中國的開源新勢(shì)力而言,競(jìng)爭(zhēng)也不可避免地變得激烈起來。信息更透明后,玩家們希望快速完成商業(yè)循環(huán)正事實(shí)上變得更困難。

同時(shí),開放分享也會(huì)讓競(jìng)爭(zhēng)對(duì)手獲得技術(shù)。比如美國本身就有強(qiáng)大的開源生態(tài),Meta的Llama系列開源模型的影響力就不可小覷,而美國的開源社區(qū)及工具生態(tài)本身就很強(qiáng)大。中國的開源生力軍們分享的技術(shù)也在讓對(duì)手變得更強(qiáng)大。

可以想見,國內(nèi)開源的領(lǐng)頭羊正面臨著前所未有的競(jìng)爭(zhēng)壓力。

如何持續(xù)保持創(chuàng)新?當(dāng)然是像劍客一樣去繼續(xù)戰(zhàn)斗。

“務(wù)必要瘋狂地懷抱雄心,同時(shí)要瘋狂地真誠”。

(歡迎加作者微信,進(jìn)群交流,微信號(hào)moonfly713)