打開網(wǎng)易新聞 查看精彩圖片

Web3天空之城·城主

先聲明一下,以免有同學認為標題后半段過于聳人聽聞,這是一個直接的引用,來自于一位美國學者的視頻《DeeSeek不僅在顛覆人工智能領域,也正在撼動美國資本主義》,視頻可以在本城B站觀看:https://b23.tv/dYalmTH

視頻內(nèi)容不長,文字版先行附上:

"DeepSeek是一家中國人工智能公司,正在挑戰(zhàn)美國資本主義的模式。美國經(jīng)濟與大型科技公司緊密相連,沒有它們,經(jīng)濟增長將極其有限,股市也幾乎不會增長。美國經(jīng)濟的繁榮神話,很大程度上建立在股市屢創(chuàng)新高,而這主要得益于人工智能的炒作價值。

然而,DeepSeek以少量資金,開發(fā)出似乎優(yōu)于ChatGPT的AI模型。它能出色地回答問題,但卻采用了一種與眾不同的方法:不使用英偉達的高科技芯片,能耗遠低于后者,且基于更廉價的大型語言模型。

DeepSeek的作為具有深刻的顛覆性,動搖了美國資本主義的根基。美國資本主義基于三個核心理念:首先,最大限度地保護發(fā)明,將財富集中于少數(shù)人手中,造就了“科技兄弟”以及相關的財富分配不均;其次,盡可能地反競爭,專利律師成為核心角色,通過法律手段阻礙競爭,從而維持高價;第三,由于缺乏競爭,導致效率低下,沒有動力降低成本。

你財力雄厚,可以隨意揮霍,擁有舒適區(qū),讓很多人為你工作,即便他們并非必需,你仍然能申報巨額利潤,感覺像城堡之王,享受員工的感激之情。因此,你缺乏精簡、強硬和高效的動力,這與市場資本主義的理想背道而馳,尤其在美國更是如此。

DeepSeek粉碎了這些神話。它成本低廉,市場策略迥異,甚至開源了源代碼,任何人都可訪問和使用,這與美國模式截然相反。它并非設置法律障礙,而是開放共享,雖然它依然會對大型語言模型和答案收費,但價格遠低于美國公司。

這得益于其低端技術和更低的能耗。這實際上推翻了特朗普當選前流行的投資策略,該策略認為數(shù)十億美元投資人工智能將帶來增長,從而讓特朗普繼續(xù)執(zhí)政。

然而,事實并非如此。人們不禁懷疑,這是否是中國政府為削弱特朗普潛在關稅戰(zhàn)而精心策劃的時機。我確實有這種懷疑,所以坦言之。但DeepSeek確實有效,我見過它生成的優(yōu)秀內(nèi)容。

無論這是否是中國政府的策略,DeepSeek都成功擾亂了美國人工智能市場,甚至可能阻止美國獲得該領域的全球壟斷地位,如同微軟、谷歌和推特等公司所享有的那樣。如果DeepSeek及其中國競爭對手能創(chuàng)造出與OpenAI、微軟、谷歌等公司高成本產(chǎn)品截然不同的產(chǎn)品,那么人工智能領域的壟斷趨勢可能無法復制。

我不知道這將走向何方,也無法預測,我相信其他人也無法預測。這可能只是一場小風波,但讓我們假設并非如此。如果DeepSeek的成功屬實,那么特朗普對美國市場的號召所建立的整個基礎將被摧毀。

更深層次的是,如果以人工智能及其潛力為基礎的美國經(jīng)濟力量被摧毀,那么特朗普建立以關稅壁壘為后盾的孤立主義美國的計劃也將不復存在。DeepSeek的意義遠超其作為AI模型的優(yōu)劣,它正在挑戰(zhàn)美國資本主義的核心,以及美國右翼的哲學核心。

中國政府是否選擇在特朗普政府上任伊始破壞這些意識形態(tài)并不重要,因為它無論如何都會這么做。

這可能產(chǎn)生巨大影響。

DeepSeek在AI圈的震蕩還在繼續(xù)。

而且,看不到結束。”

這幾天DeepSeek給予美國的大地震仍然在繼續(xù),看不到結束。

讓我們中立一點, 先不對美國資本進行什么評論。但肉眼可見的是,DeepSeek正在分化美國科技巨頭。

DeepSeek黑天鵝出來之后, 首先著急跳出來的就是OpenAI和Anthropic兩小強。

OpenAI的表態(tài)還是相對含蓄的,甚至在今天,OpenAI被迫提前發(fā)布了GPT O3-mini后,奧特曼在線上問答中非常坦誠在表示過去自己可能選錯了方向,他承認: DeepSeek 減弱了 OpenAI 在人工智能領域的領先地位,OpenAI 在開源其技術方面“站在了歷史的錯誤一邊”。需要“ 找出一種不同的開源策略,”奧特曼還說:“并不是所有 OpenAI 的人都持這種觀點,這也不是我們目前的最高優(yōu)先事項……我們將會推出更好的模型,但我們將保持的領先優(yōu)勢將比以前幾年少。”

這個表態(tài)對于一心閉源要搞商業(yè)化的奧特曼來說是不同尋常的。特別是最近OpenAI被曝出正在進行新一輪數(shù)百億美金融資。

更有意思的是Anthropic,其創(chuàng)始人CEO Dario Amodei發(fā)了長篇文章回應。Dario作為前OpenAI首席科學家,號稱因不滿OpenAI的封閉而自立門戶,在以往的訪談里, Dario都以(相對OpenAI)偉光正的科學家形象出現(xiàn),以打造安全性AI作為自己公司的標簽,作為估值超高且唯一能和OpenAI掰手腕的AI大模型創(chuàng)業(yè)公司,Anthropic一直都是資本的香饃饃,特別是錯過了OpenAI的AWS和Google,之前基本上搶著給Anthropic送錢,只為了搭上AI大模型這趟車。

在這篇萬字長文里,Dario不再提如何讓AI普惠人類,不再談人類文明共同進步,而是強調(diào)要加強對中國的芯片和顯卡管制,要如何限制中國AI大模型發(fā)展,要把AI的領導權留在美國。

感覺他急了。

這篇文章實在有點酸,以至于和Anthropic有密切聯(lián)系的開源社區(qū)HuggingFace創(chuàng)始人直接在X上噴這篇文章實在讓人“讀得很痛苦”。

對此城主只能評論,DeepSeek直接扯下了Anthropic的面具。

如外文評論,DeepSeek的出現(xiàn),最大的輸家莫過于Anthropic,OpenAI好歹手里還有推理模型o系列,最強的滿血版o3盡管推理成本奇高,但還是地球最強- 雖然不知道這個最強還能維持多久。Anthropic可是完全沒有公開的推理級大模型的,在這個CEO出來發(fā)酸文的同時,Anthropic內(nèi)部技術人員大概率在捧著DeepSeek無私共享的論文拼命復現(xiàn)R1。由于DeepSeek發(fā)布了頂級推理模型的技術原理,可以想見Google,微軟,AWS,meta這些巨頭的技術部門都在如獲至寶的依照論文打造自己的推理大模型,在這種局面下,沒有拿出推理大模型的Anthropic在AI屆的地位就真的很尷尬了,Dario估計在煩惱,如何繼續(xù)講好自己公司那么高估值的故事。

之前城主文章有提到過,盡管OpenAI和Anthropic官方都防中國人使用,但程度是不一樣的,OpenAI的頁面和API只需要簡單的翻個墻就可以用了;Anthropic對疑似來自中國的用戶的封禁措施只能用發(fā)指來形容,是城主見過的最夸張的封禁措施;無責任猜測,Anthropic應該是用上了自家AI來幫助分析封禁。同時,據(jù)傳Anthropic內(nèi)部絕對禁止和中國人交流。所以在DeepSee V3和Claude3.5 Sonnet并駕齊驅(qū),且R1妥妥超越之后,Anthropic CEO肉眼可見的著急和口不擇言是可以理解的

但撕下了面具,以后帶上就難了?;旧峡梢栽u論,Anthropic只是一個被資本劫持,被DeepSeek懟得有點慌張的AI先行既得利益者而已。(以上歡迎Anthropic內(nèi)部人士來指正)

而對于大公司, 就更有趣了。

最新的消息是各大科技巨頭,包括微軟Azure, AWS,NVIDIA,都第一時間在自己的云服務部署提供了DeepSeeek R1服務。

打不過,就加入。真香定律誰也逃不過。

微軟這一邊還號稱在調(diào)查DeepSeek是否從OpenAI“盜竊”數(shù)據(jù),一方面自己就部署上了。這個做法不敢說滑稽,只能說真香。首先需要明確指出,某些美媒所謂的‘盜竊數(shù)據(jù)’只是又一個慣用的混淆視聽的輿論做法罷了。作為大模型訓練慣例的“蒸餾’(即利用了其他模型的公開輸出作為訓練數(shù)據(jù) -- 況且DeepSeek有沒有,用了多少都沒有任何定論,全在猜測)和盜竊企業(yè)內(nèi)部保密數(shù)據(jù)是有本質(zhì)的區(qū)別的。

美國網(wǎng)友就直接嘲諷,OpenAI恐怕忘記了自己還身背多個指控,未經(jīng)許可非法使用《紐約時報》,油管視頻等數(shù)據(jù)來進行自家大模型訓練。

當然,我們不能以一方的瑕疵去證明另外一方的正確與否。只是,微軟一方面指責DeepSeek R1可能有問題,一方面又怕被搶了API生意趕緊部署在自家Azure云上,這一手就略有喜感了。

然后看看NVIDIA。如果說周一納斯達克因為DeepSeek載入史冊的大跌是反應過度,這幾天NVIDIA的股價卻并沒回升-- 而是一直呈現(xiàn)反復掙扎之態(tài),昨晚繼續(xù)跌了4%,維持在了DeepSeek黑天鵝后的低位120美金。

平心而論,NVIDIA的芯片+CUDA生態(tài)在相當時間里仍然是獨一份,但或許這正是這兩天NV還在低位的根本原因 - 根據(jù)最新的論文解讀,DeepSeek為了在H800這個性能一般的GPU上訓練大模型,甚至直接繞過了CUDA這個NVIDIA的軟件層,直接使用了類似CPU匯編語言的NV硬件編程語言來操作GPU,做出了非同一般的深度優(yōu)化。

這個事情的意義有點深。NVIDIA的護城河是什么,絕對不是GPU硬件本身,而是構建在GPU之上的CUDA軟件生態(tài)。業(yè)界絕大部分的AI訓練推理都深度依賴于CUDA軟件層 -- 這也是AMD如此痛苦的原因,即便生產(chǎn)出了同一級別的GPU, 做AI的大模型企業(yè)和個人用戶也不愿意選擇AMD,無他,因為大家都需要在CUDA上運行大模型的訓練和推理。

AMD也不是沒想過辦法,不就是軟件嗎,只要能兼容CUDA的API接口就可以了。在此前AMD還真的這么做了,利用開源社區(qū)開發(fā)的CUDA兼容層二次開發(fā)以讓自家GPU硬件在軟件層兼容CUDA,結果是,被NVIDIA告了。。。

那些炒作NVIDIA黃仁勛和AMD蘇姿豐是親戚的帖子毫無意義,這兩家基本上水深火熱著呢,無怪乎蘇姿豐最近直接和媒體說,和黃仁勛關系太遠,不熟。

而現(xiàn)在, DeepSeek拋開了CUDA,直接使用底層GPU匯編語言實現(xiàn)了最頂級大模型的訓練。這簡直就是AMD的天賜良機,AMD已經(jīng)第一時間官方發(fā)布新聞,宣稱在自家GPU硬件上跑DeepSeek R1比在Nvidia 硬件更快。

GPU硬件的體系架構基本上是大同小異的,硬件之間的一點點差別, 完全可以依靠底層匯編語言彌補 - 因此Windows DirectX才有可能統(tǒng)一所有顯卡圖形接口呢。而現(xiàn)在,DeepSeek團隊被逼著使用底層匯編語言來操作GPU硬件, 硬生生的在CUDA生態(tài)上撕開了一道口子,這對NVIDIA無疑是個公關的晴天霹靂。在DeepSeek之前我們基本沒聽說過這種操作,一來沒必要,二來團隊的水平一般也做不到這點。NVIDIA對這個事件估計沒有任何思想準備,但幻方做到這么極致也不意外,做量化交易的公司,對性能和延時等都極度敏感,往日的技術積累再加上被嚴格限制的芯片,使用更底層的算法實現(xiàn)性能的最大程度壓榨非常理所當然。如果沒有美國的限制,DeepSeek大概率不會在如此的規(guī)模上率先實現(xiàn)這種壯舉。

當CUDA不再成為壁壘,高興的顯然不止是AMD,國產(chǎn)GPU芯片也終于看到曙光。如果最終大規(guī)模的模型訓練和推理都可以在底層匯編語言上實現(xiàn),而不依賴于CUDA,美國對中國的算力封堵,是否問號變得更大了呢。

華爾街的眼睛還是很犀利的,NVIDIA的困境顯然被看在資本的眼里,這恐怕也是為什么NVIDIA的股價被打壓之后未能直接恢復的原因了。如果美國繼續(xù)芯片封堵的政策,可以想見,國產(chǎn)算力環(huán)境CUDA替代化的運動必將如火如荼的展開,當走到這一步,美國恐怕就真把NVIDIA坑慘了。

所以此前黃仁勛上了新聞的不參加總統(tǒng)就職典禮,也算是一個明確的態(tài)度,和米國zf芯片封堵的政策劃清界限。

城主對NVIDIA和黃仁勛還是很佩服的,也希望NVIDIA能繼續(xù)好好的對國內(nèi)做生意。(5090D這種直接鎖算力不讓運行AI計算的垃圾就不要賣到中國了。)

在大廠里,Google其實是當下最舒服的一家,Google不像微軟那么尷尬,一手要安撫OpenAI一手還要登上DeepSeek R1這艘船,搞得自己打臉。G家完全可以基于自家Gemini AI模型的研究基礎,利用DeepSeek發(fā)布的論文實現(xiàn)自家的推理模型,按照G家的技術實力, 應該很快。微軟本來也有這個本事,無奈自家模型還不太爭氣,恐怕AI團隊建設比G家也差了一些,同時,微軟的AI領導人穆斯塔法和G家的AI掌門人諾獎得主Demis Hassabis 雖然同出自DeepMind,但在技術管理水平上是否還有差距。在這個開卷考試(拿著DeepSeek論文去復刻)中,城主認為G家大概率是獲勝的,我們不妨拭目以待。

聲勢浩大的上線DeepSeek R1的還有AWS。對于亞馬遜而言,這毫無疑問也是一個好機會。在此之前,AWS僅依靠Anthropic的Claude API在大模型市場上占了一小塊版圖,如不是花大價錢投資Anthropic換來了在AWS上的Claude API部署,AWS在AI時代就真挺尷尬的?,F(xiàn)在AWS第一時間上線DeepSeek R1的動機非??梢岳斫?,畢竟這是唯一一個可以和競爭方OpenAI o1/o3推理模型掰手腕且性價比超高的大模型,哪一家云廠商沒有提供這個模型, 就意味著在AI云業(yè)務上失去了一大塊競爭力;這一點,無論如何云業(yè)務負責人都不可以接受。因此,作為Anthropic重要股東的AWS義無反顧要上線DeepSeek R1,作為OpenAI重要股東的微軟Azure也要上線R1,即使要打臉自己手中的重要棋子,也必須要這么做,沒有選擇。

而同為開源旗手的Meta呢?如大家所看到的傳聞,Meta內(nèi)部已經(jīng)焦灼萬分,一方面要努力研究和復刻R1,一方面要想辦法和董事會解釋GenAI部門的高薪合理性,這個段子網(wǎng)上文章很多,就不重復了。無論如何,對于Meta開源Llama,城主是表示敬佩的,在很長時間里,DeepSeek沒出來之前,這是開源AI社區(qū)最大的旗幟。Meta開源的方向沒有什么可吐槽的,可能唯一的問題只是在投入產(chǎn)出比之上了。

總而言之,對于美國科技巨頭而言,針對DeepSeek的“國家安全”敘事看來無法影響任何科技巨頭使用DeepSeek R1;在巨大的資本利益面前,“國家安全”的敘事顯然是無力和蒼白的。美科技巨頭的反應,無論是指責DeepSeek的數(shù)據(jù)使用的"問題"還是第一時間搶先部署DeepSeek R1服務,甚至還有針對DeepSeek的來自美國的大規(guī)模網(wǎng)絡攻擊。所有的一切不外乎一個目的,就是維護美AI科技的領先地位,從而保證這一波以AI為基礎的美國科技資本安全。

DeepSeek的故事還在繼續(xù),這個注定載入科技史的事件會發(fā)展到什么程度,我們都是幸運的見證者。