打開(kāi)網(wǎng)易新聞 查看精彩圖片

這是雪貝財(cái)經(jīng)轉(zhuǎn)載的第4篇文章作者:Jordan Schneider\Angela Shen譯者:雪貝財(cái)經(jīng)(對(duì)原文有刪減、修改)

通過(guò)開(kāi)源其模型,DeepSeek 為任何好奇的開(kāi)發(fā)者提供了學(xué)習(xí)和在節(jié)約成本的創(chuàng)新基礎(chǔ)上進(jìn)行開(kāi)發(fā)的機(jī)會(huì)。雖然開(kāi)源人工智能的定義仍在不斷發(fā)展中,但DeepSeek通過(guò)發(fā)布其代碼、模型和技術(shù)報(bào)告,符合行業(yè)普遍接受的開(kāi)源定義。

這正是開(kāi)源的理想:在全球研發(fā)者構(gòu)建的沙箱中自由交換思想,允許聰明和富有創(chuàng)意的想法相互融合。

開(kāi)源模型的支持者認(rèn)為,開(kāi)源可以加速科學(xué)和創(chuàng)新,改善透明度,分散治理權(quán)力,并增強(qiáng)市場(chǎng)競(jìng)爭(zhēng)力。然而,在人工智能(AI)社區(qū)中,關(guān)于開(kāi)源與閉源的辯論仍在激烈進(jìn)行。

到目前為止,一家公司很難找到一個(gè)明確的、短期內(nèi)有商業(yè)價(jià)值的理由,來(lái)支撐自己選擇開(kāi)源其AI模型。從“讓互補(bǔ)品標(biāo)準(zhǔn)化”的角度來(lái)看,Meta公司的做法是有道理的,但這一邏輯并不適用于像DeepSeek這樣的純粹AI實(shí)驗(yàn)室。

在中國(guó)的科技領(lǐng)域,這種務(wù)實(shí)的觀點(diǎn)較為常見(jiàn)。百度創(chuàng)始人李彥宏就曾直言不諱地表示:開(kāi)源其實(shí)是一種智商稅。

“當(dāng)你理性地去想,大模型能夠帶來(lái)什么價(jià)值,以什么樣的成本帶來(lái)價(jià)值的時(shí)候,就會(huì)發(fā)現(xiàn),你永遠(yuǎn)應(yīng)該選擇閉源模型。今天無(wú)論是ChatGPT、還是文心一言等閉源模型,一定比開(kāi)源模型更強(qiáng)大,推理成本更低。”

“開(kāi)源模型打不過(guò)閉源模型。你只要理性的去看待,你的收益是啥,你的成本是啥,你就會(huì)發(fā)現(xiàn),最好還是去選擇閉源模型?!?/p>

財(cái)力雄厚的阿里巴巴公司雖然維持著其開(kāi)源的Qwen模型,但其通過(guò)向客戶推銷 API、云服務(wù)和計(jì)算基礎(chǔ)設(shè)施來(lái)賺錢(qián)。李開(kāi)復(fù)的初創(chuàng)公司01.AI發(fā)布了Yi-34B,作為“反哺”中國(guó)開(kāi)發(fā)者社區(qū)的方式,但該公司最終以最先進(jìn)的專有模型為基礎(chǔ),作為其商業(yè)產(chǎn)品的基礎(chǔ)。

相比之下,DeepSeek在短期內(nèi)沒(méi)有明確的盈利策略和計(jì)劃。

在 2023 年的一次采訪中,CEO 梁文鋒表示“DeepSeek的目標(biāo)是推動(dòng)技術(shù)前沿,而不是快速商業(yè)化”。這種觀點(diǎn)讓人想起 OpenAI 的創(chuàng)始人 Sam Altman 在 2019 年的那句名言:“我不知道我們將來(lái)如何產(chǎn)生收入?!睘?DeepSeek 提供資金的量化對(duì)沖基金幻方量化公司強(qiáng)調(diào),其 AI 模型研究不會(huì)用于股票交易:

“這與金融無(wú)關(guān)……我們關(guān)心的是長(zhǎng)期的社會(huì)價(jià)值。”

我們應(yīng)該相信這些原則性的表態(tài)——這不是一個(gè)政府背景的項(xiàng)目,因?yàn)?DeepSeek 的運(yùn)作方式與傳統(tǒng)的中國(guó)政府支持的行業(yè)截然不同。更準(zhǔn)確地說(shuō),DeepSeek 的員工主要由年輕的本土人才組成,是由除了賺錢(qián)之外的某些動(dòng)力來(lái)驅(qū)動(dòng)的。

一位采訪者詢問(wèn)梁文峰“你們?cè)谧鲆患墀偪竦氖聠幔俊?,他的回答則十分有意思:

“不知道是不是瘋狂,但這個(gè)世界存在很多無(wú)法用邏輯解釋的事,就像很多程序員,也是開(kāi)源社區(qū)的瘋狂貢獻(xiàn)者,一天很累了,還要去貢獻(xiàn)代碼。類似你徒步50公里,整個(gè)身體是癱掉的,但精神很滿足?!?/p>

“不是所有人都能瘋狂一輩子,但大部分人,在他年輕的那些年,可以完全沒(méi)有功利目的,投入地去做一件事?!?/p>

這些年輕的中國(guó)開(kāi)發(fā)者對(duì)開(kāi)源項(xiàng)目的強(qiáng)烈熱情,有時(shí)被稱為“開(kāi)源情懷”。大多數(shù)工程師都會(huì)感到興奮,如果自己的開(kāi)源項(xiàng)目——無(wú)論是數(shù)據(jù)庫(kù)、容器注冊(cè)表等——被一家外國(guó)公司,尤其是硅谷的公司采用。他們會(huì)在已經(jīng)免費(fèi)的軟件基礎(chǔ)上,再無(wú)償付出勞動(dòng),日夜修復(fù) bug、解決問(wèn)題,一切都是為了獲得認(rèn)可與肯定。

在這種“熱忱”或“使命感”之中,隱含著一種深刻的意識(shí):西方根本不尊重他們的工作,因?yàn)樵谕饨缈磥?lái),中國(guó)的一切要么是偷來(lái)的,要么是靠作弊得來(lái)的。

他們也清楚,許多中國(guó)公司一直在免費(fèi)利用開(kāi)源技術(shù)發(fā)展自身,但他們渴望自己去創(chuàng)造、去貢獻(xiàn),并證明自己的技術(shù)足夠優(yōu)秀,值得被外國(guó)企業(yè)免費(fèi)采用——其中既有民族情結(jié),也有作為工程師的自豪感。

在最近的一次采訪中,梁文峰也表達(dá)了類似的看法。他解釋說(shuō),對(duì)頂級(jí)人才吸引最大的,肯定是去解決世界上最難的問(wèn)題。“頂尖人才在中國(guó)是被低估的。因?yàn)檎麄€(gè)社會(huì)層面的硬核創(chuàng)新太少了,使得他們沒(méi)有機(jī)會(huì)被識(shí)別出來(lái)。我們?cè)谧鲎铍y的事,對(duì)他們就是有吸引力的?!?/p>

這一情況如今正在改變。得益于最近的開(kāi)源模型,DeepSeek 已經(jīng)贏得了全球工程師的認(rèn)可與尊重。

然而,監(jiān)管者會(huì)以同樣的眼光看待它嗎?

中國(guó)政府已經(jīng)對(duì)開(kāi)源發(fā)展表達(dá)了一定程度的支持。2018 年,中國(guó)人工智能開(kāi)源軟件發(fā)展聯(lián)盟成立,使開(kāi)源 AI 進(jìn)入了公眾視野。一份官方背景的白皮書(shū)指出,開(kāi)源生態(tài)的建立需要通過(guò)培育開(kāi)源社區(qū)和人才、推動(dòng)標(biāo)準(zhǔn)制定、建立資金支持機(jī)制、完善知識(shí)產(chǎn)權(quán)體系以及加強(qiáng)安全審查等手段來(lái)實(shí)現(xiàn)。

國(guó)家層面的政策規(guī)劃 (參見(jiàn)《第十三個(gè)五年規(guī)劃國(guó)家信息化發(fā)展規(guī)劃》和《軟件和信息技術(shù)服務(wù)業(yè)發(fā)展規(guī)劃》。)在討論軟件和技術(shù)生態(tài)時(shí)提及了開(kāi)源,但尚未專門(mén)針對(duì) AI 領(lǐng)域提出明確方針。同時(shí),兩份不同的五年規(guī)劃也提倡發(fā)展開(kāi)源技術(shù)及其帶來(lái)的益處。(《十四五軟件和信息技術(shù)服務(wù)業(yè)發(fā)展規(guī)劃》提出的目標(biāo)是到2025年建設(shè)兩到三個(gè)具有國(guó)際影響力的操作系統(tǒng)社區(qū)?!妒奈鍑?guó)家信息化發(fā)展規(guī)劃》明確了推進(jìn)國(guó)產(chǎn)操作系統(tǒng)的具體步驟。這些步驟包括深化創(chuàng)新驅(qū)動(dòng),發(fā)展人工智能操作系統(tǒng)框架,以及培育以國(guó)內(nèi)領(lǐng)先企業(yè)為核心的操作系統(tǒng)社區(qū)。)

監(jiān)管層對(duì)國(guó)內(nèi)開(kāi)源社區(qū)的積極態(tài)度,主要是因政界和產(chǎn)業(yè)界須減少對(duì)外國(guó)軟件依賴的需求。

中國(guó)政府在 2000 年代初推動(dòng)開(kāi)源發(fā)展,建立了多個(gè)開(kāi)源軟件聯(lián)盟,并推出自主操作系統(tǒng)(中科紅旗(Red Flag Linux))的研發(fā),以此來(lái)削弱 Microsoft Windows 操作系統(tǒng)的影響力。此后,工業(yè)和信息化部將Gitee指定為中國(guó)的國(guó)家級(jí)“獨(dú)立開(kāi)源代碼托管平臺(tái)”。

在中國(guó)的芯片產(chǎn)業(yè),開(kāi)源項(xiàng)目正被視為降低對(duì)國(guó)外封閉生態(tài)系統(tǒng)依賴的一種途徑。指令集架構(gòu)(ISA)是芯片硬件與計(jì)算機(jī)上運(yùn)行的軟件之間的接口。美國(guó)的英特爾和英國(guó)的ARM公司長(zhǎng)期以來(lái)提供大多數(shù)芯片使用的閉源指令集架構(gòu),這使得這些公司能夠獲得豐厚的利潤(rùn)。

開(kāi)源經(jīng)濟(jì)對(duì)單個(gè)公司來(lái)說(shuō)仍然充滿挑戰(zhàn),中國(guó)尚未為開(kāi)源指令集架構(gòu)(ISA)開(kāi)發(fā)推出類似于芯片產(chǎn)業(yè)其他領(lǐng)域的“大基金”。然而,私營(yíng)和公共領(lǐng)域的興趣種子已經(jīng)開(kāi)始發(fā)芽:除了華為、阿里巴巴等巨頭在為微控制器(MCU)和中央處理器(CPU)投資開(kāi)源ISA外,一些不太知名的公司,如VeriSilicon(芯原股份)、江蘇云涌科技、Bluetrum(中科藍(lán)訊)、C*Core Technology(國(guó)芯科技)等,也在利用開(kāi)源RISC-V、Linux和Khronos生態(tài)系統(tǒng)開(kāi)展研究項(xiàng)目,開(kāi)發(fā)物聯(lián)網(wǎng)應(yīng)用、自然語(yǔ)言處理、神經(jīng)網(wǎng)絡(luò)、自動(dòng)駕駛汽車等解決方案。

2019 年,華為消費(fèi)者軟件部門(mén)總裁曾警告稱,如果沒(méi)有自己的開(kāi)源社區(qū),“一旦發(fā)生我們無(wú)法控制的情況,中國(guó)所有的軟件社區(qū)都將面臨巨大風(fēng)險(xiǎn)?!?/p>

那么,監(jiān)管層是否會(huì)允許 DeepSeek 團(tuán)隊(duì)繼續(xù)他們充滿激情的“技術(shù)秀”呢?盡管官方言辭積極,但人工智能技術(shù)可能帶來(lái)的潛在責(zé)任風(fēng)險(xiǎn),可能會(huì)促使其不樂(lè)于擁抱開(kāi)源。

操作系統(tǒng)無(wú)法像人工智能那樣將信息和權(quán)力傳播到公眾手中。但是,一個(gè)開(kāi)源的 AI 模型能給予公眾廣泛的訪問(wèn)、使用和定制權(quán)限——這些是難以被有效監(jiān)控或撤回的。

而且,AI 的安全風(fēng)險(xiǎn)也顯而易見(jiàn)。隨著 AI 技術(shù)的不斷進(jìn)步,其創(chuàng)造的將不僅僅局限于一個(gè)過(guò)于直言不諱的聊天機(jī)器人。事實(shí)上,我們離這樣的世界并不遙遠(yuǎn),不妨大膽想象,在AI驅(qū)動(dòng)的未來(lái)世界里,如果風(fēng)險(xiǎn)隔離屏障沒(méi)有得到加強(qiáng),那么有人就可以下載某些東西或在某個(gè)云服務(wù)器上啟動(dòng)程序,對(duì)某人的生活或關(guān)鍵基礎(chǔ)設(shè)施造成真正的損害。

目前,中國(guó)的生成式 AI 法規(guī)還缺乏對(duì)開(kāi)源提供者的具體指導(dǎo)。隨著監(jiān)管機(jī)構(gòu)在國(guó)家控制需求與創(chuàng)新雄心之間尋求平衡,DeepSeek 團(tuán)隊(duì)——更多受到好奇心和激情驅(qū)動(dòng),而非眼前利潤(rùn)——可能處于一個(gè)脆弱的位置。

但是,無(wú)論如何,至少在目前,監(jiān)管層看到的依然是開(kāi)源 AI 的潛在好處。

DeepSeek 的成功激發(fā)了中國(guó)更多關(guān)于開(kāi)源優(yōu)勢(shì)的討論。中國(guó)的 AI 初創(chuàng)公司 MiniMax 發(fā)布了多個(gè)開(kāi)源模型,期望“對(duì)優(yōu)秀的工作給予鼓勵(lì),對(duì)不好的工作給予批評(píng),外界的人也能夠作出貢獻(xiàn)?!敝袊?guó)分析人士指出,具有成本效益的開(kāi)源模型能夠支持廣泛的訪問(wèn)和采用,尤其是在全球南方國(guó)家。

一位工程師發(fā)布了一份傳播廣泛的文章,他在文章中駁斥了Anthropic公司的首席執(zhí)行官Dario關(guān)于DeepSeek和出口管制的文章:

Dario 提出了一個(gè)關(guān)鍵問(wèn)題:如果中國(guó)在 2026–2027 年獲得數(shù)百萬(wàn)臺(tái)高端 GPU,會(huì)發(fā)生什么?他的回答是——如果中國(guó)無(wú)法獲得這些計(jì)算資源,美國(guó)將進(jìn)入“單極 AI 主導(dǎo)”階段,并可能通過(guò) AI 的自我強(qiáng)化機(jī)制,長(zhǎng)期鞏固其優(yōu)勢(shì)。然而,如果中國(guó)確實(shí)獲得了這些資源,美國(guó)可能面臨一場(chǎng)持久的“AI 軍備競(jìng)賽”。

我的看法是:無(wú)論是單極還是雙極,AI 發(fā)展已經(jīng)不可逆轉(zhuǎn)地進(jìn)入了全球擴(kuò)散的階段。美國(guó)不會(huì)壟斷 AI,中國(guó)也不會(huì)被遏制,像歐洲、日本、印度等國(guó)家也不會(huì)袖手旁觀。出口管制、模型競(jìng)爭(zhēng)和資本流動(dòng)等變量可能會(huì)影響競(jìng)爭(zhēng)的節(jié)奏,但它們無(wú)法阻止世界朝著更先進(jìn)的 AI 形式邁進(jìn)。

DeepSeek 不是終點(diǎn),而是一個(gè)信號(hào)——它的意義不在于“擊敗”任何人,而在于證明世界已經(jīng)進(jìn)入了一個(gè)不可逆轉(zhuǎn)的大規(guī)模 AI 競(jìng)爭(zhēng)時(shí)代。

在思考 DeepSeek 時(shí),兩個(gè)觀點(diǎn)可能同時(shí)成立:

DeepSeek 可能選擇開(kāi)源其模型,和世界各地的開(kāi)發(fā)者選擇開(kāi)源一樣,是因?yàn)閷?duì)開(kāi)放、全球研究社區(qū)的價(jià)值有著真誠(chéng)的信仰——他們希望展示自己的成就,并激勵(lì)他人基于其工作的基礎(chǔ)進(jìn)行構(gòu)建。

與此同時(shí),隨著 AI 模型變得愈加強(qiáng)大,政府監(jiān)管層可能會(huì)有動(dòng)力介入并掌握控制權(quán)。

除了政府的直接干預(yù),DeepSeek 的成就將為企業(yè)合作伙伴打開(kāi)大門(mén),提供比目前 DeepSeek 所擁有的計(jì)算能力更為龐大的資源。DeepSeek沒(méi)有外部投資者,沒(méi)有頂級(jí)西方實(shí)驗(yàn)室的海歸學(xué)者,也沒(méi)有政府合同或流行的消費(fèi)級(jí)應(yīng)用。這種情況將會(huì)改變。正如 OpenAI 在推出 ChatGPT 后與微軟合作的例子一樣,中國(guó)的頂級(jí)云計(jì)算公司——字節(jié)跳動(dòng)、阿里巴巴、騰訊和華為——將會(huì)主動(dòng)接觸。

考慮到梁云峰的硬核創(chuàng)新承諾和他對(duì)計(jì)算資源不足的坦承,他可能不會(huì)放棄在研發(fā)中獲得額外算力資源的機(jī)會(huì)。這可能會(huì)將 DeepSeek 推向真正推動(dòng)創(chuàng)新前沿的方向,與西方的主要 AI 參與者展開(kāi)競(jìng)爭(zhēng)。

一個(gè)問(wèn)題留給未來(lái):開(kāi)源 AI 在中國(guó)的未來(lái)如何?算力資源的吸引力會(huì)不會(huì)使 DeepSeek 偏離其開(kāi)源理念?監(jiān)管層會(huì)不會(huì)為了安全和控制介入?