有深度 有廣度
就等你來(lái)關(guān)注

編輯:Yuki | ID:YukiYuki1108
在暗示推出一款開(kāi)源模型的一個(gè)多月后(2025年4月1日),OpenAI CEO山姆·奧特曼(Sam Altman)在社交平臺(tái)X上正式宣布:OpenAI計(jì)劃在未來(lái)幾個(gè)月內(nèi)發(fā)布一款具備推理能力的“開(kāi)放權(quán)重”(open-weight)大模型。這一消息迅速引發(fā)了科技媒體和行業(yè)觀察者的廣泛關(guān)注。許多中文媒體以“OpenAI預(yù)告/即將發(fā)布開(kāi)源模型”為標(biāo)題進(jìn)行報(bào)道;一些業(yè)內(nèi)人士則將其視為OpenAI重新走向開(kāi)源的標(biāo)志性一步

然而,“開(kāi)放權(quán)重”是否等同于“開(kāi)源”?這一問(wèn)題的答案并不簡(jiǎn)單。從OpenAI的措辭
到行業(yè)實(shí)踐,“開(kāi)放權(quán)重”與“開(kāi)源”之間存在著顯著差異。本文將深入探討這一話題。
一、“開(kāi)放權(quán)重”與“開(kāi)源”:概念辨析
首先需要明確的是,“開(kāi)放權(quán)重”(open-weight)與“開(kāi)源”(open-source)是兩個(gè)不同的概念。
“開(kāi)放權(quán)重”:指的是在模型訓(xùn)練完成后公開(kāi)其參數(shù)(weights),允許開(kāi)發(fā)者基于這些參數(shù)進(jìn)行部署、測(cè)試甚至微調(diào)。然而,“開(kāi)放權(quán)重”并不包括訓(xùn)練數(shù)據(jù)、完整訓(xùn)練代碼或明確的使用權(quán)限。這意味著開(kāi)發(fā)者可以利用這些參數(shù)進(jìn)行本地部署和推理服務(wù)(如對(duì)話生成或文本分類(lèi)),但無(wú)法復(fù)現(xiàn)完整的訓(xùn)練過(guò)程或完全自由地修改模型的底層架構(gòu)。
“開(kāi)源”:則是一個(gè)更廣泛的概念。它不僅包括代碼公開(kāi)(如訓(xùn)練代碼和推理代碼),還可能涉及訓(xùn)練數(shù)據(jù)、方法透明性以及使用權(quán)限的自由度。開(kāi)源的核心理念是全面透明和自由使用。
從這個(gè)角度來(lái)看,“開(kāi)放權(quán)重”更像是開(kāi)源的一個(gè)子集——它降低了模型的使用門(mén)檻(如本地部署和微調(diào)),但無(wú)法滿足真正的可驗(yàn)證性與可重現(xiàn)性需求。

二、行業(yè)實(shí)踐:“開(kāi)放權(quán)重”已成為主流
盡管“開(kāi)放權(quán)重”與“開(kāi)源”存在差異(如缺少訓(xùn)練數(shù)據(jù)和完整
訓(xùn)練代碼),但從行業(yè)實(shí)踐來(lái)看,“開(kāi)放權(quán)重”已經(jīng)成為當(dāng)前大模型的主流模式。
以DeepSeek、Qwen(阿里)和LLaMA(Meta)為例:
DeepSeek:其V2、V3和R1等系列均采用了“開(kāi)放權(quán)重”策略。此外DeepSeek還提供了技術(shù)報(bào)告并采用了限制極少的MIT開(kāi)源協(xié)議——允許任何人自由地使用、修改、分發(fā)和商業(yè)化軟件或模型。
Qwen(阿里):Qwen系列不僅公開(kāi)了權(quán)重還采用了Apache2.0協(xié)議——允許用戶自由地使用修改分發(fā)代碼包括商業(yè)用途僅要求保留原始版權(quán)聲明許可聲明。
LLaMA(Meta):雖然LLaMA系列也公開(kāi)了參數(shù)推理腳本但其使用協(xié)議限制更多從LLaMA2開(kāi)始Meta采用了更寬松許可證(LLaMA3又更開(kāi)放了一點(diǎn))但仍需申請(qǐng)使用且不能直接用于某些商業(yè)應(yīng)用發(fā)布服務(wù)導(dǎo)致其落地場(chǎng)景受限。
這些案例表明盡管三者都自稱“開(kāi)源”,但如果將“開(kāi)源”拆解為幾個(gè)維度來(lái)看——如是否公開(kāi)完整訓(xùn)練數(shù)據(jù)是否提供可復(fù)現(xiàn)訓(xùn)練代碼等——你會(huì)發(fā)現(xiàn)沒(méi)有一家是真正意義上做到全開(kāi)。

三、“o3-mini級(jí)別”:OpenAI新模型的定位
根據(jù)Sam Altman在今年2月的暗示以及最新推文中提到的“powerful new open-weight model with reasoning”,可以推測(cè)出OpenAI在開(kāi)源路線上最終選擇了一個(gè)“o3-mini級(jí)別”的推理型大語(yǔ)言來(lái)打開(kāi)局面。
所謂“o3-mini級(jí)別”,指的是具備較強(qiáng)推理能力且適合輕量化部署的中小型大語(yǔ)言——這類(lèi)既能夠滿足企業(yè)級(jí)應(yīng)用需求又能夠降低硬件成本使其成為當(dāng)前市場(chǎng)上最受歡迎類(lèi)型之一。

四、“重返”還是“妥協(xié)”?
對(duì)于OpenAI來(lái)說(shuō)這次重返社區(qū)意義遠(yuǎn)不止發(fā)布那么簡(jiǎn)單過(guò)去兩年間Meta Mistral Qwen DeepSeek輪番上場(chǎng)一邊打造一邊打造生態(tài)甚至逐漸形成規(guī)模龐大生態(tài)尤其在DeepSeek-V3/R1之后越來(lái)越多硬件軟件廠商加入其中使得整個(gè)行業(yè)格局發(fā)生顯著變化而作為曾經(jīng)引領(lǐng)者卻因閉源策略逐漸被邊緣化因此這次部分回歸可以看作是對(duì)競(jìng)爭(zhēng)壓力回應(yīng)同時(shí)也是對(duì)自身定位調(diào)整。
五、“真開(kāi)”還是“假開(kāi)”?
盡管很多人以為是以起家但實(shí)際上至少在GPT-2時(shí)期就有了閉源路線打算2019年初GPT-2發(fā)布開(kāi)始以惡意使用風(fēng)險(xiǎn)名義拒絕公開(kāi)但在外界一致認(rèn)為夸大風(fēng)險(xiǎn)輿論下才在年底公開(kāi)滿血版15億參數(shù)GPT-2不論如何從GPT-3開(kāi)始徹底走上閉源路線不再公開(kāi)權(quán)重代碼或訓(xùn)練數(shù)據(jù)因此這一次重新也可以視為對(duì)社區(qū)釋放信號(hào)但需要明確是從Sam Altman采用字眼來(lái)看大概率將和今天DeepSeek Qwen LLaMA一樣:
- 優(yōu)點(diǎn)
:降低門(mén)檻支持本地部署微調(diào)適配
- 缺點(diǎn)
:無(wú)法復(fù)現(xiàn)完整過(guò)程難以滿足真正需求

熱門(mén)跟貼