打開網(wǎng)易新聞 查看精彩圖片

在大部分科技領(lǐng)域里,基本都是美國(guó)引領(lǐng),中國(guó)跟隨。在數(shù)字化、智能化領(lǐng)域,這個(gè)規(guī)律也適用。

但在數(shù)據(jù)領(lǐng)域,有一件事情,如果中國(guó)做成了,那將走出一條不同于歐美的路。這件事情,就是數(shù)據(jù)要素化改革。

在AI發(fā)展的敘事中,幾乎所有焦點(diǎn)都曾集中在技術(shù)演進(jìn)的前臺(tái):模型有多大?參數(shù)有多少?推理速度多快?誰率先實(shí)現(xiàn)了千億級(jí)參數(shù)、萬億級(jí)語料、類人對(duì)話?

但今天,我們已來到一個(gè)新的臨界點(diǎn):所有領(lǐng)先的大模型都已經(jīng)“能說會(huì)寫”,卻在“深度認(rèn)知”上開始撞墻。

為什么?問題并不出在算法本身,而在算法背后“認(rèn)知能力的供給體系”——即:數(shù)據(jù)從哪里來?是否可信?能否被持續(xù)調(diào)度和泛化利用?

這不僅僅是一個(gè)技術(shù)工程問題,還是一個(gè)制度設(shè)計(jì)問題。

模型的智能邊界,已不再只由參數(shù)量決定。

隨著模型訓(xùn)練的邊際收益遞減,AI能力的差異,正在從“模型結(jié)構(gòu)”轉(zhuǎn)向“數(shù)據(jù)治理”——誰擁有可控、可信、可協(xié)同的數(shù)據(jù)生態(tài),誰就能訓(xùn)練出更穩(wěn)健、更具場(chǎng)景理解力、更少幻覺的大模型。

但我們也越來越清晰地看到一個(gè)全球性難題:公共語料已被挖掘殆盡,私域數(shù)據(jù)則深鎖于孤島,數(shù)據(jù)的流通和使用,正被制度壁壘深度卡脖子。

在這個(gè)背景下,決定大模型未來性能上限的,不再只是GPU數(shù)量,也不只是Prompt優(yōu)化技巧,還是——一個(gè)國(guó)家或組織是否具備系統(tǒng)性的“數(shù)據(jù)制度能力”。

某種程度上,“數(shù)據(jù)制度紅利”,成為全球AI競(jìng)爭(zhēng)的新變量。這是AI發(fā)展史上的一次范式躍遷:從“誰能訓(xùn)練更強(qiáng)模型”,走向“誰能構(gòu)建更優(yōu)的數(shù)據(jù)制度”。

而這場(chǎng)競(jìng)逐中,一個(gè)極具戰(zhàn)略性的變量正在浮出水面:中國(guó)的數(shù)據(jù)要素化改革。

這項(xiàng)改革,曾被視為產(chǎn)業(yè)數(shù)字化的一部分,或是數(shù)據(jù)資產(chǎn)定價(jià)、數(shù)據(jù)交易的國(guó)內(nèi)探索。但今天,它的意義遠(yuǎn)超于此——它正在提供一個(gè)完全不同于西方的數(shù)據(jù)治理路徑、主權(quán)框架與協(xié)同模式,成為全球AI生態(tài)中被低估、卻最具制度穿透力的變量之一。

接下來,我們將從全球視角出發(fā),透視大模型所面臨的數(shù)據(jù)資源瓶頸,解析中國(guó)“數(shù)據(jù)要素化”背后的制度邏輯,并探討其在全球智能體系中可能帶來的規(guī)則重塑與價(jià)值重構(gòu)。

全球大模型走到“數(shù)據(jù)主權(quán)”的十字路口

全球大模型走到“數(shù)據(jù)主權(quán)”的十字路口

大模型的發(fā)展,正在逼近其“語料臨界點(diǎn)”。

從GPT-3到GPT-4,再到各類開源模型的百花齊放,背后支撐的,是過去二十年間互聯(lián)網(wǎng)所積累下來的海量公開語料。但今天,高質(zhì)量的公開文本資源幾乎已經(jīng)被用盡。據(jù)OpenAI、Anthropic等多方研究預(yù)測(cè),全球范圍內(nèi)適合用于訓(xùn)練的“公開語料紅利”將在2到3年內(nèi)完全枯竭。

這意味著,大模型的“喂養(yǎng)邊界”已觸手可及。

下一步競(jìng)爭(zhēng),不是拼語料總量,而是拼“誰能合法使用私域數(shù)據(jù)”。

當(dāng)開放數(shù)據(jù)資源即將見頂,模型要繼續(xù)提升認(rèn)知能力,就必須深入到更多結(jié)構(gòu)化與非結(jié)構(gòu)化的“私域數(shù)據(jù)”中:

行業(yè)數(shù)據(jù)(醫(yī)療記錄、制造日志、金融交易、客服語音)

企業(yè)數(shù)據(jù)(用戶行為、設(shè)備狀態(tài)、內(nèi)部知識(shí)庫(kù))

跨境數(shù)據(jù)(供應(yīng)鏈履約記錄、IoT互聯(lián)數(shù)據(jù)、國(guó)際業(yè)務(wù)流)

這些數(shù)據(jù)極具價(jià)值,卻高度敏感、結(jié)構(gòu)復(fù)雜、邊界模糊,不是“爬取”就能合法使用的。

大模型時(shí)代的智能鴻溝,不再取決于誰“爬得快”,而是取決于誰“調(diào)得動(dòng)”——誰能構(gòu)建可信的數(shù)據(jù)使用規(guī)則,誰就能訓(xùn)練出真正具備場(chǎng)景能力與業(yè)務(wù)洞察力的模型。

然而,全球數(shù)據(jù)治理,正陷入三大結(jié)構(gòu)性瓶頸:

1. 權(quán)屬不清:誰擁有數(shù)據(jù)使用權(quán)?用戶?平臺(tái)?采集者?服務(wù)提供商?

面對(duì)龐大的數(shù)據(jù)資產(chǎn),各國(guó)尚未形成統(tǒng)一確權(quán)機(jī)制,法律界定模糊,模型調(diào)用“處處踩雷”。

2. 價(jià)值難衡:數(shù)據(jù)作為商品缺乏定價(jià)模型,作為要素缺乏收益分配機(jī)制

用戶愿意授權(quán)模型使用數(shù)據(jù)嗎?企業(yè)愿意開放數(shù)據(jù)協(xié)作嗎?沒有可預(yù)期的“激勵(lì)結(jié)構(gòu)”,數(shù)據(jù)不會(huì)自發(fā)流動(dòng)。

3. 治理割裂:每個(gè)國(guó)家、每個(gè)行業(yè)都有自己的監(jiān)管口徑,難以協(xié)同

歐盟GDPR強(qiáng)調(diào)數(shù)據(jù)主權(quán),美國(guó)強(qiáng)調(diào)數(shù)據(jù)自由流動(dòng),亞洲國(guó)家政策多元,跨境模型的訓(xùn)練與調(diào)用陷入灰區(qū)地帶。

算法越來越強(qiáng),數(shù)據(jù)卻“關(guān)在門里”,這是一幅矛盾圖景:模型能寫詩(shī)、能畫畫、能規(guī)劃財(cái)報(bào),卻因?yàn)槿狈戏〝?shù)據(jù)支撐,頻繁出現(xiàn)幻覺、偏見、事實(shí)錯(cuò)誤;

這不是模型的錯(cuò),而是數(shù)據(jù)的世界正在變得碎片化、封閉化、治理化。某種程度上,可以說“AI的下一個(gè)難題,不是生成什么,而是‘如何合法地知道’。”

因此,全球大模型的發(fā)展,正在從“技術(shù)突圍”進(jìn)入到“制度突圍”的新階段。接下來,我們將聚焦中國(guó)數(shù)據(jù)要素化改革路徑,深入分析它如何在這一全球博弈格局中,提供出一套具有制度原創(chuàng)性與實(shí)踐落地性的答案。

“數(shù)據(jù)要素化”不是經(jīng)濟(jì)術(shù)語

“數(shù)據(jù)要素化”不是經(jīng)濟(jì)術(shù)語

而是制度體系設(shè)計(jì)

而是制度體系設(shè)計(jì)

過去幾年,“數(shù)據(jù)要素”這個(gè)詞頻繁出現(xiàn)在政策文件、研究報(bào)告和市場(chǎng)展望中,似乎成了數(shù)字經(jīng)濟(jì)的關(guān)鍵詞匯之一。但真正理解它的深意,必須先跳出“資產(chǎn)化”與“定價(jià)權(quán)”的窄視角。

數(shù)據(jù)要素化的真正意義,不是“把數(shù)據(jù)賣掉”,而是“為智能社會(huì)構(gòu)建一套可確權(quán)、可流通、可協(xié)同的數(shù)據(jù)制度體系”。

這不是產(chǎn)業(yè)層的改革,而是一次制度性架構(gòu)重塑。

“數(shù)據(jù)要素化”,本質(zhì)是重建信任機(jī)制與協(xié)作規(guī)則。

在大模型時(shí)代,數(shù)據(jù)不再是被動(dòng)存儲(chǔ)的資產(chǎn),而是構(gòu)成“認(rèn)知引擎”的能量源。它的流通、調(diào)用、聚合、壓縮、泛化,決定了模型的智能邊界。

但沒有制度保障的數(shù)據(jù)流動(dòng),是不可持續(xù)的。只有構(gòu)建一套“可以使用、可以追責(zé)、可以再組織”的體系,數(shù)據(jù)才可能以可信方式融入智能系統(tǒng)。

這正是中國(guó)“數(shù)據(jù)要素化”改革的核心使命。

它不是簡(jiǎn)單地給數(shù)據(jù)“貼個(gè)價(jià)格”,而是通過制度性安排,將數(shù)據(jù)從資源狀態(tài),轉(zhuǎn)變?yōu)榭山M織、可授權(quán)、可治理的智能系統(tǒng)第一性要素。

目前,三個(gè)關(guān)鍵制度躍遷,正在中國(guó)落地:

1. 從“資源所有”到“使用權(quán)確權(quán)”

傳統(tǒng)數(shù)據(jù)治理強(qiáng)調(diào)采集者/持有者的所有權(quán),而要素化邏輯關(guān)注的是:“誰可以在什么場(chǎng)景下合法使用這些數(shù)據(jù),誰可以獲取價(jià)值回報(bào)”。

這促生了“數(shù)據(jù)三權(quán)分置”的法律結(jié)構(gòu)探索——將數(shù)據(jù)所有權(quán)、使用權(quán)、經(jīng)營(yíng)權(quán)進(jìn)行分離管理,讓“被使用”本身成為合法動(dòng)作。

2. 從“系統(tǒng)孤島”到“可信交換協(xié)議 + 監(jiān)管中臺(tái)”

各地正在試點(diǎn)建立支持?jǐn)?shù)據(jù)跨平臺(tái)調(diào)用的數(shù)據(jù)交易所、聯(lián)盟鏈平臺(tái)和“監(jiān)管沙箱”機(jī)制,使數(shù)據(jù)在不同系統(tǒng)、不同機(jī)構(gòu)間流通時(shí),有身份、有履歷、有規(guī)則、有邊界。

這背后強(qiáng)調(diào)的,是一種“可溯源 + 可審計(jì) + 可調(diào)度”的信任架構(gòu)——為AI提供真實(shí)、合法、透明的數(shù)據(jù)基礎(chǔ)。

3. 從“單點(diǎn)整合”到“跨域協(xié)同機(jī)制”

“數(shù)據(jù)孤島”不是靠收歸一統(tǒng)消除的,而是靠協(xié)議機(jī)制與中臺(tái)系統(tǒng)建立數(shù)據(jù)聯(lián)邦。

典型機(jī)制如“數(shù)據(jù)中介組織”“數(shù)據(jù)托管節(jié)點(diǎn)”“異地聯(lián)合建模平臺(tái)”,已在醫(yī)療、金融、交通等多個(gè)行業(yè)落地實(shí)踐。

讓我們來看一些樣本:

政務(wù)領(lǐng)域|上海城市大腦、粵港澳政務(wù)協(xié)同平臺(tái):實(shí)現(xiàn)跨部門、跨地區(qū)的政務(wù)數(shù)據(jù)標(biāo)準(zhǔn)對(duì)齊與共用,以制度托底實(shí)現(xiàn)智能服務(wù)能力。

行業(yè)場(chǎng)景|醫(yī)療/金融數(shù)據(jù)中臺(tái):通過行業(yè)數(shù)據(jù)聯(lián)盟推動(dòng)數(shù)據(jù)供給側(cè)改革,在監(jiān)管參與下構(gòu)建“可信半公共平臺(tái)”,支撐多模型、多任務(wù)、多機(jī)構(gòu)AI應(yīng)用落地。

基礎(chǔ)設(shè)施|數(shù)據(jù)交易所與數(shù)據(jù)確權(quán)鏈:北上廣深已建立多個(gè)數(shù)據(jù)交易機(jī)構(gòu),深圳、雄安等地推進(jìn)“數(shù)據(jù)三權(quán)分置+聯(lián)盟鏈確權(quán)”機(jī)制,為“可信調(diào)度 + 合理定價(jià)”打下基礎(chǔ)。

換句話說,中國(guó)要做的,不只是“把數(shù)據(jù)商品化”,而是通過制度架構(gòu),讓數(shù)據(jù)成為可以被智能系統(tǒng)真正調(diào)用的“可信語義資源”。

這不是對(duì)市場(chǎng)邏輯的微調(diào),而是對(duì)未來智能文明基礎(chǔ)設(shè)施的主動(dòng)定義。

下一節(jié),我們將把目光投向全球,對(duì)比中美數(shù)據(jù)治理范式,揭示中國(guó)路徑如何提供另一種數(shù)字主權(quán)與智能系統(tǒng)共生的可能性。

數(shù)據(jù)主權(quán)、信任協(xié)議

數(shù)據(jù)主權(quán)、信任協(xié)議

與全球認(rèn)知秩序的再平衡

與全球認(rèn)知秩序的再平衡

當(dāng)大模型成為國(guó)家競(jìng)爭(zhēng)力的代表性技術(shù)之一,圍繞AI的競(jìng)賽早已不僅停留在技術(shù)層面,而是逐步上升為制度范式之爭(zhēng)。在這場(chǎng)深層次博弈中,數(shù)據(jù)制度的選擇方式,正決定一個(gè)國(guó)家未來AI能力的邊界——不僅是能不能訓(xùn)練模型,更是能不能可信、合法、穩(wěn)定地讓模型運(yùn)行起來。

>中國(guó)模式的優(yōu)勢(shì),不是數(shù)據(jù)總量,而是制度組織力

外界普遍認(rèn)為中國(guó)在大模型領(lǐng)域的最大優(yōu)勢(shì)是“數(shù)據(jù)規(guī)?!?,但這只是表象。

真正具有戰(zhàn)略意義的,是中國(guó)正在構(gòu)建一種“在可控邊界內(nèi)實(shí)現(xiàn)可信協(xié)作”的制度能力。

在“數(shù)據(jù)確權(quán)+數(shù)據(jù)流通+監(jiān)管中臺(tái)”的組合機(jī)制下,中國(guó)正在試圖回答一個(gè)智能時(shí)代最核心的問題:“如何讓數(shù)據(jù)既能高效參與AI訓(xùn)練與運(yùn)行,又能兼顧安全、合規(guī)、信任?”

這一制度體系,不再單純依賴個(gè)人授權(quán)或平臺(tái)自律,而是通過立法、標(biāo)準(zhǔn)、平臺(tái)、交易規(guī)則等多層機(jī)制,實(shí)現(xiàn)數(shù)據(jù)權(quán)益、風(fēng)險(xiǎn)與使用效率的平衡。

>全球影響:制度競(jìng)爭(zhēng)成為AI時(shí)代的新博弈場(chǎng)

隨著AI模型逐步走向跨境部署、跨域協(xié)同,原有的數(shù)據(jù)治理邏輯正在面臨挑戰(zhàn):

模型可以“走出去”,但數(shù)據(jù)不能“帶出去”;

算法可以全球部署,但訓(xùn)練過程可能觸碰不同法律雷區(qū);

智能系統(tǒng)的泛化能力受限于數(shù)據(jù)邊界與授權(quán)障礙;

這就提出了三大關(guān)鍵問題:

1. 是否可能建立一套“跨國(guó)AI數(shù)據(jù)協(xié)作協(xié)議”?

類似WTO、碳排協(xié)定的數(shù)據(jù)治理框架,推動(dòng)形成國(guó)際標(biāo)準(zhǔn)。

2. 制度是否可以成為算法信用的來源?

模型可信不再由技術(shù)驗(yàn)證,而由其數(shù)據(jù)治理路徑提供信任基礎(chǔ)。

3. 誰將主導(dǎo)下一代AI價(jià)值體系的底層協(xié)議與運(yùn)行規(guī)則?

是沿用硅谷的“技術(shù)自由主義”,還是構(gòu)建一種“治理增強(qiáng)型數(shù)字秩序”?

打開網(wǎng)易新聞 查看精彩圖片

在這三道關(guān)鍵博弈題面前,中國(guó)的數(shù)據(jù)制度路徑正在以某種“全球變量”的姿態(tài)浮現(xiàn)。它不是為了封閉,而是試圖為AI運(yùn)行建立一種“邊界明確、行為合規(guī)、價(jià)值清晰”的基礎(chǔ)秩序。

數(shù)據(jù)不是金礦

數(shù)據(jù)不是金礦

是文明操作系統(tǒng)

是文明操作系統(tǒng)

人類社會(huì)歷經(jīng)資源時(shí)代、工業(yè)時(shí)代、信息時(shí)代,每一次范式躍遷,最終都由一種全新的“底層生產(chǎn)組織邏輯”所驅(qū)動(dòng)。而今天,AI 時(shí)代的底座正在顯現(xiàn):除了GPU、大模型本身,還包括誰掌握了數(shù)據(jù)制度。

在這個(gè)智能系統(tǒng)崛起的關(guān)鍵節(jié)點(diǎn),數(shù)據(jù)不再是“等著被使用的原材料”,而成為認(rèn)知系統(tǒng)的邊界線、演化能力的載體、社會(huì)信任的接口協(xié)議。它決定了:模型訓(xùn)練是否可持續(xù);智能系統(tǒng)能否泛化適配;算法行為是否可解釋、可審計(jì)、可托付。

這意味著,數(shù)據(jù)制度不只是技術(shù)創(chuàng)新的配角,而是數(shù)字文明的“憲法級(jí)組件”。

中國(guó)的數(shù)據(jù)要素改革,要做的就是試圖構(gòu)建一種“制度性紅利”。中國(guó)通過確權(quán)機(jī)制、可信流通協(xié)議、跨域中臺(tái)與交易網(wǎng)絡(luò),力圖打造一套“數(shù)據(jù)驅(qū)動(dòng)但制度可控”的生態(tài)結(jié)構(gòu)——不僅為本國(guó)模型提供合法、高質(zhì)量、可追責(zé)的語義支撐,也在為全球AI生態(tài)提供另一種智能社會(huì)構(gòu)建范式。

這是對(duì)“算法-資本-平臺(tái)”敘事的系統(tǒng)性補(bǔ)充,是一種以制度設(shè)計(jì)替代無限擴(kuò)張的路徑創(chuàng)新。

在未來的全球智能競(jìng)爭(zhēng)中,誰能率先構(gòu)建“可信數(shù)據(jù)秩序”,誰就擁有輸出AI治理標(biāo)準(zhǔn)、主導(dǎo)國(guó)際規(guī)則設(shè)定的底氣。

未來的AI強(qiáng)國(guó),不僅是模型最強(qiáng)、GPU最多的國(guó)家,還是最早定義“數(shù)據(jù)制度”的國(guó)家。

當(dāng)所有模型的能力趨近時(shí),決定系統(tǒng)上限的,將不再只是算力和算法,還是我們?cè)敢庖栽鯓拥姆绞浇M織數(shù)據(jù)、管理知識(shí)、重構(gòu)信任。

能否構(gòu)建起來一套能真正釋放出數(shù)據(jù)價(jià)值的機(jī)制體系,那將是一場(chǎng)關(guān)于智能文明底層架構(gòu)的較量。但實(shí)事求是的說,這條路我們能走多遠(yuǎn),還不好說。但總要有人去走進(jìn)無人區(qū),哪怕跌跌撞撞,也要勇敢前行。