你如果關(guān)注AI領(lǐng)域的新聞,可能會(huì)在充滿(mǎn)矛盾的信息轟炸里深感困惑:有時(shí),AI蓬勃發(fā)展,有時(shí),AI是個(gè)泡沫。今天看,AI現(xiàn)有的技術(shù)和架構(gòu)將持續(xù)突破。明日嘆,AI發(fā)展模式不可持續(xù),需革命性新思路。此刻,AI或?qū)⒚驮夷愕娘埻?!他時(shí),AI也就給你講個(gè)故事解解悶兒的能耐!

斯坦福大學(xué)以人為本人工智能研究所(HAI)2025年4月初發(fā)布了《2025年AI指數(shù)報(bào)告》(The 2025 AI Index Report)。這份400多頁(yè)的報(bào)告主要通過(guò)數(shù)據(jù)圖表呈現(xiàn)事實(shí)、揭示趨勢(shì),涵蓋了研發(fā)、技術(shù)表現(xiàn)、負(fù)責(zé)任AI、經(jīng)濟(jì)影響、科學(xué)醫(yī)療、政策、教育以及社會(huì)輿論等主題?!禝EEE縱覽》雜志精選出了報(bào)告中最能反映AI領(lǐng)域現(xiàn)狀的12份關(guān)鍵圖表。

01

行業(yè)領(lǐng)頭羊

打開(kāi)網(wǎng)易新聞 查看精彩圖片

有許多標(biāo)準(zhǔn)可用于衡量各國(guó)在AI競(jìng)賽中所處的身位,包括期刊論文發(fā)表數(shù)量、論文引用量以及專(zhuān)利數(shù)量等,不過(guò)最直觀的指標(biāo)莫過(guò)于“關(guān)鍵模型產(chǎn)自何處”。

研究機(jī)構(gòu)Epoch AI建立的數(shù)據(jù)庫(kù)收錄了1950年至今所有具有影響力的重大AI模型——上圖所示的數(shù)據(jù)就來(lái)自該庫(kù)。

可以看到,在2024年,美國(guó)產(chǎn)出了40個(gè)關(guān)鍵模型,中國(guó)有15個(gè),歐洲有3個(gè)(全部來(lái)自法國(guó))。另有一幅圖表(本文未展示)則告訴我們,這些模型幾乎全部來(lái)自企業(yè)而非學(xué)術(shù)界或政府。至于2023年至2024年間,關(guān)鍵模型數(shù)量下降的情況,報(bào)告認(rèn)為其原因可能在于技術(shù)復(fù)雜度升高和訓(xùn)練成本持續(xù)上漲。

02

訓(xùn)練成本知多少

打開(kāi)網(wǎng)易新聞 查看精彩圖片

要說(shuō)訓(xùn)練成本,那是真貴!由于頭部的AI企業(yè)已不再披露訓(xùn)練相關(guān)信息,研究人員與Epoch AI合作,收集訓(xùn)練時(shí)長(zhǎng)、硬件類(lèi)型與數(shù)量等信息并據(jù)此估算。他們能估算出的最貴模型是由谷歌豪擲約1.92億美元打造的Gemini 1.0 Ultra。訓(xùn)練成本普漲的情況也呼應(yīng)了報(bào)告里的多項(xiàng)其他發(fā)現(xiàn),包括模型參數(shù)量、訓(xùn)練時(shí)長(zhǎng)以及數(shù)據(jù)規(guī)模仍持續(xù)擴(kuò)張的態(tài)勢(shì)。

異軍突起的中國(guó)新銳DeepSeek于今年初攪動(dòng)了行業(yè)風(fēng)云,不過(guò)新報(bào)告未將其收入上述圖表。

關(guān)于DeepSeek的訓(xùn)練成本,業(yè)界存在部分質(zhì)疑,但它的表現(xiàn)無(wú)疑是現(xiàn)象級(jí)的,AI指數(shù)指導(dǎo)委員會(huì)聯(lián)合主任尤蘭達(dá)·吉爾(Yolanda Gil)評(píng)價(jià)其“令人印象深刻”,此外也指出計(jì)算機(jī)發(fā)展史上不乏低效技術(shù)被優(yōu)雅方案取代的案例。

她說(shuō)道:“不止我一人認(rèn)為大語(yǔ)言模型終將出現(xiàn)更高效版本,但大家不清楚它將由誰(shuí)打造、如何打造?!?/p>

03

使用AI的成本卻在下降

打開(kāi)網(wǎng)易新聞 查看精彩圖片

雖然圍繞(大多數(shù))AI模型的訓(xùn)練成本不斷攀升,但AI指數(shù)報(bào)告也強(qiáng)調(diào)了一些積極趨勢(shì):硬件成本下降、硬件性能增強(qiáng)、能源效率提高。這意味著推理成本(即查詢(xún)已訓(xùn)練模型的花費(fèi))正急劇減少。上面這張采用對(duì)數(shù)刻度的圖表,展示了每美元AI性能的變化趨勢(shì)。報(bào)告指出,藍(lán)色線(xiàn)表明每百萬(wàn)token成本從20美元降至0.07美元;粉色線(xiàn)表明在不到一年內(nèi),成本從15美元降至0.12美元。

04

AI的巨量碳足跡

打開(kāi)網(wǎng)易新聞 查看精彩圖片

誠(chéng)然,能源效率提升是積極信號(hào),但我們也必須直面負(fù)面趨勢(shì):在能效改善的同時(shí),總體能耗仍呈現(xiàn)增長(zhǎng)。這意味著人工智能盛世的核心,即數(shù)據(jù)中心,正產(chǎn)生巨大碳足跡。AI指數(shù)報(bào)告根據(jù)訓(xùn)練硬件、云服務(wù)商以及地理位置等因素,對(duì)部分AI模型的碳排放進(jìn)行評(píng)估,結(jié)果發(fā)現(xiàn)前沿AI模型訓(xùn)練的碳排放量持續(xù)上升——除了DeepSeek。

上方圖表中最糟糕的案例是Meta Llama 3.1模型,其產(chǎn)生的二氧化碳排放量預(yù)計(jì)高達(dá)8930噸,相當(dāng)于496個(gè)美國(guó)人生活一年的總排放。如此驚人的環(huán)境影響,解釋了為何AI公司紛紛將核能視作可靠的零碳電力來(lái)源。

05

性能差距正在縮小

打開(kāi)網(wǎng)易新聞 查看精彩圖片

美國(guó)發(fā)布的重大AI模型數(shù)量方面仍可謂遙遙領(lǐng)先,但中國(guó)模型的質(zhì)量水準(zhǔn)提升之大令業(yè)界嘆服。上方圖表顯示,在聊天機(jī)器人基準(zhǔn)測(cè)試中,中美雙方的模型性能差距逐漸縮小。2024年1月,美國(guó)最佳模型的表現(xiàn)較中國(guó)頂尖模型領(lǐng)先9.26%;到2025年2月,這一差距已縮小至1.70%。在推理、數(shù)學(xué)和編程等其他基準(zhǔn)測(cè)試中,也可觀察到類(lèi)似趨勢(shì)。

06

人類(lèi)的終極測(cè)驗(yàn)

打開(kāi)網(wǎng)易新聞 查看精彩圖片

新報(bào)告還強(qiáng)調(diào)了一個(gè)無(wú)可爭(zhēng)議的事實(shí):許多用于評(píng)估人工智能系統(tǒng)能力的基準(zhǔn)測(cè)試已趨于“飽和”——AI系統(tǒng)得分過(guò)高,以致測(cè)試不再有意義。這種現(xiàn)象已出現(xiàn)于常識(shí)、圖像推理、數(shù)學(xué)、編程等多個(gè)領(lǐng)域。

吉爾表示,她驚訝地目睹一個(gè)又一個(gè)基準(zhǔn)測(cè)試相繼失效?!拔乙恢庇X(jué)得(性能)會(huì)遇到瓶頸,必須依靠新技術(shù)或顛覆性的架構(gòu)才能繼續(xù)突破,可現(xiàn)實(shí)并非如此?!?/p>

鑒于此,科學(xué)家正努力創(chuàng)制新的基準(zhǔn)測(cè)試,以期挑戰(zhàn)AI系統(tǒng)。其中有一套名為“人類(lèi)終極測(cè)驗(yàn)”(Humanity’s Last Exam)的大殺招,匯集了由來(lái)自全球五百所機(jī)構(gòu)的學(xué)科專(zhuān)家提供的極限難題,成功難倒了現(xiàn)階段最頂尖的AI系統(tǒng):目前表現(xiàn)最好的應(yīng)試者是OpenAI的推理模型o1,其正確率達(dá)8.8%。此記錄可保持多久?讓我們拭目以待。

07

數(shù)據(jù)峰值的降臨

打開(kāi)網(wǎng)易新聞 查看精彩圖片

當(dāng)下的生成式AI通過(guò)從互聯(lián)網(wǎng)抓取海量數(shù)據(jù)并以此進(jìn)行訓(xùn)練而獲得智能,這就催生了所謂“AI經(jīng)濟(jì)下,數(shù)據(jù)是石油”的說(shuō)法。隨著人工智能企業(yè)不斷突破模型訓(xùn)練的數(shù)據(jù)上限,人們開(kāi)始擔(dān)憂(yōu)“數(shù)據(jù)峰值”何日到來(lái)。一個(gè)現(xiàn)實(shí)問(wèn)題是:越來(lái)越多網(wǎng)站正限制爬蟲(chóng)抓取數(shù)據(jù)(或許出于對(duì)AI公司既利用網(wǎng)站數(shù)據(jù)牟利又摧毀其商業(yè)模式的擔(dān)憂(yōu)),這些限制都通過(guò)機(jī)器可讀的robots.txt文件聲明。

上方圖表顯示,頂級(jí)網(wǎng)站域名的數(shù)據(jù)已有48%被完全限制。不過(guò)吉爾指出,AI領(lǐng)域的新方法或可終結(jié)對(duì)龐大數(shù)據(jù)集的依賴(lài)。

“我預(yù)感,在某個(gè)時(shí)刻,數(shù)據(jù)量將不再那么關(guān)鍵?!?/p>

08

資本市場(chǎng)用腳投票

打開(kāi)網(wǎng)易新聞 查看精彩圖片

過(guò)去5年,來(lái)自企業(yè)界的資金洶涌入局AI。盡管2024年的全球總投資額不及2021年的狂熱高點(diǎn),但要注意,私人投資規(guī)??蓜?chuàng)下了歷史新高。在1500億美元的私人投資中(此處未顯示),約330億美元流向了生成式AI領(lǐng)域。

09

等待回報(bào)

打開(kāi)網(wǎng)易新聞 查看精彩圖片

企業(yè)豪擲千金,求的當(dāng)然是豐厚回報(bào)。眼下,我們興奮不已地談?wù)撊斯ぶ悄艿淖兏镏Γ瑫诚肭八匆?jiàn)的生產(chǎn)力飛躍,但客觀來(lái)說(shuō),企業(yè)尚未看到能帶來(lái)顯著成本節(jié)約或新增利潤(rùn)的實(shí)質(zhì)改變。上面這份源于麥肯錫調(diào)研的圖表顯示:在報(bào)告降本的企業(yè)中,多數(shù)都只省下不足10%的錢(qián);而在實(shí)現(xiàn)增收的企業(yè)中,大部分的增幅都低于5%。

雖然投資數(shù)據(jù)表明眾多企業(yè)押注人工智能,但現(xiàn)在談回報(bào)還為時(shí)尚早。

10

AI醫(yī)生即將上線(xiàn)?

打開(kāi)網(wǎng)易新聞 查看精彩圖片

在這波人工智能大熱潮中,科學(xué)和醫(yī)學(xué)領(lǐng)域涌現(xiàn)了令人驚喜的AI新氣象。AI指數(shù)報(bào)告列舉了多個(gè)新發(fā)布的基礎(chǔ)模型,它們將助力材料科學(xué)、天氣預(yù)報(bào)和量子計(jì)算等方面的研究。許多公司正嘗試將AI的預(yù)測(cè)與生成能力轉(zhuǎn)化為有利可圖的藥物發(fā)現(xiàn)。例如,OpenAI的o1推理模型最近在MedQA基準(zhǔn)測(cè)試(包含醫(yī)學(xué)委員會(huì)考試的題目)中展現(xiàn)了96%的準(zhǔn)確率。

但總體而言,上述領(lǐng)域遠(yuǎn)未將AI潛力轉(zhuǎn)化為現(xiàn)實(shí)影響,因?yàn)槿祟?lèi)似乎還沒(méi)完全搞懂怎么用AI技術(shù)。2024年一項(xiàng)研究顯示:醫(yī)生使用GPT-4輔助診斷后,并未因此提升診斷的準(zhǔn)確率或速度。另一方面,獨(dú)自做事的GPT-4反而強(qiáng)于獨(dú)自做事的醫(yī)生,也強(qiáng)于醫(yī)生+AI的組合。

11

關(guān)于AI政策

打開(kāi)網(wǎng)易新聞 查看精彩圖片

上方圖表告訴我們,美國(guó)國(guó)會(huì)關(guān)于AI的討論很多,實(shí)際行動(dòng)很少。AI指數(shù)報(bào)告指出,美國(guó)的相關(guān)行動(dòng)重心已轉(zhuǎn)向州一級(jí):2024年共有131項(xiàng)州級(jí)法案通過(guò)立法,其中有56項(xiàng)涉及深度偽造技術(shù),禁止其被用于在選舉或傳播非自愿親密影像。

歐盟通過(guò)的《人工智能法案》針對(duì)高風(fēng)險(xiǎn)AI系統(tǒng)給企業(yè)劃定了新的義務(wù)。而全球大趨勢(shì)是各國(guó)聯(lián)手協(xié)同,發(fā)表全面而不具約束力的聲明。那么有大量關(guān)于AI的內(nèi)容需要討論。

12

樂(lè)觀的人類(lèi)繼續(xù)前行

關(guān)于“AI何時(shí)取代你的工作”的公共討論早已甚囂塵上。但有趣的是,一項(xiàng)最新的全球AI態(tài)度調(diào)查顯示,多數(shù)人并沒(méi)感受到威脅。受訪(fǎng)者來(lái)自32個(gè)國(guó)家,其中60%的人認(rèn)為人工智能將改變自己的工作方式,但只有36%的人覺(jué)得自己會(huì)被取代。

吉爾說(shuō)道:“此結(jié)果令我非常意外。人們想著‘AI改變工作,而我仍創(chuàng)造價(jià)值’,這樣的心態(tài)令人鼓舞!”

那么,未來(lái)大家是否都能通過(guò)管理AI團(tuán)隊(duì)來(lái)創(chuàng)造價(jià)值呢?待時(shí)間給出答案……

文章資料來(lái)源:12 Graphs That Explain the State of AI in 2025。文章觀點(diǎn)不代表主辦機(jī)構(gòu)立場(chǎng)。

◆ ◆ ◆

編輯郵箱:sciencepie@126.com