設(shè)置星標 關(guān)注,從此你的世界多點科學~

你如果關(guān)注AI領(lǐng)域的新聞,可能會在充滿矛盾的信息轟炸里深感困惑:有時,AI蓬勃發(fā)展,有時,AI是個泡沫。今天看,AI現(xiàn)有的技術(shù)和架構(gòu)將持續(xù)突破。明日嘆,AI發(fā)展模式不可持續(xù),需革命性新思路。此刻,AI或?qū)⒚驮夷愕娘埻?!他時,AI也就給你講個故事解解悶兒的能耐!
斯坦福大學以人為本人工智能研究所(HAI)2025年4月初發(fā)布了《2025年AI指數(shù)報告》(The 2025 AI Index Report)。這份400多頁的報告主要通過數(shù)據(jù)圖表呈現(xiàn)事實、揭示趨勢,涵蓋了研發(fā)、技術(shù)表現(xiàn)、負責任AI、經(jīng)濟影響、科學醫(yī)療、政策、教育以及社會輿論等主題?!禝EEE縱覽》雜志精選出了報告中最能反映AI領(lǐng)域現(xiàn)狀的12份關(guān)鍵圖表。
1
行業(yè)領(lǐng)頭羊

有許多標準可用于衡量各國在AI競賽中所處的身位,包括期刊論文發(fā)表數(shù)量、論文引用量以及專利數(shù)量等,不過最直觀的指標莫過于“關(guān)鍵模型產(chǎn)自何處”。
研究機構(gòu)Epoch AI建立的數(shù)據(jù)庫收錄了1950年至今所有具有影響力的重大AI模型——上圖所示的數(shù)據(jù)就來自該庫。
可以看到,在2024年,美國產(chǎn)出了40個關(guān)鍵模型,中國有15個,歐洲有3個 (全部來自法國) 。另有一幅圖表 (本文未展示) 則告訴我們,這些模型幾乎全部來自企業(yè)而非學術(shù)界或政府。至于2023年至2024年間,關(guān)鍵模型數(shù)量下降的情況,報告認為其原因可能在于技術(shù)復雜度升高和訓練成本持續(xù)上漲。
2
訓練成本知多少

要說訓練成本,那是真貴!由于頭部的AI企業(yè)已不再披露訓練相關(guān)信息,研究人員與Epoch AI合作,收集訓練時長、硬件類型與數(shù)量等信息并據(jù)此估算。他們能估算出的最貴模型是由谷歌豪擲約1.92億美元打造的Gemini 1.0 Ultra。訓練成本普漲的情況也呼應(yīng)了報告里的多項其他發(fā)現(xiàn),包括模型參數(shù)量、訓練時長以及數(shù)據(jù)規(guī)模仍持續(xù)擴張的態(tài)勢。
異軍突起的中國新銳DeepSeek于今年初攪動了行業(yè)風云,不過新報告未將其收入上述圖表。
關(guān)于DeepSeek的訓練成本,業(yè)界存在部分質(zhì)疑,但它的表現(xiàn)無疑是現(xiàn)象級的,AI指數(shù)指導委員會聯(lián)合主任尤蘭達·吉爾 (Yolanda Gil) 評價其“令人印象深刻”,此外也指出計算機發(fā)展史上不乏低效技術(shù)被優(yōu)雅方案取代的案例。
她說道:“不止我一人認為大語言模型終將出現(xiàn)更高效版本,但大家不清楚它將由誰打造、如何打造?!?/p>
3
使用AI的成本卻在下降

雖然圍繞 (大多數(shù)) AI模型的訓練成本不斷攀升,但AI指數(shù)報告也強調(diào)了一些積極趨勢:硬件成本下降、硬件性能增強、能源效率提高。這意味著推理成本 (即查詢已訓練模型的花費) 正急劇減少。上面這張采用對數(shù)刻度的圖表,展示了每美元AI性能的變化趨勢。報告指出,藍色線表明每百萬token成本從20美元降至0.07美元;粉色線表明在不到一年內(nèi),成本從15美元降至0.12美元。
4
AI的巨量碳足跡

誠然,能源效率提升是積極信號,但我們也必須直面負面趨勢:在能效改善的同時,總體能耗仍呈現(xiàn)增長。這意味著人工智能盛世的核心,即數(shù)據(jù)中心,正產(chǎn)生巨大碳足跡。AI指數(shù)報告根據(jù)訓練硬件、云服務(wù)商以及地理位置等因素,對部分AI模型的碳排放進行評估,結(jié)果發(fā)現(xiàn)前沿AI模型訓練的碳排放量持續(xù)上升——除了DeepSeek。
上方圖表中最糟糕的案例是Meta Llama 3.1模型,其產(chǎn)生的二氧化碳排放量預(yù)計高達8930噸,相當于496個美國人生活一年的總排放。如此驚人的環(huán)境影響,解釋了為何AI公司紛紛將核能視作可靠的零碳電力來源。
5
性能差距正在縮小

美國發(fā)布的重大AI模型數(shù)量方面仍可謂遙遙領(lǐng)先,但中國模型的質(zhì)量水準提升之大令業(yè)界嘆服。上方圖表顯示,在聊天機器人基準測試中,中美雙方的模型性能差距逐漸縮小。2024年1月,美國最佳模型的表現(xiàn)較中國頂尖模型領(lǐng)先9.26%;到2025年2月,這一差距已縮小至1.70%。在推理、數(shù)學和編程等其他基準測試中,也可觀察到類似趨勢。
6
人類的終極測驗

新報告還強調(diào)了一個無可爭議的事實:許多用于評估人工智能系統(tǒng)能力的基準測試已趨于“飽和”——AI系統(tǒng)得分過高,以致測試不再有意義。這種現(xiàn)象已出現(xiàn)于常識、圖像推理、數(shù)學、編程等多個領(lǐng)域。
吉爾表示,她驚訝地目睹一個又一個基準測試相繼失效。“我一直覺得 (性能) 會遇到瓶頸,必須依靠新技術(shù)或顛覆性的架構(gòu)才能繼續(xù)突破,可現(xiàn)實并非如此?!?/p>
鑒于此,科學家正努力創(chuàng)制新的基準測試,以期挑戰(zhàn)AI系統(tǒng)。其中有一套名為“人類終極測驗” (Humanity’s Last Exam) 的大殺招,匯集了由來自全球五百所機構(gòu)的學科專家提供的極限難題,成功難倒了現(xiàn)階段最頂尖的AI系統(tǒng):目前表現(xiàn)最好的應(yīng)試者是OpenAI的推理模型o1,其正確率達8.8%。此記錄可保持多久?讓我們拭目以待。
7
數(shù)據(jù)峰值的降臨

當下的生成式AI通過從互聯(lián)網(wǎng)抓取海量數(shù)據(jù)并以此進行訓練而獲得智能,這就催生了所謂“AI經(jīng)濟下,數(shù)據(jù)是石油”的說法。隨著人工智能企業(yè)不斷突破模型訓練的數(shù)據(jù)上限,人們開始擔憂“數(shù)據(jù)峰值”何日到來。一個現(xiàn)實問題是:越來越多網(wǎng)站正限制爬蟲抓取數(shù)據(jù) (或許出于對AI公司既利用網(wǎng)站數(shù)據(jù)牟利又摧毀其商業(yè)模式的擔憂) ,這些限制都通過機器可讀的robots.txt文件聲明。
上方圖表顯示,頂級網(wǎng)站域名的數(shù)據(jù)已有48%被完全限制。不過吉爾指出,AI領(lǐng)域的新方法或可終結(jié)對龐大數(shù)據(jù)集的依賴。
“我預(yù)感,在某個時刻,數(shù)據(jù)量將不再那么關(guān)鍵?!?/strong>
8
資本市場用腳投票

過去5年,來自企業(yè)界的資金洶涌入局AI。盡管2024年的全球總投資額不及2021年的狂熱高點,但要注意,私人投資規(guī)??蓜?chuàng)下了歷史新高。在1500億美元的私人投資中 (此處未顯示) ,約330億美元流向了生成式AI領(lǐng)域。
9
等待回報

企業(yè)豪擲千金,求的當然是豐厚回報。眼下,我們興奮不已地談?wù)撊斯ぶ悄艿淖兏镏?,暢想前所未見的生產(chǎn)力飛躍,但客觀來說,企業(yè)尚未看到能帶來顯著成本節(jié)約或新增利潤的實質(zhì)改變。上面這份源于麥肯錫調(diào)研的圖表顯示:在報告降本的企業(yè)中,多數(shù)都只省下不足10%的錢;而在實現(xiàn)增收的企業(yè)中,大部分的增幅都低于5%。
雖然投資數(shù)據(jù)表明眾多企業(yè)押注人工智能,但現(xiàn)在談回報還為時尚早。
10
AI醫(yī)生即將上線?

在這波人工智能大熱潮中,科學和醫(yī)學領(lǐng)域涌現(xiàn)了令人驚喜的AI新氣象。AI指數(shù)報告列舉了多個新發(fā)布的基礎(chǔ)模型,它們將助力材料科學、天氣預(yù)報和量子計算等方面的研究。許多公司正嘗試將AI的預(yù)測與生成能力轉(zhuǎn)化為有利可圖的藥物發(fā)現(xiàn)。例如,OpenAI的o1推理模型最近在MedQA基準測試 (包含醫(yī)學委員會考試的題目) 中展現(xiàn)了96%的準確率。
但總體而言,上述領(lǐng)域遠未將AI潛力轉(zhuǎn)化為現(xiàn)實影響,因為人類似乎還沒完全搞懂怎么用AI技術(shù)。2024年一項研究顯示:醫(yī)生使用GPT-4輔助診斷后,并未因此提升診斷的準確率或速度。另一方面,獨自做事的GPT-4反而強于獨自做事的醫(yī)生,也強于醫(yī)生+AI的組合。
11
關(guān)于AI政策

上方圖表告訴我們,美國國會關(guān)于AI的討論很多,實際行動很少。AI指數(shù)報告指出,美國的相關(guān)行動重心已轉(zhuǎn)向州一級:2024年共有131項州級法案通過立法,其中有56項涉及深度偽造技術(shù),禁止其被用于在選舉或傳播非自愿親密影像。
歐盟通過的《人工智能法案》針對高風險AI系統(tǒng)給企業(yè)劃定了新的義務(wù)。而全球大趨勢是各國聯(lián)手協(xié)同,發(fā)表全面而不具約束力的聲明。那么有大量關(guān)于AI的內(nèi)容需要討論。
12
樂觀的人類繼續(xù)前行
關(guān)于“AI何時取代你的工作”的公共討論早已甚囂塵上。但有趣的是,一項最新的全球AI態(tài)度調(diào)查顯示,多數(shù)人并沒感受到威脅。受訪者來自32個國家,其中60%的人認為人工智能將改變自己的工作方式,但只有36%的人覺得自己會被取代。
吉爾說道:“此結(jié)果令我非常意外。人們想著‘AI改變工作,而我仍創(chuàng)造價值’,這樣的心態(tài)令人鼓舞!”
那么,未來大家是否都能通過管理AI團隊來創(chuàng)造價值呢?待時間給出答案……
資料來源:
《世界科學》雜志版在售中 歡迎訂閱
月刊定價
15元/期
全年訂閱價
180元
點擊左側(cè)圖片或以下方訂閱方式選購
方式一:
掃描二維碼,“雜志鋪”訂閱有折扣~
方式二:
全國各地郵局訂閱 郵發(fā)代號:4-263
方式三:
機構(gòu)訂閱,請撥打
021-53300839;
021-53300838
熱門跟貼