亚洲男人天堂av女优,女人被男人操在线观看,肉色欧美久久久蜜桃,加拿大永久居民福利,国产精品一区二区三区导航

設(shè)置星標關(guān)注，從此你的世界多點科學~

你如果關(guān)注AI領(lǐng)域的新聞，可能會在充滿矛盾的信息轟炸里深感困惑：有時，AI蓬勃發(fā)展，有時，AI是個泡沫。今天看，AI現(xiàn)有的技術(shù)和架構(gòu)將持續(xù)突破。明日嘆，AI發(fā)展模式不可持續(xù)，需革命性新思路。此刻，AI或?qū)⒚驮夷愕娘埻?！他時，AI也就給你講個故事解解悶兒的能耐！

斯坦福大學以人為本人工智能研究所(HAI)2025年4月初發(fā)布了《2025年AI指數(shù)報告》(The 2025 AI Index Report)。這份400多頁的報告主要通過數(shù)據(jù)圖表呈現(xiàn)事實、揭示趨勢，涵蓋了研發(fā)、技術(shù)表現(xiàn)、負責任AI、經(jīng)濟影響、科學醫(yī)療、政策、教育以及社會輿論等主題?！禝EEE縱覽》雜志精選出了報告中最能反映AI領(lǐng)域現(xiàn)狀的12份關(guān)鍵圖表。

行業(yè)領(lǐng)頭羊

有許多標準可用于衡量各國在AI競賽中所處的身位，包括期刊論文發(fā)表數(shù)量、論文引用量以及專利數(shù)量等，不過最直觀的指標莫過于“關(guān)鍵模型產(chǎn)自何處”。

研究機構(gòu)Epoch AI建立的數(shù)據(jù)庫收錄了1950年至今所有具有影響力的重大AI模型——上圖所示的數(shù)據(jù)就來自該庫。

可以看到，在2024年，美國產(chǎn)出了40個關(guān)鍵模型，中國有15個，歐洲有3個 (全部來自法國) 。另有一幅圖表 (本文未展示) 則告訴我們，這些模型幾乎全部來自企業(yè)而非學術(shù)界或政府。至于2023年至2024年間，關(guān)鍵模型數(shù)量下降的情況，報告認為其原因可能在于技術(shù)復雜度升高和訓練成本持續(xù)上漲。

訓練成本知多少

要說訓練成本，那是真貴！由于頭部的AI企業(yè)已不再披露訓練相關(guān)信息，研究人員與Epoch AI合作，收集訓練時長、硬件類型與數(shù)量等信息并據(jù)此估算。他們能估算出的最貴模型是由谷歌豪擲約1.92億美元打造的Gemini 1.0 Ultra。訓練成本普漲的情況也呼應(yīng)了報告里的多項其他發(fā)現(xiàn)，包括模型參數(shù)量、訓練時長以及數(shù)據(jù)規(guī)模仍持續(xù)擴張的態(tài)勢。

異軍突起的中國新銳DeepSeek于今年初攪動了行業(yè)風云，不過新報告未將其收入上述圖表。

關(guān)于DeepSeek的訓練成本，業(yè)界存在部分質(zhì)疑，但它的表現(xiàn)無疑是現(xiàn)象級的，AI指數(shù)指導委員會聯(lián)合主任尤蘭達·吉爾 (Yolanda Gil) 評價其“令人印象深刻”，此外也指出計算機發(fā)展史上不乏低效技術(shù)被優(yōu)雅方案取代的案例。

她說道：“不止我一人認為大語言模型終將出現(xiàn)更高效版本，但大家不清楚它將由誰打造、如何打造?！?/p>

使用AI的成本卻在下降

雖然圍繞 (大多數(shù)) AI模型的訓練成本不斷攀升，但AI指數(shù)報告也強調(diào)了一些積極趨勢：硬件成本下降、硬件性能增強、能源效率提高。這意味著推理成本 (即查詢已訓練模型的花費) 正急劇減少。上面這張采用對數(shù)刻度的圖表，展示了每美元AI性能的變化趨勢。報告指出，藍色線表明每百萬token成本從20美元降至0.07美元；粉色線表明在不到一年內(nèi)，成本從15美元降至0.12美元。

AI的巨量碳足跡

誠然，能源效率提升是積極信號，但我們也必須直面負面趨勢：在能效改善的同時，總體能耗仍呈現(xiàn)增長。這意味著人工智能盛世的核心，即數(shù)據(jù)中心，正產(chǎn)生巨大碳足跡。AI指數(shù)報告根據(jù)訓練硬件、云服務(wù)商以及地理位置等因素，對部分AI模型的碳排放進行評估，結(jié)果發(fā)現(xiàn)前沿AI模型訓練的碳排放量持續(xù)上升——除了DeepSeek。

上方圖表中最糟糕的案例是Meta Llama 3.1模型，其產(chǎn)生的二氧化碳排放量預(yù)計高達8930噸，相當于496個美國人生活一年的總排放。如此驚人的環(huán)境影響，解釋了為何AI公司紛紛將核能視作可靠的零碳電力來源。

性能差距正在縮小

美國發(fā)布的重大AI模型數(shù)量方面仍可謂遙遙領(lǐng)先，但中國模型的質(zhì)量水準提升之大令業(yè)界嘆服。上方圖表顯示，在聊天機器人基準測試中，中美雙方的模型性能差距逐漸縮小。2024年1月，美國最佳模型的表現(xiàn)較中國頂尖模型領(lǐng)先9.26%；到2025年2月，這一差距已縮小至1.70%。在推理、數(shù)學和編程等其他基準測試中，也可觀察到類似趨勢。

人類的終極測驗

新報告還強調(diào)了一個無可爭議的事實：許多用于評估人工智能系統(tǒng)能力的基準測試已趨于“飽和”——AI系統(tǒng)得分過高，以致測試不再有意義。這種現(xiàn)象已出現(xiàn)于常識、圖像推理、數(shù)學、編程等多個領(lǐng)域。

吉爾表示，她驚訝地目睹一個又一個基準測試相繼失效。“我一直覺得 (性能) 會遇到瓶頸，必須依靠新技術(shù)或顛覆性的架構(gòu)才能繼續(xù)突破，可現(xiàn)實并非如此?！?/p>

鑒于此，科學家正努力創(chuàng)制新的基準測試，以期挑戰(zhàn)AI系統(tǒng)。其中有一套名為“人類終極測驗” (Humanity’s Last Exam) 的大殺招，匯集了由來自全球五百所機構(gòu)的學科專家提供的極限難題，成功難倒了現(xiàn)階段最頂尖的AI系統(tǒng)：目前表現(xiàn)最好的應(yīng)試者是OpenAI的推理模型o1，其正確率達8.8%。此記錄可保持多久？讓我們拭目以待。

數(shù)據(jù)峰值的降臨

當下的生成式AI通過從互聯(lián)網(wǎng)抓取海量數(shù)據(jù)并以此進行訓練而獲得智能，這就催生了所謂“AI經(jīng)濟下，數(shù)據(jù)是石油”的說法。隨著人工智能企業(yè)不斷突破模型訓練的數(shù)據(jù)上限，人們開始擔憂“數(shù)據(jù)峰值”何日到來。一個現(xiàn)實問題是：越來越多網(wǎng)站正限制爬蟲抓取數(shù)據(jù) （或許出于對AI公司既利用網(wǎng)站數(shù)據(jù)牟利又摧毀其商業(yè)模式的擔憂），這些限制都通過機器可讀的robots.txt文件聲明。

上方圖表顯示，頂級網(wǎng)站域名的數(shù)據(jù)已有48%被完全限制。不過吉爾指出，AI領(lǐng)域的新方法或可終結(jié)對龐大數(shù)據(jù)集的依賴。

“我預(yù)感，在某個時刻，數(shù)據(jù)量將不再那么關(guān)鍵?！?/strong>

資本市場用腳投票

過去5年，來自企業(yè)界的資金洶涌入局AI。盡管2024年的全球總投資額不及2021年的狂熱高點，但要注意，私人投資規(guī)?？蓜?chuàng)下了歷史新高。在1500億美元的私人投資中（此處未顯示），約330億美元流向了生成式AI領(lǐng)域。

等待回報

企業(yè)豪擲千金，求的當然是豐厚回報。眼下，我們興奮不已地談?wù)撊斯ぶ悄艿淖兏镏?，暢想前所未見的生產(chǎn)力飛躍，但客觀來說，企業(yè)尚未看到能帶來顯著成本節(jié)約或新增利潤的實質(zhì)改變。上面這份源于麥肯錫調(diào)研的圖表顯示：在報告降本的企業(yè)中，多數(shù)都只省下不足10%的錢；而在實現(xiàn)增收的企業(yè)中，大部分的增幅都低于5%。

雖然投資數(shù)據(jù)表明眾多企業(yè)押注人工智能，但現(xiàn)在談回報還為時尚早。

AI醫(yī)生即將上線？

在這波人工智能大熱潮中，科學和醫(yī)學領(lǐng)域涌現(xiàn)了令人驚喜的AI新氣象。AI指數(shù)報告列舉了多個新發(fā)布的基礎(chǔ)模型，它們將助力材料科學、天氣預(yù)報和量子計算等方面的研究。許多公司正嘗試將AI的預(yù)測與生成能力轉(zhuǎn)化為有利可圖的藥物發(fā)現(xiàn)。例如，OpenAI的o1推理模型最近在MedQA基準測試 (包含醫(yī)學委員會考試的題目) 中展現(xiàn)了96%的準確率。

但總體而言，上述領(lǐng)域遠未將AI潛力轉(zhuǎn)化為現(xiàn)實影響，因為人類似乎還沒完全搞懂怎么用AI技術(shù)。2024年一項研究顯示：醫(yī)生使用GPT-4輔助診斷后，并未因此提升診斷的準確率或速度。另一方面，獨自做事的GPT-4反而強于獨自做事的醫(yī)生，也強于醫(yī)生+AI的組合。

關(guān)于AI政策