人工智能(AI)的影響從未像現(xiàn)在這樣深入社會。斯坦福大學的人工智能研究機構(Stanford HAI)4月8日發(fā)布《2025年人工智能指數(shù)報告》認為,推理成本暴降280倍,小模型性能飆升,AI正變得更高效、更普惠。

報告還指出,中國高性能AI模型的數(shù)量和質量不斷提升,對美國的領先地位構成挑戰(zhàn),頂級模型之間的性能差距正在縮小。

美國此前在模型質量方面的領先優(yōu)勢已經(jīng)消失。中國是人工智能出版物和專利產(chǎn)出最多的國家,如今其開發(fā)的模型在性能上已經(jīng)與美國的競爭對手不相上下。

“2023年,在大規(guī)模多任務語言理解測試(MMLU)中,中國領先的模型落后于美國頂級模型近20個百分點。然而,到2024年底,美國的領先優(yōu)勢縮小到了0.3個百分點?!?/strong>

最新的斯坦福HAI博文中,濃縮了2025年AI指數(shù)報告的十二大亮點。

打開網(wǎng)易新聞 查看精彩圖片

1. AI性能突飛猛進:新基準下的爆發(fā)式增長

2023年,研究人員推出了新的基準測試,如MMMU、GPQA和SWE-bench,以測試先進AI系統(tǒng)的極限。

僅一年后,性能便急劇提升:在MMMU、GPQA和SWE-bench上的得分分別提高了18.8、48.9和67.3個百分點。除了基準測試之外,AI系統(tǒng)在生成高質量視頻方面也取得了重大進展,在某些情況下,語言模型代理甚至在編程任務中超越了人類,盡管時間預算有限。

打開網(wǎng)易新聞 查看精彩圖片

2. AI滲透日常生活:從實驗室走向現(xiàn)實

從醫(yī)療保健到交通運輸,AI正迅速從實驗室走向日常生活。

2023年,美國食品藥品監(jiān)督管理局(FDA)批準了223款AI醫(yī)療設備,而2015年僅有6款。

在道路上,自動駕駛汽車不再是實驗:Waymo每周提供超過15萬次自動駕駛服務,而百度的Apollo Go無人駕駛出租車隊現(xiàn)已服務于中國多個城市。

打開網(wǎng)易新聞 查看精彩圖片

3. 企業(yè)押注AI:投資與應用雙雙飆升

2024年,美國私營AI投資增長至1091億美元,是英國45億美元的24倍。

生成式AI表現(xiàn)尤為強勁,吸引了全球339億美元的私人投資,比2023年增長了18.7%。AI業(yè)務的使用也在加速:78%的組織報告稱在2024年使用了AI,高于前一年的55%。

越來越多的研究證實,AI提高了生產(chǎn)力,并且在大多數(shù)情況下,有助于縮小勞動力中的技能差距。

打開網(wǎng)易新聞 查看精彩圖片

4. 美國仍領跑AI模型:但中國正在縮小差距

2024年,總部位于美國的機構產(chǎn)生了40個值得關注的AI模型,大大超過了歐洲的3個。

雖然美國在數(shù)量上保持領先,但中國模型在質量上迅速縮小差距:在MMLU和HumanEval等主要基準測試上的性能差距從2023年的兩位數(shù)縮小到2024年的接近持平。

與此同時,中國在AI出版物和專利方面繼續(xù)保持領先地位。同時,模型開發(fā)日益全球化,來自中東、拉丁美洲和東南亞等地區(qū)的項目也值得關注。

打開網(wǎng)易新聞 查看精彩圖片

5.負責任AI生態(tài)發(fā)展不均

與AI相關的事件正在急劇上升,但在主要的工業(yè)模型開發(fā)商中,標準化的RAI評估仍然很少見。

然而,如HELM Safety、AIR-Bench和FACTS等新基準測試為評估事實性和安全性提供了有希望的工具。在公司中,承認RAI風險與采取有意義的行動之間仍然存在差距。

相比之下,各國政府正表現(xiàn)出越來越大的緊迫性:2024年,全球在AI治理方面的合作加劇,包括OECD、歐盟、聯(lián)合國和非洲聯(lián)盟在內(nèi)的組織發(fā)布了側重于透明度、可信度和其他核心負責任AI原則的框架。

打開網(wǎng)易新聞 查看精彩圖片

6. 全球AI樂觀情緒上升:地區(qū)差異依然顯著

在諸如中國(83%)、印度尼西亞(80%)和泰國(77%)等國家,大多數(shù)人認為AI產(chǎn)品和服務的益處大于危害。相比之下,在諸如加拿大(40%)、美國(39%)和荷蘭(36%)等地方,樂觀情緒仍然較低。

盡管如此,情緒正在發(fā)生變化:自2022年以來,在幾個此前持懷疑態(tài)度的國家,樂觀情緒顯著增長,包括德國(+10%)、法國(+10%)、加拿大(+8%)、英國(+8%)和美國(+4%)。

打開網(wǎng)易新聞 查看精彩圖片

7. AI變得更高效、更經(jīng)濟、更易于獲取

在越來越強大的小型模型的推動下,執(zhí)行GPT-3.5水平任務的系統(tǒng)推理成本在2022年11月至2024年10月期間下降了280多倍。

在硬件層面,成本每年下降30%,而能源效率每年提高40%。開源模型也在縮小與閉源模型的差距,在某些基準測試中,性能差距從8%縮小到1.7%。這些趨勢正在迅速降低先進AI的門檻。

打開網(wǎng)易新聞 查看精彩圖片

8. 政府加大對AI的投入:監(jiān)管與投資并重

2024年,美國聯(lián)邦機構引入了59項與AI相關的法規(guī),是2023年的兩倍多,并且由兩倍多的機構發(fā)布。自2023年以來,全球75個國家提及AI的立法增加了21.3%,自2016年以來增長了九倍。

除了日益增長的關注之外,各國政府正在大規(guī)模投資:加拿大承諾投資24億美元,法國承諾投資1090億歐元,印度承諾投資12.5億美元,沙特阿拉伯的“超越”項目代表著一項1000億美元的計劃。

打開網(wǎng)易新聞 查看精彩圖片

9. AI與計算機科學教育擴張:機會與挑戰(zhàn)并存

目前,三分之二的國家提供或計劃提供K-12計算機科學教育,是2019年的兩倍,其中非洲和拉丁美洲取得了最大的進展。

在美國,擁有計算機科學學士學位的畢業(yè)生人數(shù)在過去10年中增加了22%。然而,由于電力等基本基礎設施的差距,許多非洲國家仍然難以獲得教育。在美國,81%的K-12計算機科學教師認為AI應該成為基礎計算機科學教育的一部分,但只有不到一半的人認為自己有能力教授它。

打開網(wǎng)易新聞 查看精彩圖片

10. 行業(yè)在AI領域加速發(fā)展:前沿競爭日益激烈

2024年,近90%的著名AI模型來自行業(yè),高于2023年的60%,而學術界仍然是高度引用的研究的主要來源。模型規(guī)模持續(xù)快速增長,訓練計算量每五個月翻一番,數(shù)據(jù)集每八個月翻一番,功耗每年增加。

然而,性能差距正在縮小:排名第一和第十的模型之間的分數(shù)差距在一年內(nèi)從11.9%下降到5.4%,并且前兩名之間的差距僅為0.7%。前沿領域競爭日益激烈,也變得擁擠。

打開網(wǎng)易新聞 查看精彩圖片

11. AI在科學領域的影響力獲得認可:榮獲頂級榮譽

AI日益增長的重要性反映在主要的科學獎項中:兩個諾貝爾獎表彰了導致深度學習(物理學)和其在蛋白質折疊(化學)中的應用的工作,而圖靈獎則表彰了對強化學習的開創(chuàng)性貢獻。

打開網(wǎng)易新聞 查看精彩圖片

12. 復雜推理仍然是一個挑戰(zhàn):局限性依舊存在

AI模型擅長解決國際數(shù)學奧林匹克問題等任務,但在PlanBench等復雜推理基準測試中仍然面臨挑戰(zhàn)。它們經(jīng)常無法可靠地解決邏輯任務,即使存在可證明正確的解決方案,這限制了它們在高風險環(huán)境中的有效性,在這種環(huán)境中,精確性至關重要。

打開網(wǎng)易新聞 查看精彩圖片