国产黄片av免费_在线观看看片_www第一精品久久久_成人毛片18女人毛片免_日日摸夜夜操av_国产精品热久久久久夜色精品三区 _中文字幕日韩欧美精品在线_欧美高清另类hdvideosex

李飛飛實驗室2025 AI報告出爐：中美AI模型差距更小了

量子位

2025-04-08 15:45 ·北京 ·《量子位》官方網(wǎng)易號

中美AI模型差距正在縮小。

由李飛飛聯(lián)合領(lǐng)導(dǎo)，斯坦福大學(xué)以人為本人工智能研究所（HAI）最新發(fā)布了2025 AI Index，用整整456頁追蹤了2024年全球AI行業(yè)的發(fā)展趨勢，并得出了這樣的結(jié)論。

至今，HAI已發(fā)布了8份（含本次）AI年度報告，不過今年的這份卻尤為特殊。

這是我們迄今為止最全面的版本，人工智能對社會的影響從未如此明顯。

雖然報告信息量爆炸，但手快的網(wǎng)友已經(jīng)提前為大家劃了重點：

AI推理成本降低了280倍
開源模型正在迎頭趕上
AI基準(zhǔn)測試成績飆升

話不多說，下面我們詳細(xì)展開報告中提到的一些重要結(jié)論。

中美AI模型差距正在縮小

從官網(wǎng)消息來看，鑒于報告內(nèi)容較多，HAI直接為大家挑出了其中最重要的12個結(jié)論。

我們先來看與國內(nèi)最相關(guān)的部分。

中美AI模型差距正在縮小

首先就是AI模型方面，中國模型雖然數(shù)量不及美國，但質(zhì)量方面已迅速縮小差距。

報告顯示，2024年美國機(jī)構(gòu)一共開發(fā)了40個值得關(guān)注的AI模型，遠(yuǎn)高于中國開發(fā)的15個和歐洲的3個。

不過，中美模型之間的性能差異正在快速縮小。具體表現(xiàn)為，在MMLU和HumanEval等主要基準(zhǔn)測試上，二者的性能差異由2023年的兩位數(shù)縮小到2024年的接近相等。

同時，從中美模型過去一年在大模型競技場中的表現(xiàn)也能看出這一追趕趨勢：

當(dāng)然，這一性能差距正在縮小的趨勢也不局限于中美之間。

報告提到，排名第一和第十的模型之間的得分差距在一年內(nèi)從11.9%降至5.4%，排名前兩位的差距現(xiàn)在僅為 0.7%。

也就是說，頂尖模型之間的競爭越來越激烈。

順帶一提，國內(nèi)在發(fā)表AI論文和推出AI專利方面繼續(xù)保持領(lǐng)先地位。

中國是對AI最樂觀的國家

其次是在對AI的態(tài)度方面，中國始終是全球主要國家和地區(qū)中最樂觀的。

報告顯示，2024年中國有83%的人認(rèn)為AI產(chǎn)品和服務(wù)利大于弊，排在后面的是印度尼西亞（80%）和泰國（77%）。

相比之下，美國（39%）、加拿大（40%）等的樂觀情緒遠(yuǎn)低于國內(nèi)。

不過從整體趨勢來看，自2022年以來，幾個之前對AI持懷疑態(tài)度的國家樂觀情緒增長顯著，比如美國（+4%）、加拿大（+8%）、法國（+10%）等等。

除了以上兩點，還有一些AI整體趨勢變化也值得關(guān)注。

AI基準(zhǔn)測試成績飆升，表現(xiàn)逐漸接近人類

一個比較符合大家日常感受的結(jié)論是：AI模型在各大基準(zhǔn)測試上的得分越來越高了。

報告顯示，研究人員在2023年引入了一些如今大家已耳熟能詳?shù)幕鶞?zhǔn)——MMMU、GPQA和SWE-bench，以此測試更高級AI模型的能力極限。

然而僅僅一年之后，從測試得分來看，其性能呈現(xiàn)大幅提升趨勢，分別在MMMU、GPQA和SWE-bench上提高了18.8、48.9和67.3個百分點。

從整體趨勢來看，AI各大能力表現(xiàn)逐漸接近人類，甚至在某些場景下，智能體能在限時編程任務(wù)中超越人類。

推理成本下降了280倍，開源模型正在迎頭趕上

另一個符合大家印象的趨勢是：AI正變得更加高效、經(jīng)濟(jì)實惠和易于獲取。

過去兩年間，追求更具性價比的小模型逐漸成為一股潮流。

比如報告中提到的，在MMLU中得分超過60%的小模型：

數(shù)據(jù)顯示，由越來越強(qiáng)大的小模型驅(qū)動，對于性能達(dá)到GPT-3.5水平的系統(tǒng)的推理成本，在2022年11月到2024年10月間下降了280倍。

遺憾的是，復(fù)雜推理仍然面臨挑戰(zhàn)。

截至目前，AI模型在國際數(shù)學(xué)奧林匹克競賽問題等任務(wù)中表現(xiàn)出色，但仍無法很好應(yīng)對PlanBench等復(fù)雜推理基準(zhǔn)測試。

不過與此同時，開源模型也在縮小與閉源模型的差距。

報告中特意提到，在某些基準(zhǔn)測試中，它們一年內(nèi)的性能差異就從8%減少到僅1.7%。

另外在硬件層面，成本每年下降30%，而能效每年提高40%。

以上趨勢共同降低了人們獲取高級AI的門檻。

AI正在融入日常生活，企業(yè)投資增長強(qiáng)勁

正是由于AI獲取門檻降低，我們的日常生活也逐漸被AI改寫。

報告顯示，從醫(yī)療保健到交通運輸，AI正迅速從實驗室走向日常生活。

比如2023年，美國FDA批準(zhǔn)了223種AI醫(yī)療設(shè)備，而2015年僅為6種。

另外在自動駕駛方面，美國最大的運營商之一Waymo每周提供超過15萬次自動駕駛出行，而百度的經(jīng)濟(jì)型“蘿卜快跑” （Apollo Go）自動駕駛出租車車隊現(xiàn)在已在中國多個城市提供服務(wù)。

整體而言，AI的應(yīng)用落地正在加速。

2024年，有78%的組織報告自己正在使用AI，這比前一年增長了55%。

當(dāng)然，以上服務(wù)也離不開企業(yè)對AI的大力投資。

報告顯示，2024年美國對AI的投資為1091億美元，這幾乎是中國（93億美元）的12倍和英國（45億美元）的24倍。

其中生成式AI尤其強(qiáng)勁，吸引了全球私營投資339億美元，這一數(shù)字比2023年增長了18.7%。

BTW，除了上述主要結(jié)論，報告還提到了：

各國政府正在加強(qiáng)對AI的監(jiān)管和投資；
負(fù)責(zé)任的AI生態(tài)系統(tǒng)正在不斷發(fā)展，但不均衡；
目前有2/3的國家提供或計劃提供K-12計算機(jī)科學(xué)教育（數(shù)量是2019年的兩倍），其中非洲和拉丁美洲的進(jìn)步最大；
2024年近90%的知名AI模型來自工業(yè)界，高于前一年的60%。

感興趣可以進(jìn)一步查閱原報告。

報告下載地址：
https://hai-production.s3.amazonaws.com/files/hai_ai_index_report_2025.pdf

打開網(wǎng)易新聞體驗更佳

熱搜

熱門跟貼

打開APP發(fā)貼

旺苍县| 易门县| 将乐县| 海盐县| 大石桥市| 柘城县| 个旧市| 驻马店市| 新绛县| 正阳县| 浑源县| 娄底市| 会宁县| 南宫市| 桂东县| 宁明县| 开江县| 桐梓县| 渭南市| 蓬溪县| 浏阳市| 南昌县| 长丰县| 原阳县| 满洲里市| 东港市| 苍梧县| 深泽县| 湖南省| 乌鲁木齐县| 南丰县| 安塞县| 大城县| 苍溪县| 龙陵县| 中宁县| 凌海市| 盘锦市| 大同县| 房产| 荃湾区|