
新智元報(bào)道
編輯:英智 犀牛
【新智元導(dǎo)讀】AI編程智能體的能力正在飛速增長(zhǎng),最新研究揭示了這一「新摩爾定律」,如果AI智能體的任務(wù)時(shí)長(zhǎng)繼續(xù)以每4個(gè)月翻倍的速度增長(zhǎng),到2027年它們可能完成長(zhǎng)達(dá)167小時(shí)的月級(jí)任務(wù)!
編程智能體能完成的任務(wù)量,正以爆炸式的速度增長(zhǎng)!
而且,這一趨勢(shì)還在加速。
2024到2025年,它們的任務(wù)處理能力每4個(gè)月翻一倍;而在2019到2025年,這個(gè)翻倍周期則是7個(gè)月。
22號(hào),AI研究網(wǎng)站AI Digest發(fā)表了上述觀點(diǎn),揭示了一個(gè)AI智能體的新摩爾定律。

博客地址:https://theaidigest.org/time-horizons
從圖表中可以清晰地看到這一趨勢(shì),任務(wù)時(shí)長(zhǎng)的增長(zhǎng)軌跡幾乎是一條陡峭的指數(shù)曲線。
2019年,GPT-2只能處理不到1秒的簡(jiǎn)單任務(wù);2022年ChatGPT發(fā)布時(shí),AI已經(jīng)可以完成30秒的編程任務(wù)。
現(xiàn)在,智能體可以自主完成人類需要一小時(shí)才能完成的編程任務(wù)。
頂尖的AI系統(tǒng)可以完成的任務(wù)長(zhǎng)度正在呈指數(shù)級(jí)增長(zhǎng)——每7個(gè)月翻一番。

這個(gè)趨勢(shì)是METR的研究人員發(fā)現(xiàn)的。
他們選取了2019到2025年間最強(qiáng)的AI模型,測(cè)試了它們?cè)诖蠹s200個(gè)任務(wù)上的表現(xiàn)。主要是編程任務(wù),也有一些邏輯推理任務(wù)。
然后,他們把AI的成功率和每個(gè)任務(wù)的長(zhǎng)度做了對(duì)比——任務(wù)長(zhǎng)度指的是專業(yè)人士完成這些任務(wù)需要的時(shí)間,從不到30秒到超過(guò)8小時(shí)不等。
測(cè)試過(guò)所有模型后,出現(xiàn)了兩個(gè)明顯的規(guī)律:
任務(wù)長(zhǎng)度和AI成功率高度相關(guān)(相關(guān)系數(shù)R2=0.83)。
AI成功率達(dá)到50%的任務(wù)長(zhǎng)度——即「時(shí)間跨度」——正在呈指數(shù)增長(zhǎng)。

接下來(lái)是什么?
這個(gè)指數(shù)增長(zhǎng)的趨勢(shì)看起來(lái)很穩(wěn)健,沒(méi)有停下來(lái)的意思。
如果按照這個(gè)趨勢(shì)推算下去,AI智能體將能夠完成:
2026年:2小時(shí)的任務(wù);
2027年:1個(gè)工作日(8小時(shí))的任務(wù);
2028年:1個(gè)工作周(40小時(shí))的任務(wù);
2029年:1個(gè)工作月(167小時(shí))的任務(wù)。

最近,這一趨勢(shì)還在加速。
2024-2025年間,時(shí)間跨度是每4個(gè)月任務(wù)長(zhǎng)度翻一番,而2019-2025年間則是每7個(gè)月翻一番。

如果按照2024-2025年加速的趨勢(shì)(每4個(gè)月翻倍)推算,AI智能體可能在2027年就能完成月級(jí)任務(wù)(167小時(shí))。
然而,僅觀察一年的數(shù)據(jù)給出預(yù)測(cè)可能會(huì)不太穩(wěn)定,實(shí)際的進(jìn)步速度也可能會(huì)放緩。

不過(guò),考慮到這個(gè)趨勢(shì)已經(jīng)開始加速,它很可能處于一個(gè)比指數(shù)增長(zhǎng)還要快的增長(zhǎng)軌道上。
這也很符合直覺(jué):隨著增長(zhǎng)軌道直線上升,1周和2周任務(wù)之間所需技能的差距,可能比1年和2年任務(wù)之間的差距更大。
此外,隨著AI能力的提升,它們?cè)陂_發(fā)更強(qiáng)大AI方面的作用會(huì)越來(lái)越大,可能導(dǎo)致超指數(shù)級(jí)增長(zhǎng)。
智能爆炸
AI智能體的能力提升會(huì)反過(guò)來(lái)加速更強(qiáng)大AI的研發(fā),形成飛輪效應(yīng):更強(qiáng)大的AI智能體能夠更快地開發(fā)出更先進(jìn)的AI系統(tǒng),從而進(jìn)一步提升能力。
這種正反饋循環(huán)可能導(dǎo)致超指數(shù)增長(zhǎng),甚至觸發(fā)「軟件智能爆炸」(software intelligence explosion),即AI能力在短時(shí)間內(nèi)急劇提升,遠(yuǎn)遠(yuǎn)超過(guò)人類的水平。
此外,算法進(jìn)步也在推動(dòng)這一趨勢(shì)。
METR的研究表明,近年來(lái)AI在算法效率上的提升,顯著降低了計(jì)算資源需求。
通過(guò)更高效的預(yù)訓(xùn)練和后訓(xùn)練方法,即使硬件資源不增加,AI智能體的能力也能快速提升。
AI智能體任務(wù)時(shí)長(zhǎng)的指數(shù)增長(zhǎng),可能成為人類歷史上最具變革性的趨勢(shì)之一。
它能在短時(shí)間內(nèi)完成復(fù)雜任務(wù),將徹底改變軟件開發(fā)、科學(xué)研究、醫(yī)療診斷等多個(gè)領(lǐng)域。
例如,一個(gè)能夠自主完成月級(jí)任務(wù)的AI智能體,可以完全自動(dòng)化軟件工程項(xiàng)目,甚至獨(dú)立進(jìn)行科學(xué)研究,從而大幅提高生產(chǎn)效率。
這一趨勢(shì)也帶來(lái)了潛在的社會(huì)挑戰(zhàn)。隨著AI智能體能力的快速提升,人類社會(huì)可能難以適應(yīng)這種變化。
許多傳統(tǒng)職業(yè)可能面臨自動(dòng)化,人類可能需要轉(zhuǎn)向更具創(chuàng)造性和策略性的角色。
參考資料:
https://theaidigest.org/time-horizons
https://x.com/AiDigest_/status/1914710297157493173
熱門跟貼