打開(kāi)網(wǎng)易新聞 查看精彩圖片

這些年來(lái),AI打游戲的出色表現(xiàn)已經(jīng)讓人見(jiàn)怪不怪了。

2018年《星際爭(zhēng)霸》舉辦了AI挑戰(zhàn)賽,參賽隊(duì)伍八仙過(guò)海、各顯神通;2019年,《王者榮耀》的絕悟在世界冠軍杯表演賽中打贏了五個(gè)現(xiàn)役職業(yè)選手;2022年,《暗區(qū)突圍》推出了號(hào)稱全球首個(gè)能用語(yǔ)音指揮的AI 隊(duì)友F.A.C.U.L.,直接拉滿了競(jìng)技類游戲的最高配置。

打開(kāi)網(wǎng)易新聞 查看精彩圖片
不搶資源、配合指揮,而且會(huì)講冷笑話,簡(jiǎn)直情緒價(jià)值拉滿
打開(kāi)網(wǎng)易新聞 查看精彩圖片
不搶資源、配合指揮,而且會(huì)講冷笑話,簡(jiǎn)直情緒價(jià)值拉滿

不過(guò),這些AI玩家都屬于“單游戲智能體”,專門針對(duì)單一游戲訓(xùn)練,且需要海量數(shù)據(jù)支持。

說(shuō)人話就是,這些AI必須提前學(xué)習(xí)識(shí)別場(chǎng)景中的建筑、物體、裝飾、可交互物件,對(duì)局中的微操和戰(zhàn)術(shù)配合,也只能靠人工標(biāo)記和強(qiáng)化訓(xùn)練,投入游戲中使用還會(huì)耗費(fèi)大量算力。

即便是谷歌2022年推出的多游戲智能體Transformer,能玩41款雅達(dá)利游戲,但也依賴于大量預(yù)先學(xué)習(xí)的數(shù)據(jù)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

說(shuō)白了,它們都必須模仿人類,需要靠“看攻略”來(lái)維持智商。

但最近,加州大學(xué)圣地亞哥分校的Hao AI實(shí)驗(yàn)室進(jìn)行了一項(xiàng)特別的AI推理能力測(cè)試,他們選取了四個(gè)不同的AI模型,在沒(méi)有任預(yù)先前訓(xùn)練的情況下,直接讓它們玩《逆轉(zhuǎn)裁判》——四位“參賽選手”分別是Gemini 2.5 Pro、Claude 3.7 Sonnet、Llama-4 Maverick以及OpenAI o1。

換句話說(shuō),整個(gè)過(guò)程需要AI自主理解游戲畫面、劇情與機(jī)制,并推動(dòng)游戲進(jìn)程——幾乎和第一次接觸這款游戲的新玩家沒(méi)什么區(qū)別。

而最終的結(jié)果也令人意外:Llama-4 Maverick在游戲一開(kāi)始就早早出局,Gemini 2.5 Pro和Claude 3.7 Sonnet進(jìn)入了第二章《逆轉(zhuǎn)姐妹》,而OpenAI o1則是一口氣打到了第二集結(jié)尾,雖然沒(méi)有完全通關(guān),但表現(xiàn)令人稱道。

四個(gè)模型同臺(tái)競(jìng)技最終成績(jī)
打開(kāi)網(wǎng)易新聞 查看精彩圖片
四個(gè)模型同臺(tái)競(jìng)技最終成績(jī)

為什么選擇《逆轉(zhuǎn)裁判》來(lái)考驗(yàn)AI?

根據(jù)Hao AI實(shí)驗(yàn)室的解釋,主要目的有三個(gè):一是為了考驗(yàn)AI的長(zhǎng)語(yǔ)境推理能力,《逆轉(zhuǎn)裁判》需要AI交叉引用先前的對(duì)話和證據(jù),發(fā)現(xiàn)其中的矛盾;二是考驗(yàn)視覺(jué)理解能力,觀察AI能否辨認(rèn)出、反駁虛假陳述的圖像;三是考驗(yàn)動(dòng)態(tài)決策能力,何時(shí)施壓、出示證據(jù)或隱瞞,AI需要在有限的試錯(cuò)次數(shù)內(nèi)做出正確的選擇。

而最終,AI也的確僅依靠自身的推理能力,就能夠表現(xiàn)出了接近人類的理解和處理問(wèn)題能力。

AI能理解證詞中的漏洞,自主決定打開(kāi)菜單、出示證物
打開(kāi)網(wǎng)易新聞 查看精彩圖片
AI能理解證詞中的漏洞,自主決定打開(kāi)菜單、出示證物

在打游戲這件事上,AI顯然變得越來(lái)越聰明了。

五個(gè)月前,在《精靈寶可夢(mèng) 紅/綠》的測(cè)試中,Claude 3.0 Sonnet還沒(méi)法走出真新鎮(zhèn),如今迭代過(guò)的Claude 3.7 Sonnet,已經(jīng)能在游戲中完成超過(guò)30000次互動(dòng),并自主擊敗三位道館館長(zhǎng)。可以想見(jiàn),OpenAI通關(guān)《逆轉(zhuǎn)裁判》大概也只是時(shí)間問(wèn)題。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

Claude 3.7 Sonnet玩《精靈寶可夢(mèng) 紅/綠》的數(shù)據(jù)

X軸為交互次數(shù),y軸為進(jìn)度成就,包括收集道具、抵達(dá)區(qū)域或擊敗BOSS

武能架槍丟手雷,文能拍桌喊異議,隨著AI特定游戲走向跨游戲泛用,或許在不久的未來(lái),我們真能擁有一個(gè)全能的AI隊(duì)友,既能在FPS里“指哪打哪”,又能一起在RPG里推理解謎,不拖后腿、不吵架、不掉線,最重要的是——永遠(yuǎn)不會(huì)放你鴿子。