IT之家 5 月 4 日消息,谷歌最先進(jìn)的人工智能模型取得了重大突破:成功通關(guān)了一款 29 年前的電子游戲。

谷歌首席執(zhí)行官桑達(dá)爾?皮查伊(Sundar Pichai)在 X 網(wǎng)站上興奮地宣布:“太精彩了!Gemini 2.5 Pro 剛剛完成了《寶可夢藍(lán)》!”
據(jù)IT之家了解,此次直播活動(dòng)名為“Gemini Plays Pokemon”,由一位名叫 Joel Z 的 30 歲軟件工程師發(fā)起,他并非谷歌員工。盡管如此,谷歌高管們對這一嘗試表示了支持。谷歌 AI Studio 的產(chǎn)品負(fù)責(zé)人洛根?基爾帕特里克(Logan Kilpatrick)上個(gè)月曾表示,Gemini 在完成《寶可夢》方面取得了顯著進(jìn)展,并且已經(jīng)獲得了第五個(gè)徽章(目前表現(xiàn)第二好的模型只獲得了三個(gè)徽章,不過使用的是不同的代理框架)。皮查伊還開玩笑說:“我們正在開發(fā) API,即人工寶可夢智能。”
為何選擇《寶可夢》?早在今年 2 月,Anthropic 公司就曾強(qiáng)調(diào)其 Claude AI 模型在《寶可夢紅》中的表現(xiàn),稱 Claude 的“深度思考和代理訓(xùn)練”使其在應(yīng)對“更出人意料”的任務(wù)時(shí)更具優(yōu)勢,例如玩經(jīng)典游戲。但 Claude 似乎尚未通關(guān)《寶可夢紅》,這是否意味著 Gemini 在游戲方面表現(xiàn)更勝一籌?Joel Z 在他的 Twitch 頁面上提醒觀眾:“請不要將此視為衡量大型語言模型(LLM)玩寶可夢能力的基準(zhǔn)。兩者之間無法進(jìn)行直接比較,因?yàn)?Gemini 和 Claude 使用不同的工具,并且接收到的信息也不同。”
此外,兩款 AI 模型都需要借助代理框架才能玩游戲。這些框架為模型提供帶有額外信息的游戲截圖,使模型能夠據(jù)此做出決策(可能涉及調(diào)用專業(yè)代理),并按下與 AI 指令相對應(yīng)的按鈕。
Joel Z 承認(rèn),在幫助 Gemini 完成游戲的過程中,他確實(shí)進(jìn)行了一些“開發(fā)干預(yù)”,但他強(qiáng)調(diào)這并非作弊。“我的干預(yù)是為了提升 Gemini 的整體決策和推理能力。我不會給出具體提示詞,也不會為特定挑戰(zhàn)(如月球山脈)提供攻略或直接指令。唯一接近這種情況的是,我告訴 Gemini 需要與火箭隊(duì)小兵對話兩次才能獲得升空鑰匙,這其實(shí)是一個(gè)在《寶可夢黃》中被修復(fù)的漏洞?!?/p>
他還表示:“Gemini Plays Pokémon 仍在積極開發(fā)中,其框架也在不斷演變?!?/p>
熱門跟貼