
新智元報(bào)道
編輯:犀牛 桃子
【新智元導(dǎo)讀】谷歌Gemini 2.5 Pro(I/O版)橫空出世,強(qiáng)勢(shì)登頂LMAreana,斬獲文本、視覺(jué)、編碼三連冠,甚至編程能力全面碾壓Claude 3.7,地表最強(qiáng)編碼模型誕生。
AI編程王座,一夜易主。
昨晚,谷歌放出全新升級(jí)的Gemini 2.5 Pro Preview(I/O版),一舉拿下三連冠,登頂LMeana。


它成為首個(gè)橫掃文本、視覺(jué)、WebDev Arena基準(zhǔn)的SOTA模型,編碼性能碾壓Claude 3.7 Sonnet。

不論是在代碼轉(zhuǎn)換、代碼編輯,甚至是開(kāi)發(fā)復(fù)雜的智能體工作流中,Gemini 2.5 Pro都能得心應(yīng)手。
隨手畫(huà)個(gè)草圖,Gemini 2.5 Pro即可將其變成一個(gè)繪畫(huà)小程序。
只需一個(gè)提示,它就能將自然圖像,轉(zhuǎn)化為代碼來(lái)表示獨(dú)特的圖案。
一句話用你的狗做一個(gè)小游戲。
Hassabis自豪地表示,只是隨隨便便提升了147分ELO,沒(méi)什么大不了的。

谷歌首席科學(xué)家、Gemini的負(fù)責(zé)人Jeff Dean也連發(fā)數(shù)條推文來(lái)介紹更新后的Gemini 2.5 Pro,足見(jiàn)對(duì)其性能的信心。



左右滑動(dòng)查看
開(kāi)發(fā)者現(xiàn)在可以通過(guò)Google AI Studio和Vertex AI在Gemini API中開(kāi)始使用更新后的Gemini 2.5 Pro進(jìn)行開(kāi)發(fā)。新模型也已經(jīng)在Gemini App正式上線,支持Canvas等功能。
任何人都能通過(guò)單個(gè)提示來(lái)編寫(xiě)代碼和構(gòu)建交互式Web應(yīng)用。
史上最強(qiáng)編程模型屠榜
Gemini 2.5 Pro Preview(I/O版)搶先體驗(yàn)版,是對(duì)2.5 Pro的全新升級(jí),特別在編程方面有了大幅提升,尤其擅長(zhǎng)打造引人入勝的互動(dòng)網(wǎng)頁(yè)應(yīng)用。
在視覺(jué)基準(zhǔn)測(cè)試中,Gemini 2.5 Pro Preview憑借巨大優(yōu)勢(shì),領(lǐng)先GPT-4o、o3等模型。

在WebDev上,它成為首個(gè)超越Claude的編程模型,甚至連最新發(fā)布的GPT-4.1都不及Gemini 2.5 Pro。

從基準(zhǔn)測(cè)試上看,新版Gemini 2.5 Pro相較于原版得到了全方位的提升。

谷歌在官博上聲稱,本來(lái)計(jì)劃在谷歌I/O上發(fā)布這個(gè)更新,但看到大家對(duì)這款模型的熱情高漲,所以決定提前放出,讓所有人能盡早開(kāi)發(fā)使用。
此次更新,除了以UI為中心的開(kāi)發(fā)外,還擴(kuò)展到了代碼轉(zhuǎn)換、代碼編輯和開(kāi)發(fā)復(fù)雜的AI智能體工作流。
在博客中,谷歌隨手放了個(gè)小實(shí)例:一句話將圖片上樹(shù)葉的行為用代碼表達(dá)出來(lái)。
更新后的Gemini 2.5 Pro在視頻理解方面也擁有頂尖的性能,在VideoMME基準(zhǔn)測(cè)試中的得分為84.8%,可以根據(jù)單條YouTube視頻生成一個(gè)交互式學(xué)習(xí)網(wǎng)站。
谷歌在博客中還同時(shí)給出了與更新前Gemini 2.5 Pro之間的對(duì)比視頻。
對(duì)于此次更新,AI編程工具Cursor CEO Michael Truell評(píng)價(jià)道:「我們對(duì)最新的Gemini 2.5 Pro感到非常興奮,它在原本就很強(qiáng)大的編碼能力上進(jìn)一步提升。我們?cè)趦?nèi)部觀察到,新模型在調(diào)用工具時(shí)的失敗率顯著降低,這一改進(jìn)相信會(huì)讓用戶覺(jué)得2.5 Pro在Cursor中的表現(xiàn)比以前更加出色?!?/p>
「氛圍編程」王者,全網(wǎng)玩瘋
Gemini 2.5 Pro Preview一經(jīng)發(fā)布,熱度直接爆表。開(kāi)發(fā)者們借助其強(qiáng)大編碼能力,構(gòu)建出有趣的demo了。
谷歌大佬曬demo
谷歌研究員JB Alayrac表示,Gemini 2.5 Pro最新升級(jí)的代碼能力,簡(jiǎn)直絕了。
更驚艷的是,將其編程實(shí)力和頂尖多模態(tài)視頻理解能力相結(jié)合,直接把YouTube視頻轉(zhuǎn)錄成p5.js動(dòng)畫(huà)。

在谷歌DeepMind研究員Ali Eslami發(fā)布的另一個(gè)演示中,用Gemini 2.5 Pro「氛圍編程」芝加哥藝術(shù)學(xué)院收藏品的3D導(dǎo)覽。

另一位研究員Fei Xia更是直呼,Gemini 2.5 Pro就是「氛圍編程」的勞「模」。
根據(jù)植物高度與日照朝向、最佳種植間距、共生植物搭配,它可以輕松編寫(xiě)出智能花園規(guī)劃器,自動(dòng)生成最優(yōu)布局。

谷歌AI產(chǎn)品主管Dave Messer制作了一個(gè)游戲——聽(tīng)音畫(huà)猜。

Tim Bettridg用Canvas一次性開(kāi)發(fā)了圖書(shū)推薦應(yīng)用,只需隨手拍一張書(shū)架照片。

Patrick Loeber分享了,它還能制作一個(gè)界面更為復(fù)雜美觀的理財(cái)APP。
研究員Megan Ben Dor Ruthven用Gemini 2.5 Pro制作了游戲卡片化學(xué)元素周期互動(dòng)表。
開(kāi)發(fā)者Chetaslua讓Gemini 2.5 Pro制作了一個(gè)地球是如何形成的3D演示網(wǎng)站。
在測(cè)試過(guò)程中,o3無(wú)法編譯,Claude 3.7藍(lán)屏崩潰,只有Gemini 2.5 Pro才是當(dāng)之無(wú)愧的王者。

網(wǎng)友Arthur Lee只用調(diào)整一次,就生成了一個(gè)3D太陽(yáng)系,非常漂亮,而且能夠隨意交互。
Gemini 2.5 Pro還可以進(jìn)行實(shí)時(shí)模擬。
下面演示中,它能夠動(dòng)態(tài)模擬出實(shí)時(shí)光影變化、晝夜循環(huán),以及生成角色、名字,進(jìn)行實(shí)時(shí)心率檢測(cè)等生理指標(biāo)。
在Gemini Canvas中通過(guò) Maps API創(chuàng)建一款探索世界的應(yīng)用。
物理模擬測(cè)試中,Gemini 2.5 Pro模擬桶中來(lái)回晃動(dòng)的水,一舉擊敗了Claude 3.7 Sonnet、o3。

一系列演示,切切實(shí)實(shí)展示了Gemini 2.5 Pro強(qiáng)大編程能力。
AI大佬Andrew Curran表示,「Gemini取代Gemini是一個(gè)信號(hào),頭把交椅仍會(huì)易主,但巨龍已經(jīng)蘇醒」。

參考資料:
https://techcrunch.com/2025/05/06/google-debuts-an-updated-gemini-2-5-pro-ai-model-ahead-of-i-o/
https://x.com/OfficialLoganK/status/1919770687167684808
https://x.com/GeminiApp/status/1919770661439865029
https://blog.google/products/gemini/gemini-2-5-pro-updates/
熱門跟貼