
新智元報道
編輯:犀牛 桃子
【新智元導(dǎo)讀】谷歌Gemini 2.5 Pro(I/O版)橫空出世,強(qiáng)勢登頂LMAreana,斬獲文本、視覺、編碼三連冠,甚至編程能力全面碾壓Claude 3.7,地表最強(qiáng)編碼模型誕生。
AI編程王座,一夜易主。
昨晚,谷歌放出全新升級的Gemini 2.5 Pro Preview(I/O版),一舉拿下三連冠,登頂LMeana。


它成為首個橫掃文本、視覺、WebDev Arena基準(zhǔn)的SOTA模型,編碼性能碾壓Claude 3.7 Sonnet。

不論是在代碼轉(zhuǎn)換、代碼編輯,甚至是開發(fā)復(fù)雜的智能體工作流中,Gemini 2.5 Pro都能得心應(yīng)手。
隨手畫個草圖,Gemini 2.5 Pro即可將其變成一個繪畫小程序。
只需一個提示,它就能將自然圖像,轉(zhuǎn)化為代碼來表示獨特的圖案。
一句話用你的狗做一個小游戲。
Hassabis自豪地表示,只是隨隨便便提升了147分ELO,沒什么大不了的。

谷歌首席科學(xué)家、Gemini的負(fù)責(zé)人Jeff Dean也連發(fā)數(shù)條推文來介紹更新后的Gemini 2.5 Pro,足見對其性能的信心。



左右滑動查看
開發(fā)者現(xiàn)在可以通過Google AI Studio和Vertex AI在Gemini API中開始使用更新后的Gemini 2.5 Pro進(jìn)行開發(fā)。新模型也已經(jīng)在Gemini App正式上線,支持Canvas等功能。
任何人都能通過單個提示來編寫代碼和構(gòu)建交互式Web應(yīng)用。
史上最強(qiáng)編程模型屠榜
Gemini 2.5 Pro Preview(I/O版)搶先體驗版,是對2.5 Pro的全新升級,特別在編程方面有了大幅提升,尤其擅長打造引人入勝的互動網(wǎng)頁應(yīng)用。
在視覺基準(zhǔn)測試中,Gemini 2.5 Pro Preview憑借巨大優(yōu)勢,領(lǐng)先GPT-4o、o3等模型。

在WebDev上,它成為首個超越Claude的編程模型,甚至連最新發(fā)布的GPT-4.1都不及Gemini 2.5 Pro。

從基準(zhǔn)測試上看,新版Gemini 2.5 Pro相較于原版得到了全方位的提升。

谷歌在官博上聲稱,本來計劃在谷歌I/O上發(fā)布這個更新,但看到大家對這款模型的熱情高漲,所以決定提前放出,讓所有人能盡早開發(fā)使用。
此次更新,除了以UI為中心的開發(fā)外,還擴(kuò)展到了代碼轉(zhuǎn)換、代碼編輯和開發(fā)復(fù)雜的AI智能體工作流。
在博客中,谷歌隨手放了個小實例:一句話將圖片上樹葉的行為用代碼表達(dá)出來。
更新后的Gemini 2.5 Pro在視頻理解方面也擁有頂尖的性能,在VideoMME基準(zhǔn)測試中的得分為84.8%,可以根據(jù)單條YouTube視頻生成一個交互式學(xué)習(xí)網(wǎng)站。
谷歌在博客中還同時給出了與更新前Gemini 2.5 Pro之間的對比視頻。
對于此次更新,AI編程工具Cursor CEO Michael Truell評價道:「我們對最新的Gemini 2.5 Pro感到非常興奮,它在原本就很強(qiáng)大的編碼能力上進(jìn)一步提升。我們在內(nèi)部觀察到,新模型在調(diào)用工具時的失敗率顯著降低,這一改進(jìn)相信會讓用戶覺得2.5 Pro在Cursor中的表現(xiàn)比以前更加出色?!?/p>
「氛圍編程」王者,全網(wǎng)玩瘋
Gemini 2.5 Pro Preview一經(jīng)發(fā)布,熱度直接爆表。開發(fā)者們借助其強(qiáng)大編碼能力,構(gòu)建出有趣的demo了。
谷歌大佬曬demo
谷歌研究員JB Alayrac表示,Gemini 2.5 Pro最新升級的代碼能力,簡直絕了。
更驚艷的是,將其編程實力和頂尖多模態(tài)視頻理解能力相結(jié)合,直接把YouTube視頻轉(zhuǎn)錄成p5.js動畫。

在谷歌DeepMind研究員Ali Eslami發(fā)布的另一個演示中,用Gemini 2.5 Pro「氛圍編程」芝加哥藝術(shù)學(xué)院收藏品的3D導(dǎo)覽。

另一位研究員Fei Xia更是直呼,Gemini 2.5 Pro就是「氛圍編程」的勞「?!埂?/p>
根據(jù)植物高度與日照朝向、最佳種植間距、共生植物搭配,它可以輕松編寫出智能花園規(guī)劃器,自動生成最優(yōu)布局。

谷歌AI產(chǎn)品主管Dave Messer制作了一個游戲——聽音畫猜。

Tim Bettridg用Canvas一次性開發(fā)了圖書推薦應(yīng)用,只需隨手拍一張書架照片。

Patrick Loeber分享了,它還能制作一個界面更為復(fù)雜美觀的理財APP。
研究員Megan Ben Dor Ruthven用Gemini 2.5 Pro制作了游戲卡片化學(xué)元素周期互動表。
開發(fā)者Chetaslua讓Gemini 2.5 Pro制作了一個地球是如何形成的3D演示網(wǎng)站。
在測試過程中,o3無法編譯,Claude 3.7藍(lán)屏崩潰,只有Gemini 2.5 Pro才是當(dāng)之無愧的王者。

網(wǎng)友Arthur Lee只用調(diào)整一次,就生成了一個3D太陽系,非常漂亮,而且能夠隨意交互。
Gemini 2.5 Pro還可以進(jìn)行實時模擬。
下面演示中,它能夠動態(tài)模擬出實時光影變化、晝夜循環(huán),以及生成角色、名字,進(jìn)行實時心率檢測等生理指標(biāo)。
在Gemini Canvas中通過 Maps API創(chuàng)建一款探索世界的應(yīng)用。
物理模擬測試中,Gemini 2.5 Pro模擬桶中來回晃動的水,一舉擊敗了Claude 3.7 Sonnet、o3。

一系列演示,切切實實展示了Gemini 2.5 Pro強(qiáng)大編程能力。
AI大佬Andrew Curran表示,「Gemini取代Gemini是一個信號,頭把交椅仍會易主,但巨龍已經(jīng)蘇醒」。

參考資料:
https://techcrunch.com/2025/05/06/google-debuts-an-updated-gemini-2-5-pro-ai-model-ahead-of-i-o/
https://x.com/OfficialLoganK/status/1919770687167684808
https://x.com/GeminiApp/status/1919770661439865029
https://blog.google/products/gemini/gemini-2-5-pro-updates/
熱門跟貼