国产黄片av免费_在线观看看片_www第一精品久久久_成人毛片18女人毛片免_日日摸夜夜操av_国产精品热久久久久夜色精品三区 _中文字幕日韩欧美精品在线_欧美高清另类hdvideosex

Gemini 2.5 Pro登頂三冠王！AI最強(qiáng)編程屠榜，全面碾壓Claude?3.7

新智元

2025-05-07 12:16 ·北京 ·《新智元》官方網(wǎng)易號

新智元報道

編輯：犀牛桃子

【新智元導(dǎo)讀】谷歌Gemini 2.5 Pro（I/O版）橫空出世，強(qiáng)勢登頂LMAreana，斬獲文本、視覺、編碼三連冠，甚至編程能力全面碾壓Claude 3.7，地表最強(qiáng)編碼模型誕生。

AI編程王座，一夜易主。

昨晚，谷歌放出全新升級的Gemini 2.5 Pro Preview（I/O版），一舉拿下三連冠，登頂LMeana。

它成為首個橫掃文本、視覺、WebDev Arena基準(zhǔn)的SOTA模型，編碼性能碾壓Claude 3.7 Sonnet。

不論是在代碼轉(zhuǎn)換、代碼編輯，甚至是開發(fā)復(fù)雜的智能體工作流中，Gemini 2.5 Pro都能得心應(yīng)手。

隨手畫個草圖，Gemini 2.5 Pro即可將其變成一個繪畫小程序。

只需一個提示，它就能將自然圖像，轉(zhuǎn)化為代碼來表示獨特的圖案。

一句話用你的狗做一個小游戲。

Hassabis自豪地表示，只是隨隨便便提升了147分ELO，沒什么大不了的。

谷歌首席科學(xué)家、Gemini的負(fù)責(zé)人Jeff Dean也連發(fā)數(shù)條推文來介紹更新后的Gemini 2.5 Pro，足見對其性能的信心。

左右滑動查看

開發(fā)者現(xiàn)在可以通過Google AI Studio和Vertex AI在Gemini API中開始使用更新后的Gemini 2.5 Pro進(jìn)行開發(fā)。新模型也已經(jīng)在Gemini App正式上線，支持Canvas等功能。

任何人都能通過單個提示來編寫代碼和構(gòu)建交互式Web應(yīng)用。

史上最強(qiáng)編程模型屠榜

Gemini 2.5 Pro Preview（I/O版）搶先體驗版，是對2.5 Pro的全新升級，特別在編程方面有了大幅提升，尤其擅長打造引人入勝的互動網(wǎng)頁應(yīng)用。

在視覺基準(zhǔn)測試中，Gemini 2.5 Pro Preview憑借巨大優(yōu)勢，領(lǐng)先GPT-4o、o3等模型。

在WebDev上，它成為首個超越Claude的編程模型，甚至連最新發(fā)布的GPT-4.1都不及Gemini 2.5 Pro。

從基準(zhǔn)測試上看，新版Gemini 2.5 Pro相較于原版得到了全方位的提升。

谷歌在官博上聲稱，本來計劃在谷歌I/O上發(fā)布這個更新，但看到大家對這款模型的熱情高漲，所以決定提前放出，讓所有人能盡早開發(fā)使用。

此次更新，除了以UI為中心的開發(fā)外，還擴(kuò)展到了代碼轉(zhuǎn)換、代碼編輯和開發(fā)復(fù)雜的AI智能體工作流。

在博客中，谷歌隨手放了個小實例：一句話將圖片上樹葉的行為用代碼表達(dá)出來。

更新后的Gemini 2.5 Pro在視頻理解方面也擁有頂尖的性能，在VideoMME基準(zhǔn)測試中的得分為84.8%，可以根據(jù)單條YouTube視頻生成一個交互式學(xué)習(xí)網(wǎng)站。

谷歌在博客中還同時給出了與更新前Gemini 2.5 Pro之間的對比視頻。

對于此次更新，AI編程工具Cursor CEO Michael Truell評價道：「我們對最新的Gemini 2.5 Pro感到非常興奮，它在原本就很強(qiáng)大的編碼能力上進(jìn)一步提升。我們在內(nèi)部觀察到，新模型在調(diào)用工具時的失敗率顯著降低，這一改進(jìn)相信會讓用戶覺得2.5 Pro在Cursor中的表現(xiàn)比以前更加出色?！?/p>

「氛圍編程」王者，全網(wǎng)玩瘋

Gemini 2.5 Pro Preview一經(jīng)發(fā)布，熱度直接爆表。開發(fā)者們借助其強(qiáng)大編碼能力，構(gòu)建出有趣的demo了。

谷歌大佬曬demo

谷歌研究員JB Alayrac表示，Gemini 2.5 Pro最新升級的代碼能力，簡直絕了。

更驚艷的是，將其編程實力和頂尖多模態(tài)視頻理解能力相結(jié)合，直接把YouTube視頻轉(zhuǎn)錄成p5.js動畫。

在谷歌DeepMind研究員Ali Eslami發(fā)布的另一個演示中，用Gemini 2.5 Pro「氛圍編程」芝加哥藝術(shù)學(xué)院收藏品的3D導(dǎo)覽。

Gemini 2.5 Pro登頂三冠王！AI最強(qiáng)編程屠榜，全面碾壓Claude?3.7

另一位研究員Fei Xia更是直呼，Gemini 2.5 Pro就是「氛圍編程」的勞「?！埂?/p>

根據(jù)植物高度與日照朝向、最佳種植間距、共生植物搭配，它可以輕松編寫出智能花園規(guī)劃器，自動生成最優(yōu)布局。

谷歌AI產(chǎn)品主管Dave Messer制作了一個游戲——聽音畫猜。

Gemini 2.5 Pro登頂三冠王！AI最強(qiáng)編程屠榜，全面碾壓Claude?3.7

Tim Bettridg用Canvas一次性開發(fā)了圖書推薦應(yīng)用，只需隨手拍一張書架照片。

Gemini 2.5 Pro登頂三冠王！AI最強(qiáng)編程屠榜，全面碾壓Claude?3.7

Patrick Loeber分享了，它還能制作一個界面更為復(fù)雜美觀的理財APP。

研究員Megan Ben Dor Ruthven用Gemini 2.5 Pro制作了游戲卡片化學(xué)元素周期互動表。

開發(fā)者Chetaslua讓Gemini 2.5 Pro制作了一個地球是如何形成的3D演示網(wǎng)站。

在測試過程中，o3無法編譯，Claude 3.7藍(lán)屏崩潰，只有Gemini 2.5 Pro才是當(dāng)之無愧的王者。

網(wǎng)友Arthur Lee只用調(diào)整一次，就生成了一個3D太陽系，非常漂亮，而且能夠隨意交互。

Gemini 2.5 Pro還可以進(jìn)行實時模擬。

下面演示中，它能夠動態(tài)模擬出實時光影變化、晝夜循環(huán)，以及生成角色、名字，進(jìn)行實時心率檢測等生理指標(biāo)。

Gemini 2.5 Pro登頂三冠王！AI最強(qiáng)編程屠榜，全面碾壓Claude?3.7

在Gemini Canvas中通過 Maps API創(chuàng)建一款探索世界的應(yīng)用。

Gemini 2.5 Pro登頂三冠王！AI最強(qiáng)編程屠榜，全面碾壓Claude?3.7

物理模擬測試中，Gemini 2.5 Pro模擬桶中來回晃動的水，一舉擊敗了Claude 3.7 Sonnet、o3。

一系列演示，切切實實展示了Gemini 2.5 Pro強(qiáng)大編程能力。

AI大佬Andrew Curran表示，「Gemini取代Gemini是一個信號，頭把交椅仍會易主，但巨龍已經(jīng)蘇醒」。

參考資料：

https://techcrunch.com/2025/05/06/google-debuts-an-updated-gemini-2-5-pro-ai-model-ahead-of-i-o/

https://x.com/OfficialLoganK/status/1919770687167684808

https://x.com/GeminiApp/status/1919770661439865029

https://blog.google/products/gemini/gemini-2-5-pro-updates/

打開網(wǎng)易新聞體驗更佳

熱搜

熱門跟貼

打開APP發(fā)貼

磐石市| 海淀区| 门源| 宝清县| 芮城县| 大理市| 郸城县| 吴堡县| 汤原县| 梓潼县| 宜兰县| 呼玛县| 海阳市| 利川市| 蕉岭县| 花垣县| 广水市| 通城县| 开封市| 三明市| 九江市| 吉安市| 井冈山市| 镇江市| 体育| 仲巴县| 肥东县| 日土县| 南丰县| 陕西省| 龙岩市| 雷波县| 海原县| 江山市| 天柱县| 阿坝| 鹤峰县| 察雅县| 锡林浩特市| 谷城县| 榆树市|