谷歌Gemini原生圖像生成功能又雙叒升級(jí)了!
與之前的實(shí)驗(yàn)版本相比(Gemini 2.0 Flash Experimental),這一次主打圖像質(zhì)量更好、文本渲染更準(zhǔn)確,生成速度更快。
只需一句話,就能將兩張圖片中的元素絲滑融合在一起。

還能實(shí)時(shí)編輯圖像,比如剛說(shuō)完給圖中人物加上眼鏡,圖片立馬就生成好了。
p.s. 這個(gè)需要在Google AI Studio的Starter Apps板塊體驗(yàn)
也可以指定僅修改圖中某一部分,新圖的其他部分能同時(shí)和原來(lái)保持一致。

更有意思的是,搭配Gemini 2.0 Flash食用,還能讓模型自己構(gòu)思自己生圖。

現(xiàn)在,這些功能都可以在Google AI Studio免費(fèi)試玩,模型請(qǐng)認(rèn)準(zhǔn)“
gemini-2.0-flash-preview-image-generation”。

開發(fā)者可以通過(guò)Google AI Studio和Vertex AI中的Gemini API集成,每張圖片的價(jià)格為0.039美元(約合人民幣0.28元)。
實(shí)際上,本次升級(jí)距離谷歌首次推出Gemini原生圖像生成功能,僅過(guò)去一個(gè)多月時(shí)間。
網(wǎng)友們的感受也都體現(xiàn)在了下面這張梗圖中:
- 谷歌最近真是火力全開??!

實(shí)測(cè)最新升級(jí)
據(jù)谷歌AI Studio開發(fā)者平臺(tái)產(chǎn)品負(fù)責(zé)人透露, 本次升級(jí)主要體現(xiàn)在以下幾個(gè)方面:
- 更好的視覺質(zhì)量
- 更準(zhǔn)確的文本渲染
- 顯著降低濾波器阻塞率(延遲和卡頓更低)
- 更高的速率限制(更快生成圖像或能同時(shí)處理更多圖像)

那么其實(shí)際表現(xiàn)究竟如何呢?我們也第一時(shí)間進(jìn)行了實(shí)測(cè)。
首先,在谷歌提供的demo中,我們看到了它能很好地將完全不同的元素自然融合在一起。

于是我們也提供了下面兩張?jiān)瓐D,要求它幫忙生成量子位周邊。

實(shí)測(cè)用時(shí)5.4s,幾乎一瞬間就生成了我們想要的圖片。
盡管logo的顏色還有細(xì)微偏差,但整體構(gòu)圖已經(jīng)很成熟了,處理?yè)笀D以及融合都比較干凈。

而且上面這個(gè)例子還順道考查了其文字渲染能力,除了中文,我們?cè)賴L試一下其他文字。

最常見的英文渲染正確,并且還自帶藝術(shù)字設(shè)計(jì)。

繼續(xù)換成希臘文(中譯為“我愛你”)也有同款優(yōu)秀表現(xiàn),仔細(xì)對(duì)比未發(fā)現(xiàn)渲染錯(cuò)誤。

OK,短暫告別這一趴,接下來(lái)我們測(cè)試其換圖or擴(kuò)圖能力。

開啟“找茬”模式后,我們不得不承認(rèn)它確實(shí)只更換了吊床顏色,其他素材均和原圖一致。
同時(shí)可以看到,在秒速生圖過(guò)程中,它還會(huì)在接收用戶指令后給出自己的理解。

此外,如果只給人物上半身,要求它生成完整人物形象呢?

第一次擴(kuò)圖,它只前進(jìn)了一小步,完成了更多的人物上半身復(fù)原工作。
新生成的部分看起來(lái)也非常合理,從一根藍(lán)色肩帶擴(kuò)展到了背帶褲穿搭。

不過(guò)這不是我們一開始想要的“全身肖像”,所以繼續(xù)……
最終結(jié)果如下,人物的比例和姿態(tài)都很完美,生成效果著實(shí)驚艷。

最后我們也體驗(yàn)了一波實(shí)時(shí)繪圖功能,結(jié)論是其原生圖像生成的速度確實(shí)快。
我們先隨意畫了一個(gè)太陽(yáng)的草圖,要求它為太陽(yáng)加上笑臉,結(jié)果立馬就搞定了。
而且還支持上色,效果也非常不錯(cuò)。
小結(jié)一下,從我們的實(shí)測(cè)來(lái)看,升級(jí)后的Gemini原生圖像生成功能確實(shí)表現(xiàn)驚艷,尤其在遵循用戶指令、文本渲染等方面。
當(dāng)然,除了我們的測(cè)試,更多網(wǎng)友也第一時(shí)間分享了各自的玩法。
比較經(jīng)典的就是用來(lái)搞裝修設(shè)計(jì),可以一鍵測(cè)試自己想要的裝修風(fēng)格。

不過(guò)也有淺淺翻車的,用它來(lái)擴(kuò)圖時(shí)最后生成的人物比例有點(diǎn)子怪異。

與此同時(shí),也有人將它和近期非?;鸨腉PT-4o生圖進(jìn)行了對(duì)比,初步結(jié)論是整體仍不如GPT-4o(doge)。

One More Thing
值得一提的是,谷歌最新生圖功能還能搭配Gemini 2.5 Pro(近期以強(qiáng)悍的代碼能力而出圈)食用。

只需在提示欄中選擇 “Canvas”,上傳一張圖片后輸入下列提示詞:
- Transform this image into a code-based representation of its natural behavior.(將此圖像轉(zhuǎn)換為基于代碼的自然行為表示)
最終就能得到一段視頻演示。
除了預(yù)覽效果,還能一鍵切換查看代碼。

最后,也歡迎大家進(jìn)行更多測(cè)試,順便評(píng)論區(qū)帶圖分享一波~
在線體驗(yàn):
https://aistudio.google.com/
熱門跟貼