
本文來自微信公眾號:一澤Eze,作者:一澤Eze,原文標題:《Google 用文生圖 AI 開始真正重塑行業(yè)|9 個測試案例,帶你看懂 Gemini 能力邊界》,題圖來自:AI生成
Google 總算放出了他們?nèi)ツ瓿兄Z的“可連續(xù)對話改圖”的 Gemini 文生圖能力。

照例先給總體評價:
1. Gemini (或者說 Imagen3)是當下最值得全設(shè)計行業(yè),甚至全碳基社會使用的文生圖 AI;
2.它在自然語言的修改指令理解、材質(zhì)質(zhì)感復現(xiàn)、局部細節(jié)微調(diào)方面,達到了部分生產(chǎn)創(chuàng)作環(huán)節(jié)完全可用的水準(當然也有些 Case 還差點意思);
3.這幾乎可以算 AI 許愿機、超級嘴炮魔法了,甚至說句“快變天了”不為過。
本文將用 4 項能力測試,5 個應(yīng)用案例,帶你理解 Gemini 的能力邊界。
主要測試,挑戰(zhàn) AI 能力邊界
主測試 1:簡單形體的材質(zhì)變換、連續(xù)微調(diào)形態(tài)細節(jié),并大幅度改變視角
先用一些變態(tài)的 Case 開始,測試 Gemini 文生圖的能力邊界。
這是我測試的第一個 Case,因為一上來也不知道它到底邊界在哪,先從簡單的形體開始,讓它畫個正方體。

整個 Case 看下來非常連貫,指令理解到位,材質(zhì)變換沒問題,基礎(chǔ)形態(tài)從未變形,甚至還能大幅更改相機視角,添加模特也完全沒問題。
PS:我說這個“簡單” Case 已經(jīng)秒了其他的所有文生圖 AI,不過分吧。
主測試 2:手繪稿轉(zhuǎn)設(shè)計渲染圖,順便拍出產(chǎn)品宣傳圖
繼續(xù)測,在測試 1 的基礎(chǔ)上,我們上到設(shè)計生產(chǎn)級別,用一張手繪圖打底,讓 Gemini 完成全流程的產(chǎn)品造型概念設(shè)計推敲。
這個應(yīng)該是很多設(shè)計公司在乎的 Case:

這張圖已經(jīng)是最好的證明,感覺也不需要多說什么解讀的話語了。
雖然在實測中,在產(chǎn)品穿到人身上這不算穩(wěn)定,總會帶著一些人像與產(chǎn)品的變形。
就這手稿轉(zhuǎn) 3D 產(chǎn)品渲染圖,還能再微調(diào)局部設(shè)計的水平,已經(jīng)完全超出本科設(shè)計專業(yè)的畢業(yè)生水平(對,因為我自己就是工業(yè)設(shè)計畢業(yè)的)。
還能快速在概念設(shè)計階段,生成模特使用場景圖,進一步驗證設(shè)計方案的效果。
對了, 如果你還不服氣,我再補一句:每張圖的生成時間不超過 10s……這還不算“炸裂”,那還有什么算呢?
主測試 3:一次性生成多套不同風格的設(shè)計
我發(fā)誓,這是本文最后一個工業(yè)設(shè)計的 Case 了,后面還有游戲設(shè)計、自媒體應(yīng)用等更多元的 Case,一個比一個精彩。
我其實一貫 AI 評測挺克制的,但在測試 Gemini 文生圖的 4 小時內(nèi),基本每分鐘都在發(fā)出粗鄙的感慨……

這個 Case 就是進一步模擬工業(yè)設(shè)計的造型推敲環(huán)節(jié)。
原本我們會需要大量的時間在犀牛(一套工業(yè)設(shè)計建模軟件)中花數(shù)天時間建模,再花數(shù)天在 keyshot(一套工業(yè)設(shè)計渲染軟件)中調(diào)整材質(zhì)、打光出圖。
而且一旦建模完成后,想要再對模型進行造型調(diào)整,簡直是對設(shè)計師無盡的折磨。
現(xiàn)在,Gemini 在 20s 內(nèi)就給你一次性生成 12 張 ……
主測試 4:摳圖、換背景、打光影
搞定了產(chǎn)品設(shè)計,正常商業(yè)流程中,我們還要解決一下最終宣發(fā)的物料問題。
這時候離不開摳圖、換背景、打光影拍照的工作流程。
先摳個圖,無中生有地換背景:

沒問題,換的非常好。
再看看商業(yè)級別的背景合成與打光:

再引用一個 WaytoAGI 上看到的例子:

絕了,每次都只用一句嘴炮,就能在 10s 內(nèi)取得相當穩(wěn)定的預期結(jié)果。甚至復雜的形體打光,也能做的有模有樣。
OK,fine,測到這里,我只想說:
大碳奸恭迎硅基老爺重塑人類社會。
社區(qū)實例一覽
再看一些社區(qū)里大家在嘗試的應(yīng)用實例,也幫助我們獲得更多啟發(fā)。
更多應(yīng)用 1:游戲角色與道具設(shè)計
對游戲行業(yè)可能的影響與啟發(fā)之一:游戲內(nèi)容設(shè)計(來自群友@z.z.h)

更多應(yīng)用 2:家裝設(shè)計
來自群友@Zhenyuan_Branton,家裝設(shè)計也不含糊,你也可以直接把自己的手稿、房子照片拍給它,讓它自己添加家具,完成設(shè)計推演。

更多應(yīng)用 3:創(chuàng)作教育、自媒體內(nèi)容素材
如果 Gemini 這么強的能力,用在教育、自媒體內(nèi)容創(chuàng)作領(lǐng)域呢?

更多應(yīng)用 4:漫畫繪制與改色
來自推特@Linaqruf:

更多應(yīng)用 5:游戲復雜場景與動作變換預覽
來自推特@Cristian Pe?as:

如何使用?
1. 登錄 Google AI studio,鏈接:https://aistudio.google.com/prompts/new_chat
2.在 Model 中選擇PREVIEW - Gemini 2.0 Flash Experimental(new)

3.確認選擇“Images and text”

好,接下來也和我一起參與到恭迎硅基老爺重塑人類社會的行列吧~
Btw:我有個設(shè)計師朋友對此評價:
以前我可以假裝建模、摳圖磨洋工,現(xiàn)在老板只會跟我說趕緊 AI 生產(chǎn)改完發(fā)他了。
本文來自微信公眾號:一澤Eze,作者:一澤Eze
本內(nèi)容為作者獨立觀點,不代表虎嗅立場。未經(jīng)允許不得轉(zhuǎn)載,授權(quán)事宜請聯(lián)系 hezuo@huxiu.com
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4062550.html
熱門跟貼