GPT4o的多模態(tài)生圖前天上線(xiàn)之后。

經(jīng)過(guò)兩天的發(fā)酵,含金量還在不斷提升。

在我的群里,已經(jīng)能看到越來(lái)越多的,進(jìn)入到實(shí)際生產(chǎn)環(huán)節(jié)的例子。

比如@銀海的直接做商品圖的翻譯和合成,這是原來(lái)的算法,很難做的效果,但是現(xiàn)在,有手就行。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

非常復(fù)雜的電商流程,一張?jiān)紙D,換產(chǎn)品換臉換衣服。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

比如@ 歸藏的直接把UI圖放樣機(jī)里面的例子,如果做過(guò)UI或者產(chǎn)品設(shè)計(jì)的朋友肯定都知道,以前我們?cè)谧鲎稣故?,或者做匯報(bào)的時(shí)候,經(jīng)常做樣機(jī)做的挺痛苦的。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

比如給他頭像,畫(huà)的兩套表情包,是可以直接上架到微信表情商店的那種。

打開(kāi)網(wǎng)易新聞 查看精彩圖片
打開(kāi)網(wǎng)易新聞 查看精彩圖片

來(lái)自一個(gè)頂級(jí)消費(fèi)品公司的電商設(shè)計(jì)團(tuán)隊(duì)負(fù)責(zé)人@黃花魚(yú),用GPT-4o來(lái)直接做之前非常流行的3D品牌海報(bào)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

比如我一個(gè)很喜歡的小紅書(shū)AI博主@ Rico有三貓,用GPT-4o給她做小紅書(shū)封面。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

也用GPT-4o直接做商品圖翻譯出海。

群友@ 默月僉在用GPT-4o出蜜蜂的解剖科普?qǐng)D。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

一個(gè)很專(zhuān)業(yè)的公眾號(hào)AI博主@ 阿真lrene,不僅用GPT-4o生成復(fù)雜的漫畫(huà),還能摳圖,一鍵直出透明通道的PNG圖。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

干死各種摳圖軟件的不是更牛逼的摳圖軟件,而是大模型。。。

還有朋友@ 不知名網(wǎng)友虎子哥,用GPT-4o給他自己家的房子裝修。。。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

還有一些我確實(shí)不知道源頭的但是被傳播的蠻廣的例子(如有作者,歡迎評(píng)論區(qū)認(rèn)領(lǐng))。

給幾個(gè)家具做一個(gè)展示圖,這個(gè)場(chǎng)景在電商領(lǐng)域無(wú)敵。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

之前我寫(xiě)可靈的AI模特的時(shí)候,很多人問(wèn),能不能讓模特帶首飾?現(xiàn)在,可以了。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

還用它,直接P圖,消除人物。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

老照片一鍵修復(fù)+上色。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

甚至,還可以模仿字體做自體設(shè)計(jì)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

在GPT-4o的沖擊下,N多的設(shè)計(jì)師和創(chuàng)業(yè)者,都有點(diǎn)emo了。

比如就有大佬在X上感嘆道:

打開(kāi)網(wǎng)易新聞 查看精彩圖片

朋友圈里還看到了一張圖,是glif的老板,在X上發(fā)的。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

紀(jì)念ComfyUI,紀(jì)念一切的AI圖像工作流。

OpenAI的一次更新,又屠殺了一堆公司。

又一次深刻的闡明了那句《三體》中的經(jīng)典臺(tái)詞:

我消滅你,與你無(wú)關(guān)。

GPT-4o的沖擊當(dāng)然是有,但是,他的上限在哪?能做到什么地步?真的能徹底替代ComfyUI的AI圖像工作流嗎?

我想弄清楚這個(gè)答案。

首先我覺(jué)得我還是要跟大家非常簡(jiǎn)單的用一兩句話(huà)解釋一下ComfyUI,讓大家知道這玩意是個(gè)啥,我們才好繼續(xù)往下聊。

ComfyUI是一個(gè)非常專(zhuān)業(yè)的工作流工具,不局限于AI繪圖,AI視頻啥的也都可以往里面接。他的界面大概是這樣的,很像電路板。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

這個(gè)就是在Liblib上搭的ComfyUI工作流。

它是以節(jié)點(diǎn)方式,把各個(gè)工具、各個(gè)模型給串起來(lái),形成一整套的工作流,比如一張圖進(jìn)去,經(jīng)過(guò)各種節(jié)點(diǎn)和插件,輸出一個(gè)完全風(fēng)格不同的AI視頻,這都是OK的。

坦率的講,我不是ComfyUI的專(zhuān)家的,做過(guò)的工作流也不多,我覺(jué)得在這個(gè)領(lǐng)域,我并沒(méi)有那么強(qiáng)的發(fā)言權(quán),所以。

我去請(qǐng)教了一下我的1個(gè)好朋友,AI繪圖大神@煉丹師忠忠。

我想聽(tīng)聽(tīng),他的看法。

首先是,GPT-4o對(duì)電商設(shè)計(jì)的沖擊到底有多大?

我跟忠忠聊了很久。

最后得到的結(jié)論,跟我自己在設(shè)計(jì)行業(yè)里感受到的水溫差不多。

對(duì)于普通水平的電商設(shè)計(jì)師,肯定是有打擊的,他們?cè)械募寄芩揭簿椭荒墚a(chǎn)出跟gpt4o差不多的圖,相對(duì)來(lái)說(shuō)意義不大了。

上游的運(yùn)營(yíng)專(zhuān)員可以自己操作工具來(lái)生產(chǎn)一樣質(zhì)量的圖。跟被沖擊的插畫(huà)師類(lèi)似,可能會(huì)變?yōu)閹兔π扪a(bǔ)gpt4o產(chǎn)出的圖的bug,還有疊加原圖部分細(xì)節(jié)上去加強(qiáng)細(xì)節(jié)還原(類(lèi)似于高低頻修復(fù)流程)。

生產(chǎn)成本降低后,需求量會(huì)變大,原本用不起各種華麗背景圖包裝的商家,現(xiàn)在也用的起了。

從效果上極簡(jiǎn)操作就能生圖的工具有美圖設(shè)計(jì)室等一堆工具,GPT4o只是在某些效果方面更進(jìn)一步而已,對(duì)于專(zhuān)業(yè)級(jí)的實(shí)際商業(yè)生產(chǎn)的影響可能沒(méi)有那么大。

而從視覺(jué)設(shè)計(jì)角度,對(duì)現(xiàn)有的整個(gè)開(kāi)源生態(tài),反而是利好作用。

忠忠舉了自己設(shè)計(jì)的公司IP的例子。

現(xiàn)在,可以一句話(huà)把IP的3D模型,直出到品牌海報(bào)上,不需要走以前的3D建模+渲染了,大大節(jié)省了時(shí)間。

打開(kāi)網(wǎng)易新聞 查看精彩圖片
打開(kāi)網(wǎng)易新聞 查看精彩圖片

同時(shí),更有趣的一點(diǎn)是,GPT-4o可以根據(jù)一張IP草圖,來(lái)生成這個(gè)IP的各角度視圖。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

而這些圖,會(huì)進(jìn)一步推動(dòng)flux等開(kāi)源模型的微調(diào)版本的效果。

你可能會(huì)問(wèn),都有GPT-4o了,為什么還要去微調(diào)flux,在ComfyUI搭工作流用呢?這不是脫褲子放屁多此一舉呢?

其實(shí)有兩個(gè)原因。

數(shù)據(jù)隱私性和精準(zhǔn)性。

數(shù)據(jù)隱私很好解釋?zhuān)褪荊PT-4o是一個(gè)閉源的模型,后面最多最多也就是開(kāi)放一個(gè)API,讓大家接到ComfyUI里面去用,但是,就OpenAI這個(gè)尿性,我們給過(guò)去的東西,大概率就成他后續(xù)的訓(xùn)練素材了。

舉個(gè)例子,《流浪地球3》2027年上映,要是現(xiàn)在美術(shù)組把核心概念圖或者設(shè)定圖直接灌給GPT-4o做一些處理,到時(shí)候,《流浪地球3》電影還沒(méi)上映,設(shè)定圖你可以直接在GPT-5o里面讓它畫(huà)出來(lái),這特么就炸了。。。

所以,數(shù)據(jù)隱私性至關(guān)重要,在真正的生產(chǎn)環(huán)境里,特別是一些大廠里,必須只能用本地的ComfyUI搭,真正的輸出,必須是本地環(huán)境,用開(kāi)源的模型。

所以,這個(gè)時(shí)候,我們就可以用一些不敏感的信息,扔給GPT-4o,來(lái)輔助生成數(shù)據(jù)集,反過(guò)來(lái)微調(diào)自己的flux模型,這個(gè)點(diǎn),真的很有用。

精準(zhǔn)性其實(shí)也很簡(jiǎn)單,我們回過(guò)頭來(lái)看忠忠用GPT-4o輸出的自己家IP的海報(bào)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

先不說(shuō)其他的細(xì)節(jié)了,這幾處,你是能發(fā)現(xiàn)一些明顯的BUG的。

這其實(shí)在生產(chǎn)環(huán)境里,這種BUG是品牌方覺(jué)得不可能接受的,就想你給一個(gè)手機(jī)產(chǎn)品做廣告,你把人手機(jī)弄變形了,你跟人說(shuō)不行AI出得就是這樣的,你看對(duì)面會(huì)不會(huì)把你掛在電風(fēng)扇上轉(zhuǎn)著打。

而這個(gè)時(shí)候,用Flux專(zhuān)門(mén)微調(diào)的Lora,是可以完美的解決這種精準(zhǔn)性和一致性的問(wèn)題的。

這其實(shí)就是普通設(shè)計(jì)場(chǎng)景和專(zhuān)業(yè)設(shè)計(jì)場(chǎng)景的區(qū)別。

GPT-4o當(dāng)然可以替代大部分的普通工作流,會(huì)讓ComfyUI里一大批的工作流失去價(jià)值,但是這就不代表,ComfyUI失去價(jià)值了。

很簡(jiǎn)單的一點(diǎn)是,在專(zhuān)業(yè)的設(shè)計(jì)工作里,純對(duì)話(huà)式的簡(jiǎn)單界面滿(mǎn)足不了復(fù)雜專(zhuān)業(yè)的需求的。

就像你問(wèn)一個(gè)專(zhuān)業(yè)設(shè)計(jì)師,為什么設(shè)計(jì)是用PS做設(shè)計(jì),而不用美圖秀秀來(lái)做設(shè)計(jì),對(duì)方只會(huì)把你當(dāng)傻子。

在真正的專(zhuān)業(yè)的AI設(shè)計(jì)工作里,可控性,很多時(shí)候非常的重要。

需要精確的規(guī)定重繪區(qū)域,需要精確的調(diào)節(jié)風(fēng)格效果,出圖尺寸比例等,所以在專(zhuān)業(yè)生產(chǎn)中需要精確調(diào)節(jié)的細(xì)節(jié),不能指望OpenAI全做成功能。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

還有前后處理流程,比如說(shuō)前置的裁剪,摳圖,語(yǔ)義識(shí)別,后置的比如對(duì)圖片的放大,貼回原圖細(xì)節(jié)(高低頻修復(fù)),再接入其他工作流繼續(xù)處理等。

自動(dòng)化一鍵完成的效率要比多輪對(duì)話(huà)高很多。

包括在一些精準(zhǔn)度要求高的產(chǎn)品和場(chǎng)景上,GPT-4o目前還達(dá)不到專(zhuān)業(yè)級(jí)的水準(zhǔn)。

看個(gè)例子。

比如我們要把問(wèn)界M9這款車(chē),換到另一個(gè)場(chǎng)景里。車(chē)這種產(chǎn)品,跟筆、戒指、香水等等要求的精細(xì)度,完全不一樣。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

這是GPT-4o出的圖。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

而如果我們用大佬的牛逼工作流呢?

打開(kāi)網(wǎng)易新聞 查看精彩圖片

生成出來(lái)的效果在整體比例和質(zhì)感上,是更好的。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

對(duì)比應(yīng)該非常直觀了。

這里我要給自己疊個(gè)甲,我并不是在這里鼓吹,GPT-4o不行,ComfyUI的效果可以吊打GPT-4o。

如果是這樣的話(huà),我也不會(huì)連更兩篇,來(lái)給大家看一看,GPT-4o,有多酷,有多強(qiáng)。

我想說(shuō)的是,GPT-4o,跟當(dāng)年的SD、Midjorney、Runway、可靈等等AI工具是一樣的。

會(huì)無(wú)差別替代所有這個(gè)行業(yè)里面的初級(jí)執(zhí)行職位。

屠殺所有曾經(jīng)在工程層面對(duì)大模型進(jìn)行的一些優(yōu)化。

然后,一點(diǎn)一點(diǎn)侵蝕更上層的建筑。

它更像是一層層洶涌上漲的潮水,將整個(gè)AI圖像領(lǐng)域原有的邊界打得支離破碎。

都說(shuō)做AI產(chǎn)品,要看到大模型的邊界,在邊界之外的安全地帶做。

但是現(xiàn)在,你根本不知道邊界在何方。

那些看似高聳的技術(shù)壁壘與工作流程,如果只是基于簡(jiǎn)單組裝或者初級(jí)執(zhí)行的邏輯,正在被GPT-4o以近乎暴力的方式消解。

絕大多數(shù)機(jī)械式的制作工作,一旦被強(qiáng)大的多模態(tài)理解與生成替代,就會(huì)像那些轟然倒塌的圍墻一樣,被歷史的風(fēng)塵輕易覆蓋。

有沒(méi)有一種第一次工業(yè)革命時(shí)候,機(jī)器代替手工勞動(dòng)的即視感?

打開(kāi)網(wǎng)易新聞 查看精彩圖片

歷史總是在不斷的重復(fù)。

可一如上文所言,這絕不代表ComfyUI之流就會(huì)被完全淘汰。

在工業(yè)級(jí)、專(zhuān)業(yè)級(jí)的深度工作流里,人們對(duì)數(shù)據(jù)安全、設(shè)計(jì)精度、可控度的需求不可能憑空消失。

那種圖像與視頻的多次處理、分層輸出、版本管理、腳本化批量運(yùn)行、自動(dòng)化節(jié)點(diǎn)銜接,只要是大型企業(yè)或核心團(tuán)隊(duì),都會(huì)很在意。

GPT-4o會(huì)在C端和中小B端市場(chǎng)里摧枯拉朽,取代了大量低端或者重復(fù)性工作。

而ComfyUI、Flux、ControlNet等開(kāi)源生態(tài)則在更專(zhuān)業(yè)的領(lǐng)域繼續(xù)進(jìn)化,利用它們精細(xì)、可控、可離線(xiàn)部署的特性,為高端客戶(hù)或機(jī)密項(xiàng)目提供服務(wù)。

這氣勢(shì)就像云端辦公與本地辦公的關(guān)系一樣,前者無(wú)限便捷,后者安全可控。

也如同家用轎車(chē)與頂級(jí)跑車(chē)的分別,各自目標(biāo)用戶(hù)并不沖突。

GPT-4o也一定會(huì)不斷進(jìn)化,去擴(kuò)大自己的邊界蠶食更多的場(chǎng)景。

開(kāi)源生態(tài)也會(huì)有各種可以復(fù)刻效果的模型、產(chǎn)品出來(lái),從而進(jìn)行私有化。

沒(méi)什么能夠阻止浪潮向前。

要么成為浪潮的追隨者,要么成為浪潮的推手。

這二者,都肯定比做一塊沉在海底的礁石,要精彩得多。

你說(shuō)是嗎。

以上,既然看到這里了,如果覺(jué)得不錯(cuò),隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時(shí)間收到推送,也可以給我個(gè)星標(biāo)?~謝謝你看我的文章,我們,下次再見(jiàn)。

>/ 作者:卡茲克

>/ 投稿或爆料,請(qǐng)聯(lián)系郵箱:wzglyay@virxact.com