打開網(wǎng)易新聞 查看精彩圖片

編輯|佳琪

不會 PS 也能贏麻了!

這句話我們已經(jīng)在各種各樣的 AI 生圖工具那里聽了太多遍,不過,這次 GPT-4o 好像玩的是真的。

打開社交媒體,無論是 X 還是小紅書,都被 GPT-4o 生成的圖片刷了屏。上次 AI 產(chǎn)品能讓全網(wǎng)這么嗨玩,可能還是 DeepSeek R1。

隨機掉落幾個案例,震撼一下還沒刷到的朋友,比如下面這張論文插圖,就是 GPT-4o 做的。

打開網(wǎng)易新聞 查看精彩圖片

來源:小紅書 @陸導

宮崎駿畫風的特朗普「積極坦誠對話」?jié)蛇B斯基,GPT-4o 做的。

打開網(wǎng)易新聞 查看精彩圖片

約稿一張 5 塊的日本小人,GPT-4o 做的。

打開網(wǎng)易新聞 查看精彩圖片

排版精良的長圖海報,GPT-4o 做的。

打開網(wǎng)易新聞 查看精彩圖片

來源:小紅書 @張一凡

3D 深度圖,GPT-4o 做的。

打開網(wǎng)易新聞 查看精彩圖片

來源:小紅書 @小崔大口吃湯圓,原博主評論:「雖然現(xiàn)在圖像還有些瑕疵,但是這空間能力和 affordance 推測能力提升有點太大了?!?/blockquote>

各種風格的頭像隨心切換,還是 GPT-4o 做的。

打開網(wǎng)易新聞 查看精彩圖片

最左為原圖,分別改為迪士尼、吉卜力、史努比和星露谷風格

最重要的是,以上這些操作,GPT-4o 幾乎都是一次成功,無需多輪對話修改。

再加上 AI 視頻的魔法,一部宮崎駿風格的《星際穿越》就這么水靈靈地做出來了。

 GPT-4o的P圖全家桶有多強?連Midjourney CEO都坐不住了
打開網(wǎng)易新聞 查看更多視頻
GPT-4o的P圖全家桶有多強?連Midjourney CEO都坐不住了

視頻來自 X@kb24x7

制作步驟其實只有兩大步:第一,用 GPT-4o 生成首尾幀;第二,把這些圖片放到 Morphic 等視頻生成平臺輸入想要的動作效果,再剪輯拼合。

打開網(wǎng)易新聞 查看精彩圖片

那么問題來了,AI 繪圖工具明明多如過江之鯽,為什么是 GPT-4o 破圈?

答案也很直觀,首先是好看。AI 生圖,顏值即正義,效果如何一眼就能看出來。

就拿生成微信公眾號封面來說,同一段提示詞,即夢和 GPT-4o 端出來的作品,不需要投票,從構(gòu)圖到配色,相信大家心中也有判斷。

提示詞:A pair of pastel-colored headphones with a gradient from blue to purple, floating in a soft pink background. In the center of the headphones, there is a small ball with the word "mureka" written on it in a playful font. The image should have a 3D, cartoonish style.colorful background.

打開網(wǎng)易新聞 查看精彩圖片

圖左來自即夢,圖右來自 GPT-4o

其次是足夠簡單,能達到這么好的效果的,操作比對話復雜得多,特別是 Stable Diffusion 和 Midjourney,至今仍需要復雜咒語。至于還想更精細,就只能自己微調(diào) lora 或者訓練模型了。

而風格化、摳圖、帶文字排版,在其他平臺要手動框選,在頁面之中跳轉(zhuǎn)的功能,GPT-4o 都包攬在一個對話框里,效果還更強。

綜合來看,結(jié)合了「能打」和「好用」的 GPT-4o 這次主要帶來了幾大殺手锏:

高保真真實照片

有審美的文字排版:從海報到梗圖,不僅準確,字在哪里都聽你指揮

各種風格、濾鏡隨心切換

P 圖全家桶:摳圖、換臉、擴圖樣樣行,還能結(jié)合不同圖片中的元素「燉」出一張新圖來

聽起來很厲害?讓我們一項一項地來看,GPT-4o 是不是真的這么神。

真實感

這居然是 AI 生成的嗎?攝影師看了沉默,平臺審核看了流淚,以后我們還看得出照片里的 AI 味嗎?

提示詞:幫我生成一張身著白裙的女生,比著剪刀手,在佛羅倫薩的舊宮門口拍的照片。

打開網(wǎng)易新聞 查看精彩圖片

不過,GPT-4o 偶爾也會翻車,不僅沒畫出小米 su7 的「櫻花」輪胎,還把雷總生生卡在了車外。

提示詞:雷軍從小米 su7 里探頭比耶,背景是武大櫻花,照片盡可能接近真實。

打開網(wǎng)易新聞 查看精彩圖片

文字排版

無論是菜單、婚禮請柬、漫畫、科研插圖,只要是需要排版的圖片,GPT-4o 真的帶來了一種「aha moment」的感覺。

除了字體邊緣稍為有些模糊之外,這個菜單似乎可以直接放在餐廳用了。

打開網(wǎng)易新聞 查看精彩圖片

圖源微信公眾號:賽博禪心

不過,雖然排版夠用了,GPT-4o 的漢字寫得還不太好。

打開網(wǎng)易新聞 查看精彩圖片

以后直接把論文方法扔給 ChatGPT,配圖就可以出來了:

打開網(wǎng)易新聞 查看精彩圖片

圖源:小紅書 @云安

提示詞寫得稍微簡單一些,這個配圖也是 next level 了:

打開網(wǎng)易新聞 查看精彩圖片

想要更復雜的設計,網(wǎng)易云聽歌年度報告也能安排。當然,相比英文的準確度,GPT-4o 的漢字還亟待進步。

打開網(wǎng)易新聞 查看精彩圖片

圖源 X@歸藏 @op7418

最重要的是,GPT-4o 多模態(tài)能力是原生的,它可以理解你的需求,在不提供文案的情況下,它也能續(xù)上畫面中的主體和對話。

打開網(wǎng)易新聞 查看精彩圖片

要知道,主體一致性至今也是視覺生成的難題。在 GPT-4o 出現(xiàn)之前,大家一般會用 Stable Diffusion 和 ControlNet 來治療生圖模型「選擇性失憶」的問題。

但是現(xiàn)在在 GPT-4o 里,主題一致性已經(jīng)完全不再是問題。

打開網(wǎng)易新聞 查看精彩圖片

圖源: X@emollick

不僅完全告別即使是輸入圖像主題參考,每次抽卡的人物也都各有各的抽象?,F(xiàn)在根據(jù)上下對話中的結(jié)果,GPT-4o 就能穩(wěn)定輸出,角色特征分毫不差。

打開網(wǎng)易新聞 查看精彩圖片

圖源: X@zhansheng

風格化

都說 GPT4o 一出,宮崎駿的天塌了一半。

現(xiàn)在 X 上最火的,就是把各種各樣的名場面讓 GPT-4o 用宮崎駿的風格再畫一遍。無論娛樂圈,還是科技圈,哪怕已退生物圈,都逃不掉。

打開網(wǎng)易新聞 查看精彩圖片

OpenAI CEO Sam Altman 把自己的頭像改成了吉卜力風格的自己

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

雖然換了畫風,但是畫面中人物本來的面部特征,都得以保留,不一一標出這些圖片中的人物,相信大家都認得出來它本來的面目。

當然,除了吉卜力風格,任何畫風它也能 hold 得住。

比如梵高風格的李逵,就連文字都能完美融入其中:

打開網(wǎng)易新聞 查看精彩圖片

再比如,皮克斯 CG 3D 風格的伊利亞和奧特曼吵架神圖:

打開網(wǎng)易新聞 查看精彩圖片

還有澤連斯基和特朗普在白宮吵架的經(jīng)典一幕,也被網(wǎng)友用 GPT-4o 轉(zhuǎn)成了蠟筆小新風格:

打開網(wǎng)易新聞 查看精彩圖片

圖源:小紅書 @AI 學習筆記

看來以后,網(wǎng)友的整活又多了一款神器。

滿足基礎設計功能

2023 年底,美圖秀秀和剪映曾推出了擴圖功能,但畫風相當癲狂,不是男女不分,就是人面獸身。

而 GPT-4o 也被網(wǎng)友開發(fā)出了相同的功能,效果相當驚艷,不僅能擴出小狗的全身,還能讓它跑起來。

打開網(wǎng)易新聞 查看精彩圖片

一鍵換衣,不用再提供 10 張全身照片:

打開網(wǎng)易新聞 查看精彩圖片

僅需兩張圖片外加一句簡單的提示詞,就能讓圖一的人物跑到圖二中的手機樣機里:

打開網(wǎng)易新聞 查看精彩圖片

圖源:小紅書 @AIGC 魔法學院

此外,GPT-4o 還能直接生成帶通道的照片,圖中的人物、和背景都是分開生成的,不需要后期摳圖,編輯起來方便了不少:

打開網(wǎng)易新聞 查看精彩圖片

動圖來源:X 博主歸藏

看完了這些 case,學繪畫的朋友們,學 comfyui 的朋友們,你們還好嗎?

打開網(wǎng)易新聞 查看精彩圖片

當然,除了一片叫好聲外,也有質(zhì)疑聲。據(jù)說今早,Midjourney 的 CEO 就在內(nèi)網(wǎng)大大嘲諷了 GPT-4o 一通:

GPT-4o 生成圖像又慢,質(zhì)量又差。

他們發(fā)這個功能只是為了籌集資金用的。

GPT-4o 不是一款創(chuàng)意工具。

一周后(Midjourney v7 即將發(fā)布),就沒人會在討論 GPT-4o 了。

打開網(wǎng)易新聞 查看精彩圖片

至于 Midjourney v7 發(fā)布后,GPT-4o 是不是還是這么火,我們無從得知,但 AI 好好用將持續(xù)關注~

? THE END

轉(zhuǎn)載請聯(lián)系本公眾號獲得授權