作者|沐風(fēng)

來源|AI先鋒官

最近AI繪圖領(lǐng)域可謂是熱鬧非凡。

GPT-4o帶來的熱潮還未褪去,字節(jié)即夢(mèng)的圖片模型又悄悄上線了3.0版本。

經(jīng)即夢(mèng)官方確認(rèn),今天開始進(jìn)行小范圍內(nèi)測(cè),部分用戶登錄賬號(hào)后,在左側(cè)生圖模型即可看到“圖片3.0”版本。

打開網(wǎng)易新聞 查看精彩圖片

未獲得測(cè)試資格的小伙伴也不要著急,你可以試著多注冊(cè)幾個(gè)賬號(hào),說不定哪個(gè)賬號(hào)就可以使用即夢(mèng)3.0版本。

去年12月,即夢(mèng)上線了2.1版本,可以通過簡(jiǎn)單的指令,控制文字的顏色和位置等元素,快速生成中英文圖像海報(bào),號(hào)稱“一句話生成海報(bào)”。

即夢(mèng)2.1版本相比,即夢(mèng)3.0版本在真實(shí)感、高清度、專業(yè)性以及文字響應(yīng)上,表現(xiàn)出了驚人的突破。

據(jù)官方介紹,即夢(mèng)3.0最大的亮點(diǎn)是:影視質(zhì)感,文字更準(zhǔn),直出2k高清圖。

話不多說,小編這就來一手實(shí)測(cè)對(duì)比,看看它與GPT-4o相比,誰會(huì)更勝一籌呢,同時(shí)也可以讓大家更直觀感受 即夢(mèng)3.0版本的突破。

另外需要注意的是,即夢(mèng)3.0暫時(shí)還無法使用“導(dǎo)入?yún)⒖紙D”生成圖片。

那么,小編先使用大家最熟悉的GPT-4o同款提示詞。

GPT-4o:“壞了,這波好像是我沖來的。”

提示詞:

用手機(jī)拍攝的玻璃白板的廣角圖像,位于俯瞰海灣大橋的房間里。視野顯示一名女性正在寫作,她穿著一件帶有大型 OpenAI 標(biāo)志的 T 恤。筆跡看起來很自然,有點(diǎn)凌亂,我們看到了攝影師的倒影。文本寫道:(左)"Transfer between Modalities:Suppose we directly modelp(text, pixels, sound) [equation]with one big autoregressive transformer.Pros:* image generation augmented with vast world knowledge* next-level text rendering* native in-context learning* unified post-training stackCons:* varying bit-rate across modalities* compute not adaptive"(右)"Fixes:* model compressed representations* compose autoregressive prior with a powerful decoder"On the bottom right of the board, she draws a diagram:"tokens -> [transformer] -> [diffusion] -> pixels".

GPT-4o

打開網(wǎng)易新聞 查看精彩圖片

即夢(mèng)3.0

打開網(wǎng)易新聞 查看精彩圖片

即夢(mèng)2.1

打開網(wǎng)易新聞 查看精彩圖片

小編還將提示詞中的“OpenAI”換為了“即夢(mèng)”,他也能準(zhǔn)確生成。

打開網(wǎng)易新聞 查看精彩圖片

并且小編發(fā)現(xiàn),即夢(mèng)3.0版本在生成中文表現(xiàn)更好,如圖:

打開網(wǎng)易新聞 查看精彩圖片

提示詞:

創(chuàng)作一幅逼真的圖像,描繪兩個(gè)20多歲的女巫(一個(gè)灰發(fā)挑染,一個(gè)擁有長(zhǎng)波浪栗色頭發(fā))正在閱讀一個(gè)路標(biāo)。背景:紐約威廉斯堡的一條隨機(jī)街道,街道上立著一根柱子,柱子上覆蓋著無數(shù)詳細(xì)的街道標(biāo)志(例如,街道清掃時(shí)間、需要停車許可證、車輛分類、拖車規(guī)則),中間有幾個(gè)荒謬的標(biāo)志:“女巫不得在C區(qū)使用掃帚停車”和“魔法地毯裝卸僅限(15分鐘限制)以及“馴鹿停車需許可證(12月24日至25日)”?!斑`規(guī)者將被列入“淘氣名單”。指示牌位于街道右側(cè)。不要重復(fù)標(biāo)志。標(biāo)志必須是現(xiàn)實(shí)的。角色:一個(gè)女巫拿著掃帚,另一個(gè)女巫拿著卷起來的魔法地毯。她們?cè)谇熬爸猩晕⒈硨?duì)著鏡頭,頭稍微傾斜,仔細(xì)檢查著標(biāo)志。從背景到前景的構(gòu)圖:街道+停放的汽車+建筑物+街道標(biāo)志 +女巫。角色必須最靠近拍攝鏡頭。

GPT-4o

打開網(wǎng)易新聞 查看精彩圖片

即夢(mèng)3.0

打開網(wǎng)易新聞 查看精彩圖片

即夢(mèng)2.1

打開網(wǎng)易新聞 查看精彩圖片

因字?jǐn)?shù)限制,小編就將提示詞由英文轉(zhuǎn)換為了中文,可以看出即夢(mèng)3.0在復(fù)雜提示詞和遵循提示詞的能力上與GPT-4o相比稍遜,例如,它并未生成“攝影師的倒影”等等。

但相較于即夢(mèng)2.1版本,它的提升不是一星半點(diǎn),雖然3.0版本在部分單詞中還是會(huì)出現(xiàn)不穩(wěn)定,但大部分內(nèi)容還是非常準(zhǔn)確的。

我們?cè)賮睃c(diǎn)簡(jiǎn)單的提示詞,讓它設(shè)計(jì)兩張海報(bào)。

提示詞:

3D立體字"瘋狂星期四"懸浮在深紅色背景前,字母縫隙露出炸雞食材剖面。前景透明手機(jī)屏幕顯示優(yōu)惠彈窗"v我50即刻解鎖",背景光斑虛化成漢堡形狀,側(cè)逆光勾勒炸雞桶輪廓,金屬質(zhì)感標(biāo)題下方小字標(biāo)注活動(dòng)條款 。

即夢(mèng)3.0

打開網(wǎng)易新聞 查看精彩圖片

即夢(mèng)2.1

打開網(wǎng)易新聞 查看精彩圖片

提示詞:

Switch2游戲主機(jī)懸浮在星空宇宙背景中,手柄按鍵化作霓虹光圈環(huán)繞,"即刻暢玩"立體發(fā)光字體傾斜45度,粒子光效從屏幕迸發(fā),底部液態(tài)金屬形成"Switch2震撼發(fā)售"漸變文字,未來科技感霓虹光效。

即夢(mèng)3.0

打開網(wǎng)易新聞 查看精彩圖片

即夢(mèng)2.1

打開網(wǎng)易新聞 查看精彩圖片

提示詞:

電影海報(bào),小丑站在臺(tái)階上,張開雙臂,詭異的笑,正面,人物攝影,灰暗的氛圍,頂部顯示手寫的文字“joker”。

即夢(mèng)3.0

打開網(wǎng)易新聞 查看精彩圖片

即夢(mèng)2.1

打開網(wǎng)易新聞 查看精彩圖片

提示詞:

奧斯卡獲獎(jiǎng)電影海報(bào)設(shè)計(jì),巨大的潑墨狂草書法字“異人之下”為主體的海報(bào)”和副標(biāo)題“我的存在自有異義”,鐳射閃電標(biāo)記印章,海報(bào)底部是:2024-12-27 上映 ,導(dǎo)演和演員名單,極小的帶兜帽的紅衣連帽衫人群分散在毛筆筆觸間行走,詹姆斯特瑞爾,彌散漸變,強(qiáng)烈的對(duì)比反差,東方美學(xué),極簡(jiǎn)主義,大面積留白,禪意,神性,杰作,獲獎(jiǎng)作品,極致構(gòu)圖,電影光線,極致像素,高清出圖,32K,HDR

即夢(mèng)3.0

打開網(wǎng)易新聞 查看精彩圖片

即夢(mèng)2.1

打開網(wǎng)易新聞 查看精彩圖片

可以看到,2.1版本在大字生成上沒什么問題,但是到了副標(biāo)題,就開始出現(xiàn)BUG。而3.0版本的副標(biāo)題更加穩(wěn)定,并且,設(shè)計(jì)感、準(zhǔn)確性更加優(yōu)秀。

除了文字生成能力提升之外,在影視級(jí)的畫面表現(xiàn)上,即夢(mèng)3.0也表現(xiàn)出了不俗的實(shí)力。

提示詞:

攝影寫真 慢門攝影 王家衛(wèi)電影感 抽幀攝影 慢門攝影 創(chuàng)意人像攝影 青橙色調(diào) 港風(fēng)街拍攝影 地鐵站 人來人往 光線虛化模糊 形成模糊的拖影 柔焦攝影 深邃迷離的眼神 藝術(shù)氛圍感

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

提示詞:

宇航員特寫,被花朵包圍,光線,朦朧,迷幻,孤獨(dú)世界,四周大面積留白,彌散漸變,層次感,噪點(diǎn)攝影,超現(xiàn)實(shí)主義美學(xué),空靈,寶利來,膠片,如夢(mèng)似幻。

打開網(wǎng)易新聞 查看精彩圖片

提示詞:

俯視,長(zhǎng)焦鏡頭,一直泰迪熊孤獨(dú)地坐在十字路口,天空中正下著傾盆大雨,邊緣模糊,增加視覺沖擊力。周圍是大量行人穿過的模糊身影,動(dòng)態(tài)美學(xué),虛化效果,長(zhǎng)距離拖影。膠片顆粒質(zhì)感,電影感,陰天光線,雨天,電影般逼真,大師構(gòu)圖,超高清,最佳質(zhì)量,精致細(xì)節(jié),32K。

打開網(wǎng)易新聞 查看精彩圖片

提示詞:

近景拍攝,索尼鏡頭,一只布偶貓?jiān)谘┑乩锉寂?,毛發(fā)濃密

打開網(wǎng)易新聞 查看精彩圖片

提示詞:

特寫鏡頭,少女面部肩頸角度,溫婉東方古典面容,眼神低垂,恬靜沉思,柔和斜前光,細(xì)膩光影過渡,高挺鼻梁,飽滿嘴唇,光滑肌膚,優(yōu)美下頜線,蓬松深棕卷發(fā),櫻花花瓣,自然靈動(dòng),淺粉色旗袍,絲綢反光,虛化櫻花花叢背景,朦朧工筆畫筆觸,柔和色彩過渡,大量圓形淺焦外光斑,夢(mèng)幻氛圍,飄近半透明花瓣,動(dòng)態(tài)模糊,真實(shí)肌膚質(zhì)感,清晰發(fā)絲細(xì)節(jié),柔美光影,情感細(xì)膩。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

最后,小編想說,雖然AI繪圖越來越強(qiáng),但這并不意味著設(shè)計(jì)師會(huì)被取代,反而小編認(rèn)為,它更可能會(huì)成為設(shè)計(jì)師手中的利器。

設(shè)計(jì)師的核心價(jià)值在于創(chuàng)新力,而AI可以讓許多重復(fù)的勞動(dòng)一鍵實(shí)現(xiàn),從而可以讓設(shè)計(jì)師把更多精力,放在更高維度的思考上,助力他們創(chuàng)造出更優(yōu)秀高效的作品。

另外,值得一提的是,有消息稱,Midjourney v7也將馬上來到,聽說還帶了AI視頻大模型。

掃碼邀請(qǐng)進(jìn)群,我們帶你一起來玩轉(zhuǎn)ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學(xué)一些AI搞錢技能。

往期文章回顧