曾經(jīng)被視為必備技能的 PS,如今似乎陷入了「可學(xué)可不學(xué)」的微妙處境。

最新版本的 Gemini「言出法隨」,僅需一句話(huà)就能改圖,成為現(xiàn)象級(jí)的存在,GPT-4o 多模態(tài)生圖功能上線以來(lái),生成的吉卜力風(fēng)格圖片也幾乎在一夜之間席卷網(wǎng)絡(luò)。

面對(duì)新勢(shì)力的崛起,老牌 AI 圖像生成巨頭 Midjourney 也不甘示弱,剛剛正式發(fā)布最新版本 V7 。

 Midjourney重磅更新!又一個(gè)「言出法隨」的AI生圖神器|附10+場(chǎng)景演示& 缺陷整理
打開(kāi)網(wǎng)易新聞 查看更多視頻
Midjourney重磅更新!又一個(gè)「言出法隨」的AI生圖神器|附10+場(chǎng)景演示& 缺陷整理

我們梳理了新版本的一些要點(diǎn):

整體圖像質(zhì)量提高,對(duì)文字與圖像提示的理解更準(zhǔn)確,身體、手部及各種物體在細(xì)節(jié)上的一致性大幅增強(qiáng)。

人物膚色和面部細(xì)節(jié)更加自然清晰,材質(zhì)紋理(如羽毛、衣物)質(zhì)感表現(xiàn)精細(xì),光影效果逼真。

能更好理解并呈現(xiàn)提示詞描述的完整場(chǎng)景,元素間空間關(guān)系合理,背景與主體融合度高。

能準(zhǔn)確表現(xiàn)特定視角,低角度和特寫(xiě)等拍攝風(fēng)格表現(xiàn)專(zhuān)業(yè)。

氛圍感和情感表達(dá)略弱,缺少一些戲劇性和神秘感,某些藝術(shù)風(fēng)格的獨(dú)特性和創(chuàng)意性稍顯不足。

需要注意的是,V7 是首個(gè)默認(rèn)啟用模型個(gè)性化的版本。用戶(hù)需解鎖個(gè)性化設(shè)置才能使用此功能,整個(gè)過(guò)程約需 5 分鐘,且可隨時(shí)開(kāi)關(guān)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

V7 的另一大亮點(diǎn)是「草稿模式」(Draft Mode)。該模式成本僅為標(biāo)準(zhǔn)模式的一半,圖像渲染速度卻提升至 10 倍。

在網(wǎng)頁(yè)端使用時(shí),提示欄將自動(dòng)切換為「對(duì)話(huà)模式」,用戶(hù)可直接通過(guò)指令調(diào)整內(nèi)容,例如將貓?zhí)鎿Q為貓頭鷹或?qū)?chǎng)景改為夜晚,系統(tǒng)會(huì)自動(dòng)調(diào)整提示并生成新圖像。

點(diǎn)擊「草稿模式」并啟用麥克風(fēng)按鈕后,用戶(hù)還能進(jìn)入「語(yǔ)音模式」,通過(guò)語(yǔ)音指令進(jìn)行實(shí)時(shí)創(chuàng)作。若需明確運(yùn)行草稿任務(wù),用戶(hù)可在提示后添加「--draft」參數(shù),適用于排列組合或重復(fù)生成等場(chǎng)景。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

Midjourney 官方表示,「草稿模式」是迄今為止迭代創(chuàng)意的最佳方式。

用戶(hù)若對(duì)草稿圖像滿(mǎn)意,可點(diǎn)擊「增強(qiáng)」或「改變」按鈕,以完整質(zhì)量重新渲染。需要注意的是,草稿模式下的圖像質(zhì)量低于標(biāo)準(zhǔn)模式,但其行為和美學(xué)表現(xiàn)高度一致,適合快速驗(yàn)證想法。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

圖片來(lái)自:@U79916881747113

V7 目前支持兩種運(yùn)行模式:Turbo 和 Relax。Turbo 模式速度更快,但成本為普通 V6 作業(yè)的 2 倍;草稿模式則成本減半。標(biāo)準(zhǔn)速度模式仍在優(yōu)化中,預(yù)計(jì)不久后推出。

目前,放大、編輯和重新紋理功能將回退至 V6 模型,未來(lái)將逐步升級(jí)至 V7。情緒板和 SREF 功能已可用,后續(xù)更新將進(jìn)一步提升性能。

Midjourney 團(tuán)隊(duì)透露,在未來(lái) 60 天內(nèi),每隔一至兩周將推出新功能,其中最受期待的則是全新的 V7 角色和對(duì)象引用系統(tǒng)。

話(huà)不多說(shuō),先來(lái)看圖。

知名博主 @nickfloats 分享了 Midjourney V6/V7版本基于同一提示詞生成的的圖片對(duì)比,一起來(lái)看看。

Prompt: A young Indian woman with dark hair in an open ponytail and a black jacket stands on a university campus, looking directly at the camera. The image has a 1990s-style movie still aesthetic, with a close-up portrait on a sunny day.

(一位年輕的印度女性,黑色頭發(fā)扎成松散的馬尾,穿著黑色夾克,站在大學(xué)校園里,直視鏡頭。照片呈現(xiàn)出 90 年代電影劇照風(fēng)格,背景是陽(yáng)光明媚的一天,特寫(xiě)的肖像。)

打開(kāi)網(wǎng)易新聞 查看精彩圖片

左:V6 右:V7

新版本的光線更加自然,尤其是在人物臉部,膚色更加清晰,細(xì)節(jié)更加豐富,畫(huà)面焦點(diǎn)更加清晰,尤其是人物的發(fā)型部分,但也因此犧牲了一些氛圍和情感的表達(dá)。

Prompt:A majestic barn owl perched on an ancient, moss-covered tree branch, surrounded by the misty forest. The scene is bathed in soft light filtering through the dense foliage, creating a magical and ethereal atmosphere. Photorealistic style with attention to detail of the feathers and textures.

(一只威嚴(yán)的 barn owl(倉(cāng)鸮)棲息在一根古老、覆蓋著苔蘚的樹(shù)枝上,周?chē)敲造F繚繞的森林。柔和的光線透過(guò)濃密的樹(shù)葉灑下,營(yíng)造出一種神秘而飄渺的氛圍。畫(huà)面風(fēng)格為逼真的寫(xiě)實(shí)風(fēng)格,細(xì)致入微地展現(xiàn)了羽毛和樹(shù)皮的質(zhì)感。)

打開(kāi)網(wǎng)易新聞 查看精彩圖片

左:V6 右:V7

新版本的貓頭鷹羽毛紋理更加細(xì)膩,羽毛的層次感和光影效果更強(qiáng),顯得更加真實(shí)。貓頭鷹的姿態(tài)方面,新版本更自然,身體略微傾斜,顯得更有動(dòng)態(tài)感,眼睛的細(xì)節(jié)也更生動(dòng),傳遞出一種警惕的神態(tài)。

簡(jiǎn)言之,魚(yú)和熊掌,不可兼得,V7 在追求真實(shí)感的目標(biāo)上更勝一籌;V6 則可能在追求畫(huà)面沖擊力和神秘感上更具優(yōu)勢(shì)。

Prompt:A person's hand points towards the window of an airplane, which is seen from inside with its wing visible in profile. The sky outside shows a clear horizon at dawn or dusk. In front of them lies a vast expanse of ocean.

(一個(gè)人的手指向飛機(jī)窗外,窗外的飛機(jī)機(jī)翼從側(cè)面可見(jiàn)。外面的天空清晰,天際線顯示出黎明或黃昏的景象。眼前是廣闊的海洋。)

打開(kāi)網(wǎng)易新聞 查看精彩圖片

左:V6 右:V7

同樣都是從飛機(jī)舷窗向外看的情景,一只手指向窗外,V7 的進(jìn)步肉眼可見(jiàn),通過(guò)加入飛機(jī)機(jī)翼的元素,增加了畫(huà)面的層次感和真實(shí)感,更能感受到身處飛機(jī)的視角。

Prompt:A close-up of broccoli being sautéed in oil, with the vegetable's green florets contrasting against a dark brown sauce. A large spoon is partially visible inside a stainless steel pot filled with caramelized and shiny black glaze on top, against a white...

(一塊近距離拍攝的西蘭花在油中翻炒,綠意盎然的花椰菜與深棕色的醬汁形成鮮明對(duì)比。一只大湯勺部分可見(jiàn),放在一個(gè)不銹鋼鍋中,鍋里覆蓋著一層焦糖色的光澤黑色醬汁,背景是白色的...)

打開(kāi)網(wǎng)易新聞 查看精彩圖片

左:V6 右:V7

V6 雖然通過(guò)特寫(xiě)鏡頭突出了醬汁和勺子,焦點(diǎn)非常明確,注意力很容易被吸引到醬汁的質(zhì)感和細(xì)節(jié)上, 但如果從提示詞的要求出發(fā),新版本展示整個(gè)鍋內(nèi)的西蘭花和醬汁的搭配,呈現(xiàn)了一個(gè)更完整的烹飪場(chǎng)景,邏輯上更符合實(shí)際烹飪過(guò)程。

Prompt:Close-up of an anime woman's face with a shocked expression, dark hair, in the anime style. Colorful animation stills, close-up intensity, soft lighting, low-angle camera view, and high detail.

(一位動(dòng)漫女性的面部特寫(xiě),表情震驚,黑色頭發(fā),呈現(xiàn)動(dòng)漫風(fēng)格。色彩豐富的動(dòng)畫(huà)畫(huà)面,特寫(xiě)鏡頭強(qiáng)烈,柔和的光線,低角度拍攝,細(xì)節(jié)非常精致。)

打開(kāi)網(wǎng)易新聞 查看精彩圖片

左:V6 右:V7

光影和色彩的處理上,V7 也符合提示詞中的「soft lighting」要求,臉部的高光和陰影過(guò)渡更加柔和自然,尤其是眼部和臉頰的光影分布,營(yíng)造出更立體的效果。

Prompt:A dynamic film still of an epic space battle with sleek starfighters zooming past a massive space station, lasers firing, and a distant planet visible in the backdrop.

(一幅動(dòng)態(tài)的電影畫(huà)面,展示了一場(chǎng)史詩(shī)般的太空戰(zhàn)斗,流線型的星際戰(zhàn)斗機(jī)飛馳而過(guò),巨大的太空站在一旁,激光四射,遠(yuǎn)處的行星清晰可見(jiàn),構(gòu)成了一幅震撼的畫(huà)面。)

打開(kāi)網(wǎng)易新聞 查看精彩圖片

左:V6 右:V7

人像方面,v7 在細(xì)節(jié)的精細(xì)度和真實(shí)感(服裝、皮膚、光影等)上有所提升,人物的立體感和與背景的融合度更高,但在情感傳遞、表情的戲劇性、動(dòng)態(tài)感上有所倒退。

以下為三個(gè)具體的對(duì)比案例:

Prompt:1980s mystery film, low-angle shot of an evil-eyed French Butler sporting a black suit and grasping a candle in the hallway of a creepy Victorian mansion with musty decor. The warm candle glow evokes a spooky sense of mystery

(一張 1980 年代神秘電影風(fēng)格的低角度鏡頭,拍攝了一位邪惡眼神的法國(guó)管家,身穿黑色西裝,手中握著一支蠟燭,站在一座裝飾陳舊、充滿(mǎn)霉味的維多利亞式大廈走廊里。溫暖的燭光營(yíng)造出一種陰森神秘的氛圍。)

打開(kāi)網(wǎng)易新聞 查看精彩圖片

左:V6 右:V7

Prompt:1990s medium-full street style fashion photo shot on Kodak 500T capturing a rugged 50-year-old man with curly gray hair, 5-o'clock shadow, and a stern look walking down the sidewalk on a bright spring morning in Paris. He's wearing ...

(一張 1990 年代中等全身街頭風(fēng)格的照片,使用 Kodak 500T 膠片拍攝,捕捉到一位五十多歲的男子,他有著卷曲的灰白色頭發(fā)、胡茬和嚴(yán)肅的表情,正走在巴黎春日明媚的早晨人行道上。他穿著...)

打開(kāi)網(wǎng)易新聞 查看精彩圖片

左:V6 右:V7

Prompt:Cinematic, off-center, two-shot, 35mm film still of a 30-year-old french man, curly brown hair and a stained beige polo sweater, reading a book to his adorable 5-year-old daughter, wearing fuzzy pink pajamas, sitting in a cozy corner nook...

(一張電影感的 35 毫米膠片畫(huà)面,構(gòu)圖偏離中心,拍攝了一位 30 歲的法國(guó)男子,卷曲的棕色頭發(fā),穿著一件弄臟的米色 polo 衫,正在給他可愛(ài)的 5 歲女兒讀書(shū)。女兒穿著柔軟的粉色睡衣,坐在一個(gè)溫馨的角落里。)

打開(kāi)網(wǎng)易新聞 查看精彩圖片

左:V6 右:V7

海螺 AI+Midjourney 會(huì)是讓圖片動(dòng)起來(lái)的王炸組合嗎?網(wǎng)友 @ainextastro 也試了試。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

下面由 @tanvitabs 用 v7 生成的這張照片則將 AI 圖像生成的坑都踩了個(gè)遍,包括憑空多出來(lái)的第三只手,T 恤和西裝著裝上的混淆,以及不匹配的面部生成等。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

最后留個(gè)課堂作業(yè),以下是基于同一提示詞生成的四張照片,你更喜歡哪個(gè)版本?請(qǐng)投票。

Prompt:Elegant female model standing by a large window in a sunlit room, soft morningliaht casting natural highlights and shadows on her face, wearing a flowing beigedress, relaxed pose, minimal makeup, 85mm lens depth of field, lifestyle fashioneditorial, cinematic tones, airy atmosphere

(一位優(yōu)雅的女性模特站在陽(yáng)光灑進(jìn)的房間大窗旁,柔和的晨光在她的臉上投下自然的高光與陰影,身穿一襲飄逸的米色長(zhǎng)裙,姿勢(shì)放松,妝容簡(jiǎn)約。使用 85mm 鏡頭拍攝,背景有著淺景深,營(yíng)造出生活方式時(shí)尚編輯感,畫(huà)面呈現(xiàn)電影般的色調(diào),空氣感十足。)

打開(kāi)網(wǎng)易新聞 查看精彩圖片

過(guò)去幾年,AI 圖像生成的主旋律是追求真實(shí)、無(wú)油膩感。

去年,F(xiàn)lux 因生成超真實(shí)人像而一舉破圈,聲名大噪, 現(xiàn)在,Midjourney V7 接過(guò)接力棒,以更豐富的細(xì)節(jié)、更有層次感的光影、更自然的膚質(zhì)紋理,再次將「真實(shí)」推向新的高度。

但追求真實(shí),是一切的終點(diǎn)嗎?

最近,隨著 GPT-4o 多模態(tài)生圖功能的發(fā)布,吉卜力風(fēng)格的圖片幾乎在一夜之間點(diǎn)燃了網(wǎng)絡(luò),也像一陣春風(fēng)吹進(jìn)了 AI 圖像生成的世界。

技術(shù)選擇的可能性多了,創(chuàng)作的玩法也跟著變了。用更通俗的話(huà)來(lái)說(shuō),現(xiàn)在就好比站在廚房里,你是想做頓踏實(shí)的飯,還是想整點(diǎn)黑暗料理的,全然在你。

我們正在招募伙伴

簡(jiǎn)歷投遞郵箱
hr@ifanr.com

?? 郵件標(biāo)題
「姓名 + 崗位名稱(chēng)」(請(qǐng)隨簡(jiǎn)歷附上項(xiàng)目 / 作品或相關(guān)鏈接)

打開(kāi)網(wǎng)易新聞 查看精彩圖片