剛剛,Midjourney 推出了一個全新圖像生成模型,距離其上次發(fā)布新模型已經(jīng)過去了一年多。該模型叫做 V7,官方表示它得到了全面的重新設(shè)計,且默認啟用了個性化功能,目前用戶可以使用其測試版本。

Midjourney 在 X 表示:“我們現(xiàn)在開始對新的 V7 圖像模型進行 Alpha 測試。這是我們迄今為止最智能、最美觀、最連貫的模型。請嘗試一下,預(yù)計在接下來的兩個月內(nèi)每周或每兩周都會更新一次?!?/p>
V7 有兩個方面的改進:第一是生成質(zhì)量更好的圖像,第二是推出了新工具和工作流程。
在圖像質(zhì)量的提升上,Midjourney 表示 V7 在手部、手指、身體部位以及“各類物體”的生成上,具有更高的連貫性和一致性。它還能呈現(xiàn)出更加細致逼真的紋理和材質(zhì)效果,比如皮膚的皺紋或是陶瓷花瓶的細微之處。

這些細節(jié)往往是判斷一幅圖像是否由 AI 生成的最明顯標(biāo)志。需要明確的是,Midjourney 并沒有宣稱其取得了能讓訓(xùn)練有素的人無法識別出 AI 生成圖像的進展,它只是表示人們習(xí)以為常的一些粗糙之處已在很大程度上得到了改善。
在功能方面,最引人注目的是新推出的“草稿模式”。Midjourney 在其與用戶溝通的各個渠道(博客、Discord、X 等平臺)上表示,“草稿模式的成本減半,圖像渲染速度提升至原來的 10 倍”。
Midjourney 在 X 表示:“草稿模式的成本是原來的一半,速度是原來的 10 倍,它可能是有史以來迭代創(chuàng)意的最佳方式。用語音嘗試一下,大聲說出自己的想法,讓我們的想法像夢一樣流動?!迸c此同時,Midjourney 附上了一則視頻來展示草稿模式。
不過,該模式下生成的圖像質(zhì)量比其他模式要低,所以它并非用于生成最終成品圖像的模式。相反,它的作用是讓用戶在切換模式生成高質(zhì)量的圖像之前,通過反復(fù)嘗試和探索來找到理想的效果。
V7 有兩種模式:加速模式和普通模式。加速模式能快速生成最終圖像,但是成本更高;而普通模式耗時較長,但成本僅為加速模式的一半。奇怪的是,目前 V7 沒有標(biāo)準(zhǔn)模式。Midjourney 表示標(biāo)準(zhǔn)模式稍后會推出,因為還需要一些時間來完善。
V7 支持之前版本的大多數(shù)參數(shù)(如--ar、--seed 等),包括用戶現(xiàn)有的來自 6.1 版本的--sref 代碼,以及最近推出的個性化功能。實際上,V7 是 Midjourney 首個默認啟用個性化功能的模型,這意味著用戶必須至少挑選 200 張圖片來訓(xùn)練,以便建立自己的審美偏好。
在使用個性化功能的時候,V7 會數(shù)百次地讓用戶在兩張圖片之間做出選擇,這樣它就能了解用戶認為“好看”的標(biāo)準(zhǔn),并根據(jù)這些偏好生成圖像。不過,和之前的模型一樣,用戶在 V7 中也可以根據(jù)需要關(guān)閉個性化功能。
Midjourney 是最早被廣泛使用的 AI 圖像生成工具之一。最初,它在 Discord 平臺上可用,且需要通過有點晦澀難懂的語法來操作,但后來它推出了更現(xiàn)代化的網(wǎng)頁界面。
社交媒體上分享的很大一部分 AI 藝術(shù)作品都是用 Midjourney 創(chuàng)作的。對于許多 AI 視頻創(chuàng)作者來說,它也是工作流程中的關(guān)鍵環(huán)節(jié),這些創(chuàng)作者通常會先在 Midjourney 中生成初始圖像,然后再使用如 Runway 等應(yīng)用程序的圖像轉(zhuǎn)視頻功能。
然而,盡管 Midjourney 很受歡迎,但它也成為了多起訴訟的對象,并且它也卷入了“在受版權(quán)保護的作品上訓(xùn)練 AI 模型是否構(gòu)成合理使用”的巨大爭議之中。使用過 Midjourney 的人都知道,它是在受版權(quán)保護的作品上進行訓(xùn)練的、它甚至有時會在生成的圖像中出現(xiàn)水印和藝術(shù)家簽名。
另據(jù)悉,該公司還宣布計劃在未來推出硬件產(chǎn)品,但具體會是什么樣子仍不清楚。
參考資料:
https://www.midjourney.com/updates/v7-alpha
https://x.com/midjourney/status/1908012961840672947
運營/排版:何晨龍
熱門跟貼