豆包前段時(shí)間新的圖片模型的實(shí)力大家應(yīng)該也看到了。
強(qiáng)大的提示詞理解加上字體和營(yíng)銷圖片生成能力直接讓人人都能生成自己需要的營(yíng)銷圖片或者進(jìn)行字體設(shè)計(jì)。
就在前天豆包又更新了超能創(chuàng)意 1.0 模式,我被灰度到了試了一下,給我整麻了。
圖片的生成效率和修改效率大幅提升,讓本來(lái)就很低的設(shè)計(jì)門檻又低了一大截。
我們可以先看個(gè)例子再介紹
我輸入的提示詞為:
參考下面的提示詞幫我生成十個(gè)其他知名品牌的膠囊 16:9 圖片,先基于品牌和主營(yíng)業(yè)務(wù)更改提示詞中的內(nèi)容然后在生成。
示例提示詞為:一個(gè)高高的、外觀逼真且充滿活力的膠囊體水平漂浮著。它的左半邊是標(biāo)志性的星巴克綠色,標(biāo)有“Starbucks – Uplifting the Everyday”字樣以及經(jīng)典的美人魚(Siren)標(biāo)志。右半邊是透明的,里面填充著漂浮的烘焙咖啡豆、細(xì)膩的奶泡漩渦、手繪咖啡杯圖標(biāo)以及代表社區(qū)連接的抽象暖色調(diào)線條,需要有背景色。
來(lái)看看他給我的結(jié)果,我根本沒提要哪些品牌,也沒提這些品牌的主營(yíng)業(yè)務(wù)和典型產(chǎn)品。
他直接從LLM 模型拿到了這些知識(shí)然后還按照要求改了提示詞,太離譜了,而且這十張圖片的生成速度比 4o 一張都要快很多。


我測(cè)試完總結(jié)了一下這次的升級(jí)主要是三個(gè)部分:
- 智能增強(qiáng):圖像模型可以使用 LLM 的智能,提示詞可以不用寫的很細(xì),一些知識(shí)模型自己知道;
- 上下文理解:你可以連續(xù)對(duì)生成的圖片進(jìn)行修改和調(diào)整;
- 批量生成:支持批量生成不同的圖片,比如不同比例相同提示詞的或者相同提示詞不同比例的圖片。
批量生成
我們先來(lái)看一下批量生成能力,支持不同內(nèi)容和比例的批量生成,對(duì)提示詞的理解和響應(yīng)都非常好,而且速度非常的快。
你可以讓他針對(duì)同一個(gè)設(shè)計(jì)生成不同比例的社交媒體圖片,也可以基于同一個(gè)內(nèi)容給你不同的風(fēng)格圖片,甚至同一種風(fēng)格給你不同的內(nèi)容圖片供你挑選,老板說(shuō)再來(lái)一版?沒關(guān)系,給他一百版!
參考這張商品照的拍攝風(fēng)格,為我生成10張其他化妝品的商品照


這個(gè)案例更是離譜,之前 3.0 圖片模型剛出來(lái)的時(shí)候藏師傅就發(fā)現(xiàn)可以他可以做字體設(shè)計(jì),現(xiàn)在我直接給他十個(gè)字體設(shè)計(jì)風(fēng)格提示詞,他就能一次性全部生成,而且提示詞遵循都是正確的。
幫我將“幻光潮流”分別按照下面這十個(gè)字體風(fēng)格生成字體海報(bào),比例為 16:9:
字體仿若流動(dòng)汞金屬,鏡面高光隨曲面滑動(dòng),筆畫邊緣柔和融化,冷峻未來(lái)感,深灰漸變背景
8-bit 像素塊拼接筆畫,CRT 掃描線與微弱 RGB 偏移,故障閃爍,霓虹紫藍(lán)撞色,街機(jī)復(fù)古
發(fā)光描邊被數(shù)字噪聲切割,RGB 錯(cuò)位色散,垂直斷層,黑底電光粉藍(lán),對(duì)比強(qiáng)烈酸性
手撕牛皮紙纖維邊緣,層疊拼貼出筆畫,輕微投影,暖灰背景,手作溫度感
筆畫呈砂巖凹凸紋理,邊緣風(fēng)蝕破碎,暖赭石漸變,營(yíng)造曠野與滄桑
半透明水彩邊界暈開,色塊相互滲透,筆畫毛邊自然,柔霧留白,治愈系
半透明水彩邊界暈開,色塊相互滲透,筆畫毛邊自然,柔霧留白,治愈系
粗糙木紋刻刀痕,深淺不均油墨,復(fù)古版畫質(zhì)感,米色粗紙底,文藝懷舊
亞光塑料質(zhì)地,鮮艷高飽和撞色,筆畫圓潤(rùn)泡泡感,卡扣接縫細(xì)節(jié),童趣潮玩
毛玻璃半透字體,柔和冷光從背后透出,邊緣軟化,營(yíng)造朦朧靜謐氛圍


UI 設(shè)計(jì)插畫荒?也沒問(wèn)題,直接基于一個(gè)已有的圖片風(fēng)格生成一堆其他不同狀態(tài)的插圖,而且都跟主題相關(guān)。
根據(jù)圖片線稿,生成 12 張同風(fēng)格空狀態(tài)插圖:加載失敗、無(wú)搜索結(jié)果、網(wǎng)絡(luò)中斷… 背景統(tǒng)一留白。



智能增強(qiáng)
之前 3.0 圖像模型相較于 4o 最大的問(wèn)題是你的提示詞需要寫的很細(xì),模型不會(huì)聯(lián)想和獲取知識(shí),這次超能創(chuàng)意更新之后這不再是問(wèn)題。
你可以給他一個(gè)案例讓他自己發(fā)散其他的案例,而且一些常識(shí)性內(nèi)容你不需要說(shuō)他也知道,看幾個(gè)例子。
這里我就舉了三個(gè)例子,沒說(shuō)其他的樣機(jī)長(zhǎng)啥樣,他自己根據(jù)這三個(gè)例子腦補(bǔ)了其他的樣機(jī),而且還都不錯(cuò)。
將下方 LOGO 放在 8 張不同介質(zhì)(霓虹燈牌、熱壓皮標(biāo)、燙金貼紙…)的質(zhì)感 Mockup(樣機(jī))上面,比例都用 1:1。

下面這個(gè)例子里面,我讓他生成類似風(fēng)格的其他地標(biāo)的圖片,他自己腦補(bǔ)了這些地標(biāo)和周圍應(yīng)該有個(gè)景色替換了提示詞內(nèi)容之后生成(提示詞和圖片是在即夢(mèng)找到圖片有原作者水?。?。
模仿這個(gè)圖像的風(fēng)格幫我生成 8 個(gè)世界其他著名景點(diǎn)的插畫,這個(gè)圖片的原始提示詞為:藝術(shù)家Yeoniu Choi風(fēng)格,簡(jiǎn)筆畫,卡通,粗線條勾勒,手繪插畫,夏天,海邊,旅游路上,治愈,治愈系畫風(fēng)格,簡(jiǎn)潔,干凈,顏色低飽和度,豐富細(xì)節(jié),背景干凈,大師構(gòu)圖,假日,白色背景,水彩畫,水彩,圣托里尼,馬克筆,在白紙上的小插畫,無(wú)明顯邊界,氛圍感,白色留白邊


除了剛開頭那個(gè)例子,這個(gè)例子也很離譜,我找了個(gè)生成 Q 版微縮星巴克店面的提示詞,讓他基于這個(gè)提示詞生成四個(gè)國(guó)內(nèi)其他茶飲品牌的門店設(shè)計(jì)。
他自己找到了四個(gè)國(guó)內(nèi)的茶飲品牌,然后根據(jù)這四個(gè)品牌的特點(diǎn)修改了提示詞生成了新的圖片。
基于下面這個(gè)星巴克的創(chuàng)意門店圖片提示詞,幫我生成四個(gè)其他國(guó)內(nèi)茶飲或者咖啡品牌的圖片,先替換提示詞中的對(duì)應(yīng)內(nèi)容然后再生成
一家3D Q版迷你星巴克門店,屋頂上矗立著巨型綠色美人魚標(biāo)志雕塑。建筑采用溫馨的苔蘚綠配色,搭配奶油白邊框,正面裝飾著經(jīng)典的星巴克白綠相間字母標(biāo)識(shí)。透過(guò)寬敞的玻璃立面,溫暖的琥珀色燈光映照出內(nèi)部原木色調(diào)的桌椅與舒適扶手椅。微型盆栽植物與垂掛燈飾共同營(yíng)造出溫馨的咖啡館氛圍。




上下文理解
最后一個(gè)能力是上下文理解,現(xiàn)在豆包的圖片生成可以記住上次的東西基于上一張生成的結(jié)果進(jìn)行修改,也可以跟豆包一起探索和碰撞新的創(chuàng)意。
最強(qiáng)的使用場(chǎng)景是直接從小說(shuō)內(nèi)容轉(zhuǎn)換分鏡圖片,甚至不需要說(shuō)任何提示詞只需要提供內(nèi)容就行,這個(gè)太強(qiáng)了。
可以看到下面幾個(gè)連續(xù)的分鏡人物的穿著和形象都是可以保持一致的。
幫我基于下面我自己寫的小說(shuō)序章生成分鏡腳本后批量生成 CG 動(dòng)畫的分鏡圖片,文章內(nèi)容為:XXXX


然后我先讓他基于我的需求設(shè)計(jì)了一個(gè)叫星塵貓的 IP 形象。

之后就基于這個(gè)原有的形象開始進(jìn)行發(fā)散和個(gè)性化,先是變成蒸汽朋克探險(xiǎn)家,然后變成唐朝公子,之后變成冰雪魔法師。他都能在保持原有設(shè)計(jì)的基礎(chǔ)上加上對(duì)應(yīng)的組件和裝飾。



具有上下文的另一個(gè)好處是他自己進(jìn)行內(nèi)容規(guī)劃之后生成,比如這里我這里讓他生成一個(gè) 30 秒 12 個(gè)分鏡的洗發(fā)水廣告腳本圖片。
他自己開始一個(gè)分鏡一個(gè)分鏡的規(guī)劃對(duì)應(yīng)的畫面文案然后生成對(duì)應(yīng)的圖片,而且和上一次的人物穿著場(chǎng)景都是一致的。
之后我又讓他將剛才的寫實(shí)圖片變成日式賽璐璐風(fēng)格的動(dòng)漫分鏡,可以看到人物的動(dòng)作、環(huán)境、產(chǎn)品依然可以保持一致這個(gè)太牛了。


好了這次的體驗(yàn)和測(cè)試就是這些,希望能夠?qū)δ阌行﹩l(fā)。
每當(dāng)看到技術(shù)突破既有邊界,總會(huì)讓人想起Arthur C. Clarke的名言:"任何足夠先進(jìn)的技術(shù)都與魔法無(wú)異。"
豆包超能創(chuàng)意1.0所展現(xiàn)的,正是這種既震撼又讓人恍然大悟的魔法時(shí)刻——我們想要的不僅僅是工具能聽懂我們說(shuō)什么,更是能理解我們沒說(shuō)出口的東西。
如果覺的有收獲的話可以幫我點(diǎn)個(gè)或者喜歡,也可以推薦給你有需要的朋友。
熱門跟貼