4月15日,快手旗下的可靈AI宣布基座模型再次升級,正式發(fā)布可靈2.0視頻生成模型及可圖2.0圖像生成模型。
快手高級副總裁、社區(qū)科學(xué)線負(fù)責(zé)人蓋坤在可靈2.0模型發(fā)布會上介紹,可靈2.0大師版在語義響應(yīng)、動態(tài)質(zhì)量、畫面美學(xué)等方面顯著提升生成效果。可靈2.0大師版全面升級視頻及圖像創(chuàng)作可控生成與編輯能力,上線全新的多模態(tài)視頻編輯功能,能靈活理解用戶意圖,支持對視頻內(nèi)容實現(xiàn)增、刪、改。

可靈AI2.0到底有多“靈”?我們一起來一探究竟!
語義響應(yīng)能力顯著提升
可靈2.0在語義響應(yīng)方面取得了顯著進(jìn)步。其能夠更精準(zhǔn)地理解用戶輸入的文本指令,并生成與之高度匹配的視頻或圖像內(nèi)容。這意味著,用戶可以通過更自然、更復(fù)雜的語言描述來指導(dǎo)AI創(chuàng)作,從而獲得更符合預(yù)期的作品。
例如,用戶可以詳細(xì)描述一個場景的氛圍、角色的動作和情感,可靈2.0能夠準(zhǔn)確地將這些元素融入生成的內(nèi)容中。
“男人先是開心地笑著,突然變得憤怒,手錘桌子起身?!?br/>動態(tài)質(zhì)量優(yōu)化
打開網(wǎng)易新聞 查看精彩圖片
在動態(tài)質(zhì)量方面,可靈2.0實現(xiàn)了質(zhì)的飛躍。其生成的視頻在運動流暢性、時序連貫性和運鏡效果上都有了顯著提升。無論是復(fù)雜的動作場景還是細(xì)膩的情感表達(dá),可靈2.0都能以更自然、更逼真的方式呈現(xiàn)。
“恐龍朝著鏡頭沖過來,運動模糊,鏡頭抖動?!?br/>畫面質(zhì)感升級
打開網(wǎng)易新聞 查看精彩圖片
可靈2.0在畫面質(zhì)感上也進(jìn)行了全面優(yōu)化。其生成的圖像和視頻在色彩、光影效果和細(xì)節(jié)表現(xiàn)上更加出色??蓤D2.0圖像生成模型在指令遵循、電影質(zhì)感及藝術(shù)風(fēng)格表現(xiàn)等方面也顯著提升,能夠生成具有電影級質(zhì)感的圖像。
“女孩從靜坐在公園長椅上,到慢慢走出畫面,晨光逐漸轉(zhuǎn)為正午烈日再過渡至暮色,天空色彩從粉橙漸變?yōu)檎克{(lán)再轉(zhuǎn)為紫紅,來往行人形成流動的虛影軌跡固定鏡頭,突出光影在長椅木紋上的緩慢爬行,飄落的樹葉在長椅下堆積又隨風(fēng)卷起?!?br/>
打開網(wǎng)易新聞 查看精彩圖片
據(jù)了解,當(dāng)前視頻生成主要分文生視頻和圖生視頻兩種,快手副總裁、可靈AI負(fù)責(zé)人張迪就披露,85%的視頻創(chuàng)作通過圖生視頻完成。

而在蓋坤的演示中,通過MVL方式,用戶能夠結(jié)合圖像參考、視頻片段等多模態(tài)信息,將腦海中的多維度復(fù)雜創(chuàng)意傳達(dá)給AI,而不僅僅是文字的提示語句。

“一個吟游貓詩人,在酒館中,唱著屬于自己的故事,而且,彈吉他的手,還會按和弦?!?/p>
“一個看著專業(yè)但是卻是菜雞的跳水?!?/p>
“女孩剛進(jìn)行完一場演出,向大家,誠懇的鞠了一躬?!?/p>
“第一視角,在開車,是真實的開車?!?/p>
“輕聲哭泣的外星人?!?/p>
有網(wǎng)友評論稱:
“看完可靈2.0發(fā)布會,我身邊形成了激進(jìn)派和保守派,激進(jìn)派覺得可靈2.0已經(jīng)是世界領(lǐng)先了,保守派覺得激進(jìn)派太保守了……”

“可靈的使用感至少是top3?!?br/>

“這甚至比導(dǎo)演拍得還好?!?br/>

“可靈生成視頻的功能可靈了”

“AI進(jìn)步太快了?!?br/>
還有X上的網(wǎng)友稱,“可以拿來做短劇了?!?br/>

熱門跟貼