2分鐘玩轉(zhuǎn)HeyGen最新模型:一張照片+一句話,秒出AI分身!超逼真!
打開(kāi)網(wǎng)易新聞 查看更多視頻
2分鐘玩轉(zhuǎn)HeyGen最新模型:一張照片+一句話,秒出AI分身!超逼真!

編輯|Sia

咳咳, 你還能分辨出什么是真實(shí)的嗎?

 2分鐘玩轉(zhuǎn)HeyGen最新模型:一張照片+一句話,秒出AI分身!超逼真!
打開(kāi)網(wǎng)易新聞 查看更多視頻
2分鐘玩轉(zhuǎn)HeyGen最新模型:一張照片+一句話,秒出AI分身!超逼真!

不僅說(shuō)話,它們還可以唱歌。

仔細(xì)看她的嘴巴、臉頰和眼睛,甚至胸部的起伏,動(dòng)作細(xì)節(jié)非常到位,是不是足以以假亂真?

 2分鐘玩轉(zhuǎn)HeyGen最新模型:一張照片+一句話,秒出AI分身!超逼真!
打開(kāi)網(wǎng)易新聞 查看更多視頻
2分鐘玩轉(zhuǎn)HeyGen最新模型:一張照片+一句話,秒出AI分身!超逼真!

不止是做數(shù)字「人」,任何形象——寵物、外星人,你想象得到的,都能立刻動(dòng)起來(lái)。

 2分鐘玩轉(zhuǎn)HeyGen最新模型:一張照片+一句話,秒出AI分身!超逼真!
打開(kāi)網(wǎng)易新聞 查看更多視頻
2分鐘玩轉(zhuǎn)HeyGen最新模型:一張照片+一句話,秒出AI分身!超逼真!

 2分鐘玩轉(zhuǎn)HeyGen最新模型:一張照片+一句話,秒出AI分身!超逼真!
打開(kāi)網(wǎng)易新聞 查看更多視頻
2分鐘玩轉(zhuǎn)HeyGen最新模型:一張照片+一句話,秒出AI分身!超逼真!

這就是 HeyGen 剛剛發(fā)布的 Avatar IV 模型——只需一張照片、一段腳本、一段聲音,就能生成一個(gè)以假亂真的數(shù)字人,只需幾秒。

工具鏈接:https://app.heygen.com/home

Avatar IV 亮點(diǎn)可不少。

不止能處理正臉照,還支持側(cè)臉、半身、全身等多角度圖像輸入,生成的數(shù)字人更立體、更生動(dòng),自帶電影鏡頭感,不再是死盯鏡頭的 AI 面癱臉。

更厲害的是,它不僅能說(shuō),還能唱。嘴型精準(zhǔn)貼合音樂(lè)節(jié)奏,連眼神、頭部、身體(比如腹部)都會(huì)隨之起伏律動(dòng),細(xì)節(jié)拿捏到位。

核心升級(jí)來(lái)自一項(xiàng)新技術(shù):基于擴(kuò)散模型的音頻驅(qū)動(dòng)表情引擎。

簡(jiǎn)單理解,就是這套引擎能根據(jù)語(yǔ)音的節(jié)奏、語(yǔ)氣、情緒,自動(dòng)生成對(duì)應(yīng)的表情與動(dòng)作。它不是單純對(duì)口型,而是能「聽(tīng)懂」語(yǔ)義和情緒,做出停頓、點(diǎn)頭、語(yǔ)調(diào)起伏等細(xì)膩動(dòng)作,像個(gè)真正會(huì)說(shuō)話的人。

應(yīng)用場(chǎng)景也因此拓寬了不少:動(dòng)畫視頻制作、虛擬寵物擬人化、游戲角色配音、播客內(nèi)容可視化……統(tǒng)統(tǒng)都能用上。

訂閱用戶可上傳最長(zhǎng) 30 秒的語(yǔ)音或文本,生成動(dòng)態(tài)數(shù)字人視頻,做個(gè)廣告綽綽有余。

免費(fèi)用戶則有每月 3 次機(jī)會(huì),生成最長(zhǎng) 10 秒視頻。

好了,看看怎么玩兒。

第一步,訪問(wèn) HeyGen 官網(wǎng),選擇「照片轉(zhuǎn)視頻」最新模型——Avatar IV。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

上傳一張你想讓它開(kāi)口說(shuō)話的照片,接著輸入文字腳本+選擇聲音,或者直接上傳一段音頻。

我們上傳的是周星馳的劇照,配上哪吒的 Rap 打油詩(shī)音頻:

「天雷滾滾我好怕怕,劈得我渾身掉渣渣。突破天劫我笑哈哈,逆天改命我吹喇叭?!?/p>

注意:免費(fèi)用戶最多生成 10 秒視頻,別貪心,腳本或音頻太長(zhǎng)不會(huì)被系統(tǒng)支持。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

沒(méi)有現(xiàn)成音頻?沒(méi)關(guān)系。系統(tǒng)自帶多種聲音,還能克隆自己的聲音,甚至接入第三方 API。

不過(guò)也有些小遺憾——相比英文,系統(tǒng)的中文聲音資源還不算豐富。

你可以根據(jù)方言口音、聲音性別、年齡、情緒(比如憤怒、興奮、平靜)、使用場(chǎng)景等維度篩選。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

當(dāng)然,不是每個(gè)聲音都支持豐富的情緒表達(dá)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片
打開(kāi)網(wǎng)易新聞 查看精彩圖片

準(zhǔn)備就緒,點(diǎn)擊「Generate」,等待片刻,成品視頻立刻送達(dá)。

嘴型精準(zhǔn)匹配,眼神、頭部、身體微動(dòng)跟隨語(yǔ)音節(jié)奏,連喉結(jié)都跟著上下浮動(dòng),真實(shí)感拉滿。

 2分鐘玩轉(zhuǎn)HeyGen最新模型:一張照片+一句話,秒出AI分身!超逼真!
打開(kāi)網(wǎng)易新聞 查看更多視頻
2分鐘玩轉(zhuǎn)HeyGen最新模型:一張照片+一句話,秒出AI分身!超逼真!

接下來(lái)我們?cè)嚵藗€(gè)更大膽的操作:

上傳編輯部同事家邊牧的照片,讓它來(lái)一段全球爆火的《APT.》。

照片中邊牧正好伸著舌頭,導(dǎo)致數(shù)字人效果略顯出戲,但其他部分表現(xiàn)依然在線,尤其是腹部細(xì)節(jié),做得很到位。

 2分鐘玩轉(zhuǎn)HeyGen最新模型:一張照片+一句話,秒出AI分身!超逼真!
打開(kāi)網(wǎng)易新聞 查看更多視頻
2分鐘玩轉(zhuǎn)HeyGen最新模型:一張照片+一句話,秒出AI分身!超逼真!

蘇格蘭國(guó)立美術(shù)館用 X 光掃描梵高畫作《農(nóng)婦頭像》,意外發(fā)現(xiàn)畫布背后竟藏著一幅自畫像,層層膠水和硬紙板封印多年。

于是我們嘗試:讓勃魯蓋爾筆下的名畫《老婦人的肖像》播報(bào)這則新聞——一下子,吸睛指數(shù)拉滿。

 2分鐘玩轉(zhuǎn)HeyGen最新模型:一張照片+一句話,秒出AI分身!超逼真!
打開(kāi)網(wǎng)易新聞 查看更多視頻
2分鐘玩轉(zhuǎn)HeyGen最新模型:一張照片+一句話,秒出AI分身!超逼真!

那么,問(wèn)題來(lái)了——你想做個(gè)什么樣的數(shù)字人?還等什么,快去試試吧。

以后我們會(huì)帶來(lái)更多好玩有用的 AI 評(píng)測(cè),也歡迎大家進(jìn)群交流。

? THE END

轉(zhuǎn)載請(qǐng)聯(lián)系本公眾號(hào)獲得授權(quán)