文 | kiki

距離OpenAI發(fā)布Sora過去一年多,AI視頻賽道上演了一出「王座交替」的爽文故事。

在Sora發(fā)布后,AI視頻賽道玩家以對標(biāo)它為目標(biāo),流傳在社交媒體上的一張梗圖是這樣描繪的:坐在王座上的Sora看著眼前膜拜者——Runway、Pika、PixVerse等十余個競對。

圖源:網(wǎng)絡(luò)
打開網(wǎng)易新聞 查看精彩圖片
圖源:網(wǎng)絡(luò)

在不少AI論壇的現(xiàn)場,AI視頻玩家們談Sora的少了,談DeepSeek的多了,這背后是對AI視頻加速商業(yè)化和普及的一種期待。

似乎也是某種默契,進入2025年,不到半年時間里,AI視頻玩家紛紛發(fā)布最新的視頻生成模型和產(chǎn)品更新,AI視頻的戰(zhàn)火也越燒越旺。

從著力解決視頻生成的一致性和可控性再到降低產(chǎn)品門檻,增強可編輯能力,融入工作流,讓產(chǎn)品更好用,行業(yè)玩家也以一個月,甚至是半月一迭代加速AI視頻落地,但新的問題也逐漸擺在臺前。

有多位中腰部AIGC創(chuàng)業(yè)者向「硅基研究室」表達了自己的焦慮,從商用角度看,當(dāng)前AI視頻落地還存在諸多困難,商單報價在走低,抽卡不穩(wěn)定下,制作成本還是偏貴。

除此以外,就現(xiàn)有產(chǎn)品功能看,「硅基研究室」梳理發(fā)現(xiàn),多數(shù)AI視頻產(chǎn)品功能正趨于同質(zhì)化——除了創(chuàng)意特效外,大多數(shù)AI視頻產(chǎn)品都支持主體參考、音效生成、多模態(tài)編輯等,隨著功能的豐富、選擇的增多,也將賽道玩家間視頻生成的質(zhì)量、成本和交互形式等能力的競爭擺在了眼前。

這也意味著,即便不提Sora,國產(chǎn)AI視頻玩家的壓力也并沒有減輕。

一、不提Sora的AI視頻玩家,在卷什么?

一、不提Sora的AI視頻玩家,在卷什么?

比起此前對生成時長、模型參數(shù)的強調(diào),大半年來,不提Sora的AI視頻玩家將這場「軍備競賽」的重點放在了三個維度上——卷一致性、卷可用性、卷可玩性。

所謂的「一致性」指的是視頻生成過程中幀與幀之間的過渡性、動作的連續(xù)性和場景的真實性等。

由于視頻畫面往往包含了人物角色、道具、環(huán)境等不同元素,如何在生成過程中實現(xiàn)這些元素的交互,在連貫視頻內(nèi)保持一致性,這也是AI視頻玩家長期一直在解決的問題。

打開網(wǎng)易新聞 查看精彩圖片

而在卷「一致性」上,AI視頻玩家的動作也整齊劃一。

一方面是提升圖生視頻能力,比如增加首尾幀、筆刷工具和多圖參考等,讓用戶自定義視頻的開頭和結(jié)尾的同時,筆刷支持運動方向控制,模型可以根據(jù)用戶上傳的參考圖像提取人物、場景或風(fēng)格特征,從而保證生成內(nèi)容中的一致性。

在輸入端加強控制力,不止是卷首幀。包括Runway在內(nèi)的AI視頻玩家還在輸入端就打出多模態(tài)融合,比如視頻轉(zhuǎn)視頻、多圖混合生成等。

去年10月,Runway就推出了Act-One功能,用戶可以直接錄制一段視頻,將素材中對象的面部表情直接轉(zhuǎn)移到AI生成的角色上。

Runway在去年10月推出Act-One功能 圖源:官方
打開網(wǎng)易新聞 查看精彩圖片
Runway在去年10月推出Act-One功能 圖源:官方

快手自去年6月推出可靈大模型后,目前可靈大模型已迭代至2.0版本,字節(jié)低調(diào)上線Seaweed和PixelDance,Runway在今年4月推出Gen-4,同月生數(shù)科技也發(fā)布Vidu的Q1模型,頭部AI視頻玩家至少保持半年一次基座模型更新的節(jié)奏。

打開網(wǎng)易新聞 查看精彩圖片

而所謂的卷「可用性」則是完善創(chuàng)作者工作流相關(guān)配套工具。

AIGC從業(yè)者可可告訴「硅基研究室」,據(jù)她觀察,在「可用性」上,創(chuàng)作者主要關(guān)注三個核心問題:

一是動態(tài)編輯能力,可以圍繞視頻一次性生成的結(jié)果進行再調(diào)整;

二是鏡頭運動能力,包括大幅度運動、特色運動視角等等,這體現(xiàn)畫面表現(xiàn)力;

三是端到端能力,包括從分鏡、視頻生成、音效、剪輯到分發(fā)的一站式能力。

針對動態(tài)編輯,目前可靈等玩家支持多模態(tài)編輯,給視頻替換、添加或刪減元素,比如Pika推出的Pikawaps;而在端到端能力上,標(biāo)配的「音效生成」,即夢的「故事創(chuàng)作」模式可批量生成分鏡,Runway也上線了視頻編輯器。

除了一致性、可用性外,通過創(chuàng)意特效和模版卷「可玩性」則是不少玩家引流的關(guān)鍵手段。

吃到這波紅利的典型代表也有不少,比如靠著Pikaffects、Pikadditions走紅互聯(lián)網(wǎng)的Pika,靠著毒液效果走紅的PixVerse,還有承接GPT-4o吉卜力風(fēng)流量外溢的Vidu......

Pika近期推出的發(fā)型AI特效 圖源:Pika官方
打開網(wǎng)易新聞 查看精彩圖片
Pika近期推出的發(fā)型AI特效 圖源:Pika官方

除了創(chuàng)意特效外,大多數(shù)AI視頻產(chǎn)品都支持主體參考、音效生成、多模態(tài)編輯等,有業(yè)內(nèi)人士表示,這是正?,F(xiàn)象?!艾F(xiàn)在AI視頻的交互形式和產(chǎn)品形態(tài)各家都還在探索,互相抄作業(yè)和‘致敬’很正常。”

二、AI視頻難打「價格牌」

二、AI視頻難打「價格牌」

更多的工具、更豐富的功能,廠商打著「人人都是導(dǎo)演時代」的口號,但有AI視頻創(chuàng)作者卻覺得越來越焦慮了。

2024年抱著對AI視頻的好奇,可可開始嘗試AI視頻創(chuàng)作,就是「焦慮大軍」中的一員,從2024年下半年開始,她明顯感覺到AI視頻玩家加速迭代模型和產(chǎn)品,甚至是以周為單位。

但快速迭代下,像可可這樣的腰部創(chuàng)作者正在經(jīng)歷陣痛——降不下去的制作成本,被逐漸壓低的報價。

「硅基研究室」了解到,AI視頻多為定制化項目,一般按照視頻時長(每秒)或鏡頭數(shù)報價,一般三分多鐘的AI短片制作周期在1-2周,但可可提到,隨著客戶對AI視頻降本需求的增加,預(yù)算也在降低。

與之對應(yīng)的則是AI視頻工具堅挺的價格。以可靈2.0為例,目前2.0生成一條5秒鐘的視頻需要100靈感值,黃金會員月費58元可獲得660靈感值,能抽卡6次,一次生成約為10元。

可可提到,如果對畫質(zhì)要求低,單個鏡頭(一般1-5s)需要抽卡5次左右,這意味生成一個鏡頭就需要50元,如果涉及更復(fù)雜的場景和效果抽卡次數(shù)可能高達數(shù)十次,她曾經(jīng)單個鏡頭抽卡次數(shù)達40次,以此計算,單個鏡頭就需要400元,一個三分鐘的AI短片在不算人力成本下保守估計就要數(shù)萬元,和她此前的制作成本相比,是不劃算的。

較高的成本,這也是為什么有一批AIGC創(chuàng)作者并未使用新版本,而是繼續(xù)使用可靈1.6的原因所在。

有業(yè)內(nèi)人士也提到,此次可靈2.0主要針對是影視商用領(lǐng)域,并非是如可可此類的小B用戶。

據(jù)可靈此前發(fā)布的《AI影像創(chuàng)作者手冊》,中信證券測算其單部短劇(3.5分鐘)成本測算約為8100元,即便可靈2.0很貴,但與真人短劇制作成本相比,依舊能看得見降本的空間,但降本幅度在縮減。

打開網(wǎng)易新聞 查看精彩圖片

梳理主要AI視頻玩家的商業(yè)化方案,「硅基研究室」認(rèn)為,比起此前各大主流模型廠商掀起的「價格戰(zhàn)」,推動行業(yè)邁入「按厘計價」時代,視頻大模型的價格下降趨勢并不明顯。

C端目前采取的階梯付費訂閱模式,國內(nèi)對比國外玩家價格優(yōu)勢明顯,比如大打價格優(yōu)勢的Vidu甚至效仿DeepSeek上線了「錯峰模式」。但在最先進模型上,頭部廠商的定價并未松動,譬如可靈2.0生成一個5s視頻約為10元,而Runway Gen4則為8.6元。

反倒是在B端API上,國內(nèi)廠商的價格優(yōu)勢明顯高于國外廠商。

一位行業(yè)人士預(yù)測,短期內(nèi)視頻大模型的定價不會出現(xiàn)激烈的變化。

一方面,從現(xiàn)有產(chǎn)品層看,盡管目前開源視頻生成模型中也不乏如阿里通義萬相Wan2.1等玩家,但取得身位領(lǐng)先的依舊是閉源大模型。阿里萬相團隊在技術(shù)報告中也提到,目前視頻生成賽道,盡管開源模型與閉源商業(yè)模型間的差距在不斷縮小,但目前還存在性能不佳、能力有限、效率不足等問題,Sand.ai創(chuàng)始人曹越也提到,在視頻生成領(lǐng)域,技術(shù)路徑還尚未收斂。

另一方面,降價本質(zhì)上也是一種定價營銷策略,目的也是讓更多人將AI視頻用起來,但前提是產(chǎn)品形態(tài)和交互已經(jīng)ready,但現(xiàn)階段各大廠商還在探索產(chǎn)品形態(tài),不斷完善AI視頻生產(chǎn)環(huán)節(jié),如前文所說,去跨越生產(chǎn)和消費那道鴻溝。

三、「保證自己在牌桌上」

三、「保證自己在牌桌上」

和那些熱門的垂直領(lǐng)域一樣,AI視頻早已成為巨頭和創(chuàng)業(yè)公司下一個押注的沃土,擠滿了躍躍欲試的玩家。

據(jù)「硅基研究室」不完全統(tǒng)計,2025年開年,就有十余家AI視頻領(lǐng)域初創(chuàng)企業(yè)斬獲融資,既包括了像Runway這樣的明星獨角獸,也不乏Sand.ai等新玩家。

從所屬領(lǐng)域來看,既有「模型+產(chǎn)品」兩步走的通用型選手,也有聚焦在企業(yè)級市場、視頻編輯領(lǐng)域的垂直型選手。

打開網(wǎng)易新聞 查看精彩圖片

和曾經(jīng)熱鬧的「百模大戰(zhàn)」類似,AI視頻領(lǐng)域當(dāng)前呈現(xiàn)出巨頭和初創(chuàng)公司共同競逐的局面,但也有初創(chuàng)企業(yè)提前給出預(yù)判,比如Runway CEO就曾預(yù)言:「我認(rèn)為AI公司的時代已經(jīng)結(jié)束了?!?/strong>

但從現(xiàn)實來看,AI視頻的競逐還遠未到終局,初創(chuàng)公司需要做的是「保證自己在牌桌上」。

牌桌上的分化也已經(jīng)開始顯現(xiàn)。

一類大廠和初創(chuàng)企業(yè)選擇的是「模型+產(chǎn)品」兩步走,這之中又可以分為兩條路線——「AGI派」和「平臺派」。

海外如谷歌DeepMind和OpenAI是典型的前者??煽商岬?,在視頻生成模型上,DeepMind的Veo系列強于可控性,視頻生成質(zhì)量也更高,他們的方向更偏向于構(gòu)建通往AGI的世界模型,阿里通義則以開源加速構(gòu)建視頻模型的新生態(tài)。

而所謂的「平臺派」則是從一家AI視頻企業(yè)轉(zhuǎn)型為集合內(nèi)容和生產(chǎn)消費為一體的平臺型公司,比如Runway、可靈、即夢和海螺等。

另一類則偏向于產(chǎn)品驅(qū)動,快速迭代,比如聚焦在AI特效爆款迭代的Pika,以視頻編輯生產(chǎn)力出圈的OpusClip和Capsule等。AIGC藝術(shù)家海辛在播客「十字路口」也提到,現(xiàn)階段沒有一家能攻克AI視頻所有的方向,視頻的玩法太多了,這也給創(chuàng)業(yè)公司入局帶來了機會。

而從不少創(chuàng)作者的AI視頻實際體感來看,視頻創(chuàng)作的需求是復(fù)雜的,因此多平臺多產(chǎn)品的組合使用也是常態(tài),現(xiàn)階段沒有一家能大包大攬。

比如在可控性上,可可提到Runway、可靈、PixVerse和Luma的表現(xiàn)都不錯,能實現(xiàn)較為精細(xì)化的運鏡控制;從畫面表現(xiàn)力和視頻風(fēng)格來看,海螺、Pika、Luma強于二次元、動漫效果,Vidu、可靈在寫實風(fēng)格上輸出比較穩(wěn)定。

「我感覺大家都在摸著石頭過河」。Luma AI產(chǎn)品經(jīng)理Barkley曾在播客「十字路口」里這樣形容。多模態(tài)是上限很高,它的星辰大海也絕不止是視頻生成。從這一點來說,互相摸著過河的AI視頻玩家來說,2025年,依舊是繼續(xù)卷的一年。