国产亚洲欧美日韩精品一区二区三区,日本欧美网站在线观看,av人妻激情在线,亚洲欧美在线不卡,99久久99这里只有精品免费视频

文 | kiki

距離OpenAI發(fā)布Sora過去一年多，AI視頻賽道上演了一出「王座交替」的爽文故事。

在Sora發(fā)布后，AI視頻賽道玩家以對標(biāo)它為目標(biāo)，流傳在社交媒體上的一張梗圖是這樣描繪的：坐在王座上的Sora看著眼前膜拜者——Runway、Pika、PixVerse等十余個競對。

在不少AI論壇的現(xiàn)場，AI視頻玩家們談Sora的少了，談DeepSeek的多了，這背后是對AI視頻加速商業(yè)化和普及的一種期待。

似乎也是某種默契，進入2025年，不到半年時間里，AI視頻玩家紛紛發(fā)布最新的視頻生成模型和產(chǎn)品更新，AI視頻的戰(zhàn)火也越燒越旺。

從著力解決視頻生成的一致性和可控性再到降低產(chǎn)品門檻，增強可編輯能力，融入工作流，讓產(chǎn)品更好用，行業(yè)玩家也以一個月，甚至是半月一迭代加速AI視頻落地，但新的問題也逐漸擺在臺前。

有多位中腰部AIGC創(chuàng)業(yè)者向「硅基研究室」表達了自己的焦慮，從商用角度看，當(dāng)前AI視頻落地還存在諸多困難，商單報價在走低，抽卡不穩(wěn)定下，制作成本還是偏貴。

除此以外，就現(xiàn)有產(chǎn)品功能看，「硅基研究室」梳理發(fā)現(xiàn)，多數(shù)AI視頻產(chǎn)品功能正趨于同質(zhì)化——除了創(chuàng)意特效外，大多數(shù)AI視頻產(chǎn)品都支持主體參考、音效生成、多模態(tài)編輯等，隨著功能的豐富、選擇的增多，也將賽道玩家間視頻生成的質(zhì)量、成本和交互形式等能力的競爭擺在了眼前。

這也意味著，即便不提Sora，國產(chǎn)AI視頻玩家的壓力也并沒有減輕。

一、不提Sora的AI視頻玩家，在卷什么？

比起此前對生成時長、模型參數(shù)的強調(diào)，大半年來，不提Sora的AI視頻玩家將這場「軍備競賽」的重點放在了三個維度上——卷一致性、卷可用性、卷可玩性。

所謂的「一致性」指的是視頻生成過程中幀與幀之間的過渡性、動作的連續(xù)性和場景的真實性等。

由于視頻畫面往往包含了人物角色、道具、環(huán)境等不同元素，如何在生成過程中實現(xiàn)這些元素的交互，在連貫視頻內(nèi)保持一致性，這也是AI視頻玩家長期一直在解決的問題。

而在卷「一致性」上，AI視頻玩家的動作也整齊劃一。

一方面是提升圖生視頻能力，比如增加首尾幀、筆刷工具和多圖參考等，讓用戶自定義視頻的開頭和結(jié)尾的同時，筆刷支持運動方向控制，模型可以根據(jù)用戶上傳的參考圖像提取人物、場景或風(fēng)格特征，從而保證生成內(nèi)容中的一致性。

在輸入端加強控制力，不止是卷首幀。包括Runway在內(nèi)的AI視頻玩家還在輸入端就打出多模態(tài)融合，比如視頻轉(zhuǎn)視頻、多圖混合生成等。

去年10月，Runway就推出了Act-One功能，用戶可以直接錄制一段視頻，將素材中對象的面部表情直接轉(zhuǎn)移到AI生成的角色上。

快手自去年6月推出可靈大模型后，目前可靈大模型已迭代至2.0版本，字節(jié)低調(diào)上線Seaweed和PixelDance，Runway在今年4月推出Gen-4，同月生數(shù)科技也發(fā)布Vidu的Q1模型，頭部AI視頻玩家至少保持半年一次基座模型更新的節(jié)奏。

而所謂的卷「可用性」則是完善創(chuàng)作者工作流相關(guān)配套工具。

AIGC從業(yè)者可可告訴「硅基研究室」，據(jù)她觀察，在「可用性」上，創(chuàng)作者主要關(guān)注三個核心問題：

一是動態(tài)編輯能力，可以圍繞視頻一次性生成的結(jié)果進行再調(diào)整；

二是鏡頭運動能力，包括大幅度運動、特色運動視角等等，這體現(xiàn)畫面表現(xiàn)力；

三是端到端能力，包括從分鏡、視頻生成、音效、剪輯到分發(fā)的一站式能力。

針對動態(tài)編輯，目前可靈等玩家支持多模態(tài)編輯，給視頻替換、添加或刪減元素，比如Pika推出的Pikawaps；而在端到端能力上，標(biāo)配的「音效生成」，即夢的「故事創(chuàng)作」模式可批量生成分鏡，Runway也上線了視頻編輯器。

除了一致性、可用性外，通過創(chuàng)意特效和模版卷「可玩性」則是不少玩家引流的關(guān)鍵手段。

吃到這波紅利的典型代表也有不少，比如靠著Pikaffects、Pikadditions走紅互聯(lián)網(wǎng)的Pika，靠著毒液效果走紅的PixVerse，還有承接GPT-4o吉卜力風(fēng)流量外溢的Vidu......

除了創(chuàng)意特效外，大多數(shù)AI視頻產(chǎn)品都支持主體參考、音效生成、多模態(tài)編輯等，有業(yè)內(nèi)人士表示，這是正?，F(xiàn)象?！艾F(xiàn)在AI視頻的交互形式和產(chǎn)品形態(tài)各家都還在探索，互相抄作業(yè)和‘致敬’很正常。”

二、AI視頻難打「價格牌」

更多的工具、更豐富的功能，廠商打著「人人都是導(dǎo)演時代」的口號，但有AI視頻創(chuàng)作者卻覺得越來越焦慮了。

2024年抱著對AI視頻的好奇，可可開始嘗試AI視頻創(chuàng)作，就是「焦慮大軍」中的一員，從2024年下半年開始，她明顯感覺到AI視頻玩家加速迭代模型和產(chǎn)品，甚至是以周為單位。

但快速迭代下，像可可這樣的腰部創(chuàng)作者正在經(jīng)歷陣痛——降不下去的制作成本，被逐漸壓低的報價。

「硅基研究室」了解到，AI視頻多為定制化項目，一般按照視頻時長（每秒）或鏡頭數(shù)報價，一般三分多鐘的AI短片制作周期在1-2周，但可可提到，隨著客戶對AI視頻降本需求的增加，預(yù)算也在降低。

與之對應(yīng)的則是AI視頻工具堅挺的價格。以可靈2.0為例，目前2.0生成一條5秒鐘的視頻需要100靈感值，黃金會員月費58元可獲得660靈感值，能抽卡6次，一次生成約為10元。

可可提到，如果對畫質(zhì)要求低，單個鏡頭(一般1-5s）需要抽卡5次左右，這意味生成一個鏡頭就需要50元，如果涉及更復(fù)雜的場景和效果抽卡次數(shù)可能高達數(shù)十次，她曾經(jīng)單個鏡頭抽卡次數(shù)達40次，以此計算，單個鏡頭就需要400元，一個三分鐘的AI短片在不算人力成本下保守估計就要數(shù)萬元，和她此前的制作成本相比，是不劃算的。

較高的成本，這也是為什么有一批AIGC創(chuàng)作者并未使用新版本，而是繼續(xù)使用可靈1.6的原因所在。

有業(yè)內(nèi)人士也提到，此次可靈2.0主要針對是影視商用領(lǐng)域，并非是如可可此類的小B用戶。

據(jù)可靈此前發(fā)布的《AI影像創(chuàng)作者手冊》，中信證券測算其單部短劇（3.5分鐘）成本測算約為8100元，即便可靈2.0很貴，但與真人短劇制作成本相比，依舊能看得見降本的空間，但降本幅度在縮減。

梳理主要AI視頻玩家的商業(yè)化方案，「硅基研究室」認(rèn)為，比起此前各大主流模型廠商掀起的「價格戰(zhàn)」，推動行業(yè)邁入「按厘計價」時代，視頻大模型的價格下降趨勢并不明顯。

C端目前采取的階梯付費訂閱模式，國內(nèi)對比國外玩家價格優(yōu)勢明顯，比如大打價格優(yōu)勢的Vidu甚至效仿DeepSeek上線了「錯峰模式」。但在最先進模型上，頭部廠商的定價并未松動，譬如可靈2.0生成一個5s視頻約為10元，而Runway Gen4則為8.6元。

反倒是在B端API上，國內(nèi)廠商的價格優(yōu)勢明顯高于國外廠商。

一位行業(yè)人士預(yù)測，短期內(nèi)視頻大模型的定價不會出現(xiàn)激烈的變化。

一方面，從現(xiàn)有產(chǎn)品層看，盡管目前開源視頻生成模型中也不乏如阿里通義萬相Wan2.1等玩家，但取得身位領(lǐng)先的依舊是閉源大模型。阿里萬相團隊在技術(shù)報告中也提到，目前視頻生成賽道，盡管開源模型與閉源商業(yè)模型間的差距在不斷縮小，但目前還存在性能不佳、能力有限、效率不足等問題，Sand.ai創(chuàng)始人曹越也提到，在視頻生成領(lǐng)域，技術(shù)路徑還尚未收斂。

另一方面，降價本質(zhì)上也是一種定價營銷策略，目的也是讓更多人將AI視頻用起來，但前提是產(chǎn)品形態(tài)和交互已經(jīng)ready，但現(xiàn)階段各大廠商還在探索產(chǎn)品形態(tài)，不斷完善AI視頻生產(chǎn)環(huán)節(jié)，如前文所說，去跨越生產(chǎn)和消費那道鴻溝。

三、「保證自己在牌桌上」

和那些熱門的垂直領(lǐng)域一樣，AI視頻早已成為巨頭和創(chuàng)業(yè)公司下一個押注的沃土，擠滿了躍躍欲試的玩家。

據(jù)「硅基研究室」不完全統(tǒng)計，2025年開年，就有十余家AI視頻領(lǐng)域初創(chuàng)企業(yè)斬獲融資，既包括了像Runway這樣的明星獨角獸，也不乏Sand.ai等新玩家。

從所屬領(lǐng)域來看，既有「模型+產(chǎn)品」兩步走的通用型選手，也有聚焦在企業(yè)級市場、視頻編輯領(lǐng)域的垂直型選手。

和曾經(jīng)熱鬧的「百模大戰(zhàn)」類似，AI視頻領(lǐng)域當(dāng)前呈現(xiàn)出巨頭和初創(chuàng)公司共同競逐的局面，但也有初創(chuàng)企業(yè)提前給出預(yù)判，比如Runway CEO就曾預(yù)言：「我認(rèn)為AI公司的時代已經(jīng)結(jié)束了?！?/strong>

但從現(xiàn)實來看，AI視頻的競逐還遠未到終局，初創(chuàng)公司需要做的是「保證自己在牌桌上」。

牌桌上的分化也已經(jīng)開始顯現(xiàn)。

一類大廠和初創(chuàng)企業(yè)選擇的是「模型+產(chǎn)品」兩步走，這之中又可以分為兩條路線——「AGI派」和「平臺派」。

海外如谷歌DeepMind和OpenAI是典型的前者?？煽商岬?，在視頻生成模型上，DeepMind的Veo系列強于可控性，視頻生成質(zhì)量也更高，他們的方向更偏向于構(gòu)建通往AGI的世界模型，阿里通義則以開源加速構(gòu)建視頻模型的新生態(tài)。

而所謂的「平臺派」則是從一家AI視頻企業(yè)轉(zhuǎn)型為集合內(nèi)容和生產(chǎn)消費為一體的平臺型公司，比如Runway、可靈、即夢和海螺等。

另一類則偏向于產(chǎn)品驅(qū)動，快速迭代，比如聚焦在AI特效爆款迭代的Pika，以視頻編輯生產(chǎn)力出圈的OpusClip和Capsule等。AIGC藝術(shù)家海辛在播客「十字路口」也提到，現(xiàn)階段沒有一家能攻克AI視頻所有的方向，視頻的玩法太多了，這也給創(chuàng)業(yè)公司入局帶來了機會。

而從不少創(chuàng)作者的AI視頻實際體感來看，視頻創(chuàng)作的需求是復(fù)雜的，因此多平臺多產(chǎn)品的組合使用也是常態(tài)，現(xiàn)階段沒有一家能大包大攬。

比如在可控性上，可可提到Runway、可靈、PixVerse和Luma的表現(xiàn)都不錯，能實現(xiàn)較為精細(xì)化的運鏡控制；從畫面表現(xiàn)力和視頻風(fēng)格來看，海螺、Pika、Luma強于二次元、動漫效果，Vidu、可靈在寫實風(fēng)格上輸出比較穩(wěn)定。

「我感覺大家都在摸著石頭過河」。Luma AI產(chǎn)品經(jīng)理Barkley曾在播客「十字路口」里這樣形容。多模態(tài)是上限很高，它的星辰大海也絕不止是視頻生成。從這一點來說，互相摸著過河的AI視頻玩家來說，2025年，依舊是繼續(xù)卷的一年。