文 | kiki
2024年3月,數(shù)字人服務(wù)商阿杰清晰記得在公司舉辦的一場分享會上,不大的會議室里擠滿了焦慮的老板們。焦慮被包含在具體的問題里——“無人直播是不是就是錄播?”“創(chuàng)始人IP怎么變現(xiàn)?”“矩陣批量直播怎么干?”
最高峰時,他記得自己一天接到十幾個咨詢,接待過四五波實地考察的客戶,最終成交的訂單也很可觀,那是大模型的應(yīng)用熱下AI數(shù)字人作為「淘金地」的一個縮影,流傳在圈里的GMV神話繼續(xù)放大行業(yè)的樂觀,有人形容這是數(shù)字人的「印鈔機年代」。
從行業(yè)看去,2024年也是數(shù)字人借大模型「重生」的關(guān)鍵之年,多家數(shù)字人廠商收獲新一輪融資、數(shù)字人代理江湖進入新一輪擴張,騰訊、百度、京東以及諸多大模型明星企業(yè)均將數(shù)字人視為大模型落地的前哨站......
隨手打開社交媒體應(yīng)用,深夜數(shù)字人直播間和短視頻內(nèi)容并不鮮見,但一年過去,這場數(shù)字人熱潮也正在經(jīng)歷看得見的洗牌和變化。
1、從能用到有用,無法全能的數(shù)字人
在數(shù)字人服務(wù)商阿杰眼中,和去年的狂熱不同,今年前來咨詢的客戶明顯是「有備而來」。有的對比過多家平臺的價格,甚至已經(jīng)踩過不少坑,一上來就會直接比價,問核心系統(tǒng),有的則是對自身的業(yè)務(wù)場景和目的十分明確:“甚至都不會問我要落地用例,直接問ROI,要結(jié)果?!?/p>
理解這種態(tài)度的變化,2D數(shù)字人直播就是一個觀察窗口。
國內(nèi)某服裝品牌直播負責人可心告訴「硅基研究室」,他們在2021年就接觸到數(shù)字人直播,但效果一直不溫不火,原因一方面是流量問題。平臺的流量規(guī)則不斷在變,企業(yè)往往希望公私域聯(lián)動,爭取更大的流量規(guī)模和更優(yōu)的流量利用率,但抖音、微信、快手等平臺對AI數(shù)字人直播較為謹慎,數(shù)字人很難在公域流量池直接露出,平臺也沒有流量扶持。

盡管大模型一定程度上緩解了上述問題,但數(shù)字人從能用到真正好用,并非一蹴而就:“這是一個逐步滿足的過程,而不是一次性滿足?!?/strong>
首先,從技術(shù)層來看,一位大廠技術(shù)負責人提到,2D數(shù)字人和大模型結(jié)合經(jīng)歷了「單人模型-通用大模型」階段。在單人模型階段,訓(xùn)練一個單人大模型需要經(jīng)歷建模、驅(qū)動和渲染等環(huán)節(jié),但由于服務(wù)的是單個具體商家,參數(shù)量不大,對數(shù)據(jù)依賴也沒那么高,但核心需要提升的是模型的魯棒性和數(shù)字人的交互能力,如大姿態(tài)、聲唇同步等,這些都需要算法和模型架構(gòu)的調(diào)優(yōu)和升級。
在通用大模型階段,特別是多模態(tài)模型的發(fā)展,得益于大模型自身的泛化能力,圖片、視頻和語音數(shù)據(jù)的多樣性,目前在部分場景下2D數(shù)字人可實現(xiàn)一體化生成,縮短了制造和生產(chǎn)周期。而年初隨著DeepSeek拉動低成本推理模型下沉,也加速了數(shù)字人能力的迭代,譬如在直播間的智能回復(fù)上。
而當這些技術(shù)的迭代升級落到商家的具體業(yè)務(wù)端,數(shù)字人廠商和商家場景也有一個磨合的階段??尚奶岬?,盡管從數(shù)字人形象、直播間場景設(shè)置到最終測試上線,比起此前的數(shù)月周期,現(xiàn)在可以不到3天就看到Demo,一個月就用上數(shù)字人,但無論是平臺形象庫的豐富度,還是數(shù)字人的智能回復(fù)水平,前后用了一年的時間才達到他們的預(yù)期水平。
其次,從實際場景來看,更多的企業(yè)也意識到,由于數(shù)字人應(yīng)用還在早期,數(shù)字人無法替代人,最多的還是起到引流和降本的作用。譬如在直播場景,目前企業(yè)應(yīng)用數(shù)字人一般有三類打法:
?一是創(chuàng)新直播樣態(tài),創(chuàng)新業(yè)務(wù)。比如總裁IP、雙數(shù)字人直播等,給頭部品牌的店播增加新玩法,起到創(chuàng)新業(yè)務(wù)和引流獲客的作用。
?二是矩陣直播,作為閑時補充。此類數(shù)字人直播和真人主播協(xié)同,滿足用戶全時段購物需求。
?三是強運營模式,量大管飽。一些中小企業(yè)會和數(shù)字人源碼廠商合作,利用矩陣直播和私域裂變,但這需要非常強的直播操盤能力(包括選品、供應(yīng)鏈、運營等),還需要熟悉和了解平臺規(guī)則。
可心提到,目前數(shù)字人只是起到協(xié)同和降本作用,帶來最直觀的影響是——他們?nèi)∠撕筒糠旨媛氈鞑サ暮献?,未來是否要大力布局,還需要看技術(shù)的成熟度和數(shù)字人帶貨的實際效果。
2、為了降低成本和應(yīng)用門檻,三線并進
企業(yè)端對數(shù)字人的態(tài)度走向務(wù)實,頭部數(shù)字人廠商甚至更早一點就給市場潑起了「冷水」。
專注在3D虛擬數(shù)字人領(lǐng)域的中科深智創(chuàng)始人成維忠在2023年就直言:“有的企業(yè)半年沒接到單,很正常?!惫杌悄軇?chuàng)始人司馬華鵬也曾提到:“真人直播做不好,數(shù)字人也沒戲?!彼J為,僅在數(shù)字人直播領(lǐng)域,和科技、運營、供應(yīng)鏈、IP、賬號體系多方面相關(guān)。
驅(qū)動數(shù)字人廠商這種理性態(tài)度的根本原因在于——行業(yè)正在通過降價、技術(shù)開源和產(chǎn)品組合化「三線并進」,大力降低數(shù)字人應(yīng)用的門檻。
在價格上,阿杰告訴「硅基研究室」,從去年開始,數(shù)字人行業(yè)的價格競爭就很激烈,有的號稱賣源碼的甚至都把價格卷到了幾千元,“幾乎是白菜價”。

從定價模式來看,各大廠商大多采用組合定價——包括定制服務(wù)、付費訂閱、平臺代運營等多種模式,來滿足不同用戶的需求,還有的是直接源碼買斷,但需要辨別技術(shù)真?zhèn)巍?/p>
「硅基研究室」從多位數(shù)字人源碼廠商推廣人員了解到,源碼獨立部署的報價在幾千到幾萬不等,但「具體可以再談」,一些廠商甚至直接打出了「被封就退款」的賣點,但阿杰提到,源碼廠商目前魚龍混雜,單看價格看不出技術(shù)水平:“你不知道它是自研,還是套殼?!?/p>
他記得自己的一個客戶就被源碼廠商的套路坑過,花了幾萬買斷源碼,部署了幾臺服務(wù)器,折騰幾個月產(chǎn)品上線后,發(fā)現(xiàn)根本用不起來。
降價之外,從去年下半年開始,數(shù)字人廠商也在掀起「開源熱」。
比如硅基智能在近期開源數(shù)字人模型 heygem.ai,阿里達摩院推出的 EchoMimic V2,專注在數(shù)字人半身動畫視頻生成;騰訊與浙大聯(lián)合開源的 Sonic ,京東開源的普通話數(shù)字人項目JoyHallo、字節(jié)跳動推出的端到端唇形同步框架Latentsync等等,都在加速數(shù)字人技術(shù)的普及。

而在部分業(yè)內(nèi)人士眼中,數(shù)字人更明顯的一層變化還在于從項目制轉(zhuǎn)向產(chǎn)品制。
上述大廠技術(shù)負責人提到,過去數(shù)字人訂單主要集中在G端,例如政務(wù)領(lǐng)域線下的數(shù)字人大屏等,現(xiàn)在隨著數(shù)字人的普及,各大廠商會細化解決方案,特別是大廠會提供標準化的產(chǎn)品解決方案和豐富的數(shù)字人組件商店,提高整體標品的交付能力。
除此以外,售賣數(shù)字人一體化的軟硬件設(shè)備也成了一些廠商的標配,如AI虛擬人直播機、智能交互機等,核心都是為了提升數(shù)字人的易用性。
3、多變的競爭格局,從合縱連橫到各尋出路
「股神」巴菲特曾告誡投資者:“要到魚多人少的地方釣魚。”
但在數(shù)字人領(lǐng)域,「魚多人多」已是行業(yè)的某種共識,一眼望去,擠滿了焦慮的行業(yè)玩家。
數(shù)字人賽道的行業(yè)玩家目前可以分為三類:大廠派、垂直派和AI派。
大廠派,如騰訊智影、百度的曦靈平臺、京東的言犀、商湯的如影,華為云的MetaStudio數(shù)字人生產(chǎn)平臺等,大廠瞄準數(shù)字人的意圖不僅在可落地的應(yīng)用場景,還在于搶奪入口價值。
有從業(yè)人士告訴「硅基研究室」,所謂的入口價值一方面在前端,數(shù)字人可以接入各類AI硬件;另一方面,數(shù)字人作為組件可以串聯(lián)起大廠的底層云端算力、大模型MaaS服務(wù)和AIGC產(chǎn)品。
而垂直派如硅基智能、風(fēng)平智能、小冰、魔琺科技、出門問問、中科深智、配撥精靈等,各自的技術(shù)路徑和商業(yè)化戰(zhàn)略也不盡相同。
硅基智能、風(fēng)平智能等數(shù)字人企業(yè)由于進入數(shù)字人領(lǐng)域較早,產(chǎn)品矩陣和渠道資源是其主要優(yōu)勢,而聚焦在3D數(shù)字人領(lǐng)域的魔琺科技則有較強的高質(zhì)量3D數(shù)據(jù)沉淀,這些垂直派雖直面大廠的競爭,但也表現(xiàn)出了較強的競爭力。
還有的則是AI派,主要是指一批大模型明星創(chuàng)企,如零一萬物、階躍星辰、智譜AI等,等隨著商業(yè)化加速,數(shù)字人也在它們的「射程」之內(nèi)。
不同行業(yè)玩家并非是絕對的競爭關(guān)系,考慮到算力、場景和生態(tài)等因素,多方合縱連橫一直在發(fā)生。
比如,在跨境出海上,考慮到出海的算力穩(wěn)定性,特看科技就和阿里云合作;在醫(yī)療領(lǐng)域,硅基智能就和華為云合作布局了盤古AI醫(yī)學(xué)大屏,醫(yī)療作為華為的強勢場景,數(shù)字人廠商和云廠商間的合作布局還會越來越多。
可以確定的是,數(shù)字人的競爭會在2025更加激烈。「硅基研究室」了解到,包括京東在內(nèi)的大廠會繼續(xù)加碼數(shù)字人布局,而隨著數(shù)字人生成的數(shù)量和質(zhì)量繼續(xù)提升、價格的下探和玩法的增多,行業(yè)必定迎來新的洗牌期。
“只賣SaaS,單賣接口的,沒有技術(shù)壁壘的,未來生意會越來越難做”。阿杰已提前感受到了一些「涼意」,他身邊的數(shù)字人從業(yè)者有的想借做代理,再掙一波快錢,有的也在考慮轉(zhuǎn)行,因為競爭越來越激烈。
天眼查數(shù)據(jù)顯示,截至2024年,中國與數(shù)字人相關(guān)的企業(yè)數(shù)量已達114.4萬家,僅2024年前五個月就新增注冊企業(yè)17.4萬余家。
誠然,距離千行百業(yè)落地數(shù)字人還待時間驗證,但隨著數(shù)字人告別「印鈔機」年代,行業(yè)或迎來新拐點,一場新的洗牌又開始了。
*封面圖《銀翼殺手2049》
熱門跟貼