
鏡頭里,不同國籍、不同膚色的外國美女們集體操著一口流利的中文侃侃而談,她們有的能默背論語,有的喊著要做中國好媳婦。
此話一出,可是把每一個路過的大爺大媽哄得心頭一熱。于是,中國人樸素的熱情和好客,溫暖了每一條視頻的評論區(qū)。

不過,但凡是沖過浪、稍微有點辨別能力的差友們,應(yīng)該都覺得這玩意一眼假。
因為這些數(shù)字人很好辨認(rèn),雙目無神、口型難對、肢體僵硬,再加上中文流利得異常,基本可以鑒定為 100% AI 生成,人含量為 0。
但最近,世超卻發(fā)現(xiàn)這幫數(shù)字人好像超進化了。
下面這幾個直播間,我估計俄羅斯美女本人來認(rèn),估計也不一定能看得出到底哪個是數(shù)字人。
正確答案是,除了最右邊的,其他全部都是。
沒錯,現(xiàn)在的數(shù)字人不光能對口型和表情,甚至都有轉(zhuǎn)頭、低頭看手機這種大動作。
你可能以為這應(yīng)該是什么專業(yè)設(shè)備搓出來的,但其實世超現(xiàn)在用我的手機隨手一拍,也能整個八九不離十。
比如,我花了兩分鐘時間,就復(fù)刻出了一個隔壁差評君聲優(yōu)出來。這活人感不足的表情,和似笑非笑的嘴型,比蛋蛋本人都更像真人。
當(dāng)然了,這不是世超我有啥秘訣,而是百度慧播星數(shù)字人里面自帶的一個免費功能【 一鍵開播 】。咱們只要發(fā)一條 2 分鐘的露臉視頻,就能得到一個賽博分身。

不了解數(shù)字人的差友可能不知道,這事有點牛的。
通常來說,數(shù)字人的聲音和外形都得分開兩次處理。而且,一般要求素材 5 分鐘起步。因為上傳視頻時越短,克隆的難度越大。
百度這是拿一份錢,高效地干完兩個人的活。

世超我這段素材清晰度還賊低,你現(xiàn)在用手機前置錄一個上傳,表情捕捉和口型效果會比我好一大截。
而且,生成好了之后,點一下右下角的預(yù)約開播,就能直接開業(yè)上崗。速度比發(fā)一條朋友圈還快。
可惜,火鍋主播因為素材不規(guī)范,分身失敗了

當(dāng)然了,世超只是外行小白,就純粹弄著玩的。但在真正的商家手上,那數(shù)字人就是實打?qū)嵉纳a(chǎn)力了。
開頭那些以假亂真的直播間大家也看到了。后來世超蹲在百度各種直播間里抓數(shù)字人,卻屢戰(zhàn)屢敗,見識了它們各種騷操作。
你可能還是認(rèn)為我在搞抽象,覺得 AI 生成的,說破天也不可能真到哪去,哪用得著這么仔細辨別。
下面這個女裝直播間,我覺得如果我不說,在座應(yīng)該很難有人通過這短短幾秒的動圖,識破這是 AI 。
主播不僅可以摸頭發(fā)、摸嘴擋臉,甚至是出畫來更換衣服、換包。不管怎么遮擋,都可以保持唇形和面部的高度一致。
而且,它的話術(shù)也不是傳統(tǒng)數(shù)字人那樣機械式地重復(fù)好聽話,各種帶場子、逼單的話它是一套又一套。
感覺氣氛到位了,突然說要給大家發(fā)一波紅包。“ 呃這樣好吧,今天比較特殊,那我再做一波補貼,我臨時做的決定,好不好。”
紅包發(fā)完之后,還不忘熟練地敲打一下直播間潛水的人。
“ 這件衣服以后我不會再做了。因為真的太難做了,我把我工廠的工人都逼瘋了 ”、“ 這批是我給大家爭取到的 1000 件,你要是搶不到,之后我不會再翻單了?!?/strong>
這一套話術(shù)灌下去,誰能忍住不搶一下。俄羅斯美女來了,都得在直播間買兩件衣服再走。

后面,世超專門去了解了一下。才知道,慧播星數(shù)字人的背后是有多個智能體的。
簡單來說,就是有一個腦子負(fù)責(zé)當(dāng)主播,還有一個腦子負(fù)責(zé)當(dāng)運營,還有一個可能負(fù)責(zé)場控調(diào)度。
所以,百度的數(shù)字人不僅僅是單純地文本宣讀器,它可以一邊跟你嘮嗑,一邊及時地發(fā)紅包、促單、開價,同時直播間有人要看產(chǎn)品細節(jié),它能立馬把鏡頭切換過去。這些操作和反饋,它都可以實時響應(yīng)。
這早就跟那些僵硬地朗誦“ 我愛中國 ”的數(shù)字人,不是一個 level 的了。
我舉個最簡單例子,就說賣車,這事一般數(shù)字人根本干不了。這類復(fù)雜大件,顧客是一定要看到實物細節(jié)的。比如內(nèi)飾、后排空間等等,不然說破嘴皮他們都不會多看一眼。
結(jié)果,世超我在嵐圖的直播間問,能不能看看車?yán)锛毠?jié)。
主播接完“ 可以的寶寶 ”之后,馬上就給我切到了車內(nèi)直播的機位,還調(diào)出了四五個內(nèi)飾的細節(jié)鏡頭,生怕我有哪塊走線沒看清。就這貼心程度,難怪讓嵐圖試駕率提高了幾倍。
新能源車行業(yè)還不是被數(shù)字人搶飯碗最嚴(yán)重的,隔壁的教育教輔,數(shù)字人的轉(zhuǎn)化率快比真人還要高了。
不過倒也不難理解,講課和查資料就是 AI 的老本行啊。
而且,百度也把模型這塊給拉滿了,提供了文心 4.0、文心 4.5,還有 DeepSeek-R1 和慧播星定制四種選擇。
在賣書的直播間里,它可以從三國聊到紅樓夢,從語數(shù)英聊到政史地。所以,三千多塊錢的貴價學(xué)習(xí)機,數(shù)字人都能賣得動。
你也不用擔(dān)心,它會不會跟賣衣服一樣瘋狂催單,反而讓聽課的寶爸寶媽們出戲。
因為慧播星還有一個功能叫【劇本模式】。簡單來說,就是你可以給它立一個劇本。比如董宇輝這種博古通今的講師,或者牙尖嘴利的帶貨主播。它就能根據(jù)劇本內(nèi)容實時調(diào)整語調(diào)、表情和動作,聲形音高度統(tǒng)一,且情緒轉(zhuǎn)換和動作銜接都能像真人一樣自然流暢。
有了劇本人設(shè)的打底,再加上多模型和多智能體的調(diào)用,才讓數(shù)字人從【形象 + 感知 + 行動】全方位地擬人。
這幾個 buff 里但凡少了疊了一層,都沒法做到百度慧播星數(shù)字人這樣的高說服力。
當(dāng)然了,哪怕人設(shè)寫得再好,賽博世超也沒辦法成為第二個董宇輝。AI 分身的個人魅力,和頭部主播比還是差了不少。
但僅一年多,它們就從一開始嘴型都對不好,到可以匹配手勢,再到現(xiàn)在百度這套高說服力數(shù)字人。世超也才后知后覺地發(fā)現(xiàn),原來我們已經(jīng)過了討論數(shù)字人真不真的階段,它早在實打?qū)嵉貛蜕碳覓赍X了。
作為全棧式數(shù)字人直播,百度在站內(nèi)對數(shù)字人做額外的流量傾斜。
比如前面的女裝直播間一個月能賣 15 萬,收益率被提高了 30%。有的女裝直播間甚至可以做到 GMV 提高 60%。一個叫【東北翠花在東北】農(nóng)產(chǎn)品直播間,數(shù)字人讓它一季度賣了 50w+,單量漲了十倍。

甚至最近美國瘋狂關(guān)稅轟炸后,百度數(shù)字人更是成了不少外貿(mào)人的救命稻草。
突然的天災(zāi),使得很多商家根本來不及反應(yīng)。出海美國的工廠基本 50% 的訂單都受影響,不少客戶直接要求退貨。有商家和世超說,自己身邊主做美國市場的工廠大部分停工了。
當(dāng)然了,美國不能進,還有大把其他市場可以做。但換陣地,就意味著主播、運營、直播間都需要重新招募和搭建。
工廠和庫存停擺一天,對商家都是巨大的成本壓力。之前交個朋友的主播朱蕭木說過:“ 電商的死法只有一種,就是庫存沒管好?!?/strong>
這個時候,搭建快、支持多語種的數(shù)字人,就成了很多商家爭分奪秒的首選了。
商家們可以只花幾個小時,就快速地搭一個可以上線的直播間。并且,不需要再額外招聘外語主播,因為慧播星數(shù)字人支持 9 種語言。據(jù)了解,該功能也將盡快全量上線,規(guī)?;С稚碳彝卣购M馐袌?。
最重要的一點是,它是真的省錢啊。
一個主播給我算了一筆賬,就算是運營和出鏡全都靠自己,僅搭建最基礎(chǔ)直播間也起碼得三部手機起步。
要是想要專業(yè)一點,場地租金、燈光設(shè)備、收音器材等硬性投入都跑不了,頭部直播間每月得耗資數(shù)十萬,小品牌也少說數(shù)萬。
但數(shù)字人就是拍一段視頻,一點電費和流量錢。如果在百度站內(nèi)播,數(shù)字人使用是完全免費的,連服務(wù)費都沒有。
這一兩年時間,百度還在不斷壓縮成本,現(xiàn)在后臺數(shù)字人的運算處理成本只有半年前的 1/3。

不過,即便這行已經(jīng)脫胎換骨、天翻地覆了,很多人應(yīng)該和世超一樣感知不深。因為咱們還是天然地覺得直播門檻很高,用數(shù)字人直播就更是想都不敢想的事。
所以,百度也一直在嘗試降低門檻,從原先需要上傳半個小時才能生成,到現(xiàn)在 2 分鐘就夠了。這次的一鍵開播,更是把門檻踩爛了,讓數(shù)字人直播變得比發(fā)個朋友圈還簡單。
真正做到一部手機,人人都是主播。
畢竟,判斷一個直播間好壞的標(biāo)準(zhǔn),從來就不是它到底是不是真人在播,而是看它能不能精準(zhǔn)地接住你的梗,能不能在你需要的時候及時遞上你想看的產(chǎn)品細節(jié),能不能用實打?qū)嵉膬?yōu)惠和服務(wù)把你留住。
當(dāng)“數(shù)字分身”能比真人更懂運營、更能說會道、還能 7x24 小時全年無休時,“ 人人都是主播 ”就不再是一句空泛的口號,而是一個馬上就會實現(xiàn)的未來。
撰文:star
編輯:江江
美編:萱萱
圖片、資料來源:
百度直播間:@問真國學(xué)文化、橙狐蝦w
小紅書@路熙婭Lusia

熱門跟貼