撰文/李信馬

1850年,哲學(xué)家路德維?!べM(fèi)爾巴哈(Ludwig Feuerbach)在論文《自然科學(xué)與革命》中以德語(yǔ)寫下:“Der Mensch ist, was er i?t.”

這句話后來以英文版的“You Are What You Eat”(你吃什么,就是什么)傳播到了全世界,既可以指飲食和健康,也可以指人的精神,由其經(jīng)歷所塑造。

美國(guó)行為主義心理學(xué)創(chuàng)始人約翰?B?華生(John B.Watson)在1924年出版的《行為主義》(Behaviorism)中也曾提出:“給我一打健康的嬰兒,讓他們?cè)谖以O(shè)定的環(huán)境中成長(zhǎng),我能保證隨機(jī)挑選一個(gè),將其訓(xùn)練成我選定的任何類型的專家——醫(yī)生、律師、藝術(shù)家、商人,甚至乞丐和小偷,無論其天賦、傾向、能力、職業(yè)和祖先種族如何?!?/p>

環(huán)境也許無法徹底決定一個(gè)人的命運(yùn),但足以深深影響人的三觀?;ヂ?lián)網(wǎng)的出現(xiàn),讓信息大爆炸,人類通過門戶網(wǎng)站、搜索引擎、公眾號(hào)微博等方式去了解世界,也被互聯(lián)網(wǎng)上或真或假的消息印象。

進(jìn)入移動(dòng)互聯(lián)網(wǎng)時(shí)代,短視頻平臺(tái)成為新的流量之王,據(jù)QuestMobile數(shù)據(jù)顯示,2024年12月,國(guó)內(nèi)用戶的月人均使用手機(jī)時(shí)長(zhǎng)已經(jīng)提升至171.7小時(shí),相當(dāng)于每天超過5.5小時(shí),其中用于短視頻的達(dá)到了62.9小時(shí)。

打開網(wǎng)易新聞 查看精彩圖片

圖源:QuestMobile

短視頻讓人欲罷不能,也因此有人擔(dān)心,平臺(tái)的算法是否編織了“信息繭房”,讓人們只能看到自己感興趣的同質(zhì)化內(nèi)容,逐漸變得閉塞甚至偏激?

出于這樣的擔(dān)憂和質(zhì)疑,算法被視為巫術(shù),背后的平臺(tái)如抖音、快手也經(jīng)常成為眾矢之的。4月15日,抖音在北京舉辦了“安全與信任中心開放日”活動(dòng),由相關(guān)業(yè)務(wù)負(fù)責(zé)人就抖音算法原理、平臺(tái)治理體系以及社會(huì)關(guān)切的問題,向包括DoNews在內(nèi)的廣大媒體展開了詳細(xì)介紹和澄清。

短視頻平臺(tái)到底有沒有為用戶編織一個(gè)個(gè)的“信息繭房”?看完這篇文章,或者讀者就會(huì)有一個(gè)答案。

一、推薦算法:主觀無意愿

“信息繭房”(Information Cocoons),是由美國(guó)學(xué)者凱斯?桑斯坦(Cass R. Sunstein)在2006年出版的著作《信息烏托邦 —— 眾人如何生產(chǎn)知識(shí)》中提出的。它是指在信息傳播中,公眾只注意自己選擇的東西和使自己愉悅的內(nèi)容,如同置身于一個(gè)由自己的興趣和偏見編織而成的蠶繭之中,從而將自己的生活桎梏于像蠶繭一般的 “繭房” 中。

抖音推薦算法的原理是什么?

首先,我們要知道,每天投稿到抖音的內(nèi)容有上億,而一名抖音用戶,差不多一天只會(huì)刷幾百個(gè)內(nèi)容。所以,推薦算法解決的如何從海量的內(nèi)容中,挑選出用戶喜歡的內(nèi)容并分發(fā)給他。

但這個(gè)過程中,算法并不需要了解內(nèi)容,它的重點(diǎn)是學(xué)習(xí)用戶的行為。

抖音的推薦算法的包括“召回” 和 “排序” 兩個(gè)核心環(huán)節(jié),當(dāng)用戶點(diǎn)贊了一些美食的視頻,算法就會(huì)從上億量級(jí)的投稿內(nèi)容中,通過召回策略,將適合推送給用戶的內(nèi)容縮減至萬的量級(jí)乃至千的量級(jí)。

在篩選出用戶可能感興趣的幾百到幾千個(gè)內(nèi)容后,抖音會(huì)通過排序算法,基于用戶的短期行為(點(diǎn)贊、完播率等)與長(zhǎng)期價(jià)值(收藏、與作者的持續(xù)互動(dòng)、負(fù)反饋等),猜測(cè)用戶會(huì)對(duì)哪些內(nèi)容更感興趣,然后依次打分,再按分?jǐn)?shù)由高到低進(jìn)行推送。

具體的算法有協(xié)同過濾算法,核心邏輯就是尋找興趣相似的用戶群體,比如系統(tǒng)發(fā)現(xiàn)你和另一個(gè)陌生人點(diǎn)贊的內(nèi)容有重合,那么某個(gè)你看并點(diǎn)贊的內(nèi)容,他可能也喜歡,反之亦然。

隨著機(jī)器學(xué)習(xí)發(fā)展,神經(jīng)網(wǎng)絡(luò)技術(shù)被引入推薦系統(tǒng)。其核心步驟是將用戶與內(nèi)容的特征轉(zhuǎn)化為數(shù)值化向量,通過多層網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行復(fù)雜信號(hào)融合,從而更精準(zhǔn)地匹配用戶需求。基于神經(jīng)網(wǎng)絡(luò)衍生出了雙塔召回模型,將用戶特征與內(nèi)容特征分別輸入兩個(gè)神經(jīng)網(wǎng)絡(luò),通過頂層計(jì)算二者相似度,來判斷用戶對(duì)內(nèi)容的潛在興趣。

還有Wide&Deep ,“Wide”層處理淺層次的歷史行為數(shù)據(jù)(如用戶曾點(diǎn)贊的內(nèi)容),“Deep” 層通過深層網(wǎng)絡(luò)挖掘潛在關(guān)聯(lián)(如喜歡健身的用戶可能也對(duì)爬山、游泳感興趣),相比傳統(tǒng)協(xié)同過濾,能更全面地捕捉用戶興趣。

下面這張圖介紹了排序算法的基本原理。

打開網(wǎng)易新聞 查看精彩圖片

圖源:抖音

從技術(shù)的視角來看,推送給用戶的內(nèi)容如果太發(fā)散,許多是用戶不喜歡的,那用戶的體驗(yàn)就會(huì)變差;但技術(shù)的出發(fā)點(diǎn),也不是為了讓用戶只看到自己喜歡的內(nèi)容。

抖音算法工程師劉暢表示:“用戶長(zhǎng)期價(jià)值,是抖音推薦算法的‘北極星指標(biāo)’,也就是我們最核心的業(yè)務(wù)目標(biāo)?!?/p>

這一指標(biāo)更接地氣的說法,是抖音希望有更多人使用抖音,并長(zhǎng)期留下來。編織“信息繭房”可能短期讓人停不下來,但長(zhǎng)期來看不一定是好事,打個(gè)比方,如果你知道一個(gè)用戶喜歡貓,就不停的給他推送貓相關(guān)的內(nèi)容,那他一段時(shí)間后就會(huì)厭倦離開。還有的用戶感性上喜歡看推送的內(nèi)容,但理性上討厭“奶頭樂”,甚至?xí)匾獠稽c(diǎn)贊來擾亂推薦。

打開網(wǎng)易新聞 查看精彩圖片

圖源:抖音

所以,抖音反而有動(dòng)力在推送用戶感興趣的內(nèi)容時(shí),也通過算法推送多元化的內(nèi)容,比如一方面,對(duì)用戶感興趣的內(nèi)容,通過多樣性打散、多興趣召回、扶持小眾(長(zhǎng)尾)興趣等方法控制相似內(nèi)容出現(xiàn)的頻次,另一方面,采用隨機(jī)推薦、基于用戶社交關(guān)系拓展興趣、搜索推薦聯(lián)動(dòng)、“不感興趣”不再展現(xiàn)等方式,讓用戶探索更多的內(nèi)容。

打開網(wǎng)易新聞 查看精彩圖片

圖源:抖音

劉暢在采訪中也表示,抖音的算法在向“長(zhǎng)期價(jià)值”轉(zhuǎn)移:“我們一開始比較容易建模是偏短期性的,長(zhǎng)期性的反而不好建模,對(duì)于一個(gè)短期的互動(dòng),它的隨機(jī)性比較弱,但對(duì)長(zhǎng)期興趣它的隨機(jī)性更強(qiáng)。這個(gè)時(shí)候我們的技術(shù)角度逐步攻克,進(jìn)一步去做流量上調(diào)控?!?/p>

只是,客觀來說,愛看自己喜歡的、認(rèn)同的內(nèi)容,是人性使然,如果2006年“信息繭房”這個(gè)現(xiàn)象就被提出,那么今天短視頻平臺(tái)的用戶產(chǎn)生類似擔(dān)憂也是不奇怪了。

二、平臺(tái)治理:客觀有困難

我們畏懼“信息繭房”,更多的是害怕被淹沒在同質(zhì)化甚至有偏見的信息中,最終潛移默化的被影響和改變。反過來說,如果我們接觸的都是優(yōu)質(zhì)和健康的內(nèi)容,即使是陷入了“信息繭房”中,似乎也不必太擔(dān)憂。

但前面有說到,抖音的推薦算法是基于用戶的行為,而非對(duì)內(nèi)容的深度了解,那么,存不存在有害的內(nèi)容在抖音上不斷傳播的可能呢?事實(shí)上,這個(gè)可能性是存在的。

客觀上,這些情況的出現(xiàn)絕對(duì)不是抖音所希望看到的,只是治理上也有困難。目前,抖音的平臺(tái)治理鏈路核心有兩個(gè)原則。首先是所有在發(fā)布的內(nèi)容都會(huì)經(jīng)過評(píng)估,流量越高的內(nèi)容經(jīng)過評(píng)估的次數(shù)越多,標(biāo)準(zhǔn)也越嚴(yán)格。其次是“人工+機(jī)器”審核相互分工又密切配合。

具體來說,內(nèi)容上傳至抖音后,首先進(jìn)入機(jī)器識(shí)別環(huán)節(jié),如果內(nèi)容被識(shí)別出含有高危特征,將被直接攔截。如果未命中高危特征但模型判斷有問題,則會(huì)送至人工審核;若問題概率較低,則獲得基礎(chǔ)流量進(jìn)入下一環(huán)節(jié)。視頻被舉報(bào)、評(píng)論區(qū)出現(xiàn)集中質(zhì)疑、流量激增等情況出現(xiàn),均可能觸發(fā)“人工+機(jī)器”審核。一旦內(nèi)容在任一環(huán)節(jié)被處置,系統(tǒng)會(huì)立即停止進(jìn)一步推薦和分發(fā)。

下圖可以看到,一個(gè)短視頻要在抖音順利分發(fā),要經(jīng)過機(jī)器和人工的四次審核。就像談毒藥都要談劑量,這樣也盡可能將不良信息的危害控制住。

打開網(wǎng)易新聞 查看精彩圖片

圖源:抖音

實(shí)際上,平臺(tái)治理是今年抖音重點(diǎn)任務(wù)。抖音生態(tài)運(yùn)營(yíng)經(jīng)理陳丹丹在采訪中表示,他們有陸續(xù)收到用戶、媒體,還有主管部門的反饋,去年年底也經(jīng)過了多輪的討論:“我們確實(shí)把平臺(tái)治理和算法透明度作為貫穿全年的重點(diǎn)。我們想要達(dá)到的一個(gè)目標(biāo)是信任,因?yàn)楂@得用戶信任、媒體信任、社會(huì)信任是很難的課題。在這個(gè)過程當(dāng)中,需要我們不斷地把治理體系、推薦算法技術(shù)做公開,更多是平臺(tái)選擇了這樣的動(dòng)作?!?/p>

短視頻已經(jīng)成為國(guó)人精神生活的重要組成部分,甚至可以說是當(dāng)代互聯(lián)網(wǎng)文化的重要載體,而非只是賺錢的娛樂,忽視這些,技術(shù)這把雙刃劍也有可能造成破壞。除了商業(yè)價(jià)值之外,抖音也應(yīng)在社區(qū)價(jià)值方面承擔(dān)更多的責(zé)任。