打開網(wǎng)易新聞 查看精彩圖片

技術(shù)推動多元化。

文丨??素?cái)經(jīng) 許俊浩

技術(shù)革新是當(dāng)今社會廣泛關(guān)注的重要命題。

如近日舉行的2025年世界互聯(lián)網(wǎng)大會亞太峰會,便著重探討了AI帶來的前景與挑戰(zhàn)。峰會發(fā)布了《以普惠包容的人工智能治理賦能全球可持續(xù)發(fā)展》報(bào)告,旨在深化AI治理與國際合作,通過普惠包容的AI發(fā)展,促進(jìn)彌合數(shù)字鴻溝。

科技發(fā)展不止于技術(shù)進(jìn)步本身,普惠是其重要一環(huán),而技術(shù)透明化則是通向普惠的關(guān)鍵路徑。

抖音日前舉辦的“安全與信任中心開放日”活動即是推動技術(shù)透明化的典型一例。在活動中,抖音算法工程師等相關(guān)工作人員拆解了抖音算法的邏輯與平臺審核流程。推薦算法是AI技術(shù)中機(jī)器學(xué)習(xí)的具體應(yīng)用領(lǐng)域。抖音推薦算法包含“協(xié)同過濾”算法、Wide&Deep模型、雙塔召回模型等多種技術(shù)手段,能夠通過分析和學(xué)習(xí)用戶行為來構(gòu)建千人千面的內(nèi)容推送。即便算法不懂內(nèi)容,也可以精準(zhǔn)捕捉用戶興趣,并以多元化方式增加平臺內(nèi)容豐富度和用戶留存率。

這是抖音持續(xù)努力的方向。2025年3月,抖音上線了“抖音安全與信任中心”網(wǎng)站,面向社會公開算法原理、社區(qū)規(guī)范、治理體系和用戶服務(wù)機(jī)制。

打開網(wǎng)易新聞 查看精彩圖片

這些動作進(jìn)一步幫助公眾理解技術(shù)決策的邏輯,有助于建立用戶與用戶、用戶與平臺間的信任,以平臺倡導(dǎo)的優(yōu)質(zhì)多元內(nèi)容來助推互聯(lián)網(wǎng)內(nèi)容更好地發(fā)展。

01

01

繭房起于偏見

繭房起于偏見

推薦算法的本質(zhì)是信息過濾系統(tǒng)。

當(dāng)下的人身處數(shù)據(jù)和信息爆炸的時(shí)代。據(jù)調(diào)研機(jī)構(gòu)IDC數(shù)據(jù),全球產(chǎn)生的數(shù)據(jù)量2024年達(dá)159ZB,到2028年將達(dá)384ZB。需要說明的是,1ZB等于10萬億億個(gè)Byte,如果以一部約兩小時(shí)的4K電影約20G的大小來衡量,159ZB相當(dāng)于7.95萬億部電影,連續(xù)播放這些電影需要約18億年。

互聯(lián)網(wǎng)時(shí)代的信息遠(yuǎn)超個(gè)人所能處理的極限,必然需要平臺來分類、篩選和推薦。個(gè)性化推薦算法相當(dāng)于私人管家,已經(jīng)廣泛應(yīng)用在電商、視頻、社交等不同平臺,能高效、準(zhǔn)確地滿足各個(gè)用戶的不同需求。

以抖音協(xié)同過濾算法與Wide&Deep模型的結(jié)合為例,協(xié)同過濾可以經(jīng)由不同用戶的行為推薦相似內(nèi)容,Wide&Deep模型則能發(fā)覺內(nèi)容的稀有特征并標(biāo)記相關(guān)性,兩者能夠互補(bǔ),使內(nèi)容推薦更為廣博多樣。

基于內(nèi)容的協(xié)同過濾算法會分析和比較用戶行為。假設(shè)用戶甲觀看了A、C、D內(nèi)容,用戶乙觀看了B、C、D內(nèi)容,用戶丙觀看了C、D、E內(nèi)容,算法就會判定C、D內(nèi)容有較高相似度,如果用戶喜歡C,大概率也會喜歡D。這更容易推出受更多人喜愛的頭部內(nèi)容。

Wide&Deep模型則由Wide部分和Deep部分組成,Wide部分讓模型具有較強(qiáng)的記憶能力,可以直接學(xué)習(xí)并利用歷史數(shù)據(jù)中物品或特征同時(shí)出現(xiàn)的頻率;Deep部分則讓模型具有泛化能力,也就是能夠推測未見過的數(shù)據(jù)。比如推測一個(gè)喜歡美食的用戶可能對廚具測評感興趣。當(dāng)Wide&Deep模型與協(xié)同過濾算法共同發(fā)揮作用,平臺既可以快速推薦熱門內(nèi)容,又能挖掘用戶潛在的多樣化興趣,讓小眾內(nèi)容能被更多用戶關(guān)注。

打開網(wǎng)易新聞 查看精彩圖片

不少人將算法視作“信息繭房”推手,但事實(shí)與之相去甚遠(yuǎn)。

信息繭房一詞來源于美國法學(xué)教授凱斯·R·桑斯坦2006年出版的《信息烏托邦》,指如果人只關(guān)注和選擇自我愉悅的內(nèi)容,信息接觸面便會越來越窄,困于自我編織的繭房中。事實(shí)上,這一概念提出時(shí)并非針對算法,也沒有實(shí)證研究和量化數(shù)據(jù)支撐。它在當(dāng)下的廣泛應(yīng)用更像是互聯(lián)網(wǎng)用戶信息焦慮的集中體現(xiàn)。

推薦算法的基礎(chǔ)是機(jī)器學(xué)習(xí),即通過對已有數(shù)據(jù)進(jìn)行數(shù)學(xué)建模,尋找規(guī)律,會將用戶對內(nèi)容的具體偏好抽象成數(shù)學(xué)關(guān)系。即使是最優(yōu)秀的算法工程師,也無法脫離算法技術(shù)的種種理論和架構(gòu),簡單解釋為什么把某個(gè)視頻推薦給了這些用戶而非那些用戶。當(dāng)每個(gè)用戶都變成數(shù)據(jù)里的“點(diǎn)”時(shí),用戶無法縱覽全貌,必然極易感覺身處黑盒當(dāng)中。抖音推送的算法透明化,正是希望打開黑盒,讓更多人真正理解算法的內(nèi)核。

澳大利亞學(xué)者阿克塞爾·布魯恩斯2019年發(fā)表的文章《問題不在技術(shù),笨蛋》就援引了多位學(xué)者的實(shí)驗(yàn),表示社交媒體、搜索引擎等不同網(wǎng)絡(luò)平臺實(shí)際上擴(kuò)充了用戶的信息源,使用戶接觸到的信息多樣性高于不使用這些平臺的用戶,如對370萬澳大利亞推特用戶的調(diào)研顯示,不同觀點(diǎn)的網(wǎng)絡(luò)用戶集群之間不會完全隔離,仍然保有良好互動。

02

02

優(yōu)質(zhì)深度并舉

優(yōu)質(zhì)深度并舉

為促進(jìn)內(nèi)容豐富度提升,抖音推薦算法設(shè)置了興趣探索機(jī)制。

假如用戶特別喜歡觀看音樂類視頻,那么算法還會嘗試為用戶推送與音樂相關(guān)的其他藝術(shù)領(lǐng)域,比如美術(shù)賞析或舞蹈表演。用戶的興趣點(diǎn)還可能有大小之別,比如大部分人的觀看集中在美食領(lǐng)域,小部分人的觀看在攝影領(lǐng)域,算法推薦時(shí)也會給予像攝影這樣的小興趣點(diǎn)更多權(quán)重,避免大興趣點(diǎn)領(lǐng)域內(nèi)容的過多重復(fù)。

算法還會刻意進(jìn)行多樣化推薦,以免同質(zhì)化內(nèi)容讓用戶審美疲勞。一個(gè)喜愛搞笑情景劇的用戶,在算法不考慮多樣性的情況下可能會被連續(xù)推薦3個(gè)搞笑情景劇和2個(gè)其他內(nèi)容,但在算法設(shè)定多樣性時(shí)只會被推薦1個(gè)搞笑情景劇,其余均為多樣化的其他內(nèi)容。

如此一來,算法既能貼合用戶需求,又能助力用戶探索更多可能。而且,這還有助于讓小眾、深度內(nèi)容找到真正喜愛它們的用戶。

據(jù)??素?cái)經(jīng)了解,抖音曾嘗試直接給知識、歷史、科技等深度內(nèi)容做加熱,但實(shí)際效果不佳——此舉改變了算法的正常邏輯,會影響數(shù)據(jù)循環(huán),導(dǎo)致這些內(nèi)容的后續(xù)推薦受到干擾;此后,抖音轉(zhuǎn)換思路,針對深度內(nèi)容訓(xùn)練,預(yù)估收藏和重復(fù)觀看概率的模型,使平臺中的深度內(nèi)容分發(fā)效率更高。

博主“米三漢”2024年6月發(fā)布的“450分鐘解讀紅樓夢”的長視頻頗為典型。截至目前,這條視頻播放量超過3億,點(diǎn)贊量達(dá)1291萬,收藏量達(dá)773萬。抖音總裁韓尚佑表示,2025年抖音優(yōu)質(zhì)內(nèi)容曝光量將增加300%。

打開網(wǎng)易新聞 查看精彩圖片

淄博、哈爾濱、天水等城市的走紅也能印證算法對小而美內(nèi)容的力量。本地人習(xí)以為常的部分被算法挖掘出來,分發(fā)給那些對旅游與地方特色感興趣的用戶,再經(jīng)由他們層層傳播,最終形成“破圈”的回響。

其中天水麻辣燙的走紅頗值一提。

2024年2月,博主“一杯梁白開”在抖音發(fā)布了“建議全國普及甘肅麻辣燙”的視頻,視頻中的麻辣燙湯汁濃稠、色澤誘人,很快吸引了大量用戶。截至目前,該視頻點(diǎn)贊量達(dá)141萬。后續(xù)“三個(gè)叁”“橘子公主”等博主前往天水,抖音熱榜出現(xiàn)了“到甘肅吃麻辣燙是什么體驗(yàn)”“甘肅天水打響2024旅游第一槍”等話題,越來越多用戶參與互動。

得益于算法的精準(zhǔn)匹配和信息傳播的裂變高效,天水麻辣燙從“存在感”不強(qiáng)的本地小吃一躍成為當(dāng)?shù)卮鬅嵛穆肐P,且得到了網(wǎng)友的持續(xù)關(guān)注。官方數(shù)據(jù)顯示,2025年清明假期即4月4日至4月6日,天水憑借在線旅游訂單量入圍清明節(jié)全國“黑馬”旅游目的地,全市大部分酒店入住率近100%。

還有小眾的成都“三花”民間川劇團(tuán)、陜西考古研究員講解的考古知識、被網(wǎng)友稱作“人間清醒直擊靈魂”的作家史鐵生的作品等,都因推薦算法在抖音上煥發(fā)了新生命力。以史鐵生為例,據(jù)《2024抖音讀書生態(tài)報(bào)告》,抖音上相關(guān)視頻數(shù)量累計(jì)增長192%,視頻總時(shí)長增長415%。

03

03

力促技術(shù)普惠

力促技術(shù)普惠

平臺提升內(nèi)容豐富度更能增強(qiáng)用戶粘性。

中國人民大學(xué)高瓴人工智能學(xué)院發(fā)布的《算法向善與個(gè)性化推薦發(fā)展研究報(bào)告》提及,內(nèi)容類型數(shù)量是否足夠多、內(nèi)容類型的分散程度是否足夠高,與用戶是否能長期留存呈正相關(guān)態(tài)勢。清華大學(xué)社科院發(fā)布的《用戶使用、算法推薦與信息繭房研究報(bào)告》數(shù)據(jù)顯示,70%的用戶對個(gè)性化推薦算法持肯定態(tài)度,認(rèn)可算法能夠幫助用戶解決信息過載問題。

打開網(wǎng)易新聞 查看精彩圖片

在推薦算法的基礎(chǔ)上,抖音還進(jìn)一步擴(kuò)充了平臺機(jī)制和功能。

比如社交推薦機(jī)制,用戶可以長按視頻,點(diǎn)擊“推薦”,相關(guān)視頻就會被分發(fā)給抖音內(nèi)的好友,并顯示是由哪位用戶推薦的。這種社交推薦即是對興趣推薦的補(bǔ)充。還有熱點(diǎn)熱榜,會展示當(dāng)天重要新聞事件,在話題內(nèi)容中匯集事件的最新進(jìn)展,平衡不同觀點(diǎn)以幫助用戶了解事件全貌,最大限度避免信息繭房產(chǎn)生。

抖音搜索也在持續(xù)保持增長。據(jù)??素?cái)經(jīng)了解,部分知識類、攻略類內(nèi)容發(fā)布3個(gè)月以后,搜索的平均流量占比可達(dá)50%以上。平臺將搜索與推薦相結(jié)合,使優(yōu)質(zhì)內(nèi)容產(chǎn)生長尾效應(yīng)。當(dāng)然,用戶也可以通過對內(nèi)容或者賬號點(diǎn)擊“不感興趣”,以及在內(nèi)容管理工具里面設(shè)置自己的內(nèi)容偏好來優(yōu)化個(gè)性化推薦內(nèi)容。

綜合而多元的機(jī)制為用戶提供了更多可能。

圖書即是如此。抖音上有大量經(jīng)典圖書、冷門佳作的相關(guān)視頻,用戶能夠在瀏覽過程培養(yǎng)興趣,并與出版社、讀書達(dá)人鏈接。這使圖書宣傳無需完全按照傳統(tǒng)的媒體宣傳、線下簽售、讀者見面會等路徑,原本獨(dú)立的讀者與作者、讀者與讀者被算法“打通”,甚至可以跨越時(shí)空界限。這也為圖書出版行業(yè)提供了新的渠道。

推薦算法使農(nóng)業(yè)技術(shù)推廣高效便捷。要知道,國內(nèi)中小農(nóng)戶分布廣,種植養(yǎng)殖種類眾多,需要的技術(shù)門類繁雜,原本科研機(jī)構(gòu)、農(nóng)業(yè)企業(yè)技術(shù)推廣的成本較高,正是短視頻、直播等形式使農(nóng)業(yè)技術(shù)推廣的覆蓋面更廣。

擁有22萬粉絲的博主“梁老師講農(nóng)業(yè)”即是農(nóng)業(yè)技術(shù)推廣大軍的一員。該博主本名梁振清,已經(jīng)八十多歲,是從業(yè)40年的高級農(nóng)藝師,通過抖音來傳授自己畢生所學(xué)的農(nóng)技知識。在推薦系統(tǒng)的幫助下,他的視頻能被準(zhǔn)確推薦給對三農(nóng)、鄉(xiāng)村、農(nóng)技感興趣的用戶,用戶也能順勢在搜索框中搜索、了解農(nóng)技相關(guān)內(nèi)容,擴(kuò)展相關(guān)知識。

打開網(wǎng)易新聞 查看精彩圖片

需要說明的是,算法本身只是工具,內(nèi)容平臺不可能全由算法把控內(nèi)容。抖音通過人工參與的平臺治理為算法設(shè)置“護(hù)欄”,定義和識別各類風(fēng)險(xiǎn)內(nèi)容,結(jié)合內(nèi)外部反饋持續(xù)迭代算法,以確保推送的內(nèi)容合法合規(guī)。

隨著推薦算法在日常生活中的滲透率提升,公眾對算法的好奇與疑慮也在增長。如今抖音通過算法透明化實(shí)踐,揭開技術(shù)決策的數(shù)字面紗,或可由此消除誤解,累積信任,推動內(nèi)容生態(tài)深層次變革。算法給出的不僅是瀏覽和互動的數(shù)據(jù),更是對商業(yè)價(jià)值、文化生態(tài)、社會責(zé)任的多維支撐。追求正向內(nèi)容多元化的算法,正在成為技術(shù)向上向善的重要注腳。