繼此前在今年3月上線抖音安全與信任中心網(wǎng)站,面向社會(huì)公開(kāi)抖音算法原理、機(jī)制和治理政策后,在日前舉行的開(kāi)放日活動(dòng)中,抖音相關(guān)業(yè)務(wù)負(fù)責(zé)人基于網(wǎng)站版塊就外界關(guān)切的算法和治理問(wèn)題進(jìn)行了介紹。

據(jù)了解,推薦算法作為人工智能機(jī)器學(xué)習(xí)技術(shù)的重要應(yīng)用場(chǎng)景,本質(zhì)上是一套高效的信息過(guò)濾系統(tǒng)。在實(shí)際應(yīng)用中,抖音推薦系統(tǒng)采用“人工+機(jī)器”協(xié)同的方式進(jìn)行風(fēng)險(xiǎn)治理,并通過(guò)多目標(biāo)體系算法主動(dòng)打破“信息繭房”,為用戶呈現(xiàn)更豐富多元、實(shí)用可靠的推薦內(nèi)容。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

據(jù)抖音算法工程師劉暢介紹,抖音的推薦算法與國(guó)內(nèi)外大部分內(nèi)容推薦平臺(tái)相似,包含召回、過(guò)濾、排序等環(huán)節(jié),重點(diǎn)在于對(duì)用戶行為(點(diǎn)擊、瀏覽、喜歡、轉(zhuǎn)發(fā)、收藏等)的學(xué)習(xí)。

而關(guān)于用戶行為背后的算法推薦邏輯,據(jù)了解,基于人工智能機(jī)器學(xué)習(xí)和深度學(xué)習(xí)構(gòu)建的推薦算法,其本質(zhì)是數(shù)學(xué)模型的運(yùn)算過(guò)程,只是在建立用戶行為與內(nèi)容特征之間的數(shù)學(xué)統(tǒng)計(jì)關(guān)聯(lián),并非理解內(nèi)容本身。而抖音推薦算法的核心邏輯可以簡(jiǎn)化為“推薦優(yōu)先級(jí)公式”,即綜合預(yù)測(cè)用戶行為概率×行為價(jià)值權(quán)重=視頻推薦優(yōu)先級(jí)。

通過(guò)分析用戶的行為,抖音的推薦算法能夠在完全不理解內(nèi)容的情況下,找到興趣相似的用戶,將其他人感興趣的內(nèi)容推薦給該用戶。值得一提的是,目前抖音算法已基本不依賴對(duì)內(nèi)容和用戶打標(biāo)簽,而是通過(guò)神經(jīng)網(wǎng)絡(luò)計(jì)算預(yù)估用戶行為,計(jì)算用戶觀看這條內(nèi)容獲得的價(jià)值總和,將排名靠前的內(nèi)容推給用戶。

劉暢指出,由于推薦算法通過(guò)各種“目標(biāo)”來(lái)預(yù)估用戶行為,而且隨著抖音的用戶愈發(fā)多樣化,內(nèi)容風(fēng)格也日益多元,所以抖音已經(jīng)發(fā)展出非常復(fù)雜的多目標(biāo)體系,比如將收藏率納入多目標(biāo),幫助知識(shí)類內(nèi)容推送給有需求的用戶;增強(qiáng)“收藏+復(fù)訪”、“關(guān)注+追更”、“打開(kāi)+搜索”等組合目標(biāo),預(yù)估用戶長(zhǎng)期行為,幫助用戶探索長(zhǎng)期需求;設(shè)置探索類指標(biāo),幫助用戶探索可能他們自己都還沒(méi)發(fā)現(xiàn)的潛在需求,助力破除“信息繭房”;設(shè)置原創(chuàng)性目標(biāo),鼓勵(lì)優(yōu)質(zhì)、新穎且具有獨(dú)特價(jià)值的內(nèi)容推薦。

同時(shí)在平臺(tái)內(nèi)容治理方面,抖音生態(tài)運(yùn)營(yíng)經(jīng)理陳丹丹指出,鑒于算法雖能學(xué)習(xí)并預(yù)估用戶行為,但因其無(wú)法理解內(nèi)容語(yǔ)義,可能會(huì)導(dǎo)致違法違規(guī)及不良內(nèi)容被推薦傳播,所以在實(shí)際應(yīng)用場(chǎng)景中須通過(guò)平臺(tái)治理體系對(duì)算法進(jìn)行約束和規(guī)范。

據(jù)了解,抖音方面構(gòu)建了“人工參與+機(jī)器學(xué)習(xí)”相結(jié)合的內(nèi)容治理體系,并組建了專門的平臺(tái)治理團(tuán)隊(duì),為算法設(shè)置“護(hù)欄”。在內(nèi)容審核層面,抖音方面采用“人工+機(jī)器”協(xié)同模式,其中“機(jī)器”負(fù)責(zé)“寬度”、評(píng)估所有投稿,“人工”則負(fù)責(zé)“深度”,針對(duì)專業(yè)、敏感或疑難等問(wèn)題進(jìn)行精準(zhǔn)研判。

據(jù)陳丹丹透露,在內(nèi)容上傳后,首先會(huì)進(jìn)入機(jī)器識(shí)別環(huán)節(jié),如果相關(guān)內(nèi)容被識(shí)別出含有高危特征,將被直接攔截。若未命中高危特征但模型判斷存在問(wèn)題,則會(huì)送至人工審核。如問(wèn)題概率較低,則獲得基礎(chǔ)流量進(jìn)入下一環(huán)節(jié)。同時(shí)視頻內(nèi)容被舉報(bào)、評(píng)論區(qū)出現(xiàn)集中質(zhì)疑、流量激增等情況,均可能觸發(fā)“人工+機(jī)器”審核機(jī)制。

【本文圖片來(lái)自網(wǎng)絡(luò)】