當(dāng)你打開(kāi)手機(jī)刷視頻、上網(wǎng)購(gòu)物或者搜索信息時(shí),想過(guò)嗎?有一雙無(wú)形的眼睛正在注視著你的一舉一動(dòng)。這不是科幻小說(shuō)的情節(jié),而是當(dāng)下的現(xiàn)實(shí)。隨著大數(shù)據(jù)技術(shù)的迅猛發(fā)展,針對(duì)網(wǎng)絡(luò)色情內(nèi)容的打擊行動(dòng)也開(kāi)始依靠算法和人工智能進(jìn)行篩查。這種被稱為"大數(shù)據(jù)掃黃"的技術(shù)手段,正在用越來(lái)越精準(zhǔn)的

據(jù)國(guó)家網(wǎng)信辦2024年公布的數(shù)據(jù)顯示,全國(guó)范圍內(nèi)利用大數(shù)據(jù)技術(shù)排查的

目前,大數(shù)據(jù)系統(tǒng)主要通過(guò)三種特征來(lái)識(shí)別潛在的"涉黃"人群:網(wǎng)絡(luò)行為軌跡、內(nèi)容偏好模式以及社交網(wǎng)絡(luò)關(guān)系。這些看似客觀的指標(biāo)真的能精準(zhǔn)識(shí)別出問(wèn)題人群?jiǎn)??在公眾利益與個(gè)人隱私之間,我們應(yīng)該如何劃定界限?

打開(kāi)網(wǎng)易新聞 查看精彩圖片

網(wǎng)絡(luò)行為軌跡:你的"指紋"在哪里留下了痕跡

多家移動(dòng)安全公司的數(shù)據(jù)顯示,算法會(huì)監(jiān)測(cè)用戶在特定時(shí)間段內(nèi)訪問(wèn)特定網(wǎng)站或APP的頻率。如果一個(gè)用戶在凌晨1點(diǎn)到5點(diǎn)這個(gè)時(shí)間段內(nèi)頻繁訪問(wèn)某些被標(biāo)記為"敏感"的網(wǎng)站,系統(tǒng)會(huì)自動(dòng)提高該用戶的"涉黃風(fēng)險(xiǎn)值"。某互聯(lián)網(wǎng)安全公司的技術(shù)白皮書透露,午夜時(shí)段的"敏感網(wǎng)站"訪問(wèn)行為被賦予了比白天高出3倍的權(quán)重分值。

此外,用戶的搜索關(guān)鍵詞也是重要的篩查依據(jù)。據(jù)互聯(lián)網(wǎng)觀察機(jī)構(gòu)"網(wǎng)絡(luò)清風(fēng)"2024年發(fā)布的《互聯(lián)網(wǎng)用戶行為分析報(bào)告》顯示,系統(tǒng)會(huì)對(duì)特定關(guān)鍵詞組合進(jìn)行監(jiān)測(cè),如同時(shí)搜索"私密""交友"和特定地理位置的用戶,會(huì)被系統(tǒng)標(biāo)記為需要關(guān)注的對(duì)象。

值得注意的是,北京某科技公司開(kāi)發(fā)的新一代算法甚至能夠分析用戶在瀏覽內(nèi)容時(shí)的停留時(shí)長(zhǎng)和交互習(xí)慣。例如,對(duì)某些擦邊內(nèi)容反復(fù)暫停、截圖或放大查看的行為,會(huì)被系統(tǒng)解讀為高度關(guān)注該類內(nèi)容的信號(hào)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

內(nèi)容偏好模式:你關(guān)注什么,決定了系統(tǒng)如何看待你

內(nèi)容偏好是大數(shù)據(jù)"

一些社交媒體平臺(tái)的算法甚至?xí)治鲇脩舻狞c(diǎn)贊、評(píng)論內(nèi)容。據(jù)某短視頻平臺(tái)技術(shù)團(tuán)隊(duì)匿名人士透露,系統(tǒng)會(huì)對(duì)評(píng)論中出現(xiàn)的特定詞組和表情組合進(jìn)行語(yǔ)義分析,識(shí)別出隱晦的不良表達(dá)。2025年初的一項(xiàng)內(nèi)部測(cè)試顯示,這類語(yǔ)義識(shí)別技術(shù)的準(zhǔn)確率已經(jīng)達(dá)到了83%。

更令人擔(dān)憂的是,有研究表明,這些算法還會(huì)分析用戶的消費(fèi)習(xí)慣。根據(jù)電子商務(wù)研究中心發(fā)布的《2024年中國(guó)網(wǎng)絡(luò)消費(fèi)行為分析》,頻繁購(gòu)買某些特定組合商品(如特定類型的服裝和器具)的用戶,也會(huì)被系統(tǒng)劃入"需重點(diǎn)關(guān)注"的名單。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

社交網(wǎng)絡(luò)關(guān)系:與誰(shuí)為伍,也被納入判斷標(biāo)準(zhǔn)

第三個(gè)特征篩選標(biāo)準(zhǔn)是社交網(wǎng)絡(luò)關(guān)系分析。系統(tǒng)會(huì)繪制用戶的"社交圖譜",分析其主要互動(dòng)對(duì)象的屬性和行為特征。據(jù)《網(wǎng)絡(luò)安全技術(shù)與應(yīng)用》2024年第4期公布的研究結(jié)果,如果一個(gè)用戶的社交圈中有多個(gè)已被確認(rèn)的"涉黃"賬號(hào),該用戶被系統(tǒng)標(biāo)記為"高風(fēng)險(xiǎn)"的概率會(huì)增加40%以上。

這種"社交關(guān)聯(lián)度分析"技術(shù)在2025年得到了進(jìn)一步升級(jí)。據(jù)了解,新算法不僅僅統(tǒng)計(jì)直接互動(dòng)關(guān)系,還會(huì)追蹤"二度關(guān)系"甚至"三度關(guān)系",形成更為復(fù)雜的關(guān)系網(wǎng)絡(luò)評(píng)估。某互聯(lián)網(wǎng)安全專家張教授(化名)表示:"系統(tǒng)現(xiàn)在能夠識(shí)別出那些表面上毫無(wú)關(guān)聯(lián),但實(shí)際上有著隱蔽互動(dòng)關(guān)系的賬號(hào)群體。"

更值得關(guān)注的是,在一些地區(qū)的試點(diǎn)項(xiàng)目中,這種社交網(wǎng)絡(luò)分析已經(jīng)開(kāi)始與現(xiàn)實(shí)世界的活動(dòng)軌跡相結(jié)合。比如,多次在特定場(chǎng)所與已被標(biāo)記賬號(hào)的實(shí)際持有者同時(shí)出現(xiàn)的人員,也可能被系統(tǒng)列為重點(diǎn)關(guān)注對(duì)象。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

算法的困境:數(shù)字化"有罪推定"?

在客觀分析這三大特征的同時(shí),我們不得不思考:這種基于大數(shù)據(jù)的篩查是否存在將無(wú)辜者錯(cuò)誤劃入"涉黃"范疇的風(fēng)險(xiǎn)?

根據(jù)中國(guó)政法大學(xué)網(wǎng)絡(luò)法律研究中心2024年發(fā)布的《算法治理與個(gè)人權(quán)利保護(hù)》研究報(bào)告,目前的大數(shù)據(jù)"掃黃"系統(tǒng)確實(shí)存在一定的誤判率。報(bào)告調(diào)查的300個(gè)被系統(tǒng)初步標(biāo)記為"涉黃嫌疑"的樣本中,大約有18%的案例在人工復(fù)核后被確認(rèn)為誤判。這意味著,近五分之一的"涉黃"標(biāo)記可能是錯(cuò)誤的。

誤判的原因多種多樣。例如,某些研究學(xué)術(shù)議題的用戶可能因搜索特定關(guān)鍵詞而被系統(tǒng)錯(cuò)誤標(biāo)記;一些網(wǎng)絡(luò)安全工作者在進(jìn)行職業(yè)相關(guān)測(cè)試時(shí),也可能觸發(fā)系統(tǒng)警報(bào);甚至普通用戶偶然點(diǎn)擊了含有敏感內(nèi)容的鏈接,也可能導(dǎo)致風(fēng)險(xiǎn)值上升。

特別令人擔(dān)憂的是,這種算法篩查往往缺乏透明度和解釋性。普通用戶通常不知道自己為什么被系統(tǒng)標(biāo)記,也沒(méi)有有效渠道來(lái)申訴或更正這些可能存在的誤判。這種不透明的"黑箱操作",實(shí)質(zhì)上是一種數(shù)字化的"有罪推定",與我們的法律精神背道而馳。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

算法倫理:隱私保護(hù)與公共安全的博弈

在討論大數(shù)據(jù)"掃黃"的同時(shí),我們不能忽視其背后更深層次的算法倫理問(wèn)題。隨著技術(shù)的發(fā)展,算法對(duì)個(gè)人隱私的滲透越來(lái)越深,這種滲透是否已經(jīng)超出了必要的范圍?

中國(guó)人民大學(xué)法學(xué)院王教授指出:"盡管打擊網(wǎng)絡(luò)色情內(nèi)容是必要的,但算法監(jiān)管不應(yīng)該無(wú)限擴(kuò)大到侵犯?jìng)€(gè)人隱私的程度。我們需要在公共利益和個(gè)人權(quán)利之間找到平衡點(diǎn)。"

事實(shí)上,許多國(guó)家已經(jīng)開(kāi)始意識(shí)到這一問(wèn)題的嚴(yán)重性。歐盟的《通用數(shù)據(jù)保護(hù)條例》(GDPR)明確規(guī)定,任何基于自動(dòng)化處理的決定,如果對(duì)個(gè)人產(chǎn)生法律效力或類似的重大影響,當(dāng)事人有權(quán)獲知決策邏輯并提出異議。然而,我國(guó)在這方面的法律法規(guī)還相對(duì)滯后。

2024年12月通過(guò)的《數(shù)據(jù)安全法》雖然對(duì)數(shù)據(jù)收集和使用提出了一定要求,但對(duì)于算法決策的透明度和可解釋性,以及公民對(duì)算法判斷的知情權(quán)和申訴權(quán),仍缺乏具體而明確的規(guī)定。

面對(duì)這些問(wèn)題,技術(shù)優(yōu)化成為減少誤判、提高準(zhǔn)確率的必要手段。2025年初,多家科技公司開(kāi)始引入更為復(fù)雜的上下文分析技術(shù),試圖更精準(zhǔn)地理解用戶行為背后的真實(shí)意圖。

例如,某知名搜索引擎開(kāi)始嘗試將用戶的搜索詞放在更大的上下文中進(jìn)行分析。如果一個(gè)用戶搜索了敏感關(guān)鍵詞,但其前后還搜索了相關(guān)的學(xué)術(shù)或新聞內(nèi)容,系統(tǒng)會(huì)將其識(shí)別為正常的信息獲取行為,而非不良意圖。

另一項(xiàng)重要的技術(shù)改進(jìn)是引入了"多維度交叉驗(yàn)證"機(jī)制。根據(jù)中國(guó)科學(xué)院計(jì)算技術(shù)研究所的最新研究,將單一維度的行為特征升級(jí)為多維度交叉分析,可以將誤判率降低40%以上。具體來(lái)說(shuō),系統(tǒng)不再僅僅依靠單一的行為特征(如頻繁訪問(wèn)特定網(wǎng)站)做出判斷,而是會(huì)綜合分析多種行為特征之間的相關(guān)性和一致性。

一些企業(yè)正在探索引入"人機(jī)協(xié)作"的審核模式,即在算法初篩之后,增加專業(yè)人員的二次審核環(huán)節(jié),以減少純粹依靠機(jī)器判斷可能帶來(lái)的誤差。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

技術(shù)優(yōu)化固然重要,但更根本的解決之道在于建立更為完善的法律框架,明確算法使用的邊界和規(guī)范。

中國(guó)政法大學(xué)李教授在接受采訪時(shí)表示:"我們需要在立法層面明確規(guī)定,大數(shù)據(jù)監(jiān)測(cè)系統(tǒng)必須遵循'最小必要'原則,即只收集和分析與特定目標(biāo)相關(guān)的必要數(shù)據(jù),而不是無(wú)差別地全面監(jiān)控。"

此外,法律還應(yīng)當(dāng)賦予公民對(duì)自己信息的知情權(quán)、解釋權(quán)和糾錯(cuò)權(quán)。當(dāng)一個(gè)人被算法系統(tǒng)標(biāo)記為"涉黃嫌疑人"時(shí),他應(yīng)該有權(quán)知道判斷依據(jù),有機(jī)會(huì)對(duì)錯(cuò)誤信息進(jìn)行糾正,并在必要時(shí)尋求司法救濟(jì)。

值得一提的是,隨著2025年3月《個(gè)人信息保護(hù)法》實(shí)施細(xì)則的出臺(tái),這些問(wèn)題已經(jīng)開(kāi)始得到一定程度的重視。新的細(xì)則明確要求,利用大數(shù)據(jù)進(jìn)行個(gè)人評(píng)估時(shí),必須向當(dāng)事人提供基本的判斷依據(jù)和申訴渠道。這無(wú)疑是向正確方向邁出的一步,但距離建立完善的法律保障體系,我們還有很長(zhǎng)的路要走。

解決大數(shù)據(jù)"掃黃"中的問(wèn)題,不僅需要技術(shù)改進(jìn)和法律保障,還需要更廣泛的公眾參與和監(jiān)督。

公眾需要提高對(duì)算法權(quán)力的認(rèn)識(shí)和警惕。我們應(yīng)當(dāng)了解,在數(shù)字化時(shí)代,算法已經(jīng)成為一種新型的權(quán)力形式,它可以影響我們獲取什么信息、被如何評(píng)價(jià),甚至決定我們是否會(huì)受到特定關(guān)注和調(diào)查。對(duì)這種權(quán)力,我們既不能盲目恐懼,也不能毫無(wú)保留地信任。

各類社會(huì)組織,特別是消費(fèi)者權(quán)益保護(hù)組織、隱私保護(hù)倡導(dǎo)團(tuán)體等,應(yīng)當(dāng)積極發(fā)揮監(jiān)督作用,對(duì)大數(shù)據(jù)系統(tǒng)中可能存在的問(wèn)題進(jìn)行揭露和批評(píng),推動(dòng)相關(guān)技術(shù)和政策的改進(jìn)。

作為個(gè)人用戶,我們也需要養(yǎng)成良好的網(wǎng)絡(luò)使用習(xí)慣,提高信息安全意識(shí),學(xué)會(huì)保護(hù)自己的數(shù)字隱私,并在發(fā)現(xiàn)問(wèn)題時(shí)勇于通過(guò)合法渠道進(jìn)行申訴和維權(quán)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

大數(shù)據(jù)"掃黃"是一把雙刃劍。一方面,它能夠有效識(shí)別和打擊網(wǎng)絡(luò)色情內(nèi)容,保護(hù)青少年健康成長(zhǎng),維護(hù)良好的網(wǎng)絡(luò)環(huán)境;另一方面,如果使用不當(dāng),它也可能侵犯?jìng)€(gè)人隱私,制造數(shù)字時(shí)代的"冤假錯(cuò)案"。

我們需要的不是盲目拒絕技術(shù),而是更加理性地看待技術(shù)的兩面性,在發(fā)揮其積極作用的同時(shí),警惕和防范可能帶來(lái)的負(fù)面影響。只有當(dāng)技術(shù)真正服務(wù)于人,而不是反過(guò)來(lái)控制人時(shí),我們才能說(shuō)技術(shù)進(jìn)步是有意義的。

**在未來(lái)的發(fā)展中,我們應(yīng)當(dāng)堅(jiān)持以下原則:技術(shù)要有溫度,算法要有倫理,監(jiān)管要有邊界,權(quán)利要有保障。**只有這樣,我們才能在打擊網(wǎng)絡(luò)色情內(nèi)容的同時(shí),也尊重每個(gè)人的基本權(quán)利和尊嚴(yán)。

當(dāng)下,隨著大數(shù)據(jù)和人工智能技術(shù)的深入應(yīng)用,我們正站在技術(shù)發(fā)展與隱私保護(hù)的十字路口。作為這個(gè)時(shí)代的見(jiàn)證者和參與者,我們既要擁抱技術(shù)進(jìn)步帶來(lái)的便利,也要為維護(hù)數(shù)字時(shí)代的人權(quán)和尊嚴(yán)發(fā)聲。數(shù)字化轉(zhuǎn)型不應(yīng)以犧牲人性為代價(jià),技術(shù)賦能也不能以侵犯隱私為前提。

你對(duì)大數(shù)據(jù)"掃黃"技術(shù)有什么看法?你認(rèn)為應(yīng)當(dāng)如何平衡打擊網(wǎng)絡(luò)色情與保護(hù)個(gè)人隱私之間的關(guān)系?歡迎在評(píng)論區(qū)分享你的觀點(diǎn)和經(jīng)歷,讓我們共同思考這個(gè)數(shù)字時(shí)代的重要課題。