文 | 太平洋科技

AI Agent 這股風潮正吹得起勁,我也想體驗一把“躺平式”生活,讓AI根據(jù)目的地和時間,幫我去找攻略訂機酒,然后填好信息等我付款。然而,理想很豐滿,現(xiàn)實很骨感。很多網(wǎng)站都要求強制登錄,登錄還要驗證碼,事實上這套驗證流程也是AI驅(qū)動的。

這場景,活脫脫一出“AI內(nèi)戰(zhàn)”,自家兄弟互相使絆子。今天,我們就來聊聊這場AI與反AI之間,既充滿技術(shù)含量又略帶戲謔色彩的攻防對決。

驗證碼:始于人機大亂斗

經(jīng)常搶票的朋友應該都見過各式各樣的驗證碼,特別是幾年前被調(diào)侃為地獄難度的12306驗證碼。不少朋友可能會覺得驗證碼純純就是用來為難人類的,說出來你可能不信,驗證碼設計之初其實是為了區(qū)分人類用戶和電腦。、

在互聯(lián)網(wǎng)發(fā)展初期,隨著網(wǎng)絡應用的普及,各種自動化程序開始大量涌現(xiàn),它們被用于發(fā)送垃圾郵件、惡意灌水論壇、批量注冊賬號等惡意行為,嚴重干擾了正常的網(wǎng)絡秩序,并給服務器帶來了巨大的資源消耗。

為了甄別操作者是真人還是機器,驗證碼便應運而生,全稱為Completely Automated Public Turing test to tell Computers and Humans Apart,即全自動區(qū)分計算機和人類的圖靈測試,簡稱為CAPTCHA。順帶一提,驗證碼的發(fā)明人路易斯·馮·安(Luis von Ahn)也是多鄰國的創(chuàng)始人之一,感覺我這輩子都被這個人拿捏了。

最初的驗證碼如同小學算術(shù)題,簡單的扭曲字符就能有效阻止當時的“腳本小子”。然而,道高一尺,魔高一丈,隨著OCR技術(shù)的進步,這些簡單的防線很快就被攻破。于是更復雜的字符變形、干擾線以及顏色變化都出現(xiàn)在驗證碼中,隨后,圖像驗證碼和音頻驗證碼相繼出現(xiàn)。

面對不斷升級的驗證碼,自動化工具的開發(fā)者們自然不會坐以待斃。他們開發(fā)出基于規(guī)則的腳本,專門破解特定的驗證碼模式。當驗證碼的復雜性超出機器的識別能力時,甚至出現(xiàn)了“人工打碼平臺”這種略顯“原始”但有效的解決方案,即通過雇傭大量人工來識別驗證碼。

我們在網(wǎng)上沖浪時看到的那種小廣告“大學生、無需學歷,只要會上網(wǎng)、會打字,一天包賺XXXXX”,其中有一部分廣告主就是人工打碼平臺,比如說識別一個驗證碼給你1分錢。當然還有很多是騙子,反詐意識不能松懈啊!

AI時代的驗證碼:難倒人類

進入AI時代,圖形驗證碼的設計也融入了AI技術(shù)?,F(xiàn)代圖形驗證碼不再僅僅是靜態(tài)的圖片,它們會利用AI算法動態(tài)生成更具挑戰(zhàn)性的圖像,例如要求用戶區(qū)分三角初音和初音未來,在一群吉伊中找出537(笑)。一些高級的驗證碼系統(tǒng)甚至會利用生成對抗網(wǎng)絡(GANs)來生成難以被現(xiàn)有AI模型識別的“對抗樣本”。

與此同時,AI也在不斷進化以破解這些由AI加持的驗證碼。利用深度學習中的卷積神經(jīng)網(wǎng)絡(CNNs),AI模型能夠?qū)W習識別各種復雜的圖像特征,從而準確地識別出驗證碼中的目標物體,更先進的AI還能理解驗證碼中的上下文信息,從而更有效地進行破解。

隨著AI能力的不斷提升,現(xiàn)在的圖形驗證碼已經(jīng)有超越人類理解范圍的趨勢了,在追求更高安全性的同時,或許我們也需要探索和采用其他形式的驗證方式,以提升用戶體驗。

人:我不是機器人

除了傳統(tǒng)的圖形驗證碼,現(xiàn)在也有不少網(wǎng)站換用這種只需要點一下就能證明你不是機器人的驗證方式。這種驗證方式由自谷歌的reCAPTCHA提供,常見的這種“我不是機器人”是v2版本,大部分情況下,用戶只需點擊一下即可完成驗證,體驗大幅提升。只有在系統(tǒng)認為可疑時才需要進行額外的圖片識別,但有時圖片識別的難度也較高。

打開網(wǎng)易新聞 查看精彩圖片

升級版的reCAPTCHA v3則更為隱蔽,完全在后臺運行,通過分析用戶的網(wǎng)站行為(例如鼠標移動、點擊等)給出一個風險評分。網(wǎng)站可以根據(jù)這個評分來決定是否需要進行額外的驗證,例如二次驗證或直接阻止操作。用戶通常無需進行任何顯式操作。

除了行為分析之外,很多驗證碼系統(tǒng)還會綜合采用環(huán)境與設備識別、蜜罐技術(shù)、頻率限制以及Web應用防火墻等多種防御手段,來抵御非人類用戶的訪問,這些技術(shù)同樣在背后借助了 AI 和機器學習的能力。

機器人:我是人

但是另一邊道上的AI也不是吃素的,也進化出了各種方法來對抗這種非圖形驗證碼。

面對行為分析,AI可以利用貝塞爾曲線模擬鼠標軌跡,使得鼠標的移動不再是死板的直線,而是富有曲折和停頓的自然路徑,猶如一個正常用戶在屏幕上漫無目的地游走。在點擊時,AI甚至能夠模擬人類在點擊前的細微漂移,避免那些精確到像素的點擊行為暴露其非人類的身份。

而在輸入時,它們通過模擬鍵盤輸入的節(jié)奏,掌握了人類打字的微妙停頓,甚至模擬回刪和錯打。你可能會發(fā)現(xiàn),當這些系統(tǒng)填寫在線表單時,它們不僅在內(nèi)容上準確無誤,甚至在每一個輸入框之間的停頓都顯得格外合情合理,就像一個真正的用戶在與電腦互動時的自然行為。就算它們偶爾打錯字,稍作修改,也不會讓人察覺出任何不對勁的地方。

為了最大程度地隱藏自己的真實身份,AI還會巧妙地切換網(wǎng)絡身份。它們利用大量的代理IP和虛擬專用網(wǎng)絡,每當一個IP被封鎖,它們就能迅速更換,繼續(xù)完成任務。

這些代理IP并非簡單地依賴數(shù)據(jù)中心的固定IP,而是通過住宅代理,模仿來自世界各地的普通用戶,從而避開了傳統(tǒng)反自動化系統(tǒng)的識別。而更為高階的策略則是在不顯眼的時刻,自動切換網(wǎng)絡節(jié)點,避免任何單一的訪問路徑暴露其身份。

除了對抗驗證碼的高超技巧外,AI還能夠分析網(wǎng)頁結(jié)構(gòu),精準識別并規(guī)避那些設有蜜罐陷阱的頁面。這些陷阱通常通過隱藏的表單字段或惡意重定向,來誘捕自動化工具。然而,AI能通過深度學習算法,識別這些設計并規(guī)避它們。

比如,面對使用了JavaScript 動態(tài)加載內(nèi)容的頁面,它們能夠模擬正常瀏覽器的行為,等待頁面加載完全,再進行后續(xù)操作,避免觸發(fā)反自動化防御機制。

在頻率限制方面,AI更是顯得巧妙無比。為了避免因頻繁請求而被識別為機器人,它們采取了分布式請求和智能調(diào)度的策略。這些代理分布在不同的網(wǎng)絡節(jié)點,就像是一群忙碌的工蜂,各自從不同的方向發(fā)起請求。通過這種方式,它們不僅能夠突破請求頻率限制,還能夠長期保持低調(diào),避免被系統(tǒng)察覺。

例如,AI可能會通過分布式爬蟲框架(如Scrapy)在不同的時間段,分批次請求數(shù)據(jù),從而完成目標任務,卻不被服務器檢測到異常。

總之,這些AI并不是單純依靠高效的計算能力,而是通過細致入微的策略和靈活應變的方式,在反自動化防線中反復拉扯,突破一道又一道看似堅不可摧的防護。

終極驗證碼:生物識別

看到這里,想必大家也預料到了,這場AI和反AI之間的博弈,注定是一場沒有終點的“貓鼠游戲”?,F(xiàn)在不少網(wǎng)站都采用郵箱、手機號等方式來驗證,要求登錄才能查看網(wǎng)站內(nèi)容,比如前陣子被罵上熱搜的知乎。不過高階的AI也可以利用群控等灰產(chǎn)繞過這些驗證,最后為難的還是那些普通人類用戶。

在金融、政務等對安全要求極高的領域,,大家經(jīng)常會接觸到生物識別驗證,比如指紋支付、人臉支付等,還有粵省事上各種刷臉辦的業(yè)務。一般來說這些生物識別技術(shù)是非常安全的,或者說要破解這些技術(shù)的成本遠遠超過了收益。是的你沒有聽錯,生物識別也是可以用AI破解的。

過去,想復制一枚指紋,需要一張非常清晰的指紋圖像。但現(xiàn)在,通過AI的圖像修復和超分辨率技術(shù),攻擊者甚至可以利用手機屏幕、杯子或照片中殘留的模糊指紋,生成高清的指紋紋理。隨后,結(jié)合3D打印或?qū)щ姴牧希谱鞒鲆幻犊捎糜诮怄i設備的假指紋。早在2014年,德國安全團隊Chaos Computer Club,就曾用類似方法成功解鎖iPhone。

此外,AI還被用來研究指紋識別算法的漏洞。2022年,美國密歇根州立大學與NIST(美國國家標準與技術(shù)研究院)聯(lián)合發(fā)布研究,利用AI生成的Master Prints(萬能指紋),在部分老舊安卓設備和低端指紋門禁系統(tǒng)中,仍有超過20%的成功率。

這類Master Prints并非復刻某個人的指紋,而是通過GAN(生成對抗網(wǎng)絡)和強化學習,學習大量指紋特征,生成最有可能被系統(tǒng)接受的通用紋路。研究還發(fā)現(xiàn),高端設備普遍配備活體檢測和多區(qū)域比對,難以被攻破,但部分廉價手機、門禁、行李鎖等依舊采用簡化算法,成為AI攻擊的高風險區(qū)。

類似的技術(shù)也被用于人臉識別。?學術(shù)界提出了“Master Faces”概念,通過AI學習海量人臉數(shù)據(jù),生成“最容易通過”的人臉模板。?研究顯示,在某些算法簡單或缺乏活體檢測的人臉識別系統(tǒng)中,這類技術(shù)的攻擊成功率甚至超過了40%。

此外,攻擊方式還包括Deepfake視頻偽裝、3D打印面具模擬,甚至是添加對抗樣本干擾圖像,讓AI模型誤判身份。根據(jù)Regula的Deepfake Trends 2024研究,近60%的企業(yè)認為視頻和音頻深度偽造構(gòu)成嚴重威脅,但44%的企業(yè)對自身檢測能力缺乏信心。?

說回本節(jié)開頭提到的破解成本,以前這種高階破解技術(shù)都是針對企業(yè)和富有人群的,可以簡單理解為如果破解一次的成本要10000元,那么黑客只會選那些有100萬的人下手,肯定是看不上我們普通人兜里那點。

然而,OpenAI的首席執(zhí)行官Sam Altman指出,AI的使用成本每年大約會下降10倍,這也使得這些高階破解技術(shù)的成本正在降低,如果現(xiàn)在破解一次的成本只要100元,那么我們普通人對于黑客而言也是有利可圖了。

安全沒有盡頭,但也不必為難人類

如果說,AI和驗證碼的對抗是一場貓鼠游戲,那它的規(guī)則其實早就寫在互聯(lián)網(wǎng)的歷史里:AI越來越聰明,驗證碼越來越難,自動化工具和防御機制,就這么你追我趕,版本號此起彼伏。

但有趣的是,最后往往受苦的,不是AI,也不是平臺,而是普通人類。畢竟,再強的驗證碼,難住的通常都是趕著登錄的打工人,或者深夜搶票的用戶,而不是那些繞過驗證的腳本。

好在,越來越多的安全設計,開始意識到這一點:驗證碼的目標,始終是防AI,不是折磨人?,F(xiàn)在越來越多的網(wǎng)站和App正在用更智能的方式來驗證用戶身份,而不是依賴那些讓人煩惱的驗證碼。

比如,蘋果在2022年推出的“自動驗證”功能,就是一個很好的例子:只要你在設備上登錄了Apple賬戶,當你訪問支持這一功能的App或網(wǎng)站時,系統(tǒng)就會在后臺自動確認你的身份,而你根本不用輸入驗證碼。

換句話說,就像你打開一個頁面,什么操作都不需要做,后臺已經(jīng)自動識別出你是個真實用戶。未來,我們可能會看到更多通過設備信譽和行為特征等智能手段來判斷用戶身份的技術(shù),從而讓上網(wǎng)體驗變得既簡單又安全。

畢竟,安全從來不是為了制造麻煩,技術(shù)在進化,驗證碼也該變得更有人情味一點。