打開網(wǎng)易新聞 查看精彩圖片

打開網(wǎng)易新聞 查看精彩圖片

隨著人工智能的發(fā)展,人工智能生成的圖像和文本與人類創(chuàng)作的內(nèi)容越來越難以區(qū)分。無論是逼真的深度偽造視頻、藝術(shù)作品還是復(fù)雜的聊天機(jī)器人,這些作品常常讓人們懷疑自己是否能分辨出什么是真實(shí)的,什么是人工智能制作的。

探索人們檢測人工智能生成內(nèi)容的準(zhǔn)確度,并將該準(zhǔn)確度與他們對自己能力的感知進(jìn)行比較。

人類檢測人工智能的能力

近年來,人工智能技術(shù)發(fā)展迅速,創(chuàng)造出視覺藝術(shù)、撰寫文章、創(chuàng)作音樂并生成高度逼真的人臉。隨著用于文本生成的 ChatGPT 和用于圖像創(chuàng)建的 DALL-E 等工具的興起,人工智能內(nèi)容已成為日常生活的一部分。曾經(jīng)看似明顯像機(jī)器的東西現(xiàn)在往往與人類的作品難以區(qū)分。

隨著人工智能內(nèi)容變得越來越復(fù)雜,檢測它的挑戰(zhàn)也越來越大。2023 年的一項(xiàng)研究表明,區(qū)分人工智能和人類內(nèi)容是多么困難。研究人員發(fā)現(xiàn),人工智能生成的面孔實(shí)際上比真實(shí)面孔更像人類,這種現(xiàn)象被稱為超現(xiàn)實(shí)主義。

在這項(xiàng)研究中,參與者被要求區(qū)分人工智能生成的面孔和真人面孔。令人驚訝的是,那些在識別人工智能面孔方面表現(xiàn)較差的人對自己識別人工智能面孔的能力更有信心。這種過度自信放大了他們的錯(cuò)誤,因?yàn)閰⑴c者總是誤認(rèn)為人工智能生成的面孔更像人類,尤其是當(dāng)面孔是白人時(shí)。

打開網(wǎng)易新聞 查看精彩圖片

研究還發(fā)現(xiàn),人工智能面孔通常被認(rèn)為比人類面孔更熟悉、更勻稱、更有吸引力——這些屬性影響了參與者的誤判。這些發(fā)現(xiàn)凸顯了人工智能生成的內(nèi)容如何利用某些心理偏見,使個(gè)人更難準(zhǔn)確識別什么是真實(shí)的,什么是人工制作的。

在一項(xiàng)涉及 100 名不同年齡段參與者的相關(guān)研究中,結(jié)果表明,年輕參與者更善于識別人工智能生成的圖像,而老年人則更難識別。有趣的是,參與者的信心和準(zhǔn)確率之間也存在正相關(guān)關(guān)系,盡管常見的錯(cuò)誤分類與動物皮毛和人類手中不自然的細(xì)節(jié)等細(xì)微的偽影有關(guān)。

人工智能為何難以被發(fā)現(xiàn)?

人們難以區(qū)分人類創(chuàng)造的內(nèi)容和人工智能生成的內(nèi)容的原因有很多。其中一個(gè)原因是人工智能越來越現(xiàn)實(shí),尤其是所謂的強(qiáng)人工智能和弱人工智能。

弱人工智能是指旨在處理特定任務(wù)(如生成文本或圖像)的系統(tǒng),雖然它們模仿人類行為,但它們并不具備真正的理解力或意識。弱人工智能的例子包括聊天機(jī)器人和圖像生成器。另一方面,強(qiáng)人工智能代表了假設(shè)的系統(tǒng),它們可以在各種任務(wù)中像人類一樣思考、學(xué)習(xí)和適應(yīng)。

目前,大多數(shù)人日常使用的工具都屬于弱人工智能。然而,它們模擬人類創(chuàng)造力和推理的能力已經(jīng)非常先進(jìn),以至于區(qū)分人類和人工智能生成的內(nèi)容變得越來越困難。

OpenAI 的 GPT 模型等工具已在大量數(shù)據(jù)集上進(jìn)行訓(xùn)練,使它們能夠生成自然連貫的語言。同樣,圖像生成器已在數(shù)百萬個(gè)視覺輸入上進(jìn)行訓(xùn)練,使它們能夠創(chuàng)建與現(xiàn)實(shí)極為相似的逼真圖片。

此外,人工智能現(xiàn)在不僅可以復(fù)制人類作品的外觀,還可以復(fù)制其風(fēng)格和語調(diào)。例如,人工智能撰寫的文本可以模仿專業(yè)寫作的細(xì)微差別,根據(jù)上下文采用適當(dāng)?shù)恼Z調(diào)、結(jié)構(gòu)甚至個(gè)性特征。這種適應(yīng)性使人們更難依靠直覺來判斷某篇文章是機(jī)器寫的還是人寫的。

另一個(gè)挑戰(zhàn)是缺乏明確的跡象。雖然早期的人工智能作品通??梢酝ㄟ^笨拙的語法、奇怪的圖像偽像或過于簡單的結(jié)構(gòu)來識別,但現(xiàn)代人工智能已經(jīng)變得更加善于消除這些跡象。因此,即使是熟悉該技術(shù)的人也很難依靠以前的模式來檢測人工智能作品。

案例研究:人類檢測人工智能生成的內(nèi)容

多項(xiàng)研究已經(jīng)證實(shí)了檢測人工智能內(nèi)容的挑戰(zhàn)。

打開網(wǎng)易新聞 查看精彩圖片

一項(xiàng)研究中,教師正確識別 AI 生成的學(xué)生論文的概率僅為 37.8%-45.1%,具體取決于他們的經(jīng)驗(yàn)水平。同樣,另一項(xiàng)研究中的參與者分別只能以58% 和 50% 的概率識別出 GPT-2 和 GPT-3 的內(nèi)容,這表明在區(qū)分 AI 與人類作品時(shí),人類判斷力存在局限性。

賓夕法尼亞州立大學(xué)進(jìn)行的實(shí)驗(yàn)進(jìn)一步證實(shí)了這些發(fā)現(xiàn),參與者只能在 53% 的時(shí)間內(nèi)區(qū)分出人工智能生成的文本,僅比隨機(jī)猜測好一點(diǎn)點(diǎn)。這凸顯了人們檢測人工智能內(nèi)容的難度,即使在人類和人工智能編寫的文本之間進(jìn)行二元選擇時(shí)也是如此。

在科學(xué)摘要和住院醫(yī)師申請等專業(yè)領(lǐng)域,擁有多年經(jīng)驗(yàn)的專業(yè)人士正確識別人工智能生成內(nèi)容的概率僅為 62%。評估人員以 65.9% 的準(zhǔn)確率識別出人工智能編寫的住院醫(yī)師申請,這凸顯了人工智能日益復(fù)雜化以及依靠人類感知進(jìn)行檢測的挑戰(zhàn)。

另一項(xiàng)研究顯示,人類有 54%的時(shí)間將 GPT-4 誤認(rèn)為是人類,這表明即使是高級用戶也難以檢測。大學(xué)教師正確識別人工智能生成的論文的幾率為 70%,而學(xué)生的正確率僅為 60%。盡管這些數(shù)字較高,但仍然存在相當(dāng)大的誤差幅度,這表明在學(xué)術(shù)界準(zhǔn)確檢測人工智能內(nèi)容的難度很大。

影響人工智能檢測準(zhǔn)確率的因素

有幾個(gè)因素會影響人們判斷人工智能內(nèi)容的能力。其中一個(gè)因素是所分析內(nèi)容的復(fù)雜性。人工智能生成的文本越短,就越難檢測,因?yàn)樽x者沒有太多背景信息來識別不尋常的措辭或結(jié)構(gòu)。

相比之下,較長的文本可能會為讀者提供更多機(jī)會來注意到表明人工智能參與的不一致或模式。同樣的原則也適用于圖像——簡單的圖片可能更難與真實(shí)圖片區(qū)分開來,而高度復(fù)雜的場景有時(shí)可以揭示人工智能生成的微妙跡象。

最后,所使用的 AI 模型類型也會影響檢測準(zhǔn)確性。例如,OpenAI 的 GPT-3 模型比舊版本生成更令人信服的文本,而 MidJourney 等較新的圖像生成工具比其前代產(chǎn)品創(chuàng)建更逼真的視覺效果。

人工智能檢測的心理影響

檢測人工智能生成內(nèi)容的難度引發(fā)了重要的心理和社會問題。其中之一是人們對所見所聞的信任程度有多高。

打開網(wǎng)易新聞 查看精彩圖片

人工智能越來越擅長模仿人類的創(chuàng)造力,因此制造和傳播虛假信息變得更加容易,因?yàn)槿藗兛赡軙诓恢榈那闆r下消費(fèi)由機(jī)器出于特定目的制作的內(nèi)容。這在政治言論等領(lǐng)域尤其令人擔(dān)憂,因?yàn)槿斯ぶ悄苤谱鞯纳疃葌卧旎蛘`導(dǎo)性文章可能會影響公眾輿論。

此外,許多人對檢測人工智能制作的內(nèi)容過于自信,這會導(dǎo)致一種虛假的安全感。事實(shí)上,即使是人工智能專家也難免會被復(fù)雜的機(jī)器制作的作品所欺騙。這種現(xiàn)象被稱為“解釋深度錯(cuò)覺”,即人們僅僅因?yàn)槭煜?fù)雜系統(tǒng)的基本原理,就高估了自己對它的理解。

人工智能檢測的未來:情況能否改善?

面對這些挑戰(zhàn),我們可以做些什么來提高人類檢測人工智能生成內(nèi)容的能力呢?一個(gè)可能的解決方案是開發(fā)人工智能檢測工具。正如人工智能在生成內(nèi)容方面變得更好一樣,研究人員也在致力于創(chuàng)建能夠識別某些東西是否由機(jī)器制作的系統(tǒng)。

打開網(wǎng)易新聞 查看精彩圖片

教育是另一個(gè)潛在的解決方案。通過提高對人類判斷的局限性和人工智能的復(fù)雜性的認(rèn)識,人們在評估內(nèi)容時(shí)可以變得更加謹(jǐn)慎和批判。教授個(gè)人如何識別人工智能制作的內(nèi)容的課程,例如分析文本中的異常模式或發(fā)現(xiàn)圖像中的不一致之處,可以幫助提高檢測準(zhǔn)確性。

人工智能檢測的未知復(fù)雜性

隨著人工智能模糊了人類和機(jī)器生成內(nèi)容之間的界限,人們越來越難以準(zhǔn)確識別人工智能創(chuàng)作。

雖然許多人都認(rèn)為自己有很強(qiáng)的識別人工智能的能力,但事實(shí)上,大多數(shù)人在區(qū)分真實(shí)內(nèi)容和機(jī)器制作內(nèi)容方面的能力只比隨機(jī)性強(qiáng)一點(diǎn)點(diǎn)。感知與現(xiàn)實(shí)之間的差距凸顯了現(xiàn)代人工智能的復(fù)雜性,以及對基于技術(shù)的解決方案和增強(qiáng)意識以駕馭這一新數(shù)字環(huán)境的需求。

未來幾年,隨著人工智能的不斷進(jìn)步,人們必須確定自己在檢測人工智能方面的能力以及人工智能的重要性。隨著機(jī)器進(jìn)一步融入日常生活,人們的關(guān)注點(diǎn)可能會從檢測轉(zhuǎn)向了解如何與人工智能共存,以保持信任、創(chuàng)造力和人類真實(shí)性。

免責(zé)聲明:

本文所發(fā)布的內(nèi)容和圖片旨在傳播行業(yè)信息,版權(quán)歸原作者所有,非商業(yè)用途。如有侵權(quán),請與我們聯(lián)系。所有信息僅供參考和分享,不構(gòu)成任何投資建議。投資者應(yīng)基于自身判斷和謹(jǐn)慎評估做出決策。投資有風(fēng)險(xiǎn),入市需謹(jǐn)慎。

關(guān)注我們,一起探索AWM!

2025-03-24

2025-03-25

2025-03-22