打開網(wǎng)易新聞 查看精彩圖片

蔣璟璟

“熬夜寫的論文,AI檢測直接判了80%!”大四學(xué)生曉妍(化名)在社交平臺上的抱怨,引來大量畢業(yè)生共鳴。為了探究檢測工具的實際情況,記者進行了一個實驗:將朱自清的名篇《荷塘月色》與劉慈欣《流浪地球》的片段上傳至某常用論文檢測系統(tǒng)后,結(jié)果顯示,這兩篇經(jīng)典作品AI生成內(nèi)容總體疑似度竟分別達(dá)到了62.88%和52.88%。這樣的檢測結(jié)果,也讓學(xué)生們普遍多了些“論文被AI誤判”的擔(dān)憂。(大河報)

朱自清荷塘月色》被檢出高AI率,這一結(jié)果,其實并不能說明太多問題。我們知道,嚴(yán)格說來AI本身并沒有內(nèi)容原生能力,而是根據(jù)既有的語料、素材進行化煉合成?,F(xiàn)階段,市面上很多AI檢測系統(tǒng),恰恰是基于這一大前提,通過判斷文本的原生度,來反推其AI生成的概率。將《荷塘月色》的片段投入此類論文檢測系統(tǒng),系統(tǒng)很容易檢測出其與公開資料高度重合,由此判定原生度高、AI概率高,從邏輯角度說,這是沒有問題的。

所謂“AI論文反識別”,當(dāng)然無法判斷《荷塘月色》是不是AI寫的,其能判斷的是,這部分被拿來檢測的《荷塘月色》片段文字,是不是與現(xiàn)有的語料庫、數(shù)據(jù)庫信息雷同,繼而“若雷同則視作AI生成”。這里面其實有個已知可證、遞進推理的思維在。而需要說明的是,“雷同文本”鑒別,其實只是最初階的AI檢測模塊,這屬于小兒科的功能,并不能體現(xiàn)水平。用AI生產(chǎn)的論文,去測試AI論文反識別系統(tǒng),才有基本的合理性——當(dāng)然了,其結(jié)果也可能并不樂觀。

好的AI論文反識別系統(tǒng),至少應(yīng)該有兩個基本的素質(zhì),也即準(zhǔn)確率高、誤傷率低。從目前來看,市面上的很多AI論文反識別系統(tǒng),在這兩個指標(biāo)上的表現(xiàn)都很難令人滿意。比如說,不少學(xué)生吐槽,自己辛辛苦苦“手搓”的論文,卻被系統(tǒng)檢測判定含AI率太高,簡直比竇娥還冤。之于此,固然確有一部分論文寫得AI里AI氣而被錯判的成分,但同樣更應(yīng)該看到,當(dāng)下的很多AI論文反識別系統(tǒng),的確不靠譜。

在AI平臺后臺記錄不公開、不上傳、不聯(lián)通的前提下,所謂的AI論文反識別,從本質(zhì)上說,只是一種基于概率的可能性測算,這并不是實錘、實證。之于此,很多高校心知肚明,其之所以要新設(shè)“AI檢測”這道流程,更多只是一種姿態(tài)釋放,為的是彰顯對學(xué)術(shù)標(biāo)準(zhǔn)和學(xué)術(shù)品德的不棄防。AI論文反識別,可能誤傷,而就算通過了其檢測,也可能是錯放。整個過程中,并不可靠的技術(shù)權(quán)威、基于工具理性的形式判斷,替代了學(xué)術(shù)人能動的實質(zhì)判斷、價值評判,這很難說不是本末倒置。