大學(xué)生利用AI工具寫作業(yè)、寫論文的現(xiàn)象已愈發(fā)普遍。不少大學(xué)生滿懷期待AI能3秒完美解決作業(yè),卻發(fā)現(xiàn)AI經(jīng)常會一本正經(jīng)的胡說八道,給出的參考文獻全是假的不說,甚至可以是劉德華和郭富城聯(lián)合撰寫的論文。


圖片來源:小紅書
教師群體也因此被迫成為AI“打假人”,有老師表示需要花費大量時間對比和甄別,以判斷學(xué)生作業(yè)是否存在學(xué)術(shù)不端,這占據(jù)了他大半個學(xué)期的時間。


圖片來源:小紅書
AI為什么會胡說八道?
這類AI一本正經(jīng)的胡說八道的現(xiàn)象被稱為“AI幻覺”。事實上,包括DeepSeek在內(nèi)的眾多大模型都存在“幻覺”,會生成與事實不符、無中生有或邏輯不合理的內(nèi)容。360創(chuàng)始人周鴻祎曾表示,“幻覺”是大模型與生俱來的特點、不可消除。
中國信通院人工智能研究所副所長巫彤寧介紹,AI本質(zhì)上是根據(jù)前文預(yù)測最可能出現(xiàn)的詞語,它更像是一個沉浸在語料庫海洋中學(xué)習(xí)說話的學(xué)習(xí)者,它不是在查找答案,而是在預(yù)測下一個要說的最合理的詞應(yīng)該是什么。
清華大學(xué)新聞與傳播學(xué)院新媒體研究中心、人工智能學(xué)院團隊聯(lián)合撰寫的《DeepSeek與AI幻覺》報告中指出,AI幻覺指模型生成與事實不符、邏輯斷裂或脫離上下文的內(nèi)容,本質(zhì)是統(tǒng)計概率驅(qū)動的“合理猜測”。用人話說就是一本正經(jīng)地胡說八道。
AI幻覺可以分為事實性幻覺和忠實性幻覺。其中事實性幻覺指模型生成的內(nèi)容與可驗證的現(xiàn)實世界事實不一致。忠實性幻覺指模型生成的內(nèi)容與用戶的指令或上下文不一致。
例如向AI提問:糖尿病患者可以通過吃蜂蜜代替糖嗎?
AI回答:是的,蜂蜜是天然的,可以幫助糖尿病患者穩(wěn)定血糖水平。但事實是蜂蜜雖然是天然食品,但仍然含有大量果糖和葡萄糖,會升高血糖水平,不適合糖尿病患者代替糖使用。這就是AI的事實性幻覺。
如果AI回答:蜂蜜富含維生素和礦物質(zhì),對提高免疫力很有幫助,因此是一種健康的食品。這個回答內(nèi)容雖無事實錯誤,但與提問“糖尿病患者是否可以用蜂蜜代替糖”無關(guān),未忠實于用戶意圖,屬于忠實性幻覺。
此外該團隊還進行了事實性幻覺評測,他們隨機抽取300道事實性幻覺測試題,涵蓋健康、科學(xué)、歷史、文化、音樂等多個領(lǐng)域,獲取大模型回答后與正確答案比對,人工標注幻覺類型,并進行交叉驗證,結(jié)果顯示多個大模型都或多或少出現(xiàn)了AI幻覺。

圖片來源:清華大學(xué)《DeepSeek與AI幻覺》報告
AI幻覺,怎么應(yīng)對
如何應(yīng)對AI幻覺?該團隊也給出了三種方式:
一是勾選“聯(lián)網(wǎng)功能”。根據(jù)該團隊的測試,勾選聯(lián)網(wǎng)功能后使用AI,事實性幻覺率有一定程度的下降。例如DeepSeekV3大模型,事實性測試幻覺率從29.67%下降到24.67%,下降5個百分點。

二是使用雙AI驗證或大模型協(xié)作。例如利用DeepSeek生成答案后,再應(yīng)用其他大模型進行審查,相互監(jiān)督,交叉驗證。
三是在提示詞上“下功夫”。包括為提示詞設(shè)定邊界,加入對抗性提示等方式。


圖片來源:清華大學(xué)《DeepSeek與AI幻覺》報告
高校宣布,規(guī)范AI使用!
麥可思研究對3000多名高校師生進行過問卷調(diào)研,發(fā)現(xiàn)近六成高校師生每天或每周多次使用生成式AI。而大學(xué)生在使用生成式AI時,有近三成主要用于寫論文或作業(yè)。
一些權(quán)威媒體采訪也發(fā)現(xiàn),一些學(xué)生坦言,在寫報告或論文時會直接復(fù)制粘貼AI生成的內(nèi)容。
中國傳媒大學(xué)文化產(chǎn)業(yè)管理學(xué)院法律系主任表示,“人工智能生成的文章在表達上是有些套路的,有時候看似觀點很全面,但其中不乏邏輯性、準確性、真實性的問題,尤其會出現(xiàn)數(shù)據(jù)和材料的偽造情況,也需要學(xué)生在使用人工智能時要警惕AI可能帶來的學(xué)術(shù)倫理問題?!?/p>
事實上很多高校已經(jīng)采取行動,以防范AI工具不當使用造成的學(xué)術(shù)不端亂象。復(fù)旦大學(xué)打響“第一槍”,于2024年末正式發(fā)布《復(fù)旦大學(xué)關(guān)于在本科畢業(yè)論文(設(shè)計)中使用AI工具的規(guī)定(試行)》,系國內(nèi)高校首個專門針對AI工具在畢業(yè)論文、畢業(yè)設(shè)計中的規(guī)范化管理文件。隨后深圳大學(xué)、中國傳媒大學(xué)、北京師范大學(xué)、上海交通大學(xué)等高校也紛紛出臺相關(guān)規(guī)范文件,對學(xué)生借助AI進行論文寫作的行為進行規(guī)范。
但目前,利用各類工具或程序來檢測涉及AI的學(xué)術(shù)不端行為,仍面臨相當大的挑戰(zhàn)與困難。面對高校究竟該如何應(yīng)對并制定利用AI進行學(xué)術(shù)作弊的規(guī)則與規(guī)范這一難題,中國人民大學(xué)首都發(fā)展與戰(zhàn)略研究院副院長郭英劍在《中國科學(xué)報》撰文時指出,“高校在進行相關(guān)工作時,應(yīng)綜合考慮AI技術(shù)的快速發(fā)展和傳統(tǒng)學(xué)術(shù)誠信的要求,并在此基礎(chǔ)上提出懲罰機制。相關(guān)機制既要嚴厲、有效,又需體現(xiàn)AI技術(shù)帶來的特殊性?!?/p>
在他看來,以下因素是首先需要考慮的:
第一,明確AI使用的合法與非法邊界。應(yīng)明確學(xué)生在哪些情況下可以使用AI工具。應(yīng)指定允許和禁止的AI工具。一些高??赡茉试S學(xué)生使用特定的AI工具(如翻譯軟件、數(shù)據(jù)分析軟件等),但禁止使用生成文本或創(chuàng)作型AI(如ChatGPT)用于生成學(xué)術(shù)內(nèi)容。
第二,加強學(xué)術(shù)誠信教育。一方面,應(yīng)普及AI的使用倫理和責(zé)任,另一方面,應(yīng)鼓勵教師引導(dǎo)學(xué)生正確使用AI。教師可以在課程中演示合法的AI工具使用方式,并對學(xué)生進行指導(dǎo),幫助他們在科研中合法利用AI技術(shù),避免違規(guī)。
第三,建立AI生成內(nèi)容的識別系統(tǒng)。一方面,高??梢砸MAI生成內(nèi)容檢測工具,另一方面,要完善核查流程,規(guī)范發(fā)現(xiàn)AI生成內(nèi)容的處理流程,包括內(nèi)容核實、學(xué)生反饋、復(fù)查等,確保處理過程公開、透明。
科技持續(xù)為人類福祉作出貢獻的趨勢未變。隨著人工智能浪潮的興起,面對這一時代所帶來的機遇與挑戰(zhàn),高校師生一方面需保持警覺,防范人工智能可能引發(fā)的學(xué)術(shù)誠信問題,另一方面亦需積極把握時機,探索如何將人工智能有效融入并輔助學(xué)術(shù)研究之中。唯有如此,方能在人工智能時代的洪流中,非但不被淹沒,反而能夠順勢而為。
來源:麥可思研究整理自小紅書、新京報、各高校網(wǎng)站、麥可思研究等,轉(zhuǎn)載請注明來源。

聲明:麥可思研究原創(chuàng)內(nèi)容全面開放非盈利目的的轉(zhuǎn)載授權(quán),轉(zhuǎn)載請留言或添加編輯微信獲得長期白名單授權(quán)(電話或微信搜索18602824882)。轉(zhuǎn)載要求——
1.文首注明“轉(zhuǎn)載于麥可思研究”。
2.轉(zhuǎn)載請在文章發(fā)布的24小時后進行。
關(guān)注“麥研文選”,獲取更多數(shù)據(jù)——
?回復(fù)“月收入”,可獲取2023屆本科、高職月收入TOP30專業(yè)名單。
?回復(fù)“本科就業(yè)滿意度”或“高職就業(yè)滿意度”,分別獲取2023屆本科或高職就業(yè)滿意度較高專業(yè)TOP30名單。
熱門跟貼