一項(xiàng)干預(yù)時(shí)長(zhǎng)為一個(gè)學(xué)期(2023 年秋期),試驗(yàn)學(xué)生群體為 1000 人( 9 年級(jí)、10 年級(jí)和 11 年級(jí)的學(xué)生)的研究發(fā)現(xiàn):像 ChatGPT 這樣的 AI 工具可以短暫提高學(xué)生測(cè)試成績(jī),但最終卻削弱了學(xué)生的學(xué)習(xí)能力和知識(shí)保留。
很多關(guān)于AI對(duì)學(xué)生學(xué)習(xí)的幫助的研究都只是文獻(xiàn)綜述,而另一些班級(jí)實(shí)驗(yàn)性質(zhì)的研究也是短期研究。當(dāng)然,很多好的綜述性質(zhì)研究早就點(diǎn)明:AI 對(duì)學(xué)習(xí)的影響仍然缺乏長(zhǎng)期研究的支持。雖然和大多數(shù)人一樣我也認(rèn)為 AI 在學(xué)習(xí)中會(huì)起更多積極作用,但是口說無憑,我們要基于證據(jù)說話。
論文發(fā)表于沃頓商學(xué)院校報(bào)(The Wharton School Research Paper),題目為《生成式 AI 可以傷害學(xué)習(xí)(Generative AI Can Harm Learning)》,被美國(guó)知名教育媒體 Edutopia 稱為 2024 年 10 大重要教育研究之一。
一、驗(yàn)證生成式 AI 是否降低學(xué)習(xí)能力
生成式 AI 技術(shù)迅速發(fā)展,已經(jīng)在許多領(lǐng)域展現(xiàn)出能夠顯著提高人類工作效率的潛力,并且在一些任務(wù)中達(dá)到了人類水平的表現(xiàn)。例如,在醫(yī)療考試和編程競(jìng)賽等任務(wù)中,生成式 AI 都有出色的表現(xiàn)。隨著這種技術(shù)在各個(gè)領(lǐng)域的廣泛應(yīng)用,人們開始關(guān)注它在教育領(lǐng)域的影響。教育是培養(yǎng)人類技能和知識(shí)的重要場(chǎng)所,而生成式 AI 的應(yīng)用可能會(huì)對(duì)學(xué)生的技能學(xué)習(xí)產(chǎn)生重要影響,這種影響可能是正面的,也可能是負(fù)面的。

關(guān)于學(xué)生能否有效地將人工智能輔助融入學(xué)習(xí)并區(qū)分人工智能輔助與自己的理解能力成為問題。這項(xiàng)研究要求學(xué)生先上節(jié)數(shù)學(xué)復(fù)習(xí)課,然后上一節(jié)練習(xí)課(可以使用傳統(tǒng)方法——如筆記和教科書——或人工智能工具,包括 ChatGPT 的基本版本和專門開發(fā)的 AI 輔導(dǎo)師來做課堂練習(xí)),最后是閉卷考試。
這項(xiàng)研究在土耳其一所高中進(jìn)行了實(shí)地實(shí)驗(yàn),涉及近 1000 名 9 年級(jí)、10 年級(jí)和 11 年級(jí)的學(xué)生,旨在研究生成式 AI(特別是 OpenAI 的 GPT - 4)對(duì)數(shù)學(xué)課堂上學(xué)生學(xué)習(xí)的影響。實(shí)驗(yàn)設(shè)計(jì)為隨機(jī)對(duì)照試驗(yàn)(RCT),在 2023 - 2024 學(xué)年秋季學(xué)期進(jìn)行。
研究包括每個(gè)年級(jí)的四次 90 分鐘課程,輔導(dǎo)程序占該學(xué)期數(shù)學(xué)課程內(nèi)容的約 15%。每次課程分為三個(gè)主要部分。首先,教師像正常復(fù)習(xí)課一樣復(fù)習(xí)之前學(xué)過的主題,并在黑板上解決一些示例問題。其次,有一個(gè)輔助練習(xí)階段,學(xué)生解決由教師設(shè)計(jì)的練習(xí)題,以鞏固所學(xué)概念。這是隨機(jī)干預(yù)的部分。學(xué)生被分配到三個(gè)組別之一:對(duì)照組、GPT 基礎(chǔ)組和AI 導(dǎo)師組。
對(duì)照組使用標(biāo)準(zhǔn)資源,如課程書和筆記。對(duì)于 GPT 基礎(chǔ)組和AI 導(dǎo)師組,學(xué)生使用筆記本電腦訪問相應(yīng)的輔導(dǎo)程序。GPT 基礎(chǔ)組是一個(gè)類似于 ChatGPT 的簡(jiǎn)單聊天界面,而AI導(dǎo)師組的提示詞中包含額外的保護(hù)措施,只是指導(dǎo)學(xué)生而不直接給出完整答案。
完成了復(fù)習(xí)課講授,復(fù)習(xí)課練習(xí),學(xué)生進(jìn)行閉卷考試??荚囍械膯栴}與前一部分的練習(xí)題類似。
最初,使用人工智能工具的學(xué)生表現(xiàn)出顯著進(jìn)步,使用ChatGPT和AI輔導(dǎo)師的學(xué)生分別比僅使用紙筆的同學(xué)們高出 48%和 127%。

然而,這種成功是短暫的:在后續(xù)的閉卷測(cè)試中,使用人工智能的學(xué)生分?jǐn)?shù)急劇下降:使用 ChatGPT 做復(fù)習(xí)指導(dǎo)的班級(jí)比普通班級(jí)成績(jī)低了 17%;而使用 AI 導(dǎo)師的班級(jí)和普通班級(jí)無明顯差異。
這表明,雖然生成式 AI 可以在短期內(nèi)提高學(xué)生的學(xué)習(xí)表現(xiàn),但可能會(huì)在長(zhǎng)期內(nèi)削弱學(xué)生的學(xué)習(xí)能力(順便說一句,很多類似的班級(jí)試驗(yàn)研究都是只在短期內(nèi)測(cè)了學(xué)生的成績(jī),沒有做長(zhǎng)期的研究)。

研究指出,人工智能正在快速發(fā)展,但并不能取代教師。當(dāng)這些工具被設(shè)計(jì)用于指導(dǎo)學(xué)生學(xué)習(xí)時(shí)——例如拒絕給出答案或提出深入追問(參見此處、此處和此處的研究)——它們的表現(xiàn)良好;但該類軟件仍然受制于其起源的悖論:人類能否聰明到設(shè)計(jì)出比自己更聰明的工具。
三、為什么短期提升,長(zhǎng)期退步文章討論了實(shí)驗(yàn)中學(xué)生測(cè)試成績(jī)短期表現(xiàn)提升的原因:
- 快速獲取答案:ChatGPT 能夠迅速提供問題的答案或解題思路,幫助學(xué)生在短時(shí)間內(nèi)完成更多的練習(xí)題,從而在短期內(nèi)提高學(xué)習(xí)成績(jī)。
- 個(gè)性化輔導(dǎo):ChatGPT 可以根據(jù)學(xué)生的問題提供個(gè)性化的解答,幫助學(xué)生更好地理解知識(shí)點(diǎn),解決學(xué)習(xí)中的困惑
- 提高學(xué)習(xí)效率:ChatGPT 可以提供大量的學(xué)習(xí)資源和信息,幫助學(xué)生更高效地學(xué)習(xí),節(jié)省時(shí)間和精力。
- 過度依賴:學(xué)生在使用 ChatGPT 時(shí),可能會(huì)過度依賴其提供的答案,而缺乏獨(dú)立思考和解決問題的能力。這種依賴性會(huì)導(dǎo)致學(xué)生在沒有 ChatGPT 的情況下,難以獨(dú)立完成學(xué)習(xí)任務(wù)。
- 缺乏深度理解:ChatGPT 提供的答案可能過于簡(jiǎn)潔或直接,學(xué)生在使用過程中可能只是機(jī)械地接受答案,而沒有深入理解其背后的原理和邏輯。這種淺層次的學(xué)習(xí)方式不利于學(xué)生的長(zhǎng)期發(fā)展。
- 錯(cuò)誤信息:ChatGPT 的回答并不總是完全準(zhǔn)確,學(xué)生在使用過程中可能會(huì)接觸到錯(cuò)誤的信息,從而影響學(xué)習(xí)效果。如果學(xué)生缺乏辨別能力,可能會(huì)將錯(cuò)誤信息當(dāng)作正確答案,導(dǎo)致學(xué)習(xí)偏差。
- 學(xué)習(xí)動(dòng)機(jī)下降:長(zhǎng)期使用 ChatGPT 可能會(huì)導(dǎo)致學(xué)生的學(xué)習(xí)動(dòng)機(jī)下降。由于 ChatGPT 能夠輕松提供答案,學(xué)生可能會(huì)減少對(duì)學(xué)習(xí)的投入和努力,從而影響學(xué)習(xí)效果。
- 缺乏實(shí)踐機(jī)會(huì):學(xué)生在使用 ChatGPT 時(shí),可能會(huì)減少自己動(dòng)手實(shí)踐的機(jī)會(huì)(比如列豎式計(jì)算)。實(shí)踐是學(xué)習(xí)的重要環(huán)節(jié),缺乏實(shí)踐機(jī)會(huì)會(huì)影響學(xué)生對(duì)知識(shí)的掌握和應(yīng)用能力。
進(jìn)一步研究學(xué)生和 AI 的對(duì)話記錄,研究者發(fā)現(xiàn),使用基礎(chǔ)版 ChatGPT 的學(xué)生參與的是膚淺(Superficial)的互動(dòng),經(jīng)常直接向 AI 提問,如“答案是什么?”。
研究人員得出結(jié)論,在技能培養(yǎng)階段未經(jīng)指導(dǎo)使用 AI 可能會(huì)成為一種障礙——并可能限制學(xué)習(xí)。研究人員得出結(jié)論,一旦有機(jī)會(huì),學(xué)生會(huì)將軟件當(dāng)作“外掛”,經(jīng)常直接跳到答案(我想起自己高中看到周末作業(yè)上寫的是某市聯(lián)考然后去網(wǎng)吧搜答案的經(jīng)歷)。在學(xué)習(xí)的關(guān)鍵階段部署這項(xiàng)技術(shù)實(shí)際上“有削弱學(xué)習(xí)能力的風(fēng)險(xiǎn)”。
這項(xiàng)研究表明,直接給學(xué)生在課堂上使用 ChatGPT 輔助學(xué)習(xí)在短期內(nèi)可以提高學(xué)生的成績(jī)和學(xué)習(xí)效率,但長(zhǎng)期來看,可能會(huì)導(dǎo)致學(xué)生過度依賴、缺乏深度理解、接觸到錯(cuò)誤信息、學(xué)習(xí)動(dòng)機(jī)下降以及缺乏實(shí)踐機(jī)會(huì)等問題,從而影響學(xué)生的學(xué)習(xí)效果和長(zhǎng)期發(fā)展。因此,在使用 ChatGPT 時(shí),學(xué)生應(yīng)該注意合理使用,避免過度依賴,同時(shí)加強(qiáng)獨(dú)立思考和實(shí)踐能力的培養(yǎng)。
熱門跟貼