一項干預時長為一個學期(2023 年秋期),試驗學生群體為 1000 人( 9 年級、10 年級和 11 年級的學生)的研究發(fā)現(xiàn):像 ChatGPT 這樣的 AI 工具可以短暫提高學生測試成績,但最終卻削弱了學生的學習能力和知識保留。
很多關(guān)于AI對學生學習的幫助的研究都只是文獻綜述,而另一些班級實驗性質(zhì)的研究也是短期研究。當然,很多好的綜述性質(zhì)研究早就點明:AI 對學習的影響仍然缺乏長期研究的支持。雖然和大多數(shù)人一樣我也認為 AI 在學習中會起更多積極作用,但是口說無憑,我們要基于證據(jù)說話。
論文發(fā)表于沃頓商學院校報(The Wharton School Research Paper),題目為《生成式 AI 可以傷害學習(Generative AI Can Harm Learning)》,被美國知名教育媒體 Edutopia 稱為 2024 年 10 大重要教育研究之一。
一、驗證生成式 AI 是否降低學習能力
生成式 AI 技術(shù)迅速發(fā)展,已經(jīng)在許多領(lǐng)域展現(xiàn)出能夠顯著提高人類工作效率的潛力,并且在一些任務中達到了人類水平的表現(xiàn)。例如,在醫(yī)療考試和編程競賽等任務中,生成式 AI 都有出色的表現(xiàn)。隨著這種技術(shù)在各個領(lǐng)域的廣泛應用,人們開始關(guān)注它在教育領(lǐng)域的影響。教育是培養(yǎng)人類技能和知識的重要場所,而生成式 AI 的應用可能會對學生的技能學習產(chǎn)生重要影響,這種影響可能是正面的,也可能是負面的。

關(guān)于學生能否有效地將人工智能輔助融入學習并區(qū)分人工智能輔助與自己的理解能力成為問題。這項研究要求學生先上節(jié)數(shù)學復習課,然后上一節(jié)練習課(可以使用傳統(tǒng)方法——如筆記和教科書——或人工智能工具,包括 ChatGPT 的基本版本和專門開發(fā)的 AI 輔導師來做課堂練習),最后是閉卷考試。
這項研究在土耳其一所高中進行了實地實驗,涉及近 1000 名 9 年級、10 年級和 11 年級的學生,旨在研究生成式 AI(特別是 OpenAI 的 GPT - 4)對數(shù)學課堂上學生學習的影響。實驗設(shè)計為隨機對照試驗(RCT),在 2023 - 2024 學年秋季學期進行。
研究包括每個年級的四次 90 分鐘課程,輔導程序占該學期數(shù)學課程內(nèi)容的約 15%。每次課程分為三個主要部分。首先,教師像正常復習課一樣復習之前學過的主題,并在黑板上解決一些示例問題。其次,有一個輔助練習階段,學生解決由教師設(shè)計的練習題,以鞏固所學概念。這是隨機干預的部分。學生被分配到三個組別之一:對照組、GPT 基礎(chǔ)組和AI 導師組。
對照組使用標準資源,如課程書和筆記。對于 GPT 基礎(chǔ)組和AI 導師組,學生使用筆記本電腦訪問相應的輔導程序。GPT 基礎(chǔ)組是一個類似于 ChatGPT 的簡單聊天界面,而AI導師組的提示詞中包含額外的保護措施,只是指導學生而不直接給出完整答案。
完成了復習課講授,復習課練習,學生進行閉卷考試??荚囍械膯栴}與前一部分的練習題類似。
最初,使用人工智能工具的學生表現(xiàn)出顯著進步,使用ChatGPT和AI輔導師的學生分別比僅使用紙筆的同學們高出 48%和 127%。

然而,這種成功是短暫的:在后續(xù)的閉卷測試中,使用人工智能的學生分數(shù)急劇下降:使用 ChatGPT 做復習指導的班級比普通班級成績低了 17%;而使用 AI 導師的班級和普通班級無明顯差異。
這表明,雖然生成式 AI 可以在短期內(nèi)提高學生的學習表現(xiàn),但可能會在長期內(nèi)削弱學生的學習能力(順便說一句,很多類似的班級試驗研究都是只在短期內(nèi)測了學生的成績,沒有做長期的研究)。

研究指出,人工智能正在快速發(fā)展,但并不能取代教師。當這些工具被設(shè)計用于指導學生學習時——例如拒絕給出答案或提出深入追問(參見此處、此處和此處的研究)——它們的表現(xiàn)良好;但該類軟件仍然受制于其起源的悖論:人類能否聰明到設(shè)計出比自己更聰明的工具。
三、為什么短期提升,長期退步文章討論了實驗中學生測試成績短期表現(xiàn)提升的原因:
- 快速獲取答案:ChatGPT 能夠迅速提供問題的答案或解題思路,幫助學生在短時間內(nèi)完成更多的練習題,從而在短期內(nèi)提高學習成績。
- 個性化輔導:ChatGPT 可以根據(jù)學生的問題提供個性化的解答,幫助學生更好地理解知識點,解決學習中的困惑
- 提高學習效率:ChatGPT 可以提供大量的學習資源和信息,幫助學生更高效地學習,節(jié)省時間和精力。
- 過度依賴:學生在使用 ChatGPT 時,可能會過度依賴其提供的答案,而缺乏獨立思考和解決問題的能力。這種依賴性會導致學生在沒有 ChatGPT 的情況下,難以獨立完成學習任務。
- 缺乏深度理解:ChatGPT 提供的答案可能過于簡潔或直接,學生在使用過程中可能只是機械地接受答案,而沒有深入理解其背后的原理和邏輯。這種淺層次的學習方式不利于學生的長期發(fā)展。
- 錯誤信息:ChatGPT 的回答并不總是完全準確,學生在使用過程中可能會接觸到錯誤的信息,從而影響學習效果。如果學生缺乏辨別能力,可能會將錯誤信息當作正確答案,導致學習偏差。
- 學習動機下降:長期使用 ChatGPT 可能會導致學生的學習動機下降。由于 ChatGPT 能夠輕松提供答案,學生可能會減少對學習的投入和努力,從而影響學習效果。
- 缺乏實踐機會:學生在使用 ChatGPT 時,可能會減少自己動手實踐的機會(比如列豎式計算)。實踐是學習的重要環(huán)節(jié),缺乏實踐機會會影響學生對知識的掌握和應用能力。
進一步研究學生和 AI 的對話記錄,研究者發(fā)現(xiàn),使用基礎(chǔ)版 ChatGPT 的學生參與的是膚淺(Superficial)的互動,經(jīng)常直接向 AI 提問,如“答案是什么?”。
研究人員得出結(jié)論,在技能培養(yǎng)階段未經(jīng)指導使用 AI 可能會成為一種障礙——并可能限制學習。研究人員得出結(jié)論,一旦有機會,學生會將軟件當作“外掛”,經(jīng)常直接跳到答案(我想起自己高中看到周末作業(yè)上寫的是某市聯(lián)考然后去網(wǎng)吧搜答案的經(jīng)歷)。在學習的關(guān)鍵階段部署這項技術(shù)實際上“有削弱學習能力的風險”。
這項研究表明,直接給學生在課堂上使用 ChatGPT 輔助學習在短期內(nèi)可以提高學生的成績和學習效率,但長期來看,可能會導致學生過度依賴、缺乏深度理解、接觸到錯誤信息、學習動機下降以及缺乏實踐機會等問題,從而影響學生的學習效果和長期發(fā)展。因此,在使用 ChatGPT 時,學生應該注意合理使用,避免過度依賴,同時加強獨立思考和實踐能力的培養(yǎng)。
熱門跟貼