(來源:MIT Technology Review)
打開網(wǎng)易新聞 查看精彩圖片
(來源:MIT Technology Review)

抑郁癥是一種嚴重的精神疾病,也是導(dǎo)致殘疾和自殺的主要原因之一。

據(jù)世界衛(wèi)生組織(WHO)統(tǒng)計,全球有超過 3.5 億抑郁癥患者,并且這一數(shù)字正隨著發(fā)病率的快速上升而不斷增加,就國內(nèi)而言,抑郁癥患者已超 9500 萬。

另據(jù)中國精神衛(wèi)生調(diào)查顯示,中國成人抑郁障礙終生患病率為 6.8%,其中抑郁癥為 3.4%,在每年約 28 萬的自殺人群中有近一半患有抑郁癥。這意味著抑郁癥不僅僅是一個公共衛(wèi)生問題,更是一個需要全社會共同關(guān)注的重要議題。

盡管抑郁癥的發(fā)病率較高,但真正接受治療的患者比例卻非常低。抑郁癥的難治性源于其復(fù)雜的多維度病因與治療挑戰(zhàn),包括社會偏見、醫(yī)療資源有限以及高昂的治療費用等因素,導(dǎo)致許多患者難以獲得及時有效的治療。

隨著 AI 已經(jīng)滲透到人們生活的方方面面,AI 心理治療機器人應(yīng)運而生,相較于人類心理治療師,它更容易獲取從而具有較好的依從性,治療成本也更為低廉,并且與 AI 聊天也能在很大程度上避免社會偏見所帶來的羞恥感,這些優(yōu)勢或為抑郁癥患者的治療帶來了新希望。

近期,由達特茅斯學院蓋澤爾醫(yī)學院的精神病學研究人員和心理學家團隊共同開發(fā)的名為“Therabot”的 AI 心理治療機器人,在首次針對心理健康問題的臨床試驗中展現(xiàn)出了較好的療效,對于患有抑郁、焦慮或有患飲食障礙風險的參與者而言,其治療效果可以比肩人類治療師。目前,這篇研究論文已經(jīng)發(fā)表在New England Journal of Medicine上。

(來源:New England Journal of Medicine)
打開網(wǎng)易新聞 查看精彩圖片
(來源:New England Journal of Medicine)

如今,不少科技公司正在開發(fā)專門用于心理治療的 AI 工具,旨在讓人們能夠更頻繁地與這些聊天機器人互動,而非依賴于訓(xùn)練有素的人類治療師。畢竟,這種替代方案不僅成本更低,而且更容易被廣大用戶所接觸和使用。

不少心理學家及精神病學專家都對這一愿景表示支持。他們強調(diào),當前僅有不到一半的精神疾病患者尋求了專業(yè)的治療幫助。而在那些確實接受了治療的患者中,每周可能只有大約45分鐘的時間能與治療師面對面交流。

實際上,在過去研究人員也曾嘗試利用 AI 技術(shù)來擴大精神疾病患者的治療覆蓋面,但遭遇了兩個主要障礙:

一方面,如果 AI 心理治療機器人給出了不合適甚至是有害的建議,可能會給患者帶來實質(zhì)性的傷害。

為了避免這種情況的發(fā)生,很多研究團隊選擇通過“顯式編程”的方式來構(gòu)建這些機器人,使其從一個經(jīng)過嚴格篩選的、有限的回復(fù)庫中挑選答案進行回應(yīng)(這與 20 世紀 60 年代開發(fā)的一款名為 Eliza 的心理治療模擬計算機程序非常相似)。然而,這種方式導(dǎo)致了治療對話顯得異常單調(diào)乏味,使得患者很容易失去興趣,依從性也較差。

另一方面,建立良好的治療關(guān)系是心理治療成功的關(guān)鍵之一,包括共同設(shè)定目標以及雙方之間的協(xié)作等要素,而這些都是很難通過計算機軟件完全復(fù)現(xiàn)出來的。要知道,在人與人之間的互動中,情感共鳴、直覺判斷以及即時反饋都是不可或缺的部分,顯然,這些方面是 AI 難以完全實現(xiàn)的。

2019 年,隨著諸如 OpenAI 的 GPT 這樣的早期大語言模型逐漸成熟,引起了達特茅斯學院研究人員的注意,在他們看來:生成式 AI 或許能幫助克服先前的種種障礙。

于是,研究團隊開始著手構(gòu)建一個新的 AI 模型。首先,他們在互聯(lián)網(wǎng)論壇上收集了大量通用的心理健康對話數(shù)據(jù)作為初步素材;隨后,他們深入分析了數(shù)千小時由心理治療專家參與的真實對話記錄,以便更準確地捕捉專業(yè)治療過程中的細微差別和復(fù)雜性。

“我們發(fā)現(xiàn)了很多諸如‘嗯嗯’、‘繼續(xù)說’以及‘你的問題源自你與母親的關(guān)系’等等這樣的陳詞濫調(diào)?!边@篇研究論文的第一作者、達特茅斯學院和達特茅斯健康中心的精神病學家 Michael Heinz 說道,“這些都是心理治療的老套說法,這不是我們真正想要的東西?!?/p>

意識到這一點后,研究團隊決定不再依賴那些表面化的數(shù)據(jù),而是轉(zhuǎn)向構(gòu)建一個基于循證實踐的定制化數(shù)據(jù)集,并將其整合到模型中去。

相比之下,市面上的一些 AI 治療機器人往往只是在互聯(lián)網(wǎng)對話基礎(chǔ)上進行了簡單調(diào)整的基礎(chǔ)模型(例如 Meta 的 Llama),這導(dǎo)致它們在處理諸如飲食紊亂等話題時可能存在嚴重不足。

“舉個例子,比如你說你計劃減肥。”Michael Heinz 說道,“它們會輕易地鼓勵和支持你這么去做,即便你的體重已經(jīng)低于正常范圍?!?要知道,一名稱職的人類治療師不會輕易給出這么荒唐的建議。

通過這些細致入微的方法,研究人員旨在構(gòu)建出一個既能夠提供個性化支持又能避免潛在風險的 AI 治療機器人。

為了驗證 Therabot 的有效性,研究人員開展了一項為期8 周的臨床對照試驗,招募了210 名表現(xiàn)出抑郁癥狀、廣泛性焦慮障礙或處于高風險飲食障礙的試驗者參與測試。

在這項臨床研究中,大約一半的試驗者能夠使用 Therabot 進行治療,而另一半作為對照組則沒有接入該 AI 工具的支持。這樣的設(shè)計有利于直觀比較 Therabot 與傳統(tǒng)治療方法之間的差異。

在治療期間,試驗者通過回應(yīng)來自 Therabot 的提示以及主動發(fā)起對話的方式與之互動,平均每天發(fā)送約 10 條消息。這種頻繁且靈活的交流方式使得患者能夠在日常生活中隨時隨地獲得心理支持和指導(dǎo),提高了治療的可及性和連續(xù)性。

經(jīng)過 8 周的治療后,抑郁癥患者的癥狀顯著減輕了 51%,這是所有測量指標中的最佳結(jié)果;同時,焦慮癥患者的癥狀也減輕了 31%。而對于那些有飲食障礙風險的試驗者來說,他們對身體形象和體重的關(guān)注度降低了 19%。這些積極的變化表明,Therabot 不僅在緩解抑郁和焦慮方面表現(xiàn)優(yōu)異,在改善飲食障礙相關(guān)的負面認知上也有一定效果。

需要注意的是,這些數(shù)據(jù)結(jié)果是通過問卷調(diào)查報告得出的。盡管這種方法存在一定的局限性,例如可能受到參與者主觀態(tài)度的影響,但它依然是目前評估心理健康狀況和治療成效的重要手段之一。此外,問卷調(diào)查可以大規(guī)模地收集數(shù)據(jù),并為后續(xù)深入分析提供基礎(chǔ)資料。

Michael Heinz 指出,Therabot 的試驗結(jié)果與傳統(tǒng)心理治療隨機對照臨床試驗(人類治療師提供大約 16 小時心理治療)所取得的效果相當,相較之下,Therabot 試驗僅用了大約一半的時間就達成了同樣的效果。

“我在數(shù)字療法領(lǐng)域工作了很長時間,從未見過如此長時間保持且持續(xù)的參與度?!彼f道。這意味著 AI 治療機器人在提高患者依從性和治療效率方面具有潛力。

西蒙弗雷澤大學健康倫理學助理教授 Jean-Christophe Bélisle-Pipon(未參與這項研究)曾撰寫過關(guān)于 AI 治療機器人的論文。在他看來,這些研究結(jié)果非常引人注目,但同時他也指出,正如其他臨床試驗一樣,試驗結(jié)果不一定能直接轉(zhuǎn)化為現(xiàn)實世界的療效

“我們距離‘全面推廣’還有很長的路要走?!彼谝环忄]件中提到,并強調(diào)“將研究成果應(yīng)用于實際醫(yī)療環(huán)境時面臨的挑戰(zhàn)和需要克服的問題,比如更大規(guī)模臨床應(yīng)用所需的嚴格監(jiān)管?!?/p>

因此,盡管 Therabot 的臨床試驗結(jié)果令人鼓舞,但是這并不意味著市面上數(shù)十家公司可以無視監(jiān)管,在“灰色地帶”大肆宣傳類似 AI 技術(shù)的有效性和安全性。

Michael Heinz 進一步解釋說,“在臨床試驗初期,他親自監(jiān)控并審閱了所有來自試驗者發(fā)送的消息(在得到試驗者同意的前提下),以防止 AI 治療機器人可能做出不恰當?shù)幕貞?yīng)。如果未來 AI 機器人仍然需要這種程度的監(jiān)督(人類強把關(guān)),那么它們就難以實現(xiàn)大規(guī)模應(yīng)用,惠及更多有需求的人群。”

從另外一個角度來看看,這些臨床試驗結(jié)果是否驗證了正在蓬勃發(fā)展的 AI 治療網(wǎng)站產(chǎn)業(yè)?

“事實上恰恰相反。”Michael Heinz 指出,并警告稱,“大多數(shù)公司似乎并未基于像認知行為療法這樣的循證實踐來訓(xùn)練其模型,也未必會雇傭一支專業(yè)醫(yī)療研究團隊來監(jiān)督互動過程。我對這個行業(yè)的快速發(fā)展以及缺乏充分評估的做法感到擔憂。”他補充道。

他還指出,當一些 AI 網(wǎng)站宣傳其能夠在合法、臨床環(huán)境中提供治療服務(wù)時,這意味著它們將受到美國食品藥品監(jiān)督管理局(FDA)的監(jiān)管。然而到目前為止,F(xiàn)DA 尚未對眾多此類平臺進行詳細審查。他推測,“若真正開始實施監(jiān)管,可能幾乎沒有一家能夠證明其宣稱的治療效果?!?/p>

對此,Jean-Christophe Bélisle-Pipon 認為,除非這些數(shù)字療法獲得批準,并被納入醫(yī)療保健或保險系統(tǒng),否則其覆蓋面將極其有限。那些本可以從這類治療中受益的患者可能會轉(zhuǎn)向并非為此目的設(shè)計的 AI 尋求治療。

要知道,OpenAI 近期的一項新研究表明,與其 AI 模型的互動對情緒健康確實存在影響

因此,隨著人們對便捷、低成本心理健康支持的需求不斷增加,如何確保這些新興技術(shù)的安全性、有效性和可訪問性成為了一個亟待解決的重要議題。

“一種可能是,許多人將繼續(xù)依賴更便宜的非治療類 AI 聊天機器人(比如 ChatGPT 或 Character.AI)來滿足日常需求,從生成食譜、創(chuàng)意,到管理他們的心理健康。”他說道。

https://www.technologyreview.com/2025/03/28/1114001/the-first-trial-of-generative-ai-therapy-shows-it-might-help-with-depression/