編輯丨王多魚

排版丨水成文

自然的口語交流是瞬間完成的。超過幾秒鐘的言語遲緩就會(huì)打斷對話的自然流暢。這使得癱瘓者難以參與有意義的對話,從而可能會(huì)導(dǎo)致他們產(chǎn)生孤立和沮喪的感覺。

近年來,腦機(jī)接口(BCI)領(lǐng)域取得了許多突破性進(jìn)展,例如,2023 年 8 月,加州大學(xué)舊金山分校張復(fù)倫(Edward Chang)團(tuán)隊(duì)在Nature期刊發(fā)表論文【1】,通過新型腦機(jī)接口(BCI),將因腦干中風(fēng)而嚴(yán)重癱瘓的患者在大腦中嘗試的無聲說話轉(zhuǎn)化為文字、語音和圖像,從而幫助嚴(yán)重癱瘓者恢復(fù)溝通能力。

然而,這種面相言語的腦機(jī)接口一般在患者嘗試無聲說話與計(jì)算機(jī)輸出之間會(huì)有幾秒鐘的延遲,這種延遲會(huì)在聆聽者與患者之間造成交流不暢和困擾。而一個(gè)實(shí)時(shí)系統(tǒng)有望恢復(fù)自然對話交流,或能提高失語患者的生活質(zhì)量。

2025 年 3 月 31 日,加州大學(xué)舊金山分校張復(fù)倫團(tuán)隊(duì)與加州大學(xué)伯克利分校Gopala Anumanchipalli團(tuán)隊(duì)合作,在Nature Neuroscience期刊發(fā)表了題為:A streaming brain-to-voice neuroprosthesis to restore naturalistic communication 的研究論文。

該研究開發(fā)了一種新型腦機(jī)接口設(shè)備,在 AI 模型訓(xùn)練的幫助下,能夠?qū)c瘓失語患者大腦中想象的言語活動(dòng)實(shí)時(shí)轉(zhuǎn)換成他的聲音輸出,從而幫助失語者恢復(fù)實(shí)時(shí)流暢交流的能力。

打開網(wǎng)易新聞 查看精彩圖片

在這項(xiàng)研究中,研究體開發(fā)了一款無聲腦機(jī)接口,并作為一個(gè)臨床試驗(yàn)的一部分,將它植入了一名 47 歲的四肢麻痹(四肢和軀干癱瘓)女性患者的大腦中,這名女性在一次中風(fēng)發(fā)作后已有 18 年無法說話或發(fā)聲。

研究團(tuán)隊(duì)讓她在大腦中用意念講出包含 1024 個(gè)獨(dú)特詞匯的完整句子,同時(shí)用她的大腦活動(dòng)訓(xùn)練了一個(gè)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),這些大腦活動(dòng)利用植入該患者言語感覺運(yùn)動(dòng)皮質(zhì)的電極進(jìn)行記錄。

研究團(tuán)隊(duì)隨后使用該模型以 80 毫秒遞增的速度解碼在線語音,與受試者的發(fā)聲意圖同步,再生成用受試者受傷前說話片段訓(xùn)練的模擬她聲音的音頻。這個(gè)腦機(jī)接口還可以推廣至該受試者訓(xùn)練中沒有接觸過的詞匯,而且,該設(shè)備可以連續(xù)不間斷使用,而不是每次運(yùn)行幾秒。

打開網(wǎng)易新聞 查看精彩圖片

總的來說,這項(xiàng)研究引入了一種言語-神經(jīng)假體范式,有望恢復(fù)癱瘓失語患者的自然言語交流,讓他們更自然流暢地實(shí)時(shí)說話,從而提高他們的生活質(zhì)量。

論文鏈接

https://www.nature.com/articles/s41593-025-01905-6

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片