On the minimal theory of consciousness implicit in active inference

主動推理隱含最小意識理論

https://arxiv.org/pdf/2410.06633

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

摘要

體驗的多面性給意識的研究帶來了挑戰(zhàn)。傳統(tǒng)神經(jīng)科學(xué)方法通常專注于孤立的方面,例如感知意識或意識的整體狀態(tài),并圍繞相關(guān)的經(jīng)驗范式和發(fā)現(xiàn)構(gòu)建理論。因此,意識理論往往難以比較;事實上,這些理論試圖解釋的現(xiàn)象可能幾乎沒有重疊之處。在這里,我們采用了一種不同的方法:從主動推理(active inference)開始,這是一種基于貝葉斯推理(Bayesian inference)建模行為的首要原則框架,并逐步構(gòu)建出一種最小化的意識理論,這種理論從主動推理下推導(dǎo)出的計算模型的共同特征中涌現(xiàn)出來。我們回顧了一系列將主動推理模型應(yīng)用于意識研究的工作,并認(rèn)為所有這些模型中都隱含著一組小的理論承諾,這些承諾指向了一種最小化(且可檢驗的)意識理論。

1. 引言

意識是異質(zhì)且多面的。初步來看,意識的科學(xué)研究可以分為三個相關(guān)(但在實踐中,很大程度上相互獨(dú)立)的研究項目:對意識內(nèi)容、狀態(tài)和自我的研究(Seth, 2021)。意識的內(nèi)容是指體驗中主體所意識到的品質(zhì)或元素(例如,紅色玫瑰在綠色背景上的圖像,或新鮮煮好的咖啡的香氣)。通過控制物理刺激屬性和整體意識狀態(tài)(如困倦),同時改變主觀感知來研究內(nèi)容(Baars, 2002)。有意識的生物還具有不同的整體意識狀態(tài),這些狀態(tài)通常通過行為進(jìn)行評估(例如,通過格拉斯哥昏迷評分量表;Teasdale et al., 2014),并且對于評估意識障礙患者至關(guān)重要。這些狀態(tài)包括植物狀態(tài)、各種睡眠狀態(tài)、正常清醒狀態(tài),以及可能像譫妄或幻覺狀態(tài)這樣的狀態(tài)(詳見 Bayne et al., 2016)。在人類中,意識通常還伴隨著某種形式的最小化和/或敘事性自我意識(Gallagher, 2000),以及身體性、自我性和人格性的體驗(Ciaunica et al., 2022; Seth, 2013; Seth & Tsakiris, 2018)。

大多數(shù)關(guān)于意識的神經(jīng)科學(xué)理論將這些現(xiàn)象的某個子集作為其解釋目標(biāo),并圍繞相關(guān)的經(jīng)驗范式和發(fā)現(xiàn)構(gòu)建理論(Seth & Bayne, 2022)。例如,全局工作空間理論(Baars, 2005; Baars et al., 2013)及其當(dāng)代形式——全局神經(jīng)工作空間理論(Dehaene et al., 2011; Mashour et al., 2020)是圍繞對比分析方法構(gòu)建的,該方法將意識內(nèi)容作為因變量,即通過改變參與者是否意識到由刺激引發(fā)的某種特定內(nèi)容(Baars, 2005)。意識狀態(tài)最初被視為一個背景條件(Dehaene et al., 2006),使得全局神經(jīng)工作空間理論主要成為一種關(guān)于意識內(nèi)容的理論。此后,該理論也被應(yīng)用于通過麻醉操縱整體意識狀態(tài)的實驗(詳見 Mashour et al., 2020)。然而,意識狀態(tài)最初被假設(shè)為內(nèi)容的背景條件,而不是約束內(nèi)容的背景性建構(gòu),這一假設(shè)在當(dāng)代版本的理論中可能仍然存在(詳見 Bayne et al., 2016; Bayne & Carter, 2018)。同樣,高階理論(Brown et al., 2019; Fleming, 2020; Lau & Rosenthal, 2011)也是主要關(guān)于意識內(nèi)容的理論,目前尚未明確意識內(nèi)容與意識狀態(tài)之間的關(guān)系。類似地,整合信息理論(Albantakis et al., 2023; Oizumi et al., 2014; Tononi et al., 2016)是另一種領(lǐng)先的意識理論,其明確目標(biāo)是解決意識的難題(即解釋為什么某些物理結(jié)構(gòu)會產(chǎn)生主觀體驗,而其他結(jié)構(gòu)則不會)。整合信息理論完全從內(nèi)在角度看待意識,從而淡化了外顯行為的作用,而外顯行為在塑造我們所意識的內(nèi)容以及決定意識內(nèi)容的質(zhì)性特征方面可能發(fā)揮重要作用(O’Regan & No?, 2001; Seth, 2014)。其他理論,例如主觀性自我模型理論(Metzinger, 2004)或投射意識模型(Rudrauf et al., 2017),則專注于解釋自我或第一人稱視角的存在。除了上述理論外,還有許多其他意識理論,其中許多優(yōu)先考慮特定的解釋目標(biāo)和方法論。這種狀況帶來了雙重挑戰(zhàn):不僅基于經(jīng)驗證據(jù)難以在意識理論之間進(jìn)行仲裁(Yaron et al., 2022),而且有時也不清楚這些理論是否旨在解釋相同的經(jīng)驗數(shù)據(jù)(Seth & Bayne, 2022)。

在本文中,我們沒有從意識的一個或多個特定屬性出發(fā),將其作為主要的解釋目標(biāo),而是從主動推理開始,這是一個將適應(yīng)性行為建模為(近似)貝葉斯推理的框架,并探討是否可以構(gòu)建一種意識理論。該框架的新穎之處并不在于提供獨(dú)特的預(yù)測。事實上,計算神經(jīng)科學(xué)及相關(guān)學(xué)科中許多替代的但特定領(lǐng)域的規(guī)范建模框架與主動推理一致或等價,但往往僅適用于更狹窄的范圍(Da Costa, Sajid, et al., 2020; Sajid, Ball, et al., 2021; Sajid, Da Costa, et al., 2021)。相反,主動推理的新穎之處在于其普遍性。通過最小化僅兩個目標(biāo)函數(shù)——變分自由能和預(yù)期自由能,可以在該框架下建模極其多樣的行為(Parr et al., 2022)。事實上,主動推理框架已被應(yīng)用于認(rèn)知和神經(jīng)科學(xué)領(lǐng)域的各種現(xiàn)象,包括視覺搜索(Cullen et al., 2020; Mirza et al., 2018; Parr et al., 2021)和語言的理解與生成(Friston, Parr, et al., 2020; Friston, Sajid, et al., 2020)。由于這些現(xiàn)象都通過最小化相同的目標(biāo)函數(shù)而出現(xiàn)——這些目標(biāo)函數(shù)可以分解為一組可解釋的(準(zhǔn)目的論)術(shù)語——主動推理使我們能夠揭示不同現(xiàn)象之間的共性和差異,這些共性和差異在不太一般的建??蚣苤锌赡鼙谎谏w。因此,我們將論證,正是因為主動推理本身并非一種意識理論,它才能充分涵蓋意識的多樣化屬性(參見 Hohwy & Seth, 2020; Vilas et al., 2021)。論點(diǎn)在于,通過從一個用于建模適應(yīng)性行為的通用框架開始,意識理論的輪廓將自然而然地逐漸顯現(xiàn),因為各種意識現(xiàn)象開始通過單一的數(shù)學(xué)公式得到解釋。

在從主動推理構(gòu)建意識理論的實踐中,一個自然的第一步(這一步已經(jīng)正在進(jìn)行中)是將該框架應(yīng)用于意識科學(xué)領(lǐng)域中具有代表性的現(xiàn)象,以構(gòu)建模型。開發(fā)出這些模型后,可以探索它們的計算屬性和行為,并將每個模型中的變量和參數(shù)映射到正在建模的具體意識過程的現(xiàn)象學(xué)方面。每個模型隨后成為理論的一個構(gòu)建模塊,隨著更多模型的積累,理論逐漸發(fā)展。因此,這一過程的一個關(guān)鍵組成部分在于識別具有解釋力和系統(tǒng)性的模型之間的共同計算屬性,這些模型涵蓋了意識科學(xué)中多樣化的現(xiàn)象(Atkinson et al., 2000; Seth, 2009)。

本文旨在面向兩個目前在很大程度上相互獨(dú)立的關(guān)鍵受眾:從事意識研究的實驗神經(jīng)科學(xué)家和認(rèn)知科學(xué)家,以及在主動推理框架內(nèi)工作的神經(jīng)模型研究者和理論家。對于實驗科學(xué)界,我們希望提供一份關(guān)于主動推理及其與意識關(guān)系的精確但易于理解的指南,特別強(qiáng)調(diào)該理論的經(jīng)驗承諾。對于那些目前尚未從事意識研究但在主動推理框架內(nèi)工作的理論家群體,我們希望突出該框架在意識研究中的適用性,以及需要進(jìn)一步理論和形式化發(fā)展的領(lǐng)域。

在第2節(jié)和第3節(jié),我們簡要介紹主動推理建模框架,重點(diǎn)闡述變分自由能和預(yù)期自由能分解為一組具有目的論意義的術(shù)語。我們還介紹了支持主動推理的生成模型架構(gòu)的一般特征及其可能的神經(jīng)實現(xiàn)。這兩節(jié)是最具技術(shù)性的,對于已經(jīng)熟悉主動推理形式主義的讀者可以跳過。我們鼓勵不熟悉主動推理的讀者堅持閱讀這些開篇部分。主動推理本質(zhì)上是一個數(shù)學(xué)框架,要精確地討論它,就必須使用相關(guān)的形式主義。第4節(jié)則對與意識科學(xué)相關(guān)的建模文獻(xiàn)進(jìn)行了綜述,并提出了一個現(xiàn)有模型的新擴(kuò)展,使主動推理能夠與關(guān)于整體意識狀態(tài)的研究相聯(lián)系。最后,在第5節(jié),我們論證了所有這些模型中都隱含著一組假設(shè)和理論承諾,一旦明確表述,這些假設(shè)和承諾將構(gòu)成一種最小化但經(jīng)驗上富有成效的意識理論。為了盡可能清晰地闡明最小化理論與實驗之間的關(guān)系,我們遵循了最近在意識科學(xué)哲學(xué)方面的研究工作(Negro, 2024),并從拉卡托斯關(guān)于“科學(xué)研究綱領(lǐng)”的理論視角(Lakatos, 1968)來討論該理論及其經(jīng)驗承諾。

最后,我們指出,本文的主要目的是教育性的,而非論戰(zhàn)性的。也就是說,我們不會論證其他競爭性意識理論的不足,然后將主動推理作為替代方案。相反,我們的目標(biāo)是提供一個關(guān)于主動推理框架中隱含的(最小化)意識理論的積極描述。我們堅信,最富有成效的前進(jìn)方式是以盡可能精確的方式闡述該理論的結(jié)構(gòu)及其與經(jīng)驗數(shù)據(jù)的關(guān)系,以促進(jìn)基于經(jīng)驗的理論比較。

2. 變分自由能與預(yù)期自由能

一個能夠維持自身身體完整性的生物體,必須能夠保持在其存在所允許的狹窄狀態(tài)范圍內(nèi)(例如,對于哺乳動物而言,維持相對恒定的內(nèi)部體溫);這意味著生物體將大部分時間處于一組相對受限的特征狀態(tài)中(Friston, 2013; Tschantz et al., 2020)。在主動推理框架下,這通過將生物體的表型解釋為其生態(tài)位的生成模型(即其感覺輸入是如何產(chǎn)生的模型)來建模,該模型對與頻繁占據(jù)狀態(tài)相關(guān)的觀測賦予高概率,即對該生物體所具有的特征狀態(tài)賦予高概率(Corcoran & Hohwy, 2018; Ramstead et al., 2020; Ramstead et al., 2018, 2020, 2021)。因此,感知-行動循環(huán)被轉(zhuǎn)化為一個優(yōu)化問題,其中被極化(極大化或極小化)的主要目標(biāo)函數(shù)——變分自由能——代表了生物體觀測是如何產(chǎn)生的生成模型的(對數(shù))證據(jù)(Da Costa, Parr, et al., 2020)。

關(guān)鍵在于,生成模型包含一個先驗信念,即當(dāng)行動序列最小化預(yù)期自由能時,它們更具合理性。這意味著需要考慮兩個目標(biāo)函數(shù)。具體而言,(負(fù))變分自由能是對對數(shù)模型證據(jù)的一個計算上可行的下界,而(負(fù))預(yù)期自由能可以被視為對期望對數(shù)模型證據(jù)的近似(Parr & Friston, 2018a)。最小化變分自由能為生物體提供了一個對模型證據(jù)的近似,可以用于推斷世界中的隱藏狀態(tài)并學(xué)習(xí)環(huán)境的各種統(tǒng)計特征。然后可以利用該模型中的信念來選擇能夠最小化預(yù)期自由能的行動,從而使主體保持在其具有特征性的表型狀態(tài)中,這些狀態(tài)與其持續(xù)生存相一致。這使得我們可以將行為解釋為自我證實的過程(Hohwy, 2016, 2020, 2021),即生物體會采取行動來最大化其對世界模型的證據(jù)。參與這一自我證實過程的各個量是至關(guān)重要的,我們將逐一進(jìn)行考察。

變分自由能(公式1)是在近似后驗分布(q)下,近似后驗分布的對數(shù)與生成模型(p)的對數(shù)之間的期望差異——即觀測(o)及其原因(或隱藏狀態(tài) s)的聯(lián)合概率。近似后驗分布反映了基于感覺數(shù)據(jù)推斷出的世界隱藏狀態(tài)。

打開網(wǎng)易新聞 查看精彩圖片

變分自由能有兩個關(guān)鍵的分解方式,每種分解方式都突出了其基本屬性的互補(bǔ)視角。方程 1 的第二行利用了概率的乘法法則以及模型證據(jù)不依賴于隱狀態(tài)的事實(使得我們可以在第二項中去掉期望算子),從而將變分自由能分解為兩部分:近似后驗與真實后驗之間的相對熵或 KL 散度,以及驚訝度(或稱負(fù)模型證據(jù),即對隱狀態(tài)求平均的觀測數(shù)據(jù)的概率)。KL 散度始終大于或等于零,因此變分自由能始終大于或等于驚訝度(又稱為驚訝量或自信息)。因此,變分自由能是驚訝度的上界,并且在近似后驗與真實后驗完全匹配時,兩者相等。

這種分解方式在理解變分自由能的性質(zhì)方面具有教學(xué)意義,但在描述如何最小化變分自由能時并無實用價值。這是因為真實后驗的值在計算上是不可行的,因此代理無法直接獲取。在方程的第三行,我們將變分自由能分解為復(fù)雜度和準(zhǔn)確度兩個易于計算的部分。復(fù)雜度是近似后驗與先驗之間的 KL 散度(即在接收觀測數(shù)據(jù)之前對隱狀態(tài)的信念),衡量了先驗與近似后驗之間的差異,可將其視為信念更新幅度的正則化項。先驗與近似后驗之間的變化越大,復(fù)雜度越高。準(zhǔn)確度是觀測數(shù)據(jù)的期望對數(shù)似然(即在每個隱狀態(tài)下當(dāng)前觀測數(shù)據(jù)的概率)。因此,最小化變分自由能需要在最大化準(zhǔn)確度和最小化復(fù)雜度之間進(jìn)行權(quán)衡。

這一點(diǎn)至關(guān)重要。感官輸入通常是嘈雜且模糊的,在噪聲數(shù)據(jù)的情況下,總是可以通過調(diào)整近似后驗來提高準(zhǔn)確度。然而,不斷大幅調(diào)整后驗會顯著降低模型對新觀測數(shù)據(jù)的泛化能力。如果不對大規(guī)模(貝葉斯)信念更新進(jìn)行懲罰,一個極端“準(zhǔn)確”的模型將會過擬合噪聲,并且需要不斷修正(Sengupta et al., 2013)。因此,最小化變分自由能確保了代理能夠形成對其感知世界的可泛化解釋或模型。

作為自組織生物體,代理必須選擇那些平均而言最小化變分自由能的動作(Friston, Rigoli, Ognibene, Mathys, Fitzgerald & Pezzulo, 2015; Parr & Friston, 2019)。諸如反射弧等純反應(yīng)性行為可以通過變分自由能最小化來表述,即執(zhí)行能夠帶來與(穩(wěn)態(tài)或本體感覺)設(shè)定點(diǎn)一致的觀測結(jié)果的動作(Buckley et al., 2017; Tschantz et al., 2022)。然而,更復(fù)雜的動作或動作序列(即策略)則需要對未來觀測結(jié)果進(jìn)行某種反事實計算(即規(guī)劃)。這種規(guī)劃依賴于期望自由能(方程 2),它將策略的可觀測后果視為隨機(jī)變量(因為這些后果尚未被觀測到)。期望自由能通過對預(yù)期觀測值進(jìn)行加權(quán)求和,來近似每種策略下行動的預(yù)期結(jié)果,因此被稱為“期望”自由能??梢詫⒆兎肿杂赡芤暈槠谕杂赡艿囊粋€特例,專門適用于當(dāng)前時刻,即觀測數(shù)據(jù)已知且不依賴于未來的動作。

因此,根據(jù)主動推理理論,動作選擇與知覺一樣,是一個(規(guī)劃即)推理的過程。關(guān)鍵在于,代理不是推理出能夠最大化觀測數(shù)據(jù)概率的隱狀態(tài),而是推理出最可能的行動路徑(Friston, et al., 2017)。這里的“行動”既可以是顯性身體運(yùn)動(如掃視),也可以是隱性心理活動(如注意力方向)。這種方式顛覆了傳統(tǒng)的動作選擇建??蚣?,它不是先搜索能夠達(dá)到目標(biāo)狀態(tài)的最佳動作,而是首先假設(shè)代理會達(dá)到其偏好的狀態(tài),然后推理出最可能實現(xiàn)該狀態(tài)的行動路徑(Millidge et al., 2020)。最可能的行動路徑即是使所有可能策略的期望自由能最小化的策略。

方程2的第二行展示了預(yù)期自由能分解為其最直觀的組成部分:風(fēng)險、模糊性和新奇性。由于推導(dǎo)過程較為復(fù)雜,我們建議感興趣的讀者參考(Da Costa, Parr, et al., 2020)的附錄。

打開網(wǎng)易新聞 查看精彩圖片

第一個術(shù)語是風(fēng)險,它是基于特定策略的預(yù)測后驗分布與智能體期望觀測結(jié)果(由參數(shù)C 指定)之間的KL散度。較小的值表示策略預(yù)期觀測結(jié)果與智能體認(rèn)為最具特征或最有價值的觀測結(jié)果之間的相似度更高。最小化風(fēng)險這一項促使智能體傾向于目標(biāo)導(dǎo)向行為。

第二個術(shù)語是模糊性,它是觀測結(jié)果似然的期望(條件)熵,即隱藏狀態(tài)與觀測結(jié)果之間映射的不確定性。為了最小化模糊性,智能體會選擇那些能夠精確映射狀態(tài)與觀測結(jié)果的策略,例如在黑暗的房間里打開燈。

第三個也是最后一個術(shù)語是新奇性,它是模型參數(shù)(在狀態(tài)、觀測結(jié)果和策略條件下的后驗分布)與邊際后驗分布之間期望的KL散度。這里以似然分布的參數(shù) A(描述分類似然矩陣的狄利克雷先驗的濃度參數(shù))為例,但其他參數(shù)也可以有類似的項。新奇性衡量了在每種策略下預(yù)期的狀態(tài)和觀測結(jié)果對生成模型參數(shù)信念的改變程度。由于新奇性是一個負(fù)項,為了最小化預(yù)期自由能,智能體會被驅(qū)使去最大化后驗分布與邊際后驗分布之間的差異,通過尋找那些能夠?qū)е履P蛥?shù)后驗信念最大變化的新穎觀測結(jié)果。這體現(xiàn)了主動推理背后的雙重驅(qū)動力:目標(biāo)尋求和信息尋求,這兩種驅(qū)動力都統(tǒng)一在一個目標(biāo)函數(shù)下。因此,最小化預(yù)期自由能要求智能體在這兩種驅(qū)動力之間進(jìn)行權(quán)衡,即通過選擇策略來同時最小化風(fēng)險(最大化偏好)、最小化模糊性(最大化對狀態(tài)的信息增益)和尋求新奇觀測結(jié)果(最大化對參數(shù)的信息增益)。

總的來說,具有有限自動行為庫的智能體(例如簡單生物體或復(fù)雜生物體的自動化子系統(tǒng))可以通過最小化變分自由能來建模,即通過采取與先驗信念一致的行動(例如內(nèi)穩(wěn)態(tài)設(shè)定點(diǎn))。變分自由能可用于建模連續(xù)和離散生成模型中的感知推理,以及連續(xù)模型中的簡單反射式行為。然而,一旦行動選擇需要任何反事實計算,就需要轉(zhuǎn)向預(yù)期自由能,這通常需要一個離散的生成模型(通常是分類-狄利克雷模型)。

3. 生成模型、信念更新和神經(jīng)動態(tài)

當(dāng)前主動推理領(lǐng)域的最新研究將大腦描繪為一個由相互作用的生成模型組成的分層“混合模型”(Friston等人,2017;Parr等人,2021,2022;Parr和Friston,2018c)。低水平感覺推理的基礎(chǔ)生成模型是一個預(yù)測編碼網(wǎng)絡(luò),用于對連續(xù)量(如運(yùn)動和對比度)進(jìn)行推理。這些連續(xù)的低水平感覺系統(tǒng)通過連接函數(shù)(將連續(xù)量映射到離散潛在變量)與更高水平的離散生成模型(例如部分可觀測馬爾可夫決策過程,POMDP)相連接,這些離散生成模型執(zhí)行分類感覺推理,并選擇離散的動作序列(即策略),然后這些策略再次通過連接函數(shù)轉(zhuǎn)換為連續(xù)的運(yùn)動指令(Parr和Friston,2018c)。關(guān)于連續(xù)模型的教程式綜述,可參見Bogacz(2017)和Buckley等人(2017)。對于離散模型的詳細(xì)數(shù)學(xué)綜述,可參見Da Costa、Parr等人(2020),而對于更通俗易懂的教程式綜述,可參見Smith等人(2022)。關(guān)于連續(xù)和離散模型的全面書籍級論述,可參見Parr等人(2022)。

為了說明主動推理下預(yù)測編碼推導(dǎo)的一般原理,這里我們回顧一下在假設(shè)靜態(tài)生成模型和固定先驗的情況下,從變分自由能中推導(dǎo)單層預(yù)測編碼網(wǎng)絡(luò)的過程(Bogacz,2017;Friston,2005)。相同的原理也適用于動態(tài)模型的推導(dǎo)(Buckley等人,2017),但需要更多的形式化工具(例如運(yùn)動的廣義坐標(biāo))。

為了得到一個可處理的變分自由能表達(dá)式,我們做了以下三個假設(shè):1)生成模型(即似然和先驗)和近似后驗分布是高斯分布;2)變分自由能可以用后驗分布均值周圍的二階泰勒級數(shù)展開很好地近似(拉普拉斯近似);3)方差是靜止的。實際上,這三種說法是同一假設(shè)的不同表述方式。在這些假設(shè)下,(負(fù))變分自由能的表達(dá)式簡化為在后驗眾數(shù)處評估的生成模型的對數(shù)。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

這為我們提供了一組三個常微分方程,描述了三個類似神經(jīng)元節(jié)點(diǎn)的行為,其動態(tài)過程對變分自由能進(jìn)行梯度下降。這為我們提供了一個簡單的神經(jīng)元動態(tài)模型,用于近似隱狀態(tài)的后驗分布。這些方程與皮層微回路之間的映射關(guān)系是當(dāng)前研究的熱點(diǎn)問題。然而,從廣義上來說,隱狀態(tài)的動態(tài)(在“期望節(jié)點(diǎn)”中實現(xiàn))通常與皮層的深層相關(guān),這些深層向同一皮層層級中的淺層的誤差節(jié)點(diǎn)進(jìn)行側(cè)向投射,并向下屬層級的淺層誤差節(jié)點(diǎn)進(jìn)行反饋投射。預(yù)測誤差的動態(tài)(在“誤差節(jié)點(diǎn)”中實現(xiàn))通常與皮層的淺層相關(guān),并向同一皮層層級中的深層進(jìn)行側(cè)向投射以及向該層級中更高級別的深層進(jìn)行前饋投射(見圖1a)。每個層級中的期望節(jié)點(diǎn)作為上一層級的觀測值,并作為下一層級的先驗(關(guān)于綜述和討論,參見Bastos等人,2012;Hodson等人,2023;Shipp,2016;Walsh等人,2020)。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

同樣,像預(yù)測編碼一樣,通過相對于狀態(tài)對變分自由能進(jìn)行梯度下降來反轉(zhuǎn)生成模型。忽略常數(shù)項,方程8給出了邊際自由能梯度的表達(dá)式。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

使用softmax函數(shù)(這是邏輯函數(shù)對向量的推廣)來模擬平均放電率,是基于在大規(guī)模腦動態(tài)的平均場模型中所做的假設(shè),即一個群體的平均放電率可以被視為平均膜電位的S形函數(shù)(Breakspear,2017;Da Costa等人,2021;Wilson和Cowan,1972)。在腦電圖(EEG)研究中的事件相關(guān)電位(ERPs)以及在顱內(nèi)記錄研究中的局部場電位都被視為歸一化放電率的時間導(dǎo)數(shù)(即變化率)。關(guān)于可能的神經(jīng)實現(xiàn)的簡要示意圖,請參見圖2b。關(guān)于深入的討論和綜述,可參見Parr和Friston(2018a)。

打開網(wǎng)易新聞 查看精彩圖片

到目前為止,我們已經(jīng)推導(dǎo)出了兩種簡單的算法,分別用于在連續(xù)和離散感知推理的情況中最小化變分自由能:每一種算法都可以直接用神經(jīng)動態(tài)來解釋。然而,正如上文針對行為選擇所概述的,我們尚未(通過定義)接收到(未來的)觀測值,因此必須最小化預(yù)期自由能(方程13)來選擇策略。我們在下面以矩陣形式展示預(yù)期自由能,以突出生成模型組件與預(yù)期自由能組件之間的聯(lián)系。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

那么,對于單個時間步的策略的后驗分布就是預(yù)期自由能的softmax函數(shù)(方程14),這實際上將預(yù)期自由能轉(zhuǎn)化為一個概率分布,從而可以從中采樣下一個動作。

在這里, T表示策略的未來時間范圍。最小化(預(yù)期自由能的路徑積分)的策略將具有最高的后驗概率。然后,通過在每個時間步從策略的后驗分布中采樣來選擇動作。

4. 意識現(xiàn)象的計算模型

在概述了驅(qū)動感知-行動循環(huán)的關(guān)鍵量、連續(xù)和離散生成模型的結(jié)構(gòu),以及模型動態(tài)與神經(jīng)動態(tài)測量(例如事件相關(guān)電位ERPs和放電率)之間的關(guān)系之后,我們現(xiàn)在轉(zhuǎn)向討論之前使用主動推理來模擬意識科學(xué)中典型任務(wù)的研究??傮w而言,這些研究主要關(guān)注意識內(nèi)容和自我意識。為了簡潔起見,我們僅關(guān)注數(shù)值(即模擬)研究,而犧牲了許多與意識神經(jīng)科學(xué)相關(guān)的有價值的定性和概念模型(例如Ciaunica等人,2022;Safron,2020;Seth和Tsakiris,2018),以及主動推理所隱含的意識形而上學(xué)的解釋(Friston,Wiese等人,2020;Ramstead等人,2023)。關(guān)于本文未涵蓋內(nèi)容的相關(guān)綜述,可參見(Nikolova等人,2022;Ramstead等人,2023;Rorot,2021)。

此外,我們注意到,雖然我們回顧的模型主要關(guān)注視覺和內(nèi)感受感覺模態(tài),但這反映了對意識內(nèi)容和自我意識研究中視覺和內(nèi)感受的普遍關(guān)注,并不反映主動推理框架在其他感覺模態(tài)應(yīng)用上的局限性。實際上,為了說明框架的解釋普適性——并突出本節(jié)末尾對意識狀態(tài)的潛在應(yīng)用——我們將一個現(xiàn)有的關(guān)于聽覺規(guī)律意識處理的模型擴(kuò)展,以解釋這一過程在睡眠和麻醉中的中斷。

4.1 意識內(nèi)容的模型

在前一節(jié)中,我們將感知-行動循環(huán)描述為一個迭代過程,包括:1)推斷出最能最小化變分自由能的近似后驗分布(從而為模型證據(jù)設(shè)定一個上限);2)以一種最小化預(yù)期自由能(從而最大化模型證據(jù))的方式采樣世界。這促使我們對意識科學(xué)中幾個關(guān)鍵現(xiàn)象的視角發(fā)生轉(zhuǎn)變。它將注意力引向許多通常被認(rèn)為主要是被動的感知現(xiàn)象中的主動采樣和預(yù)期的作用。

從被動感知到主動感知的轉(zhuǎn)變在雙穩(wěn)態(tài)感知的模型中尤為突出,這些模型通常將感知切換描述為由噪聲和/或適應(yīng)性驅(qū)動的振蕩(例如Moreno-Bote等人,2007;Wilson,2007),而不是至少在某種程度上由主體的行為驅(qū)動的狀態(tài)。例如,Parr等人(2019)提出了一個關(guān)于特羅勒消逝(Troxler fading)和雙眼競爭的雙實例模型(見圖3a),該模型將意識內(nèi)容的變化描述為由策略驅(qū)動的后驗信念精度的變化,這種變化是作為掃視策略(在特羅勒消逝中)和注意策略(在雙眼競爭中)的函數(shù)而發(fā)生的。特羅勒消逝是一種現(xiàn)象,當(dāng)參與者被要求保持中央注視時,與周邊呈現(xiàn)的刺激相關(guān)的感覺會在意識中逐漸消失。雙眼競爭發(fā)生在向每只眼睛呈現(xiàn)不一致的刺激時:參與者不會體驗到刺激感覺的疊加,而是體驗到單一感覺之間的離散交替,只有短暫的混合期。

打開網(wǎng)易新聞 查看精彩圖片

在主動推理框架下,這種感知交替是通過將兩個看似平常的觀察結(jié)果納入任務(wù)特定的生成模型中來解釋的。第一個觀察是,主體對狀態(tài)轉(zhuǎn)換的精度估計(即矩陣B的精度)在變幻無常的世界中永遠(yuǎn)不可能完全確定(參見Hohwy等人,2016)。第二個觀察是,感覺輸入的精度取決于注視點(diǎn)的位置和/或注意力的焦點(diǎn)(通過使矩陣A的精度條件性地依賴于掃視或注意狀態(tài)來建模)。將這兩個簡單假設(shè)納入生成模型,通過預(yù)期自由能中的模糊性項,導(dǎo)致了認(rèn)知行為的出現(xiàn)。在缺乏精確感覺輸入的情況下,關(guān)于視覺空間某個位置的感知內(nèi)容的不確定性(預(yù)測熵)會不斷積累,增加了那些會從視覺空間的該部分獲取信息的感覺輸入的策略(例如掃視或注意策略)的認(rèn)知價值。在特羅勒消逝的情況下,主體被迫保持中央注視,從而無法獲取關(guān)于周邊的精確感覺信息。隨著時間的推移,這會通過基于不精確的狀態(tài)轉(zhuǎn)換和感覺輸入的迭代信念更新,將對應(yīng)于視覺空間周邊位置的狀態(tài)的后驗分布推向均勻分布。假設(shè)狀態(tài)的后驗分布與意識內(nèi)容之間存在對應(yīng)關(guān)系,并將感知與高精度狀態(tài)的混合相關(guān)聯(lián)(這是一個我們在第5節(jié)中會再次回到的關(guān)鍵點(diǎn)),這將導(dǎo)致刺激從意識中逐漸消失。同樣,雙眼競爭中典型的離散感知切換也會從生成模型中出現(xiàn),當(dāng)主體被限制選擇那些增強(qiáng)被注意刺激的精度(即矩陣A的映射)的(隱蔽的)注意策略,而以犧牲未被注意的刺激為代價時(參見注意力的偏向競爭模型;Desimone,1998)。主體接收到關(guān)于被注意刺激的精確信息,從而對被注意刺激的狀態(tài)有一個精確的后驗分布,同時由于缺乏關(guān)于未被注意刺激的精確信息,未被注意刺激的狀態(tài)后驗分布會逐漸消散為均勻分布。至關(guān)重要的是,隨著不確定性的積累,未被注意的刺激通過預(yù)期自由能中的模糊性降低項,逐漸變得更加具有認(rèn)知吸引力,從而推動最終的注意策略切換。同樣,假設(shè)主體的狀態(tài)后驗分布與意識感知內(nèi)容之間存在對應(yīng)關(guān)系,這會導(dǎo)致依賴于注意力的感知切換。

這種對雙眼競爭的主動推理模型很好地解釋了一些在被動模型中難以容納的實驗發(fā)現(xiàn),被動模型沒有為策略選擇等主體性過程設(shè)定明確的角色。具體來說,當(dāng)缺乏注意力時競爭速度的減慢(Paffen等人,2006;Zhang等人,2011),以及獎賞對優(yōu)勢持續(xù)時間的調(diào)節(jié)(綜述見Safavi和Dayan,2022)都可以被理解為預(yù)期自由能最小化的實例。如果感知切換是由注意力策略的切換驅(qū)動的,那么在存在干擾任務(wù)時競爭速度的減慢(Paffen等人,2006)可以通過感覺輸入精度的降低來解釋,這增加了主體需要從每只眼睛采樣輸入以達(dá)到對狀態(tài)的精確后驗分布所需的時間。同樣,向其中一個刺激添加獎賞將以加性方式最小化預(yù)期自由能的風(fēng)險項,解釋了獎賞對競爭的偏向效應(yīng)(Marx和Einhauser,2015;Wilbertz和Sterzer,2018)。此外,盡管Parr等人(2019)的原始論文中沒有呈現(xiàn),但在附錄1和圖3b中我們展示了該模型輕松解釋了Levelt定律(Brascamp等人,2015;Levelt,1965)——這是一組簡潔的命題,總結(jié)了刺激屬性(例如亮度對比度)與感知優(yōu)勢持續(xù)時間之間的規(guī)律性關(guān)系。重要的是,除了事后解釋大量現(xiàn)有的現(xiàn)象外,該模型還提供了關(guān)于獎賞驅(qū)動違反Levelt定律的經(jīng)驗預(yù)測(附錄2),這些預(yù)測可以在人類心理物理學(xué)領(lǐng)域輕松進(jìn)行檢驗。關(guān)于將這種建模策略擴(kuò)展到內(nèi)克爾立方體幻覺(意識科學(xué)中常用的另一種雙穩(wěn)態(tài)范式),可參見Novicky等人(2023)。

從在既定生成模型中最小化模糊性轉(zhuǎn)向最大化新奇性和參數(shù)學(xué)習(xí),Parr和Friston(2018b)提出,偏側(cè)忽視(一種以患者忽視視覺空間一側(cè)為特征的神經(jīng)綜合征,通常是右側(cè)大腦受損后忽視左側(cè))可以通過預(yù)期自由能的新奇性成分的缺陷來解釋。在臨床上,偏側(cè)忽視通常通過掃視取消任務(wù)進(jìn)行評估,要求患者圈出(即取消)呈現(xiàn)在一張紙上的所有刺激。在這里,忽視的患者將對視覺空間的一側(cè)毫無察覺,而忽視一側(cè)的刺激則未被取消。為了模擬這一點(diǎn),Parr和Friston模擬了一個類似于偏側(cè)忽視臨床測試的掃視取消任務(wù)。他們的模型使用網(wǎng)格來表示可能的掃視位置。在每次模擬開始時,所有位置都是新奇的(即參數(shù)確定性低),這促使主體向每個位置掃視,并在此過程中在每個位置的A矩陣的狄利克雷先驗中積累計數(shù)(降低了對“已取消”位置的掃視策略的預(yù)期自由能的新奇性成分)。通過增加左側(cè)空間的濃度參數(shù)來損傷A矩陣映射(即隱藏狀態(tài)與視覺結(jié)果之間的映射),有效地模擬了背側(cè)和腹側(cè)注意力網(wǎng)絡(luò)之間的斷開;消除了基于新奇性的左側(cè)空間掃視策略的任何能力,從而模擬了視覺忽視的經(jīng)驗現(xiàn)象學(xué)。

增加濃度參數(shù)的動機(jī)——即增加似然映射中的信心——是斷開連接是一種最大信心的狀態(tài),因為沒有任何數(shù)據(jù)可以改變突觸效能。該模型的一個關(guān)鍵預(yù)測是可以在健康受試者中進(jìn)行檢驗的——健康受試者可以通過突觸效能更新似然參數(shù)——即隨著對視覺場景的熟悉程度增加,個體應(yīng)該引發(fā)越來越大的信念更新,表現(xiàn)為更大的事件相關(guān)電生理反應(yīng)。預(yù)計編碼參數(shù)確定性的底層神經(jīng)系統(tǒng)包括從頂葉腹側(cè)注意力網(wǎng)絡(luò)(TJP)到背側(cè)注意力網(wǎng)絡(luò)的前額眼區(qū)(FEF)的傳入(前饋)連接。上述經(jīng)驗預(yù)測隨后由Parr、Mirza等人(2019)在健康人群中使用掃視取消任務(wù)結(jié)合DCM和MEG進(jìn)行了檢驗。與模型預(yù)測一致,他們發(fā)現(xiàn)當(dāng)場景更具可預(yù)測性時,F(xiàn)EF的背側(cè)成分積極解除對(右側(cè))腹側(cè)TPJ的抑制,從而產(chǎn)生更大的誘發(fā)反應(yīng)。根據(jù)規(guī)范微回路網(wǎng)絡(luò)的構(gòu)建,這種解除抑制在TPJ的深層最為明顯,已知TPJ的深層接收來自FEF的下行輸入。

到目前為止,我們已經(jīng)討論了三個一般性例子——特羅勒消逝、雙眼競爭和視覺忽視——在這些例子中,注意力和掃視策略(可以說)在決定意識內(nèi)容方面發(fā)揮了決定性作用。通過選擇性采樣過程確定內(nèi)容,該過程在一個視覺場景的一個位置生成高精度輸入,而以犧牲其他位置為代價。然而,注意力與意識內(nèi)容變化之間的關(guān)系遠(yuǎn)非一對一的。從經(jīng)驗來看,有證據(jù)表明被注意的項目可以保持無意識(Koch和Tsuchiya,2007),以及某些刺激可以在幾乎沒有注意力的情況下引發(fā)相應(yīng)的感知體驗(Matthews等人,2018)。那么,在主動推理下,意識感知與無意識感知的區(qū)別在哪里呢?合理地推測,答案來自于感知綜合背后的生成模型的層次結(jié)構(gòu)以及由此產(chǎn)生的信念更新的時間尺度分離。

為了將主動推理與關(guān)于意識的神經(jīng)相關(guān)性的廣泛文獻(xiàn)聯(lián)系起來,Whyte和Smith(2021)開發(fā)了一個兩級POMDP視覺意識模型。該模型將意識感知描述為依賴于生成模型中不同層次之間精確后驗分布的雙向傳播。重要的是,模型的第二層具有足夠的時間深度以產(chǎn)生目標(biāo)導(dǎo)向的行為(例如對視覺場景的主觀報告),這些行為必然在比刺激呈現(xiàn)更長的時間尺度上演變。利用這個模型,他們模擬了Dehaene等人(2006)的經(jīng)驗性得出的注意力、刺激強(qiáng)度和意識獲取之間關(guān)系的分類。通過操縱第一層隱藏狀態(tài)與觀測值之間的A矩陣映射的精度,代表刺激強(qiáng)度和注意力之間的相互作用,他們復(fù)制了主觀報告和神經(jīng)相關(guān)性的非線性縮放。與經(jīng)驗發(fā)現(xiàn)一致,報告的刺激可見性的非線性增加與第二層的高放電率和P3b樣ERP相關(guān),類似于前額頂葉區(qū)域的“點(diǎn)火”反應(yīng)。擴(kuò)展Dehaene等人(2006)的分類,Whyte和Smith(2021)引入了期望,預(yù)測在注意力存在且刺激遠(yuǎn)高于閾值時,有效的期望會降低P3b振幅,與中性條件和無效條件相比。這一預(yù)測被Schlossmacher等人(2020)獨(dú)立證實。

最初關(guān)于意識的神經(jīng)相關(guān)性的研究(包括形成德哈恩(Dehaene)分類模型框架的工作,該模型由懷特(Whyte)和史密斯(Smith)于2021年建模)支持了前額葉皮層(PFC)活動和晚期事件相關(guān)電位(ERPs,例如P3b)與意識感知之間存在強(qiáng)相關(guān)性的觀點(diǎn)。在多種實驗范式中進(jìn)行的研究報告了類似的結(jié)果(Bisenius等,2015;Sergent等,2005)。然而,無報告范式(Tsuchiya等,2015)的出現(xiàn)對這些發(fā)現(xiàn)提出了挑戰(zhàn)。在這種條件下,前額葉皮層活動減弱或消失(Brascamp等,2015;Frassle等,2014),而曾被認(rèn)為是意識接入指標(biāo)的晚期ERPs(如P3b)也不再出現(xiàn)(Cohen等,2020;Pitts等,2014;見圖3C)。像這樣的發(fā)現(xiàn)導(dǎo)致一些研究者拒絕將前額葉皮層的參與視為意識感知的必要條件(Boly等,2017)。

然而,重要的是,證據(jù)的天平已經(jīng)開始向相反方向傾斜。隨后來自非人靈長類動物電生理學(xué)的證據(jù)表明,即使在沒有報告的情況下,也可以從前額葉皮層解碼出意識的內(nèi)容(Kapoor等,2020),并且前額葉皮層活動的波動先于知覺轉(zhuǎn)換(Dwarakanath等,2020),這表明了因果作用的存在。為了調(diào)和這些發(fā)現(xiàn),懷特等人(2022)修改了他們之前關(guān)于意識接入的模型,將報告的工作記憶要求視為通過策略選擇實現(xiàn)的一種心理行為。關(guān)于在工作記憶中保留哪些信息的可用策略控制了將第一級刺激狀態(tài)映射到模型第二級(即,對應(yīng)于從視覺皮層到工作記憶的信息門控)的二級A矩陣的精確度,以及二級B矩陣的精確度(對應(yīng)于在工作記憶中自愿保持項目)。

懷特及其同事利用這個修改后的模型模擬了一個既有報告條件又有無報告條件的視覺掩蔽任務(wù)。這些模擬再現(xiàn)了報告條件下意識的神經(jīng)相關(guān)性,其中“被意識到的”刺激伴隨著模型第二級的高放電率和一個類似P3b的ERP。關(guān)鍵的是,懷特等人(2022)能夠在沒有報告的情況下通過在模型中模擬一系列刺激精確度(即A矩陣精確度),來評估模型中刺激的可見性,從而構(gòu)建模型第二級的后驗概率與相應(yīng)報告頻率之間的映射關(guān)系。在無報告條件下模擬相同任務(wù)時,當(dāng)模型不需要提供其自身感知狀態(tài)的明確報告(因此也不需要在工作記憶中保持項目)時,他們發(fā)現(xiàn)模型表現(xiàn)出較低的第二級放電率(即前額葉活動減少),并且沒有產(chǎn)生類似P3b的ERP,因為信息傳遞的精確度降低(見圖3C)。然而,重要的是,模型第二級的后驗概率仍然遠(yuǎn)高于接近100%報告性的閾值,再現(xiàn)了關(guān)鍵發(fā)現(xiàn),即在沒有報告的情況下,意識接入與前額葉活動減少和沒有晚期ERPs相關(guān)聯(lián)。

該模型提出了兩個關(guān)鍵預(yù)測。第一,前額葉活動和晚期ERPs應(yīng)該根據(jù)報告指令而分離,因為施加報告要求意味著主體必須以目標(biāo)導(dǎo)向的方式增加感覺皮層和前額葉皮層之間(以及前額葉皮層內(nèi)部)傳遞的信息的精確度;從而改變意識接入的神經(jīng)相關(guān)性。事實上,這正是在一項同時進(jìn)行的EEG-fMRI實驗中觀察到的(Dellert等,2021;該實驗在懷特等人(2022)模型作為預(yù)印本發(fā)布后發(fā)表)。具體來說,當(dāng)刺激是有意識的,但與任務(wù)無關(guān)時,視覺區(qū)域有強(qiáng)烈的激活,出現(xiàn)較大的N170,但前額葉激活較弱,沒有P3b。相比之下,當(dāng)刺激是有意識的,并且與任務(wù)相關(guān)時,出現(xiàn)了強(qiáng)烈的前額葉激活和較大的P3b。該模型的第二個預(yù)測是,即使在沒有報告的情況下,前額葉和視覺皮層之間傳遞的雙向信息的前饋成分也應(yīng)該包含關(guān)于意識內(nèi)容的精確信息,這一預(yù)測隨后被羅(Rowe)等人(2024)證實。

4.2 意識自我的模型

我們現(xiàn)在從外感受意識的模型轉(zhuǎn)向?qū)υ庾R、內(nèi)感受和情緒的模型,在這些模型中,主體推斷并就自身的內(nèi)部認(rèn)知和身體狀態(tài)做出策略決策。由于意識本質(zhì)上是主觀的,與自我相關(guān)的加工是意識科學(xué)研究的一個關(guān)鍵領(lǐng)域。這一領(lǐng)域也引起了臨床醫(yī)生的興趣,因為內(nèi)感受推斷和策略決策的擾亂與精神癥狀和現(xiàn)象學(xué)特征密切相關(guān)(例如抑郁癥中關(guān)于自我效能的異常推斷(Barrett等,2016;Ramstead,Wiese等,2023),或者反芻中策略選擇的中斷(Hesp等,2020))。為了概念上的清晰,我們按主題而不是按時間順序組織討論。

基于塞思(Seth,2013)最初提出內(nèi)感受推斷中情感內(nèi)容的基礎(chǔ),以及斯特凡(Stephan等,2016)后來將穩(wěn)態(tài)和應(yīng)激性穩(wěn)態(tài)失調(diào)與疲勞和抑郁聯(lián)系起來的工作,欽茨(Tschantz等,2022)開展了一系列模擬研究,以檢驗不同生成模型結(jié)構(gòu)對穩(wěn)態(tài)和應(yīng)激性穩(wěn)態(tài)過程的解釋能力(參見Corcoran等,2020)。通過一個預(yù)測編碼網(wǎng)絡(luò)對身體狀態(tài)變化的反應(yīng)性自主反應(yīng)進(jìn)行建模,并通過將穩(wěn)態(tài)設(shè)定點(diǎn)基于推斷的外感受狀態(tài)進(jìn)行條件化,將其推廣到簡單形式的預(yù)期行動。至關(guān)重要的是,內(nèi)感受預(yù)測誤差的精確度變化影響了對內(nèi)感受狀態(tài)變化的敏感性,導(dǎo)致穩(wěn)態(tài)調(diào)節(jié)失敗。下行本體感受預(yù)測誤差與上行內(nèi)感受預(yù)測誤差之間的平衡決定了主體是調(diào)整其關(guān)于生理狀態(tài)的先驗信念,還是執(zhí)行自主行動以使生理狀態(tài)與設(shè)定點(diǎn)對齊。當(dāng)優(yōu)先考慮上行感覺預(yù)測誤差而不是自主調(diào)節(jié)時——即當(dāng)前設(shè)定點(diǎn)的先驗與預(yù)期的內(nèi)感受數(shù)據(jù)相比足夠不精確時——促使主體改變其對設(shè)定點(diǎn)本身的信念。這種自主調(diào)節(jié)的失敗可能與自閉癥等疾病中的矛盾性感覺功能障礙有關(guān)(Gu & FitzGerald,2014),在這些疾病中,對感覺輸入的高敏感性與減弱的自主反應(yīng)和異常的應(yīng)激性穩(wěn)態(tài)共存。最后,通過使用部分可觀測馬爾可夫決策過程(POMDP)與預(yù)測編碼網(wǎng)絡(luò)進(jìn)行交互,使模型能夠解釋目標(biāo)導(dǎo)向的內(nèi)感受控制,其中主體通過預(yù)期維持零體溫(首選的穩(wěn)態(tài)設(shè)定點(diǎn))與預(yù)期體溫之間的偏差來做出行動決策。

補(bǔ)充這種概念驗證建模方法的見解,最近將主動推斷模型擬合到實證數(shù)據(jù)的研究推斷出在各種疾病中內(nèi)感受精確度受到擾亂,包括抑郁癥、焦慮癥、飲食障礙和物質(zhì)使用障礙(Smith等,2020)。值得注意的是,在心跳敲擊任務(wù)中,最佳擬合模型(通過最小化變分自由能反轉(zhuǎn)的簡單隱馬爾可夫模型)在患者樣本中未能在屏氣干擾下調(diào)整內(nèi)感受精確度,而健康對照組成功地增加了他們的內(nèi)感受精確度。這一發(fā)現(xiàn)最近在一個預(yù)注冊的、具有大樣本跨診斷的研究(Lavalley等,2024)以及健康對照組(Smith,Kuplicki,Teed等,2020)中得到了復(fù)制。

在一項重要的研究中,史密斯等人(Smith et al., 2021)測試了與主動推斷相關(guān)的神經(jīng)過程理論的一些基本預(yù)測。他們利用一種新穎的胃腸道感知范式,讓參與者報告通過吞咽式振動膠囊傳遞到胃部的不同強(qiáng)度的振動的存在(或不存在),同時通過同步腦電圖(EEG)記錄神經(jīng)反應(yīng)。對最佳擬合模型參數(shù)(同樣是一個簡單的隱馬爾可夫模型)的檢查發(fā)現(xiàn)支持神經(jīng)過程理論的證據(jù)。具體來說,盡管該模型并未擬合反應(yīng)時間或神經(jīng)反應(yīng),但內(nèi)感受精確度(A矩陣精確度)的增加與參與者的反應(yīng)時間以及感覺(頂枕區(qū))電極的誘發(fā)反應(yīng)幅度呈正相關(guān)。

轉(zhuǎn)向更具認(rèn)知背景的研究,艾倫等人(Allen et al., 2022)構(gòu)建了一個心視感覺整合模型,該模型在呈現(xiàn)喚醒性或非喚醒性視覺刺激時推斷其心動周期的階段(舒張期與收縮期)?;诖碳ゎ愋停P屯茢嗥湫呐K策略,控制心動周期之間的狀態(tài)轉(zhuǎn)換。心動周期的隱藏狀態(tài)反過來又控制視覺A矩陣的精確度。這個最小模型再現(xiàn)了幾項原本不相關(guān)的實證發(fā)現(xiàn)。喚醒性刺激導(dǎo)致立即的心臟加速(防御性驚跳反射;Graham & Clifton, 1966),而對A矩陣映射進(jìn)行合成性損傷,對應(yīng)于內(nèi)感受精確度的降低,產(chǎn)生了“心身幻覺”以及增加的錯誤推斷或元認(rèn)知偏差(例如,Allen et al., 2016;Hauser et al., 2017)。支持模型背后的假設(shè)——即主體根據(jù)呈現(xiàn)的視覺刺激推斷其心臟策略——科克倫等人(Corcoran et al., 2021)發(fā)現(xiàn),隨著感覺模糊度的增加,靜息心率和(高頻)心率變異性均有所下降。

內(nèi)感受、感知和情境推斷與情緒相關(guān)的理論和實證工作形式化,史密斯等人(Smith et al., 2019)表明,主動推斷主體能夠在“模擬童年”期間獲得一系列情緒概念。具體來說,每個主體最初在隱藏情緒狀態(tài)(“情緒概念”)與內(nèi)感受觀察之間有一個平坦的A矩陣映射,經(jīng)過數(shù)百次試驗,這些試驗包括觀察到的內(nèi)感受觀察(喚醒度、效價和行為)的組合以及外感受觀察(情境),主體學(xué)會了隱藏情緒狀態(tài)與內(nèi)感受觀察之間的映射。有趣的是,他們發(fā)現(xiàn),一個貧乏的“模擬童年”(即模型暴露的情緒結(jié)果統(tǒng)計偏向于某種特定情緒,如悲傷)會導(dǎo)致模型在后續(xù)的情緒推斷任務(wù)中準(zhǔn)確度降低,即使在暴露于其他情緒之后也是如此。在類似但更具實證性的背景下,史密斯等人(Smith, Lane, et al., 2019)使用分層模型模擬情緒工作記憶任務(wù)中的推斷。主體需要對兩個連續(xù)的情緒狀態(tài)進(jìn)行分類,然后進(jìn)行比較。有趣的是,他們發(fā)現(xiàn)在他們相對簡單的模型中,至少有七種不同的潛在神經(jīng)機(jī)制能夠產(chǎn)生情緒意識降低的表型。例如,當(dāng)主體對不典型的身體狀態(tài)有較高的先驗預(yù)期(如某些焦慮形式)時,它會可靠地將自身的悲傷和恐慌內(nèi)部狀態(tài)誤分類為生病和心臟病發(fā)作。

在上述描述的兩個模型中,效價被當(dāng)作一種觀察結(jié)果來處理,而不是自身被推斷的對象——鑒于解釋目標(biāo)是情緒推斷(而非情感推斷),這種簡化是合理的。為了補(bǔ)充這種處理方式,赫斯普等人(Hesp et al., 2021)提出了一個情感推斷模型,認(rèn)為效價是(部分地)從策略的先驗和后驗之間的不匹配中推斷出來的。策略的先驗僅基于預(yù)期自由能(例如公式14),而后驗則基于預(yù)期自由能以及基于連續(xù)觀察的后驗信念。從先驗到后驗的變化反映了預(yù)測誤差,表明新的觀察結(jié)果與每種策略下的先驗預(yù)期的一致性程度。這種誤差的方向隨后被用作更高層次模型中的觀察結(jié)果,該模型用于推斷效價狀態(tài)。在這里,支持策略先驗的低層次觀察結(jié)果促進(jìn)了積極效價,而與先驗不一致的觀察結(jié)果則促進(jìn)了消極效價。這種類型的(獎勵)預(yù)測誤差或“情感電荷”之前曾與多巴胺的相位性釋放相關(guān)聯(lián)。

同時,這種情感電荷被用來迭代更新預(yù)期自由能的精確度參數(shù),其中效價狀態(tài)充當(dāng)先驗。在這里,消極效價狀態(tài)和意外的觀察結(jié)果都會降低這種精確度,從而減少預(yù)期自由能對策略選擇的后續(xù)影響。這種減少發(fā)揮了幾個互補(bǔ)的作用。首先,它促進(jìn)了概率匹配行為,如果對策略或計劃的信念缺乏信心,這種行為可能是適應(yīng)性的。其次,如果指定了學(xué)習(xí)習(xí)慣(通常用E表示),它允許學(xué)習(xí)習(xí)慣發(fā)揮更強(qiáng)的影響。最后,它優(yōu)化了預(yù)期自由能對策略選擇的相對影響。具體來說,當(dāng)策略的后驗預(yù)期模型證據(jù)高于先驗預(yù)期模型證據(jù)時,情感電荷(和效價)是積極的,表明主體對其計劃的信心增加,從而提高了預(yù)期自由能相對于其他項的精確度。相反,當(dāng)策略的先驗預(yù)期模型證據(jù)高于后驗預(yù)期模型證據(jù)時,效價會降低預(yù)期自由能的權(quán)重(即,它減少了風(fēng)險、模糊性和新奇性對策略選擇的貢獻(xiàn))。重要的是,由于兩級模型允許效價狀態(tài)作為策略精確度的先驗信念,主體能夠?qū)㈩A(yù)期自由能對策略選擇的貢獻(xiàn)情境化,從而在反轉(zhuǎn)學(xué)習(xí)任務(wù)中提高表現(xiàn)。換句話說,通過為主體提供對其內(nèi)部模型的置信度的動態(tài)估計,主體能夠最優(yōu)地權(quán)衡當(dāng)前觀察結(jié)果(變分自由能)和預(yù)期未來觀察結(jié)果(預(yù)期自由能)對策略選擇的貢獻(xiàn)。

赫斯普等人(Hesp et al., 2021)提出的深度參數(shù)化推斷形式隨后被桑德維德-史密斯等人(Sandved-Smith et al., 2021)擴(kuò)展,用于模擬一種元意識的形式,這種元意識是冥想神經(jīng)科學(xué)中常見的循環(huán)現(xiàn)象學(xué)的基礎(chǔ),即“專注→分心→意識到分心→重新專注”的循環(huán)。該模型的關(guān)鍵貢獻(xiàn)在于將注意力、注意力的控制以及對注意力控制的意識以A矩陣精確度的分層控制來表述。

模型中第一級的A矩陣精確度將感覺觀察映射到隱藏狀態(tài),由第二級的注意力狀態(tài)控制,第二級包含兩種理想化狀態(tài):“專注”和“分心”。主體傾向于保持在專注的注意力狀態(tài),但由于第二級B矩陣的不精確性,主體偶爾會從專注狀態(tài)轉(zhuǎn)變?yōu)椴粚W顟B(tài)。第二級的策略選擇(心理行為)允許主體重新調(diào)整其注意力狀態(tài)并重新進(jìn)入專注狀態(tài),一旦主體意識到自己處于不專注狀態(tài),這是許多冥想實踐的關(guān)鍵方面。

元意識則由第三級構(gòu)成,它反過來控制第二級意識狀態(tài)的精確度。第三級的隱藏狀態(tài)包括兩種狀態(tài):高元意識狀態(tài),對應(yīng)于高精確度的第二級A矩陣;低元意識狀態(tài),對應(yīng)于低精確度的第二級A矩陣(通過第二級到第三級的A矩陣映射)。作為概念驗證,他們模擬了一個簡單的聽覺奇異任務(wù),并在不同的第三級注意力狀態(tài)下展示了主體在低元意識條件下比高元意識條件下花費(fèi)更長時間處于分心的注意力狀態(tài)。與低感知需求條件下走神增加的發(fā)現(xiàn)一致(Lin et al., 2016),在低元意識狀態(tài)下,主體只有在聽到聽覺奇異刺激時才注意到從專注到分心的轉(zhuǎn)變。換句話說,奇異刺激引發(fā)了更大的預(yù)測誤差——并導(dǎo)致更強(qiáng)的上升證據(jù)——迫使在層級結(jié)構(gòu)中對隱藏狀態(tài)的近似后驗進(jìn)行大規(guī)模信念更新。

重要的是,與上述旨在統(tǒng)一現(xiàn)有發(fā)現(xiàn)并生成新預(yù)測的模型不同,該模型的解釋目標(biāo)最好被理解為在理論主要以口頭定義、與實證數(shù)據(jù)聯(lián)系松散的研究領(lǐng)域早期階段,提供概念上的清晰性。因此,這種類型的建模最好被視為一種計算概念分析,是旨在統(tǒng)一現(xiàn)有結(jié)果或提供實證預(yù)測的建模的先決條件。

4.3 意識狀態(tài)模型

主動推斷模型尚未應(yīng)用于操縱意識狀態(tài)的實驗(但可參考霍布森和弗里斯頓的理論綜述)。然而,操縱意識狀態(tài)通常伴隨著感覺和運(yùn)動的脫節(jié),這些脫節(jié)至少在表面上適合用主動推斷的語言來解釋。例如,對長時間尺度模式違規(guī)的神經(jīng)反應(yīng)在睡眠和麻醉狀態(tài)下有所不同。為了突出主動推斷的解釋普適性,本節(jié)將介紹史密斯等人(2022)提出的聽覺規(guī)律感知分層模型的簡單擴(kuò)展,并展示如何通過針對性地操縱精確度來重現(xiàn)以下發(fā)現(xiàn):與清醒狀態(tài)下檢測“全局”(長時尺度)模式違規(guī)相關(guān)的晚期P3b事件相關(guān)電位(ERP)成分在非快速眼動(NREM)和快速眼動(REM)睡眠狀態(tài)下均缺失,而對“局部”違規(guī)的ERP反應(yīng)則得以保留。我們簡要概述模型結(jié)構(gòu)以解釋結(jié)果,并建議感興趣的讀者參考史密斯等人(2022)以獲取模型的逐步描述。

該模型包含兩個分層級別(見圖4a):第一級追蹤聽覺音調(diào)的瞬間變化,第二級追蹤第一級的音調(diào)模式,推斷整體試驗類型(即所有刺激是否具有相同的“標(biāo)準(zhǔn)”音調(diào),或者是否存在“奇異”音調(diào))。我們允許模型在10次試驗過程中在第二級的D向量中累積濃度參數(shù)。在第10次試驗中,音調(diào)要么符合預(yù)期的試驗類型,要么違反預(yù)期。與實證發(fā)現(xiàn)一致,“全局”模式違規(guī)在模型的第二級引發(fā)了類似P3b的大型ERP,而“局部”試驗內(nèi)預(yù)期違規(guī)在模型的第一級引發(fā)了類似失匹配負(fù)波(MMN)的ERP。基于非快速眼動和快速眼動睡眠是低腎上腺素能狀態(tài)的發(fā)現(xiàn),我們利用與主動推斷相關(guān)的進(jìn)程理論,對模型進(jìn)行針對性操縱以模擬去甲腎上腺素缺失,通過降低第二級B矩陣的精確度(應(yīng)用精確度參數(shù)β=0.9的softmax函數(shù))來實現(xiàn),這在理論和實證上均與腎上腺素能張力有關(guān)。與實證發(fā)現(xiàn)一致,降低B矩陣精確度消除了模型第二級的P3b樣ERP,但保留了第一級的MMN樣ERP(見圖4b)。由于第一級的動態(tài)不依賴于逐時間步的動態(tài),第一級B矩陣損傷對模型任何一級的ERP均無影響。

打開網(wǎng)易新聞 查看精彩圖片

正如所描述的,這個模型僅僅是解釋睡眠狀態(tài)下晚期ERP缺失的原因,并沒有本身解釋為什么參與者在睡眠的某些階段失去意識。然而,如果我們遵循前文提出的論點(diǎn)——意識接入需要一種時間深度,這種深度能夠抽象化感覺輸入的瞬間變化(弗里斯頓,2018;弗里斯頓等,2012;懷特和史密斯,2021)——那么這里提供的模型也可能為非快速眼動(NREM)睡眠與較少的夢境報告(表明意識的缺失)相關(guān)聯(lián),以及快速眼動(REM)睡眠以更頻繁的、帶有離奇且看似不連貫的現(xiàn)象學(xué)特征的夢境報告為特征(霍布森,2009)提供一種算法層面的解釋。

具體來說,非快速眼動(NREM)睡眠是一種低膽堿能狀態(tài),在主動推斷框架下,這會導(dǎo)致生成模型的層級之間因A矩陣精確度的降低而出現(xiàn)脫節(jié)。這種脫節(jié)會有效地使時間深度層級“離線”,極大地減少信念更新,這可能對應(yīng)于意識的喪失。

相比之下,快速眼動(REM)睡眠是一種高膽堿能狀態(tài),這將允許在層級之間進(jìn)行層級信息傳遞。關(guān)鍵在于,處于高膽堿能狀態(tài)的模型,受到感覺皮層內(nèi)在波動的驅(qū)動,并結(jié)合低腎上腺素能張力,會表現(xiàn)出隱藏狀態(tài)之間的隨機(jī)轉(zhuǎn)換(通過低B矩陣精確度),這可能解釋了REM睡眠中夢境的離奇現(xiàn)象學(xué)。有趣的是,REM睡眠行為障礙——通常被認(rèn)為是帕金森病的前驅(qū)癥狀——表現(xiàn)為在睡眠中“表演”這些夢境,這可能反映了在層級之間平衡精確度的失敗,尤其是在做夢期間抑制本體感受預(yù)測誤差精確度的失敗。

這個簡單的例子很好地說明了主動推斷建模的典型策略:從一個足夠明確的目標(biāo)現(xiàn)象出發(fā),構(gòu)建一個生成模型,并基于實證和理論神經(jīng)生物學(xué)的結(jié)合,模擬對模型的針對性操縱,以模擬實驗操縱。鑒于睡眠和麻醉豐富的神經(jīng)生物學(xué)背景,這種策略可以像上面所展示的那樣,直接應(yīng)用于對意識狀態(tài)的實驗操縱。當(dāng)然,這里展示的模型只是跨意識狀態(tài)神經(jīng)動態(tài)生成模型的一個例子。理想情況下,未來的研究將構(gòu)建并比較多個競爭模型與實證數(shù)據(jù)。

5. 主動推斷作為一種關(guān)于意識的最小理論

我們在本文開頭引入主動推斷時,期望將其作為構(gòu)建意識理論的基礎(chǔ),利用主動推斷模型的不同方面作為構(gòu)建模塊。在明確了框架以及主動推斷模型提供的解釋類型之后,我們現(xiàn)在來探討這一期望。為了盡可能清晰地闡述理論的結(jié)構(gòu)及其與實證數(shù)據(jù)的關(guān)系,我們遵循最近關(guān)于意識科學(xué)哲學(xué)的研究(Negro, 2024),并借鑒拉卡托斯(Lakatos, 1968)關(guān)于“科學(xué)研究綱領(lǐng)”的理論,這一理論在當(dāng)代科學(xué)哲學(xué)家中(Godfrey-Smith, 2003)通常被視為波普爾證偽主義綱領(lǐng)(Popper, 2008)的繼承者。

根據(jù)拉卡托斯(1968)的觀點(diǎn),研究綱領(lǐng)包含兩個組成部分:硬核和保護(hù)帶。硬核由構(gòu)成理論基礎(chǔ)的一系列基本概念組成,這些概念本身不需要直接可檢驗。相比之下,保護(hù)帶由較不核心的概念和假設(shè)組成,當(dāng)與硬核結(jié)合時,它們能夠產(chǎn)生可檢驗的預(yù)測。如果研究綱領(lǐng)要得以存續(xù),變化只能發(fā)生在保護(hù)帶上。重要的是,所作的改變必須是進(jìn)步的。也就是說,這些改變必須使理論更加精確,或者擴(kuò)展其解釋范圍以增強(qiáng)其預(yù)測能力。然而,如果對理論的改變僅僅是為了解釋矛盾的結(jié)果,而沒有產(chǎn)生新的預(yù)測或提供其他解釋優(yōu)勢,那么該研究綱領(lǐng)就被認(rèn)為是“退化的”,最終可能需要被放棄。例如,整合信息論(Albantakis et al., 2023; Oizumi et al., 2014; Tononi et al., 2016)的硬核由推導(dǎo)出Phi作為意識衡量標(biāo)準(zhǔn)的假設(shè)構(gòu)成。其外圍部分則由使Phi可計算的橋梁假設(shè)和近似方法構(gòu)成。如果Phi不能可靠地與意識狀態(tài)共變,這將對整合信息論構(gòu)成嚴(yán)重挑戰(zhàn)。然而,重要的是,這并不會對整合信息論造成致命打擊,因為導(dǎo)致失敗的原因可能是一個或多個推導(dǎo)出Phi可計算近似的假設(shè),而不是理論的硬核本身。研究綱領(lǐng)的健康狀況將取決于整合信息論能否通過改變保護(hù)帶來產(chǎn)生額外的預(yù)測。

主動推斷框架的核心是將兩個目標(biāo)函數(shù)——預(yù)期自由能和變分自由能——最小化。因此,這兩個目標(biāo)函數(shù)以及對它們進(jìn)行極值化的要求,必須包含在基于主動推斷的任何理論的硬核中。這意味著所有行為,無論是有意識的還是無意識的,都必須在某種最小意義上旨在最小化這些量(參見Hohwy, 2021)。實現(xiàn)這一目標(biāo)的神經(jīng)和計算過程,至少目前而言,是理論保護(hù)帶的一部分。

為了構(gòu)建意識理論,我們需要的下一個組成部分是目標(biāo)函數(shù)中的量與意識體驗之間的聯(lián)系。在上述所有模型中隱含的最最小的聯(lián)系是意識內(nèi)容與推斷出的隱藏狀態(tài)(即關(guān)于世界、身體和大腦狀態(tài)的近似后驗分布 q(s)之間的聯(lián)系。因此,所有意識內(nèi)容的變化都必須源于世界、身體或大腦狀態(tài)的推斷變化;這包括從沒有意識內(nèi)容到有意識內(nèi)容的變化(如意識狀態(tài)模型),以及外感受和內(nèi)感受內(nèi)容的變化(如感知、情緒和情感模型),以及源自大腦狀態(tài)本身的意識內(nèi)容(如元意識)。這是一種最小的聯(lián)系,因為它只表明主動推斷所特有的選擇性采樣是意識內(nèi)容變化的必要條件,而不是充分條件。這種最小的聯(lián)系排除了意識變化可以在狀態(tài)后驗分布不變的情況下發(fā)生的可能性(但不排除狀態(tài)后驗分布變化而意識體驗不變的可能性),并且與表現(xiàn)出由主動推斷支配行為的無意識生物是一致的。

最后,為了讓主動推斷成為一種關(guān)于意識本身的理論,而不僅僅是關(guān)于適應(yīng)性行為的理論,我們需要一個標(biāo)準(zhǔn)來區(qū)分意識狀態(tài)和無意識狀態(tài)(Doerig等,2021;Seth和Bayne,2022)。用主動推斷的語言來說,我們需要解釋是什么使某些后驗信念成為有意識的,而另一些則成為無意識的。在這里,我們再次參考基于主動推斷推導(dǎo)出的意識內(nèi)容的計算模型所做的假設(shè)。在上述所有被回顧的模型中,與意識內(nèi)容最對應(yīng)的后驗信念是那些驅(qū)動策略選擇的信念,特別是那些驅(qū)動主觀報告策略選擇的信念。至少,支持主觀報告的計算需要一個離散生成模型。連續(xù)生成模型可以驅(qū)動類似反射的動作,但支持主觀報告(例如,信心投注,或存在與否的判斷)的計算類型是明確的反事實的。因此,它們需要一個能夠考慮一個或多個離散備選方案的離散生成模型。重要的是,離散生成模型的深層演變速度太慢,無法與感知現(xiàn)象學(xué)相匹配(Whyte和Smith,2021)。因此,我們認(rèn)為意識/無意識的區(qū)分與意識獲取機(jī)制有關(guān),并且發(fā)生在離散-連續(xù)界面,即由感官瞬間變化驅(qū)動的連續(xù)后驗信念被轉(zhuǎn)化為可以驅(qū)動行動選擇的離散格式的地方。

因此,要使一個后驗信念成為有意識的,它必須發(fā)生在足夠慢的時間尺度上,以便從即時的感官流動中抽象出來,使其能夠為反事實策略選擇提供信息,并且足夠精確,以可靠地區(qū)分不同反事實的世界狀態(tài)。這與之前關(guān)于主動推斷的哲學(xué)工作是一致的,這些工作認(rèn)為在層次生成模型中,意識獲取的計算作用是迫使主體暫時確定一個關(guān)于世界隱藏狀態(tài)的特定后驗信念,以驅(qū)動行動選擇(Hohwy,2013;Marchi和Hohwy,2022;Whyte,2019)。

精確性要求可以被視為一種計算類比,觀察到的意識體驗是由分化且常常是互斥的感知對象組成的(Canales-Johnson等,2017;Oizumi等,2014;Seth,2021;Seth,2014;Tononi,1998)。至關(guān)重要的是,這也意味著不存在一個硬性閾值,使得后驗信念會成為可報告的。相反,意識獲取的閾值會隨著任務(wù)要求和主體需要執(zhí)行的決策類型而變化。此外,我們希望明確,我們并不是說成為反事實策略選擇過程的目標(biāo)是使后驗信念有意識的原因。相反,是這種后驗信念在合適的時間尺度上并且以足夠的精確性為策略選擇過程提供信息的能力(從反事實的角度來看)使其成為有意識的(參見關(guān)于意識的傾向性理論,如Carruthers,2003;Prinz,2012)。最適合解釋主觀報告的決策標(biāo)準(zhǔn)的具體內(nèi)容是一個正在進(jìn)行的實證辯論問題,最好被視為理論的保護(hù)帶的一部分(關(guān)于可能的實現(xiàn)方式,請參見Whyte等,2022)。關(guān)于現(xiàn)象學(xué)與反事實策略選擇深度之間的關(guān)系的討論,請參見(Seth,2014)。

重要的是,理論的核心部分所包含的關(guān)于意識過程與主動推斷之間的最小聯(lián)系,應(yīng)當(dāng)被視為發(fā)現(xiàn)和構(gòu)建一個更全面的意識理論的基礎(chǔ)構(gòu)件,而這個更全面的意識理論目前隱含在主動推斷的外圍部分。換句話說,盡管主動推斷的基本架構(gòu)中已經(jīng)有所暗示,但一個完整的理論需要的不僅僅是通過行動和感知來優(yōu)化內(nèi)部模型的原則。它必須明確模型本身的特性,才能在科學(xué)上具有實用性。

發(fā)現(xiàn)的過程涉及納入、測試和拋棄模型(包括上述所回顧的模型),并對現(xiàn)有模型進(jìn)行進(jìn)一步的完善(例如對雙眼競爭和層次化聽覺處理模型所做的修改;見附錄1-2)。對這些模型的檢查隨后會為一個更豐富的理論提供信息,提示哪些特性在對意識內(nèi)容、自我和狀態(tài)的解釋中是關(guān)鍵的。

我們在這里倡導(dǎo)的方法首先是一種開放式的理論構(gòu)建和發(fā)現(xiàn)過程,只要它仍然是一個不斷進(jìn)步的研究項目,并且在與其他意識理論的模型證據(jù)競爭中保持競爭力(參見Corcoran等,2023),理論構(gòu)建就會不斷擴(kuò)展和完善。未來的關(guān)鍵發(fā)展將包括對更多意識現(xiàn)象進(jìn)行更細(xì)致的建模,包括應(yīng)用結(jié)構(gòu)相似的模型來統(tǒng)一多樣化的意識和無意識現(xiàn)象。這體現(xiàn)在雙眼競爭和特羅勒消退的模型(Parr,Corcoran等,2019)中,以及用于容納無報告范式的注意力驅(qū)動感知模型的層次化擴(kuò)展(Whyte等,2022)。進(jìn)一步的工作還應(yīng)該研究將意識內(nèi)容、自我和狀態(tài)模型的元素結(jié)合起來的模型的表現(xiàn)。此外,針對獨(dú)特現(xiàn)象學(xué)類型(例如,情感和情緒、物體性、元認(rèn)知;Barrett等,2016;Nikolova等,2022;Pezzulo等,2018;Seth,2014;Seth等,2012;Seth和Friston,2016)的概念模型也需要進(jìn)一步完善,以實現(xiàn)更大的計算特異性,并能夠產(chǎn)生可檢驗的預(yù)測。

理論的保護(hù)帶由允許對特定意識現(xiàn)象的模型進(jìn)行書寫和模擬的形式化構(gòu)成,并且包括將模擬結(jié)果映射到實證得出的行為和神經(jīng)數(shù)據(jù)的假設(shè)。這包括生成模型的結(jié)構(gòu)、將生成模型和狀態(tài)及策略推斷的動態(tài)映射到神經(jīng)數(shù)據(jù)的過程理論,以及將通過模擬得出的量與報告的現(xiàn)象學(xué)聯(lián)系起來的假設(shè)(例如,感知的內(nèi)容是否對應(yīng)于后驗分布的眾數(shù),分布的精確性是否對感覺現(xiàn)象學(xué)有貢獻(xiàn)?)。

當(dāng)前對這一理論的表述是有意保持極簡的,為活躍推斷理論家之間在經(jīng)驗或理論上尚未確定的問題上保留了實質(zhì)性的分歧空間。它也承認(rèn),絕大多數(shù)的解釋性工作將由理論的保護(hù)帶完成,因此,它在很大程度上對富有成效的修正和完善是開放的(鑒于可能的生成模型結(jié)構(gòu)的多樣性以及模擬數(shù)據(jù)與實證數(shù)據(jù)之間映射的過程理論的靈活性)。在個體生成模型的層面,幾乎總是可以構(gòu)建一組候選模型,這些模型能夠在不同程度上解釋相關(guān)的實證數(shù)據(jù),而在極端情況下,它們甚至可能產(chǎn)生相互矛盾的預(yù)測。這是一個特點(diǎn),而不是一個缺陷,并且與活躍推斷作為一種建模框架這一事實相輔相成,它已經(jīng)與一系列變分(貝葉斯)方法一起發(fā)展,用于模型擬合和模型比較(Daunizeau,2011;K. Friston等,2007;Zeidman等,2022)。這些方法使得在競爭的生成模型家族之間進(jìn)行裁決成為可能,每個模型都體現(xiàn)了關(guān)于產(chǎn)生觀察到的實證數(shù)據(jù)的過程的假設(shè)。因此,個體生成模型的發(fā)展——以及活躍推斷作為一種意識理論的發(fā)展——是相輔相成的,為理論既能夠?qū)嵶C爭論做出貢獻(xiàn),又能夠與其實證爭論共同進(jìn)化留下了空間。

例如,正如我們前面提到的,支持意識對感知狀態(tài)的獲取的各種決策標(biāo)準(zhǔn)是一個正在進(jìn)行的討論話題,最近的證據(jù)指向了一種潛在的元認(rèn)知機(jī)制,該機(jī)制涉及對刺激的存在與否進(jìn)行抽象推斷,而這種推斷獨(dú)立于感知空間本身的結(jié)構(gòu)(Dijkstra等,2023)。這一機(jī)制與之前提出的一個活躍推斷架構(gòu)(Whyte等,2022)相悖,該架構(gòu)通過一個明確與主體感知空間結(jié)構(gòu)相聯(lián)系的策略空間來模擬意識獲取。目前的證據(jù)還不足以在更一般的情境中區(qū)分這兩種假設(shè),但如果意識獲取確實基于一種與感知狀態(tài)空間結(jié)構(gòu)無關(guān)的元認(rèn)知決策,那么這將對該特定的活躍推斷模型構(gòu)成重大(可能是不可逾越的)挑戰(zhàn)。然而,至關(guān)重要的是,這一模型組件是獨(dú)特的,并不是活躍推斷下生成模型結(jié)構(gòu)的一個內(nèi)在特征,這使得未來有可能構(gòu)建尊重新發(fā)現(xiàn)的模型(并且通過這樣做,富有成效地將活躍推斷的解釋范圍擴(kuò)展到元認(rèn)知領(lǐng)域)。我們將這種靈活性視為理論的一個解釋優(yōu)勢,而不是缺陷,鑒于意識科學(xué)的早期階段以及隨著方法和數(shù)據(jù)質(zhì)量的提高而不斷修訂實證發(fā)現(xiàn),這種靈活性是完全合適的。

這些考慮留下了這樣的擔(dān)憂:活躍推斷可能過于靈活,無法作為一種意識理論而富有成效(而不僅僅是一個有用的建??蚣埽;蛘?,換句話說,理論的核心與保護(hù)帶之間的聯(lián)系留下了太多的自由度,無法導(dǎo)向一個自身獨(dú)特可識別的意識理論。然而,有兩個關(guān)鍵的考慮因素可以緩解這一擔(dān)憂。首先,上述關(guān)于對活躍推斷意識獲取模型的潛在修訂的例子涉及修訂一個模型中關(guān)于主體策略空間的假設(shè),因此并不構(gòu)成對理論保護(hù)帶的重大打擊。至關(guān)重要的是,這并非適用于所有假設(shè)。不同模型共享由少數(shù)幾個語義可解釋的數(shù)量(即,準(zhǔn)確性、復(fù)雜性、風(fēng)險、模糊性、新奇性)組成的客觀函數(shù)這一事實,限制了可能對特定行為做出貢獻(xiàn)的參數(shù)數(shù)量。例如,在模擬選擇性注意力時,刺激的顯著性被歸因于A矩陣的精確性——這將通過預(yù)期自由能的表征(模糊性最小化)成分對行為產(chǎn)生影響。這一假設(shè)幾乎被所有涉及注意力和視覺搜索的活躍推斷模型所共享(Allen等,2019;Holmes等,2021;Mirza等,2018,2018,2019;Parr等,2021;Parr & Friston,2017a,2017b,2018b;Whyte等,2022;Whyte & Smith,2021)。因此,如果發(fā)現(xiàn)一個無法用這種方式建模的注意力效應(yīng),那么這將對活躍推斷意識理論構(gòu)成非常重大的打擊,因為這種修訂的影響將波及大多數(shù)現(xiàn)有模型。

第二個重要的考慮因素是,事實上,該理論確實產(chǎn)生了定量和定性的預(yù)測。盡管這些預(yù)測并非直接從理論的核心推導(dǎo)而來,但它們足夠接近,如果被證明是錯誤的,那么將需要修訂大多數(shù)建模研究中所做的橋梁假設(shè)——即使這些研究似乎與意識科學(xué)毫無關(guān)系。這種修訂將使理論危險地接近成為一個退化的研究項目。在主動視覺中存在探索-利用權(quán)衡是一個定量預(yù)測的例子。我們在附錄2中給出了一個在雙眼競爭背景下這種預(yù)測的明確例子。如果發(fā)現(xiàn)與刺激相關(guān)的獎勵并沒有與競爭刺激的表征內(nèi)容(例如,亮度對比度)在選擇注意力策略時進(jìn)行權(quán)衡,那么活躍推斷將受到嚴(yán)重挑戰(zhàn),因為預(yù)期自由能中風(fēng)險與模糊性之間的權(quán)衡是理論核心的一個基本組成部分。當(dāng)然,直接測試這一預(yù)測將很困難,因為參與者之間在學(xué)習(xí)速率、悲觀先驗以及對獎勵關(guān)聯(lián)的敏感性等方面存在個體差異,以及其他因素。

此外,注意力在早期視覺處理中所起作用的程度仍然不確定,這意味著在實踐中,通常需要在各種實驗中進(jìn)行最佳解釋的推斷。然而,如果在參與者和實驗范式(例如,雙眼競爭和特羅勒消退)之間,最佳擬合模型被穩(wěn)健地證明在選擇注意力策略時沒有尊重風(fēng)險與模糊性之間的預(yù)期權(quán)衡,那么活躍推斷意識理論將變得不那么可信。因此,在某種意義上,活躍推斷建模框架——以及伴隨它的模型擬合和比較工具——是嚴(yán)肅檢驗活躍推斷作為一種意識理論的關(guān)鍵。這是一個有利的位置。模型擬合和比較的工具在任何情況下都不會假設(shè)用于推導(dǎo)被擬合模型的理論的真實性。在特定情境中擬合得最好的模型完全有可能是一個違反活躍推斷意識理論核心信條的模型。

我們還可以從該理論中推導(dǎo)出第二個定性預(yù)測。具體來說,正如我們在前面提到的,作為意識理論的主動推斷的一個核心承諾是,如果意識內(nèi)容有任何變化,那么身體、大腦或世界的推斷狀態(tài)也必須發(fā)生變化。這一承諾的推論是,在缺乏感官(A矩陣)精確性的情況下,關(guān)于世界狀態(tài)的后驗信念不應(yīng)偏離其先驗軌跡(例如,我們能夠在腦海中默默數(shù)數(shù)的事實表明,我們可以根據(jù)關(guān)于從一個數(shù)字過渡到下一個數(shù)字的先驗信念,逐刻改變我們的后驗信念,但在缺乏精確的感官數(shù)據(jù)的情況下,我們不會偏離這一數(shù)字軌跡),因此,意識內(nèi)容也不應(yīng)發(fā)生變化。該理論的一個方便的口號因此是“看見即凝視”(其他感覺模態(tài)也是如此,例如“聽見即聆聽”“感覺即觸摸”等)。也就是說,有意識地感知意味著運(yùn)用某種反事實策略選擇過程所特有的精確性分配,涵蓋外顯和內(nèi)隱行為。完全將零精確性分配給一種感覺模態(tài)可能過于理想化,以至于在經(jīng)驗上難以處理;然而,與理論核心相關(guān)的另一個預(yù)測是,精確性的降低會導(dǎo)致信念更新的延遲,表現(xiàn)為意識內(nèi)容變化的延遲。如果我們把內(nèi)源性精確性分配與內(nèi)隱和外顯注意力策略聯(lián)系起來(Hohwy,2012),而這是主動視覺的主動推斷模型中所做出的假設(shè),那么在選擇注意力/掃視策略時被分配了高精確性的刺激,將比視網(wǎng)膜匹配但不是掃視目標(biāo)的刺激更快地進(jìn)入意識內(nèi)容。這種預(yù)測也是主動推斷作為意識理論的獨(dú)特之處,與其他更具針對性的意識理論(如全局工作空間理論或整合信息理論)形成對比,后者沒有明確的動作角色,而在主動推斷中,精確性的分配是通過明確選擇注意力或掃視策略來實現(xiàn)的。這種經(jīng)驗性預(yù)測確實是整合信息理論與被動預(yù)測處理理論以及主動推斷之間對抗性合作的一部分(INTREPID CONSORTIUM,2021)。

最后,重要的是要注意,該理論的成功與否并不完全取決于這兩個接近核心的預(yù)測的成功與否。即使這些預(yù)測得到驗證,主動推斷仍有可能作為意識理論失敗。實際上,理論失敗的方式可能有很多種不太戲劇性的方式——而且我們懷疑這些方式更有可能發(fā)生。例如,如果主動推斷的關(guān)鍵現(xiàn)象模型過于復(fù)雜(即它們過度擬合于特定的實驗結(jié)果且無法泛化),或者意識和非意識感知的模型看起來無法區(qū)分,或者不同意識現(xiàn)象的模型未能顯示出一致的共同點(diǎn)和差異,以至于該理論在提供統(tǒng)一或獨(dú)特解釋方面幾乎沒有幫助,那么這將表明這是一個退化的研究項目。反過來,如果該理論最終取得成功,我們期望最終能夠用一組相對較小的模型來復(fù)制意識的所有關(guān)鍵行為和神經(jīng)相關(guān)性,這些模型沿著少數(shù)幾個維度變化,反映報告的現(xiàn)象學(xué)和神經(jīng)相關(guān)性之間的差異和相似性。這也暗示了解釋的性質(zhì)和方向。神經(jīng)和行為變量通過主動推斷的解釋工具與現(xiàn)象學(xué)(反之亦然)相映射。

結(jié)論

在這里,我們論證了主動推斷正是因為**不是**一種意識理論,才在當(dāng)前關(guān)于意識的理論方法中獨(dú)樹一幟,能夠充分展現(xiàn)意識科學(xué)研究下現(xiàn)象的豐富性和多樣性。至關(guān)重要的是,我們主張主動推斷不僅僅是一個用于建模意識的框架。這些模型在意識科學(xué)背景下的解釋所隱含的假設(shè),導(dǎo)致了一系列經(jīng)驗預(yù)測,如果這些預(yù)測被證明是錯誤的,那么將需要對在主動推斷下構(gòu)建的大多數(shù)模型進(jìn)行修訂。該理論的核心由一個要求構(gòu)成:在感知中最小化變分自由能,在策略選擇中最小化預(yù)期自由能,同時推測意識的內(nèi)容(包括外感受和內(nèi)感受體驗,以及大腦自身狀態(tài))——在某種程度上——必須與世界狀態(tài)的推斷相對應(yīng),這種對應(yīng)發(fā)生在連續(xù)的感官計算與離散的反事實策略選擇過程之間的界面上。

意識的科學(xué)研究,歸根結(jié)底是一門經(jīng)驗科學(xué)。如果主動推斷要為我們提供一個有用的意識理論,那么將來之不易的理論見解轉(zhuǎn)化為經(jīng)驗見解就必須成為優(yōu)先事項。目前,在將旨在澄清概念的抽象模型轉(zhuǎn)化為能夠?qū)?jīng)驗數(shù)據(jù)提供定性解釋的模型方面,存在著明顯的瓶頸。反過來,在將這些旨在定性解釋和預(yù)測的更復(fù)雜的理論模型轉(zhuǎn)化為能夠與數(shù)據(jù)進(jìn)行定量比較的最小模型方面,也存在瓶頸。大多數(shù)的解釋性工作仍有待完成。然而,我們在本文中主張,一種理論的輪廓已經(jīng)開始顯現(xiàn)。因此,我們對主動推斷作為一種意識理論,最終能夠提供一組最小化的模型來解釋和統(tǒng)一意識內(nèi)容、自我和狀態(tài)的研究充滿樂觀。

附錄1:主動推斷下的Levelt定律

為了展示Parr、Corcoran等人(2019)提出的雙眼競爭模型與Levelt定律的兼容性,我們重新實現(xiàn)了原始模型。簡要來說,該模型有三個隱藏狀態(tài)因子,分別編碼呈現(xiàn)給每只眼睛的刺激的身份(狀態(tài)為{左,空白}和{右,空白})以及注意力的焦點(diǎn)(狀態(tài)為{左,右})。換句話說,人們可以將注意力集中在與右側(cè)刺激一致的特征上,或者集中在來自右眼的數(shù)據(jù)上,或者集中在來自左眼的數(shù)據(jù)上。模型有兩個結(jié)果模態(tài)(A矩陣),每個眼睛的隱藏狀態(tài)因子各對應(yīng)一個,它們將進(jìn)入每只眼睛的刺激的觀察條件概率映射到相應(yīng)的隱藏狀態(tài)。A矩陣映射的精確性依賴于注意力隱藏狀態(tài)因子。當(dāng)注意力缺失時,A矩陣是均勻的(例如,列由[0.5 0.5]組成),而當(dāng)注意力存在時,映射相對精確([0.7 0.3])。這使得隱藏狀態(tài)在未被注意的觀察模態(tài)下條件獨(dú)立。與每只眼睛相關(guān)的隱藏狀態(tài)因子的B矩陣初始化為單位矩陣,然后通過softmax函數(shù),其中精確性參數(shù)ω = 0.8,引入足夠的不確定性到主體的轉(zhuǎn)移信念中,以確保在缺乏精確輸入(即在缺乏注意力的情況下)時,關(guān)于隱藏狀態(tài)的不確定性會隨著時間積累,未被注意的刺激會變得越來越具有認(rèn)知吸引力。注意力隱藏狀態(tài)因子的B矩陣依賴于主體的注意力策略{左,右},將注意力轉(zhuǎn)移置于主體的控制之下。兩種結(jié)果模態(tài)的C向量都是均勻的。

為了模擬Levelt命題所描述的實驗條件,我們系統(tǒng)地降低了其中一個(Levelt的第二命題)或兩個(Levelt的第四命題)A矩陣映射的精確性。Levelt的第二命題指出,降低進(jìn)入一只眼睛的刺激的“強(qiáng)度”(例如對比度),而保持進(jìn)入另一只眼睛的刺激強(qiáng)度不變,應(yīng)該會顯著增加與未改變刺激相關(guān)聯(lián)的感知的主導(dǎo)持續(xù)時間,并導(dǎo)致與強(qiáng)度降低的刺激相關(guān)聯(lián)的感知的主導(dǎo)持續(xù)時間相對較小的減少。與之相符的是,降低其中一個A矩陣的精確性,而保持另一個不變,導(dǎo)致進(jìn)入更精確眼睛的刺激被采樣(即被注意)的時間顯著增加,而與較不精確眼睛相關(guān)的刺激被采樣的時間逐漸減少(圖3b上部)。

這種不對稱性是由于較不精確的刺激的認(rèn)知價值相對降低。Levelt的第四命題指出,增加進(jìn)入兩只眼睛的刺激的“強(qiáng)度”將導(dǎo)致兩種刺激感知的主導(dǎo)持續(xù)時間減少。與Levelt的第四命題一致,降低兩個A矩陣的精確性增加了主體在切換之前采樣刺激的時間(圖3b下部)。A矩陣精確性的對稱降低促使主體花費(fèi)更多時間采樣每個刺激以減少其不確定性,從而導(dǎo)致更長的主導(dǎo)持續(xù)時間。換句話說,在A矩陣精確性降低的情況下,每個刺激保持其認(rèn)知價值(即減少模糊性)的時間更長。

附錄2:雙眼競爭與探索-利用困境

基于最小化預(yù)期自由能的主體在探索(即模糊性)和利用(即風(fēng)險)之間的權(quán)衡,我們通過將附錄1中描述的Levelt命題的模擬擴(kuò)展到包含獎勵,試圖生成一個新的實驗預(yù)測。具體來說,我們模擬了Levelt第二命題所描述的條件,但在第一組模擬中假設(shè)了一個均勻的C向量,而在這里我們將降低精確性的刺激(例如,在實驗設(shè)置中對比度降低的刺激)與獎勵相關(guān)聯(lián)。在模擬的每個時間步中,右眼結(jié)果模態(tài)的“右”狀態(tài)相關(guān)的觀察被賦予了一個值 r = 0.25 ,這在雙眼的A矩陣精確性匹配時(即每個刺激的認(rèn)知價值匹配,但獎勵眼的風(fēng)險更低)導(dǎo)致了對獎勵刺激感知的初始主導(dǎo)持續(xù)時間的偏倚。重要的是,由于風(fēng)險和模糊性相互權(quán)衡,這種偏倚可以通過降低獎勵眼的精確性來補(bǔ)償,從而降低其認(rèn)知(模糊性降低)價值(圖A.2)。因此,我們預(yù)測:1)在刺激強(qiáng)度(對比度)匹配的情況下,競爭將偏向與獎勵刺激相關(guān)的感知;2)這種偏倚將通過降低獎勵刺激的認(rèn)知價值來補(bǔ)償。綜合來看,這將導(dǎo)致在獎勵條件下對Levelt第二命題的預(yù)測性違反。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

原文鏈接: https://arxiv.org/pdf/2410.06633