On the minimal theory of consciousness implicit in active inference

主動(dòng)推理隱含最小意識(shí)理論

https://arxiv.org/pdf/2410.06633

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

摘要

體驗(yàn)的多面性給意識(shí)的研究帶來(lái)了挑戰(zhàn)。傳統(tǒng)神經(jīng)科學(xué)方法通常專注于孤立的方面,例如感知意識(shí)或意識(shí)的整體狀態(tài),并圍繞相關(guān)的經(jīng)驗(yàn)范式和發(fā)現(xiàn)構(gòu)建理論。因此,意識(shí)理論往往難以比較;事實(shí)上,這些理論試圖解釋的現(xiàn)象可能幾乎沒有重疊之處。在這里,我們采用了一種不同的方法:從主動(dòng)推理(active inference)開始,這是一種基于貝葉斯推理(Bayesian inference)建模行為的首要原則框架,并逐步構(gòu)建出一種最小化的意識(shí)理論,這種理論從主動(dòng)推理下推導(dǎo)出的計(jì)算模型的共同特征中涌現(xiàn)出來(lái)。我們回顧了一系列將主動(dòng)推理模型應(yīng)用于意識(shí)研究的工作,并認(rèn)為所有這些模型中都隱含著一組小的理論承諾,這些承諾指向了一種最小化(且可檢驗(yàn)的)意識(shí)理論。

1. 引言

意識(shí)是異質(zhì)且多面的。初步來(lái)看,意識(shí)的科學(xué)研究可以分為三個(gè)相關(guān)(但在實(shí)踐中,很大程度上相互獨(dú)立)的研究項(xiàng)目:對(duì)意識(shí)內(nèi)容、狀態(tài)和自我的研究(Seth, 2021)。意識(shí)的內(nèi)容是指體驗(yàn)中主體所意識(shí)到的品質(zhì)或元素(例如,紅色玫瑰在綠色背景上的圖像,或新鮮煮好的咖啡的香氣)。通過(guò)控制物理刺激屬性和整體意識(shí)狀態(tài)(如困倦),同時(shí)改變主觀感知來(lái)研究?jī)?nèi)容(Baars, 2002)。有意識(shí)的生物還具有不同的整體意識(shí)狀態(tài),這些狀態(tài)通常通過(guò)行為進(jìn)行評(píng)估(例如,通過(guò)格拉斯哥昏迷評(píng)分量表;Teasdale et al., 2014),并且對(duì)于評(píng)估意識(shí)障礙患者至關(guān)重要。這些狀態(tài)包括植物狀態(tài)、各種睡眠狀態(tài)、正常清醒狀態(tài),以及可能像譫妄或幻覺狀態(tài)這樣的狀態(tài)(詳見 Bayne et al., 2016)。在人類中,意識(shí)通常還伴隨著某種形式的最小化和/或敘事性自我意識(shí)(Gallagher, 2000),以及身體性、自我性和人格性的體驗(yàn)(Ciaunica et al., 2022; Seth, 2013; Seth & Tsakiris, 2018)。

大多數(shù)關(guān)于意識(shí)的神經(jīng)科學(xué)理論將這些現(xiàn)象的某個(gè)子集作為其解釋目標(biāo),并圍繞相關(guān)的經(jīng)驗(yàn)范式和發(fā)現(xiàn)構(gòu)建理論(Seth & Bayne, 2022)。例如,全局工作空間理論(Baars, 2005; Baars et al., 2013)及其當(dāng)代形式——全局神經(jīng)工作空間理論(Dehaene et al., 2011; Mashour et al., 2020)是圍繞對(duì)比分析方法構(gòu)建的,該方法將意識(shí)內(nèi)容作為因變量,即通過(guò)改變參與者是否意識(shí)到由刺激引發(fā)的某種特定內(nèi)容(Baars, 2005)。意識(shí)狀態(tài)最初被視為一個(gè)背景條件(Dehaene et al., 2006),使得全局神經(jīng)工作空間理論主要成為一種關(guān)于意識(shí)內(nèi)容的理論。此后,該理論也被應(yīng)用于通過(guò)麻醉操縱整體意識(shí)狀態(tài)的實(shí)驗(yàn)(詳見 Mashour et al., 2020)。然而,意識(shí)狀態(tài)最初被假設(shè)為內(nèi)容的背景條件,而不是約束內(nèi)容的背景性建構(gòu),這一假設(shè)在當(dāng)代版本的理論中可能仍然存在(詳見 Bayne et al., 2016; Bayne & Carter, 2018)。同樣,高階理論(Brown et al., 2019; Fleming, 2020; Lau & Rosenthal, 2011)也是主要關(guān)于意識(shí)內(nèi)容的理論,目前尚未明確意識(shí)內(nèi)容與意識(shí)狀態(tài)之間的關(guān)系。類似地,整合信息理論(Albantakis et al., 2023; Oizumi et al., 2014; Tononi et al., 2016)是另一種領(lǐng)先的意識(shí)理論,其明確目標(biāo)是解決意識(shí)的難題(即解釋為什么某些物理結(jié)構(gòu)會(huì)產(chǎn)生主觀體驗(yàn),而其他結(jié)構(gòu)則不會(huì))。整合信息理論完全從內(nèi)在角度看待意識(shí),從而淡化了外顯行為的作用,而外顯行為在塑造我們所意識(shí)的內(nèi)容以及決定意識(shí)內(nèi)容的質(zhì)性特征方面可能發(fā)揮重要作用(O’Regan & No?, 2001; Seth, 2014)。其他理論,例如主觀性自我模型理論(Metzinger, 2004)或投射意識(shí)模型(Rudrauf et al., 2017),則專注于解釋自我或第一人稱視角的存在。除了上述理論外,還有許多其他意識(shí)理論,其中許多優(yōu)先考慮特定的解釋目標(biāo)和方法論。這種狀況帶來(lái)了雙重挑戰(zhàn):不僅基于經(jīng)驗(yàn)證據(jù)難以在意識(shí)理論之間進(jìn)行仲裁(Yaron et al., 2022),而且有時(shí)也不清楚這些理論是否旨在解釋相同的經(jīng)驗(yàn)數(shù)據(jù)(Seth & Bayne, 2022)。

在本文中,我們沒有從意識(shí)的一個(gè)或多個(gè)特定屬性出發(fā),將其作為主要的解釋目標(biāo),而是從主動(dòng)推理開始,這是一個(gè)將適應(yīng)性行為建模為(近似)貝葉斯推理的框架,并探討是否可以構(gòu)建一種意識(shí)理論。該框架的新穎之處并不在于提供獨(dú)特的預(yù)測(cè)。事實(shí)上,計(jì)算神經(jīng)科學(xué)及相關(guān)學(xué)科中許多替代的但特定領(lǐng)域的規(guī)范建模框架與主動(dòng)推理一致或等價(jià),但往往僅適用于更狹窄的范圍(Da Costa, Sajid, et al., 2020; Sajid, Ball, et al., 2021; Sajid, Da Costa, et al., 2021)。相反,主動(dòng)推理的新穎之處在于其普遍性。通過(guò)最小化僅兩個(gè)目標(biāo)函數(shù)——變分自由能和預(yù)期自由能,可以在該框架下建模極其多樣的行為(Parr et al., 2022)。事實(shí)上,主動(dòng)推理框架已被應(yīng)用于認(rèn)知和神經(jīng)科學(xué)領(lǐng)域的各種現(xiàn)象,包括視覺搜索(Cullen et al., 2020; Mirza et al., 2018; Parr et al., 2021)和語(yǔ)言的理解與生成(Friston, Parr, et al., 2020; Friston, Sajid, et al., 2020)。由于這些現(xiàn)象都通過(guò)最小化相同的目標(biāo)函數(shù)而出現(xiàn)——這些目標(biāo)函數(shù)可以分解為一組可解釋的(準(zhǔn)目的論)術(shù)語(yǔ)——主動(dòng)推理使我們能夠揭示不同現(xiàn)象之間的共性和差異,這些共性和差異在不太一般的建??蚣苤锌赡鼙谎谏w。因此,我們將論證,正是因?yàn)橹鲃?dòng)推理本身并非一種意識(shí)理論,它才能充分涵蓋意識(shí)的多樣化屬性(參見 Hohwy & Seth, 2020; Vilas et al., 2021)。論點(diǎn)在于,通過(guò)從一個(gè)用于建模適應(yīng)性行為的通用框架開始,意識(shí)理論的輪廓將自然而然地逐漸顯現(xiàn),因?yàn)楦鞣N意識(shí)現(xiàn)象開始通過(guò)單一的數(shù)學(xué)公式得到解釋。

在從主動(dòng)推理構(gòu)建意識(shí)理論的實(shí)踐中,一個(gè)自然的第一步(這一步已經(jīng)正在進(jìn)行中)是將該框架應(yīng)用于意識(shí)科學(xué)領(lǐng)域中具有代表性的現(xiàn)象,以構(gòu)建模型。開發(fā)出這些模型后,可以探索它們的計(jì)算屬性和行為,并將每個(gè)模型中的變量和參數(shù)映射到正在建模的具體意識(shí)過(guò)程的現(xiàn)象學(xué)方面。每個(gè)模型隨后成為理論的一個(gè)構(gòu)建模塊,隨著更多模型的積累,理論逐漸發(fā)展。因此,這一過(guò)程的一個(gè)關(guān)鍵組成部分在于識(shí)別具有解釋力和系統(tǒng)性的模型之間的共同計(jì)算屬性,這些模型涵蓋了意識(shí)科學(xué)中多樣化的現(xiàn)象(Atkinson et al., 2000; Seth, 2009)。

本文旨在面向兩個(gè)目前在很大程度上相互獨(dú)立的關(guān)鍵受眾:從事意識(shí)研究的實(shí)驗(yàn)神經(jīng)科學(xué)家和認(rèn)知科學(xué)家,以及在主動(dòng)推理框架內(nèi)工作的神經(jīng)模型研究者和理論家。對(duì)于實(shí)驗(yàn)科學(xué)界,我們希望提供一份關(guān)于主動(dòng)推理及其與意識(shí)關(guān)系的精確但易于理解的指南,特別強(qiáng)調(diào)該理論的經(jīng)驗(yàn)承諾。對(duì)于那些目前尚未從事意識(shí)研究但在主動(dòng)推理框架內(nèi)工作的理論家群體,我們希望突出該框架在意識(shí)研究中的適用性,以及需要進(jìn)一步理論和形式化發(fā)展的領(lǐng)域。

在第2節(jié)和第3節(jié),我們簡(jiǎn)要介紹主動(dòng)推理建??蚣?,重點(diǎn)闡述變分自由能和預(yù)期自由能分解為一組具有目的論意義的術(shù)語(yǔ)。我們還介紹了支持主動(dòng)推理的生成模型架構(gòu)的一般特征及其可能的神經(jīng)實(shí)現(xiàn)。這兩節(jié)是最具技術(shù)性的,對(duì)于已經(jīng)熟悉主動(dòng)推理形式主義的讀者可以跳過(guò)。我們鼓勵(lì)不熟悉主動(dòng)推理的讀者堅(jiān)持閱讀這些開篇部分。主動(dòng)推理本質(zhì)上是一個(gè)數(shù)學(xué)框架,要精確地討論它,就必須使用相關(guān)的形式主義。第4節(jié)則對(duì)與意識(shí)科學(xué)相關(guān)的建模文獻(xiàn)進(jìn)行了綜述,并提出了一個(gè)現(xiàn)有模型的新擴(kuò)展,使主動(dòng)推理能夠與關(guān)于整體意識(shí)狀態(tài)的研究相聯(lián)系。最后,在第5節(jié),我們論證了所有這些模型中都隱含著一組假設(shè)和理論承諾,一旦明確表述,這些假設(shè)和承諾將構(gòu)成一種最小化但經(jīng)驗(yàn)上富有成效的意識(shí)理論。為了盡可能清晰地闡明最小化理論與實(shí)驗(yàn)之間的關(guān)系,我們遵循了最近在意識(shí)科學(xué)哲學(xué)方面的研究工作(Negro, 2024),并從拉卡托斯關(guān)于“科學(xué)研究綱領(lǐng)”的理論視角(Lakatos, 1968)來(lái)討論該理論及其經(jīng)驗(yàn)承諾。

最后,我們指出,本文的主要目的是教育性的,而非論戰(zhàn)性的。也就是說(shuō),我們不會(huì)論證其他競(jìng)爭(zhēng)性意識(shí)理論的不足,然后將主動(dòng)推理作為替代方案。相反,我們的目標(biāo)是提供一個(gè)關(guān)于主動(dòng)推理框架中隱含的(最小化)意識(shí)理論的積極描述。我們堅(jiān)信,最富有成效的前進(jìn)方式是以盡可能精確的方式闡述該理論的結(jié)構(gòu)及其與經(jīng)驗(yàn)數(shù)據(jù)的關(guān)系,以促進(jìn)基于經(jīng)驗(yàn)的理論比較。

2. 變分自由能與預(yù)期自由能

一個(gè)能夠維持自身身體完整性的生物體,必須能夠保持在其存在所允許的狹窄狀態(tài)范圍內(nèi)(例如,對(duì)于哺乳動(dòng)物而言,維持相對(duì)恒定的內(nèi)部體溫);這意味著生物體將大部分時(shí)間處于一組相對(duì)受限的特征狀態(tài)中(Friston, 2013; Tschantz et al., 2020)。在主動(dòng)推理框架下,這通過(guò)將生物體的表型解釋為其生態(tài)位的生成模型(即其感覺輸入是如何產(chǎn)生的模型)來(lái)建模,該模型對(duì)與頻繁占據(jù)狀態(tài)相關(guān)的觀測(cè)賦予高概率,即對(duì)該生物體所具有的特征狀態(tài)賦予高概率(Corcoran & Hohwy, 2018; Ramstead et al., 2020; Ramstead et al., 2018, 2020, 2021)。因此,感知-行動(dòng)循環(huán)被轉(zhuǎn)化為一個(gè)優(yōu)化問(wèn)題,其中被極化(極大化或極小化)的主要目標(biāo)函數(shù)——變分自由能——代表了生物體觀測(cè)是如何產(chǎn)生的生成模型的(對(duì)數(shù))證據(jù)(Da Costa, Parr, et al., 2020)。

關(guān)鍵在于,生成模型包含一個(gè)先驗(yàn)信念,即當(dāng)行動(dòng)序列最小化預(yù)期自由能時(shí),它們更具合理性。這意味著需要考慮兩個(gè)目標(biāo)函數(shù)。具體而言,(負(fù))變分自由能是對(duì)對(duì)數(shù)模型證據(jù)的一個(gè)計(jì)算上可行的下界,而(負(fù))預(yù)期自由能可以被視為對(duì)期望對(duì)數(shù)模型證據(jù)的近似(Parr & Friston, 2018a)。最小化變分自由能為生物體提供了一個(gè)對(duì)模型證據(jù)的近似,可以用于推斷世界中的隱藏狀態(tài)并學(xué)習(xí)環(huán)境的各種統(tǒng)計(jì)特征。然后可以利用該模型中的信念來(lái)選擇能夠最小化預(yù)期自由能的行動(dòng),從而使主體保持在其具有特征性的表型狀態(tài)中,這些狀態(tài)與其持續(xù)生存相一致。這使得我們可以將行為解釋為自我證實(shí)的過(guò)程(Hohwy, 2016, 2020, 2021),即生物體會(huì)采取行動(dòng)來(lái)最大化其對(duì)世界模型的證據(jù)。參與這一自我證實(shí)過(guò)程的各個(gè)量是至關(guān)重要的,我們將逐一進(jìn)行考察。

變分自由能(公式1)是在近似后驗(yàn)分布(q)下,近似后驗(yàn)分布的對(duì)數(shù)與生成模型(p)的對(duì)數(shù)之間的期望差異——即觀測(cè)(o)及其原因(或隱藏狀態(tài) s)的聯(lián)合概率。近似后驗(yàn)分布反映了基于感覺數(shù)據(jù)推斷出的世界隱藏狀態(tài)。

打開網(wǎng)易新聞 查看精彩圖片

變分自由能有兩個(gè)關(guān)鍵的分解方式,每種分解方式都突出了其基本屬性的互補(bǔ)視角。方程 1 的第二行利用了概率的乘法法則以及模型證據(jù)不依賴于隱狀態(tài)的事實(shí)(使得我們可以在第二項(xiàng)中去掉期望算子),從而將變分自由能分解為兩部分:近似后驗(yàn)與真實(shí)后驗(yàn)之間的相對(duì)熵或 KL 散度,以及驚訝度(或稱負(fù)模型證據(jù),即對(duì)隱狀態(tài)求平均的觀測(cè)數(shù)據(jù)的概率)。KL 散度始終大于或等于零,因此變分自由能始終大于或等于驚訝度(又稱為驚訝量或自信息)。因此,變分自由能是驚訝度的上界,并且在近似后驗(yàn)與真實(shí)后驗(yàn)完全匹配時(shí),兩者相等。

這種分解方式在理解變分自由能的性質(zhì)方面具有教學(xué)意義,但在描述如何最小化變分自由能時(shí)并無(wú)實(shí)用價(jià)值。這是因?yàn)檎鎸?shí)后驗(yàn)的值在計(jì)算上是不可行的,因此代理無(wú)法直接獲取。在方程的第三行,我們將變分自由能分解為復(fù)雜度和準(zhǔn)確度兩個(gè)易于計(jì)算的部分。復(fù)雜度是近似后驗(yàn)與先驗(yàn)之間的 KL 散度(即在接收觀測(cè)數(shù)據(jù)之前對(duì)隱狀態(tài)的信念),衡量了先驗(yàn)與近似后驗(yàn)之間的差異,可將其視為信念更新幅度的正則化項(xiàng)。先驗(yàn)與近似后驗(yàn)之間的變化越大,復(fù)雜度越高。準(zhǔn)確度是觀測(cè)數(shù)據(jù)的期望對(duì)數(shù)似然(即在每個(gè)隱狀態(tài)下當(dāng)前觀測(cè)數(shù)據(jù)的概率)。因此,最小化變分自由能需要在最大化準(zhǔn)確度和最小化復(fù)雜度之間進(jìn)行權(quán)衡。

這一點(diǎn)至關(guān)重要。感官輸入通常是嘈雜且模糊的,在噪聲數(shù)據(jù)的情況下,總是可以通過(guò)調(diào)整近似后驗(yàn)來(lái)提高準(zhǔn)確度。然而,不斷大幅調(diào)整后驗(yàn)會(huì)顯著降低模型對(duì)新觀測(cè)數(shù)據(jù)的泛化能力。如果不對(duì)大規(guī)模(貝葉斯)信念更新進(jìn)行懲罰,一個(gè)極端“準(zhǔn)確”的模型將會(huì)過(guò)擬合噪聲,并且需要不斷修正(Sengupta et al., 2013)。因此,最小化變分自由能確保了代理能夠形成對(duì)其感知世界的可泛化解釋或模型。

作為自組織生物體,代理必須選擇那些平均而言最小化變分自由能的動(dòng)作(Friston, Rigoli, Ognibene, Mathys, Fitzgerald & Pezzulo, 2015; Parr & Friston, 2019)。諸如反射弧等純反應(yīng)性行為可以通過(guò)變分自由能最小化來(lái)表述,即執(zhí)行能夠帶來(lái)與(穩(wěn)態(tài)或本體感覺)設(shè)定點(diǎn)一致的觀測(cè)結(jié)果的動(dòng)作(Buckley et al., 2017; Tschantz et al., 2022)。然而,更復(fù)雜的動(dòng)作或動(dòng)作序列(即策略)則需要對(duì)未來(lái)觀測(cè)結(jié)果進(jìn)行某種反事實(shí)計(jì)算(即規(guī)劃)。這種規(guī)劃依賴于期望自由能(方程 2),它將策略的可觀測(cè)后果視為隨機(jī)變量(因?yàn)檫@些后果尚未被觀測(cè)到)。期望自由能通過(guò)對(duì)預(yù)期觀測(cè)值進(jìn)行加權(quán)求和,來(lái)近似每種策略下行動(dòng)的預(yù)期結(jié)果,因此被稱為“期望”自由能。可以將變分自由能視為期望自由能的一個(gè)特例,專門適用于當(dāng)前時(shí)刻,即觀測(cè)數(shù)據(jù)已知且不依賴于未來(lái)的動(dòng)作。

因此,根據(jù)主動(dòng)推理理論,動(dòng)作選擇與知覺一樣,是一個(gè)(規(guī)劃即)推理的過(guò)程。關(guān)鍵在于,代理不是推理出能夠最大化觀測(cè)數(shù)據(jù)概率的隱狀態(tài),而是推理出最可能的行動(dòng)路徑(Friston, et al., 2017)。這里的“行動(dòng)”既可以是顯性身體運(yùn)動(dòng)(如掃視),也可以是隱性心理活動(dòng)(如注意力方向)。這種方式顛覆了傳統(tǒng)的動(dòng)作選擇建??蚣?,它不是先搜索能夠達(dá)到目標(biāo)狀態(tài)的最佳動(dòng)作,而是首先假設(shè)代理會(huì)達(dá)到其偏好的狀態(tài),然后推理出最可能實(shí)現(xiàn)該狀態(tài)的行動(dòng)路徑(Millidge et al., 2020)。最可能的行動(dòng)路徑即是使所有可能策略的期望自由能最小化的策略。

方程2的第二行展示了預(yù)期自由能分解為其最直觀的組成部分:風(fēng)險(xiǎn)、模糊性和新奇性。由于推導(dǎo)過(guò)程較為復(fù)雜,我們建議感興趣的讀者參考(Da Costa, Parr, et al., 2020)的附錄。

打開網(wǎng)易新聞 查看精彩圖片

第一個(gè)術(shù)語(yǔ)是風(fēng)險(xiǎn),它是基于特定策略的預(yù)測(cè)后驗(yàn)分布與智能體期望觀測(cè)結(jié)果(由參數(shù)C 指定)之間的KL散度。較小的值表示策略預(yù)期觀測(cè)結(jié)果與智能體認(rèn)為最具特征或最有價(jià)值的觀測(cè)結(jié)果之間的相似度更高。最小化風(fēng)險(xiǎn)這一項(xiàng)促使智能體傾向于目標(biāo)導(dǎo)向行為。

第二個(gè)術(shù)語(yǔ)是模糊性,它是觀測(cè)結(jié)果似然的期望(條件)熵,即隱藏狀態(tài)與觀測(cè)結(jié)果之間映射的不確定性。為了最小化模糊性,智能體會(huì)選擇那些能夠精確映射狀態(tài)與觀測(cè)結(jié)果的策略,例如在黑暗的房間里打開燈。

第三個(gè)也是最后一個(gè)術(shù)語(yǔ)是新奇性,它是模型參數(shù)(在狀態(tài)、觀測(cè)結(jié)果和策略條件下的后驗(yàn)分布)與邊際后驗(yàn)分布之間期望的KL散度。這里以似然分布的參數(shù) A(描述分類似然矩陣的狄利克雷先驗(yàn)的濃度參數(shù))為例,但其他參數(shù)也可以有類似的項(xiàng)。新奇性衡量了在每種策略下預(yù)期的狀態(tài)和觀測(cè)結(jié)果對(duì)生成模型參數(shù)信念的改變程度。由于新奇性是一個(gè)負(fù)項(xiàng),為了最小化預(yù)期自由能,智能體會(huì)被驅(qū)使去最大化后驗(yàn)分布與邊際后驗(yàn)分布之間的差異,通過(guò)尋找那些能夠?qū)е履P蛥?shù)后驗(yàn)信念最大變化的新穎觀測(cè)結(jié)果。這體現(xiàn)了主動(dòng)推理背后的雙重驅(qū)動(dòng)力:目標(biāo)尋求和信息尋求,這兩種驅(qū)動(dòng)力都統(tǒng)一在一個(gè)目標(biāo)函數(shù)下。因此,最小化預(yù)期自由能要求智能體在這兩種驅(qū)動(dòng)力之間進(jìn)行權(quán)衡,即通過(guò)選擇策略來(lái)同時(shí)最小化風(fēng)險(xiǎn)(最大化偏好)、最小化模糊性(最大化對(duì)狀態(tài)的信息增益)和尋求新奇觀測(cè)結(jié)果(最大化對(duì)參數(shù)的信息增益)。

總的來(lái)說(shuō),具有有限自動(dòng)行為庫(kù)的智能體(例如簡(jiǎn)單生物體或復(fù)雜生物體的自動(dòng)化子系統(tǒng))可以通過(guò)最小化變分自由能來(lái)建模,即通過(guò)采取與先驗(yàn)信念一致的行動(dòng)(例如內(nèi)穩(wěn)態(tài)設(shè)定點(diǎn))。變分自由能可用于建模連續(xù)和離散生成模型中的感知推理,以及連續(xù)模型中的簡(jiǎn)單反射式行為。然而,一旦行動(dòng)選擇需要任何反事實(shí)計(jì)算,就需要轉(zhuǎn)向預(yù)期自由能,這通常需要一個(gè)離散的生成模型(通常是分類-狄利克雷模型)。

3. 生成模型、信念更新和神經(jīng)動(dòng)態(tài)

當(dāng)前主動(dòng)推理領(lǐng)域的最新研究將大腦描繪為一個(gè)由相互作用的生成模型組成的分層“混合模型”(Friston等人,2017;Parr等人,2021,2022;Parr和Friston,2018c)。低水平感覺推理的基礎(chǔ)生成模型是一個(gè)預(yù)測(cè)編碼網(wǎng)絡(luò),用于對(duì)連續(xù)量(如運(yùn)動(dòng)和對(duì)比度)進(jìn)行推理。這些連續(xù)的低水平感覺系統(tǒng)通過(guò)連接函數(shù)(將連續(xù)量映射到離散潛在變量)與更高水平的離散生成模型(例如部分可觀測(cè)馬爾可夫決策過(guò)程,POMDP)相連接,這些離散生成模型執(zhí)行分類感覺推理,并選擇離散的動(dòng)作序列(即策略),然后這些策略再次通過(guò)連接函數(shù)轉(zhuǎn)換為連續(xù)的運(yùn)動(dòng)指令(Parr和Friston,2018c)。關(guān)于連續(xù)模型的教程式綜述,可參見Bogacz(2017)和Buckley等人(2017)。對(duì)于離散模型的詳細(xì)數(shù)學(xué)綜述,可參見Da Costa、Parr等人(2020),而對(duì)于更通俗易懂的教程式綜述,可參見Smith等人(2022)。關(guān)于連續(xù)和離散模型的全面書籍級(jí)論述,可參見Parr等人(2022)。

為了說(shuō)明主動(dòng)推理下預(yù)測(cè)編碼推導(dǎo)的一般原理,這里我們回顧一下在假設(shè)靜態(tài)生成模型和固定先驗(yàn)的情況下,從變分自由能中推導(dǎo)單層預(yù)測(cè)編碼網(wǎng)絡(luò)的過(guò)程(Bogacz,2017;Friston,2005)。相同的原理也適用于動(dòng)態(tài)模型的推導(dǎo)(Buckley等人,2017),但需要更多的形式化工具(例如運(yùn)動(dòng)的廣義坐標(biāo))。

為了得到一個(gè)可處理的變分自由能表達(dá)式,我們做了以下三個(gè)假設(shè):1)生成模型(即似然和先驗(yàn))和近似后驗(yàn)分布是高斯分布;2)變分自由能可以用后驗(yàn)分布均值周圍的二階泰勒級(jí)數(shù)展開很好地近似(拉普拉斯近似);3)方差是靜止的。實(shí)際上,這三種說(shuō)法是同一假設(shè)的不同表述方式。在這些假設(shè)下,(負(fù))變分自由能的表達(dá)式簡(jiǎn)化為在后驗(yàn)眾數(shù)處評(píng)估的生成模型的對(duì)數(shù)。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

這為我們提供了一組三個(gè)常微分方程,描述了三個(gè)類似神經(jīng)元節(jié)點(diǎn)的行為,其動(dòng)態(tài)過(guò)程對(duì)變分自由能進(jìn)行梯度下降。這為我們提供了一個(gè)簡(jiǎn)單的神經(jīng)元?jiǎng)討B(tài)模型,用于近似隱狀態(tài)的后驗(yàn)分布。這些方程與皮層微回路之間的映射關(guān)系是當(dāng)前研究的熱點(diǎn)問(wèn)題。然而,從廣義上來(lái)說(shuō),隱狀態(tài)的動(dòng)態(tài)(在“期望節(jié)點(diǎn)”中實(shí)現(xiàn))通常與皮層的深層相關(guān),這些深層向同一皮層層級(jí)中的淺層的誤差節(jié)點(diǎn)進(jìn)行側(cè)向投射,并向下屬層級(jí)的淺層誤差節(jié)點(diǎn)進(jìn)行反饋投射。預(yù)測(cè)誤差的動(dòng)態(tài)(在“誤差節(jié)點(diǎn)”中實(shí)現(xiàn))通常與皮層的淺層相關(guān),并向同一皮層層級(jí)中的深層進(jìn)行側(cè)向投射以及向該層級(jí)中更高級(jí)別的深層進(jìn)行前饋投射(見圖1a)。每個(gè)層級(jí)中的期望節(jié)點(diǎn)作為上一層級(jí)的觀測(cè)值,并作為下一層級(jí)的先驗(yàn)(關(guān)于綜述和討論,參見Bastos等人,2012;Hodson等人,2023;Shipp,2016;Walsh等人,2020)。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

同樣,像預(yù)測(cè)編碼一樣,通過(guò)相對(duì)于狀態(tài)對(duì)變分自由能進(jìn)行梯度下降來(lái)反轉(zhuǎn)生成模型。忽略常數(shù)項(xiàng),方程8給出了邊際自由能梯度的表達(dá)式。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

使用softmax函數(shù)(這是邏輯函數(shù)對(duì)向量的推廣)來(lái)模擬平均放電率,是基于在大規(guī)模腦動(dòng)態(tài)的平均場(chǎng)模型中所做的假設(shè),即一個(gè)群體的平均放電率可以被視為平均膜電位的S形函數(shù)(Breakspear,2017;Da Costa等人,2021;Wilson和Cowan,1972)。在腦電圖(EEG)研究中的事件相關(guān)電位(ERPs)以及在顱內(nèi)記錄研究中的局部場(chǎng)電位都被視為歸一化放電率的時(shí)間導(dǎo)數(shù)(即變化率)。關(guān)于可能的神經(jīng)實(shí)現(xiàn)的簡(jiǎn)要示意圖,請(qǐng)參見圖2b。關(guān)于深入的討論和綜述,可參見Parr和Friston(2018a)。

打開網(wǎng)易新聞 查看精彩圖片

到目前為止,我們已經(jīng)推導(dǎo)出了兩種簡(jiǎn)單的算法,分別用于在連續(xù)和離散感知推理的情況中最小化變分自由能:每一種算法都可以直接用神經(jīng)動(dòng)態(tài)來(lái)解釋。然而,正如上文針對(duì)行為選擇所概述的,我們尚未(通過(guò)定義)接收到(未來(lái)的)觀測(cè)值,因此必須最小化預(yù)期自由能(方程13)來(lái)選擇策略。我們?cè)谙旅嬉跃仃囆问秸故绢A(yù)期自由能,以突出生成模型組件與預(yù)期自由能組件之間的聯(lián)系。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

那么,對(duì)于單個(gè)時(shí)間步的策略的后驗(yàn)分布就是預(yù)期自由能的softmax函數(shù)(方程14),這實(shí)際上將預(yù)期自由能轉(zhuǎn)化為一個(gè)概率分布,從而可以從中采樣下一個(gè)動(dòng)作。

在這里, T表示策略的未來(lái)時(shí)間范圍。最小化(預(yù)期自由能的路徑積分)的策略將具有最高的后驗(yàn)概率。然后,通過(guò)在每個(gè)時(shí)間步從策略的后驗(yàn)分布中采樣來(lái)選擇動(dòng)作。

4. 意識(shí)現(xiàn)象的計(jì)算模型

在概述了驅(qū)動(dòng)感知-行動(dòng)循環(huán)的關(guān)鍵量、連續(xù)和離散生成模型的結(jié)構(gòu),以及模型動(dòng)態(tài)與神經(jīng)動(dòng)態(tài)測(cè)量(例如事件相關(guān)電位ERPs和放電率)之間的關(guān)系之后,我們現(xiàn)在轉(zhuǎn)向討論之前使用主動(dòng)推理來(lái)模擬意識(shí)科學(xué)中典型任務(wù)的研究。總體而言,這些研究主要關(guān)注意識(shí)內(nèi)容和自我意識(shí)。為了簡(jiǎn)潔起見,我們僅關(guān)注數(shù)值(即模擬)研究,而犧牲了許多與意識(shí)神經(jīng)科學(xué)相關(guān)的有價(jià)值的定性和概念模型(例如Ciaunica等人,2022;Safron,2020;Seth和Tsakiris,2018),以及主動(dòng)推理所隱含的意識(shí)形而上學(xué)的解釋(Friston,Wiese等人,2020;Ramstead等人,2023)。關(guān)于本文未涵蓋內(nèi)容的相關(guān)綜述,可參見(Nikolova等人,2022;Ramstead等人,2023;Rorot,2021)。

此外,我們注意到,雖然我們回顧的模型主要關(guān)注視覺和內(nèi)感受感覺模態(tài),但這反映了對(duì)意識(shí)內(nèi)容和自我意識(shí)研究中視覺和內(nèi)感受的普遍關(guān)注,并不反映主動(dòng)推理框架在其他感覺模態(tài)應(yīng)用上的局限性。實(shí)際上,為了說(shuō)明框架的解釋普適性——并突出本節(jié)末尾對(duì)意識(shí)狀態(tài)的潛在應(yīng)用——我們將一個(gè)現(xiàn)有的關(guān)于聽覺規(guī)律意識(shí)處理的模型擴(kuò)展,以解釋這一過(guò)程在睡眠和麻醉中的中斷。

4.1 意識(shí)內(nèi)容的模型

在前一節(jié)中,我們將感知-行動(dòng)循環(huán)描述為一個(gè)迭代過(guò)程,包括:1)推斷出最能最小化變分自由能的近似后驗(yàn)分布(從而為模型證據(jù)設(shè)定一個(gè)上限);2)以一種最小化預(yù)期自由能(從而最大化模型證據(jù))的方式采樣世界。這促使我們對(duì)意識(shí)科學(xué)中幾個(gè)關(guān)鍵現(xiàn)象的視角發(fā)生轉(zhuǎn)變。它將注意力引向許多通常被認(rèn)為主要是被動(dòng)的感知現(xiàn)象中的主動(dòng)采樣和預(yù)期的作用。

從被動(dòng)感知到主動(dòng)感知的轉(zhuǎn)變?cè)陔p穩(wěn)態(tài)感知的模型中尤為突出,這些模型通常將感知切換描述為由噪聲和/或適應(yīng)性驅(qū)動(dòng)的振蕩(例如Moreno-Bote等人,2007;Wilson,2007),而不是至少在某種程度上由主體的行為驅(qū)動(dòng)的狀態(tài)。例如,Parr等人(2019)提出了一個(gè)關(guān)于特羅勒消逝(Troxler fading)和雙眼競(jìng)爭(zhēng)的雙實(shí)例模型(見圖3a),該模型將意識(shí)內(nèi)容的變化描述為由策略驅(qū)動(dòng)的后驗(yàn)信念精度的變化,這種變化是作為掃視策略(在特羅勒消逝中)和注意策略(在雙眼競(jìng)爭(zhēng)中)的函數(shù)而發(fā)生的。特羅勒消逝是一種現(xiàn)象,當(dāng)參與者被要求保持中央注視時(shí),與周邊呈現(xiàn)的刺激相關(guān)的感覺會(huì)在意識(shí)中逐漸消失。雙眼競(jìng)爭(zhēng)發(fā)生在向每只眼睛呈現(xiàn)不一致的刺激時(shí):參與者不會(huì)體驗(yàn)到刺激感覺的疊加,而是體驗(yàn)到單一感覺之間的離散交替,只有短暫的混合期。

打開網(wǎng)易新聞 查看精彩圖片

在主動(dòng)推理框架下,這種感知交替是通過(guò)將兩個(gè)看似平常的觀察結(jié)果納入任務(wù)特定的生成模型中來(lái)解釋的。第一個(gè)觀察是,主體對(duì)狀態(tài)轉(zhuǎn)換的精度估計(jì)(即矩陣B的精度)在變幻無(wú)常的世界中永遠(yuǎn)不可能完全確定(參見Hohwy等人,2016)。第二個(gè)觀察是,感覺輸入的精度取決于注視點(diǎn)的位置和/或注意力的焦點(diǎn)(通過(guò)使矩陣A的精度條件性地依賴于掃視或注意狀態(tài)來(lái)建模)。將這兩個(gè)簡(jiǎn)單假設(shè)納入生成模型,通過(guò)預(yù)期自由能中的模糊性項(xiàng),導(dǎo)致了認(rèn)知行為的出現(xiàn)。在缺乏精確感覺輸入的情況下,關(guān)于視覺空間某個(gè)位置的感知內(nèi)容的不確定性(預(yù)測(cè)熵)會(huì)不斷積累,增加了那些會(huì)從視覺空間的該部分獲取信息的感覺輸入的策略(例如掃視或注意策略)的認(rèn)知價(jià)值。在特羅勒消逝的情況下,主體被迫保持中央注視,從而無(wú)法獲取關(guān)于周邊的精確感覺信息。隨著時(shí)間的推移,這會(huì)通過(guò)基于不精確的狀態(tài)轉(zhuǎn)換和感覺輸入的迭代信念更新,將對(duì)應(yīng)于視覺空間周邊位置的狀態(tài)的后驗(yàn)分布推向均勻分布。假設(shè)狀態(tài)的后驗(yàn)分布與意識(shí)內(nèi)容之間存在對(duì)應(yīng)關(guān)系,并將感知與高精度狀態(tài)的混合相關(guān)聯(lián)(這是一個(gè)我們?cè)诘?節(jié)中會(huì)再次回到的關(guān)鍵點(diǎn)),這將導(dǎo)致刺激從意識(shí)中逐漸消失。同樣,雙眼競(jìng)爭(zhēng)中典型的離散感知切換也會(huì)從生成模型中出現(xiàn),當(dāng)主體被限制選擇那些增強(qiáng)被注意刺激的精度(即矩陣A的映射)的(隱蔽的)注意策略,而以犧牲未被注意的刺激為代價(jià)時(shí)(參見注意力的偏向競(jìng)爭(zhēng)模型;Desimone,1998)。主體接收到關(guān)于被注意刺激的精確信息,從而對(duì)被注意刺激的狀態(tài)有一個(gè)精確的后驗(yàn)分布,同時(shí)由于缺乏關(guān)于未被注意刺激的精確信息,未被注意刺激的狀態(tài)后驗(yàn)分布會(huì)逐漸消散為均勻分布。至關(guān)重要的是,隨著不確定性的積累,未被注意的刺激通過(guò)預(yù)期自由能中的模糊性降低項(xiàng),逐漸變得更加具有認(rèn)知吸引力,從而推動(dòng)最終的注意策略切換。同樣,假設(shè)主體的狀態(tài)后驗(yàn)分布與意識(shí)感知內(nèi)容之間存在對(duì)應(yīng)關(guān)系,這會(huì)導(dǎo)致依賴于注意力的感知切換。

這種對(duì)雙眼競(jìng)爭(zhēng)的主動(dòng)推理模型很好地解釋了一些在被動(dòng)模型中難以容納的實(shí)驗(yàn)發(fā)現(xiàn),被動(dòng)模型沒有為策略選擇等主體性過(guò)程設(shè)定明確的角色。具體來(lái)說(shuō),當(dāng)缺乏注意力時(shí)競(jìng)爭(zhēng)速度的減慢(Paffen等人,2006;Zhang等人,2011),以及獎(jiǎng)賞對(duì)優(yōu)勢(shì)持續(xù)時(shí)間的調(diào)節(jié)(綜述見Safavi和Dayan,2022)都可以被理解為預(yù)期自由能最小化的實(shí)例。如果感知切換是由注意力策略的切換驅(qū)動(dòng)的,那么在存在干擾任務(wù)時(shí)競(jìng)爭(zhēng)速度的減慢(Paffen等人,2006)可以通過(guò)感覺輸入精度的降低來(lái)解釋,這增加了主體需要從每只眼睛采樣輸入以達(dá)到對(duì)狀態(tài)的精確后驗(yàn)分布所需的時(shí)間。同樣,向其中一個(gè)刺激添加獎(jiǎng)賞將以加性方式最小化預(yù)期自由能的風(fēng)險(xiǎn)項(xiàng),解釋了獎(jiǎng)賞對(duì)競(jìng)爭(zhēng)的偏向效應(yīng)(Marx和Einhauser,2015;Wilbertz和Sterzer,2018)。此外,盡管Parr等人(2019)的原始論文中沒有呈現(xiàn),但在附錄1和圖3b中我們展示了該模型輕松解釋了Levelt定律(Brascamp等人,2015;Levelt,1965)——這是一組簡(jiǎn)潔的命題,總結(jié)了刺激屬性(例如亮度對(duì)比度)與感知優(yōu)勢(shì)持續(xù)時(shí)間之間的規(guī)律性關(guān)系。重要的是,除了事后解釋大量現(xiàn)有的現(xiàn)象外,該模型還提供了關(guān)于獎(jiǎng)賞驅(qū)動(dòng)違反Levelt定律的經(jīng)驗(yàn)預(yù)測(cè)(附錄2),這些預(yù)測(cè)可以在人類心理物理學(xué)領(lǐng)域輕松進(jìn)行檢驗(yàn)。關(guān)于將這種建模策略擴(kuò)展到內(nèi)克爾立方體幻覺(意識(shí)科學(xué)中常用的另一種雙穩(wěn)態(tài)范式),可參見Novicky等人(2023)。

從在既定生成模型中最小化模糊性轉(zhuǎn)向最大化新奇性和參數(shù)學(xué)習(xí),Parr和Friston(2018b)提出,偏側(cè)忽視(一種以患者忽視視覺空間一側(cè)為特征的神經(jīng)綜合征,通常是右側(cè)大腦受損后忽視左側(cè))可以通過(guò)預(yù)期自由能的新奇性成分的缺陷來(lái)解釋。在臨床上,偏側(cè)忽視通常通過(guò)掃視取消任務(wù)進(jìn)行評(píng)估,要求患者圈出(即取消)呈現(xiàn)在一張紙上的所有刺激。在這里,忽視的患者將對(duì)視覺空間的一側(cè)毫無(wú)察覺,而忽視一側(cè)的刺激則未被取消。為了模擬這一點(diǎn),Parr和Friston模擬了一個(gè)類似于偏側(cè)忽視臨床測(cè)試的掃視取消任務(wù)。他們的模型使用網(wǎng)格來(lái)表示可能的掃視位置。在每次模擬開始時(shí),所有位置都是新奇的(即參數(shù)確定性低),這促使主體向每個(gè)位置掃視,并在此過(guò)程中在每個(gè)位置的A矩陣的狄利克雷先驗(yàn)中積累計(jì)數(shù)(降低了對(duì)“已取消”位置的掃視策略的預(yù)期自由能的新奇性成分)。通過(guò)增加左側(cè)空間的濃度參數(shù)來(lái)?yè)p傷A矩陣映射(即隱藏狀態(tài)與視覺結(jié)果之間的映射),有效地模擬了背側(cè)和腹側(cè)注意力網(wǎng)絡(luò)之間的斷開;消除了基于新奇性的左側(cè)空間掃視策略的任何能力,從而模擬了視覺忽視的經(jīng)驗(yàn)現(xiàn)象學(xué)。

增加濃度參數(shù)的動(dòng)機(jī)——即增加似然映射中的信心——是斷開連接是一種最大信心的狀態(tài),因?yàn)闆]有任何數(shù)據(jù)可以改變突觸效能。該模型的一個(gè)關(guān)鍵預(yù)測(cè)是可以在健康受試者中進(jìn)行檢驗(yàn)的——健康受試者可以通過(guò)突觸效能更新似然參數(shù)——即隨著對(duì)視覺場(chǎng)景的熟悉程度增加,個(gè)體應(yīng)該引發(fā)越來(lái)越大的信念更新,表現(xiàn)為更大的事件相關(guān)電生理反應(yīng)。預(yù)計(jì)編碼參數(shù)確定性的底層神經(jīng)系統(tǒng)包括從頂葉腹側(cè)注意力網(wǎng)絡(luò)(TJP)到背側(cè)注意力網(wǎng)絡(luò)的前額眼區(qū)(FEF)的傳入(前饋)連接。上述經(jīng)驗(yàn)預(yù)測(cè)隨后由Parr、Mirza等人(2019)在健康人群中使用掃視取消任務(wù)結(jié)合DCM和MEG進(jìn)行了檢驗(yàn)。與模型預(yù)測(cè)一致,他們發(fā)現(xiàn)當(dāng)場(chǎng)景更具可預(yù)測(cè)性時(shí),F(xiàn)EF的背側(cè)成分積極解除對(duì)(右側(cè))腹側(cè)TPJ的抑制,從而產(chǎn)生更大的誘發(fā)反應(yīng)。根據(jù)規(guī)范微回路網(wǎng)絡(luò)的構(gòu)建,這種解除抑制在TPJ的深層最為明顯,已知TPJ的深層接收來(lái)自FEF的下行輸入。

到目前為止,我們已經(jīng)討論了三個(gè)一般性例子——特羅勒消逝、雙眼競(jìng)爭(zhēng)和視覺忽視——在這些例子中,注意力和掃視策略(可以說(shuō))在決定意識(shí)內(nèi)容方面發(fā)揮了決定性作用。通過(guò)選擇性采樣過(guò)程確定內(nèi)容,該過(guò)程在一個(gè)視覺場(chǎng)景的一個(gè)位置生成高精度輸入,而以犧牲其他位置為代價(jià)。然而,注意力與意識(shí)內(nèi)容變化之間的關(guān)系遠(yuǎn)非一對(duì)一的。從經(jīng)驗(yàn)來(lái)看,有證據(jù)表明被注意的項(xiàng)目可以保持無(wú)意識(shí)(Koch和Tsuchiya,2007),以及某些刺激可以在幾乎沒有注意力的情況下引發(fā)相應(yīng)的感知體驗(yàn)(Matthews等人,2018)。那么,在主動(dòng)推理下,意識(shí)感知與無(wú)意識(shí)感知的區(qū)別在哪里呢?合理地推測(cè),答案來(lái)自于感知綜合背后的生成模型的層次結(jié)構(gòu)以及由此產(chǎn)生的信念更新的時(shí)間尺度分離。

為了將主動(dòng)推理與關(guān)于意識(shí)的神經(jīng)相關(guān)性的廣泛文獻(xiàn)聯(lián)系起來(lái),Whyte和Smith(2021)開發(fā)了一個(gè)兩級(jí)POMDP視覺意識(shí)模型。該模型將意識(shí)感知描述為依賴于生成模型中不同層次之間精確后驗(yàn)分布的雙向傳播。重要的是,模型的第二層具有足夠的時(shí)間深度以產(chǎn)生目標(biāo)導(dǎo)向的行為(例如對(duì)視覺場(chǎng)景的主觀報(bào)告),這些行為必然在比刺激呈現(xiàn)更長(zhǎng)的時(shí)間尺度上演變。利用這個(gè)模型,他們模擬了Dehaene等人(2006)的經(jīng)驗(yàn)性得出的注意力、刺激強(qiáng)度和意識(shí)獲取之間關(guān)系的分類。通過(guò)操縱第一層隱藏狀態(tài)與觀測(cè)值之間的A矩陣映射的精度,代表刺激強(qiáng)度和注意力之間的相互作用,他們復(fù)制了主觀報(bào)告和神經(jīng)相關(guān)性的非線性縮放。與經(jīng)驗(yàn)發(fā)現(xiàn)一致,報(bào)告的刺激可見性的非線性增加與第二層的高放電率和P3b樣ERP相關(guān),類似于前額頂葉區(qū)域的“點(diǎn)火”反應(yīng)。擴(kuò)展Dehaene等人(2006)的分類,Whyte和Smith(2021)引入了期望,預(yù)測(cè)在注意力存在且刺激遠(yuǎn)高于閾值時(shí),有效的期望會(huì)降低P3b振幅,與中性條件和無(wú)效條件相比。這一預(yù)測(cè)被Schlossmacher等人(2020)獨(dú)立證實(shí)。

最初關(guān)于意識(shí)的神經(jīng)相關(guān)性的研究(包括形成德哈恩(Dehaene)分類模型框架的工作,該模型由懷特(Whyte)和史密斯(Smith)于2021年建模)支持了前額葉皮層(PFC)活動(dòng)和晚期事件相關(guān)電位(ERPs,例如P3b)與意識(shí)感知之間存在強(qiáng)相關(guān)性的觀點(diǎn)。在多種實(shí)驗(yàn)范式中進(jìn)行的研究報(bào)告了類似的結(jié)果(Bisenius等,2015;Sergent等,2005)。然而,無(wú)報(bào)告范式(Tsuchiya等,2015)的出現(xiàn)對(duì)這些發(fā)現(xiàn)提出了挑戰(zhàn)。在這種條件下,前額葉皮層活動(dòng)減弱或消失(Brascamp等,2015;Frassle等,2014),而曾被認(rèn)為是意識(shí)接入指標(biāo)的晚期ERPs(如P3b)也不再出現(xiàn)(Cohen等,2020;Pitts等,2014;見圖3C)。像這樣的發(fā)現(xiàn)導(dǎo)致一些研究者拒絕將前額葉皮層的參與視為意識(shí)感知的必要條件(Boly等,2017)。

然而,重要的是,證據(jù)的天平已經(jīng)開始向相反方向傾斜。隨后來(lái)自非人靈長(zhǎng)類動(dòng)物電生理學(xué)的證據(jù)表明,即使在沒有報(bào)告的情況下,也可以從前額葉皮層解碼出意識(shí)的內(nèi)容(Kapoor等,2020),并且前額葉皮層活動(dòng)的波動(dòng)先于知覺轉(zhuǎn)換(Dwarakanath等,2020),這表明了因果作用的存在。為了調(diào)和這些發(fā)現(xiàn),懷特等人(2022)修改了他們之前關(guān)于意識(shí)接入的模型,將報(bào)告的工作記憶要求視為通過(guò)策略選擇實(shí)現(xiàn)的一種心理行為。關(guān)于在工作記憶中保留哪些信息的可用策略控制了將第一級(jí)刺激狀態(tài)映射到模型第二級(jí)(即,對(duì)應(yīng)于從視覺皮層到工作記憶的信息門控)的二級(jí)A矩陣的精確度,以及二級(jí)B矩陣的精確度(對(duì)應(yīng)于在工作記憶中自愿保持項(xiàng)目)。

懷特及其同事利用這個(gè)修改后的模型模擬了一個(gè)既有報(bào)告條件又有無(wú)報(bào)告條件的視覺掩蔽任務(wù)。這些模擬再現(xiàn)了報(bào)告條件下意識(shí)的神經(jīng)相關(guān)性,其中“被意識(shí)到的”刺激伴隨著模型第二級(jí)的高放電率和一個(gè)類似P3b的ERP。關(guān)鍵的是,懷特等人(2022)能夠在沒有報(bào)告的情況下通過(guò)在模型中模擬一系列刺激精確度(即A矩陣精確度),來(lái)評(píng)估模型中刺激的可見性,從而構(gòu)建模型第二級(jí)的后驗(yàn)概率與相應(yīng)報(bào)告頻率之間的映射關(guān)系。在無(wú)報(bào)告條件下模擬相同任務(wù)時(shí),當(dāng)模型不需要提供其自身感知狀態(tài)的明確報(bào)告(因此也不需要在工作記憶中保持項(xiàng)目)時(shí),他們發(fā)現(xiàn)模型表現(xiàn)出較低的第二級(jí)放電率(即前額葉活動(dòng)減少),并且沒有產(chǎn)生類似P3b的ERP,因?yàn)樾畔鬟f的精確度降低(見圖3C)。然而,重要的是,模型第二級(jí)的后驗(yàn)概率仍然遠(yuǎn)高于接近100%報(bào)告性的閾值,再現(xiàn)了關(guān)鍵發(fā)現(xiàn),即在沒有報(bào)告的情況下,意識(shí)接入與前額葉活動(dòng)減少和沒有晚期ERPs相關(guān)聯(lián)。

該模型提出了兩個(gè)關(guān)鍵預(yù)測(cè)。第一,前額葉活動(dòng)和晚期ERPs應(yīng)該根據(jù)報(bào)告指令而分離,因?yàn)槭┘訄?bào)告要求意味著主體必須以目標(biāo)導(dǎo)向的方式增加感覺皮層和前額葉皮層之間(以及前額葉皮層內(nèi)部)傳遞的信息的精確度;從而改變意識(shí)接入的神經(jīng)相關(guān)性。事實(shí)上,這正是在一項(xiàng)同時(shí)進(jìn)行的EEG-fMRI實(shí)驗(yàn)中觀察到的(Dellert等,2021;該實(shí)驗(yàn)在懷特等人(2022)模型作為預(yù)印本發(fā)布后發(fā)表)。具體來(lái)說(shuō),當(dāng)刺激是有意識(shí)的,但與任務(wù)無(wú)關(guān)時(shí),視覺區(qū)域有強(qiáng)烈的激活,出現(xiàn)較大的N170,但前額葉激活較弱,沒有P3b。相比之下,當(dāng)刺激是有意識(shí)的,并且與任務(wù)相關(guān)時(shí),出現(xiàn)了強(qiáng)烈的前額葉激活和較大的P3b。該模型的第二個(gè)預(yù)測(cè)是,即使在沒有報(bào)告的情況下,前額葉和視覺皮層之間傳遞的雙向信息的前饋成分也應(yīng)該包含關(guān)于意識(shí)內(nèi)容的精確信息,這一預(yù)測(cè)隨后被羅(Rowe)等人(2024)證實(shí)。

4.2 意識(shí)自我的模型

我們現(xiàn)在從外感受意識(shí)的模型轉(zhuǎn)向?qū)υ庾R(shí)、內(nèi)感受和情緒的模型,在這些模型中,主體推斷并就自身的內(nèi)部認(rèn)知和身體狀態(tài)做出策略決策。由于意識(shí)本質(zhì)上是主觀的,與自我相關(guān)的加工是意識(shí)科學(xué)研究的一個(gè)關(guān)鍵領(lǐng)域。這一領(lǐng)域也引起了臨床醫(yī)生的興趣,因?yàn)閮?nèi)感受推斷和策略決策的擾亂與精神癥狀和現(xiàn)象學(xué)特征密切相關(guān)(例如抑郁癥中關(guān)于自我效能的異常推斷(Barrett等,2016;Ramstead,Wiese等,2023),或者反芻中策略選擇的中斷(Hesp等,2020))。為了概念上的清晰,我們按主題而不是按時(shí)間順序組織討論。

基于塞思(Seth,2013)最初提出內(nèi)感受推斷中情感內(nèi)容的基礎(chǔ),以及斯特凡(Stephan等,2016)后來(lái)將穩(wěn)態(tài)和應(yīng)激性穩(wěn)態(tài)失調(diào)與疲勞和抑郁聯(lián)系起來(lái)的工作,欽茨(Tschantz等,2022)開展了一系列模擬研究,以檢驗(yàn)不同生成模型結(jié)構(gòu)對(duì)穩(wěn)態(tài)和應(yīng)激性穩(wěn)態(tài)過(guò)程的解釋能力(參見Corcoran等,2020)。通過(guò)一個(gè)預(yù)測(cè)編碼網(wǎng)絡(luò)對(duì)身體狀態(tài)變化的反應(yīng)性自主反應(yīng)進(jìn)行建模,并通過(guò)將穩(wěn)態(tài)設(shè)定點(diǎn)基于推斷的外感受狀態(tài)進(jìn)行條件化,將其推廣到簡(jiǎn)單形式的預(yù)期行動(dòng)。至關(guān)重要的是,內(nèi)感受預(yù)測(cè)誤差的精確度變化影響了對(duì)內(nèi)感受狀態(tài)變化的敏感性,導(dǎo)致穩(wěn)態(tài)調(diào)節(jié)失敗。下行本體感受預(yù)測(cè)誤差與上行內(nèi)感受預(yù)測(cè)誤差之間的平衡決定了主體是調(diào)整其關(guān)于生理狀態(tài)的先驗(yàn)信念,還是執(zhí)行自主行動(dòng)以使生理狀態(tài)與設(shè)定點(diǎn)對(duì)齊。當(dāng)優(yōu)先考慮上行感覺預(yù)測(cè)誤差而不是自主調(diào)節(jié)時(shí)——即當(dāng)前設(shè)定點(diǎn)的先驗(yàn)與預(yù)期的內(nèi)感受數(shù)據(jù)相比足夠不精確時(shí)——促使主體改變其對(duì)設(shè)定點(diǎn)本身的信念。這種自主調(diào)節(jié)的失敗可能與自閉癥等疾病中的矛盾性感覺功能障礙有關(guān)(Gu & FitzGerald,2014),在這些疾病中,對(duì)感覺輸入的高敏感性與減弱的自主反應(yīng)和異常的應(yīng)激性穩(wěn)態(tài)共存。最后,通過(guò)使用部分可觀測(cè)馬爾可夫決策過(guò)程(POMDP)與預(yù)測(cè)編碼網(wǎng)絡(luò)進(jìn)行交互,使模型能夠解釋目標(biāo)導(dǎo)向的內(nèi)感受控制,其中主體通過(guò)預(yù)期維持零體溫(首選的穩(wěn)態(tài)設(shè)定點(diǎn))與預(yù)期體溫之間的偏差來(lái)做出行動(dòng)決策。

補(bǔ)充這種概念驗(yàn)證建模方法的見解,最近將主動(dòng)推斷模型擬合到實(shí)證數(shù)據(jù)的研究推斷出在各種疾病中內(nèi)感受精確度受到擾亂,包括抑郁癥、焦慮癥、飲食障礙和物質(zhì)使用障礙(Smith等,2020)。值得注意的是,在心跳敲擊任務(wù)中,最佳擬合模型(通過(guò)最小化變分自由能反轉(zhuǎn)的簡(jiǎn)單隱馬爾可夫模型)在患者樣本中未能在屏氣干擾下調(diào)整內(nèi)感受精確度,而健康對(duì)照組成功地增加了他們的內(nèi)感受精確度。這一發(fā)現(xiàn)最近在一個(gè)預(yù)注冊(cè)的、具有大樣本跨診斷的研究(Lavalley等,2024)以及健康對(duì)照組(Smith,Kuplicki,Teed等,2020)中得到了復(fù)制。

在一項(xiàng)重要的研究中,史密斯等人(Smith et al., 2021)測(cè)試了與主動(dòng)推斷相關(guān)的神經(jīng)過(guò)程理論的一些基本預(yù)測(cè)。他們利用一種新穎的胃腸道感知范式,讓參與者報(bào)告通過(guò)吞咽式振動(dòng)膠囊傳遞到胃部的不同強(qiáng)度的振動(dòng)的存在(或不存在),同時(shí)通過(guò)同步腦電圖(EEG)記錄神經(jīng)反應(yīng)。對(duì)最佳擬合模型參數(shù)(同樣是一個(gè)簡(jiǎn)單的隱馬爾可夫模型)的檢查發(fā)現(xiàn)支持神經(jīng)過(guò)程理論的證據(jù)。具體來(lái)說(shuō),盡管該模型并未擬合反應(yīng)時(shí)間或神經(jīng)反應(yīng),但內(nèi)感受精確度(A矩陣精確度)的增加與參與者的反應(yīng)時(shí)間以及感覺(頂枕區(qū))電極的誘發(fā)反應(yīng)幅度呈正相關(guān)。

轉(zhuǎn)向更具認(rèn)知背景的研究,艾倫等人(Allen et al., 2022)構(gòu)建了一個(gè)心視感覺整合模型,該模型在呈現(xiàn)喚醒性或非喚醒性視覺刺激時(shí)推斷其心動(dòng)周期的階段(舒張期與收縮期)?;诖碳ゎ愋停P屯茢嗥湫呐K策略,控制心動(dòng)周期之間的狀態(tài)轉(zhuǎn)換。心動(dòng)周期的隱藏狀態(tài)反過(guò)來(lái)又控制視覺A矩陣的精確度。這個(gè)最小模型再現(xiàn)了幾項(xiàng)原本不相關(guān)的實(shí)證發(fā)現(xiàn)。喚醒性刺激導(dǎo)致立即的心臟加速(防御性驚跳反射;Graham & Clifton, 1966),而對(duì)A矩陣映射進(jìn)行合成性損傷,對(duì)應(yīng)于內(nèi)感受精確度的降低,產(chǎn)生了“心身幻覺”以及增加的錯(cuò)誤推斷或元認(rèn)知偏差(例如,Allen et al., 2016;Hauser et al., 2017)。支持模型背后的假設(shè)——即主體根據(jù)呈現(xiàn)的視覺刺激推斷其心臟策略——科克倫等人(Corcoran et al., 2021)發(fā)現(xiàn),隨著感覺模糊度的增加,靜息心率和(高頻)心率變異性均有所下降。

內(nèi)感受、感知和情境推斷與情緒相關(guān)的理論和實(shí)證工作形式化,史密斯等人(Smith et al., 2019)表明,主動(dòng)推斷主體能夠在“模擬童年”期間獲得一系列情緒概念。具體來(lái)說(shuō),每個(gè)主體最初在隱藏情緒狀態(tài)(“情緒概念”)與內(nèi)感受觀察之間有一個(gè)平坦的A矩陣映射,經(jīng)過(guò)數(shù)百次試驗(yàn),這些試驗(yàn)包括觀察到的內(nèi)感受觀察(喚醒度、效價(jià)和行為)的組合以及外感受觀察(情境),主體學(xué)會(huì)了隱藏情緒狀態(tài)與內(nèi)感受觀察之間的映射。有趣的是,他們發(fā)現(xiàn),一個(gè)貧乏的“模擬童年”(即模型暴露的情緒結(jié)果統(tǒng)計(jì)偏向于某種特定情緒,如悲傷)會(huì)導(dǎo)致模型在后續(xù)的情緒推斷任務(wù)中準(zhǔn)確度降低,即使在暴露于其他情緒之后也是如此。在類似但更具實(shí)證性的背景下,史密斯等人(Smith, Lane, et al., 2019)使用分層模型模擬情緒工作記憶任務(wù)中的推斷。主體需要對(duì)兩個(gè)連續(xù)的情緒狀態(tài)進(jìn)行分類,然后進(jìn)行比較。有趣的是,他們發(fā)現(xiàn)在他們相對(duì)簡(jiǎn)單的模型中,至少有七種不同的潛在神經(jīng)機(jī)制能夠產(chǎn)生情緒意識(shí)降低的表型。例如,當(dāng)主體對(duì)不典型的身體狀態(tài)有較高的先驗(yàn)預(yù)期(如某些焦慮形式)時(shí),它會(huì)可靠地將自身的悲傷和恐慌內(nèi)部狀態(tài)誤分類為生病和心臟病發(fā)作。

在上述描述的兩個(gè)模型中,效價(jià)被當(dāng)作一種觀察結(jié)果來(lái)處理,而不是自身被推斷的對(duì)象——鑒于解釋目標(biāo)是情緒推斷(而非情感推斷),這種簡(jiǎn)化是合理的。為了補(bǔ)充這種處理方式,赫斯普等人(Hesp et al., 2021)提出了一個(gè)情感推斷模型,認(rèn)為效價(jià)是(部分地)從策略的先驗(yàn)和后驗(yàn)之間的不匹配中推斷出來(lái)的。策略的先驗(yàn)僅基于預(yù)期自由能(例如公式14),而后驗(yàn)則基于預(yù)期自由能以及基于連續(xù)觀察的后驗(yàn)信念。從先驗(yàn)到后驗(yàn)的變化反映了預(yù)測(cè)誤差,表明新的觀察結(jié)果與每種策略下的先驗(yàn)預(yù)期的一致性程度。這種誤差的方向隨后被用作更高層次模型中的觀察結(jié)果,該模型用于推斷效價(jià)狀態(tài)。在這里,支持策略先驗(yàn)的低層次觀察結(jié)果促進(jìn)了積極效價(jià),而與先驗(yàn)不一致的觀察結(jié)果則促進(jìn)了消極效價(jià)。這種類型的(獎(jiǎng)勵(lì))預(yù)測(cè)誤差或“情感電荷”之前曾與多巴胺的相位性釋放相關(guān)聯(lián)。

同時(shí),這種情感電荷被用來(lái)迭代更新預(yù)期自由能的精確度參數(shù),其中效價(jià)狀態(tài)充當(dāng)先驗(yàn)。在這里,消極效價(jià)狀態(tài)和意外的觀察結(jié)果都會(huì)降低這種精確度,從而減少預(yù)期自由能對(duì)策略選擇的后續(xù)影響。這種減少發(fā)揮了幾個(gè)互補(bǔ)的作用。首先,它促進(jìn)了概率匹配行為,如果對(duì)策略或計(jì)劃的信念缺乏信心,這種行為可能是適應(yīng)性的。其次,如果指定了學(xué)習(xí)習(xí)慣(通常用E表示),它允許學(xué)習(xí)習(xí)慣發(fā)揮更強(qiáng)的影響。最后,它優(yōu)化了預(yù)期自由能對(duì)策略選擇的相對(duì)影響。具體來(lái)說(shuō),當(dāng)策略的后驗(yàn)預(yù)期模型證據(jù)高于先驗(yàn)預(yù)期模型證據(jù)時(shí),情感電荷(和效價(jià))是積極的,表明主體對(duì)其計(jì)劃的信心增加,從而提高了預(yù)期自由能相對(duì)于其他項(xiàng)的精確度。相反,當(dāng)策略的先驗(yàn)預(yù)期模型證據(jù)高于后驗(yàn)預(yù)期模型證據(jù)時(shí),效價(jià)會(huì)降低預(yù)期自由能的權(quán)重(即,它減少了風(fēng)險(xiǎn)、模糊性和新奇性對(duì)策略選擇的貢獻(xiàn))。重要的是,由于兩級(jí)模型允許效價(jià)狀態(tài)作為策略精確度的先驗(yàn)信念,主體能夠?qū)㈩A(yù)期自由能對(duì)策略選擇的貢獻(xiàn)情境化,從而在反轉(zhuǎn)學(xué)習(xí)任務(wù)中提高表現(xiàn)。換句話說(shuō),通過(guò)為主體提供對(duì)其內(nèi)部模型的置信度的動(dòng)態(tài)估計(jì),主體能夠最優(yōu)地權(quán)衡當(dāng)前觀察結(jié)果(變分自由能)和預(yù)期未來(lái)觀察結(jié)果(預(yù)期自由能)對(duì)策略選擇的貢獻(xiàn)。

赫斯普等人(Hesp et al., 2021)提出的深度參數(shù)化推斷形式隨后被桑德維德-史密斯等人(Sandved-Smith et al., 2021)擴(kuò)展,用于模擬一種元意識(shí)的形式,這種元意識(shí)是冥想神經(jīng)科學(xué)中常見的循環(huán)現(xiàn)象學(xué)的基礎(chǔ),即“專注→分心→意識(shí)到分心→重新專注”的循環(huán)。該模型的關(guān)鍵貢獻(xiàn)在于將注意力、注意力的控制以及對(duì)注意力控制的意識(shí)以A矩陣精確度的分層控制來(lái)表述。

模型中第一級(jí)的A矩陣精確度將感覺觀察映射到隱藏狀態(tài),由第二級(jí)的注意力狀態(tài)控制,第二級(jí)包含兩種理想化狀態(tài):“專注”和“分心”。主體傾向于保持在專注的注意力狀態(tài),但由于第二級(jí)B矩陣的不精確性,主體偶爾會(huì)從專注狀態(tài)轉(zhuǎn)變?yōu)椴粚W顟B(tài)。第二級(jí)的策略選擇(心理行為)允許主體重新調(diào)整其注意力狀態(tài)并重新進(jìn)入專注狀態(tài),一旦主體意識(shí)到自己處于不專注狀態(tài),這是許多冥想實(shí)踐的關(guān)鍵方面。

元意識(shí)則由第三級(jí)構(gòu)成,它反過(guò)來(lái)控制第二級(jí)意識(shí)狀態(tài)的精確度。第三級(jí)的隱藏狀態(tài)包括兩種狀態(tài):高元意識(shí)狀態(tài),對(duì)應(yīng)于高精確度的第二級(jí)A矩陣;低元意識(shí)狀態(tài),對(duì)應(yīng)于低精確度的第二級(jí)A矩陣(通過(guò)第二級(jí)到第三級(jí)的A矩陣映射)。作為概念驗(yàn)證,他們模擬了一個(gè)簡(jiǎn)單的聽覺奇異任務(wù),并在不同的第三級(jí)注意力狀態(tài)下展示了主體在低元意識(shí)條件下比高元意識(shí)條件下花費(fèi)更長(zhǎng)時(shí)間處于分心的注意力狀態(tài)。與低感知需求條件下走神增加的發(fā)現(xiàn)一致(Lin et al., 2016),在低元意識(shí)狀態(tài)下,主體只有在聽到聽覺奇異刺激時(shí)才注意到從專注到分心的轉(zhuǎn)變。換句話說(shuō),奇異刺激引發(fā)了更大的預(yù)測(cè)誤差——并導(dǎo)致更強(qiáng)的上升證據(jù)——迫使在層級(jí)結(jié)構(gòu)中對(duì)隱藏狀態(tài)的近似后驗(yàn)進(jìn)行大規(guī)模信念更新。

重要的是,與上述旨在統(tǒng)一現(xiàn)有發(fā)現(xiàn)并生成新預(yù)測(cè)的模型不同,該模型的解釋目標(biāo)最好被理解為在理論主要以口頭定義、與實(shí)證數(shù)據(jù)聯(lián)系松散的研究領(lǐng)域早期階段,提供概念上的清晰性。因此,這種類型的建模最好被視為一種計(jì)算概念分析,是旨在統(tǒng)一現(xiàn)有結(jié)果或提供實(shí)證預(yù)測(cè)的建模的先決條件。

4.3 意識(shí)狀態(tài)模型

主動(dòng)推斷模型尚未應(yīng)用于操縱意識(shí)狀態(tài)的實(shí)驗(yàn)(但可參考霍布森和弗里斯頓的理論綜述)。然而,操縱意識(shí)狀態(tài)通常伴隨著感覺和運(yùn)動(dòng)的脫節(jié),這些脫節(jié)至少在表面上適合用主動(dòng)推斷的語(yǔ)言來(lái)解釋。例如,對(duì)長(zhǎng)時(shí)間尺度模式違規(guī)的神經(jīng)反應(yīng)在睡眠和麻醉狀態(tài)下有所不同。為了突出主動(dòng)推斷的解釋普適性,本節(jié)將介紹史密斯等人(2022)提出的聽覺規(guī)律感知分層模型的簡(jiǎn)單擴(kuò)展,并展示如何通過(guò)針對(duì)性地操縱精確度來(lái)重現(xiàn)以下發(fā)現(xiàn):與清醒狀態(tài)下檢測(cè)“全局”(長(zhǎng)時(shí)尺度)模式違規(guī)相關(guān)的晚期P3b事件相關(guān)電位(ERP)成分在非快速眼動(dòng)(NREM)和快速眼動(dòng)(REM)睡眠狀態(tài)下均缺失,而對(duì)“局部”違規(guī)的ERP反應(yīng)則得以保留。我們簡(jiǎn)要概述模型結(jié)構(gòu)以解釋結(jié)果,并建議感興趣的讀者參考史密斯等人(2022)以獲取模型的逐步描述。

該模型包含兩個(gè)分層級(jí)別(見圖4a):第一級(jí)追蹤聽覺音調(diào)的瞬間變化,第二級(jí)追蹤第一級(jí)的音調(diào)模式,推斷整體試驗(yàn)類型(即所有刺激是否具有相同的“標(biāo)準(zhǔn)”音調(diào),或者是否存在“奇異”音調(diào))。我們?cè)试S模型在10次試驗(yàn)過(guò)程中在第二級(jí)的D向量中累積濃度參數(shù)。在第10次試驗(yàn)中,音調(diào)要么符合預(yù)期的試驗(yàn)類型,要么違反預(yù)期。與實(shí)證發(fā)現(xiàn)一致,“全局”模式違規(guī)在模型的第二級(jí)引發(fā)了類似P3b的大型ERP,而“局部”試驗(yàn)內(nèi)預(yù)期違規(guī)在模型的第一級(jí)引發(fā)了類似失匹配負(fù)波(MMN)的ERP?;诜强焖傺蹌?dòng)和快速眼動(dòng)睡眠是低腎上腺素能狀態(tài)的發(fā)現(xiàn),我們利用與主動(dòng)推斷相關(guān)的進(jìn)程理論,對(duì)模型進(jìn)行針對(duì)性操縱以模擬去甲腎上腺素缺失,通過(guò)降低第二級(jí)B矩陣的精確度(應(yīng)用精確度參數(shù)β=0.9的softmax函數(shù))來(lái)實(shí)現(xiàn),這在理論和實(shí)證上均與腎上腺素能張力有關(guān)。與實(shí)證發(fā)現(xiàn)一致,降低B矩陣精確度消除了模型第二級(jí)的P3b樣ERP,但保留了第一級(jí)的MMN樣ERP(見圖4b)。由于第一級(jí)的動(dòng)態(tài)不依賴于逐時(shí)間步的動(dòng)態(tài),第一級(jí)B矩陣損傷對(duì)模型任何一級(jí)的ERP均無(wú)影響。

打開網(wǎng)易新聞 查看精彩圖片

正如所描述的,這個(gè)模型僅僅是解釋睡眠狀態(tài)下晚期ERP缺失的原因,并沒有本身解釋為什么參與者在睡眠的某些階段失去意識(shí)。然而,如果我們遵循前文提出的論點(diǎn)——意識(shí)接入需要一種時(shí)間深度,這種深度能夠抽象化感覺輸入的瞬間變化(弗里斯頓,2018;弗里斯頓等,2012;懷特和史密斯,2021)——那么這里提供的模型也可能為非快速眼動(dòng)(NREM)睡眠與較少的夢(mèng)境報(bào)告(表明意識(shí)的缺失)相關(guān)聯(lián),以及快速眼動(dòng)(REM)睡眠以更頻繁的、帶有離奇且看似不連貫的現(xiàn)象學(xué)特征的夢(mèng)境報(bào)告為特征(霍布森,2009)提供一種算法層面的解釋。

具體來(lái)說(shuō),非快速眼動(dòng)(NREM)睡眠是一種低膽堿能狀態(tài),在主動(dòng)推斷框架下,這會(huì)導(dǎo)致生成模型的層級(jí)之間因A矩陣精確度的降低而出現(xiàn)脫節(jié)。這種脫節(jié)會(huì)有效地使時(shí)間深度層級(jí)“離線”,極大地減少信念更新,這可能對(duì)應(yīng)于意識(shí)的喪失。

相比之下,快速眼動(dòng)(REM)睡眠是一種高膽堿能狀態(tài),這將允許在層級(jí)之間進(jìn)行層級(jí)信息傳遞。關(guān)鍵在于,處于高膽堿能狀態(tài)的模型,受到感覺皮層內(nèi)在波動(dòng)的驅(qū)動(dòng),并結(jié)合低腎上腺素能張力,會(huì)表現(xiàn)出隱藏狀態(tài)之間的隨機(jī)轉(zhuǎn)換(通過(guò)低B矩陣精確度),這可能解釋了REM睡眠中夢(mèng)境的離奇現(xiàn)象學(xué)。有趣的是,REM睡眠行為障礙——通常被認(rèn)為是帕金森病的前驅(qū)癥狀——表現(xiàn)為在睡眠中“表演”這些夢(mèng)境,這可能反映了在層級(jí)之間平衡精確度的失敗,尤其是在做夢(mèng)期間抑制本體感受預(yù)測(cè)誤差精確度的失敗。

這個(gè)簡(jiǎn)單的例子很好地說(shuō)明了主動(dòng)推斷建模的典型策略:從一個(gè)足夠明確的目標(biāo)現(xiàn)象出發(fā),構(gòu)建一個(gè)生成模型,并基于實(shí)證和理論神經(jīng)生物學(xué)的結(jié)合,模擬對(duì)模型的針對(duì)性操縱,以模擬實(shí)驗(yàn)操縱。鑒于睡眠和麻醉豐富的神經(jīng)生物學(xué)背景,這種策略可以像上面所展示的那樣,直接應(yīng)用于對(duì)意識(shí)狀態(tài)的實(shí)驗(yàn)操縱。當(dāng)然,這里展示的模型只是跨意識(shí)狀態(tài)神經(jīng)動(dòng)態(tài)生成模型的一個(gè)例子。理想情況下,未來(lái)的研究將構(gòu)建并比較多個(gè)競(jìng)爭(zhēng)模型與實(shí)證數(shù)據(jù)。

5. 主動(dòng)推斷作為一種關(guān)于意識(shí)的最小理論

我們?cè)诒疚拈_頭引入主動(dòng)推斷時(shí),期望將其作為構(gòu)建意識(shí)理論的基礎(chǔ),利用主動(dòng)推斷模型的不同方面作為構(gòu)建模塊。在明確了框架以及主動(dòng)推斷模型提供的解釋類型之后,我們現(xiàn)在來(lái)探討這一期望。為了盡可能清晰地闡述理論的結(jié)構(gòu)及其與實(shí)證數(shù)據(jù)的關(guān)系,我們遵循最近關(guān)于意識(shí)科學(xué)哲學(xué)的研究(Negro, 2024),并借鑒拉卡托斯(Lakatos, 1968)關(guān)于“科學(xué)研究綱領(lǐng)”的理論,這一理論在當(dāng)代科學(xué)哲學(xué)家中(Godfrey-Smith, 2003)通常被視為波普爾證偽主義綱領(lǐng)(Popper, 2008)的繼承者。

根據(jù)拉卡托斯(1968)的觀點(diǎn),研究綱領(lǐng)包含兩個(gè)組成部分:硬核和保護(hù)帶。硬核由構(gòu)成理論基礎(chǔ)的一系列基本概念組成,這些概念本身不需要直接可檢驗(yàn)。相比之下,保護(hù)帶由較不核心的概念和假設(shè)組成,當(dāng)與硬核結(jié)合時(shí),它們能夠產(chǎn)生可檢驗(yàn)的預(yù)測(cè)。如果研究綱領(lǐng)要得以存續(xù),變化只能發(fā)生在保護(hù)帶上。重要的是,所作的改變必須是進(jìn)步的。也就是說(shuō),這些改變必須使理論更加精確,或者擴(kuò)展其解釋范圍以增強(qiáng)其預(yù)測(cè)能力。然而,如果對(duì)理論的改變僅僅是為了解釋矛盾的結(jié)果,而沒有產(chǎn)生新的預(yù)測(cè)或提供其他解釋優(yōu)勢(shì),那么該研究綱領(lǐng)就被認(rèn)為是“退化的”,最終可能需要被放棄。例如,整合信息論(Albantakis et al., 2023; Oizumi et al., 2014; Tononi et al., 2016)的硬核由推導(dǎo)出Phi作為意識(shí)衡量標(biāo)準(zhǔn)的假設(shè)構(gòu)成。其外圍部分則由使Phi可計(jì)算的橋梁假設(shè)和近似方法構(gòu)成。如果Phi不能可靠地與意識(shí)狀態(tài)共變,這將對(duì)整合信息論構(gòu)成嚴(yán)重挑戰(zhàn)。然而,重要的是,這并不會(huì)對(duì)整合信息論造成致命打擊,因?yàn)閷?dǎo)致失敗的原因可能是一個(gè)或多個(gè)推導(dǎo)出Phi可計(jì)算近似的假設(shè),而不是理論的硬核本身。研究綱領(lǐng)的健康狀況將取決于整合信息論能否通過(guò)改變保護(hù)帶來(lái)產(chǎn)生額外的預(yù)測(cè)。

主動(dòng)推斷框架的核心是將兩個(gè)目標(biāo)函數(shù)——預(yù)期自由能和變分自由能——最小化。因此,這兩個(gè)目標(biāo)函數(shù)以及對(duì)它們進(jìn)行極值化的要求,必須包含在基于主動(dòng)推斷的任何理論的硬核中。這意味著所有行為,無(wú)論是有意識(shí)的還是無(wú)意識(shí)的,都必須在某種最小意義上旨在最小化這些量(參見Hohwy, 2021)。實(shí)現(xiàn)這一目標(biāo)的神經(jīng)和計(jì)算過(guò)程,至少目前而言,是理論保護(hù)帶的一部分。

為了構(gòu)建意識(shí)理論,我們需要的下一個(gè)組成部分是目標(biāo)函數(shù)中的量與意識(shí)體驗(yàn)之間的聯(lián)系。在上述所有模型中隱含的最最小的聯(lián)系是意識(shí)內(nèi)容與推斷出的隱藏狀態(tài)(即關(guān)于世界、身體和大腦狀態(tài)的近似后驗(yàn)分布 q(s)之間的聯(lián)系。因此,所有意識(shí)內(nèi)容的變化都必須源于世界、身體或大腦狀態(tài)的推斷變化;這包括從沒有意識(shí)內(nèi)容到有意識(shí)內(nèi)容的變化(如意識(shí)狀態(tài)模型),以及外感受和內(nèi)感受內(nèi)容的變化(如感知、情緒和情感模型),以及源自大腦狀態(tài)本身的意識(shí)內(nèi)容(如元意識(shí))。這是一種最小的聯(lián)系,因?yàn)樗槐砻髦鲃?dòng)推斷所特有的選擇性采樣是意識(shí)內(nèi)容變化的必要條件,而不是充分條件。這種最小的聯(lián)系排除了意識(shí)變化可以在狀態(tài)后驗(yàn)分布不變的情況下發(fā)生的可能性(但不排除狀態(tài)后驗(yàn)分布變化而意識(shí)體驗(yàn)不變的可能性),并且與表現(xiàn)出由主動(dòng)推斷支配行為的無(wú)意識(shí)生物是一致的。

最后,為了讓主動(dòng)推斷成為一種關(guān)于意識(shí)本身的理論,而不僅僅是關(guān)于適應(yīng)性行為的理論,我們需要一個(gè)標(biāo)準(zhǔn)來(lái)區(qū)分意識(shí)狀態(tài)和無(wú)意識(shí)狀態(tài)(Doerig等,2021;Seth和Bayne,2022)。用主動(dòng)推斷的語(yǔ)言來(lái)說(shuō),我們需要解釋是什么使某些后驗(yàn)信念成為有意識(shí)的,而另一些則成為無(wú)意識(shí)的。在這里,我們?cè)俅螀⒖蓟谥鲃?dòng)推斷推導(dǎo)出的意識(shí)內(nèi)容的計(jì)算模型所做的假設(shè)。在上述所有被回顧的模型中,與意識(shí)內(nèi)容最對(duì)應(yīng)的后驗(yàn)信念是那些驅(qū)動(dòng)策略選擇的信念,特別是那些驅(qū)動(dòng)主觀報(bào)告策略選擇的信念。至少,支持主觀報(bào)告的計(jì)算需要一個(gè)離散生成模型。連續(xù)生成模型可以驅(qū)動(dòng)類似反射的動(dòng)作,但支持主觀報(bào)告(例如,信心投注,或存在與否的判斷)的計(jì)算類型是明確的反事實(shí)的。因此,它們需要一個(gè)能夠考慮一個(gè)或多個(gè)離散備選方案的離散生成模型。重要的是,離散生成模型的深層演變速度太慢,無(wú)法與感知現(xiàn)象學(xué)相匹配(Whyte和Smith,2021)。因此,我們認(rèn)為意識(shí)/無(wú)意識(shí)的區(qū)分與意識(shí)獲取機(jī)制有關(guān),并且發(fā)生在離散-連續(xù)界面,即由感官瞬間變化驅(qū)動(dòng)的連續(xù)后驗(yàn)信念被轉(zhuǎn)化為可以驅(qū)動(dòng)行動(dòng)選擇的離散格式的地方。

因此,要使一個(gè)后驗(yàn)信念成為有意識(shí)的,它必須發(fā)生在足夠慢的時(shí)間尺度上,以便從即時(shí)的感官流動(dòng)中抽象出來(lái),使其能夠?yàn)榉词聦?shí)策略選擇提供信息,并且足夠精確,以可靠地區(qū)分不同反事實(shí)的世界狀態(tài)。這與之前關(guān)于主動(dòng)推斷的哲學(xué)工作是一致的,這些工作認(rèn)為在層次生成模型中,意識(shí)獲取的計(jì)算作用是迫使主體暫時(shí)確定一個(gè)關(guān)于世界隱藏狀態(tài)的特定后驗(yàn)信念,以驅(qū)動(dòng)行動(dòng)選擇(Hohwy,2013;Marchi和Hohwy,2022;Whyte,2019)。

精確性要求可以被視為一種計(jì)算類比,觀察到的意識(shí)體驗(yàn)是由分化且常常是互斥的感知對(duì)象組成的(Canales-Johnson等,2017;Oizumi等,2014;Seth,2021;Seth,2014;Tononi,1998)。至關(guān)重要的是,這也意味著不存在一個(gè)硬性閾值,使得后驗(yàn)信念會(huì)成為可報(bào)告的。相反,意識(shí)獲取的閾值會(huì)隨著任務(wù)要求和主體需要執(zhí)行的決策類型而變化。此外,我們希望明確,我們并不是說(shuō)成為反事實(shí)策略選擇過(guò)程的目標(biāo)是使后驗(yàn)信念有意識(shí)的原因。相反,是這種后驗(yàn)信念在合適的時(shí)間尺度上并且以足夠的精確性為策略選擇過(guò)程提供信息的能力(從反事實(shí)的角度來(lái)看)使其成為有意識(shí)的(參見關(guān)于意識(shí)的傾向性理論,如Carruthers,2003;Prinz,2012)。最適合解釋主觀報(bào)告的決策標(biāo)準(zhǔn)的具體內(nèi)容是一個(gè)正在進(jìn)行的實(shí)證辯論問(wèn)題,最好被視為理論的保護(hù)帶的一部分(關(guān)于可能的實(shí)現(xiàn)方式,請(qǐng)參見Whyte等,2022)。關(guān)于現(xiàn)象學(xué)與反事實(shí)策略選擇深度之間的關(guān)系的討論,請(qǐng)參見(Seth,2014)。

重要的是,理論的核心部分所包含的關(guān)于意識(shí)過(guò)程與主動(dòng)推斷之間的最小聯(lián)系,應(yīng)當(dāng)被視為發(fā)現(xiàn)和構(gòu)建一個(gè)更全面的意識(shí)理論的基礎(chǔ)構(gòu)件,而這個(gè)更全面的意識(shí)理論目前隱含在主動(dòng)推斷的外圍部分。換句話說(shuō),盡管主動(dòng)推斷的基本架構(gòu)中已經(jīng)有所暗示,但一個(gè)完整的理論需要的不僅僅是通過(guò)行動(dòng)和感知來(lái)優(yōu)化內(nèi)部模型的原則。它必須明確模型本身的特性,才能在科學(xué)上具有實(shí)用性。

發(fā)現(xiàn)的過(guò)程涉及納入、測(cè)試和拋棄模型(包括上述所回顧的模型),并對(duì)現(xiàn)有模型進(jìn)行進(jìn)一步的完善(例如對(duì)雙眼競(jìng)爭(zhēng)和層次化聽覺處理模型所做的修改;見附錄1-2)。對(duì)這些模型的檢查隨后會(huì)為一個(gè)更豐富的理論提供信息,提示哪些特性在對(duì)意識(shí)內(nèi)容、自我和狀態(tài)的解釋中是關(guān)鍵的。

我們?cè)谶@里倡導(dǎo)的方法首先是一種開放式的理論構(gòu)建和發(fā)現(xiàn)過(guò)程,只要它仍然是一個(gè)不斷進(jìn)步的研究項(xiàng)目,并且在與其他意識(shí)理論的模型證據(jù)競(jìng)爭(zhēng)中保持競(jìng)爭(zhēng)力(參見Corcoran等,2023),理論構(gòu)建就會(huì)不斷擴(kuò)展和完善。未來(lái)的關(guān)鍵發(fā)展將包括對(duì)更多意識(shí)現(xiàn)象進(jìn)行更細(xì)致的建模,包括應(yīng)用結(jié)構(gòu)相似的模型來(lái)統(tǒng)一多樣化的意識(shí)和無(wú)意識(shí)現(xiàn)象。這體現(xiàn)在雙眼競(jìng)爭(zhēng)和特羅勒消退的模型(Parr,Corcoran等,2019)中,以及用于容納無(wú)報(bào)告范式的注意力驅(qū)動(dòng)感知模型的層次化擴(kuò)展(Whyte等,2022)。進(jìn)一步的工作還應(yīng)該研究將意識(shí)內(nèi)容、自我和狀態(tài)模型的元素結(jié)合起來(lái)的模型的表現(xiàn)。此外,針對(duì)獨(dú)特現(xiàn)象學(xué)類型(例如,情感和情緒、物體性、元認(rèn)知;Barrett等,2016;Nikolova等,2022;Pezzulo等,2018;Seth,2014;Seth等,2012;Seth和Friston,2016)的概念模型也需要進(jìn)一步完善,以實(shí)現(xiàn)更大的計(jì)算特異性,并能夠產(chǎn)生可檢驗(yàn)的預(yù)測(cè)。

理論的保護(hù)帶由允許對(duì)特定意識(shí)現(xiàn)象的模型進(jìn)行書寫和模擬的形式化構(gòu)成,并且包括將模擬結(jié)果映射到實(shí)證得出的行為和神經(jīng)數(shù)據(jù)的假設(shè)。這包括生成模型的結(jié)構(gòu)、將生成模型和狀態(tài)及策略推斷的動(dòng)態(tài)映射到神經(jīng)數(shù)據(jù)的過(guò)程理論,以及將通過(guò)模擬得出的量與報(bào)告的現(xiàn)象學(xué)聯(lián)系起來(lái)的假設(shè)(例如,感知的內(nèi)容是否對(duì)應(yīng)于后驗(yàn)分布的眾數(shù),分布的精確性是否對(duì)感覺現(xiàn)象學(xué)有貢獻(xiàn)?)。

當(dāng)前對(duì)這一理論的表述是有意保持極簡(jiǎn)的,為活躍推斷理論家之間在經(jīng)驗(yàn)或理論上尚未確定的問(wèn)題上保留了實(shí)質(zhì)性的分歧空間。它也承認(rèn),絕大多數(shù)的解釋性工作將由理論的保護(hù)帶完成,因此,它在很大程度上對(duì)富有成效的修正和完善是開放的(鑒于可能的生成模型結(jié)構(gòu)的多樣性以及模擬數(shù)據(jù)與實(shí)證數(shù)據(jù)之間映射的過(guò)程理論的靈活性)。在個(gè)體生成模型的層面,幾乎總是可以構(gòu)建一組候選模型,這些模型能夠在不同程度上解釋相關(guān)的實(shí)證數(shù)據(jù),而在極端情況下,它們甚至可能產(chǎn)生相互矛盾的預(yù)測(cè)。這是一個(gè)特點(diǎn),而不是一個(gè)缺陷,并且與活躍推斷作為一種建??蚣苓@一事實(shí)相輔相成,它已經(jīng)與一系列變分(貝葉斯)方法一起發(fā)展,用于模型擬合和模型比較(Daunizeau,2011;K. Friston等,2007;Zeidman等,2022)。這些方法使得在競(jìng)爭(zhēng)的生成模型家族之間進(jìn)行裁決成為可能,每個(gè)模型都體現(xiàn)了關(guān)于產(chǎn)生觀察到的實(shí)證數(shù)據(jù)的過(guò)程的假設(shè)。因此,個(gè)體生成模型的發(fā)展——以及活躍推斷作為一種意識(shí)理論的發(fā)展——是相輔相成的,為理論既能夠?qū)?shí)證爭(zhēng)論做出貢獻(xiàn),又能夠與其實(shí)證爭(zhēng)論共同進(jìn)化留下了空間。

例如,正如我們前面提到的,支持意識(shí)對(duì)感知狀態(tài)的獲取的各種決策標(biāo)準(zhǔn)是一個(gè)正在進(jìn)行的討論話題,最近的證據(jù)指向了一種潛在的元認(rèn)知機(jī)制,該機(jī)制涉及對(duì)刺激的存在與否進(jìn)行抽象推斷,而這種推斷獨(dú)立于感知空間本身的結(jié)構(gòu)(Dijkstra等,2023)。這一機(jī)制與之前提出的一個(gè)活躍推斷架構(gòu)(Whyte等,2022)相悖,該架構(gòu)通過(guò)一個(gè)明確與主體感知空間結(jié)構(gòu)相聯(lián)系的策略空間來(lái)模擬意識(shí)獲取。目前的證據(jù)還不足以在更一般的情境中區(qū)分這兩種假設(shè),但如果意識(shí)獲取確實(shí)基于一種與感知狀態(tài)空間結(jié)構(gòu)無(wú)關(guān)的元認(rèn)知決策,那么這將對(duì)該特定的活躍推斷模型構(gòu)成重大(可能是不可逾越的)挑戰(zhàn)。然而,至關(guān)重要的是,這一模型組件是獨(dú)特的,并不是活躍推斷下生成模型結(jié)構(gòu)的一個(gè)內(nèi)在特征,這使得未來(lái)有可能構(gòu)建尊重新發(fā)現(xiàn)的模型(并且通過(guò)這樣做,富有成效地將活躍推斷的解釋范圍擴(kuò)展到元認(rèn)知領(lǐng)域)。我們將這種靈活性視為理論的一個(gè)解釋優(yōu)勢(shì),而不是缺陷,鑒于意識(shí)科學(xué)的早期階段以及隨著方法和數(shù)據(jù)質(zhì)量的提高而不斷修訂實(shí)證發(fā)現(xiàn),這種靈活性是完全合適的。

這些考慮留下了這樣的擔(dān)憂:活躍推斷可能過(guò)于靈活,無(wú)法作為一種意識(shí)理論而富有成效(而不僅僅是一個(gè)有用的建??蚣埽?。或者,換句話說(shuō),理論的核心與保護(hù)帶之間的聯(lián)系留下了太多的自由度,無(wú)法導(dǎo)向一個(gè)自身獨(dú)特可識(shí)別的意識(shí)理論。然而,有兩個(gè)關(guān)鍵的考慮因素可以緩解這一擔(dān)憂。首先,上述關(guān)于對(duì)活躍推斷意識(shí)獲取模型的潛在修訂的例子涉及修訂一個(gè)模型中關(guān)于主體策略空間的假設(shè),因此并不構(gòu)成對(duì)理論保護(hù)帶的重大打擊。至關(guān)重要的是,這并非適用于所有假設(shè)。不同模型共享由少數(shù)幾個(gè)語(yǔ)義可解釋的數(shù)量(即,準(zhǔn)確性、復(fù)雜性、風(fēng)險(xiǎn)、模糊性、新奇性)組成的客觀函數(shù)這一事實(shí),限制了可能對(duì)特定行為做出貢獻(xiàn)的參數(shù)數(shù)量。例如,在模擬選擇性注意力時(shí),刺激的顯著性被歸因于A矩陣的精確性——這將通過(guò)預(yù)期自由能的表征(模糊性最小化)成分對(duì)行為產(chǎn)生影響。這一假設(shè)幾乎被所有涉及注意力和視覺搜索的活躍推斷模型所共享(Allen等,2019;Holmes等,2021;Mirza等,2018,2018,2019;Parr等,2021;Parr & Friston,2017a,2017b,2018b;Whyte等,2022;Whyte & Smith,2021)。因此,如果發(fā)現(xiàn)一個(gè)無(wú)法用這種方式建模的注意力效應(yīng),那么這將對(duì)活躍推斷意識(shí)理論構(gòu)成非常重大的打擊,因?yàn)檫@種修訂的影響將波及大多數(shù)現(xiàn)有模型。

第二個(gè)重要的考慮因素是,事實(shí)上,該理論確實(shí)產(chǎn)生了定量和定性的預(yù)測(cè)。盡管這些預(yù)測(cè)并非直接從理論的核心推導(dǎo)而來(lái),但它們足夠接近,如果被證明是錯(cuò)誤的,那么將需要修訂大多數(shù)建模研究中所做的橋梁假設(shè)——即使這些研究似乎與意識(shí)科學(xué)毫無(wú)關(guān)系。這種修訂將使理論危險(xiǎn)地接近成為一個(gè)退化的研究項(xiàng)目。在主動(dòng)視覺中存在探索-利用權(quán)衡是一個(gè)定量預(yù)測(cè)的例子。我們?cè)诟戒?中給出了一個(gè)在雙眼競(jìng)爭(zhēng)背景下這種預(yù)測(cè)的明確例子。如果發(fā)現(xiàn)與刺激相關(guān)的獎(jiǎng)勵(lì)并沒有與競(jìng)爭(zhēng)刺激的表征內(nèi)容(例如,亮度對(duì)比度)在選擇注意力策略時(shí)進(jìn)行權(quán)衡,那么活躍推斷將受到嚴(yán)重挑戰(zhàn),因?yàn)轭A(yù)期自由能中風(fēng)險(xiǎn)與模糊性之間的權(quán)衡是理論核心的一個(gè)基本組成部分。當(dāng)然,直接測(cè)試這一預(yù)測(cè)將很困難,因?yàn)閰⑴c者之間在學(xué)習(xí)速率、悲觀先驗(yàn)以及對(duì)獎(jiǎng)勵(lì)關(guān)聯(lián)的敏感性等方面存在個(gè)體差異,以及其他因素。

此外,注意力在早期視覺處理中所起作用的程度仍然不確定,這意味著在實(shí)踐中,通常需要在各種實(shí)驗(yàn)中進(jìn)行最佳解釋的推斷。然而,如果在參與者和實(shí)驗(yàn)范式(例如,雙眼競(jìng)爭(zhēng)和特羅勒消退)之間,最佳擬合模型被穩(wěn)健地證明在選擇注意力策略時(shí)沒有尊重風(fēng)險(xiǎn)與模糊性之間的預(yù)期權(quán)衡,那么活躍推斷意識(shí)理論將變得不那么可信。因此,在某種意義上,活躍推斷建??蚣堋约鞍殡S它的模型擬合和比較工具——是嚴(yán)肅檢驗(yàn)活躍推斷作為一種意識(shí)理論的關(guān)鍵。這是一個(gè)有利的位置。模型擬合和比較的工具在任何情況下都不會(huì)假設(shè)用于推導(dǎo)被擬合模型的理論的真實(shí)性。在特定情境中擬合得最好的模型完全有可能是一個(gè)違反活躍推斷意識(shí)理論核心信條的模型。

我們還可以從該理論中推導(dǎo)出第二個(gè)定性預(yù)測(cè)。具體來(lái)說(shuō),正如我們?cè)谇懊嫣岬降模鳛橐庾R(shí)理論的主動(dòng)推斷的一個(gè)核心承諾是,如果意識(shí)內(nèi)容有任何變化,那么身體、大腦或世界的推斷狀態(tài)也必須發(fā)生變化。這一承諾的推論是,在缺乏感官(A矩陣)精確性的情況下,關(guān)于世界狀態(tài)的后驗(yàn)信念不應(yīng)偏離其先驗(yàn)軌跡(例如,我們能夠在腦海中默默數(shù)數(shù)的事實(shí)表明,我們可以根據(jù)關(guān)于從一個(gè)數(shù)字過(guò)渡到下一個(gè)數(shù)字的先驗(yàn)信念,逐刻改變我們的后驗(yàn)信念,但在缺乏精確的感官數(shù)據(jù)的情況下,我們不會(huì)偏離這一數(shù)字軌跡),因此,意識(shí)內(nèi)容也不應(yīng)發(fā)生變化。該理論的一個(gè)方便的口號(hào)因此是“看見即凝視”(其他感覺模態(tài)也是如此,例如“聽見即聆聽”“感覺即觸摸”等)。也就是說(shuō),有意識(shí)地感知意味著運(yùn)用某種反事實(shí)策略選擇過(guò)程所特有的精確性分配,涵蓋外顯和內(nèi)隱行為。完全將零精確性分配給一種感覺模態(tài)可能過(guò)于理想化,以至于在經(jīng)驗(yàn)上難以處理;然而,與理論核心相關(guān)的另一個(gè)預(yù)測(cè)是,精確性的降低會(huì)導(dǎo)致信念更新的延遲,表現(xiàn)為意識(shí)內(nèi)容變化的延遲。如果我們把內(nèi)源性精確性分配與內(nèi)隱和外顯注意力策略聯(lián)系起來(lái)(Hohwy,2012),而這是主動(dòng)視覺的主動(dòng)推斷模型中所做出的假設(shè),那么在選擇注意力/掃視策略時(shí)被分配了高精確性的刺激,將比視網(wǎng)膜匹配但不是掃視目標(biāo)的刺激更快地進(jìn)入意識(shí)內(nèi)容。這種預(yù)測(cè)也是主動(dòng)推斷作為意識(shí)理論的獨(dú)特之處,與其他更具針對(duì)性的意識(shí)理論(如全局工作空間理論或整合信息理論)形成對(duì)比,后者沒有明確的動(dòng)作角色,而在主動(dòng)推斷中,精確性的分配是通過(guò)明確選擇注意力或掃視策略來(lái)實(shí)現(xiàn)的。這種經(jīng)驗(yàn)性預(yù)測(cè)確實(shí)是整合信息理論與被動(dòng)預(yù)測(cè)處理理論以及主動(dòng)推斷之間對(duì)抗性合作的一部分(INTREPID CONSORTIUM,2021)。

最后,重要的是要注意,該理論的成功與否并不完全取決于這兩個(gè)接近核心的預(yù)測(cè)的成功與否。即使這些預(yù)測(cè)得到驗(yàn)證,主動(dòng)推斷仍有可能作為意識(shí)理論失敗。實(shí)際上,理論失敗的方式可能有很多種不太戲劇性的方式——而且我們懷疑這些方式更有可能發(fā)生。例如,如果主動(dòng)推斷的關(guān)鍵現(xiàn)象模型過(guò)于復(fù)雜(即它們過(guò)度擬合于特定的實(shí)驗(yàn)結(jié)果且無(wú)法泛化),或者意識(shí)和非意識(shí)感知的模型看起來(lái)無(wú)法區(qū)分,或者不同意識(shí)現(xiàn)象的模型未能顯示出一致的共同點(diǎn)和差異,以至于該理論在提供統(tǒng)一或獨(dú)特解釋方面幾乎沒有幫助,那么這將表明這是一個(gè)退化的研究項(xiàng)目。反過(guò)來(lái),如果該理論最終取得成功,我們期望最終能夠用一組相對(duì)較小的模型來(lái)復(fù)制意識(shí)的所有關(guān)鍵行為和神經(jīng)相關(guān)性,這些模型沿著少數(shù)幾個(gè)維度變化,反映報(bào)告的現(xiàn)象學(xué)和神經(jīng)相關(guān)性之間的差異和相似性。這也暗示了解釋的性質(zhì)和方向。神經(jīng)和行為變量通過(guò)主動(dòng)推斷的解釋工具與現(xiàn)象學(xué)(反之亦然)相映射。

結(jié)論

在這里,我們論證了主動(dòng)推斷正是因?yàn)?*不是**一種意識(shí)理論,才在當(dāng)前關(guān)于意識(shí)的理論方法中獨(dú)樹一幟,能夠充分展現(xiàn)意識(shí)科學(xué)研究下現(xiàn)象的豐富性和多樣性。至關(guān)重要的是,我們主張主動(dòng)推斷不僅僅是一個(gè)用于建模意識(shí)的框架。這些模型在意識(shí)科學(xué)背景下的解釋所隱含的假設(shè),導(dǎo)致了一系列經(jīng)驗(yàn)預(yù)測(cè),如果這些預(yù)測(cè)被證明是錯(cuò)誤的,那么將需要對(duì)在主動(dòng)推斷下構(gòu)建的大多數(shù)模型進(jìn)行修訂。該理論的核心由一個(gè)要求構(gòu)成:在感知中最小化變分自由能,在策略選擇中最小化預(yù)期自由能,同時(shí)推測(cè)意識(shí)的內(nèi)容(包括外感受和內(nèi)感受體驗(yàn),以及大腦自身狀態(tài))——在某種程度上——必須與世界狀態(tài)的推斷相對(duì)應(yīng),這種對(duì)應(yīng)發(fā)生在連續(xù)的感官計(jì)算與離散的反事實(shí)策略選擇過(guò)程之間的界面上。

意識(shí)的科學(xué)研究,歸根結(jié)底是一門經(jīng)驗(yàn)科學(xué)。如果主動(dòng)推斷要為我們提供一個(gè)有用的意識(shí)理論,那么將來(lái)之不易的理論見解轉(zhuǎn)化為經(jīng)驗(yàn)見解就必須成為優(yōu)先事項(xiàng)。目前,在將旨在澄清概念的抽象模型轉(zhuǎn)化為能夠?qū)?jīng)驗(yàn)數(shù)據(jù)提供定性解釋的模型方面,存在著明顯的瓶頸。反過(guò)來(lái),在將這些旨在定性解釋和預(yù)測(cè)的更復(fù)雜的理論模型轉(zhuǎn)化為能夠與數(shù)據(jù)進(jìn)行定量比較的最小模型方面,也存在瓶頸。大多數(shù)的解釋性工作仍有待完成。然而,我們?cè)诒疚闹兄鲝?,一種理論的輪廓已經(jīng)開始顯現(xiàn)。因此,我們對(duì)主動(dòng)推斷作為一種意識(shí)理論,最終能夠提供一組最小化的模型來(lái)解釋和統(tǒng)一意識(shí)內(nèi)容、自我和狀態(tài)的研究充滿樂觀。

附錄1:主動(dòng)推斷下的Levelt定律

為了展示Parr、Corcoran等人(2019)提出的雙眼競(jìng)爭(zhēng)模型與Levelt定律的兼容性,我們重新實(shí)現(xiàn)了原始模型。簡(jiǎn)要來(lái)說(shuō),該模型有三個(gè)隱藏狀態(tài)因子,分別編碼呈現(xiàn)給每只眼睛的刺激的身份(狀態(tài)為{左,空白}和{右,空白})以及注意力的焦點(diǎn)(狀態(tài)為{左,右})。換句話說(shuō),人們可以將注意力集中在與右側(cè)刺激一致的特征上,或者集中在來(lái)自右眼的數(shù)據(jù)上,或者集中在來(lái)自左眼的數(shù)據(jù)上。模型有兩個(gè)結(jié)果模態(tài)(A矩陣),每個(gè)眼睛的隱藏狀態(tài)因子各對(duì)應(yīng)一個(gè),它們將進(jìn)入每只眼睛的刺激的觀察條件概率映射到相應(yīng)的隱藏狀態(tài)。A矩陣映射的精確性依賴于注意力隱藏狀態(tài)因子。當(dāng)注意力缺失時(shí),A矩陣是均勻的(例如,列由[0.5 0.5]組成),而當(dāng)注意力存在時(shí),映射相對(duì)精確([0.7 0.3])。這使得隱藏狀態(tài)在未被注意的觀察模態(tài)下條件獨(dú)立。與每只眼睛相關(guān)的隱藏狀態(tài)因子的B矩陣初始化為單位矩陣,然后通過(guò)softmax函數(shù),其中精確性參數(shù)ω = 0.8,引入足夠的不確定性到主體的轉(zhuǎn)移信念中,以確保在缺乏精確輸入(即在缺乏注意力的情況下)時(shí),關(guān)于隱藏狀態(tài)的不確定性會(huì)隨著時(shí)間積累,未被注意的刺激會(huì)變得越來(lái)越具有認(rèn)知吸引力。注意力隱藏狀態(tài)因子的B矩陣依賴于主體的注意力策略{左,右},將注意力轉(zhuǎn)移置于主體的控制之下。兩種結(jié)果模態(tài)的C向量都是均勻的。

為了模擬Levelt命題所描述的實(shí)驗(yàn)條件,我們系統(tǒng)地降低了其中一個(gè)(Levelt的第二命題)或兩個(gè)(Levelt的第四命題)A矩陣映射的精確性。Levelt的第二命題指出,降低進(jìn)入一只眼睛的刺激的“強(qiáng)度”(例如對(duì)比度),而保持進(jìn)入另一只眼睛的刺激強(qiáng)度不變,應(yīng)該會(huì)顯著增加與未改變刺激相關(guān)聯(lián)的感知的主導(dǎo)持續(xù)時(shí)間,并導(dǎo)致與強(qiáng)度降低的刺激相關(guān)聯(lián)的感知的主導(dǎo)持續(xù)時(shí)間相對(duì)較小的減少。與之相符的是,降低其中一個(gè)A矩陣的精確性,而保持另一個(gè)不變,導(dǎo)致進(jìn)入更精確眼睛的刺激被采樣(即被注意)的時(shí)間顯著增加,而與較不精確眼睛相關(guān)的刺激被采樣的時(shí)間逐漸減少(圖3b上部)。

這種不對(duì)稱性是由于較不精確的刺激的認(rèn)知價(jià)值相對(duì)降低。Levelt的第四命題指出,增加進(jìn)入兩只眼睛的刺激的“強(qiáng)度”將導(dǎo)致兩種刺激感知的主導(dǎo)持續(xù)時(shí)間減少。與Levelt的第四命題一致,降低兩個(gè)A矩陣的精確性增加了主體在切換之前采樣刺激的時(shí)間(圖3b下部)。A矩陣精確性的對(duì)稱降低促使主體花費(fèi)更多時(shí)間采樣每個(gè)刺激以減少其不確定性,從而導(dǎo)致更長(zhǎng)的主導(dǎo)持續(xù)時(shí)間。換句話說(shuō),在A矩陣精確性降低的情況下,每個(gè)刺激保持其認(rèn)知價(jià)值(即減少模糊性)的時(shí)間更長(zhǎng)。

附錄2:雙眼競(jìng)爭(zhēng)與探索-利用困境

基于最小化預(yù)期自由能的主體在探索(即模糊性)和利用(即風(fēng)險(xiǎn))之間的權(quán)衡,我們通過(guò)將附錄1中描述的Levelt命題的模擬擴(kuò)展到包含獎(jiǎng)勵(lì),試圖生成一個(gè)新的實(shí)驗(yàn)預(yù)測(cè)。具體來(lái)說(shuō),我們模擬了Levelt第二命題所描述的條件,但在第一組模擬中假設(shè)了一個(gè)均勻的C向量,而在這里我們將降低精確性的刺激(例如,在實(shí)驗(yàn)設(shè)置中對(duì)比度降低的刺激)與獎(jiǎng)勵(lì)相關(guān)聯(lián)。在模擬的每個(gè)時(shí)間步中,右眼結(jié)果模態(tài)的“右”狀態(tài)相關(guān)的觀察被賦予了一個(gè)值 r = 0.25 ,這在雙眼的A矩陣精確性匹配時(shí)(即每個(gè)刺激的認(rèn)知價(jià)值匹配,但獎(jiǎng)勵(lì)眼的風(fēng)險(xiǎn)更低)導(dǎo)致了對(duì)獎(jiǎng)勵(lì)刺激感知的初始主導(dǎo)持續(xù)時(shí)間的偏倚。重要的是,由于風(fēng)險(xiǎn)和模糊性相互權(quán)衡,這種偏倚可以通過(guò)降低獎(jiǎng)勵(lì)眼的精確性來(lái)補(bǔ)償,從而降低其認(rèn)知(模糊性降低)價(jià)值(圖A.2)。因此,我們預(yù)測(cè):1)在刺激強(qiáng)度(對(duì)比度)匹配的情況下,競(jìng)爭(zhēng)將偏向與獎(jiǎng)勵(lì)刺激相關(guān)的感知;2)這種偏倚將通過(guò)降低獎(jiǎng)勵(lì)刺激的認(rèn)知價(jià)值來(lái)補(bǔ)償。綜合來(lái)看,這將導(dǎo)致在獎(jiǎng)勵(lì)條件下對(duì)Levelt第二命題的預(yù)測(cè)性違反。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

原文鏈接: https://arxiv.org/pdf/2410.06633