Concepts as Semantic Pointers: A Framework and Computational Model

作為語義指針的概念:一個框架與計算模型

https://onlinelibrary.wiley.com/doi/pdfdirect/10.1111/cogs.12265

打開網(wǎng)易新聞 查看精彩圖片

摘要

基于原型、范例和類理論結構的概念理論的調(diào)和是認知科學中的一個長期問題。針對這一問題,研究者們最近傾向于采用混合理論,將各種類型的表征結構結合起來,或者采用消除理論,用更精細的心理表征分類來取代概念。在本文中,我們描述了一種替代性方法,涉及一種名為“語義指針”的單一類別的心理表征。語義指針是由感知、詞匯和運動表征的壓縮與遞歸綁定所產(chǎn)生的類似符號的表征,有效地整合了傳統(tǒng)聯(lián)結主義和符號主義方法。我們提出了一個使用語義指針的計算模型,該模型復制了涉及每種先前范式分類研究的實驗數(shù)據(jù)。我們認為,涉及語義指針的框架可以為概念現(xiàn)象提供統(tǒng)一的解釋,并將我們的框架與現(xiàn)有替代方案在概念的范圍、內(nèi)容、遞歸組合和神經(jīng)實現(xiàn)方面進行了比較。

關鍵詞:概念;分類;神經(jīng)計算;語義學;計算建模;心理表征

1. 引言

概念的研究在近期認知功能理論的發(fā)展中發(fā)揮了核心作用。從分類到語言使用,各種現(xiàn)象都可以通過概念加工來有效地描述(參見Murphy, 2002的綜述),并且許多有影響力的認知發(fā)展描述都是基于假設概念是我們對世界知識的基本表征單元而產(chǎn)生的(例如,Carey, 1985, 2009;Tenenbaum, Kemp, Griffiths, & Goodman, 2011)。然而,盡管概念對認知科學的持續(xù)研究顯然具有重要意義,但研究者們對概念在大腦中的結構和表征方式有著截然不同的觀點。

這種分歧的主要原因是,不同學科的理論家有著眾多且有時相互沖突的解釋目標。例如,心理學家通常希望解釋涉及分類和概念學習等任務的實驗數(shù)據(jù)(例如,Lin & Murphy, 1997;Regehr & Brooks, 1993;Rips, 1989;Smith & Medin, 1981)。而哲學家則通常希望理解概念的語義和擁有條件(例如,F(xiàn)odor, 1998;Laurence & Margolis, 1999;Peacocke, 1992;Prinz, 2002)。即使在達成一致的解釋目標時,需要解釋的數(shù)據(jù)范圍往往過于龐大且分散,難以發(fā)展出統(tǒng)一的理論(Murphy, 2002)。例如,僅憑原型理論、范例理論或概念理論理論的個體資源,無法全面解釋分類現(xiàn)象(Rogers & McClelland, 2004)。

為了應對這一僵局,研究者們最近傾向于采用兩種一般策略之一。第一種策略涉及提出“混合”或“多元”模型,其中單個概念對應于多個相關或共指的表征結構,這些結構用于解釋不同現(xiàn)象(Laurence & Margolis, 1999;Murphy, 2002;Weiskopf, 2009)。第二種策略則相反,主張在認知科學的詞匯中用更精細的心理表征分類取代“概念”一詞,這些表征各自具有不同的功能(Machery, 2009)。這兩種方法的相對優(yōu)劣是當前爭論的主題(Machery, 2010),但可以說,這兩種觀點都沒有獲得廣泛的支持。

在本文中,我們提出了一個替代性的、統(tǒng)一的解決方案,以應對當前概念研究中的挑戰(zhàn)。利用用于表征神經(jīng)系統(tǒng)中表征狀態(tài)的方法(Eliasmith, 2003, 2013;Eliasmith & Anderson, 2003),我們用涉及一種最近被假設的心理表征類別——“語義指針”(Eliasmith, 2013)的過程來描述概念。粗略地說,語義指針是神經(jīng)實現(xiàn)的、類似符號的表征,可以通過多種方式轉(zhuǎn)換以產(chǎn)生進一步的表征,這些表征支持分類、推理和語言使用等認知過程。值得注意的是,語義指針已成功用于解釋目前世界上最大的功能性人腦模型中的一系列感知、認知和運動行為(Eliasmith et al., 2012)。然而,過去的工作并未詳細探討語義指針與概念現(xiàn)象的相關性。因此,我們的目標是展示基于語義指針的建??蚣芸梢詾楦拍罾碚摷覀鹘y(tǒng)上感興趣的那類現(xiàn)象提供統(tǒng)一的解釋。為了支持我們的觀點,我們描述了一個生物學上合理的脈沖神經(jīng)元模型,該模型處理語義指針以解釋用于支持三種競爭性概念理論(原型理論、范例理論和理論理論)的分類實驗數(shù)據(jù)。

2. 概念理論的標準

盡管用于評估概念理論的標準常常存在爭議,但人們普遍承認某些認知功能是典型的概念性功能。例如,語言使用、推理以及命題態(tài)度的形成只是眾多被明確界定為涉及概念操作的認知任務中的一部分。因此,我們將從認為概念理論應當解釋這些概念功能是如何實現(xiàn)的觀點出發(fā)。然而,除了這些功能解釋之外,還應當提供某些理論解釋。例如,應當解釋概念如何能夠在從抽象到普通的種類之間變化,以及它們?nèi)绾文軌蛑复F(xiàn)實世界中的對象群體。鑒于這些考慮,我們提出以下標準作為對概念加工的令人滿意的解釋的最低要求(參見Barsalou, 1999;Fodor, 1998;Laurence & Margolis, 1999;Prinz, 2002):

1. 分類

2. 遞歸綁定

3. 神經(jīng)實現(xiàn)

4. 范圍

5. 內(nèi)容

當然,還可以選擇其他標準,但我們選擇了這五個標準,原因很簡單,它們似乎捕捉到了大量概念現(xiàn)象的共同屬性。例如,分類任務在有關概念的文獻中被廣泛研究(Murphy, 2002),并且在某些情況下會調(diào)用背景知識,以推理的形式將對象屬性與類別成員身份聯(lián)系起來。因此,合理地認為涉及推理和語言的其他概念過程的描述可以部分地被理解為更復雜的分類形式。由于這些以及相關的原因,我們在模擬中只關注分類效應。

對于任何概念加工的解釋來說,對綁定的解釋也是一個重要的目標:它既涉及包含多個概念的組合結構的形成(例如,LARGE RED DOG),也涉及類別實例的多模態(tài)表征的整合。綁定已經(jīng)吸引了許多對心理表征結構感興趣的研究人員的廣泛關注(例如,Jackendoff, 2002),因此我們認為這是一個相對沒有爭議的約束條件。

關于神經(jīng)實現(xiàn),當然,說概念過程是神經(jīng)過程多少有點老生常談。但由于神經(jīng)過程的性質(zhì)可能限制了認知系統(tǒng)能夠輕松計算的函數(shù)類型(Eliasmith & Anderson, 2003),因此,任何特定認知模型所描述的函數(shù)是否確實可以被神經(jīng)實現(xiàn)仍然是一個懸而未決的問題。因此,采用神經(jīng)實現(xiàn)標準表明,其他條件相同的情況下,對特定模型的實現(xiàn)展示將極大地有利于該模型。

至于更具理論性的標準,范圍指的是不同種類概念的廣泛多樣性。概念包括可感知對象(例如,TABLE)的概念、抽象概念(例如,VIRTUE)、理論假設(例如,GENE)、數(shù)學術語(例如,SUM)以及不存在的實體(例如,CENTAUR)等(Prinz, 2002)。一個好的理論應該能夠解釋這些不同類別的概念,并且應該與將特定神經(jīng)系統(tǒng)和解剖區(qū)域與這些類別加工相關聯(lián)的現(xiàn)有證據(jù)保持一致。例如,對患有語義缺陷的神經(jīng)病學患者的研究表明,具體實體和抽象實體的概念是在不同的神經(jīng)系統(tǒng)中加工的(Shallice & Cooper, 2013)。

最后,概念是關于事物的,這意味著它們具有內(nèi)容或意義。這種內(nèi)容反過來可以大致定義為一個給定概念如何描述它所代表的事物。一個充分的理論必須解釋為什么一個給定的概念指稱某些事物而不是其他事物(即,提供其外延的解釋),并且還必須解釋為什么這個概念以某種方式而不是其他方式描述這些指稱對象(即,提供其內(nèi)涵的解釋)。關于心理表征的語義和個體化問題的哲學文獻為采用這一標準提供了動機(例如,F(xiàn)odor, 1987, 1998;Peacocke, 1992;Prinz, 2002)。

總結來說,前三個標準涉及概念功能的性質(zhì)和實現(xiàn),而后兩個標準涉及使這些功能得以實現(xiàn)的表征的理論屬性。我們的框架旨在滿足這些標準,盡管我們對前三個標準的討論旨在更加全面,而對后兩個標準的討論則旨在更具啟發(fā)性。為了開始詳細發(fā)展框架,我們首先描述神經(jīng)表征和計算的原則,這些原則推動了我們許多論點的形成。

3. 神經(jīng)表征與計算

盡管人們普遍接受心理表征是神經(jīng)系統(tǒng)的特征,但當前的認知建模方法通常不會用高度詳細的神經(jīng)術語來描述表征。例如,符號主義方法通常用基于類似語言的語法結構的原子表征來定義計算(例如,F(xiàn)odor, 1975),很少甚至從不考慮神經(jīng)細節(jié)。聯(lián)結主義方法則使用大量個體處理節(jié)點之間的加權連接來描述表征(例如,Rogers & McClelland, 2004; Rumelhart & McClelland, 1986),但這些模型僅粗略對應于大腦的結構,且忽略了真實神經(jīng)元的生理屬性、動態(tài)屬性和連接方式等許多重要細節(jié)。

我們傾向于采用一種用大量單個脈沖神經(jīng)元的活動來描述表征和計算的方法。更具體地說,我們采用了Eliasmith和Anderson(2003)開發(fā)的神經(jīng)工程框架(NEF)。根據(jù)該框架,脈沖神經(jīng)元的活動模式可以用數(shù)學對象(如向量,即一組數(shù)值)來描述,這些向量反過來可以捕捉有關世界的信息(通過神經(jīng)元對環(huán)境刺激的調(diào)諧)。通過指定兩個或多個神經(jīng)元群體之間的突觸權重集合,可以計算這些向量的轉(zhuǎn)換,包括將多個向量綁定在一起以在向量空間中嵌入復雜層次結構的轉(zhuǎn)換。因此,NEF有時被描述為一種將基于向量的算法翻譯成神經(jīng)脈沖語言的編譯器(見Eliasmith, 2013)。對于我們來說,以這種定量方式描述神經(jīng)系統(tǒng)的活動有兩個顯著優(yōu)勢。首先,已有成熟的技術可以將各種詞匯、感官和運動表征轉(zhuǎn)換為向量(Georgopoulos, Schwartz, & Kettner, 1986; Jones & Mewhort, 2007; Plate, 2003),因此向量具有足夠的表征能力來解釋概念表征的多模態(tài)性質(zhì)(參見Barsalou, 1999)。其次,涉及向量的計算可以實現(xiàn)強大的遞歸綁定形式(Gayler, 1998; Kanerva, 1994; Plate, 2003; Smolensky, 1990),鑒于即使是簡單概念也與大量內(nèi)容相關聯(lián),綁定的解釋可能是開發(fā)合理概念加工模型的關鍵。

在NEF中,可以通過一種稱為循環(huán)卷積的過程來實現(xiàn)綁定(Eliasmith, 2004, 2013)。撇開數(shù)學細節(jié)不談,循環(huán)卷積可以被視為一種將兩個輸入向量混合成一個相同維度的輸出向量的函數(shù)。實現(xiàn)這一功能相對直接:如果兩個“輸入”神經(jīng)元群體分別代表一個向量,并且連接到一個中間群體,該中間群體投射到一個“輸出”群體,那么可以使用NEF求解這些群體之間的突觸權重集合,從而使輸出群體編碼一個向量,該向量是兩個輸入向量的卷積。這個過程可以無限重復,并且也可以逆轉(zhuǎn),以恢復遞歸生成結構中綁定的任何一個向量的近似值。總體而言,NEF具備描述涉及多種神經(jīng)表征的復雜句法操作(包括組合和分解)的所有工具。NEF的神經(jīng)表征和計算原則相結合,描述了一種非常強大的表征類型,Eliasmith(2013)將其稱為“語義指針”。我們以語義指針的概念為起點,開發(fā)一種能夠滿足第2節(jié)中提出的全部五個標準的概念解釋。

4. 語義指針

在其最基本的形式中,語義指針可以被看作是一種壓縮表征,捕捉關于特定領域的摘要信息。通常,這類表征源自感知輸入。例如,視野中一個物體的圖像最初會被編碼為大量神經(jīng)元群體的一種活動模式。然而,通過上述類型的轉(zhuǎn)換,進一步的神經(jīng)元群體層會產(chǎn)生關于原始視覺輸入的越來越抽象的統(tǒng)計摘要(見圖1)。最終,可以產(chǎn)生一個高度壓縮的輸入表征。這種描述既與視覺皮層中較晚層次神經(jīng)元數(shù)量的減少一致,也與受神經(jīng)啟發(fā)的用于降維的層次化統(tǒng)計模型的發(fā)展一致(Hinton & Salakhutdinov, 2006; Serre, Oliva, & Poggio, 2007)。類似的表征也可以在其他模態(tài)(如聽覺和觸覺)中生成。

打開網(wǎng)易新聞 查看精彩圖片

之所以將這種壓縮表征稱為語義指針,是因為它們通過壓縮過程與所表征的狀態(tài)非任意相關,從而保留了關于這些狀態(tài)的語義信息。之所以稱這些表征為指針,是因為它們可以用來“指向”或再生壓縮網(wǎng)絡中較低層次的表征(Hinton & Salakhutdinov, 2006)。此外,任何一個給定的語義指針都可以獨立于生成它的網(wǎng)絡進行操作。例如,一個關于桌子的感知的語義指針可以在與桌子相關的認知任務中使用,而不一定引發(fā)相關壓縮網(wǎng)絡底部更豐富的感知表征的重新激活。

語義指針的計算能力在于它們能夠通過壓縮操作(如循環(huán)卷積)被綁定在一起,形成包含來自多種來源的詞匯、感知和運動信息的高度結構化表征。重要的是,這些結構化表征本身也是語義指針,因為它們可以指向并再生它們所構建的下屬表征。再次考慮桌子這個玩具示例。通過已經(jīng)描述過的遞歸綁定(這是一種壓縮操作),關于桌子的視覺和觸覺圖像的語義指針可以被結合起來,同時還可以結合關于“桌子”聲音的聽覺圖像的指針和關于字母“t-a-b-l-e”的視覺圖像的指針。此外,各種對應于諸如“有一個平面”或“用于吃飯”等語言信息的結構也可能被綁定在一起。這些結構本身也將由其他語義指針構建而成,包括壓縮后的關于平面、用餐場景等的視覺圖像。總體而言,這些眾多綁定操作的結果是一個單一的表征,它捕捉了與桌子相關的廣泛內(nèi)容之間的關系。這個單一表征可以通過多種方式轉(zhuǎn)換,以重新訪問桌子的圖像、關于桌子的語言信息,或者通常用于與桌子互動的運動指令。

此時,語義指針在解釋概念現(xiàn)象方面的高度適用性應該已經(jīng)顯而易見。它們可以解釋以單一對象類別為中心的符號過程、感知模擬以及許多其他功能。換句話說,它們可以作為一個類別事物的摘要表征,而這正是概念通常被認為所具有的功能。使用語義指針已經(jīng)成功地進行了諸如簡單語言推理(Eliasmith, 2013)、歸納推理(Rasmussen & Eliasmith, 2011)和基于規(guī)則的問題解決(Stewart & Eliasmith, 2011)等概念任務的神經(jīng)模擬,以及能夠執(zhí)行多種認知功能的大規(guī)模腦模型(Eliasmith et al., 2012)。基于這些成功的應用,我們認為語義指針的概念為解釋廣泛的概念現(xiàn)象提供了理想的基礎。

5. 概念作為語義指針

人們可能會傾向于聲稱概念就是語義指針。然而,我們避免這種理論表述,原因很簡單:語義指針在孤立狀態(tài)下無法滿足所有期望的標準?;叵胍幌?,語義指針只是一個由神經(jīng)元群體的脈沖活動編碼的向量。這個向量捕捉了其他各種表征之間的關系,并且可以通過多種方式轉(zhuǎn)換以訪問這些表征,但向量本身并不具備普通概念所具有的完整語義內(nèi)容。因此,與其將語義指針視為等同于概念的實體,不如將其視為使概念得以發(fā)生的基礎實體。

在我們的觀點中,概念最好被視為一種傾向性(dispositional)的存在。擁有一個概念意味著能夠激活各種神經(jīng)狀態(tài)序列,這些序列對應于圍繞單一類別的視覺和聽覺模擬、自然語言表達以及運動指令等。這些過程中的相關神經(jīng)狀態(tài)是由語義指針的轉(zhuǎn)換產(chǎn)生的,并且在任何給定的概念發(fā)生場合中,只會有有限范圍的可能轉(zhuǎn)換得以執(zhí)行。換句話說,構成給定概念發(fā)生的神經(jīng)過程是依賴于情境和任務的(Barsalou, 1999)。例如,涉及語言推理的概念任務將激活與涉及觸覺刺激分類的概念任務不同的神經(jīng)狀態(tài)(見圖2)。同樣,涉及“狗”這一概念的認知任務可能在一個個體中喚起對大型動物的視覺模擬,而在另一個個體中喚起對小型動物的模擬。闡述這一理論的部分任務是解釋影響這種情境多樣性的因素。盡管如此,我們的觀點是,這些構成概念加工的各種神經(jīng)狀態(tài)都源自一個共同的起點,即語義指針的轉(zhuǎn)換。

打開網(wǎng)易新聞 查看精彩圖片

鑒于這種描述,重要的是要考慮我們的觀點與最近發(fā)展起來的“新經(jīng)驗主義”理論之間的明顯相似性,這些理論將概念加工等同于部分重新激活之前捕捉到的感知狀態(tài)(例如,Barsalou, 1999; Barsalou, Simmons, Barbey, & Wilson, 2003; Barsalou, Santos, Simmons, & Wilson, 2008; Prinz, 2002)。例如,Barsalou(1999)將概念等同于“模擬器”或有組織的類別特定感知符號系統(tǒng),這些符號可以被選擇性地轉(zhuǎn)移到工作記憶中。正如人們可能預期的那樣,這種將符號轉(zhuǎn)移到工作記憶的過程與通過轉(zhuǎn)換語義指針來訪問詳細感知表征的過程高度相似。同樣,Prinz(2002)聲稱概念是“代理型”(即“可以通過工作記憶招募來表征類別的感知派生表征”)(第149頁),這與我們關于概念作為部分對應于感知模擬的過程的觀點有許多共同之處。

語義指針框架與這些新經(jīng)驗主義理論之間存在兩個顯著差異。首先,語義指針理論與非模態(tài)表征的存在是一致的。例如,對應于詞匯項的語義指針可以包含關于相關項在某些語境中共現(xiàn)的非模態(tài)統(tǒng)計信息(Eliasmith, 2013)。在缺乏感知表征的情況下訪問此類信息可以解釋在某些需要驗證詞語與屬性之間匹配的任務中的反應時間(例如,Solomon & Barsalou, 2004)。此外,鑒于通常被用來支持嚴格經(jīng)驗主義理論的論據(jù)和證據(jù)的爭議性(Machery, 2007),以及存在證據(jù)表明具體和抽象概念是在至少部分分離的系統(tǒng)中加工的(Shallice & Cooper, 2013),我們認為語義指針框架在這一問題上的中立性是一種優(yōu)點。

其次,我們提出的觀點對概念的實際表征方式提供了不同的解釋。新經(jīng)驗主義理論通常將概念等同于(1)模擬器(即有組織的感知符號系統(tǒng))或(2)模擬(即工作記憶中的臨時表征)。第一種選擇的問題在于,它在如何執(zhí)行功能方面沒有明確說明(Dennett & Viger, 1999)。語義指針框架通過將概念發(fā)生與神經(jīng)過程等同起來,并以獨立動機的神經(jīng)計算原則和下面描述的基于模型的實現(xiàn)來機械地描述這些過程,從而解決了這一不足。第二種選擇的問題在于,它意味著每個特定模擬的實例都對應于一個獨特的概念。如果是這樣,那么一個人可以擁有多個指代單一類別的概念,并且由于在不同時間產(chǎn)生完全相同的模擬的可能性很小,因此很少會兩次喚起同一個概念。如果沒有解釋為什么這些模擬形成了不同的概念(或者如果它們不是不同的概念,為什么它們是相關的),那么這個理論就會顯得模糊和不精確。我們的觀點通過假設一個共同的底層神經(jīng)機制來統(tǒng)一單一概念的多樣化發(fā)生,從而避免了這個問題。

語義指針框架與通過梯度下降訓練以關聯(lián)各種模態(tài)特定表征(例如,感知、語言描述等)的聯(lián)結主義模型之間的相似性也很明顯,這些模型通過中介的非模態(tài)語義表征來關聯(lián)這些表征(Rogers et al., 2004; Roy & Pentland, 2002; Rumelhart & McClelland, 1986)。兩個關鍵特征區(qū)分了我們的方法。第一個是我們提供的表征綁定的解釋。學會關聯(lián)表征的聯(lián)結主義模型沒有遞歸綁定表征的手段,因此也沒有解釋復合概念或具有句法結構的表征的手段。第二個是,通常使用一種局部編碼形式,其中個體處理節(jié)點被認為代表獨特的語言謂詞和感知特征。這種編碼違反了實現(xiàn)標準,因為這些節(jié)點與神經(jīng)基質(zhì)之間的對應關系沒有被明確說明。

由于上述所有原因,我們提出我們的觀點為滿足第2節(jié)中介紹的標準提供了一種有前景的新方法。然而,在重新回到根據(jù)這些標準對理論進行評估之前,我們首先描述了一個基于語義指針的模型,該模型能夠解釋原型理論、范例理論和理論理論對概念的重要特征。盡管這個計算模型并不全面,但它很好地初步展示了基于語義指針的框架對概念現(xiàn)象提供統(tǒng)一解釋的潛力。

6. 模型描述

我們的建模工作集中在三項典范的分類研究上。第一項研究由Posner和Keele(1968)進行,表明當受試者學習對通過干擾各種原型模式生成的點陣圖案進行分類時,他們會抽象并利用有關相關原型的信息。第二項研究由Regehr和Brooks(1993)進行,證明在某些情況下,基于相似性的分類策略可以取代更具分析性的策略。第三項研究由Lin和Murphy(1997)進行,研究了背景知識對涉及相同視覺刺激的分類決策的影響,這些刺激在不同的功能描述下被分類。這三項研究共同記錄了分類效應的廣泛多樣性。

我們提出了一種單一的模型架構,該架構在解釋這些不同效應時不會發(fā)生變化。從功能上講,該模型以對應于壓縮自然圖像的向量作為輸入,并輸出對應于運動反應的向量。所有中間處理過程都使用大約30萬個模擬的漏電積分-發(fā)放(LIF)神經(jīng)元來實現(xiàn),并且在每次模擬中都使用128維向量。關于LIF神經(jīng)元如何用于編碼、解碼和轉(zhuǎn)換向量的詳細信息可以在補充材料的A部分找到。

在更具體的層面,模型架構包括一個工作記憶系統(tǒng)、一個動作選擇系統(tǒng),以及兩個進一步的子系統(tǒng),用于對輸入刺激進行感知和推理評估(見圖3)。工作記憶存儲編碼視覺范例和定義類別成員資格的軟規(guī)則的語義指針。動作選擇系統(tǒng)控制如何從這些語義指針中提取信息,并以任務依賴的方式操縱輸入刺激。從解剖學上講,動作選擇系統(tǒng)被映射到基底神經(jīng)節(jié)和丘腦的部分區(qū)域,而其他子系統(tǒng)則被映射到皮層。這些解剖學映射主要受到其他研究工作的啟發(fā)(Eliasmith, 2013; Eliasmith et al., 2012),在目前的研究中,最好將它們視為合理的假設。模型的功能性是我們的主要關注點,在下面報告的模擬中,我們沒有使用模型以一種獨立證明這些映射的方式解釋神經(jīng)數(shù)據(jù)。

在每次實驗中,模型首先接收一個視覺輸入,提示當前的實驗任務,然后是一個需要分類的刺激。根據(jù)提示,動作選擇系統(tǒng)啟動過程,將語義指針解壓縮,以(a)將刺激與之前學習的范例進行比較,或者(b)應用一組定義類別成員資格的規(guī)則。

為了提供更正式的細節(jié),工作記憶系統(tǒng)包含神經(jīng)元群體,其活動代表在每次實驗的訓練階段學習的概念對應的語義指針。在涉及感知分類的實驗中,這些語義指針將具有以下數(shù)學描述:

打開網(wǎng)易新聞 查看精彩圖片

其中 是一個索引特定規(guī)則的向量,而 是該規(guī)則內(nèi)容的表征。通過依次檢索和應用這些規(guī)則,模型能夠推斷出給定輸入刺激與規(guī)則所編碼的類別描述的一致性程度??傮w而言,(1)和(2)為我們的模型中使用的語義指針提供了表征方案,但需要注意的是,這些方案是為了適應特定的分類實驗而選擇的,并不能反映我們框架的表征能力。

動作選擇系統(tǒng)的細節(jié)更為復雜。許多傳入連接使得該系統(tǒng)能夠監(jiān)測模型中其他神經(jīng)群體中的表征狀態(tài),并且其中一小部分狀態(tài)與系統(tǒng)執(zhí)行以控制信息流動的動作相關聯(lián)。該系統(tǒng)由一系列解剖學上對應于基底神經(jīng)節(jié)的神經(jīng)群體組成,而對應于尾狀核的輸入群體編碼每個被監(jiān)測的表征狀態(tài)與觸發(fā)特定動作的狀態(tài)之間的相似性(即,點積)。輸出的內(nèi)蒼白球群體連接到丘腦,丘腦再連接回模型的其他部分,從而在特定時間執(zhí)行對應于最高編碼相似性度量的動作。關于這一基底神經(jīng)節(jié)動作選擇模型的實現(xiàn)和生物學合理性的詳細信息可以在 Stewart、Choo 和 Eliasmith(2010)中找到。然而,我們的關注點在于利用該系統(tǒng)的功能,而不是直接用它來解釋神經(jīng)數(shù)據(jù)。

執(zhí)行感知評估和推理評估的系統(tǒng)最好通過例子來說明。在每個實驗條件下,模型首先接收一個表示當前任務的向量,隨后接收一個對應于待分類視覺刺激的向量。當任務向量通過視覺緩沖區(qū)時,它觸發(fā)一個動作,更新工作記憶中任務上下文的表征,這反過來決定了刺激向量將如何被處理。在感知分類任務的情況下,這種上下文表征觸發(fā)一個動作,將輸入刺激與圖3中標記為“感知評估”子系統(tǒng)中的解壓縮語義指針進行比較。從數(shù)學上講,感知評估系統(tǒng)的后續(xù)輸出可以描述為:

其中SP是由(1)描述的那種語義指針,而 是正在被分類的輸入向量的偽逆。這個輸出通過一個由當前任務上下文的工作記憶表征觸發(fā)的動作被傳遞到運動緩沖區(qū)。圖4展示了這一過程在模型執(zhí)行Posner和Keele(1968)的任務時的展開。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

在推理序列完成后,任務上下文表征的最終狀態(tài)觸發(fā)一個動作,將推理評估系統(tǒng)的輸出傳遞到運動緩沖區(qū)。圖5展示了這一過程在模型執(zhí)行Lin和Murphy(1997)的任務時的展開。

打開網(wǎng)易新聞 查看精彩圖片

我們認為這個模型是統(tǒng)一的,原因如下:所有表征都是語義指針,模型結構在不同任務之間保持不變,動作選擇系統(tǒng)可以執(zhí)行的動作集合也在不同任務之間保持不變。

可能會有人認為,因為我們?yōu)椴煌娜蝿丈舷挛亩x了不同的動作,所以我們實際上提出了一種混合模型。然而,這類似于爭論說計算器沒有提供算術的統(tǒng)一實現(xiàn)。僅僅根據(jù)輸入(例如,按下了哪個操作按鈕)改變設備中的信息流,并不意味著該設備實現(xiàn)了算術的混合解釋。表征、結構和處理步驟都保持不變。

同樣,在我們的模型中,改變動作選擇系統(tǒng)執(zhí)行的轉(zhuǎn)換類似于手動更換計算器上的操作按鈕。我們選擇當前的實現(xiàn)方式是為了最小化模型的復雜性和運行時間。然而,至關重要的是,改變動作選擇系統(tǒng)執(zhí)行的轉(zhuǎn)換,只改變了模型中信息流的控制方式——它并沒有改變所使用的表征的性質(zhì)、模型的結構,或者刺激被分類的整體過程。

7. 模擬實驗

7.1. 原型理論:實驗 1

我們模擬的第一個研究是 Posner 和 Keele(1968)對點模式分類的實驗 3。該實驗旨在探討受試者是否會在僅被訓練對由原型變形生成的模式進行分類時,抽象出有關類別原型的信息。在實驗的訓練階段,30 名受試者通過糾正性反饋被教導對一組 12 張幻燈片進行分類,每張幻燈片都描繪了一個在 30×30 矩陣內(nèi)獨特排列的九個點的圖案。這些幻燈片分為三個類別,每個類別中的四張幻燈片都是通過隨機變形一個單一的“原型”點圖案生成的,而這個原型點圖案并不存在于訓練集中。每個類別定義原型的四張訓練幻燈片是通過一個變形規(guī)則生成的,該規(guī)則規(guī)定了每個點從其起始位置移動的距離。當受試者能夠連續(xù)兩次無誤地對所有 12 張幻燈片進行分類時,訓練被認為完成。

在完成訓練階段后,32 名受試者進入轉(zhuǎn)移階段,被要求在沒有反饋的情況下對一組 24 張幻燈片進行分類。這些幻燈片包括來自訓練階段的六個舊模式(每個原型兩個)、使用訓練階段的變形規(guī)則生成的六個新模式(每個原型兩個)、使用較弱變形規(guī)則生成的六個新模式(每個原型兩個)、三個原型以及三個完全隨機的模式。轉(zhuǎn)移階段的結果表明,訓練模式和原型的分類效果最好且相當,而新的低水平變形模式和新的高水平變形模式的分類準確率則逐漸降低。

為了模擬這個實驗,我們首先假設所有的視覺刺激都被壓縮成語義指針,使用第 3 節(jié)中描述的神經(jīng)轉(zhuǎn)換。因此,點模式以神經(jīng)脈沖模式編碼的個體向量的形式呈現(xiàn)給模型。通過一種略微受限的隨機向量生成方式構建三個原型,以確保一定程度的相似性,然后將其歸一化為單位長度。所有向量均為 128 維。為了生成訓練刺激和轉(zhuǎn)移刺激,使用以下公式:

其中,k表示向量的維度, r 表示變形的程度,I 表示一個 k x k 的單位矩陣。用通俗的話說,刺激向量是通過將從標準差為 r 的正態(tài)分布中抽取的隨機數(shù)加到相關原型向量的每個元素上而構建的。 r 的值用于近似 Posner 和 Keele 對原型圖案施加的變形程度。需要注意的是,低變形規(guī)則和高變形規(guī)則是彼此的精確比例關系,因此一個 r 值就足以描述兩者。

為了運行實驗的試驗,創(chuàng)建了一個模型實例,該實例使用語義指針編碼了12個標記的訓練圖像(如公式(1)所示),并將它們直接輸入到工作記憶中。對應于任務上下文(例如,“Posner”)和測試刺激(例如,“AT1”——原型A,訓練項目1)的向量隨后依次輸入到視覺緩沖區(qū)。任務向量觸發(fā)一個動作,該動作更新工作記憶中的任務上下文表示,以指示應執(zhí)行感知評估;然后,該表示進一步觸發(fā)任務上下文表示的更新,這使得感知評估系統(tǒng)的輸出被路由到運動緩沖區(qū)。圖4詳細說明了實驗單次試驗的這一過程。每次試驗對應于450毫秒的模擬處理時間。

為了詳細復制Posner和Keele的實驗,我們使用32個隨機種子為每個32名實驗受試者生成模型的獨特實例。這些種子固定了模型中用于設置各種神經(jīng)元參數(shù)(例如,最大放電率、首選刺激向量等)的隨機數(shù)生成器,并允許在試驗中重新創(chuàng)建模型的相同實例。為了運行完整的實驗,每個模型實例都在獨立的試驗中對一組測試刺激進行測試。特定模型實例涉及的所有試驗中使用的測試刺激是相同的,總共進行了21×9×32=672次試驗。結果是通過統(tǒng)計模型在每個刺激類別中犯錯誤的比例,并將該比例平均到32個模型實例上獲得的。

在所有后續(xù)實驗中都使用了這種程序,并且在實驗中使用相同的模型實例,以確保所有結果嚴格是由于相關參數(shù)值的變化。

為了評估模型,我們在自由參數(shù)r和Posner及Keele報告的數(shù)據(jù)之間找到了最佳擬合。我們在r值從0.05到0.15的范圍內(nèi)進行了11次完整的實驗,圖6繪制了每個刺激條件下分類錯誤率與r的關系。這些結果表明,該模型在一系列刺激失真值范圍內(nèi)概括了Posner和Keele的發(fā)現(xiàn):分類準確性對于訓練模式和原型是最高的,并且隨著低水平和高水平失真模式的增加而逐漸降低。

打開網(wǎng)易新聞 查看精彩圖片

進一步檢查這些結果表明,r值為0.1時,模型結果與數(shù)據(jù)之間的均方根差最小?;诿總€刺激類別中正分類判斷和負分類判斷的百分比,分別計算了模型數(shù)據(jù)和人類數(shù)據(jù)的95%置信區(qū)間。

在總結這些結果時,有助于指出,模型在該實驗中的表現(xiàn)主要歸因于語義指針的數(shù)學結構以及它們的處理方式。具體來說,每個隨機生成的原型向量可以被視為128維空間中的一個點,每個刺激可以被視為另一個從原型隨機偏移一定量的點,該偏移量由r指定。隨著r的增加,這些偏移在低失真和高失真條件下都變得更大,某個刺激位于與錯誤原型(因此是錯誤類別標簽)更密切相關的空間區(qū)域的概率增加。因此,圖6中顯示的結果模式并不令人驚訝。

然而,該模型在訓練模式和原型模式上的表現(xiàn)優(yōu)于人類。以下兩點評論有助于澄清這種差異的意義。首先,每個刺激類別中平均錯誤率的差異大約為10%,這相當于在實驗中每兩名參與者中每個類別多出一個錯誤。鑒于每次實驗中對超過180個訓練刺激進行了分類,這種差異實際上相當小。其次,由于原型是隨機生成的單位向量,它們可能相當不相似,這降低了錯誤分類的可能性,因為與每個原型相關的刺激更有可能位于向量空間的不相交區(qū)域。強制規(guī)定原型之間的最小相似性值可以減少圖7中可觀察到的差異,但也會為模型增加一個額外的自由參數(shù)(我們在報告的結果中沒有明確設置這個參數(shù)——見腳注6)。根據(jù)這些因素調(diào)整模型可能會減少此處觀察到的性能差異。

打開網(wǎng)易新聞 查看精彩圖片

7.2. 范例理論:實驗2

盡管原型理論和范例理論傳統(tǒng)上被發(fā)展為對同一現(xiàn)象的相互競爭的解釋,但有許多實驗結果表明,范例表征在概念加工中發(fā)揮著獨特的作用(Murphy,2002)。為了說明這種效應,我們模擬了Regehr和Brooks(1993)設計的實驗(1C),該實驗旨在測試分析性特征匹配和更整體的刺激相似性測量在形成分類判斷中的相對重要性。在實驗過程中,32名受試者被訓練對虛構生物的繪畫進行分類。每種生物都具有一組獨特的特征集合,這些特征集合定義在五個二元維度上,并且根據(jù)這一特征集合屬于兩個類別之一。這兩個類別被稱為“建造者”類別和“挖掘者”類別。為了成為建造者,一種生物必須具備三個特定特征中的至少兩個。否則,這種生物就是挖掘者。在實驗中,對于每個受試者,以下四個規(guī)則中的一個用于指定哪些特征可用于識別建造者(第99頁):

1. 長腿、棱角分明的身體和斑點。

2. 短腿、長脖子和斑點。

3. 六條腿、棱角分明的身體和斑點。

4. 兩條腿、長脖子和斑點。

使用這些不同的規(guī)則旨在平衡特定特征維度在決定類別歸屬方面的相關性(然而,需要注意的是,斑點與無斑點的維度始終是相關的;Regehr & Brooks,1993,第99頁)。

重要的是,每個特征的感知特性可以在繪畫中有所不同。例如,“長脖子”特征在一幅繪畫中可能有各種彎曲,而在另一幅繪畫中則相對筆直。這些分析上相同的繪畫之間是否存在這類感知差異被用來定義兩個實驗條件。在“組合”條件下,分析上等價的特征在感知上也是等價的。在“個體化”條件下,分析上等價的特征在感知上是不同的。通過比較這兩個條件下的分類表現(xiàn),可以評估分析結構和感知相似性在形成分類決策中的相對重要性。

在實驗的訓練階段,32名受試者中的每一個都通過糾正性反饋被教導根據(jù)上述四個規(guī)則中的一個對一組八個圖形進行分類。一半的受試者被安排在組合條件下,另一半被安排在個體化條件下;每個條件都有自己的八張訓練繪畫。在遷移階段,受試者被要求在沒有反饋的情況下對總共16張繪畫進行分類,其中八張是訓練范例,另外八張是新的繪畫。所有新的繪畫都與訓練集中的一對“雙胞胎”配對,這對“雙胞胎”僅在一個維度上有所不同(即,斑點的存在與否;因此,雙胞胎在感知上相當相似)。屬于與其雙胞胎同一類別的新圖形被稱為“良好遷移”(GT)項目,而屬于與其雙胞胎相反類別的新圖形被稱為“不良遷移”(BT)項目。雙胞胎項目之間的感知相似性因此可以暗示正確或錯誤的分類決策:對于GT項目,感知相似性暗示正確的決策,而在BT項目的情況下,感知相似性暗示錯誤的決策。

實驗結果表明,在組合條件下,受試者在訓練、GT和BT項目上的分類錯誤率大致相同。然而,在個體化條件下,BT項目的錯誤率顯著更高。

為了模擬該實驗,我們使用了與原型模擬中相似的方法。我們假設刺激通過壓縮過程被轉(zhuǎn)換為語義指針,并且每個語義指針的結構符合以下數(shù)學描述:

打開網(wǎng)易新聞 查看精彩圖片

其中“DimensionF”和“ValueF”是隨機生成的向量,用于定義每個刺激分析結構的組成部分。例如,一個可能的維度-值對是“SPOTS(斑點)~ YES(有)”。為了增加特征的個體化,并近似“組合”和“個體化”實驗條件之間的差異,對每個特征值施加了可變幅度的高斯擾動。

其中,k 再次表示向量的維度,r表示高斯分布的標準差,I 表示一個k x k 的單位矩陣。

每個實驗試驗都采用與Posner和Keele模擬中相同的方法進行。一個語義指針對八個標記的訓練刺激進行編碼,并作為直接輸入提供給工作記憶,同時視覺緩沖區(qū)依次被提供任務向量和刺激向量。任務向量啟動了圖4中描述的相同動作序列,因此模型性能的變化僅是由于使用了不同的測試刺激和不同的語義指針。每次試驗再次對應于450毫秒的模擬處理時間,模型的分類判斷通過評估模型運動系統(tǒng)中的表征狀態(tài)來確定。

為了評估特征個體化對分類表現(xiàn)的影響,我們進行了15次實驗,使用r值從0.01到0.15生成的刺激。每次實驗涉及在前16個模型實例上測試16個刺激,總共進行了16×16=256次試驗。圖8繪制了每個刺激條件下分類錯誤率與r的關系。模型評估是通過將自由參數(shù)r擬合到Regehr和Brooks報告的數(shù)據(jù)來完成的。我們觀察到,在組合條件下,r值為0.02時,模型結果與數(shù)據(jù)之間的均方根差最小。同樣,在個體化條件下,r值為0.1時,模型結果與數(shù)據(jù)之間的均方根差最小。使用不同的r值來解釋不同的刺激條件是相當合理的,因為較低的r值對應于不同刺激上分析等價特征之間的相對較小差異,而較高的r值對應于這些特征之間的相對較大差異。圖9報告了組合條件和個體化條件下模型結果與實驗數(shù)據(jù)的直接比較。置信區(qū)間如之前所述進行計算。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

為了直觀地解釋這些結果,將每個刺激視為高維空間中的一個點是有用的。標記的訓練刺激定義了與兩個類別標簽之一相關聯(lián)的空間區(qū)域。當沒有特征個體化時,分析結構的差異是兩類刺激之間存在的唯一差異。這很重要,因為它意味著每個標記的訓練范例都表明某種特定的分析結構是屬于某一特定類別的診斷特征。當一個新刺激被映射到高維空間時,可以認為存儲在記憶中的每個訓練范例都會根據(jù)結構上的重疊點對新刺激的類別歸屬進行“投票”。例如,如果一個訓練范例具有“長脖子”特征,并且被標記為建造者,那么在測試刺激中出現(xiàn)這一特征將導致該訓練范例為將測試刺激歸類為建造者投出一票。所有這些投票的平衡決定了最終的分類判斷(由于在(6)中描述的刺激構建中使用的隨機生成向量不能保證正交,因此存在一些噪聲)??傮w而言,當沒有特征個體化時,每個記憶中的范例產(chǎn)生的投票僅對分析結構敏感,這意味著GT項目和BT項目之間分析結構的變化會導致測試刺激獲得每個類別的票數(shù)發(fā)生變化。這種對分析結構的敏感性解釋了為什么在低特征個體化條件下,模型不太容易出現(xiàn)BT錯誤——模型注意到了BT項目與其訓練配對之間的結構變化。

然而,隨著刺激物的個體化程度增加,每個訓練刺激所提供的投票對分析結構的敏感性卻降低了。要理解其中的原因,回想一下,特征個體化產(chǎn)生的是分析上等價但感知上不同的特征。這意味著,一個特定訓練樣本所提供的投票只適用于具有感知上相似特征的測試刺激,因為分析上等價的特征可能由于用于近似特征個體化的扭曲而被表示為高度不同的向量。在這種情況下,如果一個訓練樣本具有高度個體化的“長脖子”特征,那么該樣本并不會為“長脖子”這一特征在總體上提供支持票。它只對特定類型的長脖子提供支持票。這種行為導致在BT項目上的錯誤率增加,原因如下。在訓練集中與BT項目相對應的樣本在所有維度上都具有相同的特征,只有一個維度除外(有斑點與無斑點)。這意味著,隨著特征個體化程度的增加,訓練樣本為分類BT測試刺激提供了越來越多的相關投票。而由于訓練樣本與BT測試刺激屬于相反的類別,這些投票增加了分類錯誤的可能性。因此,當圖8中一系列實驗中r值增加時,模型在BT項目上的表現(xiàn)逐漸變差也就不足為奇了。

最后,值得一提的是,該模型在特征個體化程度最低的情況下對GT刺激的分類表現(xiàn)優(yōu)于人類。這可能是因為Regehr和Brooks的加性特征規(guī)則設計得使得GT項目偶爾(且唯一地)不具有任何表明其屬于相反類別的特征。具體來說,每條三特征規(guī)則可以將所有可能的特征劃分為三類:表明屬于建造者(Builder)的特征、表明屬于挖掘者(Digger)的特征以及診斷上中性的特征。大多數(shù)刺激在檢查后都具有一個表明其不屬于的類別的診斷性特征。然而,一半的GT項目卻不具有任何表明其不屬于的類別的診斷性特征(參見Regehr & Brooks, 1993, p. 102)。因此,這些GT項目更有可能位于與正確分類判斷相關聯(lián)的向量空間區(qū)域中。人們可能對這些刺激之間的細微差異并不敏感,尤其是考慮到Regehr和Brooks觀察到許多受試者報告說僅依賴一兩個特征來進行分類判斷。該模型沒有注意力機制,無法對特征賦予不同的優(yōu)先級,這可能是我們在GT條件下觀察到其表現(xiàn)更準確的潛在原因。再次強調(diào),根據(jù)這些因素調(diào)整模型可能會改善我們觀察到的模型與數(shù)據(jù)的擬合程度。

7.3 理論理論:實驗3

除了原型和范例觀點的持續(xù)發(fā)展外,概念的結構類似于它們所指代類別的直覺理論這一觀點,已經(jīng)成為一個越來越受歡迎的研究目標(Keil, 1989; Murphy & Medin, 1985; Rogers & McClelland, 2004)。推動這一發(fā)展的基本觀點是,個體擁有關于因果關系、本質(zhì)和本體論區(qū)別的信念,這些信念似乎影響了他們對概念的使用(Keil, 1989; Murphy & Medin, 1985; Prinz, 2002; Rogers & McClelland, 2004)。例如,BIRD(鳥)指代一個連貫的類別,并以這種方式對實體進行分組,是因為大多數(shù)鳥類共享的許多特征(如飛行、翅膀、羽毛和中空骨骼)通過一組或一組以上的解釋相互關聯(lián):鳥類能夠飛行是因為它們有翅膀、羽毛以及中空骨骼;鳥類飛行是因為這樣做有助于它們覓食和躲避天敵(Murphy, 2002; Rogers & McClelland, 2004)。在分類任務中,這種效應表現(xiàn)為受試者使用解釋性推理將對象與類別匹配。

為了對這種簡單效應進行解釋,我們模擬了Lin和Murphy(1997)的實驗2。在這個實驗中,兩組受試者被賦予了不同的人工類別的功能描述,然后被要求對相同的圖像集進行分類。結果顯示,受試者根據(jù)他們收到的類別描述,關注圖像的不同特征。因此,背景知識被證明對受試者在基于圖像的分類任務中的表現(xiàn)有影響。

在實驗的訓練階段,20名受試者被平均分為兩組(A組和B組)。每組都得到了一組三個訓練樣本的不同解釋性描述,每個樣本由四個不同的特征組成,涉及八個不同的類別。類別描述的設計使得每個訓練樣本所呈現(xiàn)的四個特征中,一個被描述為功能上至關重要的,兩個被描述為功能上可選的,一個被描述為功能上無關的。因此,以圖10中所示的樣本為例,A組的參與者得到了以下描述:

打開網(wǎng)易新聞 查看精彩圖片

昆因島的獵人使用圖克(tuk)來捕捉邦杜(Bondu),這是一種在昆因國人們喜歡食用的動物。要用圖克捕捉邦杜,抓住圖克的手柄(3)。一旦發(fā)現(xiàn)邦杜,將環(huán)(1)套在邦杜的脖子上,然后迅速拉動末端的繩子(4)以收緊環(huán)。手柄前面的蓋子(2)可以保護你的手免受動物的咬傷或抓傷。(第1156頁)

相比之下,B組的參與者得到了以下描述:

昆因島的人們使用圖克來噴灑殺蟲劑。三角形的瓶子(2)裝有殺蟲劑。當(3)被擰開時,殺蟲劑通過軟管(4)流出。環(huán)(1)用于將圖克掛在墻上。(第1156頁)

當一個受試者學會了所有八個類別的訓練樣本和類別描述后,受試者需要回憶每個類別的描述性信息,并回答關于如何最好地照顧每個類別中的物品的問題。在受試者無錯誤地完成這一回憶過程后,他們被允許進入實驗的遷移階段。

在遷移階段,每位受試者被要求盡可能快速且準確地對一組新的物品進行分類。首先,在計算機屏幕上顯示一個類別標簽(例如,“Tuk”)持續(xù)1秒,隨后出現(xiàn)一個圖像。然后,受試者需要做出“是”或“否”的判斷,之后進入下一個項目。重要的是,每次類別標簽出現(xiàn)后所呈現(xiàn)的圖像在與訓練階段提供的類別描述的一致性上有所不同。實驗使用了四種類型的圖像。第一種是“原型”圖像,它們包含了類別描述中提到的所有四個特征。第二種是“與A組一致”的圖像,這些圖像缺少一個對A組受試者來說是功能上可選的特征,但對于B組受試者來說是功能上至關重要的特征。第三種是“與B組一致”的圖像,這些圖像缺少一個對B組受試者來說是功能上可選的特征,但對于A組受試者來說是功能上至關重要的特征。最后一種是“對照”圖像,這些圖像缺少對A組和B組受試者來說都是功能上至關重要的特征。

20名受試者每人對所有八個類別的每種圖像類型的三個圖像進行了測試。圖像以隨機順序呈現(xiàn),每位受試者總共進行了96次試驗(即3×4×8)。Lin和Murphy的研究結果表明,原型圖像引發(fā)了非常高比例的肯定判斷,而與給定受試者的類別知識一致和不一致的圖像引發(fā)的肯定判斷逐漸減少。對照圖像引發(fā)的肯定判斷非常少。

為了模擬這個實驗,我們假設每個模擬參與者已經(jīng)學習了一個語義指針,該指針將類別描述編碼為一組簡單規(guī)則。這些規(guī)則的作用是確定某個特定特征是否對屬于正在考慮的類別很重要。例如,A組參與者可能學到的一條規(guī)則是“如果這個物品是圖克(Tuk),那么它應該有一個環(huán)(loop)”。這些規(guī)則的語義指針按照(2)的結構如下:

打開網(wǎng)易新聞 查看精彩圖片

為了運行一個完整的實驗,我們創(chuàng)建了20個模型實例,并在相同的刺激集上測試每個實例。為了提高運行時間,我們只在每個類別中測試每個模型實例對每種遷移類型的刺激,總共進行次試驗。每次試驗中的刺激向量是通過將考慮中的刺激類型中存在的每個特征對應的向量相加生成的。例如,屬于圖克(Tuk)類別的一個一致的刺激將被編碼為:

其中 分別對應于圖克(Tuk)類別描述中提到的環(huán)(loop)、護手(guard)、手柄(handle)和繩子(string)。實驗中使用的八個不同類別中,每個類別的特征對應的向量都是隨機生成的。

圖11報告了這個實驗的結果,表明模型的表現(xiàn)與Lin和Murphy(1997)中報告的人類表現(xiàn)相當接近。

打開網(wǎng)易新聞 查看精彩圖片

總體而言,這些結果表明,該模型能夠逐步應用編碼在一組規(guī)則中的知識以執(zhí)行基于規(guī)則的刺激分類。當一個刺激符合這些規(guī)則時,模型非常有可能判斷該刺激屬于正在考慮的類別。當一個刺激在較小程度上符合這些規(guī)則時,模型判斷該刺激屬于正在考慮的類別的可能性就會降低。因此,該模型對給定刺激與編碼在一組規(guī)則中的簡單知識庫的一致性具有適當?shù)拿舾行?。我們認為這些結果是模型在分類過程中解釋簡單基于規(guī)則的知識效應能力的一個非常初步的證明。關于知識基礎概念處理的可能擴展和改進的討論在下一節(jié)中呈現(xiàn)。

7.4 模型總結

我們提供了一個統(tǒng)一的過程模型,并將其應用于涵蓋三種不同概念理論的三個實驗結果。一些評論可以幫助澄清我們認為這些模擬的意義所在。

首先,它們表明語義指針可以以定性上不同的方式被操作和解壓縮。在一個感知任務中,語義指針被用于將刺激與類別標簽在一次性的過程中匹配,這本質(zhì)上是一種模式識別。相比之下,在一個推理任務中,語義指針被用于促進一系列計算,以逐步、基于規(guī)則的方式分析刺激。

其次,這些模擬概括了我們在模擬的研究中報告的實證發(fā)現(xiàn)。通過改變單一參數(shù) r ,我們能夠復制這些研究中報告的感知分類模式,涵蓋一系列新的刺激。因此,該模型可以用來生成關于人類行為的新預測。

第三,在每次實驗試驗中,單個語義指針被用于編碼所有到達分類判斷所需的類別信息。該模型因此展示了語義指針如何為研究概念現(xiàn)象提供一個統(tǒng)一的框架。

對我們模型的一個潛在批評是,它未能真正解釋知識基礎方法旨在處理的概念現(xiàn)象類型。這些方法強調(diào)因果和解釋性推理在分類中的作用,而我們在實驗3中應用的規(guī)則本質(zhì)上執(zhí)行的是加權特征比較,因此似乎不太可能有任何這樣的推理發(fā)生。然而,規(guī)則足以以推理的形式提供解釋,并且當它們與感知-運動操作相關聯(lián)時,可以表達因果規(guī)律(Thagard,2012)。要解釋這一點,在任何適當?shù)耐评砝斫庵校评砜梢员幻枋鰹樾睦頎顟B(tài)之間的轉(zhuǎn)換。這種轉(zhuǎn)換可以自然地以規(guī)則或動作的形式捕捉,復雜的推理形式涉及復雜的規(guī)則和動作,而簡單的推理形式涉及簡單的規(guī)則和動作。在這種理解下,很明顯,我們的模型正在執(zhí)行一種簡單的推理。因此,真正的問題是模型所展示的效應的程度,而不是種類。如果承認模型在種類上捕捉了知識效應,那么這種批評就失去了大部分力量。

此外,特征比較與基于規(guī)則的分類的存在并不矛盾。例如,考慮Rips(1989)的經(jīng)典研究,其中參與者被要求判斷一個直徑為3英寸的物體更有可能是披薩還是硬幣。由于硬幣的直徑是固定的,受訪者通常會回答該物體更有可能是披薩,即使它與硬幣更相似。這一結果通常被認為表明存在可以覆蓋更典型相似性評估過程的基于規(guī)則的分類過程。然而,需要注意的是,關于硬幣的相關背景知識只能通過特征比較來應用:必須評估刺激物體的直徑,并將其與已知的硬幣直徑進行比較。因此,完全有可能用我們的模型來解釋這種效應。關于硬幣的一組軟規(guī)則可以按照公式(2)編碼到語義指針中,其中一條規(guī)則可以非常強烈地懲罰任何足夠大直徑的刺激的連貫性得分。當然,解釋更復雜的效果是未來工作的一個重要目標,但鑒于已經(jīng)使用語義指針實現(xiàn)了復雜推理任務(如漢諾塔謎題)的模型(Stewart & Eliasmith,2011),我們聲稱提供了一個處理知識效應的良好起點是合理的。

對我們模型的另一個潛在批評是,它所提供的所有解釋性洞見都歸因于語義指針的數(shù)學結構。雖然可以使用抽象于神經(jīng)實現(xiàn)的基于向量的模型獲得良好的分類性能(例如,Knapp & Anderson,1984),但這些模型并未描述我們模擬中存在的那種時間動態(tài)。這些動態(tài)可以用來對(a)不同任務之間的反應時間差異和(b)任務執(zhí)行期間神經(jīng)活動的時間和解剖定位進行大致預測。例如,我們的模型預測,在執(zhí)行實驗3中的任務時,與執(zhí)行實驗1或2中的任務相比,基底神經(jīng)節(jié)和丘腦中的神經(jīng)活動會更多,因為執(zhí)行了更多的動作。同樣,模型預測在實驗3中,運動系統(tǒng)活動的增加應該比實驗1或2更晚發(fā)生,因為由任務向量啟動的較長動作序列導致執(zhí)行運動路由的動作被延遲。一般來說,該模型預測涉及對語義指針進行更多操作的任務比涉及較少操作的任務需要更長時間,其他條件相同的情況下。

最后的一個問題是,該模型目前預測在涉及相同實驗任務的不同條件之間沒有反應時間(RTs)的差異。例如,在實驗3中,模型生成分類判斷所需的時間并不取決于正在分類的刺激類型(即,原型和對照刺激的分類時間大致相同)。這種行為與Lin和Murphy(第1160頁)的觀察結果相沖突,他們發(fā)現(xiàn)與不符合類別描述的刺激相比,符合類別描述的刺激的反應時間更快。然而,重要的是要注意,這些RT差異可能是由于我們沒有明確模擬的因素造成的。例如,可能的情況是,編碼在語義指針中的規(guī)則的應用也會導致引發(fā)特定運動行為的過程。在我們的模型中,原型刺激往往比其他刺激更快地達到高于閾值的連貫性得分,盡管反映這一點的分類判斷直到從存儲在記憶中的語義指針中解碼出所有四條規(guī)則后才會通過運動緩沖區(qū)傳遞。如果運動啟動與連貫性得分的值成比例發(fā)生,那么也許可以解釋這些RT差異。還值得注意的是,在Regehr和Brook的結果中,在實驗1C中沒有觀察到不同刺激條件之間的顯著RT差異(見第100頁)??傮w而言,盡管在單一任務中解釋不同條件之間的差異在我們的建模框架內(nèi)仍有待進一步探索,但該框架目前確實對不同任務中神經(jīng)活動的時間和解剖定位做出了有趣的預測。我們認為后一點是我們的建??蚣芩峁┑闹饕匆?,并認識到在該框架內(nèi)進一步研究反應時間數(shù)據(jù)的必要性。

8. 總體討論

值得反思語義指針框架的一些更一般的屬性。如前所述,該框架提供了一種相對直接的策略,用于解釋各種概念功能。這種策略的第一步是假設某個感興趣現(xiàn)象背后的語義指針的結構。下一步是假設一組機制,這些機制操縱、壓縮和解壓縮這些語義指針以產(chǎn)生該現(xiàn)象。最近的研究表明,這種策略可以用來激勵一種新的認知架構(Eliasmith, 2013)。最近的文章還使用語義指針來解釋啟動效應、意圖、情感、創(chuàng)造力和意識(Schr?der & Thagard, 2013; Schr?der, Stewart, & Thagard, 2014; Thagard & Schr?der, 2014; Thagard & Stewart, 2011; Thagard & Stewart, 2014)。

與這種廣泛的應用一致,語義指針框架合理地滿足了我們對概念理論的五個標準。在分類方面,我們能夠用我們的模型解釋一系列重要的實驗結果,并推導出相關結果的預測。此外,我們的模型所執(zhí)行的推理和感知評估表明,它有能力以統(tǒng)一的方式解釋涉及規(guī)則和記憶的分類行為(參見Sloman, 1996; Smith, Patalano, & Jonides, 1998)。還可以擴展到涉及更多分類現(xiàn)象的情況。例如,Eliasmith(2013)描述了使用語義指針對手寫數(shù)字圖像進行分類的模擬,其準確率達到了人類水平。同樣,Hunsberger, Blouw, Bergstra和Eliasmith(2013)在實驗1和2中描述的任務中實現(xiàn)了人類水平的分類表現(xiàn),同時使用了一個層次化的視覺網(wǎng)絡,該網(wǎng)絡以刺激的原始圖像作為輸入。

為了實現(xiàn)遞歸綁定,我們使用卷積來定義如公式(1)和(2)中描述的表示方案中的那種結構豐富的語義指針。這些方案也可以修改以解釋簡單自然語言表達式的形成。例如,Eliasmith(2013)證明,可以使用語義指針對簡單句子進行編碼,這些指針將單詞的表征與其所占據(jù)的語法角色的表征綁定在一起,Stewart, Choo和Eliasmith(2014)提出了使用這種相同架構解析簡單自然語言句子的方法。研究語義指針在自然語言處理任務中的應用是一個重要的進一步研究課題。

通過使用LIF(漏電積分-發(fā)放)神經(jīng)元以及基底神經(jīng)節(jié)、丘腦和皮層等解剖區(qū)域之間生物學上合理的連接模式,滿足了神經(jīng)實現(xiàn)標準。此外,由于感知和推理處理是在模型的不同子系統(tǒng)中完成的,該模型與表明抽象和具體概念在不同神經(jīng)系統(tǒng)中被處理的證據(jù)一致(Shallice & Cooper, 2013)。盡管如此,我們神經(jīng)實現(xiàn)的某些方面仍需進一步研究。例如,目前沒有直接證據(jù)表明大腦在概念處理過程中使用了卷積操作。但由于假設這種操作帶來了眾多的解釋優(yōu)勢,我們認為這是一個合理的假設。

在范圍方面,我們模型中使用的不同語義指針編碼了不同種類的表征,將這些差異推廣以解釋高度復雜和抽象的概念是相當直接的。例如,Eliasmith(2013)描述了操縱語義指針的技術,這些指針包括從成年人詞匯量中提取的數(shù)百個綁定元素,同時仍然符合已知的解剖學約束。類似地,Crawford, Gingerich和Eliasmith(2013)展示了使用語義指針對整個WordNet圖進行可擴展編碼的方法。

關于表征內(nèi)容,還需要多說一些。先前的研究表明,NEF(神經(jīng)工程框架)與所謂的語義兩因素理論兼容(Eliasmith, 2000, 2003)。兩因素理論從外部原因(例如,驅(qū)動神經(jīng)元群體活動的刺激)和計算角色(例如,神經(jīng)群體對其他群體產(chǎn)生的后續(xù)影響)兩個方面描述心理表征的內(nèi)容。因此,以一個神經(jīng)群體表征聽覺圖像為例,刺激被編碼為神經(jīng)脈沖,這指定了因果因素,而脈沖的解碼(以恢復傳遞給其他神經(jīng)元的信號)則指定了計算因素。這兩個因素共同定義了表征的內(nèi)容,并大致指定了它的外延和內(nèi)涵。對于通過壓縮眾多表征構建的語義指針,相關的因素將由其他神經(jīng)群體中的脈沖模式來支撐。這些群體中的活動可能反過來更直接地受到感知刺激的驅(qū)動,這將因果地貢獻于構建的語義指針的內(nèi)容。當然,理論細節(jié)需要進一步完善,但追蹤神經(jīng)活動模式之間的功能關系的一般策略為識別任意復雜語義指針的內(nèi)容提供了一種合理的方法。

總體而言,盡管仍有許多工作要做,以擴展語義指針框架以解釋更復雜的概念現(xiàn)象,但它比現(xiàn)有方法有明顯的優(yōu)勢。首先,其神經(jīng)計算的詳細程度超過了大多數(shù)(如果不是全部的話)其他解釋。其次,它為一系列分類現(xiàn)象提供了一種合理的統(tǒng)一解釋。第三,它對概念綁定和自然語言表達式形成提供了機械性的描述。在更哲學的層面上,語義指針框架有工具來解釋不同種類的概念以及概念的語義內(nèi)容。在心理學文獻中,語義和范圍的討論常常被忽視或擱置,而哲學家(盡管有少數(shù)例外,如Prinz, 2002)對概念處理的實證研究關注相對較少。最后,我們認為該框架的主要貢獻在于,它提供了一種通用的表征方案和生物學上合理的機制,可以用這些機制來實現(xiàn)通常被認為在本質(zhì)上根本不同的概念功能(例如,Machery, 2009)。我們在這里建模的現(xiàn)象范圍顯然有其局限性,但應該清楚的是,語義指針提供了一種單一的表征格式,能夠描述所有主要類型的概念處理。將這種表征格式應用于更廣泛的現(xiàn)象是未來工作的一個重要方向。

9. 結論

回到我們的引言部分,我們認為語義指針為當前概念研究中所面臨的問題提供了一個有希望的解決方案。由于該框架不需要依賴多個共指代的表征結構來解釋類別知識,因此避免了多元論的問題。在我們所有的模擬中,一個語義指針(加上用于解壓縮等的處理機制)就足以解釋使用概念進行分類所涉及的所有認知過程。由于一個單一的語義指針能夠以這種方式全面支持概念處理,因此聲稱“概念”這一術語指代一組不相關的表征和過程是沒有意義的。我們建議,如果我們的方法具有任何說服力,那么概念將會長期存在。

注釋

1. 專注于分類模擬還有三個其他原因。首先,篇幅限制使得一篇文章無法對眾多概念現(xiàn)象進行建模。其次,分類是一個典型的概念任務,因此吸引了來自不同學科背景的廣泛研究者的興趣。第三,大多數(shù)現(xiàn)有的概念實證研究都集中在分類研究上,因此我們有豐富的數(shù)據(jù)可以與我們的結果進行比較。對于那些研究興趣有限的任務,模型與數(shù)據(jù)的比較是不可行的。

2. 神經(jīng)工程框架(NEF)從兩個方面定義心理表征:一是將刺激編碼為神經(jīng)脈沖模式,二是將脈沖序列解碼為它們所代表的物理變量(Eliasmith, 2003)。舉一個非常簡單的例子,腦干中的兩個區(qū)域——舌下前核(NPH)和腹內(nèi)側前庭核(VN)——包含具有調(diào)諧曲線的神經(jīng)元,這些曲線描繪了水平眼位與脈沖活動之間的關系(Eliasmith & Anderson, 2003, 第44—49頁)。因此,NPH和VN中的神經(jīng)元共同“編碼”了眼位的測量值為神經(jīng)脈沖模式。解碼過程涉及為每個神經(jīng)元的反應分配一個最優(yōu)權重(根據(jù)解碼表征的維度,可以是一個標量或向量),并對相關群體和時間內(nèi)的所有加權反應進行求和。在NPH和VN中,這個求和結果是對眼睛位置的估計。關于這些編碼和解碼關系的更詳細數(shù)學定義,請參閱補充材料的A部分。

3. 還值得注意的是,這種單一的綁定網(wǎng)絡可以計算任意兩個輸入向量的循環(huán)卷積,而NEF具備資源,可以通過使用生物學上合理的赫布學習規(guī)則來解釋如何學習實現(xiàn)這種綁定網(wǎng)絡的權重(Stewart, Bekolay, & Eliasmith, 2011)。

4. 獲得向量的偽逆是一個簡單的線性變換,因此可以在神經(jīng)群體之間的連接上計算。將語義指針與向量的偽逆進行卷積,可以提取語義指針中綁定到該向量的任何項目的近似值。

5. 具體來說,第一個原型的向量是隨機生成的,而第二個和第三個原型的向量是隨機生成向量與第一個向量的和。

6. 在Posner和Keele(1968)的論文中,訓練和高失真刺激是通過7.7比特失真規(guī)則生成的,而低失真模式是通過5比特失真規(guī)則生成的。由于失真值是彼此的倍數(shù),我們使用“基礎失真水平”等于sigma來擬合模型,并使用標準差為7.7/5倍sigma的值來生成訓練和高條件下的刺激模式。

7. 為了減少模型的運行時間,沒有進行涉及完全隨機刺激的試驗,因為這些刺激沒有正確性的衡量標準。

8. 完整的特征維度和值如下:身體(角形或圓形);腿部(長或短);腿的數(shù)量(2條或6條);斑點(有或無);脖子(長或短)。

9. 這里還需要進一步說明的一點是,區(qū)分概念獲取和概念使用是很重要的。在Lin和Murphy的實驗中,是在概念獲取過程中,利用關于環(huán)的收縮與殺死邦杜之間因果關系的知識,來優(yōu)先考慮圖克(Tuk)上環(huán)的存在。在使用概念進行分類時,這些因果關系不需要直接考慮。由于我們并不打算對概念獲取進行全面解釋,因此在我們的模型中省略這些因果推理是合理的。

10. 我們選擇450毫秒的模擬窗口并沒有特別的意義,只是這個窗口為所有三種分類任務的完成提供了足夠的時間,同時最小化了總的模擬時間。此外,我們的研究中并沒有隱含反應時間應該在450毫秒左右的預測,因為模型排除了大量的感知和運動處理過程,這些過程需要納入對反應時間的精確估計中。

11. 這是一個過度簡化的說法。為了避免因誤表征而產(chǎn)生的問題,使用各種神經(jīng)活動觸發(fā)因素之間的統(tǒng)計依賴性來指定相關的因果因素。詳情請參閱Eliasmith(2000)。

原文鏈接: https://onlinelibrary.wiley.com/doi/pdfdirect/10.1111/cogs.12265