Analogy as a search procedure: a dimensional view

類比作為一種搜索過程:維度視角

https://www.tandfonline.com/doi/epdf/10.1080/0952813X.2022.2125081?needAccess=true

后續(xù)工作:

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

摘要

在本文中,我們基于概念空間理論,概述了一種綜合性的復(fù)合類比方法。我們的算法模型將類比視為一種搜索程序,并基于類比相似性依賴于一種稱為“維度顯著性”的概念現(xiàn)象這一觀點。我們區(qū)分了基于類別的類比、基于屬性的類比、基于事件的類比和基于部分 - 整體的類比,并提出了用以在概念空間中明確表達它們的計算導(dǎo)向方法。

關(guān)鍵詞 : 類比;分類;概念空間;搜索問題;相似性

引言

類比是一種認知機制,它強調(diào)在本質(zhì)上不同的對象或情境之間的相似性關(guān)系。例如,動脈可以與高速公路形成類比關(guān)系,因為它們共享一個顯著的特征(運輸功能),盡管在許多方面存在差異。同樣地,一位母親哺乳嬰兒和一只鳥喂養(yǎng)雛鳥是類比事件,即使涉及的個體和過程都截然不同。

類比陳述的語義非常獨特。與傳達關(guān)于世界狀態(tài)信息的事實性陳述不同,類比似乎具有主要的認識論目標:它們通過指出看似遙遠的知識領(lǐng)域之間的相似性關(guān)系,豐富并結(jié)構(gòu)化我們的概念知識,從而在抽象類別形成中發(fā)揮組織作用(參見 Gentner & Hoyos, 2017)。

認知科學領(lǐng)域的大量研究支持了這一觀點。研究表明,類比機制在語言習得(如 Behrens, 2017)、類別學習(如 Gentner & Hoyos, 2017;Tomlinson & Love, 2006)、教學(如 Vosniadou, 1995)、科學推理與發(fā)現(xiàn)(如 Gentner, 2002;Oppenheimer, 1956)以及人工智能(如 Barbot 等, 2019;Jani & Levine, 2000;Mitchell, 2021)中發(fā)揮了關(guān)鍵作用。

在過去的幾十年里,兩種不同類型的類比結(jié)構(gòu)吸引了主要關(guān)注:直接類比和組合類比。前者將一個單獨的源與一個單獨的目標進行比較,就像上面給出的例子一樣。而組合類比則根據(jù)每對對象之間某些顯著的關(guān)系來比較兩對對象。例如,句子“腳對于腿,正如手對于臂”是一個組合類比,因為腳與腿之間的顯著(部分-整體)關(guān)系與手與臂之間的(部分-整體)關(guān)系是對稱的。在認知科學中,大多數(shù)研究集中于直接類比。然而,在本文中,我們關(guān)注的是組合類比。我們將使用符號“A : B : C : D”表示一個組合類比,其中 A : B 被用來與 C : D 進行比較。

我們的主要目標是展示概念空間理論(G?rdenfors, 2000, p. 2014)可以為人類如何判斷組合類比提供一個解釋框架?;谝环N早期被稱為“平行四邊形模型”的幾何類比推理模型(Rumelhart & Abrahamson, 1973),我們將證明,組合類比可以通過對涉及類比元素的顯著維度上的相似性關(guān)系進行分析。

我們的方法基于一種新穎的方式來理解類比,將其視為具有以下一般結(jié)構(gòu)的搜索問題:

- 搜索空間:詞匯表 L 中的一組概念;

- 初始狀態(tài):A : B : C : X(X 未知);

- 目標條件:在 L 中找到至少一個元素 X,使得 A : B 中的語義關(guān)系在 C : X 中得以復(fù)制;

- 搜索算法:在分析初始狀態(tài)中的語義關(guān)系種類后定義;

- 最終狀態(tài):滿足目標條件的一個概念(或概念的偏好順序)。

解決類比 A : B : C : X 的過程包括以下步驟:

(1) 識別 A : B 中的語義關(guān)系,并根據(jù) C 限制搜索空間。

正如我們將在下文中展示的,語義關(guān)系可以是多種類型。我們將考慮:

(i) 分類(“維度”)關(guān)系(例如,金槍魚 : 鯊魚 或 熱 : 冷),

(ii) 屬性-類別關(guān)系(例如,黃色 : 檸檬),

(iii) 基于事件的關(guān)系(例如,開門 : 關(guān)門),

(iv) 部分-整體關(guān)系(例如,腳 : 腿)。

第 1 步將告訴我們應(yīng)該尋找什么以及在哪里尋找。例如,類比紅色 : 蘋果 : 黃色 : X 是關(guān)于水果類別和顏色維度中的一種典型屬性。X 的搜索空間將是水果的概念空間,而目標條件將由那些以黃色為典型屬性的水果類別滿足。

(2) 指定搜索算法。

在本文中,我們提出了四種針對不同語義關(guān)系的搜索算法。這些關(guān)系的種類將定義算法運行的相似性空間。

(3) 應(yīng)用搜索算法以識別滿足目標條件的一個或多個類別。

下一節(jié)將根據(jù)認知科學中的已有思想討論類比關(guān)系的一些理論方面。在第 3 節(jié)中,我們將介紹概念空間理論。在第 4 節(jié)中,我們轉(zhuǎn)向類似狗 : 狼 : 貓 : 美洲獅的基于類別的類比,并引入平行四邊形模型作為搜索算法的基礎(chǔ)。顧名思義,這種類比基于類別之間的比較。第 5 節(jié)專門討論基于屬性的類比,例如紅色 : 蘋果 : 黃色 : 香蕉;我們提出了一種典型性標準用于搜索過程。對于這些類比,一個類別與一種特征屬性進行比較。在第 6 節(jié)中,我們轉(zhuǎn)向基于事件的類比,以馬 : 飛奔 : 人 : 跑步為例。對于這種類型,力向量和結(jié)果向量將是核心內(nèi)容。最后一種類比是部分-整體類比,形式如手 : 臂 : 腳 : 腿。我們在第 7 節(jié)中論證,這種部分-整體(meronomic)關(guān)系也可以通過概念空間來建模。本文的重點是模擬人類推理,但我們提出的模型可以通過我們確定的搜索算法應(yīng)用于人工智能系統(tǒng)。正如我們將針對所有四種類型的類比所展示的,使用概念空間作為模型的基礎(chǔ)為新的計算實現(xiàn)開辟了可能性。

相似性及其問題

人們普遍認為,相似性是類比過程背后的基本關(guān)系(參見 Cummings, 2020;Gentner & Markman, 1997;Holyoak, 2012)。然而,相似性是一個存在問題的概念(參見 Goodman, 1972;Smith, 1989;Tversky, 1977),其許多令人困惑的特性滲透到了對類比的研究中。以句子“鯨魚像鯊魚”為例。如果比較基于感知相似性,這句話可能是正確的;但如果關(guān)注生物學和分類學特征,它則是錯誤的??傮w而言,相似性判斷需要額外的信息來明確所比較的事物在哪些方面相似。

當我們觀察類比時,這一點變得尤為明顯,因為它們的目標是突出那些在豐富差異背景下的相似性關(guān)系。例如,考慮以下句子:(i) “豹像獵豹”和(ii) “跑車像獵豹”。(i) 表達了一種直接的“表面”相似性,而(ii) 表達了一種類比關(guān)系,其中類別之間的相似性被歸結(jié)為一個顯著的共同特征:速度。將(ii) 解釋為有意義的陳述依賴于主體的語義知識以及其把握非字面相似性關(guān)系的能力(例如 Gentner et al., 1995;Ortony, 1979)。這表明,類比理論需要對過程中所基于的相似性關(guān)系類型進行具體說明。

關(guān)于類比相似性的最具影響力的理論是結(jié)構(gòu)對齊觀(SAV tructural alignment view),由Gentner及其同事提出(參見 Gentner & Holyoak, 1997;Gentner, 1983;Markman & Gentner, 2000)。根據(jù)SAV,類比依賴于兩個表征結(jié)構(gòu)之間的映射,這些結(jié)構(gòu)由對象、屬性(一元謂詞)和高階關(guān)系組成。映射返回一組共性(結(jié)構(gòu)之間共享的特征或?qū)ο螅?、一組可對齊的差異(原則上不同的但仍然可以對應(yīng)的一對特征或?qū)ο螅约耙唤M不可對齊的差異(未能映射的某些結(jié)構(gòu)的元素,因為它們不屬于前兩類中的任何一類)。該理論的關(guān)鍵在于,可對齊的差異比不可對齊的差異更為顯著(Gentner & Markman, 1997,第50頁)。

SAV的一個核心思想是,類比相似性主要是關(guān)系型的,也就是說,它更關(guān)注高階關(guān)系的映射,而不是對象或?qū)傩云ヅ洌▍⒁?Gentner et al., 1995)。Gentner及其他一些作者甚至斷言,我們在類比中處理關(guān)系謂詞的能力是區(qū)分人類與非人類認知的關(guān)鍵所在(Gentner, 2003)。為了說明這一觀點,請考慮圖1中描繪的場景。

打開網(wǎng)易新聞 查看精彩圖片

在對象/屬性層面,圖像b和c高度相似:它們有許多共同屬性,且只有一個可對齊的差異:對象的空間配置。另一方面,a和b有許多可對齊的差異,例如每個映射對象的形狀和顏色,但也有一項重要的共性:一種類似的結(jié)構(gòu)關(guān)系(較短對象位于較高對象的左側(cè))。這最后的共性使a和b成為類比物,而b和c僅共享一種字面相似性關(guān)系。

上述例子展示了類比相似性是一種特殊類型,無法通過將相似性直觀理解為共享與非共享特征之間的正差異函數(shù)來捕捉(參見 Goldstone et al., 1991)。SAV成功地證明了這一點,并推進了一種更豐富的相似性概念,能夠區(qū)分不同類型的差異。然而,這種方法也存在一些問題。首先,SAV并未建立在任何特定的概念結(jié)構(gòu)理論上。

正如在大多數(shù)計算機科學領(lǐng)域中的情況一樣,SAV從命題的角度分析類比表征,其中謂詞僅根據(jù)其元數(shù)(arity)加以區(qū)分。從這一角度來看,形容詞和名詞被視為同一種類型的術(shù)語,但從認知角度來看,它們顯然扮演著不同的概念角色(G?rdenfors, 2000, p. 2014)。這種差異在類比中很容易被發(fā)現(xiàn)。例如,考慮“紅色之于蘋果正如黃色之于檸檬”和“狗之于狼正如貓之于猞猁”。前者將兩個對象類別(蘋果和檸檬)與其兩種典型屬性聯(lián)系起來,因此該類比建立在這些類別的內(nèi)部結(jié)構(gòu)之上。而后者則在同一概念層面上比較了四個對象類別,這些類別共享一個共同的直接上位類別。正如我們將在后文展示的那樣,如果我們基于概念結(jié)構(gòu)理論而非命題形式理論來構(gòu)建類比理論,這種差異可以輕松解釋。

其次,雖然關(guān)系謂詞確實在類比中扮演核心角色,但并不清楚是否可以將類比相似性完全歸結(jié)為關(guān)系相似性。像“跑車像獵豹”這樣的類比并非基于任何關(guān)系概念,而是基于共享維度的顯著性。此外,大多數(shù)關(guān)系謂詞可以從單一維度的角度進行分析。例如,像“更高(x, y)”或“更年輕(x, y)”這樣的比較形容詞表達了對象之間在某一共享維度上的差異(在這些例子中是高度和年齡維度)。然而,使用這些謂詞的類比的核心因素并不是關(guān)系的結(jié)構(gòu),而是我們對它們所比較的維度的知識。

第三,關(guān)系相似性的計算實現(xiàn)難以以系統(tǒng)化的方式構(gòu)建。通過使用概念空間中的距離函數(shù)(如本文提出的各種類型類比的標準中所使用的),可以開啟新的實現(xiàn)形式。我們通過描述不同的搜索程序展示了如何做到這一點。這對于旨在模仿人類推理的人工智能系統(tǒng)尤為重要,因為類比在其中扮演著如此核心的角色。此外,我們的分析將表明,不僅需要一種,而是需要多種計算方法來處理不同類型的類比。

維度顯著性

這里提出的方法基于上述最后兩個觀察結(jié)果。首先,我們主張復(fù)合類比需要在概念結(jié)構(gòu)理論的框架下進行分析。其次,我們提出在大多數(shù)情況下,類比相似性依賴于維度顯著性,更準確地說,是通過識別一個或多個將作為類比中類別比較框架的維度。這些維度對給定類別的顯著性程度與類比的“質(zhì)量”或“恰當性”相關(guān)。最后一個觀點相當直接??紤]以下類比:

打開網(wǎng)易新聞 查看精彩圖片

每個類比都包括將第一對類別中的顯著語義關(guān)系投射到第二對類別中。這種關(guān)系取決于識別出可以充當“類比例子因素”的一個或多個類別維度。在(1)中,類比例子因素是年齡維度;在(2)中是味道;在(3)中是大小和兇猛程度;在(4)中是溫度維度。類比例子因素通常是差異化的:它選擇了一個維度,在該維度上,第一對類別的值具有顯著差異。

在評估類比關(guān)系時的一個挑戰(zhàn)是,從構(gòu)成相關(guān)類別的眾多維度中,識別出哪些維度能夠更好地承載類比關(guān)系。例如,在(3)中,大小可能是作為類比例子因素的良好候選者,但顏色顯然不是。在我們的方法中,優(yōu)先被視為潛在類比例子因素的維度是第一對類別中最顯著的維度。這種顯著性因素在基于命題的計算實現(xiàn)中很難建模。

這一方法的一個直接預(yù)測是,類比的心理處理速度將與類比例子因素的顯著程度呈正相關(guān),并與可能被視為潛在類比例子因素的維度數(shù)量呈負相關(guān)。例如,(4)是一個簡單的類比,因為只有一個維度將其四個類別聯(lián)系起來;而(3)則提供了多個可能的維度作為潛在類比例子因素,因此其類比復(fù)雜性更高。

盡管經(jīng)典方法傾向于尋找高度通用的類比模型(如 Gentner, 1983; Holyoak & Thagard, 1989),我們的觀點偏離了“類比是概念特定的”這一思想。換句話說,類比利用了與其中出現(xiàn)的詞類相關(guān)的表征結(jié)構(gòu)的屬性。由于不同的詞類代表了不同種類的概念(見 G?rdenfors, 2014),我們需要一種整合不同子模型的理論。在本文的其余部分,我們提出了幾個可能的模型,這些模型可被解釋為搜索算法。與邏輯學和計算機科學中所有謂詞均同等對待的傳統(tǒng)方法不同,我們旨在表明,根據(jù)它們的不同概念角色進行劃分,會產(chǎn)生更富有成果的計算系統(tǒng),并表現(xiàn)為不同的搜索程序。

概念空間

概念空間(CS)是一種理論框架,通過幾何和拓撲關(guān)系來表示概念(參見 G?rdenfors, 2000, p. 2014)。CS 假設(shè)概念具有一個內(nèi)部結(jié)構(gòu),該結(jié)構(gòu)基于質(zhì)量維度和領(lǐng)域。許多質(zhì)量維度是感知刺激的基本特征。例如,聲音被感知為具有三個維度:響度、音高和音色;這些維度中的每一個都可以獨立用作比較不同聲音的框架,但它們在每個單獨的刺激中是完全整合的(我們無法感知缺乏這些維度之一的聲音)。在這種情況下,我們稱這些維度為“整體性”的。另一方面,當我們能夠獨立于其他維度為某個維度賦予“值”時,我們稱之為“可分離”維度。例如,桌子的長度與其堅固性無關(guān),因此堅固性和長度是兩個可分離的維度。一些維度,如親屬關(guān)系、經(jīng)濟變量和理論物理變量,并非感知性的。然而,在許多情況下,這些維度的數(shù)學結(jié)構(gòu)可以被精確描述。

在本文中,我們不討論維度的起源,而是將其視為已知條件,以計算組合類比的有效性。維度的起源已在 G?rdenfors (2000, p. 2014; G?rdenfors, 2021) 中進行了研究。

CS 的一個關(guān)鍵點在于,維度可以被表示為實例化不同的幾何結(jié)構(gòu)。例如,長度、重量和響度可以被表示為與非負實數(shù)同構(gòu)的半線。當我們有一組整體性維度時,它們的幾何結(jié)構(gòu)會組合成所謂的“領(lǐng)域”。領(lǐng)域是多維結(jié)構(gòu),能夠?qū)蝹€刺激表示為在其構(gòu)成維度中具有坐標的點。例如,顏色領(lǐng)域是由三個整體性維度組成的幾何結(jié)構(gòu):色調(diào)、強度和亮度(見圖 2),任何顏色實例都可以在該結(jié)構(gòu)中表示為一個點,且在每個維度上都有相應(yīng)的值。像“紅色”、“藍色”、“黃色”等顏色術(shù)語可以在顏色領(lǐng)域中表示為點的凸集(即“區(qū)域”)。在 CS 中,這些區(qū)域被稱為“屬性”,由于它們局限于單一領(lǐng)域,可以被視為概念的特殊情況。

打開網(wǎng)易新聞 查看精彩圖片

更一般地,概念比領(lǐng)域具有更復(fù)雜的結(jié)構(gòu),因為它們通常需要多個領(lǐng)域和維度才能正確表示。例如,我們的“蘋果”概念需要顏色領(lǐng)域以及表示顏色、成熟度、味道、質(zhì)地、大小和形狀等屬性的維度。一種闡釋這一概念的方法是考慮所有上述維度的乘積空間;“蘋果”概念將是該空間中的一個凸子區(qū)域,如圖 3 所示。

打開網(wǎng)易新聞 查看精彩圖片

概括這些思想,我們將概念空間定義為包含一個或多個領(lǐng)域的集合,并配備一個距離函數(shù)——即度量——用于表示屬性、概念、對象及其相似性關(guān)系。概念和對象之間的相似性可以通過其在空間中的距離輕松估計,因為它是距離的單調(diào)遞減函數(shù)(Nosofsky, 1992; Shepard, 1987)。距離函數(shù)可以有所不同,最常見的是歐幾里得距離,但曼哈頓距離、其他閔可夫斯基距離以及極坐標度量在不同背景下也可能適用(參見 G?rdenfors, 2014; Johannesson, 2002; Shepard, 1964)。

這一框架的一個重要優(yōu)勢是它可以表示概念的原型結(jié)構(gòu)(參見 G?rdenfors, 2000; Rosch, 1983),即存在一個實例比其他任何實例更好地代表該概念。在凸區(qū)域中,可以將某個特定點(或在某些情況下的一組點)作為類別的原型。因此,利用空間內(nèi)置的度量,可以通過估計類別成員到原型的距離來測量其典型性程度。例如,在認知科學和語言學中,焦點顏色常被視為顏色空間的原型(參見 Douven, 2019; Rosch, 1975)。假設(shè)概念具有原型結(jié)構(gòu)并不意味著必須有一個實際對象代表原型。概念空間可以表示屬于某個概念的所有可能對象。G?rdenfors (2000) 認為,原型可以對應(yīng)于一個部分向量,僅包含與概念最相關(guān)維度的值信息。

關(guān)于這一方法還可以探討更多內(nèi)容,但出于本文的目的,我們將重點關(guān)注 CS 的兩個方面:概念具有維度和原型結(jié)構(gòu),且存在一個距離函數(shù),允許我們在空間中比較概念和對象。接下來,我們將展示如何運用這些思想來分析類比。

平行四邊形模型

其中一個最早的類比模型由 Rumelhart 和 Abrahamson(1973)提出,該模型基于一個假設(shè):類比推理依賴于語義記憶中知識組織的特性。根據(jù)作者的觀點,可以將類比相似性表示為多維空間中作為點表示的類別之間的語義距離的函數(shù)。具體而言,他們聲稱形式為 A : B : C : D 的類比(其中元素是對象類別)必須遵循“平行四邊形規(guī)則”,即類別 A 和 B 之間的向量距離必須等于(或高度類似于)C 和 D 之間的向量距離(見圖 4)。

打開網(wǎng)易新聞 查看精彩圖片

該模型將類比推理理解為一種選擇問題,在這個問題中,智能體首先將類別 A、B 和 C 表示為多維空間中的點,并選擇一個類別 D,使其成為滿足平行四邊形規(guī)則的最佳選項。粗略地說,這一規(guī)則包括固定的向量加法和減法操作:D = (B ? A) + C。

在一系列使用 Henley(1969)提出的三維哺乳動物空間的實驗中(見圖 5 中的一些示例),Rumelhart 和 Abrahamson 展示了當面對類似“猴子 : 豬 : 大猩猩 : X”的類比問題時,給出兔子、老虎、牛和大象作為 X 的選項,受試者會根據(jù)平行四邊形規(guī)則對這四個選項進行排序。平行四邊形模型預(yù)測牛是首選答案,而他們的實驗結(jié)果清楚地支持了這一模型。

打開網(wǎng)易新聞 查看精彩圖片

總體而言,我們認為該模型為基于類別的類比提供了正確的見解。然而,它存在兩個重要的局限性。首先,它缺乏解釋深度,因為它既不能識別類比例子因素,也無法提供類比相似性的概念。其次,它只能處理所有術(shù)語處于相同概念層次的類比(這里稱為“基于類別的類比”);像“游泳 : 魚 : 飛行 : 鳥”或“熊 : 哺乳動物 : 蜥蜴 : 爬行動物”這樣的類比無法通過該模型分析,因為這些類比中的類別并非都具有相同的向量表示,因此無法比較。

概念空間中的基于類別的類比
本節(jié)提出了一種廣義版本的平行四邊形模型,該模型遵循引言中描述的半算法方法。其基本思想是,進行向量比較的概念空間并不是固定的,而是取決于在每個特定類比中被視為類比例子因素的維度。

在我們的模型中,基于類別類比 A : B : C : D 中的類別是某個共同概念空間 M 的凸區(qū)域(記作“C(M)”),因為它們都處于相同的概念層次。為了簡化起見,我們假設(shè)每個類別都有一個由空間中的點表示的精確原型。對于類別 X,我們將該點稱為 pX。以下描述了搜索程序的主要步驟:

打開網(wǎng)易新聞 查看精彩圖片

讓我們通過一個簡單的例子來說明這一過程??紤]不完整的類比“老鼠 : 狼 : 兔子 : X”,以及一個包含河馬、水牛、大象和大猩猩的簡化搜索空間。M 將是 Rumelhart 和 Abrahamson(1973)使用的哺乳動物空間(見圖 5),而 M* 中作為比較框架的維度將是體型和兇猛性,因為老鼠和狼在這兩個維度上存在顯著差異。圖 5 中的人性化維度較不顯著,因此不會成為 M* 的一部分。然后,在加權(quán)概念空間 M* 中,將確定一個點 y,它是以兔子原型為起點的向量頭部,并且與由老鼠和狼的原型形成的向量等價。假設(shè)原型的位置如圖 6 所示,水牛的原型是該類比的最佳解決方案,因為它比 M* 中任何其他原型更接近 y。

打開網(wǎng)易新聞 查看精彩圖片

類比并非全有或全無,而是具有不同程度的恰當性或合理性。例如,在基于類別的類比中,與最佳選擇(在加權(quán)概念空間中)非常接近的類別也可能是不錯的解決方案。除此之外,可能會選取不同的維度集合作為類比例子因素,從而生成多個可能合理的類比。我們認為,在大多數(shù)情況下,會有一組特別顯著的維度產(chǎn)生最強的類比關(guān)系。然而,提供一個系統(tǒng)化的標準來找到這些維度相當復(fù)雜,因為它強烈依賴于主體對特定語義領(lǐng)域的知識,以及扎根于某個語言社群的語義直覺。最終,為給定類別找到顯著維度集合是一個實證問題。

從類別到屬性

如前所述,Rumelhart 和 Abrahamson(1973)模型的一個重要局限性在于,它只能處理相同概念層次上的類比。請看以下兩個例子:

打開網(wǎng)易新聞 查看精彩圖片

(5) 和 (6) 是合理的類比,但它們無法通過平行四邊形模型進行分析。我們?nèi)绾螌⒁环N顏色與一種水果或一種動物與一種運動方式進行比較呢?從形式化的角度來看,無法比較來自不同概念空間的兩個向量。

我們將像 (5) 和 (6) 這樣的類比稱為“基于屬性的類比”。自然地,由于這些類比中術(shù)語對之間的語義關(guān)系不同于基于類別的類比,因此通過搜索算法來闡釋它們需要采用不同的方法。特別是,X 的搜索空間將是與 C 中類別共同屬性相關(guān)聯(lián)的詞匯項集合。

我們對基于屬性的類比的提議非常直接:我們認為,一個類比的強度取決于兩個因素。第一,識別與該對中屬性相對應(yīng)的維度;第二,識別該屬性對于該對中類別的典型性程度。換句話說,我們通過檢查這些對中的屬性是否來自同一維度,并借助典型性條件判斷它們對該對中的類別是否具有類似的預(yù)期,以此評估這些類比的恰當性。在這個意義上,像 (6) 這樣的類比必須被認為比變體“魚 : 游泳 : 鳥 : 行走”更強,因為即使鳥可以行走,飛行比行走對于該類別更具典型性(Osta-Vélez & G?rdenfors, 2022)。

建模典型性

從搜索算法的角度來看,難點在于確定某一特定類別屬性的典型性程度。在 Osta-Vélez 和 G?rdenfors(2022)中,我們提出了一種通過概念空間中的距離來實現(xiàn)這一目標的方法。讓我們回顧一下,一個類別 M 的概念空間包含了屬于 M 的對象可能具有的所有屬性。這些屬性可以根據(jù)是否屬于 M 的原型劃分為原型屬性非原型屬性。非原型屬性可以通過測量它們與概念 C(M) 中 M 的原型 (pM) 的距離來賦予典型性程度。

根據(jù)定義,原型屬性比非原型屬性具有更高的典型性程度,但它們并不完全同等典型。例如,雖然“圓形”和“紅色”都屬于蘋果的原型屬性,但前者比后者更具典型性,因為一個非圓形的蘋果比一個非紅色的蘋果更令人驚訝?;谶@一思想,可以通過測量某個屬性未被滿足的空間中最近點的距離,來建立原型屬性之間的排序。同樣地,非原型屬性也可以通過測量它們與概念 C(M) 中原型的距離來賦予典型性程度。以下標準系統(tǒng)化了這些思想:

典型性標準

打開網(wǎng)易新聞 查看精彩圖片

現(xiàn)在,給定一個類比 A : B : C : X,其中 A 和 C 是類別,B 是 A 在維度 D 中的屬性,選擇 X 以獲得最強的類比關(guān)系時,X 應(yīng)為維度 D 中的另一個屬性,且其典型性程度比 D 中任何其他屬性更接近 B 的典型性程度。我們預(yù)測,如果在 D 中存在多個屬性,它們對于類別 C 的典型性程度與 B 相同,則該類比會比那些不存在這種情況的類別弱。例如,類比“獅子 : 米色 : 烏鴉 : 黑色”必須被認為比“獅子 : 米色 : 狗 : 棕色”更強,因為對于類別“狗”來說,除了棕色之外還有其他幾種顏色也同樣具有典型性。

從屬性到類別

需要注意的是,如果類比中的術(shù)語順序不同,例如 A : B : C : X,其中 A 和 C 是同一維度 D 中的屬性,而 B 和 X 是類別,則搜索程序會發(fā)生變化。像“紅色 : 蘋果 : 黃色 : X”這樣的類比要求智能體尋找一個與蘋果處于相同概念層次的類別,并且黃色對該類別來說具有高度原型性。在這里,相關(guān)的語義現(xiàn)象不再是典型性程度,而是**診斷性**。診斷性屬性使我們能夠以最少的信息識別類別成員(參見 Chin-Parker & Ross, 2004;Tversky, 1977),例如,“有鰓”對類別“魚”來說是高度診斷性的。診斷性與典型性密切相關(guān),但并不相同:診斷性屬性是典型的,但并非所有典型屬性都是診斷性的(例如,“甜”是蘋果的典型屬性,但不是診斷性的,因為對比類別中的其他幾個類別也共享這一屬性)。

我們認為,在這些情況下,搜索算法包括三個步驟:第一,確定最小的概念空間 M,使得 B ? C(M);第二,在 C(M) 中找到一組類別,其中 C 是典型的;第三,從這組類別中選擇 C(M) 中最典型的類別。這將是產(chǎn)生最強類比關(guān)系的選擇。嚴格來說,我們不能直接使用上述針對 X 的典型性標準,因為 X 是一個類別而非屬性。然而,這一標準可以通過相同的思想進行調(diào)整,以適用于類別。

基于事件的類比

現(xiàn)在讓我們分析一種在某種程度上涉及事件的類比。從認知和語義的角度來看,事件背后的表征結(jié)構(gòu)與名詞和形容詞的表征結(jié)構(gòu)不同(有關(guān)綜述,參見 G?rdenfors, 2014;Papafragou, 2015)。據(jù)我們所知,它們僅在有限范圍內(nèi)被研究過(例如,Goswami & Brown, 1990)?!盎谑录念惐取保缥覀兯Q的那樣,分為兩種類型。一種涉及動作的類比,如以下示例:

打開網(wǎng)易新聞 查看精彩圖片

我們的目標是展示,基于事件的類比也可以通過概念空間進行分析。

我們基于 G?rdenfors 和 Warglien(2012)提出的事件兩向量模型(參見 G?rdenfors 等, 2018;Warglien 等, 2012)。兩向量模型指出,一個事件由兩個組成部分表示——生成事件的動作的力量(或力量模式),以及其應(yīng)用的結(jié)果。這兩個組成部分都以向量的形式在空間中表示。在沒有變化的特殊情況下,即當結(jié)果向量為零向量時,事件則是一種狀態(tài)。

事件的一個核心特征是它們基于因果關(guān)系:一個事件包含關(guān)于一個代理的信息,該代理是導(dǎo)致與患者相關(guān)結(jié)果的動作的原因。事件的結(jié)果被建模為一個向量,表示患者在事件前后屬性的變化,如圖 7 所示。

打開網(wǎng)易新聞 查看精彩圖片

為了建模一個事件,至少需要兩個空間:一個動作空間和一個結(jié)果空間。動作空間可以被設(shè)想為一個力量空間,或者更廣泛地,作用于某個患者的力量模式空間。我們稱之為力量模式,因為在身體運動中,涉及多個身體部位,因此多個力量向量通過類比 Marr 和 Vaina(1982)的微分方程相互作用(更多細節(jié)參見 G?rdenfors 和 Warglien, 2012)。結(jié)果空間包含表示患者屬性變化的維度。這些空間表示不同類型的向量:力量的性質(zhì)不同于屬性變化的性質(zhì)。

一旦力量向量和結(jié)果向量可用,我們可以像前幾節(jié)一樣使用它們來建模基于事件的類比。例如,在類比(7)“女人 : 揮手 : 樹 : 搖擺”中,女人是一個事件的代理,“揮手”可以用描述代理動作的力量向量建模(G?rdenfors 和 Warglien, 2012;G?rdenfors, 2014)。然后,在類比的第二部分中,樹是代理,“搖擺”描述了一個最類似于女人揮手的力量向量。對于(8)“馬 : 飛奔 : 人 : 跑步”,可以給出類似的解釋。這個類比的恰當性在于,跑步是描述人類運動的動詞,其力量模式表示與“飛奔”最為相似,當代理是馬時。出于類似的原因,我們預(yù)測類比“鳥 : 翅膀 : 魚 : 鰭”會被認為比“鳥 : 翅膀 : 人 : 手臂”更強,因為翅膀和鰭的運動力量模式通常比翅膀和手臂的運動力量模式更為相似。翅膀和鰭是動物運動中的功能性部分,因此對周圍的空氣或水施加了顯著的力量,而手臂通常不用于運動。

在類比(9)“盒子 : 打開盒子 : 瓶子 : 打開瓶子”中,“打開盒子”描述了對盒子執(zhí)行的動作的結(jié)果,結(jié)果向量簡單地表示為 <盒子; 打開盒子> 。然后,一旦給定瓶子,對應(yīng)的結(jié)果向量就是 <瓶子; 打開瓶子> 。因此,結(jié)果向量的相似性解釋了該類比的有效性。類似的分析可以應(yīng)用于(10)“巧克力 : 融化的巧克力 : 雪人 : 融化的雪人”,以及 Goswami 和 Brown(1990)研究的其余類比。有趣的是,Goswami(1992)和 Goswami 與 Brown(1990)指出,兒童處理這種類比的能力取決于他們的語義能力,即他們對類比中涉及的因果概念(切割、融化、打開等)的掌握程度。正如他們所指出的,這與 Piaget 的觀點相矛盾,Piaget 認為類比推理是一種形式機制,兒童只能在形式運算階段(13-14 歲)學習(參見 Piaget 等, 1977)。我們的方法完全同意前者的想法。類比推理是一種基于語義的機制,利用了概念表征的特性,因此任何純粹邏輯的(即非語義的)方法都不太可能成功(另見 Osta-Vélez 和 G?rdenfors, 2020, 2022)。

需要注意的是,領(lǐng)域和維度在基于事件的類比中仍然起著核心作用。根據(jù)事件的概念空間模型,動詞的意義是“依賴于單一領(lǐng)域(或維度)的向量凸區(qū)域”(Warglien 等, 2012,第 172 頁)。例如,“涂漆”表示動作患者顏色領(lǐng)域中的變化,而“加熱”意味著溫度維度的變化。即使與動詞相對應(yīng)的實際動作涉及患者的多個維度的變化,動詞通過將注意力引導(dǎo)到其中一個領(lǐng)域/維度上起作用?;谑录念惐纫韵嗤姆绞竭\作,例如“火 : 加熱 : 冰 : 冷卻”,這個類比是一致的,因為溫度是兩個類比中的顯著維度。

部分-整體類比

與屬性和事件一樣,部分-整體(meronomic)關(guān)系有其自身的底層表征(參見 Markman, 1981;Winston 等, 1987),這些關(guān)系無法完全通過上述模型來解釋。建立在這些關(guān)系上的類比利用了這些結(jié)構(gòu)的特性,因此必須相應(yīng)地進行建模。接下來,我們將概述一個建議方案,使用 Fiorini 等人(2014)最近開發(fā)的概念空間理論的擴展來處理部分-整體關(guān)系。

結(jié)構(gòu)空間

這一提議背后的主要思想是,關(guān)于概念 M的部分-整體(meronomic)信息無法在標準概念空間中表示,而是需要一個稱為結(jié)構(gòu)空間的補充空間。該空間編碼了兩種不同的信息:(i) 關(guān)于屬于 M 的對象應(yīng)具有的部分的信息,以及(ii) 這些部分相對于整體如何排列的信息(這被稱為配置信息)。前者存儲在每個部分的個體概念空間中,后者則存儲在所謂的**結(jié)構(gòu)域**中。在這種更豐富的概念空間概念中,整體的概念相似性是標準概念空間的相似性度量與基于結(jié)構(gòu)空間中的距離函數(shù)計算的結(jié)構(gòu)相似性的函數(shù)。

我們的觀點是,部分-整體類比主要依賴于結(jié)構(gòu)相似性,因此依賴于存儲在結(jié)構(gòu)空間中的信息。然而,概念信息也可以作為強化類比因素使用。請看以下兩個類比:

打開網(wǎng)易新聞 查看精彩圖片

支撐(11)的類比例子因素有兩個:一個是構(gòu)型上的,涉及腿與馬和輪子與車之間的空間排列相似性;第二個是概念上的,涉及腿和輪子相對于各自整體所具有的運輸功能。在(12)中,唯一的類比例子因素是構(gòu)型上的:腳和手分別在腿和臂的部分-整體結(jié)構(gòu)中占據(jù)相同的位置。除了類比中類別之間的高度整體相似性之外,似乎沒有其他顯著的維度與此相關(guān)。

形狀分析

我們現(xiàn)在將概述一種可能的方法,利用形狀分析的思想對部分-整體類比中的結(jié)構(gòu)因素進行建模。形狀分析的一個核心目標是識別在物體形狀以多種方式呈現(xiàn)給感知時保持不變的結(jié)構(gòu)。這些結(jié)構(gòu)必須捕捉的兩個關(guān)鍵要素是物體部分的長度和方向,正如物體感知中所熟知的那樣,這些通常足以對物體進行分類。Marr 和 Nishihara(1978)的經(jīng)典方法通過使用類似圓柱體的建模原語來描述物體的部分層次結(jié)構(gòu)實現(xiàn)了這一點。圓柱體及其連接點的向量坐標將生成一個形狀的多維空間,每個特定的圓柱形狀對應(yīng)于該空間中的一個點。可以通過對不同層次的所有維度進行加權(quán)求和,為該空間引入度量。該結(jié)構(gòu)空間中的一個點表示在給定分解層次上的形狀形式和位移的組合,表示特定的肢體配置。

形狀分析中的另一個重要組成部分是部分相對于整體的連接性。Zhu 和 Yuille(1996)提出了一種特別強調(diào)這一點的方法。他們的模型使用了兩種基本的原始形狀:蠕蟲形(兩端帶有圓形的矩形)和帶有角度的圓形(代表鉸鏈及其靈活性)。與圓柱體類似,蠕蟲形可以用長度和寬度兩個坐標來描述。部分之間的鉸鏈可以通過半徑和角度值來描述。不同的形狀可以表示為這兩種基本結(jié)構(gòu)實例的組合(見圖 8)。與 Marr 和 Nishihara 的模型一樣,這種結(jié)構(gòu)可以用多維向量表示。

打開網(wǎng)易新聞 查看精彩圖片

給定以上述方式表示的形狀,可以通過識別形狀邊界中兩個或多個點等距點的軌跡來計算進一步的結(jié)構(gòu)。這種結(jié)構(gòu)被稱為“拓撲骨架”(見圖 9),它們是物體部分連接性的不變表示,似乎在人類視覺中發(fā)揮了重要作用(Firestone & Scholl, 2014;Lowet 等, 2018)。

打開網(wǎng)易新聞 查看精彩圖片

Zhu 和 Yuille(1996,第 203-204 頁)提出了一種算法,可以將不同物體的骨架映射到彼此之上(例如見圖 10)。該算法生成了一個顯式的相似性度量,用于比較不同的形狀,或?qū)⑿螤钆c一個原型模型進行比較。一個有趣的特征是,即使兩個物體的部分無法一一匹配,它們的相似性度量仍然有效。例如,缺少一根手指的手仍然被認為與典型的手高度相似,三條腿的狗仍然被視為狗。

Marr 和 Nishihara(1978)以及 Zhu 和 Yuille(1996)關(guān)于部分-整體形狀關(guān)系的模型概述表明,原則上,結(jié)構(gòu)性形狀關(guān)系可以在概念空間中表示,盡管其維度更高且比其他感知屬性更復(fù)雜。

Zhu 和 Yuille 開發(fā)的方法可以被搜索算法用于部分-整體類比,具體如下:給定一個類比 A : B : C : X,其中 B 和 X 分別是 A 和 C 的部分,X 的最佳選擇將是 C 中映射到 B 的部分,同時匹配 A 和 C 的拓撲骨架。換句話說,X 將是 C 中與 B 最相似的部分。

需要注意的是,如果類比中術(shù)語的順序為 A : B : C : X,其中 A 和 C 分別是 B 和 X 的部分,則搜索過程會有所不同。在這種情況下,需要指定一個詞匯類別的搜索空間 S,使得 (S = {Y : Y { 滿足條件 )。然后,可以應(yīng)用 Zhu 和 Yuille 的算法,在 S 中找到與 B 最相似的骨架形狀,使得 B 中的部分 a 映射到 X 中的部分 C。由于 S 中很可能存在多個類別是完成 A : B : C : X 的良好候選者,上述算法可用于在 S 中找到一組相對于 B 達到或超過相似性閾值的骨架形狀。

結(jié)論

我們現(xiàn)在已經(jīng)通過概念空間分析了四種類型的類比:基于類別的、基于屬性的、基于事件的和部分-整體類比。當我們采用概念空間理論來解釋類比時,這種分類自然生成。這四種類型對應(yīng)于不同的關(guān)系結(jié)構(gòu)。

(i) **基于類別的類比**,例如“狗 : 狼 : 貓 : 羽飾貓”,在相同領(lǐng)域中選取四個概念,并指出類比中前兩個元素之間的向量與后兩個元素之間的向量平行。通常情況下,所有四個概念都以名詞形式表達。

(ii) 基于屬性的類比,例如“梨 : 綠色 : 香蕉 : 黃色”,將兩個對象類別作為第一和第三元素,將這些類別的兩個屬性作為第二和第四元素。該類比表明,第一個類別的屬性(綠色)對該類別的領(lǐng)域是典型的,第二個類別的屬性對該領(lǐng)域同樣是典型的。在這種情況下,第二和第四元素通常以形容詞形式表達。

(iii) 基于事件的類比,例如“馬 : 奔跑 : 人 : 跑步”,將兩個對象類別作為第一和第三元素,將這些類別的兩個動作作為第二和第四元素。該類比表明,第一個類別的動作(奔跑)涉及與第二個類別的動作(跑步)相似的力量模式。在這種情況下,第二和第四元素通常以動詞形式表達。

(iv) 最后,部分-整體類比,例如“手 : 臂 : 腳 : 腿”,利用存儲在概念空間結(jié)構(gòu)域中的信息。它們依賴于一種結(jié)構(gòu)相似性,比較部分在各自整體的部分層次結(jié)構(gòu)中的角色。我們提出了一種映射算法作為該機制的模型,但許多其他方法也可以奏效(例如 Macrini 等, 2011;Siddiqi 等, 1999)。在這種情況下,第二和第四元素通常以名詞形式表達,且在部分-整體層次中分別高于第一和第三元素。

使用概念空間作為建模工具的一個優(yōu)勢是我們已經(jīng)注意到的,即可以比較不同類比的相對強度。這對基于類別的類比、基于事件的類比以及某些部分-整體類比的情況都適用。通過這種方式,我們的模型得出了其他類比解釋無法做出的預(yù)測。未來的工作應(yīng)集中于評估這些預(yù)測的經(jīng)驗充分性。

我們方法的一個重要貢獻是對語義相似性在類比中的作用進行了詳細分析。基于命題的觀點,如 Thagard(Thagard 等, 1990)或 Gentner(Gentner, 1983)的觀點,也依賴于語義相似性,但忽略了維度和顯著性的調(diào)節(jié)作用。我們表明,關(guān)注概念結(jié)構(gòu)而非命題結(jié)構(gòu)在解釋類比的多樣性以及設(shè)計建模算法方面具有明顯的優(yōu)勢。

這些搜索算法適用于人工系統(tǒng)的實現(xiàn)。由于已有概念空間的計算模型(Adams & Raubal, 2009;Chella 等, 2001;G?rdenfors, 2014;Lieto, 2021),這些算法可以通過實現(xiàn)此處提出的搜索程序進行擴展,以解釋不同類型的類比推理。此外,概念空間可以作為命題模型和亞符號認知模型之間的接口(Lieto 等, 2017)。這為我們的方法在基于神經(jīng)網(wǎng)絡(luò)的算法中得到應(yīng)用提供了可能性(參見 Jani & Levine, 2000)。

原文鏈接: https://www.tandfonline.com/doi/epdf/10.1080/0952813X.2022.2125081?needAccess=true