文 | 追問nextquestion
01 摘要

本文提出了一種基于自由能原理(FEP)的簡約解釋,試圖從生物學理論的角度解釋早期智人(Homo erectus)的行為演化,特別是他們制作石斧的行為?!罢J知驚奇”(cognitive surprise)可能促使早期智人偶爾展現(xiàn)出非傳統(tǒng)或異常的行為,這些行為的協(xié)同演化傾向,如“蛇梯棋”游戲一樣揭示了石器時代智人某些行為的出現(xiàn)、消失及再次出現(xiàn)的模式。

當這些遺物出現(xiàn)在早期和中新世記錄中時,人類學家和考古學家通常會將它們想象成早期人類在想象中的系譜“梯子”上攀登的證據(jù),用來解釋人類認知能力如何漸進式發(fā)展,實現(xiàn)越來越創(chuàng)新的技藝,并最終導致了智人的認知優(yōu)勢。

然而,Héctor Marín Manrique, Karl Friston和Michael Walker提出了一種不同的假設:異常個體的行為并非總是被群體所接納,群體可能無法理解或想象這些與以往不同的行為所帶來的潛在優(yōu)勢,甚至無法表達這種不同。這種理解上的失敗和偶發(fā)的種群事件,可能導致這些異常行為被忽略,從而不為后世所記。這種情況猶如在“蛇梯棋”中沿“蛇”滑落,可能會在人類行為演化的歷程中造成斷層,留下難以解釋的進化謎團。

打開網(wǎng)易新聞 查看精彩圖片

?Manrique, Héctor Marín, Karl John Friston, and Michael John Walker. "‘Snakes and ladders’ in paleoanthropology: From cognitive surprise to skillfulness a million years ago." Physics of life reviews (2024).

02 “手斧”:考古學案例

石制“手斧”(Handaxes)是人類活動在早期和中期更新世的證據(jù)之一[1-2],它被歸類為“雙面剝片大型切削工具”(Bifacially-flaked large cutting tools”,簡稱BFLCTs),同屬于此類的還有“薄刃斧”(Cleavers)。

打開網(wǎng)易新聞 查看精彩圖片

?一件早期“手斧”和一件“薄刃斧”,來自西歐(以厘米為單位標度)。

這些“手斧”的縱向和橫向?qū)ΨQ性,是其普遍且顯著的特點,早在約170至160萬年前便已經(jīng)存在[3]。人們普遍認為,這種對稱性體現(xiàn)了制作者的主觀意圖,即在制作工具前,制作者就已經(jīng)對其外形進行了預設[4]。

這種預設反映了制作者在神經(jīng)生物學上的一種認知意識傾向,即他們能夠從一塊原始石塊中塑造出預想的三維形狀,如“手斧”的形狀[5-9]。舊石器時代的考古學家普遍認同,形態(tài)技術(shù)上的規(guī)律性可以在這些工具的形狀中感知到,這標志著“手斧”其他缺乏此類特征的簡單石器之間有著本質(zhì)的區(qū)別,無論這些簡單石器是否來源于“手斧”的遺址。

雖然BFLCTs代表了復雜的石制切削工具,其制作方式是通過從石塊上削去大片部分而成,但它們并非最早的切削工具。最古老的剝片石器出現(xiàn)在約340萬年前的非洲上新世晚期,其創(chuàng)造者可能是南方古猿人,而最古老的歸為人類的化石骨骼則可以追溯到280萬年前;在大約258萬年前的早期更新世開始時,我們的遠古祖先開始表現(xiàn)出合作的跡象。這些跡象之一就是他們制作的工具,這些工具通過敲打石塊制成,留下的形狀像貝殼一樣,非常適合用手抓握。

相較于BFLCTs,這些更早期的工具在制作工藝上較為簡單。更加精細的“手斧”首次出現(xiàn)在東非約176萬年前,當時直立人已經(jīng)取代了幾種早期的人科動物[10-14]。在南非,“手斧”大約出現(xiàn)在160萬年前[15],此后“手斧”在非洲和歐亞大陸的舊石器時代記錄中都有零星出現(xiàn),但在時間和空間上的分布并不均勻。從更晚的早期更新世開始,BFLCTs在西亞和南亞的少數(shù)幾個遺址中出現(xiàn),時間跨度從150萬至100萬年前。也就是說,BFLCTs是由各種形態(tài)的人類在長達150多萬年的時間里持續(xù)制造的。

上面提到的300萬年前就出現(xiàn)的簡單石器,如“砍砸器”(choppers),它的考古發(fā)現(xiàn)一直延續(xù)到最近的千年。也就是說,當176萬年前,人們開始通過更精細的雙面剝片制作“手斧”時,那些更早期的更簡單的手工技術(shù)在時間和空間上仍然廣泛存在,與“手斧”的制造形成鮮明對比。后者在其首次出現(xiàn)后的一百多萬年中的記錄是間歇和稀疏的,因而它并非是正統(tǒng)的制作工藝。它們的稀少也支持了一個推論:從這些雙面剝片石器的發(fā)明到它們在舊石器時代生活中發(fā)揮重要作用之間,可能存在數(shù)十萬年的時間跨度。

打開網(wǎng)易新聞 查看精彩圖片

?砍砸器

于是這產(chǎn)生了一系列問題。既然“手斧”的制造反映了一種明確的意圖性,那么這種認識是如何在早期人類成員中產(chǎn)生的?它可能已經(jīng)產(chǎn)生過多少次?它是否在多個時間和地點出現(xiàn)和消失?[16]我們可以認為它只產(chǎn)生過一次,之后不僅技巧性地代代相傳,而且還作為一種技能從一個社區(qū)傳遞到另一社區(qū),在時間和空間上產(chǎn)生了深遠的影響嗎?

一些舊石器時代的考古學家和古人類學家認為這種可能性是可信的。它基于一種“進步主義”的假設,即BFLCTs為早期人類提供了功能優(yōu)勢。這些優(yōu)勢具有明顯的適應價值,有助于生存并且促進了人口的日漸增長和繁殖成功。這些技能通過使早期人類能夠廣泛利用生態(tài)區(qū)和生物群落的資源,推動了人口和地理的擴張。

這種觀點遭到了來自許多方面的反駁。首先,“手斧”存在的時間和空間跨度極大。即使在地理區(qū)域≥500公里范圍內(nèi)發(fā)現(xiàn)了幾個包含“手斧”的考古組合,并且這些考古年代可以歸在一個大致相似的時間段(可能≥200,000年),我們也難以斷言這一定代表了一種連續(xù)不斷、世代相傳的“文化傳統(tǒng)”。因為如果一個世代平均持續(xù)25年,那么200,000年意味著8000個世代,這對用“社會傳播”、“累積文化”和“文化歷史”的方法來解釋考古記錄的可能性(更不用說合理性)構(gòu)成了重大挑戰(zhàn)。

其次,手斧的時空分布并不規(guī)律,在時間上多次呈現(xiàn)“出現(xiàn),消失,然后又出現(xiàn)”的特征,在空間的分布上也較為零散,如果我們認為手斧的制作是文化傳播的結(jié)果,并且?guī)砹松鎯?yōu)勢,就很難解釋這種稀疏性和間歇性。有觀點認為,手斧的“社會傳播”或“文化傳播”在考古記錄中的保存并不完整,但這僅是一種補救性的解釋。最后,如果“手斧”與制作工藝更簡單的“砍砸器”并存,且后者并未顯示出顯著的優(yōu)勢,為什么“砍砸器”會被不斷制作出來呢?

本文將對此現(xiàn)象,給出一種基于自由能原理(FEP)的簡約解釋[17]。它除了可以解釋“手斧”等石器工具,也可以解釋古人類的其它技術(shù)發(fā)展。為此,我們首先引入一個很有幫助的類比——“蛇梯棋”游戲。

03 “蛇梯棋”游戲的類比

古老的“蛇梯棋”是一種適合兩個或更多玩家的桌游,棋盤如下圖。棋盤上的梯子和蛇分別連接兩個不同的方格。游戲開始時,玩家的棋子放置在起點(編號為1的方格),通過投擲骰子來決定前進的步數(shù),若投出6點,就可以再投一次。

如果棋子停留在梯子的下端,就可以沿梯子上升至對應的上端;若停留在蛇的頭部,則須沿蛇身滑落至尾部。首先到達終點的玩家獲勝。顯然,游戲過程中,玩家的棋子經(jīng)歷多次升降,有時甚至在某些位置循環(huán)徘徊。

打開網(wǎng)易新聞 查看精彩圖片

?蛇梯棋:https://en.wikipedia.org/wiki/Snakes_and_ladders

從“文化累積”的角度看,人類的技術(shù)和文化的發(fā)展如爬梯子一般不斷上升。但實際上,歷時兩百萬年的“人類上升”就像這個游戲一樣,并非一帆風順,也不是直線前進的??鋸埖卣f,它幾乎可以被看作一個寓言,描述了我們在技術(shù)和文化發(fā)展過程中,以蝸牛般的速度,緩慢、猶豫、跌跌撞撞,有時甚至倒退?!笆指边@種規(guī)律性技術(shù)在時空范圍內(nèi)的不規(guī)律出現(xiàn),也可以這樣理解。

接下來的論點將解釋為什么這種發(fā)展模式是蹣跚而斷續(xù)的。這一論點植根于自組織物理學的理論。簡單來說,遠離平衡狀態(tài)的自組織系統(tǒng)必然呈現(xiàn)一種特殊的巡游行為,這種行為在許多方面都與“蛇梯棋”游戲的特點相似[17]。

04 自由能原理、主動推理與人類進化

自由能原理(FEP)提供了一種基于統(tǒng)計物理學的非瑣碎、第一性原理的方法,來理解自組織系統(tǒng)(如生物體)是如何調(diào)節(jié)其響應以適應進化的,以及具有感知能力的生物(即能夠體驗感覺的主體)如何做出行為反應。我們特別考慮那些具有“層次機制性心智”(hierarchically mechanistic mind,簡稱HMM)的動物[18-19]。

HMM將具身、定位的大腦定義為一個復雜的自適應系統(tǒng),該系統(tǒng)通過其內(nèi)部分層組織的神經(jīng)認知機制之間的動態(tài)相互作用,產(chǎn)生感知-行動周期,主動地最小化人類感覺和身體狀態(tài)的熵(即擴散或衰減)[19]。HMM可以看作是一種神經(jīng)生物學推理機[20],它的運行機制符合自由能原理。

自由能原理指出,所有生物都傾向于消耗與生存相兼容的最小能量。然而,可適應環(huán)境的自組織系統(tǒng)卻會通過主動推理,在感知預測之外對變化的環(huán)境進行反應,消耗更多的能量。這種試圖最小化的能量,被定義為自由能,它可以衡量對外部的感知預測與內(nèi)部信念(偏好、先驗)之間的差異??梢院唵蔚卣J為,感知預測是根據(jù)外部接受到的信息所進行的“客觀推理”,比如走在路上遇到了下雨,我們根據(jù)對雨滴的視覺觀察、觸感做出自己會被淋濕的預測,而內(nèi)部信念的偏好則是不希望被淋濕的主觀意愿。前者與是否厭惡被淋濕無關。

生物系統(tǒng)需要盡可能減小感官預測與信念預測之間的差異。要做到這一點,除了可以通過根據(jù)外部信息修正信念,比如在上述情景中不得不接受被打濕的事實,還可以通過行動改變外部世界的狀態(tài),也就是跑去避雨。在基于自由能原理的主動推理的框架下,生物體的認知和行為都遵循相同的規(guī)則,服務于最小化感知上的驚奇(surprise),驚奇即是一種預測誤差(prediction error)。在信息論和預測編碼的貝葉斯條件概率分析中,這種預測誤差通常被稱為“意外”或“自信息”,其計算方式是可能事件概率的負對數(shù)。

打開網(wǎng)易新聞 查看精彩圖片

?自由能原理中,系統(tǒng)的狀態(tài)可分為四類:代表外部環(huán)境的外部狀態(tài)(external state)、智能體的觀測狀態(tài)(sensation state)、內(nèi)部狀態(tài)(internal state)以及動作狀態(tài)(action state)。

對生態(tài)系統(tǒng)中的生物而言,負自由能被視為其適應度的一種表現(xiàn),它要求生物與生態(tài)位之間的互動達到熱力學效率的最優(yōu)化。自由能作為一種信息度量,衡量了各種結(jié)果對生物體來說的平均驚奇程度。因此,當一個生物體能夠準確模擬并預測其與生態(tài)位的交互時,我們便可以說它已經(jīng)適應了那個環(huán)境。因為它避免了與環(huán)境的驚奇交換(例如,偏離穩(wěn)態(tài)設定點),或者避免處于極低概率的狀態(tài)(例如,受傷或死亡)。

某些生物,例如人類,已經(jīng)發(fā)展出深層的生成模型,有能力預測其行為的結(jié)果。這種生物有能力設想不同行動下的“反事實未來”:簡單地說,他可以進行規(guī)劃[21-25]。因為這種生物在進行感知預測時,會將其即將執(zhí)行的行動納入考量,從而能預測各種行動的潛在結(jié)果,并據(jù)此作出行動決策,以進行主動推斷(規(guī)劃)。

這是“主動推理”的一個關鍵方面:根據(jù)最小化計劃下的預期自由能來選擇行動和計劃。更簡單地說,行動的選擇旨在最小化預期的驚奇,以避免發(fā)生低概率的不良事件(如受傷或死亡),并通過產(chǎn)生的結(jié)果減少對環(huán)境的不確定性。減少不確定性是至關重要的,因為它意味著在深層生成模型規(guī)定下的感知行為具有認識的方面,使感知行為對顯著性和新穎性保持敏感。

只有具有這種深層生成模型的系統(tǒng)才會表現(xiàn)出這種探索行為,因為它們是唯一能夠響應認知啟示并回答“如果我這樣做會發(fā)生什么?”的系統(tǒng)[26-28]。因此,驅(qū)動計劃或策略選擇的預期自由能可以分解為實用和認知部分,分別支撐實用性(exploitative)行為和探索性(exploratory)行為。

我們可以這樣理解:如果一個生物能夠嘗試預見未來行為的后果,那么在行動尚未展開之前,其心中便充滿了由想象帶來的種種可能性與驚奇。這種對未來結(jié)果的預期,促使個體試圖降低感知中的驚奇,從而增強對環(huán)境的掌控力,并更深入地理解各種行為可能帶來的后果。這便是探索性行為的動力所在。

在生物進化的大背景下,自由能最小化不僅支撐著生物的存活,還包括其成功繁衍后代的能力[29-30]。自然選擇是漸進和保守的,面對環(huán)境相互依賴性和規(guī)律性,生物的生成性自組織系統(tǒng)的完整性,是由包括“主動推理”在內(nèi)的適應性交互所支持的。這種“主動推理”與由生成模型所引發(fā)的,以及由進化所賦予的先驗期望密切相關[31-33]。主動推理實例化了一個生成模型,其組成部分是大腦中能夠預測接下來最有可能感知的神經(jīng)網(wǎng)絡。在條件概率的貝葉斯統(tǒng)計中,進化和自然選擇可以被視為自然的“貝葉斯模型選擇”(也稱為“結(jié)構(gòu)學習”[34])。

因此,進化在生物、技術(shù),甚至是在心理社會層面上逐漸且間歇性地發(fā)展[35-37]。自由能原理與生物學,特別是神經(jīng)生物學相關,無論是在細胞動力學、神經(jīng)回路和行為的個體發(fā)育層面,還是在通過生物適應和適應性的自然選擇進化的種群的系統(tǒng)發(fā)育層面。

05 “認知驚喜”與“蛇梯圖”

現(xiàn)在,讓我們利用前文的觀點來解讀與“手斧”相關的考古發(fā)現(xiàn)。在討論這一主題時,我們或許不應過分強調(diào)“群體大小”在推動“手斧”制作技術(shù)社會傳播方面的作用,反而應更多地關注個體層面。即,是什么激發(fā)了制作者對制造石制“手斧”可能性的認知意識?以及觀察者(其它同伴或者制作者本身)對這種創(chuàng)新做法的反應又是如何?

在傳統(tǒng)工具作為主流的環(huán)境下,個體耗費更多時間和精力制作精細的、步驟更繁復的“手斧”,需要一種探索性的傾向,意識到采用不同的方式制作可能產(chǎn)生什么結(jié)果(如我們在文中第一部分所見,“手斧”的形態(tài)反映了制作者對形狀的預先設想),或者認識到新技術(shù)的產(chǎn)物可能帶來更長遠的實用性價值,也即減小后續(xù)能量消耗的潛在可能。這些都需要個體具備更深層次的生成模型。

于是我們可以這樣認為,在“手斧”存在的時空跨度中,各種古人類群體的整體認知能力,并未達到能夠認識到“手斧”的創(chuàng)新性和長遠價值的水平[38-39]。然而,偶爾也會有個別個體可以擁有更具表達性(即更深層次)的生成模型,洞察這種探索(認知)和利用(實用)價值,于是在偶然的情況下發(fā)展出了這些更復雜的工藝。但是,群體中的其他個體(有時包括這些異常個體自身)往往未能意識到同伴這種創(chuàng)新行為的特殊之處,并未產(chǎn)生“認知驚奇”[40]。

對于旁觀者來說,這種行為與他們的行為模式庫中的典型活動不吻合,因為典型活動是基于他們實用的先驗知識,而這種有利的先驗的規(guī)范性信念往往會壓倒對新認知的探索。這就導致了這些新的創(chuàng)造并未被群體所接受,創(chuàng)造者的“技藝”被視為浪費了群體為維持生存所需的(不可調(diào)和的)寶貴能量和時間。

值得注意的是,在維持基礎穩(wěn)態(tài)時,我們的大腦在休息狀態(tài)下每公斤消耗11.2瓦特的能量,而整個身體僅消耗1.25瓦特/公斤,耗費了我們50%的葡萄糖攝入量和20%的氧氣攝入量,其中75-80%的能量用于支持腦神經(jīng)元的活動[41]。

因此,直立人一百萬年前的活動必須滿足更大的日常能量需求,否則我們今天就不會存在。這種情況下,經(jīng)過驗證的例行公事成了生活的主導,那些能高效執(zhí)行這些任務的人贏得了群體的信任,而那些古怪、非正統(tǒng)或異質(zhì)的行為則被置于不聞不問之中,未能在集體的記憶或傳說中留下痕跡。此外,在我們的遠古祖先制作石器時,他們通過敲擊大石塊來打造工具,過程中偶爾會敲出一些奇特的形狀。這些形狀其實是意外產(chǎn)生的,當時的人們可能并沒有意識到這些偶然形成的石塊也可以用作工具[42-43],盡管考古學家從比較形態(tài)學的角度將它們分類為工具。

打開網(wǎng)易新聞 查看精彩圖片

?Vadim Sherbakov

總的來說,我們認為,在早期和中期更新世時期,那些異常的、異質(zhì)的行為活動在人類成員中遭遇的命運就是這樣起起落落。在技術(shù)能力“梯子”上看似達到的個人成就,很可能被同伴忽視,他們無法想象或表達這些行為可能帶來的生存優(yōu)勢。并且,彼時的人類缺乏足夠流暢的溝通能力,再加上各種人口事故,異質(zhì)行為的記錄往往會丟失。即使這些技術(shù)在某些小型的狩獵采集群體中被記住,它們也可能因人口的波動而在滅絕時消失。

那個時期的人類交流十分有限,即便存在語言溝通也相當原始;加之該時期人類壽命較短,生物成熟期早于現(xiàn)在,腦容量也有限(這些小型大腦只有我們今天大腦大小的三分之二),這在任何情況下都限制了小型成人腦中神經(jīng)生物學的靈活性,進而影響了深層次的認知能力*。

論文原文第四部分著重討論了直立人與現(xiàn)代人在細節(jié)上的大腦差異,由于與文章的整體邏輯無關,僅作為佐證,在這里不再贅述。

除此之外,群體還面臨各種各樣滅絕的風險,如不平等的性別比例、分娩時的死亡或先天性殘疾、感染、牙齒脫落,或由于瘟疫、枯萎、干旱、洪水、野火、霜凍、暴風雪或其他暴力氣候事件造成的食物或水稀缺。這些因素共同作用,導致異常行為結(jié)果難以在種群中穩(wěn)定傳承。

最后一個問題是,如果這些分布在各個地點以及各個時間的“手斧”是由不同的個體獨立制作的,那么它們的形態(tài)為何會具有一定的相似性呢?比如橫向和縱向的對稱性等。

對此,我們或許可以理解為,自組織的本質(zhì)具有內(nèi)在的周期性、隨機性以及最小化自由能的傾向,這使得系統(tǒng)總會反復探索巨大狀態(tài)空間中的某些特定狀態(tài),從而導致深層的生成模型在偏好上呈現(xiàn)某種相似性(比如對對稱性的意識,顯然,對稱在認知上是更加簡潔的,符合最小化的原則)。同時,原料的局限性、生理結(jié)構(gòu)(比如便于抓握)等也限制了制作的形態(tài)。這使得各地出土的不同時間制作的“手斧”等工具可以在獨立制作的情況下具有某種形態(tài)上的相似性,這種相似除巧合外也有一定進化的必然性,并不一定是文化傳播的結(jié)果。

總而言之,在審視“手斧”技術(shù)的演變過程中,我們發(fā)現(xiàn)了技術(shù)發(fā)展的不規(guī)則性和周期性,這種現(xiàn)象并非人類特有的歷史劇本,而是一種普遍存在于生物系統(tǒng)中的自組織行為。自由能原理為我們提供了一個理解這種現(xiàn)象的有力工具。

技術(shù)的每次“跳躍”或“滑落”都可能是對外部環(huán)境變化的一種適應性回應,其中既包括物理環(huán)境的變化,也包括社會、經(jīng)濟和文化背景的轉(zhuǎn)變。在全球化和快速信息流動的當代社會,人類技術(shù)和文化的發(fā)展可能呈現(xiàn)出更加復雜的動態(tài)變化。

正因如此,我們更應促進開放的創(chuàng)新體系,允許“非傳統(tǒng)”思維的存在和發(fā)展。通過這樣的開放與合作,可以最大限度地減少技術(shù)進步中的“驚奇”元素,促進一個更為穩(wěn)定和可持續(xù)的技術(shù)和文化發(fā)展環(huán)境。

參考文獻

[1] de la Torre I, Mora R, Domínguez-Rodrigo M, de Luque L, Alcal′a L. The Oldowan industry of Peninj and its bearing on the reconstruction of the technological skills of Lower Pleistocene hominids. J Hum Evol 2003;44(2):203–24.

https://doi.org/10.1016/s0047-2484(02)00206-3.

[2] de la Torre I, Mora R. The early Acheulean in Peninj (Lake Natron, Tanzania). J Anthropol Archaeol 2008;27(2):244–68. https://doi.org/10.1016/j.jaa.2007.12.001.

[3] Diez-Martín F, Wynn T, S′anchez-Yustos P, Duque J, Fraile C, de Francisco Rodríguez S, Uribelarrea D, Mabulla A, Baquedano E, Domínguez-Rodrigo M.A faltering origin for the Acheulean? Technological and cognitive implications from FLK West (Olduvai Gorge, Tanzania). Quat Int 2019;526:49–66. https://doi.org/10.1016/jquaint.2019.09.023.

[4] Shipton C, Clarkson C, Cobden R. Were Acheulean bifaces deliberately made symmetrical? Archaeological and experimental evidence. Camb Archaeol J 2018;29(1):65–79. https://doi.org/10.1017/S095977431800032X.

[5] Wynn T. The evolution of spatial competence. Urbana and Chicago: University of Illinois Press; 1989. ‘Illinois Studies in Communication’ and ‘Illinois Studies in Anthropology No. 17.’.

[6] Wynn T. Archaeology and cognitive evolution. Behav Brain Sci 2002;25(3):389–438. https://doi.org/10.1017/s0140525x020000794.

[7] Hodgson D. Evolution of the visual cortex and the emergence of symmetry in the Acheulean techno-complex. C R Palevol 2009;8:93–7. https://doi.org/10.1016/j.crpv.2008.10.009.

[8] Hodgson D. The symmetry of Acheulean handaxes and cognitive evolution. J Archaeol Sci Rep 2015;2:204–8. https://doi.org/10.1017/j.jasr2015.02.002.

[9] Hodgson D. Stone tools and spatial cognition. In K.A. Overmann, & F.L. Coolidge (editors). Squeezing minds from stones. Cognitive archaeology and the evolution of the human mind. Oxford: Oxford University Press; 2019. p. 200–24.

[10]: Asfaw B, Beyene Y, Suwa G, Walter RC, White TD, WoldeGabriel G, et al. The earliest Acheulean from Konso-Gardula. Nature 1992;360(6406):732–5. https://doi.org/10.1038/360732a0.

[11]: Beyene Y, Katoh S, WoldeGabriel G, Hart WK, Uto K, Sudo M, Kondo M, Hyodo M, Renne PR, Suwa G, Asfaw B. The characteristics and chronology of the earliest Acheulean at Konso, Ethiopia. Proc Natl Acad Sci USA 2013;110(5):1584–91. https://doi.org/10.1073/pnas.1221285110.

[12] Duke H, Feibel C, Harmand S. Before the Acheulean: the emergence of bifacial shaping at Kokiselei 6 (1.8 Ma), West Turkana, Kenya. J Hum Evol 2021;159:103061. https://doi.org/10.1016/j.jhevol.2021.103061.

[13] Lepre CJ, Roche H, Kent DV, Harmand S, Quinn RL, Brugal JP, Texier PJ, Lenoble A, Feibel CS. An earlier origin for the Acheulian. Nature 2011;477(7362):82–5. https://doi.org/10.1038/nature10372.

[14] Roche H, Brugal JP, Delagnes A, Feibel C, Harmand S, Kibunjia M, Prat P, Texier PJ. Les sites arch′eologiques plio-pl′eistoc`enes de la formation de Nachukui,

Ouest-Turkana, Kenya: bilan synth′etique 1997–2001. C R Palevol 2003;2(8):663–73. https://doi.org/10.1016/j.crpv.2003.06.001.

[15] Kuman K. 21. Development of the archaeological record in southern Africa during the earlier stone age. In J. Kingh, & S.W. Grab (editors). Quaternary environmental change in southern Africa: physical and human dimensions. Cambridge: Cambridge University Press; 2016. p. 349–70. https://doi.org/10.1017/CBO9781107295483.021.

[16] Bar-Yosef O. The known and the unknown about the Acheulian. In N. Goren-Inbar, & G. Sharon (editors). Axe age: Acheulian tool-making from quarry to discard. London and Oakville CT: Equinox Publishing Ltd; 2006. p. 479–94. “Approaches to Anthropological Archaeology”. http://refhub.elsevier.com/S1571-0645(24)00004-6/sbref0022

[17] Friston K, Da Costa L, Sakthivadivel DAR, Heins C, Pavliotis GA, Ramstead M, Parr T. Path integrals, particular kinds, and strange things. Phys Life Rev 2023.

https://doi.org/10.1016/j-plrev.2023.08.016. PLREV 1451(pre-proof).

[18]Badcock PB, Friston KJ, Ramstead MJD, Ploeger A, Hohwy J. The hierarchically mechanistic mind: an evolutionary systems theory of the human brain,cognition, and behavior. Cogn Affect Behav Neurosci 2019;19:1319–51. https://doi.org/10.3758/s13415-019-00721-3.

[19] Badcock PB, Friston KJ, Ramstead MJD. The hierarchically mechanistic mind: a free-energy formulation of the human psyche. Phys Life Rev 2019;31(10):104–21. j.plrev.2018.10.002. http://refhub.elsevier.com/S1571-0645(24)00004-6/sbref0018

[20] Parr T, Pezzulo G, Friston K. Active inference: the free energy principle in mind, brain, and behavior. Cambridge MA and London: The MIT Press; 2022. http://refhub.elsevier.com/S1571-0645(24)00004-6/sbref0217

[21] Attias H. Planning by probabilistic inference. In: Proceedings of the Ninth International Workshop on Artificial Intelligence and Statistics; 2003. p. 9–16. PMLRR4. http://refhub.elsevier.com/S1571-0645(24)00004-6/sbref0016

[22] Botvinick M, Toussaint M. Planning as inference. Trends Cogn Sci 2012;16(10):485–8. https://doi.org/10.1016/j.tics.2012.08.006.

[23] Friston K, FitzGerald T, Rigoli F, Schwartenbeck P, Pezzulo G. Active inference: a process theory. Neural Comput 2017;29(1):1–49. https://doi.org/10.1162/NECO_a_00912.

[24] Friston KJ, Lin M, Frith CD, Pezzulo G, Hobson JA, Ondobaka S. Active inference, curiosity and insight. Neural Comput 2017;29(10):2633–83. https://doi.org/10.1162/neco_a_00999.

[25] Millidge, B., (2019). Deep active inference as variational policy gradients. Preprint in arXiv:1907.03876.

[26] Schmidhuber J. Developmental robotics, optimal artificial curiosity, creativity, music, and the fine arts. Connect Sci 2006;18(2):173–87. https://doi.org/10.1080/09540090600768658.

[27] Schwartenbeck P, Passecker J, Hauser TU, FitzGerald THB, Kronbichler M, Friston KJ. Computational mechanisms of curiosity and goal-directed exploration.

eLife 2019;8:41703. https://doi.org/10.7554/eLife.41703.

[28] Still S, Precup D. An information-theoretic approach to curiosity-driven reinforcement learning. Theory Biosci 2012;131(3):139–48. https://doi.org/10.1007/s12064-011-0142-z.

[29] Frank SA. Natural selection. V. How to read the fundamental equations of evolutionary change in terms of information theory. J Evol Biol 2012;25(12):2377–96. https://doi.org/10.1111/jeb.12010.

[30] Friston K, Friedman DA, Constant A, Knight VB, Fields C, Parr T, Campbell JO. A variational synthesis of evolutionary and developmental dynamics. Entropy2023;25:964. https://doi.org/10.39390/e25070964.

[31] Friston K. The free-energy principle: a unified brain theory? Nat Rev Neurosci 2010;11:127–38. https://doi.org/10.1038/nrn2787.

[32] Friston KJ, Rosch R, Parr T, Price C, Bowman H. Deep temporal models and active inference. Neurosci Biobehav Rev 2018;90:486–501. https://doi.org/10.1016/j.neubiorev.2018.04.004.

[33] Parr T, Friston KJ. Generalised free energy and active inference. Biol Cybern 2019;113(5–6):495–513. https://doi.org/10.1007/s00442-019-00805w.

[34] Smith, R., Schwartenbeck, P., Parr, T., & Friston, K.J. (2019). An active inference approach to modeling structure learning: concept learning as an examplecase. Preprint in bioRxiv: 633677. 10.1101/633677. http://10.1101/633677

[35] Ramstead MJD, Badcock PB, Friston KJ. Answering Schr¨odinger’s question: a free-energy formulation. Phys Life Rev 2017;24:1–16. https://doi.org/10.1016/j.plrev.2017.09.001.

[36] Ramstead MJD, Badcock PB, Friston KJ. Variational neuroethology: answering further questions: reply to comments on ‘Answering Schr¨odinger’s question: a

free-energy formulation. Phys Life Rev 2018;24:59–66. https://doi.org/10.1016/j.plrev.2018.01.003.

[37] Ramstead MJD, Constant A, Badcock PB, Friston KJ. Variational ecology and the physics of sentient systems. Phys Life Rev 2019;31:188–205. https://doi.org/10.1016/j.plrev.2018.12.002.

[38]Friston K, Rigoli F, Ognibene D, Mathys C, Fitzgerald T, Pezzulo G. Active inference and epistemic value. Cogn Neurosci 2015;6(4):187–224. https://doi.org/10.1080/17588928.2015.1020053.

[39] Friston K, Adams R, Montague R. What is value - accumulated reward or evidence? Front Neurorobot 2012;6:11. https://doi.org/10.3389/fnbot.2012.00011999.

[40] Manrique HM, Walker MJ. To copy or not to copy? That is the question! From chimpanzees to the foundation of human technological culture. Phys Life Rev2023;45:6–24. https://doi.org/10.1016/j.plrev.2023.02.005.

[41] Hyder F, Rothman DL, Bennett MR. Cortical energy demands of signaling and nonsignaling components in brain are conserved across mammalian species and activity levels. Proc Natl Acad Sci USA 2013;110(9):3549–54. 10.1073 pnas.1214912110. http://refhub.elsevier.com/S1571-0645(24)00004-6/sbref0138

[42] Gould SJ, Lewontin RC. The spandrels of San Marco and the Panglossian paradigm: a critique of the adaptationist program. Proc R Soc Lond Ser B 1979;205(1161):581–98. https://doi.org/10.1002/rspb.1979.0086.

[43] Moore MW. ‘Grammars of action’ and stone flaking design space. In A. Nowell, & I. Davidson, (editors). Stone tools and the evolution of human cognition.Boulder: University Press of Colorado; 2010. p. 13–43. http://refhub.elsevier.com/S1571-0645(24)00004-6/sbref0203