The temporal dynamics of group interactions in higher-order social networks
高階社會網(wǎng)絡(luò)中群體互動(dòng)的時(shí)間動(dòng)態(tài)https://arxiv.org/pdf/2306.09967


摘要
將社會系統(tǒng)表示為網(wǎng)絡(luò),從個(gè)體之間的互動(dòng)出發(fā),有助于揭示支配其動(dòng)態(tài)的機(jī)制。然而,網(wǎng)絡(luò)僅能編碼成對的交互,而大多數(shù)社交互動(dòng)發(fā)生在群體之間,這需要更高階的網(wǎng)絡(luò)表示。盡管最近對高階網(wǎng)絡(luò)的興趣增加,但對群體形成與演變的機(jī)制以及人們?nèi)绾卧谌后w之間流動(dòng)仍知之甚少。在此,我們利用關(guān)于兒童和大學(xué)生之間社交互動(dòng)的經(jīng)驗(yàn)數(shù)據(jù),研究其在個(gè)體和群體層面的時(shí)間動(dòng)態(tài),刻畫個(gè)體如何在群體中導(dǎo)航,以及群體如何形成和解散。我們發(fā)現(xiàn)了跨情境的穩(wěn)健模式,并提出了一個(gè)動(dòng)力學(xué)模型,能夠高度復(fù)現(xiàn)經(jīng)驗(yàn)觀察結(jié)果。這些結(jié)果代表了理解社會系統(tǒng)的進(jìn)一步進(jìn)展,并開辟了研究群體動(dòng)態(tài)對在其之上演化的動(dòng)態(tài)過程影響的研究方向。
引言
社交互動(dòng)是我們社會的基石。人類——以及動(dòng)物群體——會形成不同規(guī)模的群體,并已經(jīng)學(xué)會了在緊密的社交圈中溝通和聚集的優(yōu)勢。我們的日常社交路徑實(shí)際上是由涉及不同數(shù)量同伴的群體事件組成的序列,從獨(dú)自步行或與朋友喝咖啡,到參與工作會議或在工作場合或社交聚會中的群體對話。網(wǎng)絡(luò)提供了一種強(qiáng)大的工具來表示這些復(fù)雜的社交軌跡,并能夠編碼個(gè)體之間互動(dòng)的結(jié)構(gòu)和動(dòng)態(tài)。網(wǎng)絡(luò)表示法和社會網(wǎng)絡(luò)分析工具的使用,以及時(shí)間網(wǎng)絡(luò)這一新興領(lǐng)域,幫助識別了支配這些結(jié)構(gòu)形成和演變的機(jī)制。然而,這些傳統(tǒng)的網(wǎng)絡(luò)描述本質(zhì)上僅限于成對交互的描述,無法捕捉社會現(xiàn)象的全部復(fù)雜性。因此,考慮更高階的交互對于表示和建模人類如何在群體中互動(dòng)或動(dòng)物如何聚集是必不可少的。
然而,群體互動(dòng)的結(jié)構(gòu)和動(dòng)態(tài)是復(fù)雜的。群體可能具有異質(zhì)的規(guī)模,可以動(dòng)態(tài)變化,或表現(xiàn)出分層和嵌套的結(jié)構(gòu)。這些特征背后的潛在驅(qū)動(dòng)機(jī)制包括單純形閉合和同質(zhì)性。盡管如此,大多數(shù)關(guān)于群體形成和結(jié)構(gòu)的研究并未考慮到底層社會系統(tǒng)的進(jìn)一步時(shí)間演變——這種演變以記憶和突發(fā)性模式為特征,并表現(xiàn)出群體合并和分裂的復(fù)雜動(dòng)態(tài)。例如,較大的群體往往持續(xù)時(shí)間較短,并表現(xiàn)出較短的時(shí)間相關(guān)性;群體形成和分裂的動(dòng)態(tài)表現(xiàn)出一個(gè)優(yōu)先的時(shí)間方向,且群體的非平凡重復(fù)出現(xiàn)可能由不同的背景和地理互動(dòng)場所驅(qū)動(dòng),從而定義社交圈。這些復(fù)雜的模式是個(gè)體微觀決策的結(jié)果,最終塑造了集體行為的涌現(xiàn)。理解這些機(jī)制對于更好地刻畫群體動(dòng)態(tài)的涌現(xiàn)及其對疾病傳播、信息擴(kuò)散、社會規(guī)范和行為模式等過程的影響至關(guān)重要。
在此,我們通過研究從不同社會和時(shí)間背景中提取的群體動(dòng)態(tài)經(jīng)驗(yàn)數(shù)據(jù)來應(yīng)對這一挑戰(zhàn)。利用兩個(gè)時(shí)間分辨的人類互動(dòng)數(shù)據(jù)集(學(xué)齡前兒童和大學(xué)新生),我們在個(gè)體和群體層面揭示了群體動(dòng)態(tài)的復(fù)雜機(jī)制。通過追蹤個(gè)體在不同規(guī)模群體中的成員身份,我們發(fā)現(xiàn)群體變化的主要?jiǎng)討B(tài)模式與互動(dòng)背景無關(guān)。群體持續(xù)時(shí)間的統(tǒng)計(jì)也表現(xiàn)出穩(wěn)健的特性,所有規(guī)模的群體均呈現(xiàn)“越長越長”效應(yīng)(即更換群體的概率隨在當(dāng)前群體中的停留時(shí)間增加而降低)。此外,群體聚合和解散的動(dòng)態(tài)顯示出分層且高度對稱的組裝和解散特性。最后,我們提出了一種針對時(shí)間交互的動(dòng)力學(xué)模型——明確將群體納入考量——并證明其能夠復(fù)現(xiàn)經(jīng)驗(yàn)?zāi)J健?/p>
我們的研究揭示了群體形成和演變的時(shí)間模式如何從個(gè)體層面的微觀選擇中產(chǎn)生,同時(shí)解釋了社會和時(shí)間記憶的機(jī)制。所提出的模型還可以作為研究群體互動(dòng)及其時(shí)間特性對動(dòng)態(tài)過程影響的綜合結(jié)構(gòu):事實(shí)上,最近基于靜態(tài)超圖的研究表明,群體互動(dòng)可以在社會傳染中引發(fā)臨界質(zhì)量效應(yīng),放大初始的小意見偏差,加速共識和合作的形成,但對演化結(jié)構(gòu)的研究仍然很少??傮w而言,我們的研究為更現(xiàn)實(shí)的建模方法提供了起點(diǎn),以更好地刻畫復(fù)雜社會系統(tǒng)及其附帶過程的現(xiàn)象學(xué)。
結(jié)果
從真實(shí)世界數(shù)據(jù)中提取群體
我們分析了兩項(xiàng)數(shù)據(jù)收集工作的記錄,這些記錄追蹤了大學(xué)和幼兒園中的社交互動(dòng),生成了以時(shí)間網(wǎng)絡(luò)形式呈現(xiàn)的數(shù)據(jù)集。在這些數(shù)據(jù)集中,每個(gè)人被表示為一個(gè)節(jié)點(diǎn),每次互動(dòng)被表示為一條時(shí)間邊(詳見方法部分)。時(shí)間根據(jù)數(shù)據(jù)收集設(shè)置的時(shí)間分辨率進(jìn)行離散化處理。在每個(gè)時(shí)間戳,我們將最大團(tuán)(最大完全連通子圖)定義為群體,并以此構(gòu)建一個(gè)時(shí)間超圖。在每個(gè)時(shí)間戳,每個(gè)節(jié)點(diǎn)可以是孤立的,或?qū)儆谝粋€(gè)或多個(gè)群體(超邊)。
大學(xué)數(shù)據(jù)集我們使用由哥本哈根網(wǎng)絡(luò)研究(CNS)收集的數(shù)據(jù)。這是一組時(shí)間分辨的數(shù)據(jù),描述了丹麥技術(shù)大學(xué)706名新生通過智能手機(jī)藍(lán)牙信號交換記錄的接近事件。我們使用公開可用的數(shù)據(jù),涵蓋連續(xù)四周的接近事件,時(shí)間分辨率為5分鐘。我們將數(shù)據(jù)分為三種不同的背景,這些背景可能導(dǎo)致不同的互動(dòng)模式。首先,我們將所有發(fā)生在周末的互動(dòng)視為一個(gè)獨(dú)立的集合。其次,我們將工作日的互動(dòng)分為課內(nèi)和課外時(shí)間。通過這種方式,我們避免將午餐休息和課間自由時(shí)間中無約束互動(dòng)產(chǎn)生的群體動(dòng)態(tài)與因共同上課或座位安排導(dǎo)致的潛在受限共現(xiàn)混合在一起。此外,對于該數(shù)據(jù)集,我們在提取每個(gè)時(shí)間戳的群體之前進(jìn)行了一些數(shù)據(jù)預(yù)處理,以過濾掉非常弱的互動(dòng)(基于藍(lán)牙接收信號強(qiáng)度指示),平滑間歇性模式,去除虛假連接,并執(zhí)行帶有定制參數(shù)的標(biāo)準(zhǔn)三角閉合程序。更多關(guān)于數(shù)據(jù)集和預(yù)處理的詳細(xì)信息請參見方法部分。
幼兒園數(shù)據(jù)集我們還分析了另一個(gè)數(shù)據(jù)集,這是作為DyLNet項(xiàng)目的一部分在一所幼兒園收集的,用于追蹤3至6歲兒童及其教師和助教的社交互動(dòng)。該數(shù)據(jù)描述了174名兒童和34名成人之間的接近社交互動(dòng),這些互動(dòng)由每位參與者攜帶的射頻識別(RFID)無線接近傳感器記錄?;?dòng)以5秒的時(shí)間分辨率記錄,覆蓋了一個(gè)法國幼兒園單個(gè)學(xué)年的連續(xù)10個(gè)月中(總計(jì)50天的數(shù)據(jù)收集),每次連續(xù)5天的互動(dòng)記錄。為了我們的研究目的,我們依賴于文獻(xiàn)中共享的預(yù)處理數(shù)據(jù)集以及從清理后的互動(dòng)信號重建的時(shí)間網(wǎng)絡(luò),并且我們移除了成人之間及與成人的互動(dòng)數(shù)據(jù),以便專注于兒童的群體動(dòng)態(tài)。
與大學(xué)環(huán)境類似,我們也根據(jù)可能對群體互動(dòng)產(chǎn)生不同約束的背景對數(shù)據(jù)進(jìn)行了劃分。我們區(qū)分了課內(nèi)時(shí)間段(在此期間,兒童的社交分組受到教師指令和計(jì)劃活動(dòng)的強(qiáng)烈影響)和課外時(shí)間段(此時(shí)兒童可以自由選擇與自己班級或潛在其他班級的任何人互動(dòng))。有關(guān)數(shù)據(jù)預(yù)處理、網(wǎng)絡(luò)重建和背景選擇的更多細(xì)節(jié),請參見方法部分。
群體變化的動(dòng)力學(xué)
群體互動(dòng)復(fù)雜性的一個(gè)初步粗略總結(jié)通過群體規(guī)模的異質(zhì)性得以揭示,這一點(diǎn)已在多項(xiàng)研究中有所記錄。我們在圖1A和B中確認(rèn)了這一發(fā)現(xiàn),即時(shí)群體規(guī)模的分布具有相似的形狀,但涵蓋的范圍不同:大學(xué)中的互動(dòng)(圖A)表現(xiàn)出比幼兒園(圖B)更大的群體規(guī)模,這可能是由于數(shù)據(jù)收集基礎(chǔ)設(shè)施中使用的藍(lán)牙信號范圍更長所致。此外,我們觀察到,在學(xué)生或兒童可以自由互動(dòng)的情境下(如課外時(shí)間和周末),他們傾向于聚集在較小的群體中。
然而,規(guī)模分布本質(zhì)上是一個(gè)聚合的可觀測量,無法為我們提供關(guān)于互動(dòng)動(dòng)態(tài)的信息:一個(gè)特定節(jié)點(diǎn)可能在不同時(shí)間屬于規(guī)模差異很大的群體,正如時(shí)間網(wǎng)絡(luò)中的節(jié)點(diǎn)在不同時(shí)間可能具有非常不同的鄰居數(shù)量或中心性值。因此,我們現(xiàn)在研究個(gè)體的群體成員身份如何在不同規(guī)模之間演變(一些示例軌跡可在補(bǔ)充信息的圖S1和S2中找到)。在此方面,需要強(qiáng)調(diào)的是,當(dāng)我們提到節(jié)點(diǎn)的“群體變化”時(shí),我們是在最廣泛的意義上進(jìn)行解釋,即這并不一定意味著該節(jié)點(diǎn)主動(dòng)從一個(gè)群體切換到另一個(gè)群體。事實(shí)上,從某個(gè)個(gè)體的角度來看,群體變化也可能是因?yàn)榱硪粋€(gè)人加入或離開了當(dāng)前群體。在這種方法下,為了避免在群體成員發(fā)生變化時(shí)隨意決定群體“標(biāo)簽”如何傳播,我們的分析是純粹基于觀察的,并且對個(gè)體意圖保持不可知態(tài)度。

這一現(xiàn)象與“突發(fā)性”密切相關(guān),這是經(jīng)驗(yàn)時(shí)間網(wǎng)絡(luò)中的一個(gè)重要特征,其中節(jié)點(diǎn)(或鏈接)的非活動(dòng)期呈異質(zhì)分布。超越成對互動(dòng)后,節(jié)點(diǎn)的非活動(dòng)期對應(yīng)于規(guī)模為1的群體,即當(dāng)節(jié)點(diǎn)孤立時(shí)。因此,圖2確認(rèn)了節(jié)點(diǎn)層面存在突發(fā)性的非活動(dòng)期。這也通過一些選定節(jié)點(diǎn)的群體規(guī)模隨時(shí)間變化的例子得到說明(見補(bǔ)充信息圖S1和S2)。正如預(yù)期,節(jié)點(diǎn)表現(xiàn)出高度異質(zhì)的參與水平——涉及中型和大型群體的活躍期不可避免地在不同節(jié)點(diǎn)之間相關(guān)聯(lián)。除了圖2中給出的節(jié)點(diǎn)事件間時(shí)間分布外,我們還發(fā)現(xiàn)不同互動(dòng)情境下群體層面的突發(fā)性。這可以從補(bǔ)充信息圖S4和S5中報(bào)告的事件間時(shí)間分布推斷出來,即使在按群體規(guī)模分解后,這些分布仍然廣泛分布。這一分析擴(kuò)展了文獻(xiàn)中描述的結(jié)果,涵蓋了非常不同的背景,表明接觸統(tǒng)計(jì)模式的強(qiáng)穩(wěn)健性超出了早期研究中描述的成對互動(dòng)范圍,并暗示了在不同背景下決定接觸和群體形成、持續(xù)時(shí)間及演化的共同穩(wěn)健機(jī)制。
為了進(jìn)一步深入研究,我們現(xiàn)在探討群體如何變化:事實(shí)上,上述引入并在圖1中展示的節(jié)點(diǎn)轉(zhuǎn)移矩陣僅提供了關(guān)于實(shí)際群體動(dòng)態(tài)的部分信息。所采用的個(gè)體視角有助于理解個(gè)體群體成員身份如何在不同規(guī)模之間演變,但這些個(gè)體變化對群體規(guī)模的影響需要獨(dú)立分析。例如,雖然圖2表明較大的群體往往壽命較短,但它們是如何分解的仍然是一個(gè)未解之謎。同樣,一個(gè)群體可能是由于兩個(gè)規(guī)模相近的現(xiàn)有群體融合而出現(xiàn)的——就像水滴因表面張力重疊后合并,或者通過逐漸每次整合一個(gè)個(gè)體的過程形成。為了解決這一問題,我們追蹤了每個(gè)群體的成員,在群體“出生”之前和“解散”之后進(jìn)行觀察。此外,我們將相同規(guī)模的群體結(jié)果匯總在一起,以檢查不同規(guī)模的群體是否經(jīng)歷了不同的聚合和分解動(dòng)態(tài)。對于每種群體規(guī)模k ,我們在圖3中展示了熱圖(每個(gè)情境一張),顯示了在群體“出生”前或“死亡”后觀察到的最大成員子集的規(guī)模分布(詳見方法部分)。對于較小的群體規(guī)模,群體的聚合和分解往往逐漸從或向相似規(guī)模的群體發(fā)生。這與先前關(guān)于三體互動(dòng)形成的研究結(jié)果一致。對于越來越大的群體,情況會略有情境依賴的變化??傮w情況是,沒有觀察到從同等規(guī)模的群體合并(或分裂)的現(xiàn)象,這從純組合學(xué)的角度來看是可以預(yù)期的。中型和大型群體往往是由一個(gè)稍小規(guī)模的群體加入一個(gè)或幾個(gè)小型群體形成的,并且對稱地,它們也會以小規(guī)模塊的形式失去成員,但仍保持中型到大型規(guī)模。這指向了一種部分分層的動(dòng)力學(xué)機(jī)制:個(gè)體首先參與小型群體,隨后小型、中型和大型群體逐步聚合形成更大的群體。當(dāng)大型群體解散時(shí),會發(fā)生一個(gè)對稱的過程——首先分解為較小的中型子群體,然后逐漸每次失去一個(gè)成員。



基于數(shù)據(jù)驅(qū)動(dòng)的群體演化動(dòng)力學(xué)模型
大多數(shù)描述社交互動(dòng)時(shí)間演化的模型考慮的是網(wǎng)絡(luò)表示形式,即基于支配成對互動(dòng)如何建立和相繼斷開的機(jī)制。在此,我們描述了一種明確整合個(gè)體如何形成任意規(guī)模群體的模型:在每個(gè)時(shí)間步,個(gè)體可以選擇留在當(dāng)前群體、離開并加入另一個(gè)群體,或者變得孤立。





不同情境和數(shù)據(jù)集的結(jié)果分別在補(bǔ)充信息的圖 S10 和 S11 中報(bào)告,對應(yīng)于 CNS 和 DyLNet 數(shù)據(jù)集。在所有情況下,邏輯函數(shù)擬合均落在經(jīng)驗(yàn)測量值的置信區(qū)間內(nèi),這證明了選擇邏輯函數(shù)的合理性。




模型再現(xiàn)了高階動(dòng)力學(xué)特征
我們現(xiàn)在探討上述定義的模型捕捉群體互動(dòng)動(dòng)態(tài)中揭示的關(guān)鍵經(jīng)驗(yàn)特征的能力。由于經(jīng)驗(yàn)結(jié)果在不同數(shù)據(jù)集和情境下均具有魯棒性,我們以課外時(shí)間發(fā)生的大學(xué)互動(dòng)為例。因此,我們運(yùn)行該模型,初始化 (N = 700) 個(gè)代理,持續(xù) (T = 2000) 個(gè)時(shí)間步,使用不同的參數(shù)值根據(jù)圖 4A 的測量結(jié)果設(shè)為 0.8。模型的每次實(shí)現(xiàn)生成一個(gè)時(shí)間有序的超圖序列,我們可以像分析經(jīng)驗(yàn)數(shù)據(jù)一樣對其進(jìn)行分析,特別是獲得群體規(guī)模分布和群體規(guī)模轉(zhuǎn)移矩陣。正如方法部分所述,我們因此可以基于這兩個(gè)可觀測量聯(lián)合擬合模型。

我們在圖5中展示了表現(xiàn)最佳的模型結(jié)果。所有獲得的結(jié)果均與分析的經(jīng)驗(yàn)數(shù)據(jù)一致。群體規(guī)模分布(圖5A)涵蓋的范圍與圖1A中的經(jīng)驗(yàn)觀察值相當(dāng)。從節(jié)點(diǎn)視角出發(fā)的群體變化動(dòng)力學(xué)的群體規(guī)模轉(zhuǎn)移矩陣如圖5B所示,小規(guī)模群體呈現(xiàn)出類似的對稱模式,而由于較大群體的截?cái)嘈?yīng),存在向較小規(guī)模的偏移,正如圖1C所示。需要注意的是,盡管其他群體特性未被納入模型參數(shù)的探索中,它們同樣被復(fù)現(xiàn)了。事實(shí)上,群體持續(xù)時(shí)間分布(圖5C)顯示出寬尾特征,并且與圖2B中經(jīng)驗(yàn)觀察到的群體規(guī)模依賴性相似。更重要的是,即使是復(fù)雜的動(dòng)態(tài)特征,例如群體分解和聚合概率分布(圖5D),也與經(jīng)驗(yàn)發(fā)現(xiàn)(圖3B)相似,這表明所提出的模型在解釋和再現(xiàn)群體互動(dòng)動(dòng)態(tài)的復(fù)雜現(xiàn)象方面具有極強(qiáng)的能力。

我們在此通過兩個(gè)數(shù)據(jù)集分析了群體動(dòng)態(tài)視角下的人類互動(dòng),這些數(shù)據(jù)分別來自學(xué)齡前兒童和大學(xué)新生。盡管由于年齡、情境以及諸如課程安排等環(huán)境約束導(dǎo)致他們的互動(dòng)本質(zhì)上存在差異,并且數(shù)據(jù)收集技術(shù)也有所不同,但我們發(fā)現(xiàn)了在個(gè)體和群體層面上驚人相似的群體動(dòng)態(tài)。特別是,我們觀察到類似的群體規(guī)模和持續(xù)時(shí)間分布,更重要的是,在兩種情境中,甚至在對應(yīng)于不同類型活動(dòng)的時(shí)間段內(nèi),個(gè)體群體轉(zhuǎn)換以及群體形成和解散現(xiàn)象的動(dòng)力學(xué)模式是一致的。值得注意的是,我們在補(bǔ)充信息中展示了這些特征也可以在其他情境的數(shù)據(jù)中找到,例如在GESIS組織的四次不同科學(xué)會議期間發(fā)生的社交互動(dòng)(見補(bǔ)充信息,注釋1及圖S14、S15、S16、S17、S18、S19)。那些數(shù)據(jù)中報(bào)告的互動(dòng)個(gè)體比我們在此分析的大學(xué)和幼兒園場景更加多樣化:會議參與者覆蓋了廣泛的年齡范圍,互動(dòng)涉及不同資歷層次的人員。即使是情境也可以被視為課堂內(nèi)外設(shè)置的混合體,因?yàn)闀h日程通常比課程提供更多的自由——參與者往往不會參加所有會議。盡管存在所有這些差異,仍觀察到非常相似的群體統(tǒng)計(jì)和群體變化模式。當(dāng)然,進(jìn)一步擴(kuò)展這些結(jié)果,考慮更多人類互動(dòng)的情境以確認(rèn)這種群體動(dòng)態(tài)及其規(guī)模變化模式的普遍性將是非常有趣的。
我們的分析和結(jié)果為獲得比僅限于成對互動(dòng)更完整的社會動(dòng)態(tài)表示做出了貢獻(xiàn)。因此,我們提出了一個(gè)綜合模型,描述代表個(gè)體的節(jié)點(diǎn)如何形成群體并在不同規(guī)模的群體之間導(dǎo)航。該模型包括短期記憶(“越長越長”效應(yīng))和長期社會記憶(加入包含已接觸過個(gè)體的群體的概率更高,見補(bǔ)充信息圖S20),并能夠從以節(jié)點(diǎn)為中心的視角和群體形成與解散的視角再現(xiàn)復(fù)雜的群體變化動(dòng)力學(xué)。需要注意的是,無論是在討論不同經(jīng)驗(yàn)背景下所獲模式的穩(wěn)健性時(shí),還是在驗(yàn)證模型時(shí),我們都停留在現(xiàn)象學(xué)層面,原因有以下幾點(diǎn)。首先,目前尚無公認(rèn)的量化指標(biāo)來衡量兩個(gè)時(shí)間網(wǎng)絡(luò)或時(shí)間超圖之間的距離或相似性。其次,我們研究的數(shù)據(jù)集具有不同的規(guī)模和最大群體規(guī)模,因此我們關(guān)注的矩陣大小不同,分布的截?cái)嘀狄膊煌?。第三,我們避免對函?shù)的具體形狀(尤其是寬分布的情況)或普適性提出主張,因?yàn)檫@類主張眾所周知難以證實(shí)或反駁。最后,即使我們定義了一種結(jié)合各種可觀測量的特別量化差異指標(biāo),我們也缺乏參考值來進(jìn)行比較。
得益于其逼真的群體動(dòng)態(tài),我們的模型可用于生成合成基底,以研究高階時(shí)間互動(dòng)對動(dòng)態(tài)過程的影響。事實(shí)上,盡管高階互動(dòng)對各種動(dòng)態(tài)過程的影響已被充分評估,但關(guān)于經(jīng)歷真實(shí)時(shí)間演化的結(jié)構(gòu)的研究仍然很少。群體動(dòng)態(tài)與許多情境中的關(guān)鍵過程之間的相互作用可能被證明是相關(guān)的,例如采納行為動(dòng)態(tài)、意見形成的動(dòng)態(tài),還包括同步、合作以及其他進(jìn)化動(dòng)態(tài)過程??傮w而言,我們的研究結(jié)果呼吁發(fā)展更多建模方法,顯式考慮社會互動(dòng)的時(shí)間性和多體性質(zhì),既為了理解復(fù)雜群體動(dòng)態(tài)涌現(xiàn)的機(jī)制,也為了研究此類群體聚集對集體動(dòng)態(tài)的影響。例如,該模型可以擴(kuò)展到其他形式的記憶,正如在成對互動(dòng)中探索的那樣。此外,我們實(shí)現(xiàn)的模型依賴于一組極簡機(jī)制來塑造節(jié)點(diǎn)的行為。未來的工作可以通過整合同質(zhì)性驅(qū)動(dòng)的決策和與社會結(jié)構(gòu)共同演化的意見動(dòng)態(tài)機(jī)制,進(jìn)一步豐富這些規(guī)則(用于群體變化和選擇)。值得注意的是,所有這些方法不應(yīng)局限于人類,因?yàn)榉侨祟悇?dòng)物也被證明對高階社會效應(yīng)敏感,并且在成對互動(dòng)層面觀察到了與人類互動(dòng)相似的復(fù)雜特征。然而,要將行為響應(yīng)與非成對互動(dòng)相結(jié)合,還需要進(jìn)一步研究,同時(shí)考慮額外的環(huán)境、文化和生態(tài)因素——例如因資源競爭而分裂,或?yàn)榉烙妒痴叨奂扇?。事?shí)上,在某些情況下,動(dòng)物群體形成的驅(qū)動(dòng)因素可能具有遺傳根源?;蛘?,可以嘗試設(shè)計(jì)一種微觀基礎(chǔ)原則,用以解釋群體規(guī)模的時(shí)間演化,類似于用于集體行動(dòng)問題的進(jìn)化模型,平衡成本和收益。沿著這一思路,已有研究對基于科學(xué)合作構(gòu)建的靜態(tài)超圖的不同群體規(guī)模給出了博弈論解釋。
我們的結(jié)果不可避免地依賴于給定的群體互動(dòng)定義,這是從成對數(shù)據(jù)構(gòu)建的,代表了現(xiàn)實(shí)世界群體遭遇的代理,同時(shí)也取決于數(shù)據(jù)的時(shí)間分辨率。鑒于目前尚無專門設(shè)計(jì)用于追蹤群體互動(dòng)的縱向數(shù)據(jù)收集工作,可以探索多個(gè)研究方向。例如,檢查經(jīng)驗(yàn)結(jié)果對其他群體或超邊定義的穩(wěn)健性將是有趣的,這些定義可以從測量成對互動(dòng)獲得的數(shù)據(jù)中提取,例如使用貝葉斯推理方法區(qū)分超邊與低階互動(dòng)組合,或提取統(tǒng)計(jì)顯著的超邊。甚至我們使用的嚴(yán)格群體定義也可能受到挑戰(zhàn),取而代之的是采用更寬松的條件,并允許節(jié)點(diǎn)具有多重成員身份的可能性。
總之,我們的研究有助于更好地理解人類行為中群體形成和解散以及社交群體間導(dǎo)航的過程。我們期望所呈現(xiàn)的分析能夠支持在社會與行為科學(xué)交叉領(lǐng)域工作的研究人員,而所提出的模型可以直接用于為互動(dòng)人群中的社會傳染、規(guī)范涌現(xiàn)和傳播現(xiàn)象提供更真實(shí)的模擬依據(jù)。
方法
數(shù)據(jù)描述與預(yù)處理
哥本哈根網(wǎng)絡(luò)研究我們使用通過哥本哈根網(wǎng)絡(luò)研究(CNS)收集的數(shù)據(jù),該數(shù)據(jù)代表了通過丹麥技術(shù)大學(xué)706名新生攜帶的手機(jī)藍(lán)牙信號收集的時(shí)間分辨接近數(shù)據(jù)。公開可用的數(shù)據(jù)對應(yīng)于一個(gè)學(xué)期中四周內(nèi)記錄的數(shù)據(jù),描述了學(xué)生之間的接近情況,時(shí)間分辨率為5分鐘。原始數(shù)據(jù)(已在參考文獻(xiàn)43中進(jìn)行了預(yù)處理)包含5,474,289條記錄。每條記錄包含時(shí)間戳、一個(gè)用戶(自我)的ID、另一個(gè)用戶(他者)的ID以及以dBm為單位測量的接收信號強(qiáng)度指示(RSSI)。數(shù)據(jù)已經(jīng)過處理,忽略了每次互動(dòng)的方向性(哪個(gè)設(shè)備正在掃描)??諕呙瑁ㄎ窗l(fā)現(xiàn)其他設(shè)備)報(bào)告為0 RSSI,這對應(yīng)于孤立節(jié)點(diǎn)。
我們根據(jù)一天中的時(shí)間和一周中的日期將數(shù)據(jù)記錄分為三個(gè)主要時(shí)間段。盡管發(fā)布的數(shù)據(jù)中沒有包含精確的時(shí)間和日期信息,但可以通過將時(shí)間序列中的活動(dòng)模式與DTU本科課程的官方時(shí)間表進(jìn)行交叉檢查輕松推斷出這些信息。得出的情境如下:
工作周(課內(nèi)):周一至周五,上午8點(diǎn)至下午5點(diǎn)。
工作周(課外):周一至周五,午夜12點(diǎn)至上午8點(diǎn),以及下午5點(diǎn)至晚上11點(diǎn)59分。
周末:周六和周日。
我們進(jìn)一步以以下方式清理數(shù)據(jù)。首先,通過刪除所有參與者設(shè)備掃描到未參與實(shí)驗(yàn)的設(shè)備的記錄來移除外部用戶(最終保留4,646,415條記錄)。然后,我們僅保留RSSI高于-90dBm的記錄(見補(bǔ)充信息圖S21)。這比參考文獻(xiàn)83中使用的-80dBm閾值略寬松,后者用于選擇發(fā)生在2米半徑內(nèi)的互動(dòng)(這是親密熟人之間社交互動(dòng)的典型距離)。完成此步驟后,我們得到了3,824,052條記錄,分為1,603,916對成對互動(dòng)和2,220,136次空掃描。我們將后者視為孤立節(jié)點(diǎn)。
接著,我們按照參考文獻(xiàn)32的方法執(zhí)行三個(gè)預(yù)處理步驟。首先,為了平滑成對互動(dòng),我們查找所有由在時(shí)間t-1和t+1存在但在時(shí)間t不存在的成對互動(dòng)組成的時(shí)間間隔。我們通過使用相鄰時(shí)間戳的平均RSSI填補(bǔ)了由此產(chǎn)生的163,349個(gè)間隔(如果存在,最終替換掉來自兩個(gè)互動(dòng)節(jié)點(diǎn)之一的空掃描記錄)。其次,我們通過移除所有僅在時(shí)間t存在但在時(shí)間t-1和t+1不存在的130,935個(gè)成對信號來過濾掉虛假互動(dòng),最終保留3,855,139條記錄。這也與參考文獻(xiàn)32中執(zhí)行的程序一致,該程序基于羅切斯特互動(dòng)記錄的約定,即一次接觸需要持續(xù)10分鐘或更長時(shí)間才能被歸類為有意義的互動(dòng)。
第三,我們執(zhí)行三角閉合。具體來說,如果在時(shí)間 t 用戶 i 掃描到用戶 j ,而用戶 j 掃描到用戶 k ,那么我們還會添加(如果尚未存在)用戶 i 和用戶 k 之間的主動(dòng)掃描記錄。我們?yōu)檫@次互動(dòng)分配另外兩個(gè)信號中較低的 RSSI 值。執(zhí)行三角閉合的一個(gè)潛在隱患是向 RSSI 較低的事件中添加大量鏈接。特別是,如果我們根據(jù) RSSI 過濾由于三角閉合而新增的鏈接數(shù)量,我們會注意到這個(gè)數(shù)量與 RSSI 呈冪律關(guān)系(見補(bǔ)充信息圖 S22)。為了避免閉合與“弱”事件相關(guān)的三角形,我們?yōu)樾略鲦溄拥?RSSI 選擇了一個(gè)額外的閾值:-75dBm。這是能夠保留不同情境下群體規(guī)模分布的最低閾值(見補(bǔ)充信息圖 S23)。補(bǔ)充信息圖 S24 和 S25 分別顯示了使用所選閾值進(jìn)行三角閉合對隨時(shí)間變化的鏈接和群體數(shù)量的影響。通過時(shí)間觀察可以發(fā)現(xiàn),新增的鏈接本身并未顯著影響跟蹤的鏈接數(shù)量,但有助于減少群體數(shù)量——將原本可能斷開的組件合并在一起。
作為最后一步,我們檢查在上述過程中移除的鏈接是否為某個(gè)節(jié)點(diǎn)在該特定時(shí)間的唯一互動(dòng)(同時(shí)考慮三角閉合)。如果是這種情況,我們將該節(jié)點(diǎn)重新添加到記錄中,并將其標(biāo)記為孤立節(jié)點(diǎn)。最終,我們得到了一個(gè)包含 3,991,329 條記錄的預(yù)處理數(shù)據(jù)集。
DyLNet 研究
DyLNet 數(shù)據(jù)集的收集目的是縱向觀察學(xué)齡前兒童社交網(wǎng)絡(luò)與語言發(fā)展的共同演化。數(shù)據(jù)收集是在一所法國幼兒園進(jìn)行的,記錄了 174 名 3 至 6 歲兒童及其教師和助教的代理社交互動(dòng)和語音數(shù)據(jù)。在本研究中,我們依賴于文獻(xiàn)中公開共享的數(shù)據(jù),并專注于近距社交互動(dòng)數(shù)據(jù),這些數(shù)據(jù)每周在 9 個(gè)時(shí)段(5 個(gè)上午和 4 個(gè)下午時(shí)段——法國周三沒有課程)內(nèi)記錄,覆蓋了單個(gè)學(xué)年的連續(xù) 10 個(gè)月。數(shù)據(jù)收集是通過安裝在參與者身上的自主射頻識別(RFID)無線近距傳感器完成的(使用 IEEE 802.15.4 低速率無線標(biāo)準(zhǔn)進(jìn)行通信)。真實(shí)數(shù)據(jù)通過現(xiàn)場或受控實(shí)驗(yàn)設(shè)置收集。設(shè)備每 5 秒以 0 dBm 的傳輸功率廣播一個(gè)“hello”數(shù)據(jù)包,持續(xù)時(shí)間為 384 微秒,其余時(shí)間則處于監(jiān)聽模式,以記錄其他代理設(shè)備的 ID 和 RSSI(如果接收到的信號達(dá)到 -94 dBm 的最小靈敏度值)。相互檢測到的設(shè)備配對表示近距互動(dòng),并經(jīng)過進(jìn)一步預(yù)處理,最終生成一個(gè)無向的時(shí)間網(wǎng)絡(luò)。該網(wǎng)絡(luò)中的互動(dòng)表示參與者在 2 米范圍內(nèi)的面對面接近,時(shí)間分辨率為 5 秒。
以重建的網(wǎng)絡(luò)為起點(diǎn),我們從數(shù)據(jù)中移除了教師,僅關(guān)注兒童。數(shù)據(jù)還被進(jìn)一步豐富了信息。例如,每次成對互動(dòng)的記錄都附帶一個(gè) 5 位數(shù)字標(biāo)簽,用于跟蹤互動(dòng)開始和結(jié)束時(shí)兩個(gè)人的身份及其所屬的情境類別。利用這些信息以及每個(gè)個(gè)體的身份和班級歸屬(類似于 CNS 數(shù)據(jù)集),我們可以將互動(dòng)分為兩類:
課內(nèi)互動(dòng):屬于同一班級的兒童之間的互動(dòng),且互動(dòng)開始和結(jié)束均在上課時(shí)間內(nèi)。屬于不同班級的兒童在上課時(shí)間內(nèi)的虛假互動(dòng),或從上課時(shí)間開始但在自由時(shí)間內(nèi)結(jié)束的互動(dòng)均被移除;
課外互動(dòng):任何班級的兒童之間的互動(dòng),且互動(dòng)開始和結(jié)束均在自由時(shí)間內(nèi)。從上課時(shí)間開始但在自由時(shí)間內(nèi)結(jié)束(或反之)的虛假互動(dòng)也被移除。
與 CNS 數(shù)據(jù)集不同,周末并未進(jìn)行數(shù)據(jù)收集。盡管原始數(shù)據(jù)的時(shí)間分辨率為 5 秒,但由于沒有中央單元同步每個(gè)參與者佩戴的徽章時(shí)鐘(每天僅同步一次),我們移除了持續(xù)時(shí)間少于 10 秒的互動(dòng)。最后,與 CNS 不同的是,DyLNet 數(shù)據(jù)記錄未明確包含孤立的參與者,即在某個(gè)時(shí)間戳未參與任何互動(dòng)的兒童。因此,我們?yōu)槊總€(gè)兒童“補(bǔ)回”了孤立記錄,在那些未與其他節(jié)點(diǎn)互動(dòng)的時(shí)間戳中添加記錄,但前提是該兒童在同一節(jié)課期間至少有一次互動(dòng)。











補(bǔ)充說明 1 – GESIS 會議互動(dòng)數(shù)據(jù)集
我們使用了 SocioPatterns 合作項(xiàng)目在德國萊布尼茨社會科學(xué)研究機(jī)構(gòu)(GESIS)組織的四次不同科學(xué)會議中收集的公開數(shù)據(jù)。這些會議包括:2016 年第三屆 GESIS 計(jì)算社會科學(xué)冬季研討會(WS16)、2017 年國際計(jì)算社會科學(xué)會議(ICCSS17)、2018 年歐洲計(jì)算社會科學(xué)研討會(ECSS18)以及 2019 年第 41 屆歐洲信息檢索會議(ECIR19)。這些會議具有高度跨學(xué)科性,涵蓋了從計(jì)算機(jī)科學(xué)到社會科學(xué)和自然科學(xué)的廣泛主題。
數(shù)據(jù)由可穿戴 RFID 傳感器測量,記錄了與會者之間的面對面互動(dòng),時(shí)間分辨率為 20 秒。數(shù)據(jù)收集的詳細(xì)信息,包括收集技術(shù)及互動(dòng)分析,均在原始參考文獻(xiàn)中呈現(xiàn)。每次會議的原始數(shù)據(jù)分別包含以下條目數(shù):WS16 為 153,371 條,ICCSS17 為 229,536 條,ECSS18 為 96,362 條,ECIR19 為 132,949 條。我們按照大學(xué)數(shù)據(jù)集的處理方式,將這些記錄聚合為 5 分鐘的時(shí)間窗口,最終得到 WS16 為 38,832 條,ICCSS17 為 58,745 條,ECSS18 為 24,637 條,ECIR19 為 34,217 條記錄。然后,我們將孤立節(jié)點(diǎn)添加到數(shù)據(jù)中。具體來說,對于每次會議,我們考慮所有曾經(jīng)出現(xiàn)的節(jié)點(diǎn),并在它們首次出現(xiàn)后的每個(gè)時(shí)間步中添加該節(jié)點(diǎn)處于孤立狀態(tài)的記錄。至此,數(shù)據(jù)分別擴(kuò)展為 WS16 為 46,915 條,ICCSS17 為 98,124 條,ECSS18 為 35,124 條,ECIR19 為 61,371 條記錄。
















原文鏈接:https://arxiv.org/pdf/2306.09967
熱門跟貼