現(xiàn)在,大模型可以做私人導(dǎo)游,為你規(guī)劃Citywalk路線了——

港大MIT等單位聯(lián)合推出ITINERA,將LLM與空間優(yōu)化相結(jié)合,實(shí)現(xiàn)個(gè)性化的開放域城市行程規(guī)劃。

舉個(gè)栗子,用戶輸入“給我規(guī)劃一條包含‘巨富長(zhǎng)’、以靜安寺為終點(diǎn)的citywalk路線”。

ITINERA系統(tǒng)立馬生成了一條包含若干地點(diǎn)的路線,并提供了相應(yīng)的介紹文本。

甚至“適合情侶一起去的酒吧”“二次元圣地”“途經(jīng)網(wǎng)紅打卡點(diǎn)”這樣的個(gè)性化需求,ITINERA也可以理解和滿足。

單看可能沒感覺,咱們直接對(duì)比ITINERA(左側(cè))和GPT-4 CoT生成的路線。

同一提示詞:“我想要一個(gè)文藝的路線,要經(jīng)過(guò)橋和渡輪?!?/p>

可以看到,ITINERA生成的行程會(huì)經(jīng)過(guò)蘇州河沿岸的幾座橋和黃浦江渡輪,在文藝的朵云書店結(jié)束,并且路線較為合理,將地點(diǎn)集中在兩個(gè)空間聚類中。

而右圖中GPT選擇的POI(個(gè)人偏好的興趣點(diǎn))則與用戶要求的橋和渡輪不太相符,還出現(xiàn)了繞路、POI距離過(guò)遠(yuǎn)的情況。除了這個(gè)例子外,GPT有時(shí)還會(huì)出現(xiàn)幻覺,生成不存在的POI。

概括而言,ITINERA具有以下特色

  • 動(dòng)態(tài)信息:實(shí)時(shí)更新POI和當(dāng)前熱門活動(dòng)
  • 個(gè)性定制:優(yōu)先考慮個(gè)人喜好而非僅考慮熱門景點(diǎn)
  • 多樣約束:靈活應(yīng)對(duì)復(fù)雜、多樣的用戶需求
  • 空間智能:結(jié)合空間優(yōu)化算法,確保路線合理高效

ITINERA在四個(gè)城市的旅行行程數(shù)據(jù)集(1233條熱門城市路線、7578個(gè)POI)上進(jìn)行了訓(xùn)練評(píng)估。

結(jié)果顯示,它可以生成比傳統(tǒng)行程規(guī)劃、直接使用LLM等方法更優(yōu)的效果。

目前相關(guān)論文已被KDD Urban Computing Workshop (UrbComp) 2024收錄。

五大模塊組成ITINERA

下一個(gè)問(wèn)題來(lái)了:咋做到的呢?

如下圖所示,ITINERA由大模型驅(qū)動(dòng)的五個(gè)模塊組成。

首先, User-owned POI Database Construction(UPC)模塊從社交平臺(tái)上的旅游內(nèi)容中收集、構(gòu)建用戶興趣點(diǎn)數(shù)據(jù)庫(kù)。

為了規(guī)劃符合用戶請(qǐng)求的行程,Request Decomposition(RD)模塊對(duì)用戶的偏好進(jìn)行解讀和整理,轉(zhuǎn)換為結(jié)構(gòu)化的數(shù)據(jù)形式。

Preference-aware POI Retrieval(PPR)模塊將會(huì)根據(jù)用戶偏好進(jìn)行檢索,獲取最相關(guān)的若干個(gè)興趣點(diǎn)。

為了確保行程在空間上連貫,作者采用了Cluster-aware Spatial Optimization(CSO)模塊,通過(guò)解決分層旅行商問(wèn)題來(lái)空間過(guò)濾和排列檢索的興趣點(diǎn)。

最后,Itinerary Generation(IG)模塊將候選興趣點(diǎn)集與多個(gè)約束相結(jié)合,使用大模型生成既空間合理又符合用戶請(qǐng)求的旅行路線及相關(guān)描述。

原理摸清了,ITINERA實(shí)際表現(xiàn)如何呢?

為了搞清這個(gè)問(wèn)題,作者收集了來(lái)自四個(gè)城市的旅行行程數(shù)據(jù)集,包括用戶請(qǐng)求、相應(yīng)的城市行程路線以及詳細(xì)的興趣點(diǎn)(POI)數(shù)據(jù)。

通過(guò)POI的召回率(RR)、總路程與理論最短路徑的差值(AM)、路線中的交叉點(diǎn)個(gè)數(shù)(OL)、未知POI比例(FR)等客觀指標(biāo),評(píng)測(cè)個(gè)性化推薦POI的準(zhǔn)確度、與用戶請(qǐng)求的匹配度,以及生成路線的空間合理度。

甚至為了解決興趣點(diǎn)吸引力、用戶請(qǐng)求匹配度等方面無(wú)法量化的問(wèn)題,作者還采用了LLM自動(dòng)評(píng)估POI的質(zhì)量、路線的質(zhì)量、行程和用戶請(qǐng)求的匹配程度。

可以看到,與GPT-3.5、GPT-4和GPT-4 CoT等其他方法相比, ITINERA系統(tǒng)在所有指標(biāo)上均表現(xiàn)更好。

用戶和專家評(píng)估的POI質(zhì)量(POI Quality)、行程質(zhì)量(Itinerary Quality)和匹配度(Match)方面,ITINERA系統(tǒng)也獲得了更高的評(píng)分。

總體來(lái)說(shuō),ITINERA能夠從自然語(yǔ)言請(qǐng)求直接生成個(gè)性化、空間連貫的citywalk行程,不僅探究了大模型時(shí)代的開放域行程規(guī)劃問(wèn)題,還提供了在城市應(yīng)用中利用大模型解決復(fù)雜空間相關(guān)問(wèn)題的思路。