當(dāng)前,基于成對(duì)的排序方法雖然在局部關(guān)系建模上表現(xiàn)出色,但是缺乏全局優(yōu)化能力。

而基于列表的深度學(xué)習(xí)方法雖側(cè)重整體排序優(yōu)化,卻因復(fù)雜的調(diào)參流程和跨領(lǐng)域遷移時(shí)的魯棒性不足,限制了其實(shí)用性。于是愛(ài)丁堡大學(xué)李尉銜博士和所在團(tuán)隊(duì)開(kāi)始思考是否能把列表和成對(duì)排序的優(yōu)點(diǎn)都結(jié)合起來(lái)。
研究初期有兩篇論文給了他們帶來(lái)了很大啟發(fā):一是本論文作者之一謝伊·科恩(Shay Cohen)教授早期關(guān)于利用組合優(yōu)化推理食譜順序的研究[1];二是李尉銜的大學(xué)同學(xué)Yixuan He關(guān)于GNNRank的研究[2],該研究通過(guò)利用圖神經(jīng)網(wǎng)絡(luò)建模成對(duì)關(guān)系從而能夠恢復(fù)全局排序。
受到這些工作的啟發(fā),研究團(tuán)隊(duì)將排序問(wèn)題轉(zhuǎn)化為圖建模問(wèn)題,并借助旅行商問(wèn)題與排序問(wèn)題的結(jié)構(gòu)相似性,提出了一種全新的解決方案——TSPRank。
TSPRank通過(guò)將排序問(wèn)題重構(gòu)為旅行商問(wèn)題,結(jié)合成對(duì)建模的局部?jī)?yōu)勢(shì)和全局優(yōu)化能力,為復(fù)雜排序問(wèn)題提供了創(chuàng)新性解決方案。
研究團(tuán)隊(duì)在三個(gè)不同領(lǐng)域(股票排名、信息檢索、歷史事件排序)和多模態(tài)輸入(數(shù)值與文本)上進(jìn)行了實(shí)驗(yàn),驗(yàn)證了TSPRank的跨領(lǐng)域適用性和優(yōu)越性能。
對(duì)于相關(guān)論文,審稿人認(rèn)為TSPRank將排序問(wèn)題重構(gòu)為旅行商問(wèn)題的想法非常新穎,結(jié)合了成對(duì)建模的魯棒性與全局優(yōu)化的能力,為解決傳統(tǒng)排序方法的局限性提供了新思路。
此外,實(shí)驗(yàn)設(shè)計(jì)的全面性和結(jié)果的有效性也得到了審稿人的肯定。與此同時(shí),審稿人也提出了一些建設(shè)性建議,例如進(jìn)一步解釋局部與全局建模的結(jié)合點(diǎn)以及優(yōu)化目標(biāo)與排序誤差之間的關(guān)系。
同時(shí),審稿人建議未來(lái)應(yīng)在更大規(guī)模的數(shù)據(jù)場(chǎng)景下探索低延遲的求解器,以便提升TSPRank的計(jì)算效率。
在金融領(lǐng)域,TSPRank可以用于股票排名和投資組合優(yōu)化,幫助投資者在多維特征下進(jìn)行資產(chǎn)篩選和排序,從而提高投資決策的準(zhǔn)確性和效率。
在搜索引擎和信息檢索領(lǐng)域,TSPRank可以作為重排序(reranking)模塊,提升檢索結(jié)果的相關(guān)性和用戶體驗(yàn)。它能夠利用精細(xì)化的全局優(yōu)化策略,在初步檢索后的結(jié)果中對(duì)文檔或網(wǎng)頁(yè)進(jìn)行更準(zhǔn)確的排序,從而確保用戶在查詢結(jié)果的前幾項(xiàng)中看到最優(yōu)內(nèi)容。
此外,TSPRank在教育和科學(xué)研究中也有潛在應(yīng)用。例如,在學(xué)術(shù)論文排序中,它可以綜合不同的評(píng)價(jià)指標(biāo)(如引文、下載量和閱讀量)生成更合理的推薦順序,為研究人員提供更相關(guān)的參考文獻(xiàn)。在教育領(lǐng)域,它可以用于學(xué)生評(píng)估或?qū)W校排名,通過(guò)整合多維數(shù)據(jù)(如考試成績(jī)、活動(dòng)參與度、教師評(píng)估)提供更加精準(zhǔn)的排序。
目前,TSPRank的主要限制在于推理延遲問(wèn)題。由于旅行商問(wèn)題本質(zhì)上是NP-Hard的,其求解時(shí)間會(huì)隨著問(wèn)題規(guī)模的增加呈指數(shù)增長(zhǎng)。因此,現(xiàn)階段TSPRank的應(yīng)用主要局限于中小規(guī)模的場(chǎng)景,例如排序系統(tǒng)的重排序階段。然而,基于神經(jīng)網(wǎng)絡(luò)的組合優(yōu)化求解器近年來(lái)發(fā)展迅速,這為研究團(tuán)隊(duì)在未來(lái)的優(yōu)化計(jì)劃提供了新的方向。
研究團(tuán)隊(duì)計(jì)劃探索基于深度學(xué)習(xí)的近似求解算法,例如通過(guò)神經(jīng)網(wǎng)絡(luò)模擬TSP的最優(yōu)解或快速近似解。通過(guò)引入這些新的求解器,研究團(tuán)隊(duì)希望能夠?qū)SPRank的應(yīng)用范圍擴(kuò)展到更大規(guī)模的問(wèn)題中,如電商平臺(tái)的大規(guī)模商品排序、搜索引擎的實(shí)時(shí)文檔排序,以及需要處理更高數(shù)據(jù)吞吐量的金融市場(chǎng)分析場(chǎng)景。
參考資料:
1.Abend, Omri, Shay B. Cohen, and Mark Steedman. "Lexical event ordering with an edge-factored model." Proceedings of the 2015 conference of the north american chapter of the association for computational linguistics: Human language technologies. 2015.
2.He, Yixuan, et al. "Gnnrank: Learning global rankings from pairwise comparisons via directed graph neural networks." international conference on machine learning. PMLR, 2022.
3.Niepert, Mathias, Pasquale Minervini, and Luca Franceschi. "Implicit MLE: backpropagating through discrete exponential family distributions." Advances in Neural Information Processing Systems 34 (2021): 14567-14579.
4.Li, Weixian Waylon, et al. "BERT is not The Count: Learning to Match Mathematical Statements with Proofs." European Chapter of the Association for Computational Linguistics. 2023.
熱門跟貼