打開網(wǎng)易新聞 查看精彩圖片

新智元報(bào)道

編輯:桃子

【新智元導(dǎo)讀】21世紀(jì)最具影響力的25篇論文中,AI論文竟然獨(dú)占鰲頭!從席卷全球的ResNet到奠定ChatGPT基礎(chǔ)的Transformer架構(gòu),Nature獨(dú)家揭秘全球高被引論文。

21世紀(jì)第一個(gè)25年,AI領(lǐng)域被引最高25篇論文都有哪些?

近日,Nature頭版獨(dú)家文章,揭秘了不同科學(xué)領(lǐng)域最具影響力的論文。

打開網(wǎng)易新聞 查看精彩圖片

然而,令人意外的是,那些廣為人知的科學(xué)發(fā)現(xiàn):從mRNA疫苗和CRISPR基因編輯技術(shù),到希格斯玻色子的發(fā)現(xiàn)和引力波的首次測(cè)量,并沒(méi)有出現(xiàn)在這些入選的論文中。

他們得出結(jié)論,被引最高的論文,正是描述科學(xué)方法、軟件工具或系統(tǒng)性綜述的「幕后英雄」。

那么,都有哪些論文上榜了呢?

打開網(wǎng)易新聞 查看精彩圖片

引用:科學(xué)影響力的衡量標(biāo)準(zhǔn)

引用是學(xué)術(shù)界衡量論文影響力的重要指標(biāo),作者通過(guò)引用來(lái)致敬前人的工作。

Nature的分析基于五個(gè)學(xué)術(shù)數(shù)據(jù)庫(kù)(涵蓋了21世紀(jì)數(shù)千萬(wàn)篇論文),通過(guò)取中位數(shù)排名,篩選出本世紀(jì)最受引用的25篇論文。

結(jié)果顯示,人工智能、提升研究質(zhì)量提升、癌癥統(tǒng)計(jì)、研究軟件相關(guān)的論文占據(jù)了榜單前列。

唯一例外是一篇2004年關(guān)于石墨烯實(shí)驗(yàn)的開創(chuàng)性論文,這項(xiàng)工作為作者贏得了2010年的諾貝爾物理學(xué)獎(jiǎng)。

AI崛起,ResNet登頂

人工智能論文,在本世紀(jì)引用榜單中獨(dú)領(lǐng)風(fēng)騷。

位居榜首的是,微軟團(tuán)隊(duì)2016年發(fā)表的一篇論文——Deep Residual Learning for Image Recognition。

這恰恰是所有人熟知的「深度殘差學(xué)習(xí)」神經(jīng)網(wǎng)絡(luò)——ResNets的開山之作,由AI大牛孫劍帶隊(duì)何愷明等人完成。

打開網(wǎng)易新聞 查看精彩圖片

論文地址:https://arxiv.org/abs/1512.03385

ResNets解決了信號(hào)在多層網(wǎng)絡(luò)中傳播時(shí)衰減的問(wèn)題,讓研究人員能夠訓(xùn)練約150層神經(jīng)網(wǎng)絡(luò)。

這大約是當(dāng)時(shí)常規(guī)神經(jīng)網(wǎng)絡(luò)層數(shù)的5倍。

打開網(wǎng)易新聞 查看精彩圖片

該論文首次作為預(yù)印本發(fā)布于2015年末,微軟團(tuán)隊(duì)?wèi){借其在圖像識(shí)別競(jìng)賽中奪冠。

ResNets的突破為AI飛速發(fā)展鋪平了道路,催生了AlphaGo、AlphaFold、ChatGPT等模型誕生。

現(xiàn)就職于麻省理工學(xué)院的何愷明表示,「在ResNets之前,深度學(xué)習(xí)并不那么『深』」。

據(jù)統(tǒng)計(jì),這篇論文的引用量在10萬(wàn)-25.4萬(wàn)次之間。在五個(gè)數(shù)據(jù)庫(kù)中有兩個(gè)將其列為第一,兩個(gè)列為第二,一個(gè)列為第三,綜合中位數(shù)排名第一。

打開網(wǎng)易新聞 查看精彩圖片

Google Scholar這篇論文被引數(shù)已超25萬(wàn)

此外,2017年谷歌發(fā)表的Attention is all you need排位列七,論文中提出了著名的Transformer架構(gòu),成為ChatGPT等大模型的核心。

打開網(wǎng)易新聞 查看精彩圖片

論文地址:https://arxiv.org/pdf/1706.03762

AI論文的高引用量,主要是因?yàn)槠鋸V泛的應(yīng)用領(lǐng)域和快速的研究進(jìn)展。

同樣,AI教父Geoff Hinton指出,「AI論文天然具有引用優(yōu)勢(shì)」。

2012年,Hinton帶領(lǐng)學(xué)生Ilya、Alex Krizhevsky發(fā)表的AlexNet論文排名第八。

這篇巨作展示了神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別競(jìng)賽中的壓倒性優(yōu)勢(shì),掀起了后來(lái)的深度學(xué)習(xí)革命。

打開網(wǎng)易新聞 查看精彩圖片

論文地址:https://proceedings.neurips.cc/paper_files/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf

打開網(wǎng)易新聞 查看精彩圖片

此外,開源也助推了AI論文的引用。

比如排名第六的Random Forests論文介紹了一種開源、易用的機(jī)器學(xué)習(xí)算法,廣泛應(yīng)用于多個(gè)領(lǐng)域。

打開網(wǎng)易新聞 查看精彩圖片

論文地址:https://link.springer.com/article/10.1023/A:1010933404324

需要說(shuō)明的是,許多AI論文以預(yù)印本形式發(fā)布,增加了引用統(tǒng)計(jì)的復(fù)雜性。

OpenAlex數(shù)據(jù)庫(kù)嘗試合并預(yù)印本與最終出版物的引用,而Google Scholar則努力將同一作品的所有版本歸類并匯總引用。

研究軟件:科學(xué)家的「工具箱」

除了AI領(lǐng)域,研究軟件相關(guān)論文在本世紀(jì)引用榜單中表現(xiàn)亮眼。

排名第二的論文由Thomas Schmittgen等人于2000年發(fā)表,介紹了一種用于定量PCR(聚合酶鏈?zhǔn)椒磻?yīng))數(shù)據(jù)分析的方法。

這篇論文應(yīng)審稿人要求而生,因其提供了計(jì)算基因活性變化的簡(jiǎn)單公式,被引量超過(guò)16.2萬(wàn)次,躋身歷史前十。

打開網(wǎng)易新聞 查看精彩圖片

論文地址:https://www.sciencedirect.com/science/article/abs/pii/S1046202301912629

排名第五的論文,是由英國(guó)化學(xué)家George Sheldrick撰寫,介紹SHELX程序套件,用于分析X射線散射模式以揭示分子結(jié)構(gòu)。

這篇2008年的綜述論文建議使用SHELX時(shí)引用,引用量在7萬(wàn)至9萬(wàn)次之間。

打開網(wǎng)易新聞 查看精彩圖片

論文地址:https://journals.iucr.org/a/issues/2008/01/00/sc5010/index.html

其他軟件論文,如排名第十五的scikit-learn(Python機(jī)器學(xué)習(xí)庫(kù))和排名第十八的DESeq2(RNA測(cè)序分析),因其開源和易用性,成為科學(xué)家不可或缺的工具。

統(tǒng)計(jì)軟件:數(shù)據(jù)分析的利器

統(tǒng)計(jì)軟件相關(guān)論文,也在榜單中名列前茅。

例如,排名第15的scikit-learn論文和排名第22的lme4論文分別為Python和R語(yǔ)言用戶提供了強(qiáng)大的數(shù)據(jù)分析工具。

排名第23的G*Power軟件論文則幫助生物學(xué)家計(jì)算實(shí)驗(yàn)所需的樣本量,以確保統(tǒng)計(jì)顯著性。

值得注意的是,R編程語(yǔ)言本身未出現(xiàn)在榜單中,盡管OpenAlex記錄其引用量超過(guò)30萬(wàn)次。

這是因?yàn)镽的開發(fā)者建議用戶引用其網(wǎng)站而非學(xué)術(shù)論文,導(dǎo)致數(shù)據(jù)庫(kù)記錄不一致。

這也提醒研究者:若開發(fā)了有影響力的程序,發(fā)表一篇相關(guān)論文至關(guān)重要。

癌癥與健康:數(shù)據(jù)驅(qū)動(dòng)的洞見

癌癥研究領(lǐng)域的三篇論文在榜單中占據(jù)重要位置。

排名第四的Diagnostic and Statistical Manual of Mental Disorders(DSM-5)是精神病學(xué)領(lǐng)域的權(quán)威指南,2013年出版后廣泛用于研究和臨床,定義了精神障礙的診斷標(biāo)準(zhǔn)。

排名第九和第十的是世界衛(wèi)生組織GLOBOCAN項(xiàng)目于2018年和2020年發(fā)布的全球癌癥統(tǒng)計(jì)報(bào)告,為研究者和政策制定者提供了關(guān)鍵數(shù)據(jù)。

排名第十九的綜述論文總結(jié)了癌癥的「標(biāo)志性特征」,激勵(lì)了無(wú)數(shù)學(xué)生投身癌癥研究。

提升研究質(zhì)量

提升研究質(zhì)量的論文在本世紀(jì)引用榜單中熠熠生輝。排名第三的論文Using thematic analysis in psychology,由心理學(xué)家Virginia Braun和Victoria Hannah Clarke于2006年發(fā)表,介紹了「主題分析」——一種分析定性數(shù)據(jù)的系統(tǒng)方法。

這篇為學(xué)生設(shè)計(jì)的指南意外成為本世紀(jì)第三高引用論文,徹底改變了兩位作者的職業(yè)軌跡。

排名第11的PRISMA聲明(2009年)為系統(tǒng)綜述和薈萃分析提供了27項(xiàng)報(bào)告規(guī)范,引用量在5.3萬(wàn)至13.8萬(wàn)次之間。

2020年更新的PRISMA(排名第23)同樣上榜。排名第17的論文(2003年)討論了行為研究中的方法偏差,幫助研究者提高研究嚴(yán)謹(jǐn)性。

參考資料:

https://www.nature.com/articles/d41586-025-01125-9