作為以量化和數(shù)學方法為主來測度科學的一門學問,科學計量學已經成為科技政策研究不可缺少的方法性支撐工具,然而對其進行科學測度的質疑聲音也從未停止過。本文試圖從科學計量學源起和發(fā)展的復雜歷史背景中去把握這門學問的特點和價值,厘清其與科學學、科學技術史、科學社會學、科學哲學、文獻計量學、科技政策研究、計算社會學之間復雜而又有秩序的關聯(lián)和脈絡,強調科學計量學只有在跨學科研究范式中,才有可能實現(xiàn)其工具理性和價值理性的統(tǒng)一,從而更為客觀有效地測度科學,從而為提供科技發(fā)展洞見提供有力支撐。

本文的主要觀點是,科學計量學源于對科學與社會關系的系統(tǒng)性思考,這既包括知識論視角的科學自身,又包括社會學視角的科學活動;科學計量學是科學學強調用科學的方法來研究科學的重要特征之一,而其有效應用的前提是將科學視為可以測度的信息;隨著大數(shù)據(jù)大模型的發(fā)展,科學計量學迅速融入其中,逐漸興起的計算社會學正在將更廣泛的科學相關信息納入其中,對于將復雜的科學清晰化是有很大積極意義的;然而,作為科學學的定量研究方法,科學計量學仍然要納入到科學學支撐的科技政策框架當中,因而必須考慮到工具理性和價值理性的統(tǒng)一,而這就要求對科學計量學的發(fā)展更加要關注多源數(shù)據(jù)基礎設施建設、本體論和方法論的統(tǒng)一,不能脫離科學社會學、科技史、科技哲學、科技政策等質性研究的闡釋和分析。

作為以量化和數(shù)學方法為主來測度科學的一門學問,科學計量學已經成為科技政策研究不可缺少的方法性支撐工具,但對其質疑的聲音自其誕生之日起就沒有停止過,這些質疑幾乎都直接指向其能否準確測度科學,即測度結果能否反映“真實”的科學世界。

“科學”是多維復雜的,有宏觀與微觀的尺度之分,也有知識體系、研究方法、思維方式、社會建制和社會文化的社會屬性之分??茖W的這種復雜性意味著僅僅依靠量化和數(shù)學方法是難以實現(xiàn)對科學世界的全面客觀反映,但這并不能否認科學計量學存在的價值和意義。雷迭斯多夫(L. Leydesdorff)認為對科學計量學的否定是就其具體方法和結果而言的,不能因此否定其在認識論上的“科學發(fā)展是可以測度的”這一論斷。早在1969年納利莫夫(V.V. Nalimov)創(chuàng)造的“科學計量學”這一術語,就是將科學視為信息過程,將其定義為對這種信息過程進行的量化分析,即將“科學”定位在“信息”,而信息是可以被測度的,測度信息的意義在于減少不確定性。從這個意義上來說,有效利用科學計量學可以減少對科學活動認識的模糊性,事實上,創(chuàng)造科學測度新指標從來就沒有停止過。然而,隨著數(shù)據(jù)分析技術的發(fā)展,科學計量學從關注數(shù)理統(tǒng)計指標逐漸擴展到網(wǎng)絡指標,從對“實體”要素的關注擴展至對結構的關注,從側重科研評價擴展至知識發(fā)現(xiàn),從結構化數(shù)據(jù)分析擴展至非結構化數(shù)據(jù)挖掘……。無論量化方法如何變化,我們都不能忽略普賴斯(Derek J.de Solla Price)于1978年為Scientometrics期刊撰寫的發(fā)刊詞中明確指出的,無論我們在理解科學家的生產力以及科學創(chuàng)造力的機制和模式方面多么成功,我們仍然需要歷史學家、社會學家和科學心理學家來進行那些無法用測量指標表達的分析。

隨著科學活動的復雜性和開放性日益提升,科學活動的表征物日益豐富,同時科學對經濟與社會的影響日益深遠,作為測度科學的科學計量學也面臨不小的挑戰(zhàn)。本文試圖從科學計量學源起和發(fā)展的復雜歷史背景中去把握科學計量學的未來,理清它與科學學、科學技術史、科學社會學、科學哲學、文獻計量學、科學計量學、科技政策研究之間復雜而又有秩序的脈絡,強調科學計量學工具理性和價值理性的統(tǒng)一,從而促進科學計量學更好地服務于科技政策研究。

1 東歐興起科學與社會的研究議題

盡管在17世紀末至18世紀的科學啟蒙時期,人們就開始關注科學對人類社會進步的作用,但直到世界大戰(zhàn)期間,戰(zhàn)爭對科學的需求和科技對戰(zhàn)爭的推進才使得科學受到了公眾和政府前所未有的關注。尤其是在波蘭學術組織與政府的支持下,一批關心國家建設的杰出學者涌現(xiàn)出來,指出“用科學的方式來研究科學正在興起”。奧氏夫婦(M. Ossowska, S. Ossowski)在1935年發(fā)表了The Science of Science一文,闡述了這一領域的研究綱要,并將這一領域命名為“科學學”。

波蘭轟轟烈烈的科學學研究進程因1939年被德國占領而中斷,同時期在俄羅斯興起了旨在對科學知識、理論、方法和科學哲學進行系統(tǒng)研究的科學學(俄文naukovedenije)。與波蘭相比較,俄羅斯的科學學更關注作為科學自我意識的科學思想史研究,以強調“精確科學(exact science)”的革命力量。1931年,時任科學技術史研究所主任的布哈林(Nikolai Bukharin)率團參加在倫敦召開的科學技術史大會,提出科學發(fā)展受社會、經濟和政治因素深刻影響,同時發(fā)生的格森事件對參會的西方科學家產生了強烈反響與巨大震動。布哈林是將科學學理論與實踐貫通起來的不可忽視的人物。其科學學思想從一開始就是圍繞著對“計劃手段促進科技發(fā)展是否必要,能否有效,是否應當?shù)痊F(xiàn)實問題而展開的”,他不僅在理論上給予了充分的論證,在實踐中也不遺余力地通過政策制定和執(zhí)行來推進理論與實踐的結合。

然而,隨著1937年的政治大清洗,布哈林倒臺,蘇聯(lián)這一階段的科學學研究也隨之逝去。

2 英美對科學的系統(tǒng)性反思

蘇聯(lián)的科學學研究意外地引發(fā)了英國科學界的興趣,將科學作為一種社會現(xiàn)象進行研究開始興起。一批關于蘇聯(lián)科學實踐和從馬克思主義視角討論科技史的書籍涌現(xiàn)出來,貝爾納(J.D.Bernal)是這股潮流中的代表者,他認為英國科學家對辯證唯物主義的興趣真正開始于1931年舉行的倫敦國際科學史大會。作為戰(zhàn)略科學家,貝爾納早在1938年就發(fā)表了題為“科學的社會功能”的文章,闡釋了科學對社會的戰(zhàn)略地位和巨大作用。為了更充分的論證,1939年出版了傳世之作《科學的社會功能》,開創(chuàng)了對科學社會系統(tǒng)的科學分析,從“科學現(xiàn)在所起的作用”和“科學所能起的作用”兩個方面強調科學反身性。《科學的社會功能》這本書收集了廣泛的定量指標和實證數(shù)據(jù),以說明通過支持系統(tǒng)性組織科學研究來增強其社會功能。

20世紀的30年代,“科學”還只是受到少數(shù)具有人文主義情懷的自然科學家所關注,美國社會學家默頓(Robert K. Merton)具有“意外巧獲性(Serendipity)”。奠定科學社會學的重要基礎之作《十七世紀英格蘭的科學、技術與社會》(默頓,1936)采用定量分析和定性分析相結合的方法,對科學技術在誕生初期的社會歷史背景進行了深刻的分析和詮釋,他最早將科學、技術與社會(Science, Technology and Society, 或STS)三個術語放在一起使用。這篇論文主要是在著名科學史學家薩頓的指導下完成的,嚴格地說它只能算是科學社會史的研究。1942年,默頓出版了科學社會學的奠基之作《科學的規(guī)范結構》,他提出了科學家的行為規(guī)范(norms of science),這些規(guī)范有助于確保科學研究的可靠性和有效性,并促進了科學知識的積累和傳播。同期,科學哲學家托馬斯·庫恩(Thomas Samuel Kuhn)的重要著作《科學革命的結構》(1962年)以及科學學家普賴斯的《小科學,大科學》(1963年)相繼問世,在相當大程度上推動了人們對科學社會學學科的認同。

貝爾納和默頓對科學的研究都與歷史分析密切相關,相比之下,美國研發(fā)委員會主席范內瓦·布什(Vannevar Bush)的研究更多地與他領導戰(zhàn)時美國軍事科研的經驗相關。尤其是他于1945年撰寫并提交給杜魯門政府的報告《科學:無盡的前沿》,被視為美國科學政策的“開山之作”。該報告呼吁政府資助的科學需要集中管理,并且要避免政治問責,科學對于實現(xiàn)國家衛(wèi)生、國防和經濟目標至關重要。布什適時拓寬了“基礎研究(basic research)”術語的內涵,促進了科學家和政治家之間的妥協(xié),即科學研究既能滿足科學家的好奇心,也能滿足國家需求,避免了科研資助只是科學家受益的狹隘觀點。這份報告使“政府資助科學研究”進入美國政策話語體系,從20世紀40年代到60年代,美國政府的研發(fā)經費支出增加了十倍以上。

布什的報告不僅影響了美國政府對科技的態(tài)度,也在英國引發(fā)了熱烈的討論,成為政治辯論的重要話題。貝爾納仍是大討論中的關鍵人物,他主張英國應該加大對科學研究資助,并建議改革科學研究的組織結構和管理方式,以更好地促進科學發(fā)展及其應用。1964年,馬凱(Allan Mackay)和戈德史密斯(Maurice Goldsmith)組織了十五位諾貝爾獎獲得者和著名科學家撰寫論文,出版了論文集《科學的科學:技術時代的社會》,以紀念貝爾納的《科學的社會功能》發(fā)表25周年,同時也成立了旨在促進科學社會學發(fā)展的科學基金會。在這本論文集中,貝爾納倡導創(chuàng)立一門“科研戰(zhàn)略學”,“要想把科研效率略微提高一點點兒,就必須有一種全然不同的新學問來指導,這就是建立在科學學基礎上的科研戰(zhàn)略學” ,并強調科學學研究的范圍必須是寬闊的,它必須包容科學的社會問題和經濟問題。

3 文獻計量和科技情報檢索的并行發(fā)展

布什在發(fā)表《科學:無盡的前沿》的同一年,還寫了一篇“As We May Think”的文章,他指出科學活動專業(yè)化和快速擴張,使得及時獲取和掌握科學的最新進展變得很困難,科學家們應該解決知識儲存與獲取的問題,他在文章中描述了一種歸檔檢索系統(tǒng)(memex)。事實上,貝爾納早在1939就已經提到了關于科學交流的問題,指出“每一個工作者理應可以得到一切有關的資料,而且資料數(shù)量還和相關程度成比例……這就意味著要建立一個系統(tǒng),或者說服務體系,來對科學情報進行記錄、歸檔、協(xié)調和分配。實際上各國科學家已經考慮到這種方案了”。

大學和科研院所中的圖書管理人員已經關注到這方面的問題,并做出了一些卓有成效的工作。在圖書管理領域編制文獻索引工作的發(fā)展,主要受到源于1873年編制的法律先例索引Shepard’s citations的啟發(fā)。比利時目錄學家保羅·奧特勒(Paul Otlet)創(chuàng)辦了國際書目研究所,并于1905年公開發(fā)表了“通用十進制圖書分類法”。英國動物學家科爾(Francis Joseph Cole)和博物館館長伊爾斯(Nellie Barbara Eales)研究了1543-1860年所發(fā)表的比較解剖學文獻,對有關圖書和期刊文章進行統(tǒng)計,并按國別加以分類,開辟了統(tǒng)計書目學(bibliography),后來發(fā)展成文獻計量學(bibliometrics)(該術語由Alan Pritchard于1969年創(chuàng)造)。受此啟發(fā),隨后出現(xiàn)了文獻計量學的三大定律。美國化學家格羅斯兄弟(P.L.K.Gross & E.M.Gross)于1927年根據(jù)被引頻次列出了化學教育核心期刊列表,為引文分析奠定了基礎。美國語言學家齊普夫(George Kingsley Zipf)于1932年提出詞頻分布的齊普夫定律,現(xiàn)已廣泛應用于文獻計量學之中。英國文獻學家布拉德福(Samuel Clement Bradford)于1934年提出了定量描述科學論文在相關期刊中“集中-分散”狀況的經驗規(guī)律,即“布拉德福定律”。

美國科學家積極響應布什的呼吁,積極解決知識儲存與獲取的問題。1951年畢業(yè)于哥倫比亞大學化學專業(yè)的加菲爾德(Eugene Garfield)在參加約翰霍普金斯大學的韋爾奇醫(yī)學圖書館的“醫(yī)學文獻索引”軍方項目小組(該項目旨在提高文獻檢索的質量和效率)期間,發(fā)明了用打孔卡建立檢索和文獻索引的方法。1953年,他參加了第一屆科學文獻大會的機器方法研討會,了解到了Shepard’s citations,1955年在SCIENCE上發(fā)表《Citation Indexes for Science》文章,介紹了他的科學引文索引這一創(chuàng)造性的想法。1956年注冊成立一家小公司DocuMation,推出一個了解最新科研進展的工具《期刊目錄快訊》(Current Contents),貝爾實驗室是它的第一個大客戶。

4 科學學走向科學計量學

蘇聯(lián)、波蘭、匈牙利等東歐國家的科學學研究在20世紀60年代非?;钴S,對科學管理的研究熱情不斷高漲。1966-1969年期間,蘇聯(lián)和波蘭學者多次聯(lián)合召開科學學研討會,對蘇聯(lián)科學計量學的發(fā)展影響很大,其中烏克蘭科學院的多勃羅夫(G.M.Dobrov)和科學技術信息研究所VINITI(Научно-техническая информация)的納利莫夫是其中的代表人物,他們都十分注重將概率論應用于科學測度。1967年,由戈德史密斯領導的科學基金會與瑞士CIBA基金會在倫敦共同組織了“Decision Making in National Science Policy”的大型國際會議,各國的“科學政治家”積極參與其中,多勃羅夫在大會上指出研究科學知識的生產過程、科學組織形式的優(yōu)化、科研工作的效率,解決這些問題必須綜合運用描述和數(shù)量分析方法。深受普賴斯文獻增長曲線的影響,納利莫夫帶領年輕人在20世紀60-70年代發(fā)表了一系列的成果,與切爾諾娃(N. A. Chernova)合作發(fā)表了關于極值試驗規(guī)劃專題報告,勾畫了在1950-1965年間文獻數(shù)量增長指數(shù)曲線,與格蘭諾夫斯基(Yu. V. Granovsky)和阿德列爾(Yu. Adler)合作論述了試驗數(shù)學理論信息體系是文獻增長曲線的理論基礎,與穆里欽科(Z. M. Mulechenko)合著《科學與生物圈:兩種體系的比較嘗試》一書,與科爾頓(E. Colton)合作撰寫《科學信息的地理分布》,闡述計量方法在科學學中的作用。終于在1969年,納利莫夫與穆里欽科出版了世界上第一部運用數(shù)學方法研究科學發(fā)展歷程的專著《科學計量學:作為信息過程的科學發(fā)展研究》,成為蘇聯(lián)和東歐學者研究科學系統(tǒng)的理論基礎。遺憾的是,由于語言帶來的傳播限制,納利莫夫首創(chuàng)的“科學計量學”這一學科名稱(俄文Наукометрия)并未立刻引起國際學界關注,直到1971年由美國軍方(Foreign Technology Division of the US Air Force)翻譯而來 。有一個背景需要提及,蘇聯(lián)于1957年發(fā)射首顆人造衛(wèi)星令美國政府十分惱火,并在一定程度上歸咎于美國科研系統(tǒng)對蘇聯(lián)科技發(fā)展監(jiān)測不利,因此加強科技情報獲取能力自此成為美國政府的一項重要工作。1971年,美國Air Force Magazine中出現(xiàn)了對莫斯科于1952年成立科學技術信息研究所VINITI的介紹,這也表明科技信息管理和交流在當時學界和軍界是非常重要的,這涉及到跨國的科技合作和信息共享。1971年,納利莫夫與普賴斯在莫斯科召開的國際科學史大會上首次會面,在學術上做了面對面的熱烈交流,二人在學術研究方面還是彼此熟悉和欣賞。

普賴斯關于科學學最經典的兩本著作是《巴比倫以來的科學》(1961年)和《小科學,大科學》(1963年)。前一本書雖是一部科學史實例研究著作,普賴斯卻有意用了比科學史學更寬泛的“科學人文學”(The Humanities of Science)作為后記題目;而后一本書側重于將物理學模型與方法應用于科學活動的定量研究,普賴斯用了“科學學的序幕”(Prologue to a Science of Science)作為第一章的題目。在納利莫夫創(chuàng)造“科學計量學”這一術語之前,普賴斯對科學學的描述是有科學計量學指向的,他將科學學定義為與科學發(fā)展規(guī)律相關的科學指標,以使現(xiàn)象學解釋成為可能。但后來普賴斯明確科學計量學并不能取代科學學,他在1978年為Scientometrics期刊所寫的發(fā)刊詞中,仍使用“science of science”術語,指出:“科學計量學決不排斥其他一切研究科學的方式。無論科學引文分析如何成功,它也決不會取代人類理智的判斷,我們也不打算這樣做?!逼召囁拐J為科學計量學的主要目的是用數(shù)學方法對科學進行分析。他也清楚地指出,無論我們在理解科學家的生產力以及科學創(chuàng)造力的機制和模式方面多么成功,我們仍然需要歷史學家、社會學家和科學心理學家來進行那些無法用測量指標表達的分析。

隨著加菲爾德科學引文索引的發(fā)明,科學計量學由數(shù)理統(tǒng)計走向引文分析。普賴斯于1965年發(fā)表《科學的科學》一文中指出,“出人意料的是,作為一項處理科學文獻的引文索引法的副產品,可以應用于貝爾納提出的科學發(fā)展的網(wǎng)絡模型,借助這種網(wǎng)絡模型,人們就可以用圖論和矩陣的方法來加以研究。它似乎還向人們暗示,論文一定會聚集成團,而形成幾乎繪制成地圖的(顯示出擁有高地和不可逾越的沼澤地)‘陸地’和‘國家’”。同年,普賴斯在此基礎上,以加菲爾德的SCI為數(shù)據(jù)來源,發(fā)表了著名的文章《科學論文的網(wǎng)絡》,嘗試概述世界科學論文網(wǎng)絡的總體特征,勾畫出將每篇已發(fā)表論文和與之有直接關聯(lián)的其他論文鏈接起來的科學論文網(wǎng)絡。從此開創(chuàng)了以引文分析和網(wǎng)絡分析為基礎的科學計量學新階段。加菲爾德于1964年本人也力圖用自己編制的引文索引探索科學文獻發(fā)展脈絡的編年歷史圖譜,而后開發(fā)了強大的HisCite引文分析工具。之后,亨利·斯莫爾(Henry Small)于1973年創(chuàng)造性地提出了論文“共引”的概念和共引分析的方法,以1971年的SCI數(shù)據(jù)庫為數(shù)據(jù)來源,手工繪制了粒子物理學領域高被引論文的共引網(wǎng)絡圖譜。這些拓展了引文分析,為進而產生科學知識圖譜,奠定了深厚的理論基礎。2009年,加菲爾德在講到“從科學學到科學計量學”的歷史過程時,強調普賴斯是繼科學學奠基人貝爾納之后,把科學學提升到定量分析階段,并形成科學計量學的開創(chuàng)性人物。

值得贊譽的是匈牙利化學家布勞溫(Tibor Braun)于1978年聯(lián)合英美和蘇聯(lián)的科學學、文獻計量學、科學計量學等多國學者,創(chuàng)辦了一本真正的國際學術期刊Scientometrics,以納利莫夫發(fā)明的科學計量學術語為名,并讓它廣泛傳播和公認。該期刊初創(chuàng)主編包括匈牙利的貝克(M.T.Beck),蘇聯(lián)的多勃羅夫,美國的加菲爾德和英國/美國的普賴斯,匈牙利的布勞溫為執(zhí)行主編,這本期刊將東西方兩種相對獨立的科學計量學范式連接了起來。一個是英美派系,即通過文獻計量學將科學史與社會學相結合,另一個是在蘇聯(lián)發(fā)展起來的馬克思主義科學研究傳統(tǒng)。布勞溫進行科學計量學研究的動機直接源于對科研評價的不滿,他“曾在一篇文章中回憶起七十年代初期參加科學院化學學部的一個專家委員會進行化學科學評議的情景,他說他一直意識到這種評議有很大的主觀性并為此而深感不安”,他隨后發(fā)表了很多論文多是以科學文獻為對象,研究科研產出、科學家個體及集體的科學生產率,為匈牙利國家科學發(fā)展戰(zhàn)略和決策提供數(shù)據(jù)支持和參考。

在Scientometrics期刊推出的1978年,一批先進的歷史學家、科學哲學家和社會科學家出版了論文集Towards scientific Metrics: The Emergence of scientific indicators,提出了新的思考。他們發(fā)現(xiàn)側重于宏觀層面的科學文獻計量分析在解釋科學實踐方面作用有限,因而科學社會學由此更多地轉向微觀分析,關注科學家在實驗室中的行為。由此,聚焦于科學交流的科學計量學指標更接近于圖書館和信息科學,與科學社會學相距甚遠?;诙垦芯窟M行科學技術洞見和評估的文章逐漸增多,這類文章多發(fā)表在Research Policy、Research Evaluation、Technology Analysis & Strategic Management等期刊上。在這些不同研究力量的推動下,以科學技術為研究對象的科學學研究逐漸分化,形成以定性為主的“科學知識社會學”和以定量為主的科學計量學和科學指標研究,這種分化都清晰地呈現(xiàn)在貝爾納獎和普賴斯獎的設置及其獲獎者的研究興趣中。

值得注意的是,科學計量學的指標在評估方面的使用已經滲透到學術環(huán)境中,并對學術生態(tài)產生了影響。高校和科研組織的資源分配、科研人員個體的職業(yè)成長、甚或科學交流文化都越來越受到發(fā)表和引用等定量測度的指標的影響。尤其是2004年上海交通大學發(fā)布《世界大學學術排名》(ARWU)更是進一步強化了這種定量評估。發(fā)文數(shù)量、引用數(shù)量、期刊影響因子、H指數(shù)、g指數(shù)、Altmetrics指標都可以通過在線搜索或幾個主要的大型文獻數(shù)據(jù)庫中方便獲得,這些指標已經廣泛應用于大學、科研機構以及相關部門中。盡管過多依賴既定的定量指標進行科研評價的弊端也日益明顯,負責任的同行評議仍是科研評價的根本,但是科學量化的分析一定是同行評價不可或缺的輔助手段,因為科學計量學的科學使用和附以恰當?shù)目茖W社會學闡釋仍是能夠減少對科學和科學活動認識的模糊性的。

5 網(wǎng)絡分析推動科學計量學走向科技洞見與預測

由計算機、應用物理和社會學領域發(fā)展出來的復雜性網(wǎng)絡和社會網(wǎng)絡分析方法很快就被科學計量學家應用于對科學數(shù)據(jù)的分析。美國社會心理學家米爾格蘭姆(Stanley Milgram)于1967年通過社會網(wǎng)絡人際關系的“六度分隔”試驗而發(fā)現(xiàn)著名的“小世界”現(xiàn)象,逐漸引起數(shù)學家、物理學家、社會學家和計算機學家對復雜網(wǎng)絡結構與機制研究的興趣。1990年代,基于小世界理論的復雜網(wǎng)絡模型建立起來,并應用于科學中無所不在的復雜網(wǎng)絡的拓撲結構和非線性動力學研究。美國社會學家格蘭諾維特(Mark Granovetter)于1974年提出的社會網(wǎng)絡“弱連接優(yōu)勢”理論引發(fā)學界關注,哈佛社會學家懷特(Harrison C. White)和伯曼(Scott A. Boorman),弗里曼(Freeman L C),以及貝克曼(Berkman L.F.)和柯恩(Cohen S.)等學者開展了社會網(wǎng)絡分析的理論綜合、數(shù)學模型建構和實證研究。1994年,美國學者魏斯曼(Stanley Wasserman)和范斯特(Katherine Faust)所著《社會網(wǎng)絡分析:方法與應用》,進一步擴大了社會網(wǎng)絡分析在社會科學界的影響與應用。

實際上,科學計量學關于引文網(wǎng)絡的研究,同復雜網(wǎng)絡、社會網(wǎng)絡的研究幾乎是同時起步。運用統(tǒng)計分析的方法揭示引文網(wǎng)絡結構的復雜特征與形成規(guī)律,其中研究和論證的反映有關科學文獻定量規(guī)律的洛特卡(AJ.Lotka)定律、齊普夫(G K.Zipf)定律和帕累托(V.Pareto)定律,在數(shù)學形式上都呈負冪律分布的特征,說明引文網(wǎng)絡結構同樣具有一般復雜網(wǎng)絡的無標度(scale free network)特征。網(wǎng)絡分析中的結構洞概念和路徑算法的提出極大地推動了科學技術發(fā)展的洞見和預測研究。由于計算機技術與一系列網(wǎng)絡分析軟件技術的發(fā)展,為復雜網(wǎng)絡系統(tǒng)和社會網(wǎng)絡分析在引文網(wǎng)絡研究中的結合與應用創(chuàng)造了條件,盡管基于科學文獻數(shù)據(jù)進行的網(wǎng)絡分析方法,早期并不旨在發(fā)展科學學。美國學者紐曼(M. E J.Newman)用復雜網(wǎng)絡方法對生物醫(yī)藥、物理學和計算機科學等領域的科學合作網(wǎng)絡結構進了研究,通過中心性的測量來確定科學合作網(wǎng)絡中最有影響的科學家,認為中心性高的人對整個網(wǎng)絡中信息流動和知識傳播產生的影響也最大;并揭示出科學合作網(wǎng)絡的結構具有復雜網(wǎng)絡的高集聚和小世界等特性;同時以加權網(wǎng)絡(weighted networks)的觀點分析了合作網(wǎng)絡的結構特征。1989年,社會學家哈蒙(Norman P. Hummon)把社會網(wǎng)絡分析中的路徑概念引入引文網(wǎng)絡,通過搜索算法提出了引文網(wǎng)絡中的關鍵路徑算法 。

自1980年代以來,融合了人機交互、數(shù)據(jù)挖掘、圖像技術、圖形學、認知科學等諸多學科理論和方法的信息可視化技術獲得長足的發(fā)展,并與引文網(wǎng)絡分析的結合推動了科學知識圖譜的發(fā)展,并相繼開發(fā)了各具特色的工具,包括BibExcel、Bibliometrix R Package、CiteSpace、 Sci2 Tool、vosViewer、SCImago、HistCite、CitNetExplorer、BiblioTool、Excellece mapping、AlluvialGenerator、SCImago、Software and Data of Leydesdorff、CREexplore、Flourish、Gephi、Pajek、CytoScape、Ucinet等,從而進一步深化學界對科學洞見和科技預測的研究。

6 計算社會學推進科學學大數(shù)據(jù)建模

隨著科學決策的復雜性增加和數(shù)據(jù)獲取和分析能力的增強,美國科技決策部門在本世紀初興起了對科技政策的循證研究,一個旨在通過科學、定量的方法,以及計算機和數(shù)學工具的運用,深入研究和理解社會科學中的各種問題的學問,即計算社會學(Computational Social Science)也隨之逐漸興起。計算社會學是社會學與計算機科學和工程領域的交叉融合而形成的一門新興的交叉學科,是社會科學在大數(shù)據(jù)時代所呈現(xiàn)出的新發(fā)展、新路徑和新范式。計算社會科學基于大規(guī)模行為數(shù)據(jù)、社交網(wǎng)絡數(shù)據(jù)、人口統(tǒng)計數(shù)據(jù)或其他數(shù)字化資源檔案的可獲取性,通過應用計算技術和大數(shù)據(jù)分析技術,從而提升理解傳統(tǒng)社會科學方法難以理解的、復雜的社會現(xiàn)象,目前研究集中于大數(shù)據(jù)的獲取與處理、社會統(tǒng)計和計算建模三個方面(圖1)。

打開網(wǎng)易新聞 查看精彩圖片

圖1 計算社會科學研究主題圖譜

(關鍵詞出現(xiàn)頻次≥5,共計417個節(jié)點,5455條連線)

隨著科技文獻數(shù)據(jù)源的增多和質量的提升,以及人們對科學技術活動系統(tǒng)性認識的迫切需求,科學學大數(shù)據(jù)的概念應運而生。計算社會科學利用最新的計算機科學技術,通過搜集和分析科學家進行科學研究、交流、發(fā)表學術成果等數(shù)據(jù)形成的數(shù)字軌跡,建立科學學研究的多源數(shù)據(jù),綜合運用社會統(tǒng)計和計算建模的方法,更為深入地探究科學、技術和創(chuàng)新之間的內在機制。美國巴拉巴西(Albert-LászlóBarabási)和王大順教授團隊近些年來發(fā)表了一系列的基于科學大數(shù)據(jù)的計算社會學研究,尤其是在理解科學家職業(yè)發(fā)展、科研團隊建設科學影響力等方面做出積極又有趣的研究。它有望解決當代科學計量學面臨的挑戰(zhàn),以幫助人們更深入理解科學、技術、工程和社會之間的互動關系和作用機制,真正實現(xiàn)增進人類未來福祉。

7 結語

作為科學學的量化研究方法,科學計量學也正在融于大數(shù)據(jù)時代。隨著科學數(shù)據(jù)和社會數(shù)據(jù)的可獲取性和大數(shù)據(jù)算力的提升,逐漸興起的計算社會學正在試圖彌合本是同源生、卻又越走越遠的科學計量學和科學社會。但作為一門支撐科技發(fā)展戰(zhàn)略與政策的理論性和方法性學問,仍然面臨著一些值得提出來的挑戰(zhàn)。

首先,作為科學學的量化研究方法,科學計量學不能脫離科學社會學、科技史、科技哲學、科技政策等質性研究的闡釋和分析。數(shù)據(jù)驅動的本質是變量思維,通過變量思維去習得科學思維,但不能讓變量思維使你變得剛愎傲慢,量化分析是有適用邊界的,科學計量學只有在跨學科研究范式下,才可能實現(xiàn)工具理性和價值理性的統(tǒng)一。

其次,科學的量化分析需要本體論和認識論的統(tǒng)一。本體論關注存在的本質,而認識論關注知識和認知的本質??茖W大數(shù)據(jù)是科學技術活動及其認知結果的表征,數(shù)據(jù)分析是依據(jù)規(guī)則的“游戲”,它本身并無意義,只有將其與有著豐富經驗認知的領域專家相結合,才能以賦能的方式發(fā)揮其富有實際意義的效能。

再次,科學大數(shù)據(jù)基礎設施建設尤為關鍵。數(shù)據(jù)分析的結果依賴于數(shù)據(jù)的客觀性、精準性和全面性,因而對應用于科技決策的與科學技術活動相關的數(shù)據(jù)收集、存儲、管理、分析和共享的科學學大數(shù)據(jù)基礎設施建設就尤為重要。盡管當前中國科學院和中國知網(wǎng)等擁有海量科技資源的機構已經做了大量工作,但在多源數(shù)據(jù)融合、數(shù)據(jù)精準標注、大模型建構、問題導向的數(shù)據(jù)個性化等方面仍需要很大的提升空間。

陳悅,大連理工大學科學學與科技管理研究所暨WISE實驗室教授,博士研究生導師;謝俊杰,大連理工大學科學學與科技管理研究所暨WISE實驗室博士研究生;王智琦,大連理工大學科學學與科技管理研究所暨WISE實驗室助理研究員。文章觀點不代表主辦機構立場。

◆ ◆ ◆

編輯郵箱:sciencepie@126.com