讀書介紹:

批判性思維意味著不僅僅思維邏輯本身是重要的,我們還需要具備一定的認(rèn)知心理學(xué)方面的知識(shí),要對(duì)人類常見的非理性思維模式保持警惕。

數(shù)據(jù)在標(biāo)準(zhǔn)化、采集和分析這三個(gè)環(huán)節(jié),都可能摻雜主觀意志。有時(shí)候,個(gè)人的主觀臆斷和價(jià)值傾向可能通過所謂“客觀”數(shù)據(jù)的包裝,成為所謂的“事實(shí)”。

桑內(nèi)·布勞的《數(shù)據(jù)如何誤導(dǎo)了我們》教會(huì)我們對(duì)數(shù)據(jù)的主觀性保持警覺,只有當(dāng)我們學(xué)會(huì)以懷疑之眼審視數(shù)據(jù),方能真正駕馭數(shù)據(jù)。

本刊特約 續(xù)芹/文

在后真相時(shí)代,還有“真相”嗎?事實(shí)是什么?知識(shí)的陣營(yíng)還牢固嗎?

前段時(shí)間看過瑞典教授奧薩·維克福什的《另類事實(shí)》,書中對(duì)知識(shí)是這樣定義的——知識(shí)就是那些你信以為真的東西(一種信念),并且它需要與事實(shí)相符,而你需要求得證據(jù)來保持信念。顯然,在獲取和更新知識(shí)這個(gè)方面,批判性思維的能力特別重要。批判性思維意味著不僅僅思維邏輯本身是重要的,我們還需要具備一定的認(rèn)知心理學(xué)方面的知識(shí),要對(duì)人類常見的非理性思維模式保持警惕。

在大數(shù)據(jù)時(shí)代,很多知識(shí)以“大數(shù)據(jù)”的形式出現(xiàn),如何認(rèn)識(shí)數(shù)據(jù)背后的“真相”也就成為考驗(yàn)思維成熟度的重要標(biāo)志。桑內(nèi)·布勞的這本《數(shù)據(jù)如何誤導(dǎo)了我們》可以幫助我們?cè)凇按髷?shù)據(jù)”時(shí)代更加審慎地捍衛(wèi)自己的知識(shí)領(lǐng)域。

打開網(wǎng)易新聞 查看精彩圖片

作者桑內(nèi)·布勞是荷蘭的一名計(jì)量經(jīng)濟(jì)學(xué)家和數(shù)據(jù)統(tǒng)計(jì)記者。布勞從兒時(shí)起就特別擅長(zhǎng)于數(shù)字有關(guān)的東西,數(shù)學(xué)是她中學(xué)時(shí)最喜歡的一門課,后來她在拉斯謨經(jīng)濟(jì)學(xué)院(Erasmus School of Economics)攻讀計(jì)量經(jīng)濟(jì)學(xué)博士學(xué)位。作為荷蘭知名新聞平臺(tái)“通訊員網(wǎng)”(De Correspondent)的通訊記者,布勞長(zhǎng)期致力于數(shù)據(jù)新聞的深度報(bào)道。讀罷這本書,以下這幾個(gè)書中案例給我留下了非常深刻的印象。

一圖勝過千言萬語——直觀數(shù)據(jù)的積極作用

書中最開始講述的一個(gè)南丁格爾的例子,一下子就吸引了我。19世紀(jì)南丁格爾通過可視化圖表推動(dòng)了英國(guó)的醫(yī)療改革的故事,彰顯了數(shù)據(jù)的積極力量。

南丁格爾1820年出生在一個(gè)富裕的英國(guó)家庭,在那個(gè)時(shí)代相比于其他女孩,她接受了非常良好的教育,系統(tǒng)學(xué)習(xí)過意大利語、哲學(xué)、物理、化學(xué)還有數(shù)學(xué)。擁有良好的教育背景的她,在從事隨后的軍中護(hù)理工作時(shí),發(fā)現(xiàn)當(dāng)?shù)赜④姷年囃雎侍吡恕?duì)此,她做了一個(gè)非常直觀的圖表——東部軍隊(duì)死亡原因統(tǒng)計(jì)圖,這個(gè)統(tǒng)計(jì)圖用餅圖的方式非常直觀地顯示了士兵的死亡原因。據(jù)此,該報(bào)告成功說服了當(dāng)局。到1880年時(shí),之前的許多問題得到了妥善解決:傷兵們吃得更好了,能洗澡的地方變多了,他們的營(yíng)房也更干凈了。

歷史學(xué)家斯蒂芬·斯蒂格勒將1890年至1940年稱為“統(tǒng)計(jì)學(xué)的啟蒙時(shí)代”,但在這之前的1858年,南丁格爾已經(jīng)使用統(tǒng)計(jì)圖表來解釋現(xiàn)狀和闡述事實(shí)了。數(shù)字的積極作用彰顯無遺,它可以用來挽救生命。

我平時(shí)在學(xué)校講授財(cái)務(wù)分析課程,對(duì)此頗有體會(huì)。財(cái)務(wù)分析也是這樣,用圖表的方式直觀展示一家企業(yè)的經(jīng)營(yíng)業(yè)績(jī)是非常合適的。當(dāng)然,圖表在列示時(shí)也是有講究的。比較公司的選擇、圖表量綱的選擇,都有可能影響到讀者的感官和判斷。例如,我想分析A公司的營(yíng)業(yè)收入,但這家公司營(yíng)業(yè)收入的增長(zhǎng)趨勢(shì)并不好看;于是我選擇了另一家經(jīng)營(yíng)更加差勁的企業(yè)進(jìn)行比較,這樣A公司顯得還不錯(cuò)。又例如,我想看一下資產(chǎn)負(fù)債率的變動(dòng)趨勢(shì),這家企業(yè)的資產(chǎn)負(fù)債表其實(shí)增長(zhǎng)非常快速,但是我不想給讀者造成負(fù)債率飆升、財(cái)務(wù)風(fēng)險(xiǎn)增加的印象,于是我將原本縱軸5%的單位調(diào)整為100%,顯示出來的資產(chǎn)負(fù)債率立刻就不那么陡峭了。所以,當(dāng)我們?cè)偃タ匆恍?shù)據(jù)分析和結(jié)論時(shí),要對(duì)比較對(duì)象和量綱保持敏感,以免被誤導(dǎo)。

數(shù)據(jù)的主觀性

數(shù)據(jù)在標(biāo)準(zhǔn)化、采集和分析這三個(gè)環(huán)節(jié),都可能摻雜主觀意志。有時(shí)候,個(gè)人的主觀臆斷和價(jià)值傾向可能通過所謂“客觀”數(shù)據(jù)的包裝,成為所謂的“事實(shí)”。

首先,來討論一下數(shù)據(jù)如何標(biāo)準(zhǔn)化的問題。

數(shù)據(jù)的標(biāo)準(zhǔn)化就是指如何測(cè)度這個(gè)想要測(cè)度的對(duì)象。例如,關(guān)于膚色和智商的有關(guān)統(tǒng)計(jì)問題上,膚色的測(cè)度相對(duì)較容易(但事實(shí)上,可能也不是那么容易),關(guān)于智商的測(cè)度則顯然有不同的測(cè)度方法,不同的方法測(cè)度的面向可能會(huì)有較大差異。2014年,《紐約時(shí)報(bào)》的記者尼古拉斯·韋德撰寫了一本暢銷書,《天生的煩惱》。他在書中指出,世界上不同種族的形成是人類進(jìn)化的結(jié)果,而種族之間的差異就反映在他們的智力水平上。

果真如此嗎?

智商這個(gè)概念是人為創(chuàng)造出來了,我們?yōu)榱藴y(cè)度它,設(shè)計(jì)了很多不同的題目。例如,韋氏智力測(cè)試中,題目涉及詞匯量、數(shù)字序列和空間洞察力等,這些內(nèi)容多與抽象思維相關(guān)。隨著時(shí)代發(fā)展,智商測(cè)度中抽象思維越來越占據(jù)智力測(cè)試題目的主導(dǎo)地位。但側(cè)重測(cè)度抽象思維僅僅是人類目前選擇測(cè)度智商的一種價(jià)值判斷而已。

所以,我們一定要意識(shí)到數(shù)據(jù)的“客觀性”本質(zhì)上是人為建構(gòu)的產(chǎn)物。很多數(shù)據(jù)的取得可能都有類似問題,例如問卷設(shè)計(jì)時(shí)的架構(gòu)帶來的隱含選擇傾向問題、問卷本身設(shè)計(jì)合理性問題等等,都會(huì)影響到數(shù)據(jù)的測(cè)度。

其次,在數(shù)據(jù)的采集階段。

由于我們很難獲得全樣本的數(shù)據(jù),所以一般數(shù)據(jù)采集會(huì)選取一定范圍的樣本。那么這個(gè)樣本的普遍性和代表性就會(huì)影響到我們對(duì)這個(gè)數(shù)據(jù)的理解。

《數(shù)據(jù)如何誤導(dǎo)了我們》提到一個(gè)非常有名的美國(guó)生物學(xué)家阿爾弗雷德·金賽的案例。在這個(gè)案例中,由于研究者個(gè)人被一種打破舊有的性行為規(guī)則的使命感驅(qū)動(dòng),導(dǎo)致他在選擇調(diào)查對(duì)象時(shí)人為排除了“保守人群”,從而得出了一些頗為驚世駭俗的研究結(jié)論,在上世紀(jì)50年代引發(fā)了很大的爭(zhēng)議。正如作者布勞評(píng)價(jià)的那樣——“金賽的研究實(shí)際上是一種披著各式圖表和表格的科學(xué)外衣下的行動(dòng)主義”。

在財(cái)務(wù)分析領(lǐng)域,數(shù)據(jù)采集的錯(cuò)誤也有可能會(huì)帶來決策上的失誤。例如,某化妝品品牌在第一季度時(shí)采用滿減方式大規(guī)模促銷,帶來了一季度營(yíng)業(yè)收入的快速增長(zhǎng)。如果單單基于此,管理層就做出繼續(xù)加大促銷的決策,很有可能由于數(shù)據(jù)采集不完整、分析不全面而造成重大經(jīng)營(yíng)虧損。理性的做法是,在采用滿減方式大規(guī)模促銷后,管理層應(yīng)當(dāng)審慎觀察后續(xù)客戶復(fù)購(gòu)率、退貨率等情況,并仔細(xì)核算相關(guān)成本來綜合評(píng)價(jià)促銷效果。

財(cái)務(wù)分析中,還有可能由于數(shù)據(jù)顆粒度不夠或者指標(biāo)設(shè)計(jì)不當(dāng),造成無法取得決策相關(guān)數(shù)據(jù)。例如,某些財(cái)務(wù)分析系統(tǒng)中僅僅針對(duì)營(yíng)業(yè)收入設(shè)計(jì)了營(yíng)業(yè)收入增長(zhǎng)率,但對(duì)于導(dǎo)致營(yíng)業(yè)收入增長(zhǎng)的原因沒有設(shè)計(jì)指標(biāo)而無法進(jìn)一步仔細(xì)分析。對(duì)于營(yíng)業(yè)收入的變動(dòng),應(yīng)當(dāng)區(qū)分價(jià)格和銷量等因素,來分析導(dǎo)致營(yíng)業(yè)收入變化的原因。

第三,在數(shù)據(jù)的分析階段。

《數(shù)據(jù)如何誤導(dǎo)了我們》一書中,作者使用了煙草公司的經(jīng)典案例。這個(gè)案例非常清晰地展示了具有利益沖突的研究者是如何利用自己的專業(yè)知識(shí)為煙草公司進(jìn)行辯護(hù)的。

統(tǒng)計(jì)學(xué)家達(dá)萊爾·哈夫于1954年出版了一本非常有名的專著《統(tǒng)計(jì)數(shù)字會(huì)說謊》。在這本書中,哈夫指出數(shù)據(jù)分析階段存在三種類型的“偽因果關(guān)系”。第一種,偶然事件——數(shù)據(jù)呈現(xiàn)的只是偶然情況;第二種,因素缺失——數(shù)據(jù)呈現(xiàn)的相關(guān)性僅僅是相關(guān)性,其實(shí)中間缺失了一個(gè)真正的因素;第三種,反向關(guān)聯(lián)——因果關(guān)系也可能是相反的。這本書非常經(jīng)典,今天也仍然值得大家研讀。哈夫作為統(tǒng)計(jì)專家,在1965年3月美國(guó)國(guó)會(huì)一場(chǎng)有關(guān)香煙廣告及包裝的聽證會(huì)上發(fā)言,他認(rèn)為吸煙和不健康這二者之間的相關(guān)性不應(yīng)與因果關(guān)系混為一談。但隨后更多的不同領(lǐng)域的科學(xué)證據(jù)都表明,吸煙的確與肺癌發(fā)生有非常直接的因果關(guān)系,目前這已經(jīng)成為了“科學(xué)共識(shí)”,也迫使煙草行業(yè)在包裝上做出了明確提示。布勞在《數(shù)據(jù)如何誤導(dǎo)了我們》中介紹,哈夫收到過煙草業(yè)的贊助,這對(duì)他的分析的獨(dú)立性造成了影響。

在財(cái)務(wù)分析中,哈夫著作中列示的三種偽因果關(guān)系同樣是適用的。例如,某高科技企業(yè)某期的利潤(rùn)率得到了改善,這是否意味著該公司的研發(fā)能力突出,是前期高額研發(fā)帶來的正面效果呢?第一,觀察利潤(rùn)表,如果利潤(rùn)率的改善來自一次性的“非經(jīng)常性損益”,是偶然事件帶來的,那么就無法說明是公司前期研發(fā)帶來的效果;第二、觀察后發(fā)現(xiàn),由于研發(fā)支出占用了公司大量資金,使得公司更加審慎地利用資金,成本費(fèi)用的控制更加高效,從而帶來了利潤(rùn)率的改善,并不是前期研發(fā)支出帶來的效果;第三,還有一種可能是,由于公司利潤(rùn)率不斷的改善,使得公司有余力進(jìn)行大額的研發(fā)投入,因果關(guān)系其實(shí)是倒置的。

我這里描述的三種情境對(duì)應(yīng)了哈夫所述的三種偽因果關(guān)系。因此,我們進(jìn)行數(shù)據(jù)分析時(shí),一定要熟悉統(tǒng)計(jì)語言和套路。

大數(shù)據(jù)時(shí)代的困境

我們正處在4V(volume,velocity,variety,veracity)的大數(shù)據(jù)時(shí)代,上文中描述的數(shù)據(jù)在標(biāo)準(zhǔn)化、采集和分析階段可能面臨的問題還存在嗎?作者認(rèn)為仍然是存在的。

同樣地,很多抽象概念被不得不量化了;大數(shù)據(jù)的來源可能不符合倫理要求(黑客問題和隱私數(shù)據(jù));以及相關(guān)性仍然不等同于因果關(guān)系。

事實(shí)上,當(dāng)數(shù)據(jù)足夠大的時(shí)候,你總會(huì)發(fā)現(xiàn)越來越多的變量間存在顯著關(guān)聯(lián)。作者提醒我們注意“算法”的背后是什么?正如作者所說——“這些算法想要達(dá)成什么目的?是尋求真理還是追逐利潤(rùn)?是民眾的安全還是自由?是正義還是效率?這些均是道德上的困境,而我們是無法用統(tǒng)計(jì)數(shù)據(jù)解決的”。

該如何解讀數(shù)據(jù)

布勞提供了一個(gè)六步清單,幫助我們來解讀一份數(shù)據(jù)及其結(jié)果。一,這個(gè)數(shù)字是由誰提供的?數(shù)據(jù)一定程度上是人類價(jià)值判斷和立場(chǎng)選擇的呈現(xiàn)。二,我對(duì)這個(gè)數(shù)字有什么感覺?評(píng)估自己的直覺,我們也有自己的價(jià)值判斷和取向。三,人們是如何將它標(biāo)準(zhǔn)化的?數(shù)據(jù)是如何測(cè)度的?四,數(shù)據(jù)是如何被采集的?了解采集方式和樣本代表性。五,數(shù)據(jù)是如何被分析的?是否可能是偶然事件、因素缺失和反向關(guān)聯(lián)?六,數(shù)據(jù)是如何呈現(xiàn)的?數(shù)據(jù)的呈現(xiàn)方式對(duì)于我們理解它也是至關(guān)重要的。

當(dāng)然,一個(gè)擁有智識(shí)的人是會(huì)根據(jù)新的數(shù)據(jù)和證據(jù)來選擇是否更新自己的知識(shí)的。我們要擁抱不確定性,不然你相信的就是“偽科學(xué)”。

桑內(nèi)·布勞的《數(shù)據(jù)如何誤導(dǎo)了我們》教會(huì)我們對(duì)數(shù)據(jù)的主觀性保持警覺,只有當(dāng)我們學(xué)會(huì)以懷疑之眼審視數(shù)據(jù),方能真正駕馭數(shù)據(jù)??茖W(xué)就是一些還沒有被推翻的假設(shè),是一些可以被證偽的假說。這是科學(xué)的本質(zhì),懷疑是所有科學(xué)家和哲學(xué)家的精神內(nèi)核。當(dāng)然,這不是說我們要懷疑一切。我們可以選擇去相信(非自己熟悉領(lǐng)域的)專家,畢竟我們沒有精力去驗(yàn)證所有的事情。但在我們自己的專業(yè)領(lǐng)域內(nèi),保持對(duì)數(shù)據(jù)的警惕和審慎是應(yīng)當(dāng)做到的。

(作者任職于對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)國(guó)際商學(xué)院)

本文刊于04月12日出版的《證券市場(chǎng)周刊》