中華民國史上有一個著名事件,叫做“蔣介石重注押杜威”。
1948年美國大選前夕,蔣介石的智囊團在美國報紙上看到民調(diào)數(shù)據(jù),共和黨候選人杜威遠(yuǎn)遠(yuǎn)勝過民主黨候選人杜魯門,便決定全力支持杜威。

坊間傳聞,時任中國立法院副院長陳立夫訪美時偷偷送給了杜威巨額政治獻金(外國人資助美國大選是違法的),但從未得到官方證實,權(quán)作談資。

蔣介石組織的支持杜威的游行隊伍,正路過故宮博物院。游行隊伍的標(biāo)語以中英文書寫,上面一行是“GOOD LUCK DEWEY”,下面一行是漢字“杜威好運”。還弄了4個人抬著一頭不知道什么材料做的大象,代表共和黨,大象的身上掛著杜威的頭像。

上表中黨派后面一列的數(shù)字為選舉人票數(shù)。大選結(jié)果出來,杜魯門大勝杜威,其選舉人票之比為303:189。當(dāng)時美國的選舉人票總數(shù)是531張,現(xiàn)在是538張,這是因為阿拉斯加和夏威夷兩個小州于1959年成為美國的最后兩個州,加了幾張選票。
從上表還可以看出,以前第三方候選人參賽的時候還是不少的,克林頓和小布什時期還有,近20年都沒有第三方候選人殺入決賽了。我的推測是,競選花錢越來越多,第三方?jīng)]那么多錢,大金主也不會在他們身上投資。那么這些獨立候選人的出路就是做一點成績出來被兩大黨之一收購,就像今年的小羅伯特·肯尼迪一樣,跟小公司被巨頭收購類似。
杜魯門上臺以后當(dāng)然報復(fù)了老蔣,但“押錯寶”未必是主要原因,反而應(yīng)該是結(jié)果。也就是說,杜魯門“美國優(yōu)先”的路線讓蔣公選擇了杜威,而不是老蔣誤信了民調(diào)機構(gòu),押了杜威才讓杜魯門報復(fù)他。
回到今年的美國大選,賽前幾乎所有的民調(diào)機構(gòu)都錯得離譜。哈里斯剛剛換掉拜登之后,挾風(fēng)雷之勢,曾在民調(diào)中明顯優(yōu)于特朗普,直到大選前夕,在7個搖擺州還是“膠著”。結(jié)果出來,特朗普在7個搖擺州全勝,相當(dāng)于日本隊碾壓國足的比分,怎么看也不像“膠著”,甚至在鐵盤州的得票也比上屆多。
民調(diào)是一門統(tǒng)計科學(xué),比較復(fù)雜,我先列舉一些“術(shù)語”,給觀眾看看大概是什么樣的,方便理解。

先拿特朗普舉個例子,解釋一下上表這四種誤差?!拔锤采w誤差”,即有些人群是支持特朗普的,但民調(diào)沒覆蓋進來。這個聽起來簡單,實際上很復(fù)雜且昂貴。比方說,民調(diào)可以把不同性別、種族、年齡、教育階層的群體都覆蓋進來,但如果胖子都支持特朗普,而按照前面幾個維度的抽樣恰好都是瘦子,那么胖子這個群體就叫“未覆蓋”。
人群的分類維度理論上可以有無窮多個,抽不抽煙、好不好色、吃不吃香菜,都可以算個維度,這是覆蓋不過來的。所以辦法只能是這樣,先覆蓋性別、種族這些最基本的可能對不同候選人有偏好的維度,再適當(dāng)考慮其他影響比較小的維度。萬一這次民調(diào)蒙錯了,沒關(guān)系,可以事后總結(jié),發(fā)現(xiàn)胖瘦對喜歡哪個候選人也有傾向,那么下屆大選的民調(diào)把胖瘦這個維度也加進來。教育程度就是這樣,前幾屆大選的民調(diào)較少考慮選民的教育程度,后來發(fā)現(xiàn)這玩意有影響,近兩屆大選也加進來了。另外,以前民調(diào)主要是全國性的,近幾屆大選搖擺州越來越重要,所以現(xiàn)在更注重以州細(xì)分做民調(diào),民調(diào)機構(gòu)跟候選人一樣,也在搖擺州多投錢。
其他幾條也差不多?!盁o應(yīng)答誤差”,民調(diào)公司打電話沒接,或者郵寄了問卷沒發(fā)回來。為什么呢?有可能是特朗普支持者藍領(lǐng)多,忙著送外賣沒空;也有可能是特朗普支持者上網(wǎng)少,不看帖子(電子問卷);還有可能是特朗普支持者在他的忽悠下不相信主流媒體、民調(diào)公司,故意不回復(fù)。
“測量誤差”,既可能是問題有誤導(dǎo)性,也可能是特朗普支持者教育水平低,理解問題有誤的人多。
“抽樣誤差”,這個就更難。媒體每次報道的民調(diào),我注意過樣本數(shù)量,一般全國只抽樣幾千或者一萬多人,還有更少的(1千多人),考慮到美國有3億多人,各州的地域差異也很大,很難反映總體情況。
為了給不熟悉統(tǒng)計學(xué)的觀眾更直觀的印象,再舉一個例子。民調(diào)機構(gòu)“538”創(chuàng)始人內(nèi)特·西爾弗稱,他在選前運行8萬個模型,顯示兩人的票數(shù)“比拋硬幣還要接近”,哈里斯勝率略高。
本文原計劃要分析幾個統(tǒng)計模型,看看民調(diào)的缺陷在哪,為什么不準(zhǔn)。既然8萬個模型都預(yù)測成這樣,不費這勁也罷。

從科學(xué)角度,民調(diào)統(tǒng)計的誤差在3%以內(nèi)就算合理范圍,正負(fù)加一塊有6%的浮動。但是這無法解釋為什么2016、2020、2024三屆大選,民調(diào)都嚴(yán)重低估特朗普,一邊倒的誤差不像是隨機的。所以學(xué)界又提出了一個理論,叫做“害羞的特朗普支持者”,說白了就是支持特朗普政治不正確,所以他們不說實話,有人問就說支持哈里斯,或者還沒想好選誰。這個理論在學(xué)界也有爭議,我看過一些反對的觀點,覺得也有道理,因為這問題影響因素太多,怎么解釋都行。
由于AI的出現(xiàn),科學(xué)家又發(fā)明了一個新辦法,就是用計算機來模擬選民。原理跟電腦游戲差不多,用計算機設(shè)定一個虛擬選民,然后給他賦值,年齡、性別、種族這些基本參數(shù),以及他所在的州(比如賓州),該州的經(jīng)濟發(fā)展水平、人口結(jié)構(gòu)什么的也都輸進去,這樣就可以設(shè)計幾萬甚至幾十、上百萬虛擬選民,然后使用特定的算法計算該州的投票結(jié)果。上文中的內(nèi)特·西爾弗可能也使用了AI模型。AI猜的準(zhǔn)不準(zhǔn)我還沒看到相關(guān)結(jié)論,既然真人調(diào)查都不準(zhǔn),AI有什么理由更準(zhǔn)呢?
再回到1948年大勝的杜魯門,又發(fā)現(xiàn)杜魯門跟特朗普有很多共通之處,只是黨派反過來了,杜魯門是民主黨,特朗普是共和黨。下面列舉一些他倆相似的地方,或許能解釋一部分為什么民調(diào)總是低估特朗普的問題。
1.1948年大選之前,絕大多數(shù)媒體、多次民調(diào),都顯示杜威勝。
2.以選舉人票計,杜魯門:杜威是303:189,特朗普:哈里斯是312:226,勝負(fù)比例差不多。
3.不但媒體、民調(diào)支持杜威,當(dāng)時共和黨的競選經(jīng)費也比民主黨多(具體數(shù)字未找到)。杜魯門的優(yōu)勢是在任總統(tǒng)身份,但民主黨當(dāng)時已經(jīng)從羅斯福連任多屆,想換人的選民也很多。
4.當(dāng)時電話并未普及,裝電話的都是比較富裕的家庭或者中產(chǎn),以電話方式進行的民調(diào)覆蓋不到窮人。
5.杜威出身中上階層,當(dāng)州長之前是地區(qū)檢察官,哈里斯當(dāng)參議員之前是加州總檢察長。杜魯門出身農(nóng)民,到處打零工,沒上過大學(xué),舉止粗俗經(jīng)常被人笑話。
6.在競選中,杜威經(jīng)常說空話廢話套話,回避實質(zhì)性問題,精英派頭十足,不屑于跟杜魯門對懟。而杜魯門深入基層,在沒有高鐵的情況下,在全美巡游3萬英里,挨個居民點走訪,坐老鄉(xiāng)家炕頭上聊天,而且為了跟中西部白人拉近距離,專挑粗俗的詞語說話(也算是本色出演)。
7.杜魯門還喜歡一驚一乍地制造噱頭,博取關(guān)注度,扮演明星,有時信口開河,因為群眾愛聽。
8.對蔣政府軍援:杜威愿意加大軍援,杜魯門傾向于保持半死不活的現(xiàn)狀,甚至“24小時內(nèi)結(jié)束戰(zhàn)斗”。
民選的規(guī)則,不是比誰“客觀正確”,而是比誰更能得到多數(shù)人的“主觀認(rèn)可”。民調(diào)的復(fù)雜性,也需要民調(diào)機構(gòu)盡可能摒棄自己的思維定式,不但問卷要盡可能觸達更多階層,也需要獲得更廣泛群體的信任。精英更不是關(guān)起門來當(dāng)精英,須得躬身入世,才能了解群眾所思所求。
熱門跟貼