開場介紹
主持人 Daniel Ferreira(倫敦政經學院金融學教授、金融市場研究群成員)歡迎各位來賓參與這場由金融市場研究群贊助的公開活動。今晚的主講人是 Alex Edmans,他將為我們介紹他的新書《May Contain Lies: How Stories, Statistics, and Studies Exploit Our Biases — and What We Can Do About It》。
Daniel 對 Alex Edmans 的介紹
Daniel 表示自己與 Alex 相識已久,非常榮幸能在此介紹他。 Alex 是倫敦商學院的金融學教授,但這個頭銜遠遠不足以概括他。與其列舉他的成就,不如說要找出他「沒做過的事」反而更難。以下是 Alex 的部分資歷:
他擁有麻省理工學院(MIT)博士學位,曾任華頓商學院終身教授及摩根士丹利投資銀行家。他曾在世界經濟論壇發表演說、在英國國會作證、發表過極受歡迎的 TED 演講。他同時擔任投資論壇的非執行董事、世界經濟論壇「負責任投資」全球未來理事會成員、 Royal London 資產管理公司負責任投資顧問委員會成員,以及 Novo Nordisk 永續發展顧問委員會成員。他是英國國家學術院和社會科學院的院士。
有些人可能讀過他之前的著作《Grow the Pie: How Great Companies Deliver Both Purpose and Profit》,該書獲選為《金融時報》年度好書,並被翻譯成九種語言——Daniel 開玩笑說,Alex 說不定還親自翻譯了其中幾個版本,因為他精通多種語言。他也是經典教科書《Principles of Corporate Finance》(與 Brealey 、 Myers 及 Allen 合著)的共同作者。他在華頓商學院和倫敦商學院累計獲得不少於二十六項教學獎,並於 2021 年被 Poets & Quants 評選為年度教授。
不過 Daniel 也說,同為學術界的一員,他知道學術圈真正看重的是論文品質。 Alex 的論文發表在金融學與經濟學頂尖期刊,截至目前已被引用超過一萬九千次。他在公司治理和永續金融等領域都有重大貢獻,是一位真正的學術重量級人物和領域領袖。
Daniel 分享了他閱讀本書的個人體會:他從中學到了一個有趣的發現——沒有可靠證據證明母乳餵養能提高智商。這意味著他不能再把自己不夠聰明的原因歸咎於母親沒有餵母乳了(他開玩笑說)。他也意識到,為什麼自己練習貝斯吉他超過一萬小時卻仍然彈得不好——這個問題書中也有解答。
Alex Edmans 演講全文
非常感謝 Daniel 的熱情介紹。很開心能回到這裡。感謝大家在經歷漫長的工作或學習後,願意花一個小時來聽我分享。 Daniel 提到了很多,但他沒說的是,我今年稍早曾在倫敦政經學院擔任訪問講師,教授大學部的 Finance 1300 課程,所以能再次回來分享我的研究,真的很棒。
一本關於數據與證據的書
這是一本關於數據、證據和統計的書。作為一位金融學教授,數據和統計曾經就是我生活的全部——直到我兒子 Casper 出生。
孩子的誕生是一件令人震撼的大事,我相信許多在座的朋友都有體會。對我們來說,生產過程相當順利,很幸運沒有遇到太多波折。我們把 Casper 帶回家後,就得開始照顧這個小傢伙。眼前最大的問題是:該餵他吃什麼?
看起來這是一個有明確答案的問題,因為有數據和證據可循。我和太太參加了英國全國兒童生育信託(National Childbirth Trust)的課程,這是一個在英國極具聲望、備受推崇的機構。課程大部分內容是實用技巧,比如怎麼換尿布、嬰兒生病了怎麼辦,但有兩堂課專門在講母乳餵養。很多內容關於如何餵母乳、如何確保寶寶正確含乳,但他們一開始是先解釋「為什麼要餵母乳」。
他們的觀點是:餵母乳很辛苦,如果你能先被說服它的好處有多大,那麼當你筋疲力竭、想要放棄時,你就會堅持下去,因為你知道那些好處有多大。那麼,那些好處是什麼呢?據說母乳餵養與大量的正面結果相關:孩子的身體健康、智力發展,以及母親在經歷艱難分娩後的身體恢復。而支持這些論述的數據來自世界衛生組織——這在健康領域已經是最高權威了。世界衛生組織建議:前六個月應純母乳餵養,而且是「完全純粹」,連水都不給,任何液體都不給,只能給母乳。這些建議都附有參考文獻和註腳,所以我們相信它必然是真的。
因此,我和太太制定了一個明確的計劃:我們要純母乳餵養 Casper 六個月,這樣他就會比托兒所裡其他的孩子都聰明。然後——為什麼停在六個月?我們餵了十六個月,他可以成為天才,跟我合著論文,幫我做研究。這就是我們非常清晰的計劃。
但我們想,光相信一面之詞是不夠的,畢竟這可能只是一個經過篩選的研究。於是我決定運用我的研究技能來檢視。考量到這不是金融領域的問題,我的技能其實很基礎,但我至少會用 Google 。身為一個學術宅,比起他未來會不會成為職業足球員,我更在乎的是智商。於是我搜尋了:「母乳餵養與智商是否有關聯?」
結果顯示確實有關聯,而且來自可靠的來源。 BBC 報導:母乳餵養與較高的智商有關。往下捲,更多類似文章。改天再搜,結果也差不多——喝母乳的孩子智商比沒喝母乳的孩子高。所以我們的計劃就是純母乳餵養。
邁克·泰森的育兒智慧
但後來我們遇到了一位非常著名的母乳餵養專家——他的名字叫邁克·泰森(Mike Tyson)。他說過一句話:「每個人都有計劃,直到臉上挨了一拳。」對我們來說,那「一拳」就是:母乳餵養並非總能順利進行。即使 Casper 含乳很好,他還是會把我太太吸乾,而且他仍然飢餓。在生產後的頭幾天,母親只會分泌初乳,那是真正母乳的前驅物。這種情況下,你可能會想:這是個不用動腦的問題——有個飢餓的嬰兒,你當然該餵他配方奶。但你也可能往另一個方向想:世界衛生組織都說了要純母乳餵養,什麼都別給。而育兒的一部分就是,有時不能因為孩子一直哭就讓步。
於是我心想,這沒那麼簡單。讓我真正運用我的研究能力,不要只依賴 Google,而是去檢視背後真正的證據。我點進了那篇文章——畢竟我們都知道假新聞的問題,也許 Google 搞錯了,也許它根本沒說過這些話。但我點進去後,發現 Google 沒搞錯,文章確實寫了 Google 摘要所示的內容。然而,眼尖的觀眾可能注意到,往下數行有一句話寫著:「由於樣本量小,我們無法確認母乳餵養和奶瓶餵養之間存在顯著差異。」換成白話文就是:差異小到可能只是運氣使然。
更糟糕的是,文章開頭還寫道:「在一項包含五千五百名兒童的不同研究中,母乳餵養對智力沒有顯著影響。」這讓我們很驚訝,因為每個人都告訴你「母乳最好」——你從醫生、兒科醫師和護士嘴裡聽到這些話,你被要求應該純母乳餵養。
檢視真正的證據
於是我去看證據。註腳 18 指向一篇發表在《英國醫學期刊》的研究。我有點緊張,因為可能有很多醫學詞彙我這個金融背景的人看不懂。但我鼓起勇氣點開,直接奔向數字——數字讓我最自在。
研究比較了母乳餵養和奶瓶餵養兒童的智商,差異大約是五個智商點數。這不算巨大,但也不小——如果我只要改變餵養方式就能讓孩子的智商提高五分,這確實是值得認真對待的事情。
但有些觀眾可能注意到,這裡有個詞叫「未調整」(unadjusted)。為什麼需要調整其他因素?因為一個孩子是喝母乳還是喝配方奶,並不是隨機的,它取決於其他因素。餵母乳很辛苦,如果沒有家庭支持會很困難,所以可能那些喝母乳的嬰兒來自支持度較高的家庭環境,而這個家庭環境不只讓他們能餵母乳,也是所有較好結果的原因。或者,當母親回到工作崗位時,如果她是在辦公室工作的主管,可能有哺乳室和冰箱可以儲存母乳;如果你在工廠工作或是到處移動的清潔人員,就沒有這個選項。所以,母親的工作類型可能與母乳餵養相關,同時也影響孩子的發展結果。
因此,研究接著控制了其他因素。白話文就是:他們把這些其他因素對智商的影響剝離掉——母親的教育程度、家庭貧困狀況、母親自身的智商、母親的年齡。在剝離所有這些因素之後,我們只剩下微乎其微的東西:零點五二,半個智商點數。這小到在統計上不具顯著性。
為什麼這件事很重要
這就是問題的關鍵所在。「母乳最好」這個觀念如此根深柢固,以至於它會讓母親感到內疚,覺得如果自己伸手去拿奶瓶,就不是個好母親。同樣地,父親可能因此無法分擔育兒責任,導致親職分工更加不平等。
書出版後,我收到了一些正面的讀者來信,但有一封真正打動了我。一位正在懷孕的女性,因為曾罹患乳癌,接受了雙側乳房切除術,她將無法哺乳。她將在一家美國醫院生產,而這家醫院與一所頂尖常春藤盟校有關——你可能會認為他們應該更懂得實證。但他們告訴她:「我們不會提供任何資源來協助妳,因為我們只專注於推廣母乳餵養,因為證據實在太強了。我們不建議奶瓶餵養。」——即使她生理上根本無法餵母乳。他們認為證據如此充分,以至於她得靠自己,得不到任何協助。
但當你掀開引擎蓋、仔細看看數據,會發現事實遠非如此非黑即白。
為什麼在倫敦政經學院談母乳餵養?
那麼,為什麼我要在倫敦政治經濟學院談一個既不關經濟也不關政治的話題——母乳餵養?因為這裡面其實有許多對經濟學、政治學和商業都重要的啟示。
第一點:研究無處不在。 Daniel 和我平常的工作是寫學術論文,審查和評閱學術論文,也擔任期刊編輯來決定接受或拒絕論文。有些人在學業結束後可能一輩子都不會再讀任何一篇學術論文。但我想強調的是,即使你不直接閱讀學術研究,這些東西仍然影響著你——我們做決策所依據的資訊,很多最終都來自研究,比如「只能母乳餵養」這項建議。你可能讀的不是學術期刊,而是其他類型的雜誌。每次翻開《男士健康》、《女性健身》或《跑者世界》,你都在閱讀研究的發現。也許七個月前你看了倫敦馬拉松,感到興奮,想明年也參加——我該做高強度間歇訓練還是低強度穩定訓練?這全是基於研究。也許你想在其他方面提升自己,不是健身,而是發展一項技能。正如 Daniel 提到的,Malcolm Gladwell 有個「一萬小時定律」——只要投入一萬小時,你就能成為貝斯吉他高手。但這項研究實際上並不如他所宣稱的那般清楚且確定。也許你在閒暇時間根本不閱讀,因為你的日常工作或學業已經夠多了——也許你用聽的。如果要聽,還有什麼比 TED 演講更好呢?Amy Cuddy 的演講是 TED 有史以來收聽次數第二高的。她聲稱,當你面對難搞的人際情境,比如工作面試或公開演講,你要在上場前在旁邊做一個「強勢姿勢」。據說這會釋放腦內啡到血液中,讓你面試表現出色。但這項研究所依據的證據實際上相當薄弱,而且未被重複驗證。
這些事物都具有影響力——即使我們不是學者,我們的決策、投資、作為企業領袖的策略,都依賴於資訊。
第二點:真相是不夠的。 我非常感謝各位來聽一場關於錯誤資訊的演講,因為你可能覺得錯誤資訊已經是舊聞了。 2016 年,英國脫歐公投那一年,「後真相」成為牛津字典年度詞彙——我們認識錯誤資訊這個問題已經很多年了。但那只是我所謂的「第一級錯誤資訊」:人們說出明顯不實、可以被證明為假的言論。比如有人聲稱歐巴馬不是美國的自然出生公民,你只要出示他的出生證明就可以駁斥。
但真正微妙的是這種形式的錯誤資訊:即使某件事百分之百準確,它仍然可能具有誤導性。 Google 並沒有歪曲任何資訊,因為那篇論文確實寫了 Google 摘要所示的內容。但它只突顯了那句話,而沒有提供開頭和結尾的脈絡——結果整段文字的實際意思大不相同,而且有其他研究並未發現顯著影響。即使假設論文的所有內容就這麼一句話,沒有任何矛盾研究,像「較多母乳餵養的參與者智商分數較高」這樣一句話仍然可能構成錯誤資訊。我們會從中讀出因果關係——以為母乳餵養導致了高智商——然而實際的文字陳述並不蘊含任何因果性,只表達了相關性。你無法因為人們說出這樣的陳述就起訴他們。
我們總認為錯誤資訊是別人的問題,政府應該起訴散布錯誤資訊的人。但實際上,有時錯誤資訊的來源正是我們自己——我們接收正確的陳述、正確的事實,卻過度解讀、過度推斷。這就是我寫這本書的初衷:賦予讀者能力,能夠自己辨識這類問題,不再過度解讀。
為什麼我們會犯這些錯?
不是因為我們愚笨,也不是因為我們是壞人,而是因為我們是人。身為人,我們就會受到偏誤的影響——我說「我們」時,絕對包括我自己,因為書中有很多地方我談到自己如何被資訊誤導。
其中一個巨大的偏誤叫做確認偏誤。意思是:我們對世界有一套看法,當我們看到支持這套看法的東西時,就會不經批判地緊抓不放。為什麼?因為我們是人,我們有大腦,大腦中有紋狀體。當我們看到自己喜歡的東西時,它會釋放多巴胺到血液中——那種感覺就是很爽,所以我們不去質疑。
當你聽到「偏誤」這個詞,你可能想到的是那些重大議題上的偏誤——也許我對移民、槍枝管制、墮胎或氣候變遷有偏見。但我想強調的是:偏誤可以是極其微妙的。像「天然的東西比人造的好」這樣微妙的想法,就讓我認為母乳餵養一定優於奶瓶餵養,於是我對聽到的說法照單全收、不加批判——即使我理應更清楚,也理應知道相關性與因果關係的區別。
解決方案:檢查一切
你可能會想,這太不切實際了。我真的需要檢查一切嗎?我是個忙碌的人,沒時間去追溯每條註腳,我也沒有統計學博士學位。的確,在寫這本書之前,我讀過其他關於錯誤資訊的書,它們都很好——我不會批評它們,因為它們不是我的競爭對手。但這些書太全面了,列出了兩百六十七種你可能被誤導的方式,結果根本記不住,更別說實踐了。
因此,我將錯誤資訊歸納成僅有四種類型,用我所謂的「謬誤推論階梯」(Ladder of Misinference)來說明。為什麼用階梯?因為當我們從陳述出發、得出結論時,就像在爬梯子。但我稱之為「謬誤推論階梯」,因為有時梯級是斷裂的,而我們正在進行錯誤的解讀。
謬誤推論階梯的四個梯級
第一級:陳述不等於事實——它可能不準確
Google 告訴你母乳餵養與智商之間有明確關聯,但如果你讀完整段文字,就會發現情況並非如此明確。即使該陳述表面上沒有錯誤資訊——它如實報導了原文——但沒有提供更廣的脈絡,它就是不準確的。
這種現象存在於許多領域。比如睡眠這個同樣對發展很重要的議題。有一本非常暢銷、全球銷量數百萬冊的書,作者是 Matthew Walker,他強調自己擁有博士學位,彷彿這意味著他所說的一切都是真的。這本書講的是睡眠的重要性——我們都希望這是真的。我們希望有個藉口能在床上多待一小時,我們希望那個過於勤奮、早上五點起床的同事終究會遭到報應。而證據暗示,如果你早起,你可能會撞到桌子受傷——書中的圖表確實顯示,睡得越多,受傷可能性越低。但如果你去看他引用的原始學術論文,真正的圖表上還有另一條長條,顯示如果你睡五小時,受傷數比睡六或七小時還少。因為這不符合他的敘事,他直接把那條長條從書中刪掉了,選擇性忽略證據。而這並非單一案例——甚至有個網站專門整理他書中的所有錯誤和他如何誤導讀者。然而這本書卻被視為「睡眠重要性」的證據堡壘。為什麼?因為作者被認為擁有這些資歷,而且他所報導的內容嚴格來說並非錯誤——他不會因此被起訴——但問題在於他所隱瞞的部分。
比睡眠更重要的,是生死的問題。這是一篇關於鴉片類藥物氾濫的論文,這場危機導致全球兩百萬人死亡。為什麼會有這麼多人被開立鴉片類藥物處方,而這些藥物的成癮性如此之高?因為人們不知道它會上癮——原因是一篇發表在《新英格蘭醫學期刊》上的文章指出「使用麻醉藥品的患者中成癮情況罕見」。這篇文章已被引用一千六百五十次。我們來看看這篇文章:確實有這麼一篇叫做「成癮罕見」的文章存在,但如果你仔細閱讀,它研究的是什麼?它研究的是服用「一次」麻醉製劑的患者——也許一次不會成癮,但四次或五次可能會。而且它研究的是住院患者——如果你在醫院接受控制藥物管理,也許不會成癮。但如果你是門診患者,拿到大量鴉片類藥物,也許疼痛太劇烈,以至於你一天吃下四天的止痛藥量,那就可能導致成癮。
這些都是微妙的錯誤資訊形式。即使該陳述完全真實,它仍然不是事實——為什麼?因為它不適用於我們特定的情境。研究所探討的內容,和門診醫師處方時關心的情況大不相同。
你可能會想:解決方案就是核實事實——去看原始研究究竟顯示了什麼,去看那張長條圖。但這還不夠,因為還有第二個問題。
第二級:事實不等於數據——它可能不具代表性
即使某事百分之百準確,它仍然可能具有誤導性——它可能是一個離群值,一個不能證明規則的例外。
我提到過 Amy Cuddy 。現在來看看 TED 觀看次數第三高的演講,來自 Simon Sinek,催生了全球暢銷書《Start With Why》。這本書的核心論點是:熱情和使命能帶你走向成功。我們都希望這是真的——你告訴你的孩子「只要有心,什麼都做得到」,然後你引用事實來佐證:Apple 從「為什麼」出發,顯然非常成功,市值破兆甚至三兆美元,是第一家突破這些門檻的公司;在非營利領域,Wikipedia 顯然成功,已超越《大英百科全書》成為全球知識基石;人的例子呢?萊特兄弟顯然成功了,他們比 Samuel Pierpont Langley 更早實現了首次動力飛行。
這些全都是事實——公司、組織、個人,確實都成功了。所以事實本身沒有問題。但即使這些事實是真的,它們可能是刻意挑選的——其他數百家具備「為什麼」卻失敗了的公司或個人呢?我們永遠聽不到他們的故事,因為他們不支持 Simon Sinek 的論點,所以他不會告訴我們。這些案例永遠見不到光。
我們需要的是一個類似臨床試驗的東西:我們觀察一群生病的人,給一些人用藥,看多少人好轉、多少人惡化;給另一些人安慰劑,看多少人好轉、多少人惡化,然後我們比較兩組。但關鍵是,我們的數據集必須包含那些「服藥後惡化」的人——也就是那些「始於為什麼」卻失敗的公司,但我們永遠不會在 Simon Sinek 的書中看到它們。我們也需要那些「服用安慰劑卻好轉」的人——也就是那些「沒有始於為什麼」卻仍成功的公司,同樣,我們也不會在這種書中看到。
我們只看到與作者論點相符的事實。即使這些事實百分之百準確,它們仍是誤導的,因為我們看不到全貌——看不到完整數據。這就是為什麼錯誤資訊如此難以監管:即使人們說的是實話,他們「沒說的東西」才是真正的關鍵。
你可能會想:解決方案就是確保你擁有所有數據。但即使這樣還不夠,因為還有第三個問題。
第三級:數據不等於證據——它可能不具結論性
數據和證據這兩個詞經常被互換使用,但它們是不同的。什麼是證據?我們最常在哪裡聽到「證據」這個詞?在刑事審判中。證據之所以是證據,是因為它支持某個結論而非其他結論。如果證據暗示 Tom 、 Dick 或 Harry 都可能殺了 Sarah,那不是有用的證據——有多個嫌疑犯。證據只有在它能指認唯一嫌疑犯(比如 Tom)時才有用。這就是「替代解釋」的問題所在。
回到母乳餵養與智商的數據:存在強烈的相關性。一種解讀是母乳餵養導致較高的兒童智商。但還有替代嫌疑犯:也許有共同原因,比如家庭背景,同時導致了母乳餵養可能性與智商。那麼,一個時間有限、沒有統計學博士學位、無法追查每條註腳的人,該怎麼思考替代解釋?
這裡提供一個簡單的技巧:當你看到某個你非常希望它為真的事情——你的確認偏誤正催促你去接受、轉發、在推特上昭告天下——想像你發現了相反的結果,那個你「不希望」為真的結果。想像證據顯示母乳餵養導致較低的智商。你不喜歡這個結果,因為你想相信天然的東西總是比較好,所以你會想方設法推翻它,你會訴諸替代解釋——你可能會說,也許那些餵母乳的女性比較貧窮,買不起配方奶,是貧窮導致了較低的兒童智商。現在,既然我們已經警覺到「家庭背景」可能是驅動因素,我們就問自己:即使現在關聯的方向是我們樂見的,這個替代解釋是否仍然成立?
這說明了一件事:辨別能力本來就存在於你身上。你不需要統計學博士學位——我自己都沒有。你要做的只是運用你已經具備的辨別力。如果我在 LinkedIn 上看到一項研究說「人們不喜歡某種聲音」,底下留言區充滿各種質疑,討論為什麼相關不等於因果、為什麼可能是刻意挑選的例子。但當人們看到一項「大家都想相信」的研究時,他們卻不加批判地照單全收。所以,「想像相反結果」這個方法,只是鼓勵我們對自己喜歡的東西,也要像對待自己討厭的東西一樣保持辨別力。
第四級:證據不等於證明——它可能不具普遍性
證據和證明之間有什麼區別?證明是普遍性的,適用於全世界所有地方。當阿基米德證明圓面積等於 π 乘以半徑的平方,這不僅在公元前三世紀的古希臘成立,在 2024 年的倫敦霍本也同樣成立。而證據只在特定情境下成立。如果證據顯示 Tom 殺了 Sarah,而 Tom 是她的丈夫,這並不意味著每次有女性死亡,兇手都是她的丈夫。這是我們常犯的「過度推斷」錯誤。
回到 Malcolm Gladwell 的定律(感謝 Daniel 的鋪陳):你需要練習一萬小時才能成為任何領域的專家。注意他說的是「任何領域」——可以是西洋棋、神經外科,任何認知複雜的領域。但如果你去看他引用的證據,那是有關小提琴演奏的研究。小提琴演奏和西洋棋或神經外科是非常不同的東西——在小提琴演奏上成立的結論,不一定在西洋棋或神經外科上成立。
但如果你找到一個在你所關心領域內的相同研究,我們就安全了嗎?不幸的是,答案是否定的,因為存在一個叫做「範圍」(range)的問題。以下是我倒數第二個案例。
這是一個很棒的 TED 演講和暢銷書,作者是賓州大學心理學教授 Angela Duckworth,主題是「恆毅力」(grit)的重要性。她想探討是什麼導致成功,她聲稱答案是恆毅力——熱情、堅持,所有我們希望為真的特質。她的標誌性研究觀察了進入美國西點軍校的男性和女性。進入西點軍校後,你還不等於有資格從軍——你必須完成一個為期六週的體能訓練課程,稱為「野獸兵營」。她想了解:什麼因素能預測你能否通過野獸兵營?大多數人認為是體能,但她發現不是——正是這個發現讓她成名。她發現:恆毅力比單純的體能更能預測一個人是否能完成野獸兵營。正因為這是一個體力要求極高的環境,恆毅力竟然比體能更有預測力,這種反差讓她聲名大噪。
但這裡的問題叫做「範圍限制」:你必須本來就非常強健才能進入西點軍校,而如果體能達到一定程度後邊際效益遞減,那麼在這個群體中,體能就不會造成差異,必須由其他因素(如恆毅力)來解釋。但如果你是一個夢想加入軍隊的普通路人,也許你該鍛鍊的是你的體能,而不是恆毅力。在一個由非常強健者構成的小樣本中觀察到的現象,並不適用於一般大眾。
為了進一步說明這一點,最後一個案例:如果你必須從飛機上跳傘,因為飛機即將墜毀,你會想要降落傘嗎?你可能覺得這是個愚蠢的問題——誰不想要降落傘?但降落傘要花錢製造,而且我們還關心環保,降落傘也許是用塑膠做的。如果我們不需要降落傘,就能省下一些錢。於是,《英國醫學期刊》上出現了一項隨機對照試驗,研究「降落傘在跳傘時是否有幫助」。他們設法找到了一些志願者(我不知道他們是怎麼說服這些人的),一些人幸運地拿到降落傘,另一些人被隨機分配到沒有降落傘的組別,被迫跳下。
你可能會想:這怎麼可能在倫理上說得過去?但他們發現:降落傘對生存率沒有任何影響——有降落傘和沒有降落傘的人中,死亡人數相同。在你覺得這太可怕之前,讓我向你保證:死亡人數是零,因為飛機是在「地面上」。他們從停在地面上的飛機跳下來。這項研究是諷刺性的,但它突顯了一個重要觀點:範圍和情境很重要。如果你看到的是兩英尺高的跳躍,並發現降落傘在這種情況下沒有差別,你不能過度推斷說「降落傘在一萬英尺高空也不會有差別」。
總結:四個要點
我在過去半小時內向大家灌輸了很多內容——今天難得提前結束,讓我們來總結一下,然後進入問答環節。
回顧四個要點:
一、陳述不等於事實——它可能不準確。 檢查原始來源,看原文到底說了什麼。如果是關於母乳餵養的陳述,實際段落是否真的證實了這個說法,還是其實有矛盾之處?如果是一張圖表,去看原始的圖表——它是否真的顯示了人們所暗示的內容?它所測量的是什麼——是一次鴉片類藥物劑量,還是多次?是否僅限於住院患者,而非門診患者?當然,如果你每次看到什麼都要去核實,你會瘋掉。所以我們要運用 80/20 原則:把精力集中在最重要的 20% 的事情上,對這些東西進行嚴格的審視。
二、事實不等於數據——它可能不具代表性。 我們是否看到了全貌?我們是否知道那些擁有「秘密配方」卻失敗的案例——那些「始於為什麼」卻破產的公司?我們是否知道那些沒有「秘密配方」卻成功的案例——那些沒有「為什麼」卻大獲成功的公司?
三、數據不等於證據——它可能不具結論性。 即使你有大規模的證據,也要檢查是否存在對立的理論和替代解釋。一個讓自己做到這一點的方法,就是「想像相反的結果」——想像你不喜歡的那個結果,你會如何試圖推翻它?
四、證據不等於證明——它可能不具普遍性。 檢查情境——這項研究是在你關心的環境下進行的嗎?是在神經外科還是小提琴演奏的情境?檢查範圍——研究對象是已經極度強健的人,還是你所關心的一般大眾?
你可能會想:如果我每件事都要檢查,這太費力了。但就像任何技能一樣,練習越多就越輕鬆。當你第一次學網球,你得刻意去想步伐、側身、引拍、過肩隨揮——前幾次你都在刻意練習這些動作。但一段時間後,這就成了習慣。數據辨別也是一樣的道理。
而我們為什麼要做這些?實際上是為了讓自己活得更自由,而不是更受束縛。當我們變得更有質疑精神、更有辨別力時,我們會發現,那些非黑即白的信條——比如「不純母乳餵養你就是壞母親」、「想減肥就永遠不能碰巧克力」、「永遠不能喝酒」——背後的數據,其實並不如人們所宣稱的那般強而有力。這反而讓我們能夠活得更自由,而不是更受限。
非常感謝各位的聆聽,能在此分享是我的榮幸。現在讓我將時間交給 Daniel 進行問答環節。
現場問答環節
Daniel:現在開放現場提問。請等待麥克風傳到您手中,提問前請先告知您的姓名和所屬單位(如果您願意的話)。請舉手——後排的那位,請。
提問一:誰在聆聽?——來自英國國防論壇
提問者(曾任執法情報分析師):非常感謝您。我在培訓課程中曾教授甘迺迪總統遇刺案,我發現要讓學員理解「脈絡就是一切」變得越來越困難。我的問題是:誰在聽您說話?您是否曾被邀請向科學家、政府部門——無論是本國或其他國家——發表演說?因為我認為很多人會從您剛才所說的內容中受益,更不用說讀您的書了。
Alex:非常感謝您的善意評論。這其實正是我寫這本書的起因。這並非我作為金融學教授的本職工作。我的第一本書《Grow the Pie》完全是關於金融的。但與眾不同的是,作為學者,我非常享受與公眾和實務界人士交流研究成果。長期以來,我一直在做這件事——分享有關公司治理和永續商業的研究。但讓我感到挫折的是,人們對研究的反應取決於他們是否「喜歡」其結論,而不是研究的實際準確性。正如 Daniel 所說,在英國國會作證之類的場合,我一直在解釋證據究竟是什麼。所以即使這本書今年四月才出版,嘗試凸顯真相和證據的理念,我已經做了很多年了——大約從我十一前回到英國時就開始了。不只有我,其他學者也在努力傳達研究的重要性。但這本書的特別之處在於,相較於我先前純金融領域的作品,它能夠觸及更廣泛的領域——科學或政治類播客,例如我最近上了 Rory Stewart 的節目。希望這些議題能超越我狹窄的經濟學領域,擴展到更廣泛的錯誤資訊問題。
提問二:是否應該追求系統性變革?
Eugene(倫敦政經學院博士班四年級學生):我對您提出的解決方案有些擔憂。即使將核實範圍限制在對個人生活最重要的資訊上,要求人們自己去事實核查每一件事,對大多數人來說仍然太費時費力。我們是否應該倡導更系統性的變革——改變新聞媒體和企業面臨的激勵機制,使他們不會以這種偏誤和動機性推理的方式報導?
Alex:我很希望能有一個基於激勵機制的解決方案——Daniel 和我的學術研究都在處理激勵問題。但我認為改變激勵機制很困難,因為這些激勵是結構性的。以社群媒體公司為例:他們如何賺錢?透過螢幕上的眼球。他們如何讓你留在螢幕前?餵給你你喜歡的東西。這就是為什麼我們喜歡活在同溫層,喜歡追蹤與我們觀點相似的人——這會釋放多巴胺。
所以我認為,雖然我們當然會盡力而為——比如起訴散布錯誤資訊的社群媒體公司——但我真的認為責任很大程度上在於我們自己。而且我要挑戰「這太難、不切實際」的想法。我認為「保持辨別力」這件事,我們其實從小就在教導人們了。我的兒子這個週末就要滿三歲了,他已經知道要保持懷疑——不要接受陌生人的糖果。長大一點後我們會教他不要上陌生人的車。辨別力是我們從小就學習的東西。成年後,當我們不喜歡某項研究時,我們知道如何攻擊它——我們會看樣本量、會談相關與因果的區別。所以我們其實已經擁有識破錯誤資訊的工具。問題在於我們的偏誤阻止了我們——我們只在選擇性的情況下運用這些工具,而不是在需要的時候。因此,既然這不是技能或知識的問題,而是「應用這些知識的意願」的問題,我認為這是可以克服的。
提問三:學術探索 vs. 產業預測
提問者(擁有經濟學博士學位,現任投資銀行數據科學團隊主管):我在學術界做過很多迴歸分析,現在在業界則做很多機器學習模型。我認為最大的差異在於:學術界的迴歸分析目的是「探索」——你在嘗試探索關係;而業界的機器學習目的是「預測」——我們有大量測試樣本,有訓練集和多個測試集。然而即使有多個測試樣本,我們仍然經常出錯。所以當我看到學術期刊上的許多結果——你指出來的那種——沒有測試樣本,只有一個訓練集,而且樣本量通常很小,你會覺得這類偏誤很自然地會滲透進來。我不知道增加測試樣本是否能改變這種情況,但我確實看到了這個顯著差異。
Alex:非常感謝您的評論。我同樣對「增加測試樣本能成為解決方案」抱持懷疑。我認為更重要的是意識到「描述」和「預測」之間的差異。迴歸分析適合作為對世界的描述——比如你說「以 U 開頭的國家有較高的 GDP,如英國和美國」,這是對世界合理的描述。但如果你把它轉成預測——「把你的國名改成 U 開頭就能提高 GDP」——那就不成立了。
這也是我對先前關於改變社群媒體公司激勵機制的提問的回應:我不確定那是解決方案。因為即使他們正確地將迴歸結果作為「描述」呈現,我們自己還是傾向於將它們轉換成「預測」。這不是因為我們是壞人——我們想要提升自己,我們想要給別人健康建議。很可能就是母乳餵養與智商之間的相關性,導致人們出於善意,給出了「應該純母乳餵養」的建議——即使這在原始研究中並未得到實證支持。
提問四:智商 vs. 情緒智力
提問者:非常感謝您的精采洞見。當今世界充斥著各種自助書籍,我們確實需要用您所說的方法去核實它們。但我想特別指出一點:有一本書(我忘了作者名字)討論了智商與情緒智力的比較。我們生活在一個科技和社群媒體的時代,大部分情況下,如果某個東西配上好聽的音樂和熱血包裝,人們就會被激勵去相信它。那本書聲稱,一個人需要培養情緒智力,並將其置於智商之上,才能在這個世界中應對自如並獲得成功。您對智商與情緒智力之間的這場辯論有什麼看法?
Alex:我不確定您指的是哪本書,聽起來可能是 Daniel Goleman 的著作——他寫了很多關於情緒智力的東西。我認為情緒智力非常重要,尤其在處理錯誤資訊方面。如果你無法說服某個人,教授們的「智商式解決方案」是給他們更好的數據——展示最漂亮的迴歸分析和工具變數來支持因果主張。但這沒用,因為人們有偏誤,情緒上會有反應。
我認為關鍵在於理解資訊的文化脈絡——資訊不是存在於真空中。以氣候變遷為例:為什麼有這麼多人不相信氣候變遷是真的,即使像《不願面對的真相》這樣資訊豐富的紀錄片已經問世?那是一部很棒的紀錄片,訊息豐富,但它不是一部「好」的紀錄片——因為它以 Al Gore 為主角,把議題政治化了。這讓一些共和黨人認為,既然民主黨人相信氣候變遷,那共和黨人不應該相信。那麼解決方案是什麼?也許不是給共和黨人更多氣候變遷資訊,而是突顯氣候變遷其實符合共和黨價值觀。如果你說「氣候變遷是真的,因此我們需要對企業課稅和監管、補貼清潔能源」,一些共和黨人不喜歡。但如果你說「因為氣候變遷是真的,我們需要人類的聰明才智和商業創新——比如發射太陽能反射器到大氣層,或開發碳捕捉和深層地質封存技術」,這可能更能打動人。
所以情緒智力就是認識到,我們不能只依賴統計上的純粹性,還要理解數據所附帶的意義,並以人們更容易接受的方式來呈現。因為如果人們因為偏誤而關閉了大腦,數據再好也無濟於事——他們根本沒在聽。
提問五:可信任機構的角色
提問者(健康研究資助機構):您觸及了這個問題——您認為可信任的機構在處理這類錯誤資訊、以及我們該如何獲取資訊和做出判斷方面,應該扮演什麼角色?
Alex:我認為可信任的機構應該提供協助,尤其是那些致力於促進自由的機構。以倫敦政經學院為例——這是一所偉大的學術機構,我認為機構的目標是鼓勵學術辯論。有時候研究發現並不支持人們希望為真的事——比如永續發展並不總是能提升績效(即使像我這樣的人也希望它是真的)。如果有人寫出一篇顯示這一結果的論文,他們應該能夠不受報復恐懼地發表它。
有時候涉及敏感議題——我的研究領域之一是多樣性。有些研究(比如 Daniel 和他的共同作者 Renée Adams 那篇高引用的論文)顯示,多樣性和財務績效之間並不總是正相關。這是一篇極具影響力的文章,卻經常被帶著議程的人忽略——他們想聲稱多樣性和績效之間「總是」正相關。這就是我在與監管機構交流時會提出的觀點。
所以我認為,擁有自由去書寫這些主題、呈現科學所顯示的內容,而不會因為被認為是「反對多樣性」就被取消,是非常重要的。而呼應前面情緒智力的觀點,你可以這樣說:性別多樣性並不總是能提升財務績效——這不是因為你反對多樣性,你其實非常支持多樣性,但你知道多樣性可能不僅限於性別和族裔,還包括認知多樣性和社會經濟多樣性。這是一種處理棘手問題的方式,能讓人們願意接受而不是產生防衛心態。
提問六:如何平衡完整資訊與吸引注意力?
Stephany(Point Sigma 分析主管,曾任記者):我要當一下魔鬼代言人。當你在寫論文時,很容易寫出非常細緻、充滿脈絡的內容。但當你在寫一篇新聞報導或數據故事推文時,你是在為注意力和標題優化。你如何在提供完整脈絡資訊與給出人們真正願意點開的內容之間取得平衡?對於那些工作需要吸引注意力、同時也想提供脈絡的人,您有什麼建議?
Alex:非常感謝這個問題。我認為「故事」配「大規模證據」的組合拳非常強大。學者們的弱點可能在於,他們認為:「好,我只要展示最棒的迴歸分析,配上最強計量方法,人們就會相信。」但人們是聽故事的——幾千年前我們的口傳傳統就已如此,故事具有記憶性。
但如果只依賴故事,那也有問題——因為你永遠能找到一個故事來支持任何你想支持的觀點。我確信我能找到一個抽很多菸卻活到一百歲的人。所以我認為,故事配證據的組合拳是最有力的——比如我用我試圖餵養兒子的故事,這可能是一個能引起共鳴的感性故事,但它背後有母乳餵養與智力之間關係的大規模數據支撐。這種組合比單一形式更有力量。
提問七:80/20 原則在實務中如何應用?
Anil Kashyap(芝加哥大學):幾乎在所有情況下,需求曲線都是向下傾斜的——提高價格,需求下降。我們應該花多少精力去驗證這件事?我猜需求曲線向上傾斜的例外案例數量,遠遠超過那些在統計上不顯著的案例。您能否更具體說明如何將 80/20 原則付諸實踐,尤其是當證據在某一方向上已經非常強大時?
Alex:並非生活中所有事情都有那麼多細微差別——有些事情的證據可能相當接近於單一方向。這是我對氣候變遷證據的解讀。那麼你如何得出這樣的判斷?可以透過科學共識來達成。如何在經濟學和金融學這類主題上獲取科學共識?你可以閱讀綜述文章——它們會更全面地檢視文獻。在醫學領域則有 Cochrane 綜述。所以在某些情況下,你不需要親力親為——已經有專家做過這些工作,你可以站在巨人的肩膀上。
如果沒有這樣的綜述可以依靠,我認為關鍵在於這個議題對你的重要性。比如母乳餵養和兒童發展,對我來說很重要。但我會去研究「足球是不是比橄欖球更有利於我孩子的發展」嗎?我可能不會認為這是一個那麼重要的問題。
另外,如果你認為某個議題上確認偏誤會特別強烈,以至於你看到的證據可能被高度篩選——比如永續發展與績效的數據、多樣性與績效的數據——你會發現幾乎所有數據都指向同一方向,似乎人們在緊抓並轉發這些資訊。這就是我選擇更深入檢視這些研究所宣稱內容背後「實際嚴謹度」的原因。
提問八:歷史學家的角色與偏誤來源的質疑
Ben Norman(前倫敦政經學院學生,現任英格蘭銀行,以個人身分發言):我帶著自己的偏誤來聽這場演講。我原本唸的是中世紀史,多年來我一直認為,真正質疑資料來源偏誤的歷史學家,是對抗後真相時代的關鍵解藥。所以我有點驚訝在您的演講中沒聽到這方面的內容。我非常喜歡您的階梯模型,但我在想:對資料來源偏誤的質疑,是否能成為您 80/20 原則的一部分——作為一種篩選工具,幫助我們判斷哪些事情不需要再走完整個階梯?
Alex:這是一個非常好的觀點。我在書的第九章中處理了這個問題:一個人如何在不進行所有這些檢查的情況下進行批判性思考?我們能否站在巨人的肩膀上?
其中一個我談到的機制是同儕審查——我們能在多大程度上依賴同儕審查流程。簡短的總結是:同儕審查是好的,並不完美,但完美不應成為良善的敵人。經過審查的內容總比未經審查的好。同儕審查並不總是有效,但它仍是一個品質標記。
另一個我們可以觀察的是作者的特質。有兩種特質特別重要:資歷和偏誤。資歷是指他們在該特定領域的專業知識——比如新冠疫情這種熱門議題,你可能看到很多醫生發聲,即使他們的專業是心臟科而非流行病學。偏誤方面,你可以問自己:這些作者是否可能發表相反的結果?比如,研究多樣性與財務績效的學術界內部,有很多學者展示了多樣性沒有正面效果,也有些人展示了正面效果——兩種結論都有可能出現。但高薪中心(High Pay Centre)會發表一份報告,說執行長薪酬並不過高嗎?不會——我認為他們在做的是倡議而非研究。
這並不意味著他們說的話一定是錯的——有時他們希望為真的事情確實是真的。但正如 Anil 所說,如果我們要決定在哪裡集中精力,那麼對於那些「只會呈現某種特定結果」的來源,我們就應該特別保持辨別力。
結語
Daniel 表示,還有很多人想提問,對未能被點到的人致歉,但時間已到。他再次感謝 Alex 的精采演講,提醒大家 Alex 將會在現場簽書,書籍也在現場販售。活動在掌聲中圓滿結束。