這才是心理學(五)

在前一部分,我們已經學會了對個案研究和見證敘述這類「孤立事件」的證據保持高度警惕。現在,我們將進入科學推理中另一個更為普遍,也更為微妙的領域。這引出了本書的第五個核心論點:相關不等於因果(Correlation does not imply causation)。

這個原則是科學思維的基石,也是外行人最常犯的邏輯謬誤之一。掌握了這個原則,您就能看穿無數來自媒體、研究報告甚至學術討論中的誤導性結論。

論點五:相關與因果的迷霧——用「烤箱法」避孕的荒謬

讓我們從書中那個令人捧腹卻極具啟發性的例子開始:在台灣進行的一項大規模研究發現,在所有調查的變數中,與「是否使用避孕措施」這個行為相關性最強的變數,竟然是「家中電器的數量」。

如果我們將「相關」誤解為「因果」,那麼我們就會得出一個荒謬絕倫的政策建議:為了降低青少年懷孕率,政府應該在高中免費發放烤箱和電風扇!

您之所以會覺得這個建議可笑,是因為您的直覺告訴您,擁有烤箱和使用避孕措施之間,不可能存在直接的因果關係。一台烤箱不會神奇地讓人們產生避孕的念頭。您會很自然地想到,這兩者之間一定存在某個「中間人」,一個同時影響著這兩個變數的隱藏因素。這個隱藏因素,在統計學上被稱為第三變數(third variable)

在這個例子中,最明顯的第三變數就是社會經濟地位(socioeconomic status, SES)。通常情況下:

  • 社會經濟地位較高的人,更有可能接受良好的教育,擁有更強的避孕意識和資源,因此更傾向於使用避孕措施。
  • 同時,社會經濟地位較高的人,也更有經濟能力購買各種家用電器。

於是,社會經濟地位就像一座橋樑,將「電器數量」和「避孕措施使用」這兩個看似無關的變數聯繫了起來,製造出了一個虛假相關(spurious correlation)。相關是真實存在的(數據上確實有關聯),但背後的因果鏈條卻是虛假的。

這個看似簡單的例子,揭示了從相關性證據直接跳到因果結論的兩大陷阱:第三變數問題方向性問題

陷阱一:看不見的第三變數(The Third-Variable Problem)

第三變數問題的核心在於:當我們觀察到變數 A 和變數 B 之間存在相關時,這種關聯很可能不是因為 A 導致了 B,也不是因為 B 導致了 A,而是因為存在一個我們沒有測量到的第三變數 C,C 同時導致了 A 和 B 的變化。

書中糙皮病的例子是一個經典的歷史教訓。在 20 世紀初的美國南部,糙皮病肆虐,造成大量人口死亡。當時的醫生們觀察到一個強烈的相關:糙皮病的發病率與家庭的衛生條件(如是否有良好的排水系統)呈負相關。衛生條件越差的家庭,得病的人越多。於是,主流醫學界得出了結論:糙皮病是一種由惡劣衛生條件傳播的傳染病。這個結論看似合情合理,也符合當時對傳染病的普遍認知。

然而,約瑟夫·戈德伯格(Joseph Goldberger)醫生對此表示懷疑。他認為,真正的「第三變數」是飲食(背後則是社會經濟地位)。他觀察到,衛生條件差的家庭通常也更貧窮,他們的飲食主要由玉米等高碳水化合物、低蛋白質的食物構成。他假設,糙皮病是由於缺乏特定營養素(後來被證實是菸鹼酸,即維生素 B3)所導致的營養不良症。

在這個案例中,貧窮(社會經濟地位)是那個隱藏的第三變數。貧窮導致了飲食單一(低蛋白質),也導致了衛生條件差。於是,「衛生條件差」和「糙皮病」之間出現了虛假相關。如果當時的政府根據這個虛假相關制定公共衛生政策,投入大量資金去改善排水系統,而忽略了飲食問題,那麼將會有無數生命被白白犧牲。

這個問題在心理學研究中無處不在。例如,大量研究發現,父母的教養方式(如溫暖、支持)與孩子的學業成績和心理健康狀況存在正相關。人們很容易得出結論:是父母溫暖的教養「導致」了孩子更優秀。但這裡就可能存在一個強大的第三變數——遺傳。聰明、性格隨和的父母,不僅更有可能為孩子提供一個溫暖的成長環境,也更有可能將優秀的智力和性格基因遺傳給孩子。因此,孩子優秀的表現,可能同時源於遺傳和教養,甚至主要源於遺傳,而教養方式與孩子表現之間的相關,至少有一部分是虛假的。

陷阱二:因果的方向性(The Directionality Problem)

即使我們排除了所有可能的第三變數,當變數 A 和 B 存在相關時,我們仍然面臨一個棘手的問題:到底是 A 導致了 B,還是 B 導致了 A?這就是方向性問題。

書中關於眼動模式與閱讀能力的例子是闡釋這一點的最佳教材。研究早就發現,閱讀能力差的兒童,其眼球運動模式很不規則,存在更多的「回掃」(從右向左的眼動)和「凝視」(停頓)。基於這個強烈的相關,許多教育工作者得出結論:是不規則的眼動「導致」了閱讀困難。於是,大量的「眼動訓練」項目應運而生,耗費了無數的教育經費和時間。

然而,後來的嚴謹研究徹底推翻了這個因果方向。事實恰恰相反:是閱讀困難(如緩慢的詞語識別和理解困難)「導致」了不規則的眼動。當兒童的詞彙解碼能力和理解能力得到提升後,他們不規則的眼動自然就消失了。那些昂貴的眼動訓練儀,對提高閱讀能力沒有任何幫助,它們成了因果方向判斷錯誤的歷史見證。

同樣的邏輯也適用於自尊與學業成績的關係。長期以來,一個流行的觀點是,低自尊導致了差的學業成績,因此我們應該大力推行各種「自尊提升課程」。然而,大量研究證據表明,因果關係的方向更可能是反過來的:優異的學業成績(以及生活中的其他成就)「導致」了高自尊。一個孩子因為在數學上取得了成功而感到自信,而不是因為他感到自信就能神奇地解決數學難題。

這兩個例子給我們的教訓是:在沒有進行真正的實驗操縱之前,僅僅依賴相關數據,我們永遠無法確定因果關係的真正方向。

選擇偏差:產生虛假相關的隱形推手

第三變數問題有一種特別常見且具有誤導性的形式,稱為選擇偏差(selection bias)。它指的是,人們會「自我選擇」進入特定的群體或環境,這種自我選擇的行為,而不是環境本身,造成了某些行為特徵與環境之間的虛假相關。

書中舉了幾個精彩的例子:

  • 亞利桑那州的呼吸道疾病死亡率:數據顯示,亞利桑那州的呼吸道疾病死亡率高於美國平均水平。如果我們輕率地推斷,就會認為是亞利桑那州的空氣有問題。但真相是,正因為亞利桑那州以空氣乾燥潔淨聞名,許多患有呼吸道疾病的人才會「選擇」搬到那裡去安度晚年,並最終在那裡去世。是病人的「自我選擇」,而不是亞利桑那州的空氣,導致了這個虛假相關。
  • 心理治療的「負面」效果:有時數據會顯示,接受過心理治療的成癮者(如肥胖、吸毒),其治癒率反而低於那些從未接受過治療的人。這是否意味著心理治療有害?當然不是。真相是,問題最嚴重、最棘手、最不可能自癒的患者,才最有可能去「選擇」尋求專業的心理治療。是病情的嚴重程度導致了選擇行為,而不是治療導致了更差的結果。這就是所謂的「臨床醫生的錯覺」。
  • 「性感」的共和黨支持者:有數據顯示,共和黨支持者比民主黨支持者對自己的性生活更滿意。這是否意味著共和黨的政治理念能提升性福感?當然也不是。這背後是選擇偏差:1. 已婚人士比單身人士更傾向於投票給共和黨;2. 已婚人士比單身人士對性生活更滿意。是「已婚」這個共同因素,導致了政治立場與性生活滿意度之間的虛假相關。

我們能從相關研究中學到什麼?

讀到這裡,您可能會覺得相關研究似乎一無是處。但這並非本書的結論。相關研究在科學探索中扮演著重要的角色:

  1. 提供預測:即使無法確定因果關係,強烈的相關也能幫助我們做出有效的預測。保險公司正是利用年齡、性別、駕駛記錄等相關變數來預測事故風險,從而制定保費,即使他們知道年齡本身不是導致事故的直接原因。
  2. 提供線索:相關研究是發現潛在因果關係的第一步。許多重要的科學發現都始於對一個有趣相關的觀察。
  3. 排除假設:雖然相關不能「證實」因果,但它有時可以「證偽」因果。如果兩個變數之間連相關都不存在,那麼它們之間就不太可能有直接的因果關係。
  4. 倫理考量:在許多情況下,我們出於倫理原因「不能」進行實驗。例如,我們不能隨機指派一些孩子去吸煙,來研究吸煙對發育的影響。在這些情況下,相關研究就是我們能獲得的最佳證據。

結論:保持對因果推論的敬畏

本章的核心教訓是,我們必須對從相關直接跳到因果的誘惑保持極大的警惕。人類的大腦天生就喜歡尋找因果解釋,這讓我們在看到兩個事件同時發生時,會不自覺地為它們編織一個因果故事。科學訓練的一個重要部分,就是學會抑制這種衝動。

當您下一次讀到一篇新聞報導,標題是「研究發現,吃巧克力的人更快樂」時,您應該立刻在腦中升起幾個問題:

  • 第三變數問題:有沒有可能是更富裕的人既能買得起更多巧克力,也擁有更快樂的生活?
  • 方向性問題:有沒有可能是快樂的人更傾向於獎勵自己吃巧克力,而不是吃巧克力讓人們變得快樂?
  • 選擇偏差問題:這項研究的參與者是如何被選中的?

只有當一項研究採用了實驗控制隨機分配(這將是下一章的核心內容)時,我們才能更有信心地談論因果關係。在此之前,任何相關性的發現,都應被視為一個有待進一步驗證的有趣線索,而不是一個板上釘釘的因果結論。