這才是心理學（六）

在前幾部分，我們已經學會了要警惕那些看似有理卻充滿陷阱的證據，如見證敘述和相關性數據。我們知道了為什麼「我朋友的經歷」和「A 與 B 有關」都不能直接證明因果關係。那麼，科學家究竟是如何超越這些局限，進而令人信服地揭示出事物之間的因果聯繫呢？

這引出了本書的第六個，也是方法論上最核心的論點：科學家透過「實驗控制」（Control）和「變數操縱」（Manipulation）來分離出真實的因果關係。這兩者與「隨機分配」（Random Assignment）的結合，構成了「真實驗」（True Experiment）的基礎，這是我們能得出最強因果結論的方法。

論點六：實驗的邏輯——讓一切置於控制之下

想像一下，您是一位偵探，正在調查一樁謀殺案。案發現場有多位嫌疑人，每個人都有一定的作案動機和可能。如果您想找出真正的兇手，您不能只聽取其中一個人的證詞（這就像個案研究），也不能僅僅因為某個嫌疑人與死者有過爭執就認定他是兇手（這就像相關研究）。一個優秀的偵探會做的是，系統性地排除其他所有嫌疑人，直到只剩下唯一一個無法被排除的。

科學實驗的邏輯與此非常相似。當我們想要驗證「變數 A 導致了變數 B」這個假設時，我們面臨的最大挑戰就是世界上無數個其他的變數（C 、 D 、 E…）可能也在同時影響著 B 。一個好的實驗，就像一場精密的偵探調查，其目的就是創設一種特殊的、受控制的條件，將我們感興趣的變數 A 的影響，從所有其他無關變數的混雜影響中分離出來。

約翰·斯諾與戈德伯格的啟示：從觀察到操縱

書中提到的兩位醫學偵探——約翰·斯諾和約瑟夫·戈德伯格——為我們展示了實驗邏輯的演進。

約翰·斯諾與霍亂（巧妙的比較與控制）：斯諾醫生懷疑霍亂是透過受污染的水源傳播的。但他面臨一個巨大的挑戰：在 19 世紀的倫敦，喝不同水源的人，其生活條件（貧富、衛生、飲食）也天差地別。如果他只是簡單地比較喝 A 公司水的人和喝 B 公司水的人的得病率，那麼任何差異都可能歸因於社會經濟地位這個強大的第三變數。斯諾的聰明之處在於，他找到了一個自然的實驗情境。在倫敦的某個區域，有兩家自來水公司同時供水，甚至在同一條街道上，相鄰的兩戶人家都可能使用不同的水源。這就天然地形成了一個比較組和一個控制組，這兩組人的社會經濟地位、生活習慣都非常相似，唯一的系統性差異就是他們的供水源不同。更幸運的是，其中一家公司的水源比另一家乾淨得多。結果發現，喝髒水的人家死亡率是喝乾淨水人家的近九倍。透過這種精巧的比較，斯諾在很大程度上排除了其他解釋，強有力地支持了他的因果假設。
戈德伯格與糙皮病（終極的操縱）：戈德伯格醫生的做法則更進一步，他不再僅僅是等待和觀察自然發生的情況，而是主動地去操縱和創造條件。為了證偽「糙皮病是傳染病」這個主流理論，他和助手們做了一件驚世駭俗的事：吞食糙皮病患者的排泄物！他們主動地創造了傳染病最可能傳播的條件，結果他們安然無恙。這就強有力地否定了傳染病的因果假設。接著，為了驗證自己的「營養不良導致糙皮病」的假設，他進行了一場真正的實驗。他找到兩組健康的囚犯，一組（實驗組）被給予他懷疑會致病的高碳水化合物、低蛋白飲食，另一組（控制組）則給予營養均衡的飲食。幾個月後，實驗組的囚犯果然患上了糙皮病，而控制組則保持健康。

戈德伯格的證據之所以比斯諾的更有說服力，就在於他使用了直接操縱。他不再被動地依賴自然界提供的關聯，而是主動地、系統地改變他認為是原因的那個變數（飲食），並觀察對結果（是否患病）的影響。

真實驗的核心：操縱與隨機分配

一個真實驗（True Experiment）的精髓，可以歸結為兩個關鍵要素：

1. 操縱（Manipulation）

科學家必須主動地去操縱他們認為是原因的那個變數，即自變數（Independent Variable）。例如，在戈德伯格的實驗中，「飲食類型」就是自變數。他創造了至少兩種不同水平的自變數（致病飲食 vs. 健康飲食）。然後，他去觀察這個操縱是否對結果變數——因變數（Dependent Variable）——產生了影響。在這個例子中，「是否患上糙皮病」就是因變數。

2. 隨機分配（Random Assignment）

僅有操縱還不夠。我們如何確保接受致病飲食的實驗組和接受健康飲食的控制組，在實驗開始之前，在所有其他方面都是相似的呢？萬一實驗組的人碰巧天生體質就比較弱呢？這時，隨機分配就派上了用場。

隨機分配指的是，將參與研究的被試以一種完全隨機的方式（例如擲硬幣或電腦隨機數）分配到不同的實驗組中。這樣做的目的是，在實驗操縱開始之前，就讓各組在所有可能的個體差異（如智力、體質、性格、家庭背景等）上達到最大程度的平衡。

隨機分配的力量是巨大的。隨著樣本量的增加，它能確保兩組之間不會存在任何系統性的偏差。即使因為偶然因素，實驗組的平均智商碰巧比控制組高了一點點，但在大量重複的實驗中，這種差異會被抵消掉。隨機分配確保了實驗組和控制組在統計上是「對等的」，因此，在實驗結束後，如果兩組在因變數上出現了顯著差異，我們就能更有信心地將這個差異歸因於我們唯一的、系統性的操縱——也就是自變數的影響。

重要區分：隨機分配 vs. 隨機取樣

請務必不要將「隨機分配」與我們在民意調查中常聽到的「隨機取樣（Random Sampling）」混為一談。

隨機取樣關乎的是「如何選取被試進入研究」，其目的是為了確保樣本能夠代表更廣泛的總體，這樣研究結果才能推廣到總體中去。
隨機分配關乎的是「如何將已經選入研究的被試分配到不同組別」，其目的是為了在實驗開始前平衡各組的個體差異，從而得出準確的因果結論。

一個研究可以有隨機取樣但沒有隨機分配（如一份好的相關性調查），也可以有隨機分配但沒有隨機取樣（如大多數在大學實驗室裡進行的基礎研究）。

聰明漢斯的故事：控制的必要性

書中「聰明漢斯」這匹會算術的馬的故事，生動地說明了如果缺乏恰當的實驗控制，我們是多麼容易被表象所迷惑。

漢斯確實能用蹄子敲出正確的算術題答案，這是一個無可爭議的現象描述。許多「專家」觀察後也證實了這一點。問題出在對這個現象的解釋。人們輕率地從「馬能答對題」這個現象，跳到了「馬具有算術能力」這個理論解釋上。

心理學家奧斯卡·芬斯特（Oskar Pfungst）則展現了真正的科學思維。他意識到，「馬有算術能力」只是眾多可能解釋中的一種。另一種可能是，馬在根據提問者不經意的視覺線索做出反應。為了區分這兩種解釋，芬斯特引入了實驗控制：

控制條件一：讓一個不知道答案的人來向漢斯提問。
控制條件二：讓提問者站在隔板後面，讓漢斯看不見他。

結果，在這些被控制的、非自然的「特殊條件」下，漢斯的「算術能力」就消失了。芬斯特由此證偽了「馬有算術能力」的假設，並證實了「馬是根據視覺線索反應」的假設。

這個故事教給我們兩個深刻的教訓：

必須仔細區分對現象的描述和對現象的解釋。 描述是客觀事實，而解釋是需要被檢驗的理論。
為了分離出真正的因果關係，科學家必須創設有時看起來很「人為」的特殊條件。 正是這些看似「不真實」的條件，才賦予了科學實驗揭示真相的獨特力量。

從直覺物理學到直覺心理學

本章開頭關於物體運動的小測驗，揭示了一個令人不安卻極其重要的事實：即使對於我們天天都能觀察到的物理現象，我們基於個人經驗所形成的「直覺理論」也往往是錯誤的。我們看過無數次物體下落，卻很少有人能憑直覺答對步槍射出的子彈與從同一高度自由落體的子彈會同時落地。

這背後的原因正是本章的核心：我們的日常觀察是「自然的」，但卻是「不受控制的」。在自然世界中，各種變數總是混雜在一起。只有像伽利略那樣，在光滑的斜面上滾動銅球，創設出人為的、受控制的條件，才能分離出變數，發現真正的運動定律。

如果我們連對物理世界的直覺都如此不可靠，那麼我們對更為複雜的人類行為的「直覺心理學」理論，又怎能輕易相信呢？這有力地反駁了「心理學不過是常識」的觀點。事實上，正因為我們的常識和直覺常常是錯誤的，我們才需要一門以實驗控制為基礎的科學心理學，來系統地檢驗我們關於人類行為的各種信念。

總結來說，實驗方法是科學的心臟。透過對感興趣的變數進行操縱，並使用隨機分配等方法來控制其他所有無關變數，科學家得以從複雜的現實世界中梳理出清晰的因果鏈條。這種方法可能看起來「人為」，甚至「古怪」，但它恰恰是科學能夠超越個人直覺和常識，提供可靠知識的根本原因。心理學正是透過擁抱這種實驗邏輯，才得以成為一門真正的科學。