賽局理論核心概念解析

什麼是社會困境(Social Dilemma)?書中以什麼例子來說明?

社會困境是指個體追求自身利益的理性行為,最終導致對所有人都不利的結果。書中以一個共有土地放牧山羊的例子來說明。假設有十個家庭共享一片土地,每個家庭單獨決策飼養多少隻山羊。每個家庭的牛奶產量函數是 m = ge^(1-(g+G)/10),其中 g 是該家庭飼養的羊數量,G 是其他所有家庭飼養的羊總數。從單個家庭的角度來看,無論其他家庭養多少隻羊,飼養十隻羊都能使其自身牛奶產量最大化。然而,當所有十個家庭都這樣做時,總共一百隻羊會過度放牧這片土地,導致牛奶總產量極低 (M = 100e^(-9) ≈ 0.012),幾乎可以忽略不計。這個例子展示了個人理性與集體非理性的衝突。

在賽局理論中,什麼是純策略(Pure Strategy)?書中以井字遊戲為例說明了什麼?

純策略是指玩家在每個決策點都選擇一個特定的行動。對於一個有完美資訊的賽局(如井字遊戲的部分樹狀圖所示),一個純策略必須為玩家在每個可能的決策點指定一個行動。書中以一個簡化的三人井字遊戲為例,說明了計算純策略數量的方法。如果玩家 I 在節點 a 有 4 個選擇,在節點 b 有 2 個選擇,在節點 c 有 2 個選擇,那麼玩家 I 總共有 4 × 2 × 2 = 16 個純策略。這個例子強調了即使是看似簡單的遊戲,其策略空間也可能非常龐大。

賽局理論中如何理解機率(Probability)?機率的「proper interpretation」為何會被哲學家爭論?

在賽局理論中,機率被用來描述事件發生的可能性,通常表示為介於 0 和 1 之間的實數。書中將機率定義為一個從樣本空間 S(所有可能事件的集合)到閉區間 [0, 1] 的函數 prob: S → [0, 1],為每個事件 E 分配一個唯一的機率值 prob(E) 。例如,擲一個公平的六面骰子,擲出偶數點的機率是 prob(2) + prob(4) + prob(6) = 1/6 + 1/6 + 1/6 = 1/2 。機率的「proper interpretation」之所以被哲學家爭論,是因為對於機率的本質存在不同的觀點,例如頻率主義(將機率視為事件在長期重複試驗中的相對頻率)、主觀主義(將機率視為個體對事件發生的信念程度)等等。不同的解釋會影響我們如何在現實世界中應用和理解機率。

賽局理論中的報酬(Payoffs)是如何衡量的?為什麼不能僅僅用金錢來衡量?效用(Utility)的概念是什麼?

在賽局理論中,報酬衡量的是玩家在賽局結束時獲得的結果的價值或吸引力。書中指出,報酬不能僅僅用金錢來衡量,因為玩家的決策不僅受到金錢利益的驅動,還受到他們的偏好、風險態度以及其他非貨幣因素的影響。因此,賽局理論中使用效用(Utility)這個更廣泛的概念來衡量報酬。效用代表了玩家對不同結果的主觀偏好程度。維多利亞時代的經濟學家曾將效用視為衡量個人感受到的快樂或痛苦程度,但現代賽局理論將效用視為一種可以代表玩家在不同選項之間做出選擇時所表現出的偏好的指標。

什麼是馮·諾伊曼-摩根斯坦效用函數(Von Neumann and Morgenstern Utility Function)?它如何幫助我們理解風險下的決策?

馮·諾伊曼-摩根斯坦效用函數是一種將個體對不同結果的偏好量化的方法,尤其適用於涉及風險的決策情境。這個函數為每個可能的結果分配一個效用值,並且滿足一些特定的公理(如完備性、可傳遞性、連續性和獨立性)。一個擁有馮·諾伊曼-摩根斯坦效用函數的個體在面臨不同機率分布的結果(彩票)時,會選擇使得其期望效用最大化的選項。書中舉例說明了奧爾加的貨幣效用函數 u(x) = 4√x,這是一個凹函數,表明奧爾加是風險厭惡的,因為每一額外美元帶來的效用增量遞減。這種效用函數能夠解釋人們在面對風險時並非總是追求期望貨幣價值最大化,而是根據他們對不同結果的效用評價來做出決策。

什麼是納許均衡(Nash Equilibrium)?在雙人賽局中,如何判斷一個策略組合是否是納許均衡?

納許均衡是指在一個賽局中,所有玩家的策略構成的組合,其中每個玩家的策略都是在給定其他玩家策略的前提下,對自己最優的回應。換句話說,在納許均衡中,沒有任何一個玩家能夠通過單方面改變自己的策略來獲得更高的報酬。在一個雙人賽局中,一個策略組合 (s, t)(其中 s 是玩家一的策略,t 是玩家二的策略)是納許均衡,當且僅當 s 是對 t 的最佳回應,並且 t 同時也是對 s 的最佳回應。書中用不等式 p1(s, t) ≥ p1(s’, t) 對於玩家一的所有其他策略 s’ 成立,以及 p2(s, t) ≥ p2(s, t’) 對於玩家二的所有其他策略 t’ 成立來表示這個概念。

為什麼在重複賽局(Repeated Game)中,承諾(Commitment)很重要但又難以實現?如何通過不可逆的行動來達到類似承諾的效果?

在重複賽局中,玩家之間的互動是多次進行的,這使得當前的行為可能會影響未來的互動和報酬。承諾在重複賽局中很重要,因為它可以幫助玩家建立信任,促成合作,並獲得比單次賽局更高的長期收益。然而,僅僅聲稱自己已做出承諾往往難以令人信服,特別是在其他玩家認為你是理性的並會追求自身利益的情況下。因為在未來的某個時間點,維持承諾可能不再符合你的短期利益,你可能會選擇背棄承諾。為了達到類似承諾的效果,玩家可以採取不可逆的行動。這些行動通常是代價高昂的,這樣其他玩家才能相信你是認真的,並且你的確會按照你所說的那樣去做,因為改變主意會付出很高的成本。書中提到,這種行動相當於「把錢放在嘴邊」,以此來向其他玩家傳達你的決心。

什麼是逆向歸納法(Backward Induction)?書中以一個簡單的例子(在街上遇到要錢的人)說明了什麼?

逆向歸納法是一種從賽局的最後一個階段開始,逐步向前推理,以確定每個階段理性玩家應該採取的行動的方法。它通常應用於有限且具有完美資訊的序列賽局。書中以一個在街上遇到要錢的人的簡單例子來說明逆向歸納法可能導致令人不安的結果。假設你有 10 美元,遇到一個人向你要 1 美元。你可以選擇給或不給。如果你不給,他可能會變得有攻擊性,這對你來說是不利的。但是,如果你理性地從最後一步開始考慮,你會意識到,無論你之前做了什麼,在最後一刻給 1 美元似乎總比冒著被攻擊的風險要好。然而,如果你提前預料到這種情況,你可能會選擇避免走那條街,從而避免了這個困境。這個例子表明,雖然逆向歸納法在理論上是合理的,但在某些情況下,它可能導致與我們的直覺相悖或不良的結果,並強調了預先行動和改變遊戲規則的重要性。