第21部分(第1/4 頁)
功回球機率沿著圖中的兩條直線上升到交點之上,也就是超過48%。因此,40%的時間瞄準對方的正手就是發球者的最佳策略。
混合策略的確切比例是由基本行動配對而成的4種情況確定的。對於擁有不同的絕對優勢和相對優勢的選手,這裡的數字90、60、30
和20會相應發生變化,而他們的最佳混合策略也會隨之不同。我們很快就會發現,這樣一些變化可能導致一些令人驚訝的結果。這裡的關鍵在於,你必須透過估計你真正參加的博弈的4種基本情況,確定自己的最佳混合策略。
這裡有一條捷徑,使你不必畫出前面提到的圖表也可以計算出均衡策略。這個簡單的算術方法歸功於J。D.威廉斯。'3'回到基本情況的表格。對於發球者,如果選擇瞄準對方正手的策略,就要觀察對方選擇兩種不同的回應方式之一會使結果發生什麼變化;我們得到90…30=60
。假設他瞄準對方反手發球,再做同樣的計算,可得60…20=40 。將上述數字倒過來排列,就能得到最佳混合策略中採用這兩種策略的機率。①
因此,發球者應該按照40:60的比例瞄準對方的正手和反手。
現在我們改從接球者的角度考察同一場比賽。圖7…4顯示了他的不同選擇會有什麼不同的結果。假如發球者瞄準他的反手,那麼,他回①
我們可以用一點代數知識驗證這個結果。假如縱列選手的得失情況如下圖所示,左列對右列的均衡比例為(D…B):(
A…C)。縱列選手選擇左列的機率是p,那麼,無論橫行選手選擇上或者下都沒有關係;pA+(1…p)B=pC十1…P)D 意味著p /(
1…p )=(D…B )/(A…C)
,如前所述。由於橫行選手的得失是縱列選手的得失的負數,他的均衡混合策略就是上行對下行,即(D…C):(A…B)。
球的時候向反手方移動就能得到60%的成功回球機率,而向正手方移動的成功回球機率只有20%。從O到100%改變向正手方移動的機率,就得到一條和上述兩點相交的直線。與前面的分析類似,若是發球者瞄準對手的正手,我們就得到一條從30%上升到90%的直線。這兩條直線交於一點,在這一點,接球者向正手方移動的機率為30%
,無論發球者選擇瞄準哪一方,他的成功回球機率始終維持在48%。任何其他混合策略都會讓發球者佔便宜,使他得以選擇更好的策略,將接球者的成功回球機率進一步降低到48%以下。
圖7…4 接球手向正手移動的機率(% )
此外,我們也可以採用威廉斯的方法。表格顯示了接球者兩種不同選擇可能導致什麼不同結果。若向正手方移動,我們得到90…20=70 ;
向反手方移動,我們得到60…30=30。將這兩個數字倒過來排列就得到最佳混合策略的比例:30%的時間準備向正手方移動,70%的時間準備向反手方移動。
你可能已經注意到,從兩位選手的不同角度計算最佳混合策略,會得到一個有趣的共同點:兩次計算會得到同樣的成功回球機率,即48%。接球者若採用自己的最佳混合策略,就能將發球者的成功機率拉低到發球者採用自己的最佳混合策略所能達到的成功機率。這並非巧合,而是兩個選手的利益嚴格對立的所有博弈的一個共同點。這個結果稱為最小最大定理,由前普林斯頓數學家約翰·馮·諾伊曼(John
von Nrumann)與奧斯卡·摩根斯頓(Oscar
Morgenstern)創立。這一定理指出,在零和博弈裡,參與者的利益嚴格相反(一人所得等於另一人所失),每個參與者儘量使對手的最大收益最小化,而他的對手則努力使自己的最小收益最大化。他們這樣做的時候,會出現一個令人驚訝的結果,即最大收益的最小值(最小最大收益)等於最小收益的最大值(最大最小收益)。雙方都沒辦法改善自己的地位,因此這些策略形成這個博弈的一個均衡。
我們以網球比賽為例,並假設每個選手只有兩種策略,以此證明這一定理。假如發球者想努力使接球者的最大成功率最小化,他應該在假設接球者已經正確預計到他的混合策略且會做出最優回應的基礎上確定自己的行動。也就是說,接球者的成功率將是圖7…5中兩條直線的最大值。這個最大值的最小值出現在兩條直線的相交處,該點的成功率為48%。