會員書架
首頁 > 遊戲競技 > 更好地學會做策略選擇:博弈生存 > 第1部分

第1部分(第3/4 頁)

目錄
最新遊戲競技小說: 記錄地平線上的旅途苟在艾澤拉斯的幸福生活騎砍之卡拉迪亞征途籃壇:將時代拉回正軌網路重生王者:這個選手,正得發邪傳說之下,時間線之外的人遊戲降臨:從隱藏職業開始封神牧師傳說網遊之超級鬼才終極牧師我的遊戲專治主播精神內耗優雅型AD,他身上沒有汙漬!B級天賦,一樣可以登頂列車求生:無掛求生nba最強球星詹姆斯哈登夏日狂響曲開局零幸運值?別慌我有任意門雙城之戰:第九議員網遊之獨步逍遙

些內容呢?

第一, 一個博弈涉及至少兩個獨立的博弈參與人(player)。

一個博弈是一個活動,該活動至少有兩個參與人,下文有時將參與人稱為行動者。每個參與人透過行動,努力使自己的效用或利益最大化。但是,他的行動的好處或支付取決於另外的參與人。

“囚徒博弈”或“囚徒困境”是一個被廣泛談及和研究的博弈。兩個共同作案偷竊的小偷被警察抓住,被帶進警察局單獨關押。他們面臨的“政策”是“坦白從寬,抗拒從嚴”,具體的政策是:如果一方與警方合作,招認並供出自己與對方以前所做違法之事,而對方不招認,招認方無罪釋放,不招認的另一方則會被判重刑10年;如果雙方都與警方合作共同招認,各被判刑5年;而如果雙方均不承認有罪,因警察找不到他們以前違法的證據,只能對他們的小偷行為進行懲戒,各被判刑3個月。這兩個小偷如何作出選擇?

在這個囚徒困境中,參與人為兩個小偷。每個小偷的最後結果——是當場釋放還是被判刑(10年、5年、3個月),不僅取決於他自己的決定,而且還取決於另外一個小偷的決定。

買賣活動是日常生活中的常見現象。我們知道,在買賣的交換行為中,買東西的人要儘量以低的價格買到,但是他是否能買到取決於賣者是否能賣;賣東西的人想以儘量高的價格將東西賣出去,但價格太高,買者不接受,因此賣東西的人能否將物品賣出去取決於買者。

囚徒困境是一個博弈,買賣的交易活動也是博弈。我們可看到,在任何一個博弈之中,至少存在兩個理性的參與人,他們的利益是相關的,即他們每個人的利益受其他人的行動影響。

博弈中行動者或參與人存在策略(strategy)選擇的可能。

博弈論用策略空間來表示參與人可以選擇的策略集。

赤壁一戰,曹兵大敗,曹操落荒而逃,在選擇是走通往華容道的小路,還是選擇大路時,曹操需要在兩個策略之間進行選擇:“走大路”還是“走小路”。曹操最終選擇“走小路”。囚徒困境中的小偷面臨著“不招認”還是“招認”的選擇。

不同策略下的後果往往是有差異的,否則便不存在選擇的必要。對每個參與人而言,如果沒有不同選擇的可能,理性的計算便是多餘的,對自己的目標也就無能為力。從這個意義上來講,我國改革開放走向市場經濟,就是使得每個經濟主體有選擇的可能,這樣人們才能發揮其理性的作用,使每個人的經濟狀況更好,而在計劃經濟下因沒有可選擇的餘地,每個人的理性計算能力便無從施展。

參與人在不同策略組合下會得到一定的支付(payoff)。

我們往往用支付矩陣來表示參與人在各種策略組合下的支付。1這個方法簡單,比用函式來表示直觀、易於理解,當然它的缺陷是,它只能表示兩個人的博弈結構。囚徒困境的支付矩陣為:

基本術語(2)

乙 不招認 招認 不招認 各被判刑3個月 甲:當場釋放

乙:被判刑10年, 招認 甲:被判刑10年

乙:當場釋放 各被判刑5年這個矩陣表示的是:若甲選擇“招認”、乙選擇“招認”,甲乙各被判刑5年;若甲選擇“招認”、乙選擇“不招認”,甲被當場釋放,乙被判刑10年;若甲選擇“不招認”、乙選擇“招認”,甲被判刑10年,乙被當場釋放;若甲選擇“不招認”、乙選擇“不招認”,甲乙均被判刑3個月。

我們再來刻畫一交易過程的支付矩陣。在賣主甲和買主乙之間的“買—賣”博弈中——這是一討價還價過程,透過討價還價後一個價格被確定。在此價格下我們假定,賣者賣成後獲得的效用為6,賣不成的效用為0;買者買成的效用為4,買不成的效用為0。而如果他們之間的交易不成功,無論是買主還是賣主都要等待並再次進行討價還價,這需要成本。假定等待和討價還價的成本均為1,則支付矩陣為:

甲 買成 買不成 賣成 6,4 5,0 賣不成 0,3 0,0 這兩個矩陣表明,在每個策略組合下參與人有一個收益值或支付值。

第四,對於博弈參與人來說,存在一個博弈結果。

所謂博弈結果是指,一個博弈中參與人最終對策略的選擇而產生的確定性的支付。如在曹操敗走華容道的博弈中,諸葛亮在“埋伏大路”與“埋伏通往華容道的小路”之間進行選擇,而曹操需要在“走

本章未完,點選下一頁繼續。

目錄
重生後搞事業去了朝鮮戰爭美英戰俘紀事帝行天下:拐來美男充後宮傾舞江湖長宮亂(GL)上神碧落
返回頂部