以“博弈”或“變通”爲話題寫作文

諸葛亮誤用馬謖，致使街亭失守。孔明在西城中，準備啓程。等他安排停當，司馬懿引大軍15萬蜂擁而來。當時孔明身邊別無大將，只有一班文官，五千軍士，已分一半先運糧草去了，只剩二千五百軍在城中。衆官聽到這個消息，盡皆失色。孔明登城望之，果然塵土沖天，魏兵分兩路殺來。孔明傳令衆將，旌旗竟皆藏匿，諸軍各收城鋪。開啟城門，每一門用上二十軍士，扮作百姓，灑掃街道。而孔明披鶴髦，戴綸巾，引二小童，攜琴一張，於城上敵樓前，憑欄而坐，焚香操琴。馬司懿來到城下，見到諸葛亮焚香操琴，笑容可掬。司馬懿嚇壞了，立即叫後軍作前軍，前軍作後軍，急速退去。司馬懿之子司馬昭問：莫非諸葛亮無軍，故作此態，父親何故退兵?司馬懿說：“亮平生謹慎，不曾弄險，今大開城門，必有埋伏。我兵若進，中其計也。”孔明見魏軍退去，撫掌而笑，衆官無不駭然。諸葛亮說：司馬懿料吾平生謹慎，不曾弄險，見如此模樣，疑有伏兵，所以退去。吾非行險，蓋因不得已而用之。我們兵只有二千五百，若棄城而去，必爲之所擒。

我們可以用如下的博弈矩陣來表示這個博弈：

這個博弈中，“進攻”是司馬懿的“佔優策略”。該博弈有兩個納什均衡，即：(司馬懿“進攻”，諸葛亮“守城”);(司馬懿“進攻”，諸葛亮“棄城”)。然而，司馬懿不知道自己和對方在不同行動策略下的支付，而諸葛亮知道。他們對博弈結構的知識是不對稱的：諸葛亮擁有比司馬懿較多的知識。當然這種知識的不對稱完全是諸葛亮“製造出來的”。

司馬懿是如何推理的呢?司馬懿的推理是“歸納的”。司馬懿說：“亮平生謹慎，不曾弄險。今大開城門，必有埋伏。我兵若進，中其計也。”在司馬懿看來，諸葛亮一生都是謹慎的，既然諸葛亮一生沒有冒險，此次也肯定不會冒險，諸葛亮有埋伏。司馬懿在“攻城”和“撤退”之間作出“撤退”的選擇。

在這裏，司馬懿歸納作出了一個錯誤的策略選擇。儘管如此，我們不能說司馬懿是不理性的。司馬懿作出錯誤的策略選取，是由於不完全資訊造成的。在孔明-司馬懿的博弈中，孔明做出的空城假象，目的就是讓司馬懿感到“攻城”有較大的失敗的可能。如果我們用概率論的術語來說，諸葛亮的做法是加大司馬懿對進攻失敗的主觀概率。此時，在司馬懿看來，“攻城”失敗的可能性較大，而“撤退”的期望效用大於“攻城”的期望效用。即：司馬懿認爲，“攻城”的期望效用低於“撤退”的效用。諸葛亮惟有透過這個辦法，才能讓司馬懿退兵。

我知道是囚徒困境

就是AB兩個囚徒被抓住後關在兩個不同囚室

如果兩個都不招供則每人只判三年如果都招供則每人判五年

如果一個招供另一個不招供則招供的判一年不招供的判十年

最好的.結果當然是兩個人都不招供但是由於資訊不對稱

對A來說如果B不招供則他招供好一些如果B招供他也是招供好一些

則招供是他的佔優策略他會選擇招供

同樣分析B 也會選擇招供

最終結果是兩人都招工併爲達到兩人都不招供的最優選擇

這就是囚徒困境

一般經濟學書上都會講

囚徒末路

“囚徒困境”是博弈論裏最經典的例子之一。它的模型是這樣的：

兩個嫌疑犯(A和B)作案後被警察抓住，隔離審訊;警方的政策是"坦白從寬，抗拒從嚴"，如果兩人都坦白則各判8年;如果一人坦白另一人不坦白，坦白的放出去，不坦白的判10年;如果都不坦白則因證據不足各判1年。

在這個例子裏，博弈的參加者就是兩個嫌疑犯A和B，他們每個人都有兩個策略即坦白和不坦白，判刑的年數就是他們的支付。可能出現的四種情況：A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白，是博弈的結果。A和B均坦白是這個博弈的納什均衡。這是因爲，假定A選擇坦白的話，B最好是選擇坦白，因爲B坦白判8年而抵賴卻要判十年;假定A選擇抵賴的話，B最好還是選擇坦白，因爲B坦白判不被判刑而抵賴確要被判刑1年。即是說，不管A坦白或抵賴，B的最佳選擇都是坦白。反過來，同樣地，不管B是坦白還是抵賴，A的最佳選擇也是坦白。結果，兩個人都選擇了坦白，各判刑8年。在(坦白、坦白)這個組合中，A和B都不能透過單方面的改變行動增加自己的收益，於是誰也沒有動力遊離這個組合，因此這個組合是納什均衡。

囚徒困境反映了個人理性和集體理性的矛盾。如果A和B都選擇抵賴，各判刑1年，顯然比都選擇坦白各判刑8年好得多。當然，A和B可以在被警察抓到之前訂立一個"攻守同盟"，但是這可能不會有用，因爲它不構成納什均衡，沒有人有積極性遵守這個協定。