博文谷

位置:首頁 > 作文素材 > 中考素材

以“博弈”或“變通”爲話題寫作文

諸葛亮誤用馬謖,致使街亭失守。孔明在西城中,準備啓程。等他安排停當,司馬懿引大軍15萬蜂擁而來。當時孔明身邊別無大將,只有一班文官,五千軍士,已分一半先運糧草去了,只剩二千五百軍在城中。衆官聽到這個消息,盡皆失色。孔明登城望之,果然塵土沖天,魏兵分兩路殺來。孔明傳令衆將,旌旗竟皆藏匿,諸軍各收城鋪。開啟城門,每一門用上二十軍士,扮作百姓,灑掃街道。而孔明披鶴髦,戴綸巾,引二小童,攜琴一張,於城上敵樓前,憑欄而坐,焚香操琴。馬司懿來到城下,見到諸葛亮焚香操琴,笑容可掬。司馬懿嚇壞了,立即叫後軍作前軍,前軍作後軍,急速退去。司馬懿之子司馬昭問:莫非諸葛亮無軍,故作此態,父親何故退兵?司馬懿說:“亮平生謹慎,不曾弄險,今大開城門,必有埋伏。我兵若進,中其計也。”孔明見魏軍退去,撫掌而笑,衆官無不駭然。諸葛亮說:司馬懿料吾平生謹慎,不曾弄險,見如此模樣,疑有伏兵,所以退去。吾非行險,蓋因不得已而用之。我們兵只有二千五百,若棄城而去,必爲之所擒。

以“博弈”或“變通”爲話題寫作文

我們可以用如下的博弈矩陣來表示這個博弈:

這個博弈中,“進攻”是司馬懿的“佔優策略”。該博弈有兩個納什均衡,即:(司馬懿“進攻”,諸葛亮“守城”);(司馬懿“進攻”,諸葛亮“棄城”)。然而,司馬懿不知道自己和對方在不同行動策略下的支付,而諸葛亮知道。他們對博弈結構的知識是不對稱的:諸葛亮擁有比司馬懿較多的知識。當然這種知識的不對稱完全是諸葛亮“製造出來的”。

司馬懿是如何推理的呢?司馬懿的推理是“歸納的”。司馬懿說:“亮平生謹慎,不曾弄險。今大開城門,必有埋伏。我兵若進,中其計也。”在司馬懿看來,諸葛亮一生都是謹慎的,既然諸葛亮一生沒有冒險,此次也肯定不會冒險,諸葛亮有埋伏。司馬懿在“攻城”和“撤退”之間作出“撤退”的選擇。

在這裏,司馬懿歸納作出了一個錯誤的策略選擇。儘管如此,我們不能說司馬懿是不理性的。司馬懿作出錯誤的策略選取,是由於不完全資訊造成的。在孔明-司馬懿的博弈中,孔明做出的空城假象,目的就是讓司馬懿感到“攻城”有較大的失敗的可能。如果我們用概率論的術語來說,諸葛亮的做法是加大司馬懿對進攻失敗的主觀概率。此時,在司馬懿看來,“攻城”失敗的可能性較大,而“撤退”的期望效用大於“攻城”的期望效用。即:司馬懿認爲,“攻城”的期望效用低於“撤退”的效用。諸葛亮惟有透過這個辦法,才能讓司馬懿退兵。

我知道是囚徒困境

就是AB兩個囚徒 被抓住後 關在兩個不同囚室

如果兩個都不招供 則每人只判三年 如果都招供 則每人判五年

如果一個招供 另一個不招供 則招供的判一年 不招供的判十年

最好的.結果當然是兩個人都不招供 但是由於資訊不對稱

對A來說如果B不招供 則他招供好一些 如果B招供 他也是招供好一些

則招供是他的佔優策略 他會選擇招供

同樣分析B 也 會選擇招供

最終結果是兩人都招工 併爲達到兩人都不招供的最優選擇

這就是囚徒困境

一般經濟學書上都會講

囚徒末路

“囚徒困境”是博弈論裏最經典的例子之一。它的模型是這樣的:

兩個嫌疑犯(A和B)作案後被警察抓住,隔離審訊;警方的政策是"坦白從寬,抗拒從嚴",如果兩人都坦白則各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白則因證據不足各判1年。

在這個例子裏,博弈的參加者就是兩個嫌疑犯A和B,他們每個人都有兩個策略即坦白和不坦白,判刑的年數就是他們的支付。可能出現的四種情況:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的結果。A和B均坦白是這個博弈的納什均衡。這是因爲,假定A選擇坦白的話,B最好是選擇坦白,因爲B坦白判8年而抵賴卻要判十年;假定A選擇抵賴的話,B最好還是選擇坦白,因爲B坦白判不被判刑而抵賴確要被判刑1年。即是說,不管A坦白或抵賴,B的最佳選擇都是坦白。反過來,同樣地,不管B是坦白還是抵賴,A的最佳選擇也是坦白。結果,兩個人都選擇了坦白,各判刑8年。在(坦白、坦白)這個組合中,A和B都不能透過單方面的改變行動增加自己的收益,於是誰也沒有動力遊離這個組合,因此這個組合是納什均衡。

囚徒困境反映了個人理性和集體理性的矛盾。如果A和B都選擇抵賴,各判刑1年,顯然比都選擇坦白各判刑8年好得多。當然,A和B可以在被警察抓到之前訂立一個"攻守同盟",但是這可能不會有用,因爲它不構成納什均衡,沒有人有積極性遵守這個協定。