請問什麼是「囚徒困境」,什麼是囚徒困境

2022-09-04 18:41:21 字數 4963 閱讀 3247

1樓:

「囚徒困境」是博弈論裡最經典的例子之一。它的模型是這樣的:

兩個嫌疑犯(a和b)作案後被警察抓住,隔離審訊;**的政策是"坦白從寬,抗拒從嚴",如果兩人都坦白則各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白則因證據不足各判1年。

在這個例子裡,博弈的參加者就是兩個嫌疑犯a和b,他們每個人都有兩個策略即坦白和不坦白,判刑的年數就是他們的支付。可能出現的四種情況:a和b均坦白或均不坦白、a坦白b不坦白或者b坦白a不坦白,是博弈的結果。

a和b均坦白是這個博弈的納什均衡。這是因為,假定a選擇坦白的話,b最好是選擇坦白,因為b坦白判8年而抵賴卻要判十年;假定a選擇抵賴的話,b最好還是選擇坦白,因為b坦白判不被判刑而抵賴確要被判刑1年。即是說,不管a坦白或抵賴,b的最佳選擇都是坦白。

反過來,同樣地,不管b是坦白還是抵賴,a的最佳選擇也是坦白。結果,兩個人都選擇了坦白,各判刑8年。在(坦白、坦白)這個組合中,a和b都不能通過單方面的改變行動增加自己的收益,於是誰也沒有動力遊離這個組合,因此這個組合是納什均衡。

囚徒困境反映了個人理性和集體理性的矛盾。如果a和b都選擇抵賴,各判刑1年,顯然比都選擇坦白各判刑8年好得多。當然,a和b可以在被警察抓到之前訂立一個"攻守同盟",但是這可能不會有用,因為它不構成納什均衡,沒有人有積極性遵守這個協定。

2樓:

囚徒困境是博弈論中非零和博弈的代表性的例子,反映個人最佳選擇並非是團體最佳選擇。

3樓:職場小白

付費內容限時免費檢視

回答囚徒困境(prisoner's dilemma)是指兩個**的囚徒之間的一種特殊博弈,說明為什麼甚至在合作對雙方都有利時,保持合作也是困難的。囚徒困境是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。雖然困境本身只屬模型性質,但現實中的**競爭、環境保護、人際關係等方面,也會頻繁出現類似情況。

囚徒困境(prisoner'sdilemma)是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。或者說在一個群體中,個人做出理性選擇卻往往導致集體的非理性。雖然困境本身只屬模型性質,但現實中的**競爭、環境保護等方面,也會頻繁出現類似情況。

「囚徒困境」是2023年美國蘭德公司的梅里爾·弗勒德(merrillflood)和梅爾文·德雷希爾(melvindresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(alberttucker)以囚徒方式闡述,並命名為「囚徒困境」。兩個共謀犯罪的人被關入監獄,不能互相溝通情況。如果兩個人都不揭發對方,則由於證據不確定,每個人都坐牢一年;若一人揭發,而另一人沉默,則揭發者因為立功而立即獲釋,沉默者因不合作而入獄十年;若互相揭發,則因證據確實,二者都判刑八年。

由於囚徒無法信任對方,因此傾向於互相揭發,而不是同守沉默。

更多1條

什麼是囚徒困境

4樓:柳絮迎風飄搖

囚徒困境是博弈論中非零和博弈的代表性的例子,反映個人最佳選擇並非團體最佳選擇。雖然困境本身只屬模型性質,但現實中囚徒困境的例子屢見不鮮。

囚徒困境是2023年美國蘭德公司的梅里爾·弗勒德(merrill flood)和梅爾文·德雷希爾(melvin dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(albert tucker)以囚徒方式闡述,並命名為"囚徒困境"。兩個共謀犯罪的人被關入監獄,不能互相溝通情況。

如果兩個人都不揭發對方,則由於證據不確定,每個人都坐牢一年;若一人揭發,而另一人沉默,則揭發者因為立功而立即獲釋,沉默者因不合作而入獄十年;若互相揭發,則因證據確實,二者都判刑八年。由於囚徒無法信任對方,因此傾向於互相揭發,而不是同守沉默。最終導致納什均衡僅落在非合作點上的博弈模型。

囚徒困境(prisoner's dilemma ):兩個**的囚徒之間的一種特殊博弈,說明為什麼甚至在合作對雙方都有利時,保持合作也是困難的。囚徒困境是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。

雖然困境本身只屬模型性質,但現實中的**競爭、環境保護、人際關係等方面,也會頻繁出現類似情況。

5樓:牽青芬所己

什麼是囚徒困境呢?它的具體內容是什麼呢?

囚徒困境簡介

囚徒困境是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。雖然困境本身只屬模型性質,但現實中的**競爭、環境保護等方面,也會頻繁出現類似情況。

單次發生的囚徒困境,和多次重複的囚徒困境結果不會一樣。

在重複的囚徒困境中,博弈被反覆地進行。因而每個參與者都有機會去「懲罰」另一個參與者前一回合的不合作行為。這時,合作可能會作為均衡的結果出現。

欺騙的動機這時可能被受到懲罰的威脅所克服,從而可能導向一個較好的、合作的結果。作為反覆接近無限的數量,納什均衡趨向於帕累托最優。

經典的囚徒困境

2023年,由就職於蘭德公司的梅里爾·弗拉德(merrill

flood)和梅爾文·德雷希爾(melvin

dresher)擬定出相關困境的理論,後來由顧問阿爾伯特·塔克(albert

tucker)以囚徒方式闡述,並命名為「囚徒困境」。經典的囚徒困境如下:

**逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人入罪。於是**分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:

若一人認罪並作證檢舉對方(相關術語稱「背叛」對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。

若二人都保持沉默(相關術語稱互相「合作」),則二人同樣判監半年。

若二人都互相檢舉(互相「背叛」),則二人同樣判監2年。

如同博弈論的其他例證,囚徒困境假定每個參與者(即「囚徒」)都是利己的,即都尋求最大自身利益,而不關心另一參與者的利益。參與者某一策略所得利益,如果在任何情況下都比其他策略要低的話,此策略稱為「嚴格劣勢」,理性的參與者絕不會選擇。另外,沒有任何其他力量干預個人決策,參與者可完全按照自己意願選擇策略。

囚徒到底應該選擇哪一項策略,才能將自己個人的刑期縮至最短?兩名囚徒由於隔絕監禁,並不知道對方選擇;而即使他們能交談,還是未必能夠盡信對方不會反口。就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。

試設想困境中兩名理性囚徒會如何作出選擇:

若對方沉默、背叛會讓我獲釋,所以會選擇背叛。

若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。

二人面對的情況一樣,所以二人的理性思考都會得出相同的結論——選擇背叛。背叛是兩種策略之中的支配性策略。因此,這場博弈中唯一可能達到的納什均衡,就是雙方參與者都背叛對方,結果二人同樣服刑2年。

這場博弈的納什均衡,顯然不是顧及團體利益的帕累托最優解決方案

。以全體利益而言,如果兩個參與者都合作保持沉默,兩人都只會被判刑半年,總體利益更高,結果也比兩人背叛對方、判刑2年的情況較佳。但根據以上假設,二人均為理性的個人,且只追求自己個人利益。

均衡狀況會是兩個囚徒都選擇背叛,結果二人判決均比合作為高,總體利益較合作為低。這就是「困境」所在。例子漂亮地證明了:

非零和博弈中,帕累托最優和納什均衡是相沖突的。

6樓:匿名使用者

囚徒困境的故事講的是,

兩個嫌疑犯作案後被警察抓住,分別關在不同的屋子裡接受審訊。警察知道兩人有罪,但缺乏足夠的證據。警察告訴每個人:

如果兩人都抵賴,各判刑一年;如果兩人都坦白,各判八年;如果兩人中一個坦白而另一個抵賴,坦白的放出去,抵賴的判十年。於是,每個囚徒都面臨兩種選擇:坦白或抵賴。

然而,不管同夥選擇什麼,每個囚徒的最優選擇是坦白:如果同夥抵賴、自己坦白的話放出去,不坦白的話判一年,坦白比不坦白好;如果同夥坦白、自己坦白的話判八年,不坦白的話判十年,坦白還是比不坦白好。結果,兩個嫌疑犯都選擇坦白,各判刑八年。

如果兩人都抵賴,各判一年,顯然這個結果好。但這個帕累託改進辦不到,因為它不能滿足人類的理性要求。囚徒困境所反映出的深刻問題是,人類的個人理性有時能導致集體的非理性——聰明的人類會因自己的聰明而作繭自縛。

什麼是囚徒困境?

7樓:叔梅胥俏

囚徒困境(prison

dilemma)是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。雖然困境本身只屬模型性質,但現實中的**競爭、環境保護等方面,也會頻繁出現類似情況。

單次發生的囚徒困境,和多次重複的囚徒困境結果不會一樣。

在重複的囚徒困境中,博弈被反覆地進行。因而每個參與者都有機會去「懲罰」另一個參與者前一回合的不合作行為。這時,合作可能會作為均衡的結果出現。

欺騙的動機這時可能被受到懲罰的威脅所克服,從而可能導向一個較好的、合作的結果。作為反覆接近無限的數量,納什均衡趨向於帕累托最優。

囚徒困境的主旨為,囚徒們雖然彼此合作,堅不吐實,可為全體帶來最佳利益(無罪開釋),但在資訊不明的情況下,因為出賣同夥可為自己帶來利益(縮短刑期),也因為同夥把自己招出來可為他帶來利益,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。但實際上,執法機構不可能設立如此情境來誘使所有囚徒招供,因為囚徒們必須考慮刑期以外之因素(出賣同夥會受到報復等),而無法完全以執法者所設立之利益(刑期)作考量。

經典的囚徒困境

[編輯本段]

2023年,由就職於蘭德公司的梅里爾·弗勒德(merrill

flood)和梅爾文·德雷希爾(melvin

dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(albert

tucker)以囚徒方式闡述,並命名為「囚徒困境」。經典的囚徒困境如下:

**逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人入罪。於是**分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:

若一人認罪並作證檢控對方(相關術語稱「背叛」對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。

若二人都保持沉默(相關術語稱互相「合作」),則二人同樣判監半年。

若二人都互相檢舉(互相「背叛」),則二人同樣判監2年。

用**概述如下:

甲沉默(合作)

甲認罪(背叛)

乙沉默(合作)

二人同服刑半年

甲即時獲釋;乙服刑10年

乙認罪(背叛)

甲服刑10年;乙即時獲釋

二人同服刑2年

囚徒健身大體說什麼,囚徒健身為什麼大家都說是騙局

徒手鍛鍊肌肉的方法 鍛鍊的胸肌動作 上斜俯臥撐 普通式俯臥撐 窄距俯臥撐 槓桿俯臥撐 單手俯臥撐。鍛鍊腹肌的動作 仰臥起坐 仰臥舉腿 兩頭起 懸垂舉腿。鍛鍊背部的動作 引體向上 窄距引體向上 偏重引體向上 單手引體向上。鍛鍊腿部的動作 深蹲 窄距深蹲 偏重深蹲 單腿深蹲。鍛鍊肩部的動作 烏鴉式 靠牆...

請問什麼是真愛,請問什麼是真心?什麼是真愛?

真正的愛不是用言語可以表達的,是發自內心的,愛上一個人你的整顆心都會被你愛的人所吸引,為他 她 著迷,為他 她 牽掛,但願每一分鐘都可以見到他 她 見不到的時候時時刻刻都會想著他 她 見到的時候你會興奮,心跳加快 在一起的時候你會感覺很溫暖很安全,真 正的愛一個人會心甘情願 的照顧他 她 關懷他 她...

伊斯蘭教經堂語侯困是什麼意思,什麼是伊斯蘭教的「中道」

伊斯蘭教經堂語侯困 回族經堂語,顧名思義,是回族經堂教育中所使用的一種語言。因為經堂語並不脫離於漢語,而只是一種在漢語基礎上形成並通行於回族宗教教育中的語言。所以,在語言學的學科分支中,它應該歸屬於社會語言學,經堂語的語意內涵也應該是漢語言的變體 回族經堂社會語言。侯睏意思是教法,或者是 斷法。經堂...