囚人のジレンマ

https://matome.naver.jp/odai/2140353960319881201      より

囚人のジレンマって?

共同で犯罪を行ったと思われる囚人A、Bを自白させるため、警官は2人に以下の条件を伝えた。

もし、お前らが2人とも黙秘したら、2人とも懲役2年だ。

だが、お前らのうち1人だけが自白したらそいつは懲役1年に減刑してやろう。この場合自白しなかった方は懲役15年だ。

ただし、お前らが2人とも自白したら、2人とも懲役10年だ。

出典::囚人のジレンマ - Wikipedia:解説の都合上、年数を改変しています。

この時、2人の囚人は共犯者と協調して黙秘すべきか、それとも共犯者を裏切って自白すべきか、というのが問題である。

なお彼ら2人は別室に隔離される等しており、2人の間で強制力のある合意を形成できない 状況におかれているとする。

「ジレンマ」たる所以

囚人2人にとって、互いに裏切り合って10年の刑を受けるよりは互いに協調し合って2年の刑を受ける方が得である。

しかし囚人達が自分の利益のみを追求している限り、互いに裏切り合うという結末を迎える。

これがジレンマと言われる所以である。

自分の立場になって考えてみよう!

状況をまとめるとこう。

では、あなたがAさんだったとしましょう。

Aさんの立場になって「Bさんが黙秘(協調)を選ぶ」と予想します。

画像の左上と左下が「Bさんが黙秘(協調)」した場合のAさんのそれぞれの懲役年数です。

①Aさんが黙秘(協調)した場合「黙秘ー黙秘」となり懲役2年です。

②Aさんが自白(裏切り)した場合「自白ー黙秘」となり懲役1年です。

懲役2年か1年。じゃあ②のほうが得ですね。

つまり

「Bさんが黙秘(協調)を選ぶ」と予想した場合、最適なのは「自白(裏切り)」することです。

Aさんの立場になって「Bさんが自白(裏切り)を選ぶ」と予想します。

画像の右上と右下が「Bさんが自白(裏切り)」した場合のAさんの懲役年数です。

①Aさんが黙秘(協調)した場合「黙秘ー自白」となり懲役15年です。

②Aさんが自白(裏切り)した場合「自白ー自白」となり懲役10年です。

懲役15年か10年。じゃあ②のほうが得ですね。

つまり

「Bさんが自白(裏切り)を選ぶ」と予想した場合も最適なのは「自白(裏切り)」することです。

Aさんの立場になってみると、Bさんがどっちの立場にいても「自白(裏切り)」するのが最適!

ということが分かりましたね。

しかし、Bさんはどう考えるでしょうか?

Bさんの立場になって状況を考えてみると・・・

当然ですが、Aさんの立場がどちらであっても、同じく「自白(裏切る)」のほうが懲役年数は短くなります。

よって

Bさんも「自白(裏切る)」を選びます。

お互い「最適な答え」を選んだはずなのに・・・

では最適な答えをまとめましょう。

Aさん・・・自白する。なぜならBさんがどの立場にあっても他より懲役年数が少なくなるから。

Bさん・・・自白する。なぜならAさんがどの立場にあっても他より懲役年数が少なくなるから。

しかし、両方が「最適と思われる」「自白」を選んだ結果、懲役年数は本来の「2年」から「10年」になってしまうのです。

現実の「囚人のジレンマ」

さて、現実にはどういう「囚人のジレンマ」があるのでしょうか。

例えば、牛丼。いろいろなお店が低価格競争を繰り広げています。

利益を確保するためには、値下げするべきではないですよね?

しかし、値下げをしなければ他社にお客さんが流れてしまいます。

つまり「利益を求めるために値下げをする」というジレンマが発生していますね。

意外に「囚人のジレンマ」って身の回りで起きていることなんですよ。

ゲーム理論

今回の話は「ゲーム理論」というれっきとした経済学です。

世の中の経済、政治にもこういう理論はあるものです。

少し、頭の体操になったでしょうか?

これからもこんな記事を紹介していけたらと思います。

ナッシュ均衡とは

ゲーム理論の用語の一つです。

ナッシュ均衡は非協力ゲームの解(最適な戦略)の一種で、考案者であるジョン・フォーブス・ナッシュの名前からきています。

非協力ゲームとは、ある主体が他の主体と協調せずに、自らの利益を最大限にすることをゲームの目的とした、いわゆる対戦型のゲームのことです。

将棋しかり、ポーカーしかり、企業同士の市場での争いにもあてはまります。

プレイヤー全員が互いに最適な戦略を選択しており、これ以上自らの戦略を変更すると、自分の利益が減る(もしくは無くなる)、つまり戦略を変更する動機がない安定的な状態になっている互いの戦略の組み合わせのことをナッシュ均衡といいます。

つまり、相手の出方に対して最適な戦略に変更する、という対応をお互いに続けていると、いつかはそれ以上お互いに戦略を変更することができない(変更すると自分が不利になる)ところまでいきつきます。その時のお互いの戦略の組み合わせをナッシュ均衡と言うのです。

囚人のジレンマとは?ゲーム理論の代表的なモデルを解説

https://ferret-plus.com/5864  より

顧客との交渉や交渉を有利に進めるために知っておきたい概念の1つに「ゲーム理論」があります。

ゲーム理論を実践できるレベルまで理解できれば、あらゆる交渉を有利に進めることができます。

今回は、ゲーム理論の基本的な概念と代表的なモデルを解説します。

Curriculum pt1

ゲーム理論とは最も良い選択をするための思考法

ゲーム理論とは「利害関係を持つ相手がいる状況で、自分と相手の利益を考え、最適な行動を決める」ための思考法です。

例えば交渉の場で、自分が得をする提案をしても、相手に利益がなければ成立する可能性は低いでしょう。

逆に、相手だけが得をするような内容も、こちらは容認できません。

関係者全員にとって最も良い選択は何かを数学的に導き出すのが「ゲーム理論」です。

元々は経済学の分野で使われていましたが、最近は経営、政治、軍事などあらゆる分野で応用されています。

ゲーム理論の基礎を築いたのは、「ジョン・フォン・ノイマン」というアメリカの数学者で、彼は数学だけではなく経済・物理学・気象学・計算機科学など様々な分野で成果を上げています。

ノイマンが発表した「ゲーム理論」の論文により、今まで不可能と思われていた「人間の意思決定が相互に影響をあたえることを数学的に展開できる形」にすることに成功しました。

その後、経済学者のオスカー・モルゲンンシュテルンと共同で『ゲームの理論と経済行動』を1944年に出版しました。

この書籍をきっかけにゲーム理論が確立、普及していきます。

ゲーム理論の代表例「囚人のジレンマ」とは

ゲーム理論の代表的なモデルとしてよく挙げられるのが「囚人のジレンマ」です。

ある犯罪に関する容疑で捕まった2人の容疑者が、意思疎通の出来ない別々の部屋で尋問を受けています。

この2人が取る選択肢は「自白する」「自白しない」のいずれかですが、自白の状況によって受ける刑罰の重さが異なります。

・1人が自白し、もう一方が自白しない場合、自白した方は無罪・自白しない方は懲役10年

・2人共自白しない場合は懲役2年

・2人共自白した場合は懲役5年

この場合、それぞれの容疑者がどの選択肢を取るでしょうか。

お互い「相手が自白せずに、自分が自白する」という選択肢が一番魅力的であることは間違いないでしょう。

しかし、相手も自白した場合は無罪にはならないというリスクもあります。

お互いが「自白しない」という選択肢をとった場合、懲役年数は最も短い2年となります。

A、B2人がお互いの利益を考えて協力したら「自白しない」選択肢をとり、懲役が最も軽くなります。

しかし、お互いが自分自身の利益だけを追求して「自白する」ことを選択したら、「自白しない」を選択したよりも長い「懲役5年」の刑が科せられます。

このように、各人が自分にとって一番魅力的な選択肢を選んだ結果、協力した時よりも悪い結果を招いてしまうことを「囚人のジレンマ」と呼びます。

「囚人のジレンマ」の構造を理解する上で覚えておきたいのが「パレート最適」と「ナッシュ均衡」です。

全体の利益を優先する「パレート最適」と個人にとって合理的な判断となる「ナッシュ均衡」の矛盾

個人にとって合理的な選択は、必ずしも全体に良い影響を及ぼすとは限りません。

誰も不利益を被ることなく、全体の利益が最大化された状態(それ以上利益を出すためには誰かを犠牲にしなければいけない状態)を「パレート最適(またはパレート効率性)」と呼びます。

囚人のジレンマの場合、「お互い自白せずに懲役2年の刑罰を受ける」のがパレート最適と言えます。

しかし、相手が裏切って自白した場合、自分は懲役10年になってしまいます。

そのリスクを回避するためには自白するしかありません。

この状態では2人とも「自白する」という選択しかできず、そこから変える必要性はありません。

このように、自分の選択を変えると利益が得られない状態=互いに現状から変わる必要のない安定した状態を「ナッシュ均衡」と呼びます。

囚人のジレンマにおけるナッシュ均衡は「お互いが自白する」こととなります。

しかしそれは「パレート最適」な状態ではありません。

個々人にとっての合理的な判断(リスクの少ない判断)である「ナッシュ均衡」と、全体の利益が最大化される「パレート最適」は必ずしも一致しません。

この矛盾を表現しているのが「囚人のジレンマ」です。

「協力ゲーム」と「非協力ゲーム」

ゲーム理論は、「協力ゲーム」と「非協力ゲーム」の2つにわけられます。

「協力ゲーム」とはプレイヤー同士で協力できる状態を、「非協力ゲーム」はプレイヤーが各々敵対する関係にある状態を指します。

2つの違いについて詳しくみてみましょう。

参加者同士で協力した方が利益が得られる「協力ゲーム」

協力ゲームとは、「参加者同士が協力した方が利益が大きい」状況を指します。

同一の目的を持ったもの同士が協力することで、個別で動くよりも大きな利益が得られる場合が当てはまります。

例えば、同じ企業で働く社員であれば、それぞれ個別で目標を追うよりお互い協力した方が目標達成しやすいのは明らかです。

企業単位だけでなく、業種で見ても同様です。企業単位ではなく、同じ業界同士、もしくは関連する業界同士で協力すれば、より大きな利益を生み出せる可能性が高まります。

近年頻繁に行われるM&Aや事業提携はまさしく「協力ゲーム」的な発想といえるでしょう。

参加者が互いに争う「非協力ゲーム」

非協力ゲームとは「参加者同士が争う」状況を指します。

受験戦争、市場競争、就職活動など、全員が勝者となることはない場合はほとんどが「非協力ゲーム」となります。

協力ゲームにするか非協力ゲームにするかは参加者次第

では、先ほど例に挙げた「囚人のジレンマ」は、協力ゲームと非協力ゲームのどちらに当てはまるでしょうか。

「囚人同士は意思疎通が取れない」ので協力できないという前提があることに加え、お互いを裏切る選択肢が与えられているので「非協力ゲーム」となります。

「協力ゲーム」になるのか「非協力ゲーム」になるのかは、ルールや置かれた状況、参加者の意志によって決まります。

参加者次第で、協力ゲームにも非協力ゲームにも変化させる可能性があるケースは多々あります。

例えば、 ユーザーの可処分時間を奪い合う状態だったマスメディアとWebメディアを融合させ、2016年4月にリリースされたテレビ アプリ「AbemaTV」は、非協力ゲームから協力ゲームに転換した事例と言えるでしょう。

協力ゲームにしろ、非協力ゲームにしろ、共通しているのは関係者全員にとって最も良い状態を選択する点です。

あらゆるシーンで、「協力ゲーム」と「非協力ゲーム」どちらに設定した方が合理的なのかを考えてみましょう。

まとめ

ゲーム理論は、本来は計算式を組み立てて数字的な根拠を求めていくものですが、今回は概念的な部分を中心に説明しました。

重要なのは計算式を覚えることではなく、「より合理的な判断をするための思考プロセスを理解することです。

利害関係のある人間全てが良い結果を得られるための思考がゲーム理論の基本です。

自分だけの利益を追求すると、結果的に悪い結果を招くことを、ゲーム理論は数学的に証明しています。

物事を決断する場合、自分だけでなく、関係する人間の利益も考えた上での決断は、結果的に自分にとっても良い結果を招くでしょう。

合理的な判断をするためには、まず置かれた状況や条件を理解し、考えられるパターンを想定してそれぞれのパターンを「点数」で評価する必要があります。その点数を出すために計算式が必要となります。

数値化した方が合理的に判断できますが、まずは判断が必要になった時にゲーム理論的な思考プロセスを思い浮かべるようにしましょう。