ゲーム理論とは?体表的な「囚人のジレンマ」とゲーム理論の基礎を解説

ゲーム理論という言葉をご存知でしょうか。

「意味は分からないけど聞いたことある」という方も多いのでは?

ゲーム理論とは、人間の意思決定の問題を数学的に分析・研究するもの。

簡単にいえば、人の行動をゲームになぞらえてわかりやすくパターン化することです。

本来経済学の用語ですが、社会学や心理学などさまざまな分野でパターン分析のツールとして使われています。

ここでは、ゲーム理論の初歩を簡単に解説します。

ビジネスにも役立つゲーム理論の基礎を、きちんとおさえておきましょう。

ゲーム理論って何?

まずは、冒頭でも少し述べた「ゲーム理論とは何か」を、もう少しくわしくご説明します。

ゲーム理論は、一定の条件下で人がどう動くかを、わかりやすく理解するために作られたロールモデルです。

20世紀の初めに数学者フォン・ノイマンとモルゲンシュテルンが発表した「ゲーム理論と経済行動」をもとに、たくさんのバリエーションが開発されてきました。

架空の設定を作って人間の行動をシミュレートするゲーム理論は、哲学でいうところの思考実験であるともいえます。

有名なトロッコ問題などの思考実験については、ご存知の方も多いと思います。

ただ、ゲーム理論が思考実験と違うのは、すべての判断が「利益」に基づくということ。

答が倫理観という感情に左右される思考実験とは違って、計算で正答を導きだせるものなのです。

ところで、「ゲーム」と聞いて、パソコンやスマホで遊ぶロールプレイング・ゲームなどを想像した方はいませんか?

実は、それもあながち間違いではありません。

ゲーム理論で想定している「ゲーム」は、チェスやじゃんけんなどの「シンプルにパターン化されたもの」です。

でも、「架空の条件下で人の判断力をシミュレートする」という考え方は、RPGそのもの。

それほど本筋から外れてはいないのです。

ゲームの基本目的は、もちろん「勝つ」ことです。

ゲーム理論では、勝つということを「自分が最大の利益をとる」と定義します。

その考えに基づき、すべてのプレイヤーが利益を目的として合理的に行動すると仮定して、行動パターンを予測することで最大の利益が出るパターンを探ります。

利益という言葉の印象から経済学にしか利用できないと思われがちですが、政治学や法学、生物行動学まで多様な学問に応用できる優れた理論です。

ゲームの概要

ゲーム理論の目的は、シンプルなパターン化を行うことです。

そのため、ゲームは2人のプレイヤーによる勝ち-負けの二択で判断するのが最適ということになります。

とはいっても、それだけではシンプル過ぎて、シミュレーションの役には立ちません。

そこで、必要に応じて使えるさまざまなパターンが考えられました。

ここではいろいろなゲームとそこで使われる用語について解説します。

基本形

ゲームには2人のプレイヤーがいるとします。

なお、プレイヤーとして設定されるのは個人だけではありません。

たとえば複数の選手が所属するスポーツチームや法人企業も1プレイヤーと数えることができます。

「コインを投げる」「サイコロを振る」といった1人ゲームであっても、ルール上プレイヤーは2人でなければなりません。

この場合は「(コインやサイコロを投げている)個人」対「(出目を決める)自然」という考え方になります。

ゲームの条件は利得表という表で表されるのが普通です。

利得表は4つのマスをもつ表で、縦軸にプレイヤー1、横軸にプレイヤー2を置き、さらにそれぞれのマスを二分割して、プレイヤーがとった行動による結果を記します。

この表をもとに、各プレイヤーがもっとも得をする(=勝つ)パターンがどれかを割り出します。

情報完備ゲームと情報不完備ゲーム

ゲームにさまざまな条件付けをすることで、違うパターンを作ることができます。

単純とはいえない社会にシンプルなゲーム理論をあてはめるには、こうしたさまざまなパターンを検討することがとても重要になってきます。

情報完備ゲームと情報不完備ゲームもそのパターン分けのひとつで、読んで字のごとく、判断の前に情報が与えられているかいないかがカギになっています。

たとえばじゃんけんでは、相手の出す手がわかりません。

わからない状態でこちらの行動を決めるのが、情報不完備ゲームです。

対してチェスのようなゲームなら、相手の出した手を見て対応を考えることができます。

これが情報完備ゲームです。

情報完備ゲームと情報不完備ゲームとでは、プレイヤーの行動が違ってきます。

情報不完備ゲームでは合理的であったことが、情報不完備ゲームでは非合理的になることもあります。

協力と非協力

アメリカの数学者ジョン・ナッシュが考えたゲームのパターンが、協力ゲームと非協力ゲームです。

プレイヤー同士の間にコミュニケーションと協力(拘束力のある同意と表現されることも)が存在するかどうかが、定義のポイントになります。

協力ゲームでは「協調」「裏切り」という要素がプラスされ、より高度な戦略が必要になってきます。

均衡と最適

ナッシュは、すべてのゲームには「それ以上動かないポイント」があると考えました。

それが「ナッシュ均衡」です。

ゲームが動かなくなる条件としては、もちろん参加者全員が最大利益を得ている状態が望ましいのですが、実際にはすべてのゲームがめでたしめでたしで終わるとは限りません。

いささか不利益をこうむっている人がいても、「これ以上動けばさらに損をする」と判断されればそこでゲームが止まり、ナッシュ均衡となります。

なお「参加者全員が、その条件下で考えられる最大の利益を得ている状態」のことを、発案者の名前をとってパレート最適といいます。

後述する有名なゲーム「囚人のジレンマ」では、ナッシュ均衡は存在するけれど、それがパレート最適にはならないことが問題とされます。

支配戦略

支配戦略とは、相手がどんな手を出してきても自分の利益になる(最低でも損にはならない)戦略のことです。

つまり、プレイヤーが取りうる戦略の中で、もっとも有効なものといえます。

自分側に支配戦略がある場合、ゲームは「勝ち」か「引き分け」のどちらかになります。

囚人のジレンマのように、最大の利益を出せる「勝ちパターン」が成立するかどうかが相手の行動で左右される場合、そのゲームには支配戦略がないといえます。

囚人のジレンマ

ゲーム理論の用語がわかってきたところで、具体的な例をみてみましょう。

ゲーム理論を具体化するために、フォン・ノイマンとモルゲンシュテルンは実際に行うゲームをいくつも考えだしました。

その中には、コイン投げのようなゲームもあれば、空想の中で行うシミュレーションゲームもあります。

ちなみに、2人は自説を証明するために、学生を被験者にして実験を繰り返したそうです。

学生たちが延々とゲームを続ける実験なんて、なんだか楽しそうですね。

そんな2人の考えたゲームをもとに、後世のさまざまな研究者が改善を施して新しいゲームのパターンを作り出しました。

その中でも、代表的なのが「囚人のジレンマ」です。以下にその概要をご紹介します。

問題

一緒に罪を犯した2人の囚人が、別々に収監されています。

2人の罪は懲役5年ですが、2人とも黙秘を続けているため、らちがあきません。

そこで、取り調べに当たる担当者は、自白を引き出すために彼らにこう提案しました。

「もし罪を自白したら、すぐに釈放してあげよう。

ただし、それは相手が黙秘し続けて自分だけ自白した場合に限る。

その場合は、黙秘し続けたほうが自白した囚人のぶんもあわせて10年の懲役刑になる。

2人とも白状したら、どちらも元通り懲役5年。

そしてこのまま2人とも黙秘し続けるなら、懲役5年のところ証拠不十分で懲役3年になるだろう」

2人の囚人は、どうするでしょうか?

考え方

条件を整理してみましょう。

  • 自白した場合、相手が自白していれば懲役5年。黙秘していれば釈放(懲役0年)。
  • 黙秘していれば懲役3年。

数字をみたところ、自白したほうが利益が大きいように見えます。

しかし、2人が同じように考え、利益が大きい戦略を選んだ場合、利益がより小さい「懲役5年」が確定します。

つまり、わかりやすい言い方でいうと損をするわけです。

それなら2人とも黙秘して「懲役3年」になったほうが得です。

ところが、黙秘すると今度は「相手だけ白状してしまう」可能性がでてきます。

すると最大損失の「懲役10年」になってしまいます。

この危険性を回避するために「黙秘」を避けるという合理的な判断の結果、2人とも「自白」を選んで懲役5年というのが妥当な選択になります(ナッシュ均衡)。

これでは、損得なしで本来の結果と同じということになってしまいます。

担当官の思うツボ、といったところでしょうか。

正解はどこに?

問題は、2人がこの条件下でいちばん得をする解答(パレート最適)である「懲役3年」にたどりつけないということです。

2人が合理的に考えたとすれば、ともに「自白」を選んでパレート最適の可能性をなくしてしまいます。

大体、自分が「黙秘」を選んでも相手が「自白」したら最悪の結果になるのですから、そんなリスクは背負えません。

もともとこのゲームには支配戦略がないので、結局ナッシュ均衡が成立する「懲役5年」が妥当となります。

この「懲役5年」、結果からいえば下から3番目。

10年よりはまだいいという程度で、とても勝ちとはいえません。

それでも合理的に考えた結果、こうならざるをえないのです。

囚人のジレンマの最適解はまだ出ていません。

専門家・アマチュアを問わず多くの人がこの問題に取り組んできました。

影響は理数系だけでなく人文科学にも広く及んでいます。

アメリカの小説家パワーズは、囚人のジレンマをテーマにした感動的な小説を世に問いました。

数学に属する考え方でありながら、文学にも無理なく導入できるのがゲーム理論の不思議なところです。

囚人のジレンマは、しばしば軍縮問題と関連付けられ「この問題が解けたら世界平和は実現する」とまでいわれてきました。

ひとつのゲームが世界平和にまでつながる、そんなところがゲーム理論の魅力かもしれません。

ゲーム理論の応用

経済学者が考え出したゲーム理論は、いまやありとあらゆる学問に影響を及ぼすツールとして機能しています。

ですが本来の役割に立ち戻り、ビジネスモデルという意味でとらえるのが一般的でしょう。

たとえば商談や交渉の席で駆使される駆け引き、顧客の動態やライバル企業に対応する手段まで、すべてゲーム理論で解明することが可能です。

興味をもった方は、ぜひ調べてみてください。

おすすめの記事