メニュー

ゲーム理論の基礎知識

ゲーム理論の基礎知識

著者:東京都立大学 経済経営学部 教授 渡辺 隆裕

ゲーム理論という言葉をよく耳にすることがあります。それは、どのような理論なのでしょうか。そもそもゲーム理論とは、経済学を中心に発展した理論です。しかし、最近では経営工学や都市計画、情報学などでも盛んに使われるようになり、興味を持つエンジニアも多いようです。本連載では、全6回にわたりゲーム理論の基礎知識を紹介します。第1回は、ゲーム理論とは何か、そして、どのような理論から構成されているのかについて、その全体像を解説します。

第1回:ゲーム理論とは

1. ゲーム理論とは

ゲーム理論は、社会・経済・ビジネスのさまざまな問題について、そこに登場する個人・企業・政府をプレイヤーと見なし、どのような行動をとるのかを数理的に分析する理論です。現実のさまざまな問題を、将棋やボードゲームのようなゲームと考え、そこでプレイヤーがどのような戦略を選ぶかを分析できることから、この名前がついています(図1)。ゲーム理論は、数学者ジョン・フォン・ノイマンと経済学者オスカー・モルゲンシュテルンがに出版した「ゲームの理論と経済行動」を出発点としています。もっとも、その源流は、フォン・ノイマンがに発表した「社会的ゲームの理論について」と呼ばれる論文にあるとされています。

図1:ゲーム理論

図1:ゲーム理論

ゲーム理論は経済学を中心に発展し、市場や産業のさまざまな問題において、政府・企業・消費者がどのように行動するかという理論の基礎を与えました。また、政治学・社会学・経営学などでも多用され、生物学でも生物の行動や進化を説明するために使われています。さらに都市計画では、……

>>第1章の続きを読む(PDFダウンロード)

2. 戦略的行動と進化

ゲーム理論は、さまざまな理論から構成されています。現在は、非協力ゲームと呼ばれる理論が主流で、多くの人がゲーム理論と呼ぶものは、主にこの非協力ゲームを指しています(図2)。本連載では、この非協力ゲームを、ゲーム理論を代表するものとして解説します。

図2:ゲーム理論の見取り図

図2:ゲーム理論の見取り図

また、ゲーム理論(非協力ゲーム)は、戦略形ゲームと展開形ゲームという2つの形式に分類されます。戦略形ゲームは、ゲーム理論の基礎となる形式で、すべてのプレイヤーが、他のプレイヤーの行動を観察できずに同時に行動するゲームをいいます。例としてじゃんけんなどが挙げられます。また、展開形ゲームは、時間と情報の構造を扱える形式で、他のプレイヤーの行動を観察して自分の行動を選べるゲームをいいます。例として、チェスや将棋などがあります。詳しくは、次回解説します。

・戦略的行動

ゲーム理論では、プレイヤーが選ぶ行動を戦略といいます。1人ひとりのプレイヤーが行動を選び、その結果として利得(プレイヤーがどのくらい得をするかという値)が決まります。例えば、企業の価格競争では各企業がプレイヤーであり、戦略として価格を選び、その利得は利益であると考えます。企業の投資競争では、投資する金額が戦略で、その投資によって得られる利益を利得と考えたりします。ゲーム理論では、このようにプレイヤー・戦略・利得が与えられた状況で、プレイヤーは利得を最大にするための戦略を選ぶと考え、その結果を予測するのです。

このプレイヤーが利得を最大にするという考え方によって、ゲーム理論は戦略的行動の理論とかインセンティブの理論と呼ばれることもあります。例えば、交通ネットワークの設計においては、各個人が自分の費用や時間が最小となるように経路を選ぶと考えます。その結果、設計者の意図しない混雑が生じて、全体の利益が損なわれる現象が生じてしまいます。この現象は無秩序の代償などと呼ばれます。設計者の意図通りに個人が経路を選べば、利用者全員にとって利益があるとしても、個人レベルではそうしないと考えるのです。

サプライチェーン(仕入れから出荷までの流れ)の設計などでも、各企業や各部署は、自分たちの利益を最適にするように行動すると考えます。その結果、各企業や部署ごとの部分最適はされるものの、全体の最適がされないという現象が生じます。このように「設計者やマネージャの意図どおりに人は行動せずに利己的に行動する。たとえ、その意図に従って行動した方が、結果的にその人のためになったとしても」という考え方が、「合理的なプレイヤーを前提にしたゲーム理論」の考え方であるといえます。

・進化ゲーム

こうした合理的なプレイヤーを前提にしたゲーム理論の他に、進化ゲームと呼ばれる理論があります。進化ゲームは、生物の進化を説明するために作られた理論で、プレイヤーが選ぶ戦略は、利得を最大にするために選ばれるものではなく、遺伝的に決まっているものであると考えます。そして、利得(この場合は適応度と呼ぶ)が大きい戦略のプレイヤー(この場合は種と考える)が多くの子孫を残し、長期間で選択と淘汰(とうた)が起きて、プレイヤーの比率(戦略の比率)が決まります。例えば、……

>>第2章の続きを読む(PDFダウンロード)

3. 不完備情報と情報の非対称性

合理的行動を前提としたゲーム理論は、完備情報、不完備情報という2つの分類もできます(図2)。完備情報とは、ゲームに不確実性がないことをいいます。初歩的なゲーム理論では、プレイヤーが選ぶ戦略・行動や、その結果に対するプレイヤーの利得には不確実性がなく、プレイヤーはそれを知っていると仮定されます。一方、不完備情報は、ゲームに不確実性があることをいいます。

現実の世界では、私たちを取り巻く状況は不確実で、それが意思決定に影響を及ぼします。どのような行動が選べるのかも不確実で、またその結果として得られる利益もはっきりと分かりません。

情報の非対称性とは、不完備情報の中で、プレイヤーごとの情報が異なる場合をいい、ゲーム理論の重要な分析テーマです。例えば、企業が消費者に製品を販売するとき、企業は品質について情報を持っていても、消費者はそうではないことがあります。このとき、企業が良い品質の製品を売っているにも関わらず、消費者がそれを悪い製品であると推測すれば、その製品の売り上げは減少するでしょう。このように、情報の非対称性は、情報を持たない側だけでなく、持っている側にも不利益になることがあります。

このような不完備情報の理論に対しては、イギリスの数学者トーマス・ベイズが示した、確率論のベイズの定理が中心的な役割を果たします。これは、近年大きく発展を遂げたデータサイエンスや機械学習などと同じで、近い分野の方にとって親近感があるものかもしれません。これらの分野と異なる部分は、ゲーム理論ではデータや情報ですら、プレイヤーの戦略として操作される可能性があると考えることです。

製品の品質の例で考えると、まず消費者は、最初に企業の製品の品質が良いか悪いかについて、あらかじめ予測していると考えます(事前確率)。ここで、他の消費者がその製品を購入するのを見たり、企業が製品の品質について広告するのを見たりすることで、自分の情報を更新します(事後確率)。このときに、ベイズの定理が使われます。しかし、……

>>第3章の続きを読む(PDFダウンロード)

 

第2回:戦略形ゲームと戦略の支配

前回は、ゲーム理論がどのような理論から構成されているのかを解説しました。今回は、戦略形ゲームとは何か、そして、その解の1つである支配戦略について説明します。また、支配戦略の例である囚人のジレンマについても紹介します。

1. 戦略形ゲームと支配戦略

ゲーム理論(非協力ゲーム)は、戦略形ゲームと展開形ゲームという2つの形式に分けることができます。ざっくりいえば、戦略形ゲームとは、じゃんけんのように、全てのプレイヤーが同時に行動するゲーム、展開形ゲームとは、将棋や囲碁のように、プレイヤーが順番に行動するゲームと捉えて良いでしょう(第1回参照)。今回は、戦略形ゲームについて説明します。

・戦略形ゲーム

戦略形ゲームでいう「同時に行動する」とは、時間的なタイミングではなく、全てのプレイヤーは、自分が行動するときに他のプレイヤーの行動が分からない(観察できない)、ということを意味します。

例えば、2人でじゃんけんをするときに、1人がグー・チョキ・パーのどれかを紙に書いて相手に見えないように封筒に入れ、その後にもう1人がグー・チョキ・パーのどれを出すかを宣言し、封筒を開けて勝負を決めるような方法を考えてみましょう。この方法は、2人同時に行う普通のじゃんけんと変わりはありません(手間はかかりますが)。このようなゲームは、戦略形ゲームであるといえます。そう考えると、戦略形ゲームの応用範囲は、かなり広いものになります(図1)。

図1:同時に行動する戦略形のじゃんけん

図1:同時に行動する戦略形のじゃんけん

戦略形ゲームは、プレイヤー、戦略、利得の3要素から構成されます。プレイヤーは、個人・企業・国家など、ゲームで行動をする主体です。戦略は、プレイヤーが選ぶ行動や代替案を指します。各プレイヤーが戦略を選ぶと、その結果として各プレイヤーの利得が決まります。この利得は、プレイヤーの好みである結果を、何らかの数値に表したものです。例として、以下のようなモデルを紹介します。

一ノ瀬と二子山の戦略の例:
駅前の老舗和菓子店、一ノ瀬と二子山は、ライバル関係にある。両者は、看板商品である大福もちを巡る競争が激しくなったことで、価格を値下げするか、現状維持にするか、迷っている。両者が価格を現状維持とすると、共に1日の利益は4万円。しかし、一方だけが値下げをすると、値下げをした店舗は利益が6万円に増加し、現状維持をした店舗は利益が1万円に減少する。ここで、両者共に値下げをすると、両者とも利益は2万円になってしまう。

この例において、戦略形ゲームを構成する3要素は以下のようになります。

プレイヤー:一ノ瀬と二子山
戦略:どちらのプレイヤーにも現状維持と値下げという2つの戦略がある。
利得:ここでは、利益を利得と考える。

戦略形ゲームを表すために、利得行列と呼ばれる図を用います。図2は、一ノ瀬と二子山の例の利得行列です。現状維持か値下げかについて、一ノ瀬は行を(青色で表示)、二子山は列を(赤色で表示)を選択します。2人のプレイヤーが選択した行と列の交わったセルがゲームの結果で、カッコ内の2つの数字は、2人のプレイヤーの利得を表しています。左側の数字(青色)が一ノ瀬の利得で、右側が二子山(赤色)の利得です。

図2:利得行列の例

図2:利得行列の例

さて、ゲームの結果はどうなるでしょうか。まず、一ノ瀬の立場に立ってみます。相手(二子山)が現状維持を選択したと想定すると、自分(一ノ瀬)は値下げ(利得6)を選択する方が、現状維持(利得4)を選択するよりも良い選択となります。次に、相手が値下げを選択したならば、自分もやはり値下げ(利得2)を選択する方が、現状維持(利得1)を選択するよりも良い選択となります。

・支配戦略

上記の結果、自分(一ノ瀬)にとって、相手(二子山)がどんな戦略を選択しても、値下げを選択した方が現状維持を選択するよりも利得が高くなります。このように、……

>>第1章の続きを読む(PDFダウンロード)

2. 囚人のジレンマ

囚人のジレンマとは、各プレイヤーが常に利得が大きくなる支配戦略を選んだ結果、お互いが支配戦略を選ばなかった場合より利得が悪くなってしまうことをいいます。上述のゲームの結果は、両者がともに値下げをすること(利得は共に2)になりました。しかし、それは両者が現状維持をすること(利得は共に4)よりも悪い結果になっていることが分かります。支配戦略を選択するという、プレイヤー同士がお互い合理的な行動をとったことが、2人にとって非合理な結果を生んでしまいます。アメリカの数学者であるタッカーが、このゲームを説明するために以下のような寓話(ぐうわ)を用いたので、このゲームは、囚人のジレンマと呼ばれるようになりました。

囚人のジレンマ:重罪を犯した2人の人間AとBが、別件の軽微な罪で逮捕され、自白を迫られています。2人は警察に、「もし相手が黙秘し、お前だけが自白したなら無罪にしてやろう」と取引を持ちかけられています。もし1人が黙秘し、1人が自白したならば、自白した方は釈放、黙秘した方は懲役10年となります。ただし、ともに自白した場合は懲役5年であるとしましょう。また、ともに黙秘した場合は、軽微な罪しか問えないので懲役1年であるとします。この寓話(ぐうわ)では、お互いに自白することが支配戦略となるものの、その結果は、お互いが黙秘するよりも悪くなることが分かります(図4)。

図4:囚人のジレンマ

図4:囚人のジレンマ

囚人のジレンマは、

  • 1:相手が協力(現状維持/黙秘)したときに、自分は協力しない(値下げする/自白する)方が良い
  • 2:相手が協力しないときにも、自分は協力しない方が良い
  • 3:だが、2人が協力しないと、2人が協力するよりも悪い結果を生む

という3つの条件からなっています。プレイヤーにとって利得を最大にする最適が、……

>>第2章の続きを読む(PDFダウンロード)

 

第3回:ナッシュ均衡とは

前回は、戦略形ゲームと、戦略形ゲームの解の1つである支配戦略について解説しました。今回は、戦略形ゲームの一般的な解であるナッシュ均衡、さらにチキンゲームや調整ゲームなど代表的なゲームの例について説明します。

1. ナッシュ均衡

ナッシュ均衡とは、全てのプレイヤーが、一定のルールのもと、自分の利得が最大となる最適な戦略を選択し合っている状態のことをいいます。第2回では、ゲームに支配戦略(他のプレイヤーがどんな選択をしても、自分の戦略が他の戦略より常に良い(利得が高くなる)戦略)があるときは、プレイヤーがそれを選ぶことがゲームの解になることを解説しました。しかし、ゲームには支配戦略があるとは限りません。このような場合は、ナッシュ均衡がゲームの解になります。支配戦略がないような以下の例で考えてみましょう。

・一ノ瀬と二子山の例

老舗和菓子店一ノ瀬と二子山は、A地区かB地区のどちらかに支店を出そうと考えています。両店がA地区・B地区と別々に出店すれば、各地区のお客を独占でき、1日の売上はそれぞれ12万円と8万円になります。しかし、同じ地区に出店すると、各地区のお客を奪い合い、売上はその半分になってしまいます。一ノ瀬と二子山はどちらに出店するでしょう?

支配戦略がないゲーム:

図1は、前回説明した利得行列でこのゲームを表現しています。ゲームの結果を考えるために、一ノ瀬の立場で考えてみましょう。相手(二子山)がA地区を選択したと想定すると、自分(一ノ瀬)はB地区を選択する(利得8)方が、A地区(利得6)よりも良い選択となります。一方、相手がB地区を選択したならば、自分はA地区(利得12)の方が、B地区(利得4)よりも良い選択です。A地区の方が売上は大きいものの、客を奪い合うよりは相手と異なる地区に支店を出した方が良く、また、二子山も一ノ瀬と同じ状況です。

図1:支店をどちらに出すか?

図1:支店をどちらに出すか?

最適反応戦略とナッシュ均衡:図1のゲームでは、他のプレイヤーの戦略に応じて、自分の利得が高くなる戦略が変わります。常に利得が高くなる支配戦略はありません。他のプレイヤーの戦略に対して、自分の利得が一番高くなる戦略を最適反応戦略と呼びます。支配戦略は、全ての戦略に対する最適反応戦略となりますが、今回は最適反応戦略が相手の戦略によって変わってきます。

このようなときは、全てのプレイヤーが最適反応戦略を選び合うという結果が起こると考え、そうした結果(戦略の組み合わせ)をナッシュ均衡と呼びます。言い換えると、ナッシュ均衡は、全てのプレイヤーが自分の利得を一番高くする戦略を選び合っている状態であり、自分だけが別の戦略に変えても利得が高くならない状態であるといえます。

図2:ナッシュ均衡ではない結果とナッシュ均衡になる結果

図2:ナッシュ均衡ではない結果とナッシュ均衡になる結果

図1のゲームにおける、ナッシュ均衡を考えてみましょう(図2)。「両店舗がA地区に出店する」という結果は、ナッシュ均衡ではありません。一ノ瀬は、二子山がA地区に出店するならば、B地区に出店する方が利得を高くする(最適反応戦略)ので、最適反応戦略を選び合うことにはなっていないからです(二子山も同様)。

これに対し、「一ノ瀬がA地区に、二子山がB地区に出店する」という結果はナッシュ均衡になります。一ノ瀬は、二子山がB地区に出店するときに、A地区に出店することが最適反応戦略になるからです(二子山も同様)。また、「一ノ瀬がB地区に、二子山がA地区に出店する」という結果もナッシュ均衡です。このように、ナッシュ均衡は1つとは限らず、……

>>第1章の続きを読む(PDFダウンロード)

2. チキンゲームと調整ゲーム

別々の車に乗った2人のプレイヤーが、互いの車に向かって一直線に走行し、衝突を避けて先にハンドルを切ったプレイヤーを、「チキン(臆病者)」と称し、屈辱を受け負けとなる、という行為をチキンゲームと呼んだりします。ここでは、ゲーム理論におけるチキンゲームと調整ゲームについて説明します。

・チキンゲーム

チキンゲームは、プレイヤー同士が衝突を避け、あらかじめ行動を棲(す)み分けることをナッシュ均衡と見なします。チキンゲームでは、プレイヤーは強気(ブル)と弱気(チキン)のどちらかを選択します。双方が強気を選択すると、双方にとって悪い結果となり、どちらかがチキンとなって弱気を選択する方がまだ良い、というゲームです。例えば、皆が参加したいイベントであるけれども、全員が行って混雑するならば家にいた方が良いといった状況は、多人数によるチキンゲームと解釈することができます。イベントに行くことは強気(ブル)で、家にいることが弱気(チキン)となります。

今回の例は、一ノ瀬も二子山も、相手がB地区に出店し、自分はA地区に出店することが最も良い戦略であり、両者がA地区に出店することは避けたい状況であるということから、このゲームはチキンゲームであることが分かります。

・調整ゲーム

調整ゲーム(コーディネーションゲーム)は、プレイヤー同士が同じ行動をすることがナッシュ均衡となるゲームです。簡単な調整ゲームは、「左側通行か右側通行か」というゲームです。細い山道で車がすれ違うときに、どちら側に寄ってすれ違うかを想像してください。右でも左でも、お互いが同じ方向に避ければ良く、違った方向に避けるとぶつかってしまいます(図3)。同窓会に行くか行かないか(皆が行くなら行きたい/皆が行かないなら行きたくない)、緊急事態時のトイレットペーパーの買い占め(皆が買いに走るなら、自分も走らなければならない/そうでないなら、わざわざ買いに行く必要がない)、さらに銀行の取り付け騒ぎなども、調整ゲームとして解釈されます。

図3:左側通行か?右側通行か?

図3:左側通行か?右側通行か?

図3のゲームでは、相手が右を選ぶならば、……

>>第2章の続きを読む(PDFダウンロード)

3. 支配戦略とナッシュ均衡

「プレイヤーが支配戦略を選ぶ」という結果(第2回)は、ナッシュ均衡の特別なケースに含まれることが分かります。囚人のジレンマを考えてみましょう。囚人のジレンマにおいて各プレイヤーは、相手が協力しても協力しなくても、自分は協力しないことが最適反応戦略になります。支配戦略は、全ての戦略に対する最適反応戦略であるため、支配戦略を選び合うことはナッシュ均衡となります。囚人のジレンマで両者が協力しないことは、両者の支配戦略であるとともに、ナッシュ均衡でもあるのです。支配戦略があるときは、……

>>第3章の続きを読む(PDFダウンロード)

 

第4回:混合戦略とは

前回は、戦略形ゲームの解であるナッシュ均衡を説明しました。しかし、ゲームによっては、ナッシュ均衡がないように見えるゲームも存在します。今回は、確率的に戦略を選ぶ混合戦略という考え方を紹介します。混合戦略を考えると全てのゲームにナッシュ均衡が存在する、ということについても解説します。

1. ナッシュ均衡が存在しないゲーム?

前回に説明したナッシュ均衡とは、全てのプレイヤーが自分の利得を一番高くする戦略を選びあっている、という状態でした。言い換えると、他のプレイヤーがそのナッシュ均衡の戦略を選んでいるときには、自分だけが他の戦略に変えても利得が高くならないような状態である、といえます。

ところが、私たちがよく知っているじゃんけんには、このナッシュ均衡がないように見えます。図1は、2人じゃんけんの利得行列です。じゃんけんは、どの戦略の組み合わせも、一方のプレイヤーが戦略を変えた方が利得は高くなります。利得が一番高くなる最適反応戦略を選び合う戦略の組はありません。

図1:じゃんけんの利得行列-ナッシュ均衡はないように見える

図1:じゃんけんの利得行列-ナッシュ均衡はないように見える

このようなゲームは、スポーツやボードゲーム、テレビゲームなど本当のゲームのように、敵同士やライバル同士が競い合う状況によく現れます。ある状態が確定的に良い状態であれば、ゲームにはなりません。ここで、図2に示すテロリストと特殊警察の警備の例を考えてみましょう。

図2:テロリストvs特殊警察の警備ゲーム

図2:テロリストvs特殊警察の警備ゲーム

テロリストが、AとBの施設のどちらかにテロを仕掛けようと狙っており、特殊警察はそれを防衛しようとしています。テロリストも特殊警察も、攻撃する施設と防衛する施設を1つだけ選ぶものとします。お互いが同じ施設を選んだときは、防衛が成功して、双方の利得は0です。お互い異なる施設を選んだ場合は、テロリストの攻撃が成功し、その被害額がテロリストの利得であり、特殊警察の損失であるとします。Aの方が重要度の高い施設であり、テロリストがAの施設で攻撃を成功させるとテロリストの利得は+3億円(特殊警察の利得は-3億円)、Bの施設で攻撃を成功させるとテロリストの利得は+2億円(特殊警察の利得は-2億円)とします。このゲームの結果はどうなるでしょう?

>>第1章の続きを読む(PDFダウンロード)

2. 混合戦略のナッシュ均衡

混合戦略とは、ゲーム理論の創始者であるフォン・ノイマンらが導入した、複数の戦略を確率的に混合して選ぶという考え方です。フォン・ノイマンらが最初に問題にしたのは、「見かけ上は解がないゲームでは、何が答になり、それはいつでも存在するのか」ということでした。混合戦略のナッシュ均衡を考えれば、このようなゲームも解くことができます。

戦略を確率的に選ぶとは、どのようなことでしょうか。じゃんけんで考えると、それほど不自然なことではありません。じゃんけんの混合戦略のナッシュ均衡は「全ての手を1/3ずつ組み合わせて出す」ということです。もし、一方のプレイヤーがそうするならば、もう一方のプレイヤーは、グー・チョキ・パーのどの戦略を選んでも、また、全ての手を1/3ずつ組み合わせて出しても、勝ちと負けとあいこの確率は1/3ずつになり、利得の期待値は全て0になります。つまり、一方のプレイヤーが「全ての手を1/3ずつ組み合わせて出す」と、もう一方のプレイヤーも、そうするより利得を高くすることはできない、ということになります。

反対に、一方のプレイヤーが「全ての手を1/3ずつ組み合わせて出す」以外の戦略を選ぶと、どれかの手を出す確率が高くなります。すると、もう一方のプレイヤーは、その出す確率が高い手に勝つ手を選ぶことで利得が高くなります。しかし、その相手は、さらにそれに勝つ手を選ぶと考えられ、予測される結果であるナッシュ均衡にはなりません。

じゃんけんの場合は、グー・チョキ・パーを等しい確率で選ぶことがナッシュ均衡でした。一方、先に示したテロリストの例では、確率は等しくなりません。ここで、テロリストの立場で考えてみましょう(図3)。警察がAの施設を確率qで防衛したとすると、確率の合計が1(=100%)になることから、Bの施設を防衛する確率は1-qになります。
ここでテロリストがAの施設を攻撃したときの期待値は
0q+3(1-q)=3-3q
となり、Bの施設を攻撃したときの期待値は
2q+0(1-q)=2q
となります。

もしここで、テロリストがAとB、どちらかを攻撃したときの期待値がより大きいならば、テロリストはそちらの施設を攻撃します。しかし、じゃんけんと同じように、それはゲームの予測される結果とはならないはずです。なぜならば、その予測に対して、警察はテロリストが攻撃する施設を防衛します(確率1:100%、ここでは必ず防衛すること)。そうなれば、テロリストはそれと反対の施設を攻撃するはずなので、最初の予測は外れてしまうからです。つまり、ナッシュ均衡であるためには、テロリストがAとBを攻撃したときの期待値が等しくならなければなりません。これより、3-3q=2qを解いてq=3/5が得られます。つまり、警察はそれぞれ3/5と2/5の確率でAとBの施設を防衛することが、ナッシュ均衡の戦略になります。

図3:混合戦略における利得の期待値とナッシュ均衡(テロリストの期待値)

図3:混合戦略における利得の期待値とナッシュ均衡(テロリストの期待値)

ここで注意すべきは、テロリストの期待値を考えることで警察の戦略を求めることができる、という点です。同様に、警察の期待値を考えることで、テロリストのナッシュ均衡の戦略が求めることができます(図4)。テロリストがAとBの施設を攻撃する確率を、……

>>第2章の続きを読む(PDFダウンロード)

3. 混合戦略のナッシュ均衡の存在と応用

ここまで、一見するとナッシュ均衡が存在しないように思えるじゃんけんなどのゲームであっても、混合戦略を考えるとナッシュ均衡が存在する、ということが理解できました。一般に、どんなゲームも(戦略がいくつでも、プレイヤーが何人でも)混合戦略まで含めると、必ず1つはナッシュ均衡が存在します。このすばらしい定理を証明したのは、アメリカ人の数学者ジョン・ナッシュです。ナッシュは、この功績からノーベル経済学賞を受賞しています。

ゲーム理論の出発点であるフォン・ノイマンの論文は、2人ゼロサムゲーム(利得の和がゼロになるゲーム)に、混合戦略のナッシュ均衡が存在することを示したものでした。混合戦略という考え方は、理論上は興味深いものであり、ゲーム理論の数学の根幹を成すものでした。とはいえ、「確率(乱数)を用いて行動を選択する」という考え方は、実際にはなかなか応用されていませんでした。

しかし、近年では、空港や交通機関における警備配置・スケジュールなどへの混合戦略の応用が研究され、適用が始まっています(参考:M.Tambe、Security and Game Theory、Cambridge University Press、2011)。また、被験者にゲームをさせて……

>>第3章の続きを読む(PDFダウンロード)

ピックアップ記事

tags