メニュー

ナッシュ均衡とは:ゲーム理論の基礎知識3

ゲーム理論の基礎知識

更新日:2021年7月7日(初回投稿)
著者:東京都立大学 経済経営学部 教授 渡辺 隆裕

前回は、戦略形ゲームと、戦略形ゲームの解の1つである支配戦略について解説しました。今回は、戦略形ゲームの一般的な解であるナッシュ均衡、さらにチキンゲームや調整ゲームなど代表的なゲームの例について説明します。

今すぐ、技術資料をダウンロードする!(ログイン)

1. ナッシュ均衡

ナッシュ均衡とは、全てのプレイヤーが、一定のルールのもと、自分の利得が最大となる最適な戦略を選択し合っている状態のことをいいます。第2回では、ゲームに支配戦略(他のプレイヤーがどんな選択をしても、自分の戦略が他の戦略より常に良い(利得が高くなる)戦略)があるときは、プレイヤーがそれを選ぶことがゲームの解になることを解説しました。しかし、ゲームには支配戦略があるとは限りません。このような場合は、ナッシュ均衡がゲームの解になります。支配戦略がないような以下の例で考えてみましょう。

・一ノ瀬と二子山の例
老舗和菓子店一ノ瀬と二子山は、A地区かB地区のどちらかに支店を出そうと考えています。両店がA地区・B地区と別々に出店すれば、各地区のお客を独占でき、1日の売上はそれぞれ12万円と8万円になります。しかし、同じ地区に出店すると、各地区のお客を奪い合い、売上はその半分になってしまいます。一ノ瀬と二子山はどちらに出店するでしょう?

支配戦略がないゲーム:
図1は、前回説明した利得行列でこのゲームを表現しています。ゲームの結果を考えるために、一ノ瀬の立場で考えてみましょう。相手(二子山)がA地区を選択したと想定すると、自分(一ノ瀬)はB地区を選択する(利得8)方が、A地区(利得6)よりも良い選択となります。一方、相手がB地区を選択したならば、自分はA地区(利得12)の方が、B地区(利得4)よりも良い選択です。A地区の方が売上は大きいものの、客を奪い合うよりは相手と異なる地区に支店を出した方が良く、また、二子山も一ノ瀬と同じ状況です。

図1:支店をどちらに出すか?

図1:支店をどちらに出すか?

最適反応戦略とナッシュ均衡:図1のゲームでは、他のプレイヤーの戦略に応じて、自分の利得が高くなる戦略が変わります。常に利得が高くなる支配戦略はありません。他のプレイヤーの戦略に対して、自分の利得が一番高くなる戦略を最適反応戦略と呼びます。支配戦略は、全ての戦略に対する最適反応戦略となりますが、今回は最適反応戦略が相手の戦略によって変わってきます。

このようなときは、全てのプレイヤーが最適反応戦略を選び合うという結果が起こると考え、そうした結果(戦略の組み合わせ)をナッシュ均衡と呼びます。言い換えると、ナッシュ均衡は、全てのプレイヤーが自分の利得を一番高くする戦略を選び合っている状態であり、自分だけが別の戦略に変えても利得が高くならない状態であるといえます。

図2:ナッシュ均衡ではない結果とナッシュ均衡になる結果

図2:ナッシュ均衡ではない結果とナッシュ均衡になる結果

図1のゲームにおける、ナッシュ均衡を考えてみましょう(図2)。「両店舗がA地区に出店する」という結果は、ナッシュ均衡ではありません。一ノ瀬は、二子山がA地区に出店するならば、B地区に出店する方が利得を高くする(最適反応戦略)ので、最適反応戦略を選び合うことにはなっていないからです(二子山も同様)。

これに対し、「一ノ瀬がA地区に、二子山がB地区に出店する」という結果はナッシュ均衡になります。一ノ瀬は、二子山がB地区に出店するときに、A地区に出店することが最適反応戦略になるからです(二子山も同様)。また、「一ノ瀬がB地区に、二子山がA地区に出店する」という結果もナッシュ均衡です。このように、ナッシュ均衡は1つとは限らず、複数存在することもあります。

ナッシュ均衡をゲームの解と考える理由は何でしょうか。プレイヤーが結果を予測したときに、ナッシュ均衡以外では、誰かが最適反応戦略を選んでいないことになり、そのプレイヤーが予測から逸脱して行動を変えます。従って、その予測は当たらない、と考えられます。

例えば、じゃんけんの必勝法として「統計的に、人はグーを出しやすい」という予測があったとしましょう。この場合、相手がグーを出すと予測するならば、もはやプレイヤーはグーを出さず、パーを出すでしょう。ゲームのプレイヤー自身が合理的であり、何が起きて何が最良であるかを考え合っているならば、それを実現するための予測はナッシュ均衡でなければならない、ということになります。

2. チキンゲームと調整ゲーム

別々の車に乗った2人のプレイヤーが、互いの車に向かって一直線に走行し、衝突を避けて先にハンドルを切ったプレイヤーを、「チキン(臆病者)」と称し、屈辱を受け負けとなる、という行為をチキンゲームと呼んだりします。ここでは、ゲーム理論におけるチキンゲームと調整ゲームについて説明します。

・チキンゲーム
チキンゲームは、プレイヤー同士が衝突を避け、あらかじめ行動を棲(す)み分けることをナッシュ均衡と見なします。チキンゲームでは、プレイヤーは強気(ブル)と弱気(チキン)のどちらかを選択します。双方が強気を選択すると、双方にとって悪い結果となり、どちらかがチキンとなって弱気を選択する方がまだ良い、というゲームです。例えば、皆が参加したいイベントであるけれども、全員が行って混雑するならば家にいた方が良いといった状況は、多人数によるチキンゲームと解釈することができます。イベントに行くことは強気(ブル)で、家にいることが弱気(チキン)となります。

今回の例は、一ノ瀬も二子山も、相手がB地区に出店し、自分はA地区に出店することが最も良い戦略であり、両者がA地区に出店することは避けたい状況であるということから、このゲームはチキンゲームであることが分かります。

・調整ゲーム
調整ゲーム(コーディネーションゲーム)は、プレイヤー同士が同じ行動をすることがナッシュ均衡となるゲームです。簡単な調整ゲームは、「左側通行か右側通行か」というゲームです。細い山道で車がすれ違うときに、どちら側に寄ってすれ違うかを想像してください。右でも左でも、お互いが同じ方向に避ければ良く、違った方向に避けるとぶつかってしまいます(図3)。同窓会に行くか行かないか(皆が行くなら行きたい/皆が行かないなら行きたくない)、緊急事態時のトイレットペーパーの買い占め(皆が買いに走るなら、自分も走らなければならない/そうでないなら、わざわざ買いに行く必要がない)、さらに銀行の取り付け騒ぎなども、調整ゲームとして解釈されます。

図3:左側通行か?右側通行か?

図3:左側通行か?右側通行か?

図3のゲームでは、相手が右を選ぶならば、自分は左より右を選ぶ方が利得の高くなる戦略(最適反応戦略)であり、「両プレイヤーが右を選ぶ」は、最適反応戦略を選び合うナッシュ均衡になります。同様に「両プレイヤーが左を選ぶ」もナッシュ均衡です。チキンゲームと同じように、ナッシュ均衡は2つあります。

このとき、どちらのナッシュ均衡が起こるのでしょうか。交通ルールが左側通行であるイギリスや日本ならば両者は左を選び、右側通行であるアメリカやフランスであれば右を選ぶでしょう。このように、チキンゲームや調整ゲームで複数のナッシュ均衡があるときに、どのナッシュ均衡が実現するかについて、プレイヤー間で共通の予測がある場合は、その予測をフォーカルポイントと呼びます。フォーカルポイントがあれば、そのナッシュ均衡は実現する可能性が高くなるといえます。

3. 支配戦略とナッシュ均衡

続きは、保管用PDFに掲載中。ぜひ、下記よりダウンロードして、ご覧ください。

ピックアップ記事

tags