2013年4月19日金曜日

支配戦略と支配戦略均衡、そして反復支配戦略均衡

他のプレイヤーがとる戦略のすべてに対して最適な戦略を支配戦略という。例えば、下図のような利得行列を考える。


この利得行列の場合、プレイヤー甲の利得は乙が戦略CとDのどちらを選択しても戦略Aのほうが大きい。そのためプレイヤー甲にとって戦略Aは支配戦略となる。同様にプレイヤー乙の利得は、甲が戦略AとBのどちらを選択しても戦略Cが大きい。そのため甲と乙が合理的である場合、戦略の組み合わせは(A,C)の組み合わせに落ち着く。この状態を支配戦略均衡という。


一般には支配戦略均衡が存在しない場合もある(というかその場合の方が多い)。例えばジャンケンを考える。相手がグーを出す場合にはパーを出すのが利得が大きい一方で、相手がチョキを出す場合はグーを出すのが利得が大きく、支配戦略は存在しない。

支配戦略が無い場合にも、相手がどのような戦略をとっても、利得が大きくない戦略を削除していくことにより、最終的に選ぶべき戦略が残る場合がある。これを反復支配戦略均衡(支配される戦略の逐次消去)という。

例えば、下図のような利得行列を考える。
この利得行列は、両プレーヤーにとって先述の支配戦略は存在しない。
しかし、プレイヤー乙は、プレイヤー甲が戦略AやBをとっても戦略Eが最も利得が高くなることはないため、プレイヤー乙は戦略Eを選択することはない。そのため戦略Eを除去し、A、B、C、Dの四つだけの利得行列(下図)を考える。
この行列では、プレイヤー乙には支配戦略が存在しない一方で、プレイヤー甲は戦略Aが支配戦略である。そのためプレイヤー甲が戦略Bを選択することはない。そのため行列から戦略Bを除去すると、自動的にプレイヤー乙は戦略Dをとらざるを得ない。(戦略Aのもとでは戦略Dのほうが利得が大きいため。)最終的に戦略の組み合わせ(A、D)が均衡状態となる。

このように、相手の戦略選択に関わらず利得の少ないものを取り除いていって生まれる均衡を反復支配戦略均衡(支配される戦略の逐次消去)という。

0 件のコメント:

コメントを投稿