2014年10月10日金曜日

ゲーム理論についての簡単な覚え書き

以前、ゲーム理論を題材にした本を出そうと思っていた、という記事を書きました。

その後に、ゲーム理論について触れた記事を書いてアップするのを忘れていたのを修正して載せてみます。

……………………
「ゲーム理論」について語る前に、そもそもゲーム理論を知らない人のために少々、解説をすることをお許し下さい。
ゲーム理論とは、「相互作用を及ぼしあう複数、又は単独の主体の振る舞い」に関して研究する応用数学の一分野である。(中略)ゲーム理論の分析は、基本的にこのような戦略的な状況における未来の行動を予測したり、過去の行動を客観的に評価することを目的としている。つまりゲーム理論とは、あるルールのもとで各プレイヤーがとると考えられる最適な行動の組合せの解を求めることである。(Wikipediaより)
上記の方法を読んでもわかりにくいので、こう言い換えてみました。

複数のプレイヤーが競い合いながら、お互いにとってのベストな状態を模索する「試行錯誤」を科学的に分析する方法論。

――上述の説明より、少し、噛み砕いてみました。

私達の行動は、すべて「選択の積み重ね」とも言えます。指を動かすか、動かさないか、パソコンを開くか、開かないか、などなど。

選択を積み重ねることで、どのような結果を得られるのか。これを数学的に研究できる理論が「ゲーム理論」であり、経済学や生物進化の研究に、大きな影響を与えているそうです。

創始者は、ジョン・フォン・ノイマンという天才。

歴史上最も頭のいい人物とは誰か? という問いが、ときどきネットを賑わせます。レオナルド・ダ・ヴィンチだとかアインシュタインだとか、様々な人物の名前が挙がりますが、そのリストの中に必ず現れるのがノイマンです。

子供の頃に44巻の歴史書を丸暗記したり、8歳までに微積をマスターしたりという神童伝説を持っていました。中年になっても記憶力、暗算力について、他者の追随を許しませんでした。

天才が考えた人間の行動を科学するための理論……一端を知りたいものだと思いつつ、学ぶ機会を先送りにしていた私でしたが、たまたま手にしたゲーム理論の本が、なかなか面白かったのでついつい読み進めてしまいました。

まず興味を惹かれたのが、
「囚人のジレンマコンテスト」
について書かれた話です。

二人の共犯者が、自白をして自分だけ助かろうとするか(裏切り)、沈黙して相手の罪を隠してやるか(協調)、それぞれによって実刑の年数が変わるというルールを作ります。そして、この二人は意思の疎通の手段がありません。

さて、囚人はどのような選択をすればいいのか? それを考えるのが、「囚人のジレンマ」という命題。

「そんなの、場合によって異なるじゃない。人それぞれでしょ」

と言ってしまえば、それでおしまい。たしかにそうです。

でも、似たようなシチュエーションは生きている限り、人生の中にたくさん現れています。相手の気持を知ることができないまま、裏切るべきか協力するべきか、という選択です。

その時々で応対を変え、臨機応変に振る舞う、という方法もあるでしょうが、それでは偶然に支配される要素が強すぎます。それよりも、
「他人と接する際は、こういう原則で行動すれば高い確率で利益を得られる」
という原理原則を知って、迷うときは、常に同じ行動を取る、という戦略はどうでしょうか? 他の人を、ほんの少し、出し抜けるかもしれません。

1980年、政治学者のロバート・アクセルロッドは、この「囚人のジレンマ」について、コンテストを開催することにしました。無数の選択の果てに生き残るのは、どのような原則を己に課した場合でしょうか? 原理原則をコンピュータにプログラミングして、それをお互いに戦わせれば、もっとも強い原則を開発した人が生き残るはずです。

その結局、優勝した原則は、アナトール・ラポポートという心理学者の開発した「しっぺ返し戦略」というものでした。

この戦略は、まずはかならず「協調」という選択肢を選び、もしも相手が「裏切り」を選んだら、すかさず自分も裏切り返す。相手が「協調」してきたら、再び「協調」をする、という単純な戦略です。

ところが、これが強いのです。ときに敗れることはあっても、何千回とかけて調べていくと、この簡単な戦略のみが、並み居るライバルを押しのけて生き残る率が高いことが証明されました。見事コンテストでは優勝しています。

(簡単に説明しようと試みた私の説明が逆に分かりにくければ、下記サイトを御覧ください)
★ 賭博と国家と男と女 ~囚人のジレンマ

まさに、
「やられたらやり返す。倍返しだ!」
という半沢直樹の決心ですね。

実はこのことが多く世界中に知られるようになり、国家戦略にも影響を及ぼしています。もっとも影響を受けたのが、イスラエルだと言われています。つまり、相手が協調してくれば、こちらも協調するが、裏切られた瞬間、やり返すのです。それも徹底的に。

果たして、その結果は良かったのか、悪かったのか。

イスラエルがこれまで生き残ってきた、という一点でみれば、その方法は間違っていないでしょう。でも、常に戦果が絶えないという点では、誤っているように思えます。

「サバイバル」という目的に特化して戦略を組み立てていった結果、その他の目的をすべて捨てていかねばならない羽目に陥るというのは、この理論の欠陥を表しているようにも思えるのでしょうが、いかがでしょう?

0 件のコメント:

コメントを投稿