ジレンマ状況下における人間の意思決定方略の特性に関する研究

350803102 国松明弘

論文要旨

これまで意思決定に関する研究が多くなされてきた.中でも二者択一問題でありなが ら,意思決定にジレンマが生じる囚人のジレンマゲームに関する研究は多岐に渡る.Axelrod( 1980a) は繰り返し型囚人のジレンマゲームをプレーする上で有効な方略を検討し, TFT(しっぺ返し方略) の有効性を示した.本研究の目的は繰り返し型囚人のジレンマゲー ムにおける人間の意思決定の特性を解明することであり,TFT を含む囚人のジレンマ研 究で取り上げられてきた方略(規範的方略) との関係を検討する.特に人間はTFT 的な行 動を取っているのかについて検討する. そのために3 つのアプローチを取った.1 つ目は実験データ(廣瀬,2008) から人間の意 思決定の近似モデル(H モデル) を推定した.実験データを予測できた割合を示す一致率の 結果から,2 試行前の相手の選択肢の組合せを状態とする2 次マルコフ連鎖モデルを用い た近似モデルをH モデルとした.この結果は人間が相手の行動に敏感に反応した行動を 取っていることを示唆している. 2 つ目は15 種類の規範的方略を分類し,H モデルがどのカテゴリに属するのか検討し た.分類するために,自分と相手の利得関係グラフを作成し.グラフの形状から5 つのカ テゴリに分類された.そして,H モデルはTFT,JOSS と同カテゴリに属することが分か り,人間の意思決定方略がTFT,JOSS と近い関係にあることが示唆された. 最後にH モデルと同カテゴリに属したTFT とJOSS を,実験データにおける再現性の 観点に基づき比較検討した.その際の主な指標として,手法間の比較の際に用いた一致率 に加え,総裏切り回数を用いた.あるモデルが人間の意思決定方略と近い関係があるなら ば,そのモデル同士の対戦から得られる総裏切り回数は,人間同士におけるそれと一致す ると想定される.その結果,一致率においてはTFT とJOSS 共にH モデルのパフォーマ ンスであるベースラインを上回った.しかし,総裏切り回数においてはTFT よりもJOSS の方が人間同士の対戦と近い結果となった.JOSS はTFT と極めて近い行動を取る方略 である.TFT との違いは,相手よりも先に裏切らない特徴(Nice ルール) が緩和されてい ることであった. これらの結果から,人間の意思決定はTFT 的であるが,Nice ルールが緩和された行動 を取ると言うことが分かった.