co-LabBRAINS

交流広場

2023/12/20 20:54

【ゲーム理論】"ジャンケンで最も勝ち越す方法" から学ぶ、エクスプロイト(搾取)戦略

私の研究対象であるポーカーの関連トピックスとして「ゲーム理論」に関するお話をさせていただきます。




例として「ジャンケン」について考えてみましょう。

理論的に、
ジャンケンで全く隙の無いプレイは
グー、チョキ、パーを同じ頻度(約33.3%ずつ)でランダムに出すことです。
このような"均衡"のとれた戦略の相手を負かすことはできません。

では、
グー、チョキ、パーを
34.0%、33.0%、33.0%
で出すプレイヤーに対して最大限勝ち越す戦略(各手の頻度)はなんでしょうか。

ぜひ一度答えを考えてみてください。




答えは...



グー、チョキ、パー
0%、0%、100% です。(当たりましたか?)

パーを出した際の期待値(勝率)が最も高くなるため、すべてパーにすることで利益を最大化することができます。

このように、均衡プレイから外れたプレイに対して利益を最大化するプレイ戦略のことを「エクスプロイト(搾取)戦略」といいます。

今回の例の面白いところは「隙の無い戦略」は各手を同じ頻度で出すものである一方、「隙のある相手から最大限搾取する戦略」は大きく偏ったものになるところにあります。

たとえばポーカーはジャンケンよりも複雑なゲームですが、今回の例のように相手の隙を突いていく点では同じ観点から戦略を組み立てたりします。面白いです〜

以上、ゲーム理論(とポーカー)の紹介でした〜

(今回の投稿、こちらで適切だったでしょうか。もしずれてたら教えてください...!)

3件のコメント (新着順)
たに バッジ画像
2023/12/21 12:27

非常に面白いお話ありがとうございます。
ポーカーなど非完全情報ゲームでは要素が複合的なので本論を実践するのは容易ではないことが想像できますが、じゃんけん位シンプルでも相手の出した手を記憶(記録)して期待値を算出しないと期待値が最も高い手が判明しないのでなかなか難しそうですね。対峙しているのが1人でも大変なのに、例えば麻雀だと4人ですし、ポーカーだと10人以上の場合もあると思うので各々に対処するのは頭がパンクしそうですね…!


ノムリエ
2023/12/22 20:06

おっしゃる通り、言うは易しで実践は決して簡単ではありません。

相手のプレイ傾向推定には多くの試行を要するのが基本ではありますが、ポーカーの場合には1ハンド(1ゲーム)で大きなヒントを得られる場合もあります。
そのあたりの話もとても面白いので改めて投稿させて頂こうかと思います!

やまだ
2023/12/21 11:06

毎朝、目覚まし時計がしゃべる某情報番組のじゃんけんに挑んでは負け越しているのですが、彼らも1週間かけて均衡な手を出し、隙のない勝負を仕掛けてきているのでしょうか、、、笑


ノムリエ
2023/12/22 18:36

きっと完璧ではないはずです!ので、データを取ってエクスプロイトしましょう!!笑

横本@アズワン
2023/12/21 08:12

弱点(隙)は対策されるまで徹底的に擦りまくれってことですね!


ノムリエ
2023/12/22 18:35

その通りです!
実際のゲームで100%パーを出しているとすぐバレてしまいますが、さらにその裏をかいて...といった読み合いも面白いです。