リバーアクションの基本

リバーアクションの基本

リバーのバリュー・ブラフvsブラフキャッチのシチュエーションを勉強しましょう。上級編のポーカー学習の基礎となるパートです。

状況の説明(いわゆるAKQゲームのノーリミットテキサスホールデム版です)

  • OOPはKKのみ
  • IPはAAまたはQQのみ
  • リバーで強いカードを持っている方が勝つ状況(ボードは77722など)
  • お互いにレンジは知っている
  • ポットは100でレーキなし

ショーダウンした場合、次のようになります。

  • AAは必ず勝てる
  • KKはAAに負けるけど、QQには勝てる
  • QQは必ず負ける

エクイティ

OOP[KK]のEquityは
vs IP[AA]が6コンボで負けていて、
vs IP[QQ]が6コンボで勝っていて、
引き分けが無しなので、ちょうど50%です。

IP[AA,QQ]のEquityは100%-(OOP[KK]のEquity)=100%-50%=50%です。
お互いに50%ずつです(*^-^*)

各アクション

具体的なアクションと頻度について考えていきましょう。
お互いのスタックが100ずつ(ポットと同じ)で、ベットするときはポットサイズベットのオールインをすることにします。

OOP[KK]のアクション

チェックとベットどちらがいいでしょうか?

OOP[KK]が100%ベットした場合

IP[AA,QQ]はAAのとき100%コール、QQのとき100%フォールドします。

IP[AA,QQ]とOOP[KK]のEVを計算してみましょう。

IP[AA]がコールするとき
IP[AA]の収支は+200、OOP[KK]の収支は-100
IP[QQ]の収支は0、OOP[KK]の収支は+100

IP[AA,QQ]のEVは(200*6+0*6)/12=100です。
OOP[KK]のEVは(-100*6+100*6)/12=0です。

うーん、OOP[KK]さんは頑張ってベットしてもプラマイゼロですね…(;´・ω・)
一方、IP[AA,QQ]さんは勝ってるハンドでコールするだけで平均100勝てます。

なので、OOP[KK]のベットは間違ったアクションで、正解はチェックです。
中くらいのハンドで打つと、勝ってるハンドで降りられて、負けてるハンドでコールされて損しちゃうっていうポーカーの格言通りの結果になってます。。

では、OOP[KK]が100%チェックしたとして、IP[AA,QQ]のアクションを考えてみましょう。

OOP[KK]チェック後のIP[AA,QQ]のアクション

IP[AA]のとき

シチュエーションごとの収支は下記です。
IP[AA]チェック→ショーダウンでIP[AA]の勝ち 収支+100
IP[AA]ベット→OOP[KK]フォールドでIP[AA]の勝ち 収支+100
IP[AA]ベット→OOP[KK]コール→ショーダウンでIP[AA]の勝ち 収支+200

つまり、
IP[AA]チェックで収支+100
IP[AA]ベットで収支+100~+200
OOP[KK]がコールしてくれる可能性があるので、IP[AA]は100%ベットが正解です。

IP[QQ]のとき

シチュエーションごとの収支は下記です。
IP[QQ]チェック→ショーダウンでOOP[KK]の勝ち 収支0
IP[QQ]ベット→OOP[KK]フォールドでIP[QQ]の勝ち 収支+100
IP[QQ]ベット→OOP[KK]コール→ショーダウンでOOP[KK]の勝ち 収支-100

つまり、
IP[QQ]チェックで収支0
IP[QQ]ベットで収支-100~+100

では、IP[QQ]のアクションはチェックとベットどちらがいいでしょうか?

IP[QQ]が100%チェックした場合

ショーダウンで必ず負けるのでEV0です。
さらに、IPがベットしたときは100%[AA]なので、OOP[QQ]は100%フォールドするようになります。
このときのEV
IP[AA]ベットのEV+100
IP[QQ]チェックのEV0
IP[AA,QQ]のEVは(100*6+0*6)/12=50
OOP[KK]のEVは(-100*6+100*6)/12=0

IP[QQ]の適正なアクション頻度

ではIP[QQ]はどのくらいの頻度でバリューベットすればいいのでしょうか?
正解はOOP[KK]がどんな頻度でコール(ブラフキャッチ)しても変わらない頻度です。
数式はこんな感じです。xをIPのバリューベット頻度とします。
※算数でつまづくのはもったいないので少し細かく書きます。

(OOPが得られる利益)×(IPのブラフベット頻度)-(OOPがコールしたときの損失)×(IPバリューベット頻度)=0
(ポット額+OOPのコール額)(1-x)-(IPのベット額)x=0
(100+100)(1-x)-100x=0
200(1-x)-100x=0
200-200x-100x=0
200-300x=0
300x=200
x=200/300
x=2/3

つまり、IPは2/3(66.7%)の頻度でバリューベット、1/3(33.3%)の頻度でブラフベット、つまりバリュー:ブラフ=2:1が適正であることが分かります。
IP[AA,QQ]のうち、IP[AA]は100%ベットなので、IP[QQ]は50%ブラフベットすればOKです。
IP[QQ]の残り50%はチェックです。
このときのIP[AA,QQ]は適正な頻度となり、OOP[KK]がどんなアクションをしても期待値が減ることはありません。
このIPの戦略をGTO(Game Theory Optimal)戦略といいます。

OOP[KK]の適正なディフェンス頻度

では、IPにベットされたOOP[KK]はどのくらいの頻度でディフェンス(ブラフキャッチ)すればいいのでしょうか?
正解は、IPはこのbet額と頻度以上でブラフしたら、IPは損するよ!っていう頻度です。
つまりIPがブラフするときの必要勝率から求めます。
数式はこんな感じです。xをIPのバリューベット頻度とします。

ブラフを打つときの必要勝率の数式
(ポット額):(ベット額)=(ベット額)/(ポット額+ベット額)
100:100=100/(100+100)=100/200=1/2

ディフェンス頻度の数式
1-(ブラフの必要勝率)
=1-(1/2)=1/2=0.5
つまり、OOP[KK]は1/2(50%)の頻度でディフェンス、残り1/2(50%)の頻度でフォールドすれば、IPのブラフに搾取されなくなります。

このときのEV
IP[AA]EV=(100)(1/2)+(200)(1/2)=150
IP[QQ]EV=(100)(1/2)(1/2)+(-100)(1/2)(1/2)+0(1/2)=0
IP[AA,QQ]のEVは(150*6+0*6)/12=75です。

AKQゲーム
ポットの100%サイズBET時のバリューブラフ比は2:1。EV=75

OOP[KK]のEVは(200)(1/4)(1/2)+(-100)(2/4)(1/2)+(100)(1/4)=25です。

KK vs AAKK
KKが適切にコールしたときのEVは0。QQチェックのときに利益100

OOP[KK]もポット100のうち、25の期待値が生まれました。
このOOPの戦略もこれ以上搾取されないのでGTO戦略です。

2人の戦略が均衡していてお互いに搾取できない状況をナッシュ均衡といいます。
この例のように、お互いがGTO戦略を行っていて均衡している状態はナッシュ均衡の一つです。

同EquityでのポラライズドレンジとコンデンスドレンジのEVの違い

IP[AA,QQ]とOOP[KK]のエクイティはそれぞれ50%ですが、
お互いに最適な戦略を取った場合、EVに差がでました。
IP[AA,QQ]のEV=75
OOP[KK]のEV=25
これはIPの方が強いハンドを持っているからです。
同じエクイティ同士のレンジの場合、中くらいのエクイティのハンド(コンデンスドレンジ)より、強いものと弱いものが混在しているポラライズドレンジの方が戦いやすいともいえます。