GTO(ゲーム理論最適)入門
この記事はポーカー上級者向けです。GTO(Game Theory Optimal)の基本概念を説明します。
GTOとは
GTO(Game Theory Optimal)とは、「ゲーム理論最適」の略で、相手がどんな戦略を取っても、自分が損をしない(つけ込まれない)戦略のことです。
ゲーム理論の概念で、ナッシュ均衡(Nash Equilibrium)に基づいています。両方のプレイヤーがGTO戦略を取った場合、どちらも戦略を変えるインセンティブがない状態になります。
GTOとエクスプロイトの関係
ポーカー戦略には大きく2つのアプローチがあります。
| アプローチ | 特徴 | メリット | デメリット |
|---|---|---|---|
| GTO | バランスの取れた戦略 | つけ込まれない | 相手のミスから最大利益を得られない |
| エクスプロイト | 相手の弱点を突く戦略 | 相手のミスから大きく稼げる | 逆にエクスプロイトされるリスク |
実際のプレイでは、GTOをベースにしつつ、相手のリークが明確な場合にエクスプロイト寄りにアジャストするのが現代ポーカーの主流です。
GTOの基本原則
バリューとブラフの比率
GTOでは、ベットサイズに応じてバリューベットとブラフの比率が決まります。
| ベットサイズ | バリュー:ブラフ | 相手のコール頻度 |
|---|---|---|
| 33%ポット | 3:1 | 75% |
| 50%ポット | 3:1 | 67% |
| 67%ポット | 5:2 | 63% |
| 100%ポット | 2:1 | 50% |
MDF(Minimum Defense Frequency)
相手のブラフに対して、搾取されないために最低限コール(またはレイズ)しなければならない頻度。
MDF = ポットサイズ ÷ (ポットサイズ + ベットサイズ)
インディファレンス(Indifference)
GTO戦略では、混合戦略に含まれるすべてのアクションのEVが等しくなります。例えば、あるハンドでベットとチェックが50:50の混合戦略の場合、ベットのEVとチェックのEVは同じです。
GTOを学ぶ意味
GTOを完璧に実行することは人間には不可能です。しかし、GTOを理解することには以下の意味があります。
- ベースラインの確立 — 「正しいプレイ」の基準を知ることで、エクスプロイトの方向性が分かる
- リークの発見 — 自分のプレイとGTOの差を分析することで、自分の弱点が見える
- 上級者との対戦 — エクスプロイトが難しい相手に対しては、GTO寄りのプレイが有効
PokerSnowieやGTO+、PioSOLVERなどのソルバーソフトウェアを使ってGTO戦略を学ぶことができます。
- GTOは相手につけ込まれない均衡戦略
- GTOをベースにエクスプロイトを加えるのが現代の主流
- バリューとブラフの比率はベットサイズで決まる