AI, která se nebojí 3-betů: Model GPT-5.2 se stal pokerovým šampiónem v souboji umělé inteligence

Poker má jednu zvláštní schopnost – odhaluje, kdo dokáže přemýšlet pod tlakem, pracovat s nejistotou a zároveň občas přesvědčivě blafovat. Právě proto se heads-up NLH stal jednou z hlavních disciplín projektu Game Arena, který porovnává špičkové AI modely. A výsledek z prvních únorových dnů vyprofiloval šampióna – model GPT-5.2.

Game Arena je veřejný „testovací ring“ pro špičkové AI modely, který vznikl jako společný projekt Kaggle (Google platforma pro datovou vědu) a Google DeepMind – cílem je porovnávat modely ve hrách, kde rozhoduje strategie, adaptace a práce s nejistotou. Poker se do této arény dostal právě proto, že je to učebnicový příklad nedokonalé informace (nevidíte soupeřovy karty), variance a riskování – tedy věci, které „jazykové“ modely prověří jinak než šachy. V praxi to funguje tak, že modely hrají enormní množství ruk přes prostředí, které jim textově popisuje situaci.

V pokerové části Game Areny se modely testovaly v heads-up NLHE a právě GPT-5.2 měl být nejziskovějším účastníkem. Ve zprávách se objevilo konkrétní číslo: přibližně 180 000 odehraných ruk na blindech 1$/2$ a výsledný profit 167 614$. V praxi jde o „simulovaný cash game“ benchmark, který má ukázat, jak se model chová ve hře s neúplnou informací – tedy přesně v prostředí, kde nestačí být jen dobrý v počítání kombinací, ale je nutné i správně vyhodnocovat rozsahy, frekvenci a načasování agrese.

Exhibice vs. finální žebříček

Na sociálních sítích se zároveň šířila i jiná informace: v livestreamovaném pavouku (exhibičním „brackete“) finále přineslo vítězství modelu o3 nad zmiňovaným GPT-5.2. A to je právě ten detail, který stojí za vysvětlení. Bracket byl divácký formát – třídenní show s vybranými zápasy a komentářem. Finální žebříček naopak vycházel z mnohem většího množství her a sloužil jako robustnější srovnání výkonu. Jinými slovy: v „televizním“ finále mohl vyhrát o3, ale v celkovém dlouhodobém hodnocení vyšel GPT-5.2 jako nejlepší pokerový model.

Game Arena nevzbudila pozornost jen čísly, ale i stylem hry. Mnohé reakce z pokerového prostředí zmiňovaly výrazně agresivní přístup modelů, který působil místy „nelidsky“ konzistentně. I proto bylo důležité, že přenos doprovázeli známí komentátoři: Doug Polk, Nick Schulman, Liv Boeree či Hikaru Nakamura. Právě v jejich komentářích zaznívala zajímavá pointa: ano, modely dokážou tlačit na soupeře a vytvářet nepříjemná rozhodnutí, ale občas zároveň ukazují zvláštní „logické díry“ v odůvodněních situací. Pro fanoušky to byla zábava. Pro online poker je to však také připomínka, že téma integrity her a robotů bude čím dál aktuálnější.

Co na AI pokerové souboje říkají profesionálové?

Co z toho plyne pro poker

Není to ještě příběh o tom, že „AI definitivně vyřešila poker“. Spíše signál, že univerzální modely se už umí v kontrolovaném benchmarku pohybovat na úrovni, která vzbuzuje respekt – i otázky. A pokud se má poker do budoucna bránit proti nekalé výhodě, právě takové otevřené testy a veřejná srovnání mohou ukázat, kde jsou modely silné, kde dělají chyby a co vlastně znamená „hrát dobře“ v éře, kdy bluff už není jen lidskou zbraní.

Zdroje – YouTube, PokerStrategy, GitHub, Blog.Google, Science.org