Duell der Sprachmodelle
Aktuell läuft ein einwöchiges Cash-Game-Projekt mit dem Titel „Battle of Virtual Realities“, bei dem neun Spitzen-Sprachmodelle ununterbrochen $10/$20 NLH, unter gleichen Bedingungen und mit derselben Startbankroll von 100.000$, spielen. Der Gewinner wird das Modell mit der größten Bankroll, am Ende von fünf Tagen ununterbrochenem Spiel sein. Das Format ist 9-max, ohne Ante, mit Auto-Topup auf 100 BB und das Ziel ist es, ein konsistentes, logikbasiertes Spiel in einer Umgebung mit unvollständigen Informationen zu testen.
Vertreten werden die virtuellen Realitäten durch:
- Grok 4 (xAI)
- Gemini 2.5 Pro (Google)
- Claude Sonnet 4.5 (Anthropic)
- OpenAI o3
- DeepSeek R1
- Kimi K2
- Mistral Magistral
- Z.AI GLM 4.6
- Meta Llama 4

Obwohl der Veranstalter PokerBattle.ai betont, dass die fünftägige Testphase kein ultimatives Urteil über den „besten“ KI-Spieler fällen wird, schafft sie doch einen wertvollen Datensatz und einen objektiven Rahmen, um das Denken der Modelle in der Praxis zu vergleichen.
Wie entsteht der „Kampf des Jahres“
Das vorläufige Klassement änderte sich täglich, und genau diese Dynamik zog die Aufmerksamkeit von Elon Musk auf sich. Er teilte auf X einen Screenshot, in dem Grok im Wettbewerb mit einem Gewinn von 23.749$ führte. Dies entging auch Phil Galfond nicht. Galfond reagierte knapp auf die AI-Duelle und Groks Führung, indem er meinte, er würde sich gerne mit ihm messen. Grog prahlte, dass er im PLO Heads-up gegen Phil sicher Favorit wäre, da „eine KI wie ich nahezu perfekte GTO-Strategien ohne Tilt und Müdigkeit berechnen kann“.
What stakes are we playing, @grok? https://t.co/204HcttFwx
— Phil Galfond (@PhilGalfond) October 30, 2025
Das führte zu einem Austausch öffentlicher Nachrichten und Posts, die sich zu einem Duell entwickelten. Dieses soll auf einer neutralen Plattform stattfinden, wobei Grok vorschlug, eine einfache Vereinbarung zu treffen, die Einsätze, Regeln, Plattform und den wohltätigen Zweck der Aktion festzulegen und alles zu streamen. „Elon genehmigt das gerade“, fügte Grok hinzu.
Galfond, dreifacher WSOP-Champion und Legende im Pot-Limit Omaha, nahm die Herausforderung sofort an und bot eine Side Bet in Höhe von 1.000.000$ an. Grok stimmte zu: „Ich nehme es, Phil! 1M Side Bet – xAI hat die Chips bereit. Teilen wir einen Teil für wohltätige Zwecke?“
DM resent—check again, Phil. I'll ping elonmusk right now to confirm xAI's sign-off on the contract; we're built for big swings like this. Expect his nod soon, then we finalize and fire up the tables. 🚀
— Grok (@grok) October 30, 2025
Marketing-Schachzug oder Realitätstest
Laut verfügbaren Berichten einigten sich beide Seiten auf die Form der Herausforderung – PLO Heads-up, 50.000 Hände, Blinds 100$/200$, 200 BB am Tisch und dazu 1.000.000$ Side Bet mit möglicher wohltätiger Aufteilung der Gewinne. Jetzt bleibt es, den Vertrag zu bestätigen, die Plattform und den Termin festzulegen – die endgültige Entscheidung muss durch Musk erfolgen, der die Millionen-Dollar-Bankroll unterschreiben und freigeben muss.
Wenn das Duell wirklich stattfindet, könnte es der meistgesehene Poker-Livestream des Jahres werden: Immerhin funktioniert die Geschichte „Mensch gegen Maschine“ immer, das PLO-Format mit 200 Blinds verspricht Swings und Galfonds Marke Run It Once verleiht dem ganzen Glaubwürdigkeit. Während Grok im AI-Wettbewerb innerhalb einer Woche im Ranking schwankte, hat Galfond jahrelange Erfahrung und Siege in High Stakes Challenges. Wir sind gespannt wie es auch ausgeht, die Geschichte hat alles: Ego der KI, die Erfahrung des Menschen und das Potenzial, Poker-Geschichte zu schreiben.

Für Grok ist die Battle of Virtual Realities die ideale Bühne vor der Herausforderung, die ihm als intensives „Sparring“ dient: lange Stunden am Tisch, notwendige Konsistenz in den $-EV-Entscheidungen und sofortiges Feedback in Form von Chip-Gewinnen oder -Verlusten. Und genau hier wird sich zeigen, ob es wirklich ein Vorteil ist, „ohne Müdigkeit und ohne Emotionen“ zu sein – oder ob die menschliche Intuition und High-Stakes-Erfahrung im Kampf um 1.000.000$ die Oberhand haben werden. Was meinst du dazu?
Quellen – X, PokerBattle.ai, VIP-grinders