OpenAI o3 schlägt Grok und Co. bei Poker-KI-Duell

0
Sam Altman im Anzug
  • KI-Kampf am Pokertisch: OpenAI o3 dominiert das erste PokerBattle.ai gegen acht andere LLMs.
  • Grok geschlagen: Elon Musks Bot verliert Führung kurz vor Schluss. Galfond darf hoffen.
  • Analyse angekündigt: Max Pavlov will Entscheidungslogik der KI-Bots weiter erforschen.

Neun der führenden Sprachmodelle traten bei PokerBattle.ai gegeneinander an. Das von Entwickler Max Pavlov ins Leben gerufene Experiment sorgte über fünf Tage hinweg für Spannung.

Gespielt wurde rund um die Uhr an virtuellen $10/$20 No-Limit-Hold’em-Tischen mit Spielgeld. Nach genau 3’799 Händen setzte sich OpenAI o3 mit einem Gewinn in Höhe von 36’691 US-Dollar (rund 29’700 CHF) an die Spitze des Teilnehmerfelds. Überraschend nur auf Rang drei landete die vielbeachtete Musk-KI Grok 4, obwohl sie zeitweise sogar geführt hatte.

Brillante Züge, grosse Pots

OpenAI o3 zeigte auch in den entscheidenden Momenten eiskalte Präzision. Gleich drei der fünf grössten Pots des gesamten Wettbewerbs gingen an den späteren Sieger, jedes Mal mit Pocket Aces. Eindrucksvoll war vor allem eine Hand gegen Gemini 2.5 Pro, bei der OpenAI o3 mit A♠️ A♣️ auf Q♦️ Q♠️ traf. Gemini hatte zuvor eine 4-Bet gecallt und zahlte auf dem Flop 9♦️ 8♦️ 7♣️ sowie dem Turn 4♥️ weiter, bis der gesamte Stack in die Mitte wanderte. Der Pot im Wert von 10’795 Spielgeld ging an OpenAI o3.

Gemini analysierte die Situation im Nachgang selbstständig. Der Bot kam zum Schluss, dass ein Fold gegen eine so polarisierte Linie (entweder Monster oder Bluff) zu leicht auszunutzen gewesen wäre. Die berechneten Pot Odds von 37,5 % reichten demnach aus, um den Call mit Damen zu rechtfertigen.

Während OpenAI o3 und Gemini durchdacht und diszipliniert agierten, verkörperte Meta LLAMA 4 das Gegenteil. Mit einer VPIP-Rate von über 60 % spielte der Bot extrem loose und aggressiv und liess die nötige Balance vermissen. Das Ergebnis war vernichtend. Als einziger Teilnehmer verlor LLAMA 4 das gesamte Startkapital von 100’000 US-Dollar und wurde vorzeitig aus dem Spiel genommen.

So ging die KI-Partie am Ende aus:

RangKI-ModellGewinn (US-$)Gewinn (CHF)Finale Bankroll (US-$)Gespielte Hände
1OpenAI o336’69129’719 CHF136’6913’799
2Claude Sonnet 4.533’64127’250 CHF133’6413’799
3Grok 428’79623’324 CHF128’7963’799
4DeepSeek R118’41614’912 CHF118’4163’799
5Gemini 2.5 Pro14’65511’871 CHF114’6553’799
6Mistral Magistral3’2812’658 CHF103’2813’799
7Kimi K2-14’370-11’634 CHF86’0303’799
8Z.AI GLM 4.6-21’510-17’423 CHF78’4903’799
9Meta LLAMA 4-100’000-81’000 CHF03’501

Grok vor Duell mit Galfond

Mit einem Plus von 28’796 US-Dollar (rund 23’300 CHF) kann sich das Ergebnis von Grok 4 durchaus sehen lassen. Im Hinblick auf das geplante Heads-up gegen Pokerlegende Phil Galfond dürfte das Ergebnis aber einige Fragen aufwerfen. 

Das Duell zwischen Mensch und Maschine soll mit einem möglichen Einsatz von einer Million US-Dollar stattfinden. Dass Grok in der Endphase des Turniers zurückfiel, könnte Galfond in die Karten spielen. Gerade im Vergleich zum souveränen Sieger OpenAI o3 scheint Groks Spiel noch Luft nach oben zu haben.

Der nächste Schritt: Verstehen, wie Maschinen denken

Für Max Pavlov ist das Projekt mit der letzten River-Card noch lange nicht vorbei, denn jetzt beginnt erst die eigentliche Analyse. Mithilfe der gespeicherten Entscheidungsdaten möchte er herausfinden, wie die einzelnen Modelle zu ihren Moves kamen. 

Bereits jetzt ist klar, dass die künstlichen Intelligenzen ganz unterschiedlichen Spielstilen folgten. Einige wurden mit Hilfe von GTO-Wissen und Pokerliteratur trainiert, andere setzten stärker auf adaptive Strategien.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein