Macht ein neuer Artificial Intelligence Bot Poker kaputt?

1

In den vergangenen Jahren hatte es wiederholt Versuche gegeben, AI-Bots gegen menschliche Spieler pokern zu lassen. Aufgrund der Komplexität von Poker kam man dabei nie über das Heads-Up-Format hinaus, dort aber waren die Computer dann schon fast perfekt – vor allem im Limit Hold‘em.

Nun wurde erstmals ein überarbeiteter AI-Bot im No-Limit gegen mehrere (menschliche) Kontrahenten im 6-max-Format ins Rennen geschickt. Dieser AI namens Pluribus wurde von Facebook- und Carnegie Mellon University Forschern entwickelt. Ziel war es, das Gelernte aus den puren Heads-up Vorgängern Claudico und Libratus auf ein weit komplexere Format gegen mehrere Spieler gleichzeitig anzuwenden.

Zuerst spielte Pluribus viele Milliarden Hände gegen Kopien von sich selbst, um das Verständnis der Regeln und die Entwicklung von Strategien zu perfektionieren. Dies ist eine übliche Praxis im AI-Training.

Als nächstes spielten fünf Kopien von Pluribus gegen die Poker-Profis Chris “Jesus” Ferguson und Darren Elias über jeweils mindestens 5.000 Hände. In diesem Experiment war es den AI-Kopien nicht möglich, untereinander Strategien auszutauschen. Beide Menschen wurden geschlagen.

Auf diese Versuche folgte ein tatsächliches 6-max-Spiel, in dem Pluribus gegen fünf Menschen antrat. Diese Gegner kamen aus einer Gruppe von 13-15 Spielern, die für dieses Experiment bereit standen. Über 12 Tage wurden jeweils über 10.000 Hände gespielt. Pluribus gewann im Durchschnitt $5 pro Hand und somit mit einer Stundenrate von $1.00 – ein absolut eindeutiges Ergebnis für den Beweis der Überlegenheit des AI.

Die Berechnung der multi-Spieler/multi-Straßen-Strategien bedarf eine sehr hohe Computer-Rechenleistung, die momentan noch nicht unbedingt schnell zu lösen ist. Dies war bisher die große Hoffnung für die Poker-Industrie, denn ein für diese komplexen Berechnungen ausreichend leistungsfähiger Computer musste erst noch entwickelt werden.

Pluribus hat hier jedoch große Fortschritte gemacht. Dieser AI ist nicht nur generell stärker und schneller, er wendet auch eine interessante Unterkategorie von Berechnungen an, womit Rechenprozesse aufgebrochen werden können, z.B. werden nicht direkt alle möglichen zukünftigen Straßen-Entscheidungen der Gegner auf einmal berechnen, sondern nur die nächsten zwei bis drei.

Was wollen die Forscher damit erreichen?

Die Hoffnung der AI-Koautoren Tuomas Sandholm und Noam Brown ist, dass die erlernten Pluribus-Strategien für andere komplexe Entscheidungs-Bereiche, wie Cyber Security, Fraud Prevention, finanzielle Verhandlungen oder sogar Verkehrsführung, angewandt werden können.

Sandholm und Brown, bekannt durch die Arbeit mit Claudico und Liberatus, sind fasziniert von Poker und der Herausforderung, die das Spiel durch unvollständige Information und auch fehleitende Information (Bluffs) darstellt. Ihr Plan war es nie, Online-Poker zu gefährden oder zu zerstören und der Code wird dementsprechend auch nicht veröffentlicht werden. Dieser „könne sehr gefährlich für die Poker-Community sein”, sagte Brown.

Sandholm bestätigte, dass sein Interesse an Poker gestiegen ist und dass er von den Möglichkeiten für Strategieentwicklungen für die Spieler begeistert war. “Ich habe das Spiel zu lieben gelernt, weil diese künstlichen Intelligenzen wirklich aufgezeigt haben, dass es weit mehr Tiefen im Spiel gibt, die Menschen bisher noch nicht verstanden haben, sogar brillante professionelle Spieler, die Millionen von Händen gespielt haben. Ich hoffe somit, dass dies eher zu der Faszination dieses Freizeitspiels beiträgt.”

Neue Anwendungen der AI-Strategien?

Tatsächlich hat Pluribus seine Strategien im Spiel gegen sich selbst entwickelt und somit einige Ergebnisse erzielt, die wir als Menschen, die auf vorheriges Wissen aufgebaut haben, bisher anders gewertet hatten. Ein Mensch wird zum Beispiel nie in der Lage sein, eine perfekt balancierte Mixed-Strategie ohne Hilfsmittel zu spielen. Pluribus schaffte es in kürzester Zeit “vorhersehbar unvorhersehbar” zu spielen und besser zu bluffen, als ein Mensch das je könnte.

Das Limpen hat Pluribus nach nur kurzer Zeit komplett eliminiert, Donkbets wendete er im Gegenzug häufiger an, als es menschlichen Spielern lieb wäre.

“Es war unglaublich faszinierend, gegen den Poker-Bot spielen zu können und einige der Strategien zu sehen, die er wählte,” sagte Michael “Gags” Gagliano, ein weiterer Pokerspieler, der an dem Experiment teilnahm. „Da waren einige Spielzüge, die Menschen einfach nicht machen würden, insbesondere in Bezug auf Bet Sizing. Bots/AI spielen eine wichtige Rolle in der Poker-Evolution und es war Wahnsinn, diese direkten Erfahrungen zu sammeln als Teil dieses riesigen Schrittes in die Zukunft.”

Was bedeutet das für die Zukunft von Poker?

Inwieweit sich Pokerprofis mit den Strategien der AIs befassen und diese anwenden werden, muss man abwarten. Was die Existenz eines Bots dieses Ausmaßes für Online-Poker bedeutet, ist zudem eine noch viel schwerwiegendere Frage.

Die Rechenkraft ist immer noch eine große Hürde, ehe man an eine – wie auch immer geartete – Anwendung denken kann. Aber das ist natürlich nur eine Frage der Zeit. Tatsache ist jedoch, dass eine Erkennung dieser Bots durch Online-Poker-Anbieter weit schwieriger sein wird, als es jetzt schon der Fall ist.

1 KOMMENTAR

  1. Online Poker is FRAUD!
    WO immer große Summen anonym eingesetzt werden, wird es Leute geben, die das System überwinden werden wollen.
    Nur die Anbieter lassen die üblichen Pros Hier und dort gewinnen, um die Schafe anzulocken. Als Pokeranbieter gibt es keine bessere “Finanzierung” als online das Geld einzukassieren, von zig tausenden Spielern.
    Warum tauschen Poker Plattformen für zig Mrd. , Unterstützt von “Investoren” , die genau wissen, der “Return” wird abgegrast. Hier und dort Mal Ben Min Cash, damit es nicht zu offensichtlich wird- ansonsten kann man das Geld auch gleich auf die Strasse werfen.
    Bis dato hat kein online Anbieter das Gegenteil bewiesen…und wird es auch Niemals tun.
    Ich vertraue keinem Online Anbieter- können schreiben was sie wollen, über angebliche Fraud Aufdeckungen und ” wieder Mal 67 Bots” überführt…das ist doch lächerlich. Sobald jemand eine Poker Software bedienen kann, hat er kein Problem 20 oder 50 Programme parallel laufen zu lassen.
    Die “Schafe” – also die Spieler, werden Niemals über all die Skandale und Aufdeckungen erfahren- hier und da, wird ein abgenagter Knochen in die Manege geworfen, nach dem Motto ‘siehste’ …und ansonsten wird prächtig Kasse gemacht. Kein Spieler weiß, wie viele Accounts dem Anbieter gehören…KEINER!