Künstliche Intelligenz pokert besser als Du
11. Juli 2019Ein Computer, eine Künstliche Intelligenz (KI), gewinnt gegen einen Menschen im Spiel. Mal ehrlich, das haut keinen mehr vom Hocker.
Schließlich gab es schon so einige Computer, die die menschlichen Profis auf ihren Spezialgebieten geschlagen haben. 1997 gewann der Schachcomputer "Deep Blue" gegen den damals amtierenden Weltmeister Garri Kasparow. Oder 2016 besiegte "AlphaGo" den Go-Weltmeister Lee Sedol. Und auch beim Poker sind beim Mensch-Maschine-Duell die KI's schon als Sieger hervorgegangen, etwa "Libratus" und "DeepStack" in 2017.
Doch nun wurde "ein Meilenstein der Künstlichen Intelligenz" ("a recognized milestone in artificial intelligence") in der Fachzeitschrift "Science" vorgestellt, zumindest nach Aussage der beteiligten Forscher. Gemeint ist damit die neueste KI am Pokertisch: "Pluribus".
In dem Artikel "Superhuman AI for a multiplayer poker" sagt Tuomas Sandholm, Professor für Computer Science an der Carnegie Mellon University (CMU), Pluribus habe beim Multiplayer-Poker "eine übermenschliche Leistung erbracht".
Sandholm hat Pluribus unter anderem zusammen mit Noam Brown entwickelt, der seine Doktorarbeit am Computer Science Department der CMU schreibt und außerdem Forscher bei Facebook AI Research ist.
"Die Fähigkeit, in einem so komplizierten Spiel fünf andere Spieler zu schlagen, eröffnet neue Möglichkeiten, die KI zur Lösung einer Vielzahl von Problemen aus der Praxis einzusetzen", so Sandholm.
Pluribus vs. Pokerprofis
Und genau das ist der Meilenstein, von dem die Forscher so schwärmen: Bisherige Poker KI's hatten sich bisher lediglich im sogenannten Heads Up bewiesen, also im Eins gegen Eins-Spiel. Pluribus dagegen hat das getoppt und beim Texas Hold'em gewonnen, wobei zwei bis zehn Personen gegeneinander antreten.
Die Forscher trainierten die KI erst, indem Pluribus gegen fünf Kopien von sich selber spielte. Später ließen die Forscher die Software in zwei Varianten gegen Menschen antreten. Zuerst gegen fünf professionelle Spieler, dann gegen fünf virtuelle Spieler. In beiden Konstellationen setzte sich die KI signifikant öfter durch.
Und hierbei handelte es sich nicht um irgendwelche hobbymäßigen Poker-Cracks, sondern um echte Profis, zum Beispiel Darren Elias, vierfacher Sieger und damit Rekordtitelträger der World Poker Tour und Chris Ferguson, sechsfacher Braceletgewinner der World Series of Poker.
Die Strategie einer KI
"Eine Partie mit sechs statt mit zwei Spielern zu spielen, erfordert grundlegende Veränderungen darin, wie die Künstliche Intelligenz ihre Spielstrategie entwickelt", so Noam Brown in der Veröffentlichung. "Von der Performance des Programms sind wir begeistert und wir denken, dass einige der Spielstrategien von Pluribus sogar das Spielverhalten der Profis ändern werden."
Pluribus' Algorithmen hätten einige überraschende Eigenschaften entwickelt. Zum Beispiel vermeiden die meisten menschlichen Spieler "Donk Bets". So wird ein Einsatz genannt, der von einem Spieler getätigt wird, von dem ein Einsatz nicht zu erwarten gewesen wäre.
In der Regel wird so etwas als kein besonders cleverer Zug angesehen, da er strategisch meist keinen Sinn ergibt. Aber Pluribus platzierte Donk Bets viel öfter als die Profis – die er am Ende besiegte.
Auch Pokerprofi Elias zeigte sich beeindruckt. Pluribus' größte Stärke sei es, verschiedene Strategien anzuwenden. "Das ist das gleiche, was auch Menschen versuchen. Doch es ist eine Frage der Umsetzung – dies auf eine perfekt-beliebige Art und Weise und konsequent zu tun. Die meisten Leute schaffen das einfach nicht", so Elias.
(K)ein echter Meilenstein?
Interessant sei, dass Pluribus zum Trainieren nur gegen sich selbst gespielt habe und nicht mit menschlichen Spieldaten gefüttert wurde, findet Marcus Liwicki, Leiter der MindGarage von der Technischen Universität Kaiserslautern, zu der Veröffentlichung der Kollegen. Die Bezeichnung als Meilenstein der Künstlichen Intelligenz ("recognized milestone in artificial intelligence") hält er jedoch für etwas hoch gegriffen. "Der Durchbruch ist nur inkrementell (aufeinander aufbauend, Anm. der Red.), vom 2-Spieler-Spiel vor einigen Jahren war es nur eine Frage der Zeit, bis Systeme auf mehrere Spiele erweitert werden", so Liwicki.
Auch die Bezeichnung als "übermenschliche Leistung" ("superhuman performance at multi-player poker") sieht er differenziert. "Technisch ist Pluribus eine sehr gute Ingenieursleistung, da viele verschiedene Komponenten sehr gut kombiniert wurden", sagt er. Doch generell werde der Begriff "übermenschlich" derzeit inflationär verwendet, vor allem bei Artikeln von Firmen oder marketing-orientierten Forschungsinstituten, die solche Artikel auch als PR verwenden möchten.
Übermenschlich seien viele Maschinen in unserer Umgebung, sagt Liwicki: "Der Taschenrechner rechnet besser, das Auto fährt schneller, das Flugzeug kann fliegen... und in manchen Spielen ist die KI besser."
Interessant werde es erst, wenn die Künstliche Intelligenz tatsächlich in bisher unbekannten und uneingeschränkten Situationen schneller lernt, rational bessere Entscheidungen zu fällen.
Lesen Sie hier: Künstliche Intelligenz im Energiesektor - Hilfe im Kampf gegen die Klimakrise?
Kristian Kersting hingegen, Leiter des Fachgebietes Maschinelles Lernen an der Technischen Universität Darmstadt, sieht die Leistung, einen No-Limit Poker-Wettkampf mit mehreren Spielern zu gewinnen, klar als Meilenstein der KI-Forschung. "Anfangs wurden 'einfachere' Poker-Varianten betrachtet und auch gelöst. Jetzt sehen wir durch Pluribus, dass sich Maschinen auch beibringen können, eine No-Limit Mehr-Spieler Poker-Variante auf Weltmeister-Niveau zu spielen".
Falsche Erwartungshaltung
Auch die reine Spielleistung könnte man vielleicht als "übermenschlich" bezeichnen, sagt Kersting. "Ich würde das aber nicht tun." Das mache es zu einfach, Menschen auf eine Inselbegabung wie das Spielen von Poker zu reduzieren. Menschen könnten so viel mehr.
"Sollte Pluribus überhaupt die menschlichen Eigenschaften von Pokerspielern haben? Sollte Pluribus fluchen, wenn ein anderer Spieler überraschend all-in geht, und den Zug als unlogisch beschimpfen, wenn der Gegner gewinnt? Und kann uns Pluribus überhaupt das Pokerspielen selbst beibringen?", fragt Kersting. "Menschen können das."
Indes sei es nicht klar, ob uns Pluribus überhaupt helfe, besser zu verstehen, wie Menschen Poker meistern. "Daher finde ich den Begriff 'übermenschlich' und den damit gezogenen Vergleich mit Menschen falsch und sogar gefährlich, da er Erwartungen weckt, die nicht erfüllt sind."
Lesen Sie hier: Künstliche Intelligenz: "Unsere Menschlichkeit wird viel wichtiger werden"
KI als Inspiration
Auch bei anderen Meilensteinen der KI – etwa die anderen oben genannten Beispiele Deep Blue oder AlphaGo – "war die Hoffnung, große Probleme der Menschheit zu lösen. Der tatsächliche Transfer gestaltete sich dann oft schwieriger", sagt Kersting.
So sei das bei Künstlicher Intelligenz.
Er gibt zu bedenken: "Ein Mensch, der sehr gut Poker spielen kann, ist ja auch nicht gleich ein Börsengenie. Aber der Erfolg von Pluribus zeigt, was möglich ist."
Er sollte viel mehr als Inspiration dienen, viele spannende Fragen anzugehen, so Kersting – zum Beispiel das Zusammenspiel von neuen Medikamenten mit Tausenden möglicher Nebenwirkungen, Vermeidung illegaler Fischerei, Überwachung von Meeresverschmutzungen und der Kartierung sensibler Ökosysteme, intelligente Stromversorgung, verbesserte Aussagen über den Klimawandel, und vieles mehr.