Ny AI-milstolpe när Libratus utklassade fyra pokerproffs i Texas hold’em

En artificiell intelligens kallad Libratus vann nyligen över fyra pokerproffs efter en tre veckor lång tävling som anordnades på Rivers Casino i Pittsburgh. Segern ses som en ny stor milstolpe inom AI-forskningen.

För snart ett år sedan besegrade AI:n AlphaGo världsmästaren i brädspelet Go, vilket var en stor milstolpe inom AI:n då Go, till skillnad från schack, har fler möjliga drag än vad som kan hållas i minnet på en dator. Nu har ännu en milstolpe inom utvecklingen av artificiell intelligens nåtts då en AI för första gången besegrat fyra pokerproffs i heads-up, no-limit Texas hold’em.

Mellan den 11-30 januari hölls ett 20-dagars pokermaraton kallat ”Brains Vs. Artificial Intelligence: Upping the Ante” på Rivers Casino i Pittsburgh där AI:n vann överlägset med närmare 1,8 miljoner dollar i marker efter totalt 120.000 givar. AI:n, som fått namnet Libratus, har utvecklats av Tuomas Sandholm, professor i datavetenskap, och hans team vid Carnegie Mellon University (CMU) och det är inte första försöket de gör. 2015 lät de Libratus föregångare Claudico ställa upp i samma pokertävling men då förlorade AI:n.

Vad som gör poker extra svårt för en AI är att det är ett spel med bristfällig information. I brädspelet Go är brädet med alla stenar hela tiden synligt för spelarna medan man i poker döljer sina kort och dessutom kan bluffa. I ”no-limit”-varianten av Texas Hold’em kan spelarna dessutom satsa hur mycket de vill. Libratus har dock inte utvecklats specifikt som en poker-AI utan är mer generell än så.

”Algoritmerna vi använde är inte pokerspecifika”, förklarar Sandholm. ”Som inmatning tar den spelreglerna och matar sedan ut en strategi.”

Som exempel på mer användbara tillämpningsområden för denna typ av AI nämner Frank Pfenning, chef för institutionen för datavetenskap vid CMU, affärsförhandlingar, militära strategier, cybersäkerhet och planering av medicinsk behandling.

”Datorn kan inte vinna i poker om den inte kan bluffa”, sa Pfenning. ”Att utveckla en AI som kan göra det framgångsrikt är ett enormt steg framåt vetenskapligt och har många tillämpningar. Föreställ dig att din smartphone en dag kommer kunna förhandla fram det bästa priset på en ny bil åt dig. Det är bara början.”

De fyra pokerproffsen som ställde upp mot Libratus – Dong Kim, Jimmy Chou, Daniel McAulay och Jason Les – får som tröst i alla fall dela på totalt 200.000 dollar i prispengar för sin insats. McAulay sa efteråt att Libratus var en tuffare motståndare än han hade förväntat sig, men att det var spännande att spela mot den.

Den som oroar sig för att nätpokern nu är död kan dock lugna sig med att det i dagsläget krävs en enorm superdator för driva Libratus. CMU använde sig av superdatorsystemet Bridges vid Pittsburgh Supercomputing Center som har en beräkningshastighet på 1,35 petaflops/s, vilket är ungefär 7.250 gånger snabbare än en högpresterande laptop. Bridges har dessutom ett RAM-minne på 274 TB (terabyte). Den som vill grotta ner sig i fler tekniska specifikationer kan läsa mer här.

Libratus använde sig av Bridges för att räkna ut en strategi både innan och under pokertävlingen. Den lärde sig dessutom av sina misstag hela tiden och täppte till brister i strategin allt eftersom de mänskliga pokerspelarna upptäckte och utnyttjade dem.

”Varje dag efter att spelandet avslutats analyserade en meta-algoritm vilka hål som proffsen hade identifierat och utnyttjat i Libratus strategi”, berättar Sandholm. ”Den prioriterade sedan hålen och patchade algoritmiskt de tre mest kritiska hålen genom att använda superdatorn varje natt. Detta är väldigt annorlunda mot hur lärande har använts förr i poker. Vanligtvis brukar forskare utveckla algoritmer som försöker utnyttja motståndarens svagheter. I motsats till detta handlar den dagliga förbättringen i detta fall om att algoritmiskt åtgärda hålen i vår egen strategi.”

Uppdatering 11 februari: Engadget har gjort en liten minidokumentär på 11 minuter om Libratus som kan ses här under.

CMU