DeepMinds AI AlphaStar besegrade två StarCraft 2-proffs med 10-0: ”It was superhuman”

I fjärde matchen attackerade AlphaStar MaNas mycket starkare enheter med Stalkers från tre håll samtidigt.

I slutet av 2016 meddelade DeepMind att de börjat utveckla en AI som ska lära sig spela StarCraft. Nu, drygt två år senare, är AI:n så bra att den för första gången har besegrat två StarCraft 2-proffs i två separata matcher.

Efter att DeepMinds AI AlphaGo lyckades besegra världsmästaren i Go gick de vidare med realtidsstrategispelet StarCraft 2, som är ett betydligt svårare spel att bemästra. Till skillnad från schack och Go är informationen i spel som StarCraft ofullständig, eftersom hela spelplanen inte kan ses hela tiden, och dragen måste dessutom ske i realtid.

DeepMinds nya AI heter AlphaStar och har tränats i vad som kallas AlphaStar League. Det innebär i korthet att AI-agenterna i grunden utgår från riktiga matcher som de har studerat, men därefter spelar de matcher mot sig själva tills de blir bättre och bättre. De fem agenter som presterade bäst valdes ut för att spela fem matcher mot StarCraft 2-proffset Dario ”TLO” Wünsch från Team Liquid, då han besökte DeepMind i december förra året.

Matcherna som spelades var Protoss vs. Protoss på kartan Catalyst LE. Detta var inte optimalt för TLO som normalt spelar som Zerg-rasen. Han hade dock spelat 100 matcher som Protoss inför mötet med AlphaStar. Det hela slutade dock med att AlphaStar krossade motståndet och vann med 5-0.

Därför bestämde sig DeepMind för att ge AlphaStar lite hårdare motstånd och bjöd in TLO:s lagkamrat Grzegorz ”MaNa” Komincz, som är professionell Protoss-spelare och enligt egen utsago har spelat StarCraft 2 sen han var fem år. Inför detta tränades dessutom AlphaStar i ytterligare en vecka, vilket gjorde stor skillnad då beteendet i matcherna uppfattades som mycket mer mänskligt.

En visualisering av AI-agenten under en match mot MaNa. ”Outcome Prediction” visar hur stor chans AlphaStar bedömer att den har att vinna matchen.

SE ÄVEN: DeepMind och Blizzard öppnar upp StarCraft II för AI-forskning

Även här slutade det dock med storslam för AlphaStar som vann med 5-0. På skärmdumpen nedan kan ni se hur det såg ut när AlphaStar i den fjärde matchen attackerade MaNa från tre håll samtidigt med Stalkers. ”It was superhuman”, konstaterade e-sportkommentatorn Dan ”Artosis” Stemkoski efteråt.

En faktor som är viktig i ett realtidsstrategispel som StarCraft 2 är APM (Actions Per Minute) och för att AlphaStar inte skulle kunna vinna på omänskligt hög APM hade DeepMind strypt denna så den låg under snittet för en mänsklig proffsspelare (280 APM i snitt under matcherna mot TLO och MaNa). Dock hade AlphaStar en liten fördel genom att den kunde se hela den upptäckta kartan samtidigt, istället för att behöva hoppa runt med kameran som vanliga spelare måste.

Därför togs ytterligare en ny version av AlphaStar fram för en avslutande livesänd match mot MaNa. Denna gång hade man lärt AI:n använda kameran på samma sätt som mänskliga spelare gör, men tränat upp den till en nivå som skulle matcha den tidigare AI-agenten. Matchen slutade dock med vinst för MaNa till sist, som lyckades utnyttja vissa brister hos AlphaStar.

De intressantaste matcherna kan ses i videon ovan, som sändes på DeepMinds YouTube-kanal under kvällen. Samtliga elva matcher kan laddas ner från DeepMinds webbsida, för de StarCraft 2-spelare som vill lära sig av AlphaStars innovativa spelstil. Många matcher vanns nämligen genom att AlphaStar använde sig av strategier som StarCraft 2-proffsen aldrig tänkt på.

Det långsiktiga målet för DeepMind är att få fram en generell AI som kan lösa verkliga problem, som till exempel idag obotliga sjukdomar. Då är det sannerligen lovande med en AI som kan tänka utanför boxen och hitta nya lösningar och samband som de bästa forskarna aldrig har tänkt på.