OpenAI kan nu besegra hela Dota 2-lag – spelar 180 år om dagen

Foto: OpenAI via YouTube

För ungefär ett år sedan lyckades en AI från Elon Musks OpenAI besegra världens bästa Dota 2-spelare i en livesänd match. Deras AI klarade då bara av att spela en-mot-en-matcher (1v1), men har nu vidareutvecklats så den även klarar av 5v5-matcher med hela femmannalag.

Den nya AI:n heter OpenAI Five och har precis som 1v1-varianten lärt sig helt och hållet genom att spela en mängd matcher mot sig själv, utan data från matcher där människor spelar. OpenAI Five använder sig av en ny klass av RL (Reinforcement Learning) kallad PPO (Proximal Policy Optimization) som nu blivit den nya standarden hos OpenAI och beskrivs som överlägsen de bästa metoderna idag, samtidigt som den är mycket enklare att implementera och ställa in.

I dagsläget klarar OpenAI Five av att besegra Dota 2-lag på amatörnivå med vissa begränsningar satta. Målet är dock att kunna slå proffslagen under årets upplaga av Dota 2-turneringen The International i slutet av augusti. OpenAI Five spelar motsvarade 180 år av matcher mot sig själv varje dag. Redan den 28 juli kommer man dock kunna se en livesänd match på Twitch där OpenAI Five ska gå en match mot toppspelare i Dota 2. För att driva denna uppskalade PPO krävs riktigt fet hårdvara i form av 256 Nvidia Tesla P100-GPU:er och 128.000 CPU-kärnor via Google Cloud Platform.

Det skulle innebära en stor milstolpe med en AI som klarar av att besegra de bästa människorna i såpass komplexa MOBA-datorspel som Dota 2 och OpenAI hoppas att denna typ av AI-system kommer vara såpass generella att de sedan även kan användas i tillämpningar utanför spelvärlden. För fler detaljer om hur OpenAI Five fungerar finns ett matigt blogginlägg att läsa på länken nedan.

Open AI Five