Tekst: Vegard Bjørsvik
Foto: Lee Jin-man / Associated Press
I et flombelyst rom fylt med kameraer og pressekorps sitter to personer ved et lite bord dekket av et brettspill. Ved den ene enden av bordet sitter en mann fordypet i egne tanker. På den andre enden sitter en rolig og komfortabel mann med en stor TV-skjerm foran seg. Stedet er Four Seasons-hotellet i Seoul, og spillet som blir spilt er Go: et klassisk strategispill. I likhet med sjakk spilles det på et rutebrett der den ene spilleren bruker hvite brikker, og den andre bruker sorte. Målet er å omringe den andre spillerens brikker.
Sjakk blir ofte sett på som et veldig komplekst og analytisk spill, som utfordrer spilleren til å tenke mange trekk framover. Totalt antall mulige stillinger for alle brikkene i dette spillet ligger på rundt 10120. Go har et mye større brett, med 10174mulige posisjoner for brikkene. Det vil si at det er omtrent 1 million-billion-billion-billion-billioner flere mulige stillinger i Go enn det er i sjakk. Med så mange kombinasjoner av stillinger er det tydelig at det er vanskeligere å finne alle mulige trekk i Go, sammenliknet med sjakk.
Go-kampen
Spillet i Seoul stod mellom Lee Sedol og superalgoritmen AlphaGo. Lee Sedol var på dette tidspunktet regnet som en av verdens beste Go-spillere. AlphaGo var hverken en av verdens beste spillere, eller et menneske. Det var et dataprogram utviklet av selskapet Google. For Lee Sedol skulle dette være en enkel kamp – det tok kun fem minutter fra han fikk utfordringen til han takket ja.
I sjakk hadde maskinene lenge vært seirende over mennesker, men i Go var det fortsatt umulig for maskinene å slå proffe spillere. Dermed kunne mennesket, inntil videre, sitte på tronen som det smarteste og mest strategiske dyret. Det var denne overlegenheten som stod på spill da Lee Sedol skulle spille mot supermaskinen AlphaGo.
Superalgoritmen AlphaGo
Hva skal egentlig til for at en datamaskin skal kunne utfordre mennesker i et strategisk og innviklet spill, slik som Go? Du har kanskje sett sjakkommentatorer snakke om pilen som viser fordel til den ene spilleren over den andre i løpet av et parti. Bak denne pilen ligger kraftige algoritmer, ikke helt ulike AlphaGo’s algoritme. Disse er designet for å finne den beste løsningen til hvert trekk. På samme måte som oss mennesker, lærer AlphaGo å spille Go ved å se på opptak av tidligere kamper. Dette gjør at algoritmen kan være på nivå med mennesker mye raskere enn tidligere algoritmer. Mange av disse ideene har eksistert i over 40 år, så det er ikke akkurat en ny ide, men hvorfor fungerer den først nå?
I sjakk hadde maskinene lenge vært seirende over mennesker, men i Go var det fortsatt umulig for maskinene å slå proffe spillere. Dermed kunne mennesket, inntil videre, sitte på tronen som det smarteste og mest strategiske dyret.
Flere teknologiske gjennombrudd har gjort at maskiner nå kan lære av tidligere hendelser, akkurat som oss mennesker. Dette skyldes at vi i dag har tilgang til kraftigere og raskere maskiner, som klarer å gjøre mange flere utregninger enn det som var mulig for bare noen få år siden. Dermed kan AlphaGo se gjennom alle historiske profesjonelle kamper i Go, og slik lære seg å spille. Likevel finnes det fortsatt ikke nok data fra tidligere kamper til at AlphaGo kan bli så god som den er ved å utelukkende studere andres kamper.
For å kompensere for manglende datasett gjør AlphaGo noe som mange av oss sikkert gjorde som barn: den spiller mot seg selv. AlphaGo simulerer kamper mot forskjellige versjoner av seg selv, og lærer av feilene sine. Slike simuleringer gjør den flere tusen ganger hver dag, og lærer på denne måten å bli bedre enn mennesker.
Kampens vinner
Under den første Go-kampen mellom AlphaGo og et menneske forstod Lee Sedol raskt at kampen var tapt. AlphaGo vant fire av fem runder. At Sedol klarte å vinne én runde mot AlphaGo, har siden vist seg å være en stor bragd. Til nå er dette nemlig den eneste runden et menneske har klart å vinne mot AlphaGo.
Akkurat som i sjakk gikk altså maskinen seirende ut, og viste med dette at maskiner også klarer å vinne over mennesker i mer komplekse spill, slik som spillet Go.