Maskininlärningsmetoder tillämpade påStarCraft 2 - En undersökning av reinforcement och imitation learning

Typ
Examensarbete på kandidatnivå
Program
Publicerad
2019
Författare
BERGQVIST, JONATHAN
CLAESSON, CARL
ELIASSON, PONTUS
GRANDÉN, ADAM
LAM, EDVIN
LUNDBERG, ARVID
Modellbyggare
Tidskriftstitel
ISSN
Volymtitel
Utgivare
Sammanfattning
Inom artificiell intelligens, som kontinuerligt utvecklas, har maskininlärning tagit en cen-tral roll. Medan regelbaserad AI varit tillräcklig för att lösa grundläggande uppgifter be-höver dagens utmaningar mer avancerade metoder. Arbetet undersöker olika tekniker föratt utveckla avancerad artificiell intelligens till spelet StarCraft 2, och jämför dem motvarandra. Totalt utvecklades tre agenter. De första två baserades på en reinforcementlearning-metod kallad Advantage Actor Critic (A2C) där den andra även inkluderade imi-tation av en interaktiv expertpolicy. Den tredje var en behavioral cloning-agent (BC), somär en sorts imitation learning, tränad på en datamängd förgenererad av en expertpoli-cy. A2C med imitation resulterade i den högsta vinstandelen på 73,4 % mot den svårainbyggda AI:n medan BC-agenten enbart uppnådde en vinstandel på 17 %. Den grund-läggande A2C-agenten kunde enbart vinna mot den mycket lätta AI:n. Slutsatsen är attde agenter som använde sig av imitation learning presterade bättre än den som enbart an-vände reinforcement learning, möjligtvis på grund av en otillräcklig implementering avA2C.
Beskrivning
Ämne/nyckelord
Citation
Arkitekt (konstruktör)
Geografisk plats
Byggnad (typ)
Byggår
Modelltyp
Skala
Teknik / material