Maskininlärningsmetoder tillämpade påStarCraft 2 - En undersökning av reinforcement och imitation learning

BERGQVIST, JONATHAN; CLAESSON, CARL; ELIASSON, PONTUS; GRANDÉN, ADAM; LAM, EDVIN; LUNDBERG, ARVID

Maskininlärningsmetoder tillämpade påStarCraft 2 - En undersökning av reinforcement och imitation learning

Ladda ner

DATX02-19-03 Uppladdad i 360.pdf (2.57 MB)

Publicerad

2019

Författare

Typ

Examensarbete på kandidatnivå

Sammanfattning

Inom artificiell intelligens, som kontinuerligt utvecklas, har maskininlärning tagit en cen-tral roll. Medan regelbaserad AI varit tillräcklig för att lösa grundläggande uppgifter be-höver dagens utmaningar mer avancerade metoder. Arbetet undersöker olika tekniker föratt utveckla avancerad artificiell intelligens till spelet StarCraft 2, och jämför dem motvarandra. Totalt utvecklades tre agenter. De första två baserades på en reinforcementlearning-metod kallad Advantage Actor Critic (A2C) där den andra även inkluderade imi-tation av en interaktiv expertpolicy. Den tredje var en behavioral cloning-agent (BC), somär en sorts imitation learning, tränad på en datamängd förgenererad av en expertpoli-cy. A2C med imitation resulterade i den högsta vinstandelen på 73,4 % mot den svårainbyggda AI:n medan BC-agenten enbart uppnådde en vinstandel på 17 %. Den grund-läggande A2C-agenten kunde enbart vinna mot den mycket lätta AI:n. Slutsatsen är attde agenter som använde sig av imitation learning presterade bättre än den som enbart an-vände reinforcement learning, möjligtvis på grund av en otillräcklig implementering avA2C.

URI

https://hdl.handle.net/20.500.12380/301900

Samlingar

Examensarbeten för kandidatexamen

Visa fullständig post

Maskininlärningsmetoder tillämpade påStarCraft 2 - En undersökning av reinforcement och imitation learning

Ladda ner

Publicerad

Författare

Typ

Program

Modellbyggare

Tidskriftstitel

ISSN

Volymtitel

Utgivare

Sammanfattning

Beskrivning

Ämne/nyckelord

Citation

Arkitekt (konstruktör)

Geografisk plats

Byggnad (typ)

Byggår

Modelltyp

Skala

Teknik / material

Index

URI

Samlingar

item.page.endorsement

item.page.review

item.page.supplemented

item.page.referenced