Utveckling och utvärdering av en AI-agent baserad på förstärkningsinlärning för problemlösning i spelet Sokoban

Blom, Joacim; Alzein, Mohamad

Utveckling och utvärdering av en AI-agent baserad på förstärkningsinlärning för problemlösning i spelet Sokoban

dc.contributor.author	Blom, Joacim
dc.contributor.author	Alzein, Mohamad
dc.contributor.department	Chalmers tekniska högskola / Institutionen för data och informationsteknik	sv
dc.contributor.department	Chalmers University of Technology / Department of Computer Science and Engineering	en
dc.date.accessioned	2026-06-30T11:49:30Z
dc.date.issued	2026
dc.date.submitted
dc.description.abstract	Detta arbete har genomförts som ett examensarbete vid Chalmers tekniska högskola och behandlar utveckling och utvärdering av en AI-agent baserad på förstärkningsinlärning för problemlösning i spelet Sokoban. Syftet med projektet var att undersöka huruvida olika RL-algoritmer (Reinforcement Learning) såsom PPO, REINFORCE, SARSA och Tabular Q-learning kan lösa problemet, samt att jämföra dessa med varandra och utvärdera hur de presterar. Projektet har implementerats i Python och Unity. SARSA, Tabular Q-learning och REINFORCE tränades i en Python-implementation av Sokoban och kördes på Chalmers superdator Minerva, varefter de tränade modellerna utvärderades i Unity miljön. PPO tränades och utvärderades direkt i Unity med hjälp av ML-Agents ramverket. Resultatet från projektet visar att tabellbaserad algorithmer som SARSA och Ta bular Q-learning inte är tillräckliga för att lösa Sokoban då algoritmerna memorerar lösningarna för tränade kartor och saknar förmågan att generalisera till nya, osedda kartor. REINFORCE, som bygger på ett neuralt nätverk, visade däremot en viss förmåga att lösa problemet givet tillräcklig träning och presterade bättre än SARSA och Q-learning på nya, osedda testkartor. Däremot överträffade den inte en slump mässig agent på dessa kartor, vilket indikerar att modellen inte uppnådde tillräcklig generalisering.
dc.identifier.uri	https://hdl.handle.net/20.500.12380/311686
dc.language.iso	swe
dc.setspec.uppsok	Technology
dc.subject	Sokoban, AI-agent, Reinforcement learning, SARSA, REINFORCE, Q learning, PPO
dc.title	Utveckling och utvärdering av en AI-agent baserad på förstärkningsinlärning för problemlösning i spelet Sokoban
dc.type.degree	Examensarbete på kandidatnivå	sv
dc.type.degree	Bachelor Thesis	en
dc.type.uppsok	M2

Ladda ner

Original bundle

Visar 1 - 1 av 1

Namn:: CSE 26-19 MA JB.pdf
Size:: 1.72 MB
Format:: Adobe Portable Document Format

Ladda ner

License bundle

Visar 1 - 1 av 1

Namn:: license.txt
Size:: 2.35 KB
Format:: Item-specific license agreed upon to submission
Description:

Ladda ner

Samlingar

Examensarbeten för kandidatexamen