Prediktion av hårfärg och ögonfärg från genetiska markörer inom forensisk verksamhet
dc.contributor.author | Brenden Linna, Stella | |
dc.contributor.author | Dahlgren, Sophie | |
dc.contributor.author | Duong, David Huynh Thuan | |
dc.contributor.author | Årebo Nettby, Felix | |
dc.contributor.department | Chalmers tekniska högskola / Institutionen för matematiska vetenskaper | sv |
dc.contributor.department | Chalmers University of Technology / Department of Mathematical Sciences | en |
dc.contributor.examiner | Eriksson, Dennis | |
dc.contributor.supervisor | Mostad, Petter | |
dc.date.accessioned | 2025-07-01T08:47:00Z | |
dc.date.issued | 2025 | |
dc.date.submitted | ||
dc.description.abstract | Ett utvecklingsområde inom forensiska verksamheter är DNA-fenotyping, vilket är en teknik för att utifrån DNA kunna predicera visuella egenskaper för en individ. I detta arbete undersöktes hur väl statistiska modeller kan utföra prediktion av ögon- och hårfärg utifrån genetiska markörer i DNA. De modeller som framtogs var logistiska regressionsmodeller som använde en MCMC-metod med en Metropolis-Hastings-algoritm för att uppskatta posteriorifördelningen. Två binära logistiska regressionsmodeller med två olika priorifördelningar jämfördes, en icke-proper likformig priorifunktion och en multinormal priorifunktion. På samma sätt jämfördes två multinomiala logistiska regressionsmodeller med samma två priorifördelningar. Den datamängd som användes i arbetet omfattade ögon- och hårfärg för 85 individer och bestod av observerade färger samt genetiska markörer kopplade till färgerna. De ögonfärger som undersöktes var brun, blå och intermediär, medan de hårfärger som undersöktes var brun, blond, röd och svart. Modellernas prestanda utvärderades genom ROC-grafer (eng: Receiver Operating Characteristic) och tillhörande AUC-värden (eng: Area Under the Curve). Resultatet uppvisade att modellerna överlag hade låga AUC-värden och därmed presterade dåligt. Ingen av modellerna lyckades uppnå ett totalt AUC-värde på över 0,75. Däremot presterade modellerna för prediktion av ögonfärg generellt bättre än modellerna för hårfärg. Det upptäcktes emellertid att modellen för multinomial hårfärg gav bra resultat när det gällde att predicera röd hårfärg med ett AUC-värde på 0,94. En stor begränsning för modellerna som kan ha påverkat resultatet är den begränsade datamängden. Finns det inte tillräckliga skillnader i den givna datamängden över genetiska markörer mellan de olika klasserna av färger får modellen svårt att kunna göra säkra prediktioner. Eftersom alla modeller har stora begränsningar är de i nuläget inte användbara för användning i praktiken, men genom fortsatt forskning skulle liknande statistiska modeller i framtiden kunna användas för mer tillförlitliga prediktioner. | |
dc.identifier.coursecode | MVEX11 | |
dc.identifier.uri | http://hdl.handle.net/20.500.12380/309797 | |
dc.language.iso | swe | |
dc.setspec.uppsok | PhysicsChemistryMaths | |
dc.title | Prediktion av hårfärg och ögonfärg från genetiska markörer inom forensisk verksamhet | |
dc.type.degree | Examensarbete för kandidatexamen | sv |
dc.type.degree | Bachelor Thesis | en |
dc.type.uppsok | M2 |