Tidig karaktärisering av stroke genom videoanalys, maskininlärning och ögonspårning

Typ
Examensarbete på kandidatnivå
Bachelor Thesis
Program
Publicerad
2024
Författare
Ollila, Samuel
Ström, Eddie
Khatiri, Robin
Svensson, Teodor
Westerberg, Jacob
Modellbyggare
Tidskriftstitel
ISSN
Volymtitel
Utgivare
Sammanfattning
Stroke är en ledande orsak till dödlighet och funktionsnedsättning globalt. Snabb och tillförlitlig diagnos är avgörande för att optimera behandlingen, öka patientsäkerheten och rädda liv. Detta projekt syftar till att använda maskininlärningsalgoritmer för att bedöma misstänkta strokefall genom att tillämpa dem på data från ögonspårning genom videoanalys. Målet och det avsedda resultatet är att potentiellt förbättra effektiviteten i prehospital vård. National Institutes of Health Stroke Scale (NIHSS) är en skala som traditionellt har används för att klassificera stroke. Genom att digitalisera NIHSS och använda den som en mall för att identifiera ögonrörelseavvikelser, en vanlig indikator på stroke, hoppas man uppnå detta. I denna studie, på grund av bristen på patientdata, skapades en hybrid datamängd innehållande både verklig och syntetiska data. De verkliga videorna (n=99) bestod av friska individer som simulerade blickförlamning i enlighet med NIHSS-riktlinjerna. De syntetiska datan var nödvändig eftersom vissa ögonrörelser, som när en patient har problem med kranialnerv tre, är mycket svår att härma. Därför användes digitala animationsverktyg (Blender och After Effects) för att skapa videor med syntetiska ansiktet (n=65) som simulerar dessa symtom. Den riktiga datamängden validerades sedan av en strokespecialist. De algoritmer som valdes för att tolka de kombinerade datamängderna var convolutional neural networks (CNN), deep neural networks (DNN), gated recurrent units (GRU), support vector machines (SVM) and long short-term memory networks (LSTM). En hybrid datamängd utökade mängden träningsdata, en avgörande faktor för att förbättra tillförlitligheten hos alla maskininlärningsmodeller. LSTM uppnådde det bästa övergripande resultatet i studien och visade en noggrannhet på 88%, en känslighet på 87,7%, en specificitet på 94,1% och ett F1-värde på 86,7%, vilket understryker dess framtida potential som ett tillförlitligt diagnostiskt verktyg i prehospital miljö. Sammanfattningsvis visar resultaten att tillämpningen av maskininlärning och videoanalys för att digitalisera och klassificera strokeinducerade ögonrörelser erbjuder betydande fördelar. Denna teknik har potential att förändra och fungera som ett effektivt komplement till traditionella metoder för strokebedömning. Innan dessa tekniker kan implementeras i praktiken krävs dock ytterligare forskning och förfining av metoderna.
Beskrivning
Ämne/nyckelord
Citation
Arkitekt (konstruktör)
Geografisk plats
Byggnad (typ)
Byggår
Modelltyp
Skala
Teknik / material
Index