Maskininlärningstekniker för bildigenkänning
Publicerad
Typ
Examensarbete för kandidatexamen
Bachelor Thesis
Bachelor Thesis
Program
Modellbyggare
Tidskriftstitel
ISSN
Volymtitel
Utgivare
Sammanfattning
Dagens datorer är mer avancerade är någonsin och besitter kunskapen om att klassificera en bild med hjälp av matematiska metoder. Bildigenkänning används inom ett flertal områden, bland annat sjukvården och rättsväsendet. Syftet med arbetet var att analysera matematiska metoder inom bildigenkänning var för sig och slutligen kombinera dem för optimering. Me toderna som undersöktes var singulärvärdesuppdelning (SVD), principialkomponentsanalys (PCA) och neurala nätverk (NN). SVD är en matrisfaktorisering som används inom kom primering av bilder, medan PCA och NN är maskininlärningstekniker som används inom klassificering av bilder. PCA bygger på SVD, medan NN är inspirerad av nervcellerna i den mänskliga hjärnan. Undersökningen gjordes genom att applicera maskininlärningsteknikerna på databasen MNIST handwritten digits. Implementationen programmerades i Python där biblioteksram verket PyTorch användes. Analysen av PCA gjordes med avseende på parametrarna antalet tränings bilder, reduceringgrad och trunkeringsgrad. För att kunna jämföra metoderna och erhålla ett tillförlitligt resultat definierades ett linjärt nätverk som användes till alla kombi neringar. Ett konvolutionellt nätverk användes som referens vid jämförelse av metoderna och tränades på originalbilder. Det linjära neurala nätverket tränades på originalbilder, trunkerad PCA på originalbilder, poängvektor, Uk och V T k . Arbetets slutsats kring resultaten visade att de etablerade metoderna gav en hög och tillför litlig träffsäkerhet. Vid kombineringen av metoderna var poängvektorn från PCA tillsammans med NN den mest lyckade.