Document Clustering

dc.contributor.authorEbbesson, Magnus
dc.contributor.authorIssal, Christopher
dc.contributor.departmentChalmers tekniska högskola / Institutionen för data- och informationsteknik (Chalmers)sv
dc.contributor.departmentChalmers University of Technology / Department of Computer Science and Engineering (Chalmers)en
dc.date.accessioned2019-07-03T12:27:50Z
dc.date.available2019-07-03T12:27:50Z
dc.date.issued2010
dc.description.abstractCluster analysis is a sub-field in artificial intelligence and machine learning that refers to a group of algorithms that try to find a natural grouping of objects based on some objective metric. In general this problem is hard because a good grouping might be subjective, two expert taxonomists can disagree on what they believe represents reasonable discriminatory features. The methods work directly on the data and are thus contained in the class of unsupervised algorithms contrary to classification algorithms whose bias is based on known classes. This report tries to give an overview to the application of clustering algorithms to text and how data might be processed. Klusteranalys är ett delområde inom artificiell intelligens och maskininlärning som refererar till en grupp av algoritmer som försöker hitta naturliga grupperingar av objekt baserat på dess egenskaper. I allmänhet detta problem är svårt, eftersom en bra gruppering kan vara subjektiv, två experter inom taxonomi kan exmepelvis vara oense om vilka egenskaper de anser vara mest utmärkande. Dessa metoder som arbetar direkt på data och ingår därmed i klassen av oövervakade algoritmer vilka skiljer sig från mot klassificeringsproblemets algoritmer vars preferenser baseras på inlärd information. Denna rapport försöker ge en översikt över tillämpningen av kluster algoritmer till text och hur data kan bearbetas.
dc.identifier.urihttps://hdl.handle.net/20.500.12380/128681
dc.language.isoeng
dc.setspec.uppsokTechnology
dc.subjectDatavetenskap (datalogi)
dc.subjectComputer Science
dc.titleDocument Clustering
dc.type.degreeExamensarbete för masterexamensv
dc.type.degreeMaster Thesisen
dc.type.uppsokH
Ladda ner
Original bundle
Visar 1 - 1 av 1
Hämtar...
Bild (thumbnail)
Namn:
128681.pdf
Storlek:
1.33 MB
Format:
Adobe Portable Document Format
Beskrivning:
Fulltext