Show simple item record

dc.rights.licenseCC-BY-NC-ND
dc.contributor.advisorAdriaans, F.W.
dc.contributor.authorKersbergen, R.J.
dc.date.accessioned2020-08-10T18:00:18Z
dc.date.available2020-08-10T18:00:18Z
dc.date.issued2020
dc.identifier.urihttps://studenttheses.uu.nl/handle/20.500.12932/36849
dc.description.abstractHet belang van het ontwikkelen van automatische spraakherkenning (ASR) wordt steeds groter. Vooruitgangen in neurale netwerken bieden de mogelijkheid om geavanceerde state-of-the-art spraakherkenningstechnieken toe te passen op spraakemotieherkenning. Emotie komt in het spraaksignaal voor in de vorm van stemkwaliteit, toonhoogte, formantfrequenties en spraaktempo. State-of-the-art Speech Emotion Recognition (SER) in Kaldi wordt geanalyseerd en vergeleken met een nieuw SER-experiment in Python om te ontdekken wat positieve en negatieve effecten heeft op de prestatie van het neuraal netwerk model. De conclusie is dat niet alle emotiecategorieën geschikt zijn als trainings- en testdata, dat perturbatie geschikt is voor data augmentatie, en dat een Time Delay Neural Network (TDNN) LSTM de meest geschikte architectuurontwerp is voor een SER systeem.
dc.description.sponsorshipUtrecht University
dc.format.extent571212
dc.format.mimetypeapplication/pdf
dc.language.isonl
dc.titleEmotieherkenning door Spraakherkenningssoftware
dc.type.contentBachelor Thesis
dc.rights.accessrightsOpen Access
dc.subject.keywordsspraakherkenning, emotie, neuraal netwerk
dc.subject.courseuuTaalwetenschap


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record