Emotieherkenning door Spraakherkenningssoftware

dc.rights.license	CC-BY-NC-ND
dc.contributor.advisor	Adriaans, F.W.
dc.contributor.author	Kersbergen, R.J.
dc.date.accessioned	2020-08-10T18:00:18Z
dc.date.available	2020-08-10T18:00:18Z
dc.date.issued	2020
dc.identifier.uri	https://studenttheses.uu.nl/handle/20.500.12932/36849
dc.description.abstract	Het belang van het ontwikkelen van automatische spraakherkenning (ASR) wordt steeds groter. Vooruitgangen in neurale netwerken bieden de mogelijkheid om geavanceerde state-of-the-art spraakherkenningstechnieken toe te passen op spraakemotieherkenning. Emotie komt in het spraaksignaal voor in de vorm van stemkwaliteit, toonhoogte, formantfrequenties en spraaktempo. State-of-the-art Speech Emotion Recognition (SER) in Kaldi wordt geanalyseerd en vergeleken met een nieuw SER-experiment in Python om te ontdekken wat positieve en negatieve effecten heeft op de prestatie van het neuraal netwerk model. De conclusie is dat niet alle emotiecategorieën geschikt zijn als trainings- en testdata, dat perturbatie geschikt is voor data augmentatie, en dat een Time Delay Neural Network (TDNN) LSTM de meest geschikte architectuurontwerp is voor een SER systeem.
dc.description.sponsorship	Utrecht University
dc.format.extent	571212
dc.format.mimetype	application/pdf
dc.language.iso	nl
dc.title	Emotieherkenning door Spraakherkenningssoftware
dc.type.content	Bachelor Thesis
dc.rights.accessrights	Open Access
dc.subject.keywords	spraakherkenning, emotie, neuraal netwerk
dc.subject.courseuu	Taalwetenschap