Automatische toekenning werkwoordstijden
Summary
In dit onderzoek is onderzocht of het mogelijk is om automatisch
werkwoordstijden toe te kennen aan werkwoordscombinaties
uit datasets. Er zijn vijf talen onderzocht: Nederlands,
Spaans, Engels, Frans en Duits. De nadruk lag echter op Nederlands
en Spaans. Er is onderzocht of een beslisboom kon
worden getraind op een dataset en vervolgens worden gevalideerd
op een andere dataset. Een handmatig opgesteld regelgebaseerd
algoritme is gebruikt als basislijn voor het Nederlands
en het Spaans. Uit de resultaten is gebleken dat voor het
Nederlands een percentage kon worden behaald van boven de
90 procent, voor het Spaans rond de 70 procent. Het algoritme
behaalde slechtere resultaten dan het regelgebaseerde
algoritme voor beide talen.