Een lerende strategie gebruikmakend van Markov modellen om te gebruiken in de herhaalde vorm van bimatrix spelen

Haan, I. de

dc.rights.license	CC-BY-NC-ND
dc.contributor.advisor	Vreeswijk, G.A.W.
dc.contributor.author	Haan, I. de
dc.date.accessioned	2018-08-03T17:01:30Z
dc.date.available	2018-08-03T17:01:30Z
dc.date.issued	2018
dc.identifier.uri	https://studenttheses.uu.nl/handle/20.500.12932/30113
dc.description.abstract	Het doel van het onderzoek was het ontwerpen en testen van een nieuwe lerende strategie voor in herhaalde bimatrix spelen. Er zijn al lerende strategie¨en gemaakt voor in herhaalde bimatrix spelen maar deze behalen niet altijd optimale resultaten. Hierom hebben wij een nieuwe lerende strategie ontworpen genaamd de markov-learner die gebruik maakt van een Markov model. In dit onderzoeksverslag wordt eerst uitgelegd wat bimatrix spelen zijn, om daarna specifiek te kijken naar het prisoners dilemma. Hierna worden de twee lerende strategie¨en uitgelegd. Hierna wordt uitgelegd wat een Markov model is om daarna deze kennis te gebruiken om de zelf ontworpen strategie uit te leggen. Hierna volgt een methodesectie en de bespreking van de gevonden resultaten. De methode bestond uit het testen van twee al eerder omschreven lerende strategie¨en, namelijk fictitous play en reinforcement learning, samen met de zelf ontworpen markov-learner strategie. Deze strategie¨en zijn onderling vergeleken door ze paarsgewijs en met zichzelf de herhaalde vorm van het prisoners dilemma te spelen. Het gevonden resultaat van het experiment was dat de ontworpen markov-learner een constante, relatief hoge opbrengst bereikte wanneer het tegen zichzelf de herhaalde vorm van het prisoners dilemma speelde in vergelijking met andere tegen elkaar spelende strategie paren. Verder onderzoek zal nodig zijn om de mogelijkheden en het gedrag van de markovlearner volledig te doorgronden.
dc.description.sponsorship	Utrecht University
dc.format.extent	244127
dc.format.mimetype	application/pdf
dc.language.iso	nl
dc.title	Een lerende strategie gebruikmakend van Markov modellen om te gebruiken in de herhaalde vorm van bimatrix spelen
dc.type.content	Bachelor Thesis
dc.rights.accessrights	Open Access
dc.subject.courseuu	Kunstmatige Intelligentie

Files in this item

Name:: Scriptie Ivar de Haan.pdf
Size:: 238.4Kb
Format:: PDF

View/Open

This item appears in the following Collection(s)

Theses

Show simple item record