Wat bestudeert speltheorie?
Leerdoelen
•Je kunt uitleggen wat speltheorie is en welke soorten spellen er zijn.
•Je kunt uitleggen wat een gevangenendilemma is.
•Je kunt uitleggen hoe een dominante strategie ontstaat.
•Je kunt uitleggen wat een Nash-evenwicht is.
•Je kunt uitleggen waarom een niet-optimale uitkomst het resultaat is van een spel.
Wat is speltheorie?
Speltheorie is de tak van de economie die onderzoekt hoe mensen keuzes maken, rekening houdend met de mogelijke keuzes van anderen. In speltheorie gaan we ervan uit dat mensen rationeel handelen en daarbij proberen hun eigen belang te maximaliseren. In de economie zien we keuzes die gaan over tijd en geld, waarbij spelers beslissingen nemen die hun uitkomsten beïnvloeden. De theorie analyseert strategische situaties waarin de uitkomst voor een speler niet alleen afhangt van de eigen keuze, maar ook van de keuzes van anderen.
Soorten spellen
Er zijn verschillende manieren om spellen te categoriseren binnen de speltheorie:
•Simultane spellen: hierbij nemen de spelers hun beslissing gelijktijdig, zonder te weten wat de ander kiest.
•Sequentiële spellen: bij deze spellen nemen de spelers na elkaar een beslissing, waardoor ze kunnen reageren op de keuzes van anderen.
•Eenmalige spellen: het spel wordt slechts één keer gespeeld.
•Herhaalde spellen: het spel wordt meerdere keren gespeeld, waardoor spelers van eerdere rondes kunnen leren.
•Coöperatieve spellen: spelers kunnen samenwerken en afspraken maken over hun strategieën.
•Non-coöperatieve spellen: spelers kunnen niet samenwerken. Iedere speler kiest de strategie die het beste is voor zichzelf, rekening houdend met de strategie van anderen.
Het gevangenendilemma
Het gevangenendilemma is een van de bekendste spellen in de speltheorie. Het gaat om een situatie waarin twee spelers een keuze moeten maken, maar de uitkomst voor beide spelers niet optimaal is, ondanks dat ze rationeel handelen. Het is een simultaan, eenmalig en non-coöperatief spel, waarbij de spelers niet kunnen communiceren en ieder voor zijn eigen belang kiest. De uitkomst van dit spel is vaak een suboptimale situatie.
Het verhaal van Yoeri en Sara
Stel je voor: op een middelbare school is een schoolexamen gestolen. De conrector heeft twee verdachten: Yoeri, die in de buurt van de kluis werd gezien, en Sara, die betrapt werd met de zegel van een examen-envelop in haar tas. Het is duidelijk dat ze schuldig zijn, maar er is geen sluitend bewijs zonder een bekentenis.
De conrector verhoort Yoeri en Sara tegelijkertijd, in aparte kamers, zonder dat ze met elkaar kunnen overleggen. Ze hebben de keuze om te zwijgen of te bekennen, en de straf die ze krijgen is afhankelijk van hun eigen keuze én die van de ander.
Hier zijn de mogelijke uitkomsten:
•Optie 1: Yoeri zwijgt.
•Als Sara ook zwijgt, krijgen ze allebei twee jaar straf. Er is wel wat bewijs, maar niet genoeg voor een zware veroordeling.
•Als Sara bekent, krijgt Yoeri acht jaar straf, omdat hij weigert mee te werken. Sara krijgt de 'deal' en slechts één jaar straf.
•Optie 2: Yoeri bekent.
•Als Sara zwijgt, krijgt Yoeri de mooie deal van de conrector en slechts één jaar straf. Sara krijgt dan acht jaar.
•Als Sara ook bekent, krijgen ze allebei geen deal en allebei vijf jaar straf. Ze krijgen dan wel een kleine strafvermindering voor 'goed gedrag' (bekennen), maar niet de complete deal.
Voor Sara gelden precies dezelfde opties en straffen als voor Yoeri.

Het oplossen van het dilemma
Om het dilemma op te lossen, bekijken we de dominante strategie, de strategie die een speler altijd kiest omdat die de speler de beste uitkomst oplevert, ongeacht wat de andere speler doet.
•Als Yoeri bekent, moet Sara kiezen tussen bekennen (5 jaar) of zwijgen (8 jaar). Haar beste optie is bekennen (5 jaar).
•Als Yoeri zwijgt, moet Sara kiezen tussen bekennen (1 jaar) of zwijgen (2 jaar). Ook hier kiest Sara voor bekennen (1 jaar).
Haar dominante strategie is dus bekennen. Dit geldt ook voor Yoeri, omdat hij in beide gevallen kiest voor bekennen, aangezien dit voor hem altijd de beste uitkomst oplevert (1 jaar is beter dan 2 jaar, en 5 jaar is beter dan 8 jaar).

Het Nash-evenwicht
Het Nash-evenwicht is de combinatie van strategieën waarbij geen enkele speler zijn uitkomst kan verbeteren door een andere keuze te maken, gegeven de keuze van de andere speler. In het geval van het gevangenendilemma is het Nash-evenwicht bereikt wanneer beide spelers bekennen. Dit resulteert in beide spelers die vijf jaar straf krijgen, wat een suboptimale uitkomst is. De optimale uitkomst zou zijn dat beide spelers zwijgen en zo slechts twee jaar straf krijgen. Het Nash-evenwicht laat zien dat zelfs als beide spelers rationeel handelen en hun eigen belang maximaliseren, de uitkomst niet optimaal is voor beide.
Kenmerken van het gevangenendilemma
Het gevangenendilemma heeft een aantal specifieke kenmerken:
•Geen communicatie mogelijk: spelers kunnen niet overleggen of afspraken maken.
•Simultaan spel: beide spelers nemen hun beslissing gelijktijdig.
•Keuze voor eigen belang: iedere speler kiest wat voor hem persoonlijk het beste is.
•Beide spelers hebben een dominante strategie: dit leidt tot het specifieke resultaat van het dilemma.
•Suboptimale uitkomst: het Nash-evenwicht is niet de beste uitkomst voor beide spelers samen.
•Eenmalige beslissing: er is geen kans om van eerdere interacties te leren.
De zoektocht naar een optimale uitkomst
In het gevangenendilemma is de uitkomst van vijf jaar straf voor beide spelers suboptimaal. De beste uitkomst zou zijn als beide spelers zwijgen en slechts twee jaar straf krijgen. Hoe zou die optimale uitkomst toch bereikt kunnen worden? Dit zou mogelijk zijn door het spel te herhalen. Als de spelers, nadat ze hun straf hebben uitgezeten, opnieuw in dezelfde situatie komen, kunnen ze van eerdere ervaringen leren en misschien samenwerken. Dit laat zien hoe herhaling van het spel kan leiden tot een andere, meer coöperatieve uitkomst.













