Leg uit wanneer een dilemma een “gevangendilemma” is
Leerdoelen
•Je kunt uitleggen wat speltheorie is en welke soorten spellen er zijn.
•Je kunt uitleggen wat een gevangenendilemma is.
•Je kunt uitleggen hoe een dominante strategie ontstaat.
•Je kunt uitleggen waarom een niet-optimale uitkomst het resultaat is van een gevangenendilemma.
Soorten spellen
Speltheorie is de theorie over hoe mensen beslissingen nemen, waarbij ze rekening houden met de mogelijke uitkomsten van de keuzes die anderen maken. Je houdt dus rekening met de mogelijke acties van de ander en de invloed daarvan op je eigen beslissing.
Er zijn verschillende soorten spellen die we kunnen onderscheiden in de speltheorie:
•Simultane spellen of sequentiële spellen: Bij een simultaan spel nemen spelers gelijktijdig hun beslissing. Ze kunnen dus niet op elkaar reageren. Bij een sequentieel spel nemen spelers na elkaar een beslissing, waardoor ze wel op elkaars acties kunnen reageren.
•Eenmalige spellen of herhaalde spellen: Een spel kan eenmalig worden gespeeld, of het kan vaker worden herhaald.
•Coöperatieve spellen of non-coöperatieve spellen: Bij een coöperatief spel kunnen spelers samenwerken en van tevoren afspraken maken over hun strategieën. Bij een non-coöperatief spel kan dit niet. Elke speler kiest zijn eigen beste strategie, puur in zijn eigen belang, maar houdt wel rekening met wat de ander zou kunnen doen.
Het gevangenendilemma
Het gevangenendilemma, ook wel bekend als Prisoner's Dilemma, is een van de bekendste voorbeelden binnen de speltheorie. Het is een situatie of spel waarin een evenwicht ontstaat dat voor alle spelers eigenlijk niet de beste uitkomst is. Hoewel de uitkomst niet optimaal is, wordt deze toch bereikt. Dit type spel is een simultaan, eenmalig en non-coöperatief spel. Dit betekent dat de spelers tegelijk beslissen, het spel maar één keer plaatsvindt en ze niet kunnen overleggen.
Een scenario
Stel je voor: de conrector van een school ontdekt een ernstig misdrijf. De schoolexamens zijn gestolen uit de kluis. Wie heeft dit gedaan en hoe kan hij de schuldige vinden? Na onderzoek komen twee verdachten naar voren: Yoeri en Sara. Yoeri is gezien bij de kluis direct na het alarm, en Sara is betrapt met de zegel van een van de examenveloppen in haar tas.
De conrector verhoort Yoeri en Sara tegelijkertijd, maar in aparte ruimtes. Ze kunnen niet met elkaar overleggen en hebben ook geen kans gehad om elkaar te spreken na de diefstal. Het is overduidelijk dat ze allebei schuldig zijn, maar er is geen sluitend bewijs zonder een bekentenis. De conrector heeft één bekentenis nodig en degene die als eerste bekent, krijgt een mooiere deal aangeboden. De straf die Yoeri en Sara krijgen, hangt af van hun eigen keuze (bekennen of zwijgen) én van de keuze van de ander.
Mogelijke uitkomsten
Laten we de mogelijke scenario's eens bekijken vanuit het oogpunt van Yoeri en Sara:
Als Yoeri zwijgt:
•En Sara zwijgt ook: Ze krijgen allebei twee jaar straf, want er is wel wat bewijs, maar niet veel.
•En Sara bekent: Yoeri krijgt acht jaar straf, terwijl Sara slechts één jaar straf krijgt.
Als Yoeri bekent:
•En Sara zwijgt: Yoeri krijgt één jaar straf, terwijl Sara acht jaar straf krijgt.
•En Sara bekent ook: Ze krijgen allebei vijf jaar straf. Er is geen mooie deal meer, maar wel een beetje strafvermindering voor 'goed gedrag' door te bekennen.
De pay-off matrix lezen
Om de keuzes en uitkomsten overzichtelijk te maken, gebruiken we een pay-off matrix (ook wel strafmatrix genoemd).
Sara bekent | Sara zwijgt | |
Yoeri bekent | 5 jaar, 5 jaar | 1 jaar, 8 jaar |
Yoeri zwijgt | 8 jaar, 1 jaar | 2 jaar, 2 jaar |
In deze tabel is Yoeri de 'rij-speler' (links) en Sara de 'kolom-speler' (boven). Het linker getal in elk vakje staat voor de straf van Yoeri, en het rechter getal voor de straf van Sara. Bijvoorbeeld: als Yoeri bekent en Sara zwijgt, krijgt Yoeri 1 jaar en Sara 8 jaar.
Het oplossen van het dilemma
Om erachter te komen wie zal bekennen en wie zal zwijgen, moeten we het dilemma oplossen door te kijken naar de dominante strategie van elke speler. Een dominante strategie is een strategie die voor een speler altijd de beste keuze is, ongeacht wat de andere speler doet.
De keuzes van Sara
Ze overweegt wat ze moet doen, afhankelijk van wat Yoeri kiest:
•Stel Yoeri bekent: Sara heeft twee opties:
•Zij bekent ook: 5 jaar straf.
•Zij zwijgt: 8 jaar straf. Omdat 5 jaar beter is dan 8 jaar, kiest Sara ervoor om te bekennen.
•Stel Yoeri zwijgt: Sara heeft opnieuw twee opties:
•Zij bekent: 1 jaar straf.
•Zij zwijgt: 2 jaar straf. Omdat 1 jaar beter is dan 2 jaar, kiest Sara ook hier voor bekennen.
Sara heeft dus een dominante strategie: bekennen. Het maakt niet uit wat Yoeri doet, voor Sara is bekennen altijd de beste keuze.
De keuzes van Yoeri
Nu bekijken we Yoeri's keuzes, afhankelijk van wat Sara kiest:
•Stel Sara bekent: Yoeri heeft twee opties:
•Hij bekent ook: 5 jaar straf.
•Hij zwijgt: 8 jaar straf. Omdat 5 jaar beter is dan 8 jaar, kiest Yoeri ervoor om te bekennen.
•Stel Sara zwijgt: Yoeri heeft opnieuw twee opties:
•Hij bekent: 1 jaar straf.
•Hij zwijgt: 2 jaar straf. Omdat 1 jaar beter is dan 2 jaar, kiest Yoeri ook hier voor bekennen.
Yoeri heeft dus ook een dominante strategie: bekennen.
De dominante strategie bepalen
Beide spelers hebben een dominante strategie, namelijk bekennen. Dit betekent dat zowel Yoeri als Sara ervoor zullen kiezen om te bekennen. De uitkomst van het spel is dus dat beide bekennen, en ze allebei vijf jaar straf krijgen. In de pay-off matrix kun je dit soms ook zien aan het aantal 'streepjes' dat in een vakje is gezet onder de jaren, als een methode om het op te lossen. Het vakje waarin de dominante strategieën elkaar kruisen, heeft de grootste voorkeur, zoals aangegeven door de onderstrepingen.
Sara bekent | Sara zwijgt | |
Yoeri bekent | 5 jaar, 5 jaar | 1 jaar, 8 jaar |
Yoeri zwijgt | 8 jaar, 1 jaar | 2 jaar, 2 jaar |
De niet-optimale uitkomst
De uitkomst van het gevangenendilemma, waarbij beide partijen 'bekennen, bekennen' en vijf jaar straf krijgen, is opvallend. Kijk maar eens naar de pay-off matrix: als ze allebei hadden gezwegen, hadden ze allebei maar twee jaar straf gekregen. Dit is een veel betere uitkomst voor beiden. Dit noemen we een suboptimale uitkomst of niet-optimale uitkomst, omdat er een voor beide spelers betere uitkomst mogelijk was geweest.
Waarom zwijgen beter zou zijn
In de situatie van het gevangenendilemma komen Yoeri en Sara niet terecht in de voor hen meest wenselijke situatie (zwijgen, zwijgen), omdat ze allebei hun eigen belang nastreven en niet kunnen communiceren. Ze zijn bang dat de ander bekent en zij de zwaarste straf krijgen (8 jaar). Om dit te voorkomen, kiezen ze er allebei voor om te bekennen, met als gevolg dat ze beiden slechter af zijn dan wanneer ze hadden samengewerkt.
Kenmerken van het gevangenendilemma
Het gevangenendilemma heeft een aantal belangrijke kenmerken:
•geen communicatie mogelijk; spelers kunnen niet overleggen of afspraken maken;
•simultaan spel; beslissingen worden gelijktijdig genomen;
•ieder kiest voor zijn eigen belang; elke speler kiest de optie die voor hemzelf het beste is;
•beide spelers hebben een dominante strategie; dit leidt tot de specifieke uitkomst;
•resulteert in een suboptimale uitkomst; de uiteindelijke uitkomst is niet de best mogelijke voor de spelers samen;
•eenmalige beslissing zonder herhaling; dit maakt samenwerking moeilijker, omdat er geen kans is om van eerdere acties te leren.
Als je moet bepalen of een situatie een gevangenendilemma is, kun je deze kenmerken als check gebruiken.
Kunnen we de optimale uitkomst bereiken?
De optimale uitkomst van 'zwijgen, zwijgen' (2 jaar straf voor beiden) wordt in het klassieke gevangenendilemma niet bereikt. Er zijn echter situaties waarin dit wel kan. Als het spel bijvoorbeeld herhaald wordt, kunnen spelers van eerdere acties van hun tegenspelers leren. Als Yoeri en Sara na hun straf opnieuw samen een misdaad plegen en weer in deze situatie terechtkomen, zouden ze kunnen leren dat zwijgen toch tot een betere uitkomst leidt.













