Wat is een boxplot en welke waarden gebruiken we om een boxplot te tekenen?
Wat is een boxplot?
Een boxplot is een speciaal soort diagram dat de spreiding van waarnemingsgetallen van een groep weergeeft. In een boxplot maken we gebruik van verschillende waarden: het laagste en hoogste waarnemingsgetal, het eerste kwartiel (Q1), het derde kwartiel (Q3) en de mediaan (Q2). Als dit klinkt als wiskundige abracadabra, vrees niet! We gaan dit stapsgewijs doorlopen.
Hoe bereken je een boxplot?
Om de concepten achter de boxplot echt te begrijpen, nemen we een voorbeeld. Stel je voor, we hebben in een klas gevraagd hoeveel paar schoenen iedereen heeft en de resultaten in een tabel gezet.

Voor het tekenen van de boxplot, hebben we de volgende getallen nodig;
•het laagste getal (2);
•het hoogste getal (10);
•de kwartielen Q1, Q2 en Q3.
De mediaan (Q2) bepalen
We beginnen met het vinden van de mediaan, Q2. We berekenen dit door de totale frequentie te nemen en deze door 2 te delen. In ons voorbeeld:
•tellen we de frequenties op (6+6+4+2+1) en komen we op 25.
•De helft van 25 is 12,5, maar omdat we werken met een lijst van getallen, ronden we dit af naar het dichtstbijzijnde gehele getal: 13.
•Het dertiende getal is onze mediaan.
•Eerste 6 getallen zijn 2, 6 getallen daarna zijn 3, het 13e getal is dus 4.
Q1 en Q3 berekenen
Voor het berekenen van Q1, kijken we naar de eerste helft van de getallen (de getallen vóór de mediaan).
•Omdat er 12 (6 bij 2 en 6 bij 3) getallen staan in deze eerste helft (een even aantal), hebben we twee 'middelste' getallen: het zesde en zevende getal. Deze tellen we op en delen door 2 om het gemiddelde te berekenen. Dit gemiddelde is onze Q1. Dus (2 + 3) / 2 = 2,5.
•We volgen dezelfde werkwijze om Q3 te bepalen, maar dit keer kijken we naar de tweede helft van onze getallen (de getallen na de mediaan). Dan gaat het om het 19e en 20e getal. (5 + 5) / 2 = 5.

Hoe teken je een boxplot?
Nu we alle benodigde getallen hebben, is het tijd om de boxplot te tekenen.
•Beginnen met een horizontale as waarop we getallen noteren van het laagste (2) tot het hoogste (10) waarnemingsgetal.
•Vervolgens tekenen we verticale strepen bij elk van de belangrijke getallen die we hebben berekend: het laagste getal, Q1, de mediaan, Q3 en het hoogste getal.

Deze visuele weergave van gegevens geeft een schat aan informatie. Het is een effectieve manier om de spreiding en symmetrie van de data te begrijpen. Daarnaast kunnen we ook outliers detecteren met een boxplot.













