Populatie en proportie
Populatie verwijst naar een gehele groep die je onderzoekt, bijvoorbeeld alle inwoners van Nederland. Hieruit kun je delen selecteren waarvoor bepaalde dingen gelden, bijvoorbeeld alle Nederlanders die in een koophuis wonen; deze delen noemen we een proportie. Populatie en proportie zijn dus belangrijke statistische termen.
Steekproef
Omdat je niet altijd de hele populatie kunt onderzoeken, neem je soms een steekproef. Dat is een deel van de populatie, dat representatief moet zijn: het moet lijken op de totale populatie en aselect gekozen zijn, iedereen in de populatie moet evenveel kans hebben om in de steekproef terecht te komen. Daarnaast moet de steekproef voldoende groot zijn. Dit geeft ons de kans om metingen uit te voeren en wat te zeggen over de hele populatie.
Centrummaten
Centrummaten zijn metingen die je kunt gebruiken om iets te weten te komen over je gegevens. Je kent waarschijnlijk al het gemiddelde, de modus en de mediaan.
•Gemiddelde: dit bereken je door alle waarden bij elkaar op te tellen, en vervolgens te delen door het aantal waarden.
•Modus: dit is de waarde die het meeste voorkomt in je dataset. Stel je een grafiek of diagram voor waarbij de hoogste balk de modus toont.
•Mediaan: dit is de middelste waarde als je je gegevens in volgorde zet van klein naar groot.
Soorten variabelen
We kunnen ook onderscheid maken tussen verschillende soorten variabelen. Een variabele is iets wat je nog niet weet, dus wat variabel is.
•Kwalitatieve variabelen: Deze geven kenmerken weer. Ze hoeven niet noodzakelijkerwijs in getallen uitgedrukt te zijn, denk bijvoorbeeld aan kleuren. Er zijn twee soorten kwalitatieve variabelen: nominaal en ordinaal.
Nominaal: Deze variabelen geven namen weer, zoals katten, honden, en knaagdieren in een dierenopvang. Ze kunnen niet geordend of met elkaar vergeleken worden.
Ordinaal: Deze variabelen geven wel een bepaalde orde aan, zoals kledingmaten (S, M, L, XL). Je weet alleen niet precies hoeveel groter M is dan S, enzovoort.
•Kwantitatieve variabelen: Deze geven aantallen weer en worden altijd in getallen uitgedrukt. Ze kunnen verdeeld worden in discreet en continu.
Discreet: Dit zijn losse waarden. Je kunt bijvoorbeeld denken aan het aantal mensen in een kamer (30 of 31, er is niets tussen).
Continu: Dit zijn waarden die altijd meer of minder kunnen zijn, zoals gewicht op een weegschaal. Elke twee meetwaarden kunnen altijd een andere meetwaarde tussenliggen.