Wat is een fout van de eerste soort en hoe bereken je het kritieke gebied?

Wat is een fout van de eerste soort en hoe bereken je het kritieke gebied?

Wiskunde BWiskunde B

Wat is een fout van de eerste soort en hoe bereken je het kritieke gebied?

Ik ben bezig met statistiek voor school en ik snap niet goed wat een fout van de eerste soort precies inhoudt. Ook wil ik graag weten hoe ik het kritieke gebied moet berekenen bij een hypothesetoets, vooral als het gaat om een tweezijdige toets met een binomiale verdeling, zoals in de voorbeelden die we hebben behandeld met een steekproefomvang van n=100n=100, een kans van p=0.3p=0.3 en een significantieniveau van α=0.05\alpha=0.05. Kun je me dit stap voor stap uitleggen?

Antwoord van Ainstein

Een fout van de eerste soort (ook wel α\alpha-fout genoemd) treedt op wanneer je de nulhypothese (H0H_0) verwerpt, terwijl deze in werkelijkheid waar is. Dit betekent dat je onterecht concludeert dat er een effect of verschil is, terwijl dit in feite niet zo is. De kans op een fout van de eerste soort is gelijk aan het significantieniveau α\alpha.

Het kritieke gebied is het bereik van waarden voor de toetsingsgrootheid waarbij je de nulhypothese verwerpt. De manier waarop je het kritieke gebied berekent, hangt af van of de toets eenzijdig of tweezijdig is.

1. Kritieke gebied bij een eenzijdige toets (voorbeeld met dobbelsteen): Bij een eenzijdige toets zoek je naar afwijkingen in één specifieke richting (bijvoorbeeld alleen 'groter dan' of alleen 'kleiner dan'). Stel, je hebt een nulhypothese H0:p=16H_0: p = \frac{1}{6} en een alternatieve hypothese H1:p>16H_1: p > \frac{1}{6} (de dobbelsteen komt te vaak op de krokodil met kiespijn). Je hebt n=50n=50 worpen en een significantieniveau α=0.05\alpha = 0.05. De toetsingsgrootheid XX volgt een binomiale verdeling XB(50,16)X \sim B(50, \frac{1}{6}).

Om het kritieke gebied te bepalen, zoek je de kleinste waarde kk waarvoor de kans op kk of meer successen (onder de aanname dat H0H_0 waar is) kleiner of gelijk is aan het significantieniveau: P(Xkp=16)0.05P(X \ge k | p = \frac{1}{6}) \le 0.05

Dit kun je ook schrijven als: 1P(Xk1p=16)0.051 - P(X \le k-1 | p = \frac{1}{6}) \le 0.05 of P(Xk1p=16)0.95P(X \le k-1 | p = \frac{1}{6}) \ge 0.95

Met een rekenmachine zoek je de waarde van k1k-1 waarbij de cumulatieve kans voor het eerst 0.95 of hoger is:

  • P(X11p=16)0.9080P(X \le 11 | p = \frac{1}{6}) \approx 0.9080
  • P(X12p=16)0.9585P(X \le 12 | p = \frac{1}{6}) \approx 0.9585

De waarde k1k-1 waarbij de cumulatieve kans voor het eerst boven de 0.95 komt, is 12. Dit betekent dat k1=12k-1 = 12, dus k=13k = 13. Het kritieke gebied is dan X13X \ge 13. Als de dobbelsteen 13 keer of vaker op de krokodil met kiespijn terechtkomt, verwerp je H0H_0.

2. Kritieke gebied bij een tweezijdige toets (voorbeeld met n=100,p=0.3,α=0.05n=100, p=0.3, \alpha=0.05): Bij een tweezijdige toets zoek je naar afwijkingen in beide richtingen (zowel 'groter dan' als 'kleiner dan'). Stel, je hebt:

  • H0:p=0.3H_0: p = 0.3
  • H1:p0.3H_1: p \ne 0.3 (dit is een tweezijdige toets)
  • Steekproefomvang n=100n=100
  • Significantieniveau α=0.05\alpha = 0.05 De toetsingsgrootheid XX volgt een binomiale verdeling XB(100,0.3)X \sim B(100, 0.3).

Omdat het een tweezijdige toets is, verdeel je het significantieniveau over twee staarten. Voor elke staart is het significantieniveau α2=0.052=0.025\frac{\alpha}{2} = \frac{0.05}{2} = 0.025.

  • Ondergrens van het kritieke gebied (k1k_1) bepalen: Je zoekt de grootste waarde k1k_1 waarvoor geldt: P(Xk1p=0.3)0.025P(X \le k_1 | p = 0.3) \le 0.025 Met een rekenmachine vind je:

    • P(X22p=0.3)0.0098P(X \le 22 | p = 0.3) \approx 0.0098
    • P(X23p=0.3)0.0179P(X \le 23 | p = 0.3) \approx 0.0179
    • P(X24p=0.3)0.0308P(X \le 24 | p = 0.3) \approx 0.0308 De grootste waarde k1k_1 waarvoor de kans 0.025\le 0.025 is, is k1=23k_1 = 23.
  • Bovengrens van het kritieke gebied (k2k_2) bepalen: Je zoekt de kleinste waarde k2k_2 waarvoor geldt: P(Xk2p=0.3)0.025P(X \ge k_2 | p = 0.3) \le 0.025 Dit is hetzelfde als 1P(Xk21p=0.3)0.0251 - P(X \le k_2-1 | p = 0.3) \le 0.025, of P(Xk21p=0.3)0.975P(X \le k_2-1 | p = 0.3) \ge 0.975. Met een rekenmachine vind je:

    • P(X36p=0.3)0.9660P(X \le 36 | p = 0.3) \approx 0.9660
    • P(X37p=0.3)0.9790P(X \le 37 | p = 0.3) \approx 0.9790
    • P(X38p=0.3)0.9877P(X \le 38 | p = 0.3) \approx 0.9877 De kleinste waarde k21k_2-1 waarvoor de kans 0.975\ge 0.975 is, is k21=37k_2-1 = 37. Dus k2=38k_2 = 38.

Het kritieke gebied voor deze tweezijdige toets bestaat uit de waarden XX waarvoor X23X \le 23 of X38X \ge 38. Als je steekproefresultaat in dit gebied valt, verwerp je de nulhypothese.

Wil je betere cijfers halen?
  • Extra uitleg en oefenen voor elk boek op school
  • Stel vragen en krijg direct antwoord
  • Video's, samenvattingen, oefenen, AI-tutor, woordjes leren en examentraining
Cookies
Meer uitleg

Om deze website goed te laten werken plaatsen we functionele cookies. We plaatsen analytische cookies om te bepalen welke onderdelen van de website het meest interessant zijn voor bezoekers. We plaatsen marketing cookies om de effectiviteit van onze campagnes te kunnen meten.