\( \chi^2\)-test på terningkast
Matematikcenter skal på Ungdommens folkemøde 2022. Til det har vi købt en ny, oppustelig terning. Det første vi vil gøre med den, er selvfølgelig at tjekke, om det er en ærlig terning - altså om der er lige stor sandsynlighed for at slå alle 6 slag. Det er lige præcis det, man kan bruge \( \chi^2 \)-test til. Denne testtype bruges, når man allerede ved, hvilken fordeling forsøget bør følge. Det faktiske udfald sammenlignes med det forventede udfald, og det afgøres, hvor sandsynligt det er, at det faktiske udfald sker ud fra fordelingen.
Forsøg med terningkast
Vi har kastet med terningen 50 gange, og skrevet udfaldene ind i tabellen.
Udfald | 1 | 2 | 3 | 4 | 5 | 6 |
Antal slag | 8 | 10 | 7 | 8 | 6 | 11 |
Nu vil vi gerne finde ud af, om vi kan regne med at terningen er ærlig, med denne fordeling over 50 slag. Når man laver \( \chi^2 \)-test, skal man bestemme de forventede værdier, og opstille nulhypotesen om, at der ikke er en signifikant forskel på de forventede værdier, og værdierne fra forsøget. Vi sætter signifikansniveauet til 5%.
Hvis der er lige stor sandsynlighed for alle 6 udfald, ville man forvente at få hvert slag \( \frac{50}{6} = 8{,}33\) gange. Det skal vi bruge til at beregne vores \( \chi^2 \)-teststørrelse, med formlen:
$$\chi^2=\sum_{i=1}^k\frac{(O_i-F_i)^2}{F_i}=\frac{(O_1-F_1)^2}{F_1}+\frac{(O_2-F_2)^2}{F_2}+...+\frac{(O_k-F_k)^2}{F_k}$$
hvor O står får observeret værdi, og F for forventet værdi. Nu sætter vi vores tal ind i formlen:
$$\chi^2=\frac{(8-8{,}33)^2}{8{,}33}+\frac{(10-8{,}33)^2}{8{,}33}+\frac{(7-8{,}33)^2}{8{,}33}+\frac{(8-8{,}33)^2}{8{,}33}+$$
$$\frac{(6-8{,}33)^2}{8{,}33}+\frac{(11-8{,}33)^2}{8{,}33}=2{,}08$$
Nu har vi vores teststørrelse, og der er 5 frihedsgrader. Når vi har de to tal, kan vi udregne sandsynlighede for, at vores udfald forekommer. Det gør vi med Excel-kommandoen:
=CHI2.FORD.RT(teststørrelse;frihedsgrader)
Skriver man det ind i Excel, kommer vi frem til 0,84. Det vil sige, at der er 84% chance for at vores udfald (eller noget, der er værre) forekommer. Hvis vi skulle forkaste nulhypotesen, skulle det tal være helt nede under 5%. Afvigelserne fra det forventede skyldes altså med god sandsynlighed tilfældigheder, og vi kan godt regne med, at vores terning er ærlig.