Frihedsgrader
Hvad er en frihedsgrad?
Ordet frihedsgrad dækker over hver enkelt uafhængigt datapunkt, der kan variere og stadigvæk indgå i udregningen af en parameter.
Frihedsgrader er nogle gange noteret med det græske bogstav \(\nu\) (Ny), DOF (Degrees Of Freedom) eller bare df.
Frihedsgrader i en \(\chi ^2\)-test
I Tabel 1 nedenfor er givet en \(2\times2\) tabel. En sådan \(2\times2\) tabel vil have 1 frihedsgrad, da de forskellige observationer skal summere op til det totale antal observationer, her n=20.
\(A_1\) | \(A_2\) | Total | |
\(B_1\) | ? | 5 | 5+? |
\(B_2\) | 5 | 5 | 10 |
Total | 5+? | 10 | 20 |
I de udvidede tilfælde med r rækker og k kolonner gælder at \(\textit{df=(r-1)} \times \textit{(k-1)}\).
NB: I tilfældet med r rækker og 1 kolonne, gælder at \(\textit{df=r-1}\).
\(A_1\) | \(A_2\) | \(A_3\) | \(A_4\) | \(A_5\) | Total | |
\(B_1\) | ? | ? | 5 | 15 | 10 | 40 |
\(B_2\) | ? | ? | 0 | 20 | 5 | 40 |
Total | 10 | 15 | 5 | 35 | 15 | 80 |
Tabel 2 vil have 4 frihedsgrader. Det forstås at man frit vil kunne variere indholdet af 4 celler, og resten vil så være låst i forhold til de bestemmelser, der gør sig gældende.
Frihedsgrader i en t-test
Hvis man har en talrække på n tal: \(n_1 , n_2, ... n_i\) vil man have \(i-1\) frihedsgrader til at udregne gennemsnittet.
Hvis man tester for gennemsnittet med 10 måleresultater vil man derfor have \(\textit{df}=10-9\)frihedsgrader. Hvis man efterfølgende også estimerer variansen vil man have endnu en frihedsgrad mindre, da den første er brugt til at udregne gennemsnittet, som indgår i udregningen af varians.
Dette er vigtigt at have in mente når man udregner konfidensintervaller hvor
\(CI_\alpha = \bar{x} \pm t(\alpha, df) \cdot \frac{s}{\sqrt{n}}\), hvor \(t(\alpha, df)\) er din t-score på konfidensniveau \(\alpha\) med df frihedsgrader.