Stupnjevi slobode kombinacija su broja promatranja u skupu podataka koji se slučajno i neovisno razlikuju, umanjena za opažanja koja su uvjetovana tim proizvoljnim vrijednostima.
Drugim riječima, stupnjevi slobode su broj čisto slobodnih promatranja (koja mogu varirati) kada procjenjujemo parametre.
Uglavnom razlikujemo statistiku koja koristi populaciju i parametre uzorka kako bi znali njihove stupnjeve slobode. Razgovaramo o razlikama između srednje i standardne devijacije kada su parametri populacija ili uzorak:
Populacija i parametri uzorka
- Parametri stanovništva:
Budući da u populacijama ne znamo sve vrijednosti, stupnjevi slobode bit će svi elementi populacije: N.
Obje statistike omogućuju da sva opažanja u skupu budu slučajna, pa ćemo stoga svaki put kad procijenimo statistiku dobiti različite rezultate. Zatim su opažanja koja imaju puno pravo varirati sva opažanja skupa populacije. Drugim riječima, stupnjevi slobode u ovom su slučaju svi elementi populacije: N. Iz tog razloga obje statistike dijelimo ukupnom veličinom stanovništva (N).
- Uzorci parametara (procjene):
U uzorcima znamo sve vrijednosti.
Razlikujemo veličinu populacije (N) s veličinom uzorka (n).
Budući da znamo sve vrijednosti u uzorcima, nemamo problema s izračunavanjem srednje vrijednosti jer omogućuje da sva opažanja u skupu budu slučajna.
U slučaju standardne devijacije, namećemo ograničenje na stupnjeve slobode: sve elemente uzorka (n) i oduzimamo 1 element.
Ali … Zašto iz uzorka (n) oduzmemo samo 1, a ne 5 ili 10 elemenata?
Što više elemenata oduzmemo, to znači da što više podataka imamo o parametru uzorka, u ovom slučaju o standardnoj devijaciji.
Što više informacija imamo, manje slobode (stupnjevi slobode) moraju uzeti uzorci promatranja slučajnih vrijednosti. Što više elemenata oduzmemo od uzorka, to više ograničenja namećemo i manje će stupnjeva slobode imati parametar uzorka.
Primjer
Pretpostavljamo da idemo u Andoru vidjeti finale Svjetskog kupa u skijanju jer zaista volimo alpsko skijanje. Donosimo mapu koja nam govori gdje se nalaze različite discipline i ime nekih natjecatelja, ali startni broj svakog sudionika nije naveden. Svaki put kad izgovore ime natjecatelja, zagrebemo njihovo ime. Budući da je popis natjecatelja ograničen, doći će do točke da ćemo znati ime natjecatelja prije nego što ga objave preko zvučnika.
Kroniku analiziramo s matematičke točke gledišta:
- Veličina uzorka (n) jer nam govore samo imena nekih sudionika.
- Svaki sudionik može startati nasumično, redoslijed nije važan i ne može se ponovno natjecati (kombinacije bez ponavljanja).
- Posljednji sudionik bit će poznati element (n-1). Tada svi ostali sudionici mogu nasumično izaći, osim posljednjeg, što zasigurno znamo.
Pročitajte primjer stupnjeva slobode