Studentova t distribucija ili t distribucija teoretski je model koji se koristi za približavanje trenutka prvog reda normalno raspoređene populacije kada je veličina uzorka mala, a standardno odstupanje nepoznato.
Drugim riječima, t-raspodjela je raspodjela vjerojatnosti koja procjenjuje vrijednost srednje vrijednosti malog uzorka izvađenog iz populacije koja slijedi normalnu raspodjelu i za koju ne znamo njezinu standardnu devijaciju.
Preporučeni članci: stupnjevi slobode, stupnjevi slobode (primjer) i normalna raspodjela.
Formula t-raspodjele učenika
S obzirom na kontinuiranu slučajnu varijablu L, kažemo da se učestalost njegovih promatranja može na zadovoljavajući način približiti t-raspodjeli s g stupnjeva slobode tako da:
Prikaz studentske t distribucije
Funkcija gustoće t distribucije s 3 stupnja slobode (df).
Kao što vidimo, prikaz t-raspodjele sliči na uobičajenu raspodjelu, osim što normalna raspodjela ima šire repove i više je ojačana. Drugim riječima, t-raspodjeli bismo trebali dodati više stupnjeva slobode kako bi raspodjela "rasla" i izgledala više poput normalne raspodjele.
Specijalitet
I … Zašto je t-distribucija tako posebna?
Pa, jer za razliku od normalne raspodjele koja ovisi o srednjoj vrijednosti i varijansi, t raspodjela ovisi samo o stupnjevima slobode, od engleskog, stupnjevi slobode (df). Drugim riječima, kontrolirajući stupnjeve slobode, kontroliramo raspodjelu.
Studentova t prijava
Raspodjela t koristi se kada:
- Želimo procijeniti srednju vrijednost normalno raspoređene populacije iz malog uzorka.
- Veličina uzorka je manja od 30 predmeta, odnosno n <30.
Iz 30 promatranja, t-raspodjela jako sliči normalnoj raspodjeli, pa ćemo koristiti normalnu raspodjelu.
- Standardna devijacija populacije nije poznata i mora se procijeniti iz promatranja uzorka.
Primjer
Pretpostavljamo da imamo 28 promatranja slučajne varijable G koja slijedi Studentovu t raspodjelu s 27 stupnjeva slobode (df).
Matematički,
Budući da radimo sa stvarnim podacima, uvijek će postojati pogreška aproksimacije između podataka i distribucije. Drugim riječima, srednja vrijednost, medijan i način rada neće uvijek biti nula (0) ili potpuno jednaki.
Učestalost svakog promatranja varijable G predstavljamo pomoću histograma.
Može li se slučajna varijabla G približiti t-raspodjeli?
Razlozi za uzimanje u obzir da varijabla G slijedi t raspodjelu:
- Raspodjela je simetrična. Odnosno, postoji jednak broj opažanja i s desne i s lijeve strane središnje vrijednosti. Također, da su srednja i srednja vrijednost obično blizu iste vrijednosti. Srednja vrijednost je približno nula, srednja vrijednost = 0,016.
- Opažanja s najviše učestalosti ili vjerojatnosti su oko središnje vrijednosti. Promatranja s manje učestalosti ili vjerojatnosti daleko su od središnje vrijednosti.