Raspodjela učenika - što je to, definicija i pojam

Sadržaj:

Anonim

Studentova t distribucija ili t distribucija teoretski je model koji se koristi za približavanje trenutka prvog reda normalno raspoređene populacije kada je veličina uzorka mala, a standardno odstupanje nepoznato.

Drugim riječima, t-raspodjela je raspodjela vjerojatnosti koja procjenjuje vrijednost srednje vrijednosti malog uzorka izvađenog iz populacije koja slijedi normalnu raspodjelu i za koju ne znamo njezinu standardnu ​​devijaciju.

Preporučeni članci: stupnjevi slobode, stupnjevi slobode (primjer) i normalna raspodjela.

Formula t-raspodjele učenika

S obzirom na kontinuiranu slučajnu varijablu L, kažemo da se učestalost njegovih promatranja može na zadovoljavajući način približiti t-raspodjeli s g stupnjeva slobode tako da:

Prikaz studentske t distribucije

Funkcija gustoće t distribucije s 3 stupnja slobode (df).

Kao što vidimo, prikaz t-raspodjele sliči na uobičajenu raspodjelu, osim što normalna raspodjela ima šire repove i više je ojačana. Drugim riječima, t-raspodjeli bismo trebali dodati više stupnjeva slobode kako bi raspodjela "rasla" i izgledala više poput normalne raspodjele.

Specijalitet

I … Zašto je t-distribucija tako posebna?

Pa, jer za razliku od normalne raspodjele koja ovisi o srednjoj vrijednosti i varijansi, t raspodjela ovisi samo o stupnjevima slobode, od engleskog, stupnjevi slobode (df). Drugim riječima, kontrolirajući stupnjeve slobode, kontroliramo raspodjelu.

Studentova t prijava

Raspodjela t koristi se kada:

  • Želimo procijeniti srednju vrijednost normalno raspoređene populacije iz malog uzorka.
  • Veličina uzorka je manja od 30 predmeta, odnosno n <30.

Iz 30 promatranja, t-raspodjela jako sliči normalnoj raspodjeli, pa ćemo koristiti normalnu raspodjelu.

  • Standardna devijacija populacije nije poznata i mora se procijeniti iz promatranja uzorka.

Primjer

Pretpostavljamo da imamo 28 promatranja slučajne varijable G koja slijedi Studentovu t raspodjelu s 27 stupnjeva slobode (df).

Matematički,

Budući da radimo sa stvarnim podacima, uvijek će postojati pogreška aproksimacije između podataka i distribucije. Drugim riječima, srednja vrijednost, medijan i način rada neće uvijek biti nula (0) ili potpuno jednaki.

Učestalost svakog promatranja varijable G predstavljamo pomoću histograma.

Može li se slučajna varijabla G približiti t-raspodjeli?

Razlozi za uzimanje u obzir da varijabla G slijedi t raspodjelu:

  • Raspodjela je simetrična. Odnosno, postoji jednak broj opažanja i s desne i s lijeve strane središnje vrijednosti. Također, da su srednja i srednja vrijednost obično blizu iste vrijednosti. Srednja vrijednost je približno nula, srednja vrijednost = 0,016.
  • Opažanja s najviše učestalosti ili vjerojatnosti su oko središnje vrijednosti. Promatranja s manje učestalosti ili vjerojatnosti daleko su od središnje vrijednosti.