Interval pouzdanosti je tehnika procjene koja se koristi u statističkom zaključivanju koja omogućuje ograničavanje para ili nekoliko parova vrijednosti, unutar kojih će se pronaći željena procjena točke (s određenom vjerojatnošću).
Interval pouzdanosti omogućit će nam da izračunamo dvije vrijednosti oko srednje vrijednosti uzorka (jednu gornju i jednu donju). Te će vrijednosti ograničiti raspon unutar kojeg će se, uz određenu vjerojatnost, nalaziti parametar populacije.
Interval pouzdanosti = srednja vrijednost + - granica pogreške
Poznavanje prave populacije, općenito, nešto je vrlo složeno. Uzmimo u obzir populaciju od 4 milijuna ljudi. Možemo li znati prosječne troškove potrošnje po kućanstvu ove populacije? U principu da. Jednostavno bismo morali anketirati sva kućanstva i izračunati prosjek. Međutim, praćenje tog postupka bilo bi izuzetno mukotrpno i učinilo bi studiju prilično složenom.
U ovakvim je situacijama izvedivije odabrati statistički uzorak. Na primjer, 500 ljudi. A na navedenom uzorku izračunajte srednju vrijednost. Iako još uvijek ne bismo znali pravu vrijednost populacije, mogli bismo pretpostaviti da će biti blizu vrijednosti uzorka. To znači da dodamo granicu pogreške i imamo vrijednost intervala pouzdanosti. S druge strane, tu granicu pogreške oduzimamo od srednje vrijednosti i imat ćemo drugu vrijednost. Između ove dvije vrijednosti nalazit će se srednja vrijednost populacije.
Zaključno, interval pouzdanosti ne služi za točku procjenu parametra populacije, ako će nam pomoći da dobijemo približnu ideju o tome koji bi mogao biti istiniti. Omogućuje nam ograničenje između dviju vrijednosti gdje će se naći srednja vrijednost populacije.
koeficijent varijacijeKumulativna učestalostČimbenici o kojima ovisi interval pouzdanosti
Izračun intervala pouzdanosti uglavnom ovisi o sljedećim čimbenicima:
- Odabrana veličina uzorka: Ovisno o količini podataka koja je korištena za izračunavanje vrijednosti uzorka, ona će biti više ili manje blizu istinskog parametra populacije.
- Razina povjerenja: Obavijestit će nas u kojem je postotku slučajeva naša procjena točna. Uobičajene razine su 95% i 99%.
- Dopuštena pogreška naše procjene: To se naziva alfa i informira nas o vjerojatnosti da je vrijednost populacije izvan našeg raspona.
- Procjena u uzorku (srednja vrijednost, varijanca, razlika srednjih vrijednosti …): O tome će ovisiti statistika osovine za izračunavanje intervala.
Primjer intervala pouzdanosti za srednju vrijednost, pod pretpostavkom normalnosti i poznate standardne devijacije
Za izračun korištena zaokretna statistika bila bi sljedeća:
Rezultirajući interval bio bi sljedeći:
Vidimo kako u intervalu lijevo i desno od nejednakosti imamo donju i gornju granicu. Stoga nam izraz govori da je vjerojatnost da stanovništvo znači između ovih vrijednosti 1-alfa (razina pouzdanosti).
Pogledajmo bolje navedeno s primjerom riješenom vježbom.
Želite procijeniti prosječno vrijeme koje trkaču treba za odlazak na maraton. Za to je tempirano 10 maratona i dobivena su prosječna 4 sata sa standardnim odstupanjem od 33 minute (0,55 sata). Želite dobiti interval pouzdanosti od 95%.
Da bismo dobili interval, morali bismo samo zamijeniti podatke u formuli intervala.
Interval pouzdanosti bio bi dio raspodjele koji je zasjenjen plavom bojom. 2 vrijednosti omeđene time bile bi one koje odgovaraju 2 crvene crte. Središnja crta koja dijeli raspodjelu na 2 bila bi prava vrijednost populacije.
Važno je napomenuti da u ovom slučaju, s obzirom da nam funkcija gustoće raspodjele N (0,1) daje kumulativnu vjerojatnost (s lijeve na kritičnu vrijednost), moramo pronaći vrijednost koja nam ostavlja 0,975 na lijevi% (ovo je 1,96).