Dovoljna statistika za parametar Θ je ona sposobna prikupiti ili sažeti sve informacije koje sadrži uzorak slučajne varijable X.
Znamo da je statistika stvarna funkcija uzorka. Odnosno, uzima stvarne vrijednosti sadržane u uzorku. Odatle, kao što smo vidjeli u članku u kojem je definiran pojam statistike, moramo osigurati da statističar ima određena svojstva. Zašto tražiti takva svojstva? Da bismo osigurali da je statistika korisna za naše svrhe.
Dovoljnost je jedno od tih svojstava. Na puno jednostavniji način reći ćemo da je statistika dovoljna ako koristi sve podatke sadržane u uzorku.
Kako znati je li statistika dovoljna?
Logično, postavlja se pitanje: Kako mogu znati ispunjava li T statistika svojstvo dostatnosti? Ili Kako mogu pronaći, ako postoji, statistiku koja ispunjava svojstvo dostatnosti. Odgovor na ova dva pitanja nalazimo u dva teorema:
- Fisher-Neymanov kriterij faktorizacije: Ovaj kriterij navodi da će dati statistički podatak T, ako ispunjava određene uvjete, biti dovoljna statistika.
- Darmoisov teorem: Ovaj teorem odgovara na drugo pitanje. Odnosno, omogućuje nam pronalazak dovoljne statistike kroz niz postupaka.
Primjer dovoljne statistike
Pretpostavimo da želimo izračunati prosječni godišnji prihod obitelji s prebivalištem u Čileu. Da bismo to učinili, slijedit ćemo sljedeći postupak:
- Prikupiti podatke (uzorak): Kako ne možemo pitati svaku obitelj koja živi u Čileu koliko godišnje zarađuju, uzet ćemo reprezentativni uzorak od, primjerice, 1.000 obitelji.
- Identificirajte slučajnu varijablu koja se proučava: Slučajna varijabla koja se proučava je obiteljski prihod. Dakle: X → Obiteljski prihod
- Odaberite pravu statistiku: Prikladna statistika za izračunavanje srednjeg dohotka nije ništa drugo do očekivanje X. Drugim riječima, uzorak srednje vrijednosti X.
- Kako mogu znati je li statistika uzorka srednja vrijednost dovoljna? Kako već imamo matematički izraz statistike, poslužit ćemo se Fisher-Neymanovim faktoring faktorom. Ili, Darmoisov teorem. To su formule stvorene u tu svrhu.
Nakon primjene ispravnih izračuna, zaključujemo da statistika prosjeka uzorka udovoljava zahtjevu ili svojstvu dostatnosti. Osiguravajući da udovoljava ovom zahtjevu, osiguravamo da ova (statistička) funkcija, koja nam omogućuje sintezu podataka (prosječni dohodak), koristi sve podatke sadržane u uzorku (1.000 obitelji).
Zašto je važno da koristim sve podatke u uzorku?
Sad kad znamo da je srednja vrijednost uzorka dovoljna statistika, pretpostavimo slučaj. Kakav bi smisao imao izračun prosječnog dohotka na temelju tih 1.000 čileanskih obitelji i da koristimo podatke samo 500 obitelji?
Naravno, to ne bi imalo smisla. Želimo sažetak svih informacija. Odnosno, ono što smo definirali kao dovoljnu statistiku.