Centralni granični teorem (TCL) statistička je teorija koja kaže da će, s obzirom na dovoljno velik slučajni uzorak populacije, raspodjela uzoraka slijediti normalnu raspodjelu.
Nadalje, TCL navodi da će se povećanjem veličine uzorka srednja vrijednost uzorka približavati srednjoj populaciji. Stoga pomoću TCL-a možemo definirati raspodjelu srednje vrijednosti uzorka određene populacije s poznatom varijancom. Dakle, raspodjela će slijediti normalnu raspodjelu ako je veličina uzorka dovoljno velika.
Glavna svojstva središnjeg graničnog teorema
Teorem o središnjoj granici ima niz vrlo korisnih svojstava u statističkom i vjerojatnosnom polju. Glavni su:
- Ako je veličina uzorka dovoljno velika, raspodjela uzoraka znači da slijedi približno normalnu raspodjelu. TCL smatra uzorak velikim kad je njegova veličina veća od 30. Stoga, ako je uzorak veći od 30, srednja vrijednost uzorka imat će funkciju raspodjele blizu normalne. I to je točno bez obzira na oblik distribucije s kojim radimo.
- Srednja vrijednost populacije i srednja vrijednost uzorka bit će ista. Odnosno, srednja vrijednost raspodjele svih uzoračkih sredstava bit će jednaka srednjoj vrijednosti ukupne populacije.
- Odstupanje raspodjele sredina uzorka bit će σ² / n. Koja je varijansa populacije podijeljena s veličinom uzorka.
Da distribucija uzorka znači da nalikuje normalnoj, izuzetno je korisno. Budući da je normalnu raspodjelu vrlo lako primijeniti za provođenje testova hipoteza i izgradnju intervala pouzdanosti. U statistikama je prilično važna raspodjela, jer mnoge statistike zahtijevaju ovu vrstu raspodjele. Uz to, TCL će nam omogućiti da zaključimo o srednjoj vrijednosti populacije kroz srednju vrijednost uzorka. A ovo je vrlo korisno kada zbog nedostatka sredstava ne možemo prikupiti podatke od cijele populacije.
Primjer teorema o središnjoj granici
Zamislimo da želimo analizirati povijesni prosječni prinos indeksa S&P 500, koji, kako znamo, ima oko 500 tvrtki u sebi. Ali nemamo dovoljno podataka za analizu svih 500 tvrtki u indeksu. U ovom bi slučaju prosječna profitabilnost S&P 500 bila prosjek stanovništva.
Sada, slijedeći TCL, možemo uzeti uzorak od ovih 500 tvrtki za provođenje analize. Jedino ograničenje koje imamo je da u uzorku mora biti više od 30 tvrtki da bi se teorem ispunio. Dakle, zamislimo da slučajno odaberemo 50 tvrtki iz indeksa i ponovimo postupak nekoliko puta. Koraci koje treba slijediti u primjeru bili bi sljedeći:
- Odabiremo uzorak od oko 50 tvrtki i dobivamo prosječnu profitabilnost cijelog uzorka.
- Kontinuirano biramo 50 tvrtki i postižemo prosječnu profitabilnost.
- Raspodjela svih prosječnih prinosa svih odabranih uzoraka približno će biti normalna raspodjela.
- Prosječni prinosi svih odabranih uzoraka približni su prosječnim prinosima ukupnog indeksa. Kao što pokazuje Srednji granični teorem.
Stoga se zaključivanjem iz prosječnog prinosa uzorka možemo približiti prosječnom prinosu indeksa.