Statistička normalizacija je transformacija skale raspodjele varijable kako bi se mogle napraviti usporedbe s obzirom na skupove elemenata i sredinu uklanjanjem učinaka utjecaja.
Drugim riječima, normalizacija su proporcije bez mjernih jedinica (bezdimenzionalne ili nepromjenjive skale) koje nam omogućuju usporedbu elemenata različitih varijabli i različitih mjernih jedinica.
U statistici i ekonometriji koriste se standardizirane tablice raspodjele vjerojatnosti za pronalaženje vjerojatnosti koju promatranje uzima s obzirom na funkciju raspodjele koju varijabla slijedi.
Važno je ne ograničiti pojam normalizacije samo na skupove elemenata kod kojih je normalna raspodjela dobra aproksimacija njihove učestalosti.
Statistička varijablaStol
Sljedeća tablica daje detalje o najčešćim standardizacijama u statistici koje se primjenjuju na financije i ekonomiju.
- Tipizirani ili standardni rezultat normalizira pogreške kada možemo izračunati parametre uzorka.
- Normalizacija u Studentovoj t distribuciji normalizira ostatke kada su parametri nepoznati i mi izračunavamo kako bismo ih dobili.
- Koeficijent varijacije koristi srednju vrijednost kao mjerilo skale, za razliku od standardiziranog rezultata i Studentova t, koji koriste standardno odstupanje. Raspodjela je normalizirana za Poissonovu i eksponencijalnu raspodjelu.
- Standardizirani moment može se primijeniti na bilo koju raspodjelu vjerojatnosti koja ima funkciju stvaranja trenutka. Drugim riječima, da su integrali trenutaka konvergentni.
Prijave
Koliko smo puta pročitali da se normalna raspodjela vjerojatnosti čini dovoljno dobrom aproksimacijom učestalosti promatranja i od nas se traži da nađemo vjerojatnost da varijabla X poprimi određenu vrijednost?
Drugim riječima, postavljamo X ~ N (μ, σ2), a od nas se traži da nađemo P (X ≤ xja)
Znamo da je za pronalaženje P (X ≤ xja), moramo potražiti vjerojatnost u tablicama raspodjele vjerojatnosti. U ovom slučaju, u tablicama raspodjele normalne raspodjele. Tablice raspodjele vjerojatnosti koje se najčešće koriste u ekonometriji i kvantitativnim financijama su: hi-kvadrat, Studentova t, Fisher-Snedecorova F, Poisson, eksponencijalna, kauzična i standardna norma.
Vjerojatnosti izračunate u tablicama raspodjele ispunjavaju svojstvo:
Odnosno, vjerojatnosti (brojevi u tablici) su tipizirane. Tada ćemo također morati utipkati svoju varijablu prema parametrima funkcije raspodjele ako želimo pronaći vjerojatnost P (X ≤ xja).
Praktični primjer
Želimo znati vjerojatnost da je broj skijaša koji idu na skijanje u petak ujutro 288.
Skijalište nam govori da se učestalost varijable skijaša može približiti normalnoj raspodjeli od prosječno 280 i varijansi 16.
Dakle, imamo:
X ~ N (μ, σ2)
gdje je X definirana kao varijabla "skijaši"
Pitaju nas za vjerojatnost da je broj skijaša koji će skijati u petak manji ili jednak 288. To jest:
P (X ≤ 288)
Postupak
Da bismo pronašli vjerojatnost da je broj skijaša jednak 288, prvo moramo upisati varijablu.
Zatim pogledamo tablicu raspodjele kontinuirane standardne normale:
Z | 0 | 1 | 2 | 3 |
2,0 | 0,9772 | 0,9778 | 0,9783 | 0,9788 |
Vjerojatnost da će 288 skijaša ići na skijanje u petak ujutro je 97,72% s obzirom na srednje vrijednosti i parametre odstupanja.