Statistička disperzija - što je to, definicija i pojam

Sadržaj:

Anonim

Statističko širenje je stupanj u kojem se distribucija podataka odmiče ili se približava apsolutnoj vrijednosti aritmetičkoj sredini kao središnja statistička pozicija.

Stoga će mjere disperzije uvijek pratiti tu srednju vrijednost ili prosjek.

Na taj bi način izvještavali o varijabilnosti ili raspršenosti podataka u vezi s tim. Što su vrijednosti veće, kao što ćemo vidjeti u nastavku, to je veća statistička disperzija.

Važnost statističke disperzije

Kada želimo izvršiti deskriptivnu analizu, prvo izračunavamo sažete mjere položaja. Najčešći su srednja vrijednost, medijan, modus ili kvartili, decili, kvintili ili percentili. Također, moramo znati i statističko širenje.

Mjere raspršivanja pružaju vrlo relevantne informacije. Ako je disperzija vrlo visoka, to utječe na srednju vrijednost i to više nije reprezentativno za skupinu kao sažetu mjeru. Stoga se obično oba podatka slažu.

Statističke mjere raspršivanja

Postoje razne mjere disperzije koje omogućuju njezino mjerenje. Pogledajmo sažetak najrelevantnijih. Ovdje smo ih detaljnije analizirali.

  • Rang: To nije veća od razlike između najmanje i najveće vrijednosti distribucije.
  • Prosječno odstupanje: To bi bio ekvivalent prosjeka različitih odstupanja pojedinih podataka od srednje vrijednosti.
  • Varijansa i standardna devijacija: Oni su najpoznatije mjere disperzije. Obično se koristi drugi koji je lakše izračunati (korijen varijance) i protumačiti. Izražavaju se u apsolutnim vrijednostima.
  • Koeficijent varijacije: U ovom se slučaju izračunava sa standardnim odstupanjem i srednjom vrijednosti, a koristi se za usporedbu, jer se izražava u relativnim vrijednostima (%).
Statističke mjere raspršivanja

Primjer statističke disperzije

Napokon, vidjet ćemo primjer deset fiktivnih zemalja i njihov BDP.

Vidimo da su vrlo različiti kada je u pitanju njihov BDP. Od najveće, sa 7.000 milijuna jedinica, do najmanje, s 2.500 milijuna.

Vidimo da je prosjek gotovo 4.500 milijuna, ali mjere raspršivanja su vrlo visoke. S jedne strane, prosječno odstupanje, od gotovo 1500 milijuna jedinica. Varijansa, koja ne doprinosi puno, ali omogućuje izračunavanje standardne devijacije od gotovo 1.500 milijuna jedinica. Konačno, koeficijent varijacije od gotovo 33%.

Možemo reći da je statistička disperzija vrlo visoka, a srednja vrijednost nije reprezentativna. Nešto što se može provjeriti jer je malo podataka i uočavaju se zemlje s visokim BDP-om, a druge s niskim. Ali zamislite da ih 194 priznaje UN, tamo su vrlo korisne, zar ne?