Koeficijent varijacije - što je to, definicija i značenje
Koeficijent varijacije, poznat i kao Pearsonov koeficijent varijacije, statistička je mjera koja nas informira o relativnoj disperziji skupa podataka.
Odnosno, obavještava nas, poput ostalih mjera disperzije, o tome kreće li se varijabla puno, malo, više ili manje od druge.
Koeficijent formule varijacije
Njegov se izračun dobiva dijeljenjem standardne devijacije s apsolutnom vrijednošću srednje vrijednosti skupa i obično se izražava kao postotak za bolje razumijevanje.

- X: varijabla na kojoj se izračunava varijanca
- σx: Standardna devijacija varijable X.
- | x̄ |: To je srednja vrijednost varijable X u apsolutnoj vrijednosti s x̄ ≠ 0
Koeficijent varijacije može se izraziti slovima CV ili r, ovisno o priručniku ili korištenom fontu. Njegova je formula sljedeća:
Koeficijent varijacije koristi se za usporedbu skupova podataka koji pripadaju različitim populacijama. Ako pogledamo njegovu formulu, vidimo da uzima u obzir vrijednost srednje vrijednosti. Stoga nam koeficijent varijacije omogućuje mjeru disperzije koja eliminira moguća iskrivljenja sredstava dviju ili više populacija.
RangPrimjeri upotrebe koeficijenta varijacije umjesto standardne devijacije
Evo nekoliko primjera ove mjere disperzije:
Usporedba skupova podataka različitih dimenzija
Želimo kupiti disperziju između visine 50 učenika u razredu i njihove težine. Za usporedbu visine mogli bismo upotrijebiti metre i centimetre kao mjernu jedinicu, a kilogram za težinu. Usporedba ove dvije raspodjele pomoću standardne devijacije ne bi imala smisla jer pokušavamo izmjeriti dvije različite kvalitativne varijable (mjeru duljine i jednu mase).
Usporedite skupove s velikom razlikom između sredstava
Zamislite, na primjer, da želimo izmjeriti težinu buba i nilskih konja. Težina kornjaša mjeri se u gramima ili miligramima, a težina nilskih konja obično se mjeri u tonama. Ako za naše mjerenje težinu kornjaša pretvorimo u tone, tako da su obje populacije na istoj skali, upotreba standardne devijacije kao mjere disperzije ne bi bila prikladna. Srednja težina kornjaša izmjerena u tonama bila bi toliko mala da kada bismo koristili standardno odstupanje, teško da bi došlo do disperzije u podacima. To bi bila pogreška jer se težina između različitih vrsta kornjaša može znatno razlikovati.
Primjer izračuna koeficijenta varijacije
Uzmimo u obzir populaciju slonova i još jednu mišu. Populacija slonova ima srednju težinu od 5000 kilograma i standardnu devijaciju od 400 kilograma. Populacija miša ima srednju težinu od 15 grama i standardno odstupanje od 5 grama. Ako usporedimo raspršenost obje populacije pomoću standardne devijacije, mogli bismo pomisliti da postoji veća disperzija za populaciju slonova nego za miševe.
Međutim, izračunavajući koeficijent varijacije za obje populacije, shvatili bismo da je upravo suprotno.
Slonovi: 400/5000 = 0,08
Miševi: 5/15 = 0,33
Pomnožimo li oba podatka sa 100, imamo da je koeficijent varijacije za slonove samo 8%, dok je kod miševa 33%. Kao posljedica razlike između populacija i njihove srednje težine, vidimo da populacija s najvećom disperzijom nije ona s najvećom standardnom devijacijom.
Interval pouzdanostiKoeficijent linearne korelacije