Kvartilno odstupanje - što je to, definicija i pojam

Kvartilno odstupanje statistička je mjera disperzije koja vraća središnju vrijednost interkvartilnog raspona i koristi se u iskrivljenim skupovima podataka.

Drugim riječima, kvartilno odstupanje je izračunavanje medijana interkvartilnog raspona (IQR) i koristi se u skupovima podataka s podosta ekstremnih vrijednosti.

Stenografija devijacije kvartila je DQ.

Interkvartilni Raspon

Interkvartilni raspon mjera je raspršivanja skupa podataka koji se obično koristi u okvirnoj shemi. Drugim riječima, interkvartilni raspon je razlika između pretposljednjeg i prvog kvartila raspodjele koja se koristi u okvirnoj kutiji.

IQR = Q3 - Q1

Prednost korištenja interkvartilnog raspona je u tome što se može izračunati kvartilno odstupanje (DQ), što je vrlo adekvatna mjera disperzije kada imamo pristrane skupove podataka.

Formula kvartilnog odstupanja

Kvartilno odstupanje izračunava se kao podjela interkvartilnog raspona s 2.

DQ = (Q3 - Q1) / 2 = RIC / 2

Budući da razmatramo samo disperziju između trećeg i prvog kvartila, zanemarujemo sve podatke izvan tog raspona. I zato su sve vrijednosti blizu ekstremnosti. Dakle, ako podijelimo interkvartilni raspon s dva, dobit ćemo medijan vrijednosti disperzije.

Primjer devijacije kvartila

Pretpostavljamo da želimo izračunati međukvartilni domet i kvartilno odstupanje broja biciklista koji prolaze našom kućom tijekom godine.

  1. Prvo, brojimo bicikliste i podatke prikupljamo u tablici.
  1. Drugo, izračunavamo prvi i treći kvartil da bismo dobili interkvartilni raspon.

Q3 = 550

Q1 = 200

IQR = Q3 - Q1 = 550 - 200 = 350

  1. Treće, izračunavamo disperziju kvartila jednostavnim dijeljenjem interkvartilnog raspona s dva.

DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175

Kvartilni raspon za ovaj skup podataka iznosi 175. Ovaj je broj središnja vrijednost interkvartilnog raspona.

Važno je napomenuti da su podaci za mjesec srpanj ekstremni podaci jer su nekoliko puta veći od svih ostalih podataka. Dakle, mogli bismo reći da je ovaj skup podataka pristran prema tom mjesecu. Zahvaljujući "neznanju" rasipanja kvartila prema ekstremnim podacima, rezultat ove mjere vrlo je sličan onome ako je u srpnju kružilo samo 600 biciklista. Da je u srpnju bilo samo 600 biciklista, disperzija kvartila bila bi 162,5, vrlo blizu 175 s obzirom na to da je broj biciklista tog mjeseca 10 puta manji.