Boxplot, s engleskog, boxplot, predstavlja kvantitativnu ili kategorijsku varijablu u svrhu brze identifikacije kvartila skupa podataka.
Drugim riječima, boxplot je graf koji predstavlja kvantitativnu ili kvalitativnu varijablu kroz kvartile.
U statistici je koristan alat za predstavljanje diskretnih i kontinuiranih skupova podataka.
Važno je imati na umu da kvalitativne varijable varijable ili koje su namijenjene predstavljanju narudžbe ili kategorije uvijek moraju biti povezane s numeričkim indeksom većim od 0 kako bi se mogle pojaviti na grafikonu i izračunati odgovarajuće statistike.
Grafikon kutije i histogram
Grafikon okvira nije ništa drugo nego histogram gledan odozgo, a na isti način, histogram je okvir okvira gledan sa strane. Primjer se može vidjeti u nastavku.
Prva karakteristika koju dijele obje ljestvice je minimum i maksimum skupa podataka. Krajnje trake nakon crtica označavaju minimum (donja traka) i maksimum (gornja traka). Outlieri bi bili zastupljeni izvan raspona maksimuma i minimuma. Odnosno, iza rešetaka nakon crtica. Također možemo pronaći i horizontalne kutijske parcele.
Na prvi pogled možete vidjeti da je većina podataka usredotočena na promatranja blizu minimuma u oba grafa. Na to ukazuje grafikon okvira u kojem je okvir bliži minimumu od maksimuma. Ako pogledamo histogram, vidjet ćemo da su najčešća promatranja promatranja koja su blizu minimuma i daleko od maksimuma.
Podaci o parceli okvira
Podaci pruženi u okviru su sljedeći:
- Dno kutije je prvi kvartil (Q1).
- Traka u sredini okvira je medijan ili drugi kvartil (Q2).
- Vrh kutije je treći kvartil (Q3).
- Interkvartilni raspon ili IQR bila bi visina kutije, odnosno razlika između Q3 i Q1.
Ključ parcele okvira
Ovaj grafički prikaz naziva se kutija, jer izgleda poput kutije. Stoga, da bismo zapamtili ovaj graf, morali bismo misliti samo na kvadratni objekt ili okvir.
Čitatelji koji su upoznati s cijenom financijske imovine vidjet će više sličnosti sa svijećom. Svijeće koje vidite u ponudi su crteži okvira prilagođeni odabranom vremenskom prozoru.
Prednosti i nedostaci parcele s kutijama
Među prednostima i nedostacima ovog dijagrama nalazimo sljedeće:
Prednost
- Globalizirana vizija apsolutne učestalosti kvantitativne ili kvalitativne varijable.
- Poznavanje minimuma, maksimuma i kvartila skupa podataka bez potrebe za njihovim izračunavanjem.
- Prepoznavanje ekstremnih vrijednosti brže nego kod histograma, jer su ekstremne vrijednosti označene krugovima izvan maksimuma i minimuma.
Mane
- Ako je skup podataka mali, teže će se razumjeti izrada okvira za izražavanje tih podataka.
Primjer zapletne kutije
Pretpostavljamo da želimo predstaviti broj biciklista koji prođu našu kuću tijekom godine. Prvo, brojimo bicikliste i podatke prikupljamo u tablici.
Kroz neke programe poput R ili Excel možemo generirati grafikon prikazan u nastavku.
Zahvaljujući predstavljanju broja biciklista kroz zaplet, brzo možemo uočiti gdje je medijan, ostali kvartili, maksimum i minimum. U ovom slučaju nemamo atipičnih podataka jer izvan maksimuma i minimuma nema ništa.
Primjena ove vrste grafova vrlo je česta s obzirom na njezinu jednostavnost i korisnost u mnogim područjima izvan financija i ekonomije.