Kategorijska varijabla - što je to, definicija i pojam

Sadržaj:

Anonim

Kategorijska varijabla je ona koja omogućuje klasificiranje niza podataka pomoću fiksnih vrijednosti povezanih s određenom kvalitetom ili kategorijom.

Kategorijska varijabla, za razliku od kardinalnih ili kontinuiranih varijabli (koje omogućuju numeričke izračune), klasificira pojedince ili slučajeve. Oni obično uzimaju vrijednosti predstavljene cijelim brojevima, poput jedinice ili nule, ali to su samo prikazi.

U primjeru ćemo to vidjeti detaljnije.

Razlike između kategoričke i kontinuirane varijable

Postoje neke razlike između kategoričke varijable i kontinuirane ili kardinalne varijable koje bi trebale biti poznate. Pogledajmo najrelevantnije.

  • Prvo, kategorijska varijabla koristi se za grupiranje, a kontinuirana varijabla za brojanje. Drugim riječima, prva omogućuje formiranje kategorija s nizom podataka. Na primjer, spol ili broj djece. Drugi nam daje numeričke podatke. Na primjer, dob.
  • Kardinalna varijabla omogućuje numeričke izračune, ostale ne. Na taj način, u prvom možemo znati sredstva ili odstupanja, dok u drugima samo neki podaci, poput načina ili postotka kategorija.
  • Kategorični su vrlo korisni za poznavanje kvalitativnih informacija, odnosno neke kvalitete podataka. Kontinuirani nam pružaju kvantitativne podatke, odnosno količine i vrijednosti predstavljene brojevima.

Statističke tehnike za kategorijske varijable

Dalje, pogledajmo statističke tehnike koje se najčešće koriste u kategorijskim varijablama, uspoređujući ih s onima kontinuiranih ili kardinalnih varijabli.

  • Opisne statistike: U ovoj vrsti varijabli, analize se, između ostalih, obično temelje na stupčastim i postotnim dijagramima. Kardinali dopuštaju primjenu analitičkih tehnika za izračunavanje statistike položaja poput kvantila ili statistike raspršenja poput varijansi.
  • Kontrast hipoteze: U kategorizaciji, rezultati se mogu ekstrapolirati pomoću neparametarskih testova hipoteza. S druge strane, kontinuirani koriste parametarske kontraste o kojima se također može zaključiti.
  • Tehnike regresije: U ovom se slučaju, među prvima, koriste logistička regresija ili slično. Za drugu vrstu varijabli, najčešće korištena tehnika je linearna regresija.

Primjer kategorijske varijable

Za kraj, pogledajmo vrlo čest primjer u marketingu. Zamislimo da želimo prodati proizvod i zanima nas bračno stanje.

Da bismo to učinili, dodijelit ćemo 1 slobodnima, 2 vjenčanima, 3 razvedenom, 4 partneru i 5 drugima.

Pogledajmo sliku, a zatim je komentirajte:

U njemu možemo vidjeti da je najveći postotak pojedinaca samac, vjenčani i razvedeni, dok su ostale dvije mogućnosti samo 5%.

Kao što vidimo, kategorijske varijable korisne su za grupiranje. Trakasti grafikon omogućuje nam bolje promatranje tih postotaka, jer je lakše usporediti veličinu šipki.