Statistički znak - što je to, definicija i pojam

Sadržaj:

Statistički znak - što je to, definicija i pojam
Statistički znak - što je to, definicija i pojam
Anonim

Statistički uzorak je podskup podataka koji pripada populaciji podataka. Statistički gledano, mora se sastojati od određenog broja opažanja koja na odgovarajući način predstavljaju ukupne podatke.

Statistika je, kao grana matematike, odgovorna za prikupljanje podataka, njihovo raspoređivanje i analizu. Drugim riječima, kada želimo proučiti određeni fenomen, okrećemo se statistici. Dobar primjer fenomena koji proučava statistika je prosječna plaća građana neke zemlje

U tom smislu, iz razloga vremena i troškova, ne možemo prikupiti sve podatke. Ta je ukupnost podataka ono što je poznato kao populacija podataka ili jednostavno populacija.

Zašto radite sa statističkim uzorcima?

Da bismo objasnili zašto se koristi statistički uzorak umjesto ukupne populacije, pribjeći ćemo gore navedenom primjeru.

Pretpostavimo da želimo proučiti bilo koji fenomen. U našem slučaju, ova pojava je prosječna plaća građana neke zemlje. Populaciju podataka čine svi radnici u zemlji. Naravno, iz razloga vremena i troškova bilo bi nemoguće pitati svakog radnika kolika mu je godišnja plaća. Trebalo bi dugo ili bi nam trebalo puno resursa.

U ovom se trenutku pojavljuje koncept statističkog uzorka. Umjesto da pitamo milijune radnika u nekoj zemlji ili regiji, mi prikupljamo samo malu količinu podataka. Primjerice, pitali smo 100 000 ljudi. Ovaj je zadatak još uvijek složen, ali mnogo je povoljnije tražiti 100 000 ljudi nego 30 milijuna.

Ova mala količina podataka mora biti reprezentativna. Odnosno, mora adekvatno predstavljati stanovništvo. Ako je 100 000 ljudi koje smo pitali koncentrirano u bogatim četvrtima, dobit ćemo podatke koji nisu reprezentativni. Prosječna plaća bila bi puno veća nego što stvarno jest.

Karakteristike reprezentativnog statističkog uzorka

Ako želite dobro istražiti, kvaliteta statističkog uzorka je presudna. Beskorisno je izvoditi najsloženije statističke metrike s najsofisticiranijim modelima ako je statistički uzorak pristran. Odnosno, ako uzorak nije reprezentativan.

Prilikom dobivanja reprezentativnog uzorka postoje određeni aspekti koje istraživač mora znati unaprijed. Među tim su aspektima karakteristike reprezentativnog uzorka. Karakteristike reprezentativnog uzorka su sljedeće:

  • Dovoljno velika veličina: Kada radimo s uzorcima, obično radimo s količinom podataka koja je manja od populacije. Međutim, da bi statistički uzorak bio reprezentativan, on mora biti dovoljno velik da se može smatrati reprezentativnim. Primjerice, ako se naša populacija sastoji od 10 milijuna podataka, a mi odaberemo 10, teško joj je biti reprezentativna. Naravno, veći uzorak nije uvijek reprezentativniji.
  • Slučajnost: Odabir podataka iz statističkog uzorka mora biti slučajan. Odnosno, mora biti potpuno slučajno. Ako umjesto da to učinimo nasumično, provedemo planirani postupak odabira podataka, uvodimo pristranost u prikupljanju podataka. Stoga, da bismo izbjegli pristranost uzorka i, prema tome, da bismo ga učinili reprezentativnim uzorkom, moramo izvršiti slučajni odabir.

Statističko zaključivanje

Jednom dobiveni reprezentativni uzorak tada je potrebno zaključiti određene mjerne podatke. Često nas zanima saznanje određene mjere varijable. U početnom primjeru varijabla bi bila plaća građana neke zemlje. U tom smislu, mjerni podatak koji želimo analizirati je prosječna plaća građana neke zemlje.

Drugim riječima, imamo podatkovnu populaciju koju čine svi radnici u Meksiku. Iz ove populacije dobivamo varijablu, odnosno godišnju plaću. Korištenjem odgovarajućih tehnika dobivamo reprezentativni uzorak. I na kraju, nakon što imamo skup podataka s kojim možemo raditi, koristimo tehnike statističkog zaključivanja za izračunavanje srednje plaće.

Naravno, nakon što skupimo podatke, mogli bismo zaključiti i o drugim mjerama. Primjerice, kako se raspodjeljuje plaća, koliki je postotak radnika ispod određene plaće ili kolika je razlika u plaći.

Primjer statističkog uzorka

Pretpostavimo da želimo provesti studiju o prosječnom trošku kolumbijskih obitelji u mjesecu siječnju. Za to imamo dvije mogućnosti:

  1. Unesite bankovne račune svih obitelji u Kolumbiji
  2. Pitajte reprezentativni broj ljudi

Prva opcija nije održiva iz nekoliko razloga. Prvo, da se obitelji neće odreći svojih podataka, a drugo da ni obitelj ne bismo mogli ići obitelji gledajući podatke. Uglavnom zato što stanovništvo Kolumbije iznosi blizu 50 milijuna. U međuvremenu, druga je mogućnost prikupljanja statističkog uzorka.

Ono što ćemo učiniti, slijedeći gore spomenute karakteristike, tražit ćemo 100 000 obitelji. Nešto je složeno, ali mnogo je lakše nego tražiti 50 milijuna Kolumbijaca. Razlika je znatna. Stoga ćemo na temelju uzorka od 100 000 obitelji pokušati izračunati prosječne izdatke obitelji u siječnju.

Izvučeni podaci bit će manje-više pouzdani prema nizu mjernih podataka koji se uzimaju u obzir u statističkim istraživanjima. Naravno, ove su vrste mjernih podataka naprednije i stoga ih ovdje nećemo raspravljati.