Relevantna varijabla izostavljena

Izostavljanje relevantne varijable je neuključivanje važne objašnjavajuće varijable u regresiju. S obzirom na Gauss-Markovljeve pretpostavke, ovaj bi propust uzrokovao pristranost i nedosljednost u našim procjenama.

Drugim riječima, do izostanka relevantne varijable dolazi kada je ugradimo u pojam pogreške u, jer je ne uzimamo u obzir. To će uzrokovati korelaciju između ovisne varijable i pojma pogreške u.

Matematički pretpostavljamo da:

Cov (x, u) = 0

Ako u pojam pogreške uvrstimo relevantnu varijablu ili, zatim:

Cov (x, u) ≠ 0

S obzirom na Gauss-Markovljeve pretpostavke, ova korelacija:

(ρ (x, u) ≠ 0)

To ne bi ispunilo sljedeće:

E (u | x) = E (u) = 0

Odnosno, očekivanje pogrešaka uvjetovanih objašnjenjima jednako je očekivanju pogreške i da je također nula. To su pretpostavke nepristranosti (stroga egzogenost + nula vrijednost)

U slučajevima izostavljanja relevantne varijable, OLS procjenitelj je pristran i postaje nedosljedan. Dakle, krši dva svojstva procjenitelja i uzrokuje pogrešnu procjenu.

Teorijski primjer

Pretpostavljamo da želimo proučiti broj sezonskih skijaša (t) uzimajući u obzir nekoliko čimbenika: cijenu skijaških karata (skijaške karte) i broj otvorenih staza (staze) i kvalitetu snijega (snijeg).

Model 0

Pretpostavljamo da su objašnjene varijable (skijaške karte, staze i snijeg) relevantne varijable za model 0 jer pripadaju populacijskom modelu. Drugim riječima, objašnjene varijable našeg modela 0 imaju djelomičan učinak na zavisne varijable skijaša u populacijskom modelu. Tada će i modeli populacije i uzorci (model 0) imati koeficijente različite od nule.

Tumačenje

Porast kvalitete snijega (snijega) i broja otvorenih staza (staza) uzrokuje porast procjena β2 i β3. Posljedično, to se odražava na broj skijaša (skijaša).

Procentualno povećanje cijena skijaških karata uzrokuje smanjenje β1/ 100 u broju skijaša (skijaša)

Postupak

Varijablu snijega tretiramo kao izostavljenu varijablu iz modela. Zatim:

Model 1

Pojam pogreške u razlikujemo od modela 0 i pojam pogreške v od modela 1 jer jedan ne uključuje relevantnu varijablu snijeg, a drugi to čini.

U modelu 1 izostavili smo relevantnu varijablu iz modela i uveli je u pojam pogreške u. Ovo znači to:

  • Cov (snijeg, v) ≠ 0 → ρ (snijeg, v) ≠ 0
  • E (v | snijeg) ≠ 0

Ako u našem modelu 1 izostavimo relevantnu varijabilnu sniježnu vrijednost, procijenit ćemo da OLS procjenitelj pokazuje pristranost i nedosljednost. Tako da će naša procjena broja sezonskih skijaša biti pogrešna. Skijalište bi moglo imati ozbiljnih financijskih problema ako uzmete u obzir našu procjenu modela 1.