Izostavljanje relevantne varijable je neuključivanje važne objašnjavajuće varijable u regresiju. S obzirom na Gauss-Markovljeve pretpostavke, ovaj bi propust uzrokovao pristranost i nedosljednost u našim procjenama.
Drugim riječima, do izostanka relevantne varijable dolazi kada je ugradimo u pojam pogreške u, jer je ne uzimamo u obzir. To će uzrokovati korelaciju između ovisne varijable i pojma pogreške u.
Matematički pretpostavljamo da:
Cov (x, u) = 0
Ako u pojam pogreške uvrstimo relevantnu varijablu ili, zatim:
Cov (x, u) ≠ 0
S obzirom na Gauss-Markovljeve pretpostavke, ova korelacija:
(ρ (x, u) ≠ 0)
To ne bi ispunilo sljedeće:
E (u | x) = E (u) = 0
Odnosno, očekivanje pogrešaka uvjetovanih objašnjenjima jednako je očekivanju pogreške i da je također nula. To su pretpostavke nepristranosti (stroga egzogenost + nula vrijednost)
U slučajevima izostavljanja relevantne varijable, OLS procjenitelj je pristran i postaje nedosljedan. Dakle, krši dva svojstva procjenitelja i uzrokuje pogrešnu procjenu.
Teorijski primjer
Pretpostavljamo da želimo proučiti broj sezonskih skijaša (t) uzimajući u obzir nekoliko čimbenika: cijenu skijaških karata (skijaške karte) i broj otvorenih staza (staze) i kvalitetu snijega (snijeg).
Model 0
Pretpostavljamo da su objašnjene varijable (skijaške karte, staze i snijeg) relevantne varijable za model 0 jer pripadaju populacijskom modelu. Drugim riječima, objašnjene varijable našeg modela 0 imaju djelomičan učinak na zavisne varijable skijaša u populacijskom modelu. Tada će i modeli populacije i uzorci (model 0) imati koeficijente različite od nule.
Tumačenje
Porast kvalitete snijega (snijega) i broja otvorenih staza (staza) uzrokuje porast procjena β2 i β3. Posljedično, to se odražava na broj skijaša (skijaša).
Procentualno povećanje cijena skijaških karata uzrokuje smanjenje β1/ 100 u broju skijaša (skijaša)
Postupak
Varijablu snijega tretiramo kao izostavljenu varijablu iz modela. Zatim:
Model 1
Pojam pogreške u razlikujemo od modela 0 i pojam pogreške v od modela 1 jer jedan ne uključuje relevantnu varijablu snijeg, a drugi to čini.
U modelu 1 izostavili smo relevantnu varijablu iz modela i uveli je u pojam pogreške u. Ovo znači to:
- Cov (snijeg, v) ≠ 0 → ρ (snijeg, v) ≠ 0
- E (v | snijeg) ≠ 0
Ako u našem modelu 1 izostavimo relevantnu varijabilnu sniježnu vrijednost, procijenit ćemo da OLS procjenitelj pokazuje pristranost i nedosljednost. Tako da će naša procjena broja sezonskih skijaša biti pogrešna. Skijalište bi moglo imati ozbiljnih financijskih problema ako uzmete u obzir našu procjenu modela 1.