Multikolinearnost je snažna veza linearne ovisnosti između više od dvije objašnjavajuće varijable u višestrukoj regresiji koja krši Gauss-Markovljevu pretpostavku kad je točna.
Drugim riječima, multikolinearnost je visoka korelacija između više od dvije objašnjene varijable.
Naglašavamo da linearni odnos (korelacija) između objašnjavajućih varijabli mora biti jak. Vrlo je često da se objašnjavajuće varijable regresije koreliraju. Dakle, treba istaknuti da taj odnos mora biti snažan, ali nikad savršen, da bi se mogao smatrati slučajem multikolinearnosti. Linearni odnos bio bi savršen da je koeficijent korelacije 1.
Kad se ovaj snažni linearni (ali ne i savršeni) odnos dogodi samo između dvije objašnjavajuće varijable, kažemo da je to slučaj kolinearnosti. Multikolinearnost bi bila kada se snažna linearna veza dogodi između više od dvije neovisne varijable.
Gauss-Markova pretpostavka o točnoj ne-multikolinearnosti definira da objašnjavajuće varijable u uzorku ne mogu biti konstantne. Nadalje, ne bi trebalo postojati točni linearni odnosi između objašnjavajućih varijabli (ne bi trebala postojati točna multikolinearnost). Gauss-Markov nam ne dopušta točnu multikolinearnost, ali približava multikolinearnost.
Regresijska analizaPrijave
Postoje vrlo konkretni slučajevi, obično nerealni, u kojima su regresijske varijable potpuno međusobno nepovezane. U tim slučajevima govorimo o egzogenosti objašnjavajućih varijabli. Društvene znanosti općenito su poznate po tome što u svoje regresije uključuju približnu multikolinearnost.
Točna multikolinearnost
Točna multikolinearnost događa se kada je više od dvije neovisne varijable linearna kombinacija drugih neovisnih varijabli u regresiji.
Problemi
Kada Gauss Markov zabranjuje točnu multikolinearnost, to je zato što ne možemo dobiti procjenu redovnih najmanjih kvadrata (OLS).
Matematički izražavajući procijenjeni beta sub-i u matričnom obliku:
Dakle, ako postoji točna multikolinearnost, to uzrokuje da matrica (X'X) ima odrednicu 0 i, prema tome, ne može biti obrnuta. Neokretljivost podrazumijeva nemogućnost izračuna (X'X)-1 a prema tome niti procijenjena Beta pod-i.
Približna multikolinearnost
Približna multikolinearnost događa se kada više od dvije neovisne varijable nisu točno (aproksimacija) linearna kombinacija drugih neovisnih varijabli u regresiji.
Varijabla k predstavlja slučajnu varijablu (neovisnu i identično raspoređenu (i.i.d)). Učestalost vaših promatranja može se na zadovoljavajući način približiti standardnoj normalnoj raspodjeli sa srednjom vrijednosti 0 i varijancom 1. Budući da je riječ o slučajnoj varijabli, to podrazumijeva da će u svakom opažanju i vrijednost k biti različita i neovisna o bilo kojoj prethodnoj vrijednosti.
Problemi
Matematički izraz u matričnom obliku:
Dakle, ako postoji približna multikolinearnost, to dovodi do toga da je matrica (X'X) približno 0, a koeficijent determiniranosti vrlo blizu 1.
Riješenje
Multikolinearnost se može smanjiti uklanjanjem regresora varijabli s visokim linearnim odnosom između njih.
Koeficijent linearne korelacije