Gauss-Markov teorem skup je pretpostavki koje mora provoditi OLS (redovni najmanji kvadrati) da bi se mogao smatrati ELIO (optimalnim linearnim nepristranim procjeniteljem). IGauss-Markov teorem formulirali su Carl Friederich Gauss i Andrei Markov.
Carl Friederich Gauss i Andréi Márkov utvrdili su neke pretpostavke kako bi OLS procjenitelj mogao postati ELIO.
Ako su ovih 5 pretpostavki ispunjene, možemo potvrditi da je procjenitelj onaj s minimalnom varijancom (najpreciznijom) svih linearnih i nepristranih procjena. U slučaju da bilo koja od pretpostavki o prve tri ne uspije (Linearnost, Nulto srednja stroga egzogenost ili Nema savršene multikolinearnosti), OLS procjenitelj više nije nepristran. Ako zakaže samo 4 ili 5 (homoscedastičnost i bez autokorelacije), procjenitelj je još uvijek linearan i nepristran, ali više nije najtočniji. Rezimirajući, Gauss-Markov teorem navodi da:
- Prema pretpostavkama 1, 2 i 3, OLS procjenitelj je linearan i nepristran. Sad, dok se ne ispune prve tri pretpostavke, može se osigurati da je procjenitelj nepristran. Da bi procjenitelj bio dosljedan, moramo imati velik uzorak, što više to bolje.
- Prema pretpostavkama 1, 2, 3, 4 i 5, OLS procjenitelj je linearan, nepristran i optimalan (ELIO).
Pretpostavke Gauss-Markova teorema
Konkretno, postoji 5 pretpostavki:
1. Linearni model u parametrima
Prilično je fleksibilna pretpostavka. Omogućuje upotrebu funkcija varijabli od interesa.
2. Nulta srednja i stroga egzogenost
Podrazumijeva da je srednja vrijednost pogreške uvjetovana objašnjenjima jednaka bezuvjetnoj očekivanoj vrijednosti i jednaka nuli. Nadalje, stroga egzogenost zahtijeva da pogreške modela ne budu povezane s bilo kojim opažanjima.
Nula znači:
Stroga egzogenost:
Nulta vrijednost i stroga egzogenost propadaju ako:
- Model je slabo specificiran (na primjer, izostavljanje relevantnih varijabli).
- U varijablama postoje pogreške u mjerenju (podaci nisu pregledani).
- U vremenskim serijama stroga egzogenost ne uspijeva u modelima odgođene endogenosti (iako istodobna egzogenost može postojati) iu slučajevima kada postoje povratni učinci.
U podacima presjeka mnogo je lakše postići pretpostavku egzogenosti nego u slučaju vremenskih serija.
3. Nema točne multikolinearnosti
U uzorku niti jedna varijabla objašnjenja nije konstantna. Ne postoje točni linearni odnosi između objašnjavajućih varijabli. Ne isključuje neku (ne savršenu) korelaciju između varijabli. Prema Gaussu i Markovu, kada model ima točnu multikolinearnost, to je obično zbog pogreške analitičara.
4. Homoscedastičnost
Varijansa pogreške, a time i Y, neovisna je o objašnjenim vrijednostima i, osim toga, o varijansi konstantne pogreške. Matematički se izražava kao:
Evo niza podataka homoscedastičnog izgleda.
5. Nema autokorelacije
Izrazi pogrešaka dvaju različitih opažanja uvjetovanih X nisu povezani. Ako je uzorak slučajan, neće biti autokorelacije.
Gdje moram imati vrijednost različitu od h. Ako je uzorak slučajan, podaci i pogreške promatranja "i" i "h" bit će neovisni za bilo koji par opažanja "i" i "h".