Bayesov informativni kriterij

Bayesov informacijski kriterij ili Schwarzov kriterij metoda je koja se usredotočuje na zbroj kvadrata ostataka radi pronalaženja broja zaostalih razdoblja str koji minimiziraju ovaj model.

Drugim riječima, želimo pronaći minimalni broj zaostalih razdoblja koja uključujemo u autoregresiju kako bi nam pomogao s predviđanjem ovisne varijable.

Na taj ćemo način imati kontrolu nad brojem zaostalih razdoblja str koje uključujemo u regresiju. Kad prijeđemo ovu optimalnu razinu, Schwarzov model prestat će se smanjivati ​​i stoga smo dosegnuli minimum. Odnosno, doseći ćemo broj zaostalih razdoblja str koji minimaliziraju Schwarzov model.

Također se naziva Bayesov informacijski kriterij (BIC).

Preporučeni članci: autoregresija, zbroj kvadrata ostataka (SCE).

Bayesova formula informacijskog kriterija

Iako se na prvi pogled čini kao komplicirana formula, proći ćemo kroz dijelove da bismo je razumjeli. Prije svega, općenito moramo:

  • Logaritmi u oba čimbenika formule predstavljaju granični učinak uključivanja zaostalog razdoblja str više u samoregresiji.
  • N je ukupan broj promatranja.
  • Formulu možemo podijeliti na dva dijela: lijevi i desni dio.

Dio s lijeve strane:

Predstavlja zbroj kvadrata reziduala (SCE) autoregresijestr zaostala razdoblja, podijeljena s ukupnim brojem promatranja (N).

Za procjenu koeficijenata koristimo obične najmanje kvadrate (OLS). Dakle, kada uključimo nova zaostala razdoblja, SCE (p) se može samo održavati ili smanjivati.

Zatim, porast zaostalog razdoblja u autoregresiji uzrokuje:

  • SCE (p): smanjuje se ili ostaje konstantan.
  • Koeficijent određivanja: povećava se.
  • UKUPNI UČINAK: povećanje u zaostalom razdoblju uzrokuje smanjenje lijevog dijela formule.

Sada desni dio:

(p + 1) predstavlja ukupan broj koeficijenata u autoregresiji, odnosno regresore s njihovim zaostalim razdobljima (str) i presretanje (1).

Zatim, porast zaostalog razdoblja u autoregresiji uzrokuje:

  • (p + 1): povećava se jer uključujemo zaostalo razdoblje.
  • UKUPNI UČINAK: povećanje u zaostalom razdoblju uzrokuje povećanje desnog dijela formule.

Praktični primjer

Pretpostavljamo da želimo prognozirati cijeneskijaške karte za sljedeću sezonu 2020. s petogodišnjim uzorkom, ali ne znamo koliko kašnjenja koristiti: AR (2) ili AR (3)?

  • Preuzimamo podatke i izračunavamo prirodne logaritme cijena skijaške karte.

1. Procjenjujemo koeficijente pomoću OLS-a i dobivamo:

Zbroj kvadrata ostataka (SCE) za AR (2) = 0,011753112

Koeficijent utvrđivanja za AR (2) = 0,085

2. Dodamo još 1 zaostalo razdoblje da vidimo kako se mijenja SCE:

Zbroj kvadrata ostataka za AR (3) = 0,006805295

Koeficijent utvrđivanja za AR (3) = 0,47

Vidimo da kada dodamo zaostalo razdoblje u autoregresiji, koeficijent determinacije se povećava, a SCE se smanjuje u ovom slučaju.

  • Izračunavamo Bayesov informacijski kriterij:

Što je BIC model manji, to je model poželjniji. Tada bi AR (3) bio preferirani model u odnosu na AR (2) s obzirom na to da je njegov koeficijent utvrđenosti veći, SCE niži i Schwarzov model ili Bayesov informativni kriterij također niži.