52
3.7 Analiza regresji
Twierdzenie 3.44. Załóżmy, że zmienna x jest deterministyczna i obserwo-walna, zmienna Y - losowana i obserwowalna, e - losowa i nieob$envmvalna i istnieje zależność (3.136). Wtedy:
1. (Nl) jeśli €isą niezależnymi zmiennymi losowymi o rozkładzie N(0,<r2), to estymatory bo ibi są EN MW dla parametrów bo ibi,
2. (N2) jeśli założymy tylko, że £i,... ,£n są zmiennymi losowymi takimi, że
Es,- = 0 i Var£f = o2 dla i = 1,2,... ,n oraz Co\ {e i, Sj) = 0, to estymatory bo i b\ mają minimalną wariancję pośród wszystkich nieobciążonych estymatorów liniowych tych parametrów, tzn. pośi'ód esttjmatorów o postaci co 4- czyb zależnych liniowo od obserwacji.
Druga część tego twierdzenia nosi nazwę twierdzenia Gaussa-Markowa.
Niech
Yi=biXi + bo. (3.143)
Wartość Yf nazywać będziemy przewidywaną wartością zmiennej objaśnianej (zależnej). Ze względu na fakt, iż w (3.143) wykorzystujemy tylko estymatory parametrów bo i &i (a nie nieznane, dokładne wartości tych parametrów), wartości Y( mogą leżeć w pewnej odległości od Yf (obserwowanych wartości zmiennej zależnej) i y,- (nieobserwowanych wartości zmiennej zależnej, na które nie wpływa błąd losowy). Wielkości
ii = Yi-Yi = Yi- hXi - bo (3.144)
nazywamy resztami. Znowu należy podkreślić, że reszty (różnica między zaobserwowaną a przewidywaną wartością zmiennej zależnej) są czymś „zbliżonym” ale innym niż błędy, tzn.
£i = Yi — b\Xi — bo ■ (3.145)
Równanie (3.143) może w prosty sposób posłużyć do predykcji (czyli prognozowania) wartości zmiennej zależnej. Przypuśćmy, że mamy daną nową wartość zmiennej niezależnej xo■ Jeśli znamy postać równania (3.143) (czyli model analizy regresji), to nie musimy wykonywać odpowiedniego eksperymentu, żeby dokonać pomiaru Yo- Wystarczy obliczyć
Yo = b\xo -I- bo (3.146)
i jeśli nasz model analizy regresji jest „odpowiednio dobrze dobrany” wartość Yo powinna być „dostatecznie bliska” wartości Yo. Co więcej, możemy również podać pewne liczbowe oszacowanie błędu, który popełniamy „zgadując” wartość Yo- Ze względu na skomplikowaną postać odpowiednie wzory na to oszacowanie nie zostaną tutaj podane.
Przykład 3.45. Załóżmy, że opracowano model obrazujący wielkość wpływów otrzymywanych przez budżet państwa w zależności od przyjętego, pojedynczego progu podatkowego. Zamiast wprowadzać w życie nowy próg w celu sprawdzenia „co się stanie?”, wystarczy wtedy dokonać predykcji (prognozy) i „zgadnąć” wielkość wpływów dla tego nowego progu.