11 regresja liniowa bis, Wariancja empirycznych współczynników a i b regresji liniowej


Wariancja empirycznych współczynników a i b regresji liniowej

Rozpatrzona zostanie sytuacja, gdy niepewnościami obarczone są jedynie wartości yi (prosta regresji cechy Y względem X, przypadek I). Ponadto wyprowadzone wzory końcowe (9) i (12) są nieobciążonymi estymatorami odpowiednich wariancji i obowiązują dla próbki o dużej liczebności.

Niech di=yi-axi-b będą odchyleniami wartości doświadczalnych od prostej regresji. Nieobciążony estymator wariancji zmiennej y, traktowanej jako zmienna niezależna y=f(x), jest określony równaniem

0x01 graphic
(1)

Wariancję wartości średniej 0x01 graphic
obliczamy jak dla zwykłej średniej, dlatego

0x01 graphic
(2)

Równanie (1) można przekształcić do rachunkowo wygodniejszej postaci

0x01 graphic
(3)

Wariancję współczynnika kierunkowego regresji liniowej a obliczamy jako wariancję wielkości mierzonej pośrednio, przyjmując, że a jest funkcją yi. Zatem

0x01 graphic
(4)

Pamiętając, że

0x01 graphic

to 0x01 graphic
(5)

oraz 0x01 graphic
(6)

Podstawiając (6) do (4), otrzymamy

0x01 graphic
(7)

Sumowania po indeksach i oraz k są równoważne, bo są to sumowania po tych samych wartościach. Zamiast k można wstawić i, a następnie wykonać odpowiednie redukcje, dostając

0x01 graphic
(8)

Podstawiając (3) do (8) otrzymamy ostatecznie

0x08 graphic
0x01 graphic
(9)

Wariancję współczynnika przesunięcia b regresji liniowej obliczymy z wzoru na wariancję wielkości mierzonej pośrednio, przyjmując, że jest on funkcją 0x01 graphic
i a: 0x01 graphic
. Dlatego

0x01 graphic
(10)

Pochodne cząstkowe wyrażają się wzorami 0x01 graphic

Dlatego wzór (10) przyjmie postać

0x01 graphic
(11)

0x08 graphic
Podstawiając (2) do (11) i wykonując stosowne przekształcenia otrzymamy ostatecznie

0x01 graphic
(12)

Estymacja przedziałowa współczynnika kierunkowego α prostej regresji y=αx+β cechy Y względem X

0x08 graphic
Na podstawie danej próbki realizację przedziału ufności dla współczynnika α, na poziomie ufności (1-α), wyznacza się ze wzoru

0x01 graphic

gdzie 0x01 graphic
,

tν,α jest wartością krytyczną zmiennej losowej Studenta dla ν=(n-2) stopni swobody (patrz rysunek obok). Wyrażenie na wartość współczynnika a podane zostało na poprzednim wykładzie.

Estymacja przedziałowa współczynnika przesunięcia β prostej regresji y=αx+β cechy Y względem X

Realizację przedziału ufności dla współczynnika β, na poziomie ufności (1-α), wyznacza się ze wzoru

0x01 graphic

gdzie

0x01 graphic

a pozostałe symbole mają podobny sens jak w poprzednim punkcie.

Obszar ufności dla prostej regresji liniowej

Współczynniki regresji liniowej a i b obarczone są niepewnościami Sa i Sb, dlatego prosta regresji nie jest jednoznacznie określona. Wariancja (2) jest miarą niepewności jednego punktu prostej regresji o współrzędnych 0x01 graphic
i może ona być łatwo obliczona z równoważnego wzoru

0x01 graphic
(13)

.Chcemy znaleźć wariancję innych punktów prostej regresji. W tym celu dowolny punkt prostej 0x01 graphic
przedstawiamy w postaci

0x01 graphic

Z prawa przenoszenia wariancji mamy

0x01 graphic
(14)

Obliczmy pochodne cząstkowe

0x01 graphic
(15)

Podstawienie (15) do (14) da nam równanie na wariancje dowolnego punktu prostej

0x01 graphic
(16)

Jak widać ze wzoru (16) najmniejszą wariancję ma punkt środkowy 0x01 graphic
i rośnie ona z kwadratem odległości od punktu środkowego. Dla małych prób, przy obliczaniu odchylenia standardowego trzeba stosować rozkład Studenta, czyli w praktyce odchylenie standardowe należy pomnożyć przez współczynnik Studenta tν,α odczytany dla poziomu istotności α i o ν=n-2 stopniach swobody (rysunek na poprzedniej stronie). Przedział ufności dla dowolnego punktu prostej regresji zapiszemy zatem następująco

0x01 graphic
. (17)

0x08 graphic
Szerokość przedziału ufności podobnie jak wariancja rośnie wraz z odchyleniem od punktu środkowego prostej regresji. Obwiednie punktów wyznaczonych przedziałami ufności (17) dla różnych punktów xi nazywamy krzywymi ufności prostej regresji liniowej. Dwie pary krzywych ufności, na poziomie ufności 1-α=0.98 i 0.80 przedstawione są na rysunku obok. Obszar zawarty między krzywymi ufności nazywamy realizacją obszaru ufności dla prostej regresji na poziomie ufności 1-α.



Wyszukiwarka