Badanie jakości związku regresyjnego, matematyka, Matematyka. Prawdopodobienstwo i Statystyka


Badanie jakości związku regresyjnego

Estymacja wariancji składnika losowego.

Przypomnijmy, że przez 0x01 graphic
oznaczamy wariancję składnika (błędu) losowego w modelu regresji. Z założenia wariancja 0x01 graphic
jest jednakowa dla wszystkich obserwacji.

0x08 graphic
Wariancję składnika losowego 0x01 graphic
uważa się za miarę rozproszenia obserwacji wokół "powierzchni" regresji. "Powierzchnią" regresji nazywamy zbiór wszystkich wartości teoretycznych w modelu regresji. Dla 0x01 graphic
jest to prosta, a dla 0x01 graphic
płaszczyzna. Ogólnie mówiąc, im mniejsza jest wariancja składnika losowego 0x01 graphic
, tym obserwacje bliżej układają się "powierzchni'' regresji (zob. rysunki dla 0x01 graphic
).

0x08 graphic

Zwykle wariancja składnika losowego 0x01 graphic
jest nieznana i oszacowuje się ją na podstawie obserwacji. Estymatorem wielkości 0x01 graphic
jest statystyka 0x01 graphic
nazywana wariancją resztową albo średnim kwadratowym błędem (MSE - mean square error). Oblicza się ją korzystając ze wzoru

0x01 graphic
.

Pierwiastek kwadratowy 0x01 graphic
nazywa się standardowym błędem (szacunku).

Przykład 6.1 (Inflacja 2000) (kontynuacja przykładu 5.1). W szczególnym przypadku 0x01 graphic
korzystamy ze wzorów

0x01 graphic
,

0x01 graphic

Ponieważ 0x01 graphic
, 0x01 graphic
i 0x01 graphic
, więc 0x01 graphic
, 0x01 graphic
oraz 0x01 graphic
.

Przykład 6.2 (Reklama).(kontynuacja przykładu 5.2).

Z wydruku

PODSUMOWANIE - WYJŚCIE

Statystyki regresji

Wielokrotność R

0,980326

R kwadrat

0,96104

Dopasowany R kwadrat

0,949908

Błąd standardowy

1,91094

Obserwacje

10

ANALIZA WARIANCJI

df

SS

MS

F

Istotność F

Regresja

2

630,5381

315,2691

86,33504

1,17E-05

Resztkowy

7

25,56185

3,651693

Razem

9

656,1

odczytujemy

0x01 graphic
oraz 0x01 graphic
.

6.2 Współczynnik determinacji.

Średni błąd kwadratowy 0x01 graphic
zależy od wymiaru (jednostki) danych, w jednych sytuacjach ta sama wartość liczbowa błędu 0x01 graphic
może być uznana za małą, a w innych za dużą. Potrzebujemy więc miary (względnej), która pozwalałaby na porównanie dopasowania do danych różnych modeli. Taką miarą jest współczynnik determinacji 0x01 graphic
.

Współczynnik determinacji 0x01 graphic
jest opisową miarą dopasowania modelu regresji do danych, czyli miarą siły liniowego związku między danymi. Mierzy on część zmienności zmiennej objaśnianej y, która została wyjaśniona liniowym oddziaływaniem zmiennych objaśniających 0x01 graphic
. Oblicza się go ze wzoru

0x01 graphic
.

Współczynnik determinacji przyjmuje wartości z zakresu od 0 do 1. Przy czym, gdy

0x01 graphic
- dane leżą dokładnie na "płaszczyźnie" regresji (zmienność jest wyjaśniona w 100 %);

0x01 graphic
- regresja niczego nie wyjaśnia, dane są nieskorelowane;

0x01 graphic
- "płaszczyzna" regresji jest tym lepiej dopasowana do danych, im współczynnik determinacji 0x01 graphic
jest bliższy jedności.

Można, na przykład, przyjąć następującą interpretację:

0x01 graphic
- dopasowanie bardzo dobre,

0x01 graphic
- dopasowanie dobre,

0x01 graphic
- dopasowanie zadawalające w niektórych zastosowaniach.

Zwróćmy także uwagę, ze mówimy, np.: "regresja wyjaśnia 93 % zmienności, gdy 0x01 graphic
".

Zwiększenie liczby k zmiennych objaśniających zwiększa wartość współczynnika determinacji 0x01 graphic
, gdyż jest on niemalejącą funkcją liczby zmiennych objaśniających. Utrudnia to porównywanie modeli regresji w oparciu o wartości współczynnika 0x01 graphic
. Wprowadzono więc tzw. skorygowany współczynnik determinacji, który nie ma tej wady. Definiuje siego wzorem

0x01 graphic

Skorygowany współczynnik determinacji wykorzystuje się w przypadku porównywania modeli regresji opartych o te same dane statystyczne, ale zawierających różne liczby zmiennych objaśniających.

Przykład 6.1 (Inflacja 2000) (kontynuacja). W szczególnym przypadku 0x01 graphic
, współczynnik determinacji oblicz się ze wzoru

0x01 graphic
.

Ponieważ 0x01 graphic
, 0x01 graphic
, 0x01 graphic
, więc

0x01 graphic
.

Regresja wyjaśnia prawie 97 % zmienności, dopasowanie modelu jest więc bardzo dobre.

W przypadku 0x01 graphic
skorygowany współczynnik determinacji jest równy współczynnikowi determinacji 0x01 graphic
.

Przykład 6.2 (Reklama).(kontynuacja przykładu 5.2).

Z wydruku

Statystyki regresji

Wielokrotność R

0,980326

R kwadrat

0,96104

Dopasowany R kwadrat

0,949908

Błąd standardowy

1,91094

Obserwacje

10

odczytujemy

0x01 graphic
oraz 0x01 graphic
.

Regresja wyjaśnia 96 % zmienności, dopasowanie modelu jest więc bardzo dobre.

Badanie jakości związku regresyjnego

więcej materiałów i notatek na www.wkuwanko.pl

0x01 graphic

0x01 graphic

2



Wyszukiwarka

Podobne podstrony:
zadania - zmienne losowe, matematyka, Matematyka. Prawdopodobienstwo i Statystyka
Excel dla statystyków. Wskazówki i ostrzeżenia, matematyka, Matematyka. Prawdopodobienstwo i Statyst
6-Sprawdzanie jakości związku regresyjnego, # Studia #, Ekonometria
Kordecki W, Jasiulewicz H Rachunek prawdopodobieństwa i statystyka matematyczna Przykłady i zadania
RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA wprowadzenie
statystyka - prawdopodobienstwo, statystyka matematyczna(1)
Kotłowska M Rachunek prawdopodobieństwa i statystyka matematyczna
Metody statystyczne cw1, Matematyka, Kombinatoryka, prawdopodobieństwo, statystyka, metody statystyc
Rachunek prawdopodobienstwa-1, Statystyka matematyczna
Metody statystyczne 2010 poblem1, Matematyka, Kombinatoryka, prawdopodobieństwo, statystyka, metody
Metody statystyczne cw4, Matematyka, Kombinatoryka, prawdopodobieństwo, statystyka, metody statystyc
Metody statystyczne cw2, Matematyka, Kombinatoryka, prawdopodobieństwo, statystyka, metody statystyc
Analiza regresji między dwiema zmiennymi, statystyka matematyczna(1)
Wartości krytyczne t, Matematyka, Kombinatoryka, prawdopodobieństwo, statystyka, stata
Metody statystyczne 2010 poblem2, Matematyka, Kombinatoryka, prawdopodobieństwo, statystyka, metody

więcej podobnych podstron