AnaLIZA STATYSTYCZNA 8 wykład8, 1


  1. Badanie zależności statystycznych z wykorzystaniem opcji Statystyki|Regresja|Liniowa

Interesuje nas identyfikacja zależności o postaci

0x01 graphic

lub, ogólnie, o postaci

0x01 graphic

gdzie Y jest zmienną zależną (objaśnianą), zmienne x1,..,xkzmiennymi niezależnymi (objaśniającymi), zaś jest zmienną losową zakłócającą o rozkładzie normalnym.

Na podstawie analizy danych należy oszacować parametry tego modelu.

Wstępna analiza: pole rozrzutu (Wykresy|Rozrzutu..)

0x01 graphic

Punkty na polu rozrzutu powinny układać się na linii prostej.

Jest to warunek wystarczający, by wyznaczyć parametry prostej regresji.

Warunki poprawności wnioskowania statystycznego:

Istotne przypadki zakłóceń:

Uwaga: Ta sama funkcja regresji może być wyznaczona dla różnych układów punktów (przykład: tzw. „kwartet Anscombe'a”).

Wykresy: Wykresy|Interaktywne|Rozrzutu...

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

W powyższych przypadkach równanie regresji wynosi:

0x01 graphic
,

zaś współczynnik korelacji wynosi 0,816.

  1. Analiza funkcji regresji

2.1 Ustalanie zmiennych

    1. Obliczane statystyki: współczynniki regresji (oszacowania, przedziały ufności, macierz kowariancji), statystyki dopasowania modelu, statystyki opisowe, statystyki do analizy reszt

    2. Wykresy: histogram zmiennej zależnej, wykresy rozrzutu

    3. Estymacja parametrów równania regresji

0x01 graphic

Parametry równania regresji

0x01 graphic

0x01 graphic

0x01 graphic

Analiza dopasowania modelu

0x01 graphic

R - współczynnik korelacji (wielokrotnej).

R-kwadrat (R2) - proporcja zmienności zmiennej zależnej „wyjaśniana” przez zmienność zmiennych niezależnych (współczynnik determinacji).

Analiza wariancji: weryfikacja hipotezy o istotności regresji

0x01 graphic

Diagnostyka: wskazanie obserwacji, które w znacznym stopniu odbiegają od swoich „przewidywanych” wartości.

0x01 graphic

Statystyki reszt: do analizy zgodności obserwacji z założeniami modelu regresji liniowej

0x01 graphic

    1. Przypadek wielu zmiennych niezależnych

Badanie korelacji:

0x01 graphic

Uwaga: Zmienne niezależneskorelowane - występuje efekt współliniowości. Model może być niestabilny! Powoduje to wzrost wariancji oszacowań parametrów.

Estymacja parametrów:

0x01 graphic

0x01 graphic

Cząstkowe wykresy regresji (zmienne są standaryzowane).

0x01 graphic

0x01 graphic

    1. Dobór zmiennych w przypadku wielu zmiennych niezależnych (więcej niż dwie zmienne niezależne)

Metody:

Jeżeli zmienne niezależne są skorelowane, to stosowanie różnych metod może prowadzić do różnych zestawów użytych zmiennych niezależnych.

Przykład 1: zastosowanie metody wprowadzania (dane wprowadzane blokami)

0x01 graphic

0x01 graphic

Estymacja parametrów

0x01 graphic

Przykład 2: zastosowanie metody krokowej (dane wprowadzane blokami)

0x01 graphic

0x01 graphic

0x01 graphic

  1. Nieparametryczne metody statystyczne - opcja

Statystyki|Testy nieparametryczne

3.1 Test chi-kwadrat

Służy do weryfikacji hipotez o zgodności danych (pogrupowanych) z założonym rozkładem prawdopodobieństwa. Należy podać „teoretyczne” wartości oczekiwane liczby obserwacji dla każdej grupy.

    1. Test dwumianowy

Stosowany dla danych dychotomicznych. Podaje się „teoretyczne” prawdopodobieństwo obserwacji danych o zadanej wartości, a następnie sprawdza, czy zaobserwowane dane odpowiadają takiemu prawdopodobieństwu.

    1. Test serii

Stosowany dla danych dychotomicznych. Sprawdza losowość serii danych, tzn. czy sekwencja kolejnych danych jest przypadkowa.

    1. Test Kołmogorowa-Smirnowa dla jednej próby.

Służy do weryfikacji hipotezy czy dane można opisać następującymi rozkładami:

0x01 graphic

    1. Testy dla dwu prób niezależnych

Weryfikuje się hipotezę, że dane należące do dwu grup opisane są tym samym rozkładem prawdopodobieństwa.

Należy podać zmienną testowaną oraz zmienną grupującą. Dla zmiennej grupującej należy określić dwie jej wartości, które określą porównywane grupy danych.

Wykorzystuje się nieparametryczne testy:

Test rang Manna-Whitneya

0x01 graphic

0x01 graphic

Test Mosesa

0x01 graphic

Test Kołmogorowa-Smirnowa dla dwu prób

0x01 graphic

Test serii Walda-Wolfowitza

0x01 graphic

Dużo wiązań! Trudno ocenić, czy rozkłady są takie same.

    1. Testy dla K prób niezależnych

Weryfikuje się hipotezę, że dane należące do K grup opisane są tym samym rozkładem prawdopodobieństwa.

Należy podać zmienną testowaną oraz zmienną grupującą.

Wykorzystuje się nieparametryczne testy:

Test Kruskala-Wallisa

0x01 graphic

0x01 graphic

    1. Testy dla dwu prób zależnych

0x01 graphic

0x01 graphic

    1. Testy dla K prób zależnych

O.Hryniewicz: Analiza statystyczna - komputery (8 godz.) 94



Wyszukiwarka