AnaLIZA STATYSTYCZNA 8 wykład6, 1


  1. Analiza danych statystycznych z wykorzystaniem opcji Statystyka|Porównywanie średnich

    1. Porównywanie średnich w warstwach z wykorzystaniem opcji Statystyka|Porównywanie średnich|Średnie

Zadanie: Porównanie wartości średnich dla różnych grup wyników.

Założenie: Istnieje wiele zmiennych (o wartościach typu kategoria, nazywanych zmiennymi niezależnymi) indeksujących zmienną typu liczbowego nazywaną zmienną zależną.

Interesuje nas porównanie wartości średnich zmiennej zależnej uzyskanych dla różnych kombinacji wartości zmiennych niezależnych.

      1. Porównanie wykonywane oddzielnie dla każdej zmiennej niezależnej

Po obliczeniach uzyskamy tabele z wartościami średnimi każdej ze zmiennych zależnych uzyskanych dla różnych wartości każdej ze zmiennych niezależnych.

Na przykład: zmienną zależną jest Wynagrodzenie, a jedną ze zmiennych niezależnych jest Miejsce pracy (o trzech możliwych wartościach)

0x01 graphic

1.1.2 Porównywanie warstwami, dla różnych kombinacji wartości zmiennych zależnych.

Na przykład: zmienną zależną jest Wynagrodzenie, pierwszą ze zmiennych niezależnych jest Miejsce pracy (o trzech możliwych wartościach), a drugą zmienną niezależną (w drugiej warstwie) jest zmienna Płeć (o dwu możliwych wartościach).

Wyznaczone zostaną wartości średniego wynagrodzenia dla wszystkich kombinacji wartości zmiennych niezależnych.

0x01 graphic

1.1.3 Wyznaczane wartości statystyk:

Zestaw obliczanych statystyk określa się w podmenu Opcje głównego okna dialogowego.

Po zaznaczeniu dodatkowo (w submenu opcji) opcji ANOVA i eta oraz Test liniowości program SPSS dokonuje

Uwaga: Małe wartości (mniejsze od 0,05) obliczanego parametru o nazwie Istotność świadczą o konieczności odrzucenia hipotezy o niezależności zmiennej zależnej od zmiennej zależnej oraz o liniowej zależności średnich zmiennej zależnej od wartości zmiennej niezależnej).

0x01 graphic

R - współczynnik korelacji liniowej

R2 - do sprawdzenia liniowości (gdy bliskie zeru nie ma liniowej zależności; w naszym przykładzie 0,042 - co świadczy o braku liniowej zależności)

Eta - stosunek sumy kwadratów odchyleń pomiędzy grupami do całkowitej sumy kwadratów odchyleń

Eta2 - miernik pozwalający określić w jakim stopniu zmienność zmiennej niezależnej wyjaśnia zmienność zmiennej zależnej (w naszym przykładzie - w 11%).

    1. Porównywanie średnich z zadaną wartością z wykorzystaniem opcji

Statystyka|Porównywanie średnich|Test t dla jednej próby

Zadanie: Porównanie wartości średniej zmiennej liczbowej z pewną założoną wartością.

Założenie: Rozkład zmiennej liczbowej jest rozkładem normalnym (a przynajmniej symetrycznym).

W oknie dialogowym wybieramy analizowaną zmienną liczbową oraz założoną wartość średnią (wartość testowaną). Poziom ufności (domyślny 95%) ustalamy w submenu Opcje.

0x01 graphic

Hipotezę o równości wartości średniej i wartości testowanej odrzucamy gdy parametr Istotność przyjmuje małą wartość (<0,05) lub gdy przedział ufności dla różnicy średnich nie obejmuje zera.

Wyniki tego testu możemy wykorzystać do sprawdzania warunków typu wartość średnia mniejsza od wartości wymaganej lub wartość średnia większa od wartości wymaganej. W takim przypadku weryfikujemy hipotezę o równości analizowanej wartości średniej z wartością zadaną (wymaganą). Jeżeli cały przedział ufności dla różnicy średnich należy do zbioru liczb ujemnych to możemy uznać, że analizowana wartość średnia jest mniejsza od wartości wymaganej.

Analogicznie, jeżeli cały przedział ufności dla różnicy średnich należy do zbioru liczb dodatnich to możemy uznać, że analizowana wartość średnia jest większa od wartości wymaganej.

    1. Porównywanie średnich dla dwu niezależnych prób

Statystyka|Porównywanie średnich|Test t dla prób niezależnych

Zadanie: Porównanie wartości średnich zmiennej liczbowej dla różnych wartości zmiennej grupującej definiującej dwie różne próby.

Założenie: Rozkład zmiennej liczbowej jest rozkładem normalnym (a przynajmniej symetrycznym).

W oknie dialogowym wybieramy analizowaną zmienną liczbową oraz zmienną grupującą, której wartości ustalamy w submenu Definiuj grupy. Zmienna grupująca może mieć więcej niż dwie wartości, ale grupy definiujemy tylko dla dwu z nich. Zmienna grupującą może być także zmienna liczbowa, dla której określimy (ustalamy w submenu Definiuj grupy) punkt odcięcia dzielący zbiór danych na dwie podgrupy.

Najpierw wykonywany jest test Levene'a równości wariancji, a następnie test t-Studenta równości wartości średniej.

0x01 graphic

O równości wariancji świadczy duża (>0,05) istotność testu Levene'a.

O równości wartości średnich świadczy duża (>0,05) istotność testu t-Studenta. Jeżeli wariancje są równe należy korzystać z wyników testu t-Studenta dla równych wariancji. W takim przypadku mamy zwiększoną możliwość wykrycia różnic wartości średnich (tzw. większą moc testu).

1.4 Porównywanie średnich dla dwu zależnych prób

Statystyka|Porównywanie średnich|Test t dla prób zależnych

Zadanie: Porównanie wartości średnich zmiennej liczbowej dla dwu zmiennych liczbowych tworzących parę zmiennych zależnych.

Założenie: Rozkład zmiennej liczbowej jest rozkładem normalnym (a przynajmniej symetrycznym).

W oknie dialogowym wybieramy dwie zmienne liczbowe, które będą tworzyły porównywaną parę o wartościach zależnych dla każdej z analizowanych obserwacji. Do analizy możemy wybrać wiele takich par.

W wyniku obliczeń uzyskuje się:

0x01 graphic

Uwaga: mała wartość Istotności świadczy o konieczności odrzucenia hipotezy o braku zależności pomiędzy dwiema próbami.

  1. Porównywanie średnich dla wielu niezależnych prób

Statystyka|Porównywanie średnich|Jednoczynnikowa ANOVA

Zadanie: Porównanie wartości średnich zmiennej liczbowej dla różnych wartości zmiennej grupującej definiującej wiele różnych prób (Jednoczynnikowa Analiza Wariancji).

Założenie: Rozkład zmiennej liczbowej jest rozkładem normalnym (a przynajmniej symetrycznym). Wariancje w grupach są równe.

W oknie dialogowym wybieramy analizowaną zmienną liczbową oraz zmienną grupującą, która może mieć więcej niż dwie wartości.

Z submenu Opcje możemy wybrać możliwość wyznaczania wartości statystyk opisowych oraz przeprowadzenia testu Levene'a równości wariancji w grupach, a także uzyskać możliwość liniowego wykresu wartości średnich.

W wyniku przeprowadzonej analizy uzyskuje się wartość Istotności testu, że wartości średnie w grupach są równe. Mała wartość tego parametru (< 0,05) świadczy, że przynajmniej jedna wartość średnia różni się od pozostałych.

0x01 graphic

W powyższym przykładzie możemy przyjąć, że różnice pomiędzy analizowanymi średnimi nie są istotne.

Poszukiwanie średniej różniącej się od pozostałych

  1. Wykorzystanie analizy kontrastu do zaplanowania własnego testu.

Kontrast jest liniową kombinacją wartości średnich

0x01 graphic

gdzie

0x01 graphic

W przypadku równości średnich kontrast ma wartość równą zeru.

Dobierając współczynniki  przed wykonaniem testu ustalamy to, co chcemy ze sobą porównać.

Przykład

Mamy wyniki badań efektywności 3 lekarstw (oznaczone, odpowiednio, indeksami 1, 2 oraz 3) oraz wyniki badań grupy kontrolnej (oznaczonej indeksem 4).

Jeżeli chcemy porównać wyniki badania lekarstw nr 1 oraz nr 2 (traktowanych łącznie) z wynikami badania lekarstwa nr 3 przyjmujemy:  oraz .

Jeżeli chcemy porównać wyniki badania lekarstw nr 1, nr 2 oraz nr 3 (traktowanych łącznie) z wynikami badania grupy kontrolnej przyjmujemy:  oraz .

Kontrast definiujemy korzystając z submenu Kontrasty.. Do okienka o nazwie Współczynniki wpisujemy wartość kolejnego współczynnika , a następnie dodajemy go do listy naciskając przycisk Dodaj.

Możemy tworzyć i poddawać edycji wiele zestawów kontrastów wybierając odpowiednie z nich przyciskami Następny oraz Poprzedni

Uwaga: Liczba współczynników kontrastu musi być równa liczbie wartości zmiennej grupującej.

Przeprowadzany test statystyczny weryfikuję hipotezę, czy wartość zdefiniowanego kontrastu jest równa zeru. Jeżeli tak jest, tzn. w przypadku gdy porównywane średnie (lub grupy średnich) są równe, to wartość wyliczonego parametru Istotność będzie większa od 0,05.

0x01 graphic

0x01 graphic

Gdy ustalone są kontrasty możemy zbadać, czy ewentualna zależność ma charakter liniowy (kwadratowy, sześcienny). W takim przypadku w oknie dialogowym submenu Kontrasty należy zaznaczyć opcję Wielomian stopnia....

Analiza przeprowadzana jest wówczas albo bez uwzględnienia różnic w liczności poszczególnych grup ( w takim przypadku wyniki obliczeń w tabeli oznaczane są etykietą nieważone) lub z uwzględnieniem różnic w liczności poszczególnych grup ( w takim przypadku wyniki obliczeń w tabeli oznaczane są etykietą ważone).

Uwaga: Analiza zależności (liniowej lub, ogólnie, wielomianowej) ma sens tylko wówczas, gdy wartości zmiennych grupujących można uporządkować na pewnej skali.

  1. Przeprowadzenie analizy post hoc.

Jednoczynnikowa analiza wariancji odpowiada na pytanie czy analizowane średnie są równe, czy też nie. W przypadku stwierdzenia nierówności ciekawym może być odpowiedź na pytanie o przyczynę takiej nierówności. Odpowiedź można uzyskać porównując poszczególne średnie ze sobą.

Analizę wykonuje się porównując parami wszystkie możliwe kombinacje wartości średnich. Można do tego celu wykorzystać 14 różnych testów statystycznych gdy słuszna jest hipoteza o równości wariancji oraz 5 testów statystycznych, gdy ta hipoteza nie jest słuszna - wybieranych w submenu Post hoc. Opisów poszczególnych testów należy szukać w literaturze. Prezentowane są wyniki wszystkich wybranych testów. Wartości parametru Istotność przekraczające 0,05 świadczą o braku podstaw do kwestionowania hipotezy o równości porównywanych średnich.

0x01 graphic

Powyższy test wskazuje, że różnice w parach nie są istotne, chociaż nie w takim samym stopniu.

O.Hryniewicz: Analiza statystyczna - komputery (8 godz.) 63



Wyszukiwarka