TESTY ISTOTNOŚCI RÓŻNIC PORÓWNUJĄCYCH ŚREDNIE WYNIKI
GRUPY NIEZALEŻNE-inni ludzie są w grupie X a inni w grupie Y.
Np. czy płeć wpływa na częstość spożywania alkoholu?
GRUPY ZALEŻNE- powtarzanie pomiaru- badamy 2 razy tych samych ludzi.
Np. sprawdzamy jaką ludzie mają refleks przed i po spożyciem alkoholu(np. refle1 i refle2)
SKALA NOMINALNA
Jak jakaś zmienna jest zdefiniowana na skali nominalnej to nie możemy na niej liczyć średniej, niczego.
grupy niezależne
Test Chi2- test dla skali nominalnej dla. Chi2 liczy się na podstawie tabel krzyżowych.
Np. czy płeć wpływa na nadużywanie alkoholu(czy płeć ma związek z nadużywaniem alkoholu, albo czy mężczyźni i kobiety różnią się pod względem nadużywania alkoholu).
Analiza/ opis statystyczny/ tabele krzyżowe
Wszystko jedna czy płeć będzie w „zmiennych w kolumnach” czy w „zmiennych w wierszach”
Wybieramy statystyki i zaznaczamy Chi-kwadrat.
Wybierzmy komórki. W komórkach interesuje nas okienko „liczebności”- zaznaczamy obserwowane i oczekiwane. I naciskamy OK.
Tabela krzyżowa płeć osoby badanej * czy nadużywa alkoholu
|
|
czy nadużywa alkoholu |
Ogółem |
||
|
|
nie |
tak |
|
|
płeć osoby badanej |
kobieta |
Liczebność |
18 |
2 |
20 |
|
|
Liczebność oczekiwana |
16,5 |
3,5 |
20,0 |
|
mężczyzna |
Liczebność |
15 |
5 |
20 |
|
|
Liczebność oczekiwana |
16,5 |
3,5 |
20,0 |
Ogółem |
Liczebność |
33 |
7 |
40 |
|
|
Liczebność oczekiwana |
33,0 |
7,0 |
40,0 |
Testy Chi-kwadrat
|
Wartość |
df |
Istotność asymptotyczna (dwustronna) |
Istotność dokładna (dwustronna) |
Istotność dokładna (jednostronna) |
Chi-kwadrat Pearsona |
1,558(b) |
1 |
,212 |
|
|
Poprawka na ciągłość(a) |
,693 |
1 |
,405 |
|
|
Iloraz wiarygodności |
1,601 |
1 |
,206 |
|
|
Dokładny test Fishera |
|
|
|
,407 |
,204 |
Test związku liniowego |
1,519 |
1 |
,218 |
|
|
N Ważnych obserwacji |
40 |
|
|
|
|
a Obliczone wyłącznie dla tabeli 2x2.
b 50,0% komórek (2) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność oczekiwana wynosi 3,50.
Odpowiedź: płeć nie wpływa na nadużywanie alkoholu(chi jest nieistotne statystycznie).
Np. czy status finansowy wpływa na częstość posiadania mieszkania(zmiene: sta_fin i czy_mie)?
Tabela krzyżowa status finansowy osoby badanej * czy ma własne mieszkanie
|
|
czy ma własne mieszkanie |
Ogółem |
||
|
|
nie |
tak |
|
|
status finansowy osoby badanej |
biedny |
Liczebność |
9 |
16 |
25 |
|
|
Liczebność oczekiwana |
5,6 |
19,4 |
25,0 |
|
bogaty |
Liczebność |
0 |
15 |
15 |
|
|
Liczebność oczekiwana |
3,4 |
11,6 |
15,0 |
Ogółem |
Liczebność |
9 |
31 |
40 |
|
|
Liczebność oczekiwana |
9,0 |
31,0 |
40,0 |
Testy Chi-kwadrat
|
Wartość |
df |
Istotność asymptotyczna (dwustronna) |
Istotność dokładna (dwustronna) |
Istotność dokładna (jednostronna) |
Chi-kwadrat Pearsona |
6,968(b) |
1 |
,008 |
|
|
Poprawka na ciągłość(a) |
5,056 |
1 |
,025 |
|
|
Iloraz wiarygodności |
9,982 |
1 |
,002 |
|
|
Dokładny test Fishera |
|
|
|
,015 |
,007 |
Test związku liniowego |
6,794 |
1 |
,009 |
|
|
N Ważnych obserwacji |
40 |
|
|
|
|
a Obliczone wyłącznie dla tabeli 2x2.
b 25,0% komórek (1) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność oczekiwana wynosi 3,38.
Odpowiedź: status finansowy wpływa(to mówi na chi)- ale to za mało.
Odpowiedź: status finansowy wpływa na posiadanie mieszkania- bogatsi mają mieszkania częściej niż biedni.
SKALA PORZĄDKOWA
GRUPY NIEZALEŻNE
W przypadku grup niezależnych na skali porządkowej będziemy używać testu U Manna- Witneya.
Np. jak status finansowy(sta_fin) wpływa na satysfakcję z pracy przed treningiem asertywności(sat_pra1).
Analiza/ testy nieparametryczne/ dwie próby niezależne
UWAGA!
W testach nieparametrycznych jest Chi-kwadrat ale nigdy nie korzystamy z niego. Jak chcemy go policzyć to używamy tabel krzyżowych.
W okienku „zmienna grupująca” wpisujemy naszą zmienną niezależną- czyli w naszym przypadku „status finansowy osoby badanej”(tą na skali nominalnej).
Naciskamy definiuj grupy - musimy wpisać jaką wartość przyjmuje grupa 1 a jaką 2(to jest zapisane w wartościach- np. 1 to biedny, 2- bogaty)
Rangi
|
status finansowy osoby badanej |
N |
Średnia ranga |
Suma rang |
satysfakcja z pracy mierzona przed treningiem asertywności |
biedny |
25 |
21,54 |
538,50 |
|
bogaty |
15 |
18,77 |
281,50 |
|
Ogółem |
40 |
|
|
Statystyki testu(b)
|
satysfakcja z pracy mierzona przed treningiem asertywności |
U Manna-Whitneya |
161,500 |
W Wilcoxona |
281,500 |
Z |
-,746 |
Istotność asymptotyczna (dwustronna) |
,455 |
Istotność dokładna [2*(jednostronna)] |
,472(a) |
a Nieskorygowane ze względu na wiązania.
b Zmienna grupująca: status finansowy osoby badanej
U= 161,5 p>0,05- patrzymy na istotność dokładną(0,472). Jeżeli na teście nie będzie dokładnej to wtedy spisujemy istotność asymptotyczną.
Odpowiedź: status finansowy nie ma wpływu na satysfakcję z pracy.
Jeżeli wynik byłby istotny, to wtedy patrzymy na średnie rangi i interpretujemy np. biedni są bardziej usatysfakcjonowani z pracy,
GRUPY ZALEŻNE
Jak mamy zmienne które się nazywają prawie tak samo to znaczy, że mamy powtarzane pomiary- czyli grupy zależne.
W grupach zależnych stosujemy test Wilcoxona.
Analiza/ testy nieparametryczne/ dwie próby zależne
Rangi
|
|
N |
Średnia ranga |
Suma rang |
satysfakcja z pracy mierzona bezpośrednio po treningu asertywności - satysfakcja z pracy mierzona przed treningiem asertywności |
Ujemne rangi |
3(a) |
7,50 |
22,50 |
|
Dodatnie rangi |
12(b) |
8,13 |
97,50 |
|
Wiązania |
25(c) |
|
|
|
Ogółem |
40 |
|
|
a satysfakcja z pracy mierzona bezpośrednio po treningu asertywności < satysfakcja z pracy mierzona przed treningiem asertywności
b satysfakcja z pracy mierzona bezpośrednio po treningu asertywności > satysfakcja z pracy mierzona przed treningiem asertywności
c satysfakcja z pracy mierzona bezpośrednio po treningu asertywności = satysfakcja z pracy mierzona przed treningiem asertywności
patrzymy na rangi dodatnie lub ujemne- interesują nas te rangi przy, których jest większa liczba i czytamy do tej rangi przypis, który jest pod tabelką.
Statystyki testu(b)
|
satysfakcja z pracy mierzona bezpośrednio po treningu asertywności - satysfakcja z pracy mierzona przed treningiem asertywności |
Z |
-2,357(a) |
Istotność asymptotyczna (dwustronna) |
,018 |
a Na bazie ujemnych rang.
b Test znaków rangowanych Wilcoxona
Z= -2,357 p<0,05 (0,018)-
Trening asertywnosci wpłyną na satysfakcję z pracy- satysfakcja z pracy wzrosła w sposób istotny statystycznie po treningu.
Czyli najpierw musimy patrzeć czy wynik jest istotny statystycznie. Jeżeli nie to mamy już gotowa odpowiedź (np. trening nie wpłyną), a jeżeli tak to patrzymy czy więcej jest dodatnich rang czy więcej jest ujemnych)
W naszym przypadku dodatnich jest więcej tzn. że wzrosła satysfakcja- po treningu asertywności ludzie oceniali swoją pracę jako bardziej atrakcyjną niż przed treningiem.
ILOŚCIOWA
TEST T STUDENTA DLA JEDNEJ GRUPY
Żeby można było liczyć test T studenta musi być spełniony jeden warunek: rozkład badanej cechy musi być zbliżony do normalnego(skośność i kurtoza muszą być w przedziale od -1 do +1). (sprawdzamy to przez częstości).
Wystarczy, że jedna z tych liczb(skośność lub kurtoza) wychodzi poza -1 lub 1 to wiadomo od razu, że nie wolno mi policzyć testu T- studenta.
Analiza/ porównywanie średnich/ test T dla jednej próby
Czy przeciętny altruizm w naszej grupie różni się od przeciętnego Amerykanina, którego wynik wynosi 51.
Do okienka zmienne testowane wrzucamy naszą zmienną zależną (np. IQ)
W okienku: wartość testowana wrzucam tę liczbę z którą porównujemy naszą średnią(w tym przypadku przeciętny altruizm w populacji amerykańskiej to 51)- naciskam OK.
Statystyki dla jednej próby
|
N |
Średnia |
Odchylenie standardowe |
Błąd standardowy średniej |
łączny wynik na skali altruizmu |
535 |
49,16 |
8,962 |
,387 |
Test dla jednej próby
|
Wartość testowana = 51 |
|||||
|
t |
df |
Istotność (dwustronna) |
Różnica średnich |
95% przedział ufności dla różnicy średnich |
|
|
|
|
|
|
Dolna granica |
Górna granica |
łączny wynik na skali altruizmu |
-4,757 |
534 |
,000 |
-1,843 |
-2,60 |
-1,08 |
Zapis wyników: t(534)= -4,757,p
W naszym przypadku:
-p<0,05 albo dokładnie p= 0,001 - wynik jest istotny statystycznie
Interpretacja: wynik tej populacji amerykańskiej 51 nie pasuje do wyniku 49,16, czyli przeciętny Amerykanin różni się od przeciętnego Polaka(Amerykanin jest większym altruistą).
TEST T DLA GRUP ZALEŻNYCH
Najpierw musimy sprawdzić czy jest spełniony warunek: skośność i kurtoza zbliżone do rozkładu normalnego(sprawdzamy to przez częstości).
Pytanie: sprawdz czy poziom asertywności przed treningiem różni się od poziomu asertywności po treningu( to liczymy test T- studenta dla grup zależnych o ile spełnia wszystkie warunki).
Analiza/ opis statystyczny/ częstości- poziom asertywności przed treningiem i poziom asertywności po treningu/ statystyki- skośność i kurtoza
Statystyki
|
poziom asertywności badany przed treningiem asertywności |
poziom asertywności badany bezpośrednio po treningu asertywności |
|
N |
Ważne |
40 |
40 |
|
Braki danych |
0 |
0 |
Skośność |
-,463 |
-,817 |
|
Błąd standardowy skośności |
,374 |
,374 |
|
Kurtoza |
,117 |
,155 |
|
Błąd standardowy kurtozy |
,733 |
,733 |
Obydwa te wykresy(asert1 i asert2) moją kształt zbliżony do rozkładu normalnego, czyli można liczyć T- studenta dla grup zależnych. Gdyby chociaż jedna liczba z tych 4 wystawała poza jeden to nie wolno liczyć T- studenta(i wtedy liczymy Wicoxona).
Analiza/ porównywanie średnich/ test t dla prób zależnych/ asert1 i asert2/ OK.
Statystyki dla prób zależnych
|
Średnia |
N |
Odchylenie standardowe |
Błąd standardowy średniej |
|
Para 1 |
poziom asertywności badany przed treningiem asertywności |
34,00 |
40 |
8,064 |
1,275 |
|
poziom asertywności badany bezpośrednio po treningu asertywności |
39,77 |
40 |
8,854 |
1,400 |
Średni poziom asertywności przed treningiem wynosił 34, po treningu 39,77
Test dla prób zależnych
|
Różnice w próbach zależnych |
t |
df |
Istotność (dwustronna) |
|||||
|
Średnia |
Odchylenie standardowe |
Błąd standardowy średniej |
95% przedział ufności dla różnicy średnich |
|
|
|
||
|
|
|
|
Dolna granica |
Górna granica |
|
|
|
|
Para 1 |
poziom asertywności badany przed treningiem asertywności - poziom asertywności badany bezpośrednio po treningu asertywności |
-5,766 |
3,628 |
,574 |
-6,927 |
-4,606 |
-10,051 |
39 |
,000 |
Interesują nas 3 ostatnie kolumny.
-t(39)= -10,051 p<0,05- wynik istostny statystycznie
interpretacja: trening asertywności wpłyną na poziom asertywności. Poziom asertywności mierzony tuż po odbytym treningu był istotnie statystycznie wyższy niż mierzony przed treningiem(czyli trening zwiększył asertywność).
(jeśli wynik jest istotny statystycznie to patrzymy, która średnia jest większa i interpretujemy czy się coś zwiększyło czy zmniejszyło).
Jeżeli skośność i kurtoza byłyby nie spełnione to robimy wszystko to co dla skali porządkowej- czyli Wilkoxona.
TEST T DLA GRUP NIEZALEŻNYCH
W przypadku testu T dla grup niezależnych musi sprawdzić:
Normalność rozkładu
Równość grup
Homogeniczność wariancji
Jeżeli pierwszy i/lub drugi warunek nie jest spełniony to liczymy test U Manna- Whitneya
Przykład: czy płeć wpływa na inteligencję?
Musimy najpierw sprawdzić normalność rozkładu, ale dla testu t dla grup niezależnych korzystamy z eksploracji.
Analiza/ opis statystyczny/ eksploracje/ Zmienna zależna: iloraz inteligencji; niezależna- płeć/ statystyki/ OK.
Statystyki opisowe
|
płeć osoby badanej |
|
Statystyka |
Błąd standardowy |
|
iloraz inteligencji |
kobieta |
Średnia |
107,60 |
2,389 |
|
|
|
95% przedział ufności dla średniej |
Dolna granica |
102,60 |
|
|
|
|
Górna granica |
112,60 |
|
|
|
5% średnia obcięta |
107,06 |
|
|
|
|
Mediana |
105,00 |
|
|
|
|
Wariancja |
114,147 |
|
|
|
|
Odchylenie standardowe |
10,684 |
|
|
|
|
Minimum |
95 |
|
|
|
|
Maksimum |
130 |
|
|
|
|
Rozstęp |
35 |
|
|
|
|
Rozstęp ćwiartkowy |
18 |
|
|
|
|
Skośność |
,777 |
,512 |
|
|
|
Kurtoza |
-,553 |
,992 |
|
|
mężczyzna |
Średnia |
108,25 |
1,976 |
|
|
|
95% przedział ufności dla średniej |
Dolna granica |
104,11 |
|
|
|
|
Górna granica |
112,39 |
|
|
|
5% średnia obcięta |
108,17 |
|
|
|
|
Mediana |
108,50 |
|
|
|
|
Wariancja |
78,092 |
|
|
|
|
Odchylenie standardowe |
8,837 |
|
|
|
|
Minimum |
89 |
|
|
|
|
Maksimum |
129 |
|
|
|
|
Rozstęp |
40 |
|
|
|
|
Rozstęp ćwiartkowy |
12 |
|
|
|
|
Skośność |
,152 |
,512 |
|
|
|
Kurtoza |
,972 |
,992 |
Skośność i kurtoza nie przekracza -1 i 1- wykres jest zbliżony do normalnego.
Informacja o analizowanych danych
|
płeć osoby badanej |
Obserwacje |
|||||
|
|
Uwzględnione |
Wykluczone |
Ogółem |
|||
|
|
N |
Procent |
N |
Procent |
N |
Procent |
iloraz inteligencji |
kobieta |
20 |
100,0% |
0 |
,0% |
20 |
100,0% |
|
mężczyzna |
20 |
100,0% |
0 |
,0% |
20 |
100,0% |
Grupy są równoliczne.
Oba warunki są spełnione więc można liczyć test t studenta dla grup niezależnych.
Analiza/ porównywanie średnich/ test t dla prób niezależnych- zmienna grupująca to płeć- musimy pamiętać żeby sprawdzić jakie ma ona wartości w naszym pliku- definiujemy grupy); zmienna testowana: IQ.
Statystyki dla grup
|
płeć osoby badanej |
N |
Średnia |
Odchylenie standardowe |
Błąd standardowy średniej |
iloraz inteligencji |
kobieta |
20 |
107,60 |
10,684 |
2,389 |
|
mężczyzna |
20 |
108,25 |
8,837 |
1,976 |
Test dla prób niezależnych
|
|
Test Levene'a jednorodności wariancji |
Test t równości średnich |
|||||||
|
|
F |
Istotność |
t |
df |
Istotność (dwustronna) |
Różnica średnich |
Błąd standardowy różnicy |
95% przedział ufności dla różnicy średnich |
|
|
|
|
|
|
|
|
|
|
Dolna granica |
Górna granica |
iloraz inteligencji |
Założono równość wariancji |
1,688 |
,202 |
-,210 |
38 |
,835 |
-,650 |
3,100 |
-6,926 |
5,626 |
|
Nie założono równości wariancji |
|
|
-,210 |
36,709 |
,835 |
-,650 |
3,100 |
-6,934 |
5,634 |
Tym razem mamy 2 wyniki testu t.
Założono równość wariancji oznacza, że wariancje są homogeniczne(podobne)
Nie założono równości wariancji- wariancję są heterogeniczne.
Patrzymy na istotność statystyczną w teście Levene'a (F nas nie interesuje tylko jego istotność). W naszym przypadku wynik tego testu nie jest istotny statystycznie.
Jeśli wynik w teście Levene'a jest nie istotny to wariancje są homogeniczne i wtedy czytamy górną linijkę.
Jeżeli wynik jest istotny to są heterogeniczne i wtedy czytamy dolną linijkę.
W naszym przypadku wariancję są homogeniczne, a więc prawidłowy wynik to:
-t(38)= -0,21 p>0,05 (0,835)- wynik nie istotny statystycznie
interpretacja: płeć nie ma wpływu na inteligencję.
Gdyby wynik testu t był istotny statystycznie to patrzymy na tabelkę „statystyki dla grup” na średnie- i wtedy interpretowalibyśmy, że mężczyźni są bardziej inteligentni niż kobiety, kobiety są mniej inteligentne od mężczyzn.