statystyka Test zgodności chi kwadrat i inne, $$ STUDIA $$, Statystyka


Test zgodności chi-kwadrat (inaczej zwany testem Pearsona) służy do porównania ze sobą zaobserowanego rozkładu naszej zmiennej z jakimś teoretycznym rozkładem. Test ten można wykorzystać na dwa sposoby, np dla:

1) sprawdzenia równoliczności grup

2) porównania występowania obserwacji z ich teoretycznym występowaniem

Są dwa najważniejsze założenia testu zgodności chi-kwadrat:

--Minimalna liczebność próby = 5:

oznacza to, że w badanych grupach (czyli np. u mężczyzn, którzy wolą piwo, patrz: przykład test niezależności chi-kwadrat) minimalnie powinno być przynajmniej 5 zbadanych obserwacji.

--Niezależność grup

Test Pearsona

W ogólności zachodzi:

0x01 graphic

gdzie: Oi - wartość mierzona, Ei - odpowiadająca wartość teoretyczna (oczekiwana), wynikająca z hipotezy, σi - odchylenie standardowe, n - liczba pomiarów.

Chi-kwadrat. Test niezależności

Test niezależności chi-kwadrat stosuje się w celu zbadania zależności pomiędzy dwiema zmiennymi nominalnymi (kategorialnymi). Bazuje on na porównywaniu ze sobą wartości obserwowanych (czyli takich, które uzyskaliśmy w badaniu) z wartościami oczekiwanymi (czyli takimi, które zakłada test, gdyby nie było żadnego związku pomiędzy zmiennymi). Jeżeli różnica pomiędzy wartościami obserwowanymi a oczekiwanymi jest duża (po sprawdzeniu w tablicach statystycznych, np. p < 0,05) to można powiedzieć, że zachodzi relacja pomiędzy jedną zmienną a drugą. Są dwa najważniejsze założenia testu niezależności chi-kwadrat:

- Minimalna liczebność próby = 5

- Niezależność grup (niezależność zdarzeń)

Jeżeli wartość naszego testu będzie większa niż wartość z tablicy uznamy, że wynik jest istotny statystycznie (przy założeniu p = 0,05).Jeżeli natomiast wartość naszego testu będzie mniejsza niż wartość z tablicy uznamy wtedy, że wynik nie jest istotny statystycznie.

Liczba stopni swobody = (liczba kolumn - 1) x (liczba wierszy - 1)

Błąd pierwszego rodzaju.

Przy testowaniu/weryfikacji hipotez możemy popełnić błąd pierwszego rodzaju. Błąd ten popełniamy wtedy, gdy na podstawie przeprowadzonej analizy statystycznej stwierdzamy, że uzyskane wyniki są istotne statystycznie a są one w rzeczywistości nieistotne statystycznie.

Na popełnienie takiego błędu narażamy się wtedy, gdy na przykład: stosujemy nieodpowiednie testy statystyczne do weryfikacji hipotez, stosujemy dany test statystyczny, pomimo tego, że założenia nie zostały spełnione, aby wykonać dany test.

W praktyce oznacza to, że popełniliśmy błąd w analizie i na tej podstawie wnioskujemy prawdziwość postawionej hipotezy, a w rzeczywistości nie możemy tego stwierdzić.

Błąd drugiego rodzaju. Przy testowaniu/weryfikacji hipotez możemy popełnić błąd drugiego rodzaju. Błąd ten popełniamy wtedy, gdy na podstawie przeprowadzonej analizy statystycznej stwierdzamy, że uzyskane wyniki są nieistotne statystycznie, a są one w rzeczywistości istotne statystycznie.

Na popełnienie takiego błędu narażamy się wtedy, gdy na przykład: stosujemy nieodpowiednie testy statystyczne do weryfikacji hipotez, stosujemy zbyt restrykcyjnie ograniczenia dla analizy wyników.

Hipoteza zerowa (H0) - Jest to hipoteza poddana procedurze weryfikacyjnej, w której zakładamy, że różnica między analizowanymi parametrami lub rozkładami wynosi zero. Przykładowo wnioskując o parametrach hipotezę zerową zapiszemy jako H0 θ1 = θ2 .

Hipoteza alternatywna (H1) - hipoteza przeciwstawna do weryfikowanej. Możemy ją zapisać na trzy sposoby w zależności od sformułowania badanego problemu

*H1 θ1 ≠ θ2

*H1 θ1 > θ2

*H1 θ1 < θ2

Obszar krytyczny - obszar znajdujący się zawsze na krańcach rozkładu. Jeżeli obliczona przez nas wartość statystyki testowej znajdzie się w tym obszarze to weryfikowaną przez nas hipotezę H0 odrzucamy. Wielkość obszaru krytycznego wyznacza dowolnie mały poziom istotności α, natomiast jego położenie określane jest przez hipotezę alternatywną.

Obszar krytyczny od pozostałej części rozkładu statystyki odzielony jest przez tzw. wartości krytyczne testu (wα), czyli wartości odczytane z rozkładu statystyki przy danym α, tak aby spełniona była relacja zależna od sposobu sformułowania H1

*P{|w|≥wα} = α gdy H1 θ1 ≠ θ2 (obszar dwustronny)

*P{w ≥wα} = α gdy H1 θ1 > θ2 (obszar prawostronny)

*P{w ≤wα} = α gdy H1 θ1 < θ2 (obszar lewostronny)

Wyniki istotne statystycznie.

Gdy porównujemy ze sobą grupy pod względem pewnej zmiennej prawie zawsze wystapią różnice pomiędzy grupami w mierzonej zmiennej. Jednakże dopiero, gdy zastosujemy odpowiedni test statystyczny, uwzględniając przyjęty poziom istotności, będziemy mogli odpowiedzieć, czy zaobserwowane wyniki są istotne statystycznie. Gdy przyjmiemy poziom istotności p < 0,05 to zaobserwowane różnice, dla których p jest mniejsze niż 0,05 możemy nazwać różnicami istotnymi statystycznie.

Poziom istotności.

Poziom istotności jest to próg, wedle którego oceniamy z jakim prawdopodobieństwem różnice, które zaobserwowaliśmy są dziełem przypadku. Dla badań społecznych takim umownym progiem jest 0,05. Gdy istotność dla danego wyniku jest mniejsza to wyniki są istotne statystycznie, gdy większa to nieistotne. Jeśli p-wartość jest większa, oznacza to, iż nie ma powodu do odrzucenia tzw. hipotezy zerowej H0 która zwykle stwierdza, że obserwowany efekt jest dziełem przypadku. Najczęściej przyjmuje się p = 0,05, 0,03 lub 0,01.

Liczba stopni swobody.

Jest to liczba niezależnych wyników obserwacji pomniejszona o liczbę związków, które łączą te wyniki ze sobą. Liczba stopni swobody ogranicza liczbę parametrów które mogą być estymowane przy użyciu danej próby. Jeśli mamy do czynienia z jedną próbką losową zawierającą n obserwacji, z której estymujemy jeden parametr (np. wartość oczekiwaną) to w rezultacie pozostaje nam n − 1 stopni swobody do dalszej estymacji (na przykład wariancji).

W przypadku dwóch próbek o n1,n2 obserwacjach, zwykle musimy estymować dwie wartości oczekiwane, a zatem pozostaje nam n1 + n2 − 2 stopni swobody.

Testy t-Studenta.

Testy t-Studenta służą do porównania ze sobą DWÓCH grup. Nie więcej! Korzystamy z nich wtedy, gdy mamy wyniki dla dwóch grup i chcemy porównać je ze sobą - tzn. stwierdzić, czy wyniki w jednej grupie są większe bądź mniejsze niż w drugiej grupie.

Standardowo istnieją trzy rodzaje testu t-Studenta:

1. dla jednej próby

2. dla prób niezależnych

3. dla prób zależnych

W zależności od rodzaju badania stosujemy w analizach jeden z tych testów.

Założenia testów t-Studenta:

1) rozkład wyników zmiennej zależnej w każdej z grupie jest zbliżony do normalnego

2) porównywane grupy mają podobna liczebność (ilość badanych osób)

3) wariancje w porównywanych grupach są do siebie podobne Który wybrać test t-Studenta :

1. Czy badamy pary wiązane?
Test dla par wiązanych stosujemy wtedy, kiedy istnieje coś, czym można "związać" pary pomiarów należące do dwóch badanych grup. - Np. pomiar na tym samym osobniku w dwóch okolicznościach (np. przed i po podaniu leku, na młodym osobniku i kiedy dorośnie, rano i wieczorem, przed rozrodem i po itp.) - Np. pomiar na parach osobników spokrewnionych (rodzeństwo, bliźnięta, klony). - Np. pomiar na tej samej powierzchni badawczej w dwóch różnych okolicznościach (np. rano i wieczorem, przed i po wybudowaniu/zamknięciu huty/drogi/fabryki itp.) 2. Czy wariancje są równe?
- jeśli tak -> test t Studenta dla różnic między średnimi przy równych wariancjach, porównanie statystki z tabelą
- jeśli nie -> test t Studenta dla różnic między średnimi przy różnych wariancjach, obliczenie t krytycznego wg. wzoru

Trzeba więc zastanowić się, czy nasze pomiary można jednoznacznie połączyć w pary i czy ma to biologiczny sens. Jeśli nie, stosujemy test dla różnic między średnimi dla prób niezależnych. Przykłady? różnorodność pająków/chrząszczy/skoczogonków/etc. w dwóch różnych typach lasu, średni wzrost zawodników reprezentacji Polski w piłce nożnej i w siatkówce...itd.



Wyszukiwarka

Podobne podstrony:
chi kwadrat, Inne, Studia, Wykłady Sędek - Statystyka
test zgodnosci chi-kwadrat, Test zgodności chi-kwadrat
stat praca, Test zgodności chi, Test zgodności chi-kwadrat służy do weryfikowania hipotezy, że obser
Prezentacja na wykład test zgodności Chi kwadrat
Test zgodności Chi
TESTY 1 (chi-kwadrat, Statystyka
odp Przykladowe pytania egzaminacyjne Poznan8VI2014, Inne, Studia, Wykłady Sędek - Statystyka
rozkład - chi kwadrat itd, statystyka matematyczna(1)
Statystyka #10 i 11 Analiza liczebnosci chi kwadrat
chi-kwadrat, Studia, WEiTI-Informatyka, FKS, lab, cw7, data
test chi kwadrat
test chi kwadrat Word2003, Elementy matematyki wyższej
wyklad9 test chi kwadrat
12 Test chi kwadrat na postać rozkładu zadania domowe ECW
Test chi kwadrat na postać rozkładu zadania domowe

więcej podobnych podstron