wykład10 statystyka


Wykład 10
Test niezależnoÅ›ci Ç2
Badając populację generalną z punktu widzenia dwóch cech jednocześnie, niejedno-
krotnie stawiamy sobie pytanie czy cechy te są powiązane, tzn. czy zmianom wartości
jednej z nich towarzyszą usystematyzowane zmiany wartości drugiej. Analizowane zmien-
ne mogą być zarówno mierzalne, jak i niemierzalne (jakościowe). W przypadku, gdy obie
cechy są mierzalne (wyrażone co najmniej w skali różnicowej), usiłujemy wykryć ewentu-
alny związek między nimi stosując analizę regresji i korelacji. Natomiast, gdy choć jedna
z badanych zmiennych ma charakter jakościowy (skala nominalna bądz porządkowa) po-
sługujemy się pojęciem niezależności stochastycznej dwóch zmiennych losowych.
Weryfikację hipotezy o niezależności dwóch cech przeprowadza się za pomocą testu
niezależnoÅ›ci, w którym wykorzystuje siÄ™ statystykÄ™ Ç2. Z badanej populacji losuje siÄ™
dużą próbę, zawierającą n elementów, której wyniki klasyfikuje się w tzw. tabeli niezależ-
ności o w wierszach i k kolumnach. Liczba wierszy tabeli niezależności odpowiada liczbie
kategorii cechy X, a liczba kolumn liczbie kategorii cechy Y .
Dla cech niemierzalnych (jakościowych) liczba kategorii jest zazwyczaj jednoznacznie
powiązana z naturą tej cechy, a więc odpowiada liczbie możliwych do zaobserwowania
 wartości badanych zmiennych. W przypadku zmiennej mierzalnej wartości cechy (za-
obserwowane w próbie) muszą być sklasyfikowane przy arbitralnym przyjęciu zarówno
liczby klas, jak i zakresu.
nij, (i = 1, . . . , w, j = 1, . . . , k)  liczba elementów, które mają jednocześnie i-tą
kategoriÄ™ cechy X oraz j-tÄ… kategoriÄ™ cechy Y .
Na podstawie tych liczebności weryfikuje się hipotezę o niezależności badanych cech,
czyli hipotezÄ™:
H0 : P {X = xi, Y = yj} = P {X = xi, }P {Y = yj},
gdzie xi oraz yj odpowiadają wartościom lub kategoriom obydwu cech.
Sumując liczebności empiryczne nij w wierszach i kolumnach otrzymuje się tzw. li-
czebności brzegowe:
k w

ni" = nij; n" j = nij,
j=1 i=1
przy czym
w k w k

n = nij = ni" = n" j.
i=1 j=1 i=1 j=1
1
Wykorzystując liczebności empiryczne, wyznaczamy prawdopodobieństwa brzegowe:
ni" n" j
pi" = , p" j = ,
n n
oraz (przy założeniu prawdziwości H0) prawdopodobieństwa hipotetyczne:
pij = pi" · p" j,
przy czym
w k w k

pij = pi" = p" j = 1.
i=1 j=1 i=1 j=1
Wartość statystyki Ç2 w teÅ›cie niezależnoÅ›ci ostatecznie oblicza siÄ™ ze wzoru:
w k

(nij - n · pij)2
Ç2 = .
obl
n · pij
i=1 j=1
Statystyka ta, przy zaÅ‚ożeniu prawdziwoÅ›ci hipotezy H0, ma asymptotyczny rozkÅ‚ad Ç2
z liczbÄ… stopni swobody df = (w - 1)(k - 1).
Obszar krytyczny jest w tym teście zawsze obszarem prawostronnym, a sposób wy-
znaczenia prawdopodobieństwa p, jako miary popełnienia błędu pierwszego rodzaju, jest
identyczny, jak w innych testach wykorzystujacych statystykÄ™ Ç2.
" Jeżeli p ą, to hipotezę o niezależności badanych cech należy odrzucić i przyjąć,
że zachodzi między nimi zależność o charakterze stochastycznym.
" W przypadku, gdy p > Ä…, stwierdza siÄ™ brak podstaw do odrzucenia hipotezy
zerowej, a więc nie ma dowodu na to, że badane cechy są wzajemnie powiązane.
Przypadek szczególny: df = 1
Z sytuacjÄ… takÄ… mamy do czynienia, gdy obydwie badane cechy majÄ… jedynie dwie
kategorie wartości (tabela niezależności ma 4 kratki).
Stosuje się wówczas poprawkę na ciągłość, zwaną poprawką Yatesa.
Zatem:
2 2

(|nij - n · pij| - 0, 5)2
Ç2 = .
obl
n · pij
i=1 j=1
2
Przykład 1
W ramach badań ortodontycznych 31 uczniów klasy III, u części z nich wykazano
wadę zgryzu (dane poniżej; C  chłopcy, D  dziewczęta, P  zgryz prawidłowy, N  zgryz
nieprawidłowy). Czy w świetle przeprowadzonych badań można przyjąć, że występowanie
tej wady rozwojowej ma powiązanie z płcią dziecka?
Przykład 2
Sprawdzić, czy istnieje związek pomiędzy jakością odlewanych tulei (TW  tuleja
wadliwa i BW  tuleja bez wad) a sposobem odlewania (PO  z osiÄ… poziomÄ…, UK  z
osią ukośną, PI  z osią pionową), jeżeli w dziale kontroli jakości zebrano następujące
dane (przyjąć poziom istotności ą = 0, 05):
Test mediany
Często sprawdzając hipotezę, że dwie próby pochodzą z jednej populacji, nie ma-
my przyporządkowania wynikom jednej próby wyników drugiej próby. Wówczas możemy
użyć, gdy próba nie jest zbyt mała, testu nieparametrycznego zwanego testem mediany.
Model
" Dane są dwie populacje generalne o rozkładach z dowolnymi dystrybuantami F1(x)
i F2(x).
3
" Z populacji tych pobrano losowo dwie próby o liczebnościach odpowiednio n1 i n2
elementów (n1 i n2 są niezbyt małe).
" Na podstawie wyników tych prób należy sprawdzić hipotezę, że obie próby pochodzą
z jednej populacji, tzn. hipotezÄ™
H0 : F1(x) = F2(x).
Przebieg testu
" Z wyników obu prób tworzymy jeden ciąg niemalejący, ustawiając wyniki w kolej-
ności rosnącej.
" Z ciÄ…gu tego wyznaczamy medianÄ™ me.
" Grupujemy wszystkie obserwacje w tablicę czteropolową z liczebnościami obserwacji
z obu prób: 2 wiersze (l.obs. > me i l.obs. me) i 2 kolumny (próba I i próba II).
" Traktujemy tę tablicę, jak tablicę niezależności i obliczamy z niej wartość statystyki
2 2

(nij - n · pij)2
Ç2 = .
n · pij
i=1 j=1
" Jesli hipoteza H0 jest prawdziwa, to statystyka ta ma asymptotyczny rozkÅ‚ad Ç2 z
jednym stopniem swobody.
" Z tablicy rozkÅ‚adu Ç2 dla jednego stopnia swobody i ustalonego z góry poziomu
istotnoÅ›ci Ä… odczytujemy wartość krytycznÄ… Ç2 tak, aby P (Ç2 Ç2 ) = Ä….
Ä… Ä…
" Porównujemy obliczonÄ… wartość Ç2 z wartoÅ›ciÄ… krytycznÄ… Ç2 .
emp. Ä…
" JeÅ›li zachodzi nierówność Ç2 Ç2 , to H0 odrzucamy.
Ä…
" Gdy natomiast Ç2 < Ç2 , nie ma podstaw do odrzucenia hipotezy, że obie próby
Ä…
pochodzÄ… z jednej populacji.
4


Wyszukiwarka

Podobne podstrony:
Wyklad4 statystyka
Wyklad2 statystyka
wykład statystyka matematyczna cz 4
wykład 1 Statystyka
wykład9 statystyka
Wykład 2 statystyka opisowa
2010 TB wyklady statystyka
wykład5 statystyka
Wyklad1 statystyka
Wyklad3 statystyka
wykład3 statystyka
Wyklad 7 Nieparametryczne metody statystyczne PL [tryb zgodności]
Statystyka wyklad 7
wyklad 1 wprowadzenie statystyki oisowe
Wykłady z metod statystycznych
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 6
Statystyka wyklad 4
Statystyka wyklad4nowy

więcej podobnych podstron