Analiza Zależności
Tabulacja
danych
Istotność i siła związku między zmiennymi
Zależności między zmiennymi w zależności od ich charakteru
a) zmienna ilościowa, ilościowa → analiza korelacji Pearsona, współczynnik korelacji rang Spearmana
b)zmienna: jakościowa, jakościowa → Test niezależności Chi- kwadrat Yula, współczynnik kontyngencji C.Pearsona, V.Cramera, T. Czuprowa
c)zmienne ilościowe, jakościowe → analiza wariancji ANOVA
Wykresy rozrzutu
Punkty leżą dokładnie na linii prostej (korelacja pełna b. rzadko)
konfiguracja wielu punktów leżących mniej więcej wzdłuż prostej lub krzywej (silna korelacja)
punkty są rozproszone (korelacja słabsza)
bezkształtna chmura punktów (brak korelacji)
Kierunek zależności
rxy = 0 brak zależności liniowej między badanymi cechami (możliwe, że istnieje między nimi korelacja krzywoliniowa)
rxy > 0 zależność dodatnia (wraz ze wzrostem wartości jednej cechy wzrasta wartość drugiej)
rxy<0 korelacja jest ujemna (wzrostowi wartości jednej cechy towarzyszy wartości drugiej)
przy rxy= 1 lub -1 istnieje liniowa zależność funkcyjna
Testowanie hipotez statystycznych
Sformułowanie hipotezy zerowej (H0) oraz hipotezy alternatywnej (H1)
Wykonanie procedury testowej:
Wyznaczany
jest rozkład wartości statystyki testowej przy losowym doborze
próby oraz przy założeniu prawdziwości hipotezy zerowej
Przyjęcie poziomu istotności α – przyjmujemy prawdopodobieństwo popełnienia błędu
Wybór tzw. statystyki testowej (tablice)
Podjęcie decyzji dotyczącej odrzucenia bądź nie odrzucania H0
test niezależności χ2
Formułowanie
hipotez
Hipoteza zerowa:
H0
cechy X i Y są niezależne
Hipoteza alternatywna:
H1
cechy X i Y są zależne
Wyznaczenie rozkładu teoretycznego
Przyjęcie poziomu istotności
Obliczenie
stopni swobody
Odczytanie wartości krytycznej z tablic rozkładu χ2
Wykonanie procedury testowej χ2
Podjęcie
decyzji dotyczącej H0
(odrzucenie
bądź nie odrzucania)
Gdy χ2
większe
lub równe χ2a;(r-1)(k-1)
H0
odrzucamy na rzecz hipotezy alternatywnej
Gdy χ2
< χ2a;(r-1)(k-1)
nie
ma podstaw do odrzucenia H0
o niezależności cech
Prawostronny
obszar krytyczny
Współczynnik korelacji Yula
współczynnik Yula jest miarą korelacji pomiędzy dwiema zmiennymi jakościowymi w tabeli 2x2
przyjmuje wartości od 0 (brak powiązania między zmiennymi) do 1 (całkowite powiązanie między zmiennymi)
Współczynnik korelacji V. Cramera
współczynnik przyjmuje wartości od 0 (brak relacji między zmiennymi) do 1.
Współczynnik kontyngencji Pearsona
Stosowany do tablic kwadratowych.
Maksymalna wartość jest zawsze mniejsza od 1 i zależy od liczby wierszy/kolumn
Współczynnik korelacji Czuprowa (jeszcze istnieje)