Interpretacja tabel
kontyngencji
Dr hab. inż. Jadwiga Stobiecka
Etapy wnioskowania statystycznego
Z zastosowaniem programów
Na piechotÄ™
statystycznych
Øð Wprowadzenie danych
Øð Wprowadzenie danych
Øð SformuÅ‚owanie hipotezy zerowej
Øð SformuÅ‚owanie hipotezy zerowej
Øð Sprawdzenie zaÅ‚ożeÅ„ testu
Øð Sprawdzenie zaÅ‚ożeÅ„ testu
Øð Obliczenie wartoÅ›ci testu na
podstawie wyników z próby
Øð -
Øð Znajdowanie wartoÅ›ci krytycznych
z tablic przy ustalonym poziomie
Øð -
istotności ą
Øð PodjÄ™cie decyzji o odrzuceniu/lub
Øð PodjÄ™cie decyzji przy możliwie
nie hipotezy zerowej przy danym
najlepszym poziomie
poziomie istotności
wiarygodności hipotezy
Øð Interpretacja wyników
alternatywnej
Øð Interpretacja wyników
Analiza tabel zależności
polega na:
óðUstaleniu czy istnieje zależność
statystycznie istotna oraz:
óðJeÅ›li jest istotna, to należy ustalić,
jaka jest jej siła.
Idea komputerowego poziomu
prawdopodobieństwa
Przy weryfikacji hipotez statystycznych za pomocą programów
komputerowych ważne jest wprowadzenie poza poziomem
istotności ą (ex ante) także poziomu p (ex post). Ten drugi poziom
istotności nazywany jest komputerowym poziomem istotności,
poziomem prawdopodobieństwa lub też prawdopodobieństwem
testowym (significance level).
Jeżeli ą > p, to na danym poziomie istotności ą odrzucamy
hipotezę zerową, natomiast jeśli ą < p, to na danym poziomie
istotności ą brak jest podstaw do odrzucenia hipotezy zerowej.
Weryfikacja hipotez statystycznych
Hipotezę zerową orzekająca, że cechy X i Y są
niezależne, możemy zweryfikować testem Ç2.
H0: cechy X i Y są niezależne
H1: cechy X i Y są zależne
(O E)2 k p (nij Eij)2
Ç2 = "---------- = " " ----------
E i=1 j=1 Eij
gdzie:
E wartość oczekiwana
O wartość obserwowana
ZaÅ‚ożenia testu Ç2 :
óðWartość oczekiwana E nie może być
zerem, bo przez zero siÄ™ nie dzieli!
óðNajkorzystniej jest, gdy wartość
oczekiwana E jest większa od 10.
óðDla maÅ‚ych tabel (20
większych, w których występują liczności
poniżej 5 wprowadza się tzw. poprawkę
Yatesa
Wybrane współczynniki siły
zwiÄ…zku
Współczynnik Ś stosowany
dla tabel małych (2x2)
Współczynnik Ś jest miarą zależności między dwiema
zmiennymi w tabeli 2x2. Jego wartość zmienia się od 0
(brak zależności między zmiennymi) do 1 (całkowita
zależność między zmiennymi).
Współczynnik V Cramera stosowany
dla tabel ze zmiennÄ… (zmiennymi)
nominalnÄ…
Współczynnik V Cramera jest miarą zależności
pomiędzy dwiema zmiennymi. Przyjmuje on wartość od 0
(brak zależności między zmiennymi) do 1. Im wyższa jest
wartość współczynnika, tym silniejsze jest powiązanie
między analizowanymi cechami.
Współczynnik R Spearmana stosowany
dla zmiennych porzÄ…dkowych
Współczynnik korelacji rang Spearmana (R)
można uważać za zwyczajny współczynnik korelacji
Pearsona z tą różnicą, że wykorzystujemy rangi, a nie
wartości. Stosuje się go wtedy, gdy dwie zmienne
mierzone sÄ… na skali porzÄ…dkowej lub nie posiadajÄ…
rozkładu normalnego. Przyjmuje on wartości z przedziału
<-1, 1>. Im wartość R jest bliższa 1 lub -1, tym
silniejsza jest analizowana zależność.
Przykład braku zależności
Płeć a częstość korzystania z restauracji
typu fast-food
Wiersz
PAEC Nigdy Rzadko Często
ogółem
Mężczyzna 80 190 250 520
Kobieta 110 200 300 610
Ogółem 190 390 550 1130
Charakterystyka statystyczna zależności
Chi-kwadr. df p
Chi kwadrat
0,2385699 df=2 p=0,88756
Pearsona
Współczynnik
0,0458998
kontyngencji
V Cramera 0,0459482
Interpretacja danych polega na:
1. Postawieniu hipotezy zerowej
o niezależności analizowanych zmiennych
óð Ho: Nie ma zależnoÅ›ci pomiÄ™dzy pÅ‚ciÄ… a
częstością korzystania z restauracji
typu fast food (zmienne są niezależne).
2. Postawieniu hipotezy alternatywnej
óð H1: Istnieje zależność pomiÄ™dzy pÅ‚ciÄ… a
częstością korzystania z restauracji
typu fast food (zmienne są zależne).
3. Sprawdzeniu założenia testu, w tym
przypadku Ç2. (zaÅ‚ożenia dla tabeli na
slajdzie 13 są spełnione, dlaczego?)
4. Porównanie prawdopodobiestwa
testowego p z przyjętym poziomem
istotności ą.
Dla p>Ä… - nie ma podstaw do odrzucenia
hipotezy zerowej
Dla p=ą - mamy dylemat przyjąć czy
odrzucić?
Dla p<Ä… - odrzucamy hipotezÄ™ zerowÄ… na
rzecz alternatywnej
5. Podjęciu decyzji o braku podstaw do
odrzuceniu hipotezy zerowej lub
odrzucenie hipotezy i przyjęcie
alternatywnej
Niech Ä…=0,01, p=0,88756 (tabela na slajdzie 13)
Ponieważ p>ą, nie ma podstaw do odrzucenia
hipotezy zerowej o niezależności zmiennych.
6. W przypadku odrzucenia hipotezy zerowej,
wybór właściwego współczynnika do określenia
siły zależności (w oparciu o wymiar tabeli i
poziom obu pomiaru zmiennych)
W naszym przypadku to koniec zadania. Gdyby
były podstawy do odrzucenia hipotezy zerowej,
należałoby jeszcze określić siłę związku w
oparciu o właściwy współczynnik. W naszym
przypadku zmienna płeć jest mierzona na skali
nominalnej, zmienna częstość korzystania z
restauracji Fast- food na skali porzÄ…dkowej,
wobec tego moglibyśmy zastosować
współczynnik V Cramera.
Zadanie do samodzielnej interpretacji
Wiek respondenta a czas posiadania
telefonu komórkowego
WIEK Do roku 1 do 3 lat Pow. 3 lat Wiersz
do 20 lat 50 150 100 300
21-30 lat 140 610 160 910
31-45 lat 0 170 160 330
Ogółem 1900 930 420 1540
Wiek respondenta
a czas posiadania telefonu komórkowego
(charakterystyka statystyczna zależności)
Chi-kwadr. df p
Chi
kwadrat 15,82521 df=4 p=0,00326
Pearsona
V Cramera 0,2266728
R rang
0,1730977 t=2,1668 p=0,03181
Spearmana
Jeszcze jedno zadanie
Wiek a znajomość marek rowerów
(procentowanie do kolumn)
ZNAJOMOŚĆ WIEK - WIEK - WIEK - Wiersz
MAREK 15_24 25_44 45_64 Razem
Liczba NIE ZNA 7 17 28 52
% z kolumny 10,00% 17,71% 41,18%
Liczba SAABO ZNA 18 39 20 77
% z kolumny 25,71% 40,63% 29,41%
Liczba DOBRZE ZNA 45 40 20 105
% z kolumny 64,29% 41,67% 29,41%
Liczba Ogółem 70 96 68 234
% z kolumny 100% 100% 100%
Wiek a znajomość marek rowerów
(procentowanie do wierszy)
ZNAJOMOŚĆ WIEK WIEK WIEK Wiersz
MAREK 15-24 25-44 45-64 Razem
Liczba NIE ZNA 7 17 28 52
% z wiersza 13,46% 32,69% 53,85% 100%
Liczba SAABO ZNA 18 39 20 77
% z wiersza 23,38% 50,65% 25,97% 100%
Liczba DOBRZE ZNA 45 40 20 105
% z wiersza 42,86% 38,10% 19,05% 100%
Liczba 70 96 68 234
Wiek a znajomość marek rowerów
(procentowanie do całości)
ZNAJOMOŚĆ WIEK - WIEK - WIEK - Wiersz
MAREK 15_24 25_44 45_64 Razem
NIE ZNA
Liczba 7 17 28 52
% z całości 2,99% 7,26% 11,97% 22,22%
SAABO ZNA
Liczba 18 39 20 77
% z całości 7,69% 16,67% 8,55% 32,91%
DOBRZE ZNA
Liczba 45 40 20 105
% z całości 19,23% 17,09% 8,55% 44,87%
Liczba 70 96 68 234
% z całości 29,91% 41,03% 29,06% 100%
Histogram skategoryzowany
Skategoryz. histogram: ZNAJ_MAR x WIEK
50
45
40
35
30
25
20
15
10
5
0
15_24 25_44 45_64 15_24 25_44 45_64
ZNAJ_MAR: N_ZNA ZNAJ_MAR: S_ZNA
50
45
40
35
30
25
20
15
10
5
0
15_24 25_44 45_64
ZNAJ_MAR: D_ZNA
WIEK
Liczba obs.
Wykres interakcji
Wykres interakcji: ZNAJ_MAR x WIEK
50
45
40
35
30
25
20
15
10
ZNAJ_MAR
5
N_ZNA
ZNAJ_MAR
0
S_ZNA
15_24 25_44 45_64
ZNAJ_MAR
WIEK
D_ZNA
Liczności
Interpretacja statystyczna zależności
Chi-kwadr. df p
Chi^2 29,39154 df=4 p=0,00001
Pearsona
Chi^2 NW 28,24119 df=4 p=0,00001
V Craméra 0,2506042
R rang -0,317159 t=-5,094 p=0,00000
Spearmana
Wyszukiwarka
Podobne podstrony:
BM w TM Stobiecka Technika drabinkowa wykład turystyka(1)
BM w TM Stobiecka Wywiad grupowy(1)
Komunikacja interpersonalna wykład 8 11 2012
Komunikacja interpersonalna 25 10 2012
Komunikacja Interpersonalna 18 10 2012
BM Stobiecka Pytania kwestonariuszowe(1)
KURS BM
03 Wyklad 1 (wprowadzenie do BM)
Odblokowanie Blumedia BM 6300
Fadal [BM] M480 89
Fanuc 10M Okada [BM] M467 80
Fanuc 6M Mat [BM] M481 80
bm 1
więcej podobnych podstron