21 kwietnia – wykład
Parametryczne testy istotności
Test parametryczne stosowane są w celu sprawdzania hipotez parametrycznych. Najczęściej się stosuje jako testy istotności.
Test istotności – test polegający na odrzuceniu H0 lub stwierdzeniu braku podstaw do jej odrzucenia. W teście tym pod uwagę brany jest tylko błąd pierwszego rodzaju (poziom istotności), nie uwzględnia się konsekwencji popełnienia błędu drugiego rodzaju. (stąd nazwa testy istotności)
Istotność różnicy między średnimi
Test t-studenta próby niezależne
Test-t studenta próby zależne
Są to statystyki małych prób (te dwa wyżej)
Istotność różnicy między wariancjami
Test F-Fishera, próby niezależne
Istotność różnic miar współzależności
Istotność współczynnika korelacji
ISTOTNOŚĆ RÓŻNICY POMIĘDZY ŚREDNIMI (test t-student)
Tsty t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich.
Zmienne muszą być zmiennymi ilościowymi (liczymy i porównujemy średnie)
Rozkład testu t-studenta zależy od wielkości odchylenia standardowego z próby i wielkości samej próby, według której ustala się stopnie swobody.
Stopnie swobody (df) określają liczbę niezależnych obserwacji (pomiarów) w próbie, tzn. takich które mogą mieć dowolną wartość.
Hipoteza zerowa ma postać:
H0: dwie próby różnią się między sobą w sposób nieistotny (przypadkowy), czyli (inaczej) nie ma różnicy pomiędzy dwoma próbami
Hipoteza alternatywna (odwrotna):
H1: dwie próby różnią się między sobą w sposób istotny (różnica jest istotna, nieprzypadkowa) DWUSTRONNY TEST SPRAWDZAJĄCY
Różnica pomiędzy jedną próbą jest istotnie wyższa/niższa od drugiej próby JEDNOSTRONNY TEST SPRAWDZAJĄCY
Sformułowanie hipotezy alternatywnej decyduje o tym czy mamy do czynienia z testem jednostronnym stronnym czy testem dwustronnym
Test dwustronny (bezkierunkowy) – testuje hipotezy bezkierunkowe (nie testuje kierunku zależności), np.
H1: średnie wynagrodzenie nauczycieli szkół podstawowych na wsi nie jest równe średniemu wynagrodzeniu nauczycieli szkol podstawowych w mieście
Test jednostronny (kierunkowy) – testuje hipotezy kierunkowe (testuje kierunek zależności) np.
H1: średnie wynagrodzenie nauczycieli szkol podstawowych na wsi jest niższe/jest wyższe od średniego wynagrodzenia nauczycieli szkol podstawowych w mieście
W obu przypadkach hipoteza zerowa jest taka sama
H0: średnie wynagrodzenie nauczycieli szkol podstawowych na wsi jest równe średniemu wynagrodzeniu nauczycieli szkół podstawowych w mieście.
Test t-studenta dla prób niezależnych (nieskorelowanych, niepowiązanych)
Porównuje średnie dwóch niezależnych od siebie grupach ( grupa eksperymentalna/grupa kontrolna kobiety/mężczyźni, zatrudnieni/bezrobotni/ dzieci wiejskie/miejskie)
Wymagana jest homogeniczność (jednorodność/równość? Wariancji (wariancje obu rób muszą być zbliżone
Homogeniczność wariancji sprawdzana jest testem F-Fishera (kolejne slajdy)
Test t-studenta dla prób zależnych (skorelowanych, powiązanych)
Porównuje średnie z dwóch pomiarów:
Przed i po zadziałaniu jakiegoś czynnika, np. przed i po eksperymencie
Prowadzonych w różnych warunkach
Prowadzonych w nowej i starej metodzie; w dwóch próbach zależnych (wśród tych samych badanych)
Np. wyniki testu przed rozpoczęciem zajęć z terapii pedagogicznej i po jej zakończeniu
Czas rozwiązywania zadań bez i podczas słuchania muzyki
Istotność różnicy między wariancjami
Test F-Fishera
(próby niezależne, nieskorelowane)
Test Fishera służy ocenie, czy wariancje dwóch prób są równe/zbliżone (homogeniczne), a zatem czy można zastosować test t-studenta dla prób niezależnych
Badamy hipotezę o braku istotnych różnic pomiędzy wariancjami. Brak podstaw do odrzucenia H0 wskazuje na homogeniczność wariancji.
Estymator F-Fishera – wzory (+najistotniejsze informacje)
Estymatory wariancji obliczamy na podstawie wariancji dla obu osób stosując wzór:
WZORY W ZESZYCIE
Estymatory wariancji – pierwszym estymatorem jest ten o większej wartości
Obliczone estymatory wariancji z obu prób podstawiamy do wzory na F, tak aby w liczniku znajdowała się większa wartość estymatora
Istotność różnic miar współzależności
Istotność współczynnika korelacji
Istotność współczynnika korelacji, głownie dla małej próby, można sprawdzić stosując:
Test t-studenta
Metodę wg wartości krytycznej
Istotność przeprowadzamy dla zależnych współczynników korelacji w celu dokonania oceny ich istotności. Pozwala ona ustalić czy otrzymana wartość jest istotna, czy tez powstała w sposób przypadkowy.
Metoda 1 – test t-studenta
Wzór: w zeszycie t=r….<pierwiastek>
Hipotezy maja postać:
H0: współczynnik korelacji jest nieistotny (związek między zmiennymi jest przypadkowy)
H1: korelacja między zmiennymi jest istotna
METODA 2 – według wartości krytycznej
Polega na porównaniu obliczonej wartości współczynnika z wartością krytyczną odczytaną z odpowiedniej tablicy:
Wartości krytyczne współczynnika korelacji r(xy indeks dolny) Pearsona
Lub
Wartości krytyczne współczynnika rs Spearmana
Zasada:
Jeżeli |r| ….. – to współczynnik jest statystycznie istotny
Jeżeli |r| <…. To współczynnik jest statystycznie nieistotny
TESTY NIEPARAMETRYCZNE – testy dotyczące całej badanej zbiorowości, a nie tylko określonych jej parametrów.
Własności:
Nie wymagają żadnych założeń co do rozkładu
Można je stosować wobec zmiennych wyrażonych na wszystkich skalach pomiarowych
TEST CHI- KWADRAT
Najczęściej stosowany test nieparametryczny w badaniach statystycznych w pedagogice – wykorzystywany podczas analizowania ankiet
W teście chi kwadrat porównujemy wartości obserwowane z wartościami oczekiwanymi. Wzór tego testu ma postać: …
Wymagania: wartości oczekiwane powinny być większe od 5.
Test chi-kwadrat jest testem jednostronnym.
Stosowany jest do:
Zadania zgodności cech zaobserwowanych i oczekiwanych – jest to TEST ZGODNOŚCI
Sprawdzania niezależności dwóch zmiennych – jest to TEST NIEZALEŻNOŚCI
Test niezależności jest szczególnym przypadkiem testu zgodności
Test niezależności Chi-kwadrat stosuje się w celu sprawdzenia związku (zależności) pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)
Ocena niezależności między badanymi cechami jest niezbędna do badania ich współzależności
Przykłady:
Związek pomiędzy zainteresowaniem sportem a płcią
Związek dwóch, zazwyczaj nominalnych, zmiennych dychotomicznych dwudzielnych)
Związek pomiędzy miejscem zamieszania, a częstością uprawiania sportu (często, czasami, nigdy)
Związek dwóch najczęściej jakościowych, zmiennych wielodzielnych
Hipotezy:
H0: badane cechy są niezależne
H1: badane cechy są zależne
(test chi-kwadrat testuje niezależność zmiennych)
Aby wyznaczyć wartość chi-kwadrat wymagane jest sporządzenie tablicy kombinowanej, (in. Tablicy zależnościowej lub tablicy niezależności) odpowiednio:
Czteropolowej (dla zmiennych dwudzielnych)
Lub
Wielopolowej (dla zmiennych wielodzielnych)
Umiejętność obliczenia wartości oczekiwanej na podstawie wartości empirycznej – PYTANIE OTWARTE NA ZALICZENIU !!! – w oparciu o tabele czteropolowe
UWAGI
Wartość statystyki chi-kwadrat zależy od trzech czynników: - PYT NA ZALICZENIE
Od siły związku
Od wielkości próby
Od szczegółowości grupowania danych
Im większa wartość chi-kwadrat tym większa „szansa” na istnienie związku między zmiennymi.
ANALIZA WSPÓŁZALEŻNOŚCI POMIĘDZY CECHAMI JAKOŚCIOWYMI
ANALIZA WSPÓŁZALEŻNOŚCI
Stwierdzenie występowania związku (odrzucenie hipotezy zerowej) daje podstawę do obliczania siły tego związku.
Siłę związku pomiędzy zależnymi zmiennymi jakościowymi badamy za pomocą współczynników kontyngencji
Współczynniki
Dla tablic czteropolowych – współczynnik … (zeszyt) (Fi) Yule’a
Dla tablic wielopolowych – współczynnik kontyngencji C Pearsona
PYTANIE NA ZALICZENIE: Współczynnik C Pearsona może być stosowany przy obliczaniu siły związku występującego w tablicach wielopolowych dowolnej wielkość i dowolnego kształtu (kwadratowych lub prostokątnych)
Tablica czteropolowa jest szczególnym przypadkiem tablicy wielopolowej (najmniejsza tablica wielopolowa to tablica 2x2) zatem współczynnik C Pearsona może być również stosowany dla tablic czteropolowych.
Maksymalna wartość współczynnika C Pearsona zależy od liczby wierszy i kolumn w tabeli
Im większa jest liczba tych pól, tym bardziej osiągalna jest maksymalna wartość tego współczynnika (współczynnik Cmax zbliża się do +1)
Im mniejsza jest liczba tych pól, tym niższa jest maksymalnie osiągana wartość C.
Zatem:
Wartość współczynnika C należy rozpatrywać w zależności od wartości maksymalnej możliwej dla danej tabeli
Obliczanie współczynnika Cmax na zaliczeniu będzie
Dysponując wartością współczynnika C obliczoną dla konkretnego przykładu orac Cmax należy obliczyć wartość skorygowaną współczynnika kontyngencji …wzór
W każdym przypadku wartość skorygowana Ckor prowadzi do podwyższenia wartości współczynnika C
Interpretacja współczynników kontyngencji
Współczynniki kontyngencji przyjmują TYLKO WARTOŚCI DODATNIE (od 0 do 1),
Zatem określają tylko siłę zależności nie opisują natomiast jej kierunku. – PYTANIE NA ZALICZENIE