Przebieg Wykładu nr .5 ? z Metodologii
Wykład 3 - Wnioskowanie statystyczne c.d.
Testu z się często nie używa.
Wnioskowanie stat:
Szacujemy prawdopodobieństwo uzyskania danego efektu w próbie, gdyby do nie było w pop.
Poprzez przyjęcie zał. O braku tego efektu i uzyskanie danych wyników, że jest on na tyle mało prawdopodobny, że przyjmujemy, że nie ma go…
Na ile coś jest prawdopodobne, że nie jest tylko efektem losowania próby.
Nie można uzyskać wyników na temat prawdziwości hipotezy badawczej, ale nie istnieje taka procedura. Nie istnieje metoda do zliczenia prawdopodobieństwa uzyskania
Istnieje metoda obliczenia
Jeśli jest mała szansa na uzyskanie czegoś to nie wierzymy, żę jest to wynikiem tylko losowania próby i przyjmujemy, że jest to możliwe przez coś innego
Efekty generowane losowo mają rozkład normalny.
Np. mieszkańcy lewej i prawej strony wisły powiązanie z długością włosów. To po wykonaniu testów 1000 razy to zobaczył
Rzeczy generowane przypadkowo zdarzają się z określoną częstotliwością - rozkład normalny.
Powierzchnię pod krzywą reprezentuje jak często się coś zdarza w pop. I sprawdzić czy ten obszar nie przekracza 5%.
Uzyskanie danych wyników, gdyby tego efektu nie było
Alfa=5% - arbitralne kryterium
Rozumowaliśmy w kategoriach testu jednostronnego
A jest jeszcze dwustronny
TEST Dwustronny
Hipoteza bezkierunkowa - dwustronne testy istotności
Hipoteza kierunkowa - jednostronne
Test dwukierunkowy:
H0:u1=u2
H1:u1 to ~= u2
Różnice między średnimi, ale nie wiadomo w którym kierunku.
Np. osoby zdrowe i chore różnia się psychotyzmem.
Dwu - blondynki i brunetki różnią się wysokością
Jednokierunkowa - blondynki wyższe od brunetek
H0 - średnia pop.=śred. W 2 pop.
H1 - różnią się
Jednokierunkowa
H0: u1 > u2
H1: u2 <=u2
Lub odwrotnie
Rozkład z próby różnic między średnimi jest normalny.
W wypadku dużych prób przedziały ufności dla śred. Można konstruować w oparciu o stat. Z próby oraz w oparciu o właściwości krzywej normalnej. (Gaussa-la Plasa).
W miare zmniejszania się liczby obserwacji rozkład przestaje przypominać normalny
Min. 30 os . , a praktycznie 100
W wypadku małych prób n<30 konstruowanie statystyk w oparciu o krzywą normalną powoduje błąd.
Dla małych prób, różnica między średnią z próby a średnią w populacji jest większa, a przedziały ufności są węższe, niż wynikałoby to z właściwości rozkładu normalnego.
Dla małych prób, testy statystyczne oparte na krzywej normalnej odrzucają prawdziwą H0 częściej niż powinny. -> BłĄd 1 RODZAju
Gosset
Rozkład t i test t Studenta
„A student of statistics”
Nazwy skłądają się z symbolu literowego i nazwiska twórcy
Egzaminy jakości piwa Ginessa.
Test z: Wartość dla granicy obszaru krytycznego jest niezależny od wielkości próby i wynosi 1,96 (dla dwustronnego) i 1,65 (dla jednostronnego)
/Nie ważne czego dotyczy eksperyment, ważne, że porównywane są dwie populacje/
Normalny reprezentuje częstość efektów, które są dziełem tylko przypadku!
Trza przeliczyć na zety i przeliczyć ile wyszło.
Jeśli wyszło zeta tyle to szansa
W każdym eksp. W którym z=1,63 lub więcej to efekt był nieprzypadkowy (a przynajmniej mało prawdopodobne)
Natomiast w przypadku dwustronnego testu ta granica jest z=1,96
W przypadku testu t nie istnieje jednolita wartość która oddziela istotność, wartość ta jest ruchoma…. Ruchoma granica.
Zależy od LiCzBy osób badanych - liczby prób.
Im więcej osób badanych tym bardziej rozkład normalny się rozjeżdża. Też są to rozkłady dzwonowe , ale mają szerszą gałąź, więc 1,96 obejmuje większy obszar. Przez co operuje na znacznie wyższym procencie niż 5%.
Trzeba znaleźć te 5% dla danej ilości próby, np. dla n=8 to dopiero w 2,45 zetów obejmuje 95% obserwacji i mamy te 5%.
Dla 3 os. Dopiero 3 z obejmuje te 95%.
Jeśli jest mniej osób badanych rozkład nie jest normalny więc nie można uznawać 1,96 - 95%. Jeśli to zignorujemy to błąd 1.
W zależności od wielkości próby potrzeba określonej siły efektu by określony efekt wyłapać
PRZEZNACZENIE MIĘDZYGRUPOWEGO TESTU T STUDENTA
Badanie istotności różnic między dwiema średnimi.
Badanie związku między zmienną nominalną z dwiema kategoriami ze zmienną interwałową (ilorazową).
Płeć - zmienna nominalna z dwiema kategoriami.
Stopnie swobody- ilość parametrów, które potrafią się swobodnie zmieniać
Nie dokonujemy globalizacji wyników z próby na pop.
Żeby obliczyć średnią w próbie to … arytm. W pop. Byśmy tak nie postąpili. Żeby to policzyć to nie dzielimy przez liczbę obserwacji, ale przez nią +1
Np.
Wzrost 10 os. - średnia arytm. - normalnie
W pop. Występuje - średnia, liczba 10 i te dzięsięt obserwacji czyli 12 parametrów.
Dzielimy przez liczbę obserwacji +1
Trzeba odrzucić ten element który nie ma swobody, Stopnie swobody, czyli dzielimy nie przez 10 a przez 9 bo tylko 9 ma swobode
W teście t studenta -2 bo po -1 z każdej grupy
Stopnie swobody powodują zmianę rozkładu normalnego na rozkład t.
Zmienne w teście t studenta:
- niezależna:
Nominalna z dwiema kategoriami
- zależna:
Interwałowa lub ilorazowa
Typy zmiennych niezależnych w teście t studenta
Coś co klasyfikuje próbe na dwie części
- manipulowalne (nie musi tak być)
- niemanipulowalna (organizmiczne) - płeć, zdrowy/chory - zastana właściwosć danej osoby
- z natury dychotomiczne (plec)
- z natury ciągłe, ale zdychotomizowane (wzrost na wysocy i niscy)
Podział całej próby na dwie grupy
- wg średniej (jeśli jest symetryczny rozkład)
- wg mediany (w przypadku skośnych rozkładów)
Wykorzystanie skrajnych części grurpy
- np. skrajne kwantyle (nieśmiałość, asertywność - a sukces życiowy)
Test t studenta jest testem parametrycznym, czyli ma założenia , czyli warunki który ten test musi spełniać żeby ten test pozwalał wnioskować
Zagrożenia:
- zależne od badacza (np. skale pomiarowe -> musi być tak , że niezależna musi być nominalna z dwiema kategoriami!!!, natomiast zmienna zależna nie może być nominalna, ani porządkowa, a musi być interwałowa)
- niezależne od badacza (np. normalność rozkładów zmiennych zależnych w badanych populacjach (test Lillieforsa, test Shapiro-Wilka). -> czy rozejście od normalność jest istotne statystycznie bądź nie. Wykrywanie odejścia od normalności.
Wymaga to test t Studenta. Jeśli tak się nie stało to zależy jak bardzo to się nie stało….
Jeśli rozkład jest całkiem niepodobny do normalnego to nie używamy testu t studenta.
- homogeniczność wariancji w badanych populacjach (test Levena) - równoważność
Nie powinno być tak, że w jednej grupie są 5, 4, 3 , 6, 7 a w drugiej 203 , 32 4, 35, 5,
Test t studenta tego nie znosi. Jest odporny. Dopóki założenie nie jest skrajne to wyniki testu t będą poprawne.
- liczebność próby (test t studenta nadaje się do sytuacji jak jest mało obserwacji) - w przypadku małej liczby badanych to mała jest moc testu - zdolność przewidywania rzeczywiście istniejących elementów.
Np. lupa wykryje duże obiekty - robaczki
Mikroskop też to zobaczy
Ale bakterii lupa nie zobaczy, a mikroskop tak , a efekt też istnieje tyle, że jest słaby.
Im mocniejszy jest obiektywnie efekt tym łatwiej jest go wykryć, czyli mniejszą liczbę obserwacji potrzeba by to zauważyć ten efekt.
Im większa próba tym większa moc.
Test jest poprawny (nawet jeśli nie dostrzegł teg), ale ma małą moc po prostu. Ale na swoim poziomie jest poprawny.
Wariancje różne, a próby różnoliczne, najbardziej niebezpieczna sytuacja!
Np. porównanie ludzi chorych i zdrowych - chorych mniej…
- Skośność jest niebezpieczna szczególnie wtedy, gdy dwie populacje mają rozkłady skośne w różne w różne strony -- gwarant błędów w teście t.
Wersje testu t studenta
- Dla danych międzygrupowych (standard)test g1 i test g2
-wymagająca homogeniczności wariancji (dokładne wyniki)
-wersja nie zakładająca homogeniczności wariancji. (daje wyniki przybliżone, większy błąd)Zwykle nie ma potrzeby jej stosowania.
- dla danych skorelowanych (pomiarów zależnych/ manipulacji wewnątrz osób badanych)
Test- manipulacja-test
Wszyscy z i wszyscy bez
- Dla jednej zmiennej/sredniej
Czy średnia uzyskana w grupie jest istotnie różna od średniej kryterialnj
H1: u1~=4,541 a H0: u1=4,541
Dla tego samego poziomu t, poziom p jest dwukrotnie niższy w wypadku hipotezy jednostronnej niż dwustronnej.
Obszar pod krzywą który wydzieliliśmy to obszar prawdopodobieństwa tego, że coś jest tylko wynikiem błędów losowania próby!!!!!
Np.
Z=1,812
I prosi wartość obszaru pod krzywą jeśli jest ponizej 5% to jest zbyt mało prawdopodobne że efekt powstał tylko naskutek tylko błędów losowania próby.
Jeśli jest dwukierunkowa to musimy uwzględniać obie strony rozkładu. Więc jest po obu 2,5%
Ponieważ jest mniejszy to przesunięciu ulega wartość krytyczna …
Poziom t wymagany dla osiągnięcia poziomu istotności statystycznej będzie niższy dla hipotezy jednostronnej niż dwustronnej.
Jeśli jest dwustronna trzeba silniejszych wyników.
Jeśli była kierunkowa to wystarczą słabsze wyniki, żeby były istotne statystyczne. Szansa na istotność rozkładu jest większa.
Czemu więc się nie stawia non stop kierunkowych. Kierunkowe są skuteczne jeśli istnieją ważne podstawy do ich postawienia. Jeśli nie było podstaw to stawiamy bezkierunkowa to uzyskując 2,00 to nie jest to wystarczające bo trzeba 2,228, więc jego wyniki nie są istotne dla hipotezy dwustronnej , ale jest większy od 1,812 to w jednostronnej są to wyniki istotne statystyczne. Manipulowanie wynikami. Fałszowanie wyników.