wyklad 5 Testy parametryczne PL [tryb zgodności]


Biometria i Biostatystyka
Wykład 5: Testy parametryczne
Testy Istotności
Czemu służą?
Formułowanie hipotez
Statystyka testowa
P-wartości
P-wartości
Istotność/znamienność statystyczna
Testowanie wartości średniej w populacji
Dwustronne testy istotności i przedziały
ufności
P-wartości vs. ustalone ą
Testy Istotności
2 najczęściej stosowane formy
wnioskowania statystycznego
Przedział ufności
Przedział ufności
Ocena parametru populacji
Test istotności
Ocena słuszności konkretnych stwierdzeń o
populacji dokonana na podstawie dowodów
dostarczonych przez dane.
Testy istotności jako narzędzie
wnioskowania statystycznego
Test istotności
Formalna procedura porównywania
zebranych danych z hipotezą, której
prawdziwość chcemy ocenić.
prawdziwość chcemy ocenić.
Hipoteza: stwierdzenie o parametrach
populacji lub modelu
Wyniki testu są wyrażone w postaci
prawdopodobieństwa, które mierzy jak
hipoteza się zgadza z danymi
Formułowanie hipotez
Hipoteza zerowa
Stwierdzenie będące przedmiotem testu
istotności
istotności
Test istotności jest tak skonstruowany, by
ocenić siłę dowodów przeciw niej
Stwierdzenie w postaci  brak wpływu lub
 brak różnic
Skrót: H0
Formułowanie hipotez, cd.
Hipoteza alternatywna
Stwierdzenie, które podejrzewamy o prawdziwość
jako alternatywę dla H0
Skrót: Ha
Skrót: Ha
Hipotezy zawsze odnoszą się do populacji lub
modelu, nie do poszczególnych wyników.
Hipotezy testów parametrycznych dotyczą
parametrów populacji.
Istnieją jednostronne lub dwustronne hipotezy
alternatywne.
Statystyki testowe
Test opiera się na statystyce szacującej parametr,
o którym mówi hipoteza. Zwykle jest to taka sama
estymata, którą wykorzystuje się przy
konstruowaniu przedziałów ufności dla badanego
konstruowaniu przedziałów ufności dla badanego
parametru. Kiedy H0 jest prawdziwa, oczekujemy,
że estymacja daje wartości bliskie tym
wynikającym z H0.
Wartości estymat dalekie od wartości parametru
opisanej przez H0 dostarczają dowodu przeciw H0.
Hipoteza alternatywna determinuje, który kierunek
uważamy za sprzyjający Ha.
Statystyki testowe, cd.
Statystyki testowe
Mierzą zgodność hipotezy zerowej i
danych.
danych.
Używane są do obliczania
prawdopodobieństwa, które potrzebujemy
do testu istotności.
Zmienne losowe ze znanym rozkładem.
P-wartości
Test istotności znajduje
prawdopodobieństwo otrzymania
wyniku tak skrajnego lub bardziej, niż w
wyniku tak skrajnego lub bardziej, niż w
danej chwili obserwowany.
Skrajny: daleki od tego, którego byśmy się
spodziewali gdyby hipoteza zerowa była
prawdziwa
P-wartości, cd.
Prawdopodobieństwo, obliczane przy
założeniu prawdziwości H0, że statystyka
testowa da wynik tak skrajny lub bardziej niż
w danej chwili obserwowany jest nazywane
w danej chwili obserwowany jest nazywane
P-wartością testu.
Im mniejsza P-wartość, tym mocniejszy
dowód przeciw H0 dostarczony przez dane
Oblicza się ją używając funkcji rozkładu
gęstości prawdopodobieństwa statystyki
testowej (np. standardowego rozkładu
normalnego dla statystyki testowej z).
Istotność statystyczna
Jeśli poziom P jest mniejsza lub równa niż ą,
mówimy że dane są znamienne statystycznie
na poziomie istotności ą.
Przykład: poziom istotności 0.01 znaczy że
Przykład: poziom istotności 0.01 znaczy że
mamy dowód tak silny, że pojawiałby się
tylko w 1% obserwacji, gdyby hipoteza
zerowa była rzeczywiście prawdziwa.
Co mówi P-wartość równa 0.03?
Symulacje numeryczne
Krok 1. Korzystając z generatora liczb
losowych N(0,1) wygeneruj dwa zbiory
pomiarów po 16 pomiarów w każdym
Krok 2. Zapamiętaj P-wartości uzyskane z
zastosowanego testu statystycznego (np.
testu t)
Liczba powtórzeń kroków 1-2: N=25000
N = 1262
Test istotności - kroki
Można ocenić istotność dowodów przeciw
hipotezie zerowej dostarczonych przez dane
wykonując czynności:
1. Sformułuj hipotezę zerową H0 i hipotezę
1. Sformułuj hipotezę zerową H0 i hipotezę
alternatywną Ha. Test jest przeznaczony do
oceny siły dowodów przeciw H0. Ha jest
stwierdzeniem które zaakceptujemy jeśli dowody
pozwolą nam odrzucić H0.
2. Oblicz wartość statystyki testowej. Ta statystyka
zwykle określa jak daleko dane są od H0.
Test istotności - kroki
3. Znajdz P-wartość dla obserwowanych danych.
Jest to prawdopodobieństwo (przyjmując, że
hipoteza zerowa jest prawdziwa), że statystyka
będzie się opowiadać przeciw hipotezie co
najmniej tak silnie jak z tymi danymi.
najmniej tak silnie jak z tymi danymi.
4. Sformułuj wniosek. Wybierz poziom istotności ą
(jak bardzo dowód przeciw H0 uznajesz za
decydujący). Jeśli P-wartość jest mniejsza lub
równa ą - wniosek, że hipoteza alternatywna
jest prawdziwa; jeśli jest większa od ą -
wniosek, że dane nie dostarczają wystarczająco
silnego dowodu do odrzucenia H0. Twój wniosek
jest podsumowaniem badań wykonanych za
pomocą testu istotności.
Testy dla wartości średniej w
populacji  test z
Mamy prostą próbę losową o liczności n
wylosowanej z normalnej populacji o
nieznananej średniej ale ze znaną wariancją
2. Chcemy sprawdzić hipotezę że ma
2. Chcemy sprawdzić hipotezę że ma
określoną wartość, np. 0.
Hipoteza zerowa: H0: = 0.
Testy dla wartości średniej w
populacji  test z
Hipoteza zerowa: H0: = 0.
Statystyka testowa:
x - 0
z =
 / n
 / n
jeśli hipoteza zerowa jest prawdziwa, to statystyka
z ma standardowy rozkład normalny.
Testy dla wartości średniej w
populacji  test z
Alternatywna hipoteza: Jeśli jest
jednostronna to np. Ha: > 0
p-wartość: prawdopodobieństwo, że
standardowa normalna zmienna losowa Z
standardowa normalna zmienna losowa Z
przybierze wartość co najmniej taką jak
obserwowana z.
Możemy podobnie wnioskować dla
innych hipotez alternatywnych.
Dystrybucja statystyki testowej
Dwustronne testy istotności i
przedziały ufności
Poziom ą dwustronnego testu istotności
odrzuca hipotezę H0: = 0 dokładnie
wtedy, gdy wartość 0 znajduje się poza
wtedy, gdy wartość 0 znajduje się poza
przedziałem ufności dla dla
obliczonym dla poziomu 1-ą .
P-wartości vs. ustalone ą
P-wartość to najmniejszy poziom ą, na
którym dane są istotne.
Znając P-wartość możemy ocenić istotność na
każdym poziomie.
każdym poziomie.
To daje więcej informacji niż sprawdzanie
odrzucony-lub-nie na ustalonym poziomie
istotności.
Wartość z*, taka że P(Z>z*) jest równa
zadanej liczbie a, 0wartością krytyczną standardowego rozkładu
normalnego.
Wykorzystywanie i nadużywanie
testów
Wybieranie poziomu istotności
Wybierz poziom ą z góry jeśli musisz dokonać
decyzji.
Nie ma sensu, jeśli chcesz jedynie opisać siłę swoich
Nie ma sensu, jeśli chcesz jedynie opisać siłę swoich
dowodów.
Jeśli stosujesz test istotności z ustalonym ą by
podjąć decyzję, wybierz ą pytając jak silny dowód
jest potrzebny do odrzucenia H0.
To też zależy od tego jak wiarygodna jest/ma być
hipoteza zerowa.
Wybór poziomu istotności
Jeśli H0 reprezentuje hipotezę, w którą
każdy wierzył przez lata, będzie
potrzebny mocny dowód (małe ą) żeby
potrzebny mocny dowód (małe ą) żeby
ją obalić.
Siła dowodu potrzebnego do odrzucenia
H0 zależy od konsekwencji podjęcia
takiej decyzji.
Kosztowne: silny dowód
Wybór poziomu istotności
Lepiej podawać p-wartość, która
pozwala każdemu z nas decydować
indywidualnie czy mamy wystarczająco
indywidualnie czy mamy wystarczająco
silne dowody.
Nie ma ostrej granicy między  istotny a
 nieistotny a jedynie rosnąca siła
dowodu przy malejącej p-wartości.
Czego istotność statystyczna
nie oznacza?
Istotność statystyczna to nie to samo co
praktyczna istotność.
Przykład: hipoteza bez zależności jest odrzucana
Nie oznacza mocnego związku, ale że jest silny dowód na
Nie oznacza mocnego związku, ale że jest silny dowód na
istnienie jakiegoś związku
Kilka punktów odstających może się
przyczynić do zaobserwowania wysokiej
istotności wyniku testu, jeśli ślepo stosuje się
testy istotności.
Punkty odstające mogą również zniwelować
istotność.
Nie ignoruj braku istotności
Jeśli badacz ma wyrazny powód podejrzewać,
że zależność istnieje a potem nie może
znalezć istotnego dowodu nań, to może to
być ciekawą wiadomością --- czasami
być ciekawą wiadomością --- czasami
ciekawszą niż to gdyby potwierdzono związek
na poziomie istotności 5%.
Ukrywanie negatywnych wyników może
skazać innych badaczy na poszukiwanie
zależności, która nie istnieje.
Wnioskowanie statystyczne nie jest
słuszne dla wszystkich danych
Formalne wnioskowanie statystyczne
nie koryguje błędnie przeprowadzonego
eksperymentu.
eksperymentu.
Losowość próbkowania gwarantuje, że
prawa probabilistyki mają zastosowanie
w naszych testach istotności oraz
wyznaczanych przedziałach ufności.
Nie szukaj na siłę
znamienności statystycznej!
Można także wnioskować bez
uwzględniania istotności statystycznej.
Jeśli zdecydujesz jakiego wyniku
Jeśli zdecydujesz jakiego wyniku
szukasz, zaprojektuj eksperyment lub
próbę, która Cię do niego doprowadzi i
zastosuj test istotności żeby ocenić
wagę dowodów.
Nie szukaj na siłę
znamienności statystycznej!
Ponieważ udane próby szukania zjawisk
naukowych zwykle kończą się
naukowych zwykle kończą się
znalezieniem istotności statystycznej,
uczynienie samej istotności obiektem
poszukiwań jest zbyt nęcące.
Nie szukaj na siłę
znamienności statystycznej!
Jeśli już masz hipotezę, zaprojektuj
badanie tak, żeby otrzymać wynik, który
badanie tak, żeby otrzymać wynik, który
uważasz za istniejący.
Jeśli wynik badania jest statystycznie
istotny, masz już rzeczywisty dowód.
Moc i wnioskowanie
Badanie użyteczności przedziału ufności
Poziom ufności: mówi nam jak
niezawodna jest ta metoda przy
niezawodna jest ta metoda przy
wielokrotnych powtórzeniach
eksperymentu.
Margines błędu: mówi nam, jak czuła jest
ta metoda lub jak bardzo przedział
ogranicza szacowanie parametru
Moc i wnioskowanie
Badanie użyteczności testów istotności przy
ustalonym ą.
Poziom istotności: mówi nam jak wiarygodna jest
ta metoda w użyciu
ta metoda w użyciu
Moc testu: mówi nam o zdolności testu do
wykrywania tego, że hipoteza zerowa jest
fałszywa
Mierzona jako prawdopodobieństwo że test odrzuci
hipotezę zerową kiedy alternatywna jest prawdziwa. Im
wyższe prawdopodobieństwo, tym bardziej czuły jest
test.
Moc testu
Prawdopodobieństwo, że test istotności
przy ustalonym ą odrzuci H0, kiedy
alternatywna wartość parametru jest
alternatywna wartość parametru jest
prawdziwa, jest nazywane mocą testu
do wykrywania tej alternatywy.
Obliczanie mocy testu
Sformułuj H0, Ha (konkretną
alternatywę, którą chcemy wykryć) i
poziom istotności ą.
poziom istotności ą.
Znajdz wartości , które spowodują
x
że odrzucimy H0.
Oblicz prawdopodobieństwo
x
zaobserwowania tych wartości , dla
których alternatywa jest prawdziwa.
Zwiększanie mocy testu
Zwiększ ą. 5%-owy test istotności
będzie miał większą szansę odrzucenia
alternatywy niż 1%-owy, ponieważ jest
wymagana mniejsza siła dowodu.
wymagana mniejsza siła dowodu.
Wez taką alternatywę, która jest dalej
od 0. Wartości , które są w Ha ale leżą
blisko do hipotetycznej wartości 0 są
cięższe do wykrycia (mniejsza moc) niż
wartości , które są daleko od 0.
Zwiększanie mocy testu, cd.
Zwiększ rozmiar próby. Więcej danych
dostarczy więcej informacji o więc jest
x
większa szansa odróżnienia wartości .
Zmniejsz . To daje taki sam efekt jak
Zmniejsz . To daje taki sam efekt jak
zwiększanie rozmiaru próby: więcej informacji
o . Poprawienie procesu pomiarów i
ograniczenie uwagi na subpopulacje to dwa
najpopularniejsze sposoby na zmniejszenie .
Dwa typy błędów
Podczas przeprowadzania testów istotności
musimy przyjąć jedną hipotezę a drugą
odrzucić.
Mamy nadzieję że jest to trafna decyzja, ale
Mamy nadzieję że jest to trafna decyzja, ale
nie musi tak być.
2 typy niewłaściwych decyzji:
Jeśli odrzucimy H0 (przyjmiemy Ha) kiedy w
rzeczywistości H0 jest prawdziwe, jest to błąd
pierwszego rodzaju (odniesiony do p-wartości).
Jeśli przyjmiemy H0 (odrzucimy Ha) kiedy w
rzeczywistości Ha jest prawdziwe, jest to błąd
drugiego rodzaju (odniesiony do mocy).
Prawdopodobieństwa błędów
Statystyczne wnioskowanie jest oparte na
prawdopodobieństwie.
Jakakolwiek zasada podejmowania decyzji jest
związana z prawdopodobieństwami popełnienia
związana z prawdopodobieństwami popełnienia
dwóch rodzajów błędów.
dwóch rodzajów błędów.
Poziom istotności ą jakiegokolwiek testu z ustalonym
poziomem jest prawdopodobieństwem popełnienia
błędu pierwszego rodzaju.
ą jest prawdopodobieństwem że test odrzuci zerową
hipotezę H0 kiedy w rzeczywistości jest prawdziwa.
Moc testu przeprowadzonego na zadanym poziomie
istotności ą określona dla zadanej alternatywy wynosi 1
minus prawdopodobieństwo popełnienia błędu drugiego
rodzaju dla tej alternatywy.
Ogólnie przyjęte postępowanie
przy testowaniu hipotez
Zdefiniuj H0 i Ha tak samo jak do testu
istotności.
Popatrz na problem jak na decyzję -
Popatrz na problem jak na decyzję -
prawdopodobieństwa popełnienia błędów
I-szego i II-ego rodzaju są powiązane.
Błędy pierwszego rodzaju są poważniejsze.
Wybierz ą (poziom istotności) i rozważ testy
tylko takie, gdzie prawdopodobieństwo
popełnienia błędu I-szego rodzaju nie jest
większe od ą.
Ogólnie przyjęte postępowanie
przy testowaniu hipotez
Spośród testów wybierz ten, który ma jak
najmniejsze prawdopodobieństwo
najmniejsze prawdopodobieństwo
popełnienia błędu II-ego rodzaju (czyli jak
największą moc). Jeśli to
prawdopodobieństwo jest zbyt duże,
będziesz musisz wziąć większą liczbę prób
żeby zmniejszyć ryzyko błędu.
Testy dla wartości średniej w
populacji  jednostronny test t
Niech prosta próba losowa (PPL) o liczności n jest
losowana z populacji o nieznanej wart. oczekiwanej
. Żeby zweryfikować hipotezę że H0: = 0 na
podstawie PPL, oblicz statystykę t
podstawie PPL, oblicz statystykę t
x - 0
t =
s / n
Zmienna losowa T ma rozkład t(n-1), P-wartość dla
P(T e" t)
testu H0 przeciw Ha: > 0 wynosi albo
dla Ha: < 0
P(T d" t )
Test t - przykład 1
Niech PPL o liczności n jest losowana z
populacji o nieznanej wartości oczekiwanej .
[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1, 117.4, 111, 121.7,
124.5, 130.5]
124.5, 130.5]
średnia próby = 121.15
odchylenie standardowe próby = 5.89
Żeby zweryfikować hipotezę że H0: =
0=120 na podstawie PPL liczności n, oblicz
statystykę t dla jednej próby
x - 0 121.15 - 120
- -
- -
- -
t = = = 0.6764
= = =
= = =
= = =
s / n 5.89 / 12
Test t - przykład 1
W kategoriach zmiennej losowej T z
rozkładem t(n-1), P-wartość dla testu
H przeciw Ha: > wynosi P(T e" t)
H0 przeciw H : > 0 wynosi P(T e" t)
stopień swobody
Wartość krytyczna dla ą=0.95
Test t - przykład 1
Jeśli t1=0.6 to cdf(t1)=0.71967 więc p1=1-0.71967=0.28033
Jeśli t2=0.7 to cdf(t2)=0.75077 więc p2=1-0.75077=0.24923
więc p2 < p < p1
więc p2 < p < p1
Test t - przykład 1
Z rozkładu t Studenta otrzymujemy
tcdf(0.6764,11) = 0.743621
p = 1  0.743621 = 0.256379
Test t - przykład 1
0.7436
p=0.2564
Test t - przykład 1
Końcowy wniosek:
Nie możemy odrzucić H0
mówiącej, że wartość średnia w
populacji wynosi =120 i
przyjąć Ha z p=0.2564
Test t  przykład 2
Żeby zweryfikować hipotezę H0: = 135 na
podstawie PPL liczności n, obliczmy statystykę
t dla jednej próby:
x - 135
x - 135
t =
=
s / n
W kategoriach zmiennej losowej T z
rozkładem t(n-1), P-wartość dla testu na H0
przeciw Ha: < 0 wynosi
P(T d" t)
Test t - przykład 2
[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1,
117.4, 111, 121.7, 124.5, 130.5]
średnia próby = 121.15
odchylenie standardowe próby = 5.89
Żeby zweryfikować hipotezę że H0:
= 0=135, obliczmy statystykę t
x - 0 121.15 -135
t = = = -8.1456
s / n 5.89 / 12
Test t - przykład 2
Z rozkładu t Studenta otrzymujemy
P(T d" t) = tcdf(-8.1456,11) =2.7e-6
p = 0.0000027 < 0.000005
Test t - przykład 2
p=2.7e-6
t = -8.1456
Test t - przykład 2
Końcowy wniosek:
Odrzucamy H0 mówiącą, że wartość
średnia w populacji wynosi =135 i
przyjmujemy Ha: < 0 z p <
0.000005
Testy dla wartości średniej w
populacji  dwustronny test t
Żeby zweryfikować hipotezę że H0: = 115
na podstawie PPL liczności n, obliczmy
statystykę t
x - 115
x - 115
-
-
-
-
-
-
t =
t =
=
=
=
=
=
=
s / n
W kategoriach zmiennej losowej T z
rozkładem t(n-1), P-wartość dla testu H0
przeciw Ha: `" 0 wynosi
P(|T |>|t |)
Test t - przykład 3
[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1,
117.4, 111, 121.7, 124.5, 130.5]
średnia próby = 121.15
odchylenie standardowe próby = 5.89
Żeby zweryfikować hipotezę że H0:
= 0=115 obliczmy statystykę t
x - 0 121.15 -115
t = = = 3.6170
s / n 5.89 / 12
Test t - przykład 3
" Ponieważ wartość krytyczna t0.05=2.2010
a nasza obserwowana wartość jest wyższa,
odrzucamy hipotezę zerową na poziomie
odrzucamy hipotezę zerową na poziomie
ą=0.05.
" Z rozkładu t otrzymujemy
P(|T| > |t|) = 2*(1-tcdf(3.6170,11)) =
0.0040
Więc dokładnie p = 0.0040
Test t - przykład 3
p=0.0040
t = 3.6170
-t = -3.6170
Test t - przykład 3
Końcowy wniosek:
odrzucamy H0 że wartość średnia w
populacji wynosi =115 i przyjmujemy
Ha: `" 0 z p = 0.0040
Pary obserwacji - test t
W badaniu par obserwacji wyniki są
łączone w pary i porównywane w jej
obrębie.
obrębie.
Przykład: wyniki przed i po kursie
Pary obserwacji - analiza
" Analiza par obserwacji jest konieczna
kiedy mamy dwa pomiary lub
obserwacje każdego obiektu i chcemy
obserwacje każdego obiektu i chcemy
zbadać zmianę jednej względem
drugiej. Zazwyczaj obserwacje w
pewnym sensie są pomiarami  przed i
 po .
Pary obserwacji - analiza
" W każdej parze odejmuje się pomiar
 przed od pomiaru  po .
" Analizuje się rozkład różnic stosując
przedziały ufności i testy istotności dla
jednej próby.
Pary obserwacji  przykład 4
Gain średnia z próby = 2.5
Gain odchylenie standardowe z próby = 2.89
Aby zweryfikować hipotezę H0: =
Aby zweryfikować hipotezę H0: =
0=0 (brak różnic) przeciwko HA: `" 0
na podstawie PPL o liczności n,
obliczamy statystykę testową t
x - 0 2.5 - 0
t = = = 3.8686
s / n 2.89 / 20
Pary obserwacji  przykład 4
" Wartość krytyczna t[0.05,19]=2.0930.
" Obliczona statystyka t jest większa niż
" Obliczona statystyka t jest większa niż
wartość krytyczna, odrzucamy zatem
hipotezę zerową na poziomie ą=0.05.
" Z rozkładu t znajdujemy
P(|T| > |t|) = 2*(1-tcdf(3.8686,19)) = 0.001
Zatem dokładna wartość p = 0.001
Wykorzystanie przedziałów ufności do
wnioskowania o wartości średniej w
populacji
" Zakładając poziom istotności ą, możemy
przeprowadzić test dla wartości średniej w populacji
wykorzystując przedział ufności określony dla
poziomu C=1-ą.
poziomu C=1-ą.
" Obliczamy dolną i górną granicę przedziału ufności i
sprawdzamy, czy 0 należy do tego przedziału.
" Jeśli tak, to nie mamy podstaw do odrzucenia
hipotezy zerowej H0: = 0
" Jest to równoważne przeprowadzeniu dwustronnego
testu t na poziomie istotności ą.
Przykład 3  przedziały ufności
[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1,
117.4, 111, 121.7, 124.5, 130.5]
Średnia z próby = 121.15
Odchylenie standardowe z próby = 5.89,
ą=0.05
s 5.89
ł2.2010" ł
L1 = Y - t0.05,11 =121.15 - =117.41
ł ł
n 12
ł łł
s 5.89
ł2.2010" ł
L2 = Y + t0.05,11 =121.15 + =124.89
ł ł
n 12
ł łł
Przykład 3  przedziały ufności
Przedział ufności
P{117.41 < < 124.89}= 0.95
Hipoteza zerowa H0: =115,
Hipoteza zerowa H : =115,
hipoteza alternatywna HA: `"115.
Ponieważ 115 "(117.41, 124.89)
odrzucamy hipotezę zerowa na
poziomie ą=0.05
Odporność procedur t
Wnioskowanie statystyczne jest nazywane
odpornym, jeśli wymagane metodyka obliczeń
jest nieczuła na naruszenie przyjętych
jest nieczuła na naruszenie przyjętych
założeń.
Procedury t są dość odporne na odstępstwa
od normalności rozkładu populacji z
wyjątkiem obserwowania silnej skośności
rozkłądu lub występowania punktów
odstających.
Odporność procedur t
Większe próby to większa dokładność
oszacowania P-wartości oraz wartości
krytycznych dystrybucji t, gdy rozkład
krytycznych dystrybucji t, gdy rozkład
populacji nie jest normalny.
W przypadku małolicznych prób, zanim
przejdzie się do testów t należy narysować
wykres qq lub ramkowy w celu sprawdzenia
skośności i punktów ostających.
Praktyczne wskazówki do
wnioskowania o średniej
Liczność próby: mniej niż 15: Zastosuj
procedury t jeśli dane mają w przybliżeniu
rozkład normalny. Jeśli ich rozkład jest daleki
od normalnego, albo zaobserwowaliśmy punkty
od normalnego, albo zaobserwowaliśmy punkty
odstające, nie używaj t.
Liczność próby co najmniej 15: Można
zastosować procedury t, chyba że istnieją
punkty odstające lub rozkład jest bardzo skośny
Duże próby: Można stosować procedury t,
nawet dla skośnych rozkładów, ale liczność musi
być duża: ponad 40
Porównywanie dwóch średnich
Problemy z dwiema próbami
Cel wnioskowania: porównanie odpowiedzi
w dwóch grupach.
w dwóch grupach.
Przyjmuje się że każda grupa to próba z
oddzielnej populacji.
Odpowiedzi w każdej z grup są niezależne.
Pojęcia
Populacja
Zmienna
Średnia
Średnia
Odchylenie standardowe
Liczność próby
Średnia próby
Odchylenie standardowe próby
Test z dla dwóch prób
Naturalny estymator różnicy 1 - 2 jest
różnicą dwóch średnich prób,
x1 - x2
x1 - x2
Żeby wnioskować z tej statystyki
musimy znać jej rozkład próbkowania.
Jeśli rozkłady obu populacji są normalne,
x1 - x2
rozkład
2 2
ł ł
1 
2
ł
Nł 1 - 2, +
jest także normalny.
ł
n1 n2 ł
ł łł
Test z dla dwóch prób
x1
Niech jest średnią prostej próby losowej o
liczności n1 z populacji o rozkładzie N(1, 1)
a to średnia PPL o liczności n2 z populacji o
x2
rozkładzie N(  ). Wtedy taka statystyka
rozkładzie N(2, 2). Wtedy taka statystyka
(x1 - x2)-(1 - 2)
z =
2 2
1 
2
+
n1 n2
ma standardowy rozkład funkcji gęstości
prawdopodobieństwa N(0,1).
Test t dla dwóch prób
Ten test zakłada że populacje, z
których wzięto próbki mają równe
wariancje
wariancje
Statystyka t dla dwóch prób
Jeśli odchylenia standardowe populacji
nie są znane, przybliżamy je na
podstawie odchylenia standardowego
podstawie odchylenia standardowego
próby.
Stosuj właściwy wzór, zależny od
liczności prób: n1 i n2.
Statystyka t dla dwóch prób
Kiedy liczności prób są różne i
przynajmniej jedno z n1 i n2 jest małe
(<30) stosuj:
(x1 - x2)-(1 - 2)
t =
2 2
ł łł ł
( n1 - 1)s1 + ( n2 - 1)s2 łł n1 + n2 ł
ł
ł łł
n1 + n2 - 2 n1n2 ł
ł łłł łł
Taka statystyka ma rozkład t Studenta z
k=n1+ n2  2 stopniami swobody.
Statystyka t dla dwóch prób
Kiedy n1 i n2 są sobie równe (niezależnie
od liczności) zastosuj:
(x - x )-( - )
(x1 - x2)-(1 - 2)
t =
2 2
s1 + s2
n
Taka statystyka ma rozkład t Studenta z
k=2(n  1) stopniami swobody.
Statystyka t dla dwóch prób
Kiedy n1 i n2 są różne, ale duże (e"30)
stosuj:
(x - x )-( - )
(x1 - x2)-(1 - 2)
t =
2 2
s1 s2
+
n1 n2
Taka statystyka ma rozkład t Studenta z
k=n1 + n2 - 2 stopniami swobody.
Test istotności t dla dwóch
prób
Niech prosta próba losowa o liczności n1 jest
losowana z populacji o rozkładzie normalnym
z nieznaną wartością oczekiwaną 1 i jest
niezależna od drugiej próby o liczności n ,
niezależna od drugiej próby o liczności n2,
losowanej z innej populacji o nieznanej
wartości oczekiwanej 2.
Zakładamy że odchylenia standardowe obu
populacji są równe.
Test istotności t dla dwóch
prób
Żeby zweryfikować hipotezę H0: 1 = 2
przeciw Ha: 1 `" 2, obliczymy
odpowiednią statystykę t i użyjemy P-
odpowiednią statystykę t i użyjemy P-
wartości lub wartości krytycznych dla
rozkładu t Studenta z odpowiednim
stopniem swobody.
Test istotności t dla dwóch
prób  przykład 5
Niech PPL o liczności n1 jest losowana z populacji o
nieznanej wartości oczekiwanej 1.
[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1, 117.4,
111, 121.7, 124.5, 130.5]
średnia próby = 121.15
średnia próby = 121.15
odchylenie standardowe próby = 5.89
Kolejna PPL o liczności n2 jest losowana z populacji o
nieznanej wartości oczekiwanej 2.
[120, 125.5, 126, 125.5, 128.5, 125, 128, 116, 122,
121, 117, 125]
średnia próby = 123.29
odchylenie standardowe próby = 4.08
Test istotności t dla dwóch
prób  przykład 5
Ponieważ n1=n2=12
=0 z założenia
(x1 - x2)-(1 - 2)
t = =
2 2
s1 + s2
s1 + s2
n
= 1.0383
p = 0.3104
Wniosek: nie możemy odrzucić hipotezy, że wartości
średnie obu populacji są równe na poziomie istotności
ą=0.05
Przedział ufności dla dwóch prób
Niech PPL liczności n1 jest losowana z
normalnej populacji o nieznanej wart.
oczekiwanej 1 i kolejna PPL o liczności n2
jest losowana z kolejnej normalnej populacji o
jest losowana z kolejnej normalnej populacji o
nieznanej wart. oczekiwanej 2. Dla dużych n1
i n2 przedział ufności dla 1 - 2 jest dany
przez
2 2 2 2
s1 s2 s1 s2
(x1 - x2)- t * + ,(x1 - x2)+ t * +
n1 n2 n1 n2
gdzie statystyka t ma n1+n2-2 stopni
swobody.
Odporność procedur dla
dwóch prób
Procedury t dla dwóch prób są bardziej
odporne niż metody t dla jednej próby.
Jeśli liczności obu prób są równe a rozkłady
porównywanych populacji mają podobne
porównywanych populacji mają podobne
kształty, otrzymujemy dobrą dokładność.
Jeśli kształty rozkładów populacji są różne,
potrzeba prób o większej liczności.
Planując badanie oparte na dwóch próbach,
powinieneś zwykle wybierać równe liczności
tych prób.
Przybliżony test t Welch a
równości wartości średnich
równości wartości średnich
dwóch populacji o różnych
wariancjach
Przybliżony test t Welch a
Ten test oblicza przybliżoną t-wartość,
taką , dla której krytyczna wartość jest
liczona jako średnia ważona
pojedynczych wartości krytycznych t
pojedynczych wartości krytycznych t
odpowiadających stopniom swobody
dwóch prób.
Przybliżony test t Welch a
Dwupróbowa statystyka t jest równa:
( ) ( )
(x1 - x2)-(1 - 2)
1 2 1 2
t' =
t' =
2 2
s1 s2
+
n1 n2
Przybliżony test t Welch a
Wartość krytyczna tą dla błędu
pierwszego rodzaju jest liczona jako:
2 2
s1 s2
tą [1 ] + tą [ ]
2
n1 n2
t'ą =
2 2
s1 s2
+
n1 n2
Testy dla wariancji w populacji
Mamy PPL o liczności n losowaną z rozkładu
normalnego. Chcemy testować hipotezę, że
wariancja w populacji 2 ma określoną
2
wartość 02.
wartość  .
Hipoteza zerowa: H0: 2 = 02.
Hipoteza alternatywna: HA: 2 `" 02
Jest to test dwustronny, testy jednostronne
można wyprowadzić analogicznie
Testy dla wariancji w populacji 
test X2
Z definicji rozkładu ż2
(n -1)s2
2
X = Xi'2 =
"
2


n
n
[2
n-1]
Ponieważ statystyka X2 ma rozkład
postępujemy następująco::
Oblicz X2
Znajdz wartości krytyczne dla testu
dwustronnego dla zadanego poziomu istotności ą
Porównaj wartość statystyki testowej z
robszarem krytycznym.
Testy dla wartości wariancji w
populacji  przykład 6
Producent twierdzi, że wariancja średnicy tulejek
wynosi 100.
Odchylenie standardowe z próby, oszacowane na
podstawie 10 pomiarów, wynosi 11.2
Statystyka testowa
Statystyka testowa
(n -1)s2 9"(11.2)2
2
X = Xi'2 = = = 11.290
"
2
 100
n
Wartości krytyczne dla testu dwustronnego na
poziomie ą=0.05 dla 9 stopni swobody wynoszą
odpowiednio 2.700 oraz 19.023.
Wartość statystyki testowe jest mniejsza niż 19.023
i większa niż 2.700, prowadzi to do akceptacji
hipotezy zerowej na poziomie ą=0.05.
Rozkład F
Załóżmy, że losowanie dokonywane jest z
populacji o rozkładzie normalnym o wartości
średniej i wariancji 2.
Losujemy najpierw n wartości i obliczamy
Losujemy najpierw n1 wartości i obliczamy
2
s1
ich wariancję z próby , następnie losujemy
2
n2 wartości i obliczamy ich wariancję z próbys2
Liczba stopni swobody dla obu wariancji
1=n1-1 oraz 2=n2-1.
Rozkład F
2 2
s1 s2
Mając obie wielkości oraz , obliczamy
2
s1
Fs =
Fs =
2
s2
s2
Opracowano model matematyczny
oczekiwanego rozkładu tak zdefiniowanej
zmiennej losowej i nazwano go rozkładem F,
na cześć znanego statystyka of R.A.Fishera.
Rozkład F
W przeciwieństwie do rozkładów t i ż2, kształt
rozkładu F określony jest przez dwa parametry 1 i
2.
Jednostronny test F
jednorodności wariancji
2 2
1 = 
Hipoteza zerowa H0:
2
2 2
Hipoteza alternatywna HA: 1
 > 
2
2
s2
s1
Fs =
Statystyka testowa:
2
s2
opisana jest rozkładem F o [v1, v2]
stopniach swobody.
Jednostronny test F jednorodności
wariancji  przykład 7
2
Próba 1: n1=7, s = 21.180
1
2
s2 =16.029
Próba 2: n2=29,
2 2
1 = 
1 = 
Hipoteza zerowa H0:
Hipoteza zerowa H0:
2
2
2 2
1 > 
Hipoteza alternatywna HA:
2
2
s1 21.181
Statystyka testowa: Fs = = =1.32
2
s2 16.029
ma rozkład F o [6, 28] stopniach swobody.
Jednostronny test F jednorodności
wariancji  przykład 7
Ponieważ wartość
statystyki F nie
należy do obszaru
krytycznego,
krytycznego,
przyjmujemy
hipotezę zerową
na poziomie
ą=0.05
F =1.32
Dwustronny test F jednorodności
wariancji  przykład 8
2
s1 =12.856
Próba 1: n1=10,
2
s2 =18.021
Próba 2: n2=15,
2 2
1 = 
1 = 
Hipoteza zerowa H0:
Hipoteza zerowa H0:
2
2
2 2
1 `" 
Hipoteza alternatywna HA:
2
2
s1 12.856
Fs = = = 0.7134
Statystyka testowa:
2
s2 18.021
ma rozkład F o [9,14] stopniach swobody.
Dwustronny test F jednorodności
wariancji  przykład 8
Since our F
statistic does
not belong to
not belong to
the rejection
region, we
accept null
hypothesis at
ą=0.05
F = 0.7134
Test Bartlett a homogeniczności
(jednorodności) wariancji
Testowanie hipotezy zerowej mówiącej
że dwie lub więcej populacje
reprezentowane przez dwie lub więcej
reprezentowane przez dwie lub więcej
próby mają równe wariancje.
Hipoteza alternatywna mówi że co
najmniej jedna wariancja jest inna
Przykład 9
Test Bartlett a homogeniczności
(jednorodności) wariancji  przykład 9
2 2
1 = 
Hipoteza zerowa H0:
2
2 2
 `" 
Hipoteza alternatywna HA: 1
2
Poziom istotności ą=0.005
Poziom istotności ą=0.005
Próba 1: Treatment group n1=21,
s1=11.01,
Próba 2: Control group n2=23, s2=17.15
Naturalne logarytmy z wariancji:
ln(11.012)=4.80 oraz ln(17.152)= 5.68
Test Bartlett a homogeniczności
(jednorodności) wariancji  przykład 9
Suma liczby stopni swobody: 20+22=42
Średnia ważona wariancji:
20*11.012 + 22*17.152
s2 = = 211.79
42
42
Logarytm naturalny średniej ważonej wariancji: 5.36
Suma ważona logarytmów wariancji składowych
20*4.80 + 22*5.68 = 220.96
Statystyka testowa
ż2 = 42*5.36 - 220.96 = 4.16
Korekta skalująca C=1.0398
Test Bartlett a homogeniczności
(jednorodności) wariancji  przykład 9
Skorygowana wartość statystyki testowej
4.16/1.0398=4.00
Wartość krytyczna dla 1 stopnia swobody i poziomu
istotności ą=0.005 wynosi 9.14.
istotności ą=0.005 wynosi 9.14.
Ponieważ wartość statystyki testowej (4.00) jest
mniejsza od wartości krytycznej (9.14), nie mamy
podstaw do odrzucenia hipotezy zerowej na poziomie
ą=0.005.
Wniosek końcowy: wariancje są jednorodne.
Test Bartlett a homogeniczności
(jednorodności) wariancji  przykład 10
Oblicz logarytm naturalny wariancji
każdej z prób.
Zsumuj liczby stopni swobody
Zsumuj liczby stopni swobody
- = + + + =
- = + + + =
- = + + + =
"(n - 1) = 17 + 12 + ... + 9 = 95
"
"
"
i
a
Oblicz średnią ważoną wariancji i jej
logarytm naturalny
2
-
-
-
"(n - 1)si
"
"
"
i
a
s2 = = 0.112459, ln0.112459 = -2.185167
= = = -
= = = -
= = = -
-
-
-
"(n - 1)
"
"
"
i
a
Test Bartlett a homogeniczności
(jednorodności) wariancji  przykład 10
Oblicz ważoną sumę logarytmów
wariancji każdej z prób
2
- = -
- = -
- = -
- = -
- = -
- = -
"(n - 1)lns2 = -229.227545
"(n - 1)lnsi = -229.227545
"
"
"
"
"
"
i
a
Oblicz statystykę
ł łł
ł łł
ł łł
ł łł
2
X2 = - - - =
= - - - =
= - - - =
=
ł"(n - 1)śł lns2 - "(n - 1)lnsi = 21.636721
ł" śł "
ł" śł "
ł" śł "
i i
ł śł
ł śł
ł śł
ł śł
ł a ł a
ł ł
ł ł
ł ł
Test Bartlett a homogeniczności
(jednorodności) wariancji  przykład 10
Jeśli hipoteza zerowa jest prawdziwa, to
skorygowana statystyka X2 ma w
przybliżeniu rozkład 2 o a-1 stopniach
przybliżeniu rozkład  o a-1 stopniach
swobody.
ł łł
ł łł
ł łł
ł łł
1 1 1
ł śł
ł śł
ł śł
ł śł
C = 1 + - = 1.034566
= + - =
= + - =
= + - =
"
"
"
"
ł śł
ł śł
ł śł
ł
3(a - 1) ni - 1 -
- - -
- - -
- -
"(n - 1)śł
"
"
"
i
a
ł śł
ł śł
ł śł
ł śł
ł a ł
ł ł
ł ł
ł ł
X2 21.63672
2
Xkor = = = 20.914
= = =
= = =
= = =
C 1.034566
Test Bartlett a homogeniczności
(jednorodności) wariancji  przykład 10
Wartość krytyczna dla a-1=7 stopni swobody
oraz alfa = 0.01 wynosi
ż2 = 18.475
ż0.01[7] = 18.475
ż =
ż =
ż =
ż2 =
ż =
ż =
Wartość skorygowanej statystyki wynosi 20.914.
Wnioskujemy więc, że wariancje są
niejednorodne.


Wyszukiwarka

Podobne podstrony:
wyklad 9 Wnioskowanie o proporcjach PL [tryb zgodności]
wyklad 2 Prezentacja danych PL [tryb zgodności]
Wyklad 7 Nieparametryczne metody statystyczne PL [tryb zgodności]
wyklad 3 Funkcje gestosci prawdopodobienstwa PL [tryb zgodności]
wyklad 1 Wstepne przetwarzania danych PL [tryb zgodności]
ROZROD PTAKOW wyklad i 13 andro platforma tryb zgodnosci
Wyklad 14 2 Transport kolejowy [tryb zgodnosci]
Rynek finansowy wykład 4 2011(ryzyko inwestycyjne) [tryb zgodności]
Wykład 2 samodzielne funkcje techniczne [tryb zgodności]
WYKŁAD Opodatkowanie dochodow przedsiebiorstw [tryb zgodnośc
USM Automatyka w IS (wyklad 5) Zawory reg ppt [tryb zgodnosci]
USM Automatyka w IS (wyklad 4) elementy pomiarowe ppt [tryb zgodnosci]
wyklad 1 podstawowe informacje o przedsiebiorstwie [tryb zgodnosci]
Blachownica? PL [tryb zgodności] (1)
wykład 2 SKM sygnali abon [tryb zgodności]
TRIAGE PL [tryb zgodności]
Wykład 6 [tryb zgodności]
wykład 7i8 4h podstawy zarządzania m jablonski [tryb zgodności]

więcej podobnych podstron