Wykład II
Testy istotności,
zastosowanie testu t-
studenta
Wprowadzenie
Badanie właściwości populacji dokonujemy
najczęściej na podstawie próby, stanowiącej
jej reprezentatywną część. Wnioskowanie
statystyczne możemy podzielić na dwie
zasadnicze grupy: estymacja parametrów i
testowanie
hipotez
statystycznych.
Estymacja parametrów może być punktowa
albo przedziałowa. W estymacji punktowej
oceniamy parametry takie jak na przykład
średnia
arytmetyczna
czy
wariancja.
Estymacja
przedziałowa
polega
na
wyliczeniu na podstawie wyników z próby
przedziału liczbowego, który z określonym
prawdopodobieństwem obejmować będzie
wyznaczony przez nas parametr punktowy.
Weryfikacja hipotez
Na podstawie zbioru wartości liczbowych
uzyskanych z pomiarów czy obserwacji
staramy się odpowiedzieć na pytanie czy np.
2 badane przez nas odmiany A i B różnią się
pod względem wysokości plonu ziarna,
zawartość magnezu w nawozie jest zgodna z
przewidzianą dla tego produktu normą. Do
weryfikacji hipotez statystycznych
wykorzystujemy testy statystyczne. Testem
statystycznym nazywamy sposób
postępowania przy pomocy którego możemy
zadecydować czy postawioną hipotezę należy
odrzucić czy też jej nie odrzucać.
Rodzaje hipotez
statystycznych
Hipoteza zerowa. Zakłada, że średnia nie różni się
od wzorca lub średnie dla 2 obiektów są takie
same
A
H :
0
A
H :
0
Hipoteza alternatywna . Zakłada, że średnia
różni się od wzorca lub że średnie dla 2
obiektów nie są takie same
B
A
H
:
0
A
H :
1
B
A
H
:
1
Przy wnioskowaniu możemy
popełnić następujące błędy:
Hipoteza
zerowa
DECYZJE
Przyjąć H
0
Odrzucić H
0
Hipoteza
zerowa jest
prawdziwa
Decyzja
prawidłowa
Błąd I-go
rodzaju ()
Hipoteza
zerowa jest
fałszywa
Błąd II-go
rodzaju ()
Decyzja
prawidłowa
Zasady wnioskowania
Wnioskowanie w testach istotności
polega na wyliczeniu na podstawie
wyników n - elementowej próby
wartości empirycznej i porównaniu jej z
wartością krytyczną odczytaną z
odpowiednich tablic. Jeśli wartość
empiryczna jest większa o wartości
krytycznej to hipotezę zerową
odrzucamy i w jej miejsce przyjmujemy
hipotezę alternatywną.
Poziom istotności i ufności
Błąd I-go rodzaju () polegający na odrzuceniu
prawdziwej hipotezy zerowej określamy
poziomem istotności. W testach istotności
przyjęto określone niskie wartości tego błędu tak
aby wnioski formułowane przy nich były
wystarczająco wiarygodne:
< 0,05 (5 %) różnice istotne
< 0,01 (1 %) różnice wysoce istotne
< 0,001 (0,1 %) różnice bardzo wysoce istotne
Poziomem ufności określa się wartość 1- ,
która oznacza prawdopodobieństwo tego, że nie
popełniliśmy błędu I-go rodzaju
Kryteria wyboru testu
istotności
Czy obserwowane zmienne losowe
mają rozkłady normalne ?
TAK
Znane wariancję ?
NIE
Duże próby ?
TAK
Test U
NIE
Równe wariancje ?
TAK
Test Z
NIE
Testy nieparametryczne
Tak
Duża próba?
NIE
Test Cochrana-Coxa
Tak
Test U
NIE
Test t
Zastosowania testu t-
Studenta
Jako test” jakościowy”
do porównania średniej z wzorcem
-
porównania dwóch średnich metodą zmiennych
niepołączonych,
-
porównania dwóch średnich metodą zmiennych
połączonych.
Jako test „ilościowy”:
-
określenia przedziału ufności, w którym znajduje się
prawdziwa średnia populacji (),
-
określenia przedziału ufności w którym znajduje się
prawdziwa różnica pomiędzy średnimi dwóch
populacji,
-
określenia minimalnej wielkości próby,
-
oceny błędu szacunku średniej
-
Wykrywania błędów grubych
Porównanie wartości
średniej z wzorcem
Interesuje nas porównanie czy średnia z
próby jest zgodna z pewną hipotetyczną
średnią populacji
s
n
m
x
s
m
x
t
x
emp
)
(
Hipotezę zerową odrzucamy, gdy t
empiryczne jest większe od t przy danym
poziomie istotności (0,05, 0,01) i liczbie
stopni swobody n-1
Wartości krytyczne z rozkładu testu t
-Studenta
l.s.s
0,2
0,1 0,05 0,02 0,01
1 3,08 6,31
12,7
1
31,8
2
63,6
6
2 1,89 2,92 4,30 6,96 9,92
3 1,64 2,35 3,18 4,54 5,84
4 1,53 2,13 2,78 3,75 4,60
5 1,48 2,02 2,57 3,36 4,03
6 1,44 1,94 2,45 3,14 3,71
7 1,41 1,89 2,36 3,00 3,50
8 1,40 1,86 2,31 2,90 3,36
9 1,38 1,83 2,26 2,82 3,25
10 1,37 1,81 2,23 2,76 3,17
Poziom istotności
Co decyduje o możliwości
stwierdzenia różnicy?
Różnica pomiędzy średnią z próby a wzorcem
Rozrzut wyników w obrębie próby
Liczebność próby – im większa tym
łatwiej
Poziom istotności – im niższy tym
łatwiej
m
Porównanie dwóch średnich
metodą zmiennych
niepołączonych
Metoda służy do określenia na
podstawie dwóch prób niezależnych, czy
pochodzą one z populacji o różnych
wartościach średniej prawdziwej.
Przyjmujemy założenia: średnie mogą
być zróżnicowane w dowolny sposób,
obiekty porównywane nie są
skorelowane parami, materiał badawczy
jest jednorodny, nie podlega klasyfikacji
ze względu na zmienność glebową czy
odmiany roślin, zaś wybór elementów do
prób przebiega w sposób losowy
Porównanie dwóch średnich
metodą zmiennych
niepołączonych
Ocena zawartości Mg w glebie po uprawie pszenicy i
kukurydzy
x
x x
x x
x
x
x x
x x
x x
x
Pole jest jednorodne, nie występuje zmienność
systematyczna, jedynie zmienność przypadkowa
Porównanie dwóch średnich
metodą zmiennych
niepołączonych
. Polega na wyliczeniu
wartości empirycznej testu i
porównaniu jej z wartością
krytyczną.
Jeśli temp jest większe od t
przy poziomie istotności 0,05
hipotezę zerową odrzucamy i
możemy stwierdzić, że
pomiędzy średnimi jest
istotna różnica
2
:
1
1
2
2
2
2
2
2
B
A
B
A
B
A
B
A
d
B
A
d
d
B
A
emp
n
n
nS
nS
S
gdzie
n
n
n
n
S
S
n
n
n
S
S
S
x
x
t
Porównanie dwóch średnich
metodą zmiennych
połączonych
Przedstawiony w poprzednim punkcie sposób
postępowania jest prawidłowy gdy obiekty
porównywane są niezależne. Jeśli jednak
wartości zmiennych są skorelowane dodatnio
to metodę zmiennych niepołączonych
powinniśmy zastąpić metodą zmiennych
połączonych. Z kolejnych obserwacji dla dwóch
zmiennych A i B tworzymy pary i wyliczamy n
różnic d=xa-xb. W ten sposób eliminujemy
zróżnicowanie w wynikach pomiędzy
poszczególnymi parami.
Porównanie dwóch średnich
metodą zmiennych
połączonych
Ocena zawartości Mg w glebie po uprawie pszenicy i
kukurydzy
x
x
x
x
x
x
x
x
x
x
x
x
Pole nie jest jednorodne, występuje zmienność
systematyczna,
p H 7,0
p H 5,5
Porównanie dwóch średnich
metodą zmiennych
połączonych
Hipoteza zerowa
zakłada, że średnia
różnic jest zerem.
Wartość funkcji
testowej temp
wyliczamy z
następującego wzoru
Jeśli t emp jest > t; to
hipotezę o równości
średnich odrzucamy
n
d
d
nS
n
d
d
n
n
nS
d
S
d
t
d
d
d
emp
2
2
2
2
)
(
)
1
(
Wnioskowanie na
podstawie testu t-studenta
Wnioski na podstawie zastosowania testu t-Studenta
mogą być dwóch rodzajów:
a) W przypadku gdy wartość empiryczna testu jest
większa od wartości krytycznej stwierdzamy:
Ponieważ wartość t
emp
> t
w związku z tym odrzucam
hipotezę zerową (H
0
) na korzyść (H
1
) i z
prawdopodobieństwem popełnienia błędu mniejszym
niż (=0,05; 0,01; 0,001) stwierdzam, że
porównywane próby pochodzą z populacji o: istotnie/
wysoce istotnie/ bardzo wysoce istotnie różnych
wartościach średnich prawdziwych.
Stwierdzenie istotności nie oznacza tego, że
różnice są duże, ale, że mamy co najmniej 95 %
pewności tego, że mamy rację – nie mylimy się
Wnioskowanie na
podstawie testu t-studenta
c.d.
W przypadku gdy wartość empiryczna testu jest
mniejsza
lub
równa
wartości
krytycznej
stwierdzamy:
Ponieważ wartość t
emp
<= t
w związku z tym brak
jest podstaw do odrzucenia hipotezy zerowej H
0
Brak podstaw do odrzucenia hipotezy
zerowej (H
0
) nie oznacza, że jest ona
prawdziwa !!!, a jedynie oznacza to, że nie
mamy co najmniej 95 % pewności, że
hipoteza alternatywna (H
1
) jest prawdziwa
Wyliczenie przedziału
ufności dla średniej testem
t-Studenta
Przedział ufności dla średniej prawdziwej populacji
wyliczony na podstawie n elementowej próby
określamy jako:
gdzie: t
; =n-1
- oznacza odczyt z tablic testu t-
Studenta dla danego poziomu istotności i liczby
stopni swobody =n-1
x
n
x
n
S
t
x
S
t
x
1
;
1
;
Wyliczenie przedziału ufności
dla różnicy średnich testem t-
Studenta
Przedział ufności dla prawdziwej różnicy pomiędzy 2
populacjami wyliczony na podstawie n elementowych
prób określamy jako
:
gdzie: t; - oznacza odczyt z tablic testu t-Studenta dla
danego poziomu istotności i liczby stopni swobody
=n
A
+n
B
-2
B
A
B
A
d
B
A
d
d
n
n
B
A
B
A
d
n
n
B
A
B
A
B
A
B
A
n
n
n
n
S
S
n
n
n
S
S
S
t
x
x
S
t
x
x
L
x
x
L
x
x
B
A
B
A
1
1
2
2
2
2
;
2
;
Podsumowanie
1.
Test t-studenta jest uniwersalnym testem
umożliwiającym ocenę istotności różnic pomiędzy
średnią a wzorcem oraz pomiędzy 2 średnimi.
2.
W zależności od stopnia zależności wyników w
porównywanych próbach należy stosować metodę
zmiennych niepołączonych lub połączonych
3.
Umożliwia ocenę w jakich granicach mieści się
prawdziwa średnia i prawdziwa różnica między
średnimi
4.
Jest przydatny do wykrywania odstających
obserwacji oraz oceny minimalnej liczebności
próby