LABORKI 4
Rozkład normalny wykorzystuje się do testu aby uogólnić całą populacje.
1 Zad
a) stat. -> stat.podst. i tab. -> stat. opisowe -> normalność ->
zmienne -> wzrost -> select cases -> v1='M'-> liczba przedziałów 8 ->
histogramy
Rozkład w całej populacji jest normalną. Oceniamy różnice między rozkłądem
empirycznym a normalnym są przypadkowe. Zawsze będa różnice.
Hipotezy H0(zerowe):
Rozkład wzrostu mężczyzn w *(populacji studentów 3 roku na kierunku
informatyka) jest normalny.
Hipoteza alternatywna H1: ~H0
Test K-S d=0,8150 -> wartość statystyki w wersji klasycznej konstruuje się
obszar krytyczny.
OK - obszar krytyczny
$ - należy
jeżeli d $ OK -> odrzucamy H0 na korzyść H1, rozkłąd nie jest normalny
jeżeli d ~$(nie należy) OK -> brak podstaw do odrzucania hipotezy zerowej
Poziom prawdopodobieństwa oznaczamy przez: p.
.20=,020
Poziom istotności alfa określa prawdopodobieństwo popełnienia błędu pierwszego
rodzaju tzn. na odrzuceniu hipotezy H0 gdy jest prawdziwa istotność.
np. alfa = 0.05
>=
Jeśli alfa > p dla zmiennych ciągłych nie ma znaczenia czy przedziały są domknięte
czy otwarte
alfa > p <=> d $ OK - odrzucamy hipoteze H0 na korzysc H1
alfa < p <=> d $ OK - brak podstaw do odrzucenia H0
b)
p>0.2
alfa(poziom istotności) = o.o5
jeśli p > 0.2
alfa 0.05 <p
0.05 mniejsze od p brak podstaw do odrzucenia hipotezy H0. Różnice
między rozkładem empirycznym a rozkładem normalnym wzrostu mężczyzn
w * są przypadkowe, to znaczy nie są istotne.
Różnice zawsze występują istotne albo nieistotne
Prawdopodbieństwo Lillieforsa p>.20
Test Lillieforsa - statystyka w teście K-S jest istotna
Prawdopodobieństwo Lilleforsa określa prawd K-S???
H0 stat. K-s jest istotna
h1 ~ H0 - hipotea alternatywna -> znów inny test
Test Szafira Wilka W 0,97863 p= 0,37816
alfa < p -> więc brak podstaw do odrzucenia hipotezy H0 w rozkładzie normalnym *
0,05<p -> brak podstaw do odrzucenia testu K-S, hipotezy wiarygodności
c)Przedziały ufności (gdy nie wykluczyliśmy rozkładu)
1. analiza -> więcej -> przedz. uf. średniej -> 95.00% -> statystyki lub wykresy
p>.20
Przedział ufności:
(178.3079, 181, 5631)
Prawdziwa średnia wzrostu w * należy do przedziału ((178.3079, 181, 5631)
z prawdopodobieństwem 0,95 to znaczy w 95 przypadkach na 100.Im większy
poziom ufności tym szerszy przedział.
Średnia
d)
1. analiza -> PU odchylenia standardowego 97 %
Przdział od (5,348,7,960075)
zawiera prawdziwe odchylenie standardowe dla wzrostu mężczyzn w * z
prawdopodobieństwem 0,97 tzn. w 97 przypadkach na 100 próbek
e)
Isteniej hipoteza zerowa i alternatywna.
Hipoteza H0 : m=177 (zawsze równość!!!!)
w Hipotezie zerowej średnia jest równa 177cm
h1> 177
różne sposoby interpretowania.
H1: m != 177 gdy spraw. że jest równa
H1: m> 177 gdy w zad. śr. większa od 177 (na wykresie zaznacz. po prawej)
H1: m<177gdy w zad. śr. mniejsz. 177 (na wykresie zaznacz. po lewej)
Dla obustronnego p się nie zmienia H1.
1. stat. podst. tab. -> test dla pojedynczej próby -> zmienna ->
wzrost -> testu średnia względem 177 -> podsumowanie testu
(w radyjku musi być zaznaczone tylko górne okienko!)
statystyka testowa -> t= 3,606
jeśli t>0 => H1 ">" p/2
H1 "<" 1-p/2
t<0 => H1 ">" 1-p/2
H1 "<" p/2
W naszym przykładzie:
t>0
p=0,0006
p/2=0,0003
0,05>= p/2, więc
odrzucamy H0 na korzyść H1 tzn. że średnia wzrostu *jest większa
od 177
Przedziały ufności oraz tesy się dopełniają
2. analiza -> wykres ramka wąsy -> ostatnia wartosc -> OK
Kropka -średnia z próbki, Wąsy- zakres 95%, Zakres- odchylenie błędu
standardowego(średnia odchylenia standardowego dla estymanty???
zad2
1. analiza ->stat. opisowe -> normalność -> liczba klas 8 ->
Test W Shapiro_WIlka -> zmienna -> waga ->
histogramy
test K-S nie pozwala odrzucić założenia
test Lillieforsa p<0,1(więc dla wagi test Lillieforsa nie rostrzyga
o istnieniu testu K-S
test Shapiro-Wilk p=0,0567 alfa = 0,03
alfa < p => brak podst. do odrzucenia hip. zerowej (Rysunek podejrzany)
c) d) 1. analiza -> więcej -> dla średniej PU 99% -> Przed. ufn. średnia 96%
Przedz(10,03,16,07) zawiera prawdziwe odchylenie standarodwe wagi
z prawdopodobieństwem 99%
e) h0- hipoteza zerowa
m(średnia waga) = 75 alternatywna != 75
t - statystyka
1.analiza -> anuluj -> poj. test dla poj. próby -> -> zmienne -> waga ->
test. śr. względem 75
t=-0,28 p<0,01
alfa < p => brak podstaw do odrzucenia hipotezy zerowej
statystyka 95% należy do przedziiłu
zad3
1. analiza -> stat. opisowe -> normalność -> licz. przedzi. 8 ->
test K-S -> test W. Shapiro Wilk.-> odblokowujemy select case->
histogramy
d=,21437 W=0,92403 p=0,00060 p<0,01
K-S nie rostrzyga
Sh.W. -> odrzucamy H0 na korzysc alternatywy (trzeba sprawdzić w warunkach!)
Nie można szacować średniej!!!
Zad4
a) analiza -> normalność -> zmienne -> wiek ->
select cases-> wszystkie
żeby usunąć jedną wartość wyrażenie v10='inny'
Sprawdzam
analiza -> grupami -> zm. gr -> system -> wył. wykonaj również
analizę bez grupowania
dla Windows
K-S d=,11653, p>.20 -> rozstrzyga brak podstaw do odrzucenia
Lilliefors p<,10
Shapiro_Wilk W=,96648, p=,14173 brak podstaw
dla Linux
d=0,15338 p>.20
Lilliefors p>.2
Shapiro_Wilks W=0,90522 p=0,32164 rozsztrzygają zgodność więc
wykonuje test
b)
1. analiza ._ anuluj -> stat. podst. i tabele. -> test dla
prób niezależnych (wzgl. grup) -> zmienne ->w pierwszej wiek ->
w drugiej system -> wyłączam select cases
dla prób zależnych tej samej próby wykonujemy badani dwa razy (np. medycyna porównuje
pierwszą próbke z drugą próbką te ta sam grupa przed i po)
grupy niezależne (wzgl. grup) -> wiele jest w jednej zmiennej
grupy niezależnych w(wzg. zmiennej) _> gdy ta sama zmienna
hipotezy
H0: mL=mW
H1: mL < mW statystyki t =2,14
p=0,036152
t<0 => H1 "<" to p/2 p/2=0,018
o,05>p -> odrzucamy H0 na korzyść H1(średnia wiek w grupie Linux*
jest istotnie mnijesza od śr. wieku rozp. akt. z kompr. w grupie windos
2.analiza ->wykres ramka wąsy
Średnia mniejsza w gruoie Linux
c)
iloraz Fishera - test Fishera
wariancja 1,039360
H0: @L=@W
H1: @L != @W
F=1,04
p=0,83
0,05 < p => brak podst. odrzucenia hipotezy zerowej