Metody statystyczne
Część 2
Populacja i próba:
po co są testy statystyczne?
Definicje: populacja
Dowolny zbiór badanych obiektów,
Dowolny zbiór badanych obiektów,
o ile jest dobrze zdefiniowany
o ile jest dobrze zdefiniowany
Populacja =
Populacja =
Dorośli mieszkańcy Polski
Dorośli mieszkańcy Polski
Uniwersum
Uniwersum
Posiadacze samochodów Nissan
Posiadacze samochodów Nissan
Kobiety mieszkające w Warszawie
Kobiety mieszkające w Warszawie
Sklepy powy\ej 300 m22 w woj. śląskim
Sklepy powy\ej 300 m w woj. śląskim
W praktyce mo\na przyjąć, \e populacja o liczebności powy\ej
W praktyce mo\na przyjąć, \e populacja o liczebności powy\ej
2000 jest nieskończenie wielka
2000 jest nieskończenie wielka
Definicje: próba
Stosunkowo niewielki podzbiór populacji
Stosunkowo niewielki podzbiór populacji
Dobrany wg określonej procedury
Dobrany wg określonej procedury
Losowej
Próba
Losowej
Próba
Nielosowej
Nielosowej
Niezale\nie od wielkości i próby, interesują
Niezale\nie od wielkości i próby, interesująnas
nas
przede wszystkim wnioski dotyczące populacji
przede wszystkim wnioski dotyczące populacji
To jest mo\liwe dzięki statystyce
To jest mo\liwe dzięki statystyce
Prawa statystyki odnoszą
Prawa statystyki odnosząsię TYLKO
sięTYLKO
do prób losowych!
do prób losowych!
Co tracimy?
Badania donoszące się
Badania donoszące siędo całej populacji (na przykład spis powszechny) są
do całej populacji (na przykład spis powszechny) są
potrzebne, ale niezwykle kosztowne
potrzebne, ale niezwykle kosztowne
Dlatego w większości przypadków musi nam wystarczyć
Dlatego w większości przypadków musi nam wystarczyćodpowiednio
odpowiednio
dobrana próba
dobrana próba
Prowadząc badanie nawet na du\ej próbie nie mamy całkowitej pewności,
Prowadząc badanie nawet na du\ej próbie nie mamy całkowitej pewności,
\e nasze wyniki mo\na odnieść
\e nasze wyniki mo\na odnieśćdo całej populacji
do całej populacji
Opis populacji dokonany na podstawie opisu próby jest jedynie
Opis populacji dokonany na podstawie opisu próby jest jedynie
przybli\eniem
przybli\eniem
Prawa statystyki mówią, czy to przybli\enie jest dostatecznie dobre
Prawa statystyki mówią, czy to przybli\enie jest dostatecznie dobre
TEST STATYSTYCZNY
TEST STATYSTYCZNY
mówi nam, jak wyciągać
mówi nam, jak wyciągaćwnioski
wnioski
Dwa rodzaje błędu
Wyobraz
Wyobrazsobie, \e jesteś księ\niczką, a przed tobąstoi kandydat do twojej ręki
sobie, \e jesteśksię\niczką, a przed tobą stoi kandydat do twojej ręki
Musisz zdecydować, czy jest to prawdziwy ksią\ę, czy te\
Musisz zdecydować, czy jest to prawdziwy ksią\ę, czy te\oszust
oszust
Jeśli go wybierzesz, zostanie królem i będzie decydował o losach królestwa (ale jeśli jest
Jeśli go wybierzesz, zostanie królem i będzie decydował o losach królestwa (ale jeśli jest
oszustem, to pewnie się
oszustem, to pewnie sięnie nadaje do tej roli)
nie nadaje do tej roli)
Jeśli go odrzucisz, zostanie ścięty (ale tracisz kandydata na mę\a, a kto wie czy się
Jeśli go odrzucisz, zostanie ścięty (ale tracisz kandydata na mę\a, a kto wie czy siętrafi
trafi
inny?)
inny?)
Od trafnej decyzji zale\ą
Od trafnej decyzji zale\ąlosy królestwa i twoje mał\eństwo!
losy królestwa i twoje mał\eństwo!
Dobra decyzja
Dobra decyzja
" wybór prawdziwego księcia
" wybór prawdziwego księcia
" odrzucenie oszusta
" odrzucenie oszusta
Zła decyzja
Zła decyzja
" wybór oszusta
" wybór oszusta
" odrzucenie prawdziwego księcia
" odrzucenie prawdziwego księcia
Zła decyzja mo\e mieć
Zła decyzja mo\e miećró\ne konsekwencje. Tobie - księ\niczce mo\e zale\ećna czym innym
ró\ne konsekwencje. Tobie -księ\niczce mo\e zale\eć na czym innym
ni\
ni\twoim poddanym
twoim poddanym
W testach statystycznych te\
W testach statystycznych te\są dwie mo\liwości; zazwyczaj jedna z nich jest dla nas bardziej
sądwie mo\liwości; zazwyczaj jedna z nich jest dla nas bardziej
grozna
grozna
Jeśli uznamy, \e obserwowany wynik ma faktycznie miejsce w populacji i zaplanujemy
Jeśli uznamy, \e obserwowany wynik ma faktycznie miejsce w populacji i zaplanujemy
odpowiednie działania marketingowe, skutki błędu mogą
odpowiednie działania marketingowe, skutki błędu mogąbyć bardzo powa\ne
byćbardzo powa\ne
Jeśli istniejący faktycznie efekt uznamy za nieistotny , być
Jeśli istniejący faktycznie efekt uznamy za nieistotny , byćmo\e tracimy szansę; ale
mo\e tracimy szansę; ale
przynajmniej nie nara\amy się
przynajmniej nie nara\amy sięna pora\kę
na pora\kę
Dylemat księ\niczki
STAN FAKTYCZNY (księ\niczka go nie zna)
Kandydat jest oszustem Kandydat jest księciem
DECYZJA KSIśNICZKI
Kandydat jest oszustem Prawdopodobieństwo =
Poziom ufności = 1 - ą
Ściąć BAD II rodzaju
SAUSZNIE
Kandydat jest księciem Prawdopodobieństwo = ą
Poziom ufności = 1
Wybrać BAD I rodzaju
SAUSZNIE
Zwyczajowo prawdopodobieństwo wystąpienia błędów I i II rodzaju
Zwyczajowo prawdopodobieństwo wystąpienia błędów I i II rodzaju
oznaczamy literami ą
oznaczamy literami ąi
i
Prawdopodobieństwo słusznej decyzji w zale\ności od sytuacji faktycznej
Prawdopodobieństwo słusznej decyzji w zale\ności od sytuacji faktycznej
wynosi zatem 1-
wynosi zatem 1-ąąlub 1- ; nazywamy je poziomem ufności
lub 1-; nazywamy je poziomem ufności
Wnioskowanie statystyczne
W badaniach mamy do czynienia z bardzo podobną
W badaniach mamy do czynienia z bardzo podobnąsytuacją
sytuacją
Dysponujemy sformułowaną
Dysponujemy sformułowanąprzez nas hipotezą oraz wynikiem badania
przez nas hipoteząoraz wynikiem badania
Musimy zdecydować, czy hipotezę
Musimy zdecydować, czy hipotezęnale\y odrzucić, czy przyjąć
nale\y odrzucić, czy przyjąć
Wyjściową
Wyjściowąhipotezę zawsze formułujemy jako brak zmian czy
hipotezęzawsze formułujemy jako brak zmian czy
zale\ności; takie sformułowanie nazywamy hipotezą
zale\ności; takie sformułowanie nazywamy hipotezązerową
zerową
Przykłady poprawnych sformułowań
Przykłady poprawnych sformułowań(niekoniecznie prawdziwych)
(niekoniecznie prawdziwych)
" " Inteligencja nie zale\y od płci
Inteligencja nie zale\y od płci
" " Średnia długość
Średnia długość\ycia nie zale\y od kraju
\ycia nie zale\y od kraju
" " Palenie do 5 papierosów dziennie nie wpływa na stan zdrowia
Palenie do 5 papierosów dziennie nie wpływa na stan zdrowia
" " Opakowanie A jest tak samo atrakcyjne, jak opakowanie B
Opakowanie A jest tak samo atrakcyjne, jak opakowanie B
Wnioskowanie statystyczne
STAN FAKTYCZNY (nieznany)
Hipoteza zerowa jest Hipoteza zerowa jest fałszywa
WNIOSEK
prawdziwa
Przyjąć hipotezę zerową Prawdopodobieństwo =
Poziom ufności = 1 - ą
BAD I rodzaju
SAUSZNIE
Odrzucić hipotezę zerową Prawdopodobieństwo = ą
Poziom ufności = 1 -
BAD I rodzaju
SAUSZNIE
Który błąd będzie miał
Który błąd będzie miałpowa\niejsze konsekwencje?
powa\niejsze konsekwencje?
Przykład: Ile wynosi średnia?
Często w badaniach szukamy wartości średniej (dochodów, wydatków,
Często w badaniach szukamy wartości średniej (dochodów, wydatków,
powierzchni, odległości& )
powierzchni, odległości& )
Przypuśćmy, \e interesuje nas średni roczny przebieg prywatnego
Przypuśćmy, \e interesuje nas średni roczny przebieg prywatnego
samochodu w Polsce
samochodu w Polsce
Po wykonaniu badania na odpowiedni du\ej próbie chcemy podać,
Po wykonaniu badania na odpowiedni du\ej próbie chcemy podać,
jaki jest średni przebieg w populacji
jaki jest średni przebieg w populacji
Na początek spróbujmy sobie wyobrazić, \e wykonujemy takie badanie
Na początek spróbujmy sobie wyobrazić, \e wykonujemy takie badanie
bardzo wiele razy
bardzo wiele razy na przykład 500
na przykład 500
Trochę matematyki
No niestety, bez matematyki trudno się
No niestety, bez matematyki trudno siętu obejść.
tu obejść.
Pamiętajmy, \e wszystkim wartościom w populacji odpowiada wartość
Pamiętajmy, \e wszystkim wartościom w populacji odpowiada wartość
zmierzona w próbie.
zmierzona w próbie.
Wartości w populacji oznaczamy literami greckimi (, )
Wartości w populacji oznaczamy literami greckimi (, )
Ich odpowiedniki wyliczone z próby
_
Ich odpowiedniki wyliczone z próby zwykłymi literami łacińskimi
zwykłymi literami łacińskimi
(( , s)
x
, s)
" " Średnią
Średniąz próby oznaczamy dodatkowo kreską nad x taki zwyczaj
z próby oznaczamy dodatkowo kreskąnad x taki zwyczaj
(samo x oznacza konkretną
(samo x oznacza konkretnąwartość uzyskanądla pojedynczej
wartośćuzyskaną dla pojedynczej
badanej osoby)
badanej osoby)
Co mówią prawa statystyki?
Szukamy: średni roczny przebieg samochodu
Szukamy: średni roczny przebieg samochodu
wśród kierowców prywatnych w Polsce
wśród kierowców prywatnych w Polsce
Wyobrazmy sobie, \e wykonujemy sonda\
Wyobrazmy sobie, \e wykonujemy sonda\bardzo wiele razy na ró\nych próbach -
bardzo wiele razy na ró\nych próbach -
losowanych za ka\dym razem od początku
losowanych za ka\dym razem od początku
Za ka\dym razem obliczamy średni roczny przebieg dla kierowców w próbie
Za ka\dym razem obliczamy średni roczny przebieg dla kierowców w próbie
I za ka\dym razem otrzymujemy nieco inną
I za ka\dym razem otrzymujemy nieco innąwartość
wartość
Nr badania Średni przebieg
Jeśli prawdziwa średnia w populacji wynosi
Jeśli prawdziwa średnia w populacji wynosi
tys. km
powiedzmy
powiedzmy = 19,7 tys. km, a odchylenie
= 19,7 tys. km, a odchylenie
B1 15,4
standardowe w populacji ma wartość
standardowe w populacji ma wartość= 2,2 tys. km,
= 2,2 tys. km,
B2 12,7
to statystyka mówi nam, jakie jest
to statystyka mówi nam, jakie jest
B3 23,1
prawdopodobieństwo, \e w badaniu wykonanym
prawdopodobieństwo, \e w badaniu wykonanym
. .
jeden raz otrzymana wartość
jeden raz otrzymana wartośćbędzie się mieściła w
będzie sięmieściła w
. .
pewnym przedziale, na przykład 19,7ą
pewnym przedziale, na przykład 19,7ą2,2
2,2
. .
(odpowiedz: około 68%)
(odpowiedz: około 68%)
B500 18,8
To za mało
Po wykonaniu jednorazowego pomiaru nadal nie wiemy jaki jest
Po wykonaniu jednorazowego pomiaru nadal nie wiemy jaki jest
prawdziwy wynik w populacji ani jaka jest wariancja badanej zmiennej
prawdziwy wynik w populacji ani jaka jest wariancja badanej zmiennej
Na szczęście nie musimy wykonywać
Na szczęście nie musimy wykonywaćwielu pomiarów z pomocą
wielu pomiarów z pomocą
przychodzi Centralne Twierdzenie Graniczne, które umo\liwia
przychodzi Centralne Twierdzenie Graniczne, które umo\liwia
wyciąganie dobrych wniosków
wyciąganie dobrych wniosków
Jeśli brzmi o strasznie, mo\esz pominąć
Jeśli brzmi o strasznie, mo\esz pominąćnastępny slajd. Pamiętaj
następny slajd. Pamiętaj
tyle, \e wnioskowanie na temat prawdziwej wartości średniej
tyle, \e wnioskowanie na temat prawdziwej wartości średniej
opiera się
opiera sięna własnościach rozkładu normalnego
na własnościach rozkładu normalnego
Rozkład normalny to po prostu pewna funkcja -
Rozkład normalny to po prostu pewna funkcja -opisana paskudnym
opisana paskudnym
wzorem i piękną
wzorem i pięknąkrzywą w kształcie dzwonu
krzywąw kształcie dzwonu
Centralne Twierdzenie Graniczne
Nr badania Średni przebieg w
tys. km
B1 15,4
Niezale\nie od tego, jaki jest faktyczny rozkład
B2 12,7
Niezale\nie od tego, jaki jest faktyczny rozkład
rocznego przebiegu samochodów w Polsce,
B3 23,1
rocznego przebiegu samochodów w Polsce,
. .
średnia otrzymana z wielu badań
średnia otrzymana z wielu badańma
ma
. .
rozkład normalny, opisany krzywą
rozkład normalny, opisany krzywąGaussa
Gaussa
. .
B500 18,8
Je\eli w wariancja zmiennej w populacji wynosi , to
wariancja średniej uzyskanej w wielu badaniach wyniesie
2
x2 =
Co więcej:
Co więcej:
N
!
GDZIE N wielkość próby w ka\dym badaniu
x nazywamy błędem standardowym
Stosowane oznaczenia
Dla próby o liczebności N
Dla próby o liczebności N
_
Średnia uzyskana w próbie
x
Prawdziwa średnia w populacji (nieznana)
Wariancja rozkładu średnich z wielu badań (nieznana)
x2
Wielkość próby
N
Wariancja rozkładu mierzonej wielkości w populacji (nieznana)
2
s2
Wariancja rozkładu mierzonej wielkości w próbie (znana)
Z
Wielkość dana wzorem:
_
_
x -
x -
Z = =
___
x
/
"N
"
"
"
Wnioskowanie statystyczne dla średniej
_
W praktyce badanie wykonujemy jeden raz i otrzymujemy tylko
W praktyce badanie wykonujemy jeden raz i otrzymujemy tylko
x
jedną wartość oraz wariancji badanej zmiennej s22(w próbie)
jedną wartośćdla średniej oraz wariancji badanej zmiennej s (w próbie)
dla średniej
Nie znamy prawdziwej wartości średniej
Nie znamy prawdziwej wartości średniej i wariancji w populacji
i wariancji w populacji 22
Tego właśnie chcemy się
Tego właśnie chcemy siędowiedzieć
dowiedzieć
Z własności rozkładu normalnego wynika, \e:
Z własności rozkładu normalnego wynika, \e:
_
Istnieje 68% prawdopodobieństwo, \e w badaniu uzyskaliśmy wartość
Istnieje 68% prawdopodobieństwo, \e w badaniu uzyskaliśmy wartośćx
w przedziale
xx
w przedziale ą
ą
_
Istnieje 95% prawdopodobieństwo, \e w badaniu uzyskaliśmy wartość
Istnieje 95% prawdopodobieństwo, \e w badaniu uzyskaliśmy wartośćx
w przedziale
xx
w przedziale ą 2 itd.
ą2 itd.
s
___
Przyjmujemy
xx xx
Przyjmujemydodatkowo (na razie), \e = s , przy czym: sx =
dodatkowo (na razie), \e = s , przy czym:
"N
"
"
"
Wartość
x
Wartośćssi s mo\emy obliczyćz próby (zrobi to za nas komputer)
i s xmo\emy obliczyć z próby (zrobi to za nas komputer)
Musimy przyjąć
Musimy przyjąćjakieś zało\enie o prawdziwej wartości
jakieśzało\enie o prawdziwej wartości
Test dla średniej krok po kroku
Formułujemy hipotezę
Formułujemy hipotezęzerową
zerową
W przypadku średniej hipoteza ta brzmi: wartość
W przypadku średniej hipoteza ta brzmi: wartośćjest równa pewnej konkretnej
jest równa pewnej konkretnej
liczbie, którą
0
liczbie, którąoznaczamy
oznaczamy 0
Od sposobu sformułowania hipotezy (interesuje nas zmiana w dowolną
Od sposobu sformułowania hipotezy (interesuje nas zmiana w dowolnąstronę
stronę
czy zmiana w określonym kierunku), zale\y wybór testu jednostronnego lub
czy zmiana w określonym kierunku), zale\y wybór testu jednostronnego lub
dwustronnegp
dwustronnegp
Ustalamy maksymalne akceptowane przez nas prawdopodobieństwo ą
Ustalamy maksymalne akceptowane przez nas prawdopodobieństwo ąpopełnienia
popełnienia
błędu I rodzaju (na ogół
błędu I rodzaju (na ogół5%). Błędem II rodzaju na ogół specjalnie sięnie
5%). Błędem II rodzaju na ogółspecjalnie się nie
przejmujemy.
przejmujemy.
Ka\dy test ma dwie równowa\ne wersje:
Ka\dy test ma dwie równowa\ne wersje:
1. Obliczamy wartość
1. Obliczamy wartośćtestu (czyli odpowiedniej funkcji) jaka odpowiada przyjętemu
testu (czyli odpowiedniej funkcji) jaka odpowiada przyjętemu
prawdopodobieństwu -
prawdopodobieństwu -dla średniej trzeba obliczyć wartość Z (wzór podany
dla średniej trzeba obliczyćwartość Z (wzór podany
powy\ej). Wynik porównujemy z wartością
powy\ej). Wynik porównujemy z wartościąkrytyczną (dla średniej jest to
krytyczną(dla średniej jest to
krytyczna wartość w rozkładzie normalnym). Wartości krytyczne dla danego
krytyczna wartośćzz w rozkładzie normalnym). Wartości krytyczne dla danego
testu znajdujemy w tablicach
testu znajdujemy w tablicach
2. Obliczamy prawdopodobieństwo p
2. Obliczamy prawdopodobieństwo potrzymania wyniku takiego jak nasz przy
otrzymania wyniku takiego jak nasz przy
zało\eniu, \e hipoteza zerowa jest prawdziwa i porównujemy z wartością
zało\eniu, \e hipoteza zerowa jest prawdziwa i porównujemy z wartościąą
ą
Na tej podstawie przyjmujemy lub odrzucamy hipotezę
Na tej podstawie przyjmujemy lub odrzucamy hipotezęzerową
zerową
Przyjmujemy hipotezę
Przyjmujemy hipotezęzerową, jeśli z > Z i odrzucamy, jeśliz <
zerową, jeśli z > Zi odrzucamy, jeśli z
Przykład 1:
Przykład 1:
czy
czyprogram lojalnościowy ma wpływ na konsumpcjękawy?
program lojalnościowyma wpływ na konsumpcję kawy?
Z wcześniejszych badań
Z wcześniejszych badańwiemy, \e przeciętny u\ytkownik miesięcznie do tej
wiemy, \e przeciętny u\ytkownik miesięcznie do tej
pory wypijał
pory wypijał100 fili\anek miesięcznie
100 fili\anek miesięcznie
Nowe badanie obejmuje 64 osoby, które uczestniczyły przez 6 miesięcy w
Nowe badanie obejmuje 64 osoby, które uczestniczyły przez 6 miesięcy w
programie lojalnościowym; w tym czasie wypijały średnio 103.32 fili\anki kawy
programie lojalnościowym; w tym czasie wypijały średnio 103.32 fili\anki kawy
miesięcznie; wartość
miesięcznie; wartośćs wyniosła dla tej próby 16
s wyniosła dla tej próby 16
Stawiamy hipotezę
Stawiamy hipotezęzerową:
zerową:
program lojalnościowy
program lojalnościowynie ma \adnego wpływu na wielkość konsumpcji,
nie ma \adnego wpływu na wielkośćkonsumpcji,
czyli faktyczna średnia liczba wypijanych fili\anek kawy jest nadal taka
czyli faktyczna średnia liczba wypijanych fili\anek kawy jest nadal taka
sama
sama
W tym wypadku 0 = 100, przyjmujemy = 16
W tym wypadku 0= 100, przyjmujemy = 16
__
Zatem x= 16/ ""64 = 16/8 = 2
""
""
"
Zatem x= 16/ " 64 = 16/8 = 2
Obliczamy Z = (103.32-100)/2 = 1.66
Obliczamy Z = (103.32-100)/2 = 1.66
Jeśli wybrany poziom ufności to 95% (ą
ą
ą
ą
Jeśli wybrany poziom ufności to 95% (ą= 0.95), to wówczas krytyczna wartość
ą = 0.95), to wówczas krytyczna wartość
ą
ą
z = 1.96 (test dwustronny)
z = 1.96 (test dwustronny)
Co mówi test statystyczny?
Co mówi test statystyczny?
Wynik pomiaru
Z = 1.66
1.66
Wynik pomiaru Z jest mniejszy od wartości krytycznej z
Wniosek: nie mo\na odrzucić hipotezy zerowej
Wniosek badawczy: program lojalnościowy nie wpływa na poziom konsumpcji
kawy
Przykład 2:
Przykład 2:
czy
czyprogram lojalnościowy ma wpływ na konsumpcjękawy?
program lojalnościowyma wpływ na konsumpcję kawy?
Z wcześniejszych badań
Z wcześniejszych badańwiemy, \e przeciętny u\ytkownik miesięcznie do tej
wiemy, \e przeciętny u\ytkownik miesięcznie do tej
pory wypijał
pory wypijał100 fili\anek miesięcznie
100 fili\anek miesięcznie
Nowe badanie obejmuje 400 osób, które uczestniczyły przez 6 miesięcy w
Nowe badanie obejmuje 400 osób, które uczestniczyły przez 6 miesięcy w
programie lojalnościowym; w tym czasie wypijały średnio 103.32 fili\anki kawy
programie lojalnościowym; w tym czasie wypijały średnio 103.32 fili\anki kawy
miesięcznie; wartość
miesięcznie; wartośćs wyniosła dla tej próby 16
s wyniosła dla tej próby 16
Stawiamy hipotezę
Stawiamy hipotezęzerową:
zerową:
program lojalnościowy
program lojalnościowynie ma \adnego wpływu na wielkość konsumpcji,
nie ma \adnego wpływu na wielkośćkonsumpcji,
czyli faktyczna średnia liczba wypijanych fili\anek kawy jest nadal taka
czyli faktyczna średnia liczba wypijanych fili\anek kawy jest nadal taka
sama
sama
W tym wypadku 0 = 100, przyjmujemy = 16
W tym wypadku 0= 100, przyjmujemy = 16
___
Zatem x= 16/ ""400 = 16/20 = 0.8
""
""
"
Zatem x= 16/ " 400 = 16/20 = 0.8
Obliczamy Z = (103.32-100)/0.8 = 4.15
Obliczamy Z = (103.32-100)/0.8 = 4.15
Jeśli wybrany poziom ufności to 95% (ą
ą
ą
ą
Jeśli wybrany poziom ufności to 95% (ą= 0.05), to wówczas krytyczna wartość
ą = 0.05), to wówczas krytyczna wartość
ą
ą
z = 1.96 (test dwustronny)
z = 1.96 (test dwustronny)
Co mówi test statystyczny?
Co mówi test statystyczny?
Wynik pomiaru
Z = 4.15
4.15
Wynik eksperymentu Z jest większy od wartości krytycznej z
Wniosek: nale\y odrzucić hipotezę zerową
Wniosek badawczy: program lojalnościowy wpływa na wielkość konsumpcji
kawy
Przykład 3:
Przykład 3:
czy
czyprogram lojalnościowy ma wpływ na konsumpcjękawy?
program lojalnościowyma wpływ na konsumpcję kawy?
Z wcześniejszych badań
Z wcześniejszych badańwiemy, \e przeciętny u\ytkownik miesięcznie do tej
wiemy, \e przeciętny u\ytkownik miesięcznie do tej
pory wypijał
pory wypijał100 fili\anek miesięcznie
100 fili\anek miesięcznie
Nowe badanie obejmuje 64 osoby, które uczestniczyły przez 6 miesięcy w
Nowe badanie obejmuje 64 osoby, które uczestniczyły przez 6 miesięcy w
programie lojalnościowym; w tym czasie wypijały średnio 103.32 fili\anki kawy
programie lojalnościowym; w tym czasie wypijały średnio 103.32 fili\anki kawy
miesięcznie; wartość
miesięcznie; wartośćs wyniosła dla tej próby 16
s wyniosła dla tej próby 16
Stawiamy hipotezę
Stawiamy hipotezęzerową:
zerową:
program lojalnościowy
program lojalnościowynie zwiększa wielkości konsumpcji, czyli faktyczna
nie zwiększawielkości konsumpcji, czyli faktyczna
średnia liczba wypijanych fili\anek kawy jest nadal taka sama
średnia liczba wypijanych fili\anek kawy jest nadal taka sama
W tym wypadku 0 = 100, przyjmujemy = 16
W tym wypadku 0= 100, przyjmujemy = 16
__
Zatem x= 16/ ""64 = 16/8 = 2
""
""
"
Zatem x= 16/ " 64 = 16/8 = 2
Obliczamy Z = (103.32-100)/2 = 1.66
Obliczamy Z = (103.32-100)/2 = 1.66
Jeśli wybrany poziom ufności to 95% (ą
ą
ą
ą
Jeśli wybrany poziom ufności to 95% (ą= 0.95), to wówczas krytyczna wartość
ą = 0.95), to wówczas krytyczna wartość
ą
ą
z = 1.65 (bo wybieramy teraz test jednostronny)
z = 1.65 (bo wybieramy teraz test jednostronny)
Co mówi test statystyczny?
Co mówi test statystyczny?
Wynik pomiaru
Z = 1.66
1.66
Wynik eksperymentu Z jest większy od wartości krytycznej z
Wniosek: nale\y odrzucić hipotezę zerową
Wniosek badawczy: program lojalnościowy zwiększa wielkość konsumpcji kawy
Test dwustronny czy jednostronny?
Na osiach zaznaczono krytyczne wartości z dla najwa\niejszych przypadków
`"
`"
`"
`" > 00
`"00 >
`"
`"
`"
Ale...
To na razie było
xx x,x,
To na razie było przybli\enie musieliśmy przyjąćzało\enie, \e = s , a to nie
przybli\enie musieliśmy przyjąć zało\enie, \e = s , a to nie
całkiem prawda
całkiem prawda
Poprawna wersja wymaga zastosowania rozkładu t Studenta.
Poprawna wersja wymaga zastosowania rozkładu t Studenta.
jest on jednak bardzo podobny do rozkładu normalnego i dla prób powy\ej N=100 daje
jest on jednak bardzo podobny do rozkładu normalnego i dla prób powy\ej N=100 daje
takie same wyniki
takie same wyniki
Wartość
Wartośćz dla rozkładu normalnego ma swój odpowiednik dla rozkładu t Studenta
z dla rozkładu normalnego ma swój odpowiednik dla rozkładu t Studenta
wartość
wartośćtt
Sprawdzamy
Sprawdzamyw tablicach, jaka jest krytyczna wartość (dla poziomu ufności 95% i zadanej
w tablicach, jaka jest krytyczna wartośćtt(dla poziomu ufności 95% i zadanej
wielkości próby)
wielkości próby)
_
Obliczamy wynik pomiaru podobnie jako poprzednio ) / s
x
Obliczamy wynik pomiaru podobnie jako poprzednioTT= ( - 00 xx
= ( - ) / s
wartość
wartośćTTwynosi zatem tyle samo co wartość
wynosi zatem tyle samo co wartośćZZ
Porównujemy wynik pomiaru T
Porównujemy wynik pomiaru Tz krytyczną wartościątt
z krytycznąwartością
wartości t
wartości tró\nią siętrochę od wartości z
ró\niąsię trochęod wartości z
Przyjmujemy hipotezę
Przyjmujemy hipotezęzerową, jeśli t > Ti odrzucamy, jeśli < T
zerową, jeśli t> T i odrzucamy, jeślitt< T
Testy oparciu o rozkład t Studenta
Przykład 1
Przykład 1
Krytyczna wartość t dla wielkości próby N=64
i poziomu ufności 95% wynosi 1,998 (test dwustronny)
Wartość T dla przykładu 1 (N=64) wynosi 1,66
Przyjmujemy hipotezę zerową
Przykład 2
Przykład 2
Krytyczna wartość t dla wielkości próby N=400
i poziomu ufności 95% wynosi 1,97 (test dwustronny)
Wartość T dla przykładu 2 (N=400) wynosi 4,15
W szczególnych przypadkach
Odrzucamy hipotezę zerową
W szczególnych przypadkach
rozkład t Studenta daje inny
rozkład t Studenta daje inny
wynik ni\
Przykład 3
wynik ni\rozkład normalny.
rozkład normalny.
Przykład 3
Zdarza się
Zdarza sięto dla małych prób;
to dla małych prób;
Krytyczna wartość t dla wielkości próby N=64
jeśli N<100 stosowanie rozkładu
jeśli N<100 stosowanie rozkładu
i poziomu ufności 95% wynosi 1,67 (test jednostronny)
normalnego jest błędem
normalnego jest błędem
Wartość T dla przykładu 3 (N=64) wynosi 1,66
Przyjmujemy hipotezę zerową
Wnioski
Wynik testu, a więc przyjęcie lub odrzucenie hipotezy zerowej zale\y od:
Wynik testu, a więc przyjęcie lub odrzucenie hipotezy zerowej zale\y od:
wyniku pomiaru (to jasne), ale tak\e od
wyniku pomiaru (to jasne), ale tak\e od
wielkości próby (większe próby pozwalają
wielkości próby (większe próby pozwalająprzeprowadzać bardziej czułe
przeprowadzaćbardziej czułe
testy)
testy)
sformułowania hipotezy zerowej (jednostronne czy dwustronne)
sformułowania hipotezy zerowej (jednostronne czy dwustronne)
przyjętego poziomu ufnośc
przyjętego poziomu ufnośc
Nale\y pamiętać
Nale\y pamiętaćo wyborze poprawnego rozkładu
o wyborze poprawnego rozkładu
Poprawna metodologia wymaga sformułowania hipotezy zerowej i określenia
Poprawna metodologia wymaga sformułowania hipotezy zerowej i określenia
poziomu ufności przed przeprowadzeniem testu
poziomu ufności przed przeprowadzeniem testu
liczy się
liczy sięwyłącznie porównanie wartości Z lub Tz wartością krytyczną.
wyłącznie porównanie wartości Zlub T z wartościąkrytyczną.
hipotezę
hipotezęzerową przyjmujemy albo odrzucamy nawet wtedy gdy ró\nica jest
zerowąprzyjmujemy albo odrzucamy nawet wtedy gdy ró\nica jest
bardzo niewielka
bardzo niewielka niezale\nie od tego, czy nam się to podoba, czy nie!
niezale\nie od tego, czy nam sięto podoba, czy nie!
jeśli mamy wątpliwości, mo\na powtórzyć
jeśli mamy wątpliwości, mo\na powtórzyćbadanie na większej próbie&
badanie na większej próbie&
Pamiętajmy, \e statystyka nie chroni nas przed popełnieniem błędu!
Pamiętajmy, \e statystyka nie chroni nas przed popełnieniem błędu!
poziom ufności 95% oznacza, \e mniej więcej raz na 20 pomiarów będziemy
poziom ufności 95% oznacza, \e mniej więcej raz na 20 pomiarów będziemy
wyciągać
wyciągaćbłędne wnioski
błędne wnioski
Średnia: podsumowanie
Próba
Próba
_
średnia obliczona z próby średni roczny przebieg samochodu
x
odchylenie standardowe obliczone z próby, s x błąd standardowy
s
____________
_
Ł (xi x )2
s
___
s = sx =
"
"
" N - 1
"
"N
"
"
"
Populacja
Populacja
prawdziwa średnia dla populacji (nieznana)
prawdziwe odchylenie standardowe dla populacji (nieznane)
Wykonując pomiar na skończonej próbie, mo\emy uzyskać ró\ne wyniki średniej:
_
- z prawdopodobieństwem 68% x zawiera się w przedziale ą x
_
- z prawdopodobieństwem 95% x zawiera się w przedziale ą 2x
_
- z prawdopodobieństwem 99% x zawiera się w przedziale ą 3x
Pytanie na koniec
Ostatecznie często przyjmujemy, \e średnia w populacji jest równa (z jakimś przybli\eniem)
wynikowi naszego badania. Czy to poprawny wiosek?
Inaczej mówiąc: jeśli
_
Średnia uzyskana w próbie
x
Prawdziwa średnia w populacji (nieznana)
sx2 Estymowana wariancja rozkładu średnich (błąd standardowy)
N
Wielkość próby
s2
Wariancja rozkładu mierzonej wielkości (z próby)
oraz biorąc pod uwagę powy\sze rozwa\ania:
Czy wolno powiedzieć, \e średnia wartość w populacji wynosi
_
x ą 2sx
na poziomie ufności 95%?
A jak jest dla procentów?
W badaniach bardzo wiele wyników podawanych jest w %, czyli jako
W badaniach bardzo wiele wyników podawanych jest w %, czyli jako
odsetek
odsetek
Tu te\
Tu te\chcemy uzyskać mo\liwośćwnioskowania o populacji
chcemy uzyskaćmo\liwość wnioskowania o populacji
(na przykład jaki % dorosłych Polaków chce zagłosować
(na przykład jaki % dorosłych Polaków chce zagłosowaćna polityka X?)
na polityka X?)
szczegóły rozumowania ró\nią
szczegóły rozumowania ró\niąsię od tego, co pokazywaliśmy dla
sięod tego, co pokazywaliśmy dla
średnich, ostatecznie jednak wnioski są
średnich, ostatecznie jednak wnioski sąbardzo podobne (inne są
bardzo podobne (inne są
oczywiście wzory)
oczywiście wzory)
w przypadku odsetków równie\
w przypadku odsetków równie\mo\na korzystać z rozkładu
mo\na korzystaćz rozkładu
normalnego
normalnego
Proporcja (odsetek) - podsumowanie
proporcja obliczona z próby np. odsetek osób, które znają markę Jacobs
p
sp błąd proporcji obliczony z próby (obliczamy oszacowanie z góry)
____________
____________
p (1- p) 0,5
0,5 x 0,5
______
d"
sp = =
"
"
" N "
"
"
" N
"
N
"
"
"
"
Jaki jest prawdziwy odsetek osób znających markę
Jaki jest prawdziwy odsetek osób znających markęJacobs
Jacobs
w populacji?
w populacji?
prawdziwa proporcja dla populacji (nieznana)
Ą
Wykonując pomiar na próbie, mo\emy uzyskać ró\ne wyniki:
- z prawdopodobieństwem 68% p zawiera się w przedziale Ą ą p
- z prawdopodobieństwem 95% p zawiera się w przedziale Ą ą 2p
- z prawdopodobieństwem 99% p zawiera się w przedziale Ą ą 3p
Mo\na przyjąć, \e = S p
p
Wyszukiwarka
Podobne podstrony:
Metody statystyczne dla opornych cz 1
statystyka dla opornych
Alt klawiatura numeryczna Kurs dla opornych
Metody modelowania procesow 12 cz I (1)
Wyklad 7 Nieparametryczne metody statystyczne PL [tryb zgodności]
MS Word dla opornych
metody numeryczne dla informatykow
więcej podobnych podstron