Statystyka w badaniach. Weryfikacja hipotez statystycznych
Urszula Augustyńska
Od hipotezy badawczej do hipotezy statystycznej
Hipoteza badawcza to formułowane przez badacza przypuszczenie dotyczące interesującego
badawczo stanu rzeczy. Przypuszczenie to jest wnioskiem z teorii i wymaga sprawdzenia na drodze
empirycznej.
Hipoteza statystyczna to przypuszczenie, które (1) dotyczy rozkładu populacji, (2) o
prawdziwości lub fałszywości tego przypuszczenia wnioskuje się na podstawie próbki tej populacji.
Hipoteza badawcza jest formułowana w języku teorii, na gruncie której została wywiedziona.
Hipoteza statystyczna jest formułowana w języku formalnym teorii matematycznej.
Opracowano wiele narzędzi weryfikacji hipotez statystycznych. Aby te narzędzia wykorzystać do
weryfikacji hipotez badawczych wystarczy wyrazić hipotezę badawczą w „języku” statystyki - jako
hipotezę statystyczną.
Popatrzmy na poniży przykład obrazujący związek między hipotezą badawczą a odpowiadającą
jej hipotezą statystyczną.
Tabela1. Formułowanie hipotezy badawczej jako hipotezy statystycznej
Hipoteza badawcza
Przeciętny poziom inteligencji studentów jest wyższy niż przeciętny
poziom inteligencji rówieśników nie będących studentami
populacje
Studenci – jedna populacja, rówieśnicy nie będący studentami – druga
populacja
zmienna
Poziom inteligencji (zmienna nieobserwowalna)
Wskaźnik
Wynik testu inteligencji Bieneta (skala z jednostką miary)
Parametr populacji
Średni wynik testu Bieneta w populacji studentów (μ
1
), średni wynik
testu Bieneta w populacji rówieśników nie będących studentami (μ
2
)
Hipoteza statystyczna
H1
Średni wynik testu Bieneta w populacji studentów jest wyższy niż
w populacji rówieśników nie będących studentami
zapis formalny H1
H1: μ
1
> μ
2
Hipoteza statystyczna
zerowa H0
Średni wynik testu Bieneta w populacji studentów jest taki sam jak
w populacji rówieśników nie będących studentami
Zapis formalny H0
H0: μ
1
= μ
2
W przykładzie tym zwrócimy uwagę na takie istotne sprawy:
1. hipoteza statystyczna dotyczy rozkładu zmiennej w populacji i te populacje oraz zmienna muszą
być wyraźnie uświadamiane,
2. jeżeli zmienna jest nieobserwowalna należy określić wskaźnik zmiennej oraz skalę dokładności
pomiaru zmiennej,
3. rozkład zmiennej w populacji jest scharakteryzowany poprzez parametry; należy określić ten
parametr, który wykorzystamy przy porównywaniu populacji
W ostatnich dwu wierszach tabeli sformułowana jest tzw. hipoteza zerowa, o której powiemy w
dalszej części skryptu.
Statystyka w badaniach. Weryfikacja hipotez statystycznych
Urszula Augustyńska
Aby odróżnić można było szybko, kiedy mówimy o statystykach z próby, a kiedy o parametrach rozkładu zmiennej w
populacji przyjęło się stosować następującą symbolikę:
Tabela 2. Symbol parametru a symbol statystyki z próby i jej wartości
Własność rozkładu
Próba
statystyka
wartość
statystyki
Populacja
parametr
Średnia
M
m
µ
Odchylenie standardowe
S
s
σ
Wskaźnik struktury
P
p
π
Parametry rozkładu zmiennej w danej populacji są wielkościami stałymi, natomiast statystyki z próby przyjmują
różne wartości dla różnych prób pobranych z tej samej populacji.
Zajmiemy się teraz tylko takim rodzajem hipotez, które nazywane są hipotezami istotności różnic
i dotyczą różnicy między dwiema populacjami. Oto przykłady hipotez badawczych dla dwu
populacji, którym odpowiadają statystyczne hipotezy istotności różnic:
Hipotezie badawczej:
Sprawność manualna 3-letnich dziewczynek jest wyższa niż 3-letnich chłopców.
Odpowiada hipoteza statystyczna:
Wynik średni testu sprawności manualnej w populacji 3-letnich dziewczynek jest wyższy niż
w populacji 3-letnich chłopców.
Formalny zapis tej hipotezy ma postać:
H1:
µ
d
>
µ
ch ,
gdzie
µ
d
oznacza wynik średni
testu w populacji dziewczynek, a
µ
ch
–wynik średni testu w populacji
chłopców
Hipotezie badawczej:
Uczniowie liceum częściej deklarują zainteresowanie literaturą niż uczniowie szkół
zawodowych.
Odpowiada hipoteza statystyczna:
Częstość wyboru pozycji A Kwestionariusza Zainteresowań jest wyższa w populacji uczniów
liceum niż w populacji uczniów szkól zawodowych.
H1:
π
l
>
π
2
,
gdzie
π
l
oznacza wskaźnik struktury (procent) wyboru pozycji A w populacji uczniów liceum,
π
2
–
wskaźnik struktury wyboru pozycji A w populacji uczniów szkół zawodowych.
Wprowadzimy jeszcze pojęcie hipotezy parametrycznej. Hipoteza parametryczna to taka hipoteza,
w której „mówi się” o konkretnym parametrze rozkładu zmiennej w populacji, np. średniej lub
wskaźniku struktury.
Powyższe hipotezy są hipotezami parametrycznymi; pierwsza dotyczy różnic między
wartościami średniej w populacji, druga – różnic między wskaźnikami struktury.
Statystyka w badaniach. Weryfikacja hipotez statystycznych
Urszula Augustyńska
Hipoteza zerowa
Narzędzia weryfikacji hipotez statystycznych są tak skonstruowane, że wymagają „na wejściu” pary
hipotez. Jedna z tych hipotez nazywana jest hipotezą zerową (H0) i mówi o braku różnic między
porównywanymi populacjami. Druga hipoteza, nazywana hipotezą alternatywną (H1), mówi o tym,
że porównywane populacje różnią się między sobą pod wybranym względem. Wróćmy do
podanych wcześniej przykładów hipotez:
H1:
Wynik średni testu sprawności manualnej w populacji 3-letnich dziewczynek jest wyższy niż
w populacji 3-letnich chłopców.
Jest to hipoteza alternatywna, mówi o tym, że populacja 3-letnich dziewczynek różni się od
populacji 3-letnich chłopców pod względem sprawności manualnej. Odpowiadająca jej hipoteza
zerowa brzmi:
H0:
Wynik średni testu sprawności manualnej w populacji 3-letnich dziewczynek jest jest taki
sam jak w populacji 3-letnich chłopców.
Hipoteza alternatywna może być formułowana jako hipoteza jednokierunkowa (jednostronna):
Η1: µ
1
>
µ
2
H1:
µ
1
<
µ
2
albo jako hipoteza dwukierunkowa (dwustronna):
Η1: µ
1
≠
µ
2
odpowiednio do treści hipotezy badawczej.
Hipoteza zerowa w formalnym zapisie ma postać:
H0:
µ
1
=
µ
2
Ćwiczenie
Przekształć poniższą hipotezę badawczą na hipotezę statystyczną według wzoru podanego w
tabeli1.
Gotowość do flirtu 15-letnich dziewcząt jest wyższa niż 15-letnich chłopców.
Poziom istotności
Hipoteza statystyczna jest przypuszczeniem dotyczącym populacji, a weryfikowana jest na
podstawie próbki populacji, a więc na podstawie niepełnej informacji o populacji. Kończąca
procedurę weryfikacji decyzja może być zatem obarczona błędem. Błąd polegający na odrzuceniu
hipotezy sprawdzanej H0, gdy jest ona prawdziwa nosi nazwę błędu pierwszego rodzaju. Błąd
polegający na przyjęciu hipotezy sprawdzanej H0, gdy jest ona fałszywa nosi nazwę błędu
drugiego rodzaju.
Tabela3: Błąd I rodzaju i błąd II rodzaju
Hipoteza H0
Decyzja
H0
Odrzucić
H0
nie odrzucić
Prawdziwa
Błąd I rodzaju
Decyzja prawidłowa
Fałszywa
Decyzja prawidłowa
Błąd II rodzaju
Statystyka w badaniach. Weryfikacja hipotez statystycznych
Urszula Augustyńska
Prawdopodobieństwo popełnienia błędu I rodzaju, czyli odrzucenia prawdziwej hipotezy H0,
oznaczane jest symbolem
α
i nazywane poziomem istotności. Zauważmy przy tym, że odrzucenie
sprawdzanej hipotezy H0 skutkuje przyjęciem hipotezy alternatywnej H1. Hipoteza alternatywna
jest w naszym przypadku tą właśnie hipotezą, która odpowiada hipotezie badawczej.
W dalszym ciągu interesować nas będzie tylko błąd I rodzaju. Błąd ten, jak wynika z powyższych
rozważań jest równocześnie błędem jakim obarczona jest decyzja o przyjęciu fałszywej hipotezy
H1.
Poziom istotności, czyli prawdopodobieństwo odrzucenia prawdziwej hipotezy zerowej i, co za
tym idzie, przyjęcia fałszywej hipotezy alternatywnej, jest ustalany przez badacza. To badacz
decyduje o tym jakie ryzyko błędnej decyzji może zaakceptować. W badaniach społecznych
najczęściej przyjmuje się jako dopuszczalny taki błąd, dla którego poziom istotności nie przekracza
poziomu
α = 0,05,
czyli 5%.
Ο
znacza to, że badacz przyjmie hipotezę alternatywną, gdy wynik
sprawdzania wskaże, że przynajmniej na 95% jest ona prawdziwa.
Akceptowane w badaniach społecznych poziomy istotności to:
α = 0,01
(99% pewności, że hipoteza alternatywna jest prawdziwa),
α = 0,05 (95%
pewności, że hipoteza alternatywna jest prawdziwa),
α = 0,10 (
90% pewności, że hipoteza alternatywna jest prawdziwa).
Dla zobrazowania tego zagadnienia zróbmy pewien myślowy eksperyment. Wyobraźmy sobie,
że w dwu zamkniętych i nieprzezroczystych pudłach są koty. Naszym zadaniem jest
zweryfikowanie hipotezy, że oba koty są różnej maści, jeden czarny a drugi czaro-biały. Nie
widzimy kotów, a hipotezę tę możemy sprawdzić pobierając próbkę sierści kotów. Aby
przeprowadzić weryfikację narzędziami statystyki formułujemy hipotezę zerową. Tę hipotezę
będziemy sprawdzać. Mamy więc dwie hipotezy:
H0: koty są tej samej maści, inaczej: populacja sierści obu kotów składa się z włosów o tej samej
barwie
H1: koty są różnej maści, inaczej: populacja sierści kota w pierwszym pudle różni się od
populacji sierści kota w drugim pudle pod względem barwy
Aby sprawdzić hipotezę pobieramy próbkę sierści z populacji 1 i próbkę sierści z populacji 2.
Przyjmijmy, że próbki są takie jak to opisano pod rysunkami.
Populacja 1
próbka populacji 1
100 włosów, w tym: 70 czarnych, 30 białych
Populacja 2
próbka populacji 2
100 włosów, wszystkie czarne
Pobrane próbki sierści wskazują na różnicę umaszczenia kotów. Biorąc pod uwagę wyniki
badania możemy zdecydować o odrzuceniu prawdziwej hipotezy zerowej: koty są tej samej maści, a
co za tym idzie, przyjęciu fałszywej hipotezy alternatywnej: koty są różnej maści. Popełnimy błąd.
Statystyka w badaniach. Weryfikacja hipotez statystycznych
Urszula Augustyńska
W rzeczywistości oba koty są tej samej maści, oba są czarno-białe.
Zaletą wnioskowania z wykorzystaniem narzędzi statystki jest to, że badacz może decydować o
poziomie ryzyka odrzucenia prawdziwej hipotezy zerowej. To ryzyko, to właśnie poziom
istotności. Zauważmy, że poziom ryzyka związany z odrzucaniem hipotezy zerowej wyznacza
równocześnie poziom zaufania do przyjmowanej hipotezy alternatywnej. Jeżeli, na przykład,
przyjęty poziom ryzyka wynosi 5%, to poziom zaufania jest równy 100% - 5% = 95%.
Sprawdzanie hipotezy. Wybór testu statystycznego
Istnieje wiele narzędzi do sprawdzania hipotez statystycznych. Narzędzia te to testy statystyczne.
Test statystyczny, mówiąc najogólniej, jest ściśle określonym sposobem postępowania podającym,
przy jakiego rodzaju wynikach próby hipotezę sprawdzaną należy odrzucić. Testy wykorzystywane
do sprawdzania hipotez istotności różnic, to testy istotności różnic.
Na początek zaznajomimy się z trzema testami istotności różnic. Są to:
test t-Studenta
test wskaźników struktury
test chi-kwadrat dla tabel czteropolowych
Tabela4. Wybrane testy istotności różnic
test
Kiedy stosujemy
Sprawdzian testu
Założenia testu
t-Studenta dla prób
niezależnych
t-Studenta dla prób
zależnych
testowanie różnicy
między średnimi dwu
populacji
+
−
+
+
−
=
2
1
2
1
2
2
2
2
1
1
2
1
1
1
2
n
n
n
n
S
n
S
n
M
M
T
1
−
=
n
S
M
T
z
z
Gdy próby są małe
(n<30) należy
sprawdzić, czy
rozkład zmiennej w
populacji jest
normalny oraz czy
wariancje rozkładów
w obu populacjach
są podobne
Test wskaźników
struktury
testuje różnicę między
wybranymi
wskaźnikami struktury
(procentami) dwu
populacji
n
q
p
n
m
n
m
U
′
−
=
2
2
1
1
2
1
2
1
n
n
m
m
p
+
+
=
2
1
2
1
n
n
n
n
n
+
=
′
q
q
−
=
1
Próby powinny być
duże (n>100)
test chi-kwadrat dla
tabel czteropolowych
testuje różnicę między
liczebnościami w
odpowiednich polach
tabeli czteropolowej
(
)
(
)(
)( )(
)
d
b
c
a
d
c
b
a
n
bc
ad
+
+
+
+
−
=
2
2
χ
Liczebności w
polach tabeli nie
powinny być
mniejsze niż 8
M – średnia w próbce, M
z
– średnia różnic pomiarów
S – odchylenie standardowe w próbce, S
z
– odchylenie standardowe rozkładu różnic pomiarów
n – liczebność próbki,
a,b,c,d – liczebności w komórkach tabeli czteropolowej
Sprawdzian testu to pewne wyrażenie matematyczne, dokładniej funkcja zmiennych losowych.
Pokazuje ono, jak należy przeliczyć uzyskane w próbce dane. Po przeliczeniu otrzymujemy pewną
liczbę. Na podstawie tej liczby określić możemy prawdopodobieństwo, że sprawdzana hipoteza
Statystyka w badaniach. Weryfikacja hipotez statystycznych
Urszula Augustyńska
zerowa jest prawdziwa.
Obecnie wszystkie obliczenia związane z wyznaczaniem prawdopodobieństwa, że hipoteza zerowa
jest prawdziwa wykonują odpowiednie programy komputerowe. Nam pozostaje to co
najtrudniejsze:
postawić odpowiednie do rozwiązywanego problemu hipotezy,
wyrazić je jako hipotezy statystyczne,
ustalić dopuszczalne ryzyko błędu I rodzaju, czyli poziom istotności,
dobrać właściwy test statystyczny,
odnaleźć test w którymś z poznanych programów do analiz statystycznych,
wprowadzić do programu dane z badania próbki,
zinterpretować wyniki obliczeń programu, czyli podjąć decyzję dotyczącą sprawdzanej
hipotezy zerowej, a co za tym idzie, również postawionej hipotezy badawczej.
Podejmowanie decyzji. Wynik statystycznie istotny
Program komputerowy wylicza wartość sprawdzianu testu statystycznego oraz
prawdopodobieństwo, że hipoteza zerowa jest prawdziwa. Decyzję podejmujemy na podstawie tego
wyliczonego przez program prawdopodobieństwa (oznaczonego literą p), według następującej
reguły:
jeżeli p<
α ,
to:
odrzucamy hipotezę zerową H0
przyjmujemy hipotezę alternatywną H1
jeżeli p>
α ,
to:
nie odrzucamy hipotezy zerowej H0
nie przyjmujemy hipotezy alternatywnej H1
Tabela 5. Podejmowanie decyzji na podstawie wyniku testu statystycznego
Wynik testu
statystycznego
Decyzja
Hipoteza zerowa H0
Hipoteza alternatywna
H1
Interpretacja wyniku testu
statystycznego
p <
α
Odrzucamy
Przyjmujemy
Wynik jest statystycznie
istotny na poziomie
α
p >
α
Nie odrzucamy
Nie przyjmujemy
Wynik nie jest statystycznie
istotny na poziomie
α
Wynik testu statystycznego pozwalający podjąć decyzję o przyjęciu postawionej hipotezy
badawczej na wyznaczonym poziomem istotności
α
poziomie ryzyka jest zwykle tym, co badacza
satysfakcjonuje. Jak natomiast odnieść się do sytuacji, gdy wynik testu statystycznego nie daje
podstaw do przyjęcia postawionej hipotezy badawczej?
Stwierdzenie braku podstaw do odrzucenia hipotezy zerowej H0 nie jest równoznaczne z
przyjęciem H0, a więc i koniecznością odrzucenia hipotezy alternatywnej H1. Innymi słowy, nie
oznacza, że określone w hipotezie badawczej różnice, czy związki nie istnieją.
Wynik testu statystycznego oceniony jako „nieistotny” może być konsekwencją np. zbyt małej
liczebności próby, niewłaściwej operacjonalizacji badanej zmiennej teoretycznej, niewłaściwego
doboru próbki, nieodpowiedniego planu eksperymentalnego, niewłaściwej realizacji planu badania
itp.
Statystyka w badaniach. Weryfikacja hipotez statystycznych
Urszula Augustyńska
Podkreślmy jeszcze, że procedura weryfikacji hipotezy nie jest dowodzeniem jej prawdziwości czy
fałszywości.
Stanisław Lem wyraził rzecz trafnie słowami „statystyka niczego nie dowodzi, czyni
tylko wszystko mniej lub bardziej prawdopodobnym”. Poprawne wyprowadzenie wniosków
wynikających z weryfikacji hipotezy wymaga dobrej znajomości dziedziny, której zjawiska
podlegają badaniu i tylko przez znawcę tej dziedziny może być odpowiednio dokonane.
Zastosowanie testu t do porównania średnich dwu populacji. Próby niezależne
W badaniach na temat aktywności ruchowej kobiet zmierzono: siłę procesu pobudzania, siłę
procesu hamowania oraz ruchliwość procesów nerwowych (Kwestionariusz Temperamentu
J.Strelaua, A.Angleitnera, W.Rucha i J.Baltenmana). W badaniu wzięły udział 123 kobiety
aktywnych ruchowo - uczestniczące regularnie w różnych formach zajęć rekreacyjnych i 80 kobiet
biernych ruchowo – nie uprawiających żadnej formy rekreacji. Otrzymano następujące wyniki
(M.Giszkowska, D.Rogacz-Mańka, B.Wit, Temperament i ...., Wychowanie Fizyczne i Sport, 1999,
Nr 4):
Właściwość
Aktywne ruchowo
Bierne ruchowo
M
S
M
S
Siła procesu pobudzenia
48,91
7,54
45,29
8,33
Siła procesu hamowania
49,73
6,51
50,70
6,31
Ruchliwość procesów nerwowych
55,82
8,45
52,39
8,92
Na poziomie
α
= 0,01 należy zweryfikować hipotezy o wyższym poziomie natężenia poszczególnych
właściwości w populacji kobiet aktywnych ruchowo.
W przeprowadzonym badaniu weryfikowano trzy hipotezy badawcze. Prześledzimy procedurę
weryfikacji hipotezy: Siła procesu pobudzenia kobiet aktywnych ruchowo jest wyższa niż kobiet
biernych ruchowo
Przekształcenie hipotezy badawczej na hipotezę statystyczną
Hipoteza badawcza
Siła procesu pobudzenia kobiet aktywnych ruchowo jest wyższa niż
kobiet biernych ruchowo
populacje
Kobiety aktywne ruchowo – jedna populacja, kobiety bierne ruchowo –
druga populacja
zmienna
Siła procesu pobudzenia (zmienna nieobserwowalna)
Wskaźnik
Wynik kwestionariusza temperamentu w wymiarze siła procesu
pobudzenia (skala z jednostką miary)
Parametr populacji
Średnia siła procesu pobudzenia w populacji kobiet aktywnych ruchowo
(μ
1
), średnia siła procesu pobudzenia w populacji kobiet biernych
ruchowo (μ
2
)
Hipoteza statystyczna
H1
Wynik średni kwestionariusza temperamentu w wymiarze siła procesu
pobudzenia w populacji kobiet aktywnych ruchowo jest wyższy niż w
populacji kobiet biernych ruchowo
zapis formalny H1
H1: μ
1
> μ
2
Statystyka w badaniach. Weryfikacja hipotez statystycznych
Urszula Augustyńska
Hipoteza statystyczna
zerowa H0
Wynik średni kwestionariusza temperamentu w wymiarze siła procesu
pobudzenia w populacji kobiet aktywnych ruchowo jest taki sam jak w
populacji kobiet biernych ruchowo
Zapis formalny H0
H0: μ
1
= μ
2
Schemat weryfikacji hipotezy
Ustalenie poziomu istotności
(poziomu ryzyka)
α = 0,01
Wybór testu statystycznego
Test t-Studenta (różnica między dwiema średnimi)
Sprawdzenie założeń testu
statystycznego
Założenia testu t są spełnione
Wyniki próbki
Kobiety aktywne ruchowo:
n = 123, M = 48,91, S = 7,54
Kobiety bierne ruchowo:
n = 80, M = 45,29, S = 6,31
Wynik testu statystycznego
p=0,0011 (
test jednostronny, program STATISTICA 8,
menu:statystyka/statystyki podstawowe i tabele/inne testy istotności
decyzja
Ponieważ p<0,01 odrzucamy hipotezę zerową i przyjmujemy
hipotezę alternatywną
Wynik badania
Wynik średni kwestionariusza temperamentu w wymiarze siła
procesu pobudzenia w próbce kobiet aktywnych ruchowo jest
wyższy niż w próbce kobiet biernych ruchowo, różnica jest
statystycznie istotna na poziomie istotności p<0,01
Wniosek
Siła procesu pobudzenia kobiet aktywnych ruchowo jest wyższa niż
kobiet biernych ruchowo
Uwagi
Postawiona hipoteza badawcza została potwierdzona na poziomie
ufności 99%
Schemat weryfikacji hipotezy Siła procesu hamowania kobiet aktywnych ruchowo jest wyższa niż
kobiet biernych ruchowo
Hipoteza
Siła procesu hamowania kobiet aktywnych ruchowo jest wyższa niż
kobiet biernych ruchowo
Ustalenie poziomu istotności
(poziomu ryzyka)
α = 0,01
Wybór testu statystycznego
Test t-Studenta (różnica między dwiema średnimi)
Sprawdzenie założeń testu
statystycznego
Założenia testu t są spełnione
Wyniki próbki
Kobiety aktywne ruchowo:
n = 123, M = 49,73, S = 6,51
Kobiety bierne ruchowo:
n = 80, M = 50,70, S = 8,33
Wynik testu statystycznego
p=0,1475 (
test jednostronny, program STATISTICA 8,
menu:statystyka/statystyki podstawowe i tabele/inne testy istotności)
Statystyka w badaniach. Weryfikacja hipotez statystycznych
Urszula Augustyńska
decyzja
Ponieważ p>0,01 nie mamy podstaw do odrzucenia hipotezy zerowej
i nie przyjmujemy hipotezy alternatywnej
Wynik badania
Wynik średni kwestionariusza temperamentu w wymiarze siła
procesu hamowania w próbce kobiet aktywnych ruchowo jest
wyższy niż w próbce kobiet biernych ruchowo, ale różnica jest
statystycznie nieistotna na poziomie istotności p<0,01
Wniosek
Nie można twierdzić, że siła procesu hamowania kobiet aktywnych
ruchowo jest wyższa niż kobiet biernych ruchowo
Uwagi
Postawiona hipoteza badawcza nie została potwierdzona na
poziomie ufności 99% w tym badaniu empirycznym
Powyższe schematy precyzują poszczególne kroki weryfikacji hipotezy. Jednakże w samym
raporcie z badania (np. w części badawczej pracy magisterskiej) wystarczy podać w tabeli wyniki
uzyskane w próbie (tabela 6), wynik badania i wniosek.
Tabela 6. Różnice średnich w badanych grupach i ich statystyczna istotność
Właściwość
Aktywne ruchowo
(N=123)
Bierne ruchowo
(N=80)
M
a
S
a
M
b
S
b
M
a
- M
b
Poziom p
Siła procesu pobudzenia
48,91
7,54
45,29
8,33
3,62
**
Siła procesu hamowania
49,73
6,51
50,70
6,31
-0,97
n.i.
Ruchliwość procesów nerwowych
55,82
8,45
52,39
8,92
3,43
** - różnica statystycznie istotna na poziomie p<0,01
* - różnica statystycznie istotna na poziomie p<0,05
n.i. - różnica statystycznie nieistotna
Ćwiczenia:
1. Sformułuj pozostałą hipotezę badawczą postawioną w analizowanym badaniu. Przeprowadź jej
weryfikację (skorzystaj z programu komputerowego). Podaj wynik badania i wniosek z badania.
2. W badaniach nad rozumieniem związków przyczynowo-skutkowych postawiono hipotezę o
zróżnicowaniu środowiskowym poziomu rozumienia związków przyczynowo-skutkowych.
Pobrano losowe próby z populacji uczniów szkół podstawowych miejskich (próba M) oraz z
populacji uczniów szkół podstawowych wiejskich (próba W) i przeprowadzono odpowiedni test,
którego wyniki interpretowane są jako pomiary ze skali przedziałowej.
Podaj formalny zapis hipotezy zerowej oraz alternatywnej, ustal poziom istotności, dobierz
odpowiedni test do testowania postawionej hipotezy, przeprowadź wnioskowanie przyjmując
poniższe dane:
Próba M: liczebność=30 uczniów średnia=9,6 odchylenie standardowe = 2,06
Próba W: liczebność=30 uczniów średnia=8,3 odchylenie standardowe = 1,77
Podaj wynik weryfikacji hipotezy i wniosek
Statystyka w badaniach. Weryfikacja hipotez statystycznych
Urszula Augustyńska
Zastosowanie testu t do porównania średnich dwu populacji. Próby zależne
W badaniach nad wpływem uświadamiania celu działania na skuteczność działania, losowo
dobranej grupie uczniów polecono wykonać pewne zadanie i zmierzono czas jego wykonania.
Następnie grupie tej polecono wykonać zadanie o analogicznym poziomie złożoności w
analogicznych warunkach, ale tym razem podano im cel czynności. Zmierzono czas wykonania
zadania. Uzyskano następujące pary pomiarów (dane umowne, Cz. Lewicki, 1989,s.113):
Uczeń:
1
2
3
4
5
6
7
9
9
10
Pomiar
początkowy[s]
55
70
60
60
52
70
62
80
57
70
Pomiar
końcowy [s]
70
92
57
65
50
100
97
86
72
83
Należy sprawdzić przypuszczenie, że świadomość celu wykonania zadania wpływa na czas jego
wykonania.
Przekształcenie hipotezy badawczej na hipotezę statystyczną
Hipoteza badawcza
populacje
zmienna
Wskaźnik
Parametr populacji
Hipoteza statystyczna
H1
zapis formalny H1
Hipoteza statystyczna
zerowa H0
Zapis formalny H0
Schemat weryfikacji
Hipoteza
Ustalenie poziomu istotności
(poziomu ryzyka)
α = 0,05
Wybór testu statystycznego
Test t-Studenta dla grup zależnych (różnica między dwiema
średnimi)
Sprawdzenie założeń testu
statystycznego
Założenia testu t są spełnione
Wyniki próbki
Uczniowie przed
uświadomieniem celu działania
Uczniowie po uświadomieniu celu
działania
n=10, średnia różnic M
z
= 13,6 , odchylenie standardowe rozkładu
różnic S
z
= 12,7
Statystyka w badaniach. Weryfikacja hipotez statystycznych
Urszula Augustyńska
Wynik testu statystycznego
p =
0,008057 (test studenta dla prób zależnych, program Statistica 8,
menu:statystyka/statystyki podstawowe i tabele/test t dla prób zależnych)
decyzja
Wynik
Wniosek
Uwagi
Ćwiczenie:
Uzupełnij powyższy schemat weryfikacji podanej hipotezy
Zastosowanie testu wskaźników struktury
Przeprowadzono badania dotyczące zainteresowania współczesną muzyką rozrywkową.
W wylosowanej grupie 400 młodych osób w wieku 14 – 18 lat zainteresowanie stylem hip-hop
zadeklarowało 27%. W liczącej 300 osób losowo dobranej grupie młodzieży w wieku 19 – 23 lata
zainteresowanie tym stylem zadeklarowało 20%. Czy te dane potwierdzają hipotezę o większej
popularności stylu hip-hop w populacji młodzieży 14 – 18 lat, niż w populacji młodzieży w wieku
19 – 23 lata? Inaczej mówiąc, czy różnica 7% uzyskana w tym badaniu jest statystycznie istotna?
Uwaga: dane umowne
Hipoteza badawcza
Popularność stylu hip-hop wśród młodzieży w wieku 14-18 lat jest
większa niż wśród młodzieży w wieku 19 – 23 lata
populacje
Młodzież 14-18 lat, młodzież 19 – 23 lata
zmienna
Zainteresowanie stylem hip-hop
Wskaźnik
Odpowiedź na pytanie 3. kwestionariusza ankiety
Parametr populacji
Wskaźnik struktury (procent)
Hipoteza statystyczna
H1
Procent osób deklarujących zainteresowanie stylem hip-hop w populacji
młodzieży w wieku 14-18 lat ( π
1
) jest wyższy niż w populacji młodzieży
w wieku 19-23 lata (π
2
)
zapis formalny H1
H1: π
1
> π
2
Hipoteza statystyczna
zerowa H0
Procent osób deklarujących zainteresowanie stylem hip-hop w populacji
młodzieży w wieku 14-18 lat ( π
1
) jest taki sam jak w populacji
młodzieży w wieku 19-23 lata (π
2
)
Zapis formalny H0
H0: π
1
= π
2
Schemat weryfikacji hipotezy
Ustalenie poziomu istotności
(poziomu ryzyka)
α = 0,05
Wybór testu statystycznego
Test wskaźnika struktury
Sprawdzenie założeń testu
statystycznego
Założenia testu spełnione, obie próby powyżej 100 osób każda
Statystyka w badaniach. Weryfikacja hipotez statystycznych
Urszula Augustyńska
Wyniki próbki
Grupa młodzieży 14-18 lat
n = 400, P = 27%
Grupa młodzieży 19 – 23 lata
n = 300, P = 20%
Wynik testu statystycznego
p = 0,0161
(test wskaźnika struktury, program Statistica8/ statystyki/statystyki
podstawowe i tabele/ inne testy istotności)
decyzja
Ponieważ p<0,05 odrzucamy hipotezę H0 i przyjmujemy hipotezę
H1
Wynik badania
W grupie młodzieży 14-18 lat procent osób deklarujących
zainteresowanie stylem hip-hop jest wyższy niż w grupie młodzieży
19 – 23 lata. Różnica jest statystycznie istotna na poziomie 0,05
Wniosek
Popularność stylu hip-hop wśród młodzieży w wieku 14-18 lat jest
większa niż wśród młodzieży w wieku 19 – 23 lata
Uwagi
Zaufanie do wniosku wynosi 95%
Zastosowanie testu chi-kwadrat dla tabel czteropolowych. Próby niezależne
Tabela 7. Deklaracje nauczycieli pracujących w szkołach miejskich i wiejskich dotyczące poczucia
wypalenia zawodowego
Szkoła
Wypalenie zawodowe
Wypalony
zawodowo
Niewypalony
zawodowo
Na wsi
10
40
50
W mieście
20
30
50
Razem
30
70
100
Chi-kwadrat=4,76; p= 0,0291
Wynik: Różnica poczucia wypalenia zawodowego między grupą nauczycieli pracujących w
szkołach miejskich i szkołach wiejskich jest statystycznie istotna (chi-kwadrat=4,76, p<0,05).
Wniosek:
Istnieje związek między poczuciem wypalenia zawodowego nauczyciela a jego miejscem pracy.
Nauczyciele pracujący w szkołach wiejskich rzadziej deklarują poczucie wypalenia zawodowego
niż nauczyciele pracujący w szkołach w miastach.