Rozkład Normalny
Mówimy, że zmienna losowa ciągła X ma rozkład normalny o wartości oczekiwanej μ i odchyleniu standardowym σ i zapisujemy:
, wtedy i tylko wtedy gdy Funkcja gęstości w rozkładzie normalnym o postaci:
(określona dla wszystkich rzeczywistych wartości zmiennej X)
Przykładowe rozkłady funkcji gęstości i dystrybuant dla danych μ i σ
Reguła „trzech sigma” - jeżeli zmienna losowa (cecha) ma rozkład normalny to:
68,3 % populacji mieści się w przedziale (µ - σ; µ + σ)
95,5 % populacji mieści się w przedziale (µ - 2σ; µ + 2σ)
- 99,7 % populacji mieści się w przedziale (µ - 3σ; µ + 3σ)
*************************************
Hipotezy i test statystyczny
Przed przystąpieniem do badania jakiegoś problemu możemy sformułować wiele hipotez. Hipotezę wyróżnioną, która ma być poddana weryfikacji nazywamy hipotezę zerową i oznaczamy symbolem H0, natomiast metoda umożliwiająca jej weryfikację nazywa się testem statystycznym. Test statystyczny daje jeden z dwóch wyników:
nakazuje odrzucenie hipotezy zerowej,
nie daje podstaw do odrzucenia H0, co nie jest równoznaczne z jej przyjęciem.
Gdy odrzucamy hipotezę zerową, powinniśmy przyjąć jakąś inną. Hipotezę przyjmowaną w wyniku odrzucenia H0 nazywamy hipotezą alternatywną. Przypuśćmy, że interesuje nas populacja krów i na podstawie jakichś informacji spodziewamy się, że średnia wydajność mleka w tej populacji jest równa µ0 = 5200 kg mleka. Gdybyśmy chcieli na podstawie jakieś próby sprawdzić czy rzeczywiście wartość średnia populacji jest równa 5200, przyjęlibyśmy hipotezę zerową H0: µ = 5200. Moglibyśmy sformułować wiele hipotez alternatywnych (np. HA: µ = 5384 kg mleka), jednak sens mają tylko trzy:
H1: µ < 5200
H2: µ > 5200
H3: µ ≠ 5200.
Hipoteza typu µ < µ0 lub µ > µ0 nazywa się hipotezą jednostronną, a test związany z jej weryfikacją – testem jednostronnym. Analogicznie, testem dwustronnym nazywa się test użyty do weryfikowania hipotezy dwustronnej, tzn. hipotezy postaci: µ ≠µ0. Może się zdarzyć, że formułując hipotezę jednostronną, test statystyczny da podstawy do jej przyjęcia (bo odrzucona zostanie hipoteza zerowa), natomiast nie będzie można przyjąć hipotezy alternatywnej w przypadku hipotezy dwustronnej. Dlatego przed przystąpieniem do testowania muszą być sformułowane obie hipotezy: zerowa i alternatywna.
Przystępując do testowania hipotezy zerowej zakładamy, że jest ona prawdziwa. Na tej podstawie definiujemy statystykę, której obliczona w próbie wartość użyta zostanie jako kryterium weryfikujące hipotezę. Oznaczmy tę statystykę przez T i załóżmy dla uproszczenia, że zostanie ona użyta do weryfikowania hipotezy postaci H0: d=d0 przy jednostronnej hipotezie alternatywnej HA: d>d0. Niech t oznacza wartość statystyki T uzyskaną w próbie. Znając rozkład statystyki (jest ona zmienną losową), można określić prawdopodobieństwo, że T przyjmie wartość z określonego przedziału; oznaczmy to prawdopodobieństwo przez 1 – α :
P(t1 < t < t2) = 1 – α .
Umówmy się, że jeżeli będzie to wartość z przedziału (t1, t2), to nie zaprzecza to prawdziwości hipotezy zerowej (co nie jest równoznaczne z uznaniem jej prawdziwości). Wartości t1, t2 można tak dobrać, żeby wartość prawdopodobieństwa 1 – α była duża. Wtedy uzyskanie wartości statystyki spoza wymienionego przedziału będzie mało prawdopdodobne (prawdopodobieństwo α ) i jeśli to nastąpi, może to świadczyć o fałszywości hipotezy zerowej. Zbiór wartości statystyki uprawniających do odrzucenia hipotezy zerowej nazywa się obszarem krytycznym, a wartości t1 i t2 wydzielające ten obszar nazywają się wartościami krytycznymi. Prawdopodobieństwo α wyznaczające obszar krytyczny nazywa się poziomem istotności testu Powyższe rozważania ilustrują poniższe rysunki, przedstawiające rozkład statystyki T.
Typy obszarów krytycznych (rozkład statystyki T)– zakreskowany obszar krytyczny odpowiada poziomowi istotności W przypadku testu dwustronnego obszar krytyczny składa się z 2 części zlokalizowanych u obu końców rozkładu, przy czym wielkości tych części, mierzone prawdopodobieństwem przyjęcia przez statystykę wartości z tego przedziału, są jednakowe: α /2. Gdy rozkład statystyki jest symetryczny o wartości średniej 0 (np. jest to standaryzowany rozkład normalny lub Studenta), wtedy wartości krytyczne określające oba podobszary różnią się tylko znakiem, tzn. t2 = tαoraz t1 = –tα. Ustalając wartości krytyczne, należy uwzględniać czy odnoszą się one do testu jednostronnego, czy dwustronnego. |
|
---|---|
α. |
Wnioskowanie statystyczne obejmuje następujące czynności:
Sformułowanie hipotezy zerowej i hipotezy alternatywnej.
Ustalenie poziomu istotności α.
Wybór statystyki do weryfikacji hipotezy H0 i ustalenie obszaru krytycznego (wartości krytycznych).
Obliczenie wartości statystyki w próbie.
Sformułowanie wniosków (weryfikacja hipotezy H0) przez porównanie wartości obliczonej statystyki z wartościami krytycznymi; będzie to jeden z dwóch wniosków:
– odrzuca się hipotezę zerową i za prawdziwą uznaje się hipotezę alternatywną,
– nie ma podstaw do odrzucenia H0 (co nie oznacza jej przyjęcia).
Błędy związane z weryfikowaniem hipotez statystycznych
Test statystyczny opiera się na założeniu, że gdy prawdziwa jest hipoteza zerowa, mało prawdopodobne jest uzyskanie w próbie wartości statystyki z obszaru krytycznego, co nie oznacza, że nie jest w ogóle niemożliwe. Przyjmijmy, że poziom istotności α = 0,05 i wyobraźmy sobie, że z populacji pobrano bardzo dużo prób tej samej wielkości. Nawet jeżeli hipoteza H0 jest prawdziwa, w 5% wszystkich prób uzyskamy wartość statystyki z obszaru krytycznego. Wśród tych 5% prób może znaleźć się ta jedna realna próba, którą dysponujemy i gdyby na jej podstawie testować hipotezę H0, należałoby ją – mimo prawdziwości – odrzucić. Popełniony zostałby błąd pierwszego rodzaju, polegający na odrzuceniu hipotezy prawdziwej. Prawdopodobieństwo popełnienia takiego błędu wyznacza poziom istotności testu, α . Przyjmując niższe wartości α , zmniejszamy ryzyko popełnienia błędu pierwszego rodzaju.
Gdybyśmy nie odrzuconą hipotezę zerową uznali za prawdziwą, moglibyśmy popełnić błąd drugiego rodzaju, polegający na przyjęciu hipotezy fałszywej. Prawdopodobieństwa popełnienia błędów pierwszego (α ) i drugiego (β ) rodzaju oraz liczebności próby (n) są wielkościami zależnymi. Jeżeli liczebność próby się nie zmienia, to zmniejszając wartość α zwiększamy prawdopodobieństwo β , chcąc natomiast przy danym poziomie istotności α zmniejszyć prawdopodobieństwo popełnienia błędu drugiego rodzaju, należałoby zwiększyć liczebność próby. Z tego powodu stwierdziliśmy wcześniej, że nieodrzucenie H0 nie może oznaczać jej automatycznego przyjęcia.
Hipotezę H0 można by przyjąć tylko wtedy, gdy liczebność próby jest wystarczająco (bardzo) duża; niestety, błąd drugiego rodzaju nie może być kontrolowany tak jak błąd pierwszego rodzaju – przez wyznaczenie obszaru krytycznego. Z tego powodu w miarę możliwości należy starać się tak formułować hipotezy, aby hipoteza, którą w wyniku testowania chcielibyśmy przyjąć, była hipotezą alternatywną. Jeżeli na przykład x1 i x2 są średnimi arytmetycznymi obserwacji z dwóch prób i chcemy wykazać, że próby pochodzą z populacji o różnych wartościach średnich µ1 i µ2, sformułujemy hipotezę H0: µ1 = µ 2 oraz hipotezę alternatywną HA: µ1≠ µ2.(i użyjemy testu dwustronnego) lub gdybyśmy przypuszczali, że wartość średnia µ1 jest mniejsza od µ 2 – HA: µ1 < µ2 (teraz zastosujemy test jednostronny).