hipotezy statystyczne i ich weryfikacja, statystyka


1. HIPOTEZA STATYSTYCZNA. DEFINICJA, PRZYKŁADY METODY WERYFIKACJI.

Hipoteza statystyczna - każde przypuszczenie dotyczące rozkładu lub charakterystyk rozkład określonej zmiennej losowej, o prawdziwości lub fałszywości którego wnioskuje się na podstawie pobranej próbki.

Rodzaje hipotez statystycznych:

  1. parametryczna - hipoteza, która dotyczy wyłącznie wartości parametru określonej klasy rozkładów

  2. nieparametryczna - każda hipoteza, która nie jest parametryczna

  3. prosta - jeżeli hipoteza parametryczna precyzuje dokładne wartości wszystkich nieznanych parametrów rozkładu badanej cechy

  4. złożona - hipoteza, która nie jest prostą

2. TEST STATYSTYCZNY. POJĘCIE, ZASTOSOWANIE, RODZAJE

Test statystyczny - reguła postępowania, za pomocą której, na podstawie wyników próby losowej, decydujemy o przyjęciu lub odrzuceniu sprawdzanej hipotezy

Rodzaje testów statystycznych:

  1. testy parametryczne - służą do weryfikacji hipotez parametrycznych

  2. testy nieparametryczne - służą do weryfikacji hipotez nieparametrycznych

    1. testy niezależności - służą do weryfikacji skojarzeń cech

    2. testy zgodności - mają na celu ustalenie typu rozkładu rozważanej zmiennej losowej

  3. testy istotności - pozwalają na odrzucenie hipotezy sprawdzanej z małym ryzykiem popełnienia błędu I rodzaju lub stwierdzenia, że brak jest podstaw do jej odrzucenia.

3. WERYFIKACJA HIPOTEZ STATYSTYCZNYCH. RODZAJE POPEŁNIANYCH BŁĘDÓW. METODY MINIMALIZACJI PRAWDOPODOBIEŃSTWA POPEŁNIENIA BŁĘDU.

Sprawdzając hipotezę statystyczną, można popełnić dwojakiego rodzaju błędy. Odrzucenie hipotezy zerowej gdy jest ona prawdziwa, nosi nazwę błędu pierwszego rodzaju, a przyjęcie hipotezy zerowej gdy jest ona fałszywa - błędu drugiego rodzaju. Prawdopodobieństwo popełnienia błędu pierwszego rodzaju jest oznaczone przez α, zaś prawdopodobieństwo popełnienia błędu drugiego rodzaju oznacza się przez β.

Udowodniono, że przy danej próbie n-elementowej zmniejszenie prawdopodobieństwa α popełnienia błędu I rodzaju powoduje wzrost prawdopodobieństwa β popełnienia błędu II rodzaju i odwrotnie. Aby rozwiązać ten problem, można najpierw zmniejszać α, aby następnie - przez zwiększenie liczebności próby n - obniżyć również prawdopodobieństwo β do wymaganego poziomu i w ten sposób zwiększyć moc testu.

4. SCHEMAT POSTEPOWANIA PRZY WERYFIKACJI HIPOTEZ STATYSTYCZNYCH PRZY POMOCY TESTÓW ISTOTNOŚCI

W testach istotności nie oblicza się błędu drugiego rodzaju. Przy założeniu prawdziwości weryfikowanej hipotezy budujemy zbiór krytyczny w ten sposób, aby zagwarantować małe prawdopodobieństwo zaobserwowania wartości statystyki testowej należącej do tego zbioru, równe z góry obranemu poziomowi istotności α. Jeżeli zatem wartość statystyki testowej wpadnie do wyznaczonego uprzednio obszaru krytycznego, to można twierdzić, że zaszło zdarzenie o małym prawdopodobieństwie i wówczas weryfikowaną hipotezę należy odrzucić. Jeżeli jednak wartość statystyki testowej nie znajdzie się w obszarze krytycznym, a prawdopodobieństwo takiego zdarzenia jest większe niż α, to można jedynie twierdzić, że nie ma podstaw do odrzucenia weryfikowanej hipotezy.

Schemat postępowania:

  1. sformułowanie hipotezy zerowej i hipotezy alternatywnej

  2. ustalenie poziomu istotności α

  3. wybór odpowiedniej statystyki testowej związanej z hipotezą zerową

  4. określenie obszaru krytycznego

  5. obliczenie wartości wybranej statystyki testowej na podstawie wyników uzyskanych z próby

  6. podjęcie decyzji weryfikującej

5. TESTY ISTOTNOŚCI DLA DWÓCH ŚREDNICH. WARUNKI STOSOWANIA, SPRAWDZIANY

MODEL I

Założenia:

Losujemy dwie próby niezależne: X1 ~ N(μ11) oraz X2 ~ N(μ22)

σ12 - znane

H0: μ1=μ2

H1: μ10x01 graphic
μ2

poziom istotności α

n1 n2

Sprawdzianem Hipotezy zerowej są średnie arytmetyczne 0x01 graphic
, ale wiemy, że zmienna która jest różnicą tych zmiennych: 0x01 graphic
~ 0x01 graphic
. Jeśli hipoteza H0 jest prawdziwa, to 0x01 graphic
~ 0x01 graphic
, natomiast standaryzowana statystyka postaci 0x01 graphic
ma standaryzowany rozkład normalny N(0;1).Obszar krytyczny jest określony nierównością 0x01 graphic

MODEL II

Założenia:

Losujemy dwie próby niezależne: X1 ~ N(μ11) oraz X2 ~ N(μ22)

σ12 - nieznane, ale wiemy, że σ12

H0: μ1=μ2

H1: μ10x01 graphic
μ2

poziom istotności α

n1 n2

Do weryfikacji hipotezy zerowej wykorzystujemy test t oparty na statystyce 0x01 graphic
, która przy założeniu prawdziwości hipotezy zerowej ma rozkład t-Studenta o (n1+n2-2) stopniach swobody, gdzie S12 i S22 są wariancjami z prób. Obszar krytyczny jest określony nierównością 0x01 graphic

MODEL III

Założenia:

Losujemy dwie próby niezależne: X1 ~ N(μ11) oraz X2 ~ N(μ22)

σ12 - nieznane i nie wiemy czy σ12

H0: μ1=μ2

H1: μ10x01 graphic
μ2

poziom istotności α

n1 n2

  1. Musimy zweryfikować odpowiednią hipotezę o równości dwóch wariancji. W obu testach poziom istotności musi być taki sam.

  2. 2.wykonujemy procedure z modelu 2 jeśli nie podstaw do odrzucenia hipotezy

H0: σ1222

MODEL IV

Założenia:

Losujemy dwie próby niezależne: X1 ~ N(μ11) oraz X2 ~ N(μ22)

σ12 - nieznane

H0: μ1=μ2

H1: μ10x01 graphic
μ2

poziom istotności α

n1 n2 - duże

Sprawdzianem Hipotezy zerowej są średnie arytmetyczne 0x01 graphic
, ale wiemy, że zmienna która jest różnicą tych zmiennych: 0x01 graphic
~ 0x01 graphic
, gdzie S12 i S22 są wariancjami z prób. Jeśli hipoteza H0 jest prawdziwa, to 0x01 graphic
~

0x01 graphic
, natomiast standaryzowana statystyka postaci 0x01 graphic
ma asymptotyczny rozkład normalny N(0;1).Obszar krytyczny jest określony nierównością 0x01 graphic

6. TEST ISTOTNOŚCI DLA DWÓCH FRAKCJI. WARUNKI STOSOWANIA, SPRAWDZIAN

MODEL

Założenia:

Losujemy dwie próby niezależne: X1 oraz X2 o rozkładach dwupunktowych

Z obu prób obliczamy m1 i m2 elementów z cechą wyróżnioną w tych próbach

p1,p2 - nieznane

H0: p1=p2

H1: p10x01 graphic
p2

poziom istotności α

n1 n2 - duże

Korzystam z twierdzenia, że w próbie rozkład różnicy miedzy wskaźnikami struktury 0x01 graphic
można dobrze zaproksymować za pomocą rozkładu normalnego postaci 0x01 graphic
. Jeśli prawdziwa jest hipoteza zerowa to statystyka 0x01 graphic
~ 0x01 graphic
. Za ocenę p w obu populacjach przyjmuje się wskaźnik struktury z połączonych prób 0x01 graphic
. Sprawdzianem hipotezy zerowej jest

statystyka postaci 0x01 graphic
. Obszar krytyczny jest określony nierównością

0x01 graphic

7. ZWIĄZEK MIĘDZY WSPÓŁCZYNNIKIEM UFNOŚCI, A ROZPIĘTOŚCIĄ PRZEDZIAŁU UFNOŚCI

Ponieważ wraz ze wzrostem liczebności próby otrzymuje się na ogół - przy ustalonym poziomie ufności 1-α - przedziały o coraz mniejszej długości, to można stwierdzić, że wraz ze wzrostem współczynnika ufności rośnie rozpiętość przedziału ufności, a tym samym maleje precyzja oszacowania.

8. POZIOM ISTOTNOŚCI, HIPOTEZA ALTERNATYWNA, OBSZAR KRYTYCZNY. DEFINICJE, ZWIĄZKI MIĘDZY TYMI WIELKOŚCIAMI.

Hipoteza alternatywna - hipoteza przeciwna do hipotezy zerowej

Poziom istotności - prawdopodobieństwo popełnienia błędu I rodzaju, czyli odrzucenia hipotezy zerowej gdy jest ona prawdziwa. Im mniejszy przyjmie się poziom istotności α, tym

trudniej jest hipotezę zerową odrzucić. Odrzucenie hipotezy zerowej na poziomie istotności α=0,01 oznacza, że ryzyko popełnienia błędu pierwszego rodzaju przy tej decyzji wynosi 1%.

Obszar krytyczny testu - taki zbiór możliwych wartości wybranej statystyki Zn, że zaobserwowanie w próbie losowej wartości statystyki należącej do tego zbioru będzie powodować odrzucenie sprawdzanej hipotezy zerowej.

W zależności od sformułowanej hipotezy alternatywnej wyróżnia się trzy rodzaje obszarów krytycznych:

  1. dwustronny

  2. prawostronny

  3. lewostronny

Rozkład sprawdzianu hipotezy określa, z jakich tablic należy odczytać wartość krytyczną Zα, wyznaczającą zbiór krytyczny.

9. TEST NIEZALEŻNOŚCI χ2

Test niezależności χ2 wykorzystuje się do oceny niezależności stochastycznej dwóch cech jakościowych, dwóch cech ilościowych lub cechy jakościowej i ilościowej

Uwagi:

  1. dobre ułożenie zapisu - uporządkowanie rosnąco lub malejąco

  2. liczebność duża 0x01 graphic

  3. mały poziom istotności

  4. wymaga się by liczebności oczekiwane były nie mniejsze od 5 dla każdego i, j. Ze względu na ten warunek zmniejsza się czasem liczba stopni swobody statystyki testowej, a tym samym zmniejsza się szansa odrzucenia hipotezy zerowej.

  5. jeżeli dysponujemy danymi w postaci %, to należy je przekształcić w liczebności

0x01 graphic

0x01 graphic

Sprawdzianem hipotezy zerowej jest statystyka: 0x01 graphic
, która przy założeniu prawdziwości hipotezy zerowej o niezależności badanych cech, ma asymptotyczny rozkład chi-kwadrat z (r-1)(k-1) stopniami swobody. Obszar krytyczny jest prawostronny i wyznacza się go z warunku 0x01 graphic

10. TEST ZGODNOŚCI χ2

Test zgodności χ2 pozwala na sprawdzenie hipotezy, że populacja generalna ma określony typ rozkładu.

  1. pobieramy próbkę losową o dużej liczebności 0x01 graphic
    .

  2. uzyskane z obserwacji dane przedstawiamy w postaci:

    1. szeregu rozdzielczego punktowego lub przedziałowego o k wartościach xi zmiennej X w przypadku zmiennej skokowej

    2. szeregu rozdzielczego-klasowego o k klasach o środkach 0x01 graphic
      dla zmiennej ciągłej.

  3. formułujemy hipotezy: 0x01 graphic

0x01 graphic

  1. z teoretycznego rozkładu określonego typu obliczamy, dla każdego z możliwych wariantów cechy (klas), prawdopodobieństwa pi, ze zmienna losowa X o określonym rozkładzie przyjmie wartości należące do wariantu cechy X o numerze i.

  2. mnożymy te prawdopodobieństwa przez wielkość próby otrzymując liczebności teoretyczne.

  3. obliczamy wartość statystyki testowej: 0x01 graphic

  4. obszar krytyczny jest prawostronny i buduje się go na podstawie0x01 graphic
    , gdzie 0x01 graphic
    odczytujemy z tablic rozkładu chi-kwadrat o (k-l-1) stopniach swobody, gdzie l jest liczbą parametrów rozkładu teoretycznego.

11. TEST SHAPIRO-WILKA

Test Shapiro-Wilka służy tylko i wyłącznie do sprawdzania hipotezy, że próba pochodzi ze zbiorowości o rozkładzie normalnym. Obszar odrzucenia jest lewostronny. Liczebność próby musi być duża 0x01 graphic
. W praktyce stosuje się go gdy:

  1. wyraźnie jest powiedziane że dana próba pochodzi ze zbiorowości o rozkładzie normalnym

  2. celem głównym jest weryfikacja hipotezy o średniej, ale wówczas statystyka testowa będzie miała rozkład t-Studenta, jeśli:

Statystyka testowa 0x01 graphic
służy do sformułowania jednego z wniosków:

        1. jeżeli Wobl wpadnie do obszaru krytycznego to odrzucamy hipotezę zerową

        2. jeżeli Wobl >Wα to nie ma podstaw do odrzucenia hipotezy zerowej

Schemat postępowania:

1.sformułowanie hipotez statystycznych:

          1. 0x01 graphic

          2. 0x01 graphic
            gdzie 0x01 graphic
            - dystrybuanta rozkładu normalnego

2.obliczam wartość statystyki testowej Wobl

12. TESTY SERII

Testy serii stosujemy do:

  1. sprawdzenia, że próba jest losowa. Obszar odrzucenia jest dwustronny 0x01 graphic
    .

  2. dwie próby pochodzą z tej samej populacji (rozkłady są jednakowe). Obszar odrzucenia jest lewostronny.

MODEL I

Schemat postępowania:

  1. sformułowanie hipotez statystycznych:

    1. H0: F(x1) = F(x2)

    2. H1: F(x1)0x01 graphic
      F(x2)

  2. losujemy małą n-elementową próbę.

  3. wyznaczamy medianę.

  4. zaobserwowane wartości xi∈X1 oznaczamy jako A, zaś wartości xi∈X2 oznaczamy jako B

  5. otrzymuję ciąg elementów a i b

  6. obliczam ogólną liczbę serii k (im mniejsza jest liczba k w stosunku do liczby obserwacji n, tym większe jest prawdopodobieństwo nielosowości próby)

  7. przy założeniu prawdziwości hipotezy zerowej liczba k ma znany i stablicowany rozkład zależny tylko od liczebności elementów a i b.

  8. obszar krytyczny jest lewostronny 0x01 graphic

MODEL II

Schemat postępowania:

  1. sformułowanie hipotez statystycznych:

    1. H0: próba jest losowa

    2. H1; próba nie jest losowa

  2. losujemy małą n-elementową próbę.

  3. wyznaczamy medianę.

  4. zaobserwowane wartości xi>Me oznaczamy jako A, zaś wartości xi<Me oznaczamy jako B

  5. otrzymuję ciąg elementów a i b

  6. obliczam ogólną liczbę serii k (im mniejsza jest liczba k w stosunku do liczby obserwacji n, tym większe jest prawdopodobieństwo nielosowości próby)

  7. przy założeniu prawdziwości hipotezy zerowej liczba k ma znany i stablicowany rozkład zależny tylko od liczebności elementów a i b.

  8. obszar krytyczny jest dwustronny 0x01 graphic

13. WERYFIKACJA HIPOTEZY O WARTOŚCI OCZEKIWANEJ W POPULACJI

MODEL I

Założenia:

Losujemy niezależnie: X ~ N(μ,σ)

σ - znane

H0: μ=μ0

H1: μ0x01 graphic
μ0

poziom istotności α

liczebność n

Sprawdzianem Hipotezy zerowej jest statystyka testowa postaci 0x01 graphic
, która przy założeniu prawdziwości hipotezy zerowej ma standaryzowany rozkład normalny N(0;1).Obszar krytyczny jest określony:

0x01 graphic
, czyli dla obszaru jednostronnego 0x01 graphic
, zaś dla obszaru odrzucenia dwustronnego 0x01 graphic

MODEL II

Założenia:

Losujemy niezależnie: X ~ N(μ,σ)

σ - nieznane

H0: μ=μ0

H1: μ0x01 graphic
μ0

poziom istotności α

liczebność n <30

Statystyka testowa jest postaci 0x01 graphic
i przy założeniu prawdziwości hipotezy zerowej ma rozkład t-Studenta o (n-1) stopniach swobody.

Obszar krytyczny jest określony:

0x01 graphic

MODEL III

Założenia:

Losujemy niezależnie: X (nie ma podstaw do przyjęcia, że populacja ma rozkład normalny)

σ - nieznane

H0: μ=μ0

H1: μ0x01 graphic
μ0

poziom istotności α

liczebność n >30

Sprawdzianem Hipotezy zerowej jest statystyka testowa postaci 0x01 graphic
, która przy założeniu prawdziwości hipotezy zerowej ma standaryzowany rozkład normalny N(0;1).Obszar krytyczny jest określony:

0x01 graphic
, czyli dla obszaru jednostronnego 0x01 graphic
, zaś dla obszaru odrzucenia dwustronnego 0x01 graphic

14. WERYFIKACJA HIPOTEZY O WSKAŹNIKU STRUKTURY

Założenia:

Losujemy niezależnie: X ~ rozkład dwupunktowy

H0: p=p0

H1: p0x01 graphic
p0

poziom istotności α

liczebność n >100

  1. Wyznaczamy wskaźnik struktury z próby 0x01 graphic
    , gdzie k - liczba elementów wyróżnionych w próbie

  2. obliczamy wartość statystyki testowej 0x01 graphic
    gdzie 0x01 graphic
    , która przy założeniu prawdziwości hipotezy zerowej ma rozkład N(0;1)

15. WERYFIKACJA HIPOTEZY O RÓWNOŚCI WARIANCJI

Założenia:

Losujemy dwie próby niezależne: X1 ~ N(μ11) oraz X2 ~ N(μ22)

σ12 - nieznane

poziom istotności α

n1 n2

Hipotezy:

0x01 graphic

Statystyka testowa ma postać 0x01 graphic
i ma ona przy założeniu prawdziwości hipotezy zerowej rozkład F Snedecora o (n1-1) i (n2-1) stopniach swobody. Obszar odrzucenia jest prawostronny.

Hipotezy statystyczne i ich weryfikacja testy statystyczne

- 4 -



Wyszukiwarka

Podobne podstrony:
Weryfikacja hipotez statystycznych
w7i8, Weryfikacja hipotez statystycznych
Testowanie, WERYFIKACJA HIPOTEZ STATYSTYCZNYCH
5 Weryfikacja hipotez statystycznych z wykorzystaniem testˇw parametrycznych
Ćwiczenia 7 weryfikacja hipotez statystycznych
3 zadania, zadania weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych 2, SQL, Statystyka matematyczna
w5 weryfikacja hipotez statystycznych
weryfikacja hipotez statystycznych - wzory (1 str), Weryfikacja hipotez statystycznych
WERYFIKACJA HIPOTEZ STATYSTYCZNYCH
WERYFIKACJA HIPOTEZ STATYSTYCZNYCH
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych
06 Testowanie hipotez statystycznychid 6412 ppt
Ogólne zasady testowania hipotez statystycznych
HIPOTEZY STATYSTYCZNE

więcej podobnych podstron