STATYSTYKA WYKŁAD wybrane testy istotnosci

STATYSTYKA WYKŁAD

~ WYBRANE STATYSTYCZNE TESTY ISTOTNOŚCI ~

Szkic wykładu

  1. Wprowadzenie

  1. Przypomnienie podstawowych pojęć z zakresu testowania hipotez

  2. Etapy testowania hipotez statystycznych

  3. Etapy testowania hipotez statystycznych

  4. Podstawowy podział hipotez statystycznych

  1. Testy dla średnich populacji

  1. Testy istotności dla jednej średniej populacji – wprowadzenie

  1. Test U dla jednej średniej czyli test dla średniej populacji w przypadku dużej Próby

  2. Fragment tablicy dystrybuanty rozkładu N(0,1)

  3. Przykłady

  4. Test Studenta dla jednej średniej czyli test dla ´średniej populacji, gdy cecha ma rozkład normalny

  5. Fragment tablicy kwantyli rozkładu Studenta

  6. Przykład

  1. Testy dla średnich w dwóch populacjach – wprowadzenie

  1. Fragment tablicy dystrybuanty rozkładu N(0,1)

  2. Przykład

  3. Test Studenta dla dwóch średnich czyli test dla średnich w dwóch populacjach, gdy cecha ma rozkład normalny

  4. Przykład

  1. Testy dla frakcji – wprowadzenie

  1. Testy dla jednej frakcji

  1. Wprowadzenie

  2. Przykład

  1. Test dla dwóch frakcji

  1. Wprowadzenie

  2. Przykład

  1. Testy dla wariacji populacji

  1. Test dla jednej wariancji – wprowadzenie

  1. Test chi-kwadrat dla wariancji

  2. Fragment tablicy kwantyli rozkładu chi-kwadrat

  3. Przykład

  1. Test normalności Shapiro-Wilka

  1. Wprowadzenie

  2. Fragment tablicy współczynników an − i + 1 Shapiro-Wilka

  3. Fragment tablicy kwantyli Wα rozkładu Shapiro-Wilka

  4. Przykład

  1. Wprowadzenie

  1. Przypomnienie podstawowych pojęć z zakresu testowania hipotez

Teoria weryfikacji hipotez zajmuje się metodami testowania dowolnego przypuszczenia dotyczącego nieznanego rozkładu lub nieznanych parametrów rozkładu badanej cechy w populacji.

  1. Etapy testowania hipotez statystycznych

  1. Formułujemy parę˛ wykluczających się˛ hipotez H0, H1 dotyczących interesującej nas populacji.

  2. Ustalamy dopuszczalny poziom istotności α.

  3. Projektujemy i przeprowadzamy eksperyment (losujemy próbę) i obliczamy statystykę testu.

  4. Wyznaczamy obszar odrzucenia testu, przy założeniu, że prawdziwa jest hipoteza zerowa H0.

  5. Jeśli wartość statystyki testu znajdzie się w obszarze odrzucenia, wówczas odrzucamy hipotezę H0 na rzecz H1. W przeciwnym przypadku stwierdzamy, że nie ma podstaw do odrzucenia H0.

  1. Rodzaje błędów przy testowaniu hipotez

  1. Podstawowy podział hipotez statystycznych

Hipotezy statystyczne dzielimy na:

  1. Testy dla średnich populacji

  1. Testy istotności dla jednej średniej populacji – wprowadzenie


1. Ho:             μ=  μ 0  H1:         μ>  μ0


2. Ho:             μ=  μ 0  H1:         μ<  μ0


3. H0:             μ=  μ 0  H1:         μ  μ0

gdzie μ0 oznacza domniemana˛ wartość´ parametru μ.

  1. Test U dla jednej średniej czyli test dla średniej populacji w przypadku dużej

próby


$$\mathbf{U = \ }\frac{\overset{\overline{}}{\mathbf{X}}\mathbf{- \ }\mathbf{\mu}_{\mathbf{0}}}{\mathbf{S}}\sqrt{\mathbf{n}}$$

gdzie $\overset{\overline{}}{\mathbf{X}}$ i S oznaczają˛ odpowiednio średnia˛ arytmetyczna˛ i odchylenie standardowe z próby.

  1. W przypadku hipotezy alternatywnej H1 :   μ >  μ0 konstruujemy prawostronny obszar odrzucenia. Jest nim przedział liczbowy [u ,  ∞), gdzie u oznacza kwantyl rzędu 1 – α rozkładu N(0,1).

  1. W przypadku hipotezy alternatywnej H1:  μ<  μ0konstruujemy lewostronny obszar odrzucenia, tj. przedział liczbowy  (−∞ , - u], gdzie u], jest kwantylem rzędu 1 – α rozkładu N(0,1).

  1. W przypadku hipotezy alternatywnej H1 :   μ ≠  μ0budujemy dwustronny obszar odrzucenia, określony jako suma przedziałów $\left( - \ \infty\ ,\ - \ U_{\frac{\propto}{2}} \right\rbrack \cup \lbrack\ U_{\frac{\propto}{2}}\ ,\ \infty)$ , gdzie $U_{\frac{\propto}{2}}\ $jest kwantylem rzędu 1 - $\frac{\alpha}{2}\ $ rozkładu N(0,1) (kwantyle odczytujemy z tablic rozkładu N(0,1) – por. następny slajd).

  1. Fragment tablicy dystrybuanty rozkładu N(0,1)

  1. Przykłady

Przykład 1.

Rozwiązanie


H0 :  |μ=| 11, 5% H1 :  μ ≠ 1, 5 %


$$u = \ \frac{10,4 - 11,5}{3,4}\sqrt{50}\ \approx \ - 2,29$$

Wniosek: Stwierdzamy tym samym, że zapewnienia firmy doradczej nie są˛ prawdziwe. Ryzyko tego, że nasz wniosek nie jest słuszny, jest małe i wynosi α (tutaj 0,05).

Przykład 2

Rozwiązanie

H0 : μ = 20 kg , H1 : μ > 20 kg:


$$u = \ \frac{22 - 20}{6}\sqrt{150}\ \approx 4,08$$

Wniosek: Stwierdzamy, że ´średnia waga bagażu podręcznego jest większa od wagi nominalnej, co wskazuje na konieczność przeprojektowania kabin. Prawdopodobieństwo tego, że niesłusznie odrzuciliśmy hipotezę˛ zerowa˛ wynosi 0,05.

Przykład 3

Rozwiązanie

H0 : μ = 200 g, H1 : μ < 200 g


$$u = \ \frac{199,5 - 200}{6}\sqrt{100}\ \approx - 0,83$$

Na poziomie istotności 0,05 nie udało si ˛e potwierdzić podejrzeń o tym, że informacja producenta dotycząca średniej wagi produktu jest nieprawdziwa.

  1. Test Studenta dla jednej średniej czyli test dla ´średniej populacji, gdy cecha ma rozkład normalny

μμ0


$$t = \ \frac{\overset{\overline{}}{X} - \ \mu_{0}}{S}\sqrt{n - 1}$$

gdzie $\overset{\overline{}}{X}$ i S – ´średnia i odchylenie standardowe z próby.

  1. Podobnie, jak poprzednio, w przypadku hipotezy alternatywnej H1 : μ > μ0 konstruujemy prawostronny obszar odrzucenia. Jest nim przedział liczbowy [tα , ), gdzie tα to kwantyl rz˛edu 1 – α rozkładu Studenta o k = n - 1 st. sw.

  1. W przypadku hipotezy alternatywnej H1 : H1 : μ < μ0 konstruujemy lewostronny obszar odrzucenia, którym jest przedział liczbowy (- , - tα], gdzie tα oznacza kwantyl rzędu 1- α rozkładu Studenta o k = n - 1 stopniach swobody.

  1. W przypadku hipotezy alternatywnej H1 : μμ0 budujemy dwustronny obszar odrzucenia, określony jako suma przedziałów $\left( - \ \infty\ , \right.\ - t_{\frac{\propto}{2}}\rbrack\ \cup \lbrack\ t_{\frac{\alpha}{2}}\ ,\ \infty\ )\text{\ gdzie\ }t_{\frac{\alpha}{2}}\text{\ \ }$to kwantyl rzędu $\ 1 - \ \frac{\propto}{2}$ rozkładu Studenta o k=n - 1 st. sw. (następny slajd).

  1. Fragment tablicy kwantyli rozkładu Studenta

  1. Przykład 4

2 mln zł.

Rozwiązanie

H0 : μ = 2 mln zł, H1 : μ > 2 mln zł:


$$t = \ \frac{2,76 - 2}{0,71}\sqrt{4}\ \approx 2,14$$

Wniosek: Stwierdzamy, że średnia wartość odszkodowań powodziowych w tej firmie jest wyższa od 2 mln zł. Ryzyko tego, że odrzuciliśmy prawdziwa˛ hipotezę˛ wynosi 0,05.

  1. Testy dla średnich w dwóch populacjach – wprowadzenie


1. Ho:             μ1= μ 2  H1:         μ1> μ2


2. Ho:             μ1= μ 2  H1:         μ1< μ2


3. H0:             μ1= μ 2  H1:         μ1 μ2

gdzie μ1,  μ2 oznaczają˛ średnie wartości cechy w dwóch badanych populacjach.


$$\left| \mathbf{U} \right|\mathbf{= \ }\frac{\overset{\overline{}}{\mathbf{X}_{\mathbf{1}}}\mathbf{- \ }\overset{\overline{}}{\mathbf{X}_{\mathbf{2}}}}{\sqrt{\frac{\mathbf{s}_{\mathbf{1}}^{\mathbf{2}}}{\mathbf{n}_{\mathbf{1}}}\mathbf{+ \ }\frac{\mathbf{s}_{\mathbf{2}}^{\mathbf{2}}}{\mathbf{n}_{\mathbf{2}}}}}$$

gdzie $\overset{\overline{}}{X_{1}},\ \ \overset{\overline{}}{X_{2}}$ oznaczają˛ średnie arytmetyczne z obu prób, natomiast s12 ,  s22 – wariancje z prób.

Zasady budowy obszaru odrzucenia testu są˛ analogiczne, jak w teście U dla jednej średniej, a więc:

  1. W przypadku hipotezy alternatywnej H1 :  μ1 >  μ2 konstruujemy prawostronny obszar odrzucenia. Jest nim przedział liczbowy [u ,  ∞), gdzie uoznacza kwantyl rzędu 1 – α rozkładu N(0,1).

  2. W przypadku hipotezy alternatywnejH1 :  μ1 <  μ2 konstruujemy lewostronny obszar odrzucenia (− ∞ ,   −  u], gdzie u oznacza kwantyl rzędu 1 – α rozkładu N(0,1).

  3. W przypadku hipotezy alternatywnej H1 :  μ1 ≠  μ2 budujemy dwustronny obszar odrzucenia definiowany jako suma przedziałów ($- \ \infty\ ,\ - \ u_{\frac{\propto}{2}}$] [$u_{\frac{\propto}{2}}\ ,\ \infty$),

gdzie $u_{\frac{\propto}{2}}\ $jest kwantylem rzędu 1 - $\frac{\propto}{2}$ rozkładu N(0,1) (następny slajd).

  1. Fragment tablicy dystrybuanty rozkładu N(0,1)

  1. Przykład 5

Rozwiązanie


$$u = \ \frac{3 - 2,5}{\sqrt{\frac{\left( 0,9 \right)^{2}}{60} + \ \frac{\left( 0,5 \right)^{2}}{100}}}\ \approx 3,95$$

  1. Test Studenta dla dwóch średnich czyli test dla średnich w dwóch populacjach, gdy cecha ma rozkład normalny


$$\mathbf{t = \ }\frac{\overset{\overline{}}{\mathbf{X}_{\mathbf{1}}}\mathbf{+ \ }\overset{\overline{}}{\mathbf{X}_{\mathbf{2}}}}{\sqrt{\frac{\mathbf{n}_{\mathbf{i}}\mathbf{\ \bullet \ }\mathbf{S}_{\mathbf{1}}^{\mathbf{2}}\mathbf{+ \ }\mathbf{n}_{\mathbf{2}}\mathbf{\ \bullet \ }\mathbf{S}_{\mathbf{2}}^{\mathbf{2}}}{\mathbf{n}_{\mathbf{1}}\mathbf{+ \ }\mathbf{n}_{\mathbf{2}}\mathbf{- 2}}\left( \frac{\mathbf{1}}{\mathbf{n}_{\mathbf{1}}}\mathbf{+ \ }\frac{\mathbf{1}}{\mathbf{n}_{\mathbf{2}}} \right)}}$$

gdzie $\overset{\overline{}}{X_{1}},\ \ \overset{\overline{}}{X_{2}}$ oznaczają˛ średnie arytmetyczne z prób, S12, S22 a – wariancje z prób.

Zasady budowy obszaru odrzucenia testu są˛ analogiczne, jak w teście Studenta dla jednej średniej, czyli:

  1. W przypadku hipotezy alternatywnej H1: μ1 > μ2konstruujemy prawostronny obszar odrzucenia: [tα , ), gdzie tα oznacza kwantyl rzędu 1 - α.

Studenta o n1+n2 -2 st. sw.

  1. W przypadku hipotezy alternatywnej H1 : μ1 < μ2 konstruujemy lewostronny obszar odrzucenia: (- , - tα], gdzie tα oznacza kwantyl rzędu 1 - α r.

Studenta o n1+n2-2 st. sw.

  1. W przypadku hipotezy alternatywnej H1 : μ1 = μ2budujemy dwustronny obszar odrzucenia: (- , - $t_{\frac{\propto}{2}}\rbrack\ \cup \lbrack\ t_{\frac{\alpha}{2}\ }\ ,\ \infty)$ gdzie $t_{\frac{\alpha}{2}\ }\ $jest kwantylem rzędu 1- $\frac{\propto}{2}\ $rozkład Studenta o n1+n2 - 2 stopniach swobody.

  1. Przykład 6. Bank chce sprawdzić, która metoda pozyskiwania pieniędzy – ze ´źródeł publicznych czy prywatnych – prowadzi do pozyskania większego funduszu. Bank pobrał losowa˛ próbę˛ 12 firm, które zaciągnęły kredyt tylko ze źródeł publicznych, stwierdzając, że przeciętna wartość kredytu w tej próbie wynosiła 60 tys. zł, przy odchyleniu standardowym 10 tys. zł. W losowej próbie 18 firm, które zaciągnęły kredyt tylko ze źródeł prywatnych, średnia wysokość kredytu wynosiła 80 tys. zł, przy odchyleniu standardowym 15 tys. zł.

Czy można sadzić, że publiczne źródła finansowania udzielają˛, przeciętnie biorąc, mniejszych kredytów, zakładając, że wysokość´ kredytów prywatnych i publicznych ma rozkład normalny o tej samej wariancji? (przyjąć α=0,01).

Rozwiązanie


$$t = \ \frac{60 - 80}{\sqrt{\frac{12\ \bullet \ 10^{2} + 18\ \bullet \ 15^{2}}{12 + 18 - 2}\left( \frac{1}{12} + \ \frac{1}{18} \right)}}\ \approx \ - 3,92$$

  1. Testy dla frakcji – wprowadzenie

p(1 - p) wariancje tej zmiennej.

  1. Testy dla jednej frakcji

  1. wprowadzenie

1. H0 : p = p0 H1 : p > p0

2. H0 : p = p0 H1 : p < p0

3. H0 : p = p0 H1 : p ≠ p0

gdzie p0 oznacza domniemana˛ wartość´ parametru p.


$$\mathbf{U = \ }\frac{\frac{\mathbf{m}}{\mathbf{n}}\mathbf{- \ }\mathbf{p}_{\mathbf{0}}}{\sqrt{\frac{\frac{\mathbf{m}}{\mathbf{n}}\left( \mathbf{1 - \ }\frac{\mathbf{m}}{\mathbf{n}} \right)}{\mathbf{n}}}}$$

  1. Przykład 7.

Rozwiązanie


$$\mathbf{u = \ }\frac{\mathbf{0,68 - 0,60}}{\sqrt{\frac{\mathbf{0,68\ \bullet \ }\left( \mathbf{1 - 0,68} \right)}{\mathbf{1000}}}}\mathbf{\ \approx 5,42}$$

  1. Test dla dwóch frakcji

  1. Wprowadzenie

a. H0 : p1 = p2 H1 : p1 > p2

b. H0 : p1 = p2 H1 : p1 < p2

c. H0 : p1 = p2 H1 : p1 ≠ p2


$$\mathbf{U = \ }\frac{\frac{\mathbf{m}_{\mathbf{1}}}{\mathbf{n}_{\mathbf{1}}}\mathbf{- \ }\frac{\mathbf{m}_{\mathbf{2}}}{\mathbf{n}_{\mathbf{2}}}}{\sqrt{\frac{\overset{\overline{}}{\mathbf{p}}\overset{\overline{}}{\mathbf{q}}}{\mathbf{n}}}}$$

gdzie m1, m2 oznaczają˛ liczby elementów wyróżnionych w obu próbach$\overset{\overline{}}{p} = \ \frac{m_{1} + \ m_{2}}{n_{1} + \ n_{2}}\ $

$\overset{\overline{}}{q} = 1 - \ \overset{\overline{}}{q}$ $\ \ \ \ \ \ \ \ \ \ n = \ \frac{n_{1}\ \bullet \ n_{2}}{n_{1} + \ n_{2}}$

  1. Przykład 8

Rozwiązanie


$$\mathbf{u = \ }\frac{\mathbf{0,80 - 0,85}}{\sqrt{\frac{\mathbf{0,80\ \bullet 0,175}}{\mathbf{50}}}}\mathbf{\ \approx \ - 0,93}$$


(     ,   1,64][ 1,64 ,  )

  1. Testy dla wariacji populacji

  1. Test dla jednej wariancji – wprowadzenie

  1. Test chi-kwadrat dla wariancji


$$\mathbf{Z = \ }\frac{\mathbf{n}\mathbf{S}^{\mathbf{2}}}{\mathbf{\sigma}_{\mathbf{0}}^{\mathbf{2}}}$$

chi-kwadrat o k =n - 1 st. swobody.

  1. Fragment tablicy kwantyli rozkładu chi-kwadrat

  1. Przykład 9

Rozwiązanie

H0 : σ2 = 0,25 (cm)2 H1 : σ2 > 0,25 (cm)2


$$\mathbf{Z = \ }\frac{\mathbf{10\ \bullet 0,3}}{\mathbf{0,25}}\mathbf{= 12}$$

  1. Test normalności Shapiro-Wilka

  1. Wprowadzenie

przeciwko hipotezie alternatywnej:


H1:       H0


$$\mathbf{W = \ }\frac{\left\lbrack \sum_{\mathbf{i = 1}}^{\left\lbrack \frac{\mathbf{n}}{\mathbf{2}} \right\rbrack}{\mathbf{a}_{\mathbf{n - i + 1}}\left( \mathbf{X}_{\mathbf{(n - i + 1)}}\mathbf{- \ }\mathbf{X}_{\mathbf{(i)}} \right)} \right\rbrack^{\mathbf{2}}}{\sum_{\mathbf{i = 1}}^{\mathbf{n}}{\mathbf{(\ }{\mathbf{X}_{\mathbf{i}}\mathbf{- \ }\overset{\overline{}}{\mathbf{X}}\mathbf{\ )}}^{\mathbf{2}}}}$$

$\left\lbrack \frac{n}{2} \right\rbrack$ część całkowita liczby $\frac{n}{2}$

X(i)  zmienna przyjmująca j-tą co do wielkości wartość w próbie (tzw. j-ta statystyka pozycyjna)

an − i + 1 – stablicowane współczynniki Shapiro-Wilka

  1. Fragment tablicy współczynników ani+1 Shapiro-Wilka

  1. Fragment tablicy kwantyli Wα rozkładu Shapiro-Wilka

  1. Przykład 10

Formułujemy hipotezę˛ zerowa˛: H0 : Wysokość´ odszkodowań powodziowych podlega rozkładowi normalnemu, przeciwko hipotezie alternatywnej H1:       H0

Rozwiązanie

Dane (odszkodowania w mln zł): 1,9; 2,0; 2,9; 3,3; 3,7.

Liczebność próby: n = 5, średnia z próby: $\overset{\overline{}}{x} = \ \frac{13,8}{5} = 2,76$

Część całkowita ilorazu $\frac{n}{2}\ :\ \left\lbrack \frac{5}{2} \right\rbrack = 2$

Tablica 1. Obliczenia pomocnicze statystyki Shapiro-Wilka

i X(i) 
X(ni+1) X(i)

an − i + 1

ani+1(X(ni+1) X(i))

$$\mathbf{(\ }{\mathbf{X}_{\mathbf{i}}\mathbf{- \ }\overset{\overline{}}{\mathbf{X}}\mathbf{\ )}}^{\mathbf{2}}$$

1

2

3

4

5

1,9

2,0

2,9

3,3

3,7

1,8

1,3

0,6646

0,2413

0,19628

0,31369

0,7396

0,5776

0,0196

0,2916

0,8836

Suma 13,8 x x 1,50997 2,5120

Wartość statystyki: $W = \ \frac{{(\ 1,50997)}^{2}}{2,5120}\ \approx 0,91$ nie wpada do obszaru odrzucenia [0 , 0,762], a więc nie ma podstaw do odrzucenia hipotezy zerowej.


Wyszukiwarka

Podobne podstrony:
STATYSTYKA WYKŁAD wybrane rozkłady zmiennych lsoowych
Metodologia z elelmentami statystyki dr Grzegorz Sędek wykład 11 Testy T Studenta cd
Nazwiska z wykładów [wybrane konwencje teatru światowego], KULTUROZNAWSTWO, Semestr 3 i 4
statystyka wykład
testy?rma wyklady WSZYSTKIE testy zebrane
Wyklad IV, Testy
statystyka wyklady, Szkoła WSTiH
Statystyka wykład 1
Testy istotności różnic dla prób niezależnych
Finanse przedsiębiorstw wykłady (prezentacje + testy) FP testy
statystyka wyklad III
Statystyka - egzamin - ściąga - Kuszewski, Statystyka - wykłady - T.Kuszewski
statystyka- wyklady, Ekonomia, 1ROK, statystyka
statystyka -wykłady II sem, statystyka

więcej podobnych podstron