Wykład 1
13.10
Po co są testy statystyczne?
Co to odchylenie?
Co to wariancja?
Jakie błędy możemy zrobić?
Odrzucamy hipotezę, która okazała się prawdziwa – błąd I rodzaju
Zaakceptowanie hipotezy błędnej – błąd II rodzaju
Testy parametryczne – bada parametry: średnia, odchylenie standardowe, wariancja, procent
Testy nieparametryczne – np. rozkład normalny
TEST DLA WARTOŚCI ŚREDNIEJ
MODEL
Założenia:
populacja ma rozkład normalny
odchylenie standardowe w całej populacji jest znane
parametry N (m, σ)
mediana – środek
im mniejsza wartość σ tym bardziej wysmukły
N(m, 5) – rozkład normalny o odchyleniu standardowym = 5 w całej populacji
Określenie hipotezy
H0: m = m0 H1: m < m0 |
H0: m = m0 H1: m ≠ m0 |
H0: m = m0 H1: m > m0 |
---|
Wartość pewnej statystyki
$$u = \frac{x_{sr} - m_{0}}{\sigma}*\sqrt{n}$$
σ- odchylenie standardowe z całej populacji
prawdopodobieństwo popełnienia błędu I rzędu – poziom istotności α
α | 1-0,5α | 1-α |
---|
Szukamy danych w tablicach rozkładu normalnego w środku i uα będzie to, co na bokach tablicy podane
u ≤ uα | |u| ≥ uα | u > uα |
---|
ZADANIE
W pewnym doświadczeniu medycznym bada się czas snu pacjentów. Zmierzono u 166 wylosowanych niezależnie pacjentów czas snu i otrzymano następujące wyniki w minutach: 435, 533, 393, 458, 525, 481, 324, 437, 348, 503, 383, 395, 416, 553, 500, 488. Przyjmując, że czas snu ma rozkład N(m, 70) sprawdzić na poziomie istotności 0,05 hipotezę, że średni czas snu pacjentów wynosi 7h.
H0: m = 420
H1: m ≠ 420
Xśr=488,25
$$u = \frac{448,25 - 420}{70}*\sqrt{16} = 1,61$$
1-0,5α =>1-0,05*0,05 = 0,975 <- tej wartości szukamy w środku tablic i odczytujemy na bokach wartość uα
uα=1,96
|u| ≥ uα
|1,61|≥ 1,96 FAŁSZ
Odp. Nie ma podstaw do odrzucenia hipotezy H0
MODEL (oparty na tablicach t-Studenta)
Założenia:
rozkład jest normalny
odchylenie standardowe w całej populacji jest nieznane
próba jest mała (do 30)
Określenie hipotezy
H0: m = m0 H1: m < m0 |
H0: m = m0 H1: m ≠ m0 |
H0: m = m0 H1: m > m0 |
---|
Wartość pewnej statystyki
$$t = \frac{x_{sr} - m_{0}}{S}*\sqrt{n - 1}$$
S- odchylenie standardowe z próby
$$s = \sqrt{\frac{\sum_{}^{}{(x - x_{sr})}^{2}}{n}}$$
n-1, 2α | n-1, α | n-1, 2α |
---|
Z tablic t-Studenta odczytujemy z zewnątrz do środka
t ≤ -tα | |t| ≥ tα | t > tα |
---|
ZADANIE
Wylosowano niezależnie 10 gospodarstw rolnych i otrzymano dla nich następujące wielkości uzyskanych plonów owsa w kwintalach z ha: 18,1, 17, 17,5 ,17,8 18,3, 16,7, 18, 15,9, 17,6 18,1. Na poziomie istotności 0,1 zweryfikować hipotezę, że średni plon owsa w tej wsi wynosi 18q z ha.
H0: m = 18
H1: m ≠ 18
$\overset{\overline{}}{x}$=17,5
xi | xi - xśr | (xi - xśr)2 |
---|---|---|
18,1 | 0,6 | 0,36 |
17 | -0,5 | 0,25 |
17,5 | 0 | 0 |
17,8 | 0,3 | 0,09 |
18,3 | 0,8 | 0,64 |
16,7 | -0,8 | 0,64 |
18 | 0,5 | 0,25 |
15,9 | 1,6 | 2,56 |
17,6 | 0,1 | 0,01 |
18,1 | 0,6 | 0,36 |
Suma: | 5,16 |
$$s = \sqrt{\frac{5,16}{10}} = 0,72$$
$$t = \frac{17,5 - 18}{0,72}*\sqrt{10 - 1} = - 2,08$$
Odczytanie z tablic:
n-1 = 9
α = 0,1
tα =1,833
|t| ≥ tα
|-2,08| ≥ 1,833 PRAWDA
Odp. Hipotezę H0 odrzucamy na korzyść hipotezy alternatywnej.
MODEL
Założenia:
odchylenie standardowe w całej populacji jest nieznane
próba jest duża
Określenie hipotezy
H0: m = m0 H1: m < m0 |
H0: m = m0 H1: m ≠ m0 |
H0: m = m0 H1: m > m0 |
---|
Wartość pewnej statystyki
$$u = \frac{x_{sr} - m_{0}}{s}*\sqrt{n}$$
s- odchylenie standardowe z próby
$$x_{sr} = \frac{\sum_{}^{}{x_{i}n_{i}}}{n}$$
$$s = \sqrt{\frac{\sum_{}^{}{{(x_{i} - x_{sr})}^{2}n_{}}}{n}}$$
Tablice rozkładu normalnego
α | 1-0,5α | 1-α |
---|
Szukamy danych w tablicach rozkładu normalnego w środku i uα będzie to, co na bokach tablicy podane
u ≤ uα | |u| ≥ uα | u > uα |
---|
TEST DLA PROCENTU
Określenie hipotezy
H0: p = p0 H1: p < p0 |
H0: p = p0 H1: p ≠ p0 |
H0: p = p0 H1: p > p0 |
---|
Wartość pewnej statystyki
$$u = \frac{\frac{m}{n} - p_{0}}{\sqrt{\frac{p_{0}*(1 - p_{0})}{n}}}$$
m- liczba wyróżnionych
n – liczebność próby
Tablice rozkładu normalnego
α | 1-0,5α | 1-α |
---|
Szukamy danych w tablicach rozkładu normalnego w środku i uα będzie to, co na bokach tablicy podane
u ≤ uα | |u| ≥ uα | u > uα |
---|
ZADANIE
W zakładzie produkcyjnym chrakteryzującym się wyjątkowo dużym nasileniem hałasu, wylosowano niezależnie 160 pracowników i okazało się, 68 pracowników ma zakłócenia słyszalności dźwięków o częstotliwości ponad 4000 drgań na sekundę. Zweryfikować, na poziomie istotności 0,05 hipotezę, że więcej niż 30% pracowników tego zakładu ma zakłócenia słuchu.
H0: p = 0,3
H1: p > 0,3
$$u = \frac{\frac{68}{160} - 0,3}{\sqrt{\frac{0,3*(1 - 0,3)}{160}}} = 3,45$$
1-α => 1 – 0,05 = 0,95 (odczyt ze środka)
uα = 1,64
u > uα
3,45 > 1,64 PRAWDA
Odp. Odrzucamy hipotezę H0 na korzyść hipotezy alternatywnej. Więcej niż 30% pracowników ma problemy ze słuchem
Wykład 2
27.10
Wariancja – miara rozrzutu, chodzi o to, by wariancja była jak najmniejsza
TEST NA ODCHYLENIE STANDARDOWE (TABLICE HI KWADRAT):
H0 : σ2 = σ02
H1 : σ2 > σ02
$$X^{2} = \frac{\text{ns}^{2}}{\sigma_{0}^{2}} = \frac{1}{\sigma_{0}^{2}}\sum_{}^{}{(x_{i}} - \overset{\overline{}}{x})^{2}$$
Tablice X2 dla α, n-1 stopnie swobody.
Obszar krytyczny: X2 ≥ X2α
Jeżeli chcemy przejść na rozkład normalny: $\mathbf{u} = \sqrt{2X^{2}} - \sqrt{2k - 1}$ <= gdy n>30
Zadanie1
Dokonano 11 niezależnych pomiarów średnicy i otrzymano następujące wyniki w mm: 50,2; 50,4; 50,6; 50,5; 49,9; 50; 50,3; 50,1; 50; 49,6; 50,6. Na poziomie istotności 0,05 zweryfikować hipotezę, że wariancja uzyskanych średnic jest 0,04.
xi |
$$\mathbf{x -}\overset{\overline{}}{\mathbf{x}}$$ |
$$\mathbf{(x -}\overset{\overline{}}{\mathbf{x}}\mathbf{)}^{\mathbf{2}}$$ |
---|---|---|
50,6 | 0,4 | 0,16 |
49,6 | -0,6 | 0,36 |
50,2 | 0 | 0 |
50,4 | 0,2 | 0,04 |
50,6 | 0,4 | 0,16 |
50,5 | 0,3 | 0,09 |
49,9 | -0,3 | 0,09 |
50 | -0,2 | 0,04 |
50,3 | 0,1 | 0,01 |
50,1 | -0,1 | 0,01 |
50 | -0,2 | 0,04 |
$$\sum_{}^{}1$$ |
H0 : σ2 = 0, 04
H1 : σ2 > 0, 04
$$\overset{\overline{}}{x} = \frac{552,2}{11} = 50,2$$
$$X^{2} = \frac{1}{0,04} \times 1 = 25$$
α=0,05
n-1=10
Xα2 = 18, 307
X2 ≥ X2α
25 ≥ 18, 307
PRAWDA, Hipotezę H0 należy odrzucić, wariancja jest większa niż 0,04.
TEST NA 2 ŚREDNIE
I model: rozkład jest normalny dla 2 populacji, odchylenie standardowe obu populacji jest znane (znane N).
H0 : m1 = m2 H0 : m1 = m2 H0 : m1 = m2
H0 : m1 > m2 H0 : m1 ≠ m2 H0 : m1 < m2
$$u = \frac{{\overset{\overline{}}{x}}_{1} - {\overset{\overline{}}{x}}_{2}}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}} + \frac{\sigma_{2}^{2}}{n_{2}}}}$$
II model: próbki małe, nieznane odchylenie standardowe, rozkład normalny
H0 : m1 = m2 H0 : m1 = m2 H0 : m1 = m2
H0 : m1 > m2 H0 : m1 ≠ m2 H0 : m1 < m2
$$t = \frac{{\overset{\overline{}}{x}}_{1} - {\overset{\overline{}}{x}}_{2}}{\sqrt{\frac{n_{1}s_{1}^{2} + n_{2}s_{2}^{2}}{n_{1} + n_{2} - 2}(\frac{1}{n_{1}} + \frac{1}{n_{2}})}}$$
III model: duże próby, odchylenie standardowe nieznane
H0 : m1 = m2 H0 : m1 = m2 H0 : m1 = m2
H0 : m1 > m2 H0 : m1 ≠ m2 H0 : m1 < m2
$$u = \frac{{\overset{\overline{}}{x}}_{1} - {\overset{\overline{}}{x}}_{2}}{\sqrt{\frac{s_{1}^{2}}{n_{1}} + \frac{s_{2}^{2}}{n_{2}}}}$$
Zadanie:
W celu sprawdzenia hipotezy, że średnie płace księgowych zatrudnionych w 2 resortach są różne wylosowano dwie próby o liczebnościach odpowiednio 500 i 400 księgowych. Otrzymano następujące wyniki w złotówkach. Na poziomie istotności α=0,01 zweryfikować hipotezę o jednakowych średnich płacach księgowych zatrudnionych w 2 resortach.
Płace | I resort | II resort | xi |
xini1 |
xini2 |
$${\mathbf{(x}_{\mathbf{i}}\mathbf{-}{\overset{\overline{}}{x}}_{1})}^{2}n_{i1}$$ |
$${\mathbf{(x}_{\mathbf{i}}\mathbf{-}{\overset{\overline{}}{x}}_{12})}^{2}n_{i2}$$ |
---|---|---|---|---|---|---|---|
1600-2000 | 10 | 20 | 1800 | 18 000 | 36 000 | 21 785 760 | 16 562 000 |
2000-2400 | 20 | 60 | 2200 | 44 000 | 132 000 | 23 155 520 | 15 606 000 |
2400-2800 | 50 | 170 | 2600 | 130 000 | 442 000 | 22 848 800 | 2 057 000 |
2800-3200 | 100 | 100 | 3000 | 300 000 | 300 000 | 7 617 600 | 8 410 000 |
3200-3600 | 200 | 40 | 3400 | 680 000 | 136 000 | 3 075 200 | 19 044 000 |
3600-4000 | 100 | 10 | 3800 | 380 000 | 38 000 | 27 457 600 | 11 881 000 |
4000-4600 | 20 | - | 4300 | 86 000 | - | 20 971 520 | |
$$\sum_{}^{}500$$ |
$$\sum_{}^{}400$$ |
$$\sum_{}^{}{1\ 638\ 000}$$ |
$$\sum_{}^{}{1\ 084\ 000}$$ |
$$\sum_{}^{}{126\ 912\ 000}$$ |
$$\sum_{}^{}{73\ 560\ 000}$$ |
H0 : m1 = m2
H0 : m1 ≠ m2
${\overset{\overline{}}{x}}_{1} = \ \frac{\sum_{}^{}{xn_{i1}}}{n_{i}} = \ $3276
${\overset{\overline{}}{x}}_{2} = \ \frac{\sum_{}^{}{xn_{i2}}}{n_{i}}$ = 2710
$$s_{1} = \frac{\sum_{}^{}{{\mathbf{(x}_{\mathbf{i}}\mathbf{-}{\overset{\overline{}}{x}}_{1})}^{2}n_{i1}}}{n_{1}} = 253\ 824$$
$$s_{2} = \frac{\sum_{}^{}{{\mathbf{(x}_{\mathbf{i}}\mathbf{-}{\overset{\overline{}}{x}}_{2})}^{2}n_{i2}}}{n_{2}} = 183\ 900$$
$$u = \frac{3276 - 2710}{\sqrt{\frac{253824}{500} + \frac{183904}{400}}} = 18,20$$
1-1/2 α = 1- ½ x 0,01=0,995
$$1 - \frac{1}{2}\alpha = 1 - \frac{1}{2} \times 0,01 = 0,995$$
uα=2,57
|u|>uα
18,2>2,57
Prawda, hipotezę H0 należy odrzucić, nie można powiedzieć, że księgowi w obu resortach średnio zarabiają tyle samo.
TEST NA DWA WSKAŹNIKI STRUKTURY (PROCENT)
Oparty na rozkładzie normalnym
H0 : p1 = p2 H0 : p1 = p2 H0 : p1 = p2
H0 : p1 > p2 H0 : p1 ≠ p2 H0 : p1 < p2
$$\overset{\overline{}}{p} = \frac{m_{1} + m_{2}}{n_{1} + n_{2}}$$
$$n = \frac{n_{1}n_{2}}{n_{1} + n_{2}}$$
$$u = \frac{\frac{m_{1}}{n_{1}} - \frac{m_{2}}{n_{2}}}{\sqrt{\frac{\overset{\overline{}}{p}(1 - \overset{\overline{}}{p})}{n}}}$$
n – całość próby
m – liczba elementów sprzyjających
Zadanie
Z dwóch wydziałów pewnego dużego zakładu produkcyjnego wylosowano dwie próby w celu zbadania jak hałas wpływa na ubytki słuchu pracowników. Z wydziału o małym natężeniu hałasu wylosowano 100 pracownic i po zbadaniu okazało się że 8 pracowników ma poważne ubytki słuchu. Natomiast na 120 wylosowanych pracowników wydziału o dużym natężeniu hałasu 20 pracowników ma poważne ubytki słuchu. Na poziomie istotności 0,05 zweryfikować hipotezę że hałas na wydziale zwiększa ubytki słuchu.
1 – z większym hałasem
2 – z mniejszym hałasem
n1 = 120
m1 = 20
n2 = 100
m2 = 8
$$\overset{\overline{}}{p} = \frac{20 + 8}{120 + 100} = 0,127$$
$$n = \frac{120 \times 100}{120 + 100} = 54,55$$
$$u = \frac{\frac{20}{120} - \frac{8}{100}}{\sqrt{\frac{0,127\left( 1 - 0,127 \right)}{54,55}}} = 1,92$$
1- α = 0,95
Uα = 1,64
u>uα
1,92> 1,64
Prawda, hipotezę H0 należy odrzucić, przy większym hałasie
Wykład 3
24.11