Statystyka i ekonometria w finansach i rachunkowośco

Wykład 1

13.10

Po co są testy statystyczne?

Co to odchylenie?

Co to wariancja?

Jakie błędy możemy zrobić?

  1. Odrzucamy hipotezę, która okazała się prawdziwa – błąd I rodzaju

  2. Zaakceptowanie hipotezy błędnej – błąd II rodzaju

Testy parametryczne – bada parametry: średnia, odchylenie standardowe, wariancja, procent

Testy nieparametryczne – np. rozkład normalny

TEST DLA WARTOŚCI ŚREDNIEJ

  1. MODEL

Założenia:

parametry N (m, σ)

mediana – środek

im mniejsza wartość σ tym bardziej wysmukły

N(m, 5) – rozkład normalny o odchyleniu standardowym = 5 w całej populacji

  1. Określenie hipotezy

H0: m = m0

H1: m < m0

H0: m = m0

H1: m ≠ m0

H0: m = m0

H1: m > m0

  1. Wartość pewnej statystyki


$$u = \frac{x_{sr} - m_{0}}{\sigma}*\sqrt{n}$$

σ- odchylenie standardowe z całej populacji

  1. prawdopodobieństwo popełnienia błędu I rzędu – poziom istotności α

α 1-0,5α 1-α
  1. Szukamy danych w tablicach rozkładu normalnego w środku i uα będzie to, co na bokach tablicy podane

u ≤ uα |u| ≥ uα u > uα

ZADANIE

W pewnym doświadczeniu medycznym bada się czas snu pacjentów. Zmierzono u 166 wylosowanych niezależnie pacjentów czas snu i otrzymano następujące wyniki w minutach: 435, 533, 393, 458, 525, 481, 324, 437, 348, 503, 383, 395, 416, 553, 500, 488. Przyjmując, że czas snu ma rozkład N(m, 70) sprawdzić na poziomie istotności 0,05 hipotezę, że średni czas snu pacjentów wynosi 7h.

H0: m = 420

H1: m ≠ 420

Xśr=488,25


$$u = \frac{448,25 - 420}{70}*\sqrt{16} = 1,61$$

1-0,5α =>1-0,05*0,05 = 0,975 <- tej wartości szukamy w środku tablic i odczytujemy na bokach wartość uα

uα=1,96

|u| ≥ uα

|1,61|≥ 1,96 FAŁSZ

Odp. Nie ma podstaw do odrzucenia hipotezy H0

  1. MODEL (oparty na tablicach t-Studenta)

Założenia:

  1. Określenie hipotezy

H0: m = m0

H1: m < m0

H0: m = m0

H1: m ≠ m0

H0: m = m0

H1: m > m0

  1. Wartość pewnej statystyki


$$t = \frac{x_{sr} - m_{0}}{S}*\sqrt{n - 1}$$

S- odchylenie standardowe z próby


$$s = \sqrt{\frac{\sum_{}^{}{(x - x_{sr})}^{2}}{n}}$$

n-1, 2α n-1, α n-1, 2α
  1. Z tablic t-Studenta odczytujemy z zewnątrz do środka

t ≤ -tα |t| ≥ tα t > tα

ZADANIE

Wylosowano niezależnie 10 gospodarstw rolnych i otrzymano dla nich następujące wielkości uzyskanych plonów owsa w kwintalach z ha: 18,1, 17, 17,5 ,17,8 18,3, 16,7, 18, 15,9, 17,6 18,1. Na poziomie istotności 0,1 zweryfikować hipotezę, że średni plon owsa w tej wsi wynosi 18q z ha.

H0: m = 18

H1: m ≠ 18

$\overset{\overline{}}{x}$=17,5

xi xi - xśr (xi - xśr)2
18,1 0,6 0,36
17 -0,5 0,25
17,5 0 0
17,8 0,3 0,09
18,3 0,8 0,64
16,7 -0,8 0,64
18 0,5 0,25
15,9 1,6 2,56
17,6 0,1 0,01
18,1 0,6 0,36
Suma: 5,16


$$s = \sqrt{\frac{5,16}{10}} = 0,72$$


$$t = \frac{17,5 - 18}{0,72}*\sqrt{10 - 1} = - 2,08$$

Odczytanie z tablic:

n-1 = 9

α = 0,1

tα =1,833

|t| ≥ tα

|-2,08| ≥ 1,833 PRAWDA

Odp. Hipotezę H0 odrzucamy na korzyść hipotezy alternatywnej.

  1. MODEL

Założenia:

  1. Określenie hipotezy

H0: m = m0

H1: m < m0

H0: m = m0

H1: m ≠ m0

H0: m = m0

H1: m > m0

  1. Wartość pewnej statystyki


$$u = \frac{x_{sr} - m_{0}}{s}*\sqrt{n}$$

s- odchylenie standardowe z próby


$$x_{sr} = \frac{\sum_{}^{}{x_{i}n_{i}}}{n}$$


$$s = \sqrt{\frac{\sum_{}^{}{{(x_{i} - x_{sr})}^{2}n_{}}}{n}}$$

  1. Tablice rozkładu normalnego

α 1-0,5α 1-α
  1. Szukamy danych w tablicach rozkładu normalnego w środku i uα będzie to, co na bokach tablicy podane

u ≤ uα |u| ≥ uα u > uα

TEST DLA PROCENTU

  1. Określenie hipotezy

H0: p = p0

H1: p < p0

H0: p = p0

H1: p ≠ p0

H0: p = p0

H1: p > p0

  1. Wartość pewnej statystyki


$$u = \frac{\frac{m}{n} - p_{0}}{\sqrt{\frac{p_{0}*(1 - p_{0})}{n}}}$$

m- liczba wyróżnionych

n – liczebność próby

  1. Tablice rozkładu normalnego

α 1-0,5α 1-α
  1. Szukamy danych w tablicach rozkładu normalnego w środku i uα będzie to, co na bokach tablicy podane

u ≤ uα |u| ≥ uα u > uα

ZADANIE

W zakładzie produkcyjnym chrakteryzującym się wyjątkowo dużym nasileniem hałasu, wylosowano niezależnie 160 pracowników i okazało się, 68 pracowników ma zakłócenia słyszalności dźwięków o częstotliwości ponad 4000 drgań na sekundę. Zweryfikować, na poziomie istotności 0,05 hipotezę, że więcej niż 30% pracowników tego zakładu ma zakłócenia słuchu.

H0: p = 0,3

H1: p > 0,3


$$u = \frac{\frac{68}{160} - 0,3}{\sqrt{\frac{0,3*(1 - 0,3)}{160}}} = 3,45$$

1-α => 1 – 0,05 = 0,95 (odczyt ze środka)

uα = 1,64

u > uα

3,45 > 1,64 PRAWDA

Odp. Odrzucamy hipotezę H0 na korzyść hipotezy alternatywnej. Więcej niż 30% pracowników ma problemy ze słuchem

Wykład 2

27.10

Wariancja – miara rozrzutu, chodzi o to, by wariancja była jak najmniejsza

TEST NA ODCHYLENIE STANDARDOWE (TABLICE HI KWADRAT):


H0 : σ2 = σ02


H1 : σ2 > σ02


$$X^{2} = \frac{\text{ns}^{2}}{\sigma_{0}^{2}} = \frac{1}{\sigma_{0}^{2}}\sum_{}^{}{(x_{i}} - \overset{\overline{}}{x})^{2}$$

Tablice X2 dla α, n-1 stopnie swobody.

Obszar krytyczny: X2 ≥ X2α

Jeżeli chcemy przejść na rozkład normalny: $\mathbf{u} = \sqrt{2X^{2}} - \sqrt{2k - 1}$ <= gdy n>30

Zadanie1

Dokonano 11 niezależnych pomiarów średnicy i otrzymano następujące wyniki w mm: 50,2; 50,4; 50,6; 50,5; 49,9; 50; 50,3; 50,1; 50; 49,6; 50,6. Na poziomie istotności 0,05 zweryfikować hipotezę, że wariancja uzyskanych średnic jest 0,04.


xi

$$\mathbf{x -}\overset{\overline{}}{\mathbf{x}}$$

$$\mathbf{(x -}\overset{\overline{}}{\mathbf{x}}\mathbf{)}^{\mathbf{2}}$$
50,6 0,4 0,16
49,6 -0,6 0,36
50,2 0 0
50,4 0,2 0,04
50,6 0,4 0,16
50,5 0,3 0,09
49,9 -0,3 0,09
50 -0,2 0,04
50,3 0,1 0,01
50,1 -0,1 0,01
50 -0,2 0,04

$$\sum_{}^{}1$$


H0 : σ2 = 0, 04


H1 : σ2 > 0, 04


$$\overset{\overline{}}{x} = \frac{552,2}{11} = 50,2$$


$$X^{2} = \frac{1}{0,04} \times 1 = 25$$

α=0,05

n-1=10


Xα2 = 18, 307


X2 ≥ X2α


25 ≥ 18, 307

PRAWDA, Hipotezę H0 należy odrzucić, wariancja jest większa niż 0,04.

TEST NA 2 ŚREDNIE

I model: rozkład jest normalny dla 2 populacji, odchylenie standardowe obu populacji jest znane (znane N).

H0 : m1 = m2 H0 : m1 = m2 H0 : m1 = m2

H0 : m1 > m2 H0 : m1 ≠ m2 H0 : m1 < m2


$$u = \frac{{\overset{\overline{}}{x}}_{1} - {\overset{\overline{}}{x}}_{2}}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}} + \frac{\sigma_{2}^{2}}{n_{2}}}}$$

II model: próbki małe, nieznane odchylenie standardowe, rozkład normalny

H0 : m1 = m2 H0 : m1 = m2 H0 : m1 = m2

H0 : m1 > m2 H0 : m1 ≠ m2 H0 : m1 < m2


$$t = \frac{{\overset{\overline{}}{x}}_{1} - {\overset{\overline{}}{x}}_{2}}{\sqrt{\frac{n_{1}s_{1}^{2} + n_{2}s_{2}^{2}}{n_{1} + n_{2} - 2}(\frac{1}{n_{1}} + \frac{1}{n_{2}})}}$$

III model: duże próby, odchylenie standardowe nieznane

H0 : m1 = m2 H0 : m1 = m2 H0 : m1 = m2

H0 : m1 > m2 H0 : m1 ≠ m2 H0 : m1 < m2


$$u = \frac{{\overset{\overline{}}{x}}_{1} - {\overset{\overline{}}{x}}_{2}}{\sqrt{\frac{s_{1}^{2}}{n_{1}} + \frac{s_{2}^{2}}{n_{2}}}}$$

Zadanie:

W celu sprawdzenia hipotezy, że średnie płace księgowych zatrudnionych w 2 resortach są różne wylosowano dwie próby o liczebnościach odpowiednio 500 i 400 księgowych. Otrzymano następujące wyniki w złotówkach. Na poziomie istotności α=0,01 zweryfikować hipotezę o jednakowych średnich płacach księgowych zatrudnionych w 2 resortach.

Płace I resort II resort
xi

xini1

xini2

$${\mathbf{(x}_{\mathbf{i}}\mathbf{-}{\overset{\overline{}}{x}}_{1})}^{2}n_{i1}$$

$${\mathbf{(x}_{\mathbf{i}}\mathbf{-}{\overset{\overline{}}{x}}_{12})}^{2}n_{i2}$$
1600-2000 10 20 1800 18 000 36 000 21 785 760 16 562 000
2000-2400 20 60 2200 44 000 132 000 23 155 520 15 606 000
2400-2800 50 170 2600 130 000 442 000 22 848 800 2 057 000
2800-3200 100 100 3000 300 000 300 000 7 617 600 8 410 000
3200-3600 200 40 3400 680 000 136 000 3 075 200 19 044 000
3600-4000 100 10 3800 380 000 38 000 27 457 600 11 881 000
4000-4600 20 - 4300 86 000 - 20 971 520

$$\sum_{}^{}500$$

$$\sum_{}^{}400$$

$$\sum_{}^{}{1\ 638\ 000}$$

$$\sum_{}^{}{1\ 084\ 000}$$

$$\sum_{}^{}{126\ 912\ 000}$$

$$\sum_{}^{}{73\ 560\ 000}$$


H0 : m1 = m2


H0 : m1 ≠ m2

${\overset{\overline{}}{x}}_{1} = \ \frac{\sum_{}^{}{xn_{i1}}}{n_{i}} = \ $3276

${\overset{\overline{}}{x}}_{2} = \ \frac{\sum_{}^{}{xn_{i2}}}{n_{i}}$ = 2710


$$s_{1} = \frac{\sum_{}^{}{{\mathbf{(x}_{\mathbf{i}}\mathbf{-}{\overset{\overline{}}{x}}_{1})}^{2}n_{i1}}}{n_{1}} = 253\ 824$$


$$s_{2} = \frac{\sum_{}^{}{{\mathbf{(x}_{\mathbf{i}}\mathbf{-}{\overset{\overline{}}{x}}_{2})}^{2}n_{i2}}}{n_{2}} = 183\ 900$$


$$u = \frac{3276 - 2710}{\sqrt{\frac{253824}{500} + \frac{183904}{400}}} = 18,20$$

1-1/2 α = 1- ½ x 0,01=0,995


$$1 - \frac{1}{2}\alpha = 1 - \frac{1}{2} \times 0,01 = 0,995$$

uα=2,57

|u|>uα

18,2>2,57

Prawda, hipotezę H0 należy odrzucić, nie można powiedzieć, że księgowi w obu resortach średnio zarabiają tyle samo.

TEST NA DWA WSKAŹNIKI STRUKTURY (PROCENT)

Oparty na rozkładzie normalnym

H0 : p1 = p2 H0 : p1 = p2 H0 : p1 = p2

H0 : p1 > p2 H0 : p1 ≠ p2 H0 : p1 < p2


$$\overset{\overline{}}{p} = \frac{m_{1} + m_{2}}{n_{1} + n_{2}}$$


$$n = \frac{n_{1}n_{2}}{n_{1} + n_{2}}$$


$$u = \frac{\frac{m_{1}}{n_{1}} - \frac{m_{2}}{n_{2}}}{\sqrt{\frac{\overset{\overline{}}{p}(1 - \overset{\overline{}}{p})}{n}}}$$

n – całość próby

m – liczba elementów sprzyjających

Zadanie

Z dwóch wydziałów pewnego dużego zakładu produkcyjnego wylosowano dwie próby w celu zbadania jak hałas wpływa na ubytki słuchu pracowników. Z wydziału o małym natężeniu hałasu wylosowano 100 pracownic i po zbadaniu okazało się że 8 pracowników ma poważne ubytki słuchu. Natomiast na 120 wylosowanych pracowników wydziału o dużym natężeniu hałasu 20 pracowników ma poważne ubytki słuchu. Na poziomie istotności 0,05 zweryfikować hipotezę że hałas na wydziale zwiększa ubytki słuchu.

1 – z większym hałasem

2 – z mniejszym hałasem

n1 = 120

m1 = 20

n2 = 100

m2 = 8


$$\overset{\overline{}}{p} = \frac{20 + 8}{120 + 100} = 0,127$$


$$n = \frac{120 \times 100}{120 + 100} = 54,55$$


$$u = \frac{\frac{20}{120} - \frac{8}{100}}{\sqrt{\frac{0,127\left( 1 - 0,127 \right)}{54,55}}} = 1,92$$

1- α = 0,95

Uα = 1,64

u>uα

1,92> 1,64

Prawda, hipotezę H0 należy odrzucić, przy większym hałasie

Wykład 3

24.11


Wyszukiwarka