STATYSTYKA I EKONOMETRIA
WYKŁAD 4 – 8.12.2014
$${\overline{x}}_{i} = \ \frac{1}{n_{i}}*\ \sum_{}^{}x_{i}{\text{\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ }\overset{}{x}}_{i} = \ \frac{1}{n}*\ \sum_{}^{}{\sum_{}^{}x_{\text{ij}}}$$
H0 : m1 = m2 = …= mk H1 : nie sa rozne
źródło | Suma kwadratów (a) | St. Swobody (b) | Wariancja ($c = \frac{a}{b}$) | Test F |
---|---|---|---|---|
Między populacjami (czynnik, który analizuje) | $${\sum_{}^{}{({\overset{\overline{}}{x}}_{i} - \overset{}{x}})}^{2}*n$$ |
k-1 | S12 |
$$F = \frac{{S_{1}}^{2}}{{S_{2}}^{2}}$$ |
Wewnątrz grup (składnik losowy) | $${\sum_{}^{}{\sum_{}^{}{(x_{\text{ij}}}} - {\overset{\overline{}}{x}}_{i})}^{2}$$ |
n-k | S22 |
n – obserwacje, k – populacje
a, k-1, n-k => Fα Interpretacja (obszar krytyczny): F ≥ Fα
*Jak odrzucę H0, tzn. że dany czynnik ma istotny wpływ na badane zjawisko.
PRZYKŁAD 1
Liczba błędów popełnionych w toku przejścia tresowanych szczurów przez labirynt ma rozkład
normalny. Do pewnych dalszych doświadczeń wylosowano po pięć szczurów do czterech grup,
które powinny być jednorodne pod względem stopnia wytresowania. Otrzymano dla szczurów w
poszczególnych grupach następujące liczby popełnianych przez nie błędów:
I grupa: 10,8,7,6,11 II grupa: 7,10,6,14,5
III grupa: 8,13,15,6,3 IV grupa: 16,10,8,10,4.
Na poziomie istotności α = 0, 05 zweryfikować hipotezę o takiej samej liczbie błędów popełnionej przez szczury we wszystkich grupach (czyli czy rodzaj grupy do której trafił szczur wpływa na liczbe błędów).
I | II | III | IV | $${(x_{I} - {\overset{\overline{}}{x}}_{I})}^{2}$$ |
$${(x_{\text{II}} - {\overset{\overline{}}{x}}_{\text{II}})}^{2}$$ |
$${(x_{\text{II}I} - {\overset{\overline{}}{x}}_{\text{III}})}^{2}$$ |
$${(x_{\text{IV}} - {\overset{\overline{}}{x}}_{\text{IV}})}^{2}$$ |
---|---|---|---|---|---|---|---|
10 | 7 | 8 | 16 | (10 - 8,4)² | (7 - 8,4)² | (8 - 9)² | (16 – 9,6)² |
8 | 10 | 13 | 10 | (8 - 8,4)² | (10 - 8,4)² | (13 - 9)² | (10 – 9,6)² |
7 | 6 | 15 | 8 | (7 - 8,4)² | (6- 8,4)² | (15 - 9)² | (8 – 9,6)² |
6 | 14 | 6 | 10 | (6 - 8,4)² | (14 - 8,4)² | (6 - 9)² | (10 – 9,6)² |
11 | 15 | 3 | 4 | (11 - 8,4)² | (15 - 8,4)² | (3 - 9)² | (4 – 9,6)² |
$${\overset{\overline{}}{x}}_{I} = 8,4$$ |
$${\overset{\overline{}}{x}}_{\text{II}} = 8,4$$ |
$${\overset{\overline{}}{x}}_{\text{III}} = 9$$ |
$${\overset{\overline{}}{x}}_{\text{IV}} = 9,6$$ |
$$\sum_{}^{}{= 17,2}$$ |
$$\sum_{}^{}{= 53,2}$$ |
$$\sum_{}^{}{= 98}$$ |
$$\sum_{}^{}{= 75,2}$$ |
$\overset{}{x} = \ \frac{177}{5*4} = 8,85$
$\overset{}{x}$ – średnia globalna
Wewnątrz grupy składnik:
17,2 + 53,2 + 98 + 75,2 = 243,6
(8,4 – 8,85)² * 5
(8,4 – 8,85)² * 5
(9 – 8,85)² * 5 Ʃ = 4,26
(9,6 – 8,85)² * 5
źródło | Suma kwadratów (a) | St. Swobody (b) | Wariancja ($c = \frac{a}{b}$) | Test F |
---|---|---|---|---|
Między populacjami (czynnik, który analizuje) | 4,26 | 4 – 1 = 3 | 1,65 | $$F = \frac{1,65}{15,22} = 0,11$$ |
Wewnątrz grup (składnik losowy) | 243,6 | 4 – 1 = 3 | 15,22 |
1 | 2 | 3 | |
---|---|---|---|
1 | |||
2 | |||
: | |||
16 | 3,24 |
Z tablic odczytuje dla:
a = 0, 05
k – 1 = 3 Fα = 3, 24 Z tablic Fishera:
n – k = 16
Obszar krytyczny: F ≥ Fα
0,11 ≥ 3,24 fałsz
Brak podstaw do odrzucenia H0, czyli nie ma wpływu z której grupy wezmę szczury.
$${\overline{x}}_{i} = \ \frac{1}{k}*\ \sum_{j = 1}^{k}x_{\text{ij}}{\text{\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ }\overline{x}}_{j} = \ \frac{1}{p}*\ \sum_{i = 1}^{\text{kp}}x_{\text{ij}}\text{\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ }\overset{}{x} = \ \frac{1}{\text{pk}}\ \sum_{}^{}{\sum_{}^{}x_{\text{ij}}}\text{\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ }$$
A B |
1 | 2 | … | k |
---|---|---|---|---|
1 | xij |
|||
2 | ||||
: | ||||
p |
Suma kwadratów:
Dla zmienności całkowitej: $SK_{c} = \ {\sum_{}^{}{\sum_{}^{}{(x_{\text{ij}} - \overset{}{x})}}}^{2}$
Dla zmienności między wierszami: (A) $\ SK_{A} = \ {k*\sum_{}^{}{({\overline{x}}_{i} - \ \overset{}{x})\ }}^{2}$
Dla zmienności między kolumnami: (B) $SK_{B} = \ {p*\sum_{}^{}\left( {\overline{x}}_{j} - \ \overset{}{x} \right)}^{2}$
Dla zmienności resztowej: SKR = SKc − SKA − SKB
Źródło zmienności | Suma kwadratów (a) | St. Swobody (b) | Wariancja ($c = \frac{a}{b}$) | Test F |
---|---|---|---|---|
Czynnik A | SKA |
p – 1 | S12 | $$F = \frac{{S_{1}}^{2}}{{S_{3}}^{2}}$$ |
Czynnik B | SKB |
k – 1 | S22 |
$$F = \frac{{S_{2}}^{2}}{{S_{3}}^{2}}$$ |
Błąd losowy | SKR |
(k – 1)( p – 1) | S32 |
p – liczba wierszy, k – liczba kolumn
Z tablic: α, p – 1, (k – 1)( p – 1) => FA obszar krytyczny: F ≥ FA
α, p – 1, (k – 1)( p – 1) => FB obszar krytyczny: F ≥ FB
PRZYKŁAD 2
W celu sprawdzenia jaki wpływ na wydajność pracy robotników ma typ maszyn, przeprowadzono w pewnym zakładzie metalowym doświadczenie polegające w którym mierzono wydajność pracy (liczba sztuk detali wyprodukowanych w godzinę) 5 robotników pracujących na poszczególnych typach obrabiarek. Wyniki doświadczenia były następujące:
Robotnicy | Typy maszyn | Średnie wierszy |
---|---|---|
1 | 2 | |
1 | 28 | 30 |
2 | 24 | 21 |
3 | 20 | 22 |
4 | 25 | 25 |
5 | 32 | 28 |
Średnie kolumn | 25,8 | 25,2 |
Przyjmując rozkład normalny wydajności pracy zbadać na poziomie istotności a = 0, 05 wpływ typu maszyn oraz indywidualnych cech robotników na ich wydajność pracy.
$$\overset{}{x} = \ \frac{335}{3*5\ } = 25,4$$
SKC = (28 – 25,4)² + (24 – 25,4)² + … + (30 – 25,4)² = 219,6
SKA = 3 * [(28 – 25,4)² + (24 – 25,4)² + (20 – 25,4)² + (25 – 25,4)² + (30 – 25,4)²] = 177,6
SKB = 5 * [(25,8 – 25,4)² + (25,2 – 25,4)² + (25,2 – 25,4)²] = 1,2
SKR = 219,6 – 177,6 – 1,2 = 40,8
Źródło zmienności | Suma kwadratów (a) | St. Swobody (b) | Wariancja ($c = \frac{a}{b}$) | Test F |
---|---|---|---|---|
Czynnik A | 177,6 | 5 – 1 = 4 | 44,4 | $$F = \ \frac{44,4}{25,1} = 8,7$$ |
Czynnik B | 1,2 | 3 – 1 = 2 | 0,6 | $$F = \ \frac{0,6}{5,1} = 0,12$$ |
Błąd losowy | 40,8 | 2*4 = 8 | 5,1 |
Z tablic odczytuje dla:
a = 0, 05 F ≥ FA
p – 1 =4 FA = 3, 84 8,7 ≥ 3,84 Prawda
(k – 1)( p – 1) = 8
Odrzucam H0, czyli czynnik A ma istotny wpływ.
a = 0, 05 F ≥ FB
p – 1 = 2 FB = 4, 46 0,12 ≥ 4,46 Fałsz
(k – 1)( p – 1) = 8
Brak podstaw do odrzucenia H0.
Podsumowując: cechy robotników były istotne a wybór maszyny nie.