Analiza wariancji, Jednoczynnikowy model analizy wariancji


JEDNOCZYNNIKOWY MODEL ANALIZY WARIANCJI (MODEL STAŁY)

Sformułowanie modelu

  1. Zmienna Y w populacji generalnej (zmienna objaśniana) zależy od pewnego czynnika, który przyjmuje r poziomów.

  1. Przyjmując poziom czynnika za kryterium podziału wyodrębniamy r subpopulacji (grup) i rozpatrujemy zmienne Y1, Y2,...,Yr, które mają rozkłady N(μi,σ2)

  1. Z każdej subpopulacji pobieramy próbę prostą o liczebności ni, przy czym 0x01 graphic

  1. Jeżeli czynnik nie wpływa na wartości zmiennej Y, to prawdziwa jest hipoteza zerowa:

0x01 graphic

wobec hipotezy alternatywnej:

0x01 graphic

  1. Oznaczamy przez yki obserwację o numerze k z i-tej próby i przyjmujemy, że obserwacje generowane są przez model:

0x01 graphic
,

gdzie:

μ - stała wartość, identyczna dla wszystkich grup,

αi - nieznana stała opisująca wpływ i-tego poziomu czynnika na wartość zmiennej Y,

ξki - zmienna losowa opisująca łączny wpływ innych czynników o charakterze losowym na wartość zmiennej Y.

Zmienna ξki nazywana jest składnikiem (błędem) losowym. Przyjmuje się, że każda zmienna ξki ma rozkład N(0;σ) oraz że są one niezależne, czyli 0x01 graphic
dla wszystkich k, i, k', i', przy czym kk'.

Możemy zatem zapisać:

0x01 graphic

czyli obserwacja yki pochodzi z subpopulacji o wartości oczekiwanej μi.

Stała αi charakteryzuje odchylenie średniej zmiennej Y w i-tej grupie od średniej ogólnej dla całej populacji, spełnia zatem warunek 0x01 graphic
. Hipoteza zerowa może więc być sformułowana równoważnie jako 0x01 graphic

Weryfikacja hipotezy zerowej o identyczności średnich

w r populacjach

Założenie

Istotność różnic między średnimi może być oceniana na podstawie relacji zróżnicowania między średnimi w wyodrębnionych grupach do ogólnego zróżnicowania badanej zmiennej

Oznaczenia

nr obserwacji (k)

1

numer

2

grupy

....

(i)

r

1

2

0x01 graphic

...

ni

liczebność grupy

ni

n2

....

nr

średnie grupowe

0x01 graphic

0x01 graphic

....

0x01 graphic

Średnia ogólna: 0x01 graphic

Średnia grupowa: 0x01 graphic

Całkowita suma kwadratów odchyleń od średniej ogólnej:

0x01 graphic

gdzie:

SST - całkowita zmienność zmiennej Y,

SSE - zmienność wewnątrzgrupowa,

SSB - zmienność międzygrupowa.

Procedura

Do weryfikacji hipotezy zerowej wykorzystujemy statystykę postaci:

0x01 graphic

gdzie:

0x01 graphic

Statystyka F przy założeniu słuszności hipotezy zerowej ma rozkład F-Snedecora o stopniach swobody licznika i mianownika odpowiednio r-1 oraz n-r.

Obszar krytyczny wyznaczony jest z zależności:

0x01 graphic

Zestawienie obliczeń w postaci tablicy analizy wariancji

Źródło zmienności

Suma kwadratów odchyleń

Stopnie swobody

Średni kwadrat odchyleń

Czynnik (zróżnicowanie międzygrupowe)

SSB

r-1

MSB

Błąd losowy (zróżnicowanie wewnątrzgrupowe)

SSE

n-r

MSE

Zróżnicowanie całkowite

SST

n-1

-

Weryfikacja założeń modelu wariancji

Założenia:

Test jednorodności wariancji

0x01 graphic

0x01 graphic

PRZYKŁAD

Organizacja Współpracy Gospodarczej i Rozwoju (OECD) stosuje poniższą klasyfikację regionów (województw) w Polsce (według stopnia ich rozwoju), wyróżniając następujące grupy:

A - rozwinięte regiony rolnicze,

B - słabo rozwinięte regiony rolnicze,

C - rozwinięte regiony uprzemysłowione,

D - słabo rozwinięte regiony uprzemysłowione,

F - rozwinięte regiony „mieszane”,

G - nierozwinięte regiony „mieszane”.

TABLICA 1

Województwa

Klasyfikacja

Stopa bezrobocia

Stoł. Warszawskie

Bialskopodlaskie

Białostockie

Bielskie

Bydgoskie

Chełmskie

Ciechanowskie

Częstochowskie

Elbląskie

Gdańskie

Gorzowskie

Jeleniogórskie

Kaliskie

Katowickie

Kieleckie

Konińskie

Koszalińskie

Miej. krakowskie

Krośnieńskie

Legnickie

Leszczyńskie

Lubelskie

Łomżyńskie

Miej. łódzkie

Nowosądeckie

Olsztyńskie

Opolskie

Ostrołęckie

Pilskie

Piotrkowskie

Płockie

Poznańskie

Przemyskie

Radomskie

F

B

F

C

C

A

B

D

G

F

G

D

C

D

B

B

G

F

B

C

G

G

B

C

B

G

D

B

G

D

B

F

B

B

7,7

12,2

13,4

11,1

18,9

13,3

22,3

13,5

27

14,8

21,3

18,7

17,1

9,7

17,9

18,1

28,8

7,2

16,4

17,8

13,9

13,5

17,5

20,5

13,9

27,9

13,2

18,9

24,6

19,7

20,8

8,2

16,5

19,5

Rzeszowskie

Siedleckie

Sieradzkie

Skierniewickie

Słupskie

Suwalskie

Szczecińskie

Tarnobrzeskie

Tarnowskie

Toruńskie

Wałbrzyskie

Włocławskie wrocławskie

Zamojskie

Zielonogórskie

G

B

B

B

G

B

F

B

A

G

D

A

F

B

C

17

15,4

14,8

14,2

27,5

28,8

14,1

13,4

14,5

21,9

23,9

22

13,3

13,5

18,1

Przekrojowe dane, dotyczące całej zbiorowości województw w ustalonym momencie, potraktujemy jako próbę z populacji hipotecznej.

Formalnie zweryfikujemy hipotezę zerową, że średnie stopy bezrobocia w poszczególnych grupach województw są identyczne: 0x01 graphic
wobec alternatywy, że co najmniej dwie średnie różnią się między sobą.

TABLICA 2

Źródło zmienności

Suma kwadratów odchyleń

Stopnie swobody

Średni kwadrat odchyleń

Zróżnicowanie międzygrupowe

SSB = 516,65

5

MSB = 103,33

Zróżnicowanie wewnątrzgrupowe

SSE = 871,77

43

MSE = 20,27

Ogółem

SST = 1388,42

48

_

Obliczamy wartość statystyki 0x01 graphic
.

Jeśli przyjmiemy poziom istotności α=0,05, to wartość krytyczna rozkładu F-Snedecora wynosi 0x01 graphic
.

Obszar krytyczny ma postać: 0x01 graphic
.

0x01 graphic
co oznacza, że (z prawdopodobieństwem popełnienia błędu równym 0,05) odrzucamy hipotezę zerową, a więc przeciętne stopy bezrobocia w sześciu wyodrębnionych grupach województw różnią się istotnie między sobą. Inaczej mówiąc, otrzymany wynik wskazuje na to, że stopa bezrobocia zależy od poziomu rozwoju województwa (według przyjętych przez OECD kryteriów).

Można też stwierdzić, że z punktu widzenia zróżnicowania bezrobocia zastosowana klasyfikacja województw jest uzasadniona.



Wyszukiwarka

Podobne podstrony:
Jednoczynnikowa analiza wariancji
6 jednoczynnikowa analiza wariancji
Jednoczynnikowa analiza wariancji zadania Word2003, Elementy matematyki wyższej
Opis analizowanych wariantów inwestycji
analizy opisowa, regresji i wariancji
Analiza wariancji wprowadzenie
Analiza wariancji
Hierarchiczna analiza wariancji zadania Word2003, Elementy matematyki wyższej
8 1 analiza wariancji odp
ANALIZA 3 WARIANTÓW ZAMIENNEGO WYKONANIA OKIEN
10 Analiza wariancji
analiza wariancji
analiza wariancji metodologia wyk4
Analiza wariancji
zaj 10i11 analiza wariancji

więcej podobnych podstron