Statystyka 3 korelacja

Analiza zależności zjawisk masowych

Prezentowane dotychczas metody statystyczne dotyczyły analizy struktury zbiorowości i opierały się na obserwacjach jednej zmiennej (cechy).

Tymczasem jednostki tworzące zbiorowość statystyczną charakteryzują się zazwyczaj za pomocą więcej niż jednej cechy. Cechy te nie są od siebie izolowane, ale wzajemnie się warunkują. Zachodzi zatem potrzeba ich łącznego zbadania. Celem takiej analizy jest stwierdzenie, czy między badanymi zmiennymi zachodzą jakieś zależności, jaka jest ich siła, kształt i kierunek.

Celem analizy jest stwierdzenie, czy między badanymi zmiennymi zachodzą jakieś zależności, jaka jest ich siła, kształt i kierunek.

Za pomocą metod korelacji określa się wzajemną zależność między cechami ilościowymi lub jakościowymi, przy czym można badać korelację dowolnej liczby cech.

Gdy obserwacji badanej zmiennej jest dużo wówczas w celu stwierdzenia istnienia lub braku korelacji należy skonstruować tablicę korelacyjną.

Na skrzyżowaniu kolumn z wierszami wpisywane są liczebności jednostek badanej zbiorowości.

Tablica korelacyjna

yi

xi

y1 y2 yj

x1

x2

:

xi

:

:

n11

n21

:

ni1

:

:

n12

n22

:

ni2

:

:

:

:

:

n1j

n2j

:

nij

:

:

n1.

n2.

ni.

n.1 n.2 n.j N

Rozkłady cechy

W tablicy korelacyjnej są dwa rodzaje rozkładów: rozkład brzegowy i rozkłady warunkowe.

Rozkład brzegowy prezentuje strukturę wartości jednej zmiennej (X lub Y) bez względu na kształtowanie się wartości drugiej zmiennej.

yi

xi

y1 y2 yj

x1

x2

:

xi

:

:

n11

n21

:

ni1

:

:

n12

n22

:

ni2

:

:

:

:

:

n1j

n2j

:

nij

:

:

n1.

n2.

ni.

n.1 n.2 n.j N

W tablicy korelacyjnej są dwa rodzaje rozkładów: rozkład brzegowy i rozkłady warunkowe.

Rozkłady warunkowe

Rozkład warunkowy prezentuje strukturę wartości jednej zmiennej (X lub Y) pod warunkiem, że druga zmienna przyjęła określoną wartość.

Rozkładów warunkowych zmiennej X jest w tablicy tyle, ile jest wariantów zmiennej Y i na odwrót.

Tablica korelacyjna

yi

xi

y1 y2 yj

x1

x2

:

xi

:

:

n11

n21

:

ni1

:

:

n12

n22

:

ni2

:

:

:

:

:

n1j

n2j

:

nij

:

:

n1.

n2.

ni.

n.1 n.2 n.j N

yi

xi

y1 y2 yj

x1

x2

:

xi

:

:

n11

n21

:

ni1

:

:

n12

n22

:

ni2

:

:

:

:

:

n1j

n2j

:

nij

:

:

n1.

n2.

ni.

n.1 n.2 n.j N

yi

xi

y1 y2 yj

x1

x2

:

xi

:

:

n11

n21

:

ni1

:

:

n12

n22

:

ni2

:

:

:

:

:

n1j

n2j

:

nij

:

:

n1.

n2.

ni.

n.1 n.2 n.j N

yi

xi

y1 y2 yj

x1

x2

:

xi

:

:

n11

n21

:

ni1

:

:

n12

n22

:

ni2

:

:

:

:

:

n1j

n2j

:

nij

:

:

n1.

n2.

ni.

n.1 n.2 n.j N

yi

xi

y1 y2 yj

x1

x2

:

xi

:

:

n11

n21

:

ni1

:

:

n12

n22

:

ni2

:

:

:

:

:

n1j

n2j

:

nij

:

:

n1.

n2.

ni.

n.1 n.2 n.j N

yi

xi

y1 y2 yj

x1

x2

:

xi

:

:

n11

n21

:

ni1

:

:

n12

n22

:

ni2

:

:

:

:

:

n1j

n2j

:

nij

:

:

n1.

n2.

ni.

n.1 n.2 n.j N

Wskaźnik korelacji liniowej Pearsona

Współczynnik korelacji jest miarą unormowaną i przyjmuje wartości z przedziału

Dodatni znak współczynnika korelacji wskazuje na zależność dodatnią, znak „-” mówi o zależności ujemnej.

Im moduł współczynnika korelacji jest bliższy jedności, tym zależność korelacyjna między danymi zmiennymi jest silniejsza.

Orientacyjnie przyjmuje się:

0 – 0,1 – brak zależności

0,1-0,3 – słaba zależność

0,3-0,5 – zależność średnia

0,5-0,8 – zależność silna

0,8 – 1 – zależność bardzo silna

Gdy – występuje zależność funkcyjna

Gdy – zupełny brak zależności między X i Y

Współczynnik determinacji

informuje, w ilu procentach zmiany zmiennej zależnej są spowodowane zmianami zmiennej niezależnej.

Przykład 1.

W pewnym Urzędzie Stanu Cywilnego przeprowadzono badanie nowo zawartych małżeństw według wieku męża (yi) i żony (xi). Wyniki badania przedstawiono w tabeli. Określić siłę i kierunek zależności między badanymi zmiennymi.

Rozwiązanie

W celu wyznaczenia współczynnika korelacji liniowej Pearsona należy obliczyć średnie arytmetyczne i odchylenia standardowe obu cech

xi yi

18

19

20

21

23

24

26

27

27

30

19

21

23

21

20

23

26

25

26

34

-5,5

-4,5

-3,5

-2,5

-0,5

0,5

2,5

3,5

3,5

6,5

-4,8

-2,8

-0,8

-2,8

-3,8

-0,8

2,2

1,2

2,2

10,2

26,4

12,6

2,8

7,0

1,9

-0,4

5,5

4,2

7,7

66,3

30,25

20,25

12,25

6,25

0,25

0,25

6,25

12,25

12,25

42,25

23,04

7,84

0,64

7,84

14,44

0,64

4,84

1,44

4,84

104,04

235 238 x x 134,0 142,5 169,628

Odchylenia standardowe obu cech oraz współczynnik korelacji liniowej Pearsona wynoszą:

Otrzymany wynik oznacza, że między badanymi zmiennymi istnieje bardzo silna dodatnia zależność korelacyjna. W 74% zmiany jednej cechy są uwarunkowane zmianami drugiej.

Przykład 2.

Wydajność pracy pracownika Y (w tys. sztuk wyrobów) oraz staż pracy X (w latach) w pewnym zakładzie przedstawia poniższa tabela:

yj

x0i-1i

1 2 3 4
2-4 10 1 - -
4-6 2 12 12 2
6-8 - - 1 10
  1. Jaki jest średni staż pracy oraz odchylenie standardowe w zbiorowości badanych pracowników?

  1. Jaka jest średnia wydajność pracy oraz odchylenie standardowe w zbiorowości badanych pracowników?

  1. Jaka jest zależność między stażem pracy a wydajnością pracy?

  2. Jaka jest średnia wydajność pracowników o stażu pracy od 6 do 8 lat?

  3. Jakie jest odchylenie standardowe od średniego stażu pracy pracowników o wydajności 4 tys. sztuk wyrobów?

1. Jaki jest średni staż pracy oraz odchylenie standardowe w zbiorowości badanych pracowników?

yj

x0i-1i

1 2 3

4

Suma

2-4 10 1 -

-

11

4-6 2 12 12

2

28

6-8 - - 1

10

11

Suma 12 13 13

12

50

2. Jaka jest średnia wydajność pracy oraz odchylenie standardowe w zbiorowości badanych pracowników?

yj

x0i-1i

1

2 3 4

Suma

2-4

10

1 - -

11

4-6

2

12 12 2

28

6-8

-

- 1 10

11

Suma

12

13 13 12

50

3. Jaka jest zależność między stażem pracy a wydajnością pracy?

1-2,5 2-2,5

3-2,5

4-2,5

Suma

3-5

10 1

-

-

5-5

2 12

12

2

7-5

- -

1

10

Suma

4.Jaka jest średnia wydajność pracowników o stażu pracy od 6 do 8 lat?

yj

x0i-1i

1 2

3

4

Suma

2-4

10 1

-

-

11

4-6

2 12

12

2

28

6-8

- -

1

10

11

Suma

12 13

13

12

50

  1. Jakie jest odchylenie standardowe od średniego stażu pracy pracowników o wydajności 4 tys. sztuk wyrobów?

yj

x0i-1i

1 2 3

4

Suma

2-4 10 1 -

-

11

4-6 2 12 12

2

28

6-8 - - 1

10

11

Suma 12 13 13

12

50


Wyszukiwarka

Podobne podstrony:
statystyka, Korelacja i regresja liniowa, Korelacja i regresja liniowa
7 STATYSTYKA korelacja rangowa0 Nieznany (2)
Statystyka korelacje
Statystyka korelacje
5 STATYSTYKA korelacja 1a id 40 Nieznany (2)
5 STATYSTYKA korelacja 1b
Izabela Tupik Zadanie ze statystyki Korelacja i regresja
5 STATYSTYKA korelacja 1b
Statystyka #9 Regresja i korelacja
Przykłady do rozwiązania - tablica korelacyjna, Informatyka i Ekonometria SGGW, Semestr 2, Statystyk
korelacje, Statystyka i metodologia(1)
zadania na korelację, Statystyka
korelacja, Zarządzanie i inżynieria produkcji, Semestr 2, Statystyka, statystyka
Wzory statystyczne - analiza, korelacja, prawdopodobieństo

więcej podobnych podstron