Analiza zależności zjawisk masowych
Prezentowane dotychczas metody statystyczne dotyczyły analizy struktury zbiorowości i opierały się na obserwacjach jednej zmiennej (cechy).
Tymczasem jednostki tworzące zbiorowość statystyczną charakteryzują się zazwyczaj za pomocą więcej niż jednej cechy. Cechy te nie są od siebie izolowane, ale wzajemnie się warunkują. Zachodzi zatem potrzeba ich łącznego zbadania. Celem takiej analizy jest stwierdzenie, czy między badanymi zmiennymi zachodzą jakieś zależności, jaka jest ich siła, kształt i kierunek.
Celem analizy jest stwierdzenie, czy między badanymi zmiennymi zachodzą jakieś zależności, jaka jest ich siła, kształt i kierunek.
Za pomocą metod korelacji określa się wzajemną zależność między cechami ilościowymi lub jakościowymi, przy czym można badać korelację dowolnej liczby cech.
Gdy obserwacji badanej zmiennej jest dużo wówczas w celu stwierdzenia istnienia lub braku korelacji należy skonstruować tablicę korelacyjną.
Na skrzyżowaniu kolumn z wierszami wpisywane są liczebności jednostek badanej zbiorowości.
Tablica korelacyjna
yi xi |
y1 | y2 | … | yj | … | |
---|---|---|---|---|---|---|
x1 x2 : xi : : |
n11 n21 : ni1 : : |
n12 n22 : ni2 : : |
… … : … : : |
n1j n2j : nij : : |
… … … … … … |
n1. n2. … ni. … … |
n.1 | n.2 | … | n.j | … | N |
Rozkłady cechy
W tablicy korelacyjnej są dwa rodzaje rozkładów: rozkład brzegowy i rozkłady warunkowe.
Rozkład brzegowy prezentuje strukturę wartości jednej zmiennej (X lub Y) bez względu na kształtowanie się wartości drugiej zmiennej.
Rozkład brzegowy
yi xi |
y1 | y2 | … | yj | … | |
---|---|---|---|---|---|---|
x1 x2 : xi : : |
n11 n21 : ni1 : : |
n12 n22 : ni2 : : |
… … : … : : |
n1j n2j : nij : : |
… … … … … … |
n1. n2. … ni. … … |
n.1 | n.2 | … | n.j | … | N |
W tablicy korelacyjnej są dwa rodzaje rozkładów: rozkład brzegowy i rozkłady warunkowe.
Rozkłady warunkowe
Rozkład warunkowy prezentuje strukturę wartości jednej zmiennej (X lub Y) pod warunkiem, że druga zmienna przyjęła określoną wartość.
Rozkładów warunkowych zmiennej X jest w tablicy tyle, ile jest wariantów zmiennej Y i na odwrót.
Tablica korelacyjna
yi xi |
y1 | y2 | … | yj | … | |
---|---|---|---|---|---|---|
x1 x2 : xi : : |
n11 n21 : ni1 : : |
n12 n22 : ni2 : : |
… … : … : : |
n1j n2j : nij : : |
… … … … … … |
n1. n2. … ni. … … |
n.1 | n.2 | … | n.j | … | N |
yi xi |
y1 | y2 | … | yj | … | |
---|---|---|---|---|---|---|
x1 x2 : xi : : |
n11 n21 : ni1 : : |
n12 n22 : ni2 : : |
… … : … : : |
n1j n2j : nij : : |
… … … … … … |
n1. n2. … ni. … … |
n.1 | n.2 | … | n.j | … | N |
yi xi |
y1 | y2 | … | yj | … | |
---|---|---|---|---|---|---|
x1 x2 : xi : : |
n11 n21 : ni1 : : |
n12 n22 : ni2 : : |
… … : … : : |
n1j n2j : nij : : |
… … … … … … |
n1. n2. … ni. … … |
n.1 | n.2 | … | n.j | … | N |
yi xi |
y1 | y2 | … | yj | … | |
---|---|---|---|---|---|---|
x1 x2 : xi : : |
n11 n21 : ni1 : : |
n12 n22 : ni2 : : |
… … : … : : |
n1j n2j : nij : : |
… … … … … … |
n1. n2. … ni. … … |
n.1 | n.2 | … | n.j | … | N |
yi xi |
y1 | y2 | … | yj | … | |
---|---|---|---|---|---|---|
x1 x2 : xi : : |
n11 n21 : ni1 : : |
n12 n22 : ni2 : : |
… … : … : : |
n1j n2j : nij : : |
… … … … … … |
n1. n2. … ni. … … |
n.1 | n.2 | … | n.j | … | N |
yi xi |
y1 | y2 | … | yj | … | |
---|---|---|---|---|---|---|
x1 x2 : xi : : |
n11 n21 : ni1 : : |
n12 n22 : ni2 : : |
… … : … : : |
n1j n2j : nij : : |
… … … … … … |
n1. n2. … ni. … … |
n.1 | n.2 | … | n.j | … | N |
Wskaźnik korelacji liniowej Pearsona
Współczynnik korelacji jest miarą unormowaną i przyjmuje wartości z przedziału
Dodatni znak współczynnika korelacji wskazuje na zależność dodatnią, znak „-” mówi o zależności ujemnej.
Im moduł współczynnika korelacji jest bliższy jedności, tym zależność korelacyjna między danymi zmiennymi jest silniejsza.
Orientacyjnie przyjmuje się:
0 – 0,1 – brak zależności
0,1-0,3 – słaba zależność
0,3-0,5 – zależność średnia
0,5-0,8 – zależność silna
0,8 – 1 – zależność bardzo silna
Gdy – występuje zależność funkcyjna
Gdy – zupełny brak zależności między X i Y
Współczynnik determinacji
informuje, w ilu procentach zmiany zmiennej zależnej są spowodowane zmianami zmiennej niezależnej.
Przykład 1.
W pewnym Urzędzie Stanu Cywilnego przeprowadzono badanie nowo zawartych małżeństw według wieku męża (yi) i żony (xi). Wyniki badania przedstawiono w tabeli. Określić siłę i kierunek zależności między badanymi zmiennymi.
Rozwiązanie
W celu wyznaczenia współczynnika korelacji liniowej Pearsona należy obliczyć średnie arytmetyczne i odchylenia standardowe obu cech
xi | yi | |||||
---|---|---|---|---|---|---|
18 19 20 21 23 24 26 27 27 30 |
19 21 23 21 20 23 26 25 26 34 |
-5,5 -4,5 -3,5 -2,5 -0,5 0,5 2,5 3,5 3,5 6,5 |
-4,8 -2,8 -0,8 -2,8 -3,8 -0,8 2,2 1,2 2,2 10,2 |
26,4 12,6 2,8 7,0 1,9 -0,4 5,5 4,2 7,7 66,3 |
30,25 20,25 12,25 6,25 0,25 0,25 6,25 12,25 12,25 42,25 |
23,04 7,84 0,64 7,84 14,44 0,64 4,84 1,44 4,84 104,04 |
235 | 238 | x | x | 134,0 | 142,5 | 169,628 |
Odchylenia standardowe obu cech oraz współczynnik korelacji liniowej Pearsona wynoszą:
Otrzymany wynik oznacza, że między badanymi zmiennymi istnieje bardzo silna dodatnia zależność korelacyjna. W 74% zmiany jednej cechy są uwarunkowane zmianami drugiej.
Przykład 2.
Wydajność pracy pracownika Y (w tys. sztuk wyrobów) oraz staż pracy X (w latach) w pewnym zakładzie przedstawia poniższa tabela:
yj x0i-1i |
1 | 2 | 3 | 4 |
---|---|---|---|---|
2-4 | 10 | 1 | - | - |
4-6 | 2 | 12 | 12 | 2 |
6-8 | - | - | 1 | 10 |
Jaki jest średni staż pracy oraz odchylenie standardowe w zbiorowości badanych pracowników?
Jaka jest średnia wydajność pracy oraz odchylenie standardowe w zbiorowości badanych pracowników?
Jaka jest zależność między stażem pracy a wydajnością pracy?
Jaka jest średnia wydajność pracowników o stażu pracy od 6 do 8 lat?
Jakie jest odchylenie standardowe od średniego stażu pracy pracowników o wydajności 4 tys. sztuk wyrobów?
1. Jaki jest średni staż pracy oraz odchylenie standardowe w zbiorowości badanych pracowników?
yj x0i-1i |
1 | 2 | 3 |
|
|
---|---|---|---|---|---|
2-4 | 10 | 1 | - |
|
|
4-6 | 2 | 12 | 12 |
|
|
6-8 | - | - | 1 |
|
|
Suma | 12 | 13 | 13 |
|
|
2. Jaka jest średnia wydajność pracy oraz odchylenie standardowe w zbiorowości badanych pracowników?
|
|
2 | 3 | 4 |
|
---|---|---|---|---|---|
|
|
1 | - | - |
|
|
|
12 | 12 | 2 |
|
|
|
- | 1 | 10 |
|
|
|
13 | 13 | 12 |
|
3. Jaka jest zależność między stażem pracy a wydajnością pracy?
1-2,5 | 2-2,5 |
|
|
|
|
---|---|---|---|---|---|
|
10 | 1 |
|
|
|
|
2 | 12 |
|
|
|
|
- | - |
|
|
|
|
4.Jaka jest średnia wydajność pracowników o stażu pracy od 6 do 8 lat?
yj x0i-1i |
1 | 2 |
|
|
|
---|---|---|---|---|---|
|
10 | 1 |
|
|
|
|
2 | 12 |
|
|
|
|
- | - |
|
|
|
|
12 | 13 |
|
|
|
Jakie jest odchylenie standardowe od średniego stażu pracy pracowników o wydajności 4 tys. sztuk wyrobów?
yj x0i-1i |
1 | 2 | 3 |
|
|
---|---|---|---|---|---|
2-4 | 10 | 1 | - |
|
|
4-6 | 2 | 12 | 12 |
|
|
6-8 | - | - | 1 |
|
|
Suma | 12 | 13 | 13 |
|
|