Kowariancja:
Współczynnik korelacji liniowej Pearsona:
Gdzie sx i sy to są odchylenia standardowe badanych zmiennych.
Ostatecznie otrzymujemy:
Po pewnych przekształceniach wzór ma postać:
Przykład:
W celu ustalenia, jaka jest zależność stopnia zużycia maszyn od okresu ich użytkowania zebrano dane dotyczące 15 maszyn w pewnej fabryce:
Nr maszyny |
Okres eksploatacji w latach |
Stopień zużycia w % |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
7 2 6 9 2 4 3 1 11 10 4 8 5 2 1 |
27 6 28 33 8 12 12 8 45 40 13 32 17 10 9 |
Ustal siłę zależności między tymi cechami.
Rozwiązanie:
Ustalamy, która zmienna jest zależna (Y), a która niezależna (X).
Rysujemy korelacyjny diagram rozrzutu:
W oparciu o wykres stwierdzamy, że zależność jest przypuszczalnie liniowa i wobec tego liczymy współczynnik korelacji liniowej.
W tym celu musimy wyliczyć średnie i odchylenia standardowe obu cech. Obliczenia pośrednie zawarte są w tabeli poniżej:
Nr |
Czas eksploatacji w latach (x) |
Zużycie w % (y) |
x2 |
y2 |
x*y |
1 |
7 |
27 |
49 |
729 |
189 |
2 |
2 |
6 |
4 |
36 |
12 |
3 |
6 |
28 |
36 |
784 |
168 |
4 |
9 |
33 |
81 |
1089 |
297 |
5 |
2 |
8 |
4 |
64 |
16 |
6 |
4 |
12 |
16 |
144 |
48 |
7 |
3 |
12 |
9 |
144 |
36 |
8 |
1 |
8 |
1 |
64 |
8 |
9 |
11 |
45 |
121 |
2025 |
495 |
10 |
10 |
40 |
100 |
1600 |
400 |
11 |
4 |
13 |
16 |
169 |
52 |
12 |
8 |
32 |
64 |
1024 |
256 |
13 |
5 |
17 |
25 |
289 |
85 |
14 |
2 |
10 |
4 |
100 |
20 |
15 |
1 |
9 |
1 |
81 |
9 |
Ogółem |
75 |
300 |
531 |
8342 |
2091 |
Komentarz:
Między zużyciem maszyny a okresem jej użytkowania występuje bardzo silna zależność liniowa dodatnia.