Trzecia forma prezentacji danych to wykres korelacyjny. Diagram korelacyjny jest wykresem punktowym. Diagram jest tworzony po to aby przeprowadzić wstępną ocenę współzależności. Ocena jest ważna dla dalszego toku postępowania. Ma odpowiadać na pytania:
1. Czy między zmiennymi występuje zależność (Tak, Nie)
2 Jaki jest charakter i siła zależności
Ocena zależności na podstawie diagramu korelacyjnego.
O
O
O
O
O
O
O
O
O
O
O O O
O O
O O O
-►
Brak zależności
Słaba zależność liniowa dodatnia
O
Zasadnicze pytanie (2) czy zależność jest liniowa czy nieliniowa. Inaczej się bada zależności liniowe i nieliniowe.
Zależność statystyczna lub stochastyczna jest to uproszczenie koncepcji stochastycznej, powiadamy, że zmienne są niezależne statystycznie lub nie są nieskorelowane jeżeli poszczególnym odmianom jednej zmiennej odpowiadają takie same wartości średnich warunkowych.
W przeciwnym przypadku mówimy, że zmienne są skorelowane. Ponieważ koncepcja zależności stochastycznej jest szersza, to z niezależności stochastycznej wynika niezależność statystyczna (korelacyjna) ale nie odwrotnie. Czyli jeżeli stwierdzimy, że zmienne są nieskorelowane to nie wynika z tego, że są niezależne stochastycznie (probabilistycznie).
Do badania siły liniowej zależności korelacyjnej służy współczynnik korelacji Pearsona.
Inne nazwy - współczynnik korelacji liniowej
parami
- współczynnik wg momentu iloczynowego.
Współczynnik korelacji w próbie - r Współczynnik korelacji w populacji -Wartość współczynnika korelacji przyjmuje:
— 1 < r < 1
Jeżeli zależność jest funkcyjna to wartość współczynnika może przyjąć wartości graniczne, r = 0 - oznacza nieskorelowanie r > 0 - korelacja dodatnia r < 0 - korelacja ujemna
Rozkład w próbie silnie zależny od liczebności próby i współczynnika korelacji P. Może się okazać, że dla małej próby współczynnik korelacji V nieistotnie różni się od 0 nawet przy względnie wysokich wartościach tego współczynnika.
Współczynnik korelacji jeżeli próba jest mała musi być testowany.