Statystyka www.pure6.neostrada.pl
Wykład 7 2003-11-20
<x,y>
Analiza współzależności cech (analiza korelacji i regresji) zmienna dwuwymiarowa (x,y)
Jeśli punkty układają się wzdłuż prostej to mówimy o korelacji liniowej.
Jeśli wzdłuż paraboli to mówimy o korelacji krzywoliniowej.
Jeśli są rozproszone to nie ma korelacji.
TABLICA KORELACYJNA (przy szeregu rozdzielczym)
x (pionowo) y (poziomo) |
……. |
Klasy wartości |
……. |
|
……. |
|
|
|
|
Klasy wartości |
|
|
|
|
……. |
|
|
|
|
|
|
|
|
|
,
- liczebności
,
- liczebności brzegowe
HISTOGRAM DLA ZMIENNEJ DWUWYMIAROWEJ
PARAMETRY ROZKŁADU ZMIENNEJ DWUWYMIAROWEJ (X,Y)
KOWARIANCJA
Mierzy współzależność pomiędzy zmienna „x”, a „y”.
Wadą kowariancji jest to, że jest to liczba mianowana. Żeby to ominąć liczymy współczynnik korelacji.
- mianownik tego wyrażenia to iloczyn odchyleń standardowych
Współczynnik korelacji jest liczbą niemianowaną przyjmującą wartości z przedziału <-1,1>
-1 ≤ r ≤ 1
| r | - mówi o sile korelacji
Znak współczynnika korelacji mówi o kierunku korelacji
im | r | bliższe 1 tym korelacja jest silniejsza
im | r | bliższe 0 tym korelacja jest słabsza
r < 0 mówimy o korelacji ujemnej
r > 0 mówimy o korelacji dodatniej
INTERPRETACJA:
0 ≤ | r | < 0,2 - oznacza brak korelacji
0,2 ≤ | r | < 0,5 - słaba korelacja
0,5 ≤ | r | < 0,7 - korelacja dość silna
0,7 ≤ | r | < 1 - korelacja bardzo silna