Y. A zatem każda jednostka obserwowanej zbiorowości statystycznej musi być scharakteryzowana za pomocą wartości dwóch cccii (x,\y,). Jeżeli obie badane cechy są ilościowe, bądź też dają się wyrazić w skali porządkowej, albo też przynajmniej jedna z nich jest cechą ilościową, to oceniając związki między nimi, posługujemy się metodami korelacji i regresji.
Korelacja jest to współzależność, czyli wzajemne oddziaływanie lub wspólwystępowanie dwóch zjawisk lub cech tej samej zbiorowości. Statystyczny opis współzależności może mieć formę tabelaryczną (szeregi lub tablice), graficzną (diagram korelacyjny) oraz parametryczną w postaci odpowiedniej charakterystyki liczbowej.
Regresja oznacza oddziaływanie cechy traktowanej jako zmienna niezależna na cechę traktowaną jako zmienna zależna. Formalnym zapisem tego oddziaływania są funkcje regresji. Funkcję przedstawiającą wpływ zmiennej X na zmienną Y zapisujemy w postaci y = /(.v), natomiast funkcję przedstawiającą wpływ zmiennej Y na zmienną X w postaci x = J\y). Oba kierunki oddziaływania analizujemy, gdy badany związek ma charakter dwustronny, np. długość stażu pracy wpływa na wysokość wynagrodzenia, a z drugiej strony godziwa płaca jest czynnikiem oddziałującym na stabilność zatrudnienia, a zatem wpływa na długość stażu pracy w firmie.
Najczęściej mamy do czynienia ze związkami przyczynowo--skutkowymi, np. zwiększenie podaż}' warzyw w okresie jesiennym powoduje obniżenie ich cen, zwiększenie liczby zarejestrowanych samochodów powoduje wzrost liczby wypadków drogowych. W takich wypadkach analizuje się tylko jedną funkcję regresji.
Analiza regresji pozostaje w ścisłym związku z badaniami korelacji. Obie te metody nawzajem się uzupełniają i wynikają jedna z drugiej.
Obserwacje dotyczące dwóch cech w badanej zbiorowości mogą być przedstawione w postaci szeregów lub po pogrupowaniu, w postaci tablicy korelacyjnej. Gdy cechy są mierzalne, chcąc określić rodzaj związku, posługujemy się często metodą graficzną, tzw. diagramem korelacyjnym.
Najprostszym sposobem oceny związku jest zestawienie szeregów prezentujących wartości obu badanych zmiennych. Jeżeli stwierdzimy, że zmiany wartości obu cech przebiegają w tym samym kierunku, tzn. wzrost wartości jednej cechy łączy' się ze zwiększeniem wartości drugiej lub też wartości obu cech maleją, jest to korelacja dodatnia. Jeżeli natomiast zmiany są różnokicrunkowc, czyli wzrostowi wartości jednej cechy towarzyszy spadek wartości drugiej, mówimy o korelacji ujemnej. Trzeba mieć na względzie, że poszczególne obserwacje mogą odbiegać od stwierdzonej prawidłowości. Prawidłowość może być zakłócana działaniem różnych przyczyn, wśród których mogą być znaczące cechy nic uwzględnione w badaniu, jak również czynniki o charakterze przypadkowym (losowym).
P3.1. W „Gazecie Wyborczej” z. 3 V 1994 r. podano ceny mieszkań oferowanych do sprzedaży w wybranych miastach w min zl (y,) oraz powierzchnię tych mieszkań w nr (*;).
x\ |
26 |
31 |
33 |
35 |
36 |
51 |
54 |
60 |
60 |
63 |
104 |
110 |
130 |
150 |
125 |
140 |
230 |
180 |
280 |
250 |
350 |
320 |
560 |
200 |
765 |
605 |
450 |
230 |
Pomimo zauważalnych różnic cen mieszkań o tym samym lub zbliżonym metrażu (np. z dwóch mieszkań 60 m2 jedno kosztuje 320 min zl, a drugie 560 min zl), spowodowanych różnymi czynnikami, jak np. lokalizacja, standard wyposażenia, telefon, ujawnia się logiczna prawidłowość, polegająca na wzroście ceny wraz ze wzrostem powierzchni mieszkania do 104 m2, natomiast cena mieszkań większych maleje wraz ze wzrostem powierzchni. Zmiana kierunku związku z dodatniego (wzrost X, wzrost Y) na ujemny (wzrost .V, spadek ij wskazuje, że mamy do czynienia z korelacją krzywoliniową.
123