Statystyka dla jakości produktów i usług
Six sigma i inne strategie
Wprowadzenie do analizy
korelacji i regresji
StatSoft Polska
Wybrane zagadnienia analizy korelacji
Przy analizie zjawisk i procesów stanowiących przedmiot badania
zazwyczaj charakteryzujemy jednostki badane za pomocą więcej
niż jednej cechy.
Bardzo często interesują nas powiązania jakie zachodzą pomiędzy
analizowanymi cechami i w zwiÄ…zku z tym zachodzi potrzeba ich
Å‚Ä…cznego badania.
Celem takiej analizy jest stwierdzenie, czy między badanymi
zmiennymi zachodzą jakieś zależności, jaka jest ich siła, jaka jest
ich postać i kierunek.
Współzależność między zmiennymi może być dwojakiego
rodzaju: funkcyjna lub stochastyczna (probabilistyczna).
Istota zależności funkcyjnej polega na tym, że zmiana wartości
jednej zmiennej powoduje ściśle określoną zmianę wartości
drugiej zmiennej. W przypadku zależności funkcyjnej, określonej
wartości jednej zmiennej (X) odpowiada jedna i tylko jedna
wartość drugiej zmiennej (Y).
Symbolem X oznaczamy zmienną niezależną (objaśniającą),
natomiast symbolem Y - zmienną zależną (objaśnianą).
Zależność stochastyczna występuje wtedy, gdy wraz ze zmianą
wartości jednej zmiennej zmienia się rozkład
prawdopodobieństwa drugiej zmiennej.
Szczególnym przypadkiem zależności stochastycznej jest
zależność korelacyjna (statystyczna). Polega ona na tym, że
określonym wartościom jednej zmiennej odpowiadają ściśle
określone średnie wartości drugiej zmiennej.
Możemy zatem ustalić, jak zmieni się - średnio biorąc - wartość
zmiennej zależnej Y w zależności od wartości zmiennej
niezależnej X.
Na zamieszczonym poniżej wykresach przedstawiono
przykładowe postacie związków funkcyjnych i statystycznych.
ZwiÄ…zek funkcyjny, liniowy ZwiÄ…zek funkcyjny, nieliniowy
46 140
120
42
100
38
80
60
34
40
30
20
26 0
3 4 5 6 7 8 9 10 11 12 3 4 5 6 7 8 9 10 11 12
X X
ZwiÄ…zek statystyczny, liniowy ZwiÄ…zek statystyczny, nieliniowy
44 140
42
120
40
38 100
36
80
34
32 60
30
40
28
26 20
3 4 5 6 7 8 9 10 11 3 4 5 6 7 8 9 10 11 12
X X
Związki typu statystycznego są możliwe do wykrycia oraz
ilościowego opisu w przypadku, kiedy mamy do czynienia z wieloma
obserwacjami, opisującymi badane obiekty, zjawiska czy też procesy.
Y
Y
Y
Y
Opisywane tutaj postacie związków pomiędzy zmiennymi zawęzimy
do związków liniowych.
Ogólnie związki pomiędzy zmiennymi mogą przyjmować postać
krzywej drugiego i wyższych stopni lub też inne postacie.
Dlatego też badając dane, ważnym krokiem jest sporządzenie
wykresu rozrzutu wartości dwóch badanych zmiennych. Jeśli okaże
się, że badany związek nie jest liniowy, wówczas trzeba zastosować
odpowiednie rozwiÄ…zanie nieliniowe.
Współczynnik korelacji liniowej
Statystyką, która opisuje siłę liniowego związku pomiędzy dwiema
zmiennymi jest współczynnik korelacji z próby (r).
Przyjmuje on wartości z przedziału domkniętego <-1; 1>.
Wartość 1 oznacza występowanie doskonałej korelacji ujemnej (to
znaczy sytuację, w której punkty leżą dokładnie na prostej,
skierowanej w dół), a wartość 1 oznacza doskonałą korelację
dodatnią (punkty leżą dokładnie na prostej, skierowanej w górę).
Wartość 0 oznacza brak korelacji liniowej.
Wzór do obliczania współczynnik korelacji ma postać:
"(x - x)(yi - y)
i
r =
"(x - x)2"(y - y)2
i i
gdzie xi oraz yi oznaczają odpowiednio wartości zmiennych x i y,
a oraz oznaczają średnie wartości tych zmiennych.
x
y
Po obliczeniu wartości współczynnika korelacji zawsze zalecane jest
utworzenie wykresu rozrzutu. Chodzi o to, aby wizualnie stwierdzić,
czy badany związek rzeczywiście najlepiej opisuje funkcja liniowa
Może się bowiem okazać, że wyliczona wartość współczynnika
korelacji jest zbliżona do zera, a mimo to pomiędzy korelowanymi
zmiennymi występuje współzależność, tyle że nieliniowa.
Na poniższym rysunku przedstawiono przykładowy wygląd
wykresów przy określonych wartościach współczynnika korelacji.
Badanie istotności współczynnika korelacji liniowej
Współczynnik korelacji r (z próby) stanowi ocenę współczynnika
korelacji Á w zbiorowoÅ›ci generalnej. W zwiÄ…zku z tym pojawia
się potrzeba testowania jego istotności statystycznej.
FormuÅ‚ujemy hipotezÄ™ zerowÄ… H0: Á = 0, wobec alternatywnej:
H1: Á`"0, a nastÄ™pnie obliczamy wartość statystyki testowej:
N - 2
t = r
1- r2
i porównujemy jej wartość z odpowiednią wartością krytyczną i
podejmujemy odpowiednią decyzję co do prawdziwości H0.
Przykład w STATISTICA
Wybrane zagadnienia analizy regresji prostej
Analiza regresji stanowi w stosunku do analizy korelacji dalszy
krok w zakresie ilościowego opisu powiązań zachodzących
między zmiennymi.
Pojęcie funkcji w zastosowaniu do badań empirycznych nie może
być zazwyczaj stosowane bez pewnych zastrzeżeń. Elementarna
matematyka wymaga bowiem, aby jednej wartości zmiennej
niezależnej (objaśniającej, predyktora) była przyporządkowana
dokładnie jedna wartość zmiennej zależnej (objaśnianej).
Badacz natomiast w praktyce ma zazwyczaj do czynienia z
sytuacją, w której przy kilku powtórzeniach doświadczenia,
zachowując za każdym razem te same wartości zmiennej
niezależnej, otrzymuje inne wartości mierzonej zmiennej zależnej.
Wartości te zwykle leżą blisko siebie, ale nie są na ogół
identyczne.
Tak więc rozsądek podpowiada, żeby pojęcie funkcji uczynić
bardziej elastycznym, a terminy zmienna niezależna i zmienna
zależna dostosować odpowiednio do nowych potrzeb.
Dla tego celu w statystyce matematycznej wprowadzono pojęcie
regresji oznaczajÄ…ce obliczenia wykorzystywane do
ilościowego opisu zależności jednej zmiennej od drugiej.
Model regresji liniowej prostej (tzn. takiej w przypadku której
występuje tylko jeden predyktor) przyjmuje postać:
Y = ²0 + ²1x + µ
µ
²0 ²1
gdzie oznacza wyraz wolny, współczynnik kierunkowy a
błąd.
Jak to zostało już wcześniej powiedziane zazwyczaj nie wszystkie
punkty układają się dokładnie na prostej regresji. yródłem błędu są
wpływy innych nie uwzględnionych w modelu zmiennych, takich
jak np. błędy pomiaro
Wyszukiwarka
Podobne podstrony:
korelacja i regresjaElementy analizy korelacji i regresjiWzory korelacja i regresjakorelacja i regresjawzory (korelacja, regresja,czasowe)Teoria 5 Korelacja i regresjamet4zn korelacje regresja studentKorelacja i regresja liniowaregresja&korelacjaregresja empirycznaTablice statystyczne wartości krytyczne współczynnika korelacji Pearsona06 Wspolczynniki korelacji rangowej i liniowejWyniki2 korelacja2regresjaWspomnienia z sesji regresingu Wojna w Wietnamiecele regresinguneuronalne korelaty obecnoscizadania korelacje1 index ramka regresingwięcej podobnych podstron