STYL ŻYCIA DOROSŁYCH
STYL ŻYCIA DOROSŁYCH
POLAKÓW
POLAKÓW
A
A
CZYNNIK
CZYNNIK
I
I
RYZYKA
RYZYKA
CHORÓB SERC
CHORÓB SERC
A
A
Wykład 8
Wykład 8
Wprowadzenie do analizy
Wprowadzenie do analizy
regresji
regresji
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Siła związku – współczynnik
Siła związku – współczynnik
korelacji
korelacji
Współczynnik korelacji może
Współczynnik korelacji może
przyjmować wartości z przedziału:
przyjmować wartości z przedziału:
•
(0; 1) , plus – pozytywna, 1 idealna
(0; 1) , plus – pozytywna, 1 idealna
•
(-1; 0), minus – ujemny związek, 1 idealny
(-1; 0), minus – ujemny związek, 1 idealny
+1 =idealny związek
+1 =idealny związek
-1 = idealny związek
-1 = idealny związek
•
To, że współczynnik korelacji jest ujemny
To, że współczynnik korelacji jest ujemny
nie oznacza, że jest mniej istotny, czy
nie oznacza, że jest mniej istotny, czy
silny, niż pozytywny
silny, niż pozytywny
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
ZARYS PROBLEMATYKI
ZARYS PROBLEMATYKI
W jaki sposób można przewidzieć
W jaki sposób można przewidzieć
zmienność jednej zmiennej na
zmienność jednej zmiennej na
podstawie informacji o drugiej
podstawie informacji o drugiej
zmiennej
zmiennej
?
?
Jak zmieniają się wartości jednej
Jak zmieniają się wartości jednej
zmiennej wraz ze zmianą wartości
zmiennej wraz ze zmianą wartości
drugiej zmiennej?
drugiej zmiennej?
Wnioskowanie w kategoriach
Wnioskowanie w kategoriach
przyczyny i skutku
przyczyny i skutku
Nikotyna przyczyną
Nikotyna przyczyną
zwiększonego ryzyka
zwiększonego ryzyka
choroby wieńcowej
choroby wieńcowej
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
problem
problem
Zależność między liczbą wypalanych
Zależność między liczbą wypalanych
papierosów i chorobą wieńcową
papierosów i chorobą wieńcową
Chcielibyśmy przewidzieć
Chcielibyśmy przewidzieć
śmiertelność spowodowaną chorobą
śmiertelność spowodowaną chorobą
wieńcową dla kraju w którym dorośli
wieńcową dla kraju w którym dorośli
wypalają średnio 20 papierosów
wypalają średnio 20 papierosów
dziennie
dziennie
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Palenie papierosów i
Palenie papierosów i
umieralność na chorobę
umieralność na chorobę
wieńcową w 21 krajach
wieńcową w 21 krajach
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Dane w SPSS
Dane w SPSS
Dane wpisane jak w
Dane wpisane jak w
schemacie
schemacie
korelacyjnym
korelacyjnym
Zmienna na podstawie
Zmienna na podstawie
której będziemy
której będziemy
przewidywać to:
przewidywać to:
Liczba papierosów
Liczba papierosów
(zmienna
(zmienna
wyjaśniająca,
wyjaśniająca,
predyktor)
predyktor)
Umieralność to
Umieralność to
zmienna wyjaśniana,
zmienna wyjaśniana,
zmienna zależna
zmienna zależna
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Niezbędna wizualizacja
Niezbędna wizualizacja
związku
związku
Zanim przeprowadzimy analizę
Zanim przeprowadzimy analizę
regresji niezbędne jest przyjrzenie się
regresji niezbędne jest przyjrzenie się
wykresowi rozrzutu dla predyktora i
wykresowi rozrzutu dla predyktora i
zamiennej kryterialnej w celu
zamiennej kryterialnej w celu
wyśledzenia:
wyśledzenia:
Zależności nieliniowej
Zależności nieliniowej
•
Interesujemy się zależnością liniową –
Interesujemy się zależnością liniową –
będziemy robić analizę regresji liniowej
będziemy robić analizę regresji liniowej
Wyników skrajnych
Wyników skrajnych
(outlierów)
(outlierów)
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Robimy prosty
Robimy prosty
wykres rozrzutu
wykres rozrzutu
Według konwencji:
Według konwencji:
•
Predyktor na osi X
Predyktor na osi X
•
Zmienna zależna na
Zmienna zależna na
osi Y
osi Y
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Linie proste
Linie proste
Możemy narysować linię prostą jeśli
Możemy narysować linię prostą jeśli
znamy:
znamy:
•
Jej nachylenie względem osi x
Jej nachylenie względem osi x
(współczynnik b)
(współczynnik b)
•
Mówi o sile nachylenia i kierunku związku
Mówi o sile nachylenia i kierunku związku
•
Miejsce, w którym przecina się z osią y
Miejsce, w którym przecina się z osią y
(stała, b
(stała, b
0
0
)
)
0
b
bx
y
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Linia regresji
Linia regresji
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Co jest lepszym opisem
Co jest lepszym opisem
danych
danych
Średni wskaźnik
umieralności wynosi 14,52
Czy przewidywanie w oparciu
o średnią,
czy też o linię regresji
jest lepszym opisem zależności
W którym przypadku byłby
większy błąd predykcji?
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Dlaczego szukamy linii
Dlaczego szukamy linii
regresji?
regresji?
Może zależy nam na przewidywaniu
Może zależy nam na przewidywaniu
Częściej jednak interesuje nas
Częściej jednak interesuje nas
zrozumienie zależności
zrozumienie zależności
.
.
•
Jak szybko wzrasta wskaźnik
Jak szybko wzrasta wskaźnik
umieralności na chorobę wieńcową wraz
umieralności na chorobę wieńcową wraz
ze wzrostem liczby spalanych
ze wzrostem liczby spalanych
papierosów o 1 jednostkę (w tym
papierosów o 1 jednostkę (w tym
przypadku o 1 papierosa dziennie)?
przypadku o 1 papierosa dziennie)?
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Linia regresji
Linia regresji
wzór
wzór
•
Ŷ
Ŷ
=
=
przewidywana wartość
przewidywana wartość
Y
Y
(
(
wskaźnik
wskaźnik
umieralności na chorobę wieńcową na 10000)
umieralności na chorobę wieńcową na 10000)
•
X
X
=
=
liczba spalanych papierosów w danym
liczba spalanych papierosów w danym
kraju na 1 dorosłego (predyktor – zmienna
kraju na 1 dorosłego (predyktor – zmienna
niezależna)
niezależna)
•
Współczynniki regresji szacują jak dokładnie
Współczynniki regresji szacują jak dokładnie
wyniki Y są przewidywane przez to równanie
wyniki Y są przewidywane przez to równanie
liniowe
liniowe
stala
nachylenia
ˆ
B
X
B
Y
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Współczynniki w równaniu
Współczynniki w równaniu
regresji
regresji
Współczynniki:
Współczynniki:
Współczynnik nachylenia
Współczynnik nachylenia
prostej
prostej
względem osi X
względem osi X
•
Zmiana w przewidywanych wartościach
Zmiana w przewidywanych wartościach
Y, gdy X wzrasta o 1 jednostkę
Y, gdy X wzrasta o 1 jednostkę
stała
stała
•
punkt przecięcia linii regresji z osią Y
punkt przecięcia linii regresji z osią Y
•
wartość
wartość
Ŷ
Ŷ
gdy
gdy
X
X
= 0
= 0
•
często w równaniu oznaczana literą „a”
często w równaniu oznaczana literą „a”
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Analiza> regresja> regresja
Analiza> regresja> regresja
liniowa
liniowa
W prostej regresji liniowej mamy tylko 1 predyktor
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Analiza regresji podaje
Analiza regresji podaje
•
Ogólny wskaźnik dobroci dopasowania naszego modelu
Ogólny wskaźnik dobroci dopasowania naszego modelu
Na ile nasz predyktor dokładnie przewiduje wartości
Na ile nasz predyktor dokładnie przewiduje wartości
zmiennej zależnej
zmiennej zależnej
•
oszacowania obu współczynników regresji (czy są
oszacowania obu współczynników regresji (czy są
istotnie różne od zera)
istotnie różne od zera)
•
Możemy zaznaczyć statystyki opisowe (współczynnik
Możemy zaznaczyć statystyki opisowe (współczynnik
korelacji będzie podany)
korelacji będzie podany)
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Oszacowanie
Oszacowanie
współczynników
współczynników
Do predykcji w równaniu regresji patrzymy na
niewystandaryzowane współczynniki:
punkt przecięcia linii regresji z osią Y (stała)
• Jeśli papierosy=0, to wskaźnik umieralności na CW=2,37
współczynnik nachylenia prostej B określony nazwą
predyktora (dzienna liczba papierosów)
•
zmiana w zmiennej przewidywanej, jeśli wartość predyktora
zmiana w zmiennej przewidywanej, jeśli wartość predyktora
zmieni się o jednostkę (u nas 1 papierosa)
zmieni się o jednostkę (u nas 1 papierosa)
•
nasz model przewiduje, że jeśli liczba wypalanych papierosów
nasz model przewiduje, że jeśli liczba wypalanych papierosów
wzrośnie o 1, to o 2,04 osób wzrośnie wskaźnik umieralności
wzrośnie o 1, to o 2,04 osób wzrośnie wskaźnik umieralności
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Pr
Pr
zewidywanie
zewidywanie
•
Chcielibyśmy przewidzieć wielkość wskaźnika
Chcielibyśmy przewidzieć wielkość wskaźnika
umieralności na CW w kraju w którym średnio
umieralności na CW w kraju w którym średnio
dorosły wypala 6 papierosów dziennie.
dorosły wypala 6 papierosów dziennie.
•
Na podstawie modelu regresji
Na podstawie modelu regresji
przewidywalibyśmy, iż około 15
przewidywalibyśmy, iż około 15
/10,000
/10,000
w
w
tym kraju umrze na chorobę wieńcową.
tym kraju umrze na chorobę wieńcową.
61
,
14
37
.
2
6
*
04
.
2
ˆ
37
.
2
04
.
2
ˆ
Y
X
B
X
B
Y
stala
nachylenia
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Dokładność predykcji
Dokładność predykcji
Fińscy palacze wypalają dziennie
Fińscy palacze wypalają dziennie
6
6
papierosów
papierosów
Przewidywaliśmy, iż w związku z tym
Przewidywaliśmy, iż w związku z tym
14.61
14.61
umrze
umrze
/10,000
/10,000
na CW
na CW
Wskaźnik umieralności w tym kraju
Wskaźnik umieralności w tym kraju
wynosi
wynosi
23 /10,000
23 /10,000
Nasz błąd predykcji („reszta”)
Nasz błąd predykcji („reszta”)
•
reszta
reszta
= 23 - 14.61 = 8.39
= 23 - 14.61 = 8.39
•
Dość duży błąd, o 8 osób na 10000
Dość duży błąd, o 8 osób na 10000
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Reszta
Predykcj
a
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Metoda najmniejszych
Metoda najmniejszych
kwadratów
kwadratów
Sposób na znalezienie takiej linii,
Sposób na znalezienie takiej linii,
która przebiega jak najbliżej jak
która przebiega jak najbliżej jak
największej ilości punktów (naszych
największej ilości punktów (naszych
wyników)
wyników)
Linia najlepszego dopasowania jest
Linia najlepszego dopasowania jest
wyznaczana tak, aby zachować jak
wyznaczana tak, aby zachować jak
najmniejsze odległości od
najmniejsze odległości od
obserwowanych wyników
obserwowanych wyników
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Niektóre punkty leżą powyżej,
inne poniżej linii – wskazują na
różnice między naszym
modelem dopasowanym do
danych a danymi
Różnice między danymi a
modelem to reszty
Niektóre różnice są dodatnie,
inne ujemne – gdybyśmy je
dodali do siebie to by się
zniosły – więc najpierw
podnosimy do kwadratu
Wybieramy taką linię dla której
suma kwadratów różnic jest
najmniejsza.
SPSS podaje nam współczynnik
b i punkt przecięcia dla linii
regresji
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Błąd standardowy
Błąd standardowy
oszacowania
oszacowania
Miara dokładności naszych przewidywań dla
Miara dokładności naszych przewidywań dla
prostej regresji
prostej regresji
•
Wskaźnik tego, jak ogólnie duży błąd popełniamy
Wskaźnik tego, jak ogólnie duży błąd popełniamy
przewidując wyniki Y na podstawie X
przewidując wyniki Y na podstawie X
•
Pokazuje jak bardzo się mylimy przewidując wyniki
Pokazuje jak bardzo się mylimy przewidując wyniki
zmiennej zależnej w jej jednostkach (wskaźniki
zmiennej zależnej w jej jednostkach (wskaźniki
korelacyjne nie odwołują się do oryginalnych jednostek)
korelacyjne nie odwołują się do oryginalnych jednostek)
•
Zależy nam na tym, aby był jak najmniejszy
Zależy nam na tym, aby był jak najmniejszy
2
)
ˆ
(
2
ˆ
N
Y
Y
s
Y
Y
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
R
R
= .713
= .713
– korelacja między x i y (wartość dodatnia),
– korelacja między x i y (wartość dodatnia),
informuje o tym jak dobrze wyniki układają się wokół prostej
informuje o tym jak dobrze wyniki układają się wokół prostej
regresji
regresji
R
R
2
2
= .7132 =.508
= .7132 =.508
(miara wielkości efektu)
(miara wielkości efektu)
Około 5
Około 5
0%
0%
wariancji wyników we wskaźniku umieralności na
wariancji wyników we wskaźniku umieralności na
CW jest związane ze zmiennością w paleniu papierosów w
CW jest związane ze zmiennością w paleniu papierosów w
danym kraju.
danym kraju.
Skorygowane
Skorygowane
R
R
2
2
– bierze poprawkę na liczbę uczestników w
– bierze poprawkę na liczbę uczestników w
badaniu i liczbę predyktorów, dla prostej regresji liniowej
badaniu i liczbę predyktorów, dla prostej regresji liniowej
bardzo zbliżone do
bardzo zbliżone do
R
R
2
2
, znaczenie interpretacyjne wzrasta
, znaczenie interpretacyjne wzrasta
przy regresji wielokrotnej (przy większej liczbie
przy regresji wielokrotnej (przy większej liczbie
predyktorów)
predyktorów)
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
R
R
2
2
jako procent wyjaśnionej
jako procent wyjaśnionej
wariancji
wariancji
Proporcja wariancji, która jest wyjaśniona
Proporcja wariancji, która jest wyjaśniona
przez liniowy związek z X
przez liniowy związek z X
•
Proporcja redukcji błędu, którą osiągamy dzięki
Proporcja redukcji błędu, którą osiągamy dzięki
wprowadzeniu X do równania regresji
wprowadzeniu X do równania regresji
ogolem
regresja
SK
SK
R
2
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Czy model jest istotny?
Czy model jest istotny?
Tabela analizy wariancji pokazuje, czy linia regresji
(najlepszego dopasowania) przewiduje nasze wyniki lepiej niż to losowo.
W tym wypadku F(1,19)=19,59; p<0,001, więc jest mało prawdopodobne,
żeby związek między tymi zmiennymi był nieistotny,
żeby współczynnik nachylenia prostej b=0 - odrzucamy hipotezę zerową
W przypadku prostej analizy regresji, model będzie zawsze istotny,
kiedy współczynnik nachylenia prostej będzie istotny
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Jakie testujemy hipotezy
Jakie testujemy hipotezy
Hipotezy zerowe
Hipotezy zerowe
•
B nachylenia
B nachylenia
= 0
= 0
•
B stała
B stała
= 0
= 0
•
Korelacja w populacji
Korelacja w populacji
(
(
) = 0
) = 0
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Testowanie współczynnika
Testowanie współczynnika
nachylenia linii i stałej
nachylenia linii i stałej
•
Gdyby model był zły, wtedy zmiana jeśli zmienia się wartość
Gdyby model był zły, wtedy zmiana jeśli zmienia się wartość
predyktora, zmiana w zmiennej przewidywanej byłaby bliska zeru
predyktora, zmiana w zmiennej przewidywanej byłaby bliska zeru
•
Jeśli wybrana przez nas zmienna istotnie przewiduje zmienną zależną,
Jeśli wybrana przez nas zmienna istotnie przewiduje zmienną zależną,
wtedy współczynnik b powinien być istotnie rożny od zera
wtedy współczynnik b powinien być istotnie rożny od zera
Istotność współczynników regresji sprawdzamy za pomocą testu t,
Istotność współczynników regresji sprawdzamy za pomocą testu t,
czy są istotnie różne od zera
czy są istotnie różne od zera
•
Nawet jeśli stała jest nieistotna (tak jak w naszym przypadku), dla
Nawet jeśli stała jest nieistotna (tak jak w naszym przypadku), dla
dokładności predykcji umieszczamy ją w równaniu
dokładności predykcji umieszczamy ją w równaniu
BS
B
t
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
pytanka
pytanka
Co to oznacza, jeśli współczynnik
Co to oznacza, jeśli współczynnik
nachylenia prostej regresji jest
nachylenia prostej regresji jest
nieistotny
nieistotny
?
?
•
W jaki sposób jest to związane z R
W jaki sposób jest to związane z R
?
?
Co to oznacza, jeśli stała jest
Co to oznacza, jeśli stała jest
nieistotna
nieistotna
?
?
Czy istotny współczynnik nachylenia
Czy istotny współczynnik nachylenia
prostej oznacza, że nasze
prostej oznacza, że nasze
przewidywanie jest całkiem dobre
przewidywanie jest całkiem dobre
?
?
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Na początku wykładu
Na początku wykładu
Chcieliśmy przewidzieć śmiertelność
Chcieliśmy przewidzieć śmiertelność
spowodowaną chorobą wieńcową dla
spowodowaną chorobą wieńcową dla
kraju w którym dorośli wypalają
kraju w którym dorośli wypalają
średnio 20 papierosów dziennie
średnio 20 papierosów dziennie
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
37
.
2
04
.
2
ˆ
X
B
X
B
Y
stala
nachylenia
17
,
43
37
.
2
20
*
04
.
2
ˆ
37
.
2
04
.
2
ˆ
Y
X
B
X
B
Y
stala
nachylenia
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Analiza regresji
Analiza regresji
Rozszerzenie analizy korelacyjnej
Rozszerzenie analizy korelacyjnej
•
analiza korelacji - mówi o sile związku między
analiza korelacji - mówi o sile związku między
dwiema zmiennymi (siła i kierunek związku)
dwiema zmiennymi (siła i kierunek związku)
Pozwala na oszacowanie związku między
Pozwala na oszacowanie związku między
zmienną zależną (y) i jedną lub więcej
zmienną zależną (y) i jedną lub więcej
zmiennymi niezależnymi (x, predyktory)
zmiennymi niezależnymi (x, predyktory)
Możemy przewidywać wynik pojedynczej
Możemy przewidywać wynik pojedynczej
osoby znając jej wynik na zmiennej
osoby znając jej wynik na zmiennej
niezależnej
niezależnej
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
W analizie regresji liniowej
W analizie regresji liniowej
Idziemy krok dalej, próbujemy przewidzieć
Idziemy krok dalej, próbujemy przewidzieć
wartości zmiennej zależnej na podstawie
wartości zmiennej zależnej na podstawie
zmiennej, którą obierzemy za niezależną
zmiennej, którą obierzemy za niezależną
(predyktor)
(predyktor)
•
O ile zmieni się zmienna zależna, gdy zmieni
O ile zmieni się zmienna zależna, gdy zmieni
się wartość predyktora
się wartość predyktora
•
Przewidujemy na podstawie naszych danych,
Przewidujemy na podstawie naszych danych,
jak będzie zmieniała się zmienna zależna
jak będzie zmieniała się zmienna zależna
Budujemy model, który będzie
Budujemy model, który będzie
podsumowywał dane, zależność między
podsumowywał dane, zależność między
zmiennymi
zmiennymi
•
Dopasowujemy prostą regresji do danych
Dopasowujemy prostą regresji do danych
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Model w regresji liniowej
Model w regresji liniowej
Oszacowanie zarówno przy pozytywnym jak i
Oszacowanie zarówno przy pozytywnym jak i
negatywnym związku między zmiennymi.
negatywnym związku między zmiennymi.
Szukamy ( SPSS robi to za nas) linii, która
Szukamy ( SPSS robi to za nas) linii, która
najlepiej pasuje do rozkładu wyników.
najlepiej pasuje do rozkładu wyników.
•
zmienna x - predyktor umieszczany na osi poziomej (oś
zmienna x - predyktor umieszczany na osi poziomej (oś
x)
x)
•
zmienna y - zmienna wyjaśniana na osi pionowej y
zmienna y - zmienna wyjaśniana na osi pionowej y
Regresja linowa próbuje dostosować linię do
Regresja linowa próbuje dostosować linię do
rozkładu wyników metodą najmniejszych
rozkładu wyników metodą najmniejszych
kwadratów.
kwadratów.
Materiały do wykładu
Materiały do wykładu
Izabela Krejtz
Izabela Krejtz
Podsumowanie
Podsumowanie
Regresja liniowa odpowie na pytanie:
Regresja liniowa odpowie na pytanie:
•
jak bardzo zmieni się y jeśli zmieni się x o jednostkę
jak bardzo zmieni się y jeśli zmieni się x o jednostkę
•
czyli jeśli x zmieni się o określoną wielkość, będziemy
czyli jeśli x zmieni się o określoną wielkość, będziemy
wiedzieć, o ile zmieni się y
wiedzieć, o ile zmieni się y
możemy przewidywać y na podstawie x
możemy przewidywać y na podstawie x
możemy przewidzieć np. wysokość sprzedaży
możemy przewidzieć np. wysokość sprzedaży
Coli dietetycznej na podstawie zmian jej ceny.
Coli dietetycznej na podstawie zmian jej ceny.
Jeśli cena coli wzrośnie, spadnie sprzedaż tej coli
Jeśli cena coli wzrośnie, spadnie sprzedaż tej coli
(prosta korelacja) - równanie regresji pozwoli nam
(prosta korelacja) - równanie regresji pozwoli nam
na przewidywanie o ile spadnie sprzedaż, jeśli
na przewidywanie o ile spadnie sprzedaż, jeśli
wzrośnie cena o określoną wartość.
wzrośnie cena o określoną wartość.
Można sugerować wnioski przyczynowo skutkowe
Można sugerować wnioski przyczynowo skutkowe
- chociaż badanie korelacyjne
- chociaż badanie korelacyjne