Analiza zbiorowości badanej ze względu na 2 cechy
Zad.1. Przedstawione w poniższej tabeli dane stanowią wycinek badania na temat wpływu czynników różnorakiej natury na ceny domów. W ramach badania zgromadzono informację o wartości domu, liczbie pokoi, odległości od centrum aglomeracji oraz wskaźniku skażenia powietrza.
Y (wartość) |
X1 (l.pokoi) |
X2 (odległość) |
X3 (skażenie) |
25 |
7 |
4 |
4 |
19 |
3 |
5 |
5 |
25 |
6 |
6 |
3 |
20 |
5 |
2 |
7 |
28 |
7 |
3 |
5 |
21 |
6 |
3 |
6 |
Korelacja
Narysować wykres, który będzie ilustrował współzależność pomiędzy odległością od centrum oraz skażeniem powietrza. Jak nazywa się ten typ wykresu?
Na podstawie wykresu proszę odpowiedzieć na pytania: jaki jest kierunek współzależności?, jak silna jest współzależność?
Obliczyć i zinterpretować miarę, która pozwoli określić kierunek i siłę współzależności między zmiennymi.
Regresja liniowa
Narysować diagram korelacyjny dla zmiennych X1 oraz Y.
Oszacować parametry liniowej funkcji regresji między „liczbą pokoi” (X1) a „wartością” (Y) oraz zapisać równanie regresji. Nanieść na diagram korelacyjny prostą regresji.
Zinterpretować współczynnik kierunkowy oraz wyraz wolny równania regresji.
Obliczyć oraz zinterpretować miary dobroci dopasowania modelu do danych: odchylenie standardowe składnika resztowego, współczynnik zmienności resztowej, współczynniki determinacji.
Wskazać na diagramie obserwacje odstające (o ile takie występują). Opisać wpływ obserwacji odstających na równanie regresji.
Na podstawie równania regresji dokonać predykcji średniej ceny mieszkania z 6 pokojami.
Na podstawie równania regresji dokonać predykcji średniej ceny mieszkania z 1, z 15 pokojami. Określić czy wyznaczanie średniej ceny dla wskazanych wartości zmiennej objaśniającej jest zasadne.
Wzory
Zad.2. Tabela przedstawia dane dotyczące nakładów na promocję (X) oraz wyniki sprzedaży (Y).
X |
Y |
1,0 |
3,0 |
2,0 |
4,5 |
2,6 |
6,0 |
1,0 |
2,5 |
3,0 |
7,5 |
2,4 |
6,5 |
Narysować diagram korelacyjny.
Obliczyć i zinterpretować współczynnik korelacji liniowej pomiędzy badanymi zmiennymi.
* Obliczyć i zinterpretować współczynnik korelacji rangowej pomiędzy badanymi zmiennymi.
Oszacować i zinterpretować parametry liniowej funkcji regresji opisującej zależność pomiędzy nakładami na promocję oraz wynikami sprzedaży.
Zbadać dopasowanie funkcji regresji do danych empirycznych za pomocą odpowiednich miar.
Jakich wyników sprzedaży należy spodziewać się dla nakładów na promocję równych 1,5 i 2,5 mln zł?
Jak zmieni się wielkość sprzedaży, gdy nakłady na promocję wzrosną o 2 mln zł, a jak gdy spadną o 1,7 mln zł?
1