Analiza zależności dwóch cech statystycznych ilościowych


Materiały do ćwiczeń z przedmiotu Statystyka, mgr Oskar Knapik
Analiza zależności dwóch cech statystycznych ilościowych.
Analiza korelacji i regresji liniowej
Zagadnienia:
üð diagram korelacyjny,
üð kowariancja,
üð współczynnik korelacji liniowej Pearsona i jego interpretacja,
üð funkcja regresji liniowej dwóch zmiennych,
üð metoda najmniejszych kwadratów,
üð miary dobroci dopasowania funkcji regresji do danych empirycznych: odchylenie standardowe
składnika resztowego, współczynnik zmienności reszt, współczynnik zbieżności i współczynnik de-
terminacji liniowej.
üð DokÅ‚adność obliczeÅ„: 4 miejsca po przecinku.
Zad. 1. Zbadano zależność między liczbą reklam pewnego wyrobu emitowanego dziennie w telewizji a
wysokością obrotów (w mln zł) otrzymując następujące dane:
Liczba reklam ( xi )
3 5 4 5 7
Wielkość obrotów (w mln
10 13 14 16 15
zł) ( yi )
a) Narysować diagram korelacyjny. Co można stwierdzić na jego podstawie?
b) Obliczyć i zinterpretować kowariancję.
c) Obliczyć i zinterpretować współczynnik korelacji liniowej Pearsona.
d) Oszacować i zinterpretować parametry liniowej funkcji regresji opisującej zależność pomiędzy
liczba reklam i wielkość obrotów.
e) Zbadać dopasowanie funkcji regresji do danych empirycznych, przy pomocy odpowiednich miar
dopasowania
f) Dla ambitnych: Jak wykonać powyższą analizę w pakiecie R?
xi yi xi -ð x yi -ð y (xi -ð x)2 ( yi -ð y)2 (xi -ð x)( yi -ð y)
Lp.
1
2
3
4
5
Suma
Åšrednia
Miary dopasowania:
n
1 2
2
·ð Wariancja reszt: se =ð
åð(ð yi -ð wi )ð
n -ð 2
i=ð1
2
·ð Odchylenie standardowe reszt: se =ð se
Interpretacja...............
Materiały do ćwiczeń z przedmiotu Statystyka, mgr Oskar Knapik
se
·ð Współczynnik zmiennoÅ›ci reszt: Ve =ð ×ð100%
y
Interpretacja...............
n
2
åð(ð yi -ð wi )ð
i=ð1
·ð Współczynnik zbieżnoÅ›ci: fð2 =ð
n
2
åð(ð yi -ð y)ð
i=ð1
Interpretacja...............
·ð Współczynnik determinacji liniowej: R2 =ð 1-ðfð2
Interpretacja...............
g) Jakiej wielkości obrotów należy spodziewać się przy liczbie reklam wynoszącej 7?
h) Jak zmieni się wielkość obrotów, gdy liczba reklam wzrośnie o 2, a jak gdy spadnie o 3?
Zad. 2. Tabela przedstawia dane dotyczące kosztów poniesionych na reklamę ( X w mln zł) przez 6 kon-
cernów i wyniki ich sprzedaży (Y w mln zł)
xi yi xi -ð x yi -ð y (xi -ð x)2 ( yi -ð y)2 (xi -ð x)( yi -ð y)
Lp.
1 1,0 3,0 -1 -2 1 4 2
2 2,0 4,5 0 -0,5 0 0,25 0
3 2,6 6,0 0,6 1 0,36 1 0,6
4 1,0 2,5 -1 -2,5 1 6,25 2,5
5 3,0 7,5 1 2,5 1 6,25 2,5
6 2,4 6,5 0,4 1,5 0,16 2,25 0,6
Suma 12 30
Åšrednia - -
a) Narysować diagram korelacyjny.
b) Oblicz kowariancję między badanymi zmiennymi.
c) Obliczyć i zinterpretować współczynnik korelacji liniowej między badanymi zmiennymi.
d) Oszacować i zinterpretować parametry liniowej funkcji regresji opisującej zależność pomiędzy
kosztami poniesionymi na reklamę i wynikami sprzedaży.
e) Zbadać dopasowanie funkcji regresji do danych empirycznych, przy pomocy odpowiednich miar
dopasowania.
Materiały do ćwiczeń z przedmiotu Statystyka, mgr Oskar Knapik
yi wi yi -ð wi
Lp. ( yi -ð wi )2 ( yi -ð y)2
1 3.0
2 4.5
3 6.0
4 2.5
5 7.5
6 6.5
Suma
Miary dopasowania:
n
1 2
2
·ð Wariancja reszt: se =ð
åð(ð yi -ð wi )ð
n -ð 2
i=ð1
2
·ð Odchylenie standardowe reszt: se =ð se
Interpretacja...............
se
·ð Współczynnik zmiennoÅ›ci reszt: Ve =ð ×ð100%
y
Interpretacja...............
n
2
åð(ð yi -ð wi )ð
i=ð1
·ð Współczynnik zbieżnoÅ›ci: fð2 =ð
n
2
åð(ð yi -ð y)ð
i=ð1
Interpretacja...............
·ð Współczynnik determinacji liniowej: R2 =ð 1-ðfð2
Interpretacja...............
f) Jakich wyników sprzedaży należy spodziewać się przy nakładach na reklamę równych 1,5 i 2,5
mln zł?
g) Jak zmieni się wielkość sprzedaży, gdy nakłady na reklamę wzrosną o 2 mln zł., a jak gdy spadną
o 1,7 mln zł.?
h) Dla ambitnych: Jak wykonać powyższą analizę w pakiecie R?
Materiały do ćwiczeń z przedmiotu Statystyka, mgr Oskar Knapik
Zad. 3 Tabela przedstawia dane dotyczące ceny metra kwadratowego Y [w tys. zł] 6 wystawionych na
sprzedaż mieszkań w Krakowie i ich odległości X [w km] od Rynku Głównego.
xi yi
Lp. xi2 yi2 xi yi
1 9 3,0
2 5 3,5
3 2 4,5
4 13 1,5
5 11 2,5
6 8 3,0
Suma
Åšrednia - -
a) Narysować diagram korelacyjny.
b) Oblicz kowariancję między badanymi zmiennymi.
c) Obliczyć i zinterpretować współczynnik korelacji liniowej między badanymi zmiennymi.
d) Oszacować i zinterpretować parametry liniowej funkcji regresji opisującej zależność pomiędzy
ceną metra kwadratowego mieszkań i ich odległością od Rynku Głównego.
e) Zbadać dopasowanie funkcji regresji do danych empirycznych, przy pomocy odpowiednich miar
dopasowania.
yi wi yi -ð wi
Lp. ( yi -ð wi )2 ( yi -ð y)2 ( yi -ð y)2
1 3,0
2 3,5
3 4,5
4 1,5
5 2,5
6 3,0
Suma
Miary dopasowania:
n
1 2
2
·ð Wariancja reszt: se =ð
åð(ð yi -ð wi )ð
n -ð 2
i=ð1
2
·ð Odchylenie standardowe reszt: se =ð se
Interpretacja...............
se
Ve =ð ×ð100%
·ð Współczynnik zmiennoÅ›ci reszt:
y
Interpretacja...............
Materiały do ćwiczeń z przedmiotu Statystyka, mgr Oskar Knapik
n
2
åð(ð yi -ð wi )ð
i=ð1
·ð Współczynnik zbieżnoÅ›ci: fð2 =ð
n
2
åð(ð yi -ð y)ð
i=ð1
Interpretacja...............
·ð Współczynnik determinacji liniowej: R2 =ð 1-ðfð2
Interpretacja...............
f) Jakiej przeciętnej ceny metra kwadratowego należy się spodziewać dla mieszkań odległych o 12
km od Rynku i 6 km od Rynku?
g) Jak zmieni się cena metra kwadratowego, gdy odległość od Rynku wzrośnie o 3 km, a jak gdy
spadnie o 2,5 km?
h) Dla ambitnych: Jak wykonać powyższą analizę w pakiecie R?
Zad. 4 Losowo wybrano 6 zakładów produkcyjnych i zbadano je ze względu na wartość produkcji w mln
PLN (Y) i zatrudnienie w dziesiątkach osób (X). Otrzymano następujące wyniki:
Lp.
xi yi
1 3 7
2 4 7
3 5 8
4 5 7
5 6 8
6 7 9
Suma
Åšrednia
a) Narysować diagram korelacyjny.
b) Oblicz kowariancję między badanymi zmiennymi.
c) Obliczyć i zinterpretować współczynnik korelacji liniowej między badanymi zmiennymi.
d) Oszacować i zinterpretować parametry liniowej funkcji regresji opisującej zależność produkcji od
zatrudnienia.
e) Zbadać dopasowanie funkcji regresji do danych empirycznych, przy pomocy odpowiednich miar
dopasowania.
f) Ile przeciętnie może wynosić produkcja zakładu zatrudniającego 15 osób?
g) Dla ambitnych: Jak wykonać powyższą analizę w pakiecie R?
Materiały do ćwiczeń z przedmiotu Statystyka, mgr Oskar Knapik
Zad. 5 Fabryka mebli analizując kwartalną sprzedaż (w mln zł) oraz wydatki na reklamę (w tys. zł) uzy-
skała następujące informacje:
Kwartalne wy- Wielkość sprze- a) narysuj korelacyjny diagram rozrzutu,
datki na rekla- daży kwartalnej b) oblicz współczynnik korelacji liniowej Pearso-
mę (w (w mln zł) na,
tys. zł) c) wyznacz rachunkowo i graficznie obydwa rów-
1.8 26 nania regresji,
2.3 31 d) oceń stopień dopasowania funkcji regresji do
2.6 28 danych empirycznych,
2.4 30 e) oszacuj wielkość sprzedaży kwartalnej, jeśli
2.8 34 wydatki na reklamę będą kształtowały się na po-
ziomie 4 tys. zł.
Zad. 6 Pewne biuro nieruchomości w Krakowie jest zainteresowane zbadaniem zależności pomiędzy
powierzchnią sprzedawanych przez nich mieszkań (w m2 ) a ich ceną rynkową (w tys. zł). Uzyskany ma-
teriał empiryczny przedstawia poniższy szereg statystyczny:
Powierzchnia Cena a) narysuj korelacyjny diagram rozrzutu,
(w tys. zł) b) oblicz współczynnik korelacji liniowej Pearsona,
(w m2 )
c) wyznacz rachunkowo i graficznie obydwa rów-
80 340
nania regresji,
70 315
d) oceń stopień dopasowania funkcji regresji do
64 325
danych empirycznych,
50 300
e) Nowy klient chce sprzedać mieszkanie o po-
64 317
wierzchni 76 m2 . Oszacuj cenÄ™ rynkowÄ… tego
mieszkania.
Zad. 7 W banku Z zbadano zależność między stażem pracy zatrudnionych pracowników w latach (X) a
wysokością ich zarobków w zł (Y). Uzyskano następujące informacje: przeciętny staż pracy wynosił 5
lat, przeciętny zarobek 1200 zł. Współczynnik zmienności stażu pracy wynosił 20%. Współczynnik
zmienności płac  30%. Z kolei współczynnik korelacji pomiędzy stażem pracy a wysokością płac 0.75.
Na podstawie tych informacji:
a) wyznacz rachunkowo teoretyczne linie regresji,
b) oszacuj wysokość płacy dla dziesięcioletniego stażu pracy,
c) czy prawdą jest, ze staż pracy w 90% kształtuje zmienność zarobków zatrudnionych pracowni-
ków?
Zad. 8 Badanie działalności handlowej dostarczyły min. następujących informacji o powierzchni i wiel-
kości utargu:
a) wyznacz parametry teoretycznej funkcji regre-
Powierzchnia Dzienny utarg
sji liniowej w zależności od powierzchni oraz
(w m kw.) (w tys. zł)
odchylenie standardowe reszt modelu,
b) sklep ma powierzchniÄ™ 120 m kw. Na podsta-
wie wyznaczonego równania regresji oszacuj
20 3.5
możliwy utarg tego sklepu.
30 4.8
c) Sklep uzyskał dzienny w wysokości 7 tys. zł.
35 4.5
Określ powierzchnię sklepu.
40 3.0
d) Współczynnik korelacji między liczbą sprze-
45 5.0
dawców a utargiem wynosi 0,7. Która z cech
w większym stopniu wyjaśnia wielkość utargu:
liczba sprzedawców czy powierzchnia sklepu?
Materiały do ćwiczeń z przedmiotu Statystyka, mgr Oskar Knapik
Zad. 9 W zakładach odzieżowych przeprowadzono badania w celu ustalenia zależności między długością
serii produkcji w tys. sztuk (X) a jednostkowym kosztem produkcji wyrobu w zł (Y). W rezultacie otrzy-
mano następujące teoretyczne równania regresji:
w =ð 5160 -ð 270xi
Ć
x =ð1,7 -ð 0,003yi
a) podaj interpretację współczynników regresji,
b) co można powiedzieć o kierunku i sile zależności między tymi cechami?
c) W jakim procencie zmienna X wyjaśnia zmienną Y?
d) Jaki jest teoretyczny poziom kosztu jednostkowego przy serii o długości 10 tys. sztuk?
Zad. 10 Spółka zajmująca się sprzedaż różnego rodzaju kserokopiarek chce ustalić wpływ wydatków na
reklamę własnego produktu (w tys. zł) na wielkość sprzedaży (w mln zł). W tym celu zebrano informacje
dotyczące ostatnich pięciu lat (dane roczne):
5 5
2
=ð 132 , =ð 3502 ,
åðxi åðxi
i=ð1 i=ð1
5 5
yi =ð 96 yi2 =ð 1870
åð åð
i=ð1 i=ð1
5
yi =ð 2553 .
åðxi
i=ð1
Na podstawie tych informacji:
a) oblicz współczynnik korelacji liniowej Pearsona,
b) wyznacz rachunkowo i graficznie obydwa równania regresji,
c) oszacuj  dobroć dopasowania równania regresji opisującego zależność sprzedaży kserokopiarek od
wydatków ponoszonych na reklamę w tym przedsiębiorstwie,
d) oszacuj wartość sprzedaży przyjmując, że wydatki na reklamę wynoszą 30 tys. zł rocznie.
Zad. 11. Losowo wybrano 8 zakładów przemysłowych i zbadano je ze względu na wielkość produkcji w
tysiącach ton (Y) i poziom zatrudnienia w tysiącach osób (X). Otrzymano następujące wyniki:
Zatrudnienie (w tys. osób) 0,9 1,0 1,2 1,2 1,4 1,4 1,5 1,6
Produkcja (w tys. ton) 2,0 2,3 2,6 2,5 3,0 3,1 3,2 3,4
Obliczenia pomocnicze:
8 8 8 8 8
2 2 2
=ð 10,2 ; yi =ð 22,1; ×ð yi =ð 29; =ð 13,42 ; yi2 =ð 62,71; sx =ð 0,0519 ; sy =ð 0,2073 ;
åðxi åð åðxi åðxi åð
i=ð1 i=ð1 i=ð1 i=ð1 i=ð1
8 8
-ð wi)2 =ð 0,0286 ; -ð y)2 =ð 1,6588 .
åð(yi åð(yi
i=ð1 i=ð1
a) Obliczyć i zinterpretować kowariancję oraz współczynnik korelacji liniowej Pearsona.
b) Oszacować parametry liniowego modelu regresji (opisującego zależność produkcji od zatrudnienia)
wykorzystując obliczone wcześniej wartości współczynników kowariancji lub korelacji.
c) Oszacować parametry liniowego modelu regresji (produkcji względem zatrudnienia) wykorzystując
układ równań normalnych (rozwiązać go metodą wyznaczników).
d) Metodą macierzową oszacować parametry równania regresji produkcji względem zatrudnienia.
e) Zinterpretować współczynnik regresji liniowej.
f) Ocenić dopasowanie wyznaczonego modelu regresji do danych empirycznych za pomocą: wariancji
resztowej, odchylenia standardowego składnika resztowego, współczynnika zmienności resztowej,
współczynnika zbieżności, współczynnika determinacji.
g) Jak zmieni się wielkość produkcji gdy zatrudnienie wzrośnie o 0,5 tysiąca osób?
h) Jak zmieni się wielkość produkcji gdy zatrudnienie spadnie o 3 tysiące osób?
i) Ile przeciętnie może wynosić wielkość produkcji zakładu zatrudniającego 2.5 tysiąca osób?
Materiały do ćwiczeń z przedmiotu Statystyka, mgr Oskar Knapik
Zad. 12. Wiadomo, że długość drogi hamowania samochodu (Y) zależy od jego prędkości (X). Przepro-
wadzono test na suchej nawierzchni i otrzymano następujące dane:
Prędkość samochodu (w km/h) 20 40 60 80 100
Droga hamowania (w metrach) 5 15 30 50 80
Obliczenia pomocnicze:
5 5 5 5 5
2 2 2
=ð 300 ; yi =ð 180 ; ×ð yi =ð 14500 ; =ð 22000 ; yi2 =ð 10050 ; sx =ð 800 ; sy =ð 714 .
åðxi åð åðxi åðxi åð
i=ð1 i=ð1 i=ð1 i=ð1 i=ð1
a) Oszacować parametry liniowego modelu regresji (zinterpretować współczynnik regresji liniowej).
b) Ocenić dopasowanie wyznaczonego modelu regresji do danych empirycznych za pomocą: wariancji
resztowej, odchylenia standardowego składnika resztowego, współczynnika zmienności resztowej,
współczynnika zbieżności, współczynnika determinacji.
c) Jak zmieni się droga hamowania gdy prędkość samochodu wzrośnie o 8 km/h?
d) Jaka będzie droga hamowania przy prędkości 63 km/h?
Zad. 13. W jednowskaznikowym modelu Sharpe a przyjmuje się, że stopa zwrotu akcji danej spółki
giełdowej R spełnia równanie
R =ð að +ð bð RI +ð eð
gdzie RI oznacza stopÄ™ zwrotu indeksu gieÅ‚dowego, eð jest bÅ‚Ä™dem losowym o wartoÅ›ci oczekiwanej
zero, zaÅ› að i bð sÄ… współczynnikami, które należy oszacować. Równanie R =ð að +ð bð RI nazywa siÄ™ liniÄ…
charakterystyczną akcji. W poniższej tabeli podano stopy zwrotu akcji R i indeksu giełdowego RI w
ciągu sześciu tygodni.
Tydzień Akcja Indeks rynku
1 8.36% 9.23%
2 4.95% 7.10%
3 -1.29% 3.12%
4 0.10% 4.65%
5 -2.05% 1.16%
6 0% 2.20%
Użyć metody najmniejszych kwadratów do oszacowania linii charakterystycznej akcji i narysować wy-
kres linii wraz ze stopami zwrotu. Sprawdzić czy akcja jest defensywna (tzn. 0 <ð bð <ð 1), czy agresywna
(tzn. bð >ð 1).
Zad. 14. Oszacować metodÄ… najmniejszych kwadratów współczynniki ln bð0 i bð1 w modelu Cobba-
Douglasa
1
Y =ð bð0xbð eW
po zlogarytmowaniu obu stron powyższego równania. Dane zmieszczono w następującej tabeli:
Tydzień Wielkość produkcji Y Wielkość nakładów x
1 12.1 5
2 15.5 7
3 18.3 9
4 20.1 11
5 18.9 10
Materiały do ćwiczeń z przedmiotu Statystyka, mgr Oskar Knapik
Numer
Odpowiedzi
zadania
1
2
3
4
5
6
7
8
9
10
a) cov(X ,Y ) =ð 0.1028 ; r(X ,Y ) =ð 0.9913; b), c), d) a =ð 0.2355; b =ð 1.9819 ;
wi =ð 0.2355 +ð1.9819xi ;
2
11
f) Se =ð 0.0048 ; Se =ð 0.0691; Ve =ð 0.025; fð2 =ð 0.0173 ; R2 =ð 0.9827 ; g) wzroÅ›nie o
0.991 tys. ton;
h) spadnie o 5.9458 tys. ton; i) 5.1904 tys. ton
2
a) a =ð-ð19.5 ; b =ð 0.925; wi =ð -ð19.5 +ð 0.925xi ; b) Se =ð 49.1667 ; Se =ð 7.0119 ;
12
Ve =ð 0.1948 ; fð2 =ð 0.0413 ; R2 =ð 0.9587 ; c) wydÅ‚uży siÄ™ o 7.4 metra; d) 38.775 metra
13
14


Wyszukiwarka

Podobne podstrony:
Wzory analiza zaleznosci
Porównawcza analiza aerodynamiczna dwóch największych mostów podwieszonych w Polsce
Zajecia 5 Analizy statystyczne?nych jakosciowych
Podstawy analizy statystycznej 2
Przestępczość nieletnich w latach dziewięćdziesiątych w świetle analiz i statystyk policyjnych Szy
genetya cech ilościowych
Cz VII Analiza ilosciowa
Analiza ilościowo jakościowa procesów projektowania REFERAT
Przekrój zbrojenia w zależności od ilości prętów [1](1)
Statystyczna analiza systemow bonus malus w ubezpieczeniach komunikacyjnych e6j
Cwiczenie nr Analiza ilosciowa Alkacymetria Oznacznie weglanow i wodoroweglanow
Wybrane aspekty analizy wypadków przy pomocy nowej karty statystycznej wypadku budownictwo

więcej podobnych podstron