R E G R E S J A
1. W pewnej kompanii naftowej zbadano zależność pomiędzy głębokością wydrążonego otworu wiertniczego - zmienna X (w tys. metrów) a całkowitym kosztem wydrążenia tego otworu - zmienna Y (w mln dolarów). Dla czterech otworów wiertniczych uzyskano następujące informacje:
x i |
3 5 1 6 |
y i |
7 11 3 13 |
a) Oszacuj parametry liniowego modelu regresji głębokości wydrążonego otworu wiertniczego względem kosztu wydrążenia tego otworu.
b) Zweryfikuj hipotezę o istotnie dodatnim wpływie głębokości otworu na koszt wydrążenia otworu
2. Posługując się danymi z wybranych stanów USA oszacowano model regresji liniowej przedstawiający zależność między średnią stopą stanowego podatku dochodowego X oraz stopą bezrobocia Y (obie zmienne wyrażone są w procentach). Wyniki oszacowania były następujące:
i = 0,2 x i + 2. Ponadto obliczono, że współczynnik determinacji R2 = 0,92. Czy i dlaczego prawdziwe są następujące stwierdzenia:
dopasowanie powyższego oszacowania modelu do danych empirycznych jest zadowalające;
jeżeli w danym stanie nie ma podatku dochod., to prognozowana stopa bezrobocia wynosi 2,2%;
korelacja między zmiennymi X i Y jest wysoka i dodatnia.
3. Analiza spożycia artykułu A zależnie od dochodu w losowej próbie gospodarstw domowych dostarczyła następujących informacji;
średnie spożycie artykułu A na 1 osobę wynosi 2,5 kg,
średni miesięczny dochód na 1 osobę wynosi 540 zł,
współczynnik zmienności dochodu wynosi 15%, a spożycia 20%,
wartość kowariancji równa jest 27.
Korzystając z danych należy: a) zmierzyć siłę i kierunek zależności liniowej badanych cech;
b) oszacować parametry funkcji regresji spożycia względem wielkości dochodu. Wyniki skomentować.
4. Badając zależność pomiędzy zużyciem surowca w tonach (Y) a wielkością produkcji pewnego wyrobu w tys.szt. (X) otrzymano dla 7 obserwacji wyniki:
i = 2,1 xi + 7;
;
;
;
Podaj przedział ufności dla współczynnika regresji liniowej przy współczynniku ufności 0,90.
5. Oszacowano model regresji liniowej czasu przeznaczonego w ciągu dnia na sen przez niemowlęta (Y - w godz.) względem wieku dziecka (X-w miesiącach). Z oszacowanego współczynnika regresji wynika, że z miesiąca na miesiąc dzieci śpią przeciętnie o 0,5 godz. krócej. Czy oszacowanie współczynnika regresji tego modelu jest statystycznie istotne (α = 0,05), jeśli wariancja wieku dzieci była równa 4 (m-ce)2m, zaś reszty były następujące: -1, -2, 0, 0, 2, -3, 0, 3, 1?
6. Zakłada się, iż popyt na samochody "Mitsubishi" (zmienna Y - w tys. samochodów) jest liniową funkcją ich ceny (zmienna X - w tys. $). Na podstawie obserwacji z 10 lat otrzymano następującą funkcję regresji:
i = -0.01 xi + 9.6. Wiedząc, że
= 7, oraz że suma kwadratów reszt wynosi 34, a wariancja ceny S2(x) =1,24 wyznacz oczekiwany popyt, jeśli cena wyniesie 9 tys.$ . Wynik podaj wraz z błędem prognozy.
7. Estymując model regresji liniowej uzależniającego liczbę dzieci urodzonych przez kobiety (cecha Y) od liczby kobiet w wieku 20-24 lata (cecha X) na podstawie danych przekrojowych (województwa, 1995) otrzymano następujące wyniki:
Zapisz oszacowany model, podając interpretację parametrów oraz wyznaczyć przewidywaną liczbę urodzeń dla 100 tys. kobiet w wieku 20-24 lata. Co można powiedzieć o dopasowaniu modelu do danych empirycznych?
8. W badaniu zależności pomiędzy wydatkami na reklamę w telewizji (X - w mln zł) a sprzedażą kawy „Ziarenko” (Y - w mln opakowań) otrzymano następujący model regresji liniowej oraz wektor reszt:
yi = 10 xi + 2 + ei
[2,5] [0,4] [1,3] ei = [1; 2; -0,5; -0,8; 1; -2; 0,8; 0,5; -1; -1]
a)Ocenić stopień dopasowania funkcji regresji do danych empirycznych wiedząc, że
b)Wyznaczyć prognozę wielkości sprzedaży kawy oraz średni błąd prognozy gdy nakłady na reklamę wyniosą 0,3 mln zł wiedząc, że
= 0,1 mln zł; S(x) = 0,02.
9. Na podstawie 18 obserwacji oszacowano parametry liniowej funkcji regresji zużycia benzyny (l/km) względem prędkości samochodu (km/godz). Okazało się, że wyjaśniona regresją suma kwadratów odchyleń wartości zmiennej zależnej od średniej wynosi 23,2 (l2), natomiast nie wyjaśniona regresją suma kwadratów odchyleń wynosiła 10,8 (l2). W jakim stopniu uzyskana funkcja regresji wyjaśnia kształtowanie się zużycia benzyny.
10. Na podstawie 38 obserwacji oszacowano model regresji oglądalności pewnego programu (Y- w %) względem liczby reklam emitowanych w przerwie programu (X): yi = -0,2 xi + 5,48 + ei .
dodatkowo wiadomo, że średnio emitowano 3 reklamy, wariancja liczby reklam wynosi 4 (reklamy)2, zaś wariancja oglądalności 0,25 (%)2 .
a) ocenić stopień niedopasowania modelu do danych empirycznych,
b) wyznaczyć odchylenie standardowe reszt,
c) ocenić, czy ujemny wpływ emitowanych reklam na oglądalność programu jest statystycznie istotny (α = 0,05).
d) wyznaczyć prognozę oglądalności tego programu w przypadku emisji 2 reklam w trakcie przerwy z dokładnością do standardowego błędu prognozy.
TREND I WAHANIA OKRESOWE
1. W latach 1994-1997 skup pewnego produktu rolnego był następujący (w tys. t):
Lata |
1994 |
1995 |
1996 |
1997 |
||||
Półrocza |
I |
II |
I |
II |
I |
II |
I |
II |
Poziom skupu |
20 |
80 |
20 |
70 |
30 |
80 |
20 |
80 |
Średnie ruchome 2-okresowe |
* |
50 |
47,5 |
* |
* |
52,5 |
50 |
* |
a) uzupełnić brakujące średnie; b) obliczyć względne i bezwzględne wskaźniki okresowych wahań.
2. Na podstawie półrocznych informacji o sprzedaży samochodów marki ZZ w latach 1999-2002 wyznaczono addytywny surowy wskaźnik sezonowości dla pierwszego półrocza S1'= -10,33
Lata |
1999 |
2000 |
2001 |
2002 |
||||
Półrocze |
I |
II |
I |
II |
I |
II |
I |
II |
Liczba samochodów w tys. szt. |
100 |
115 |
102 |
126 |
105 |
130 |
112 |
135 |
Średnie ruchome |
|
107,5 |
* |
114,75 |
116,5 |
119,25 |
* |
|
Proszę wyznaczyć: a) brakujące średnie ruchome
b) oczyszczony wskaźnik sezonowości dla II półrocza (podaj jego interpretację).
3. W latach 1995-1998 sprzedaż artykułu A była następująca (w szt.):
Lata |
1995 |
1996 |
1997 |
1998 |
||||
Półrocza |
I |
II |
I |
II |
I |
II |
I |
II |
Poziom sprzedaży |
600 |
800 |
400 |
700 |
500 |
800 |
600 |
700 |
a) wyrównać szereg pierwotny; b) obliczyć względne i bezwzględne wskaźniki wahań okresowych.
4. Poniższe dane przedstawiają średnie ocen kolejnych czterech sprawdzianów ze statystyki w grupach wykładowcy Jerzego Gondola w latach 1992-1995:
3.3 4 3.7 3.8 3.4 4.1 3.9 3.9 3.6 4.2 4 4 3.7 4.3 4 4
Obliczono oczyszczony wskaźnik sezonowości dla drugiej pracy. Które z poniższych wartości O2
nie mogą być prawdziwe 1.25 1 0.85 1.1 0.9 i dlaczego?
5. Dwóch studentów: P(pilny) i N(niestaranny) w oparciu o te same dane kwartalne dla lat 1997-1999 oszacowało dwa modele trendu skupu artykułu A (tys. t.) wyodrębniając:
|
Model z wahaniami multiplikatywnymi |
Model z wahaniami addytywnymi |
Reszty |
-4; 1; 3; -5; -1; 2; 6; 2; -6; -1; 1; 2 |
-2; -3; 4; 1; 2; -5; -1; 1; 3; 1; -1; 2 |
Wskaźniki sezonowości |
O1=0,9; O2=0,7; O3 = 0,8; O4 =1,6 |
S1 = 14; S2 = -8; S3 = 10; S4 = -12 |
Który model zawiera błędy świadczące o tym, że szacował je student N?
2