UWAGA! KONWENCJE ZAPISU:
alfa, beta = α, β
x1, x2, xk = x1, x2, xk
tk, bk, dk, t alfa = tk, bk, dk, tα
| t3 | = wartość bezwzględna z t3
ln = logarytm naturalny
EKONOMETRIA - 9 lutego 2008
Imię i nazwisko ..................................................................... Pkty............. Ocena ................
Zad. 1. Przypuszcza się, że liczba osób zwiedzających Międzynarodowe Targi Poznańskie (Y w tys.) zależy od: powierzchni wystawowej (X1 w tys. m2), liczby wystawców (X2 w tys.), indeksu zmiany przeciętnego miesięcznego wynagrodzenia (X3, rok 1991 = 100) oraz liczby miejsc noclegowych w Poznaniu (X4). Na podstawie zebranych danych oszacowano model z potencjalnymi zmiennymi objaśniającymi i otrzymano m.in. następujące wyniki:
ANALIZA WARIANCJI |
||
|
df |
SS |
Regresja |
4 |
164181,4 |
Resztkowy |
7 |
|
Razem |
11 |
167131,9 |
|
Współczynniki |
Błąd standardowy |
Wartość-p |
Przecięcie |
-507,6 |
103,395 |
0,002 |
POW -1 |
0,32 |
0,205 |
0,159 |
WYST -2 |
79,1 |
10,381 |
0,000 |
WYNAGR -3 |
-0,82 |
0,862 |
0,371 |
NOCLEGI -4 |
0,12 |
0,011 |
0,000 |
Napisz równanie modelu teoretycznego
Y^ = 0,32x1 + 79,1x2 - 0,82x3 + 0,12x4 - 507,6
Oceń dobroć dopasowania tego modelu do obserwacji.
R2 = RSK / OSK = 164181,4 / 167131,9 = 0,98.
R2 >= 0,9 a nawet jest bliski 1 -> a więc Model jest bardzo dobrze dopasowany. Zmienne xk w 98% wyjaśniają zmienność liczby odwiedzających targi.
Podaj wartość i interpretację odchylenia standardowego składnika losowego.
s = pierwiastek (SKR / (T-K)) = pierwiastek (2950,4 / 7) = 20,530 [tys. osób].
Rzeczywista liczba osób zwiedzających targi na skutek składnika losowego różni się od liczby zwiedzających z oszacowanego modelu średnio o 20530 osób.
SKR = OSK - RSK = 167131,9 - 164181,4 = 2950,4.
T-K = 7 [z pierwszej tabeli >> df Resztkowy]
Czy przy poziomie istotności α = 0.05 uznać możemy, że zmienne objaśniające występujące w modelu mają istotny wpływ na liczbę osób zwiedzających MTP? Odpowiedź uzasadnij.
H0: beta k = 0
H1: beta k <> 0
gdy | tk | > t alfa, to zmienna xk jest istotna:
tk = bk / dk
t alfa odczytujemy z tablic / Excela lub stosujemy bez tablic zasadę mnemotechniczną „Doroty”:
gdy |tk|>3 zmienna xk jest istotna
gdy |tk|<2 zmienna xk jest NIEistotna
gdy 2<|tk|<3 to musimy użyć tablic/Excela
t1 = b1 / d1 = 0,32 / 0,205 = 1,56, więc | t1 | < 2, więc bez tablic rozkładu (dla α = 0.05) zmienna x1 jest NIEistotna.
| t2 | = 7,62, >3, więc bez tablic rozkładu (dla α = 0.05) zmienna x2 jest istotna (możemy odrzucić H0 na rzecz hipotezy alternatywnej)
| t3 | = 0,95, <2, więc bez tablic rozkładu (dla α = 0.05) zmienna x3 jest NIEistotna
| t4 | = 10,91, >3, więc bez tablic rozkładu (dla α = 0.05) zmienna x4 jest istotna
Dodatkowo potwierdza to podana w drugiej tabeli „Wartość-p” - empiryczny poziom istotności - ustalone na podstawie obserwacji prawdopodobieństwo tego, że dana zmienna jest nieistotna w modelu.
Gdy p < alfa, to zmienna jest istotna.
W zadaniu dla x2 [WYST] i x4 [NOCLEGI]: p=0,000, a 0,000 < 0,05, więc x2 i x4 są istotne.
Natomiast dla x1 i x3: p > alfa, więc zmienne x1 i x3 są NIEistotne.
Zad. 2. Postanowiono skonstruować trend wykładniczy, opisujący zmiany rozmiarów sprzedaży pewnego kosmetyku (w tys. opakowań) w latach 1993 - 2000. Na podstawie zebranych danych statystycznych oszacowano parametry liniowego modelu pomocniczego i otrzymano równanie:
ln Y = 2.1761 - 0.043*t (dla t = 1, 2, ..., 6).
Model oryginalny po oszacowaniu ma postać
Y=beta0 * ebeta1*t / logarytmujemy (ln) obie strony równania
ln Y = ln beta0 + beta1*t * ln e
ln e = 1
beta1*t = - 0,043*t
ln beta0 = beta0* = 2,1761
beta0 = ebeta0* = e2,1761 = 8,812
Y^ = 8,812 * e-0,043*t
Liczba -0.043 informuje nas o tym, że
wzrost „t“ o 1 (w kolejnym okresie) spowoduje zmianę rozmiarów sprzedaży o beta1 * 100% = -4,3%.
Parametr ten nazywamy stałą stopą wzrostu Y ze względu na zmienną t stojącą przy tym parametrze.
Na podstawie modelu ustal, jakiej należy się spodziewać zmiany wielkości sprzedaży kosmetyku w roku 2001 w stosunku do roku 2000
t = 6 (2000 r.)
t = 7 (2001 r.)
Zmianę obliczymy jako różnicę wielkości sprzedaży:
Y*(7) - Y*(6) = (8,812 * e-0,043*7) - (8,812 * e-0,043*6) = 6,521 - 6,808 = - 0,287 [tys. opakowań]
Prognozujemy, że w 2001 roku sprzedaż spadnie o 287 szt. kosmetyku w porównaniu do roku 2000.
Zad. 3. Postanowiono skonstruować model, w którym wartość produkcji (Y - w tys. zł) w kolejnych latach zależy od wielkości zatrudnienia (X1) i wartości zainstalowanych maszyn (X2). Przyjęto hipotezę, że model ten ma postać:
.
Zebrano odpowiednie obserwacje i oszacowano parametry pomocniczego modelu liniowego otrzymując równanie:
W = 2 + 0.40 Z1 + 0.70 Z2
Przedstaw sposób postępowania przy tworzeniu pomocniczego modelu liniowego:
Y = beta0 * X1beta1 * X2beta2 / logarytmujemy (ln) obie strony równania
ln Y = ln beta0 + beta1 * ln X1 + beta2 * ln X2
ln Y = W
ln X1 = Z1 [wprowadzamy zmienne pomocnicze]
ln X2 = Z2
W = ln beta0 + beta1 * Z1 + beta2 * Z2
W = 2 + 0.40 Z1 + 0.70 Z2
2 = ln beta0
beta0 = e2 = 7,389
Model oryginalny po oszacowaniu ma postać:
Y^ = 7,389 * X10,4 * X20,7
O ile zmieni się łącznie wartość produkcji, jeżeli zatrudnienie spadnie o 2%, a wartość zainstalowanych maszyn wzrośnie o 3%?
W następnym okresie (t+1):
zmienna X1 dla t+1: 0,98 X1 (zatrudnienie spadnie o 2%);
zmienna X2 dla t+1: 1,03 X2 (wartość zainstalowanych maszyn wzrośnie o 3%)
Y* = 7,389 * (0,98*X1)0,4 * (1,03*X2)0,7 = 7,389 * 1,013 * X10,4 * X20,7 = 1,013 * (7,389 * X10,4 * X20,7)
1,013 = wzrost o 0,013 (+ 1,3 %)
Przy założeniu, że zatrudnienie spadnie o 2%, a wartość zainstalowanych maszyn wzrośnie o 3%, to prognozujemy, że łączna wartość produkcji wzrośnie o 1,3 %.
Zad. 4. Komenda Główna Straży Pożarnej postanowiła skonstruować model opisujący zmiany powierzchni pożarów lasów, by na jego podstawie prognozować zapotrzebowanie na wozy strażackie. W oparciu o zabrane dane kwartalne oszacowano trend liniowy i otrzymano równanie:
oraz
.
Ile wynosi i o czym informuje współczynnik kierunkowy oszacowanego trendu?
Współczynnik kierunkowy = 77,53 [uwaga wsp. kier. jest przy t - należy zwracać uwagę jak jest zapisane równanie modelu!]
Informuje on o tym, że w okresie większym o 1 (w kolejnym okresie) powierzchnia pożarów lasów zwiększy się o 77,53 [jednostek powierzchni].
Oceń dobroć dopasowania tego trendu do obserwacji
R2 = 0,04 (< 0,9), czyli wyznaczony model trendu jest słabo dopasowany do obserwacji.
Aby poprawić jakość modelu postanowiono trend uzupełnić o względne wskaźniki sezonowości. Odpowiednie obliczenia przeprowadzano w poniższej tabelce. Niestety niektóre liczby „zniknęły”. Uzupełnij je:
ROK |
Kwartał |
Sprzedaż |
t |
trend |
reszty_wzgl |
Szima = 0,802 [(1,590+0,581+0,736+0,302) / 4]
Swiosna = 2,133
Slato = 0,738
Sjesień = 0,062 |
1997 |
Zima |
2008 |
1 |
podstawiamy do równania trendu, dla t = 1: 1185,64+77,53*1= 1263,17 |
Sprzedaż / trend 2008 / 1263,17 = 1,590 |
|
|
Wiosna |
3351 |
2 |
1340,7 |
2,499 |
|
|
Lato |
691 |
3 |
1418,24 |
0,487 |
|
|
Jesień |
116 |
4 |
1495,77 |
0,078 |
|
1998 |
Zima |
914 |
5 |
1573,31 |
0,581 |
|
|
Wiosna |
2779 |
6 |
1650,84 |
1,683 |
|
|
Lato |
848 |
7 |
1728,38 |
0,491 |
|
|
Jesień |
123 |
8 |
1805,88 |
0,068 |
|
1999 |
Zima |
1386 |
9 |
1883,41 |
0,736 |
|
|
Wiosna |
3911 |
10 |
1960,98 |
1,994 |
|
|
Lato |
2520 |
11 |
2038,51 |
1,236 |
|
|
Jesień |
83 |
12 |
2116,05 |
0,039 |
|
2000 |
Zima |
662 |
13 |
2193,58 |
0,302 |
|
|
Wiosna |
5348 |
14 |
2271,11 |
2,355 |
|
Jeżeli obliczone wskaźniki wymagają korekty, to jej dokonaj:
ΣSi = 0,802+2,133+0,738+0,062 = 3,735. Suma ta nie jest równa N=4, więc wskaźniki Si wymagają korekty:
wk = ΣSi / N = 3,735 / 4 = 0,934
Wskaźniki skorygowane:
Szima = 0,802/0,934=0,859 Swiosna = 2,133/0,934=2,285 Slato = 0,790 Sjesień = 0,066
Podaj interpretację skorygowanego względnego wskaźnika sezonowości dla lata:
S`lato = 0,790
Latem rzeczywista ilość {zmiennej Y} jest średnio o: (S`lato - 1) * 100 % = 21% mniejsza niż to wynika z równania trendu.
Wyjaśnij, kiedy uzasadnione jest opisywanie i prognozowanie szeregu czasowego za pomocą modelu multiplikatywnego i względnych wskaźników sezonowości
Model multiplikatywny stosujemy dla zjawisk, w których występują następujące sytuacje:
*przy trendzie rosnącym rośnie amplituda wahań;
*przy trendzie malejącym maleje amplituda wahań.
Zad. 5. Postanowiono skonstruować trend, opisujący zmiany liczby kin (w tys.) w pewnym województwie w latach 1992 - 2006. Rozważano dwie alternatywne postacie modelu: globalny trend liniowy, którego oszacowanie przedstawia wydruk (1) oraz liniowy trend segmentowy (punkt zwrotny t* = 8 dla roku 1999), którego oszacowanie przedstawia wydruk (2).
Wydruk (1) - model globalny |
||||
|
df |
SS |
MS |
F |
Regresja |
1 |
3628,8 |
3628,8 |
67,68854 |
Resztkowy |
13 |
696,9333 |
53,61026 |
|
Razem |
14 |
4325,733 |
|
|
|
|
|
|
|
|
Współczynniki |
Błąd standardowy |
t Stat |
Wartość-p |
Przecięcie |
199,333 |
3,978 |
50,104 |
2,92E-16 |
t |
3,600 |
0,438 |
8,227 |
1,64E-06 |
Model globalny ma postać:
Y^ = 3,6 t + 199,333
Współczynnik R2 dla modelu globalnego przyjmuje wartość 3628,8 / 4325,733 = 0,83, co oznacza, że
zbudowany model jest dość dobrze dopasowany do obserwacji.
Zmienność liczby kin jest w 83% wyjaśniona przez powyższy model.
Czy przyjmując poziom istotności α = 0,01 zmiany liczby kin w modelu globalnym uznać należy za istotne? Odpowiedź uzasadnij.
p [z tabeli „Wartość-p” dla t] = 1,64E-06
1,64E-06 < 0,01
Przy prawdopodobieństwie 99% należy uznać zmiany liczby kin w modelu globalnym za istotne, gdyż empiryczny poziom istotności p < α.
Wydruk (2) - model segmentowy
|
df |
SS |
MS |
F |
Regresja |
4 |
3906,269 |
976,5673 |
25,60943 |
Resztkowy |
11 |
419,4643 |
38,13312 |
|
Razem |
15 |
4325,733 |
|
|
|
|
|
|
|
|
Współczynniki |
Błąd standard |
t Stat |
Wartość-p |
Przecięcie |
0 |
#N/D! |
#N/D! |
#N/D! |
t1 |
4,893 |
1,167 |
4,193 |
0,001504 |
Z1 |
196,429 |
5,219 |
37,637 |
5,63E-13 |
t2 |
5,571 |
0,953 |
5,847 |
0,000111 |
Z2 |
174,679 |
11,173 |
15,634 |
7,37E-09 |
Model segmentowy przedstawiający zmiany liczby kin w badanym okresie ma postać:
nie mieliśmy modelu segmentowego
Współczynnik kierunkowy dla pierwszego segmentu ma wartość i informuje, że
nie mieliśmy modelu segmentowego
Przyjmując poziom istotności = 0.05 sprawdź, czy rok 1998 może być uznany za istotny punkt zwrotny badanej tendencji rozwojowej:
nie mieliśmy modelu segmentowego
F = F ( = 0.05, K = , v = ) = 3,98
Wniosek:
Zad. 6. Postanowiono skonstruować model opisujący kształtowanie sprzedaży pewnego kosmetyku (zmienna Y). Jako potencjalne zmienne objaśniające przyjęto cenę kosmetyku (X1) oraz przeciętne dochody w sektorze uspołecznionym (X2). Poniższa tabelka przedstawia wartości współczynników korelacji między tymi trzema zmiennymi.
|
Sprzedaż |
Cena |
Cena |
-0,7 |
|
Dochody |
0,9 |
-0,8 |
Wypisz kombinacje potencjalnych zmiennych objaśniających, które można utworzyć z rozważanych zmiennych objaśniających i oblicz integralną pojemność informacyjną każdej z nich.
???
Która z rozważanych kombinacji zmiennych jest optymalna?
???
1
4
IiE_zaoczne