Etapy budowy modelu ekonometrycznego
1. Zebranie materiału statystycznego
- zdefiniowanie zmiennej objaśnianej
- dobór potencjalnych zmiennych objaśniających
2. Hipoteza dotycząca równania modelu
- ustalenie postaci funkcji opisującej badaną zależność
3. Szacowanie parametrów modelu
4. Weryfikacja statystyczna i merytoryczna modelu
5. Prognozowanie - praktyczne wykorzystanie modelu
Wybrałem temat: Produkcja energii elektrycznej
Zmiennymi objaśniającymi, które mogą istotnie wpływać na zmienną objaśnianą są:
1.Zużycie energii elektrycznej
2.Eksport energii elektrycznej
3.Import energii elektrycznej
4.Straty w sieci elektrycznej
5.Wydobycie węgla kamiennego energetycznego
6.Przeciętne zatrudnienie w przemyśle energetycznym
7.Nakłady inwestycyjne w przemyśle energetycznym
8. Koszty w przemyśle energetycznym
Ustalenie postaci analitycznej modelu ekonometrycznego
Model hipotetyczny będzie miał postać:
Y = β0 + β1x1 + β2x2 + β3x3 + β4x4 + β5x5 + β6x6 + β7x7 + β8x8
(x1,..., x8) - kolejne zmienne objaśniające
(β1,..., β8) - parametry modelu hipotetycznego
Dobór istotnych zmiennych objaśniających
Przy zastosowaniu procedury Regresja otrzymujemy następujące wyniki (patrz tabela nr 1).
Z tabeli odczytujemy, że przy przyjętym 5% poziomie istotności i 16 stopniach swobody wartość krytyczna rozkładu t-Studenta wynosi 2,120. Ponieważ t2 = 1.496 < t (0,05;16) więc zmienna x2 jest nieistotna.
Po wyeliminowaniu tej zmiennej otrzymałam model (patrz tabela nr 2).
Przy uprzednio przyjętym poziomie istotności i 17 stopniach swobody wartość krytyczna rozkładu t-Studenta wynosi 2,110. Zważywszy, iż t3 = -1,730 < t (0,05;17) więc zmienna x3 jest nieistotna.
Po wyeliminowaniu tej zmiennej otrzymałam model (patrz tabela nr 3).
Przy uprzednio przyjętym poziomie istotności i 18 stopniach swobody wartość krytyczna rozkładu t-Studenta wynosi 2,101. Zważywszy, iż t5 = 1,367 < t (0,05;18) więc zmienna x5 jest nieistotna.
Po wyeliminowaniu tej zmiennej otrzymałam model (patrz tabela nr 4).
Przy uprzednio przyjętym poziomie istotności i 19 stopniach swobody wartość krytyczna rozkładu t-Studenta wynosi 2,093. Zważywszy, iż t7 = -1,298 < t (0,05;19) więc zmienna x7 jest nieistotna.
Po wyeliminowaniu tej zmiennej otrzymałam model (patrz tabela nr 5).
Przy uprzednio przyjętym poziomie istotności i 20 stopniach swobody wartość krytyczna rozkładu t-Studenta wynosi 2,086. Zważywszy, iż t8 = 1,097 < t (0,05;20) więc zmienna x8 jest nieistotna.
Po wyeliminowaniu tej zmiennej otrzymałam model (patrz tabela nr 6)
Uzyskane wyniki wskazują, że pozostałe zmienne w istotny sposób wpływają na zmienną objaśnianą (przy założonym 5% poziomie istotności i 21 stopniach swobody)
Istotnymi zmiennymi objaśniającymi okazały się:
X1 - zużycie energii elektrycznej
X4 - straty w sieci elektrycznej
X6 - przeciętne zatrudnienie w przemyśle energetycznym
Szacowanie modelu z istotnymi zmiennymi objaśniającymi
Model ekonometryczny w oparciu, o który będę szacowała wartości parametrów β0 , β1, β4, β6 modelu hipotetycznego przyjmie postać:
Y = b0 + b1x1 + b4x4 + b6x6
Postać oszacowana modelu
Y = 17,045 + 0,501x1 + 1,539x4 + 0,284x6
Merytoryczna ocena wyników
- parametr b1 = 0,501 przy zmiennej x1 mówi, że przy stałych wartościach x4, x6, jeżeli zużycie energii elektrycznej wzrośnie o 1mld kWH, to produkcja energii elektrycznej wzrośnie o 0,501 mld kWH
- parametr b4 =1,539 przy zmiennej x4 informuje nas, że przy stałych wartościach x1, x6, jeżeli straty w sieci elektrycznej wzrosną o 1 mld kWH, to produkcja energii elektrycznej wzrośnie o 1,539 mld kWH.
- parametr b6 = 0,284 przy zmiennej x6 informuje nas, że przy stałych wartościach x1, x4, jeżeli przeciętne zatrudnienie w przemyśle energetycznym wzrośnie o tysiąc osób, to produkcja energii elektrycznej wzrośnie o 0,284 mld kWH.
- parametr b0 = 17,045 odpowiada stałej tego modelu i mówi nam, że przy zerowych wartościach x1, x4, x6, produkcja energii elektrycznej będzie kształtować się na poziomie 17,045 mld kWH.
Weryfikacja statystyczna modelu ekonometrycznego
Wskaźniki oceniające statystyczną wartość oszacowanego modelu (patrz tabel nr 6):
Wartość dopasowanego R2 wynosi 0,98711 co nam mówi, że model w 98,711% objaśnia zmienność zjawiska produkcji energii elektrycznej, co jest wynikiem bardzo dobrym. Na podstawie tego można powiedzieć, że model jest dobrze dopasowany. Na podstawie tego wskaźnika można powiedzieć, że 1,289% zmienności zmiennej objaśnianej nie zostało wyjaśnione przez stworzony model.
Odchylenie standardowe składnika losowego - wartość błędu standardowego w wysokości 2,025 mówi nam, że realizacje składnika losowego odchylają się przeciętnie od wartości średniej o 2,025 jednostek, powoduje to, że obserwowana liczba odbiega przeciętnie od modelu hipotetycznego o 2.025 jednostek
Szacunkowe błędy średnie parametrów - mówią o średnim odchyleniu estymatora βi od rzeczywistych wartości parametru bi. Odchylenia te wynoszą odpowiednio:
dla β1 = 0,0399;
dla β4 = 0,308;
dla β6 = 0,049
natomiast szacunkowy błąd stałej nie jest obliczany gdyż nie ma żadnego znaczenia.
Szacunkowe błędy średnie d1, d4, d6 stanowią odpowiednio 0,3%; 2,3% i 0,04% wartości parametrów. Szacunkowe błędy średnie są małe, co wskazuje na dobrą estymację parametrów β1, β4, β6.
Przedziały ufności dla parametrów βi - dla ustalenia wartości poszczególnych przedziałów posługujemy się tabelą nr 6:
z 95% ufnością przypuszczamy, że przedział < 9,52; 24,56 > pokrywa wartość parametru b0
z prawdopodobieństwem równym 0,95 parametr b1 jest liczbą zawartą w przedziale < 0,417; 0,583 >
z 95% ufnością przypuszczamy, że przedział < 0,899; 2,178 > pokrywa wartość parametru b4
z 95% ufnością przypuszczamy, że przedział < 0,181; 0,387 > pokrywa wartość parametru b6
Prognozowanie
Prognoza X1, X4, X6, na podstawie równania trendu
Prognoza zmiennej objaśnianej na podstawie równania modelu
Ia. Prognozowanie zużycia energii elektrycznej.
Wykres nr 1 wskazuje, że funkcją trendu najlepiej opisującą daną zmienną jest funkcja wielomianowa. Jej równanie przedstawia się następująco:
Y = 0,005t5 - 0,0295t4 + 0,6171t3 - 5,5094t2 + 23,201t + 70,146
Dopasowanie modelu jest dobre, świadczy o tym współczynnik R2 = 0,9078
Prognozowane zużycie energii elektrycznej w 1998 roku wynosi 132,146
.
Ib. Prognozowanie strat w sieci.
Na podstawie wykresu nr 2 stwierdzamy, że mamy do czynienia z wykresem liniowym. Równanie przedstawia się następująco:
Y = 0,3604t + 0,2012
Trend jest średnio dopasowany, ponieważ R2 = 0,818 jednak na podstawie tego równania możemy dokonać prognozy odnośnie wartości zmiennej w roku następnym:
Prognozowane straty w sieci wynoszą 9,5716
Ib. Prognozowanie przeciętnego zatrudnienia w przemyśle energetycznym.
Posługując się wykresem nr 3 zauważamy, że funkcja liniowa jest najlepiej dopasowana (R2 = 0,9463) do badanej zmiennej objaśniającej. Funkcję tą opisuje równanie:
Y = 2,9649t + 63,045
Liczba ta wynosi 140,1324
II. Prognoza zmiennej objaśnianej na podstawie równania modelu
Posiadając prognozowane wartości poszczególnych zmiennych objaśniających możemy je wstawić do ogólnego równania modelu:
Y98 = Y = 17,045 + 0,501*132,146 + 1,539*9,5716 + 0,284*140,1324
Y98 = 137,77844
Prognozowana wielkość produkcji energii elektrycznej w mld kWH wynosi 137,77844. Wielkość ta w niewielkim stopniu różni się od wartości zaobserwowanych wcześniej. Zakładając, że wszystkie obliczenia zostały wykonane prawidłowo należy uznać, że przyczyną odchyleń od tej prognozy mogą być błędy pomiaru, nieuwzględnienie w modelu wszystkich zmiennych, źle dobrana postać modelu i inne czysto losowe czynniki.