Politechnika Świętokrzyska
Wydział Zarządzania i Modelowania Komputerowego
Kierunek: Ekonomia
Model ekonometryczny:
Od czego zależała cena benzyny Pb95 w latach 2009-2011?
Kielce 2013
Opis problemu
Problem jaki postawiłyśmy sobie do zbadania to cena benzyny Pb95 w latach 2009-2011. Jako cechy charakteryzujące wybrałyśmy:
-import ropy naftowej -cenę LPG
- wydobycie ropy naftowej
- liczbę nowo-zarejestrowanych pojazdów
- kurs waluty USD
- produkcję przemysłową w Polsce
Model jednowymiarowy ma postać:
Y=f(x1,x2,x3,x4,x5,x6)
Y - cena benzyny Pb95 – zmienna objaśniana
X1 - import ropy naftowej – zmienna objaśniająca
X2 - cena LPG – zmienna objaśniająca
X3 - wydobycie ropy naftowej – zmienna objaśniająca
X4 -liczba nowo-zarejestrowanych pojazdów – zmienna objaśniająca
X5 - kurs waluty USD – zmienna objaśniająca
X6 - produkcja przemysłowa w Polsce – zmienna objaśniająca
Dane wyjściowe
Tabela1 Dane wyjściowe w rozpatrywanym modelu
Y | x1 ( w mln ton) | x2 (w zł/l) | x3 (w tys. ton) | x4 (w szt.) | x5 (w zł) | x6 | |
---|---|---|---|---|---|---|---|
I 2009 | 3,49 | 1,65 | 1,8 | 55 | 31 042 | 3,1717 | -15,3 |
II | 3,81 | 1,67 | 1,74 | 53 | 34 788 | 3,6314 | -14,6 |
III | 3,37 | 1,64 | 1,72 | 52 | 36 263 | 3,5412 | -1,9 |
IV | 3,86 | 1,66 | 1,67 | 56 | 33 149 | 3,348 | -12,2 |
V | 4,41 | 1,67 | 1,65 | 59 | 29 263 | 3,2337 | -5,2 |
VI | 4,54 | 1,69 | 1,67 | 61 | 30 991 | 3,2146 | -4,5 |
VII | 4,46 | 1,71 | 1,92 | 58 | 28 707 | 3,0596 | -4,4 |
VIII | 4,48 | 1,68 | 1,91 | 56 | 24 516 | 2,8956 | 0,1 |
IX | 4,36 | 1,66 | 1,89 | 51 | 29 097 | 2,8595 | -1,3 |
X | 4,27 | 1,64 | 1,97 | 52 | 29 616 | 2,8469 | -1,2 |
XI | 4,37 | 1,65 | 2,08 | 53 | 31 576 | 2,799 | 9,9 |
XII | 4,26 | 1,64 | 2,04 | 54 | 33 134 | 2,8352 | 7,4 |
I 2010 | 4,38 | 1,8 | 2,17 | 55 | 28 591 | 2,8518 | 8,5 |
II | 4,35 | 1,8 | 2,18 | 57 | 28 006 | 1,9385 | 9,2 |
III | 4,5 | 1,81 | 2,2 | 53 | 33 788 | 2,8672 | 12,3 |
IV | 4,61 | 1,82 | 2,16 | 54 | 29 436 | 2,8799 | 9,7 |
V | 4,75 | 1,83 | 2,12 | 58 | 29 707 | 3,2137 | 14 |
VI | 4,76 | 1,84 | 2,15 | 61 | 32 869 | 3,3571 | 14,5 |
VII | 4,66 | 1,85 | 2,16 | 62 | 28 822 | 3,195 | 10,3 |
VIII | 4,65 | 1,86 | 2,14 | 58 | 26 484 | 3,0894 | 13,5 |
IX | 4,58 | 1,87 | 2,16 | 57 | 32 640 | 3,0318 | 11,8 |
X | 4,58 | 1,88 | 2,29 | 54 | 35 637 | 2,8482 | 8 |
XI | 4,59 | 1,89 | 2,28 | 53 | 39 680 | 2,8913 | 10,1 |
XII | 4,67 | 1,9 | 2,48 | 55 | 42 293 | 3,0197 | 11,5 |
I 2011 | 4,83 | 1,93 | 2,64 | 57 | 27 690 | 2,9148 | 10,3 |
II | 4,95 | 1,96 | 2,61 | 54 | 26 551 | 2,8787 | 10,7 |
III | 5,04 | 2,01 | 2,56 | 55 | 32 405 | 2,8688 | 7 |
IV | 5,13 | 2,32 | 2,52 | 56 | 28 128 | 2,7467 | 6,7 |
V | 5,17 | 2,25 | 2,51 | 52 | 28 221 | 2,7419 | 7,8 |
VI | 5,14 | 2,14 | 2,49 | 53 | 30 915 | 2,7586 | 2 |
VII | 5,13 | 2,12 | 2,47 | 54 | 26 603 | 2,7911 | 1,8 |
VIII | 5,16 | 2,22 | 2,48 | 52 | 22 546 | 2,8756 | 8,1 |
IX | 5,18 | 2,2 | 2,44 | 52 | 21 789 | 2,8779 | 10,2 |
X | 5,21 | 2,18 | 2,5 | 54 | 31 760 | 2,7691 | 7,6 |
XI | 5,15 | 2,31 | 2,47 | 53 | 28 431 | 2,7778 | 6,6 |
XII | 5,23 | 2,27 | 2,49 | 55 | 29 003 | 2,7891 | 10,2 |
Eliminacja zmiennych quasi-stałych
Ze zbioru zmiennych wybranych jako zmiennych objaśniających eliminuje się te zmienne, które odznaczają się zbyt małą zmiennością. Miarą zmienności jest w tym przypadku współczynnik zmienności:
, gdzie:
- średnia
- odchylenie standardowe
Jeśli zmienna spełnia warunek to oznacza iż charakteryzuje się ona małą zmiennością i jest traktowana przez nas jako quasi-stała. Taką zmienną eliminujemy ze zbioru zmiennych kandydujących do modelu.
Obliczenia średniej, odchylenia standardowego i współczynnika zmienności przedstawia tabela 2.
Tabela2. Średnia, odchylenie standardowe i współczynnik zmienności
Y | X1 | X2 | X3 | X4 | X5 | X6 | |
---|---|---|---|---|---|---|---|
Średnia | 1,89 | 4,61 | 2,19 | 55,11 | 30392,69 | 2,96 | 4,98 |
odch.stand. | 0,22 | 0,46 | 0,29 | 2,70 | 4067,00 | 0,28 | 7,75 |
V | 11,41 | 9,93 | 13,35 | 4,90 | 13,38 | 9,44 | 155,69 |
W naszym modelu, jako quasi-stałą uznajemy X3, co oznacza, że eliminujemy ją jako pierwszą. Natomiast pozostałe zmienne przechodzą do dalszej analizy, gdyż poszczególne wartości wskaźnika zmienności są większe od wartości krytycznej równej 9%.
Analiza współczynników korelacji
Współczynnik korelacji liniowej mierzy siłę liniowej współzależności. Oblicza się go ze wzoru:
gdzie
Analizę macierzy i wektora współczynników korelacji obliczono za pomocą programu Excel. Wyniki obliczeń przedstawia tabela 3.
Tabela 3. Macierz i wektor współczynników korelacji
Y | x1 | x2 | x6 | x4 | x5 | |
---|---|---|---|---|---|---|
Y | 1 | |||||
x1 | 0,853 | 1,000 | ||||
x2 | 0,829 | 0,836 | 1,000 | |||
x6 | 0,832 | 0,427 | 0,679 | 1,000 | ||
x4 | -0,399 | -0,326 | -0,190 | -0,064 | 1,000 | |
x5 | -0,468 | -0,399 | -0,543 | -0,430 | 0,303 | 1 |
Wektor korelacji między zmienną objaśnianą a zmiennymi objaśniającymi ma następującą postać:
Natomiast macierz współczynników korelacji między zmiennymi objaśniającymi wygląda następująco:
Ustalenie wartości krytycznej współczynnika korelacji
gdzie:
- poziom istotności, ,
- liczba obserwacji, ,
- wartość statystyki t - Studenta dla zadanego poziomu istotności oraz dla stopni swobody,
- liczba stopni swobody.
Jako następne eliminujemy te zmienne, które są słabo skorelowane z Y. W tym celu korzystamy z warunku:
W naszym przypadku możemy powiedzieć, że silna korelacja jest w przedziałach .
Do modelu wybrałyśmy zmienną X1 , gdyż jest najsilniej skorelowana z Y oraz zmienną X2, ponieważ jest skorelowana ze zmienną Y a nie jest skorelowana ze zmienną X1.
Ostatecznie do modelu trafiają dwie zmienne – X1 i X2, Zmienne X4 oraz X5 zostały wyeliminowane, gdyż są słabo skorelowane z Y. Natomiast zmienna X6 została wyeliminowana, gdyż jest silnie skorelowana.
Zależność zmiennej objaśnianej Y od zmiennej objaśniającej X1 przedstawia wykres 1.
Wykres 1.
Zależność zmiennej objaśnianej Y od zmiennej objaśniającej X2 przedstawia wykres 2.
Wykres 2.
Wybór postaci funkcji
Do projektu modelowania ekonometrycznego wybrany został model liniowy funkcji.
Poszukujemy zależności w postaci:
gdzie: - zmienna objaśniana,
- zmienne objaśniające,
- liczba zmiennych objaśniających,
- składnik losowy.
Rozpisując powyższą zależność dla poszczególnych obserwacji otrzymujemy:
…
gdzie:
- N-ta obserwacja zmiennej objaśnianej,
- N-ta obserwacja K-tej zmiennej objaśniającej,
- nieznane losowe składniki (zakłócenia) uwzględniające wpływ nie uwzględnionych w modelu czynników.
Przyjmiemy następujące oznaczenia macierzy:
Estymacja modelu – określenie parametrów funkcji
Zakładamy model postaci:
,
Obliczamy macierz :
Macierz odwrotna:
Obliczamy macierz :
Obliczamy macierz β:
Powyższe dane zostały obliczone za pomocą programu Excel.
Nasz model ma postać:
Wzrost importu ropy naftowej, spowoduje wzrost ceny o ok.1,13 zł. Z kolei jednostkowy wzrost cen LPG spowoduje wzrost ceny benzyny o ok.0,6zł.
Weryfikacja modelu
Współczynnik determinacji oblicza się ze wzoru:
Wartość R2 jest liczbą należącą do przedziału [0:1]. Bliskie jedności R2 wskazują na dobre dopasowanie, natomiast bliskie zera na słabe dopasowanie modelu do danych empirycznych. W praktyce przyjmuje się że model jest dobrze dopasowany, gdy R2 > 0,6.
Współczynnik determinacji mówi, jaka część całkowitej zmienności zmiennej Y jesr wyjaśniona przez model.
R2 = 0,7724 ~ 0,77
Z obliczeń wynika, że współczynnik determinacji jest większy od wartości 0,6. Stwierdzamy zatem, że model jest dobrze dopasowany do danych empirycznych. Wybrany przez nas model tłumaczy w 77% zmienność zmiennej Y.
Weryfikacja statystyczna modelu
Estymator wariancji składnika losowego:
0,043803031
Estymator odchylenia standardowego:
0,20929
Współczynnik zmienności:
V = 0,045 = 4,5%
Z obliczeń wynika, iż błędy sięgają 4,5 % średniego poziomu Y. Z związku z czym można stwierdzić, że są to małe błędy.
Macierz wariancji oraz kowariancji estymatorów parametrów:
Średnie błędy szacunku parametrów (błędy bezwzględne):
Błąd oszacowania parametru wynosi 0,336, błąd oszacowania parametru wynosi 0,322, a błąd oszacowania parametru wynosi 0,237.
Średni błąd względny szacunku k-tego parametru:
Dla$\left| \frac{0,336}{1,157} \right|$*100%= 29,04%
Dla $\left| \frac{0,322}{1,133} \right|$*100%= 28,42%
Dla $\left| \frac{0,237}{0,602} \right|$*100%= 39,36%
Model ma postać:
Parametry wyznaczone są z następującymi błędami:
z błędem 0,336
z błędem 0,322
z błędem 0,237.
Najdokładniej wyznaczony jest parametr , ponieważ jego błąd względny jest najmniejszy i wynosi 28,42%%. Błąd względny parametru wynosi 29,04%. Najgorzej oszacowany jest parametr gdyż jego błąd względny wynosi 39,36%.
Stawianie hipotez dla parametrów
β0 β1 β2
H0 : β0 = 0 H0 : β1 = 0 H0 : β0 = 0
H1 : β00 H1 : β10 H1 : β20
α =0,05
t1 − ∝ = t0, 95 = 2,05183
Wartość statystyki testowej oraz obszary krytyczne:
Wartość statystyki testowej oraz obszary krytyczne dla parametru :
T= $\frac{1,157}{0,336}$ =3,4434
Wartość statystyki testowej oraz obszary krytyczne dla parametru :
T=$\frac{1,133}{0,322}$ = 3,5186
Wartość statystyki testowej oraz obszary krytyczne dla parametru :
T=$\frac{0,602}{0,237}$ =2,5400
K = (2,05183;+∞)
Dla parametrów i wartość statystyki testowej należy do obszaru krytycznego, dlatego we obu przypadkach odrzucamy hipotezy zerowe, uznając za prawdziwe hipotezy alternatywne. Parametry i są istotnie statystycznie różne od zera. W naszym wypadku oznacza to, że import ropy naftowej w mln ton oraz cena LPG w zł, mają wpływ na cenę benzyny.
Przedziały ufności dla parametrów modelu
Przedziału ufności :
Dla parametru :
Dla parametru :
Dla parametru :
Z prawdopodobieństwem 95% , , . Na podstawie 30-elementowej próby nie można stwierdzić w jakim wieku może być najmłodsza kobieta, która może urodzić dziecko, ponieważ przedział ufności zawiera wartości dodatnie jak i ujemne, a jak powszechnie wiadomo wiek nie może być ujemny, a nie mamy podstaw by twierdzić, że jest to 6,48 rok życia. Jeśli chodzi o przedział dla β1 interpretuje się go tak, że jednostkowy wzrost importu ropy naftowej może powodować wzrost ceny benzyny w granicach od 0,47 do 1,35. Przedział dla β2 interpretuje się tak, że każdy jednostkowy wzrost ceny LPG, wpływa na wzrost ceny benzyny w granicach od 0,00323 do 0,12 do 1,1.
Prognozowanie
Celem modelowania jest budowanie prognozy czyli przewidywanie jak badane zjawisko będzie kształtowało się w następnych latach. W naszym modelu będzie to prognozowanie ceny benzyny Pb95 przy założeniu konkretnych zmiennych objaśniających. W tym celu przyjęto, iż wartości zmiennych objaśniających będą wynosiły:2,2 import ropy naftowej oraz 2,53 cena LPG.
Prognozowana Y*(cena benzyny) wynosi:
Y*=5,17
Średni błąd szacunku parametru Y *:
Błąd oszacowania parametru Y* wynosi 1,04
Średni względny błąd prognozy:
Średni względny błąd prognozy wynosi 20,1%, co oznacza, że wartość przyjętych zmiennych objaśniających jest dobrze dobrana i są wartościami wiarygodnymi.
PODSUMOWANIE - WYJŚCIE |
---|
Statystyki regresji |
Wielokrotność R |
R kwadrat |
Dopasowany R kwadrat |
Błąd standardowy |
Obserwacje |
ANALIZA WARIANCJI | ||||
---|---|---|---|---|
df | SS | MS | F | |
Regresja | 2 | 5,1179 | 2,5589 | 60,5207 |
Resztkowy | 32 | 1,3530 | 0,0423 | |
Razem | 34 | 6,4709 |
Współczynniki | Błąd stand. | t Stat | Wartość-p | Dolne 95% | Górne 95% | Dolne 95% | Górne95% | |
---|---|---|---|---|---|---|---|---|
Przecięcie | 1,3557 | 0,3051 | 4,4428 | 0,0001 | 0,7341 | 1,9772 | 0,7341 | 1,9772 |
1,65 | 1,1323 | 0,2857 | 3,9631 | 0,0004 | 0,5503 | 1,7143 | 0,5503 | 1,7143 |
1,8 | 0,5198 | 0,2126 | 2,4453 | 0,0202 | 0,0868 | 0,9529 | 0,0868 | 0,9529 |
Wnioski
Celem projektu było zbadanie jaki wpływ na cenę benzyny Pb95 w latach 2009-2011 mają czynniki zewnętrzne. Skupiłyśmy się właśnie na tym problemie, gdyż na przełomie tych lat był to temat bardzo popularny. W pierwszym etapie konstruowania modelu ekonometrycznego było sześć parametrów, które miały wpływ na cenę benzyny Pb95. Z przeprowadzonych obserwacji, analizy ekonometrycznej wynika, iż cena zależy od importu ropy naftowej oraz ceny LPG. Na podstawie zebranych danych i po przeprowadzeniu obliczeń utworzyłyśmy model w postaci: , który opisuje w 77% opisuje zmienność ceny od przyjętych do modelu zmiennych.