Przedmiot:
Modelowanie ekonometryczne
Temat pracy:
Dochody ze sprzedaży firmy KGHM
Temat pracy: przychody ze sprzedaży firmy KGHM.
Dane do projektu zostały zaczerpnięte z lat 2005 - 2011, podawane, co kwartał. Projekt liczy 26 obserwacji, czyli 26 danych kwartalnych. Zmienna objaśniana to: przychody ze sprzedaży, a zmienne objaśniające to:
- wskaźnik inflacji
- kursy walut
- cena miedzi
- PKB
- liczba bezrobotnych
Na podstawie tych danych została sporządzona tabela.
Tabela 1 Zmienne objaśniane i objaśniające
W każdej kolumnie zmiennych objaśniających wyliczono odchylenie standardowe i średnia tych zmiennych. Za pomocą tych zmiennych obliczono iloraz tych parametrów w celu odrzucenia zmiennej objaśniającej, która nie spełnia warunek: parametr > wartości krytycznej 10%.
Wyniki pokazały, że wszystkie zmienne spełniają warunek i mogą być użyte do analizy danych - regresji.
Poniżej tabela przedstawia zachowanie zmiennej objaśnianej w badanym okresie.
Wykres 1 Przychody ze sprzedaży firmy KGHM
Za pomocą zmiennych objaśnianych i objaśniających dokonano w programie excel analizę regresji.
Tabela 2 Analiza danych - regresja 1 krok
Pierwsza tabela mówi, w ilu procentach dany model jest dopasowany. W tym przypadku model przy 26 obserwacjach ma dopasowany R kwadrat na poziomie 90%. Czyli 10% procentach projekt jest niepoprawny.
W następnej tabeli analiza wariancji przy przyjętej istotności 0,05 badamy hipotezę zerową. Jeżeli poziom istotności jest poniżej 0,05, wówczas mamy podstawy by odrzucić tę hipotezę. W tym przypadku tak też się stało, więc model spełnia wymogli.
W ostatniej tabeli sprawdzamy wynik wartości p dla każdego parametru. Jeżeli wartość p jest wyższa niż poziom istotności, wówczas odrzucamy parametr i wykonujemy ponownie analizę regresji bez tego parametru
Z analizy wynika, że parametr „liczba bezrobotnych” nie spełnia wymogów. Dlatego odrzucamy ten parametr, wykonując ponownie czynność analizy regresji.
Tabela 3 Analiza danych - regresja 2 krok
Po wykonaniu analizy regresji, następny parametr „PKB” ma wartość p powyżej 0,05. Dlatego odrzucamy ten parametr i wykonujemy ponownie tę samą czynność.
Tabela 4 Analiza danych - regresja 2 krok
Po odrzuceniu 2 parametrów analiza regresji wygląda prawidłowo.
Następny etap projektu to wygenerowanie zanalizowanych w poprzednim etapie zmiennych objaśnianych i objaśniających do programu „GRETL”.
Po wprowadzeniu danych do programu Gretl, wykonujemy model klasycznej metody najmniejszych kwadratów. Wynik tego działania przestawia poniższy rysunek:
Rysunek 1 Klasyczna metoda najmniejszych kwadratów
Rysunek przedstawia podobną analizę, jak w programie exel. Program Gretl wykonał dodatkowo jeszcze inne obliczenia m.in.: błąd standardowy reszty, który wynosi 2,86e+08 - to błąd, jaki model przyjmuje w tym projekcie.
Pozostałe wynik Bayes Schwarza, Inform Akaike'a oraz Hannana-Quinna są dobre dla modelu, gdy osiągają wysoką wartość.
W celu sprawdzenia, czy między składnikami resztowymi analizowanego modelu występuje autokorelacja, wykorzystujemy test Durbina Watsona
Rysunek 2 Test Durbina Watsona
Rysunek 3 Przedział występowania autokorelacji
Statystyka testu wykazała, że wynik Durbina Watsona 1,55 nie daje rozstrzygnięcia, czy autokorelacja występuje, czy nie. W tym wypadku wykonujemy test Breuscha-Godfreya na autokorelację rzędu pierwszego by zbadać, jaka ta korelacja jest dla naszego modelu.
Rysunek 4 Test na autokorelację rzędu pierwszego
Rysunek 5 Wynik testu na autokorelację rzędu 1
Po sprawdzeniu autokorelacja rzędu 1 wynika, że hipotezę o braku autokorelacji składnika losowego przyjmujemy, gdyż wartość p 0,52 jest wyższa niż poziom istotności 0,05.
W tym projekcie również wykonane zostały następujące testy:
Test White'a na heteroskedastyczność reszty
Rysunek 6 Test na heteroskedastyczność reszt
Rysunek 7 Wynik testu na heteroskedastyczność reszt
Wnioski: Test wykazał, że przyjmujemy hipotezę o niewystępowaniu heteroskedastyczności reszty
Test normalności rozkładu reszty
Wykres 2 Rozkład gęstości
Rysunek 8 Test normalności rozkładu reszty
Rysunek 9 Wynik testu normalności rozkładu reszty
Wnioski: Test wykazał, że składnik losowy ma rozkład normalny, gdyż wartość p 0,62 jest wyższa od poziomu istotności 0,05.
Ocena współliniowości VIF
Rysunek 10 Ocena wpółliniowości
Wnioski: Ocena współliniowości VIF wykazała, że wszystkie 3 wartości parametrów nie wskazują na problem współliniowości-rozdęcia wariancji. Parametr X1,X2 oraz X3 jest mniejszy o 10.