EKONOMETRIA
Wpływ wybranych czynników na wielość produkcji korpusu
Joanna Bach 208963
Kamila Rudnicka 213455
Ekonometria jest nauką, którą wykorzystuje się do mierzenia i modelowania zjawisk ekonomicznych, a także innych zjawisk socjologicznych czy technicznych, od nich zależnych. Jednym ze środków, które służą w tym celu jest model ekonometryczny. Korzystając z niego można przedstawić związki, które zachodzą w procesach gospodarczych. W modelu ekonometrycznym bierze się pod uwagę tylko najbardziej istotne czynniki główne, które wpływają na zmienność zjawiska. Polega to na analizie zależności między jedną zmienną i zespołem czynników ją kształtujących. Modelowanie znajduje szerokie zastosowanie w gospodarce zarówno w pojęci makro jak i mikroskali. Można je wykorzystać w instytucjach czy przedsiębiorstwach. Przykładowymi zastosowaniami są: modele: inflacji i PKB, funkcje: produkcji i kosztów.
W poniższym projekcie przeanalizowane zostaną czynniki wpływające na produkcję korpusu. Dane zostały pobrane od firmy Danfoss. Zmienną objaśnianą będzie ilość zmian produkcyjnych przy honownicy KADIA, żeby została wyprodukowana dana liczba korpusów.
Do projektu wybrano następujących 9 zmiennych objaśniających:
Ilość korpusów wyprodukowanych w danym miesiącu – x1
Koszt wyprodukowania danej liczby korpusów – x2
Wskaźnik dostępności (OEE) centrum obróbki korpusu MAZAK – x3
Wskaźnik dostępności (OEE) honownicy KADIA – x4
Liczba zmian produkcyjnych przy centrum obróbki MAZAK – x5
Wskaźnik wydajności pierwotnej (FPY) centrum obróbki MAZAK – x6
Wskaźnik wydajności pierwotnej(FPY) honownicy KADIA – x7
Czas pracy centrum obróbki MAZAK w miesiącu [min] – x8
Czas pracy honownicy KADIA w miesiącu [min] – x9
Model obejmuje dużą próbę 34 danych, które zebrano od stycznia 2013 do października 2015.(Tabela 1)
Zmienne objaśniające wybrano biorąc pod uwagę fakt, iż do produkcji korpusu wykorzystuje się dwie maszyny: centrum obróbkowe i honownicę. Analizuje się wskaźniki dostępności maszyn w danym miesiącu, co uwzględnia ich ewentualną naprawę, wymianę narzędzi itd. Na ilość zmian przy honownicy ma wpływ czas jej pracy oraz centrum. Z maszynami ściśle związany jest współczynnik ich wydajności pierwotnej, który informuje nas na jakim poziomie znajduje się produkcja w danym miesiącu. Ilość korpusów wyprodukowanych w danym miesiącu to zmienna, która bardzo wpływa, gdyż to od niej przede wszystkim uzależnia się ilość zmian przy maszy
Tabela 1
Year | Month | No of shifts KADIA= Y | Quantity= x1 | Cost PLN= x2 | OEE MAZAK= x3 | OEE Kadia=x4 | No of shifts Mazak= x5 | FPY MAZAK= x6 | FPY KADIA=x7 | Time Mazak Min= x8 | Time Kadia Min= x9 |
---|---|---|---|---|---|---|---|---|---|---|---|
2013 | 1 | 16 | 3181 | 392726,26 | 0,76 | 0,91 | 45 | 0,961 | 0,996 | 60916,15 | 6998,20 |
2 | 18 | 3499 | 431986,54 | 0,75 | 0,92 | 49 | 0,965 | 0,995 | 67005,85 | 7697,80 | |
3 | 18 | 3563 | 439887,98 | 0,74 | 0,88 | 50 | 0,955 | 0,994 | 68231,45 | 7838,60 | |
4 | 13 | 2563 | 316427,98 | 0,69 | 0,87 | 36 | 0,923 | 0,995 | 49081,45 | 5638,60 | |
5 | 15 | 2956 | 364947,76 | 0,78 | 0,86 | 42 | 0,925 | 0,998 | 56607,40 | 6503,20 | |
6 | 21 | 4115 | 508037,90 | 0,74 | 0,87 | 58 | 0,923 | 0,996 | 78802,25 | 9053,00 | |
7 | 14 | 2734 | 337539,64 | 0,71 | 0,88 | 38 | 0,924 | 0,997 | 52356,10 | 6014,80 | |
8 | 17 | 3355 | 414208,30 | 0,68 | 0,89 | 47 | 0,928 | 0,997 | 64248,25 | 7381,00 | |
9 | 19 | 3738 | 461493,48 | 0,67 | 0,9 | 52 | 0,917 | 0,996 | 71582,70 | 8223,60 | |
10 | 20 | 3949 | 487543,54 | 0,73 | 0,88 | 55 | 0,928 | 0,998 | 75623,35 | 8687,80 | |
11 | 15 | 2939 | 362848,94 | 0,74 | 0,89 | 41 | 0,936 | 0,995 | 56281,85 | 6465,80 | |
12 | 10 | 1968 | 242969,28 | 0,71 | 0,93 | 28 | 0,935 | 0,996 | 37687,20 | 4329,60 | |
2014 | 1 | 14 | 2721 | 335934,66 | 0,75 | 0,88 | 38 | 0,924 | 0,996 | 52107,15 | 5986,20 |
2 | 10 | 1949 | 240623,54 | 0,76 | 0,84 | 28 | 0,931 | 0,983 | 37323,35 | 4287,80 | |
3 | 12 | 2359 | 291242,14 | 0,75 | 0,83 | 33 | 0,929 | 0,985 | 45174,85 | 5189,80 | |
4 | 15 | 2973 | 367046,58 | 0,74 | 0,85 | 42 | 0,965 | 0,987 | 56932,95 | 6540,60 | |
5 | 18 | 3517 | 434208,82 | 0,78 | 0,86 | 49 | 0,968 | 0,985 | 67350,55 | 7737,40 | |
6 | 19 | 3746 | 462481,16 | 0,77 | 0,84 | 53 | 0,967 | 0,986 | 71735,90 | 8241,20 | |
7 | 19 | 3667 | 452727,82 | 0,74 | 0,86 | 51 | 0,964 | 0,987 | 70223,05 | 8067,40 | |
8 | 12 | 2327 | 287291,42 | 0,71 | 0,92 | 33 | 0,968 | 0,985 | 44562,05 | 5119,40 | |
9 | 13 | 2409 | 297415,14 | 0,69 | 0,93 | 34 | 0,963 | 0,996 | 46132,35 | 5299,80 | |
10 | 15 | 2999 | 370256,54 | 0,68 | 0,94 | 42 | 0,965 | 0,995 | 57430,85 | 6597,80 | |
11 | 14 | 2775 | 342601,50 | 0,66 | 0,92 | 39 | 0,968 | 0,996 | 53141,25 | 6105,00 | |
12 | 8 | 1528 | 188646,88 | 0,74 | 0,91 | 22 | 0,967 | 0,994 | 29261,20 | 3361,60 | |
2015 | 1 | 15 | 2874 | 336516,66 | 0,75 | 0,88 | 40 | 0,971 | 0,996 | 55037,10 | 6322,80 |
2 | 12 | 2386 | 279376,74 | 0,78 | 0,92 | 34 | 0,968 | 0,997 | 45691,90 | 5249,20 | |
3 | 20 | 3913 | 458173,17 | 0,77 | 0,94 | 55 | 0,967 | 0,996 | 74933,95 | 8608,60 | |
4 | 14 | 2789 | 326564,01 | 0,76 | 0,93 | 39 | 0,959 | 0,998 | 53409,35 | 6135,80 | |
5 | 15 | 2978 | 348694,02 | 0,74 | 0,95 | 42 | 0,964 | 0,997 | 57028,70 | 6551,60 | |
6 | 19 | 3681 | 431008,29 | 0,78 | 0,91 | 52 | 0,963 | 0,996 | 70491,15 | 8098,20 | |
7 | 13 | 2437 | 285348,33 | 0,73 | 0,88 | 34 | 0,959 | 0,998 | 46668,55 | 5361,40 | |
8 | 16 | 3001 | 351387,09 | 0,71 | 0,89 | 42 | 0,968 | 0,997 | 57469,15 | 6602,20 | |
9 | 18 | 3574 | 418479,66 | 0,75 | 0,92 | 50 | 0,971 | 0,998 | 68442,10 | 7862,80 | |
10 | 15 | 2843 | 332886,87 | 0,74 | 0,91 | 40 | 0,962 | 0,995 | 54443,45 | 6254,60 |
V
V1 [%] 20.9478795
V2 [%] 21.1002767
V3 [%] 4.5109280
V4 [%] 3.5594558
V5 [%] 20.6357888
V6 [%] 1.9927782
V7 [%] 0.4620205
V8 [%] 20.9478795
V9 [%] 20.9478795
W przypadku, gdy wartość V[%] < 10 %, co w projekcie miejsce dla zmiennych objaśniających x3, x4, x6, x7 można sądzić, że te zmienne charakteryzuje małe zróżnicowanie. W tym momencie nie usuwa się żadnej z nich. O tym, które z nich są nie istotnie dowiemy się w dalszej części projektu.
Następnym krokiem było przeprowadzenie analizy korelacji.
Y | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | |
---|---|---|---|---|---|---|---|---|---|---|
Y | 1.0000 | 0.9967 | 0.9872 | 0.1456 | -0.0741 | 0.9955 | 0.0212 | 0.1294 | 0.9967 | 0.9967 |
x1 | 0.9967 | 1.0000 | 0.9930 | 0.1481 | -0.0697 | 0.9994 | 0.0041 | 0.1266 | 1.0000 | 1.0000 |
x2 | 0.9872 | 0.9930 | 1.0000 | 0.1094 | -0.1196 | 0.9924 | -0.0520 | 0.0818 | 0.9930 | 0.9930 |
x3 | 0.1456 | 0.1481 | 0.1094 | 1.0000 | -0.2417 | 0.1605 | 0.2237 | -0.2031 | 0.1481 | 0.1481 |
x4 | -0.0741 | -0.0697 | -0.1196 | -0.2417 | 1.0000 | -0.0678 | 0.4006 | 0.5641 | -0.0697 | -0.0697 |
x5 | 0.9955 | 0.9994 | 0.9924 | 0.1605 | -0.0678 | 1.0000 | 0.0093 | 0.1221 | 0.9994 | 0.9994 |
x6 | 0.0212 | 0.0041 | -0.0520 | 0.2237 | 0.4006 | 0.0093 | 1.0000 | -0.1065 | 0.0041 | 0.0041 |
x7 | 0.1294 | 0.1266 | 0.0818 | -0.2031 | 0.5641 | 0.1221 | -0.1065 | 1.0000 | 0.1266 | 0.1266 |
x8 | 0.9967 | 1.0000 | 0.9930 | 0.1481 | -0.0697 | 0.9994 | 0.0041 | 0.1266 | 1.0000 | 1.0000 |
x9 | 0.9967 | 1.0000 | 0.9930 | 0.1481 | -0.0697 | 0.9994 | 0.0041 | 0.1266 | 1.0000 | 1.0000 |
Wartość minimalna: -0,242.
Wartość maksymalna: 0,9994
Z powyższych wyników wnioskujemy, że najmniejsza korelacja występuję między zmienną x4 i x3. Największa korelacja zachodzi między x1 i x5.
Ocena siły korelacji
x1 - korelacja dodatnia, największa korelacja z Y
x2 - korelacja dodatnia, silna
x3 - korelacja dodatnia, bardzo słaba
x4 - korelacja ujemna, najmniejsza korelacja z Y
x5 - korelacja dodatnia, silna
x6 - korelacja dodatnia, słaba
x7 – korelacja dodatnia, słaba
x8 - korelacja dodatnia, silna, największa korelacja z Y
x9 - korelacja dodatnia, silna, największa korelacja z Y
Wykresy zmiennej objaśnionej do zmiennych objaśniających x1, x2, x5, x8 i x9 mają charakter funkcji liniowej. Pozostałe zmienne x3, x4, x6, x7 mają charakter losowy.
Przy współpracy z programem R, chciałyśmy otrzymać oszacowane parametry do modelu liniowego. Po wywołaniu w programie R odpowiedniego kodu, otrzymano:
Y | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 |
---|---|---|---|---|---|---|---|---|---|
-7.392e+00 | 7.947e-03 | -9.432e-06 | -1.770e+00 | -3.736e+00 | -1.297e-01 | 4.451e+00 | 8.264e+00 | NA | NA |
5.2 Postać modelu po oszacowaniu parametrów:
$$\hat{y} = - 7,392 + 0,008x_{1} - 9 \bullet 10^{- 6}x_{2} - 1,77x_{3} - 3,74x_{4} - 1,29x_{5} + 4,45x_{6} + 8,26x_{7}\backslash n$$
Budowa modelu - zmienne wyselekcjonowane przez kryterium Schwarza:
Następnym krokiem w projekcie jest selekcja zmiennych oparta o kryterium Schwarza BIC:
> model_BIC
Call: lm(formula = Y ~ x1, data = dane)
Coefficients:
(Intercept) | x1 |
---|---|
0.312610 | 0.005013 |
> summary(model_BIC)
Call: lm(formula = Y ~ x1, data = dane)
Residuals:
Min | 1Q | Median | 3Q | Max |
---|---|---|---|---|
-0.34704 | -0.17748 | -0.06750 | 0.06777 | 0.64293 |
Coefficients: Estimate Std. Error t value Pr(>|t|)
(Intercept) | 3.126e-01 | 2.220e-01 | 1.408 | 0.169 |
---|---|---|---|---|
x1 | 5.013e-03 | 7.248e-05 | 69.167<2e-16 | *** |
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.2617 on 32 degrees of freedom
Multiple R-squared: 0.9934, Adjusted R-squared: 0.9931
F-statistic: 4784 on 1 and 32 DF, p-value: < 2.2e-16
5.3 Model bez wyrazu wolnego:
Selekcja zmiennych oparta o kryterium Schwarza wykazała, że jedynie x1 jest istotną zmienną. Wobec tego zbudowano model bez wyrazu wolnego:
> model_bez_ww=lm(Y~x1-1)
> summary(model_bez_ww)
Call: lm(formula = Y ~ x1 - 1)
Residuals:
Min | 1Q | Median | 3Q | Max |
---|---|---|---|---|
-0.33416 | -0.19090 | -0.05107 | 0.10744 | 0.68257 |
Coefficients: Estimate Std. Error t value Pr(>|t|)
x1 | 5.113e-03 | 1.487e-05 | 344<2e-16 | *** |
---|
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.2655 on 33 degrees of freedom
Multiple R-squared: 0.9997, Adjusted R-squared: 0.9997
F-statistic: 1.183e+05 on 1 and 33 DF, p-value: < 2.2e-16
5.4 Ocena precyzji szacunku parametrów i dopasowania równania
Postać ogólna modelu: Y = α1x1
Postać oszacowana modelu: ŷ= 0,005x1
Standardowy błąd szacunku:
S(α1): 0,00001
Wartość standardowego błędu szacunku jest bardzo mała, stąd wnioskujemy, że wartość, którą oszacowano, niewiele różni się od jego rzeczywistej wartości.
Współczynnik determinacji R2: 0, 9997
Wartość współczynnika determinacji R2 jest równa 0,9997.
Znaczy to, iż model ekonometryczny w 99,97% objaśnia zmienność ilości zmian produkcyjnych przy honownicy KADIA.
5.5 Liniowy wykres dopasowania
Linia niebieska- wartości rzeczywiste
Linia czerwona- wartości oszacowane
Analizując powyższy wykres dowiadujemy się czy model ekonometryczny dobrze dopasował się do wybranych danych. Zauważając jedynie drobne rozbieżności linii od siebie, wnioskujemy, że model w wysokim stopniu dopasował się do naszych danych.
Interpretacja parametrów:
Interpretacją parametru x1 jest stwierdzenie, że:
Jeżeli ilość korpusów wyprodukowanych w danym miesiącu wzrośnie o 1, to można sądzić, że ilość zmian produkcyjnych przy Kadii wzrośnie o 0,005, przy założeniu, że pozostałe zmienne będą miały stałą wartość.
5.7 Weryfikacja założeń
5.7.1. Test Durbina-Watsona
durbinWatsonTest(model_bez_ww)
lag | Autocorrelation | D-W Statistic | p-value |
---|---|---|---|
1 | 0,02057523 | 1,836406 | 0,566 |
Alternative hypothesis: rho != 0
Hipoteza zerowa: brak występowania autokorelacji składnika losowego
Hipoteza alternatywna: występuje autokorelacja składnika losowego
Hipotezę zerową odrzuca się w przypadku, gdy poziom istotności α jest większy od p-value.
p-value=0,566 α=0,05
0,566>0,05, a więc p-value> α, co nie daje nam podstawy do odrzucenia hipotezy zerowej.
Wnioskuje się zatem, że w zbudowanym modelu nie występuje autokorelacja składnika losowego.
5.7.2. Test Shapiro-Wilka
W = 0,90015,
p-value = 0,004629
Hipoteza zerowa: składnik zerowy ma rozkład normalny
Hipoteza alternatywna: składnik zerowy nie ma rozkładu normalnego
Hipotezę zerową można odrzucić, gdy poziom istotności α > p-value. (α=0,05)
p-value=0,004629 α=0,05
0,004629 < 0,05, a więc p-value <α
Można odrzucić hipotezę zerową, zatem można mówić o braku rozkładu normalnego składnika losowego.
5.7.3. Test serii
Runs Test - Two sided
Standardized Runs Statistic = 1,3933,
p-value = 0,1635
Hipoteza zerowa: istnieje losowość składnika losowego
Hipoteza alternatywna: brak losowości składnika losowego
Hipotezę zerową można odrzucić, gdy poziom istotności α >p-value. (α=0,05)
p-value=0,1635 α=0,05
0,1635 > 0,05, a więc p-value >α
Hipoteza zerowa nie może zostać odrzucona. W przypadku tego testu mówi się o losowości składnika losowego.
5.7.4. Test symetrii
m-out-of-n bootstrap symmetry test by Miao, Gel, and Gastwirth (2006)
Test statistic = 2,1493,
p-value = 0,02
alternative hypothesis: the distribution is asymmetric.
sample estimates:
bootstrap optimal m
15
Hipoteza zerowa: symetryczny rozkład składnika losowego
Hipoteza alternatywna: brak symetrii rozkładu składnika losowego
Hipotezę zerową można odrzucić, gdy poziom istotności α > p-value. (α=0,05)
p-value=0,02 α=0,05
0,02< 0,05, a więc p-value <α
Hipoteza zerowa może zostać odrzucona, występuje brak symetrii rozkładu składnika losowego.
5.7.5. Test Goldfelda-Guandta
data: model_bez_ww
GQ = 10,727,
df1 = 16, df2 = 16,
p-value = 1,038e-05
Hipoteza zerowa: składnik losowy jest homoscedastyczny
Hipoteza alternatywna: składnik losowy nie jest homoscedastyczny
Hipotezę zerową można odrzucić, gdy poziom istotności α >p-value. (α=0,05)
p-value=0,00001 α=0,05
0,00001< 0,05, a więc p-value < α
Hipoteza zerowa może zostać odrzucona. W związku z tym wnioskuje się, że składnik losowy nie jest homoscedastyczny.
Powyższy model analizował czynniki wpływające na produkcję korpusu. Według kryteriów Schwarza na 9 zmiennych objaśniających, jedynie pierwsza ma istotny wpływ. Jest to ilość korpusów wyprodukowanych w danym miesiącu. Nieistotny okazał się także wyraz wolny. Wartość współczynnika determinacji R2 ukazała, że model ekonometryczny w 99,97% objaśnia zmienność ilości zmian produkcyjnych przy honownicy KADIA. Liniowy wykres dopasowania wykazał, iż model był bardzo dobrze dopasowany do danych.
Założenia projektu weryfikowano poprzez wykonanie pięciu testów:
Durbina-Watsona,
Shapiro-Wilka,
Serii,
Symetrii,
Goldfelda-Guandta.
Po ich wykonaniu odrzucono trzy z pięciu hipotez zerowych, co pomogło Nam scharakteryzować nasz model ekonometryczny. Nie występuje w nim autokorelacja składnika losowego. Składnik ten nie ma rozkładu normalnego, a jego rozkład charakteryzuje brak symetrii. Ponadto jest losowy oraz nie można go uznać za homoscedastyczny.
Projekt ten wykazał, że spośród pobranych danych najmniej skorelowane były zmienne: x3 i x4, czyli Wskaźnik dostępności (OEE) centrum obróbki korpusu MAZAK oraz Wskaźnik dostępności (OEE) honownicy KADIA. Najbardziej skorelowane były zmienne: x1 i x5, to jest: ilość korpusów wyprodukowanych w danym miesiącu i liczba zmian produkcyjnych przy centrum obróbki MAZAK.
W skutek przeprowadzonej analizy trzeba uznać, że powyższy model nie jest idealny. Trzeba rozpatrzeć go, wprowadzając do niego więcej zmiennych wpływających na zmienną objaśnianą.