Rozdział 9
9. ANALIZA TRENDU NIELINIOWEGO: ESTYMACJA PARAMETRÓW STRUKTURALNYCH POTĘGOWEGO I WYKŁADNICZEGO MODELU TRENDU, WSPÓŁCZYNNIK DETERMINACJI NIELINIOWEJ FUNKCJI TRENDU JAKO PODSTAWA WYBORU NAJLEPSZEJ FUNKCJI
Podział modeli trendu na modele liniowe lub nieliniowe względem zmiennych oraz na modele liniowe lub nieliniowe względem parametrów możemy zilustrować następującymi przykładami: liniowy model trendu jest modelem liniowym względem zmiennych i liniowym względem parametrów; model trendu w postaci paraboli, czyli wielomianu stopnia drugiego, jest modelem nieliniowym względem zmiennych, a liniowym względem parametrów; wykładniczy model trendu jest modelem nieliniowym względem zmiennych i parametrów; potęgowy model trendu jest również modelem nieliniowym względem zmiennych i parametrów.
Przedmiotem zainteresowania w podstawowym kursie statystyki są dwa nieliniowe modele trendu: potęgowy i wykładniczy. Modele te, przez odpowiednią transformację zmiennych i parametrów, można sprowadzić do postaci liniowej względem zmiennych i względem parametrów.
Potęgowy model trendu jest następujący: Yt = β tα εt, dla t = 1,..., n. Po transformacji logarytmicznej obu stron otrzymujemy:
ln Yt = ln {β tα εt},
ln Yt = ln β + ln{tα} + ln εt,
ln Yt = ln β + α ln t + ln εt.
Przy oznaczeniach: Yt* = ln Yt, β* = ln β, t* = ln t, εt* = ln εt transformowany logarytmicznie, z użyciem logarytmów naturalnych, potęgowy model trendu zapisujemy jako liniowy model trendu postaci:
Yt* = β* + α t* + εt*.
Założenia właściwe dla klasycznego modelu trendu dotyczą logarytmicznej transformacji modelu:
E(ε*t) = 0,
,
, dla s … t, t, s = 1,..., n.
Wykładniczy model trendu jest następujący:
Yt = eαt+β+ε, dla t = 1,..., n.
Po transformacji logarytmicznej obu stron otrzymujemy:
ln Yt = ln [eαt+β+ε],
ln Yt = β + α t + εt,
ln Yt = α t + β + εt.
Przy oznaczeniu Yt* = ln Yt transformowany logarytmicznie, z zastosowaniem logarytmów naturalnych, potęgowy model trendu zapisujemy jako liniowy model trendu postaci:
Yt* = α t + β + εt.
Założenia właściwe dla klasycznego modelu trendu dotyczą jego logarytmicznej transformacji:
E(εt) = 0,
, E(εs, εt) = 0, dla s … t, t, s = 1,..., n.
Modele potęgowy i wykładniczy transformowane logarytmicznie do postaci modeli liniowych względem zmiennych i parametrów szacujemy, przy klasycznych założeniach, metodą najmniejszych kwadratów. Własności metody, słuszne dla modeli liniowych, nie zachowują mocy dla pierwotnej, wyjściowej postaci modeli, a zachowują moc dla transformowanej logarytmicznie postaci modeli.
Oszacowane metodą najmniejszych kwadratów w pierwszym kroku parametry strukturalne modeli liniowych (liniowych transformacji logarytmicznych modeli nieliniowych) pozwalają nam w drugim kroku wrócić do wyjściowej, nieliniowej postaci modelu i zapisać oszacowaną funkcję trendu na podstawie wyników oszacowań z kroku pierwszego.
Przy wykresach pierwotnej, nieliniowej funkcji trendu oraz jej liniowej transformacji logarytmicznej mamy do czynienia z układami współrzędnych prostokątnych o różnych skalach osi odciętych i rzędnych.
Aby otrzymać w prostokątnym układzie współrzędnych oszacowaną liniową funkcję trendu, należy odłożyć na poziomej osi odciętych oraz na pionowej osi rzędnych wartości zmiennej czasowej t i teoretyczne wartości
zmiennej zależnej Yt.
Aby otrzymać w prostokątnym układzie współrzędnych oszacowaną pierwotną potęgową funkcję trendu, należy odłożyć na poziomej osi odciętych oraz na pionowej osi rzędnych wartości zmiennej czasowej t i teoretyczne wartości
zmiennej zależnej Yt.
Aby otrzymać w prostokątnym układzie współrzędnych oszacowaną liniową transformację logarytmiczną potęgowej funkcji trendu, należy odłożyć na poziomej osi odciętych oraz na pionowej osi rzędnych transtormowane logarytmicznie wartości zmiennej czasowej lnt i teoretyczne wartości
zmiennej zależnej transformowanej logarytmicznie (ln Yt).
Aby otrzymać w prostokątnym układzie współrzędnych oszacowaną pierwotną wykładniczą funkcję trendu, należy odłożyć na poziomej osi odciętych oraz na pionowej osi rzędnych wartości zmiennej czasowej t i teoretyczne wartości
zmiennej zależnej Yt.
Aby otrzymać w prostokątnym układzie współrzędnych oszacowaną liniową transformację logarytmiczną wykładniczej funkcji trendu, należy odłożyć na poziomej osi odciętych oraz na pionowej osi rzędnych wartości zmiennej czasowej t i teoretyczne wartości
zmiennej zależnej transformowanej logarytmicznie (ln Yt).
Podstawowym kryterium oceny stopnia dopasowania liniowego oraz nieliniowych modeli trendu do danych liczbowych szeregu czasowego obserwacji jest współczynnik indeterminacji
i współczynnik determinacji
. W celu sformułowania wzorów tych współczynników przedstawiamy odchylenie obserwowanej wartości Yt od średniej arytmetycznej
, gdzie
, dla t = 1,..., n, jako sumę dwóch składników:
(9.1)
,
gdzie
w modelu liniowym
w modelu potęgowym
,
w modelu wykładniczym
,
Podnosząc obie strony relacji (9.1) do kwadratu mamy:
(9.2) ,
(9.3)
Sumując obie strony tożsamości (9.3) dla t = 1,..., n otrzymujemy następującą równość wariancyjną:
(9.4)
Dla modeli liniowych, których parametry szacowane są klasyczną metodą najmniejszych kwadratów, równość wariancyjna (9.4) upraszcza się (por. J. Jóźwiak, J. Podgórski: Statystyka od podstaw, PWE, Warszawa 1997, s. 395) do następującej:
(9.5)
.
Przy liniowych transformacjach logarytmicznych nieliniowych modeli trendu licznik wariancji zmiennej zależnej logarytmicznie transformowanej, ln Yt, wyraża się wzorem
gdzie
.
Licznik wariancji resztowej transformowanej zmiennej zależnej ln Yt określa wzór
,
gdzie
w modelu potęgowym
, dla t = 1,..., n,
w modelu wykładniczym
, dla t = 1,..., n.
Równość wariancyjna (9.5) zastosowana do liniowych transformacji logarytmicznych modeli nieliniowych: potęgowego i wykładniczego, przybiera postać równości wariancyjnej (9.6):
(9.6)
Wzór współczynnika determinacji
dla wyjściowej zmiennej zależnej Yt opisanej liniową funkcją trendu
jest następujący:
(9.7)
Wzór współczynnika determinacji
dla transformowanej logarytmicznie zmiennej zależnej lnYt (opisanej modelem potęgowym lub wykładniczym sprowadzonym do modelu liniowego poprzez transformację logarytmiczną) jest następujący:
(9.8)
gdzie
dla potęgowej funkcji trendu
, t = 1,..., n,
dla wykładniczej funkcji trendu
, t = 1,..., n.
Współczynnik determinacji dla wyjściowej, nieliniowej funkcji trendu wyznaczany jest z równości wariancyjnej (9.4) jako:
(9.9)
.
gdzie
dla potęgowej funkcji trendu
, t = 1,..., n,
dla wykładniczej funkcji trendu
, t = 1,..., n.
Wzory współczynników determinacji
dla wyjściowej zmiennej zależnej Yt opisanej modelem liniowym (9.7) oraz potęgowym lub wykładniczym (9.9) odpowiadają wykresowi oszacowanej funkcji trendu w prostokątnym układzie współrzędnych, gdzie na poziomej osi odciętych oraz na pionowej osi rzędnych odkładamy odpowiednio wartości zmiennej czasowej t i teoretyczne wartości
zmiennej zależnej Yt.
Wzór (9.8) współczynnika determinacji
dla transformowanej logarytmicznie zmiennej zależnej ln Yt (opisanej modelem potęgowym lub wykładniczym sprowadzonym do modelu liniowego poprzez transformację logarytmiczną) odpowiada wykresowi oszacowanej funkcji trendu w prostokątnym układzie współrzędnych, gdzie na poziomej osi odciętych oraz na pionowej osi rzędnych odkładamy odpowiednio:
1) dla modelu wykładniczego n wartości zmiennej czasowej t i teoretyczne wartości
zmiennej zależnej transformowanej logarytmicznie (lnYt),
2) dla modelu potęgowego n transformowane logarytmicznie wartości zmiennej czasowej, lnt, i teoretyczne wartości
zmiennej zależnej transformowanej logarytmicznie (lnYt).
Na pytanie, jak wybrać najlepszą funkcję trendu (liniową lub nieliniową) do opisu przebiegu zmian w czasie badanego zjawiska i jego prognozowania, odpowiedź w literaturze przedmiotu brzmi: należy wybrać tę funkcję, która ma najwyższą wartość współczynnika determinacji. Skoro współczynnik determinacji może być obliczany według wzoru (9.7), (9.8) lub (9.9) powstaje pytanie, który z nich może stanowić najlepszą podstawę takiego wyboru?
Z przeprowadzonych rozważań wynika, iż wzór (9.9) gwarantuje pełną porównywalność wyników ze względu na jednakową skalę prostokątnego układu współrzędnych, w którym na osi odciętych odkładane są wartości zmiennej czasowej t, a na osi rzędnych wartości teoretyczne
zmiennej zależnej Yt. Obliczanie współczynnika determinacji dla modeli nieliniowych według wzoru (9.8) powoduje, że wybierając najlepszą funkcję trendu spośród, np. liniowej, potęgowej i wykładniczej wybieramy najwyższą wartość wspóczynnika determinacji spośród współczynników liczonych według skali (t,
) n dla funkcji liniowej, (lnt,
) n dla funkcji potęgowej i (t,
) n dla funkcji wykładniczej.
Wniosek
Jak zatem obliczany jest współczynnik determinacji dla liniowych transformacji modeli nieliniowych w programach komputerowych? Oczywiście, według wzoru (9.8), co wynika z istoty metody najmniejszych kwadratów. Można jednak sformułować postulat, aby dzięki komputerowej łatwości dokonywania wszystkich obliczeń wzbogacić ofertę wyników o współczynniki determinacji obliczane dla nieliniowych funkcji trendu według wzoru (9.9). Ułatwiłoby to wybór najlepszej funkcji trendu spośród wielu oszacowanych, wśród których znalazłyby się funkcje liniowe względem zmiennych lub parametrów oraz różnego typu funkcje nieliniowe.
Przykład 1
Spółka założona w 1991 roku rozwijała się dobrze w następnych latach, czego dowodem jest, między innymi, suma zysku netto, która w kolejnych latach okresu lat 1991-1997 wynosiła odpowiednio 1, 1, 2, 3, 5, 5 i 8 mln PLN.
1) Metodą najmniejszych kwadratów proszę oszacować parametry strukturalne nieliniowego modelu trendu: a) potęgowego, b) wykładniczego sprowadzając oba modele, poprzez odpowiednią transformację logarytmiczną, do modeli liniowych.
2) Proszę obliczyć i porównać współczynniki determinacji:
a) dla zmiennych transformowanych logarytmicznie,
b) dla zmiennych wyjściowych.
Do obliczeń można wykorzystać informacje podane w tablicach 9.1 i 9.2.
Tablica robocza 9.1. Potęgowy model trendu
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
Lata |
t |
yt |
lnyt |
lnt |
lnt lnyt |
(lnt)2 |
|
|
|
|
|
|
|
|
|
1991 1992 1993 1994 1995 1996 1997 |
1 2 3 4 5 6 7 |
1 1 2 3 5 5 8 |
0 0 0,6931 1,0986 1,6094 1,6094 2,0795 |
0 0,6931 1,0986 1,3863 1,6094 1,7918 1,9459 |
0 0 0,7614396 1,5229891 2,5901683 2,8837229 4,0464991 |
0 0,4803876 1,2069219 1,9218276 2,5901683 3,2105472 3,7865268 |
-0,5392 0,4217 0,8785 1,2026 1,4539 1,6594 1,8331 |
Suma |
28 |
25 |
7,0900 |
8,5251 |
11,804818 |
13,196379 |
7,0900 |
Tablica 9.1 cd.
9 |
10 |
11 |
12 |
|
|
|
|
|
|
|
|
0,3592 -0,4217 -0,1854 -0,1040 0,1554 -0,0499 0,2464 |
0,1290246 0,1777971 0,0343731 0,0108222 0,0241584 0,0024960 0,0607228 |
-1,2179 -0,5248 -0,1193 0,1684 0,3915 0,5739 0,7280 |
1,483280 0,275415 0,014232 0,028358 0,153272 0,329361 0,529984 |
0,0000 |
0,4393942 |
-0,0002 |
2,813902 |
Tablica 9.1 cd.
13 |
14 |
15 |
16 |
17 |
18 |
19 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
-1,0128 -1,0128 -0,3197 0,0858 0,5966 0,5966 1,0667 |
1,0257638 1,0257638 0,1022080 0,0073616 0,3559315 0,3559315 1,1378488 |
0,69823 1,52449 2,40729 3,32886 4,28007 5,25595 6,25312 |
+0,30177 -0,52449 -0,40729 -0,32886 +0,71993 -0,25595 +1,74688 |
0,0910651 0,2750897 0,1658818 0,1081488 0,5182946 0,0655078 3,0516037 |
-2,57 -2,57 -1,57 -0,57 1,43 1,43 4,43 |
6,6049 6,6049 2,4649 0,3249 2,0449 2,0449 19,6249 |
0,0004 |
4,0108090 |
23,74801 |
-1,25199 |
4,2755917 |
0,01 |
39,7143 |
Źródło: obliczenia własne.
Tablica robocza nr 9.2. Wykładniczy model trendu
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Lata |
t |
yt |
ln yt |
t ln yt |
t2 |
|
|
|
|
|
|
|
|
|
|
|
|
1991 1992 1993 1994 1995 1996 1997 |
1 2 3 4 5 6 7 |
1 1 2 3 5 5 8 |
0 0 0,6931 1,0986 1,6094 1,6094 2,0795 |
0 0 2,0793 4,33944 8,0470 9,6564 14,5565 |
1 4 9 16 25 36 49 |
-0,0986 0,27189 0,64237 1,01286 1,38334 1,75383 2,12431 |
0,09860 -0,27189 0,05073 0,08574 0,22606 -0,14443 -0,04481 |
0,0097219 0,0739241 0,0025735 0,0073513 0,0511031 0,0208600 0,0020079 |
Suma |
28 |
25 |
7,900 |
38,7336 |
140 |
7,0900 |
0,00000 |
0,1675418 |
Tablica 9.2 cd.
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
-3 -2 -1 0 1 2 3 |
9 4 1 0 1 4 9 |
-1,0128 -1,0128 -0,3197 0,0858 0,5966 0,5966 1,0667 |
1,0257638 1,0257638 0,1022080 0,0073616 0,3559315 0,3559315 1,1378488 |
0,9061 1,3124 1,9009 2,7534 3,9882 5,7767 8,3671 |
0,0939 -0,3124 0,0991 0,2466 1,0118 -0,7767 -0,3671 |
0,0088172 0,0976187 0,0098049 0,0607819 1,0237594 0,6032225 0,1347770 |
-2,57 -2,57 -1,57 -0,57 1,43 1,43 4,43 |
6,6049 6,6049 2,4649 0,3249 2,0449 2,0449 19,6249 |
0 |
28 |
0,0004 |
4,0108090 |
25,0048 |
-0,0048 |
1,9387816 |
0,01 |
39,7143 |
Źródło: obliczenia własne.
Wyniki oszacowań a i ln b parametrów strukturalnych α i ln β potęgowego modelu trendu otrzymane na podstawie estymatorów
i
metody najmniejszych kwadratów są następujące:
,
.
,
,
a zatem b = 0,69824446.
Wyniki oszacowań dla logarytmicznej transformacji potęgowej funkcji trendu postaci
, dla t = 1,..., n,
zapisujemy:
, t = 1,..., n.
Dla wyjściowej funkcji trendu potęgowego otrzymujemy:
, t = 1,..., n.
Wyniki oszacowań a i b parametrów strukturalnych α i β wykładniczego modelu trendu otrzymane na podstawie estymatorów
i
metody najmniejszych kwadratów są następujące:
,
,
,
,
czyli
yt = a t + b, t = 1,..., n,
yt = 0,370482 t - 0,469056, t = 1,..., n,
a zatem
= e0,370482 t - 0,469056 , t = 1,..., n,
lub
= e-0,469056 e0,370482 t = 0,62559 [e0,370482<=>t, t = 1,..., n,
czyli
= 0,62559[1,4484]t, t = 1,..., n.
Współczynnik determinacji
dany wzorem (9.9) przyjął wartość r2, która wynosi,
a) dla potęgowej funkcji trendu,
r2 = 1 - 4,2755917/39,7143 = 1 - 0,1077 = 0,8923,
b) dla wykładniczej funkcji trendu,
r2 = 1 - 1,9387816/39,7143 = 1 - 0,0488 = 0,9512.
Współczynnik determinacji
dany wzorem (9.8) przyjął wartość r2, która wynosi,
a) dla potęgowej funkcji trendu,
r2 = 1 - 0,4393942/4,010809 = 1 - 0,1096 = 0,8904,
b) dla wykładniczej funkcji trendu,
r2 = 1 - 0,1675418/4,010809 = 1 - 0,0428 = 0,9582.
Wykładnicza funkcja trendu ma w obu przypadkach wyższą wartość współczynnika determinacji, jest zatem lepiej dopasowana do danych empirycznych niż funkcja potęgowa (jest także lepiej dopasowana niż funkcja liniowa, dla której współczynnik determinacji wynosi 0,9209).
Wartości współczynników determinacji obliczane według wzoru (9.8) oraz (9.9) są w omawianym przykładzie, o bardzo krótkim szeregu czasowym obserwacji, zbliżone. Nie dowodzi to, oczywiście, iż dla innych szeregów czasowych różnice są również niewielkie. Wybór tak krótkiego zbioru danych czasowych został podyktowany chęcią ograniczenia żmudnych obliczeń. Te zaś sygnalizują konieczność stosowania komputerowego wspomagania rachunków. Stosowanie kompletnych procedur statystycznych programów komputerowych ułatwia żmudne obliczenia, wymaga jednak dobrej znajomości metod, według których je zaprogramowano. Na omawianym przykładzie współczynników determinacji potwierdziliśmy tę prawdę.