Cele badania statystycznego:
Badania statystyczne muszą mieć określone cele. Zostają one wyznaczone przez zakres badania. Może ono dotyczyć jednego problemu, np. liczby zgonów, jak też kilku problemów. Do osiągania celów dobierany zostaje zakres przestrzenny i przedmiotowy badania. Metody analizy statystycznej muszą być oparte na metodach statystycznych. Cele badania statystycznego sprowadzają się do 3 grup zagadnień:
statystyczny opis struktury zjawisk - odnosi się do badania budowy zjawiska (stosunek proporcje)
statystyczny opis współzależności badanych zjawisk - polega na badaniu powiązań, występujących między poszczególnymi członami danego zjawiska
statystyczny opis dynamiki zjawisk - polega na badaniu rozwoju danych zjawisk (rozwój może być dodatni lub ujemny)
Etapy badania statystycznego:
W zależności od stopnia szczegółowości przedmiotu badań można wyróżnić mniej lub więcej etapów badania. W sposób syntetyczny (nie zależny od stopnia szczegółowości) można wyróżnić 3 etapy badania statystycznego:
Obserwacja statystyczna - gromadzenie odpowiedniego materiału statystycznego. Jest to najważniejszy z etapów, gdyż jakość i ilość zebranych danych wpływa na końcowy efekt badania. Podstawowym źródłem informacji statystycznej jest „Rocznik statystyczny”. Innym źródłem informacji może być ankieta lub wywiad sondażowy. Gromadzenie informacji wymaga posiadania pewnych umiejętności, umożliwiających oszczędzić czas i obniżyć koszty. Część danych może wystąpić w postaci gotowej, a pozostałe dane mogą wymagać uporządkowania, zestawienia.
Prezentacja statystyczna - podstawową formą jest tablica statystyczna. Składa się ona z pewnej liczby kolumn i wierszy, w których są zawarte dane, odpowiadające badanemu problemowi. Tablica musi posiadać tytuł, numer oraz nie może zwierać pustych miejsc. Przyczyny nie wypełnienia mogą być różne, np. brak danych, znikome wartości danych. Należy wtedy zastosować symbole statystyczne, określające przyczynę wolnego miejsca w tabeli.
Tabela 1. Ludność Polski według poziomu wykształcenia
Poziom wykształcenia |
Liczba osób (tys.) |
Podstawowe |
15005 |
Średnie |
7500 |
Wyższe |
2720 |
Źródło: Dane umowne lub Źródło: Rocznik statystyczny 2003 s. 146
Opis wyników badań - słowna charakterystyka uzyskanych efektów, pokazanie wyników na tle innych danych. Opis powinien być precyzyjny, zrozumiały dla słuchacza.
Zbiorowość statystyczna - zbiór wszystkich elementów podlegających badaniu statystycznemu.
Zbiorowość generalna - zespół elementów wywodzący się ze zbiorowości statystycznej, który charakteryzuje się pewnymi cechami.
Badania pełne - badanie wszystkich jednostek, np. narodowy spis ludności.
Badanie reprezentacyjne - badanie części zbiorowości generalnej. Nie bada się wszystkich jednostek, a jedynie wybiera się część elementów. Wybór próbki do badania musi spełniać 2 kryteria:
Wybór jednostek musi być losowy, czyli przypadkowy
Wybór jednostek musi być przeprowadzony w taki sposób, aby utworzona w nim zbiorowość próbna była reprezentatywna względem zbiorowości generalnej
Reprezentatywność - polega na tym, że struktura elementów w próbie jest identyczna lub bardzo zbliżona do struktury elementów zbiorowości generalnej (populacji)
Jeżeli próba spełnia te kryteria, umożliwiające przeprowadzenie badania na części populacji, wpływa tym samym na obniżenie kosztów i zaoszczędzenie czasu przeznaczonego na badanie całej zbiorowości.
Częstość (wskaźnik struktury) - stosunek odpowiedniej liczebności danej cechy i ogólnej liczebności zbiorowości
Dystrybuanta empiryczna - przyporządkowanie kolejnym wartościom cechy odpowiadających im częstości skumulowanych lub liczebności skumulowanych.
Przykład:
Pogrupowano dane dotyczące liczby błędów na poszczególnych stronach maszynopisu. Dane przedstawia tabela:
Tabela 2. Wykaz błędów
Liczba błędów Xi |
Liczba stron ni |
Częstość wi |
Liczba skumulowana |
Dystrybuanta empiryczna |
0 |
5 |
0,25 |
5 |
0,25 |
1 |
8 |
0,40 |
13 |
0,65 |
2 |
4 |
0,20 |
17 |
0,85 |
3 |
2 |
0,10 |
19 |
0,95 |
4 |
0 |
0 |
19 |
0,95 |
5 |
1 |
0,05 |
20 |
1,00 |
|
20 |
1 |
|
|
Frakcja - poszczególny (jeden) zapis częstotliwości.
Cecha dyskretna - to cecha zawierająca skończoną liczbę elementów.
Cecha ciągła - może przyjmować nieskończenie wiele elementów.
Cechy o bardzo dużej liczbie elementów jest ujmowana w przedziały klasowe.
Przedziały klasowe składają się z dwóch liczb, z których jedna jest dolną granica tegoż przedziału, a druga górna granica.
W takim przypadku do dalszych analiz bierzemy pod uwagę środki przedziałów określone symbolem
Przedziały klasowe musza spełniać 2 warunki:
zasada rozłączności, tzn. że każda jednostka statystyczna powinna trafić do jednej z klas
warunek wyczerpujący, tzn. że wszystkie obserwowane jednostki są objęte klasyfikacją
Miary pozycyjne:
Mediana (Me, me) to taka wartość cechy, że co najmniej połowa jednostek zbiorowości ma wartości cechy nie większe od niej i równocześnie, co najmniej połowa jednostek tejże zbiorowości ma wartości ni mniejsze od niej. To wartość cechy, którą ma środkowa jednostka w uporządkowanym (rosnąco lub malejąco) ciągu elementów badanej zbiorowości, a więc jednostka o mierze
. Jeżeli zbiorowość zawiera parzystą liczbę elementów to wyrażenie
nie jest liczbą całkowitą i dlatego każda wartość pomiędzy
i
może być medianą. W praktyce medianę oblicza się jako średnią z tych dwóch wielkości. Z podanej definicji wynika, że do wyznaczenia mediany można użyć skumulowanego szeregu liczebności lub dystrybuanty empirycznej. Medianą można określić jako taką pierwszą wartość cechy, dla której zachodzi
, czyli skumulowana liczebność osiąga wartość
bądź
,czyli dystrybuanta empiryczna przyjmuje wartości ½. W przypadku cechy skokowej, która jest przedstawiona jako ciąg liczb, wartość mediany możemy odczytać z szeregu kumulacyjnego liczebności lub z dystrybuanty. Natomiast w przypadku cechy ciągłej potrzebna jest interpolacja, która ma charakter liczbowy, wówczas mediana przyjmuje wzór:
(*)
X0m - dolna granica przedziału, w której znajduje się mediana
N(X0m) - liczebność skumulowana dla dolnej granicy przedziału mediany
hm, nm - oznaczają odpowiednio rozpiętości i liczebność przedziału mediany
Gdy posługujemy się dystrybuanta, korzystamy ze wzoru:
(**)
Fn - wartość dystrybuanty empirycznej
Mediana jest miarą tendencji centralnej wówczas, gdy zachodzi średnia arytmetyczna z uwagi na znaczną niejednorodność rozkładu lub ze względu na występowanie otwartych przedziałów klasowych.
Mediana należy do miar pozycyjnych rozkładu badanej cechy zwanych kwantylami.
Kwantylem rzędu p (0<p<1) w rozkładzie empirycznym nazywamy taką wartość cechy, dla której jako pierwszej dystrybuanta empiryczna spełnia następujący warunek:
. Do obliczania kwantyli stosujemy wzór interpolacyjny oparty na tych samych założeniach, co wzór na medianę (mediana jest jednym z kwantyli):
(***)
X0p - dolna granica przedziału, w którym znajduje się wartość kwantyla rzędu p
Fn(X0p) - skumulowana częstość względna dla dolnej granicy przedziału kwantila rzędu p
hp, wp - odpowiednio rozpiętość i częstość przedziału kwantyla rzędu p
- dolna granica przedziału kwantyla
- numer kwantyla
- suma szeregu skumulowanym powyżej przedziału kwantyla
Kwartyle - kwantyle rzędu 0,25; 0,5; 0,75
0,25 (K0,25) kwartyl pierwszy [Q1]; oddziela on 25% jednostek o wartościach niższych oraz 75% jednostek o wartościach wyższych od kwartyla pierwszego
0,5 (K0,5) jest mediana, czyli kwartylem drugim [Q2]
0,75 (K0,75) określa się jako kwartyl trzeci i oznacza [Q3]
Kwartyle dzielą uporządkowana rosnąco zbiorowość statystyczną na 4 części, liczące po 25% obserwacji. Kwartyle można obliczać stosując wzór (***) lub można je obliczać w sposób dokładny, wykorzystując indywidualne dane statystyczne. W tym celu należy znaleźć w uporządkowanym rosnąco szeregu obserwacji jednostek następujące numery:
dla Q1 lub
dla Q3. Gdy uzyskane numery nie są liczbami całkowitymi należy je zaokrąglić, np. 0,5 w numerze obserwacji dla Q1 zaokrąglamy w górę, natomiast 0,5 w numerze dla Q3 zaokrąglamy w dół.
Stosuje się także tzw. decyle, które dzielą zbiorowość uporządkowana na 10 części.
Poza ty stosuje się także w praktyce centyle, dzielące zbiorowość na 100 równych części.
Dominanta (D0, d0) w rozkładzie empirycznym cechy to wartość cechy występującej w tym rozkładzie najczęściej tzn. wartość, której odpowiada największa liczebność lub największa częstość. Dominantę określamy ze wzoru:
X0d - dolna granica przedziału, w którym występuje mediana
hd - rozpiętość (długość) przedziału
nd-1, nd+1 - oznaczają odpowiednie liczebności przedziału, w którym występuje dominanta, przedziału poprzedniego i przedziału następnego.
We wzorze dominanty możemy liczebności zastąpić częstościami.
Miary zróżnicowania cech (miary dyspersji):
Cechy statystyczne ulegają zmianom w czasie, co powoduje negatywne skutki w szacowaniu wartości zmiennej. Aby temu zapobiec statystyka wprowadziła specjalne miary, którymi są:
Rozstęp - między maksymalna z minimalną wartością cechy. Umożliwia on wstęp do analizy badanej cechy. Rozstęp powinien być stosowany przy niewielkiej różnicy między wartością maksymalna a minimalna. W przypadku dużej różnicy, należy odrzucić wartości skrajne lub zaprzestać analizy. Miara ta pozwala na wstępne rozpoznanie dyspersji badanej cechy. R = Xmax - Xmin
Wariacja - dla zestawu zmiennych np. x1, x2...xn nazywamy wyrażenie:
Jeżeli natomiast korzystamy z danych pogrupowanych (w szeregu rozdzielczy) odpowiedni wzór na wariacje to:
Jeśli badane cechy są ujęte w postaci przedziałów klasowych to stosujemy wzór:
Im mniejsza wartość wariacji, tym mniejsze zróżnicowanie badanej cechy.
Wariacja jest równa 0, gdy wartości w nawiasie są identyczne. Teoretycznie jest to możliwe, w praktyce jednak takie przypadki występują niezwykle rzadko.
Jednostka miary, w której wyrażona jest badana cecha we wzorze na wariację będzie występowała w kwadracie. W związku z tym wprowadzono miarę ściśle powiązaną z wariacją i oblicza się ją ze wzoru:
Jednostka nazywa się odchyleniem standardowym.
Odchylenie standardowe i wariacja mierzą to samo zjawisko, a mianowicie zróżnicowanie badanej cechy, tzw. skalę dyspersji badanej cechy.
Cechy statystyczne mogą być przekształcone z użyciem średniej arytmetycznej i odchylenia standartowego do postaci standardowej.
x - obserwacja należąca do zbioru danych o wartości średniej
i odchyleniu standardowym s.
Wartością standaryzowaną cechy x jest wartość:
u - cecha (zmienna) standaryzowana.
Samo przekształcenie nazywamy standaryzacją.
Otrzymywane w ten sposób wartości u wskazują, o ile odchyleń standartowych różnią się wartości cechy od średniej arytmetycznej.
Przykład:
Średnia liczba punktów zdobytych przez kandydatów zdających egzamin na wyższą uczelnię wynosiła 72, przy odchyleniu standardowym 6. Jakie są wartości standaryzujące następującej liczby punktów:
50
80
72
Liczba 50 punktów jest o 3,6 odchylenia standardowego mniejsza od średniej.
Liczba 80 jest o 1,3 odchylenia większa od średniej.
Liczba 72 pokrywa się ze średnią.
Dla każdego zbioru danych xj j=1...n, zbiór odpowiadających im wartości spełnia następujące warunki:
W przypadku prowadzonej analizy, gdy w zbiorze danych pojawią się wartości, dla których
>3, wówczas należy zweryfikować, czy w zbiorze tych wartości nie znalazł się błąd.
Asymetria rozkładu empirycznego
Rozkład empiryczny jest symetryczny, gdy każdej wartości cechy xi <
odpowiada wartości
takie, że
oraz ni = nj
Rozkład empiryczny jest symetryczny, jeżeli liczebność (częstość) układa się identycznie dla wartości cech jednakowo odległych od środka symetrii, jakim jest średnia arytmetyczna. Jeżeli rozkład nie spełnia tego warunku, to mówimy, że rozkład jest asymetryczny (skośny).
Klasycznym parametrem rozkładu cechy, wskazującym na asymetrię jest trzeci moment centralny, określony jako średnia arytmetyczna trzecich potęg odchyleń wartości cechy od jej średniej arytmetycznej:
M3 przyjmuje wartości ujemne dla rozkładu o asymetrii lewostronnej oraz wartości dodatnie dla rozkładu prawostronnego. Wartość 0 występuje przy rozkładzie symetrycznym.
Wartości M3 zależą od jednostki, w jakich wyrażona jest cecha, dlatego też wartości M3 nie można wykorzystywać do oceny w różnych populacjach.
Typowym miernikiem stopnia i kierunku asymetrii rozkładu jest współczynnik asymetrii:
s3 - odchylenie standardowe
M3 - trzeci moment centralny
W rozkładzie empirycznym jednomodalnym
rzadko przekracza 2.
Jeżeli rozkład jest symetryczny to
Asymetria prawostronna:
Asymetria lewostronna:
Analiza szeregów czasowych
W badaniach ekonomicznych często mamy do czynienia ze zbiorem wartości cechy lub wartości określonego zjawiska zaobserwowanych w różnych momentach lub różnych przedziałach czasowych. Tego rodzaju dane uporządkowane chronologicznie tworzą szereg czasowy lub szereg chronologiczny.
Składniki szeregu czasowego:
Rozwój konkretnego zjawiska w czasie może podlegać prawidłowościom, których wykrycie i opis są celem analizy szeregów czasowych. W teorii ekonomicznej analizy wyróżnia się szeregi czasowe:
Tendencja rozwojowa (trend)
Wahania okresowe (sezonowe)
Wahania koniunkturalne
Wahania przypadkowe (losowe)
Tendencja rozwojowa - przejawia się w danym szeregu czasowym poprzez systematyczne jednokierunkowe zmiany (wzrost lub spadek) poziomu badanego zjawiska, zachodzące w stosunkowo długim okresie. Charakter tych zmian (systematyczność, długotrwałość) pozwala przypuszczać, że przyczyną występowania trendów w rozwoju zjawiska jest stałe oddziaływanie na nie pewnego zespołu czynników.
Wahania okresowe (sezonowe) to rytmiczne wahania o określonym cyklu (okresie przebiegu). Najczęściej obserwujemy wahania o cyklu rocznym, który dzielimy na podokresy, np. półrocze, kwartał, miesiąc, dzień. Przyczynami wahań o cyklu rocznym są czynniki przyrodnicze, klimatyczne, dlatego też ten rodzaj wahań nazywamy okresowymi.
Metody analizy szeregów czasowych:
Wyrównywanie szeregów czasowych za pomocą tzw. średnich ruchomych i tę metodę nazywamy metodą mechaniczną
Szeregi czasowe zawierają w sobie istotny udział wahań okresowych i przypadkowych. Poddaje się je określonemu wyrównaniu, czego rezultatem jest nowy szereg czasowy, eksponujący trend rozwojowy zjawiska. Otrzymane w wyniku zastosowania średniej ruchomej wartości badanego zjawiska zastępują wyrazy danego szeregu pierwotnego. Średnie ruchome oblicza się zazwyczaj z nieparzystej liczby sąsiadujących ze sobą wyrazów szeregu tak, aby uzyskany wynik mógł przyporządkować całkowitej wartości „t”, znajdującej się w środku uwzględnionego w obliczeniach przedziału.
Liczba wyrazów szeregu czasowego uwzględniana przy obliczaniu średniej ruchomej 2q+1 (q - ustalona liczba naturalna)
Wzór na średnią ruchomą:
(t = q+1, q+2, q+3,...q+n)
Jeżeli przyjmiemy, że q = 1, to wówczas wzór wyraża średnie ruchome trzyokresowe.
Jeżeli przyjmiemy q = 2, to otrzymamy wzór na średnią ruchomą pięciookresową.
Zauważmy, iż szereg czasowy złożony z tak obliczonych średnich ruchomych jest krótszy od szeregu pierwotnego o dwa razy q-wyrazów. Znaczy się q-wyrazów początkowych i q-wyrazów końcowych.
q=1, szereg krótszy o 2 wyrazy
q=2, szereg krótszy o 4 wyrazy
Przykład:
q=1
y1 y2 =1/3(y1+ y2 + y3)
y2 y3=1/3(y2 + y3 +y4)
y3 y4=1/3(y3 + y4 + y5)
y4
y5
Ciągi średnich ruchomych tworzą nowe wyrównanie szeregów czasowych. Jeżeli przedmiotem analizy jest szereg czasowy złożony z 24 okresów, to liczba podokresów w pełnym cyklu wahań jest parzysta i w związku z tym otrzymanej średniej nie można będzie przyporządkować całkowitym wartościom „t”, a warunek całkowitoliczbowy na „t” wynika z dyskretnego charakteru rozpatrywania szeregów czasowych. Trudność tę, która występuje przy wahaniach o cyklu z parzystą liczbą podokresów pokonamy wówczas, jeżeli obliczymy tzw. średnie ruchome zcentralizowane. Przy ich obliczaniu uwzględnia się połowę wartości pierwszego wyrazu z danego cyklu wahań, następnie bierze się pod uwagę pozostałe wyrazy szeregu, składające się na pełny cykl wahań i wreszcie uwzględnia się połowę pierwszego wyrazu z następnego cyklu wahań. W ten sposób liczba składników sumy stanowiącej podstawę do obliczania średniej ruchomej jest nieparzysta. Oznaczając liczbę (parzystą) od okresów w cyklu wahań przed „d” oraz przyjmując, że
wzór na obliczenie średniej ruchomej scentralizowanej ma następującą postać:
Średnie ruchome są wykorzystywane w analizach prowadzonych przez banki, giełdy papierów wartościowych.
Wynikami są ciągi liczb, które stanowią linię trendu.
Trend nie odpowiada na pytanie, dotyczące czynników powodujących rozwój.
Wyrównywanie szeregów czasowych za pomocą określonej postaci funkcji i tę metodą nazywamy metodą analityczną
Funkcje trendu może mieć różne matematyczne postacie w zależności od rozkładu badanej cechy.
- parametry funkcji
t - zmienna wyrażająca czas
Bardzo ważna cecha metody analitycznej jest fakt, ze trend na podstawie funkcji można ekstrapolować, czyli można przewidywać, jak ten trend zachowa się w kolejnych latach nie objętych w analizie.
Dzięki metodzie analitycznej mamy możliwość tworzenia prognoz przebiegu badanego zjawiska.
Aby dojść do końcowych wzorów szacowania parametrów należy zastosować następujące wzory:
t - czas
- średnia czasu
- średnia wartość poziomu badanego zjawiska
- średnia wartość „t”
- parametr
Parametr
może przyjmować 2 wartości: większą od 0 i mniejszą od 0. Dodatni parametr oznacza, że mamy do czynienia z tendencja rozwojowa badanego zjawiska (trend rosnący). Natomiast parametr ujemny oznacza, że mamy do czynienia z trendem malejącym. Bezwzględna wartość parametru informuje o tempie zmian trendu, np.
oznacza, że poziom badanego zjawiska z miesiąca na miesiąc zmniejsza się o 3,5 jednostki.
Wartość parametru
informuje o poziomie badanego zjawiska w okresie poprzedzającym okres badany.
Wskaźniki sezonowości (okresowości), wyrażają jednoznacznie poziom wahań sezonowych dla przyjętych okresów. Znajomość wielkości wahań okresowych jest niezbędna dla trafnego przewidywania kształtowania się zjawiska w przyszłości. Analiza okresu sezonowości może mieć na celu „oczyszczenie” szeregu wyjściowego z wahań okresowych, aby dzięki temu ułatwić ocenę wpływu innych czynników ma poziom badanego zjawiska. Wahania okresowe mierzy się za pomocą tzw. wskaźników badań okresowych, zwanych również wskaźnikami sezonowości. Sposób konstrukcji tych wskaźników zależy od tego, czy w badanym szeregu czasowym występuje silny trend, czy trend jest umiarkowany, czy w ogóle nie występuje. Istotne znaczenie odkrywa fakt, czy badania okresowe nakładają się na trend w sposób addytywny (dodawanie), czy też oddziaływają one na trend w sposób multiplikatywny (mnożenie).
Końcowym wynikiem analizy wahań okresowych jest obliczanie wskaźników sezonowości dla takich okresów, jakie zostały przyjęte dla konkretnego problemu i cechy.
Jeżeli posługiwaliśmy się danymi kwartalnymi to wynikami analizy są wskaźniki dla poszczególnych kwartałów roku. Jeżeli tym przekrojem czasowym były np. miesiące to wskaźniki sezonowości odnoszą się do poszczególnych miesięcy zjawiska, które było przedmiotem analizy. Liczba wskaźników sezonowości dla danego cyklu badań zależy od liczby przyjętych podokresów tego cyklu.
Sezonowość - są to cykliczne, powtarzające się z dużą regularnością wahania zjawiska wyodrębnionych podokresach cyklu rocznego
Wahania sezonowe mogą wpłynąć na badana cechę (mogą ją zmniejszać lub zwiększać)
Szereg czasowy bez wyraźnego trendu
W takich szeregach czasowych wielkość wahań okresowych określa się porównując średnie wartości badanej cechy (obliczone dla poszczególnych podokresów cyklu rocznego) ze średnią wartością tej cechy (obliczoną na podstawie wszystkich obserwacji. Aby zdefiniować wskaźnik wahań sezonowych oznaczamy n-elementowy szereg czasowy z wahaniami okresowymi jako:
t - bieżący numer obserwacji
i - numer podokresu w cyklu
Przez Ni oznaczamy zbiór numerów obserwacji, które dotyczą i-tego podokresu cyklu.
i - liczebność zbioru
Średnią wartość badanej cechy w i-tym podokresie cyklu (
) obliczamy według wzoru:
(
A średnią z całego szeregu czasowego jako:
Wskaźniki wahań okresowych (Wi) są definiowane dla szeregu czasowego bez trendu jako ilorazy średnich z podokresów i średniej ogólnej:
Podajemy je w procentach, dlatego
Możemy powiedzieć, ze na skutek wahań okresowych wielkości badanego zjawiska w podokresie o numerze i jest o
wyższa lub niższa (w zależności od znaku) w całym okresie objętym analiza.
Wynika z tego, że odchylenia w ramach cyklu wnoszą się. Jeżeli mamy do czynienia ze względnym stałym w czasie poziomem zjawiska uzasadniony jest także pomiar wielkości sezonowych za pomocą miar absolutnych będących różnicami odpowiednich średnich
Szereg czasowy zawierający trend
W szeregu tym średnia arytmetyczna z całego szeregu czasowego nie reprezentuje dobrze poziomu tego zjawiska w poszczególnych podokresach cyklu i dlatego jej stosowanie nie jest wskazane przy określeniu badań okresowych. W takim przypadku wielkości badań okresowych oceniamy porównując pierwotny szereg czasowy z szeregiem wyrównanym, reprezentującym wyłącznie trend zjawiska.
Przyjmijmy, ze trend zjawiska jest wyrażany przez średnie ruchome. Dalsze postępowanie będzie zależne od tego, czy wahania mają charakter addytywny, czy tez multiplikatywny. W przypadku wahań multiplikatywnych dla wszystkich t, dla których wyznaczono średnie ruchome obliczamy indywidualne wskaźniki sezonowości w postaci
Surowe wskaźniki wahań okresowych (
) otrzymamy obliczając średnie arytmetyczne z zestawu wskaźników indywidualnych odpowiadających poszczególnym podokresom cyklu badań. Wobec tego:
Jeżeli szereg czasowy obejmuje dużą liczbę cykli, to przy obliczaniu średnich z jednoimiennych wskaźników można pominąć największe i najmniejsze, uznając je za nietypowe. Suma wskaźników
na ogół nie jest równa liczbie d, czyli liczbie podokresów w cyklu. Trzeba wówczas dokonać tzw. oczyszczenia składników
, korygując wskaźniki w następujący sposób:
Wartości wyrażeń
informują o ile procent wartość zbadanego zjawiska obserwowane w danym podokresie cyklu są na skutek wahań okresowych wyższe (+) lub niższe (-) od poziomu zjawiska określonego przez trend.
W przypadku występowania wahań okresowych addytywnych szeregów, oblicza się indywidualne różnice
, a następnie średnie tych różnic dla jednoimiennych podokresów cyklu wyznaczany w następującej relacji:
Miary
wyrażają wielkości wahań okresowych w poszczególnych podokresach cyklu w jednostkach absolutnych. Można je skorygować tak, aby suma odchyleń okresowych w obrębie cyklu wahań była równa 0. Warunek ten spełnimy, jeżeli obliczymy wartość
Wskaźniki wahań sezonowych obliczamy w celu wyodrębnienia lub wyeliminowania z pierwotnego szeregu czasowego wahań sezonowych. Procedura eliminacji multiplikatywnych wahań sezonowych polega na na podzieleniu wyrazów pierwotnego szeregu przez odpowiadające im wskaźniki:
Wahania sezonowe o charakterze addytywnym eliminujemy odejmując od wyrazu pierwotnego szeregu czasowego odpowiadające im odchylenia sezonowe:
Szereg czasowy o elementach
określany jest jedynie przez trend zjawiska i odchylenia przypadkowe. Na podstawie tego szeregu można wyznaczyć funkcję trendu metodą szacowania parametrów a i b. Znajomość podanych miar wahań sezonowych i funkcji trendu badanego zjawiska pozwala wyznaczyć jego prognozę dla okresów przyszłych.
W przypadku zjawiska z multiplikatywnymi wahaniami prognozę dla T otrzymamy ze wzoru:
Jeżeli badane zjawisko ma addytywne wahania sezonowe odpowiedni wzór na prognozę ma postać:
Indeksy statystyczne
Metody dynamicznej analizy zjawiska na podstawie szeregu czasowego poprzez wyznaczenie różnych mierników badanego zjawiska rozpatrywane w momentach czasu.
Pojęcie dynamiki zjawisk będziemy rozumieli jako zmienne zjawiska w czasie, przy czym w pojęciu zmienności kryje się zarówno jego wzrost jak i spadek.
Przyrosty badanego zjawiska mogą być dodatnie lub ujemne.
- wartość badanego zjawiska w kolejnych momentach czasu
gdzie
Podstawowymi miernikami dynamiki poziomu zmiennej yt są:
Absolutne przyrost wartości yt w okresie (t -1, t)
Względne przyrosty wartości yt w okresie (t -1, t)
- Poziom podanego zjawiska w wybranym momencie
Jeżeli w każdym momencie t jako moment odniesienia przyjmiemy
tzn. podstawą porównania jest wartość zjawiska w momencie poprzednim
to takie przyrosty nazywamy przyrostami łańcuchowymi.
Przykład:
Lata |
Wartość |
|
1996 |
101 |
- |
1997 |
120 |
120-101 |
1998 |
150 |
150-120 |
1999 |
180 |
180-150 |
Tak obliczone wskaźniki dynamiki informują jednocześnie o tempie zmian zjawiska lub cechy. Jeżeli podstawą porównań jest podstawa stała dla całego okresu analizowanego
to takie względne przyrosty będziemy nazywać przyrostami jednopodstawowymi.
Indeks indywidualny - miara umożliwiająca ocenę zmiany wartości towaru jednorodnego, ilości lub towaru w dwóch porównywanych okresach.
p - cena
q - ilość
Indywidualny indeks cen:
p1 - okres badany
p0 - okres bazowy
Indywidualny indeks ilości:
Indywidualny indeks wartości:
Wartość towaru: cena x ilość (p x q)
Produkty, które poddawane są badaniu indeksów muszą być jednorodne.
Badanie indywidualnych składników może przyjmować jako podstawę wartość towaru w okresie poprzedzającym lub wartość towaru w okresie bazowym, nie zmieniającym się przy kolejnych obliczeniach.
Indeksy, w których stosuje się okres bazowy, jako podstawę, są indeksami jednopodstawowymi.
Jeżeli podstawą porównań są wielkości z okresu bezpośrednio poprzedzającego badany okres, to takie indeksy nazywamy indeksami łańcuchowymi.
- indeksy jednopodstawowe
- indeksy łańcuchowe
Ważnym parametrem charakteryzującym kształtowanie się przebiegu danego zjawiska w czasie jest średnie tempo zmian tego zjawiska.
Tempo (stopa wzrostu) to stosunkowy przyrost wartości zmiennej w stosunku do jej wartości w okresie poprzednim. Jest to, zatem różnica między wartością indeksu łańcuchowego a jednością:
Średnie tempo oznacza równomierny, rozłożony w czasie tak określony przyrost wartości zmiennej, a więc może być ono wyznaczone jako różnica między średnim indeksem łańcuchowym a jednością. Stąd średniookresowe tempo zmian zjawiska yt w okresie od momentu zerowego do momentu (n-1) wynosi
- średnia geometryczna z indeksów łańcuchowych
Wartość
jest średnią wartością indeksu łańcuchowego w badanym okresie i określa, jaka była przeciętna zmiana wartości zjawiska z okresu na okres. Dlatego średnie tempo zmian poziomu zjawiska (0,n-1) oznacza, że w całym analizowanym odcinku czasu poziom zjawiska yt zmieniał się (wzrastał lub zmniejszał się w zależności od znaku wyrażenia r).
R(0,n-1) x 100%
Indeksy agregatowe (zespołowe)
Agregatowe indeksy wielkości absolutnych:
Wartości
Ceny
Ilości
Indeksy agregatowe mają zastosowanie przy analizie okresowego zjawiska w skład, którego wchodzi nie jeden, lecz zestaw towarów, np. zmiana cen określonej ilości towarów w okresie badanym w stosunku do okresu bazowego:
Ceny wzrosły
Ceny nie zmieniły się
Ceny spadły w porównywanych okresach
W skład badanych towarów powinny znajdować się towary charakteryzujące się podobnymi cechami użytkowym.
Indeks nie jest miarą syntetyczną. Nie mówi, o ile zmieniały się wartości poszczególnych towarów. Mówi o zmianie wartości ogólnej liczby badanych towarów.
t= 1 - oznacza okres bieżący
t=0 - oznacza okres bazowy
wj0, wj1 - oznacza wartość dóbr o numerze j w okresie bazowym i okresie badanym
pj0, pj1 - oznacza cenę dóbr w okresie bazowym i okresie badanym
qj0, qj1 - oznacza ilość towaru o numerze j odpowiednio w okresie bazowym i okresie badanym
Jednym z podstawowych indeksów agregatowych jest indeks wartości:
Indeks ten informuje o łącznym zmianach wartości wszystkich analizowanych jednocześnie towarów w okresie badanym w stosunku do momentu podstawowego.
Zmiany te mogą wynikać zarówno ze zmian ilości rozpatrywanych towarów jak i zmiany ich cen,. Wpływ każdego z tych czynników z osobna na wartość można określić, przyjmując drugi czynnik jako słały w porównywanych okresach. Taki zabieg nazywamy standaryzacją, czyli sprowadzeniu odpowiednich wielkości do wielkości porównywalnych. Stały poziom jednego z czynników tworzących agregat (cena lub ilość może być przyjęty w zasadzie dowolnie, tzn. z dowolnego okresu, ale z reguły przyjmuje się poziom tego czynnika bądź z okresu podstawowego bądź z okresu badanego). W zależności od przyjętej formuły standaryzacyjnej odpowiedni indeks agregatowy jest nazywany (od nazwisk autorów tych formuł) indeksem Laspeyres'a, gdy stały poziom ilości rozpatrywanych towarów lub ich cen brane są z okresu podstawowego. Natomiast opracowany przez Paasche'go przyjmuje, że stałymi wielkościami są ceny i ilości z okresu badanego. Agregatowy indeks, który określa wpływ zmian cen na dynamikę wartości (tzn. indeks, w którym stałe się ilości) nazywamy agregatowym indeksem cen. Natomiast indeks określający wpływ zmian ilości na dynamikę wartości (przy przyjęciu stałych cen) nazywamy agregatowym indeksem ilości.
Agregatowe indeksy cen:
Wg formuły Laspeyres'a
W mianowniku mamy sumę iloczynu ceny i ilości rozpatrywanych produktów w okresie bazowym (wartość grupy towarów z okresu bazowego)
Licznik zawiera sumę iloczynu ceny z okresu badanego i ilości pochodzącej z okresu bazowego.
Indeks ten mówi, ile trzeba zapłacić za towar, gdyby ich wartość odpowiadała cenie z okresu bieżącego z ilością bazowego.
Jak zmieniły się ceny towarów w okresie badanym w stosunku do podstawowego?
Wg formuły Paasche'go
Jeśli chodzi o analizę bieżących zmian cen stosuje się formułę Pasche'go, natomiast, jeśli analiza dotyczy okresów historycznych, retrospektywnych, to stosujemy formułę Laspeyres'a.
Agregatowe indeksy ilościowe:
Odpowiadają na pytanie: jak zmieniła się podaż (ilość) towarów analizowanych w porównywanych okresach?
Wg formuły Laspeyres'a
Wartość tego indeksu mówi nam, jak zmieniły się ilości towarów w okresie badanym w stosunku do okresu podstawowego.
Wg formuły Paasche'go
Współzależności indeksów zespołowych:
3