statystyka opisowa, Statystyka Opisowa


STATYSTYKA:

Przedmiotem statystyki jest wykrywanie prawidłowości występujących w badanych różnorodnych zbiorowościach (zjawiskach masowych).

OPIS STATYSTYCZNY - liczbowy opis badanej zbiorowości lub zjawisk, występujący w formie tabelarycznej (szeregi, tablice), graficznej (wykresy) i parametrycznej (charakterystyki liczbowe takie jak miary położenia, dyspersji, asymetrii).

METODY ANALIZY:

WNIOSKOWANIE STATYSTYCZNE - uogólnianie wyników badania części zbiorowości nazywanej próbą losową, na całą zbiorowość (populację), z której ta część pochodzi. Uogólnianie to jest obarczone pewnym błędem, stąd też metody wnioskowania statystycznego oparte są na rachunku prawdopodobieństwa.

Próba statystyczna - zbiór obserwacji statystycznych wybranych (zwykle wylosowanych) z populacji.

Zwykle stosuje się tzw. próbę losową, definiowaną formalnie w teorii statystyki jako ciąg zmiennych losowych o rozkładzie takim jak rozkład populacji.

BADANIE STATYSTYCZNE - ogół prac mających na celu poznanie struktury określonej zbiorowości statystycznej.

ETAPY BADANIA STATYSTYCZNEGO:

  1. PROGRAMOWANIE (PLANOWANIE) BADANIA

  2. OBSERWACJA STATYSTYCZNA - gromadzenie, zbieranie materiału statystycznego, informacji o właściwościach poszczególnych jednostek statystycznych

  3. PREZENTACJA WYNIKÓW OBSERWACJI

  4. ANALIZA STATYSTYCZNA.

ETAP I - PROGRAMOWANIE (PLANOWANIE) BADANIA:

  1. OKREŚLENIE CELÓW BADANIA - ogólnych i cząstkowych

  2. OKREŚLENIE PRZEDMIOTU BADANIA

  1. OKREŚLENIE ZAKRESU BADANIA

  1. WYBÓR METODY BADANIA STATYSTYCZNEGO - całkowitej (pełnej), częściowej, reprezentacyjnej, monograficznej, ankietowej.

ZBIOROWOŚĆ (POPULACJA) STATYSTYCZNA - zbiór dowolnych elementów (osób, przedmiotów, faktów) nazywanych jednostkami statystycznymi, podobnych pod względem określonych cech i poddanych badaniom statystycznym.

STRUKTURA - budowa wewnętrzna zbiorowości.

JEDNOSTKA STATYSTYCZNA - poszczególny element (obiekt badania) zbiorowości statystycznej podlegający bezpośredniej obserwacji lub pomiarowi.

CECHY STATYSTYCZNE:

  1. STAŁE - wspólne wszystkim jednostkom danej zbiorowości i nie podlegają badaniu, a jedynie decydują o zaliczeniu jednostki do określonej zbiorowości

  1. ZMIENNE - właściwości, które różnią poszczególne jednostki statystyczne.

KLASYFIKACJA CECH - określenie wariantów cechy zmiennej.

CECHY ZMIENNE:

  1. JAKOŚCIOWE (CATEGORICAL VARIABLE, opisowe, niemierzalne) - można je wyrazić jedynie na skali nominalnej

  1. ILOŚCIOWE (QUANTITATIVE VARIABLE, liczbowe, mierzalne) - zależnie od pomiaru można je wyrazić na skali porządkowej, przedziałowej (interwałowej) lub ilorazowej

ROZKŁAD CECHY - przyporządkowanie liczby obserwacji (liczebności) odpowiednim wartościom cechy zmiennej.

SKALE pomiaru są uporządkowane od najsłabszej do najmocniejszej:

  1. NOMINALNA (NOMINAL) - cechy jakościowe, numer identyfikujący, klasyfikujący obiekt

  2. PORZĄDKOWA (ORDINAL) - cechy jakościowe, numer identyfikujący, szeregujący, porządkujący pozycję obiektu, ale nieokreślający wielkości różnic pomiędzy obiektami

  3. PRZEDZIAŁOWA (INTERVAL, INTERWAŁOWA) - cechy ilościowe, ocena w skali, przedziałach od - do

  4. ILORAZOWA (RATIO, STOSUNKOWA) - cechy ilościowe, coś na coś.

BADANIE STATYSTYCZNE:

  1. PEŁNE (CAŁKOWITE, WYCZERPUJĄCE) - np. powszechny spis ludności, rejestracja urodzeń, zgonów, małżeństw, rozwodów

  1. CZĘŚCIOWE (PRÓBKOWE)

  1. CIĄGŁE

  2. OKRESOWE

  3. DORAŹNE

  4. DOBÓR LOSOWY - np. badanie reprezentacyjne (badanie budżetów gospodarstw domowych, warunków życia ludności)

  5. DOBÓR NIELOSOWY

ETAP II - OBSERWACJA STATYSTYCZNA:

OKREŚLENIE ŹRÓDEŁ POZYSKIWANIA DANYCH:

SPIS - okresowe lub doraźne badanie wszystkich jednostek zbiorowości w ściśle określonym momencie czasu.

INWENTARYZACJA - rodzaj spisu polegający na ustaleniu stanu ilościowego i wartościowego oraz struktury, a także stopnia zużycia majątku trwałego w ściśle określonym momencie czasu.

REJESTRACJA BIEŻĄCA - sukcesywne rejestrowanie wydarzeń, które są przedmiotem badania.

SPRAWOZDAWCZOŚĆ - sporządzana na podstawie danych ewidencyjnych.

KLASYFIKACJA MATERIAŁU STATYSTYCZNEGO - ustalenie (wyodrębnienie) wariantów cechy.

GRUPOWANIE MATERIAŁU STATYSTYCZNEGO - usystematyzowanie, podział zbiorowości na jednorodne podgrupy według cech (szeregi rozdzielcze).

GRUPOWANIE:

ETAP III - PREZENTACJA WYNIKÓW OBSERWACJI:

SZEREG STATYSTYCZNY - ciąg wyników obserwacji uporządkowany lub uporządkowany i pogrupowany według określonych kryteriów, przyjętych wariantów cechy.

SZEREGI STATYSTYCZNE:

  1. SZCZEGÓŁOWE (WYLICZAJĄCE, PROSTE) - uporządkowane ciągi wartości badanych cech statystycznych według określonego kryterium

  2. ROZDZIELCZE - uporządkowane i pogrupowane ciągi wartości badanych cech statystycznych według określonego kryterium

  1. CZASOWE (DYNAMICZNE, CHRONOLOGICZNE).

WYKRES STATYSTYCZNY - graficzna, wizualna forma prezentacji materiału statystycznego.

WYKRESY STATYSTYCZNE:

  1. PUNKTOWE - szeregi szczegółowe, rozdzielcze jednostopniowe (punktowe)

  2. POWIERZCHNIOWE (np. słupkowe, kołowe, na planie różnych figur płaskich, histogramy) - szeregi rozdzielcze strukturalne, rozdzielcze wielostopniowe (przedziałowe)

  3. OBRAZKOWE - szeregi rozdzielcze strukturalne

  4. LINIOWE (krzywe, wieloboki liczebności) - szeregi rozdzielcze jednostopniowe (punktowe), rozdzielcze wielostopniowe (przedziałowe)

  5. TWARZE CHERNOFFA

  6. MAPOWE (np. kartogramy, kartodiagramy, szeregi geograficzne)

  7. PIRAMIDY WIEKU

  8. ZŁOŻONE (np. warstwowe, saldowe).

HISTOGRAM - zbiór prostokątów, których podstawy stanowią rozpiętość poszczególnych przedziałów klasowych, natomiast wysokości są określone przez liczebności odpowiadające poszczególnym przedziałom klasowym.

KRZYWA LICZEBNOŚCI - łamana powstała przez połączenie punktów, których współrzędnymi są środki przedziałów klasowych i odpowiadające im liczebności.

ETAP IV - ANALIZA STATYSTYCZNA:

CHARAKTERYSTYKI:

ROZKŁAD CECHY - przyporządkowanie liczby obserwacji (liczebności) odpowiednim wartościom cechy zmiennej.

ROZKŁAD EMPIRYCZNY - jeżeli wartości cechy zmiennej X zostaną uporządkowane oraz jeżeli tym wartościom zostaną przyporządkowane jednostki lub grupy jednostek badanej zbiorowości, to mówimy, że dany jest rozkład empiryczny jednej cechy. To opis wartości przyjmowanych przez cechę statystyczną przy pomocy częstości ich występowania.

TYPY ROZKŁADÓW EMPIRYCZNYCH:

  1. SYMETRYCZNY - obserwacje są rozłożone równomiernie (stopień skupienia) po obu stronach osi symetrii (punktu centralnego)

  2. ASYMETRYCZNY

  1. BIMODALNY

  2. SIODŁOWY

  3. RÓWNOMIERNY.

WŁASNOŚCI ROZKŁADU EMPIRYCZNEGO:

WSTĘPNA ANALIZA DANYCH - ma charakter opisowy, obejmuje proste operacje, metody sporządzania tablic i wykresów statystycznych. Ma na celu zrozumienie charakteru struktury danych, a w konsekwencji dobranie odpowiednich modelów statystycznych.

ANALIZA STRUKTURY - ilościowy opis każdej z własności rozkładu.

PARAMETRY ROZKŁADU - charakterystyki liczbowe służące do opisu własności rozkładu:

MIARY OPISUJĄCE SZEREGI:

MIARY POŁOŻENIA:

KWANTYLE:

MIARY DYSPERSJI (ROZPROSZENIA, ZMIENNOŚCI, ZRÓŻNICOWANIA) [A - absolutne, W - względne]:

  1. KLASYCZNE

  1. POZYCYJNE

MIARY ASYMETRII:

Statystyka dostarcza narzędzi pozwalających wykryć, zmierzyć i ocenić powiązania między cechami. Analizy takiej można dokonać dla dwóch lub większej liczby zmiennych. W dalszych rozważaniach ograniczymy się jedynie do analizy jednej pary zmiennych. Nazwijmy te zmienne X i Y. Jeżeli zmienne X i Y oddziałują na siebie wzajemnie lub współwystępują, to mówimy o korelacji lub współzależności tych cech. Nie mówimy wówczas o przyczynie i skutku, lecz określamy wzajemną relację między cechami.

KORELACJA (WSPÓŁZALEŻNOŚĆ) - wzajemne oddziaływanie lub współwystępowanie dwóch zjawisk lub cech tej samej zbiorowości.

WYKRES KORELACYJNY (DIAGRAM KORELACYJNY, DIAGRAM ROZPROSZENIA, WYKRES ROZRZUTU) (scatterplot) - pozwala zaobserwować i ocenić najważniejsze własności powiązań cech a więc: istnienie związku, rodzaj związku, kierunek zależności i siłę zależności. Analiza wykresu korelacyjnego pozwala również na zaobserwowanie jednostek, które znacznie odbiegają od pozostałych, tzw. outliersów.

KORELACJA:

KORELACJA:

KORELACJA:

WSPÓŁCZYNNIKI KORELACJI:

WSPÓŁCZYNNIK KORELACJI LINIOWEJ PEARSONA - iloraz miary łącznego zróżnicowania cech - kowariancji i iloczynu odchyleń standardowych tych cech. Można go stosować, jeżeli spełnione są jednocześnie dwa założenia: obie cechy są cechami ilościowymi oraz zależność między cechami jest liniowa. Współczynnik ten jest symetryczny, a więc nie ma znaczenia, którą cechę nazwiemy X, a którą Y, ponadto jest bardzo wrażliwy na wartości nietypowe (outliers).

KOWARIANCJA - miara współzależności cech, jednak jej wartość nie jest unormowana. Może przyjąć wartości z przedziału (-∞; +∞). Podzielenie kowariancji przez iloczyn odchyleń standardowych cech normuje jej wartość do przedziału <-1; 1>. Ten unormowany wskaźnik to współczynnik korelacji liniowej Pearsona.

WSPÓŁCZYNNIK KORELACJI RANG SPEARMANA

RANGA - miara ważności, intensywności, kolejności cechy. Badając cechy X i Y w oparciu o rangi możemy mówić o ich zgodnym lub niezgodnym uporządkowaniu. Jeżeli zbadamy uszeregowanie rang dla obu cech możemy stwierdzić, czy są one zgodne, jeżeli tak to w jakim stopniu, czy też nie są zgodne. Współczynnik ten przyjmuje wartości z przedziału <-1; 1>.

MIARY WSPÓŁZALEŻNOŚCI CECH JAKOŚCIOWYCH

W praktyce często zdarza się, że chcemy ocenić współzależności między cechami jakościowymi wyrażonymi w skali nominalnej lub między cechami jakościowymi a ilościowymi. Do oceny współzależności między cechami jakościowymi posługujemy się współczynnikami kontyngencji oceniającymi stopień powiązania (skojarzenia) cech. Ocena skojarzenia cech opiera się na statystyce χ2 (chi-kwadrat).

STATYSTYKA χ2 - mierzy różnicę między liczebnościami zaobserwowanymi empirycznie a teoretycznymi, które powinny się pojawić, gdyby cechy nie były ze sobą w żaden sposób powiązane. Przyjmuje wartości z przedziału <0; n pierwiastków z (k-1)(l-1)>. W przypadku małych różnic pomiędzy wartościami empirycznymi i teoretycznymi statystyka χ2 osiągnie niewielką wartość. Gdy różnice między wartościami empirycznymi i teoretycznymi statystyka χ2 będzie większa.

TABLICA KONTYNGENCJI (contingency table) - powstaje w wyniku grupowania badanej zbiorowości według dwóch cech i składa się z k wierszy odpowiadających wariantom jednej cechy oraz l kolumn odpowiadającym wariantom drugiej. Symbol nij oznacza liczbę jednostek posiadających i-ty wariant jednej cechy i j-ty wariant drugiej (i = 1, 2, ..., k; j = 1, 2, ..., l). Na podstawie tej tablicy wyznacza się statystykę χ2.

TABLICA ASOCJACJI (2x2 contingency table)

W wyniku grupowania zbiorowości w oparciu o dwie cechy jakościowe dychotomiczne powstanie tablica asocjacji (czteropolowa) - o rozmiarach 2x2.

Nie powinniśmy używać statystyki χ2 w przypadku, gdy n < 20 lub gdy 20 < n < 40, a wartości empiryczne są mniejsze niż 5. Jeżeli n > 40, żadna z wartości empirycznych nie powinna być mniejsza od 1. Zwiększenie próby n-krotnie z zachowaniem proporcji powoduje zwiększenie statystyki χ2 dwukrotnie.

MIERNIKI OPARTE NA χ2 - wartość χ2 jest wprost proporcjonalna do n:

REGRESJA LINIOWA - statystyczny opis związku przyczynowo-skutkowego między zmienną niezależną (przyczyną) a zmienną zależną (skutkiem). Analityczną postacią tego związku jest formalna konstrukcja nazywana modelem regresji. Model może mieć postać dowolnej funkcji. Szczególnym przypadkiem regresji jest regresja liniowa jako przypadek najprostszy (o łatwo interpretowalnych parametrach), a jednocześnie często spotykany w praktyce.

ZASTOSOWANIE ANALIZY REGRESJI:

Jeżeli dwie zmienne X i Y są ze sobą powiązane liniowo i występuje zależność przyczynowo-skutkowa, to zależność tą można przedstawić następująco:

Analiza regresji nie jest symetryczna. Wpływ cechy X na Y nie jest identyczny jak wpływ cechy Y na X. Z tej przyczyny należy dokładnie sprecyzować, która cecha wpływa na którą. Błąd spowoduje rozwiązanie innego zadania niż należało.

Z geometrycznego punktu widzenia współczynnik b to współczynnik kierunkowy prostej (nachylenie) a współczynnik a wskazuje przecięcie prostej z osią OY.

b - informuje o ile przeciętnie zmieni się Y, gdy X wzrośnie o jednostkę

a - informuje jaki poziom osiągnie Y, gdy X będzie równe 0

Jest oczywiste, że empiryczne punkty prawie nigdy nie będą leżały dokładnie na prostej regresji. Pojawi się różnica między wartościami empirycznymi a teoretycznymi wynikającymi z przyjętej funkcji. Chcemy jednak, aby linia regresji przechodziła między punktami empirycznymi jak najbliżej wszystkich tych punktów jednocześnie. Różnice między wartościami empirycznymi (punktami) a teoretycznymi (prosta) nazywamy resztami.

WYZNACZANIE WARTOŚCI WSPÓŁCZYNNIKÓW REGRESJI

Chcemy, aby linia regresji przechodziła między punktami empirycznymi jak najbliżej wszystkich tych punktów jednocześnie. Chcemy więc, aby suma odchyleń wartości empirycznych od teoretycznych była minimalna. Ponieważ jednak odchylenia dodatnie znoszą się z ujemnymi będziemy analizować kwadraty reszt: Σ(yi - ŷi)2 = min dla ŷi = f(xi) [dla x dokładnie odwrotnie]. Kryterium to nazywa się kryterium najmniejszych kwadratów. Podstawiając w równaniu w miejsce wartości teoretycznych funkcję, której parametry chcemy znaleźć, minimalizując to wyrażenie uzyskamy parametry funkcji regresji uzyskane metodą najmniejszych kwadratów.

OCENA DOPASOWANIA REGRESJI

Można powiedzieć, że na cechę Y wpływa cecha X, jednak prawie nigdy nie jest to jedyny czynnik kształtujący wartość cechy Y. Są zwykle jeszcze inne, nieuwzględnione w analizie czynniki (choć mniej istotne). To te inne (nieobserwowane w regresji) czynniki powodują, że regresja nie wyjaśnia „wszystkiego”.

Pomiaru zmienności resztowej dokonuje się w oparciu o odchylenie standardowe składnika resztowego (średni błąd szacunku, odchylenie standardowe reszt). Współczynnik ten mierzy przeciętne odchylenie wartości empirycznych od teoretycznych. Im mniejsza jego wartość, tym udział zmienności resztowej w ogólnej zmienności jest mniejszy, a więc dopasowanie prostej do danych empirycznych lepsze. Średni błąd szacunku ma jedną wadę. Może przyjmować wartości z przedziału (0; +∞), jest więc ograniczony jedynie z dołu. Małe wartości łatwo zinterpretować, duże zaś trudniej. Aby unikać tej niedogodności należy posłużyć się względnym wskaźnikiem wahań przypadkowych - współczynnikiem zmienności resztowej. Pozwala on zinterpretować natężenie wahań przypadkowych w stosunku do przeciętnego poziomu zmiennej zależnej. Wartości bliskie 0 będą oznaczały minimalne natężenie wahań przypadkowych w więc „dobrą” regresję. Wartości bliskie 100% będą oznaczały, że wahania przypadkowe stanowią przeciętnie 100% średniej zmiennej zależnej, a więc są duże i taka regresja nie ma praktycznych zastosowań. Większe wartości wykluczają taką funkcję całkowicie.

Całkowitą zmienność mierzoną sumą kwadratów odchyleń wartości cechy od jej średniej arytmetycznej można zapisać jako sumę zmienności wyjaśnionej przez regresję i zmienności niewyjaśnionej: Σ(yi - ӯ)2 = Σ(ŷi - ӯ)2 + Σ(yi - ŷi)2 R2 + φ2 = 1.

WSPÓŁCZYNNIK DETERMINACJI - przyjmuje wartości z przedziału <0; 1> i informuje jaka część zmienności zmiennej zależnej jest wyjaśniona przez kształtowanie się zmiennej niezależnej. Jego wysokie wartości oznaczają, że wyznaczona prosta dobrze opisuje badane zjawisko. Do zastosowań praktycznych powinien być wyższy niż 0,9, w przeciwnym wypadku analizy oparte na regresji będą jedynie przybliżone i mało dokładne. Na podstawie współczynnika determinacji można wyznaczyć indeks korelacyjny. Pozwala on mierzyć siłę i kierunek współzależności między cechami niezależną i zależną. W regresji jest on co do wartości bezwzględnej równy współczynnikowi korelacji liniowej Pearsona. Znak współczynnika jest taki jak znak współczynnika regresji b. R2 = Σ(ŷi - ӯ)2 / Σ(yi - ӯ)2

WSPÓŁCZYNNIK ZBIEŻNOŚCI (INDETERMINACJI) - przyjmuje wartości z przedziału <0; 1> i informuje jaka część zmienności cechy zależnej jest wywołana innymi czynnikami niż kształtowanie się cechy niezależnej. Wysokie wartości współczynnika oznaczają, że inne czynniki niż zmienna niezależna są ważniejsze w kształtowaniu się cechy zależnej.

FUNKCJA LINIOWA - postaci ŷi = a + bxi. Parametr b funkcji liniowej jest interpretowany jako WSPÓŁCZYNNIK REGRESJI, tzn. jeżeli X wzrośnie o jednostkę, to Y zmieni się (wzrośnie lub spadnie) średnio o b.

FUNKCJA POTĘGOWA - postaci ŷi = axib może być przekształcona do postaci liniowej przez logarytmowanie: log ŷi; = log a + b log xi. Parametr b funkcji potęgowej jest interpretowany jako WSPÓŁCZYNNIK ELASTYCZNOŚCI, tzn. jeżeli zmienna X wzrośnie o 1%, to Y zmieni się (wzrośnie lub spadnie) średnio o b%.

FUNKCJA WYKŁADNICZA - postaci ŷi = abxi może być przekształcona do postaci liniowej przez logarytmowanie: log ŷi; = log a + xi log b. Parametr b funkcji wykładniczej jest interpretowany jako ŚREDNI PRZYROST WZGLĘDNY, tzw. STOPA PRZYROSTU. Jeżeli X wzrośnie o jednostkę, to Y zmieni się (wzrośnie lub spadnie) średnio o (b-1)*100%.

FUNKCJA HIPERBOLICZNA - postaci ŷi = a + b*(1 / xi). Parametr a jest interpretowany jako WSPÓŁCZYNNIK NASYCENIA. Jeżeli X rośnie, to Y utrzymuje się przeciętnie na poziomie a.

SZEREG CZASOWY - szereg statystyczny, w którym kryterium porządkowania jest czas. To ciąg wyników obserwacji uporządkowanych w kolejnych jednostkach czasu. Przedstawia się je na wykresach liniowych lub punktowych.

SZEREGI CZASOWE:

Zależnie od celu badania, a także od charakteru zmian występujących w szeregach czasowych, stosujemy różne metody ustalania w nich prawidłowości statystycznych. Jeżeli chcemy badać natężenie zmian jakiegoś zjawiska w poszczególnych okresach (momentach) w odniesieniu do innych okresów (momentów), to stosujemy miary zwane WSKAŹNIKAMI DYNAMIKI. Jeżeli interesują nas prawidłowości rozwojowe w dłuższym czasie (w kilku, kilkunastu lub kilkudziesięciu okresach), to badamy TENDENCJĘ ROZWOJOWĄ (TREND), analizujemy także SEZONOWOŚĆ, gdy informacje liczbowe są podane w kwartałach lub miesiącach.

INDYWIDUALNE WSKAŹNIKI DYNAMIKI

Przyrosty możemy wyznaczyć w sposób bezwzględny (absolutny) lub względny. PRZYROSTY ABSOLUTNE informują nas o zmianach zachodzących w poziomie zjawiska w takich jednostkach jak jednostka badanej cechy. PRZYROSTY WZGLĘDNE przekazują tę samą informację jednak w sposób względny, a więc opisują zmiany w poziomie badanego zjawiska, lecz są to zmiany procentowe.

PRZYROSTY:

  1. ABSOLUTNE

  1. WZGLĘDNE

Relatywne zmiany w szeregach czasowych można mierzyć za pomocą WSKAŹNIKÓW DYNAMIKI zwanych INDEKSAMI.

INDEKS - iloraz poziomu zjawiska w okresie badanym do poziomu zjawiska w okresie przyjętym za podstawę porównań.

INDEKSY INDYWIDUALNE:

ŚREDNIE TEMPO ZMIAN - pokazuje średnią względną zmianę (wzrost lub spadek - w zależności od znaku) badanego zjawiska z okresu na okres.

INDEKSY AGREGATOWE

W wielu przypadkach chcielibyśmy badać dynamikę zmian nie jednej badanej cechy, a całego ich zespołu (agregatu). Gdy dodatkowo składniki tego zespołu charakteryzują się niejednorodnością, są wyrażone w różnych jednostkach, to nie można ich zbadać w oparciu o wskaźniki indywidualne, ze względu na niemożliwość ich zsumowania. W sytuacjach takich należy posłużyć się wskaźnikami agregatowymi (zespołowymi). Pomysł polega na tym, aby korzystając z tego, że znamy ceny wszystkich produktów i usług, a także ich ilości, w analizie brać pod uwagę wartość całego agregatu. Podstawa sumowania jest wtedy wspólna dla wszystkich cech (jest nią cena).

Jeżeli cenę oznaczymy symbolem p, a ilość (fizyczną wielkość) dóbr symbolem q, to mnożąc (p · q) otrzymamy WARTOŚĆ. Sumując wartości poszczególnych towarów lub usług, otrzymamy łączną wartość badanego agregatu dóbr, czyli Σqp. Rozwiązanie takie zaproponowali E. Laspeyres i H. Paasche. Następne propozycje przedstawili Tornqvist i Fisher.

INDEKS AGREGATOWY - indeks, który mierzy względne zmiany wartości kilku zmiennych wziętych razem, tworzących pewną kombinację.

INDEKS CEN KONSUMPCYJNYCH - ważony indeks agregatowy ceny kombinacji wielu artykułów konsumpcyjnych.

AGREGATOWY INDEKS WARTOŚCI - informuje o stopniu zmian w wartości badanego zespołu (agregatu) towarów (usług) w okresie badanym w porównaniu z okresem podstawowym. Ponieważ na wartość agregatu wpływają zarówno ceny jak i ilości, znaczenie ma także okres jaki weźmiemy do porównań.

AGREGATOWY INDEKS WARTOŚCI dla agregatu składającego się z j = 1, 2, ..., k, gdzie sumowanie obejmuje wszystkie dobra (towary, usługi) składające się na analizowany agregat, natomiast:

qj0 - ilość dóbr w okresie podstawowym

qjt - ilość dóbr w okresie badanym

pj0 - ceny jednostkowe dóbr w okresie podstawowym

pjt - ceny jednostkowe dóbr w okresie badanym.

AGREGATOWY INDEKS CEN - pokazuje jaki był wpływ zmian cen na dynamikę wartości przy ustabilizowanych ilościach składników badanego agregatu.

AGREGATOWY INDEKS ILOŚCI - pokazuje jaki był wpływ zmian ilości składników agregatu na dynamikę wartości przy ustabilizowanych cenach składników badanego agregatu.

AGREGATOWY INDEKS CEN LASPEYRESA - pokazuje jaki był wpływ zmian cen na dynamikę wartości badanego agregatu przy ustabilizowanych ilościach z okresu podstawowego.

AGREGATOWY INDEKS CEN PAASCHE'EGO - pokazuje jaki był wpływ zmian cen na dynamikę wartości badanego agregatu przy ustabilizowanych ilościach z okresu badanego.

Stałe ilości z okresu podstawowego mają ten walor, że są takie same we wszystkich indeksach liczonych dla kolejnych okresów, natomiast stałe ilości z okresu badanego zmieniają się w każdym kolejnym indeksie - mają więc wadę ograniczonej porównywalności stopnia zmian w cenach. Jednakże walorem stałych ilości z okresu badanego jest ich aktualność.

AGREGATOWY INDEKS CEN FISHERA (INDEKS „IDEALNY”) - w przypadku dużych rozbieżności między indeksem Paasche'ego i Laspeyresa indeks Fishera przestaje być „idealny”. Ma też wówczas niewielką wartość poznawczą.

AGREGATOWY INDEKS ILOŚCI LASPEYRESA - pokazuje jaki był wpływ zmian ilości na dynamikę wartości badanego agregatu przy ustabilizowanych cenach z okresu podstawowego.

AGREGATOWY INDEKS ILOŚCI PAASCHE'EGO - pokazuje jaki był wpływ zmian ilości na dynamikę wartości badanego agregatu przy ustabilizowanych cenach z okresu badanego.

Stałe ceny z okresu podstawowego mają ten walor, że są takie same we wszystkich indeksach liczonych dla kolejnych okresów, natomiast stałe ceny z okresu badanego zmieniają się w każdym kolejnym indeksie - mają więc wadę ograniczonej porównywalności stopnia zmian w ilościach. Jednakże walorem stałych cen z okresu badanego jest ich aktualność.

RÓWNOŚCI INDEKSOWE - między indeksami agregatowymi wartości, ilości i cen zachodzą związki matematyczne, które można zapisać następująco:

Iw = LIp · PIq

Iw = PIp · LIq

Iw = FIp · FIq

SKŁADOWE SZEREGU CZASOWEGO:

  1. TENDENCJA ROZWOJOWA (TREND) - ogólny kierunek zmian badanego zjawiska zachodzący w długim okresie czasu, będący wynikiem oddziaływania określonego zespołu przyczyn głównych; może być wzrostowy, spadkowy lub pozostawać na takim samym niezmiennym poziomie (wtedy mówi się o stałym lub średnim poziomie zjawiska)

  2. WAHANIA OKRESOWE - regularny wzrost lub spadek wartości badanego zjawiska w podobnych okresach czasu; wahania pojawiające się periodycznie w skali dnia, tygodnia, dekady, miesiąca, kwartału, sezonu, roku, itp.

  1. WAHANIA NIEREGULARNE - pozostałe wahania niebędące wahaniami cyklicznymi ani sezonowymi, zwykle są to nieregularne odchylenia wartości badanego zjawiska o niewielkim natężeniu

DEKOMPOZYCJA SZEREGÓW CZASOWYCH

W pewnym uproszczeniu można przyjąć, że poziom zjawiska rozpatrywanego w czasie (Y) jest funkcją trendu (Ŷ), wahań sezonowych (S) i wahań nieregularnych (E): Y = f(Ŷ, S, E). Wyodrębnienie powyższych składników nosi nazwę DEKOMPOZYCJI SZEREGU CZASOWEGO.

Poszczególne składniki szeregu czasowego są oceniane za pomocą odpowiednich charakterystyk liczbowych. Trend jest opisywany za pomocą średnich ruchomych oraz funkcji analitycznych. Wahania sezonowe są charakteryzowane za pomocą wskaźników sezonowości. Miarą wahań nieregularnych jest wariancja resztowa i współczynnik zbieżności. Na ogół przyjmuje się, że składniki szeregu czasowego mają charakter addytywny, tzn. konkretna obserwacja yt jest traktowana jako suma: yt = ŷt + sti + eti.

WYODRĘBNIANIE TRENDU

W szeregu czasowym występuje trend, jeżeli w dłuższym horyzoncie czasowym jego wartości wykazują tendencję do systematycznego wzrostu lub spadku.

METODY WYODRĘBNIANIA TRENDU Z SZEREGU CZASOWEGO:

ANALITYCZNA METODA WYODRĘBNIANIA TRENDU - FUNKCJE TRENDU

Podejście modelowe pozwala na znalezienie parametrów odpowiedniej funkcji, która będzie możliwie najlepiej opisywała zmiany wartości szeregu w czasie. Można tu posłużyć się analogią do analizy regresji. Jeżeli abstrakcyjną zmienną czasową t zapiszemy: t = 1, 2, ..., n, to parametry funkcji trendu można wyznaczyć metodą najmniejszych kwadratów minimalizując wyrażenie F = Σ(yt - ŷt)2 = min. Przyjmujemy tu założenie, że trend jest to pewna funkcja czasu: ŷt = f(t).

LINIOWA FUNKCJA TRENDU

Funkcja liniowa ŷt = a + bt jest stosowana, gdy występują zbliżone zmiany (przyrosty lub spadki) poziomu zjawiska w kolejnych okresach. Parametr b interpretuje się jako średni absolutny przyrost (spadek) z okresu na okres, parametr a jako teoretyczny poziom zjawiska w okresie t = 0.

WYKŁADNICZA FUNKCJA TRENDU

Funkcja wykładnicza ŷt = a · bt jest wykorzystywana, gdy zmiany poziomu zjawiska są coraz szybsze. Parametr a jest również interpretowany jako teoretyczny poziom w okresie, dla którego t = 0, natomiast parametr b po przekształceniu (b - 1)·100% pokazuje średni względny przyrost (spadek) poziomu zjawiska z okresu na okres, a zatem jest to odpowiednik średniego tempa zmian.

HIPERBOLICZNA FUNKCJA TRENDU

Funkcja hiperboliczna ŷt = a + b/t znajduje zastosowanie w sytuacji, gdy zmiany badanego zjawiska są coraz wolniejsze, a jego wielkość dąży asymptotycznie do poziomu określanego przez parametr a.

OCENA DOPASOWANIA FUNKCJI TRENDU DO DANYCH EMPIRYCZNYCH

Po wyznaczeniu parametrów funkcji trendu należy zawsze ocenić jakość dopasowania danych teoretycznych do empirycznych. Analogicznie jak w analizie regresji posłużymy się: średnim błędem szacunku, współczynnikiem zmienności przypadkowej, współczynnikiem zbieżności (indeterminacji) i współczynnikiem determinacji.

EKSTRAPOLACJA TRENDU

Prognozując przyszły poziom zjawiska zmieniającego się w czasie można w pewnych sytuacjach oprzeć się na ekstrapolacji trendu. Te sytuacje to:

Prognozowanie szeregów czasowych przez ekstrapolację trendu jest, technicznie rzecz biorąc, zadaniem bardzo łatwym. Wystarczy do funkcji, której parametry oszacowaliśmy, podstawić w miejsce zmiennej czasowej t odpowiednią dla żądanego momentu w przyszłości wartość. ŷt = a + bt

Budując w ten sposób prognozy, spodziewamy się, że będziemy popełniać systematyczne błędy, na średnim poziomie równym Se. Należy więc prognozy wykonywać przedziałowo uwzględniając ten błąd.

SEZONOWOŚĆ - wahania w poziomie badanej cechy, które następują w ciągu roku kalendarzowego.

W szeregach czasowych, w których zjawiska są rejestrowane według miesięcy lub kwartałów, ich poziom z reguły jest określony przez tendencję rozwojową, wahania sezonowe i wahania przypadkowe.

Chcąc wyodrębnić składnik sezonowy należy wyeliminować z szeregu czasowego wpływ tendencji rozwojowej (jeżeli ona występuje) i wahań przypadkowych. Istnieje wiele metod, które pozwalają na wyodrębnienie czystego składnika sezonowości i jego charakterystykę za pomocą miar zwanych wskaźnikami sezonowości. Ocenę sezonowości można przeprowadzić na podstawie kilku cykli rocznych. Wskaźniki sezonowości mogą mieć postać liczb względnych, które najczęściej są wyrażone w procentach, lub też postać liczb absolutnych wyrażonych w tych samych jednostkach miary, co badane zjawisko.

Można spotkać się z opinią, że wskaźniki względne są miarą odpowiednią dla szeregów, w których amplituda wahań zmienia się, a przez to są zachowane stałe relacje poziomu zjawiska w jednoimiennych podokresach w stosunku do linii trendu (tzw. sezonowość multiplikatywna).

Natomiast wskaźniki absolutne są właściwe do oceny sezonowości w tych szeregach, w których amplituda wahań jest stała, co oznacza stałą wielkość różnic w stosunku do trendu w okresach jednoimiennych (tzw. sezonowość addytywna).

Z praktycznego punktu widzenia powyższe rozróżnienie nie ma zbyt dużego znaczenia, ponieważ:

Najprostszym sposobem odróżnienia wahań addytywnych od multiplikatywnych jest sporządzenie odpowiedniego wykresu. Szereg o wahaniach addytywnych będzie się mieścił między dwiema równoległymi liniami. Dla wahań multiplikatywnych będą to linie rozbiegające się lub zbiegające się.

METODY ANALIZY SEZONOWOŚCI:

Pamiętać należy, że suma wskaźników multiplikatywnych (względnych) jest zawsze równa d lub d*100% - odpowiednio dla kwartałów 4 lub 400%, miesięcy 12 lub 1200%, półroczy 2 lub 200%. ΣWSi = d (d%).

Pamiętać należy, że suma wskaźników addytywnych (absolutnych) jest zawsze równa 0 - odpowiednio dla kwartałów 0, miesięcy 0, półroczy 0. ΣASi = 0.

INTERPRETACJE MIAR:

Średnia arytmetyczna - średnia wartość badanej cechy to...

Odchylenie standardowe - wartość badanej cechy różni się od średniej arytmetycznej średnio o ...

Współczynnik zmienności pokazuje, że zróżnicowanie wartości badanej cechy jest ...

Mediana - połowa zbiorowości ma wartości cechy nie większe niż wartość środkowa, a druga połowa nie mniejsze niż wartość środkowa

Dominanta - dominującą, czyli najczęściej występującą wartością badanej cechy jest ...

Decyl 1 - 10% badanej zbiorowości przyjmuje wartość nie większą niż ..., a 90% nie mniejszą niż ...

Decyl 9 - 90% badanej zbiorowości przyjmuje wartość nie większą niż ..., a 10% nie mniejszą niż ...

Kwartyl 1 - 25% badanej zbiorowości ma wartości nie większe niż ..., a 75% nie mniejsze niż ...

Kwartyl 3 - 75% badanej zbiorowości ma wartości nie większe niż ..., a 25% nie mniejsze niż ...

Rozstęp - różnica między skrajnymi wartościami badanej cechy wynosi ...

Rozstęp decylowy - różnica między skrajnymi wartościami badanej cechy u środkowych 80% wynosi ...

Rozstęp kwartylowy - różnica między skrajnymi wartościami badanej cechy u środkowych 50% wynosi ...



Wyszukiwarka

Podobne podstrony:
STATYSTYKA OPISOWA '
1 Statystyka opisowa Wprowadze Nieznany (2)
Gorgol I Elementy statystyki opisowej
egzamin ze statystyki, Statystyka opisowa
ROZDZIAŁ 4, Statystyka opisowa
Parametry stosowane w statystyce opisowej, Płyta farmacja Bydgoszcz, statystyka, pozostałe
STATYSTYKA OPISOWA 6 11 2010
Statystyka opisowa wykład interpretacje
1 2 statystyka opisowaid 10222 Nieznany
Przykłady do rozwiązania - tablica korelacyjna, Informatyka i Ekonometria SGGW, Semestr 2, Statystyk
WZORY(1), UEP lata 2014-2019, Statystyka opisowa
Statystyka [25 stron], Statystyka opisowa

więcej podobnych podstron