Statystyka - teoria, IiE, IV kurs, Statystyka


STATYSTYKA

Zbiorowość statystyczna - zbiór dowolnych jednostek, które mają przynajmniej jedną wspólną właściwość, a różnią się z innych punktów widzenia

Określenie jednostki statystycznej pod względem: rzeczowym, czasowym, terytorialnym, zakresowym.

Cechy statystyczne:

  1. mierzalne (ilościowe) - mogą przyjmować określone wartości wyrażone liczbowo

    1. skokowe (o zmienności skokowej, bez wartości pośrednich)

    2. ciągłe (o zmienności ciągłej, każda wartość z określonego przedziału)

  2. niemierzalne (jakościowe) - ich wariantów nie można zmierzyć przy pomocy liczb

    1. nominalne (nie ma hierarchii ich wariantów)

    2. porządkowe (dają się ustawić w pewnej kolejności)

Metody statystyczne:

Badanie statystyczne - ogół prac, których celem jest poznanie prawidłowości charakteryzujących określoną zbiorowość statystyczną

Badania pełne (całkowite, generalne) - obejmują wszystkie jednostki określonej zbiorowości statystycznej m.in. spis statystyczny, rejestracje statystyczne, sprawozdawczość statystyczna

Badania częściowe (niepełne) - obejmują tylko pewną wybraną część populacji generalnej (próbę)

Dobór próby:

Szacunek statystyczny (ocena statystyczna):

- na podstawie pewnych, znanych nam cech zbiorowości ustalamy wartości innych, nieznanych cech tej zbiorowości

- na podstawie cech znanej zbiorowości ustalamy te same lub pokrewne cechy zbiorowości nieznanej

- na podstawie wielkości zjawiska w okresach poprzednich ustalamy wielkość tego zjawiska w przyszłości

Etapy badań statystycznych:

- projektowanie badania

- obserwacja statystyczna

- opracowanie i prezentacja materiału statystycznego

- analiza statystyczna (opis lub wnioskowanie statystyczne)

Kontrola materiału statystycznego:

Szeregi statystyczne (rozkład empiryczny):

Dystrybuanta empiryczna - szereg rozdzielczy skumulowany

Graficzna prezentacja danych:

- wykresy słupkowe

- wykresy kołowe

- wykresy liniowe

- kartogramy

- wykresy w układzie współrzędnych (histogramy, krzywe liczebności, diagramy)

Analiza struktury - badanie budowy określonej zbiorowości, z jakich elementów się składa i jaką część stanowią te elementy w całości zbiorowości

Wskaźnik struktury - częstość względna

Miary przeciętne:

Średnia arytmetyczna:

Dominanta - wartość, która w zbiorowości występuje najczęściej

W szeregu rozdzielczym przedziałowym, aby wyznaczyć dominantę:

- musi występować jeden przedział klasowy z wyraźniej dominującą w stosunku do pozostałych liczebnością

- przedział klasowy, w którym znajduje się dominanta oraz dwa przedziały z nią sąsiadujące muszą mieć jednakowe rozpiętości

- szereg nie może być skrajnie asymetryczny z otwartym przedziałem dominującym

Mediana - wartość, która jest umieszczona dokładnie w środku, pod warunkiem, że mamy do czynienia z uporządkowaną zbiorowością według wielkości jej elementów

Mediana:

- może być wyznaczana w szeregach o otwartych przedziałach klasowych

- można ją wyznaczyć do opisania zbiorowości, których nie można określić liczbowo

- jest jedyną średnią, którą można wyznaczyć dla rozkładów skrajnie asymetrycznych

- nie jest wrażliwa na wartości skrajne

- może być wyznaczana w szeregach o nierównych rozpiętościach przedziałów klasowych

Miary zróżnicowania (zmienności, rozproszenia, dyspersji):

Obszar wartości typowych - typowy klasyczny obszar zmienności cechy (średnia arytmetyczna +/- odchylenie standardowe; w tym przedziale mieści się 68% jednostek badanej zbiorowości)

Asymetria (skośność szeregu):

- symetria (średnia arytmetyczna = mediana = dominanta)

- asymetria prawostronna (dodatnia; dominanta ≤ mediana ≤ średnia arytmetyczna)

- asymetria lewostronna (ujemna; średnia arytmetyczna ≤ mediana ≤ dominanta)

Koncentracja - nierównomierny podział ogólnej sumy wartości cechy pomiędzy poszczególne jednostki zbiorowości

- metoda graficzna (krzywa Lorenza)

- metoda numeryczna (współczynnik koncentracji Lorenza K)

Korelacja dwóch cech mierzalnych (zależność między dwoma cechami):

  1. Współczynnik korelacji liniowej Pearsona (rxy)

|rxy| ≤ 0,2 niewyraźna

0,2 ≤ |rxy| ≤ 0,4 niska

0,4 ≤ |rxy| ≤ 0,7 umiarkowana

0,7 ≤ |rxy| ≤ 0,9 znacząca

|rxy| > 0,9 silna

|rxy| = 1 zależność funkcyjna

  1. Współczynnik korelacji rang Spearmana:

Analiza regresji - metoda badania wpływu zmiennych uznanych za niezależne (objaśniające) na zmienną uznaną za zależną (objaśnianą)

Funkcja regresji ŷi = a + bxi

Współczynnik regresji (b) - wskazuje o ile przeciętnie zmieni się wartość zmiennej zależnej, jeśli wartość zmiennej niezależnej zmieni się o jednostkę

Średni błąd szacunku (Se, średni błąd resztowy) - o ile przeciętnie różnią się wartości zmiennej zależnej wyznaczone na podstawie funkcji regresji od jej wartości empirycznych

Współczynnik determinacji (0≤R2≤1) miara dopasowania funkcji regresji do danych empirycznych

Miary korelacji dla danych pogrupowanych w tablicy korelacyjnej:

    1. Stosunek korelacji (eyx)

      • obliczany dla zależności prostoliniowej i krzywoliniowej

      • jedna cecha mierzalna, druga mierzalna lub niemierzalna porządkowa

      • 0 ≤ eyx ≤ 1

      • eyx exy

      • |ryx| ≤ eyx

  1. Współczynnik współzależności C-Pearsona

  • Współczynnik współzależności Φ-Yule'a