STATYSTYKA WYKŁADY (2)

Funkcje statystyki

Informacyjna – daje pełny i obiektywny obraz badanych zjawiskAnalityczna – określenie czynników kształtujących konkretne procesy i zjawiska Prognostyczna – przewidywanie kierunku rozwoju

BADANIA STATYSTYCZNE – zebranie, odpowiednie przetworzenie i analiza informacji dotyczących określonej na początku badania zbiorowości statystycznej. To proces, którego celem jest zebranie danych, przetworzenie ich oraz interpretacja wyników.

Celem organizacji badania jest poznanie struktury i dynamiki określonej zbiorowości statystycznej, zaobserwowanie czynników ją kształtujących, a także ustalenie rodzaju związków występujących pomiędzy…

W badaniu wyróżniamy 5 etapów:

1.Projektowanie – określenie celu, zakresu źródła materiału statystycznego (pierwotne lub wtórne), opracowanie narzędzi i badanie pilotażowe

2.Obserwacja statystyczna (zebranie danych)

3.Opracowanie surowego materiału statystycznego

4.Analiza opracowanego materiału statystycznego

5.Przetworzenie raportu i prezentacja wyników

Wyróżnia się następujące badania statystyczne:

Pełne

Spis statystyczny
Rejestracja statystyczna
Sprawozdawczość statystyczna

Częściowe

Reprezentacyjne
Monograficzne
Ankietowe

Metody pośrednie

Interpolacja

Ekstrapolacja Czynniki wpływające na wybór metody:

Czynniki statystyczne (rodzaj zbiorowości, temat, cel badania, stopień szczegółowości badania itp.)
Czynniki pozastatystyczne (ograniczona ilość środków finansowych, technicznych, materiałowych, ludzkich itp.)
Czynniki czasowe (okres jakim dysponujemy na przeprowadzenie badania

Z uwagi na kryterium liczby jednostek zbiorowości statystycznej wyróżniamy dwie metody badań:

Generalne (pełne, całkowite, wyczerpujące) – obserwacji poddana jest każda jednostka zbiorowości statystycznej, której badanie dotyczy
Niekompletne (niepełne, niecałkowite) – sprowadza się do obserwacji tylko pewnej części badanej zbiorowości

Metody badań generalnych:

SPIS STATYSTYCZNY – jest klasycznym, pełnym badaniem statystycznym dostarczającym informacji do ustalenia stanu i struktury zjawiska w ściśle określonym momencie. Cechy tej metody to: powszechność, jednochwilowość, bezpośredniość, podejmowane wyłącznie dla celów statystycznych. (np. spis ludności 2002r; 20011r)
REJESTRACJA STATYSTYCZNA – w okresie wyznaczonym na jej przeprowadzenie zobowiązane osoby zgłaszają się w ustalonych punktach rejestracji i udzielają informacji objętych tematyką rejestracji (np. rejestracja kierowców zawodowych)
BIEŻĄCA REJESTRACJA STATYSTYCZNA – polega na systematycznym notowaniu ściśle określonych faktów np. ewidencja urodzeń i zgonów, ewidencja przychodu i rozchodu towaru w magazynie
SPRAWOZDAWCZOŚĆ STATYSTYCZNA – jednostki statystyczne sporządzają sprawozdania statystyczne na jednolitych formularzach sprawozdawczych, wykorzystując zarówno opis liczbowy jak i werbalny (tekst) np. sprawozdawczość uczelniana, system POL-on, system FAON

Metody badań częściowych:

BADANIE REPREZENTACYJNE – w celu zbadania własności całej zbiorowości wybiera się do badania tylko pewną liczbę jednostek statystycznych reprezentujących badaną zbiorowość. Ta wybrana grupa jednostek nazywa się próbą. Wnioski jakie formułujemy na podstawie badania próby uogólnia się na całą zbiorowość.

Podstawowym problemem w stosowaniu tej metody jest odpowiedni dobór jednostek do próby.

Wybór jednostek do próby

Wybór celowy – prowadzący badanie dobiera jednostki do próby świadomie na podstawie ogólnej znajomości badanego zjawiska
Wybór losowy – dobór do próby jest przypadkowy, można jednak określić jakie są szanse znalezienia się w próbie danej jednostki lub zespołu jednostek

Metody losowania próby

Losowanie bezpośrednie – elementy próby są losowane bezpośrednio z populacji generalnej. Takie losowanie dzieli się na:

Losowanie zależne (po losowaniu element nie wraca z powrotem do populacji
Losowanie niezależne (po losowaniu element wraca do populacji)

Poza tym stosowana jest procedura losowania z wykorzystaniem tablic liczb losowych (przypadkowych)

Losowanie warstwowe – przed rozpoczęciem losowania elementy populacji generalnej dzielone są na warstwy ze względu na pewną cechę lub zestaw cech

Warstwy te powinny być rozłączne (element populacji może być zaliczony tylko i wyłącznie do jednej warstwy) oraz wyczerpujące (suma elementów warstw powinna być równa liczbie elementów produkcji)

Kolejnym etapem jest losowanie jednostek statystycznych z poszczególnych warstw. Losowanie warstwowe stosuje się przypadku, gdy populacja nie jest jednorodna.

Losowanie bezpośrednie jak i warstwowe może być:

Indywidualne – pojedyncze jednostki zbiorowości
Zespołowe - losowane całe zespoły, po wylosowaniu włącza się wszystkie jednostki wchodzące w jego skład

BADANIE MONOGRAFICZNE – opiera się na całościowym i szczegółowym opisie ( zarówno ilościowym jak i jakościowym) jednostki bądź grupy jednostek. Istotnym elementem badania jest taki wybór jednostki by była ona typowym reprezentantem. (Np. badanie szpitali w województwie, badanie gminy)

BADANIE ANKIETOWE – badanie przeprowadzane na konkretnej grupie osób dotyczące zazwyczaj specyficznego zagadnienia. Podstawę takich badań stanowi kwestionariusz ankiety ze ściśle zdefiniowanym zestawem pytań, na które respondenci odpowiadają. Wyniki te zostają poddane analizie oraz interpretacji. Najczęściej stosowana metoda badawcza w naukach społecznych.

SZACUNEK STATYSTYCZNY (ocena strat) – postępowanie, w którym:

Na postawie realizacji znanych nam cech zbiorowości ustalamy wartości innych, niezależnych cech tej samej zbiorowości
Na podstawie cech znanej nam zbiorowości określamy te same lub pokrewne cechy zbiorowości nieznanej

Przykład: dane o sytuacji społeczno-gospodarczej w kraju, liczba ludności w wieku produkcyjnym, produkcja produktów rolnych.

INTERPOLACJA LINIOWA – określamy nieznane wartości cechy na podstawie znanych wartości sąsiednich (wcześniejszych i późniejszych)

$$x = \frac{dana\ pozniejsza - dana\ wczesniejsza}{2} + \ dana\ wczesniejsza$$

EKSTRAPOLACJA – szacowanie na podstawie wartości wcześniejszych, wartości cechy wykraczającej poza przedział wartości znanych (prognozowanie)

x = dana wczesniejsza + (dana wczesniejsza − dana jeszcze wczesniejsza)

Wykład 2

GRUPOWANIE STATYSTYCZNE – polega na podziale danej zbiorowości na jednorodne lub względnie jednorodne części, grupy, klasy, według cech, które charakteryzują najbardziej istotne jej strony z punktu widzenia celu badania
Korzyści

możliwość prawidłowego obliczenia uogólnionych charakterystyk zbiorowości statystycznej
odzwierciedlenie struktury badanej zbiorowości
możliwość ustalenia związków między zjawiskami

W zależności od liczby cech będących podstawą podziału badanej zbiorowości statystycznej wyróżniamy:

GRUPOWANIE PROSTE – polega na podziale badanej zbiorowości ze względu na jedną cechę charakterystyczną np. grupowani spółek giełdowych według form własności, grupowanie przedsiębiorstw według wielkości produkcji, grupowanie hurtowni według powierzchni magazynowej

GRUPOWANIE ZŁOŻONE – polega na tym, że uwzględnia się w podziale danej zbiorowości kilka cech charakterystycznych, przy czym poszczególne części wyodrębnione na podstawie jednej cechy dzielone są na dalsze części, podgrupy, ze względu na kolejne cechy charakterystyczne np. grupowanie ludności według wieku, płci i stanu cywilnego.

Zasady grupowania

Przyjęcie za podstawę podziału zbiorowości cechy istotnej dla badanego zjawiska
Wyodrębnienie optymalnej dla danych warunków (badanej zbiorowości i celu badania) liczby i wielkości (zakresu) grup (części, klas)

Stopień szczegółowości podziału zbiorowości statystycznej – czyli ustalanie liczby grup, które jest zależne od rodzaju zjawiska i celu badania.

GRUPOWANIE (podział) KILKUSTOPNIOWE – odmiana grupowania złożonego, w grupowaniu tym przechodzi się od podziału najmniej szczegółowego do najbardziej szczegółowego.

Po podziale zbiorowości na grupy według pewnej cechy ustala się kolejność oraz nazwy tych grup. Otrzymuje się uporządkowane grupy tworzące WYKAZ KLASYFIKACYJNY. Wykaz powinien być tak skonstruowany, aby żadna odmiana cechy nie mogła znaleźć się poza wykazem.

Uporządkowanie grup w wykazach klasyfikacyjnych powinno odznaczać się logiką i przejrzystością. Ułatwia to zaszeregowanie poszczególnych jednostek do odpowiednich grup.

CECHY MIERZALNE – grupy porządkujemy najczęściej zgodnie ze wzrostem wartości cechy

PRZEDZIAŁY KLASOWE – wyodrębnione podczas grupowania części (grupy, klasy) zbiorowości statystycznej w wypadku cech mierzalnych są więc przedziałami liczbowymi zwanymi przedziałami klasowymi

PRZEDZIAŁ DOMKNIĘTY – jeżeli dla rozpatrywanego przedziału jest określona dolna i górna granica.

PRZEDZIAŁ OTWARTY – jeżeli górna i dolna granica nie jest określona liczbowo np. więcej niż 2400zł

SZEREG STATYSTYCZNY – pogrupowanie materiału; jest to uporządkowanie zbioru wyników obserwacji jednostek według pewnej cechy; tworzone są przez ciągi wielkości statystycznych, które zostały uporządkowane według określonych kryteriów

Na sposób grupowanie cech mają wpływ:

Rodzaj badania (poziom merytoryczny)
Rodzaj cechy statystycznej, sposób pomiaru oraz liczba obserwacji (poziom formalny)

SZEREGI PRZESTRZENNE (geograficzne) – przedstawiają rozmieszczenie wielkości statystycznych w przestrzeni. Mają one zazwyczaj charakter opisowy (jakościowy)

SZEREGI CZASOWE (dynamiczne, chronologiczne) – pokazują zachodzące w czasie zmiany pewnych stanów lub faktów
Dzieli się na:

Szeregi momentów – p. wieloletnie zestawienie w jakimś przedsiębiorstwie zatrudnienia na dzień 1 stycznia
Szeregi okresów – np. wieloletnie zestawienie wartości sprzedaży z okresu całego roku

SZEREGI RZECZOWE (strukturalne) – tworzymy zestawiając pary liczb, z których pierwsza podaje wartość i-tego wariantu badanej cechy statystycznej x_i, druga liczbę i-jednostek n_i przypadających na dany wariant cechy.

Dzielą się na:

z cechą niemierzalną
z cechą mierzalną

szereg szczegółowy – uporządkowany ciąg wszystkich wartości badanej cechy statystycznej (przy niewielkiej liczbie jednostek)
szereg rozdzielczy – zbiorowość statystyczna podzielona na części według określonej cechy jakościowej lub ilościowej z podaniem liczebności każdej z wyodrębnionych klas

• punktowy - jeśli mamy do czynienia z cechami skokowymi (np. ilość dzieci w rodzinie, ilość pokoi w mieszkaniu itp.) i jest reprezentowana przez ilość wystąpień n_i tego wariantu

- prosty

- skumulowany

• przedziałowy – jeśli mamy do czynienia z cechami ciągłymi (przyjmującymi dowolna wartość w jakimś przedziale np. wzrost, staż pracy, wynagrodzenie itp.)

- prosty

- skumulowany

W przypadku cech mierzalnych łączenie w kategorie jednostek o odpowiednich wartościach cech statystycznych nazywamy GRUPOWANIEM WARIANCYJNYM

Zaobserwowane wartości (w przykładzie wzrost i liczba dzieci) porządkujemy:

rosnąco
malejąco

Tworzenie szeregu przedziałowego

Budowa szeregu rozdzielczego – przedziałowego obejmuje ustalenie

liczby klas – kryterium jest przede wszystkim liczba obserwacji

k = $\sqrt{\mathbf{n}}$

k = 1 + 3,322 log n

rozpiętości przedziałów klasowych – każdy ten przedział ma górną i dolną granicę. Stosujemy zwykle przedziały klasowe o jednakowej rozpiętości w celu zapewnienia porównywalności. Wyjątkiem są sytuacje, gdy badana populacja jest niejednorodna lub występuje duża koncentracja wartości w jednej grupie. Wtedy celowe jest stosowanie zróżnicowanych rozpiętości przedziałów klasowych

h_i = x_1i – x_0i

Aby wyznaczyć rozpiętość przedziału klasowego h stosujemy poniższy wzór

H = $\frac{\mathbf{xmax - xmin}}{\mathbf{k}}$

granic poszczególnych klas – jeśli ustalimy dolna granicę pierwszej klasy szeregu to przy pomocy wcześniej wyliczonej rozpiętości przedziału obliczymy granice dolne i górne pozostałych przedziałów

Zazwyczaj x0i jest różne xmin ub bliskie minimalnej wartości

Środek i-tego przedziału klasowego to suma wartości górnej x1i i dolnej granicy x0i przedziały podzielona przez 2

$$\frac{\mathbf{x}\mathbf{1}\mathbf{i + x}\mathbf{0}\mathbf{i}}{\mathbf{2}}$$

Skumulowany wskaźnik struktury musi się zsumować do 100 lub pełnej liczby.

Malejąca liczebność i malejący wskaźnik struktury jest objawem pozytywnym ponieważ liczba jest astymulantą, im większe wartości przyjmuje ta cecha tym większa jest absencja chorobowa pracowników.

Jest skrajnie asymetryczny prawostronnie (badamy rozkład liczby zwolnień) ponieważ najważniejsza wartość występuje w skrajnym (prawym) przedziale klasowym.

Skrajna asymetria lewostronna- największa częstość występuje w ostatniej klasie.

Wśród cech prostych tworzących cechę agregatową mogą występować cechy:

Stymulanta – taka cecha, której większe wartości pożądane mniejsze zaś niepożądane z punktu widzenia rozważanej właściwości cechy syntetycznej. / Zamienne wywierające dodatni wpływ na poziom rozwoju badanego zjawiska, a więc korzystne są wysokie wartości tych zmiennych

Destymulanta – taka cecha, której mniejsze wartości są pożądane większe zaś niepożądane z punktu widzenia rozpatrywanej właściwości cechy syntetycznej / Zmienne charakteryzujące się opóźniającym oddziaływaniem na stopień rozwoju zjawiska, a więc takie, których niskie wartości są korzystne

Nominanta – obok stymulant i de stymulant mogą także wystąpić dominanty, czyli zmienne nie mające istotnego wpływu na poziom rozwoju badanego obiektu. Nie wykazuje istotnej korelacji z cechą agregatową.

Podobieństwo struktur:

Aby porównać między sobą podobieństwo struktur różnych zbiorowości korzysta się z tzw. wskaźnika podobieństwa struktur.

$$w_{p} = \sum_{i = 1}^{n}{\min(}w_{1i},\ w_{2i)}$$

Przy czym 0< w_p≤ 1

Wielkość wskaźnika podobieństwa struktur- im jego wartość jest bliższa jedności tym struktury analizowanych zbiorowości są bardziej podobne.

Rozkłady empiryczne:

Rozkład równomodalny
Rozkład wielomodalny

Rozkłady symetryczny i umiarkowanie asymetryczny odnoszą się zazwyczaj do zbiorowości jednorodnych ze względu na rozpatrywaną zmienną, natomiast w przypadku znacznego zróżnicowania cech zbiorowości charakteryzowane są przez rozkłady wielomodalne skrajnie asymetryczne lub siodłowe.

Klasyfikacja miar statystycznych

Miary położenia – (miary przeciętne, poziome) – określają najbardziej typowe, przeciętne dla badanego rozkładu wartości zmiennej wokół której skupiają się pozostałe wartości

miary klasyczne – do ich obliczenia wykorzystuje się wartości wszystkich jednostek badanej zbiorowości

średnia arytmetyczna
średnia harmoniczna – jest to miara stosowana dla cech mierzalnych podanych na stałą jednostkę innej zmiennej

x_H = n/( 1/x₁ + 1/x_{2 +…})

n- liczba jednostek zbiorowości

x – wartości cechy

Dla szeregu szczegółowego:

X_H = n/ Σ1/x_i

Dla szeregu rozdzielczego:
x_{H =} Σn_i / (Σ n_i/x_i)

średnia geometryczna – stosowana w badaniach zjawisk ujmowanych dynamicznie.

Wyrażona przez pierwiastek n-tego stopnia z iloczynu wartości cechy.

$$x_{G} = \ \sqrt[n]{x_{1}x_{2}\ldots}$$

W przedsiębiorstwie w ciągu 3 kolejnych lat zatrudniono w pierwszym roku 500 osób, w drugim 750, w trzecim 825. Należy obliczyć średni względny przyrost zatrudnienia. Cecha to stosunek zatrudnienia w roku rozpatrywanym do roku poprzedniego.

X₁ = 750/500 = 1,5

X₂ = 825/750 = 1,1

X_G = pierw z 1,5 x 1,1 = 1,2845

miary pozycyjne – wykorzystuje się wybrane wartości cechy ze względu na ich pozycję w szeregu

dominanta – wartość o największej liczebności

W szeregu punktowym prostym i ważonym jest to wartość cechy, która pojawiła się największą ilość razy.

W szeregu rozdzielczym znajduje się w przedziale o największej liczebności, jednak bezpośrednio nie można jej wskazać.

Gdy rozkład wartości cechy jest symetryczny, w przypadku szeregu rozdzielczego można przyjąć środek najliczniejszego przedziału klasowego.

Mo = x_m + (n_m – n_m-1) / [(n_m – n_m-1) + (n_m – n_m+1)] x h_m

H_m – rozpiętość przedziału

X_m - dolna granica przedziału

Modalną wyznacza się gdy:
- rozkład ma jedno maksimum lokalne

- rozkład charakteryzuje się co najwyżej umiarkowaną asymetrią

- przedział, w którym występuje modalna oraz przedziały sąsiadujące mają jednakową rozpiętość.

Kwantyle – wartości cechy badanej zbiorowości, które dzielą tę zbiorowość na określone części pod względem liczby jednostek. Szeregi muszą być iporządkowane według rosnących lub malejących wartości cechy:
Kwartale – dzielą zbiorowość na 4 części

Kwartyl pierwszy Q₁ – dolny; dzieli zbiorowość uporządkowaną na dwie części: 25% jednostek ma wartości niższe (lub równe), a 75% wyższe (lub równe) od kwartyle pierwszego

Mediana Me – dzieli na połowy

Liczebność nieparzysta: x _(n+1)/2

Liczebność parzysta: ½ (x_n/2 + x_{n/2 +1})

Kumulanta – linia łamana łącząca prawe narożniki prostokątów przedziałów.

Na osi wykresu wartości skumulowanej (pionowej) znajdujemy punkt odpowiadający medianie. (?) Me = 4,5

Ogólne uwagi dotyczące mediany

- mediana jest obok średniej arytmetycznej jedną z najczęściej stosowanych miar położenia

- może być stosowana, kiedy nie jest możliwe wyznaczenie średniej arytmetycznej lub modalnej

- mediana nie reaguje na obserwacje nietypowe lub przypadkowe, przejawiające się wartościami skrajnymi

Kwatyl trzeci Q₃ – górny; dzieli zbiorowość uporządkowaną na dwie części: 75% jednostek ma wartości niższe (lub równe), a 25% wyższe (lub równe) od kwartyla trzeciego

Decyle – dzielą zbiorowość na 10 części
Centyle – dzielą zbiorowość na 100 części

Mediana i modalna są przeciętnymi pozycyjnymi, które w zbiorowościach o rozkładach symetrycznych lub umiarkowanie asymetrycznych zaliczane są (obk średnich klasycznych) do miar tendencji centralnej.

W przypadku zbiorowości charakteryzującej się umiarkowaną asymetrią zachodzi związek opisany przez wzór Pearsona

Xśr – Mo = 3(xśr – Me)

Wzorem tym możemy posłużyć się, gdy nie znamy jedne z charakterystyk a znane są pozostałe

Jeśli np. układ danych nie pozwala na obliczenie średniej arytmetycznej znając modalną i medianę wyznaczone graficznie, w posty sposób wyznaczamy przybliżoną wartość jako:

Xśr – 3/2 (Me – Mo)

Miary zmienności (rozproszenia, zróżnicowania, dyspersji) – umożliwiają zaobserwowanie stopnia zróżnicowania wartości zmiennej wokół wartości przeciętnej

Miary asymetrii – (skośności) służą do oceny kierunku zróżnicowania wartości zmiennej

W wielu sytuacjach badanie średniego poziomu cechy i rozproszenia jej wartości nie wskazuje na istnienie różnic między analizowanymi zbiorowościami. Obserwacja rozkładów empirycznych tych cech wyklucza natomiast podobieństwo struktury badanych zbiorowości. Zilustrujemy taką sytuację na przykładzie.

Xxx

Można łatwo stwierdzić, że średnie aryt. I odchylenie standardowe premii we wszystkich trzech wydziałach są takie same. Można więc powiedzieć, że w badanych zakładach typowy przedział zmienności premii pracowników jest taki sam i wynosi 35 ÷10,95 tys.

Mimo to istnieją różnice między premiami w tych wydziałach. Widać to wyraźnie na histogramach.

Przykład pokazuje, że istotne są nie tylko przeciętny poziom i wewnętrzne zróżnicowanie cechy, ale także to, czy przeważająca liczba badanych jednostek ma wartości cechy powyżej czy poniżej przeciętnego …

W wydziale II większa część pracowników otrzymuje premie poniżej przeciętnej.

Natomiast w III wydziale większość pracowników ma stawki powyżej przeciętnej.

Asymetrię rozkładu można określić porównując średnią arytmetyczną (35tys zł) z parametrami pozycyjnymi.

Im większe są różnice między średnią arytmetyczną, a modalną, tym bardziej asymetryczny jest rozkład badanej cechy.

Rozkłady różnią się między sobą kierunkiem i siłą asymetrii

W szeregach symetrycznych xśr = Me = Mo

Jeśli spełniona jest nierówność xśr > Me> Mo, to mówimy o asymetrii prawostronnej, a gdy xśr<Me<Mo to mówimy o asymetrii lewostronnej.

Wielkość bezwzględną, przyjętą do określania asymetrii i wyrażoną jako różnica między średnią arytmetyczną a modalną, nazywa się w literaturze wskaźnikiem skośności.

Xayt – Mo

Wskaźnik skośności można też wyznaczyć przy wykorzystaniu miar pozycyjnych:

W rozkładzie symetrycznycm: (Q₃ - Me) – (Me – Q ₁) = 0

Przy asymetrii prawostronnej: (Q₃ - Me) – (Me – Q ₁) > 0

Przy asymetrii lewostronnej: (Q₃ - Me) – (Me – Q ₁) < 0

W porównaniach, dla określenia zarówno siły jak i kierunku asymetrii stosuje się tzw. Współczynniki skośności:

A_s = (xart – M) / S_x

A_s = (xart – Mo) / d

Wykorzystując wyłącznie miary położenia:

A_s = (Q₃ - Me) – (Me – Q ₁) / (Q₃ - Me) + (Me – Q ₁)

Pozycyjny współczynnik asymetrii określa kierunek I siłę asymetrii jednostek znajdujących się między I a III kwartylem, a więc w zawężonym obszarze zmienności cechy.

Do klasycznych współczynników asymetrii należy także współczynnik asymetrii A:
A = m₃/ s³

S – odchylenie standardowe

m₃ – jest to moment centralny trzeciego stopnia który wynosi:

Dla szeregu szczegółowego:

m₃ = 1/n razy suma (x_i – xart)³

Dla szeregu rozdzielczego:

m₃ = 1/n razy suma (x_i – xart)³ razy n_i

Współczynniki asymetrii są liczbami niewymiernymi, przy czym im większa jest wartość bezwzględna tych współczynników, tym silniejsza jest asymetria.

Z reguły wartość bezwzględna współczynnika asymetrii ogranicza się do przedziału [0,1] niemniej przy bardzo silnej asymetrii może on przyjąć wartość większą od 1.

Brak asymetrii: A = 0

Asymetria prawostronna: A>0
Asymetria lewostronna: A<0

Miary koncentracji – wykorzystujemy do pomiaru stopnia wysmukłości rozkłau oraz badania stopnia skupienia (koncentracji) wartości wokół średniej

Omówione wcześniej miary asymetrii (skośności) pozwalają wyczerpująco opisać kształt struktury. Można ten ois uzupełnić o miary koncentracji.

Istnieje ścisły związek między koncentracją wartości cechy wokół średniej a ich zróżnicowaniem. Im większe jest zróżnicowanie, tym mniejsza jest koncentracja.

Miarą skupienia poszczególnych obserwacji jest współczynnik skupienia (kurioza)

K = m₄ / s⁴

S – odchylenie standardowe

m₄ moment dentalny czwartego rzędu

Dla szeregu szczegółowego:

m₄ = 1/n razy suma (x_i – xart)⁴

Dla szeregu rozdzielczego:

m₄ = 1/n razy suma (x_i – xart)⁴ razy n_i

K <3 – rozkład bardziej spłaszczony od normalnego

K>3 – rozkład bardziej wysmukły od normalnego

K = 3 – rozkład normalny

Eksces – inna postać współczynnika koncentracji

K¹ = ( m₄ / s⁴ )- 3

W przypadku wykorzystywania miar pozycyjnych, współczynnik koncentracji pozycyjnej wygląda tak
K_Q = D₁ – D₉/ Q₁ – Q₃

D – decyle

Q – kwartyle

W przypadku występowania spłaszenia jak w rozkładzie normalnym uzyskujemy K_Q = 1,92

Stosując procedurę standaryzacyjną analogiczną jak w przypadku ekscesu, uzyskujemy standaryzowany pozycyjny współczynnik koncentracji :

K^’_Q = K_Q - 1,92

Wyszukiwarka

Podobne podstrony:
statystyka wykład
statystyka wyklady, Szkoła WSTiH
Statystyka wykład 1
statystyka wyklad III
Statystyka - egzamin - ściąga - Kuszewski, Statystyka - wykłady - T.Kuszewski
statystyka- wyklady, Ekonomia, 1ROK, statystyka
statystyka -wykłady II sem, statystyka
AnaLIZA STATYSTYCZNA 8 wykład6, 1
statystyka wyklad V
Metodologia badań psychologicznych i statystyka dr I. Sowińska Gługiewicz, Metodologia badań psychol
Statystyka wykłady
STATYSTYKA WYKŁAD wybrane rozkłady zmiennych lsoowych
statystyka wyklad IV
STATYSTYKA WYKŁAD 5
AnaLIZA STATYSTYCZNA 8 wykład2, ANALIZA STATYSTYCZNA
AnaLIZA STATYSTYCZNA 8 wykład3, ANALIZA STATYSTYCZNA
statystyka wykłady, Wyklad5-6, Rozkład normalny
Rajfura A, Statystyka Wyklad 01 OPIS STATYSTYCZNY krotki

więcej podobnych podstron