4448


ANALIZA STRUKTURY ZBIOROWOŚĆI

STRUKTURA - budowa wewnętrzna badanej zbiorowości statystycznej.

ROZKŁAD EMPIRYCZNY - przyporządkowanie liczby obserwacji (liczebności) odpowiednim wartościom cechy zmiennej.

Rozkład empiryczny prezentuje szereg rozdzielczy.

KLASY ROZKŁADÓW EMPIRYCZNYCH

  1. Rozkłady symetryczne i asymetryczne

  2. Rozkłady jednomodalne, bimodalne i wielomodalne

  3. Rozkłady platokurtyczne (spłaszczone) i leptokurtyczne (wysmukłe)

ROZKŁAD SYMETRYCZNY - rozkład posiadający oś symetrii, obserwacje są rozłożone równomiernie po obu stronach osi symetrii. Oś symetrii przecina odciętą w punkcie, która jest średnią arytmetyczną zmiennej

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic

0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic

r. normalny r. leptokurtyczny r. platokurtyczny

ROZKŁAD ASYMETRYCZNY - rozkład nie posiadający oś symetrii,

1. rozkład lewostronny - ujemny - większość jednostek grupuje się wokół wartości wyższych w szeregu;

2. rozkład prawostronny - dodatni - większość jednostek grupuje się wokół wartości niższych w szeregu;

0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic

r. prawostronny r. lewostronny r. skrajnie ujemny

r. skrajnie dodatni

ROZKŁAD JEDNOMODALNY - krzywa liczebności o jednym ekstremum (maksimum)

ROZKŁAD BIMODALNY - krzywa liczebności o dwóch ekstremach

ROZKŁAD WIELOMODALNY - krzywa liczebności ma więcej niż dwa maksima

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic

0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic

r. jednomodalny r. bimodalny r. wielomodalny

PODSTAWOWE WSKAŹNIKI STRUKTURY I NATĘŻENIA

0x01 graphic
- bezwzględna liczba jednostek i-tego wariantu cechy

0x01 graphic
- łączna liczba jednostek w zbiorowości

0x01 graphic
- częstość tj. frakcja 0x01 graphic

0x01 graphic
-wskaźnik struktury, tj. stosunek wybranej części zbiorowości do całej zbiorowości; 0x01 graphic

0x01 graphic
-wskaźnik natężenia, tj. stosunek liczebności dwóch zbiorowości pozostających ze sobą w logicznej zależności

0x01 graphic
- liczebności szeregu skumulowanego, (sumowanie liczebności kolejnych przedziałów);

0x01 graphic
- względny wskaźnik podobieństwa struktur, tj. iloraz sumy mniejszych wskaźników zaobserwowanych w kolejnych przedziałach porównywalnych rozkładów i sumy większych wskaźników; 0x01 graphic
;

WŁASNOŚCI ROZKŁADU EMPIRYCZNEGO

TENDENCJA CENTRALNA - POŁOŻENIE - punkt skupienia obserwacji znajduje się w środku rozkładu (symetria) lub w pobliżu środka rozkładu (umiarkowana asymetria)

DYSPERSJA - ZRÓŻNICOWANIE , ROZPROSZENIE, ZMIENNOŚĆ - zróżnicowanie jednostek zbiorowości między sobą wartościami cechy zmiennej

ASYMETRIA - SKOŚNOŚĆ - sposób rozmieszczenia liczebności przy wartościach cechy

KONCENTRACJA - KURTOZA, SPŁASZCZENIE - stopień skupienia obserwacji wokół wartości średniej arytmetycznej

PARAMETRY OPISUJĄCE WŁASNOŚCI ROZKŁADU

PARAMETRY KLASYCZNE - miary obliczane na podstawie wszystkich obserwacji, stosowane do analizy rozkładów charakteryzujących się te tendencją centralną;

PARAMETRY POZYCYJNE - wyznaczane na podstawie miejsca jakie zajmują w szeregu lub częstotliwości występowania; szczególnie przydatne w analizie szeregów silnie (skrajnie) asymetrycznych, szeregów z otwartymi przedziałami klasowymi,

WŁASNOŚĆ ROZKŁADU

MIARY KLASYCZNE

MIARY POZYCYJNE

TENDENCJA CENTRALNA

Średnia arytmetyczna 0x01 graphic

Mediana Me

Dominanta D

Kwartyle Q1,, Q3

Decyle D1, D2, ..., D9

DYSPERSJA

Wariancja s2

Odchylenie przeciętne d

Odchylenia standardowe s

Współczynnik zmienności V(s)

Rozstęp R

Odchylenie ćwiartkowe Q

Współczynnik zmienności V(Q)

ASYMETRIA

Moment trzeci centralny 0x01 graphic

Moment trzeci względny 0x01 graphic

Współczynnik skośności A(x)

KONCENTRACJA

Moment czwarty centralny 0x01 graphic

Moment czwarty względny 0x01 graphic

Wskaźnik spłaszczenia Wk

MIARY POŁOŻENIA

ŚREDNIA ARYTMETYCZNA - iloraz globalnej wartości cechy oraz liczby obserwacji. Wskazuje jaki poziom badanej cechy przypada na jednostkę zbiorowości; określa jaki jest przeciętny (średni) poziom badanej cechy w zbiorowości.

  1. szereg szczegółowy:

0x01 graphic
xi - poszczególne wartości cechy

n - ogólna liczba obserwacji

  1. szereg rozdzielczy jednostopniowy:

0x01 graphic

xi - warianty cechy

ni - liczebności wariantów cechy

  1. szereg rozdzielczy wielostopniowy:

0x01 graphic
0x01 graphic
- środek przedziału klasowego 0x01 graphic

ni - liczebność w przedziale

MEDIANA - wartość środkowa; wartość cechy jaką posiada jednostka znajdująca się w środku uporządkowanego szeregu. Oznacza ona, iż połowa zbiorowości ma wartości cechy nie większe niż mediana, a druga połowa wartości nie mniejsze niż mediana.

  1. szereg szczegółowy - porządkujemy obserwacje wg rosnących wartości cechy i wskazujemy obserwację środkową.

W przypadku parzystej liczby obserwacji wartość mediany jest średnią arytmetyczną z dwóch środkowych obserwacji.

np.

2 3 3 6 7 7 9 11 13

0x01 graphic

11 13 13 16 18 19 22 22 25 30

0x01 graphic

  1. szereg rozdzielczy jednostopniowy - 1) wyznaczamy numer jednostki znajdującej się w szeregu, tzw. pozycję mediany, 2) w szeregu skumulowanym znajdujemy klasę zawierającą pozycję mediany, 3) wartość mediany jest wartością cechy we wskazanej klasie;

  2. xi

    ni

    nicum

    0

    6

    6

    1

    7

    13

    2

    11

    24

    3

    4

    28

    4

    3

    31

    5

    2

    33

    33

    x

    0x08 graphic
    0x01 graphic

    0x01 graphic

    1. szereg rozdzielczy wielostopniowy - 1) wyznaczamy numer jednostki znajdującej się w szeregu, tzw. pozycję mediany, 2) w szeregu skumulowanym znajdujemy klasę zawierającą pozycję mediany, 3) wyznaczamy medianę w oparciu o wzór interpolacyjny:

    2. 0x01 graphic

      ni

      nicum

      0-10

      9

      9

      10-20

      19

      28

      20-30

      23

      51

      30-40

      14

      65

      40-50

      9

      74

      50 i więcej

      7

      81

      81

      x

      0x01 graphic

      0x08 graphic

      0x01 graphic

      KWARTYLE - wartości ćwiartkowe, dzielą zbiorowość, uporządkowaną wg rosnących wartości badanej cechy, na cztery jednakowo liczne części.

      KWARTYL PIERWSZY Q1 - oznacza, iż 25% badanej zbiorowości osiąga wartości cechy nie większe niż Q1, a 75% zbiorowości ma wartości cechy nie mniejsze niż Q1.

      KWARTYL DRUGI Q2 - jest równy Medianie, gdyż oznacza, iż 50% badanej zbiorowości osiąga wartości cechy nie większe niż Q2, a druga połowa - wartości nie mniejsze niż Q2.

      KWARTYL TRZECI Q3 - oznacza, iż 75% badanej zbiorowości osiąga wartości cechy nie większe niż Q3, zaś pozostałe 25% - wartości nie mniejsze niż Q3.

      1. szereg szczegółowy - porządkujemy obserwacje wg rosnących wartości cechy i wskazujemy obserwację leżącą w ¼ zbiorowości.

      np.

      2 3 3 6 7 7 9 11 13

      0x01 graphic

      1. szereg rozdzielczy jednostopniowy - 1) wyznaczamy numer jednostki znajdującej się w szeregu, tzw. pozycję mediany, 2) w szeregu skumulowanym znajdujemy klasę zawierającą pozycję mediany, 3) wartość mediany jest wartością cechy we wskazanej klasie;

      2. xi

        ni

        nicum

        0

        6

        6

        1

        7

        13

        2

        11

        24

        3

        4

        28

        4

        3

        31

        5

        2

        33

        33

        x

        0x08 graphic
        0x01 graphic

        Q1=1

        Q3=3

        1. szereg rozdzielczy wielostopniowy - 1) wyznaczamy numer jednostki znajdującej się w szeregu, tzw. pozycję, 2) w szeregu skumulowanym znajdujemy klasę zawierającą pozycję parametru, 3) wyznaczamy parametr w oparciu o wzór interpolacyjny:

        2. 0x01 graphic

          ni

          nicum

          0-10

          9

          9

          10-20

          19

          28

          20-30

          23

          51

          30-40

          14

          65

          40-50

          9

          74

          50 i więcej

          7

          81

          81

          x

          0x01 graphic

          0x01 graphic

          0x01 graphic

          DOMINANTA - MODA - to pozycyjna miara położenia wyznaczana przez częstotliwość występowania wyróżnionych wartości cechy. Informuje ona jaka wartość cechy występuje najczęściej (dominuje).

          1. szereg szczegółowy - porządkujemy obserwacje wg rosnących wartości cechy i wskazujemy obserwację występującą najczęściej.

          np.

          2 3 3 6 7 7 7 9 11 13 0x01 graphic

          1. szereg rozdzielczy jednostopniowy - wskazujemy wartość cechy wokół oscyluje największa liczba obserwacji

          xi

          ni

          0

          6

          1

          7

          2

          11

          3

          4

          4

          3

          5

          2

          33

          0x01 graphic

          1. szereg rozdzielczy wielostopniowy - 1) wskazujemy przedział klasowy, w którym skupia się największa liczba obserwacji 2) wyznaczamy dominantę w oparciu o wzór interpolacyjny:

          2. 0x01 graphic

            ni

            0-10

            9

            10-20

            19

            20-30

            23

            30-40

            14

            40-50

            9

            50-60

            7

            81

            0x01 graphic

            0x01 graphic

            GRAFICZNE WYZNACZANIE DOMINANTY

            0x08 graphic
            0x08 graphic
            0x08 graphic
            0x01 graphic

            GRAFICZNE WYZNACZANIE KWARTYLI

            0x08 graphic
            0x08 graphic
            0x08 graphic
            0x08 graphic
            0x08 graphic
            0x08 graphic
            0x08 graphic

            DYSPERSJA, ROZPROSZENIE, ZRÓŻNICOWANIE, ZMIENNOŚĆ - to zróżnicowanie jednostek zbiorowości pomiędzy sobą pod względem wartości cechy zmiennej.

            MIARY DYSPERSJI - umożliwiają uogólnienie różnic w wartościach cechy zaobserwowanych u poszczególnych jednostek.

            KLASYCZNE MIARY DYSPERSJI - obliczane na podstawie informacji o wszystkich jednostkach statystycznych, jako wypadkowa różnic w poziomie cechy.

            WARIANCJA - średnia arytmetyczna z kwadratów odchyleń wartości cechy od wartości średniej arytmetycznej. WARIANCJA NIE POSIADA LOGICZNEJ INTERPRETACJI

            szereg szczegółowy: 0x01 graphic

            szereg rozdzielczy jednostopniowy: 0x01 graphic

            szereg rozdzielczy wielostopniowy: 0x01 graphic

            xi - warianty cechy

            ni - liczebności wariantów cechy

            0x01 graphic
            - środek przedziału klasowego 0x01 graphic

            n - ogólna liczba obserwacji

            ODCHYLENIE STANDARDOWE - średnia z odchyleń zaobserwowanych wartości cechy od jej średniej arytmetycznej. Oznacza „o ile wartości cechy różnią się przeciętnie od wartości średniej arytmetycznej”.

            0x01 graphic
            0x01 graphic
            < 0 , 100 >

            WSPÓŁCZYNNIK ZMIENNOŚCI - względna miara dyspersji wyrażająca procentowy udział odchylenia standardowego w średniej arytmetycznej. Pozwala ocenić natężenie zróżnicowania badanej cechy w zbiorowości.

            V(S) bliskie 0 - badana zbiorowość jest jednorodna

            V(S) → 1 - rośnie siła zróżnicowania zbiorowości ze względu na badaną cechę.

            ODCHYLENIE PRZECIĘTNE - średnia z bezwzględnych odchyleń zaobserwowanych wartości cechy od jej średniej arytmetycznej. Oznacza „o ile wartości cechy różnią się przeciętnie od wartości średniej arytmetycznej”.

            szereg szczegółowy: 0x01 graphic

            szereg rozdzielczy jednostopniowy: 0x01 graphic

            szereg rozdzielczy wielostopniowy: 0x01 graphic

            WSPÓŁCZYNNIK ZMIENNOŚCI - 0x01 graphic

            POZYCYJNE MIARY DYSPERSJI - obliczane są na podstawie dwóch wartości cechy występujących u jednostek zajmujących szczególne miejsce w szeregu (KWANTYLE)

            ROZSTĘP - odległość między najmniejszą a największą wartością cechy w rozkładzie. Przedstawia obszar zmienności 100% badanej zbiorowości. 0x01 graphic

            ROZSTĘP DECYLOWY - odległość między decylem pierwszym a decylem dziewiątym. Określa obszar zmienności środkowych 80% jednostek zbiorowości. 0x01 graphic

            ROZSTĘP KWARTYLOWY - odległość między kwartylem pierwszym a kwartylem trzecim. Określa obszar zmienności środkowych 50% jednostek zbiorowości. 0x01 graphic

            R

            0x08 graphic

            0x08 graphic
            0x08 graphic
            0x08 graphic
            0x08 graphic
            0x08 graphic
            0x08 graphic
            0x08 graphic
            0x08 graphic

            D1 Q1 Me Q3 D9

            R(Q)

            R(D)

            ODCHYLENIE ĆWIARTKOWE - to połowa obszaru zmienności środkowych 50% jednostek zbiorowości. 0x01 graphic

            WSPÓŁCZYNNIK ZMIENNOŚCI - 0x01 graphic

            ASYMETRIA - SKOŚNOŚĆ - sposób rozmieszczenia liczebności przy wartościach cechy, położenie punktu skupienia obserwacji, położenie dominanty.

            r. symetryczny r. prawostronny r. lewostronny

            0x08 graphic
            0x08 graphic
            0x08 graphic

            0x08 graphic
            0x08 graphic

            0x08 graphic
            0x08 graphic
            0x08 graphic
            0x08 graphic

            0x08 graphic
            0x08 graphic

            0x08 graphic
            0x08 graphic

            0x08 graphic
            0x08 graphic
            0x08 graphic

            0x01 graphic
            0x01 graphic
            0x01 graphic

            ROZKŁAD SYMETRYCZNY - rozkład posiadający oś symetrii, obserwacje są rozłożone równomiernie po obu stronach osi symetrii. Oś symetrii przecina odciętą w punkcie, która jest średnią arytmetyczną zmiennej. 0x01 graphic

            ROZKŁAD ASYMETRYCZNY - rozkład nie posiadający osi symetrii,

            1. ROZKŁAD LEWOSTRONNIE ASYMETRYCZNY - UJEMNY - większość jednostek skupia się wokół wyższych wartości cechy w szeregu;

            0x01 graphic

            2. ROZKŁAD PRAWOSTRONNIE ASYMETRYCZNY - DODATNI - większość jednostek skupia się wokół niższych wartości cechy w szeregu;

            0x01 graphic

            KLASYCZNE MIARY ASYMETRII - stosowane w analizie szeregów rozdzielczych punktowych i przedziałowych, wykazujących tendencję centralną;

            MOMENT TRZECI CENTRALNY - średnia arytmetyczna z podniesionych do potęgi trzeciej odchyleń wartości cechy od wartości średniej arytmetycznej; informuje jaki jest kierunek asymetrii rozkładu cechy zmiennej:

            0x01 graphic
            0x01 graphic
            rozkład symetryczny

            0x01 graphic
            rozkład prawostronnie asymetryczny

            0x01 graphic
            rozkład lewostronnie asymetryczny

            0x01 graphic

            MOMENT TRZECI WZGLĘDNY - to iloraz momentu trzeciego centralnego i odchylenia standardowego podniesionego do trzeciej potęgi; ocenia siłę i kierunek asymetrii:

            0x01 graphic
            0x01 graphic

            POZYCYJNE MIARY ASYMETRII - stosowane gdy rozkład zapisany jest w formie szeregu o przedziałach otwartych, a forma ta wynika z silnej asymetrii a także występowania w rozkładzie wartości skrajnych.

            WSPÓŁCZYNNIK ASYMETRII OPARTY O KWARTYLE

            0x01 graphic
            0x01 graphic

            MIESZANE MIARY ASYMETRII - stosowane do analizy symetrii rozkładów, w których niewskazane jest obliczanie 0x01 graphic

            0x01 graphic
            0x01 graphic

            1

            0x01 graphic

            0x01 graphic

            0x01 graphic

            0x01 graphic



            Wyszukiwarka

            Podobne podstrony:
            4448
            4448
            4448
            4448
            4448
            4448
            4448
            4448
            akumulator do astra hd 8 4441 4441 t 4444 t 4444 4445 4448

            więcej podobnych podstron