5. Miary asymetrii rozkładu empirycznego.
Mówimy, że rozkład empiryczny cechy skokowej
jest symetryczny, jeżeli każdej wartości cechy
odpowiada wartość
taka, że
oraz
.
Rozkład empiryczny jest więc symetryczny, jeżeli liczebności (częstości) dla wartości jednakowo odległych (poniżej i powyżej) środka symetrii, jakim jest średnia wartość cechy. W przeciwnym przypadku mówimy, że rozkład jest asymetryczny (niesymetryczny).
Powyższy warunek symetrii jest uciążliwy do sprawdzenia, jeżeli mamy rozkład o dużej liczebności. Innym warunek symetrii rozkładu jest następujący
,
czyli warunek aby średnia wartość cechy była jednocześnie wartością środkową i wartością dominującą.
Jeżeli
,
przy czym co najmniej jedna z tych nierówności jest "ostra", to mówimy o asymetrii lewostronnej (ujemnej).
Jeżeli
,
przy czym co najmniej jedna z tych nierówności jest "ostra", to mówimy o asymetrii prawostronnej (dodatniej).
W przypadku cechy ciągłej sytuacja nieco się komplikuje. Bezpośrednie badanie asymetrii rozkładu z danych indywidualnych jest możliwe tylko w przypadku bardzo małych prób. Jeśli mamy szereg rozdzielczy cechy ciągłej, to definicję symetrii rozkładu należy zmodyfikować.
Mówimy, że rozkład cechy empiryczny cechy ciągłej
jest symetryczny, jeżeli
oraz
,
gdzie:
- numer przedziału
,
- numer przedziału
,
- środek p-tego przedziału,
- środek q-tego przedziału,
- liczebność p-tego przedziału,
- liczebność q-tego przedziału.
Przykład rozkładu symetrycznego:
|
|
|
2 - 4 |
3 |
2 |
4 - 6 |
5 |
3 |
6 - 8 |
7 |
10 |
8 - 10 |
9 |
3 |
10 - 12 |
11 |
2 |
|
* |
20 |
Mamy
.
Z powyższej tabeli wynika, że warunki definicji są spełnione. Ponadto, zauważmy, że
oraz
czyli
.
Problem powstaje w następującym przypadku
|
|
|
2 - 4 |
3 |
2 |
4 - 6 |
5 |
3 |
6 - 8 |
7 |
5 |
8 - 10 |
9 |
5 |
10 - 12 |
11 |
3 |
12 - 14 |
13 |
2 |
|
* |
20 |
Mamy
Z tabeli wynika, że warunki definicji są spełnione. Nie można niestety w tym przypadku obliczyć ani mediany ani dominanty.
Reasumując, należy stwierdzić, że rozkłady symetryczne zdarzają się bardzo rzadko. W statystyce chodzi nam głownie o podanie miary asymetrii układu. Jednym z parametrów, który można tu zastosować jest klasyczny współczynnik asymetrii, określany dla cechy (skokowej lub ciągłej)
wzorem
Jeśli
, to rozkład jest symetryczny, jeśli
, to rozkład jest prawostronnie asymetryczny, a jeśli
, to rozkład jest lewostronnie asymetryczny.
Obliczymy klasyczny współczynnik asymetrii w przypadku badania stażu i wydajności pracy:
- staż pracy (w latach)
oznacza to, że staż pracy charakteryzuje się słabą asymetrią prawostronną.
- wydajność pracy (w sztukach)
co oznacza , że wydajność pracy charakteryzuje się średnią asymetrią prawostronną.
Innym parametrem, który można stosować jest pozycyjny współczynnik asymetrii, który określa się wzorem:
.
Jeśli
, to rozkład jest symetryczny, jeśli
, to rozkład jest prawostronnie asymetryczny, a jeśli
, to rozkład jest lewostronnie asymetryczny.
Obliczymy pozycyjny współczynnik asymetrii w przypadku badania stażu i wydajności pracy:
- staż pracy (w latach)
oznacza to, że rozkład stażu pracy w zakresie między kwartylami jest symetryczny.
- wydajność pracy (w sztukach)
co oznacza , że rozkład wydajności pracy w zakresie między kwartylami charakteryzuje się słabą asymetrią prawostronną.