1
Wskaźnik natężenia.
Wskaźnikiem natężenia dla określonej wartości badanej cechy x
i
nazywamy
stosunek liczebności (wielkości) odpowiadający tej wartości w dwóch
zbiorowościach pozostających w przyczynowym lub logicznym związku.
i
i
i
m
n
w
=
(np. stopa bezrobocia liczona jako liczba bezrobotnych /liczbę
aktywnych zawodowo).
Miary tendencji centralnej.
Miary tendencji centralnej służą do opisywania i porównywania średniej
wartości w szeregu. Ogólnie dzielą się na:
1. klasyczne – obliczane ze wszystkich wyrazów szeregu;
2. pozycyjne – wyznaczone z niektórych wyrazów szeregu wybranych ze
względu na pozycję, jaką w tym szeregu zajmują.
Miary klasyczne: średnia arytmetyczna, średnia harmoniczna.
Średnia arytmetyczna jest to ta wartość zmiennej X, jaką by miały
wszystkie jednostki danej zbiorowości, gdyby nie było między nimi różnic
ze względu na poziom danej cechy.
Średniej arytmetycznej nie liczymy, gdy:
1. przedziały skrajne są otwarte;
2. występują wartości nietypowe (np. wzrost: 175, 169, 172, ..., 215);
3. zbiorowość jest niejednorodna (np. widownia teatru dla dzieci
analizowana ze względu na wiek – widownię stanowią i dzieci i dorośli).
2
Własności średniej arytmetycznej:
1.
∑
=
=
n
i
i
x
n
x
1
*
- iloczyn średniej i liczebności jest równy łącznej wartości
cechy w zbiorze;
2.
0
)
(
1
=
−
∑
=
n
i
i
x
x
- suma odchyleń wartości cechy od średniej jest równa zeru;
3.
x
C
gdy
C
x
n
i
i
=
=
−
∑
=
min
)
(
1
2
.
• szereg szczegółowy -
N
x
x
i
i
∑
=
, gdzie N – liczebność zbiorowości;
• szereg rozdzielczy o klasach jednostkowych -
∑
∑
=
i
i
i
i
i
n
n
x
x
lub gdy
∑
=
i
i
i
i
n
n
w
-
∑
=
i
i
i
w
x
x
- ważona postać średniej, gdyż poszczególne wartości cechy
są mnożone przez liczebności (częstości) ich występowania (czyli są
ważone liczebnościami lub częstościami ich występowania).
• szereg rozdzielczy o przedziałach klasowych -
∑
∑
=
i
i
i
o
i
i
n
n
x
x
- w tym
przypadku nie otrzymujemy dokładnej wartości tylko wynik przybliżony.
Średnia harmoniczna: odwrotność średniej arytmetycznej policzona z
odwrotności wartości zmiennych. Stosuje się ją gdy wartości zmiennej są
podane w jednostkach względnych np. w km/ h, w zł/ szt. Zatem stosujemy
ją do obliczania przeciętnej prędkości pojazdów (w km/ h), gęstości
zaludnienia (w os./ km
2
), ceny towarów (w zł/ szt).
* szereg szczegółowy -
∑
=
=
n
i
i
h
x
n
x
1
1
* szereg rozdzielczy -.
∑
∑
=
i
i
i
i
i
i
i
h
x
n
x
n
x
x
3
Miary pozycyjne: mediana i dominanta.
Mediana – to wartość zmiennej X, która zajmuje środkową pozycję w
szeregu statystycznym uporządkowanym wg poziomu zmiennej X.
Inaczej – jest to taka wartość cechy, że co najmniej połowa jednostek
zbiorowości ma wartość cechy nie większą od niej i równocześnie co
najmniej połowa jednostek ma wartość cechy nie mniejszą od tej wartości.
• szereg szczegółowy:
+
=
+
+
jednostek
liczby
parzystej
dla
)
(
2
1
jednostek
liczby
ej
nieparzyst
dla
2
/
)
2
(
2
/
2
/
)
1
(
n
n
n
x
x
x
Me
• szereg rozdzielczy – stosujemy tzw. interpolacyjny wzór na medianę:
)
(
1
0
0
0
−
−
+
=
sk
Me
n
N
n
h
x
Me
, gdzie:
x
0
– dolna granica przedziału mediany; h
0
– rozpiętość przedziału mediany;
n
0
– liczebność przedziału mediany; N
Me
– numer mediany (dla N
parzystego N
Me
=N/2, dla N – nieparzystego N
Me
=(N+1)/2); n
sk-1
–
liczebność skumulowana dla przedziału poprzedzającego numer mediany.
Mediana jest tu oczywiście wartością przybliżoną. Wzór ten daje najlepsze
wyniki, gdy zbiór danych jest odpowiednio liczny a przedziały klasowe
mają niewielkie rozpiętości. Me stosujemy, gdy średnia arytmetyczna
zawodzi ze względu na znaczną niejednorodność rozkładu lub nie można jej
liczyć z powodu otwartych przedziałów.
4
Dominanta – ta wartość zmiennej X, której odpowiada w szeregu
największa liczba obserwacji.
Wzór interpolacyjny na dominantę:
)
(
)
(
)
(
1
0
1
0
1
0
0
0
+
−
−
−
+
−
−
+
=
n
n
n
n
n
n
h
x
Do
, gdzie:
x
0
– dolna granica przedziału dominanty; h
0
– rozpiętość przedziału
dominanty; n
0
– liczebność przedziału dominanty; n
-1
– liczebność
przedziału poprzedzającego przedział dominanty; n
+1
– liczebność
przedziału następującego po przedziale dominanty.
Dominanty nie można liczyć, gdy:
• zbiorowość nie jest jednorodna;
• największa liczebność znajduje się w pierwszym lub ostatnim przedziale;
• rozpiętości przedziałów dominanty, poprzedzającego i następnego są
różne.
Dla cechy ciągłej nie należy się spodziewać aby którakolwiek z wartości
występowała częściej niż inne, zatem Do w takim rozkładzie interpretuje się
jako wartość, wokół której grupują się elementy badanej zbiorowości.
Wyznaczanie dominanty ma sens, gdy występuje jedno wyraźnie
zaznaczone maksimum liczebności. W przypadku występowania większej
liczby lokalnych maksimów (rozkład wielomodalny) należałoby określić
więcej niż jedną dominantę. Przypadek taki wskazuje na niejednorodność
zbioru danych wynikającą z połączenia różnych populacji.
5
Ogólne cechy średnich:
Średnie są wartościami mianowanymi i posiadają takie samo miano jak
badana zmienna. Wszystkie średnie spełniają warunek: ich wartość mieści
się między największą a najmniejszą wartością zmiennej X w badanym
szeregu.
Miary klasyczne są dokładniejsze, bo biorą pod uwagę wszystkie
wyrazy w szeregu. Me powinno się obliczać, gdy zbiorowość jest bardzo
zróżnicowana, albo gdy w szeregu występują wartości nietypowe. Przy
mocno zróżnicowanej zbiorowości obliczamy średnie pozycyjne lub
dzielimy zbiorowość na bardziej jednorodne podzbiory i obliczamy średnie
klasyczne dla każdego z tych podzbiorów osobno.
Zależność Pearsona:
Odległość średniej arytmetycznej od dominanty jest w przybliżeniu równa 3
odległościom średniej od mediany:
)
(
*
3
Me
x
Do
x
−
≅
−
Kwartyle: dzielą zbiorowość na 4 części.
Kwartyl I – Q
1
– oddziela 25% obserwacji o wartościach niższych i 75%
obserwacji o wartościach wyższych od niego.
Kwartyl II – Me.
Kwartyl III – Q
3
– oddziela 75% obserwacji o wartościach niższych i 25% o
wartościach wyższych od niego.
Wzory interpolacyjne:
4
gdzie
)
(
1
1
1
1
1
1
1
N
N
n
N
n
h
x
Q
Q
sk
Q
Q
Q
Q
=
−
+
=
−
4
3
gdzie
)
(
3
1
3
3
3
3
3
N
N
n
N
n
h
x
Q
Q
sk
Q
Q
Q
Q
=
−
+
=
−