Opis statystyczny

background image

Opis statystyczny

Punktem wyjścia do wnioskowania statystycznego
(uogólnianie wyników badania próby na populację
generalną) jest odpowiednia analiza rozkładu badanej
cechy w tej próbie. Metody służące do analizy
rozkładu cechy w próbie są nazywane metodami opisu
statystycznego
.
Opis statystyczny sprowadza się do wyznaczenia
pewnych liczbowych parametrów charakteryzujących
badany

rozkład.

Opis

statystyczny

może

byd

zamkniętym badaniem (w przypadku skooczonej
zbiorowości generalnej).

1

background image

Opis statystyczny

Stosowane w analizach parametry:

Miary położenia (przeciętne, średnie)
Miary zmienności (zróżnicowania, dyspersji, rozproszenia)
Miary asymetrii (skośności)
Miary skupienia

Miary położenia :

klasyczne

– średnia arytmetyczna
– średnia geometryczna
– średnia harmoniczna

pozycyjne

– dominanta
– mediana
– kwantyle

2

background image

Opis statystyczny

Oznaczenia:

-średnia arytmetyczna
-średnia geometryczna
-średnia harmoniczna
-środek i-tego przedziału klasowego
-liczebnośd i-tego wariantu cechy

N -liczebnośd badanej zbiorowości
r -liczba wariantów cechy

3

A

x

G

x

H

x

i

i

n

background image

Opis statystyczny

Średnia arytmetyczna

1…

szereg szczegółowy

1a…

szereg rozdzielczy punktowy

1b…

szereg rozdzielczy przedziałowy
o domkniętych przedziałach klasowych

gdzie

Uwaga: Dla szeregów

przedziałowych wyznacza się tzw. średnią ważoną

(wagami są częstości

)

4

N

1

i

i

A

x

N

1

x

i

r

1

i

i

i

r

1

i

i

A

x

n

x

N

1

x

i

r

1

i

i

i

r

1

i

i

A

n

N

1

x

N

n

r

1

i

i

i

background image

Opis statystyczny

UWAGi:
1. Środki przedziałów uznajemy za reprezentatywne, ale one tylko

w przybliżeniu odzwierciedlają rzeczywiste wartości; stąd dla
szeregów rozdzielczych przedziałowych wartości: średniej
arytmetycznej wyznaczonej wg wzoru (1b) i średniej arytmetycznej
wyznaczonej dla szeregu szczegółowego wg wzoru (1) na ogół będą
się różnid.

2. Średnia arytmetyczna jest pewną abstrakcyjną wielkością

(wypadkową wszystkich obserwacji) i nie musi należed do zbioru
wartości cechy.

3. Dla szeregów rozdzielczych przedziałowych o otwartych przedziałach

klasowych przed obliczeniem średniej należy przedziały domknąd;
przyjmuje się, że otwarte przedziały można domknąd, jeśli ich
liczebnośd jest mniejsza niż 0,05N.

5

background image

Opis statystyczny

Własności średniej arytmetycznej

1. ( ; )

2.

3.

( ; )

4. ( )

6

N

1

i

i

A

x

x

N

i

r

1

i

i

A

n

x

x

N

i

r

1

i

i

A

n

x

N

max

min

x

x

x

N

1

i

i

0

)

x

x

(

0

n

)

x

x

(

i

r

1

i

i

0

n

)

x

(

i

r

1

i

i

N

1

i

2

i

N

1

i

2

i

R

c

)

x

x

(

)

c

x

(

min

i

r

1

i

2

i

i

r

1

i

2

i

R

c

n

)

x

x

(

n

)

c

x

(

min

background image

Opis statystyczny

Własności średniej arytmetycznej (c.d.)
5. Jeśli wszystkie wartości cechy powiększymy (pomniejszymy,

pomnożymy, podzielimy) o/przez pewną stałą, to średnia
arytmetyczna będzie równa sumie (różnicy, iloczynowi,
ilorazowi) średniej arytmetycznej wyjściowej cechy i tej stałej.

6. Średnia arytmetyczna sumy (różnicy) cech równa się sumie

(różnicy) ich średnich arytmetycznych.

7. Na poziom średniej arytmetycznej silny wpływ mają wartości

ekstremalne (skrajne), przy czym wpływ jest silniejszy w
przypadku wysokich wartości cechy.

UWAGA: Średnia arytmetyczna jest miarą prawidłową dla zbiorowości

w których rozkład cechy jest jednomodalny, symetryczny lub o niewielkiej
asymetrii. Jeśli tak nie jest, to dla scharakteryzowania średniego poziomu
zjawiska należy wykorzystad przeciętne pozycyjne.

7

background image

Opis statystyczny

Załóżmy, że zbiorowośd jest podzielona na m rozłącznych grup i
znamy średnią arytmetyczną wartości cechy dla każdej z grup.

Niech

(j=1,2,...,m) oznacza średnią arytmetyczną obliczoną dla

j-tej grupy,

– liczebnośd j-tej grupy

N – ogólna liczebnośd próby

– średnia arytmetyczna dla wszystkich grup łącznie

Wtedy

2… dla j=1,2,...,m oraz

3…

8

j

x

~

j

n

A

x

j

n

1

i

i

j

j

x

n

1

x

~

m

1

j

j

N

n

j

m

1

j

j

A

n

x

~

N

1

x

background image

Opis statystyczny

Średnia geometryczna

4... dla szeregów szczegółowych

4a... dla szeregów rozdzielczych

Średnia geometryczna ma zastosowanie wtedy, gdy zjawiska
ujmowane są dynamicznie, przy badaniu średniego tempa
zmian zjawisk w czasie.

9

N

i

N

1

i

N

N

2

1

G

x

x

...

x

x

x

N

n

i

r

1

i

N

n
r

n
2

n

1

G

i

r

2

1

x

x

...

x

x

x

background image

Opis statystyczny

Średnia harmoniczna

5…

dla szeregów wyliczających

6…

dla szeregów rozdzielczych punktowych

7…

dla szeregów rozdzielczych przedziałowych

Średnią harmoniczną stosuje się, gdy wartości cechy podane są w
jednostkach względnych (km/godz, kg/osobę).

UWAGA: Dla konkretnej cechy tylko jedna średnia klasyczna jest odpowiednia.

10

N

1

i

i

H

x

1

N

x

r

1

i

i

i

H

n

x

1

N

x

r

1

i

i

i

H

n

1

N

x

background image

Opis statystyczny

Dominanta

Dominanta (modalna, moda, wartośd najczęstsza) w rozkładzie
empirycznym Do – ta wartośd cechy, której odpowiada
największa liczebnośd (częstośd).

• Dominanta nie zawsze istnieje.
• Na podstawie przedziałowego szeregu rozdzielczego dominantę

można wyznaczyd jedynie wówczas, gdy przedziały klasowe w
tym szeregu mają jednakową rozpiętośd (wysoka liczebnośd
mogłaby byd spowodowana szerszą rozpiętością tego przedziału
w stosunku do innych).

• Dla szeregów rozdzielczych przedziałowych można poprzestad

na wskazaniu przedziału zawierającego dominantę.

11

background image

Opis statystyczny

Zwykle dla dokładniejszego wyznaczenia mody stosuje się wzór
interpolacyjny (8), wyprowadzony przy założeniu, że wzrost
liczebności w poszczególnych przedziałach klasowych jest
proporcjonalny do wzrostu wartości cechy.

8…

gdzie

– dolna granica przedziału, w którym występuje dominanta
– rozpiętośd przedziału z dominantą

– liczebności przedziału zawierającego

dominantę, poprzedniego, następnego (odpowiednio)

Uwaga: We wzorze (8) liczebności można zastąpid częstościami.

12

d

1

d

d

1

d

d

1

d

d

d

0

h

)

n

n

(

)

n

n

(

n

n

x

Do

d

0

x

1

d

1

d

d

n

,

n

,

n

d

h

background image

Opis statystyczny

Graficzne wyznaczanie dominanty

• Wyznaczyd histogram dla przedziału klasowego zawierającego

dominantę, poprzedniego i następnego.

• Z górnych wierzchołków najwyższego prostokąta należy

wykreślid dwa odcinki łączące po przekątnej bliższe górne
wierzchołki sąsiednich prostokątów.

• Rzut punktu przecięcia tych odcinków na oś odciętych jest

dominantą.

Uwagi:

1.

Jeśli liczebności przedziałów sąsiadujących z przedziałem dominanty są
jednakowe, to dominanta jest równa środkowi klasy dominującej.

2.

Wyznaczanie dominanty jest uzasadnione wówczas, gdy rozkład
empiryczny jest jednomodalny i asymetria jest umiarkowana.

13

background image

Opis statystyczny

Kwantyle

Kwantyl rzędu p w rozkładzie empirycznym – taka wartośd
cechy , dla której jako pierwszej dystrybuanta empiryczna
spełnia relację
9…

0 < p < 1

W statystyce opisowej wyróżnia się:

kwartyle (kwantyle rzędu k = 1,2,3)

decyle (kwantyle rzędu k = 1,2,3,…,9)

centyle (kwantyle rzędu k = 1,2,3,…,99)

14

p

k

p

)

k

(

F

p

4

k

10

k

100

k

background image

Opis statystyczny

Kwartyle:

- kwartyl pierwszy (rzędu )

me - kwartyl drugi (rzędu ) - mediana

- kwartyl trzeci (rzędu )

Mediana jest tą wartością cechy, którą posiada środkowa
jednostka w uporządkowanym (niemalejąco) ciągu wartości
cechy; gdy tych jednostek jest więcej bierze się ich średnią
arytmetyczną, tzn. dla szeregów wyliczających

10…

15

1

Q

4

1

3

Q

4

2

4

3

parzyste

-

N

gdy

)

x

x

(

2

1

e

nieparzyst

-

N

gdy

x

me

1

2

N

2

N

2

1

N

background image

Opis statystyczny

Własności mediany

1.

2. Mediana nie reaguje na zmiany wartości

cech

skrajnych

jednostek (na obserwacje nietypowe).

3. Przy zmianie próby mediana ulega większym zmianom niż

średnia arytmetyczna.

Uwaga: Mediana obok średniej arytmetycznej jest najczęściej stosowanym
parametrem; może byd obliczona, gdy nie można obliczyd średniej
arytmetycznej (otwarte przedziały).

16

N

1

i

i

N

1

i

i

R

c

|

me

x

|

|

c

x

|

min

background image

Opis statystyczny

Do wyznaczenia kwartyli z szeregów rozdzielczych przedziałowych
stosuje się wzór interpolacyjny (11), wyprowadzony przy
założeniu, że wzrost liczebności w poszczególnych przedziałach
klasowych jest proporcjonalny do wzrostu wartości cechy.

11…

gdzie:

p

– rząd kwartyla

– dolna granica przedziału, w którym jest wartośd kwartyla
– rozpiętośd przedziału kwartyla

– liczebnośd przedziału kwartyla

– liczebnośd skumulowana w przedziale poprzedzającym klasę

kwartyla

N – ogólna liczebnośd zbiorowości.

17

]

n

N

p

[

n

h

x

Q

sk

1

Q

Q

Q

Q

0

p

4

Q

0

x

Q

h

Q

n

sk

1

Q

n

background image

Opis statystyczny

Do graficznego wyznaczenia kwartyli wykorzystuje się wielobok
skumulowany liczebności (częstości) - łamana łącząca punkty o
współrzędnych: górna granica przedziału klasowego,
odpowiadająca danej klasie liczebnośd (częstośd ) skumulowana.
Wartośd kwartyla rzędu p stanowi odczytana na osi odciętych
(wartości cechy) liczna odpowiadająca skumulowanej liczebności
równej pN (skumulowanej częstości równej p); N jest ogólną
liczebnością zbiorowości .
W przypadku rozkładu umiarkowanie asymetrycznego zachodzi
wzór Pearsona

12…

18

)

me

x

(

3

Do

x

background image

Opis statystyczny

Miary zmienności:

klasyczne

wariancja

odchylenie standardowe

odchylenie przeciętne

współczynnik zmienności

pozycyjne

rozstęp

odchylenie dwiartkowe

współczynnik zmienności

19

background image

Opis statystyczny

Wariancja

Wariancja to średnia arytmetyczna kwadratów odchyleo wartości cechy

od średniej

13…

szereg szczegółowy

13a…

szereg rozdzielczy punktowy

13b…

szereg rozdzielczy przedziałowy

gdzie

20

N

n

r

1

i

i

N

)

x

x

(

S

N

1

i

2

i

2

r

1

i

i

2

i

r

1

i

i

2

i

2

)

x

x

(

N

n

)

x

x

(

S

r

1

i

i

2

i

r

1

i

i

2

i

2

)

x

(

N

n

)

x

(

S

background image

Opis statystyczny

Uwaga: Wariancja dla szeregów rozdzielczych przedziałowych jest
zawyżona (bierzemy środki klas; liczba przedziałów jest odwrotnie
proporcjonalna do ich rozpiętości, więc przeszacowanie jest tym większe
im mniej jest klas). Zaleca się stosowanie poprawki Shepparda równej

14…

gdzie h – rozpiętośd przedziałów klasowych.

Dla wariancji zachodzi

15...

21

12

h

2

12

h

)

x

(

12

h

N

n

)

x

(

S

2

r

1

i

i

2

i

2

r

1

i

i

2

i

2

2

____

2

2

x

x

S

background image

Opis statystyczny

Jeśli zbiorowośd jest podzielona na m rozłącznych grup, to
wariancja dla całej zbiorowości, tzw. wariancja ogólna jest sumą
dwóch składników:
• wariancji wewnątrzgrupowej (średnia arytmetyczna wariancji

grup);

• wariancji międzygrupowej (wariancja średnich grupowych)

22

background image

Opis statystyczny

Wariancja ogólna wyraża się wzorem

16…

gdzie:

- wariancja wewnątrzgrupowa
- wariancja międzygrupowa

(i=1,2,...,m) oznacza średnią arytmetyczną obliczoną dla i-tej grupy

- liczebnośd i-tej grupy

N - ogólna liczebnośd próby

- średnia arytmetyczna dla wszystkich grup łącznie

23

)

x

~

(

S

S

S

i

2

_____

2

i

2

N

n

S

S

m

1

i

i

2

i

_____

2

i

N

n

)

x

x

~

(

)

x

~

(

S

m

1

i

i

2

i

i

2

_____

2

i

S

)

x

~

(

S

i

2

i

x

~

i

n

x

background image

Opis statystyczny

Odchylenie standardowe

Odchylenie standardowe S jest to pierwiastek z wariancji.
Wyraża się w mianach takich jak badana cecha. Określa przeciętne
zróżnicowanie poszczególnych wartości cechy w stosunku do średniej
arytmetycznej.

Typowy obszar zmienności

17…

Na ogół w obszarze tym mieszczą się wartości cechy około 2/3 jednostek
badanej zbiorowości

24

S

x

x

S

x

typ

background image

Opis statystyczny

Uwagi:
1. Odchylenie standardowe jest najczęściej stosowanym parametrem

statystycznym.

2. Obliczane jest na podstawie wszystkich obserwacji.
3. Im zbiorowośd bardziej zróżnicowana, tym większa wariancja i

odchylenie standardowe.

4. Na podstawie nierówności Czebyszewa, sformułowano tzw. regułę

trzech sigm która mówi, że wystąpienie obserwacji o wartości cechy
poza przedziałem jest mało prawdopodobne.

5. Dla rozkładów normalnych lub zbliżonych do normalnych: tylko 1/3

obserwacji wykracza poza typowy przedział obserwacji
tylko 5% obserwacji wykracza poza przedział
a około 0,3% obserwacji poza przedział

25

)

S

3

x

;

S

3

x

(

)

S

x

;

S

x

(

)

S

2

x

;

S

2

x

(

)

S

3

x

;

S

3

x

(

background image

Opis statystyczny

Odchylenie przeciętne

Odchylenie przeciętne d wyraża się wzorem

18…

szereg szczegółowy

18a…

szereg rozdzielczy punktowy

18b…

szereg rozdzielczy przedziałowy

gdzie

26

N

n

r

1

i

i

N

|

x

x

|

d

N

1

i

i

r

1

i

i

i

r

1

i

i

i

|

x

x

|

N

n

|

x

x

|

d

r

1

i

i

i

r

1

i

i

i

|

x

|

N

n

|

x

|

d

background image

Opis statystyczny

Rozstęp

Rozstęp R to bardzo ogólna miara zmienności
19…

Odchylenie ćwiartkowe

Odchylenie ćwiartkowe Q mierzy poziom zróżnicowania tylko
części jednostek (po odrzuceniu 25% o najmniejszej i 25% o
największej wartości cechy)

20…
Zachodzi związek Q < d < S.
Typowy obszar zmienności cechy (w oparciu o parametry
pozycyjne)
20….

27

min

max

x

x

R

2

Q

Q

2

)

Q

me

(

)

me

Q

(

Q

1

3

1

3

Q

me

x

Q

me

typ

background image

Opis statystyczny

Współczynnik zmienności

Dotychczas omówione miary dyspersji są miarami bezwzględnymi
(w takich jednostkach jak cecha); nie można więc ich wykorzystad
do porównywania rozkładów cech w zbiorowościach. Dlatego w
analizie dyspersji stosuje się względną miarę rozproszenia –
współczynnik zmienności.

Współczynnik zmienności jest stosunkiem bezwzględnej miary
zróżnicowania cechy do przeciętnej wartości cechy (jest miarą
niemianowaną, najczęściej podawaną w procentach).

28

background image

Opis statystyczny

W zależności od przyjętych miar przeciętnych i dyspersji wyróżnia
się współczynniki zmienności:

• Klasyczne

21…

22…

• Pozycyjne

23…

24… ( )

29

x

S

V

S

x

d

V

d

me

Q

V

Q

1

3

1

3

Q

Q

Q

Q

Q

Q

V

3

1

2

Q

Q

Q

1

3

background image

Opis statystyczny

Miary asymetrii

Rozkłady mogą różnid się kierunkami i siłą asymetrii.
W szeregach symetrycznych

- wskaźnik skośności (określa kierunek

asymetrii)

-

pozycyjny wskaźnik skośności

Asymetria lewostronna:

Asymetria prawostronna:

30

Do

me

x

Do

me

x

Do

me

x

Do

x

0

Q

me

me

Q

1

3

1

3

Q

me

me

Q

0

Q

me

me

Q

1

3

0

Q

me

me

Q

1

3

background image

Opis statystyczny

Miary asymetrii (współczynniki skośności) określają kierunek i siłę
asymetrii
Klasyczne współczynniki asymetrii:
25…

26…

27... gdzie ( )

Pozycyjny współczynnik asymetrii

28…

Uwaga: Im większa wartośd bezwzględna współczynnika asymetrii, tym
silniejsza asymetria

31

S

Do

x

A

S

d

Do

x

A

d

3

3

S

m

A

N

)

x

x

(

m

N

1

i

3

i

3

N

n

)

x

x

(

m

r

1

i

i

3

i

3

Q

2

me

2

Q

Q

Q

me

me

Q

Q

me

me

Q

A

1

3

1

3

1

3

Q

background image

Opis statystyczny

Miary koncentracji

Współczynnik skupienia (kurtoza) – miara skupienia obserwacji
wokół średniej
29… gdzie ( )

Im wyższa wartośd K, tym bardziej wysmukła krzywa liczebności,
więc większa koncentracja wartości cechy wokół średniej.
Jeśli zbiorowośd ma rozkład normalny, to K = 3.
K < 3 -rozkład platokurtyczny bardziej spłaszczony od normalnego
K > 3 - rozkład leptokurtyczny bardziej wysmukły od normalnego

30…

- rozkład platokurtyczny

-rozkład leptokurtyczny

32

4

4

S

m

K

N

)

x

x

(

m

N

1

i

4

i

4

N

n

)

x

x

(

m

r

1

i

i

4

i

4

3

S

m

K

4

4

0

K

0

K


Wyszukiwarka

Podobne podstrony:
opis statystyczny, Statystyka
Rajfura A, Statystyka Wyklad 01 OPIS STATYSTYCZNY krotki
opis statystyczny zadania
PRACA ZALICZENIOWA-pomiar dydaktyczny 2, OPIS STATYSTYCZNY WYNIKÓW POMIARU
opis statystyczny SPSS
Miary zmienności (wzory i opis), Statystyka
opis statystyczny SPSS
opis statystyczny 1
Statystyki RK opis, Informacja Naukowa i Bibliotekoznawstwo, Materiały
Analiza funkcji dyskryminacyjnej - Opis, Psychologia, Statystyka, psychometria
Opis zawodu Statystyk, Opis-stanowiska-pracy-DOC

więcej podobnych podstron