Wykład 2 statystyka opisowa


Statystyka opisowa, II rok NE, grupy 1-3 B.Z.©
Wykład 2 (5 pazdziernika)
Temat: METODY PREZENTACJI MATERIAAU STATYSTYCZNEGO
Materiał liczbowy otrzymany w wyniku badania należy odpowiednio pogrupować w postaci
szeregów statystycznych.
Szereg statystyczny  ciąg wielkości statystycznych, uporządkowany według określonych
kryteriów. Wyróżniamy szeregi szczegółowe oraz rozdzielcze.
Szereg szczegółowy  uporządkowany ciąg wartości badanej cechy statystycznej (rosnąco lub
malejÄ…co).
Przykład: Badamy liczbę dzieci w 10 rodzinach: 0, 1, 2, 1, 2, 1, 2, 3, 0, 4. Szereg statystyczny
szczegółowy: 0, 0, 1, 1, 1, 2, 2, 2, 3, 4.
Szereg rozdzielczy  ustalona liczba rozłącznych klas (grupa) na jakie podzielono materiał
statystyczny wraz z listą pewnych wartości liczbowych przyporządkowanych kolejnym
klasom szeregu.
W przypadku tworzenia szeregu rozdzielczego wprowadza się następujące oznaczenia:
i oznacza numer klasy, i=1,2,...k ,
k oznacza liczbę klas (liczba wariantów cechy),
xi oznacza wartość cechy w i- tej klasie,
ni oznacza liczebność i-tej klasy, przy czym spełniony jest warunek, że suma wszystkich
k
liczebności jest równa wielkości próby, czyli = n ,
"n
i
i=1
k
ni
Éi = oznacza czÄ™stość wzglÄ™dnÄ… (wskaznik struktury) i-tej klasy, przy czym
"É = 1 oraz
i
n
i=1
0 d" Éi d" 1.
ni(sk) oznacza liczebność skumulowana i-tej klasy, otrzymuje się ją jako sumę liczebności tej
klasy i liczebności wszystkich klas poprzednich ni(sk) = n1 + n2 +...+ ni
ni(sk)
Éi(sk) = oznacza czÄ™stość skumulowanÄ… i-tej klasy, otrzymuje siÄ™ jako:
n
Éi = É1 + É2 + ... + Éi
sk
Wyróżnia się dwa rodzaje szeregów rozdzielczych: przedziałowe i punktowe.
Szereg punktowy: Przykład: Badamy liczbę dzieci w 100 rodzinach: 1, 3, 4, 2, 0, & .
Liczba dzieci w rodzinie (x) 0 1 2 3 4
20 35 25 15 5
Liczebności ( ni )
0,2 0,35 0,25 0,15 0,05
CzÄ™stoÅ›ci ( Éi )
20 55 80 95 100
Liczebności skumulowane ni(sk)
0,2 0,55 0,8 0,95 1,00
CzÄ™stoÅ›ci skumulowane Éi(sk)
1
Statystyka opisowa, II rok NE, grupy 1-3 B.Z.©
Szeregi przedziałowy: Przykład: Badamy wzrost dzieci.
Wzrost dzieci (x) 100-110 110-120 120-130 130-140
25 45 30 10
Liczebności ( ni )
0,23 0,41 0,27 0,09
CzÄ™stoÅ›ci ( Éi )
25 70 100 110
Liczebności skumulowane n(sk)i
0,23 0,64 0,91 1,00
CzÄ™stoÅ›ci skumulowane É(sk)i
Dolna i górna granica klasy oznaczone są następującymi symbolami: x0i oraz x1i . Rozpiętość
(szerokość) klasy: hi = x1i - x0i . Jeżeli dla wszystkich klas szerokość klasy jest taka sama
wtedy przyjmujemy oznaczenie h.
Podstawą analiz statystycznych jest określenie empirycznego rozkładu cechy. Określenie
tego rozkładu polega na przyporządkowaniu uszeregowanym rosnąco wartościom
przyjmowanym przez cechę częstościom ich występowania. Zatem rozkład empiryczny jest
wyrażony przez zestawienie wartości cechy wraz z częstościami ich występowania.
Jeżeli rozkład empiryczny przedstawimy za pomocą skumulowanych częstości otrzymamy
dystrybuantÄ™ empirycznÄ…. Z punktu widzenia formalnego dystrybuantÄ™ empirycznÄ… Fn x
( )
nazywamy funkcjÄ™ okreÅ›lonÄ… na podstawie danych xi,Éi dla i=1,2,& ,k nastÄ™pujÄ…co:
( )
0 dla x < x1
Å„Å‚
ôÅ‚
i
ôÅ‚
Fn x =
( )
òÅ‚
"w dla xi d" x < xi+1
i
s=1
ôÅ‚
ôÅ‚
1 dla x e" xk
ół
Zatem dystrybuanta empiryczna jest wyrażona przez zestawienie wartości cechy oraz
częstości skumulowanych (szereg rozdzielczy częstości skumulowanych).
Dystrybuanta empiryczna jest funkcjÄ… niemalejÄ…cÄ…, ograniczonÄ… na przedziale [0,1].
Tworzenie szeregów rozdzielczych przedziałowych:
I. Ustalanie liczby klas:
Wybór liczby klas ma decydujące znaczenie, albowiem wybór zbyt małej liczby klas
spowoduje utratę informacji o badanej zbiorowości, natomiast zbyt duża liczba klas
spowoduje utratę przejrzystości badanych danych. Przyjmuje się, że liczba klas powinna być
nie mniejsza niż 5, ale nie większa niż 20.
Liczba klas zależy od wielkości próby. Przyjmuje się, że liczba klas powinna spełniać jeden z
warunków:
k H" n
k H" 1+ 3,322log n
k d" 5log n
2
Statystyka opisowa, II rok NE, grupy 1-3 B.Z.©
Warunki te pozwalają na określenie orientacyjnej liczby klas w zależności od wielkości
próby:
n k
40-60 6-8
60-100 7-10
100-200 9-12
200-500 11-17
II. Ustalanie rozpiętości klasy:
1. Rozpiętości klas mogą być jednakowe lub różne. Jeżeli ustalimy jednakowe
rozpiętości, wtedy liczebności oraz częstości w nich występujące będą porównywalne
w całej próbie. Nierówne długości klas są uzasadnione dla niejednorodnych populacji.
Gdy liczebności klas są niejednakowe, wtedy żeby zapewnić porównywalność
ni
liczebnościom i częstościom w klasach należy obliczyć gęstości liczebności: gn =
i
hi
Éi
lub gÄ™stoÅ›ci czÄ™stoÅ›ci gÉ = .
i
hi
2. Dla równych rozpiętości klas długość klasy może być wyznaczona z następującej
xmax - xmin
zależności: h e" . Różnica xmax - xmin jest różnicą pomiędzy maksymalną
k
oraz minimalną wielkością z próby i nazywana jest rozstępem z próby.
3. Klasy nie mogą być puste (czyli takie w których liczebność równa jest zero).
4. Pierwsza i ostatnia klasa powinny być w miarę możliwości domknięte
III. Sprawdzanie poprawności grupowania (jest możliwe tylko w wypadku założenia, że
długości klas są stałe i równe h):
Jako kryterium poprawności grupowania wykorzystuje się sumę bezwzględnych różnic
środków przedziałów i średnich arytmetycznych z wartości należących do tych
przedziałów:
k
i
1
xi - xi d" h ;
"
2
i=1
i
gdzie: x - środek przedziału i-tej klasy, xi - średnia wyznaczona z wartości należących do
i
i-tej klasy.
Jeżeli grupowanie przebiega poprawnie suma nie jest większa niż 0,5 razy h.
3


Wyszukiwarka

Podobne podstrony:
Statystyka opisowa i ekonomiczna Wykład 1
1 wprowadzenie do statystyki statystyka opisowa
2 Statystyka opisowa S
Statystyka opisowa
Statystyki opisowe
Statystyka opisowa rozwiÄ…zane kolowkia
Statystyka opisowa
4 Statystyka opisowa i rozkład normalny
Statystyka opisowa
Wyklad4 statystyka
Wyklad2 statystyka
STATYSTYKA OPISOWA
wykład statystyka matematyczna cz 4
wykład 1 Statystyka

więcej podobnych podstron