Mat Stat Wyką ad 1 ( 2013L)


Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
WYKAAD 1. Informacje wstępne. Sylabus. Wprowadzenie w
problematykę badao statystycznych. Elementy statystyki
opisowej
SYLABUS
1. Wprowadzenie w problematykę badao statystycznych.
Elementy statystyki opisowej.
2. Próba losowa prosta. Momenty z próby. Model
Statystyczny. Przykłady statystyk.
3. Dystrybuanta empiryczna. Twierdzenie.Gliwienki-
Cantelliego. Prawa wielkich liczb i Centralne twierdzenia
graniczne.
4.Funkcje charakterystyczne. Własności. Związek funkcji
charakterystycznych z rozkładami prawdopodobieostwa.
5. Przegląd i charakterystyka ważniejszych rozkładów
prawdopodobieostwa . Rozkład Chi-kwadrat. Rozkład
t-Studenta.
6. Estymatory i ich własności. Metody estymacji
punktowej. Problem oceny estymatora. Funkcja ryzyka.
Związek ryzyka z wariancją i obciążeniem
7. Informacja Fishera i nierównośd informacyjna
1
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
8. Estymacja przedziałowa. Przykłady konstrukcji
przedziałów ufności
9. Asymptotyczne przedziały ufności. Metoda delta
10. Weryfikacja hipotez. Metody konstrukcji testów
statystycznych
11.Testy parametryczne. Przykłady zastosowań
12. Testy nieparametryczne. Przykłady zastosowań
13. Weryfikacja hipotez dotyczących dwu populacji
14.Testy ilorazu wiarogodności. Podstawowy Lemat
Neymana-Pearsona. Krzywa mocy testu. Przykłady
wyznaczania krzywych
15. Elementy analizy regresji i analizy wariancji
Literatura
[1] M. Sobczyk.Statystyka Opisowa. CM.BECK, Warszawa 2010
[2] W. Niemiro. Rachunek Prawdopodobieostwa i Statystyka Matematyczna.
Biblioteka Szkoły Nauk Ścisłych, Warszawa 1999.
[3] M. Krzyśko. Statystyka Matematyczna, UAM, Poznań 2004.
[4] A. Plucińska i E. Pluciński. Probabilistyka . Rachunek
Prawdopodobieństwa. Statystyka Matematyczna. Procesy Stochastyczne. WNT.
2
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
Warszawa 2000.
[5] S. Trybuła. Statystyka Matematyczna z Elementami Teorii Decyzji. OWPW,
Wrocław 2004.
[6] W. Krysicki i inni. Rachunek prawdopodobieostwa i statystyka
matematyczna w zadaniach. Cz.2., PWN, 2007.
Wprowadzenie w problematykę badao
statystycznych. (por.Sobczyk [1])
I. Przedmiot, metody i organizacja badao
statystycznych
ż Rodowód terminu statystyka pochodzi od słowa
łacioskiego status czyli paostwo. (Gottfried
Achenwal (1719-1772)  nazwa  statystyka pojawiła się w
piśmiennictwie)
ż Do połowy XIX w. statystyka, to zbiór danych
liczbowych dotyczących paostwa. Rozszerzono
pojęcie na inne zbiory danych liczbowych.
ż Zbiory danych ujmowano w tablice. Pojawili się
tabelaryści. (1741 r. praca J. P. Anchersona)
(Opisywano najczęściej warunki bytu ludności , zestawiano
bilanse itp.)
ż Rozwój nauki: 1835r. W Anglii powołano
Królewskie Towarzystwo Statystyczne. W 1854 r.
odbył się w Brukseli I Międzynarodowy Kongres
Statystyczny.
ż Współcześnie statystyka ma wiele znaczeo:
3
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
- zbiory danych liczbowych,
- gromadzenie oraz opracowywanie danych,
- charakterystyki zbioru danych,
- dyscyplina naukowa o  ilościowych metodach
badania prawidłowości występujących w zjawiskach
masowych (Kurkiewicz,Stanowski 2005r).
- potocznie - metody gromadzenia, prezentacji,
analizy i interpretacji danych dotyczących zjawisk
masowych.
W Polsce, zasady gromadzenia danych, przechowywania,
opracowywania, udostępniania i rozpowszechniania danych oraz
wyników badao, tworzy System Informacyjny Statystyki Publicznej(
SIST). Prace SIST koordynuje GUS.
Statystyka  w programach nauczania
ż statystyka opisowa  wstępna analiza danych
ż statystyka matematyczna (wnioskowanie
statystyczne)  metodologia wyciągania wniosków
(dotyczących badanego zjawiska masowego) na
podstawie danych statystycznych. Podstawy
teoretyczne metodologii  rachunek
prawdopodobieostwa
Zjawiska masowe (z.m.)
ż metody statystyczne są wykorzystywane do takich
z.m. , które dotyczą zbiorowości złożone z dużej
liczby jednostek (elementów).Na ogół jednostki te
są podobne ale nie identyczne.
4
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
ż prawidłowości ujawnione w obserwacji z.m.
nazywamy statystycznymi.(Np. prawidłowości
dotyczące charakterystyk demograficznych).
Badania statystyczne są pomocne przy podejmowaniu
decyzji w wielu dziedzinach życia i dają dużą siłę
poznawczą w różnych dyscyplinach naukowych.
Podstawowe pojęcia
a) Populacja generalna (p.g). (Inne nazwy: populacja,
zbiorowośd statystyczna)
ż p.g.- zbiór elementów (jednostek) objętych
badaniem.
b) Cecha statystyczna  badana właściwośd elementów
p.g. Bada się te cechy, które różnią elementy p.g -
(inna nazwa - zmienna obserwowalna).
ż cech jakościowe(niemierzalne) i ilościowe
(mierzalne)
ż cechy o wartościach skokowych (dyskretnych) i
ciągłych
ż Cechy wielowymiarowe.
5
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
Organizacja badao statystycznych
Etapy
ż przygotowanie badania: cel, metoda (badanie
pełne, częściowe), zbiorowośd statystyczna,
badane cechy, jednostki sprawozdawcze.
ż obserwacja statystyczna: ustalenie wartości cech
ilościowych lub odmian cech jakościowych w
badanej próbie lub całej populacji  zbieranie
danych - materiał statystyczny pierwotny i wtórny.
ż opracowanie materiału statystycznego:
grupowanie i zliczanie,
ż prezentacja materiału statystycznego: szeregi
statystyczne,
ż opis lub wnioskowanie statystyczne.
Szereg statystyczny  zbiór wyników obserwacji cech
(materiał statystyczny)
Ż Ż Ż Ż
szereg szczegółowy rozdzielczy przestrzenny dynamiczny
(uporządkowany) (strukturalny) (geograficzny) (czasowy)
wariantom cechy
przyporządkowuje się
liczebności lub częstości
6
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
Przykład szeregu rozdzielczego punktowego:
Ocena testu (cecha)
2 3 4 5
Liczba studentów
3 20 6 1
Dane jakościowe
Podstawą analiz statystycznych są:
- rozkład empiryczny cechy. (Pojęciem tym określa się
przyporządkowanie poszczególnym wariantom cechy,
obserwowalnym w próbce, liczności lub częstości ich występowania).
- wykresy: kołowe, słupkowe&
Przykład
Tabela: Skład wyznaniowy ludności Warszawy w 1864 i 1917 (K.M. str.14,15)
Wyznanie Rok 1864 Rok 1917
Liczebnośd % Liczebnośd %
Katolicy 131808 59.1 387069 46.2
Prawosławni 3026 1.4 3961 0.5
Ewangelicy 15909 6.7 12147 1.5
Żydzi 72772 32.6 329535 39.3
Inne 287 0.2 104500 12.5
7
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
Dane ilościowe
ż tablice, szeregi rozdzielcze, wykresy
ż histogram : zbiór przylegających prostokątów;
podstawa - rozpiętośd klasy, wysokośd -
liczebnośd, częstotliwośd lub natężenie
liczebności.
ż wielobok liczebności(częstości)- łamana
powstała przez połączenie punktów
odpowiadającym środkom klas i odpowiadającym
licznościom (częstościom))
ż dystrybuanta empiryczna
3. Grupowanie danych
Przykład. Rejestr wieku 20 pracowników zgłaszających się na
badanie lekarskie w pewnej firmie:
36, 41, 33, 34, 38, 26, 33, 36, 30, 48, 39, 31, 35, 36, 38, 37, 22,
31, 25, 32.
Liczba różnych wartości cechy = 16. Wykres 16-słupkowy
mało czytelny  wkładamy wartości cechy w przedziały, np:
[20,25), [25,30), [30,35), [35,40), [40,45), [45,50)
1 2 7 8 1 1
Szereg rozdzielczy przedziałowy przedstawia się graficznie w postaci wykresu
nazywanego histogramem.
8
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
histogram liczebności
Przy dużej liczności próbki dane grupuje się w przedziały klasowe.
Najczęściej tworzy się szereg rozdzielczy z klasami o jednakowej
długości (nie jest to konieczne). Liczbę klas dobiera się w zależności
od liczności próbki n. Praktycy mają swoje sposoby na ustalania
liczby klas. Niektórzy zalecają przyjąd liczbę klas k spełniającą
nierównośd
3
n Ł k Ł n
4
Jeżeli przyjąd, że klasy będą jednakowej długości to praktycy
zalecają wyznaczyd długośd klasy z następującego wzoru
xmax - xmin
Długośd klasy:
k
xmax, xmin oznaczają odpowiednio największą i najmniejszą
obserwację.
Końcowy etap badania statystycznego
Opis statystyczny (dziedzina statystyki opisowej)
dotyczy całej badanej populacji lub jej podzbioru (próby,
która nie musi byd losowa). Miary opisu: miary centralne
(np. średni poziom cechy), rozproszenia (dyspersji),
asymetrii, ...
9
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
ż dotyczy także współzależności zjawisk - powiązao między
różnymi cechami zbiorowości (np. staż pracy
i wynagrodzenie w ustalonej firmie).
ż dotyczy również dynamiki zjawisk (rozwój badanego
zjawiska w czasie nazywa się szeregiem czasowym)
Wnioskowanie statystyczne
ż Wnioskowanie o generalnej populacji na podstawie
próby losowej (wnioskowanie reprezentacyjne) 
uogólnianie wyników z próby na całą zbiorowośd
statystyczną. W zakres wnioskowania wchodzi
estymacja i testowanie hipotez. Teoretyczną
podstawą jest rachunek prawdopodobieostwa
Przykłady problemów statystycznych
1 . Testowanie hipotezy, że producent utrzymuje
zapowiedzianą na opakowaniu normę.
Listwy podłogowe dostarczane przez tartak powinny mied średnią
długośd 240 cm z odchyleniem standardowym 15cm.
Czy można na poziomie istotności a = 0,05 twierdzid, że dostarczona
duża partia listew jest zgodna z tą normą, jeśli w losowej próbie 20
listew średnia długośd wynosiła 234 cm. (Można założyd, że rozkład
długości produkowanych listew jest normalny).
2. Sprawdzanie rzetelności kostki do gry planszowej
W celu sprawdzenia , czy kostka sześcienna do gry jest rzetelna
(symetryczna) wykonano 120 rzutów, uzyskując wyniki:
Liczba oczek
1 2 3 4 5 6
Liczba rzutów
11 30 14 10 33 22
10
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
Zweryfikuj, na poziomie istotności 0.05, hipotezę, że kostka jest
rzetelna.
3. Przykład zadania ze statystyki opisowej
1. Przeprowadzono badania dotyczące rozkładu czasu trwania
rozmów telefonicznych. Wyniki  w minutach - dla 32 połączeo
telefonicznych przedstawiały się następująco:
Czas liczba
rozmowy rozmów
0  5 7
5  10 10
10  15 8
15  20 4
20  25 2
25  30 1
32
a) podaj średni czas rozmowy& & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & .
b) Wyznacz następujące miar zróżnicowania czasu trwania rozmów i podaj ich wartości:
wariancję empiryczną i odchylenie standardowe& & ..& & & & & & & & & & & & & & & & &
& & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & &
typowy obszar zmienności badanej cechy& & & & & & & & & & & & & & & & & & .& & & &
& & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & &
Oceo (w przybliżeniu) jaki procent rozmów znajduje się w typowym obszarze& & & ..
zmienności? & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & & &
Prezentacja i analiza danych empirycznych
a) szereg punktowy: x1, x2,& , xn
b) szereg rozdzielczy punktowy,
c) szereg rozdzielczy przedziałowy.
11
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
Ad b) Schemat szeregu rozdzielczego punktowego
licznośd Udział procentowy
Cecha częstość
x1 wi
ni wi 100
x2 n1 w1 w1 100
x3 n2 w2 w2 100
x4 n3 w3 w3 100
...
xk nk wk wk 100
Suma n 1 100
Ad c) Schemat szeregu rozdzielczego przedziałowego
licznośd Udział procentowy
Cecha częstość
x0i-x1i wi
ni wi 100
x01-x11 n1 w1 w1 100
x02-x12 n2 w2 w2 100
x03-x13 n3 w3 w3 100
...
x0k-x1k nk wk wk 100
Suma n 1 100
Rozważmy szereg punktowy częstości
Wartości cechy x1 x2 & xn
częstosci wzgledne w1 w2 & wn
gdzie wi = ni /n, ni  licznośd i-tej obserwacji w próbie,
n-ogólna liczba obserwacji.
12
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
Dystrybuanta empiryczna, to taka funkcja : F: R
że F(x)=
Materiał na dwiczenia
Opis próbki empirycznej. Mierniki statystyczne: średnia
arytmetyczna, mediana, dominanta, wariancja, odchylenie
standardowe skośnośd i kurtoza.
Miary opisowe rozkładu empirycznego
ż Syntetyczny sposób charakteryzacji struktury danych
statystycznych: poziom cechy, zróżnicowanie wartości
oraz kształt rozkładu.
ż Miary położenia (inne nazwy- miary tendencji
centralnej, przeciętnego poziomu): średnia
arytmetyczna, dominanta, kwantyle, kwartyle,
mediana
ż Miary rozproszenia (inne nazwy - miary
zróżnicowania, zmienności, rozrzutu, dyspersji):
rozstęp, wariancja, odchylenie standardowe,
typowy obszar zmienności, klasyczny współczynnik
zmienności, odchylenie dwiartkowe (kwartylowe)
ż Miary kształtu rozkładu: współczynnik skośności
Pearsona, klasyczny współczynnik zmienności,
pozycyjny współczynnik asymetrii, współczynnik
kurtozy.
13
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
Miary położenia
1) Średnia arytmetyczna, oznaczenie x
a) szereg szczegółowy
x1, x2, ...,xn - wartości cechy w doświadczeniu
n
1 1
x = (x1 + x2 + + xn)= xi

n n
i=1
b) szereg rozdzielczy punktowy
k k
1 ni k
Ogólnie: x = xini = xi = xiwi

n n
i=1 i=1 i=1
c) szereg rozdzielczy przedziałowy
Przykład. X  wyraża czas dojazdu do pracy w min.
Ogólnie: mamy k przedziałów klasowych:i=1,2,...,k
x0i-dolna granica i-tego przedziału
x0i-górnana granica i-tego przedziału
&
xi -środek i-tego przedziału
k k
1 ni k
& & &
x = xini = xi = xiwi

n n
i=1 i=1 i=1
14
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
Własności
n
xmin Ł x Łxmax , (xi - x) = 0

i=1
n n
(xi - x)2 Ł

(x - x)2 dla każdego x
i
i=1
i=1
2. Dominanta (moda, wartośd najczęstsza)
ż Miara tendencji centralnej  najczęściej występująca
wartośd cechy w zbiorze.
Oznaczenie- D
Przykład: X-liczba wizyt w kinie
0 0 0 0 1 1 1 1 1 2 2 2 3 3
D = 1
a) szereg szczegółowy i szereg rozdzielczy punktowy
D = wartośd najliczniejszego wariantu cechy
b) szereg rozdzielczy przedziałowy
Dominantę wyznacza się w rozkładzie, który ma:
ż wyraznie zaznaczone maksimum
ż zbliżony jest do symetrycznego
15
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
nD - nD-1
. -
Równanie dłuższej prostej : L(t)= nD-1+ (t-x0D)
h
. -
nD - nD+1
Równanie krótszej prostej: L(t)= nD+ (x0D-t)
h
. -
Punkt przecięcia prostych = dominanta ( D)
. -
x0D- dolna granica dominującego przedziału
. -
nD - licznośd dominującego przedziału
-
nD-1  licznośd przedziału poprzedniego
nD+1 - licznośd przedziału następnego
h - rozpiętośd dominującego przedziału
Dominanta
nD - nD-1
D = x0D + h (*)
(nD - nD-1) + (nD - nD+1)
Wzór (*) można także podad w wersji odpowiadającej
rozkładowi określonemu za pomocą częstości . Ma on
wtedy postad:
wD - wD-1
D = x0D + h
(wD - wD-1) + (wD - wD+1)
wD, wD-1, wD+1 oznaczają odpowiednio częstości względne
przedziałów dominanty, przedziału poprzedniego i
następnego.
3. Kwantyle
Kwantyle są miarami pozycyjnymi. Charakterystyki te
wskazują na położenie rozkładu względem osi liczbowej,
16
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
na której zaznaczono wartości cechy. Kwantylem rzędu p
(0obserwacji ma wartości nie większe od niej .
Kwantyle rzędu p = 1/4 i p=3/4 nazywają się kwartylami.
Oznaczamy je odpowiednioQ1/ 4, Q3 / 4.
Kwantyl rzędu p = nazywa się medianą. Oznaczamy go
literą M.
4. Mediana
W przybliżeniu można powiedzied, że jest to środkowa
wartośd cechy w doświadczeniu. Dzieli ona wartości próbki
na połowy tak, że połowa obserwacji ma wartości nie
większe od niej a druga nie mniejsze.
a) szereg szczegółowy uporządkowana lub szereg
rozdzielczy punktowy
liczebnośd
parzysta
xn / 2 + x(n+2) / 2
M =
2
liczebnośd
M = x(n+1) / 2
Przykład. 1, 3, 5 , 6, 9 ; M= 5
nieparzysta
5 + 6
1, 3, 5 , 6, 9, 10; M = = 5.5
2
17
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
Wyznaczanie mediany w przypadku szeregu rozdzielczego
przedziałowego
Przykład. Czas obsługi klienta w sklepie w min. (przedziału
prawostronnie domknięte)
x0i-x1i ni wi n(xi) = Fn(xi ) =
licz. sk.
czest. sk.
0-4 12 0,24 12 0.24
4-8 16 0.32 28 0.56
8-12 10 0.20 38 0.76
12-16 9 0.18 47 0.94
16-18 3 0.06 50 1
suma 50 1
Zauważmy, że środkowa obserwacja: n/2 = 25, po raz pierwszy
została przekroczona w przedziale (4,8+.
Przyjmujemy następujące (upraszczające) założenie.
(**) Obserwacja w przedziałach są rozłożone równomiernie.
Zatem w przedziale (4,8] obserwacje są w odstępach (8-4)/16 =
0.25
Stąd wynika, że 25 obserwacją jest 13 obserwacją z
przedziału (4,8+, co oznacza, że jest to wielkośd
18
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
M= 4+ (13) (0.25) = 7.25
Ogólny wzór na medianę jest oparty na opisanej metodzie.
W przypadku szeregu rozdzielczego przedziałowego przyjmuje się
następujący wzór na wyznaczanie mediany (M)
n hM

(***) M = x0M + - n(x0M)ł
ę2 ś
nM

gdzie
x0M  dolna granica przedziału , w którym znajduje
się mediana, n(x0M)- licznośd skumulowana do dolnej granicy
przedziału median, hM  rozpiętośd przedziału mediany,
nM  licznośd przedziału mediany, n - liczba zbadanych
jednostek.
Wyznaczanie mediany za pomocą częstości względnych
(dystrybuanty empirycznej) dla cech ciągłej
Ta metoda opiera się na przekształconym wzorze (***).
Jeżeli znamy dystrybuantę empiryczną to mediana jest taką
wartością cechy, która po raz pierwszy przekroczy wartośd
0.5.
Uwagi. Mediana jest miarą tendencji centralnej dla
wartości cechy w próbce -lokuje  środek rozkład  .
Jest niewrażliwa na występowanie  odstających t.zn.
bardzo małych lub bardzo dużych wartości cech.
19
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
5. Kwartyle rzędu 1/4 i . Oznaczamy je odpowiednio
Q1/ 4, Q3 / 4
ż Pierwszy kwartyl Q1/ 4, oznacza, że 25% zbiorowości
przyjmuje wartości nie większe niż Q1/ 4 a 75% nie
mniejsze.
ż Trzeci kwartyl Q3/ 4, oznacza, że 75% zbiorowości
przyjmuje wartości nie większe niż Q3 / 4 a 25% nie
mniejsze.
ż Drugi kwartyl to mediana
Wzory na wielkości kwartyli
ż Dla szeregów punktowych (bez poprawki na parzystośd)
Q1 x(n / 4) ; Q3 (3n / 4)
x
ż Dla szeregów rozdzielczych przedziałowych
hQ1
n

Q1 x(n / 4) x0Q1 + - n(x0Q1 )ł
ę4 ś
nQ1

hQ3
3n

Q3 x(3n / 4) x0Q3 + - n(x0Q3 )ł
ę ś
4 nQ3

gdzie
x0Q1, x0Q3 - Dolne granice przedziałów odpowiednio dla Q1, Q3;
n(x0Q1 ),n(x0Q3 ) - liczebności skumulowane do momentu pojawienia się
odpowiednio przedziału pierwszego i przedziału trzeciego kwartyla;
hQ1, hQ3 - rozpiętości przedziałów odpowiednio pierwszego i trzeciego
kwartyla;
20
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
nQ1,nQ2 licznośd przedziałów odpowiednich kwartyli.
Miary rozproszenia (inne nazwy - miary zróżnicowania,
zmienności, rozrzutu, dyspersji)
1. Rozstęp
Całkowita zmiennośd w wartości cechy w próbie
(wstępna ocena dyspersji, miara pozycyjna)
R= xmax - xmin
xmax  najwyższa wartośd cechy
xmin  najniższa wartośd cechy
Wykres pudełkowy czasu obsługi
xmin Q1 M Q3 xmax
Wykres pudełkowy pozwala różne parametry rozkładu
przedstawid poglądowo.
Wartości cechy w przedziale [Q1,M] są bardziej  zagęszczone niż w
[M,Q3].
2. Wariancja z próby
a) szereg szczegółowy, (n = licznośd próby, k = liczba
wariantów cechy).
n
1
S2 = (xi - x)2 - wartośd średnia sumy

n
i=1
21
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
kwadratów odchyleo od średniej
b) szereg rozdzielczy punktowy
k
1
S2 = (xi - x)2ni

n
i=1
c) szereg rozdzielczy przedziałowy
k
1
&
S2 = (xi - x)2ni

n
i=1
Uproszczona formuła liczenia S2
Po prostych przekształceniach można wykazad , że
k k
1 1
2
S2 = (xi - x)2ni = ( xi ni) - x2

n n
i=1 i=1
3. Odchylenie standardowe
Bezwzględna miara zróżnicowania: S = S2
4. Typowy obszar zmienności wartości cechy w
doświadczeniu
x - s Ł xtyp Ł x + s
Przykład. Komunikat: Średnia temperatura lipca wynosi
170 +_20
Typowy obszar zmienności to przedział *150, 190]
22
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
5. Standaryzowane wartości cechy.
Przy porównywaniu obszarów zmienności kilku cech
wygodnie jest wprowadzid uniwersalny obszar zmienności.
W tym celu przekształcamy wartości cechy:
xi - x
ui =
s
Typowy obszar zmienności dla przekształconych wartości
cechy to
-1Ł ui Ł 1
Przykład zastosowania (slajd)
6. Klasyczny współczynnik zmienności
Względna miara zróżnicowania cechy:
V=S 100%
x
7. Odchylenie dwiartkowe (kwartylowe)
Bezwzględna miara zróżnicowania  rozstęp
uwzględniający 50% środkowych wartości
Q= Q3/4  Q1/4
23
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
Miary skośnośd i spłaszczenia rozkładu
1. Współczynnik skośności Pearsona
Charakteryzuje asymetrię rozkładu przez porównanie
średniej i dominanty
x - D
wpirson=
S
2. Klasyczny współczynnik asymetrii
Charakteryzuje skośnośd rozkłady za pomocą 3
momentu centralnego z próby
m3
Wklasyk=
S3
Niech n = licznośd próby, k = liczba wariantów cechy
a) szereg szczegółowy
n
1
m3 = (xi - x)3

n
i=1
b) szereg rozdzielczy punktowy
k
1
m3 = (xi - x)3ni

n
i=1
c) szereg rozdzielczy przedziałowy (xi = środek
&
przedziału)
k
1
&
(xi - x)3ni
m3 =
n
i=1
24
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
Trzeci moment centralny liczy się jak wariancję zamieniając we wzorze
potęgę drugą na trzecią
3.Pozycyjny współczynnik asymetrii
Współczynnik mierzy skośnośd rozkładu w jego
centralnej części. Definiowany jest za pomocą 1,2 i 3
kwartyla:
(Q3/ 4 - M) - (M - Q1/ 4)
Wpozycyjny=
Q3/ 4 - Q1/ 4
Znak informuje o kierunku skośności (dodatni skośnośd
prawostronna, ujemny lewa), moduł wartości informuje o
sile asymetrii w części centralnej rozkładu.
4. Pudełko z wąsami
min Q1/4 M Q3/4 max
Rysunek przedstawia obrazowo rozkład za pomocą kwartyli:
1,2 i 3 oraz minimalnej i maksymalnej wartości cechy. (Widad, że
rozkład jest lewostronnie skośny).
25
Mat.Statystyka,2013L. Wykład 1 oraz materiał na dwiczenia
Ryszarda Rempała. Materiały dydaktyczne
3. Współczynnik kurtozy (spłaszczenia rozkładu)
Dotyczy jedynie rozkładów symetrycznych. Jest miarą
spłaszczenia rozkładu cechy. Wykorzystuje 4 moment
centralny.
m4
Wkurtoza=
S4
Czwarty moment centralny liczy się tak jak wariancję
wstawiając w miejsce drugiej potęgi potęgę czwartą.
Wyliczony dla rozkładu normalnego współczynnik kurtozy wynosi 3.
Wartośd Wkurtoza porównuje się więc z liczbą 3. Jeśli Wkurtoza< 3
spłaszczenie jest mniejsze od normalnego, jeśli Wkurtoza > 3 skupienie
wartości cechy wokół średniej jest większe niż w rozkładzie
normalnym.
26


Wyszukiwarka

Podobne podstrony:
Mat Stat WykĹ? 2 ( 2013L)
Mat Stat WykĹ? 3 (2013L)(1)
Mat Stat WykĹ 7b Es c d (2013L)
Mat Stat WykĹ 6 7 Est c d (2013L)
Mat Stat WykĹ? 5 Ws Estym ( 2013L)
Mat Stat WykĹ? 4 5a 2013
Mat Stat Wyk 8 PrzedziaĹ y(2013L)
Met mat i stat w inz chem W 1
Met mat i stat w inz chem W 2
Met mat i stat w inz chem W 3
Met mat i stat w inz chem W 5
Met mat i stat w inz chem W 4
Met mat i stat w inz chem W 6
EKON Zast Mat Wykład 8
stat biot wyklady z mat
Przykladowe zadania stat mat
Mat 6 Grawitacja dolny
MAT BUD 6

więcej podobnych podstron