Rozważania statystyczne sa zawsze oparte na pewnej próbie pochodzącej z badanej zbiorowości. Badaną zbiorowość Podstawy statystyki matematycznej
nazywamy populacją. Oczywiście wnioskowanie statystyczne Statystyka ma bardzo długą prehistorię, ale dość krótką historię.
oparte jest na pewnych obserwacjach, które dokonuje się na Początki sięgają 2000 lat p.n.e, kiedy w Chinach sporządzano spisy wybranych elementach z populacji.
ludności. W dzisiejszych czasch statystyka jest dziedziną Definicja
matematyki, którą łączy się z rachunkiem prawdopodobieństwa, Próbą nazywamy wybrane elementy z populacji, co możemy bowiem wykorzystuje się w niej teorię rachunku
rozumieć jako układ liczb X 1 , . . . Xn lub innych charakterystyk prawdopodobieństwa. Jak zatem można zdefiniować pojęcie badanej cechy. Liczbę n nazywamy liczebnością próbki.
statystyki nazywanej również wnioskowaniem statystycznym.
Na podstawie próby statystyk wnosi hipotezę dotyczącą całej Definicja
populacji, dlatego należy zadbać o to by próba była Statystyka matematyczna jest dziedziną matematyki zajmującą się reprezentatywna.
wnioskowaniem i wyprowadzaniem stwierdzeń oraz sądów w Definicja
zakresie zdarzeń losowych.
Próba losową nazywamy prostą jeżeli tworzy ją n elementowy ciąg niezależnych zmiennych losowych X 1 , X 2 , ..., Xn o jednakowym rozkładzie.
Uporządkowanie próby
Zadania statystyki
Rozróżniamy małe próby n ¬ 30 i próby duże n > 30. Jeżeli Statystyka zajmuje się:
próba jest duża to najczęściej przedstawiamy ją w postaci szeregu rozdzielczego. W zależności od badanej cechy tworzymy 1. porządkowaniem danego materiału - porządkowaniem dwa rodzaje szeregów rozdzielczych:
próby;
• jednostopniowy - jeżeli badana cecha jest typu 2. przedstawieniem graficznym zebranego materiału; dyskretnego;
3. estymacją (wyznaczeniem oszacowań) nieznanych
• wielostopniowy - jeżeli badana cecha jest typu ciągłego parametrów
lub pobrana próbka jest bardzo duża i badana cecha o 4. testowaniem (spawdzaniem) hipotez statystycznych; rozkładzie dyskretnym przyjmuje bardzo dużo wartości 5. badaniem zgodności rozkladu badanej cechy z badanym przez nas rozkładem;
Definicja
6. badaniem zależności między różnymi cechami badanej Rozstępem z próby nazywamy liczbę R obliczoną w następujący populacji i wyznaczanei zależności funkcyjnych.
sposób:
R = max xi − min xi .
1 ¬i ¬n
1 ¬i ¬n
Szereg rozdzielczy dwustopniowy budujemy według następującej Charakterystyki z próby
zasady:
1. Wskaźnik struktury i wskaźnik natężenia
• wyznaczamy liczbę przedziałów klasowych K ; Definicja
• wyznaczamy długość przedziału klasowego h, spełniającą Wskaźnikiem struktury nazywamy liczbę:
warunek R ¬ h
K
n
• wyznaczamy lewostronny koniec pierwszego przedziału z i
fi = n
zależności
α
a 0 = min xi −
,
Najczęściej podajemy w procentach.
1 ¬i ¬n
2
gdzie α jest dokładnością pomiaru.
Definicja
• tworzymy szereg rozdzielczy.
Wskaźnikiem natężenia nazywamy liczbę ni , gdzie n m
i oznacza
i
liczebność pewnej zbiorowości pod względem badanej cechy zaś m Mając dany szereg rozdzielczy możemy zinterpretować dane i
oznacza liczebość innej zbiorowości pod względem cechy.
doświadczenia tworząc histogram lub diagram.
2. Miary położenia
Miary położenia charakteryzują nam wartości badanej cechy.
X
,
gdy n jest nieparzyste
( n+1 )
(a) średnia z próby- najczęściej wykorzystywana miara M
2
e =
X
+ X
( n )
( n )+1
2
2
położenia.
,
gdy n jest parzyste
2
Wyznaczamy ją korzystając z nastepującej zależności: Medianę z szeregu rozdzielczego wyznaczamy zgodnie z wzorem 1 n
− 1
X
( n − P kme
n
X =
x
2
i =1
i ) h
i ,
gdy dane nie są uporządkowane
M
+
,
n
e = xme
n
i =1
me
1 n
gdzie n- liczebność próby, h długość przedziału klasowego, km X
e
X =
xi ni , gdy szereg jest uporządkowany,
numer przedziału mediany, n
- liczebność przedziału mediany.
n
me
i =1
Jeżeli n jest nieparzyste to czasmi zamiast n przyjmujemy n+1 .
2
2
xi - środek przedziału
(c) moda-dominanta.
(b) mediana- wartość środkowa.
Jeżeli pobraliśmy próbę ( x 1 , . . . xn), to modą nazywamy wielkość Jeżeli obraliśmy próbę ( x 1 , . . . xn), tak, że x 1 ¬ x 2 ¬ · · · ¬ xn to mo spełniającą następujące warunki:
medianą nazywamy liczbę:
(d) kwartyle - dolny i górny
c.2. mo 6= max xi
1 ¬i ¬n
Kwartyle wyznaczamy zgodnie z wzorami
c.3. jeśli m 1 , . . . mk oznaczają liczebności odpowiednich wartości k
z
Q
1 , . . . z
1 − 1
k otrzymanych z próby to mo = max zi ( n − P
ni ) h
1 ¬i ¬n
Q
4
i =1
1 = xQ +
,
1
n
Jeżeli dane z próby są przedstawione w szeregu rozdzielczym to Q 1
modę wyznaczamy zgodnie z wzorem:
gdzie xQ -lewy koniec przedziału kwartyla górnego, k - numer 1
Q 1
przedziału Q
- liczebność przedziału Q
n
1, nQ
1.
m − nm
1
m
o
o − 1
o = xm +
h
Analogicznie wyznaczamy kwartyl górny Q
o
n
3, tzn:
m − n
− n
o
mo − 1 + nmo
mo +1
kQ 3 − 1
gdzie x
( 3 n − P
n
m
oznacza lewy konec przedziału mody (przedziałem mody i ) h
o
Q
4
i =1
3 = xQ +
.
nazywamy przedział najbardziej liczny różny od przedziału 3
nQ 3
pierwszego i ostatniego), nm liczebność przedziału mody, h o
-długość przedziału klasowego.
3. Miary rozproszenia
k
Miary rozproszenia wskazują jak rozproszona jest badana cecha.
1 X
S 2 =
( xi − X )2 ni .
(a) odchylenie stadardowe z próby- najczęściej n i=1
wykorzystywana miara rozproszenia.
(b) odchylenie ćwiartkowe
Wyznaczamy je korzystając z następującego wzoru:
Wyznaczamy je z zależności:
v
u
n
ˆ
1
X
S = u
t
( xi − X )2 .
Q 3 − Q 1
n − 1 i=1
2
Liczbę ˆ
S 2 nazywamy wariancją z próby . Jeżeli próba jest dość (c) odchylenie przeciętne
duża n 100 to za odchylenie standardowe przyjmujemy liczbę: Odchylenie przeciętne od mediany wyznaczamy z następującego v
u 1 n
wzoru
X
n
S = u
1
t
( xi − X )2 .
X
n
d 2 =
|xi − me|
i =1
n i=1
Wariancję z próby przedstawionej w szeregu rozdzielczym lub z szergu rozdzielczego
wyznaczamy zgodnie z wzorami:
k
k
1 X
ˆ
1
X
S 2 =
( x
d 2 =
|xi − me|ni .
i − X )2 ni ,
n − 1
n i=1
i =1
Odchylenie przeciętne od średniej wyznaczamy z następującego (b) współczynnik nierównomierności.
wzoru
1 n
Współczynnik zmienności wyznaczamy z następującego wzoru: X
d 1 =
|xi − X |
n i=1
d 1
H =
· 100% .
lub z szergu rozdzielczego
X
1 k
Jego interpretacja jest taka sama jak współczynnika zmienności.
X
d 1 =
|xi − X |ni .
n
(c) współczynnik asymetrii (skośności).
i =1
Współczynnikiem asymetrii nazywamy liczbę
4. Miary skupienia
M 3
(a) współczynnik zmienności.
A =
,
ˆ
S 3
Współczynnik zmienności wyznaczamy z następującego wzoru: gdzie M 3 oznacza trzeci moment centralny z próby.
ˆ
S
V =
.
(d) współczynnik skupienia (kurtoza).
X
Współczynnikiem skupienia nazywamy liczbę
Najczęściej wyrażany jest w % . Przyjmując, że jest < niż 10%
M 4
to zmienność jest nieistotna. Im współczynnik większy to fakt K =
,
ˆ
ten dowodzi o dużym rozrzucie i niejednorodności badanej S 4
cechy.
gdzie M 4 oznacza czwarty moment centralny z próby.
(e) współczynnik spłaszczenia (eksces).
Współczynnikiem spłaszczenia nazywamy liczbę
g = K − 3 .
(f) współczynnik asymetrii Pearsona .
Współczynnikiem asymetrii Pearsona nazywamy liczbę X − mo
Vs =
.
ˆ
S