Wzory statystyka matematyczna (1), Socjologia, I rok, Statystyka


JEDNOWYMIAROWE ZMIENNE LOSOWE

ZMIENNA LOSOWA SKOKOWA

ZMIENNA LOSOWA CIĄGŁA

funkcja prawdopodobieństwa:

P(X=xi) = pi0x01 graphic
0,

0x01 graphic

funkcja gęstości:

f(x)0x01 graphic
0 dla x0x01 graphic
,

dystrybuanta:

F(x) = P(Xx) =

dla x0x01 graphic

F(x) = P(Xx) =

=

0x01 graphic
dla x0x01 graphic

prawdopodobieństwo:

P(X=a) = pi0x01 graphic
0

P(ab) = F(b) - F(a)

P(X=a) = 0

P(ab)= F(b) - F(a) =

=

wartość oczekiwana:

EX =

W - zbiór punktów skokowych

EX =

mediana:

0x01 graphic

F(Me) = 0,5

kwantyle rzędu p:

0x01 graphic

0x01 graphic

wariancja:

D2(X)= E(X-EX)2=

=

D2(X)= E(X2) -E(X)2

D2X= E(X-EX)2=

= 0x01 graphic

D2(X)= E(X2) -E(X)2

odchylenie standardowe:

0x01 graphic

moment zwykły

r-tego rzędu:

mr =

moment centralny

r-tego rzędu:

0x01 graphic

współczynnik zmienności:

0x01 graphic

Własności dystrybuanty zmiennej losowej typu skokowego.

Dystrybuanta F(x) zmiennej losowej X typu skokowego posiada następujące własności:

1o P(X=xi)=F(xi)-F(xi-1) gdzie xi ,xi-1 punkty skokowe zmiennej losowej X, gdzie xi-1<xi

2o P(a0x01 graphic
=F(b)-F(a)+P(X=a)

3o P(a<X<b)=F(b)-F(a)-P(X=b)

4o P(a X<b)=F(b)-F(a)+P(X=a)-P(X=b)

5o P(xa)=1-F(a)+P(X=a)

6o P(X>a)=1-F(a)

7o P(X<a)=F(a)-P(X=a)

Własności dystrybuanty zmiennej losowej typu ciągłego.

1o P(a0x01 graphic
= P(a<X<b)= P(a X<b) = F(b)-F(a)

2o P(xa)= P(X>a)=1-F(a)

3o P(X<a)= P(X0x01 graphic
a)=F(a)

DWUWYMIAROWA ZMIENNA LOSOWA SKOKOWA

prawdopodobieństwo: P(X=xi, Y=yj) = pij dla i=1,2,...,k j=1,2,...,r

0x01 graphic

rozkłady brzegowe: 0x01 graphic
dla i=1,2,...,k 0x01 graphic
dla j=1,2,...,r

rozkłady warunkowe: P(X=xi|Y=yj) = 0x01 graphic
P(Y=yj|X=xi) = 0x01 graphic

dystrybuanta: F(x,y) = P(Xx, Yy) dla (x, y)

dystrybuanty rozkładów brzegowych: F1(x) = 0x01 graphic
dla x F2(y) = 0x01 graphic
dla y

dystrybuanty rozkładów warunkowych: F(x|yj) = P(X0x01 graphic
x|Y=yj) = 0x01 graphic

F(y|xi) = P(Y0x01 graphic
y|X=xi) = 0x01 graphic

moment zwykły : mrs = E(XrYs) = 0x01 graphic
dla r,s 0x01 graphic

moment centralny : 0x01 graphic
=0x01 graphic
dla r,s 0x01 graphic

kowariancja: cov(X,Y) =0x01 graphic
= E[(X-EX)(Y-EY)]

0x01 graphic

współczynnik korelacji: 0x01 graphic
0x01 graphic

Jeśli zmienne losowe X i Y są stochastycznie niezależne, to wszystkie rozkłady warunkowe zmiennej losowej X są takie same, a ponadto identyczne z rozkładem brzegowym zmiennej losowej X. To samo można powiedzieć o rozkładach warunkowych zmiennej Y.

Zmienne losowe X i Y są stochastycznie niezależne, jeśli dla każdej pary wskaźników i=1,2,...,k j=1,2,...,r zachodzi: 0x01 graphic
.

Jeśli zmienne losowe X i Y są stochastycznie niezależne, to 0x01 graphic

Jeśli zmienne losowe X i Y są stochastycznie niezależne, to wówczas kowariancja wynosi zero: cov(X,Y)=0.

Warunkiem korelacyjnej niezależności zmiennej losowej X od zmiennej losowej Y jest równość średnich warunkowych rozkładów zmiennej X, natomiast warunkiem korelacyjnej niezależności zmiennej losowej y od zmiennej losowej X jest równość średnich warunkowych rozkładów zmiennej Y. Niezależność korelacyjna jest szczególnym przypadkiem niezależności stochastycznej.

Jeśli zmienne losowe X i Y są stochastycznie niezależne, to są również nieskorelowane. Twierdzenie odwrotne nie jest prawdziwe.

WYBRANE ROZKŁADY ZMIENNEJ LOSOWEJ

I. Rozkłady skokowe

1.Skokowy (dyskretny) rozkład równomierny

xi

x1

x2

. . .

xn

pi

. . .

Parametry rozkładu: E(X)= , D2(X)=

2. Rozkład zerojedynkowy z parametrem p, 0<p<1, gdzie p+q=1.

xi

0

1

pi

q

p

Parametry rozkładu: E(X)=p, D2(X)=pq, =pq(1-2p).

3. Rozkład dwumianowy (Bernoulliego) z parametrami (n,p), n0x01 graphic
N, gdzie q=1-p.

P(k; n,p) =, k=0,1,2,...n.

Parametry rozkładu: E(X)=np, D2(X)=npq, =npq(1-2p).

4. Rozkład Poissona z parametrem , >0.

Funkcja prawdopodobieństwa: pk=P(k; )=0x01 graphic
, k.

Parametry rozkładu: E(X)= , D2(X) =, .

Dla dużych n mamy następujące przybliżenie Poissona rozkładu dwumianowego:

0x01 graphic
, , k.

Przybliżenie to jest do celów praktycznych wystarczająco dokładne gdy: n50, p0,1,      np10.

II. Rozkłady ciągłe

1.Rozkład równomierny (jednostajny, prostokątny):

Funkcja gęstości f(x)= Dystrybuanta: F(x)=

Parametry rozkładu: E(X)=Me=, D2(X)=(b-a)2, dla dowolnego r, dla dowolnego r,brak mody.

2. Rozkład wykładniczy o parametrze .

Funkcja gęstości f(x)= Dystrybuanta: F(x)=

Parametry rozkładu: E(X)= , D2(X)=2, Me=ln2, Do=0.

3. Rozkład normalny (de Moivre'a-Gaussa) o parametrach 0x01 graphic
, przy czym 0x01 graphic

Funkcja gęstości: f(x)= dla x

Rozkład normalny o parametrach oznaczamy symbolem N().

Parametry rozkładu: E(X)=Me=Do=, D2(X)=, dla dowolnego r, współczynnik skupienia K=3, eksces (współczynnik spłaszczenia) 0x01 graphic
.

Jeżeli zmienna losowa X ma rozkład N(), to standaryzowana zmienna losowa U= ma rozkład N(0,1) zwany standaryzowanym rozkładem normalnym.

Funkcja gęstości rozkładu N(0,1):dla u, dystrybuanta

Z symetrii wykresu funkcji gęstości względem osi OY wynika następująca zależność: 1- .

4. Rozkład chi-kwadrat. Niech U1, U2, ... , Uk będą niezależnymi zmiennymi losowymi o standardowym rozkładzie normalnym N(0,1) każda. Rozkład zmiennej losowej będącej sumą ich kwadratów nazywamy rozkładem o k stopniach swobody.

Parametr k rozkładu , zwany liczbą stopni swobody, oznacza liczbę niezależnych składników , które sumujemy.

Parametry rozkładu: E()=k, D2 ()=2k,

Rozkład jest asymetryczny (dodatnia asymetria malejąca za wzrostem liczby stopni swobody k).

Rozkład przy liczbie stopni swobody jest zbieżny do rozkładu normalnego, tzn. gdy .

W praktyce korzysta się dla dużych k z szybszej zbieżności rozkładu zmiennej do rozkładu normalnego N(, czyli - gdy .

5. Rozkład t-Studenta. Niech U będzie zmienną losową o rozkładzie normalnym N(0,1), V zmienną losową o rozkładzie o k stopniach swobody, przy czym zmienne losowe U, V są niezależne. Rozkład zmiennej losowej postaci nazywamy rozkładem t-Studenta o k stopniach swobody.

Parametry rozkładu: E(t)=0 dla k>1, D2(t)= dla k>2, =0, rozkład jednomodalny Mo=0.

6. Rozkład F-Snedecora Niech U, V będą niezależnymi zmiennymi losowymi o rozkładach odpowiednio z k1 oraz k2 stopniami swobody. Rozkład zmiennej losowej nazywamy rozkładem F-Snedecora z k1, k2 stopniami swobody.

Parametry rozkładu: E(F)= dla k2>2 (dla dużych k2 E(F)),  D2(F)= dla k2>4.

ROZKŁADY STATYSTYK Z PRÓBY

1. ROZKŁAD ŚREDNIEJ ARYTMETYCZNEJ Z PRÓBY

1.1. Populacja ma rozkład normalny 0x01 graphic
ze znanym odchyleniem standardowym 0x01 graphic

Średnia arytmetyczna z n-elementowej próby 0x01 graphic
ma rozkład normalny 0x01 graphic
, czyli statystyka 0x01 graphic
ma standardowy rozkład normalny 0x01 graphic
.

1.2. Populacja ma rozkład normalny 0x01 graphic
z nieznanym odchyleniem standardowym 0x01 graphic

Statystyka 0x01 graphic
ma rozkład t-Studenta z n-1 stopniami swobody.

Uwaga: Rozkład t-Studenta z n-1 stopniami swobody ma graniczny standardowy rozkład normalny 0x01 graphic
(w praktyce przyjmujemy n>30).

1.3. Populacja ma dowolny rozkład z parametrami (m,0x01 graphic
) ze znanym odchyleniem standardowym 0x01 graphic
.

Średnia arytmetyczna z n-elementowej próby 0x01 graphic
ma przy 0x01 graphic
graniczny rozkład normalny 0x01 graphic
, czyli statystyka 0x01 graphic
ma standardowy rozkład normalny 0x01 graphic
.

2. ROZKŁAD RÓŻNICY ŚREDNICH ARYTMETYCZNYCH Z PRÓB

DLA DWÓCH POPULACJI NORMALNYCH

2.1. Populacje mają rozkłady normalne 0x01 graphic
oraz 0x01 graphic
ze znanymi odchyleniami standardowymi 0x01 graphic

Niech dane będą dwie populacje normalne 0x01 graphic
i 0x01 graphic
, z których pobiera się próby liczące odpowiednio 0x01 graphic
i 0x01 graphic
elementów. Wówczas statystyka 0x01 graphic
, czyli różnica średnich arytmetycznych z obu prób ma rozkład normalny 0x01 graphic
, czyli statystyka 0x01 graphic
ma standardowy rozkład normalny 0x01 graphic
.

2.2. Populacje mają rozkłady normalne 0x01 graphic
oraz 0x01 graphic
z nieznanymi, ale jednakowymi odchyleniami standardowymi 0x01 graphic

Niech dane będą dwie populacje normalne 0x01 graphic
i 0x01 graphic
o identycznych odchyleniach standardowych (0x01 graphic
), z których pobiera się niezależnie próby liczące odpowiednio 0x01 graphic
i 0x01 graphic
elementów. Dla tych prób wyznaczamy odpowiednio średnie 0x01 graphic
oraz wariancje 0x01 graphic
. Wówczas statystyka postaci: 0x01 graphic
ma rozkład t-Studenta z 0x01 graphic
stopniami swobody.

3. ROZKŁAD WARIANCJI Z PRÓBY DLA POPULACJI NORMALNEJ

3.1. Populacja ma rozkład normalny 0x01 graphic
o nieznanym parametrze m, próba jest mała (n0x01 graphic

Statystyka postaci: 0x01 graphic
ma rozkład 0x01 graphic
(chi-kwadrat) z n-1 stopniami swobody.

3.2. Populacja ma rozkład normalny 0x01 graphic
o nieznanym parametrze m, próba jest duża (n0x01 graphic

Statystyka 0x01 graphic
ma graniczny standardowy rozkład normalny 0x01 graphic
.

4. ROZKŁAD ILORAZU WARIANCJI Z PRÓB DLA DWÓCH POPULACJI NORMALNYCH

Dane są dwie populacje generalne o dwóch niezależnych rozkładach normalnych N(m1,0x01 graphic
), N(m2,0x01 graphic
). Z populacji tych wylosowano dwie próby proste odpowiednio o liczebnościach n1,n2 elementów. Niech 0x01 graphic
(lub 0x01 graphic
, 0x01 graphic
) będą odpowiednio wariancjami z tych prób wówczas statystyka F=0x01 graphic
ma rozkład F-Snedecora o n1-1, n2-1 stopniach swobody. UWAGA!!!!! Numeracja prób powinna być taka, aby 0x01 graphic
>0x01 graphic
.

5. ROZKŁAD WSKAŹNIKA STRUKTURY Z PRÓBY

Populacja generalna ma rozkład dwumianowy z parametrem 0x01 graphic
.

Statystyka 0x01 graphic
jest wskaźnikiem struktury z próby n-elementowej. Jeśli 0x01 graphic
(w praktyce 0x01 graphic
), to statystyka 0x01 graphic
ma graniczny rozkład normalny 0x01 graphic
, czyli statystyka0x01 graphic
ma graniczny standardowy rozkład normalny 0x01 graphic
.

6. ROZKŁAD RÓŻNICY DWÓCH WSKAŹNIKÓW STRUKTURY Z PRÓBY

Badane są dwie populacje generalne o rozkładzie dwumianowym: z parametrem 0x01 graphic
oraz z parametrem 0x01 graphic
.

Statystyka 0x01 graphic
jest różnicą wskaźników struktury z prób 0x01 graphic
-elementowej z pierwszej populacji i 0x01 graphic
-elementowej z drugiej populacji. Statystyka 0x01 graphic
ma przy 0x01 graphic
i 0x01 graphic
(w praktyce 0x01 graphic
i 0x01 graphic
), graniczny rozkład normalny 0x01 graphic
, czyli statystyka 0x01 graphic
ma graniczny standardowy rozkład normalny 0x01 graphic
.

PRZEDZIAŁY UFNOŚCI

1. Przedział ufności dla wartości średniej m w populacji normalnej ze znanym odchyleniem standardowym

0x01 graphic

2. Przedział ufności dla wartości średniej m w populacji normalnej z nieznanym odchyleniem standardowym

0x01 graphic

3. Przedział ufności dla wartości średniej m w populacji o nieznanym rozkładzie (duża próba)

0x01 graphic
, można przyjąć 0x01 graphic

4. Przedział ufności dla wariancji 0x01 graphic
w populacji normalnej

0x01 graphic
, a stąd

przedział ufności dla odchylenia standardowego 0x01 graphic
w populacji normalnej

0x01 graphic

5. Przedział ufności dla odchylenia standardowego 0x01 graphic
w populacji o nieznanym rozkładzie (duża próba)

0x01 graphic

przedział ufności dla wariancji 0x01 graphic
w populacji o nieznanym rozkładzie (duża próba)

0x01 graphic

6. Przedział ufności dla parametru p (wskaźnika struktury, inaczej frakcji) w rozkładzie dwumianowym

0x01 graphic

MINIMALNA LICZEBNOŚĆ PRÓBY

1. Minimalna liczebność próby przy szacowaniu wartości średniej m w populacji normalnej ze znanym odchyleniem standardowym 0x01 graphic
, d - maksymalny błąd szacunku czyli połowa długości przedziału ufności

2. Minimalna liczebność próby przy szacowaniu wartości średniej m w populacji normalnej z nieznanym odchyleniem standardowym 0x01 graphic
, d - maksymalny błąd szacunku czyli połowa długości przedziału ufności;

0x01 graphic
- liczebność próby wstępnej; 0x01 graphic
- wariancja w próbie wstępnej o liczebności 0x01 graphic

3. Minimalna liczebność próby przy szacowaniu parametru p (wskaźnika struktury, inaczej frakcji) w rozkładzie dwumianowym 0x01 graphic
, d - maksymalny błąd szacunku czyli połowa długości przedziału ufności

0x01 graphic
- wskaźnik struktury z badania pilotażowego

Jeśli nie mamy żadnych informacji o wielkości wskaźnika struktury z badania pilotażowego, to w miejsce 0x01 graphic
wstawiamy liczbę 0,5 i wówczas 0x01 graphic

PARAMETRYCZNE TESTY ISTOTNOŚCI

HIPOTEZA

CECHY CHARAKTERYSTYCZNE

STATYSTYKA

TABLICE STATYSTYCZNE

OBSZAR KRYTYCZNY

Test istotności dla wartości średniej

Ho:m=m0

HA:m0x01 graphic
m0

Populacja generalna ma rozkład normalny 0x01 graphic
, 0x01 graphic
jest znane.

0x01 graphic

0x01 graphic

OK=0x01 graphic

Ho: m=m0

HA:m<m0

OK=0x01 graphic

Ho:m=m0

HA:m>m0

OK=0x01 graphic

Ho:m=m0

HA:m0x01 graphic
m0

Populacja generalna ma dowolny rozkład, 0x01 graphic
jest znane, n>120

0x01 graphic

0x01 graphic

OK=0x01 graphic

Ho: m=m0

HA:m<m0

OK=0x01 graphic

Ho:m=m0

HA:m>m0

OK=0x01 graphic

Ho:m=m0

HA:m0x01 graphic
m0

Populacja generalna ma rozkład normalny 0x01 graphic
, 0x01 graphic
jest nieznane, n>30

0x01 graphic

0x01 graphic

OK=0x01 graphic

Ho: m=m0

HA:m<m0

OK=0x01 graphic

Ho:m=m0

HA:m>m0

OK=0x01 graphic

Ho:m=m0

HA:m0x01 graphic
m0

Populacja generalna ma dowolny rozkład,

0x01 graphic
jest nieznane, n>120

0x01 graphic

0x01 graphic

OK=0x01 graphic

Ho: m=m0

HA:m<m0

OK=0x01 graphic

Ho:m=m0

HA:m>m0

OK=0x01 graphic

Ho:m=m0

HA:m0x01 graphic
m0

Populacja generalna ma rozkład normalny 0x01 graphic
, 0x01 graphic
jest nieznane,

n0x01 graphic
30

0x01 graphic

lub0x01 graphic

0x01 graphic

OK=0x01 graphic

Ho: m=m0

HA:m<m0

OK=0x01 graphic

Ho:m=m0

HA:m>m0

OK=0x01 graphic

Test istotności dla dwóch wartości średnich

Ho:m1=m2

HA:m10x01 graphic
m2

Obie porównywalne populacje mają rozkłady normalne 0x01 graphic
,0x01 graphic

0x01 graphic
, 0x01 graphic
znane

0x01 graphic

0x01 graphic

OK=0x01 graphic

Ho: m1=m2

HA:m1<m2

OK=0x01 graphic

Ho:m1=m2

HA:m1>m2

OK=0x01 graphic

Ho:m1=m2

HA:m10x01 graphic
m2

Obie porównywalne populacje mają rozkłady normalne 0x01 graphic
,0x01 graphic

0x01 graphic
, 0x01 graphic
nieznane, próby duże n1+n2-2>30

0x01 graphic

0x01 graphic

OK=0x01 graphic

Ho: m1=m2

HA:m1<m2

OK=0x01 graphic

Ho:m1=m2

HA:m1>m2

OK=0x01 graphic

Ho:m1=m2

HA:m10x01 graphic
m2

Obie porównywalne populacje mają rozkłady normalne0x01 graphic
,0x01 graphic
,0x01 graphic
=0x01 graphic
ale nieznane, n1+n2 -20x01 graphic
30

0x01 graphic

0x01 graphic

OK=0x01 graphic

Ho: m1=m2

HA:m1<m2

OK=0x01 graphic

Ho:m1=m2

HA:m1>m2

OK=0x01 graphic

Test istotności dla wariancji

Ho:0x01 graphic
=0x01 graphic

HA:0x01 graphic
> 0x01 graphic

Populacja generalna ma rozkład normalny 0x01 graphic
, 0x01 graphic
jest nieznane, n0x01 graphic
30

0x01 graphic

0x01 graphic

0x01 graphic

OK=0x01 graphic

Ho:0x01 graphic
=0x01 graphic

HA:0x01 graphic
> 0x01 graphic

Populacja generalna ma rozkład normalny 0x01 graphic
, 0x01 graphic
jest nieznane, n>30

0x01 graphic

gdzie

0x01 graphic

0x01 graphic

OK=0x01 graphic

Test istotności dla dwóch wariancji

Ho:0x01 graphic
=0x01 graphic

HA:0x01 graphic
>0x01 graphic

Dwie populacje o rozkładach normalnych

0x01 graphic
0x01 graphic
,0x01 graphic
0x01 graphic
nieznane

0x01 graphic

0x01 graphic

OK.=0x01 graphic

Uwaga! Przyjmujemy taką numerację obu populacji, aby 0x01 graphic

Test istotności dla wskaźnika struktury

Ho:p=p0

HA:p0x01 graphic
p0

Populacja generalna ma rozkład zerojedynkowy z parametrem p (wskaźnik struktury), n0x01 graphic
100

0x01 graphic

0x01 graphic

OK=0x01 graphic

Ho: p=p0

HA:p<p0

OK=0x01 graphic

Ho:p=p0

HA:p>p0

OK=0x01 graphic

Test istotności dla dwóch wskaźników struktury

Ho:p1=p2

HA:p10x01 graphic
p2

Dwie populacje generalne o rozkładach zerojedynkowych z parametrami p1,p2 (wskaźniki struktury), duże próby n1, n20x01 graphic
100

0x01 graphic

0x01 graphic

OK=0x01 graphic

Ho: p1=p2

HA:p1<p2

OK=0x01 graphic

Ho:p1=p2

HA:p1>p2

OK=0x01 graphic

gdzie: 0x01 graphic
, 0x01 graphic
, 0x01 graphic
, 0x01 graphic
, 0x01 graphic
.

1



Wyszukiwarka

Podobne podstrony:
Wykład 3- Teoria prawdopodobieństwa i statystyki matematycznej, socjologia, statystyka
wzory statystyczne, statystyka matematyczna(1)
wzory statystyka matematyczna
wzory statystyka matematyczna, UWM Olsztyn - MSU Zarządzanie, Statystyka matematyczna
Wzory statystyka Matematyczna 2
Wzory statystyka
Wzory statystyka
wzory statystyka
Wzory statystyka
Statystyka - podstawowe wzory, Statystyka wzory
Wzory, Statystyka
wzory statystyka(1), notatki, III semestr
Wzory statystyczne - analiza, korelacja, prawdopodobieństo
Wzory Statystyka z opisem
ANALIZA KORELACJI I REGRESJI-wzory, Statystyka, statystyka(3)

więcej podobnych podstron