Statystyka SUM w2

background image

Statystyka II-2

1

Zmienne losowe i ich rozkłady (1)

• Do określenia zmiennej losowej potrzebna jest znajomość

trójki probabilistycznej. Załóżmy, że dana jest przestrzeń

probabilistyczna (E, Z, P). Zmienną losową nazywa się

funkcję rzeczywistą określoną na przestrzeni zdarzeń

elementarnych E i mierzalną względem ciała zdarzeń Z.

Zmienną losową X jest więc funkcja:

X:E R,

która każdemu zdarzeniu elementarnemu e E

przyporządkowuje liczbę rzeczywistą X(e) R.

• Jeżeli zbiór wartości funkcji X, jest przeliczalny, to

zmienna losowa nazywa się zmienną losową dyskretną lub

skokową. Jeśli natomiast funkcja X przyjmuje wartości z

pewnego przedziału liczbowego, nazywamy ją zmienną

losową ciąglą.

• Zmienna losowa może mieć najwyżej tyle wartości, ile

elementów liczy zbiór zdarzeń elementarnych, na którym

jest określona.

background image

Statystyka II-2

2

Zmienne losowe i ich rozkłady (2)

• Każda zmienna losowa jest jednoznacznie

charakteryzowana za pomocą dystrybuanty.

Dystrybuantą zmiennej losowej X jest funkcja

opisana zależnością:

F(x) = P(X < x)

• Własności dystrybuanty:
a) 0  F(x)  1
b)F(x) jest funkcją niemalejącą;
c) F(x) jest funkcją co najmniej lewostronnie ciągłą
d)

Ponadto zmienna losowa skokowa jest

charakteryzowana za pomocą rozkładu, a zmienna

losowa ciągła za pomocą funkcji gęstości.

1

)

(

lim

0

)

(

lim



x

F

oraz

x

F

x

x

background image

Statystyka II-2

3

Funkcja prawdopodobieństwa zmiennej

losowej dyskretnej X

• Funkcję tę definiuje się następująco:

• Jest to zbiór par (x

i

, p

i

), gdzie x

i

są wartościami,

jakie przyjmuje zmienna X, zaś p

i

prawdopodobieństwami występowania tych
wartości. Zachodzi:

Odpowiednikiem funkcji rozkładu dla zmiennej
losowej ciągłej jest funkcja gęstości.

n

i

i

i

i

p

n

i

p

x

X

P

1

1

,

...

,

2

,

1

,

x

x

i

i

p

x

F )

(

background image

Statystyka II-2

4

Funkcja gęstości zmiennej losowej

ciągłej X (1)

• Funkcja gęstości zmiennej losowej ciągłej jest

określona na zbiorze liczb rzeczywistych i spełnia
warunki:

• Dystrybuanta zmiennej losowej ciągłej X jest

definiowana podobnie jak dystrybuanta zmiennej
losowej dyskretnej, przy czym sumowanie zostaje
zastąpione całkowaniem:

• Dystrybuanta zmiennej losowej ciągłej jest funkcją

ciągłą
i spełnia podane wyżej warunki.

1

)

(

0

)

(

dx

x

f

x

f

x

dx

x

f

x

X

P

x

F

)

(

)

(

)

(

background image

Statystyka II-2

5

Funkcja gęstości zmiennej losowej

ciągłej X (2)

• Jeśli gęstość f(x) zmiennej losowej X jest

ciągła, to zachodzi związek:

F’(x) = f(x),

przy czym F’(x) oznacza pochodną
dystrybuanty zmiennej losowej ciągłej.
Ponadto prawdziwe są wzory:

a

a

b

a

a

F

dx

x

f

a

X

P

a

F

dx

x

f

a

X

P

a

F

b

F

dx

x

f

b

X

a

P

b

X

a

P

a

X

P

)

(

1

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

0

)

(

background image

Statystyka II-2

6

Charakterystyki liczbowe rozkładu

• Najważniejszymi parametrami zmiennych

losowych są: wartość oczekiwana i wariancja

zmiennej losowej X. Wartość oczekiwana E(X) —

m jest to wartość, wokół której skupiają się

realizacje zmiennej losowej uzyskiwane w wyniku

wielokrotnie powtarzanego eksperymentu.

Wariancja zmiennej losowej X (ozn. V(X))jest to

miara rozproszenia wartości zmiennej wokół

wartości średniej. Im wariancja jest mniejsza, tym

bardziej wartości zmiennej skupiają się wokół

wartości przeciętnej E(X).

V(X) = E[X – E(X)]

2

V(X) = E(X

2

)E(X)

2

Odchylenie standardowe σ zmiennej losowej

X jest to pierwiastek z jej wariancji

)

(X

V

background image

Statystyka II-2

7

Charakterystyki zmiennej los.

skokowej (1)

• Wartość oczekiwana (przeciętna) zmiennej losowej

skokowej X jest określona wzorami

lub

gdy zmienna X przyjmuje przeliczalnie wiele wartości.

• Wariancja zmiennej losowej skokowej X jest opisana

wzorami:

• Współczynnik zmienności

• Współczynnik skośności

n

i

i

i

p

x

X

E

1

)

(

1

)

(

i

i

i

p

x

X

E

n

i

n

i

i

i

i

i

X

E

p

x

X

V

p

X

E

x

X

V

1

1

2

2

2

)

(

)

(

lub

)

(

)

(

)

(X

E

v

3

3

)

(

i

i

p

X

E

x

A

background image

Statystyka II-2

8

Charakterystyki zmiennej los.

skokowej (2)

• Oprócz przedstawionych wyżej parametrów

klasycznych stosowane są parametry nieklasyczne,

spośród których najważniejsze to:

Mediana Me zmiennej losowej skokowej X – taka

wielkość x, która spełnia własność

P(X x)  1/2 i P(X

x)

1/2

Modalna Mo (dominanta) zmiennej losowej

skokowej X - wartość x, której odpowiada największe

prawdopodobieństwo realizacji.

• Dla zmiennych losowych ciągłych prawdziwe są

definicje:

Mediana zmiennej losowej ciągłej X – to taka

wartość x, dla której F(x) = 1/2.

Modalna zmiennej losowej ciągłej X - to wartość

x, dla której funkcja gęstości f(x) osiąga wartość
maksymalną

.

background image

Statystyka II-2

9

Charakterystyki zmiennej

losowej ciągłej

Wartość oczekiwana E(X) zmiennej losowej

ciągłej jest określona wzorem:

Wariancję zmiennej losowej ciągłej V(X)

oblicza się z dwóch równoważnych wzorów:

gdzie f(x) jest funkcja gęstości zmiennej losowej

ciągłej.

dx

x

xf

X

E

)

(

)

(

2

2

2

)]

(

[

)

(

)

(

)

(

)

(

)

(

X

E

dx

x

f

x

X

V

dx

x

f

X

E

x

X

V

background image

Statystyka II-2

10

Własności wartości oczekiwanej i

wariancji zmiennej losowej

1.

E(C) = C

, gdzie C jest stałą.

2.

E(CX) = C E(X)

3.

E(X - Y) = E(X) - E(Y)

4.

E(X + Y) = E(X) + E(Y)

5.

E(X·Y) = E(X)·E(Y) dla zm. losowych niezależnych

6.

V(C) = 0

7.

V(CX) = C

2

V(X)

8.

V(C+X) = V(X)

9.

V(X + Y) = V(X) + V(Y) dla zm. losowych

niezależnych

10.

V(X - Y) = V(X) + V(Y) dla zm. losowych

niezależnych

background image

Statystyka II-2

11

Rozkład zero-jedynkowy (dyskretny)

• Zmienna losowa ma rozkład zero-jedynkowy, jeżeli jej

funkcja rozkładu określona jest wzorem:

P(X = 1) = p; P(X = 0) = q;

p + q = 1.

• Dystrybuanta rozkładu zero-jedynkowego ma postać:

• Wartość oczekiwana i wariancja zmiennej X

równe:

E(X) = 1·p + 0 ·q

V(X) = 1

2

·p + 0

2

·q – p

2

= p(1 – p) = pq

Przykład: rezultat wielokrotnego rzutu monetą,jeśli

wyrzuceniu orła przyporządkowujemy liczbę 1, a

wyrzuceniu reszki – 0. E(X) = 1/2, V(X) =1/4,

= 1/2.

1

1

1

0

0

0

)

(

x

dla

x

dla

q

x

dla

X

F

background image

Statystyka II-2

12

Rozkład dwumianowy

(dyskretny) (1)

• Zmienna losowa ma rozkład dwumianowy B(n,p)

(binomial-ny, Bernoulliego), jeżeli jej funkcja

rozkładu określona jest wzorem:

B(n, p, k) = P(X = k) = C

nk

p

k

q

n-k

, k = 0,1,2, ..., n;

p+q = 1.

• Dystrybuanta tego rozkładu ma postać:

• Wartość oczekiwana i wariancja zmiennej losowej X o

rozkładzie dwumianowym są odpowiednio równe:

E(X) = np;

V(X) = npq

Funkcja rozkładu dwumianowego zależy od dwóch

paramet-rów: liczby doświadczeń n i

prawdopodobieństwa sukcesu p. Dla p=q=1/2

rozkład jest symetryczny.

x

k

k

n

k

k

n

q

p

C

x

F )

(

background image

Statystyka II-2

13

Rozkład dwumianowy

(dyskretny) (2)

Na rysunku przedstawiono rozkład i dystrybuantę zmiennej losowej X
o rozkładzie dwumianowym (pięciokrotny rzut monetą , X – liczba wyrzu-
conych orłów). E(X)=5·1/2=2,5; V(X)=5·1/2 ·1/2=1,25;  =1,12.

• Zmienna losowa o tym rozkładzie opisuje tzw. eksperyment Bernoulliego (n

niezależnych doświadczeń z prawdopodobieństwem sukcesu p i porażki q;
wynik poprzedni nie ma wpływu na wynik następnego doświadczenia).

background image

Statystyka II-2

14

Rozkład Poissona (dyskretny)

• Zmienna losowa X, która przyjmuje wartości 0, 1, 2, ...

z prawdopodobieństwem określonym wzorem

gdzie m jest stałą dodatnią, nazywa się zmienną o
rozkładzie Poissona. Dystrybuanta zmiennej losowej X:

• Wartość oczekiwana i wariancja tej zmiennej są równe:

E(X) = m,

V(X) = m,

• Rozkładem Poissona można przybliżać rozkład

dwumiano-wy, gdy 1

o

liczba doświadczeń >20; 2

o

np = m

= const
3

o

wartość parametru p jest mniejsza niż 0,2.

,

2

,

1

,

0

!

)

(

k

e

k

m

k

X

P

m

k

x

k

k

m

k

m

e

x

F

!

)

(

m

background image

Statystyka II-2

15

Rozkład geometryczny (dyskretny)

• Zmienna losowa X ma rozkład geometryczny, jeśli jej funkcja

rozkładu jest określona wzorem:

gdzie: p — prawdopodobieństwo sukcesu,

q= 1 - p — prawdopodobieństwo porażki,

k — liczba doświadczeń do pojawienia się pierwszego

sukcesu.

• Dystrybuanta zmiennej losowej X jest określona wzorem:

• Wartość oczekiwana i wariancja są następujące:
E(X) = 1/p

V(X) = q/p

2

.

Ten typ rozkładu, jest także związany z niezależnymi

doświadczeniami i takim samym prawdopodobieństwem sukcesu w

każdym doświadczeniu. Załóżmy, że przeprowadzamy niezależne

doświadczenia o stałym prawdopodobieństwie sukcesu.

Eksperyment trwa tak długo, aż pojawi się pierwszy sukces. Liczba

przeprowadzonych doświadczeń jest zmienną losową o rozkładzie

geometrycznym

...

,

3

,

2

,

1

)

(

1

k

pq

k

X

P

k

x

k

k

pq

x

F

1

)

(

background image

Statystyka II-2

16

Rozkład hipergeometryczny

• Rozpatrzymy eksperyment, w którym prawdopodobieństwo

sukcesu w kolejnych doświadczeniach się zmienia (np.
losowanie bez zwracania). Z populacji liczącej N
elementów pobieramy próbkę n-elementową
(nN). W populacji, z której pobierana jest próbka,

dokładnie R elementów ma wyróżnioną cechę
(wylosowanie takiego elementu uważamy za sukces).
Zmienna losowa, którą jest liczba sukcesów w tak
przeprowadzonym losowaniu, ma rozkład
hipergeometryczny, określony wzorem:

gdzie: N — liczba elementów w populacji, R — liczba
elementów mających interesującą nas cechę, n —
liczebność próbki, k — liczba sukcesów. Wartość
oczekiwana i wariancja zmiennej losowej X:

)

,

min(

,

,

1

,

0

)

(

n

R

k

C

C

C

k

X

P

n

N

k

n

R

N

k

R

N

R

N

q

N

R

p

N

N

n

npq

X

V

N

nR

X

E

;

;

/

1

1

/

1

)

(

;

)

(

background image

Statystyka II-2

17

Rozkład jednostajny w przedziale

<a, b>(1)

• Zmienna losowa X ma rozkład jednostajny w

przedziale <a, b>, jeśli jej funkcja gęstości
jest określona wzorem:

• Dystrybuanta tej zmiennej ma postać

b

x

dla

b

x

a

dla

a

b

a

x

dla

x

f

0

1

0

)

(

b

x

dla

b

x

a

dla

a

b

a

x

a

x

dla

x

F

1

0

)

(

background image

Statystyka II-2

18

Rozkład jednostajny w przedziale

<a, b>(2)

Funkcje gęstości i dystrybuanta rozkładu jednostajnego

Wartość oczekiwana, wariancja i mediana zmiennej

losowej X:

Zmienna ta nie ma modalnej, ponieważ funkcja gęstości

nie ma maximum.

2

12

)

(

2

)

(

2

b

a

Me

a

b

X

V

b

a

X

E

background image

Statystyka II-2

19

Rozkład wykładniczy

• Zmienna losowa X ma rozkład wykładniczy z

parametrem , jeśli jej funkcja gęstości jest

określona wzorem:

• Dystrybuanta tej zmiennej jest następująca:

• Charakterystyki liczbowe zmiennej losowej X

określone wzorami:

0

0

0

)

(

x

dla

e

x

dla

x

f

x

0

1

0

0

)

(

x

dla

e

x

dla

x

F

x

5

,

0

ln

1

)

(

1

)

(

2

Me

X

V

X

E

background image

Statystyka II-2

20

Rozkład normalny (1)

Zmienna losowa X ma rozkład normalny z

parametrami m i σ (co oznaczamy X – N(m, σ)),
jeśli jej funkcja gęstości prawdopodobieństwa jest
określona wzorem:

Dystrybuanta zmiennej losowej X – N(m, σ) jest

równa

Najważniejsze charakterystyki liczbowe:

E(X) = m V(X) = σ

2

Me = m Mo = m

x

dla

e

x

f

m

x

2

2

2

2

1

)

(

t

m

x

t

m

x

dx

e

dx

e

x

F

2

2

2

2

2

2

2

1

2

1

)

(

background image

Statystyka II-2

21

Rozkład normalny (2)

Kształt powyższej funkcji zależy
od wartości dwóch parametrów:
m i

. Funkcja f (x) ma

następujące własności:
Jest symetryczna względem
prostej x = m, co znaczy, że
spełnione jest: P(X > m) = P(X <
m
) = 0,5.
W punkcie x = m osiąga wartość
maksymalną, która wynosi

Prawdopodobieństwo, że
zmienna losowa X przyjmuje
wartości z prze działu [m-3

,

m+3

], jest w przybliżeniu

równe 1 (dokł. 0,9974)

2

1

)

(

m

f

background image

Statystyka II-2

22

Rozkład normalny (3)

• Jeżeli dokonamy przekształcenia zmiennej losowej X :

to otrzymamy standaryzowaną zmienną losową T, której
funkcja gęstości określona jest wzorem:

• Dystrybuanta zmiennej losowej T jest postaci:

lub

Wykorzystuje się fakt, że funkcja f (t) jest symetryczna.
Wartości funkcji

(t) są często podawane w formie

tablic w podręcznikach statystyki.

m

X

T

2

2

2

1

)

(

t

e

t

f

t

t

dt

e

t

F

2

2

2

1

)

(

)

0

(

2

1

)

(

0

2

2

t

T

P

dt

e

t

t

t

background image

Statystyka II-2

23

Nierówność Czebyszewa

• Jeżeli X jest dowolną zmienną losową o wartości

oczekiwanej równej m i skończonej wariancji to
dla każdego >0 jest spełniona nierówność:

• Nierówność tę można także zapisać w postaci:

• Jeżeli nie jest znany rozkład zmiennej losowej, a

chcemy policzyć prawdopodobieństwo, że
pewna zmienna losowa X różni się od swojej
wartości oczekiwanej o pewną stałą, to można
skorzystać z powyższych nierówności.

2

)

(

1

X

V

m

X

P

2

)

(

X

V

m

X

P

background image

Statystyka II-2

24

Rozkład χ

2

(1)

Rozkładem chi-kwadrat (χ

2

) z k stopniami

swobody nazywamy rozkład sumy k
niezależnych zmien-nych losowych X

12

,

X

22

, ..., X

k2

o rozkładzie normalnym, z

wartością oczekiwaną równą zero i
odchyleniem standardowym równym 1.

Rozkład χ

2

dla małych wartości k jest silnie

asymet-ryczny, w miarę wzrostu k coraz
bardziej zbliża się do rozkładu normalnego.
Wartość oczekiwana i wariancja zmiennej
losowej o rozkładzie χ

k2

są następujące:

E

k2

) = k

V

k2

) = 2k

background image

Statystyka II-2

25

Rozkład χ

2

(2)

background image

Statystyka II-2

26

Rozkład χ

2

(3)

Całkowanie gęstości rozkładu chi-kwadrat jest

ucią-żliwe, dlatego też sporządzono tablice, w
których dla określonej liczby stopni swobody k
oraz usta-lonej wartości prawdopodobieństwa α
można od-czytać wartość χ

α2

jest spełniony

warunek
P

k2

 χ

α2

) = α

Dla liczby stopni swobody większej niż 30 korzysta

się z rozkładu zmiennej losowej

Która ma rozkład zbliżony do rozkładu N( ,

1)

2

2

k

1

2 

k

background image

Statystyka II-2

27

Rozkład t-Studenta (1)

Rozkładem t-Studenta z k stopniami swobody

nazywamy rozkład prawdopodobieństwa
zmiennej losowej T

k

określonej następująco:


gdzie T i χ

k2

są niezależnymi zmiennymi

losowymi, T ma rozkład N(0, 1), χ

k2

ma rozkład

chi-kwadrat z k stopniami swobody.

Rozkład Studenta jest stablicowany, przy czym w

tablicach rozkładu dla ustalonej liczby stopni
swobody i ustalonego prawdopodobieństwa α
można odczytać wartość t

α

spełniającą warunek

P(|T

k

|>t

α

) = α

k

T

T

k

k

2

background image

Statystyka II-2

28

Rozkład t-Studenta (2)

• Tablice rozkładu Studenta są budowane dla

k < 30. Dla większej liczby stopni swobody
korzysta się z rozkładu normalnego N(0, 1).

• Rozkład Studenta ma wartość oczekiwaną

dla
k > 1, a wariancję dla k > 2.

Wartość oczekiwana i warian-

cja są odpowiednio równe:
E(T

k

) = 0,

V(T

k

) = k/(k-2).

background image

Statystyka II-2

29

Rozkład Snedecora (1)

• Rozkładem Snedecora ze stopniami swobody

(r

1

, r

2

) nazywa się rozkład

prawdopodobieństwa ilorazu:

r12

, 

r22

są niezależnymi zmiennymi losowymi

o rozkładach chi-kwadrat o r

1

i r

2

stopniach

swobody. Wartość oczekiwana i wariancja zm.
losowej są równe:

2

2

2

1

,

2

1

2

1

1

1

r

r

r

r

r

r

F

 

4

2

2

2

)

(

2

)

(

2

2

2

1

2

1

2

2

,

2

2

,

2

1

2

1

r

r

r

r

r

r

F

V

r

r

F

E

r

r

r

r

background image

Statystyka II-2

30

Rozkład Snedecora (2)

• Rozkład Snedecora jest stablicowany w taki sposób,

że dla danych wartości prawdopodobieństw (na ogół

 =0,01;

 =0,05) i ustalonej liczby stopni swobody licznika m

i mianownika n podana jest wartość f

spełniająca

zależność P(F

r1,r2

f

) = .


Document Outline


Wyszukiwarka

Podobne podstrony:
Statystyka SUM w4
zestaw zadań statystyka SUM GiG (1)
Statystyka SUM w1
zestaw zadań statystyka SUM GiG
Statystyka SUM w4
Statystyka SUM w4
ściąga statystyka, MEDYCYNA - ŚUM Katowice, I ROK, Biofizyka
Przykładowe pytania ze statystyki (1), ochrona środowiska UJ, I semestr SUM, statystyka
1-14, ochrona środowiska UJ, I semestr SUM, statystyka
statystyka Liszka 2003, Prywatne, 1 SUM, Statystyka
statystyka w2, Studia, Statystyka
statystyka 2014 I termin, ochrona środowiska UJ, I semestr SUM, statystyka
ściąga statystyka, MEDYCYNA - ŚUM Katowice, I ROK, Biofizyka
Psycholgia wychowawcza W2
statystyka 3
SP dzienni w2
w2 klasy(1)

więcej podobnych podstron