rozklad zmiennej losowe metodologia wyk2


Rozkład zmiennej losowej.
Ze względu na problem ciągłości, rozkład dyskretnej zmiennej
definiuje się zupełnie inaczej niż rozkład zmiennej ciągłej
Rozkład dyskretnej zmiennej losowej to zbiór
par (wartość zmiennej, prawdopodobieństwo
jej uzyskania), czyli zbiór par {(Xi, pi)}
Dla wyników rzutu kostką (zmienna losowa -
liczba oczek na górnej ściance)
1
{(1, ), (2, 1 ), (3, 1 ), (4, 1 ), (5, 1 ), (6, 1 )}
6 6 6 6 6 6
Rozkład dyskretnej zmiennej losowej na wykresie
Wyniki 34 losowao lotto od 1 stycznia do 20 marca 2010 
dlaczego nie jest to poprawny wykres zmiennej losowej?
Histogram Zmn2
Arkusz1 10v*205c
10
9
8
7
6
5
4
3
2
1
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48
Zmn2
Liczba obs.
Tu wstawimy poprawny wykres zmiennej losowej  rzucamy dwoma monetami i jako
wartości zmiennej podajemy liczbę orłów
Histogram skumulowany  100 osób odpowiada na pytanie Czy lubisz statystykę,
odpowiedzi sÄ… kodowane w skali od 1 do 5
120
100
80
60
40
20
0
0 1 2 3 4 5
Czy lubisz statystykÄ™
Liczebności
Jeżeli na osi OY zamiast liczebności przedstawi się prawdopodobieostwo wtedy z
histogramu skumulowanego powstanie dystrybuanta czyli wykres par, gdzie dla
każdego x podana jest wartośd
P(X x)
120
100
80
60
40
20
0
0 1 2 3 4 5
Czy lubisz statystykÄ™
było 100 osób badanych
Prawdopodobieństwo - liczby te należy podzielić przez 100, bo
Dystrybuanta zmiennej losowej
Gdyby pomiar był dokładniejszy  to wtedy słupki histogramu byłyby dużo gęstsze
Histogram Zmn1
Arkusz1 10v*100c
120
100
80
60
40
20
0
0,49 1,40 1,81 2,12 2,52 2,74 2,90 3,06 3,21 3,47 3,66 3,90 4,29
Zmn1
Liczba obs.
Jeżeli zmienna losowa ma charakter ciągły to nie można określid
prawdopodobieostwa wartości w jednym punkcie, ale można
określid prawdopodobieostwo dla danego przedziału.
Jeżeli będzie się te przedziały zmniejszad coraz bardziej, pomiar
będzie coraz bardziej dokładny.
Ostatecznie można zmniejszyd przedziały do minimum, czyli
prawie do zera (wielkośd przedziału dąży do zera)
Jeżeli jednak, na koocu zagęszczania okaże się, że przedział jest
wielkości zero to wtedy nie można obliczyd prawdopodobieostwa
dla takiego przedziału
To co, jest wynikiem tego coraz dokładniejszego dzielenia
przedziałów to gęstośd prawdopodobieostwa
W przypadku ciągłej zmiennej losowej wartości
prawdopodobieostwa na osi OY można podad jedynie dla
wykresu dystrybuanty
Odpowiednikiem wykresu rozkładu prawdopodobieostwa jest
wykres  gęstości prawdopodobieostwa czyli wykres
przetworzonej dystrybuanty, w którym obliczono
prawdopodobieostwa dla przedziałów nieskooczenie małych
Rozkład ciągłej zmiennej losow ej - Iloraz Inteligencji Dystrybuanta
1,0
0,028
0,026
0,024
0,8
0,022
0,020
0,018
0,6
0,016
0,014
0,012
0,4
0,010
0,008
0,006
0,2
0,004
0,002
0,000 0,0
70 80 90 100 110 120 130 70 80 90 100 110 120 130
Wartości w teści Weschlera
Funkcja gęstości prawdopodobieństwa
Prawdopodobieostwo w ciągłym rozkładzie zmiennej losowej 
to pole powierzchni pod tym rozkładem ograniczone przez dwie
proste prostopadłe do OX przechodzące przez granice obszaru,
dla którego wyznacza się prawdopodobieostwo
Uwaga  właśnie dlatego pomiar ciągłym zmiennych losowych
ma zawsze charakter przedziałowy (przykład  długośd wykładu)
0,40
0,35
0,30
0,25
0,20
0,15
0,10
p(XC)
0,05
0,00
-2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0
A B C
Gęstość prawdopodobieństwa
Rozkład zmiennej losowej może byd empiryczny
-czyli rozkład wyników eksperymentu
lub teoretyczny
-czyli rozkład zgodny z zasadami rachunku
prawdopodobieostwa
przykłady: rzuty monetą, kostką, wyniki lotto, iloraz inteligencji,
itd
Kształt teoretycznego rozkładu zmiennej losowej zależy
od parametrów tego rozkładu
Niektóre rozkłady teoretyczne są na tyle ważne, że uzyskały swoje
nazwy
Rozkład dwumianowy
Rozkład różnych liczb sukcesów
Prawdopodobieostwo sukcesu w jednej próbie  0,5
 kształt zależy od: Liczby prób
Liczba prób jest jedynym parametrem tego rozkładu
Przykład: Rzut 10 monetami, jeżeli orzeł to 1
Liczba prób  10
Jakie są możliwe wartości liczby sukcesów?
Jak można wykorzystad rozkład dwumianowy w analizie
danych z badao psychologicznych?
Rozkład dwumianowy jest rozkładem błędów w prawie
Webera!
Rozkład dwumianowy  prawdopodobieostwo uzyskania od 0 do 5
orłów w rzucie 5 monetami (można to obliczyd ze specjalnego
wzoru)
Jakie jest prawdopodobieostwo, że wypadną co najmniej 4
monety?
0,35
0,3125 0,3125
0,3
0,25
0,2
0,15625 0,15625
0,15
0,1
0,05
0,03125 0,03125
0
0 1 2 3 4 5 6
Im większa liczba prób (gdy prawdopodobieostwo sukcesu
p=0,5), tym bardziej rozkład dwumianowy upodabnia się do
rozkładu normalnego
Kiedy rozkład dwumianowy i normalny będą identyczne?
0,20
0,15
0,10
0,05
0,00
20/0 18/2 16/4 14/6 12/8 10/10 8/12 6/14 4/16 2/18 0/20
19/1 17/3 15/5 13/7 11/9 9/11 7/13 5/15 3/17 1/19
Proporcja orłów do reszek w rzucie 20 monetami
Prawdopodobieństwo
Każdy rozkład teoretyczny można opisad wzorem
Wzór  na rozkład dwumianowy:
W rozkładzie dwumianowym p = 0,5
Wzór  na rozkład normalny:
( X x)2
1
2
2
f X e
2
Co oznacza symbol po lewej stronie?
Od czego zależy położenie i kształt rozkładu?
Rozkładów normalnych jest nieskooczenie wiele
Funkcja = =normal(x;0;1)
Funkcja = =Normal(x;2;0,5)
Funkcja = =normal(x;0,5;0,7)
Funkcja = =normal(x;-1;0,3)
1,4
1,2
1,0
0,8
0,6
0,4
0,2
0,0
-3 -2 -1 0 1 2 3
( X x)2
1
2
2
f X e
2
Zdefiniujmy rozkład normalny przy pomocy innej
zmiennej losowej:
-odchylenie od wartości oczekiwanej
dla każdej osoby YM = Y - M
Zmienna  oceny w klasie
Descriptive Statistics
Minimu Maximu Std.
N m m Mean Deviation
Oceny 170 2,00 6,00 3,4353 1,02567
Valid N 170
(listwise)
DescriptiveStatistics
Minimu Maximu Std.
N m m Mean Deviation
Oceny 170 2,00 6,00 3,4353 1,02567
Ocen_minu_średnia_ 170 -1,43 2,57 ,0053 1,02567
całk
Valid N (listwise) 170
Odchylenia od średniej całkowitej i od średnich w grupach na jednym
wykresie
Histogram wiele zmiennych
Arkusz1 10v*170c
60
Grupa 2 minus swoja średnia
Grupa 1 - minus swoja średnia
50
40
30
20
10
Zmn3
0
-1,63 -1,43 -1,15 -0,63 -0,43 -0,15 0,37 0,57 0,85 1,37 1,57 1,85 2,37 2,57
Zmn4
Liczba obs.
Jakie własności ma rozkład normalny?
Czy rozkład normalny jest ważny dlatego, że:
wiele zjawisk empirycznych ma taki rozkład?
Wyniki eksperymentów można porównywad z parametrami
teoretycznych rozkładów?
Rozkład normalny standaryzowany
Wyniki każdego zbioru danych można standaryzowad, czyli
przedstawid w postaci odległości od średniej wyrażonej przy
pomocy odchyleo standardowych
Jak będzie średnia i odchylenie standardowe dla
standaryzowanego rozkładu normalnego?
Standaryzacja to inaczej zamienianie wszystkich wyników
na inne według wzoru:
X X
i
zi
s
zi wartość standaryzowana dla wartości Xi
s odchylenie standardowe
4 grupy po 10 osób odpowiadają na pytanie: Czy lubisz statystykę
Histogramy dla danych surowych (ile wynosi średnia?)
6
5
4
3
2
1
Zmn1
Zmn2
0 Zmn3
-1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5
Zmn4
Liczba obs.
Te same dane  histogramy dla danych standaryzowanych
Ile wynosi średnia?
5
4
3
2
1
Zmn1
Zmn2
0 Zmn3
-3,5 -3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5
Zmn4
Do czego w praktyce może przydad się standaryzacja?
Liczba obs.
Dwa najważniejsze parametry rozkładu zmiennej losowej to:
Wartośd oczekiwana, czyli ogólna wersja średniej arytmetycznej
Jakie własności ma średnia?
Dlaczego zawsze w raporcie badawczym należy podawad średnie?
Rozkład chi kwadrat  to rozkład zmiennej, która jest sumą
podniesionych do kwadratu niezależnych od siebie zmiennych, z
których każda ma rozkład normalny o średniej zero i odchyleniu
standardowym 1
2 2 2 2
Ç2 Z1 Z2 Z3 ... ZN
Rozkład chi kwadrat jest rozkładem ciągłym, a jego kształt
zależy od liczby stopni swobody
Co jest na osi OY?
120
100
80
60
40
20
Wartości Y
Y - M
0
-3 -2 -1 0 1 2 3 4 5 6 7 8 9 10 11
(Y - M)2
Liczba obs.
Rozkład F  to podzielone przez siebie wartości dwóch
zmiennych, które z kolei podzielone są przez swoje
liczby stopni swobody. Parametrami rozkładu F są dwie
wartości stopni swobody
Funkcja gęstości prawdopodobieństwa Dystrybuanta
y = F(x; 10; 5) p = F(x; 10; 5)
1,500 1,0
0,8
1,125
0,6
0,750
0,4
0,375
0,2
0,000 0,0
0 1 2 3 4 0 1 2 3 4
Wzór na wartości rozkładu F
Zmienne Y1 oraz Y2 mają rozkłady chi kwadrat,
czyli wartości tych zmiennych muszą byd sumami
kwadratów przynajmniej dwóch zmiennych (po
standaryzacji, które muszą mied rozkłady normalne
Y1
df1
F
Y2
df2
Do wzoru powrócimy przy analizie wariancji


Wyszukiwarka

Podobne podstrony:
Rozklad zmiennej losowej zadania
3 Zmienne losowe i ich rozkłady
Przekształcenia ciągłe zmiennej losowej
MPiS30 W05d Zmienne losowe II
PiS15 W03 Zmienne losowe II 12
MPiS cw zmienne losowe
03 Wykład 3 Podstawowe rozkłady zmiennych losowychidB24
zmienne losowe22 09 A
MPiS cw dwie zmienne losowe
PiS15 W02k Zmienne losowe I
SM15 W02k Zmienne losowe I
Parametry zmiennej losowej
PiS15 W02d Zmienne losowe I
zmienne losowe
zmienna losowa metodologia wyk 1
PiS15 W03k Zmienne losowe II

więcej podobnych podstron