informatyka II w3


Informatyka II
Chemia biologiczna
Wykład 3 (22.11.2010)
Egzamin końcowy!!!
Postać graficzna wybranych miar położenia
Miary położenia
Miary po
ł
rednie mediana
średnie moda
mediana kwantyle
moda kwantyle
arytmetyczna
arytmetyczna
kwartyl pierwszy
kwartyl pierwszy
kwartyl drugi
kwartyl drugi
harmoniczna
harmoniczna
medialna
medialna
kwartyl trzeci
kwartyl trzeci
geometryczna
geometryczna
decyle
decyle
Wartości
Miary położenia
ekstremalne
Wartości
odstające
kwantyle
kwantyle
+3H
+1.5H
Q1  pierwszy kwartyl
kwartyl pierwszy
H Q2  kwartyl drugi
drugi kwartyl
medialna
medialna
-1.5H
Q3  kwartyl trzeci
-3H
Wartości
H - rozstęp
odstające decyle
międzykwartylny
Wartości
ekstremalne
Warto
ś
ci nieodstaj
ą
ce
Próba X: cena szczepionki przeciw grypie A/H1N1 w wybranych 12 aptekach
23 17 32 60 22 52 29 38 42 92 27 46
Sortowanie:
17 22 23 27 29 32 38 42 46 52 60 92
23 27 32 38 46 52
2
2
2
25 35 49
25% wartości 25% wartości 25% wartości 25% wartości
zbioru próby zbioru próby zbioru próby zbioru próby
Mediana Q2 = 35
Q1 = 25 Q3 = 49
Rozstęp międzykwartylny H
H=Q3-Q1 = 24
Dolna granica Górna granica
wartości nieodstających wartości nieodstających
Q1-1.5*H=25-36 = -11 Q3+1.5*H=49+36 = 85
Rozstęp danych R
R=xmax-xmin = 92-17=75
100
Zakres wartości
nieodstających
Wartość odstająca
92
92 xmax
85
85
+1.5H
80
Q2
Q1 Q3
6
5
60
4
49
Q3
3
40
35
Q2
2
25
Q1
20
1
17
xmin
0
-20 0 20 40 60 80 100
Cena szczepionki
0
-11
-1.5H
Próba X
Rozst
ę
p cen
Zakres warto
ś
ci nieodstaj
ą
cych
Warto
ść
odstaj
ą
ca
Liczba aptek
max
min
x
x
+1.5H
-1.5H
Cena szczepionki
.
. .
.
. .
.
. .
. . .
. . .
. . .
>> boxplot(cena,miasto)
100
90
80
70
60
50
40
30
20
10
Poznań Wrocław Wałbrzych Katowice Opole
Cena
Podstawowym pojęciem rachunku prawdopodobieństwa jest zdarzenie losowe
oraz przestrzeń zdarzeń elementarnych.
Doświadczenie jest zdarzeniem losowym, jeżeli:
może być powtarzane w tych samych warunkach;
jego wynik nie może być przewidziany w sposób pewny;
zbiór wszystkich możliwych wyników jest znany i może być opisany przed
przeprowadzeniem ćwiczenia.
Zbiór wszystkich możliwych wyników zdarzeń losowych nosi nazwę
przestrzeni zdarzeń elementarnych lub przestrzenią próbkową (&! lub S).
Pojedynczy element przestrzeni zdarzeń elementarnych (pojedynczy wynik
doświadczenia losowego) nazywany jest zdarzeniem elementarnym.
Dowolny podzbiór zdarzeń elementarnych nazywamy zdarzeniem A, B, C itd.
&!
&!
&!
&!
B
A
Przykłady:
jednokrotny rzut monetą:  orzeł (O) i  reszka (R) to dwa zdarzenia
elementarne, które budują całą przestrzeń, &! ={O, R}.
rzut dwoma monetami: &! ={(O,O), (O,R), (R,O), (R,R)}.
wybierając dowolna cyfrę z książki telefonicznej:
&! ={0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
rozważając ostatnią cyfrę dowolnej liczby parzystej:
&! ={0, 2, 4, 6, 8}.
czas oczekiwania na taksówkę  zdarzenia elementarne są
dowolnymi liczbami dodatnimi, a przestrzeń jest nieskończona.
Uwaga: Zdarzenia elementarne musza być ekskluzywne  dane
zdarzenie elementarne nie zawiera w sobie innych zdarzeń
elementarnych
Zmienna losowa  dowolna funkcja o wartościach rzeczywistych określona na
przestrzeni zdarzeń elementarnych, która każdemu zdarzeniu elementarnemu
przyporządkowuje liczbę rzeczywistą z określonym prawdopodobieństwem.
Zmienną losową nazywamy dyskretną, gdy przyjmuje wartości ze zbioru
dyskretnego, tzn. skończonego lub przeliczalnego. Dla każdej wartości można
wyznaczyć prawdopodobieństwo jej wystąpienia (np. liczba studentów, liczba
oczek na kostce).
Jeżeli zmienna losowa może przybierać wszystkie wartości z pewnego
przedziału liczbowego, to nazywana jest zmienna losową ciągłą, np. ilość
wody w wiadrze, waga osobnika, temperatura za oknem).
Prawdopodobieństwo zdarzenia A
nx
Klasyczna definicja prawdopodobieństwa: P(x)=
n
liczba zdarzeń elementarnych sprzyjających zdarzeniu x
P(x)=
n liczba wszystkich zdarzeń elementarnych
Liczba wystąpień wartości zmiennej w danej grupie
Względna częstość grupy =
Liczba wystąpień wszystkich wartości zmiennej
Procentowa względna częstość grupy= Względna częstość grupy * 100
>> rozklad
rozklad =
18 19 20 21 22 23 24 25 26 27 28
2 6 4 5 8 3 7 3 6 3 3 Ł50
0.04 0.12 0.08 0.1 0.16 0.06 0.14 0.06 0.12 0.06 0.06 Ł1
4 12 8 10 16 6 14 6 12 6 6 Ł100
Właściwości rachunku prawdopodobieństwa:
Każdemu zdarzeniu losowemu A przypisujemy liczbę P(A), zwana
prawdopodobieństwem tego zdarzenia, która jest nieujemna i mniejsza
bądz równa jedności: 0 d" P(A) d"1.
Prawdopodobieństwo zdarzenia pewnego jest równe jedności: P(&!)=1.
Prawdopodobieństwo zdarzenia niemożliwego jest równe zeru: P(")=1.
Prawdopodobieństwo sumy zdarzeń losowych A oraz B:
jeżeli A)"B= 0, jest równe sumie prawdopodobieństw tych zdarzeń:
&!
&!
&!
&!
P(A*"B) = P(A) + P(B).
B
A
jeżeli A)"B`" 0, jest równe sumie prawdopodobieństw tych zdarzeń minus
prawdopodobieństwo ich iloczynu:
&!
&!
&!
&!
P(A*"B) = P(A) + P(B)  P(A)"B)
A B
Prawdopodobieństwo zdarzenia przeciwnego do zdarzenia A: P()=1-P(A)
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
18 19 20 21 22 23 24 25 26 27 28
Zmienna x - grupa (wiek)
Prawdopodobie
ń
stwo P(x)
Wzgl
ę
dna cz
ę
sto
ść
grupy / liczebno
ść
grupy
Jeżeli X jest dowolną zmienną losową to dla tej zmiennej określana jest
dystrybuanta.
Dystrybuanta - funkcja zmiennej rzeczywistej X równa prawdopodobieństwu,
że zmienna losowa przyjmie wartość nie większą od x.
Jest to więc całka oznaczona od dolnej granicy dziedziny danego rozkładu
prawdopodobieństwa zmiennej losowej (np. minus nieskończoności lub zera)
do X, z funkcji rozkładu prawdopodobieństwa danej zmiennej losowej.
Dla dyskretnej zmiennej losowej wartość F(xi) można obliczyć
przez zsumowanie (skumulowanie) funkcji prawdopodobieństwa dla wartości
nie większych od xi.
F(x)=
)= P(xi)
"
"
d"
d"
xi x
xi x
Skumulowana funkcja prawdopodobieństwa
Cumulative Distribution Function
Przykład
Funkcję dystrybuanty wyznaczamy sumując (kumulując) kolejne wartości P(xi):
xi 2 3 4 5 6 7 8 9
P(xi) 0,000 0,000 0,067 0,200 0,267 0,133 0,233 0,100
F(xi) 0,000 0,000 0,067 0,267 0,534 0,667 0,900 1,000
k
=
F (xk ) P(xi )
"
"
"
"
i=1
1
0.8
0.2
0.6
0.4
0.1
0.2
0
0
2 3 4 5 6 7 8 9
2 3 4 5 6 7 8 9
Zmienna X Zmienna X
F(X)
P(X)
5
4
Czas poświęcony
3
na naukę
2
przed egzaminem
1
z Informatyki II
0
dla próby 20 studentów:
0 10 15 20 30 60 120
Czas (min)
10
0.25
20
15
0.2
0
0.15
15
30
0.1
30
0.05
20
10
0
0 10 15 20 30 60 120
15
Czas (min)
10
1
60
0
0.8
10
30
0.6
20
0.4
120
60
0.2
10
0 20 40 60 80 100 120
120
Czas (min)
Czestosc
P(x)
F(x)
Dla dyskretnej zmiennej losowej X o funkcji prawdopodobieństwa P wartością średnią
(oczekiwaną) nazywamy liczbę
"
"
"
"
X xiP(xi)



E(X)= = "
"
"
"
i=1
Wariancją dyskretnej zmiennej losowej o funkcji prawdopodobieństwa p nazywamy
liczbę
"
"
"
"
X (xi-X)2P(xi)

2

"
V(X)= = "
"
"
i=1
2
x
Odchylenie standardowe  definiuje się jako



x
x
(x- )2*P(x)
X Częstość P(x) F(x) x*P(X)'
0 2 0.1 0.1 0 91.5063
10 5 0.25 0.35 2.5 102.5156
15 3 0.15 0.5 2.25 34.8844
20 3 0.15 0.65 3 15.7594
30 3 0.15 0.8 4.5 0.0094
60 2 0.1 0.9 6 88.5063
120 2 0.1 1 12 805.5063
2
2
2
2
30.25 1138.6875




33.7444
Funkcja gęstości prawdopodobieństwa zmiennej losowej typu ciągłego
nazywamy funkcję f(x), określoną na zbiorze liczb rzeczywistych
o następujących własnościach:
F(x)e"0
b
F(x)dx=P(a+"
a
F(x) gęstość zmiennej losowe X lub gęstość rozkładu
Wartością średnią ciągłej zmiennej losowej o gęstości f nazywamy wielkość
+"
x F(x)dx
E(X) ==



+"
-"
Wariancją ciągłej zmiennej losowej o gęstości f nazywamy wielkość
+"
2



V(X)= = )2F(x)


+"(x-
-"
Dystrybuanta rozkładu zmiennej losowej X
Rozkład zmiennej losowej można opisać dystrybuantą, czyli funkcją
zmiennej losowej X zdefiniowaną następująco
F(x) = P(XDystrybuanta określa prawdopodobieństwo, że zmienna losowa przyjmie
wartość mniejszą niż określone x:
Dystrybuanta jest funkcją:
niemalejącą,
z przedziału [0; 1],
o wartościach lim F(x)=0 oraz lim F(x)=1,
x-" x"
dla której P(a d" xd"b) = F(b)-F(a)
Zmienna losowa X
Powierzchnia pod krzywą f(x) w przedziale [-1:4] jest prawdopodobieństwem,
że zmienna losowa, której rozkład opisuje funkcja f(x) przyjmie wartość między
wartością -1 a 4.
P(x)
Probability Density Function Cumulative Distribution Function
PDF CDF
P(x)
Centralną rolę w rachunku prawdopodobieństwa i
statystyce pełni tak zwany rozkład normalny.
Związane jest z nim słynne twierdzenie nazywane
centralnym twierdzeniem granicznym. Na jego podstawie
można w wielu sytuacjach zakładać, że zmienna losowa,
którą jesteśmy właśnie zainteresowani, ma rozkład
normalny.
Funkcja gęstości w rozkładzie normalnym o postaci:
2
( -
)



1 x
(  -
)=



P x; , exp
Ą  2
 
 
 
2 2
określona dla wszystkich rzeczywistych wartości
zmiennej X.
Rozkład normalny
Rozkład normalny (termin ten został po raz pierwszy użyty przez Galtona, 1889)
posiada funkcję gęstości określoną wzorem:
Dokładny kształt rozkładu normalnego (charakterystyczna "krzywa dzwonowa")
zdefiniowany jest przez funkcję posiadającą jedynie dwa parametry:
wartość średnią i odchylenie standardowe.
Dwuwymiarowy rozkład normalny.
Dwie zmienne podlegają dwuwymiarowemu rozkładowi normalnemu,
jeśli dla każdej wartości jednej zmiennej, odpowiadające wartości drugiej zmiennej
posiadają rozkład normalny.
Funkcja gęstości w rozkładzie normalnym:
jest symetryczna względem prostej x =
w punkcie x = osiąga wartość maksymalną
ramiona funkcji mają punkty przegięcia dla x = - 
oraz x = + 
średnia ( ) jest zarazem modalną i medianą,
kształt funkcji gęstości zależy od wartości parametrów: i .
Parametr decyduje o przesunięciu krzywej,
natomiast parametr  decyduje o  smukłości krzywej.
Funkcja gęstości rozkładu normalnego ma zastosowanie do reguły
 trzech sigma , którą następnie rozwinięto na regułę  sześć sigma 
stosowaną w kontroli jakości
Reguła  trzech sigma - jeżeli zmienna losowa ma rozkład normalny to:
- 68,3 % populacji mieści się w przedziale ( - ; + )
- 95,5 % populacji mieści się w przedziale ( - 2; + 2)
- 99,7 % populacji mieści się w przedziale ( - 3; + 3)
rozstęp
międzykwartylny
H
Q1 Q3
Q1-1.5*H Q3+1.5*H
Mediana
Prawdopodobieństwo w rozkładzie normalnym wyznacza się dla
wartości zmiennej losowej z określonego przedziału
W celu obliczenia prawdopodobieństwa zmiennej X w rozkładzie
normalnym o dowolnej wartości oczekiwanej i odchyleniu
standardowym  dokonuje się standaryzacji.
Standaryzacja polega na sprowadzeniu dowolnego rozkładu
normalnego o danych parametrach i  do rozkładu
standaryzowanego (modelowego) o wartości oczekiwanej = 0
i odchyleniu standardowym  = 1.
Przykładowe rozkłady funkcji gęstości dla danych i 
N(0,1)
N(3,1)
0,5
N(0,2)
N(3,2)
0
-4 -3 -2 -1 0 1 2 3 4
Wykres dystrybuanty rozkładu normalnego
1,2
N (0,1)
1
N (3,1)
N (0,2)
0,8
N (3,2)
0,6
0,4
0,2
0
-4 -3 -2 -1 0 1 2 3 4
-0,2
>> disttool
Przykład:
Wzrost kobiet w pewnej populacji ma rozkład normalny
N(165,15). Oznacza to, iż zmienna losowa jaką jest wzrost
kobiet ma rozkład normalny ze średnią równa165 cm
i odchyleniem standardowym równym 15 cm.
Jaki jest udział w populacji kobiet o wzroscie:
a) do 160 cm,
Zmienną losową X zastępujemy
zmienną standaryzowaną u, która ma rozkład N(0,1)
-
x
x
=
u


2
1
1 u2
= -
= -
( )
)
f ; , exp
f u;0,1 exp
Ą
Ą
2
2
2
2
u = zmienna standaryzowana
Zatem:
- -
ł
a
ł ł
P(a - F
 
ł ł
Wartości dystrybuanty standaryzowanego rozkładu
normalnego  wartości te zostały stablicowane
Wzrost studentów ma rozkład N(175; 5). Odpowiedz, jakie jest
prawdopodobieństwo, że spotkamy studenta o wzroście:
a. dokładnie 180 cm
b. niższym niż 180 cm
c. wyższym niż 180 cm
d. w granicach pomiędzy 172,5 i 182,5 cm
e. w granicach pomiędzy 180 i 182,5 cm
ł
ł
ł
ł
ł
ł


Wyszukiwarka

Podobne podstrony:
informatyka ii w1
STEROWANIE DOSTĘPEM DO SYSTEMU INFORMATYCZNEGO II
informator ii 1
informatyka II w5
Zagadnienia do zaliczenia przedmiotu Informatyka II
informatyka II w1
informatyka excel 2007 pl leksykon kieszonkowy wydanie ii curt frye ebook
informatyka internet ilustrowany przewodnik wydanie ii radoslaw sokol ebook
Tłumaczenia (80) Informacji Renault Scenic II
Baptystyczny Serwis Informacyjny www baptysci pl Prymat Rzymu z perspektywy historycznej (część I
Tłumaczenia Informacji Renault Scenic II(1)
mp informatyka styczeń 2009 II
Tłumaczenia Informacji Renault Scenic II
Zastosowania Informatyki w Medycynie czesc II
Informatyka arkusz rozsz cz II
Informatyka, sem II (lab komputerowe) wszystkie bloki na kolokwium (Więckiewicz)
2015 matura INFORMATYKA poziom rozszerzony TEST II

więcej podobnych podstron