dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 1
• Dokończenie Wykładu 1. Podstawy rachunku prawdopodobieństwa (str. 21 – 30) 2. Zmienna losowa i jej charakterystyki
• Prawie wszystkie wielkości, z którymi mamy do czynienia na co dzień, mają (mniej lub bardziej) charakter losowy, np. wzrost pierwszej osoby spotkanej po wyjściu z domu, ocena otrzymana na najbliższym egzaminie, cena kostki masła w najbliższym
sklepie.
• Zdarzeniom losowym często przyporządkujemy pewne wielkości liczbowe, które charakteryzują interesujące nas cechy tych zdarzeń.
• Np. zdarzeniem losowym w grze w totolotka jest trafienie szóstki, piątki, czwórki lub trójki. Z takim trafieniem jest związana pewna nagroda pieniężna, a więc
pewna wielkość liczbowa.
• Jeśli rzucamy monetą tak długo, aż pojawi się orzeł, to liczba wykonanych rzutów jest wielkością liczbową przyporządkowaną zdarzeniu losowemu.
• Te wielkości liczbowe nazywają się zmiennymi losowymi.
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 2
• Zmienne losowe to funkcje o wartościach rzeczywistych określone na przestrzeni zdarzeń elementarnych.
• Jednak musimy nałożyć pewne ograniczenia na te funkcje. Spowodowane jest to tym, że chcemy mieć możliwość mówienia o prawdopodobieństwie tego, że zmienna losowa przyjmuje wartość należącą do danego podzbioru zbioru liczb rzeczywistych
o stosunkowo prostej budowie, np. do przedziału.
• Podamy teraz formalną definicję zmiennej losowej.
Definicja 2.1.
Niech (Ω , Α , P) będzie dowolną przestrzenią probabilistyczną. Funkcję X : R ,
określoną na przestrzeni zdarzeń elementarnych o wartościach w zbiorze liczb rzeczywistych R , nazywamy zmienną losową, jeżeli jest funkcją mierzalną względem σ-ciała Α , tj. jeżeli dla każdej liczby rzeczywistej c {ω∈Ω: X (ω)< c}∈Α .
• Zauważmy, że jeżeli przestrzeń zdarzeń elementarnych jest zbiorem co najwyżej przeliczalnym (np. skończonym), to każda funkcja X : R , która każdemu zdarzeniu elementarnemu ∈ przyporządkowuje liczbę rzeczywistą X ∈ R , jest zmienną losową.
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 3
• W teorii prawdopodobieństwa zwyczajowo (w niektórych przypadkach) opuszcza się
argument i symbolem X oznacza się zarówno wartość funkcji X , jak i samą funkcję X . Podobnie wyrażenie { X = x } jest skróconym zapisem zbioru
{∈ : X = x } .
• Każdej zmiennej losowej odpowiada
funkcja rozkładu, określająca
prawdopodobieństwa występowania poszczególnych wartości zmiennej.
• Zmienne losowe dzielimy (m.in.) na:
• dyskretne (skokowe),
• ciągłe (absolutnie ciągłe).
• Zmienna losowa dyskretna X ma skończony lub przeliczalny zbiór wartości x , x ,
, p ,
1
2 , przy czym prawdopodobieństwa p 1
2 , przyjmowania przez
zmienną losową X wartości x , x ,
1
2 , spełniają warunki: 0< pi⩽1 , i=1, 2,
i p 1 p 2=1 .
• Oczywiście zmienna losowa dyskretna może mieć co najwyżej tyle wartości, ile elementów liczy zbiór zdarzeń elementarnych, na którym jest ona określona.
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 4
• Rozkład zmiennej losowej dyskretnej X zapisujemy najczęściej w postaci tabelki: x
x
x
i
1
2
xn
p
p
p
i
1
2
pn
lub w postaci: P X = xi= pi , i=1,2, .
Przykład 2.1.
Weźmy pod uwagę prosty eksperyment losowy polegający na trzykrotnym rzucie symetryczną monetą. Przestrzeń zdarzeń elementarnych (przestrzeń prób) składa się z następujących 8 wyników:
ω1=( O ,O ,O)
ω2=( O ,O , R)
ω3=( O , R , O)
ω4=( O , R , R) ω5=( R , O , O) ω6=( R ,O , R) ω7=( R , R ,O) ω8=( R , R , R) W tym przypadku, elementami σ-ciała Α są wszystkie podzbiory zbioru
(wiemy, że tych podzbiorów jest 28=256 ), w tym np. podzbiór odpowiadający zdarzeniu otrzymania dwóch orłów jest równy { ,
,
2 3 5 } ).
W tym przypadku na przestrzeni zdarzeń elementarnych możemy zdefiniować
zmienną losową X określającą całkowitą liczbę orłów w trzech rzutach:
X 1=3 X 2=2 X 3=2 X 4=1
X 5=2 X 6=1 X 7=1 X 8=0
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 5
Zatem zmienna losowa X przyjmuje wartości: 0, 1, 2, 3. Ponadto zakładając, że wszystkie zdarzenia elementarne są jednakowo prawdopodobne (moneta jest symetryczna), otrzymujemy następujący rozkład prawdopodobieństwa zmiennej losowej X :
1
P X =0= P ∈ : X =0= P {8}=8
3
P X =1= P ∈ : X =1= P { ,
,
4 6 7 }= 8
3
P X =2= P ∈ : X =2= P { , ,
2 3 5}= 8
1
P X =3= P ∈ : X =3= P {1}=8
W postaci tabelki:
xi
0
1
2
3
1
3
3
1
pi
8
8
8
8
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 6
• Zmienna losowa ciągła X ma zbiór wartości nieskończony i nieprzeliczalny.
• Najczęściej jest to zbiór wszystkich liczb rzeczywistych lub pewien przedział.
• Zmienna losowa ciągła (absolutnie ciągła) jest reprezentowana przez funkcję gęstości (odpowiednik funkcji rozkładu) f ( x) , która ma następujące własności:
• funkcja gęstości jest funkcją nieujemną ( f x0 , dla każdego x ∈ R ),
• pole pod wykresem funkcji gęstości jest równe 1, co możemy zapisać za pomocą
∞
całki w następujący sposób ∫ f x dx=1 .
−∞
• Zauważmy, że prawdopodobieństwo, że zmienna losowa ciągła przyjmuje określoną
wartość wynosi 0 ( P X = a=0 , a∈ R ) i dlatego dla zmiennych losowych ciągłych wyznaczamy prawdopodobieństwa przedziałowe.
• Prawdopodobieństwo, że zmienna losowa ciągła przyjmuje wartości
z przedziału a , b (( a, b], [ a, b), [ a, b]) jest równe polu pod wykresem funkcji gęstości na tym przedziale.
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 7
Definicja 2.2.
Dystrybuantą (skumulowaną funkcją rozkładu prawdopodobieństwa) zmiennej losowej X nazywamy funkcję F ( F x )zdefiniowaną jako: F x= P X x , x ∈ R
• Dystrybuanta zmiennej losowej X jest jednoznacznie zdefiniowana przez rozkład tej zmiennej losowej.
• Własności dystrybuanty F:
• O F x1 , dla każdego x∈ R
•
F x jest funkcją niemalejącą
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 8
•
F x jest funkcją (co najmniej) prawostronnie ciągłą mającą lewostronne granice
•
lim F x=0 oraz lim F x=1
x −∞
x ∞
• Dla zmiennych losowych dyskretnych
F x= P X x=∑ P X = x =∑ p i
i ,
x x
x x
i
i
zaś dla zmiennych losowych ciągłych wartość dystrybuanty w punkcie x jest równa polu pod wykresem funkcji gęstości na przedziale −∞ , x , czyli x
F ( x)=∫ f ( t) dt .
−∞
• Dla zmiennej losowej ciągłej prawdziwe są następujące wzory:
b
P a X b= P a X b= P a X b= P a X b=∫ f x dx= F b− F a
a
a
P X a= P X a=∫ f x dx= F a
−∞
∞
P X a= P X a=∫ f x dx=1− F a
a
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 9
• Zmienne losowe mogą być charakteryzowane za pomocą pewnych stałych, które nazywa się parametrami.
Najważniejszymi parametrami (charakterystykami) zmiennych losowych są:
• wartość oczekiwana (wartość
• współczynnik skupienia (kurtoza)
przeciętna, nadzieja matematyczna)
• moda (wartość modalna, dominanta)
• wariancja (dyspersja)
• mediana (wartość środkowa)
• odchylenie standardowe
• kwantyl rzędu p
• współczynnik zmienności
• moment zwykły rzędu k
• współczynnik skośności (asymetrii)
• moment centralny rzędu k
• Wartość oczekiwana (wartość przeciętna, nadzieja matematyczna) EX ( ) wyraża przeciętną wartość zmiennej losowej X .
• Dla zmiennych losowych dyskretnych:
n
∞
EX =∑ x p (lub EX
x p , jeśli tylko E∣ X∣
i
i
=∑ i i
∞ ).
i=1
i=1
∞
• Dla zmiennych losowych ciągłych: EX =∫ xf x dx , jeśli tylko E∣ X∣∞ .
−∞
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 10
• Podstawowe własności wartości oczekiwanej:
E c= c
E X − Y = EX − EY
E aX = aEX
E aX bY = aEX bEY
E X Y = EX EY
E XY = EX⋅ EY , gdy X i Y są niezależne gdzie a , b ,c∈ R
• Wariancja (dyspersja) Var X ( 2 X , D 2 X ) wyraża przeciętny kwadrat odchyleń od wartości oczekiwanej i wraża się wzorem:
Var X = E X − EX 2= E X 2− EX 2
• Dla zmiennych losowych dyskretnych:
n
n
Var X =∑ x
x 2 p
i− EX 2 pi=∑
i
i− EX 2
i=1
i=1
∞
∞
(lub Var X =∑ x
x 2 p
i− EX 2 pi=∑
i
i− EX 2 ).
i=1
i=1
• Dla zmiennych losowych ciągłych:
∞
∞
Var X =∫ x− EX 2 f x dx=∫ x 2 f x dx− EX 2 .
−∞
−∞
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 11
• Podstawowe własności wariancji:
Var c=0
Var X Y = VarX VarY , gdy X i Y są niezależne Var aX = a 2 VarX
Var X − Y = VarX VarY , gdy X i Y są niezależne Var X c= VarX
Var aX bY = a 2 VarX b 2 VarY , gdy X i Y są niezależne gdzie a , b , c∈ R
• Odchylenie standardowe X ( DX , σ ) wyraża przeciętne odchylenie wartości od wartości oczekiwanej i wyraża się wzorem (jest to pierwiastek z wariancji):
X = Var X .
• Współczynnik zmienności V mierzy podobnie jak odchylenie standardowe, zróżnicowanie wartości zmiennej losowej X i wyraża się wzorem:
V
X
=
⋅100 %
EX
• Współczynnik skośności (asymetrii) A , tzw. standaryzowany moment trzeciego stopnia, mierzy skośność rozkładu i wyraża się wzorem:
E X − EX 3
A=
X 3
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 12
• Współczynnik asymetrii przyjmuje:
• wartość 0 dla rozkładów symetrycznych,
• wartości ujemne dla rozkładów o asymetrii lewostronnej (wydłużone lewe ramię rozkładu),
• wartości dodatnie dla rozkładów o asymetrii prawostronnej (wydłużone prawe ramię rozkładu).
• Współczynnik skupienia (kurtoza) K , jest jedną z miar spłaszczenia rozkładu badanej cechy i wyraża się wzorem:
E( X − EX )4
K =
−3
(σ X )4
• Rozkłady prawdopodobieństwa można podzielić ze względu na wartość K na:
• mezokurtyczne – wartość kurtozy wynosi 0, spłaszczenie rozkładu jest podobne do rozkładu normalnego (dla którego wartość kurtozy wynosi dokładnie 0),
• leptokurtyczne – kurtoza jest dodatnia, wartości cechy są bardziej skoncentrowane niż przy rozkładzie normalnym,
• platykurtyczne – kurtoza jest ujemna, wartości cechy są mniej skoncentrowane niż przy rozkładzie normalnym.
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 13
• Modą (wartością modalną, dominantą) Mo dla zmiennej losowej o rozkładzie dyskretnym nazywamy wartość (różną od wartości największej i najmniejszej) o największym prawdopodobieństwie.
• Natomiast dla zmiennej losowej ciągłej moda Mo jest wartością argumentu x, dla którego funkcja gęstości prawdopodobieństwa f x przyjmuje wartość największą.
• Medianą (wartością środkową) zmiennej losowej X nazywamy każdą liczbę Me spełniającą następujące warunki:
1
1
P
1
X Me
i P X Me
(czyli P X Me P X Me ).
2
2
2
• Oczywiście czasami może być cały przedział takich wartości (przedział
mediany).
• Dla zmiennej losowej ciągłej o dystrybuancie F, medianę wyznacza się z równania:
F
1
x= 2
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 14
• Kwantylem rzędu p, 0 p1 , zmiennej losowej X nazywamy liczbę x p , spełniającą następujące warunki:
P X x p p i P X x p1− p (czyli P X x p p P X xp ).
• Dla zmiennej losowej ciągłej o dystrybuancie F, kwantyl rzędu p wyznacza się z równania: F x= p .
= Me
• Oczywiście x 1
.
2
1
• Kwantyle rzędu ,
, 2 , 3
4 4 4 to kwartyle.
1 2 3 4
• Kwantyle rzędu
, , ,
to kwintyle.
5 5 5 5
1
2
9
• Kwantyle rzędu
,
, ,
10 10
10 to decyle.
1
2
99
• Kwantyle rzędu
,
, ,
100 100
100 to percentyyle.
dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 15
• Momentem zwykłym rzędu k zmiennej losowej X nazywamy liczbę (jeśli istnieje):
k= E X k .
• Zauważmy, że 1= EX .
• Momentem centralnym rzędu r zmiennej losowej X nazywamy liczbę (jeśli istnieje):
k= E X − EX k .
• Zauważmy, że 2= E X − EX 2= Var X .
• Zadania (rozwiązania na tablicy)
• Dla zmiennej losowej dyskretnej otrzymanej w przykładzie 2.1. wyznaczyć i narysować jej dystrybuantę oraz obliczyć EX ,VarX , σ X , V , A , K , Mo , Me , x , x ,
1
3
P( X ≤2,5) , P( X >2).
4
4
• Dana jest zmienna losowa X o funkcji gęstości danej wzorem
f ( x)= cx dla x∈[0,2] oraz f ( x)=0 dla pozostałych x.
Wyznaczyć stałą c, a następnie dystrybuantę F(x) oraz obliczyć EX ,VarX , σ X ,V , A , K , Mo , Me , x , x ,
1
3
P( X ≤√2) , P ( X >1) , P (−1< X ≤1,5).
4
4