Opracowywania danych doświadczalnych
I-probabilistyka
Michał K. Urbański,
Wydział Fizyki Politechniki Warszawskiej, pok 127B, murba@if.pw.edu.pl
1
Wstęp do rachunku prawdo-
podobieństwa
Zmienna losowa:
X : Ω → <
(1)
Ω – zbiór zdarzeń elementarnych, < – liczby rzeczywi-
ste.
x = X(ω) – wartość zmiennej losowej dla zdarzenia lo-
sowego ω ∈ Ω.
Zmienna losowa dyskretna – zbiór zdarzeń losowych
jest przeliczalny: Ω = {ω
1
, ω
2
, ..., ω
K
} = {ω
k
}
K
i=1
=
{ω
k
: k = 1, ..., K}
gdzie: K - liczność zbioru zdarzeń elementarnych Ω,
{ω
k
} - skrócony zapis zbioru zdarzeń elementarnych.
Zmienna losowa ciągła - zbiór Ω jest nieskończony i
”ciągły”.
x
k
= X(ω
k
) – realizacja zmiennej losowej – wynik
eksperymentu losowego.
Przykład: rzucamy kości, przestrzeń zdarzeń ele-
mentarnych:
Ω = {bok
1
, bok
2
, bok
3
, bok
4
, bok
5
, bok
6
}
wartosci zmiennej losowej:
x
1
= X(bok
1
) = 1
x
2
= X(bok
2
) = 2
x
3
= X(bok
3
) = 3
x
4
= X(bok
4
) = 4
x
5
= X(bok
5
) = 5
x
6
= X(bok
6
) = 6
Ale wartości zmiennej losowej moga być inne:
x
k
= k
2
+ 3 czyli x
1
= 4 i x
2
= 7 itd...
Eksperyment losowy rzucamy kością N razy i uzysku-
jemy ciąg zdarzeń (realizacji zmiennen losowej X):
y
1
, y
2
, y
3
, ....
Przykład dane empiryczne:
1, 1, 2, 2, 6, 4, 5, 3, 3, 2, 4, 4, 5, 6, 6, 6, 3, 2, 3, 4, 4, 5, ..
w relizacjach zdarzeń losowych liczby mogą sie powta-
rzać.
1.1
Prawdopodobieństwo
Prawdopodobieństwo zdarzenia A opisuje jak często
może zdarzyć się zdarzenie A.
ALE
Prawdopobieństwo opisuje populację - zespół obiektów
(zespół statystyczny).
aksjomatyczna definicja prawdopodbieństwa:
Prawdopodobieństwo P to miara na przestrzeni 2
Ω
wszyskich podzbiorów Ω:
P : 2
Ω
→ [0, 1]
P spełnia własności:
P (Ω) = 1
P (∅) = 0
P (A ∪ B) = P (A) + P (B) jeżeli A ∩ B = ∅
gdzie ∅ zbiór pusty, Ω wszystkie zdarzenia elemen-
tarne.
1.2
Wyznaczanie
prawdopodobień-
stwa:
Model teoretyczny: zakładamy, że wszystki zda-
rzenia elementarne (lub inny zbiór) są jednakowo praw-
dopodobne, wtedy:
P (A) =
A
Ω
(2)
gdzie A - liczność zbioru A, Ω, liczność zbioru ω.
Doświadczenie:
Wykonujemy N razy doświadczenie losowe i spraw-
dzamy ile razy wystąpi zdarzenie A:
P (A) = lim
N →∞
n(A)
N
(3)
n(A) liczba wystapień zdarzenia A.
Dla zdarzeń dyskretnych:
p
k
= P (x
k
) = lim
N →∞
n(x
k
)
N
(4)
gdzie n(x
k
) jest liczbą powtórzeń zdarzenia X = x
k
w
próbie losowej o liczności N .
Histogram
Wykonujemy eksperymenent N razy
Histogram - rozkład częstości występowania zjawiska:
jest to wykres: n(x
k
)
Prawdopodobieństwo empiryczne:
p
k,exp
= P (x
k
) =
n(x
k
)
N
(5)
1
Rysunek 1: histogram prędkości szczura
1.3
Wartość oczekiwana
Wartość oczekiwana
E(X) =
X
k=1,K
x
k
p
k
(6)
x
k
= X(ω
k
) – wartość zmiennej losowej dla zdarzenia
losowego ω ∈ Ω.
Zmienna losowa dyskretna: Ω = {ω
1
, ω
2
, ..., ω
K
} =
{ω
k
}
K
i=1
= {ω
k
: k = 1, ..., K}
K - liczebność zbioru zdarzeń elementarnych Ω,
p
k
prawdopodobieństwo wystąpienia zdarzenia ω
k
:
p
k
= P (X = x
k
)
Wartość średnia z próby losowej.
Próba losowa - wynik powtórzenia eksperymentu:
a) N razy rzucamy kością
b) Rzucamy N kośćmi.
Takie dwa eksperymenty są równoważne jeśli zbiór
obiektów jest powieleniem jednego obiektu.
W badaniach biologicznych i społecznych zakładamy,
że obiektem badań jest cała populacja.
Średnia z próby:
X = x
sr
=
1
N
X
i=1,N
˜
x
i
(7)
gdzie:
e
x
i
wynik i-tego eksperymentu losowego, i-ty po-
miar. {
e
x
i
} - zbiór realizacji zdarzeń losowych.
Suma w 7 jest po zbiorze realizacji.
Średnia z próby losowej jest estymatorem warto-
ści oczekiwanej
1.4
ESTYMATORY
Estymator – sposób na wyliczenie wartości przy-
bliżonej parametru modelu na podstawie danych od-
swiadczlmych.
Jest wiele estymatorów wartości oczekiwanej:
wartość średnia z próby losowej:
X = x
sr
=
1
N
X
i=1,N
˜
x
i
X = x
sr
=
1
2
(˜
x
max
− ˜
x
min
)
(8)
gdzie: ˜
x
i
i–ty wynik eksperymentu,
˜
x
min
– wartość minimalna z danych empirycznych
(próby losowej): ˜
x
min
= min({
e
x
i
})
˜
x
max
– wartość maksymalna z danych empirycznych
(próby losowej): ˜
x
max
= max({
e
x
i
})
Twierdzenie:
X = x
sr
=
K
X
k=1
x
k
˜
p
k
(9)
Gdzie: {x
k
}
k=1,K
- zbiór zdarzeń elementarnych,
Suma we wzorze (9) jest po zbiorze zdarzeń elementar-
nych
Dowód:
x
sr
=
1
N
N
X
i=1
˜
x
i
=
1
N
K
X
k=1
n
k
x
k
=
K
X
k=1
n
k
N
x
k
=
K
X
k=1
˜
p
k
x
k
(10)
gdzie:
P
K
k=1
jest sumą po zdarzeniach elementarnych
(wskaźnik k numeruje zdarzenia elementarne),
P
N
i=1
jest sumą po realizacjach (wskażnik i numeruje
realizacje empiryczne).
˜
p
k
jest
estymatorem
prawdopodobieństwa
(prawdopodbieństwem empirycznym) zdarzenia X =
x
k
˜
p
k
=
n
k
N
(11)
itd
Wartość oczekiwana E(X)
zdefiniowana jest
jako:
E(X) =
K
X
k=1
x
k
p
k
(12)
Wartość oczekiwana jest parametrem modelu pro-
babilistycznego określonego poprzez rozkład prawdo-
podobieństwa :
p
k
= P (X = x
k
) dla k = 1...K.
(13)
w granicy dla nieskończenie dużej próby losowej w wa-
runkach powtarzalności mamy:
E(X) = lim
k→∞
K
X
k=1
x
k
n
k
N
= lim
k→∞
X = lim
k→∞
1
N
N
X
n=1
˜
x
n
(14)
Wartość oczekiwana charakteryzuje model obiektu
Własności wartości oczekiwanej:
E jest operatorem liniowym:
E(X + Y ) = E(X) + E(Y )
E(αX) = αE(X)
Średnia ważona:
x
sr
= X =
N
P
i=1
w
i
x
i
N
P
i=1
w
i
=
N
X
i=1
α
i
x
i
(15)
2
gdzie: w
i
– wagi, i = 1, ..., N .
α
i
=
w
i
N
P
i=1
w
i
mianownik
N
P
i=1
w
i
jest czynnikiem normującym, tak aby
N
P
i=1
α
i
= 1 WYKŁAD 3
Własności wartości oczekiwanej i odchylenia stan-
dardowego.
Przykłady obliczania wartości oczekiwanej:
Wartość średnia rzutu monetą:
p
1
= 0.5 i p
2
= 0.5
ale z czego wartość oczekiwana?
niech:
x
1
= 2zł i x
2
= 10zł
- musimy określić zmienną losową poprzez wartości
liczbowe,
nie można wyliczyć średniej z :”orzeł” i ”reszka”.
E(X) = p
1
x
1
+ p
2
x
2
= 0.5 · 2 + 0.5 · 10 = 6
Drugi przykład: Rzut kością:
załóżmy, że kość jest niedokładnie wykonana prawdo-
podobieństwa różne:
i
p
i
x
i
p
i
= P (x
i
)
1
0.4
1
0.4
2
0.15
10
1.5
3
0.25
5
1.25
4
0.03
25
0.75
5
0.15
8
1.2
6
0.03
95
1.9
P p
i
=
1.0
P(p
i
· x
i
) =
7
(16)
Rozkład ciagły
f (x) - funkcja rozkładu gęstości prawdopodobieństwa:
P (x
1
< X < x
2
) =
x
2
Z
x
1
f (x)dx
(17)
Lub różniczkowo:
dP = f (x)dx
(18)
Warunek unormowania
∞
Z
−∞
f (x)dx = 1
(19)
Przykład
Rozkład równomierny w przedziale [a, b]:
f (x) =
0
dla
x < a
C
dla
a < x < b
0
dla
x > b
(20)
Stałą C dobieramy tak aby spełniony był warunek
unormowania (19):
∞
Z
−∞
f (x)dx = 1
czyli:
∞
Z
−∞
f (x)dx =
b
Z
a
Cdx = C(b − a) = 1
tak więc C =
1
(b−a)
Warość oczekiwana od funkcji.
Przykład: Obliczyć wartość oczekiwną energii ki-
netycznej E
K
=
mv
2
2
, jezli dany jest rozkład predkości
f (v):
E
K
= E(
mv
2
2
) =
∞
Z
−∞
mv
2
2
f (v)dv
(21)
Załóżmy, że f (v) = C dla v ∈ [0, v
M
] wtedy:
E
K
= E(
mv
2
2
) =
v
M
Z
0
mv
2
2
Cdv = C
m
2
v
M
Z
0
v
2
dv =
= C
m
2
v
3
3
v
M
0
= C
m
2
v
3
M
3
= C
mv
3
M
6
=
mv
2
M
6
(22)
bo C =
1
v
M
X – zmienna losowa, g(x) fukcja zmiennej losowej.
Wyznacz wartośc oczekiwaną E(g(X))
przypadek zmiennej dyskretnej:
ω
n
–zbiór zdarzeń elementarnych, p(ω
n
) = p
n
, n =
1, . . . , N , X(ω
n
) = x
n
.
Wartość oczekiwana:
E(g(X)) =
N
P
n=1
g(x
n
)p
n
rzucamy kością i każdemu rzutowi przyporzadkowu-
jemy wartośc wynikaqjąca z zakładów w grze:
g(x
n
) = n
2
− N , gdzie n numer zdarzenia=numer
ściany,
x
n
= n wartość zmiennej losowej,
N - liczba zdarzeń elementarnych, dla kości N = 6.
i
p
i
x
i
g(x
n
)
p
i
· g(x
i
))
1
1
6
1
−5
−
5
6
2
1
6
2
−2
−
2
6
3
1
6
3
3
3
6
4
1
6
4
10
10
6
5
1
6
5
19
19
6
6
1
6
6
30
30
6
(23)
P p
i
= 1.0 i
P(p
i
· g(x
i
)) =
85
6
Odchylenie standar-
dowe – miara rozrzutu.
(σ(X))
2
= σ
2
X
= V (X)
(24)
V (X) – warianacja
3
V (X) = E[(X − E(X))
2
] =
N
X
i=N
p
i
(x
i
− E(X))
2
(25)
Własności wariancji:
V [X] = σ
2
[X] = σ
2
X
= E[(X)
2
] − E
2
(X)
(26)
Dowód: V [X] = E[(X −E(X))
2
] = E[X
2
−2XE(X)+
E
2
(X)] = E[X
2
] − 2E(X)E(X) + E
2
(X)
czyli
V [X] = E(X
2
) − E
2
(X)
odchylenie standardowe zdarzenia dwupunktowego
P (A) = p oraz P (B) = 1 − p
wartośći zmiennej losowej:
x(A) = 1 oraz x(B) = 1
Wartość oczekiwana E(X) = 1p + 0(1 − p) = p
wariancja
V (X) = p(1 − p)
2
+ 0(0 − p)
2
= p(1 − p)
(27)
Przykładowe problemy:
Zadanie 1.
1. Wykonać eksperyment z rejestracją wielokrotną
zjawiska losowego, np.: rzut kością (np.
suma
oczek dwóch kości), generator liczb losowych,
stan giełdy, rzut do tarczy, szumy termiczne, ...
2. zbudować histogram.
3. obliczyć wartość średnią, estymator odchylenia
standardowego, trzeci moment centralny, współ-
czynnik asymerii,
4. zweryfikować hipotezę o tym, że empiryczny roz-
kład jest
a) równomierny,
b) normalny,
c) trójkątny.
Zadanie 2.
W wyniku pomiaru natężenia prądu uzyskano nastę-
pujące wyniki (w mA):
2,0 2,2 1,8 2,1 1,9 2,2 1,8 2,3 1,7 2,4 1,6
wyznacz:
a) wartość średnią
b) estymator odchylenia standardowego,
c) estymator odchylenia standardowego wartości
średniej,
d) niepewność wartości średniej, jeśli błąd systema-
tyczny graniczny wynosi 0,2mA.
Zadanie 3.
Pokój zmierzono miarką z podziałką centrymentową
i uzyskano wyniki x = (5.51 ± 0.01)m i y = (4.02 ±
0.01)m. Ponadto stwierdzono, ze ściana jest nierówna
i oszacowano nierównomierność na 100mm. Wyznacz
błąd graniczny metoda różniczki zupełnej.
Zadanie 4.
W celu pomiaru objętości kuli wykonano 10 pomia-
rów obwodu. i uzyskano (w mm):
40 / 44 / 36 / 42 / 38 / 44 / 36 / 46 / 34 / 48 / 32
zakładając, że pomiar wykonano miarka z podziałka
milimetrowa wyznacz objętość i niepewność objętości.
Zadanie 5.
Omów metodę najmnieszych kwadratów.
Wypro-
wadź wzór dla przypadku wyznaczenia nachylenia a
funkcji liniowej y = ax, gdy wszystkie pomiary {x
i
, y
i
}
wykonane zostały z taką sama niepewnością. udowod-
nij, że a =
P
i
x
i
y
i
P
i
x
2
i
.
Zadanie 6.
.Zmienna losowa ma rozkład trójkątny
w przedziale [a, b].Wyznacz:
a) funkcję rozkładu prawdopodobieństwa z warunku
”unormowania”,
b) wartość oczekiwaną,
c) odchylenie standardowe,
d) medianę.
Zadanie 7.
Zmienna losowa ma rozkład równomierny w prze-
dziale [−a, b] (gdzie: a > 0, b > 0 ). Wyznacz wartość
oczekiwaną oraz odchylenie standardowe.
Zadanie 8.
W celu wyznaczenia rezystancji wykonano pomiary
napięcia i natężenia prądu. Natężenie prądu zmierzono
amperomierzem cyfrowym o błędzie względnym 1% i
rozdzielczości dwóch ostatnich cyfr, a napięcie wol-
tomierzem analogowym klasy 5%. Wyniki pomiarów
przedstawione są w tabelce:
I(mA)
I − zakr(mA)
U (V )
U − zakr(V )
2, 0
3
1.00
3
5.0
10
2.0
3
8.0
10
4.0
10
13
30
6.0
10
17
30
9.0
10
20
30
11
30
31
100
15
30
40
100
20
30
Wyznacz metoda najmniejszych nachylenie i na tej
podstawie opór elektryczny korzystając ze wzoru otrzy-
manego w zadaniu 2. Narysuj wyniki pomiarowe na
wykresie zależności U = f (I), zaznacz słupki błędów,
narysuj prostą (na oko) najlepiej pasującą do danych
oraz określa na rysunku błąd (graniczny) wyznaczenia
rezystancji. Która składowa błędu jest większa sys-
tematyczna (aparaturowa) czy przypadkowa? Oblicz
błąd wynikający z rezystancji wewnętrznej woltomie-
rza (R
v
= 10kΩ/V ).
4