ZMIENNE LOSOWE JEDNOWYMIAROWE - PARAMETRY ROZKŁADÓW
Każdemu zdarzeniu X należącemu do populacji generalnej przyporządkowujemy liczbę x, będącą wynikiem doświadczenia. Liczby tej nie można przewidzieć przed wykonaniem doświadczenia. W
wyniku doświadczenia zmienna losowa przyjmuje tylko jedną wartość liczbową spośród wszystkich, które może przyjąć.
Zbiór zdarzeń zastępuje się zbiorem liczb.
Twierdzenie o zmiennej losowej:
jeżeli x jest zmienną losową, to zmienną losową jest też
|x|, x+c, C x, x2.
Zmiennym losowym można przypisać prawdopodobieństwo ich występowania.
Zmienna losowa skokowa
Jest to zmienna, której zbiór wartości jest przeliczalny.
Prawdopodobieństwo, że X = xi oznacza się
P( X=xi) = p( xi)
Prawdopodobieństwo to spełnia warunek normalizacji n
∑ p( x =
i )
1
i 1
=
gdzie n określa wszystkie wartości zmiennej X
Zmienna losowa ciągła
Wartości zmiennej tworzą liczby z pewnego przedziału. Zbiór tych liczb jest nieprzeliczalny.
Prawdopodobieństwo wystąpienia wartości zmiennej zawartej w przedziale x, x+dx oznacza się
P( x < X ≤ x + dx) = f ( x) d x
i spełnia warunek normalizacji w postaci
f
∫ ( x) dx = 1
x
gdzie całka rozciągnięta jest na cały obszar zmienności zmiennej.
Funkcje p( xi) i f( x) są to funkcje rozkładu zmiennej losowej.
Funkcję f( x) nazywa się też funkcją gęstości zmiennej losowej, funkcją gęstości prawdopodobieństwa lub gęstością prawdopodobieństwa.
Dystrybuanta zmiennej losowej lub dystrybuanta rozkładu zmiennej losowej Dystrybuanta zmiennej losowej jest to funkcja podająca prawdopodobieństwo wystąpienia zmiennej X nie większej od konkretnej, zadanej wartości xj, czyli prawdopodobieństwo wystąpienia wartości x ≤ xj:
- dla zmiennej skokowej
j
F = ∑ p x = P x ≤ x
j
( i) (
j )
i 1
=
- dla zmiennej ciągłej
j
F ( x ) x
= ∫ f x dx = P − ∞ < x ≤ x j
( )
(
j )
−∞
Właściwości dystrybuanty:
1. funkcja F(x) jest funkcją niemalejącą, tzn. jeżeli x1 < x2, to F( x1) ≤ F( x2) 2. F( -∞) =0 i F( +∞) =1, czyli wykres dystrybuanty zawarty jest między wartościami 0 i 1 oraz posiada dwie asymptoty poziome
3. różnica F( x2) - F( x1) określa prawdopodobieństwo występowania zmiennej losowej X w przedziale ( x1,x2>
4. prawdopodobieństwo wystąpienia zmiennej w przedziale ( xj, ∞) wynosi P( x>xj) = 1 - F( xj) zm
z i
m en
e na
n
a sk
s o
k k
o o
k w
o a
w
zmi
m en
e na
n c
i
c ąg
ą ł
g a
p(
p x
( )
i
f(
f x)
x
x
x x x x x
x
x
x
x
1
2
3
4
5
6
i
x+
x d
+ x
d
F( x
( )
i
F( x)
1
1
0
0
x
x x x x x
x
x
1
2
3
4
5
6
i
Parametr rozkładu jest liczba dająca scharakteryzowanie zbioru wartości, jakie może przyjmować zmienna losowa
Wartość oczekiwana zmiennej losowej oznaczana jako E( X), określona jest:
- dla zmiennej skokowej
E( X )
n
= ∑ x p x
i ⋅
( i)
i= 1
sumowanie rozciągnięte jest na wszystkie wartości zmiennej skokowej
- dla zmiennej ciągłej
∞
E( X ) = ∫ x ⋅ f ( x) dx
−∞
całkowanie rozciągnięte jest na cały obszar zmienności zmiennej losowej
Przykład zastosowania:
Zmienna skokowa jako wynik doświadczenia
Wykonano k serii pomiarów; każda seria posiada mi wyników. Całkowita ilość wyników wynosi tym samym
k
n = ∑ m
i
i= 1
Prawdopodobieństwo wystąpienia wartości xi z serii określa wyrażenie p( )
m
x
i
=
i
n
Wartość oczekiwana:
k
∑ m xii
E( X )
i= 1
=
n
Jeżeli serie składają się z pojedynczych pomiarów wykonywanych w identycznych warunkach, czyli dla każdego i mi=1, to wartość oczekiwana jest zwykłą średnią arytmetyczną n
∑ xi
E( X )
i
= = 1
= x
n
Średnia ważona stosowana jest wtedy, gdy są różnice w warunkach wykonywania pomiarów. Dla każdego pomiaru lub serii pomiarów wprowadza się wagę wi. Średnia ważona opisana jest wzorem: k
∑ w xii
i=
x =
1
k
∑ wi
i= 1
wi - waga pomiaru lub serii pomiarowej, xi - wartość pomiaru lub serii pomiarowej
Wariancja rozkładu zmiennej losowej oznaczana jako D2( X), określana jest jako wartość oczekiwana kwadratu odchylenia zmiennej losowej X od wartości oczekiwanej E( X)
2
D ( X ) = E ([ x − E( X ) 2]
- dla zmiennej skokowej
2
D ( X )
n
= ∑[ x − E( X )] 2 p x
i
⋅ ( i )
i= 1
- dla zmiennej ciągłej
∞
D2 ( X ) = ∫[ x − E( X )] 2 ⋅ f ( x) dx
−∞
Odchylenie standardowe (dyspersja) rozkładu
σ( X )
D2
=
( X )
Uwaga: odchylenie standardowe używane jest w praktyce częściej niż wariancja
Uogólnienie
momentem rzędu k zmiennej losowej nazywa się wartość oczekiwaną k-tej potęgi odchyleń poszczególnych wartości zmiennej losowej od wartości c ( c - pewna stała)
- dla zmiennej skokowej
n
µ = ∑ x − c ⋅ p x
k
(
) k
i
( i)
i 1
=
- dla zmiennej ciągłej
∞
µ = ∫( x − c) k
k
⋅ f ( x) dx
−∞
- jeżeli c = 0 - momenty zwykłe → wartość oczekiwana E(X) jest momentem zwykłym rozkładu 1-go rzędu
- jeżeli c=E(X) (wartością oczekiwaną) - moment centralny → wariancja D2(X) jest momentem centralnym rozkładu 2-go rzędu
Zastosowanie momentu centralnego - miara asymetrii rozkładu - znormalizowana wielkość µ 3
γ =
1
3
σ
- gdy γ 1 = 0 to rozkład jest rozkładem symetrycznym
- gdy γ 1 ≠ 0 to rozkład jest rozkładem asymetrycznym; wartość γ 1 jest miarą skośności rozkładu
Średnia geometryczna stosowana wtedy, gdy zmienne x1, x2, ....xn zachowują się jak wyrazy szeregu geometrycznego
n
x = x x .. x
.
g
1 2
n
Średnia harmoniczna stosowana m. in. wtedy, gdy n zmiennych ma silnie zróżnicowane wartości n
x
h =
n
∑ 1x
i = 1
i
Kwantyle są to wartości cechy badanej próby, które dzielą tę próbę na określone części pod względem liczby pomiarów. Wyniki tworzące próbę muszą być uporządkowane rosnąco.
Najczęściej stosowane kwantyle:
kwartyle - podział na 4 części
decyle - podział na 10 części
percentyle - podział na 100 części
Kwartyle
kwartyl pierwszy Q1 - to taka wartość, która dzieli próbę w ten sposób, że ¼ (25%) ilości pomiarów ma od niej wartości nie większe, a ¾ (75%) nie mniejsze.
kwartyl drugi Q2 (inaczej mediana) - jest to wartość znajdującą się w środku próby
- jeżeli ilość wyników n w próbie jest nieparzysta: Q = x
2
1( n 1
+ )
2
- jeżeli ilość wyników jest parzysta:
x
+ x
1
1
n
n 1
+
Q
2
2
=
2
2
kwartyl trzeci Q3 - to taka wartość, która dzieli próbę w ten sposób, że ¾ (75%) ilości pomiarów ma od niej wartości nie większe, a ¼ (25%) nie mniejsze.
Przykład zastosowania kwartyli
Uzyskano n = 13 wyników zmiennej X. Wyznaczyć parametry charakteryzujące próbę
xi
90
średnia arytmetyczna
49.23
80
rozstęp R = x12 - x0
85
Q3 70
kwartyl 1 - Q1
30
Q 60
kwartyl 2 - Q2 (mediana)
55
2
x
kwartyl 3 - Q
ś r
50
3
70
rozstęp kwartylny Q3 - Q1
40
40
Q1 30
20
10
i
0
0
1
2
3
4
5
6
7
8
9
10
11
12
Wartość modalna (wartość najczęstsza, moda, dominanta) jest to wartość występująca najczęściej w badanym zbiorze z wykluczeniem wartości skrajnych xmin i xmax, np. dla zbioru: 11, 13, 14, 10, 13, 14, 16, 15, 14
- dominanta równa jest 14.
W przypadku szeregu rozdzielczego dominanta wyznaczana jest dla przedziału klasowego, w którym występuje największa liczba obserwacji