ZMIENNE LOSOWE JEDNOWYMIAROWE - PARAMETRY ROZKŁADÓW

KaŜdemu zdarzeniu X naleŜącemu do populacji generalnej przyporządkowujemy liczbę x, będącą wynikiem doświadczenia. Liczby tej nie moŜna przewidzieć przed wykonaniem doświadczenia. W

wyniku doświadczenia zmienna losowa przyjmuje tylko jedną wartość liczbową spośród wszystkich, które moŜe przyjąć.

Zbiór zdarzeń zastępuje się zbiorem liczb.

Twierdzenie o zmiennej losowej:

jeŜeli x jest zmienną losową, to zmienną losową jest teŜ

|x|, x+c, C x, x2.

Zmiennym losowym moŜna przypisać prawdopodobieństwo ich występowania.

Zmienna losowa skokowa

Jest to zmienna, której zbiór wartości jest przeliczalny.

Prawdopodobieństwo, Ŝe X = xi oznacza się

P( X=xi) = p( xi)

Prawdopodobieństwo to spełnia warunek normalizacji n

∑ p( x =

i )

1

i 1

=

gdzie n określa wszystkie wartości zmiennej X

Zmienna losowa ciągła

Wartości zmiennej tworzą liczby z pewnego przedziału. Zbiór tych liczb jest nieprzeliczalny.

Prawdopodobieństwo wystąpienia wartości zmiennej zawartej w przedziale x, x+dx oznacza się

P( x < X ≤ x + dx) = f ( x) d x

i spełnia warunek normalizacji w postaci

f

∫ ( x) dx = 1

x

gdzie całka rozciągnięta jest na cały obszar zmienności zmiennej.

Funkcje p( xi) i f( x) są to funkcje rozkładu zmiennej losowej.

Funkcję f( x) nazywa się teŜ funkcją gęstości zmiennej losowej, funkcją gęstości prawdopodobieństwa lub gęstością prawdopodobieństwa.

Dystrybuanta zmiennej losowej lub dystrybuanta rozkładu zmiennej losowej Dystrybuanta zmiennej losowej jest to funkcja podająca prawdopodobieństwo wystąpienia zmiennej X nie większej od konkretnej, zadanej wartości xj, czyli prawdopodobieństwo wystąpienia wartości x ≤ xj:

- dla zmiennej skokowej

j

F = ∑ p x = P x ≤ x

j

( i) (

j )

i 1

=

- dla zmiennej ciągłej

j

F ( x ) x

= ∫ f x dx = P − ∞ < x ≤ x j

( )

(

j )

−∞

Właściwości dystrybuanty:

1. funkcja F(x) jest funkcją niemalejącą, tzn. jeŜeli x1 < x2, to F( x1) ≤ F( x2) 2. F( -∞) =0 i F( +∞) =1, czyli wykres dystrybuanty zawarty jest między wartościami 0 i 1 oraz posiada dwie asymptoty poziome

3. róŜnica F( x2) - F( x1) określa prawdopodobieństwo występowania zmiennej losowej X w przedziale ( x1,x2>

4. prawdopodobieństwo wystąpienia zmiennej w przedziale ( xj, ∞) wynosi P( x>xj) = 1 - F( xj) zm

z i

m en

e na

n

a sk

s o

k k

o o

k w

o a

w

zmi

m en

e na

n c

i

c ąg

ą ł

g a

p(

p x

( )

i

f(

f x)

x

x

x x x x x

x

x

x

x

1

2

3

4

5

6

i

x+

x d

+ x

d

F( x

( )

i

F( x)

1

1

0

0

x

x x x x x

x

x

1

2

3

4

5

6

i

PARAMETRY ROZKŁADU

Parametr rozkładu jest liczba dająca scharakteryzowanie zbioru wartości, jakie moŜe przyjmować zmienna losowa

Wartość oczekiwana zmiennej losowej oznaczana jako E( X), określona jest:

- dla zmiennej skokowej

E( X )

n

= ∑ x p x

i ⋅

( i)

i= 1

sumowanie rozciągnięte jest na wszystkie wartości zmiennej skokowej

- dla zmiennej ciągłej

∞

E( X ) = ∫ x ⋅ f ( x) dx

−∞

całkowanie rozciągnięte jest na cały obszar zmienności zmiennej losowej

Przykład zastosowania:

Zmienna skokowa jako wynik doświadczenia

Wykonano k serii pomiarów; kaŜda seria posiada mi wyników. Całkowita ilość wyników wynosi tym samym

k

n = ∑ m

i

i= 1

Prawdopodobieństwo wystąpienia wartości xi z serii określa wyraŜenie p( )

m

x

i

=

i

n

Wartość oczekiwana:

k

∑ m xii

E( X )

i= 1

=

n

JeŜeli serie składają się z pojedynczych pomiarów wykonywanych w identycznych warunkach, czyli dla kaŜdego i mi=1, to wartość oczekiwana jest zwykłą średnią arytmetyczną n

∑ xi

E( X )

i

= = 1

= x

n

Średnia waŜona stosowana jest wtedy, gdy są róŜnice w warunkach wykonywania pomiarów. Dla kaŜdego pomiaru lub serii pomiarów wprowadza się wagę wi. Średnia waŜona opisana jest wzorem: k

∑ w xii

i=

x =

1

k

∑ wi

i= 1

wi - waga pomiaru lub serii pomiarowej, xi - wartość pomiaru lub serii pomiarowej

Wariancja rozkładu zmiennej losowej oznaczana jako D2( X), określana jest jako wartość oczekiwana kwadratu odchylenia zmiennej losowej X od wartości oczekiwanej E( X)

2

D ( X ) = E ([ x − E( X ) 2]

- dla zmiennej skokowej

2

D ( X )

n

= ∑[ x − E( X )] 2 p x

i

⋅ ( i )

i= 1

- dla zmiennej ciągłej

∞

D2 ( X ) = ∫[ x − E( X )] 2 ⋅ f ( x) dx

−∞

Odchylenie standardowe (dyspersja) rozkładu

σ( X )

D2

=

( X )

Uwaga: odchylenie standardowe uŜywane jest w praktyce częściej niŜ wariancja

Uogólnienie

momentem rzędu k zmiennej losowej nazywa się wartość oczekiwaną k-tej potęgi odchyleń poszczególnych wartości zmiennej losowej od wartości c ( c - pewna stała)

- dla zmiennej skokowej

n

µ = ∑ x − c ⋅ p x

k

(

) k

i

( i)

i 1

=

- dla zmiennej ciągłej

∞

µ = ∫( x − c) k

k

⋅ f ( x) dx

−∞

- jeŜeli c = 0 - momenty zwykłe → wartość oczekiwana E(X) jest momentem zwykłym rozkładu 1-go rzędu

- jeŜeli c=E(X) (wartością oczekiwaną) - moment centralny → wariancja D2(X) jest momentem centralnym rozkładu 2-go rzędu

Zastosowanie momentu centralnego - miara asymetrii rozkładu - znormalizowana wielkość µ 3

γ =

1

3

σ

- gdy γ 1 = 0 to rozkład jest rozkładem symetrycznym

- gdy γ 1 ≠ 0 to rozkład jest rozkładem asymetrycznym; wartość γ 1 jest miarą skośności rozkładu

Inne miary połoŜenia

Średnia geometryczna stosowana wtedy, gdy zmienne x1, x2, ....xn zachowują się jak wyrazy szeregu geometrycznego

n

x = x x .. x

.

g

1 2

n

Średnia harmoniczna stosowana m. in. wtedy, gdy n zmiennych ma silnie zróŜnicowane wartości n

x

h =

n

∑ 1x

i = 1

i

Kwantyle są to wartości cechy badanej próby, które dzielą tę próbę na określone części pod względem liczby pomiarów. Wyniki tworzące próbę muszą być uporządkowane rosnąco.

Najczęściej stosowane kwantyle:

kwartyle - podział na 4 części

decyle - podział na 10 części

percentyle - podział na 100 części

Kwartyle

kwartyl pierwszy Q1 - to taka wartość, która dzieli próbę w ten sposób, Ŝe ¼ (25%) ilości pomiarów ma od niej wartości nie większe, a ¾ (75%) nie mniejsze.

kwartyl drugi Q2 (inaczej mediana) - jest to wartość znajdującą się w środku próby

- jeŜeli ilość wyników n w próbie jest nieparzysta: Q = x

2

1( n 1

+ )

2

- jeŜeli ilość wyników jest parzysta:

x

+ x

1

1

n

n 1

+

Q

2

2

=

2

2

kwartyl trzeci Q3 - to taka wartość, która dzieli próbę w ten sposób, Ŝe ¾ (75%) ilości pomiarów ma od niej wartości nie większe, a ¼ (25%) nie mniejsze.

Przykład zastosowania kwartyli

Uzyskano n = 13 wyników zmiennej X. Wyznaczyć parametry charakteryzujące próbę

xi

90

średnia arytmetyczna

49.23

80

rozstęp R = x12 - x0

85

Q3 70

kwartyl 1 - Q1

30

Q 60

kwartyl 2 - Q2 (mediana)

55

2

x

kwartyl 3 - Q

ś r

50

3

70

rozstęp kwartylny Q3 - Q1

40

40

Q1 30

20

10

i

0

0

1

2

3

4

5

6

7

8

9

10

11

12

Wartość modalna (wartość najczęstsza, moda, dominanta) jest to wartość występująca najczęściej w badanym zbiorze z wykluczeniem wartości skrajnych xmin i xmax, np. dla zbioru: 11, 13, 14, 10, 13, 14, 16, 15, 14

- dominanta równa jest 14.

W przypadku szeregu rozdzielczego dominanta wyznaczana jest dla przedziału klasowego, w którym występuje największa liczba obserwacji