Miary koncentracji (skupienia)
Kurtoza - K
szereg rozdzielczy przedziałowy
rozkład normalny, krzywa Gausa
K' = K - 3 zmodyfikowany współczynnik Kurtozy
ZJAZD V, 18.11.2007 r. Ć
wariancja = 0, wtedy nie ma odchyleń
|
|
|
|
|
0 - 2 |
4 |
4 |
1 |
4 |
2 - 4 |
6 |
10 |
3 |
18 |
4 - 6 |
9 |
19 |
5 |
45 |
6 - 8 |
7 |
26 |
7 |
49 |
8 - 10 |
3 |
29 |
9 |
27 |
|
29 |
X |
X |
143 |
nie jest to rozkład symetryczny,
rozkład o asymetrii lewostronnej
rozkład lekko lewostronnie asymetryczny
trzeci moment zestandaryzowany
policzyć: współczynnik asymetrii Pearsona, Yule-Kendalla, Kurtozę - do zadania o zawartości tłuszczu w mleku, które było wcześniej na ćw.
Wyniki:
As Pearsona
- 0,24378
As (III moment zestandaryzowany)
- 0,24627
K' = K - 3 = - 0,87612
AQ = - 0,10072
K
2,12388
ZJAZD VI, 1.12.2007 r. W
Bardzo często ze zdarzeniami losowymi wiążemy pewne wielkości liczbowe. Zilustrujemy to na przykładach.
Przykład 1
Do pomiarów biometrycznych wybiera się losowo pewną grupę ludzi i mierzy się, np. ich wzrost. Mamy zatem przyporządkowanie: zdarzenie losowe (tj. losowo wybrany człowiek) - liczba (tj. wzrost wyrażony w cm).
Przykład 2
Fabryka produkuje stalowe liny. Kontrola techniczna wybiera pewną ilość z wyprodukowanej partii i sprawdza wytrzymałość tych lin na zrywanie. A więc znowu zdarzeniu (losowo wybrana lina) przyporządkowujemy liczbę (wytrzymałość na zerwanie - wyrażoną w kg/mm2.
Rozpatrujemy zbiór D wzajemnie wykluczających się zdarzeń elementarnych, tworzących pełną grupę zdarzeń.
Jeżeli każdemu ze zdarzeń zbioru D przyporządkujemy jakąś liczbę rzeczywistą, to takie przyporządkowanie jest funkcją rzeczywistą określoną na zbiorze D. Funkcję te nazywamy zmienną losową i oznaczamy dużymi literami łacińskimi X, Y, Z, itp. Wartości, jakie te zmienne przybierają, oznaczamy małymi literami x, y, z…
Jeżeli w wyniku realizacji pewnego doświadczenia pojawi się jakieś zdarzenie E, ze zbioru D, to jest to równoważne zdarzeniu polegającemu na tym, że zmienna losowa X przybiera wartość x, gdzie x jest liczbą przyporządkowaną zdarzeniu E.
Możemy to zapisać w formie:
Zmienną losową jest więc taka zmienna, która w wyniku doświadczenia przybiera różne wartości z różnym prawdopodobieństwem (np. tak jak na tym rysunku):
Rozróżniamy dwa rodzaje zmiennych losowych:
Zmienne losowe skokowe (nieciągłe, dyskretne).
Zmienne losowe ciągłe.
Zmiennymi losowymi skokowymi nazywamy takie zmienne, które mają skończony lub przeliczalny zbiór wartości.
Zmienne skokowe mogą zatem przybierać tylko niektóre wartości liczbowe (często są to wartości liczb naturalnych).
Przykłady zmiennej losowej skokowej:
- wydajność robotnika w ilościach detali na godzinę
- liczba detali wadliwych w próbce pobranej od pewnej partii
- liczba wad na pewnej długości tkaniny.
Zmiennymi losowymi ciągłymi nazywamy takie zmienne losowe, które mogą przybierać dowolne wartości liczbowe, należące do pewnego przedziału. Zbiór wartości zmiennej losowej ciągłej jest nieskończony i nieprzeliczalny.
Przykłady zmiennej losowej ciągłej:
- ciężar odkuwek
- grubość blachy
- wytrzymałość na rozciąganie stali
- zawartość pierwiastków w stali, itp.
ROZKŁAD I DYSTRYBUANTA SKOKOWEJ ZMIENNEJ LOSOWEJ
Rozważamy zmienną losową X typu skokowego. Każdej realizacji zmiennej przyporządkowane jest pewne prawdopodobieństwo. Zmienna ta przybiera wartości:
x1, x2, x3, …, xi,… xn odpowiednio z prawdopodobieństwem:
p1, p2, p3, …, pi,… pn
Rozkładem skokowej zmiennej losowej X nazywamy prawdopodobieństwo tego, że zmienna ta przybiera wartości xi, co zapisujemy:
Ponieważ wartości xi stanowią pełną grupę zdarzeń, więc
.
Gdy x jest pewną liczbą rzeczywistą, to prawdopodobieństwo, że zmienna losowa X przybierze wartości mniejsze od liczby x, jest funkcją, którą oznaczamy F(x) i nazywamy dystrybuantą zmiennej losowej X.
Dystrybuanta może przybierać wartości od 0 do 1.
Związek pomiędzy funkcją rozkładu i dystrybuantą jest prosty. Uszeregujmy wartości zmiennej losowej X w porządku rosnącym:
Gdy liczba rzeczywista x spełnia nierówność:
to:
Wartość dystrybuanty otrzymuje się więc przez kumulowanie wartości funkcji rozkładu (rysunki).
DYSTRYBUANTA ZMIENNEJ LOSOWEJ CIĄGŁEJ.
GĘSTOŚĆ PRAWDOPODOBIEŃSTWA.
Dystrybuantę zmiennej losowej ciągłej definiuje się podobnie jak dystrybuantę zmiennej losowej skokowej. Jest to więc prawdopodobieństwo zdarzenia polegającego na tym, że zmienna losowa X przyjmuje wartość mniejszą od pewnej rzeczywistej wartości x.
…………(1)
Rozważmy dwie liczby rzeczywiste x1 i x2. Niech x1 < x2.
Chcemy znaleźć:
.
Zdarzenie X < x2 rozkłada się na dwa zdarzenia:
oraz
Widać, że
stąd:
……….. (2)
Posługując się pojęciem dystrybuanty ostatnią równość można zapisać następująco: z (1) i (2) wynika:
……….. (3)
Dla zmiennej losowej ciągłej funkcję rozkładu należy zdefiniować inaczej niż dla zmiennej losowej skokowej.
Mianowicie:
Funkcją rozkładu prawdopodobieństwa zmiennej losowej X (ciągłej) nazywa się prawdopodobieństwo zdarzenia polegającego na tym, że zmienna losowa przyjmuje jedną z wartości należących do pewnego przedziału, co oznacza się symbolem:
Z wzoru (3) wynika, że funkcja rozkładu zmiennej losowej ciągłej jest przyrostem dystrybuanty, to znaczy, że:
Gdy
, wtedy
, gdzie:
r(x) - pewna nieskończenie mała wartość.
Z określenia różniczki wynika, że:
bo
gdzie:
→ pochodna dystrybuanty.
Jeżeli dystrybuanta F(x) ma pochodną w punkcie x, to pochodna ta nazywa się gęstością prawdopodobieństwa zmiennej losowej X w punkcie x.
Znaczenie gęstości prawdopodobieństwa można zilustrować w sposób następujący:
Jeżeli na osi liczbowej ustali się w dowolnym punkcie x1 dostatecznie mały przedział o długości ∆x, wtedy prawdopodobieństwo, że zmienna losowa X, mająca gęstość f(x), przybiera wartości należące do tego przedziału jest - w przybliżeniu - równe iloczynowi f(x) ∙ ∆x (rysunek).
Oznaczając gęstość prawdopodobieństwa symbolem f(x), otrzymamy:
oraz
Aby dana funkcja mogła być gęstością prawdopodobieństwa, musi spełniać dwa warunki:
1.
2.
Z określenia gęstości prawdopodobieństwa wynika, że funkcja rozkładu zmiennej losowej X (ciągłej) ma postać:
PARAMETRY ROZKŁADU ZMIENNEJ LOSOWEJ
Największe znaczenie praktyczne mają dwie grupy parametrów:
Wartość oczekiwana (nadzieja matematyczna) - E(X) - reprezentuje przeciętną, średnią wielkość zmiennej losowej.
2. Wariancja (D2(X)) oraz odchylenie standardowe (odchylenie średnie) - D(X) - dają wyobrażenie o rozrzucie wartości zmiennej losowej.
WARTOŚĆ OCZEKIWANA
A) wartość oczekiwana zmiennej losowej skokowej:
X jest zmienną losową typu skokowego, przybierająca wartości
x1, x2, x3, …, xi, …, xn z prawdopodobieństwem p1, p2, p3, …, pi, …, pn.
Definicja: Wartością oczekiwaną zmiennej losowej X nazywamy sumę iloczynów poszczególnych wartości tej zmiennej przez odpowiadające tym wartością prawdopodobieństwa.
Wartość oczekiwaną oznacza się symbolem E(X).
B) wartość oczekiwana zmiennej losowej ciągłej:
Jeżeli przez f(x) oznaczymy funkcję gęstości prawdopodobieństwa zmiennej losowej X, to wartość oczekiwaną E(X) tej zmiennej określamy wzorem:
Wartość oczekiwana stałej równa się tej stałej:
(Stała jest to zmienna losowa przybierająca tylko jedną wartość z prawdopodobieństwem równym 1).
Wartość oczekiwana sumy dwóch zmiennych losowych X i Y równa się sumie wartości oczekiwanych tych zmiennych.
Twierdzenie to można uogólnić na dowolną sumę skończonej liczby zmiennych.
ROZKŁAD NORMALNY (GAUSSA)
Rozkład normalny jest najważniejszym rozkładem zmiennej losowej ciągłej, o bardzo szerokich zastosowaniach praktycznych.
W rozkładzie tym gęstość wyraża się wzorem:
gdzie:
i m - stałe (tzw. parametry rozkładu). Sens
i m podamy poniżej.
Zamiast symbolu
używa się zapisu
.
Dystrybuanta rozkładu normalnego wyraża się wzorem:
Okazuje się, że:
Powyższa całka nie może być wyrażona za pomocą funkcji elementarnych. Wyliczenie wartości F(x) jest żmudne, opiera się na całkowaniu szeregu jednostajnie zbieżnego, na który rozwija się funkcję podcałkową. Jest to rozwinięcie typu:
Dla uniknięcia żmudnych rachunków przy wyliczaniu wartości gęstości i dystrybuanty rozkładu normalnego zostały opracowane tabele.
Stabilizowane funkcje gęstości i dystrybuanty rozkładu normalnego mają postać:
Wzory te wyrażają funkcję gęstości i dystrybuanty zmiennej o parametrach m = 0 i
= 1.
Zmienną taką nazywamy zmienną standaryzowaną.
Całkę F(x) sprowadzamy do całki
przez wprowadzenie nowej zmiennej u:
Mianowicie:
ponieważ
Zmienna t jest zmienną, względem której całkujemy; jedną z jej wartości jest u - granica całkowania.
Natomiast przy wprowadzaniu zmiennej standaryzowanej określonej wzorem
, do funkcji gęstości otrzymujemy:
Między funkcją gęstości zmiennej zwykłej i funkcją gęstości zmiennej standaryzowanej istnieje więc następująca zależność:
Rozkład normalny jest rozkładem symetrycznym względem punktu x = m. Obliczając pochodną funkcji f(x) i porównując ją do zera, możemy określić maksimum tej funkcji. Maksimum to przypada w punkcie:
Na lewo i prawo od swego maksimum funkcja gęstości rozkładu normalnego stale opada, zbliżając się asymetrycznie do osi odciętych.
Punkty przegięcia krzywej gęstości rozkładu normalnego posiadają odcięte
.
Rysunek następny przedstawia krzywą gęstości rozkładu normalnego i dystrybuantę.
Liczba m określa położenie osi symetrii rozkładu, natomiast od parametru
zależy wartość maksymalna funkcji gęstości.
W celu zobrazowania znaczenia parametrów m i
przedstawiono na rysunku poniższym dwa wykresy gęstości rozkładu normalnego o tym samym
, a o różnych m oraz o tym samym m i różnych
.
Przykład
Twardość żeliwa szarego (według Brinella) posiada rozkład normalny o parametrach m = 240,
= 3 kG/mm2.
Posługując się tabelami rozkładu normalnego (tabela 2), obliczyć:
P(HB < 237)
P(HB < 244)
P(234
HB
246)
P(234
HB
240)
P(HB > 245)
Jeżeli wiadomo, że P(HB < x) = 0,97725, to czemu równa się x.
Rozkład normalny N(240,3)
du =
a)
(z tabel)
b)
(z tabel)
c)
d)
e)
gdzie:
f)
z tabel dla 0,97725 u = 2 a stąd
Zadanie 2
Sporządzić w tym samym układzie współrzędnych wykresy gęstości zmiennych losowych o rozkładach normalnych N(0,1) N(0,2) N(0,3). Korzystać z tablicy 2 (gęstość).
Obliczyć:
a)
jeżeli X jest zmienną losową o rozkładzie normalnym N(1,2)
b)
jeśli X jest zmienną losową o rozkładzie normalnym N(4,2).
Rozwiązanie:
a)
lub
czyli
b)
N(4,2)
,
Określenie wartości zmiennej mającej rozkład normalny:
Wariancja:
czyli
- odchylenie standardowe
REGUŁA 3
W zastosowaniach technicznych interesuje nas bardzo często prawdopodobieństwo zdarzenia, że wartość zmiennej losowej o rozkładzie N(m,
) będzie różniła się od wartości oczekiwanej m, co do wartości bezwzględnej o więcej niż o określoną wielokrotność odchylenia standardowego (o więcej niż o k
, gdzie k > 0).
Gdy X ma rozkład normalny N(m,
), to zmienna losowa
ma rozkład N(0,1). Wynika stąd, że:
dla k = 1, 2, 3 z tablic rozkładu normalnego otrzymujemy:
1)
czyli
Inaczej:
2) k = 2
3) k = 3
Stąd wniosek, że wartości zmiennej X o rozkładzie N(m,
), które od wartości oczekiwanej E(X) = m różnią się o więcej niż 3
, są bardzo mało prawdopodobne, a więc praktycznie biorąc nie zachodzą.
Gdy zatem pojawi się taka wartość w toku obserwacji, na przykład procesu technologicznego, to jest to wskazówka mówiąca z dużym prawdopodobieństwem o zakłóceniu, które nastąpiło w tym procesie.
ZJAZD VI, 2.12.2007 r. Ć
Zadanie 1
X - liczba dni słonecznych w Bielsku w ciągu roku
zmienna losowa X podlega rozkładowi normalnemu:
a) P(X<250)
b) P(X<120)
c) P(100<X<300)
d) P(70<X<320)
e) P(X>180)
f) P(X>300)
g) Jeżeli wiadomo, że P(X<x1) = 0,879, to ile wynosi x1?
a)
około 84%
→ z tablic
b)
0,95
0,45
1,60
c)
d)
e)
F(X) = P(X < x)
f)
g)
w tablicach jest u a nie x:
u = 1,17
Zadanie 2
Wzrost mężczyzn w Polsce - N
N(175,8)
Obliczyć:
a) P(X<160)
b) P(X>190)
c) P(150<X<195)