statystyka matematyczna - całość cz.2, statystyka matematyczna, matematyczna


Miary koncentracji (skupienia)

Kurtoza - K

0x01 graphic

0x01 graphic
szereg rozdzielczy przedziałowy

0x01 graphic

rozkład normalny, krzywa Gausa

K' = K - 3 zmodyfikowany współczynnik Kurtozy

ZJAZD V, 18.11.2007 r. Ć

wariancja = 0, wtedy nie ma odchyleń

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0 - 2

4

4

1

4

2 - 4

6

10

3

18

4 - 6

9

19

5

45

6 - 8

7

26

7

49

8 - 10

3

29

9

27

0x01 graphic

29

X

X

143

0x01 graphic

0x01 graphic
nie jest to rozkład symetryczny,

rozkład o asymetrii lewostronnej

0x01 graphic

0x01 graphic

rozkład lekko lewostronnie asymetryczny

0x01 graphic

0x01 graphic
trzeci moment zestandaryzowany

policzyć: współczynnik asymetrii Pearsona, Yule-Kendalla, Kurtozę - do zadania o zawartości tłuszczu w mleku, które było wcześniej na ćw.

Wyniki:

As Pearsona 0x01 graphic
- 0,24378

As (III moment zestandaryzowany) 0x01 graphic
- 0,24627

K' = K - 3 = - 0,87612

AQ = - 0,10072

K 0x01 graphic
2,12388

ZJAZD VI, 1.12.2007 r. W

Bardzo często ze zdarzeniami losowymi wiążemy pewne wielkości liczbowe. Zilustrujemy to na przykładach.

Przykład 1

Do pomiarów biometrycznych wybiera się losowo pewną grupę ludzi i mierzy się, np. ich wzrost. Mamy zatem przyporządkowanie: zdarzenie losowe (tj. losowo wybrany człowiek) - liczba (tj. wzrost wyrażony w cm).

Przykład 2

Fabryka produkuje stalowe liny. Kontrola techniczna wybiera pewną ilość z wyprodukowanej partii i sprawdza wytrzymałość tych lin na zrywanie. A więc znowu zdarzeniu (losowo wybrana lina) przyporządkowujemy liczbę (wytrzymałość na zerwanie - wyrażoną w kg/mm2.

Rozpatrujemy zbiór D wzajemnie wykluczających się zdarzeń elementarnych, tworzących pełną grupę zdarzeń.

Jeżeli każdemu ze zdarzeń zbioru D przyporządkujemy jakąś liczbę rzeczywistą, to takie przyporządkowanie jest funkcją rzeczywistą określoną na zbiorze D. Funkcję te nazywamy zmienną losową i oznaczamy dużymi literami łacińskimi X, Y, Z, itp. Wartości, jakie te zmienne przybierają, oznaczamy małymi literami x, y, z…

Jeżeli w wyniku realizacji pewnego doświadczenia pojawi się jakieś zdarzenie E, ze zbioru D, to jest to równoważne zdarzeniu polegającemu na tym, że zmienna losowa X przybiera wartość x, gdzie x jest liczbą przyporządkowaną zdarzeniu E.

Możemy to zapisać w formie:

0x08 graphic

0x01 graphic

Zmienną losową jest więc taka zmienna, która w wyniku doświadczenia przybiera różne wartości z różnym prawdopodobieństwem (np. tak jak na tym rysunku):

0x01 graphic

Rozróżniamy dwa rodzaje zmiennych losowych:

  1. Zmienne losowe skokowe (nieciągłe, dyskretne).

  2. Zmienne losowe ciągłe.

0x08 graphic

Zmiennymi losowymi skokowymi nazywamy takie zmienne, które mają skończony lub przeliczalny zbiór wartości.

Zmienne skokowe mogą zatem przybierać tylko niektóre wartości liczbowe (często są to wartości liczb naturalnych).

Przykłady zmiennej losowej skokowej:

- wydajność robotnika w ilościach detali na godzinę

- liczba detali wadliwych w próbce pobranej od pewnej partii

- liczba wad na pewnej długości tkaniny.

0x08 graphic
Zmiennymi losowymi ciągłymi nazywamy takie zmienne losowe, które mogą przybierać dowolne wartości liczbowe, należące do pewnego przedziału. Zbiór wartości zmiennej losowej ciągłej jest nieskończony i nieprzeliczalny.

Przykłady zmiennej losowej ciągłej:

- ciężar odkuwek

- grubość blachy

- wytrzymałość na rozciąganie stali

- zawartość pierwiastków w stali, itp.

ROZKŁAD I DYSTRYBUANTA SKOKOWEJ ZMIENNEJ LOSOWEJ

Rozważamy zmienną losową X typu skokowego. Każdej realizacji zmiennej przyporządkowane jest pewne prawdopodobieństwo. Zmienna ta przybiera wartości:

x1, x2, x3, …, xi,… xn odpowiednio z prawdopodobieństwem:

p1, p2, p3, …, pi,… pn

0x08 graphic
Rozkładem skokowej zmiennej losowej X nazywamy prawdopodobieństwo tego, że zmienna ta przybiera wartości xi, co zapisujemy:

0x08 graphic

0x01 graphic

Ponieważ wartości xi stanowią pełną grupę zdarzeń, więc 0x01 graphic
.

0x08 graphic
Gdy x jest pewną liczbą rzeczywistą, to prawdopodobieństwo, że zmienna losowa X przybierze wartości mniejsze od liczby x, jest funkcją, którą oznaczamy F(x) i nazywamy dystrybuantą zmiennej losowej X.

0x08 graphic

0x01 graphic

Dystrybuanta może przybierać wartości od 0 do 1.

0x08 graphic

0x01 graphic

Związek pomiędzy funkcją rozkładu i dystrybuantą jest prosty. Uszeregujmy wartości zmiennej losowej X w porządku rosnącym:

0x01 graphic

Gdy liczba rzeczywista x spełnia nierówność:

0x01 graphic

to:

0x01 graphic

Wartość dystrybuanty otrzymuje się więc przez kumulowanie wartości funkcji rozkładu (rysunki).

0x01 graphic

0x01 graphic

DYSTRYBUANTA ZMIENNEJ LOSOWEJ CIĄGŁEJ.

GĘSTOŚĆ PRAWDOPODOBIEŃSTWA.

0x08 graphic

Dystrybuantę zmiennej losowej ciągłej definiuje się podobnie jak dystrybuantę zmiennej losowej skokowej. Jest to więc prawdopodobieństwo zdarzenia polegającego na tym, że zmienna losowa X przyjmuje wartość mniejszą od pewnej rzeczywistej wartości x.

0x08 graphic

0x01 graphic
…………(1)

Rozważmy dwie liczby rzeczywiste x1 i x2. Niech x1 < x2.

Chcemy znaleźć: 0x01 graphic
.

Zdarzenie X < x2 rozkłada się na dwa zdarzenia:

0x01 graphic
oraz 0x01 graphic

Widać, że 0x01 graphic

stąd:

0x08 graphic
0x01 graphic

0x01 graphic
……….. (2)

Posługując się pojęciem dystrybuanty ostatnią równość można zapisać następująco: z (1) i (2) wynika:

0x08 graphic

0x01 graphic
……….. (3)

Dla zmiennej losowej ciągłej funkcję rozkładu należy zdefiniować inaczej niż dla zmiennej losowej skokowej.

Mianowicie:

0x08 graphic

Funkcją rozkładu prawdopodobieństwa zmiennej losowej X (ciągłej) nazywa się prawdopodobieństwo zdarzenia polegającego na tym, że zmienna losowa przyjmuje jedną z wartości należących do pewnego przedziału, co oznacza się symbolem:

0x08 graphic

0x01 graphic

Z wzoru (3) wynika, że funkcja rozkładu zmiennej losowej ciągłej jest przyrostem dystrybuanty, to znaczy, że:

0x01 graphic

Gdy 0x01 graphic
, wtedy 0x01 graphic
, gdzie:

r(x) - pewna nieskończenie mała wartość.

Z określenia różniczki wynika, że:

0x01 graphic
bo 0x01 graphic

gdzie: 0x01 graphic
→ pochodna dystrybuanty.

0x08 graphic
0x01 graphic

0x08 graphic

Jeżeli dystrybuanta F(x) ma pochodną w punkcie x, to pochodna ta nazywa się gęstością prawdopodobieństwa zmiennej losowej X w punkcie x.

Znaczenie gęstości prawdopodobieństwa można zilustrować w sposób następujący:

Jeżeli na osi liczbowej ustali się w dowolnym punkcie x1 dostatecznie mały przedział o długości ∆x, wtedy prawdopodobieństwo, że zmienna losowa X, mająca gęstość f(x), przybiera wartości należące do tego przedziału jest - w przybliżeniu - równe iloczynowi f(x) ∙ ∆x (rysunek).

0x01 graphic

Oznaczając gęstość prawdopodobieństwa symbolem f(x), otrzymamy:

0x08 graphic
0x01 graphic

0x08 graphic
oraz

0x01 graphic

0x08 graphic

Aby dana funkcja mogła być gęstością prawdopodobieństwa, musi spełniać dwa warunki:

1. 0x01 graphic

2. 0x01 graphic

Z określenia gęstości prawdopodobieństwa wynika, że funkcja rozkładu zmiennej losowej X (ciągłej) ma postać:

0x08 graphic
0x01 graphic

PARAMETRY ROZKŁADU ZMIENNEJ LOSOWEJ

Największe znaczenie praktyczne mają dwie grupy parametrów:

  1. Wartość oczekiwana (nadzieja matematyczna) - E(X) - reprezentuje przeciętną, średnią wielkość zmiennej losowej.

2. Wariancja (D2(X)) oraz odchylenie standardowe (odchylenie średnie) - D(X) - dają wyobrażenie o rozrzucie wartości zmiennej losowej.

WARTOŚĆ OCZEKIWANA

A) wartość oczekiwana zmiennej losowej skokowej:

X jest zmienną losową typu skokowego, przybierająca wartości

x1, x2, x3, …, xi, …, xn z prawdopodobieństwem p1, p2, p3, …, pi, …, pn.

Definicja: Wartością oczekiwaną zmiennej losowej X nazywamy sumę iloczynów poszczególnych wartości tej zmiennej przez odpowiadające tym wartością prawdopodobieństwa.

Wartość oczekiwaną oznacza się symbolem E(X).

0x01 graphic

B) wartość oczekiwana zmiennej losowej ciągłej:

Jeżeli przez f(x) oznaczymy funkcję gęstości prawdopodobieństwa zmiennej losowej X, to wartość oczekiwaną E(X) tej zmiennej określamy wzorem:

0x01 graphic

  1. Wartość oczekiwana stałej równa się tej stałej:

0x01 graphic

(Stała jest to zmienna losowa przybierająca tylko jedną wartość z prawdopodobieństwem równym 1).

  1. Wartość oczekiwana sumy dwóch zmiennych losowych X i Y równa się sumie wartości oczekiwanych tych zmiennych.

0x01 graphic

Twierdzenie to można uogólnić na dowolną sumę skończonej liczby zmiennych.

ROZKŁAD NORMALNY (GAUSSA)

Rozkład normalny jest najważniejszym rozkładem zmiennej losowej ciągłej, o bardzo szerokich zastosowaniach praktycznych.

W rozkładzie tym gęstość wyraża się wzorem:

0x01 graphic

gdzie: 0x01 graphic
i m - stałe (tzw. parametry rozkładu). Sens 0x01 graphic
i m podamy poniżej.

Zamiast symbolu 0x01 graphic
używa się zapisu 0x01 graphic
.

Dystrybuanta rozkładu normalnego wyraża się wzorem:

0x01 graphic

Okazuje się, że:

Powyższa całka nie może być wyrażona za pomocą funkcji elementarnych. Wyliczenie wartości F(x) jest żmudne, opiera się na całkowaniu szeregu jednostajnie zbieżnego, na który rozwija się funkcję podcałkową. Jest to rozwinięcie typu:

0x01 graphic

Dla uniknięcia żmudnych rachunków przy wyliczaniu wartości gęstości i dystrybuanty rozkładu normalnego zostały opracowane tabele.

Stabilizowane funkcje gęstości i dystrybuanty rozkładu normalnego mają postać:

0x08 graphic
0x01 graphic

0x01 graphic

Wzory te wyrażają funkcję gęstości i dystrybuanty zmiennej o parametrach m = 0 i 0x01 graphic
= 1.

Zmienną taką nazywamy zmienną standaryzowaną.

Całkę F(x) sprowadzamy do całki 0x01 graphic
przez wprowadzenie nowej zmiennej u:

0x01 graphic

Mianowicie:

0x01 graphic
0x01 graphic

0x08 graphic
ponieważ 0x01 graphic

Zmienna t jest zmienną, względem której całkujemy; jedną z jej wartości jest u - granica całkowania.

Natomiast przy wprowadzaniu zmiennej standaryzowanej określonej wzorem 0x01 graphic
, do funkcji gęstości otrzymujemy:

0x01 graphic

Między funkcją gęstości zmiennej zwykłej i funkcją gęstości zmiennej standaryzowanej istnieje więc następująca zależność:

0x01 graphic

Rozkład normalny jest rozkładem symetrycznym względem punktu x = m. Obliczając pochodną funkcji f(x) i porównując ją do zera, możemy określić maksimum tej funkcji. Maksimum to przypada w punkcie:

0x01 graphic

Na lewo i prawo od swego maksimum funkcja gęstości rozkładu normalnego stale opada, zbliżając się asymetrycznie do osi odciętych.

Punkty przegięcia krzywej gęstości rozkładu normalnego posiadają odcięte 0x01 graphic
.

Rysunek następny przedstawia krzywą gęstości rozkładu normalnego i dystrybuantę.

0x01 graphic

0x01 graphic

Liczba m określa położenie osi symetrii rozkładu, natomiast od parametru 0x01 graphic
zależy wartość maksymalna funkcji gęstości.

W celu zobrazowania znaczenia parametrów m i 0x01 graphic
przedstawiono na rysunku poniższym dwa wykresy gęstości rozkładu normalnego o tym samym 0x01 graphic
, a o różnych m oraz o tym samym m i różnych 0x01 graphic
.

0x01 graphic

0x01 graphic

0x01 graphic

Przykład

Twardość żeliwa szarego (według Brinella) posiada rozkład normalny o parametrach m = 240, 0x01 graphic
= 3 kG/mm2.

Posługując się tabelami rozkładu normalnego (tabela 2), obliczyć:

  1. P(HB < 237)

  2. P(HB < 244)

  3. P(234 0x01 graphic
    HB 0x01 graphic
    246)

  4. P(234 0x01 graphic
    HB 0x01 graphic
    240)

  5. P(HB > 245)

  6. Jeżeli wiadomo, że P(HB < x) = 0,97725, to czemu równa się x.

0x01 graphic

0x01 graphic

0x01 graphic

Rozkład normalny N(240,3)

0x01 graphic
du = 0x01 graphic

a)

0x01 graphic
0x01 graphic
0x01 graphic

0x08 graphic
0x01 graphic
(z tabel)

b)

0x01 graphic

0x08 graphic
0x01 graphic
(z tabel)

0x08 graphic
0x08 graphic
c) 0x01 graphic

d)

0x01 graphic
0x01 graphic

0x08 graphic
0x08 graphic
0x01 graphic

e)

0x08 graphic
0x01 graphic

gdzie:

0x01 graphic

f)

0x01 graphic

z tabel dla 0,97725 u = 2 a stąd

0x01 graphic

Zadanie 2

Sporządzić w tym samym układzie współrzędnych wykresy gęstości zmiennych losowych o rozkładach normalnych N(0,1) N(0,2) N(0,3). Korzystać z tablicy 2 (gęstość).

Obliczyć:

a) 0x01 graphic
jeżeli X jest zmienną losową o rozkładzie normalnym N(1,2)

b) 0x01 graphic
jeśli X jest zmienną losową o rozkładzie normalnym N(4,2).

0x01 graphic

Rozwiązanie:

a)

0x01 graphic
lub 0x01 graphic

czyli 0x01 graphic

0x01 graphic
0x01 graphic

0x08 graphic
0x01 graphic

0x08 graphic
0x08 graphic
0x01 graphic

0x01 graphic

0x01 graphic

0x08 graphic
b)

0x01 graphic
N(4,2) 0x01 graphic
, 0x01 graphic

0x01 graphic

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x01 graphic

Określenie wartości zmiennej mającej rozkład normalny:

0x01 graphic

Wariancja:

0x01 graphic
czyli 0x01 graphic
- odchylenie standardowe

REGUŁA 30x01 graphic

W zastosowaniach technicznych interesuje nas bardzo często prawdopodobieństwo zdarzenia, że wartość zmiennej losowej o rozkładzie N(m,0x01 graphic
) będzie różniła się od wartości oczekiwanej m, co do wartości bezwzględnej o więcej niż o określoną wielokrotność odchylenia standardowego (o więcej niż o k0x01 graphic
, gdzie k > 0).

Gdy X ma rozkład normalny N(m,0x01 graphic
), to zmienna losowa

0x01 graphic
ma rozkład N(0,1). Wynika stąd, że:

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x01 graphic

dla k = 1, 2, 3 z tablic rozkładu normalnego otrzymujemy:

1)0x08 graphic
0x08 graphic
0x01 graphic

0x01 graphic

czyli 0x01 graphic

Inaczej:

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x01 graphic

2) k = 2

0x08 graphic
0x08 graphic
0x01 graphic

0x01 graphic

3) k = 3

0x08 graphic
0x08 graphic
0x01 graphic

0x01 graphic

0x01 graphic

Stąd wniosek, że wartości zmiennej X o rozkładzie N(m,0x01 graphic
), które od wartości oczekiwanej E(X) = m różnią się o więcej niż 30x01 graphic
, są bardzo mało prawdopodobne, a więc praktycznie biorąc nie zachodzą.

Gdy zatem pojawi się taka wartość w toku obserwacji, na przykład procesu technologicznego, to jest to wskazówka mówiąca z dużym prawdopodobieństwem o zakłóceniu, które nastąpiło w tym procesie.

ZJAZD VI, 2.12.2007 r. Ć

Zadanie 1

X - liczba dni słonecznych w Bielsku w ciągu roku

zmienna losowa X podlega rozkładowi normalnemu:

0x01 graphic

a) P(X<250)

b) P(X<120)

c) P(100<X<300)

d) P(70<X<320)

e) P(X>180)

f) P(X>300)

g) Jeżeli wiadomo, że P(X<x1) = 0,879, to ile wynosi x1?

0x01 graphic

a)

0x08 graphic
0x01 graphic

około 84%

0x08 graphic
0x01 graphic
→ z tablic

0x01 graphic

0x08 graphic
0x08 graphic
b) 0x01 graphic
0x01 graphic

0,95

0x08 graphic
0,45

1,60

c)

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x01 graphic

0x08 graphic
0x08 graphic
0x08 graphic
0x01 graphic

d)

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x01 graphic

e)

0x01 graphic

0x01 graphic

F(X) = P(X < x)

0x01 graphic

f)

0x08 graphic
0x01 graphic

g)

w tablicach jest u a nie x:

u = 1,17

0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic

0x01 graphic

Zadanie 2

Wzrost mężczyzn w Polsce - N

N(175,8)

Obliczyć:

a) P(X<160)

b) P(X>190)

c) P(150<X<195)



Wyszukiwarka