NIEZAWODNOŚĆ I BEZPIECZEŃSTWO
SYSTEMÓW INŻYNIERSKICH
Temat: Zastosowanie rozkładu normalnego
Magdalena Pińkowska
Studia II stopnia, sem.3
Łódź, 2011 r.
WSTĘP
Rozkład normalny zwany także rozkładem Gaussa jest niezwykle ważnym rozkładem prawdopodobieństwa w wielu dziedzinach, w szczególności w fizyce, ekonomii i inżynierii. Jest to rodzina nieskończenie wielu rozkładów, definiowanych dwoma parametrami: średnią (odpowiada za położenie rozkładu) i odchyleniem standardowym (skala). Standardowy rozkład normalny to rozkład normalny ze średnią zero i odchyleniem standardowym jeden. Ponieważ wykres funkcji gęstości rozkładu normalnego przypomina dzwon, często nazywa się go krzywą dzwonową.
HISTORIA
Rozkład normalny został po raz pierwszy przedstawiony przez de Moivre'a w 1773 r. w artykule (przedrukowany w drugim wydaniu Doktryny Szans w 1738 r.) w kontekście aproksymacji niektórych rozkładów dwumianowych dla dużych n. Wyniki tych badań zostały rozwinięte przez Laplace'a w książce Analityczna teoria prawdopodobieństwa w 1812 r. i teraz są nazywane twierdzeniem de Moivre'a-Laplace'a. Laplace użył rozkładu normalnego w analizie błędów pojawiających się w eksperymentach. Ważna w teorii prawdopodobieństwa Metoda najmniejszych kwadratów została wprowadzona przez Legendre'a w 1805 r., jednak Gauss, który twierdził, że używał tej metody od 1794 r., uzasadnił ją silnie w 1809 r. dzięki założeniu o normalnym rozkładzie błędów.
Jeżeli chodzi o nazwę „krzywa dzwonowa” pochodzi ona od Joufretta, który użył terminu powierzchnia dzwonowa w 1872 r. dla dwuwymiarowego rozkładu normalnego z niezależnymi składnikami. Nazwa rozkład normalny została wymyślona jednocześnie przez Charlesa S. Peirce'a, Francisa Galtona i Wilhelma Lexisa około roku 1875 r. Ta terminologia nie jest najlepsza, gdyż sugeruje, że wszystko ma rozkład normalny. Fakt, że rozkład ten jest nazywany normalnym albo Gaussa, zamiast de Moivre'a, jest przykładem działania prawa Stingera.
DEFINICJA ROZKŁADU NORMALNEGO
Zmienna losowa X ma rozkład normalny z wartością oczekiwaną równą m i odchyleniem standardowym równym σ
, jeśli jej funkcja gęstości ma następującą postać:
Wykres funkcji gęstości rozkładu normalnego przyjmuje następującą postać:
We wszystkich rozkładach normalnych funkcja gęstości jest symetryczna względem wartości średniej rozkładu.
Krzywa gęstości rozkładu normalnego ma następujące własności:
jest symetryczna względem prostej x = m,
osiąga maksimum równe dla x = m,
jej ramiona mają punkty przegięcia dla x = m - σ oraz x = m + σ.
Wartość parametru m decyduje o położeniu krzywej normalnej względem osi x. Im średnia przyjmuje większe wartości, tym krzywa jest bardziej przesunięta w prawo. Wartość parametru σ determinuje natomiast „smukłość” krzywej. Im odchylenie standardowe jest większe, tym krzywa jest bardziej spłaszczona.
Z rozkładem normalnym związana jest tzw. reguła trzech sigm, zgodnie z którą praktycznie wszystkie obserwacje dokonywane na zmiennej losowej o rozkładzie normalnym mieszczą się w przedziale (m-3σ, m+3σ). Reguła trzech sigm jest wykorzystywana w badaniach statystycznych do eliminacji obserwacji niewiarygodnych. Obserwacje niewiarygodne to obserwacje, których wartość różni się od średniej o więcej niż trzy odchylenia standardowe. Przyjmuje się, iż zmienne, które odbiegają tak znacznie od średniej mogą być skutkiem błędu pomiaru. Dla realizacji zmiennej losowej o dowolnym rozkładzie normalnym około 68,3% obserwacji mieści się w granicach jednego odchylenia standardowego wokół średniej, 95,5% obserwacji mieści się w granicach dwóch odchyleń standardowych i 99,7% w granicach trzech odchyleń standardowych.
Dystrybuanta rozkładu normalnego ma postać:
Wykres dystrybuanty zmiennej losowej
przyjmuje następującą postać:
Wartość oczekiwana i wariancja dla rozkładu normalnego wyrażane są następującymi wzorami:
Parametr m oznacza średnią zmiennej losowej X o rozkładzie normalnym, natomiast parametr σ oznacza jej odchylenie standardowe.
WŁASNOŚCI
Jeśli X ~ N(μ, σ2) i a i b są liczbami rzeczywistymi, to aX + b ~ N(aμ + b, (aσ)2).
Jeśli X1 ~ N(μ1, σ12) i X2 ~ N(μ2, σ22), i X1 i X2 są niezależne, to X1 + X2 ~ N(μ1 + μ2, σ12 + σ22).
Jeśli X1, ..., Xn są niezależnymi zmiennymi losowymi o standardowym rozkładzie normalnym, to X12 + ... + Xn2 ma rozkład chi-kwadrat z n stopniami swobody.
STANDARYZOWANIE ZMIENNYCH LOSOWYCH O ROZKŁADZIE NORMALNYM
Konsekwencją własności 1 jest możliwość przekształcenia wszystkich zmiennych losowych o rozkładzie normalnym do standardowego rozkładu normalnego.
Standardowym rozkładem normalnym nazywamy rozkład normalny ze średnią równą 0 oraz odchyleniem standardowym równym 1 i oznaczamy N(0,1).
Zmienną losową, która ma standardowy rozkład normalny oznacza się literą U, jej funkcję gęstości φ(u), natomiast dystrybuantę Φ(u).
Wykres funkcji gęstości standardowego rozkładu normalnego przyjmuje następującą postać:
Wykres dystrybuanty standardowego rozkładu normalnego przyjmuje postać:
Dystrybuanta standardowego rozkładu normalnego charakteryzuje się następującymi własnościami:
Ze względu na fakt, iż w tablicach najczęściej podawane są wartości tylko dla dodatnich u, przy wyznaczaniu wartości dla ujemnych u należy skorzystać z następujących własności funkcji φ(u) i Φ(u):
W celu obliczenia prawdopodobieństwa P(a < X ≤ b) należy skorzystać z operacji nazywanej standaryzacją. Jeśli zmienna losowa X ma rozkład
to zmienna standaryzowana
ma rozkład N(0,1). Na tej podstawie można wyznaczyć:
Wartości
i
odczytuje się z tablic dystrybuanty standardowego rozkładu normalnego.
Standardowy rozkład normalny został stablicowany i inne rozkłady normalne są prostymi transformacjami rozkładu standardowego. W ten sposób możemy używać tablic dystrybuanty rozkładu normalnego do wyznaczenia wartości dystrybuanty rozkładu normalnego o dowolnych parametrach.
ZASTOSOWANIE ROZKŁADU NORMALNEGO
Rozkład normalny jest jednym z najważniejszych rozkładów prawdopodobieństwa. Odgrywa ważną rolę w statystycznym opisie zagadnień przyrodniczych, przemysłowych, medycznych, socjalnych, ekonomicznych itp. Przyczyną jest jego częstość występowania w naturze. Jeśli jakaś wielkość jest sumą lub średnią bardzo wielu drobnych losowych czynników, to niezależnie od rozkładu każdego z tych czynników, jej rozkład będzie zbliżony do normalnego, stąd można go bardzo często zaobserwować w danych. Ponadto rozkład normalny ma interesujące właściwości matematyczne, dzięki którym oparte na nim metody statystyczne są dość proste obliczeniowo.
Przykład 1. Zastosowanie rozkładu normalnego w życiu codziennym - wzrost człowieka. I tak :
Wzrost kobiet w pewnej populacji ma rozkład normalny N(165,15). Oznacza to, iż zmienna losowa jaką jest wzrost kobiet ma rozkład normalny ze średnią równą 165 cm i odchyleniem standardowym równym 15 cm.
Jaki jest udział w populacji kobiet o wzroście:
a) do 160 cm,
b) w przedziale 165-170 cm,
c) powyżej 175 cm.
Innymi przykładami mogą być:
test na inteligencje,
natężenie źródła światła,
badanie dochodu i ryzyka inwestycji, itp.
ZASTOSOWANIE ROZKŁADU NORMALNEGO W NIEZAWODNOŚCI I BEZPIECZEŃSTWIE SYSTEMÓW INŻYNIERSKICH
Teoria niezawodności obejmuje metody badawcze pozwalające na uzyskiwanie i przetwarzanie informacji o takich własnościach obiektów technicznych, jakie ujawniają się w procesie ich użytkowania i świadczą o ich przydatności w realizacji zadań, dla których one skonstruowane i wyprodukowane. Celem ogólnym badania niezawodności jest uzyskanie danych niezbędnych do wyznaczenia wartości wskaźników niezawodności oraz sprawdzenia wartości wskaźników niezawodności obiektu z wymaganiami podanymi w dokumentacji technicznej lub umowach handlowych.
Do badań niezawodności często wykorzystuje się statystyczne metody oceny wyników badań. Jeżeli obserwowana zmienna jest zmienną losową ciągłą to dla określenia postaci funkcyjnej dystrybuanty jej rozkładu należy rozważyć możliwość przyjęcia jednego z poniższych rozkładów:
rozkładu normalnego,
rozkładu logarytmiczno-normalnego,
rozkładu Weibulla,
rozkładu wykładniczego.
Rozkład normalny jest jednym z modeli obiektów nieodnawialnych opisujących jego niezawodność, tzn. przewidywana zdolność do realizacji nakładanych zadań w określonych warunkach i określonym przedziale czasowym. Aby rozszerzyć zapas modeli czasu zdatności obiektu wykorzystuje się rozkład normalny dla którego P(T<0)>0. Wówczas funkcja niezawodności ma postać:
gdzie,
Zachodzi tez związek:
Intensywność uszkodzeń przyjmuję wówczas postać:
Intensywność uszkodzeń w przypadku rozkładu normalnego wzrasta bardzo powoli dla małych t, w pobliżu t=m zaczyna wzrastać i zbliża się do asymptoty ukośnej, której kąt nachylenia do osi czasu jest tym większy, im mniejsze jest odchylenie standardowe σ. Oznacza to, że przy bardzo małej wartości σ obiekty prawie wyłącznie uszkadzają się w czasie zbliżonym do oczekiwanego czasu zdatności. Dlatego rozkład normalny jest odpowiednim modelem czasu zdatności obiektu w tych przypadkach, gdy uszkodzenia powodowane są stopniowo zachodzącymi nieodwracalnymi zmianami o charakterze starzenia.
Przykład 2. Zastosowanie rozkładu normalnego do określenia niezawodności i intensywności uszkodzeń obiektów.
Czas zdatności ma rozkład normalny o parametrach μ=8 000 h i σ=2 000 h. Jaka będzie wartość funkcji niezawodności oraz intensywność uszkodzeń dla chwili 2 000 i 10 000 h.
Korzystając z powyższych zależności otrzymujemy:
Dla chwili 2 000 mamy:
R(2 000)≈F0(3)≈0,999
λ(2 000)≈2,22∙10-6
Dla chwili 10 000 mamy:
R(10 000)≈F0(-1)≈0,159.
λ(10 000)≈7,59∙10-4.
Przykład 3. Analiza uszkodzeń obiektów systemów w okresie uszkodzeń starzeniowych
Założenia i przyjęte oznaczenia:
Obserwowana jest grupa N nieodnawianych obiektów typu mechanicznego. Zakłada się podział tej grupy obiektów na dwie frakcje (rys.1). Pierwszą z nich o liczności π stanowią obiekty, które ulegają uszkodzeniom wczesnym i przypadkowym. Drugą frakcję obiektów o liczności Ns stanowią te, które ulegają uszkodzeniom na skutek starzenia. Chwile czasowe przewidywanych uszkodzeń obiektów tworzą szereg pozycyjny:
Rys. 1. Schemat wybranych oznaczeń w formułach modeli matematycznych
Czas obserwacji uszkodzeń obiektów podzielono na przedziały o równej długości (rys.1):
W kolejnych przedziałach czasu rejestruje się liczby n (Δti-1,i) uszkodzeń obiektów, a w chwilach pokrywających się z górnymi granicami przedziałów czasowych wyznacza się skumulowane liczby uszkodzeń (rys.1):
Zakłada się, że rozkład czasu T do uszkodzeń obiektów nieodnawianych zaliczonych do frakcji drugiej jest rozkładem normalnym N(μ,σ).
Przyjmuje się, że początek uszkodzeń starzeniowych przypada na chwilę tp (rys. 1), tzn. przyjmuje się, że uszkodzenie pierwszego obiektu będące wynikiem jego starzenia pokrywa się z chwilą tp. Zakłada się, że proces starzenia przebiega tak, że wszystkie Ns obiektów drugiej frakcji uszkadza się do chwili tk+r . Z założeń tych wynika, że:
a dodatkowo zakłada się, że
Prognostyczny model parametrów rozkładu obiektów to formuły matematyczne na estymatory parametrów rozkładu czasu T do uszkodzeń starzeniowych obiektów (rozkład normalny N(μ,σ)). Estymatory te oszacowuje się na podstawie liczby n (Δtp,k) uszkodzeń obiektów w okresie od chwili tp do chwili tk oraz liczności Ns obiektów, dla których przewiduje się, że ulegną uszkodzeniom na skutek ich starzenia. Schemat ideowy tego prognostycznego modelu przedstawiono na rys. 2.
Rys. 2. Schemat ideowy prognostycznego modelu parametrów rozkładu uszkodzeń obiektów w okresie uszkodzeń starzeniowych
Obserwując uszkodzenia obiektów w kolejnych przedziałach czasu można wskazać chwilę tp początku uszkodzeń starzeniowych. Pomocnym w tym względzie może być śledzenie przebiegów empirycznych postaci funkcji fn(t) gęstości prawdopodobieństwa czasu T do uszkodzenia obiektów i funkcji λn(t) intensywności uszkodzeń. Wartości tych funkcji na końcach przedziałów czasowych wyznacza się z zależności:
Łatwo jest zauważyć, że
gdzie: FN(μ,σ)(tp), FN(μ,σ)(tk) − są wartościami dystrybuant rozkładu N(μ,σ) uszkodzeń starzeniowych w chwilach czasowych odpowiednio tp i tk, a z przyjętych założeń wynika, że: FN(μ,σ)(tp)=0
Jeżeli różnicę realizacji zmiennej losowej T odpowiadających chwilom czasowym tp i tk wyrazi się w jednostkach odchylenia standardowego rozkładu N(0,1), to otrzyma się następującą zależność:
gdzie: F-1N(0,1)(x) - jest zapisem oznaczającym wartości odwrotne dystrybuant rozkładu N(0,1) w punkcie x.
Ponieważ FN(0,1)(-3)=0,0013499, to można przyjąć, że F-1N(0,1)(0)≅-3.
Zatem uwzględniając zależność F-1N(0,1)(0)≅-3 mamy;
Ostateczną postać modelu (estymator odchylenia standardowego σ) i estymator wartości oczekiwanej μ)) można przedstawić za pomocą formuł:
oraz
Dodatkowo − na podstawie przyjętych założeń − można przyjąć, że uszkodzenie N-tego obiektu nastąpi w chwili
Idea prognostycznego modelu liczb uszkodzeń obiektów w okresie ich starzenia opiera się na oszacowanych wcześniej wartościach parametrów rozkładu uszkodzeń starzeniowych i znajomości liczby uszkodzonych obiektów od chwili tp do chwili tk+j-1 początku okresu dokonywania prognozy. Schemat ideowy algorytmu modelu prognozowania uszkodzeń pokazano na rys. 3.
Rys. 3. Schemat ideowy prognostycznego modelu liczb uszkodzeń obiektów w okresie uszkodzeń starzeniowych
Krok 1-szy. Prognozowanie liczby uszkodzeń obiektów w przedziale czasu (tk, tk+1)
Na podstawie założenia, że parametry rozkładu uszkodzeń starzeniowych nie ulegają zmianie w kolejnych przedziałach czasu, to:
a stąd
Po wykonaniu operacji funkcji odwrotnej otrzymuje się:
a gdy zauważy się, że:
to liczbę uszkodzeń obiektów w przedziale czasu (tk, tk+1) można wyznaczyć z zależności:
Krok 2-gi. Prognozowanie liczby uszkodzeń obiektów w przedziale czasu (tk+1, tk+2).
Wykorzystując wyniki obliczeń dokonanych w kroku 1-szym i powtarzając zastosowany w nim algorytm obliczeniowy, liczbę uszkodzeń obiektów w przedziale czasu (tk+1,tk+2) można wyznaczyć z zależności:
Krok j-ty. Prognozowanie liczby uszkodzeń obiektów w przedziale czasu( tk+j-1, tk+j)
Uogólniając wyniki obliczeń uzyskane w krokach 1-szym i 2-gim, można zauważyć, że liczbę uszkodzeń obiektów w przedziale czasu (tk+j-1, tk+j), j =1,2, ... , r, (rys. 3) wskazuje zależność:
gdzie:
Literatura:
Bobrowski D., Modele i metody matematyczne teorii niezawodności w przykładach i zadaniach, Wydawnictwo Naukowo-Techniczne, Warszawa 1985,
Migdalski J. (red.), Poradnia niezawodności. Podstawy matematyczne, Wydawnictwo Przemysłu Maszynowego „WEMA” Warszawa 1982,
www.wikipedia.org
2