Wykład 6: Wybrane rozkłady typu ciągłego
Mediana (zwana też wartością środkową) w statystyce wartość cechy w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji.
Mediana w rozkładach dyskretnych:
Aby obliczyć medianę ze zbioru n obserwacji, sortujemy je w kolejności od najmniejszej do największej i numerujemy od 1 do n. Następnie, jeśli n jest nieparzyste, medianą jest wartość obserwacji w środku (czyli obserwacji numer
). Jeśli natomiast n jest parzyste, wynikiem jest średnia arytmetyczna między dwiema środkowymi obserwacjami, czyli obserwacją numer
i obserwacją numer
.
Mediana M w rozkładach ciągłych:
Dystrybuanta - F(M) = ½ ;
Gęstość - linia pionowa przechodzącą przez argument M dzieli pole pod wykresem gęstości na dwie połowy.
Mediana - kwantyl rzędu ½: M = x½ .
Argument xp jest kwantylem rzędu p, jeżeli
F(xp) = p.
Wartość modalna (moda, dominanta) m: argument maksimum absolutnego gęstości.
f(m) = max.
Rozkład normalny (Gaussa)
Rozkład normalny, zwany też rozkładem Gaussa lub krzywą dzwonową, jest jednym z najważniejszych rozkładów prawdopodobieństwa. Odgrywa ważną rolę w statystycznym opisie zagadnień przyrodniczych, przemysłowych, medycznych, socjalnych itp.
Przyczyną jest jego popularność w naturze. Jeśli jakaś wielkość jest sumą lub średnią bardzo wielu drobnych losowych czynników, to niezależnie od rozkładu każdego z tych czynników, jej rozkład będzie zbliżony do normalnego, stąd można go bardzo często zaobserwować w danych. Ponadto rozkład normalny ma interesujące właściwości matematyczne, dzięki którym oparte na nim metody statystyczne są dość proste obliczeniowo.
μ = EX
.
X ~ N(μ, σ²).
Jeśli μ = 0 i σ = 1, rozkład nazywamy standardowym rozkładem normalnym, którego funkcja gęstości opisana jest wzorem:
.
Im większe σ, tym bardziej płaski jest wykres.
We wszystkich rozkładach normalnych funkcja gęstości jest symetryczna względem wartości średniej rozkładu.
Rozkład normalny |
|
|
|
|
Około 68% pola pod wykresem krzywej Gaussa znajduje się w odległości jednego odchylenia standardowego od średniej, około 95,5% w odległości dwóch odchyleń standardowych i około 99,7% w odległości trzech (reguła trzech sigm).
Procent populacji wpadający do poszczególnych przedziałów o szerokości jednego odchylenia standardowego, przy założeniu rozkładu normalnego zmiennej. Krzywa przedstawia gęstość prawdopodobieństwa rozkładu normalnego.
Dokładne wartości dla kilku naturalnych wielokrotności odchylenia przedstawia tabela:
maksymalne oddalenie |
odsetek obserwacji |
Σ |
0,6826895 |
2σ |
0,9544997 |
3σ |
0,9973002 |
4σ |
0,9999366 |
5σ |
0,9999994 |
2) Rozkład wykładniczy to rozkład zmiennej losowej opisujący sytuację, w której obiekt może przyjmować stany X i Y, przy czym obiekt w stanie X może ze stałym prawdopodobieństwem przejść w stan Y w jednostce czasu. Prawdopodobieństwo wyznaczane przez ten rozkład to prawdopodobieństwo przejścia ze stanu X w stan Y w czasie δt.
Zmienna losowa o rozkładzie wykładniczym opisuje wiele często spotykanych zjawisk.
Przykład: przyjmuje się, iż czas bezawaryjnej pracy T badanego elementu (tzw. czas życia elementu) jest zmienną losową o rozkładzie wykładniczym. Wówczas:
P(T ≥ t) = exp(-λt)
nazywamy niezawodnością elementu, a
λ - intensywnością awarii.
Innymi słowy, jeżeli w jednostce czasu ma zajść 1/λ niezależnych zdarzeń, to rozkład wykładniczy opisuje odstępy czasu pomiędzy kolejnymi zdarzeniami.
Gęstość: f(x) =
, x ≥ 0 , λ > 0.
Dystrybuanta: F(x) =
, x ≥ 0 , λ > 0.
Rozkład wykładniczy |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3) Rozkład Cauchy'ego
a = ? , b = ?
F(-∞) = 0, F(+∞) = 1
f(x) = ?
EX = ?
Rozkład Cauchy'ego |