5. Zmienna losowa, podstawowe rozkłady prawdopodobieństwa zmiennych losowych:
Zmienna losowa - każda funkcja mierzalna określona na przestrzeni zdarzeń elementarnych E, która w wyniku doświadczenia może przyjąć wartość z pewnego zbioru liczb rzeczywistych z określonym prawdopodobieństwem.
Zmienne losowe możemy podzielić na:
zmienne skokowe (dyskretne) - zmienna losowa, której zbiór różnych wartości jest przeliczalny albo skończony.
→ Przykłady: liczba prosiąt w miocie, liczba dzieci w rodzinie, liczba nasion w kłosie.
zmienne ciągłe - zmienna losowa, której zbiór jej możliwych realizacji jest nieskończony i nieprzeliczalny.
→ Przykłady: wzrost, waga, wiek poszczególnych osób.
Rozkład prawdopodobieństwa zmiennej losowej to funkcja przyporządkowująca realizacjom (wartościom) zmiennej losowej X odpowiadające im prawdopodobieństwo.
Rozkłady prawdopodobieństw dla zmiennych losowych skokowych (DYSKRETNYCH)
Dystrybuanta to prawdopodobieństwo nieprzekroczenia przez zmienną losową X pewnej wartości xi. - funkcja niemalejącą i przyjmuje wartości od 0 do 1.
Parametry rozkładu zmiennej losowe (skokowej)j: Są to liczby charakteryzujące w pewien sposób zbiór wartości, jakie może przybierać zmienna losowa. Wartość oczekiwana (wartość przeciętna, nadzieja matematyczna) - parametr reprezentujący przeciętną (średnią) wielkość zmiennej losowej, Wariancja - parametr informujący o rozrzucie wartości zmiennej losowej, jest wartością oczekiwaną kwadratu zmiennej, pomniejszonej o kwadrat wartości oczekiwanej Odchylenie standardowe - parametr informujący o rozrzucie wartości zmiennej losowej, jest pierwiastkiem kwadratowym z wariancji
Rozkład Bernoullego (dwumianowy, binominalny): wykonujemy n niezależnych doświadczeń (wynik każdego doświadczenia nie zależy od wyników doświadczeń poprzednich), przy czym może przyjąć tylko jedną z dwóch możliwości: sukces lub porażkę. Każdy z uzyskanych wyników jest tak samo prawdopodobny (w pojedynczym doświadczeniu).
Prawdopodobieństwo uzyskania sukcesu w każdym z n doświadczeń jest jednakowe i równe p.
Prawdopodobieństwo uzyskania porażki oznaczamy przez q = 1 - p.
Zmienną losową w tym rozkładzie jest liczba uzyskanych sukcesów - k.
Parametry rozkładu Bernoullego: liczba doświadczeń - n, prawdopodobieństwo uzyskania sukcesu w pojedynczym doświadczeniu - p
Zastosowanie: rzut monetą, zdarzenia związane z występowaniem w tekście TAK lub NIE,
Rozkład Poissona (zdarzeń rzadkich): modyfikacja rozkładu dwumianowego, prawdopodobieństwo sukcesu p w pojedynczym doświadczeniu jest bardzo małe (p<0,2) a liczba niezależnych doświadczeń duża (n>100)
Zmienną losową w tym rozkładzie jest liczba uzyskanych sukcesów - k.
Parametry rozkładu Poissona: liczba doświadczeń - n, prawdopodobieństwo uzyskania sukcesu w pojedynczym doświadczeniu - p
Zastosowanie: rozmieszczenie gwiazd w przestrzeni kosmicznej, oddziaływanie promieniowania na komórkę, badania dotyczące nowotworów
Rozkłady prawdopodobieństw dla zmiennych losowych CIĄGŁYCH:
Rozkład normalny (Gaussa-Laplace'a): Parametry rozkładu normalnego: średnia arytmetyczna w populacji generalnej -
(wartość oczekiwana), odchylenie standardowe w populacji generalnej - σ
Definicja gęstości normalnej; Funkcją gęstości prawdopodobieństwa zmiennej losowej typu ciągłego nazywamy funkcję f(x), określoną na zbiorze liczb rzeczywistych o następujących własnościach: f(x) » 0 dla każdego x należącego do R
Właściwości rozkładu normalnego: 1.Wykres krzywej gęstości rozkładu normalnego ma kształt dzwonu 2. Rozkład normalny - symetrycznym. Oś symetrii przechodzi przez średnią arytmetyczną w populacji generalnej. 3. Lewe i prawe ramię (ogony) wykresu funkcji gęstości rozkładu normalnego zbliżają się asymptotycznie (nigdy nie dotkną) do osi odciętych 4. Średnia arytmetyczna powoduje przesunięcie wykresu w prawo lub w lewo. 5.Parametr σ powoduje że krzywa funkcji gęstości rozkładu normalnego jest bardziej wysmukła lub bardziej spłaszczona. 6. Dla rozkładu normalnego zachodzi dana równość: X=Me=Mo, ponieważ jest to rozkład symetryczny. 7. Pole pod krzywą funkcji gęstości = 1. 8. Możemy obliczać prawdopodobieństwo przedziałowe, a nie konkretnych wartości. Można obliczyć przedział odejmując dystrybuanty.
Rozkład normalny standaryzowany: jeśli wartości zmiennej losowej X o rozkładzie normalnym i parametrach X:(
; σ) podda się przekształceniu (kodowaniu) czyli zastosuje się standaryzację za pomocą wzoru:, to otrzymamy nową zmienną losową
o parametrach
:N(0,1) i rozkładzie normalnym.
Rozkład t-studenta (Gosset'a):
Parametr rozkładu t-studenta: liczba stopni swobody: df=n-1
Zastosowanie: głównie do badania małych prób
Krzywa gęstości rozkładu t-studenta: podobnie jak krzywa gęstości rozkładu normalnego jest symetryczna z osią symetrii dla t=0, tylko dla rozkładu t- Studenta występuje niewielkie spłaszczenie.
Gdy n>30 rozkład t-Studenta jest praktycznie nierozróżnialny od rozkładu normalnego.
Rozkład chi-kwadrat: jest ciągiem niezależnych zmiennych losowych normalnych o tym samym rozkładzie N (0,1).
Parametr rozkładu χ2: liczba stopni swobody: v=n-1
Zmienna losowa x przyjmuje wartości dodatnie.
Krzywa gęstości rozkładu χ2: Dla małych wartości parametru jest to rozkład silnie asymetryczny, jednak w miarę wzrostu staje się coraz bardziej symetryczny i podobny do rozkładu normalnego. Gdy n >30 rozkład jest szybko zbieżny do rozkładu normalnego, wtedy korzysta się z rozkładu normalnego.