Zmienna losowa jest to taka zmienna, która przybiera różne wartości liczbowe z określonymi prawdopodobieństwami (inaczej jest to funkcja rzeczywista, jednoznacznie określona na zbiorze zdarzeń elementarnych).
Zmienne losowe oznaczamy zazwyczaj dużymi literami np. X, Y, Z. Wartości przyjmowane przez zmienne (zwane realizacjami zmiennych) oznaczane są odpowiednimi małymi literami xi, yi, zi.
Zmienna losowa jest odpowiednikiem pojęcia cechy statystycznej, ale zmienna jest zdefiniowana nie tylko przez zbiór możliwych realizacji, ale również przez odpowiednią funkcję rozkładu prawdopodobieństwa.
Wyróżniamy zmienną losową skokową (dyskretną) i ciągłą. Zmienną losową nazywamy skokową, jeżeli zbiór wartości, które może przyjmować zmienna jest skończony lub przeliczalny. Zmienną losową nazywamy ciągłą, jeżeli zbiór wartości, które może przyjmować zmienna jest nieprzeliczalny.
Zmienna losowa skokowa
Najważniejsze pojęcia to funkcja rozkładu prawdopodobieństwa i dystrybuanta.
Funkcja rozkładu prawdopodobieństwa (rozkład prawdopodobieństwa) jest to funkcja przyporządkowująca dopuszczalnym wartościom xi prawdopodobieństwa pi. tzn:
P (X = xi) = pi
Dystrybuanta
F (xi) = P (X
xi)
Jest to funkcja określająca prawdopodobieństwo tego, że wartość zmiennej X będzie mniejsza lub równa xi.
Podobnie jak dla cechy tak samo dla zmiennej losowej można obliczyć parametry opisujące rozkład np.: wartość oczekiwaną, wariancję, miary asymetrii i koncentracji.
Wartość oczekiwana:
Wariancja:
Najczęściej stosowane w statystyce rozkłady zmiennej losowej skokowej to: rozkład zero-jedynkowy, dwumianowy i Poissona.
Rozkład zero-jedynkowy - jest rezultatem doświadczenia, w wyniku którego określone zdarzenie A wystąpi lub nie wystąpi. Zdarzeniom elementarnym realizującym zdarzenie A przyporządkowana jest liczba 1, a zdarzeniom elementarnym nie realizującym zdarzenie A liczba 0.
Jeżeli P(A) = p to P(
) = 1-p = q gdzie:
oznacza zdarzenie przeciwne
P(X = 1) = p P(X = 0) = q
Rozkład dwumianowy (Bernouliego)
Jeżeli chcemy określić prawdopodobieństwo wystąpienia k razy określonego zdarzenia w n niezależnych doświadczeniach, przy danym prawdopodobieństwie p wystąpienia tegoż zdarzenia w pojedynczym doświadczeniu korzystamy z rozkładu dwumianowego:
gdzie: n - ilość niezależnych doświadczeń ogółem,
p - prawdopodobieństwo wystąpienia zdarzenia w pojedynczym doświadczeniu,
q - prawdopodobieństwo niewystąpienia zdarzenia w pojedynczym doświadczeniu,
k - ilość doświadczeń w których ma wystąpić dane zdarzenie.
Jeżeli: p = q to rozkład jest symetryczny
p < q to rozkład jest prawostronnie asymetryczny
p > q to rozkład jest lewostronnie asymetryczny
Dla rozkładu dwumianowego zachodzi:
E(X) =
Rozkład Poissona
Rozkład ten jest szczególnym przypadkiem rozkładu dwumianowego, gdy iloczyn n i p jest liczbą stałą:
Zmienna losowa X ma rozkład Poissona, jeżeli jej rozkład prawdopodobieństwa jest określony wzorem:
gdzie e
2,7182
Zakłada się, że dla n > 20 i p < 0,2 rozkład dwumianowy można zastąpić rozkładem Poissona. Rozkład Poissona jest rozkładem prawostronnie asymetrycznym.
Dla rozkładu Poissona zachodzi:
Zmienna losowa ciągła
Dla zmiennej losowej ciągłej niemożliwe jest przypisanie konkretnym wartościom określonych prawdopodobieństw, ponieważ:
P(X = a) = 0 (wynika to z matematycznej definicji zmiennej losowej ciągłej)
Nie oznacza to, że zdarzenie jest niemożliwe, ale jest mało prawdopodobne. Możliwe jest jednak przyporządkowanie prawdopodobieństw przedziałom liczbowym.
.
Podstawowym rozkładem zmiennej losowej ciągłej jest rozkład normalny. Zmienna losowa X ma rozkład normalny, jeśli jej funkcja gęstości prawdopodobieństwa wyraża się wzorem:
gdzie: m = E(X),
Jeżeli zmienna losowa ma rozkład normalny, to zapisujemy to w skrócie w następujący sposób:
. Rozkład normalny charakteryzują zatem dwa parametry: wartość oczekiwana i odchylenie standardowe.
Z rozkładem normalnym mamy do czynienia gdy na dane zjawisko oddziałuje duża liczba niezależnych czynników, których wpływ traktowany odrębnie jest mało znaczący. Na przykład rozkład normalny lub bardzo zbliżony do normalnego mają takie zmienne jak:
1. waga i wzrost osobników jednorodnych populacji ludzkich lub zwierzęcych,
2. losowe błędy pomiarów,
3. dochody jednorodnych grup pracowników (np. rzemieślników, rolników, itd.),
4. wykonanie norm pracy przez robotników w jednorodnych warunkach pracy przez jednorodną grupę wykonawców.