103
103
/
<5.97.)
= P
Jij
Zwróćmy uwagę, że w tablicy tej prawdopodobieństwo zapisane w e-statniej kolumnie są sumą prawdopodobieństw występujących w poszczególnych wierszach, a ostatni wiersz stanowi sumę prawdopodobieństw występujących w kolumnach. Zapis np, p^ oznacza więc sumę prawdopodobieństw p11»P12» ..., P^n ..., P-jm i czytamy, że Jest to prawdopodobieństwo przyjęcia przez zmienną X wartości bez względu na to, jakie wartości przyjmie Y.
Przyjmijmy dalej, że oznacza prawdopodobieństwo X = x^ przy założeniu, że Y = y^, a oznacza prawdopodobieństwo Y = yj przy założeniu, że X = x^. Prawdopodobieństwo równoczesnego zajścia obu tych zdarzeń równa się:
!i(yj)' p(*i)j
Rozkłady prawdopodobieństw zapisane w ostatniej kolumnie i ostatnim wierszu tablicy 5.22. to tzw. rozkłady brzegowe. W poszczególnych komórkach (polach) tablicy występują rozkłady warunkowe prawdopodobieństw, Oznaczają one rozkłady X dla danego Y oraz rozkłady Y dla danego X. Jakie zatem jest prawdopodobieństwo X = pod warunkiem równoczesnego Y = y^? Odpowiedź przynosi formuła:
C5-98'}
a odwrotnie:
Oczywiście, ZP^Jy^) = 1, podobnie , jak £p(y | x±) = 1. Parametrami ta.kiego rozkładu zmiennej losowej "dwuwymiarowejn są funkcja rozkładu prawdopodobieństw i dystrybuanta.
o stoiLjstyJo' ciur S2cjcicq6u “ 109
W pierwszej części skryptu poznaliśmy pewne metody charakteryzo-y/ania badanych zbiorowości. Były to tzw. parametry opisowre zbiorowości statystycznych. Jak jednak zaznaczaliśmy, na ogół badaniu podlegają nie oałe populacje, lecz ich części, tzw. próby. W związku z tym zachodzi konieczność poznania takich metod, które umożliwiałyby formułowanie sądów o całości populacji na podstawie informacji uzyskanych o próbie. Metodami takimi zajmuje się Statystyka indukcyjna, a proces formułowania tego typu sądów to wnioskowanie statystyczne (indukcja statystyczna). Wyróżniamy dwa sposoby wnioskowania:
- estymację parametrów (teoria estymacji),
- weryfikację hipotez (teoria weryfikacji hipotez).
Podstawą estymacji i weryfikacji hipotez są rachunek prawdopodobieństwa i zasady rozkładów zmiennych losowych, a wiarygodność wnioskowania zależy od kilku elementów.
Na wstępie ustalmy, że wspomniane parametry opisowe mogą odnosić się do próby i do zbiorowości generalnej. Jeżeli miary te odnoszą się do całej populacji generalnej, będziemy je nazywali, parametrami. Jeżeli natomiast miary te odnoszą się do próby, to nazywać je będziemy statystykami (parametrami z próby). Tak więc np, średnia arytmetyczna obliczana dla próby jest statystyką, a ta sama średnia obliczana dla populacji generalnej to parametr. Rozróżnienie to należy sobie dobrze przysv/oió, bo w trakcie wnioskowania wielokrotnie tymi terminami będziemy się posługiwać.
Poznane w pierwszej części parametry (dotyczące całej populacji) mają charakter wielkości nielosowych, stałych, ponieważ oblicza się je na podstawie wszystkich wartości zmiennej występujących w populacji. W przeciwieństwie do nich statystyki, (parametry z próby) mają charakter losowy, ponieważ oblicza się je na podstawie wartości zmiennej wylosowanych z populacji, Statystyki są więc zmiennymi lo-