czy P(A[B)=P(AB)/P(B) po prostu (to by było z aksjomatów)
-a z częstotliwości; nab - liczebność AB nb - liczebność B najb - liczebność AjB
i trzeba napisać, ze na|b = nab / nb
czyli P(AjB)~lim na|b / n = lim (nab/n) / (nb/n) ^ (lim nab/n) / (lim nb/n) = P(AB)/P(B)
Co do aksjomatycznej wersji, to można narysować sobie 2 zbioiy o pewnej części wspólnej w jakimś prostokącie. Jeden zbiór oznaczał będzie doświadczenia sprzyjające A, drugi sprzyjające B, część wspólna - sprzyjające AB , a cały prostokąt - omegę,
Teraz mamy z rysuneczku :
P(A)^|Aj/)omega|
P(AB)=lAB|/|omega|
P(A|B)=jAB[/iB|
więc P(AjB)=jAB;/jBj=(SAB|/omega)/(iBJ/Somega!)=P(AB)/P{B)
Sigma jest dokładnym oszacowaniem ogona, ale tylko dla rozkładu normalnego, a z Czebyszewa -każdy rozkład, ale jest to mniej precyzyjne.
-generalnie Czebyszew pozwala nam oszacować ogon, ale jego oszacowanie jest asymptotycznie wolniejsze od jakiegokolwiek rozkładu, wiec dla argumentów bardzo odległych od wartości oczekiwanej, oszacowanie będzie dość grube
-reguła trzech sigma dla rozkładu normalnego daje nam lepsze oszacowanie niż Czebyszew -jest jeszcze reguła trzech sigma dla dowolnego rozkładu, która wynika z nierówności Czebyszewa i to jest o tyle fajne, ze wybiera nam w artość oszacowania w zależności od wariancji danego rozkładu - oszacowanie to jest dość dobre..,.
Tak, ponieważ w wyznaczaniu przedziału ufności na początku korzystamy już z jakiegoś estymatora (najczęściej z średniej arytmetycznej). A średnia arytmetyczna jest zbudowana na podstawie zasady maksymalnej wiarygodności
-estymacja przedziałowa, czyli budowa przedziału ufności dla nieznanej wartości -estymacja punktowa
-częstości - za nieznane prawdopodob, podstawiamy częstości z próby - intuicyjne raczej -momentów - porównujemy momenty
-kwantyli - tutaj kwantyle - znaczy się porównujemy te, które odczytaliśmy z tymi z rozkładu
-największej wiarygodności - to nasza zasada maksymalizujemy funkcje gęstości próby z
parametrem teta, czasami maksymalizujemy logarytm z tej dziwnej funkcji
-Bayesa - bierzemy jakieś teta i funkcje rozkładu teta i minimalizujemy funkcje odchyłki teta od
rozkładu a priori - czyli jakby zakładamy jakiś rozkład i patrzymy czy zgadliśmy
-minaksu - znajdujemy teta, które minimalizuje funkcje kresu górnego odchyłki teta, czyli bierzemy
maksimum z minimalnej funkcji ochylki