3. Rozkład Pareto charakteryzuje się tym, źe jeśli wiemy, że X >= x to prawdopodobieństwo przyjęcia przez X = kx jest niezależne od tego x Czyli prawdopodobieństwo, że jest k* gorzej jest proporcjonalne do k i nie zależy od tego jak ile już na pewno jest. Sposób w jaki to "dowodziłem" jest rozrysowany w wykładzie. Te C(kx)/C(x) = ... Chodzi o to, żeby k-krotna zmiana argumentu funkcji k powodowała zmianę jej wartości ~k, niezależnie od x. Wykazuję się, że funkcja o określonej formie spełnia coś takiego, pokazuje że Pareto jest tej formy i tyle, Tzn. tak było na wykładzie i tak to namalowałem, nie wiem czy to wszystko i czy to jest dobrze
4. Tutaj byłem nieco mglisty, z przyczyn obiektywnych. Zasada maksymalnej wiarygodności oznacza, że dla rzeczy określonej jakąś tam funkcją prawdopodobieństwa może ona zajść tak albo inaczej z takim prawdopodobieństwem. Więc de facto nie wiemy jak konkretnie jest, ale mamy jakąś gamę sytuacji, z których każda ma dane prawd. Reguła maksimum wiarygodności odrzuca wszystko, poza najbardziej prawdopodobną tezą i przyjmuje ze tak po prostu jest. Było na rybach: pomalujesz ogony 100 rybom etc... Ja argumentowałem "przeciw" w ten sposob, że daną sytuację mógłby np opisywać wzór Bayesa, który ma X warunków. Więc teraz wszystkie zmienne ustawiam sobie tak, żeby dawał on maksimum prawd, i zakładam, że tak się stało. Ale mogę też modelować to innym rozkładem i zrobić z nim to samo stosując tą regułę. To jest w oczywisty sposób odpowiedź niepełna i z jakimś prawdopodobieństwem nieprawdziwa A
5. Coś, co znajdzie się w obszarze krytycznym zostanie odrzucone. Więc trzeba dobrać te obszary tak, żeby maksymalizowały szanse, że nie jest tak. jak zakłada hipoteza zerowa. Tutaj mamy- 2 zmienne mają identyczne rozkłady. Trzeba się zastanowić kiedy to będzie nieprawdziwe. Mi wyszło, że im serie są dłuższe, tym rozkłady mają mniejsze szanse na "podobieństwo". Dla krótkich wartości należące do każdego z rozkładów się "przeplatają" i są sobie bliskie, Jeśli są długie to każdy z rozkładów przyjmuje wartości jakimiś przedziałami i w tych przedziałach 2gi ich nie przyjmuje. Ad absurdum: seria wygląda XXXXXXXXXYYYYYYYYYY. Jeden jest zupełnie po lewej, drugi po prawej na osi.
Na wykładzie była hipoteza zerowa: "wartości są niezależne". Tam braliśmy przedział obustronny, bo jeśli serie były długie, to i jedne i drugie wartości w podejrzany sposób układały się na przemian długimi seriami. A jeśli krótkimi, to znowu podejrzanie blisko siebie Powinny przyjmować "ani bardzo odległe, ani specjalnie bliskie" wartości.
ad. ł tam gdzie Mich napisał że prawdopodobieństwo zajścia zdarzenia jest równe zeru zdaje mi się że jest źle, powinno być że jest niemożliwe (jest różnica wbrew pozorom, bo prawdopodobieństwo każdego zdarzenia dla rozkładu ciągłego jest równe zeru)
ad.2 ja tam policzyłem że jest sqrt(I4) wg wzoru Micha, i żadnego przedziału nie podawałem
ad. 3 charakterystyczna jest tylko niewyczerpalność multipHkatywna czyli C(kx)\C(x) = const
ad.4 ja napisałem ze nie może być mowy o maksymalnej wiarygodności jeżeli w Bayesie istnieje takie i!=j że P(Hi)!=P(Hj) (niezły bełkot ale chyba przeszło)
ostatnie z egzaminu - wybieramy lewostronny obszar- krytyczny, ponieważ nie interesuje nas mało serii (mało serii znaczy, ze serie są długie a to ze serie są długie znaczy ze rozkłady są rożne, byłyby bardziej zbliżone gdyby wartości się przeplatały po posortowaniu)
co do Czebyszewa to by trzeba posprawdzać dla jakich rozkładów nierówność szacuje zbyt "grubo" - na pewno dla rozkładu równomiernego i dla rozkładu normalnego znamy lepsze oszacowania.