, 3. BADANIE ZGODNOŚCI ROZKŁADU ZMIENNEJ LOSOWEJ Z ROZKŁADEM TEORETYCZNYM
3.1. Cel ćwiczenia
1 Celem ćwiczenia jcsl zapoznanie się ze sposobami weryfikacji hipotezy o zgodności t rozkładu zmiennej losowej z proponowanym rozkładem teoretycznym (modelem rozkładu).
3.2. Opis metody
f Wielokrotnie w analizie statystycznej zakładamy, że zmienne losowe (badane cechy) maja pewne rozkłady, np. normalne, Poissona czy inne. Powstaje zatem pytanie, czy takie założenie jest zgcdne z rzeczywistością. Aby to sprawdzić, dokonuje się obserwacji badanej ■cechy (pobiera próbę losową) i porównuje rozkład obserwacji zawartych w próbie z pewnym gćprclycznyrn rozkładem, który to rozkład można uważać za proponowaną hipotezę zerową. Hipoteza zerowa może być postawiona w różnej postaci, np.:
1 Ho: zmienna losowa X ma rozkład normalny o parametrach u = 5 i o = 0,5 lub Ho: zmienna losowa X jest zmienną Poissona o parametrze X 5 lub przy braku konkretnej wartości parametru
[ Ho: zmienna losowa X podlega rozkładowi wykładniczemu. t Hipoteza alternatywna określająca, że zmienna nie jest taka, jak żąda tego hipoteza zerowa Ho, jest najczęściej bardzo złożona. Na przykład, jeśli X nie jest zmienną losową o rozkładzie N(5.0,5) to może mieć rozkład N(10, 0.5) łub N(5,03). lub N(15.0.4) lub może w ogóle nie mieć rozkładu normalnego, może mieć rozkład Iogarytmo-nomialny lub gamma, lub dowolny B nicskończcnic wielu, nazwanych -lub bez nazwy, ciągłych, dyskretnych lub mieszanych, ■fiżńorodnych rozkładów.
3.2.1. Porównanie kształtów histogramów
L Najprostszym sposobem oceny zgodności rozkładu obserwacji próby /. rozkładem hipo-fescznym jest wizualne porównanie histogramu częstości z funkcja gęstości albo histogramu gphmulowanej częstości z dystrybuantą. Porównanie wizualne pozwala na natychmiastowe ^Bacowanie bliskości rozkładu danych zaobserwowanych z rozkładem hipotetycznym oraz ^■Starcza cennych informacji o obszarach niezgodności.
3.2.1.1. Porównanie histogramu częstości z funkcją gęstości
L Z powodu konieczności grupowania danych w klasach potrzebnych do zbudowania histogramu, najczęściej istotne cechy prawdziwych końców rozkładu nie są przedstawiane na Bjkresie i ulegają zatraceniu. Wybór węższych przedziałów klasowych zwiększa czytelność