Wyznaczenie charakterystyk liczbowych zmiennych losowych na podstawie danych doświadczalnych
Przebieg ćwiczenia
Przy pomocy czujnika indukcyjno- analogowego wykonaliśmy 40 pomiarów średnicy wałeczków o średnicy 15mm. Następnie na podstawie pomiarów utworzyliśmy szereg rozdzielczy składający się z dziesięciu klas o szerokości 0,04 mm każda. Na podstawie otrzymanej tabeli policzyliśmy wartość oczekiwaną i wariancję. Kolejnym krokiem było stworzenie wykresów gęstości prawdopodobieństwa i rozkładu dystrybuanty empirycznej. Ostatnim krokiem było sprawdzenie hipotez o wariancji i o wartości przeciętnej w populacji generalnej.
Podstawowe definicje
Szereg rozdzielczy - jest statystycznym sposobem prezentacji rozkładu empirycznego. Uzyskuje się go dzieląc dane statystyczne na pewne kategorie i podając liczebność lub częstość zbiorów danych przypadających na każdą z tych kategorii.
Gęstość prawdopodobieństwa - w statystyce nazywa się w ten sposób funkcję rozkładu prawdopodobieństwa ciągłej zmiennej losowej.
Wartość oczekiwana - w rachunku prawdopodobieństwa wartość określająca spodziewany wynik doświadczenia losowego. Wartość oczekiwana to inaczej pierwszy moment zwykły. Estymatorem wartości oczekiwanej rozkładu cechy w populacji jest średnia arytmetyczna.
Dystrybuanta - w rachunku prawdopodobieństwa, statystyce i dziedzinach pokrewnych, funkcja rzeczywista jednoznacznie wyznaczająca rozkład prawdopodobieństwa (tj. miarę probabilistyczną określoną na σ-ciele borelowskich podzbiorów prostej[1]), a więc zawierająca wszystkie informacje o tym rozkładzie. Dystrybuanty są efektywnym narzędziem badania prawdopodobieństwa ponieważ, są obiektem prostszym niż rozkłady prawdopodobieństwa. Dystrybuanta rozkładu próby zwana jest dystrybuantą empiryczną.
Wariancja to w statystyce klasyczna miara zmienności. Intuicyjnie utożsamiana ze zróżnicowaniem zbiorowości; jest średnią arytmetyczną kwadratów odchyleń (różnic) poszczególnych wartości cechy od wartości oczekiwanej.
Odchylenie standardowe - mówi, jak szeroko wartości jakiejś wielkości są rozrzucone wokół jej średniej[1]. Im mniejsza wartość odchylenia tym obserwacje są bardziej skupione wokół średniej.
Wykresy
Weryfikacja hipotez
Weryfikacja hipotezy o wartości przeciętnej w populacji generalnej
Hipotezę orzekającą, że wartość przeciętna m jest równa liczbie m0, zapisujemy
H(m = m0). Jeśli zmienna losowa x ma rozkład normalny N (m,σ), przy czym σ jest znane
i przyjmujemy poziom istotności α, to korzystając z tabeli, wyznaczamy εα takie, by:
Jeśli zaobserwowana w n-elementowej próbie wartość x ~ jest taka, że:
to hipotezę H (m = m0) odrzucamy.
W przypadku, gdy:
to nie ma podstaw do odrzucenia hipotezy H (m = m0).
Jeżeli nie ma podstaw do przyjęcia założenia, że cecha ma rozkład normalny, ale n > 30,
to w celu zweryfikowania hipotezy H (m = m0) można stosować postępowanie analogiczne jak
omówione wyżej, przy czym jako σ2 można przyjąć
Wynika z tego, że:
Więc nie ma podstaw do odrzucenia hipotezy.
Weryfikacja hipotezy o wariancji.
Niech zmienna losowa x ma rozkład normalny, przy czym σ jest nie znane.
Hipotezę
, tzn. że wariancja jest równa liczbie
, weryfikujemy, korzystając z faktu, że zmienna losowa:
ma rozkład χ2 o n - l stopniach swobody. Przyjmujemy poziom istotności α. W tabl. IV [l]
znajdujemy χ2α takie, że
Czyli
Hipotezę odrzucamy jeśli:
W przeciwnym przypadku hipotezę przyjmujemy.
Wynika z tego, że:
Więc hipotezę przyjmujemy.
Wnioski
Zakładając poprawność wykonania pomiarów i obliczeń możemy stwierdzić, iż otrzymane przez nas kształty wykresów gęstości prawdopodobieństwa są zbliżone do wykresu rozkładu normalnego, czyli do krzywej Gaussa. Najkorzystniejsze byłoby otrzymanie największej gęstości w klasie. Oznaczałoby to, że duża liczba detali ma wymiar najbardziej zbliżony do nominalnego. W naszym przypadku widać, że największa gęstość znajduje się w klasie 4.
Na podstawie przeprowadzonego ćwiczenia i weryfikacji hipotez doszliśmy do wniosku, że należy przyjąć całą partię przebadanych wałeczków, ponieważ spełniają one założone kryteria. Wykonując ćwiczenie nauczyliśmy się oceniać parametry całej partii na podstawie małej próbki elementów partii.