Aby wytworzyć szereg rozdzielczy należy: - 1)ustalić obszar zmienności R badanej cechy czyli przedział ograniczony najmniejszym i największym elementem próby: R=Xmax - Xmin 2)Wyznaczyć liczbę przedziałów klasowych m, próby o liczebności n (Zbyt duża liczba klas nie daje przejrzystego obrazu i ujawnia przypadkowe odchylenia. Zbyt mała liczba klas zaciera istotne szczegóły struktury próby.)3) Podzielić obszar zmienności na klasy i określić środek i końce przedziałów klasowych. Szerokość przediału dd=R/m 4) Wyznaczyć liczebność w klasach 5) wyznaczyć prawdopodobieństwa empiryczne 6) zbudować empiryczny rozkład cechy - HISTOGRAM.
CECHA: Rozkład cechy (właściwość elementy populacji)- jeżeli elementy różnią się między sobą wartościami analitycznej cechy to mówi się o rozkładzie cechy w populacji. mierzalne - te właściwości które maja charakter ilościowy nazywa się cechami mierzalnymi (wzrost, waga). niemierzalne - właściwości jakościowe płeć, kolor włosów nazywa się cechami niemierzalnymi. Są też dyskretne i Ciągłe
Dystrybuanta -funkcja zmiennej rzeczywistej x równa prawdopodobieństwu, że zmienna losowa przyjmie wartość nie większą od x. Jest to więc całka oznaczona od dolnej granicy dziedziny danego rozkładu prawdopodobieństwa zmiennej losowej (np. --nieskończoności lub 0) do x, z funkcji rozkładu prawdopodobieństwa danej zmiennej losowej. dystrubuanta zmiennej losowej-skumulowane prawdop. Funkcja F(x), określoną F(x) = P(X<x) Określa ona prawdopodobieństwo tego, że zmienna losowa X przyjmuje jakąkolwiek wartość mniejszą od z góry przyjętej danej wartości x.
Empiryczny rozkład cechy (histogram) - empiryczny rozkład cechy stanowi podstawę dla wszystkich analiz badanej cechy. Jeżeli próba dotycząca jednej cechy mierzalnej nie jest zbyt liczna tzn. dotyczy <30 jednostek to wstępne jej opracowanie polega na uszeregowaniu w porządku rosnącym dla liczb.
Estymacja przedziałowa - metoda ta dokonuje szacunku parametru w postaci takiego przedziału(zwanego przedziałem ufności) który z dużym prawdopodobieństwem obejmuje prawidłowe wartości parametrów zależności od przyjętych założeń o partych o rozkład normalny lub rozkład t - studenta.
Funkcja niezawodności R(x) wyraża prawdopodobieństwo zdarzenia losowego polegającego na tym, że czas poprawnej pracy obiektu X nie będzie krótszy, niż pewna wyróżniona wartość x: R(x)=P(X >= x) czyli R(x) = 1-P(X < x) = 1-F(x)
Hipoteza statyczna - to każde przypuszczenie dotyczące wielkości parametru rozkładu zmiennej losowej w populacji generalnej lub próbnej, albo też postaci tego rozkładu uzyskane na podstawie próby losowej. grupy hipotez: - parametryczne - związane z wartościami parametrów, nieparametryczne - związane z postacią rozkładów. Weryfikacja - podst. rodzaj wnioskowania statystycznego H.alternatywna - dla każdej hipotezy 0 określa się hipotezę alternatywną o postaciach: H1:≠T lub H1:>T lub H1:<T. H.zerowa: H0:=T - stawiamy hipotezę zerową głoszącą, że wartości parametru jest równa T. stąd hipoteza zerowa.
Histogram - jest to wykres - który charakteryzuje się tym ze to zbior prostokątów. Wysokość prostokątów to liczebność a podstawy to przedzialy klasowe.
Metoda estymacji przedziałowej - to dodawanie szacunku parametru w postaci takiego przedziału (zwanego przedziałem ufności) który z dużym prawdopodobieństwem obejmuje prawdziwą wartość parametru.
otrzymywany przez standaryzację zmiennej losowej
Podstawowe parametry rozkładu: wariancje, odchylenie standartowe, srednia arytmetyczna, mediana,dominanta,kwantyle Q1 i Q3
Populacja generalna (zbiorowością generalną.)Badana zbiorowość w statystyce matematycznej. Skończona i Nieskończona (zjawisko - np.zbiorowość wyników pomiarów twardości)
Poziom istotności: Wartość poziomu istotności określa wartość wystąpienia błędu przy przyjęciu hipotezy zerowej za prawdziwą
Próba - podzbiór elementów populacji generalnej podlegających badaniu.
Próba losowa: Próba otrzymaną w wyniku doboru losowego. Warunki: 1)Każdy element populacji generalnej ma dodatnie znane prawdopodobieństwo znalezienia się w próbie losowej. 2)Istnieje możliwość ustalenia prawdopodobieństwa znalezienia się w próbce dla każdego zespołu elementów populacji.
Reguła 3 sigm - jeżeli x -jest zmienną losową ciągłą o rozkładzie rozkładzie N(,σ) to zachodzi: P(-36≤x≤+36)=0,9973 tzn takie jest prawdopodobieństwo ze zmienna losowa przyjmuje takie wartości, które różnią się od wartości oczekiwanej nie więcej niż > odchylenie standardowe.
Rozkład dwumianowy Bernuliego - ma rokład dwumianowy gdy funkcja rozkładu prawdopodobieństwa ma postać P(x)=(nx)* px *(1-p)n-x x=0,1,..n Wartość oczekiwana (średnia): E(x)=n*p, Wariancja D2(x)=n*p*(1-p)
Rozkład normalny standaryzowany otrzymywany przez standaryzację zmiennej losowej
Rozkład Poissona - jeżeli zmienne losowe x1,x2,…,xn mają rozkład dwumianowy o parametrach n i p=/n >0 to ciąg funkcji prawdopodobieństwa Pn(x)=(nx)*px*(1-p)n-x x=0.1,…n. Dąży do funkcji: P(x)=(x * e-)/x!
rozkład teoretyczny: bernoulliego, poissona, normalny
Rozkład wykładniczy - zmienna losowa X ma wykładniczy rozkład prawdopodobieństwa, jeśli jej gęstość prawd. wyraża się wzorem: f(x)={0 dla x<0, e-x dla x, >0
Rozkład zmiennej losowej: prawdopodobieństwo tego, że zmienna losowa X przybiera wartość xi (i=1, 2, ...) P(X=xi)=pi
Statystyka w rozumieniu tego wykładu to zbiór metod służących pozyskiwaniu, prezentacji, analizie danych.
Szereg pozycyjny: Ułożenie w kolejności roznącej
Typy zależności korelacyjnej: korelacja liniowa dodatnia, korelacja liniowa ujemna, korelacja krzywoliniowa, brak korelacji.
Wnioskowanie statystyczne Działanie polegające na uogólnienia uzyskanych na podstawie próby wyników na całą populację oraz oszacowanie popełnionych przy tym błędów (estymacja i weryfikacja)
Współczynnik ufności - 1- jest prawdopodobieństwem przyjętym z góry, przyjmuje się wartość 1- >0,9.
Wymagania dotyczące przedziałów klasowych przy budowaniu histogramu: liczebność próby jest duża, - poziom ufności jest ,0,01, - próba jest próbą losową.
Zmienna losowa (cecha?) ciągła - zakładając że wartość x przyjmowane przez zmienną losową x, zmieniają się w sposób ciągły w przedziałach <a,b>. dyskretna: rozkład jednopunktowy, rozkład dwupunktowy, rozkład równomierny E(x) - wartość średnia, D2(x) - wariancja, σx - odchylenie standardowe.
Zmienna losowa X - to wielkość która w wyniku doświadczenia przyjmuje się określoną wartość x znaną po zrealizowaniu doświadczenia a nie dająca się przedstawić przed jego realizacją. skokowa - nazywa się takie losowe które mają skończony lub przeliczony zbiór wartości. ciągłe - nazywa się zmienne losowe które mogą przybierać dowolne wartości liczbowe z pewnego przedziału liczbowego.