Rozkład dwumianowy - Bernoulliego
Rozkład dwumianowy polega na przeprowadzeniu n jednakowych, niezależnych doświadczeń, z których każde może zakończyć się „sukcesem” z prawdopodobieństwem p lub „porażką” z prawdopodobieństwem q=1-p. Prawdopodobieństwo pojawienia się sukcesu jest jednakowe w każdym z kolejnych doświadczeń. Zmienną losową w tym eksperymencie jest zdarzenie polegające na pojawieniu się k liczby sukcesów w próbach, przy czym
k<0, n>.
gdzie:
k = 1, 2, 3, ..., n - liczba wystąpienia „sukcesów”
n - liczba doświadczeń
p - prawdopodobieństwo wystąpienia sukcesów
Dystrybuanta zmiennej losowej o rozkładzie dwumianowym ma postać:
Wartość oczekiwana w rozkładzie dwumianowym:
Wariancja w rozkładzie dwumianowym:
Rozkład jednostajny
Rozkład jednostajny (zwany też jednorodnym, równomiernym, prostokątnym albo płaskim) to ciągły rozkład prawdopodobieństwa, dla którego gęstość prawdopodobieństwa w przedziale od a do b jest stała i różna od zera, a poza nim równa zeru.
Ponieważ rozkład jest ciągły, nie ma większego znaczenia czy punkty a i b włączy się do przedziału czy nie. Rozkład jest określony parą parametrów a i b, takich że b>a.
Podstawiając a i b wyrażone jako funkcje wartości oczekiwanej i wariancji do wzoru na gęstość prawdopodobieństwa rozkładu jednostajnego powyżej, można ją też zapisać jako:
Funkcja gęstości prawdopodobieństwa Dystrybuanta
Mediana
Mediana (zwana też wartością środkową lub drugim kwartylem) to w statystyce wartość cechy w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. Mediana jest kwantylem rzędu 1/2, czyli drugim kwartylem.
Aby obliczyć medianę ze zbioru n obserwacji, sortujemy je w kolejności od najmniejszej do największej i numerujemy od 1 do n. Następnie,
jeśli n jest nieparzyste, medianą jest wartość obserwacji w środku (czyli obserwacji numer
).
Jeśli natomiast n jest parzyste, wynikiem jest średnia arytmetyczna między dwiema środkowymi obserwacjami, czyli obserwacją numer
i obserwacją numer
.
Dominanta
Dominanta (wartość modalna, moda, wartość najczęstsza) to jedna z miar tendencji centralnej, statystyka dla zmiennych o rozkładzie dyskretnym, wskazująca na wartość o największym prawdopodobieństwie wystąpienia, lub wartość najczęściej występująca w próbie. Dla zmiennej losowej o rozkładzie ciągłym jest to wartość, dla której funkcja gęstości prawdopodobieństwa ma wartość największą.
Miary rozproszenia.
Miary rozproszenia (jak rozproszyły się na osi nasze wartości zmiennej) to rozstęp, wariancja i odchylenia standardowe. Te charakterystyki mówią nam czy próbka rozłożyła się na całej skali, czy też dostaliśmy mało wartości ze skali, ale jest dużo frekwencji.
Rozstęp - estymator tego parametru mówi na ilu jednostkach skali rozrzuciły się wartości zmiennej.
Wariancja - to przeciętna kwadratowa odległość wszystkich pomiarów od średniej arytmetycznej.
Odchylenia standardowe - przeciętna odległość pomiarów od średniej arytmetycznej.
Statystyki kształtu rozkładu
Momentem zwykłym ml rzędu l próbki x1, x2, x3,...xn nazywamy średnią arytmetyczną l-tych potęg wartości xi
Zauważmy, że m1=
Momentem centralnym Ml rzędu l próbki x1, x2, x3,...xn nazywamy średnią arytmetyczną l-tych potęg odchyleń wartości xi od średniej arytmetycznej
próbki
Zauważmy, że M1=0, M2=s2.
Współczynnik asymetrii (skośności)
Xśr=Me=Mo - rozkład symetryczny
Xśr >Me>Mo - rozkład o asymetrii prawostronnej
Xśr <Me<Mo - rozkład o asymetrii lewostronnej
Współczynnik asymetrii (skośności) As
Interpretacja wspołczynnika asymetrii:
As = 0 rozkład symetryczny
As =>0 asymetria prawostronna
As =<0 asymetria lewostronna
Rozkład symetryczny
Po tyle samo jednostek ma wartości większe i mniejsze od poziomu średniego
Rozkład o asymetrii prawostronnej
Większość jednostek ma wartości mniejsze od poziomu średniego
Rozkład o asymetrii lewostronnej
Większość jednostek ma wartości większe od poziomu średniego.
Współczynnik koncentracji (skupienia), kurtoza K
Interpretacja współczynnika skupienia:
k <3 rozkład spłaszczony
k =3 rozkład normalny
k >3 rozkład wysmukły
4