Prawdopodobieństwem
nazywamy funkcje P która każdemu zdarzeniu A, A € Ω przyporządkowuje liczbę P(A) tak by były spełnione warunki:
P(A) ≥0 dla każdego zdarzenia A
P(Ω) = 1
Jeśli zdarzenia A, B wykluczają się to:
P(A v B) = P(A) + P(B)
Zmienna losowa X – zmienna, która w wyniku pewnego doświadczenia przyjmuje z pewnym prawdopodobieństwem wartość z określonego zbioru – każda funkcja o wartościach liczbowych ze zbioru liczb rzeczywistych, która jest określona na zbiorze zdarzeń elementarnych
Zmienną losową X – nazywamy dyskretną (skokową), jeżeli zbiór wartości zmiennej X jest zbiorem skończonym lub przeliczalnym (ciąg liczbowy).
Zmienną losową X – nazywamy ciągłą, jeżeli zbiór wartości zmiennej X można przedstawić jako przedział liczbowy.
Dystrybuanta
Funkcję F okresloną na całym zbiorze R wzorem:
F(x) = P(X < x) , x € R;
nazywamy dystrybuantą zmiennej losowej X.
Własności:
0 ≤ F(x) ≤ 1 x € R
F(0) = 0 i F(x) = 1
Funkcja niemalejąca
Funkcja co najmniej lewostronnie ciągła
P(a≤X<b) = F(b) – F(a)
Zmienna losowa ciągła
Zmienna losowa X przyjmująca wszystkie wartości z pewnego przedziału (lub przedziałów) dla której istnieje nieujemna funkcja taka, że dystrybuantę F zmiennej losowej x można przedstawić w postaci:
F(x) = ∫−∞xf(t)dt
Własności:
Jeżeli x jest punktem ciągłości funkcji f to F`(x) = F(x)
∫+∞−∞f(x)dx = 1 warunek unormowany
$\bigwedge_{c\ R}^{}{P(x = c)} = 0$
P(a≤X<b) = P(a < X ≤ b) = P( a < X < b) = P( a ≤ X ≤ b) = F(a) – F(b) różnica rzędnych
P(a≤X≤b) = ∫abf(x)dx pole
Zmienna losowa skokowa
Zmienna losowa X dla której istnieje skończony albo przeliczalny zbiór jej wartości x1, x2….taki, że:
P (x = x1) = pi > 0 ; i € N ,$\sum_{i}^{}p_{i} = 1$
Rozkład normalny, zwany też rozkładem Gaussa
Mówimy, że zmienna losowa ciągła X ma rozkład normalny o parametrach (µ,σ) (µ - dowolne, σ dodatnie).
jeżeli jej gęstość wyraża się wzorem:
Funkcja gęstości Krzywa normalna
Rozkład normalny standaryzowany
Wykres gęstośći:
$\varphi\left( U \right) = \ \frac{1}{\sqrt{2\pi}}e_{\ \ \ \ 2}^{{- U}^{2}}$ U€R
xi | 0 | 1 |
---|---|---|
pi | 1-p | p |
Rozkład Poissona – rozkład zmiennych losowych skokowych.
Mówimy że zmienna losowa x ma rozkład dwu – punktowy (zero jedynkowy) o parametrze p jeżeli jej funkcja prawdopodobieństwa jest postaci:
$P\left( X = K \right) = e^{- \alpha}\frac{\alpha^{k}}{k!}$ k=1,2,3,… α>0
Populacja statystyczna (inaczej populacja generalna, zbiorowość generalna) – zbiór elementów, podlegających badaniu statystycznemu.
Próba statystyczna – zbiór obserwacji statystycznych wybranych (zwykle wylosowanych) z populacji.
Cecha statystyczna to właściwość populacji, która jest przedmiotem badania statystycznego. Zgodnie z definicją[1] cecha statystyczna jest to funkcja przypisująca elementom populacji elementy zbioru wartości cechy statystycznej.
Próby niezależne:
Test Fishera – Snedecora
Próby zależne:
test Cochrana
Hipoteza statystyczna to dowolne przypuszczenie dotyczące rozkładu populacji - postaci funkcyjnej lub wartości parametru rozkładu. Proces sprawdzenia prawdziwości tego przypuszczenia na podstawie wyników próby losowej to weryfikacja hipotez statystycznych.
Hipotezy
parametryczne - hipoteza dotyczy wartości odpowiedniego parametru rozkładu
nieparametryczne - hipoteza dotyczy postaci funkcyjnej rozkładu korelacji zjawisk lub losowości próby
Test statystyczny - reguła matematyczna pozwalająca oszacować prawdopodobieństwo spełnienia pewnej hipotezy statystycznej w populacji na podstawie próby losowej z tej populacji.
Test istotności - rodzaj testu, w którym na podstawie wyników próby losowej podejmuje się tylko i wyłącznie decyzję odrzucenia hipotezy, którą się sprawdza, bądź stwierdza się brak podstaw do odrzucenia tej hipotezy.
W teście istotności nie podejmuje się decyzji o przyjęciu sprawdzanej hipotezy,
ponieważ bierze się w tym teście pod uwagę tylko błąd pierwszego rodzaju, a jego prawdopodobieństwo to poziom istotności, nie uwzględnia się natomiast konsekwencji popełnienia błędu drugiego rodzaju.
Testy parametryczne
test dla wariancji (test Fishera-Snedecara)
test dla średnich (test U, tStudenta i Cochrana-Coxa)
test różnic
Testy nieparametryczne
test zgodności chi-kwadrat
Poziom istotności
jest to maksymalne dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju (zazwyczaj oznaczane symbolem α). Określa tym samym maksymalne ryzyko błędu, jakie badacz jest skłonny zaakceptować. Wybór wartości α zależy od badacza, natury problemu i od tego jak dokładnie chce on weryfikować swoje hipotezy
Obszar krytyczny testu
w statystyce zbiór wartości rozkładu funkcji testowej w teście statystycznym, których wystąpienie, przy założeniu prawdziwości hipotezy zerowej (H0), jest wystarczająco mało prawdopodobne, żeby (empiryczna) realizacja zmiennej losowej mieszcząca się w obszarze krytycznym pozwalała na odrzucenie tej hipotezy.
Współczynnik korelacji liniowej
określa poziom zależności liniowej Współczynnik korelacji - liczba określająca w jakim stopniu zmienne są współzależne. Jest miarą korelacji dwu (lub więcej) zmiennych. między zmiennymi losowymi.