OBLICZENIA
Statystyka matematyczna – to oddzielna dyscyplina matematyczna zajmująca się metodami wnioskowania o całej zbiorowości statystycznej (populacji generalnej) po zbadaniu tylko pewnej jej części zwanej próbą lub próbką. Statystyka matematyczna wiąże się z wykorzystywaniem zależności matematycznych w rachunku prawdopodobieństwa.
Do samodzielnego opracowania:
- klasyczna definicja prawdopodobieństwa
-geometryczna definicja prawdopodobieństwa
- statystyczna definicja prawdopodobieństwa
- zmienna losowa skokowa:
-rozkład
-dystrybuanta
-zmienna losowa ciągła:
-gęstość prawdopodobieństwa
-dystrybuanta
-rozkład normalny (Gaussa):
-gęstość
-dystrybuanta
-parametry i ich właściwości
-parametry opisowe:
-miary skupienia:
-wartość oczekiwana
mediana
-miary rozrzutu:
-wariancja
-odchylenie standardowe
-twierdzenia o wartości oczekiwanej
-twierdzenia o wariancji
ESTYMACJA (SZACOWANIE)
Pojęcie teorii estymacji:
Estymator – dowolna statystyka (q) zastosowana do oszacowania wartości
parametru (Q) populacji generalnej.
Statystyka z próby – zmienna losowa będąca pewną funkcją wyników próby
losowej.
Populacja generalna – zbiór dowolnych elementów niejednakowych z punktu
widzenia badanej cechy.
Próba – podzbiór generacji.
Próba losowa – próba, której elementy pozyskano poprzez losowanie
Liczebność próby – liczba elementów trafiających do próby (n)
Wyniki próby – wartość badanej cechy oznaczona na elementach, które trafiły
do próby.
Rozkład estymatora – rozkład prawdopodobieństwa statystyki (q) stanowiącej
estymator parametru (Q).
Estymator nieobciążony – estymator (q) mający te właściwość, że E(q)=Q
Estymacja
Punktowa Przedziałowa
Przedział ufności - przedział losowy, wyznaczony przy wykorzystaniu rozkładu estymatora,
charakteryzujący się tym, że z dużym prawdopodobieństwem pokrywa wartości estymatora
parametru (Q).
Ogólny zapis przedziału ufności ma postać:
P(qnd<Q<qng)=1-α
gdzie: qnd i qng to dolna i górna granica przedziału ufności
Poziom ufności - 1-α ; oznacza prawdopodobieństwo z jakim nieznana wartość parametru
(Q) objęta jest przez ten przedział.
Estymacja punktowa wartości oczekiwanej:
Wartość oczekiwaną estymuje się punktowo za pomocą średniej arytmetycznej $\overset{\overline{}}{x}$:
$\overset{\overline{}}{x}$ = $\frac{1}{n}\sum_{i = 1}^{n}\text{Xi}$
Średnia arytmetyczna jest nieobciążonym estymatorem wartości oczekiwanej.
Estymacja punktowa wariancji:
$s^{2} = \frac{1}{n}\sum_{i = 1}^{n}{(x_{i} -}\overset{\overline{}}{x})^{2}$
Dla oszacowania wariancji stosuje się estymator w postaci średniej arytmetycznej.
Można wykazać, że estymator wariancji jest estymatorem obciążonym:
$s^{2} = E\left( s^{2} \right) - V\left( X \right) = - \frac{1}{n}V(X)$
$\hat{s^{2}} = \ \frac{1}{n - 1}\sum_{i = 1}^{n}{(x_{i} -}\overset{\overline{}}{x})^{2}$
Modyfikacja ta likwiduje ujemne obciążenie estymatora s2 i pozwala oszacować
wariancję bez błędu systematycznego.
Estymacja punktowa odchylenia standardowego:
s=$\sqrt{\frac{1}{n}\sum_{i = 1}^{n}{(x_{i} -}\overset{\overline{}}{x})^{2}}$ i $\hat{s}$=$\sqrt{\frac{1}{n - 1}\sum_{i = 1}^{n}{(x_{i} -}\overset{\overline{}}{x})^{2}}$
Estymacja przedziałowa wartości oczekiwanej:
Założenia: -badana cecha statystyczna ma rozkład normalny
Dane: -wyniki próby x=1,2,…,n
-liczebność próby n
-poziom ufności 1-α
Obliczenia: -punktowy estymator wartości oczekiwanej
-punktowy estymator odchylenia standardowego
-przedział ufności wg wzoru:
P{$\overset{\overline{}}{\mathbf{x}}$-t$\text{\ α}\frac{\hat{s}}{\sqrt{n}}$<m<$\overset{\overline{}}{\mathbf{x}}$+t$\text{\ α}\frac{\hat{s}}{\sqrt{n}}$} = 1-α
Zasada wyznaczania wartości tablicowej „t”:
Niezbędna liczba pomiarów do próby:
Jaka powinna być liczba pomiarów (n), aby szerokość przedziału ufności dla wartości
oczekiwanej, który zamierzamy wyznaczyć przy założeniu 1-α nie przekroczyła przyjętej
z góry wartości.
Szerokość przedziału ufności (2d) jest różnicą wartości liczbowych odpowiadających końcom
przedziału:
2d=qng − qnd=2tα$\frac{\hat{s}}{\sqrt{n}}$ (szerokość)
d=tα$\frac{\hat{s}}{\sqrt{n}}$ (połowa szerokości)
Szerokość przedziału ufności zależy od:
-wartości estymacji odchylenia standardowego
-pierwiastka kwadratowego z liczebności próby [(n)(odwrotnie prop.)]
-wartości tablicowej tα (odwrotnie prop.)
Wartość tablicowa t studenta rośnie w miarę podwyższania poziomu ufności oraz obniżania
liczby stopni swobody.
Liczbę poziomów n nazywamy:
n=$t_{\alpha}^{2}\frac{\hat{s^{2}}}{d^{2}}$ w którym znamy tylko d.
Aby obliczyć n trzeba wykonać kilka pomiarów n0 w ramach próby wstępnej i na ich
Podstawie oszacowanie wariancji $\hat{s_{0}^{2}}$.
Następnie wyznaczamy t studenta.
Znając wstępnie oszacowanie wartości:
n=$t_{\alpha}^{2}\frac{\hat{s_{0}^{2}}.}{d^{2}}$
Wynik zaokrąglamy w górę do najbliższej liczby naturalnej.
Jeżeli n<=n0 to próba wstępna ma wystarczającą liczebność, a gdy n>=n0 to należy wykonać
n-n0 pomiarów dodatkowych.
Weryfikacja hipotez statystycznych:
Test statystyczny – decyduje o przyjęciu lub odrzuceniu hipotezy
Hipoteza statystyczna – dowolne przypuszczenie dotyczące rozkładu populacji generalnej
Test istotności – typ testu, w którym bierzemy pod uwagę błąd pierwszego rodzaju. W teście
istotności możliwe jest wyłączenie hipotezy zerowej i przyjęcie alternatywnej lub
stwierdzenie braku podstaw do wyłączenia hipotezy zerowej.
Błąd pierwszego rodzaju – błąd polegający na tym, że w trakcie weryfikacji hipotezy
statystycznej podjęto decyzję o odrzuceniu hipotezy prawdziwej.
Błąd drugiego rodzaju – przyjęcie za prawdę hipotezy fałszywej
Hipoteza zerowa (H0) – hipoteza statystyczna bezpośrednio sprawdzana za pomocą
stosownego testu.
Hipoteza alternatywna (H1) – hipoteza konkurująca z zerową.
Poziom istotności – prawdopodobieństwo małe α (0,05; 0,01; 0,001)
Obszar krytyczny testu – obszar mający właściwości polegającą na tym, że obliczana wartość
odpowiedniej statystyki trafi do tego obszaru to odrzucamy hipotezę zerową i przyjęciu
alternatywnej, gdy poza obszarem przyjmujemy zerową.
Skale pomiarowe – rodzaj informacji jaki niesie wynik próby. Im słabsza skala tym mniej
precyzyjne informacje.
Rodzaje skal pomiarowych:
Nominalna – liczby stanowią etykiety obserwowanych wartości w próbie. Skala
dotyczy np. płci, koloru, kształtu czyli zmiennych losowych „jakościowych”.
Porządkowa – wyniki mogą być porządkowane np. wg znaczenia czy innych.
Liczby reprezentujące elementy próby wskazują naturalną kolejność między nimi.
Np. wzrost – niski, średni, wysoki.
Różnicowa – pozwala na porządkowanie wartości i określenie różnic między nimi
np. indeks giełdowy.
Ilorazowa – wartość można porządkować, odejmować i dzielić.