SZERAG ROZDZIELCZY PRZEDZIAŁOWY |
||||||||||
i - numer przedziału (klasy); xi - przedział <x0i, x1i); x0i - dolna granica (min) przedziału; x1i - górna granica (max) przedziału; xi - środek przedziału; ni - liczebność w przedziale; nisk - liczebność skumulowana; Wi - wskaźnik struktury (częstość); Wisk - częstość skumulowana; h - rozpiętość (szerokość) przedziału; |
||||||||||
środek przedziału |
gęstość częstości |
|||||||||
częstość |
średnia arytmetyczna ważona |
|||||||||
rozpiętość przedziału |
odchylenie standardowe |
|||||||||
gęstość liczebności |
wariacja |
|||||||||
typowy obszar zmienności |
||||||||||
odchylenie przeciętne |
|
|||||||||
współczynnik skupienia (kurtoza) |
współczynnik koncentracji |
|||||||||
modalna (dominanta, moda, wartość najczęstsza) w kol. „ni” szukamy największej wartości, następnie odczytujemy nr klasy z kol. „i”, w której występuje ta wartość, i zapisujemy jako „m”
nm+1 - liczebność klasy po klasie modalnej, hm=h - rozpiętość przedziału modalnej |
||||||||||
wskaźnik skośności |
||||||||||
współczynnik skośności |
||||||||||
kwantyle (dzielą liczebność na dwie części) /kwartyl I 25:75, mediana - kwartyl II 50:50, kwartyl III 75:25/ |
||||||||||
obliczamy wartość „N” i odszukujemy tę wartość w kol. „nisk”; nr klasy odczytany z kol. „i”, w której znaj-duje się ta wartość nazywamy „m”
m - nr klasy (przedzału) kwartyli; x0m - dolna granica przedziału kwartyli; nm - liczebność klasy kwartyli; hm=h - rozpiętość przedziału kwartyli; |
kwartyl pierwszy |
|||||||||
|
mediana |
|||||||||
|
kwartyl trzeci |
|||||||||
współczynnik zmienności |
||||||||||
klasyczny |
pozycyjny |
|||||||||
odchylenie ćwiartkowe |
||||||||||
typowy obszar zmienności cechy |
||||||||||
SZERAG ROZDZIELCZY PUNKTOWY |
||||||||||
i - numer przedziału (klasy); xi - przedział; ni - liczebność w przedziale; nisk - liczebność skumulowana; Wi - wskaźnik struktury (częstość); Wisk - częstość skumulowana; |
||||||||||
częstość |
średnia arytmetyczna ważona |
|||||||||
wariacja |
||||||||||
odchylenie standardowe |
typowy obszar zmienności |
|||||||||
odchylenie przeciętne |
|
|||||||||
współczynnik skupienia (kurtoza) |
współczynnik koncentracji |
|||||||||
modalna (dominanta, moda, wartość najczęstsza) w kol. „ni”odszukujemy największą wartość, modalną jest wartość o tym samym nr klasy z kol. „xi” |
||||||||||
współczynnik skośności |
wskaźnik skośności |
|||||||||
mediana |
||||||||||
współczynnik zmienności klasyczny |
||||||||||
SZEREG SZCZEGÓŁOWY |
||||||||||
n - liczebność próby, xi - wartości kolejnych prób, i = 1, 2, ..., n |
||||||||||
średnia arytmetyczna |
typowy obszar zmienności |
|||||||||
wariacja |
odchylenie przeciętne |
|||||||||
odchylenie standardowe |
wskaźnik skośności |
|||||||||
|
współczynnik zmienności klasyczny |
|||||||||
współczynnik skupienia (kurtoza) |
współczynnik koncentracji |
|||||||||
modalna (dominanta, moda, wartość najczęstsza) wartość lub wartości, które najczęściej występuje w szeregu |
||||||||||
mediana |
TESTOWANIE HIPOTEZ STATYSTYCZNYCH |
||||||||
o wartości przeciętnej |
o wskaźniku struktury |
o wariancji |
o równości wartości przeciętnych |
|||||
1. sformułowanie hipotezy H0 I H1 HO : m = wartość przeciętna H1 : m≠wp α = poziom istotności 2. wybór sprawdzianu hipotezy zakładamy, że rozkład cechy w zbiorowości jest N(m, σ); i tak jeśli: A σ jest znane i n≤30 σ znane i n>30 σ jest nieznane i n>30, ale wówczas σ ≈ S
to sprawdzianem hipotezy H0: m=m0 jest statystyka: B kiedy σ jest nieznane i n≤30, sprawdzianem hipotezy jest:
3. wyznaczanie zbioru krytycznego
A zakładamy, że sprawdzianem hipotezy H0 jest statystyka wartość krytyczną tα odczytujemy z tablic
dla zbiorów dwustronnych
dla jednostronnych
B zakładamy, że sprawdzianem hipotezy H0 jest statystyka Wartoś krytyczną tα odczytujemy z tablic rozkładu Studenta dla n-1 stopniami swobody: P(tα) = α przy zbiorze dwustronnym P( tα) = 2α przy zbiorach jednostronnych |
populacja generalna ma rozkład dwupunktowy z parametrem p=prawdop., że badana cech przyjmie wyróżnioną wartość, na podstawie n-elementowej próby, gdzie n≥100; HO : p=p0; H1 : p≠p0 lub p<p0 lub p>p0; α = poziom istotności
sprawdzianem hipotezy HO : p=p0 jest statystyka: wartość krytyczną tα odczytujemy z tablic tak jak dla hipotezy o wartości przeciętnej jeśli T>tα należy odrzucić H0 na korzyść H1 |
cecha X ma rozkład N(m,σ); jej hipoteza H0 to: H0: DLA n≤30 A jeśli m jest znane to spr. hipotezy:
B jeśli m nieznane to spr. hipotezy:
jeśli DLA n>30 A jeśli m jest znane to spr. hipotezy:
B jeśli m nieznane to spr. hipotezy:
T ma rozkład zbliżony do N(0,1) wartość krytyczną tα odczytujemy z tablic tak jak dla hipotezy o wartości przeciętnej |
dane są 2 zbiorowości generalne o rozkładach normalnych N(m1,σ1) i N(m2,σ2) H0: m1=m2; H1: m1{< lub ≠ lub >}m2 n1, n2 - wielkość prób prostych,
DLA: σ1, σ2 - znane i n1≤30, n2≤30; σ1, σ2 - znane i n1>30, n2>30;
σ1, σ2 - nieznane i n1>30, n2>30, to
sprawdzian ma postać: DLA: σ1,σ2 -nieznane, σ1=σ2 i n1≤30, n2≤30
dalszy tok testowania H0: m1=m2 przebiega tak jak przy testowaniu hipotezy o jednej średniej, wartości przeciętnej |
|||||
|
o dwóch wskaźnikach struktury |
|
|
|||||
|
założenia jak powyżej; HO : p1=p2; H1 : p1≠p2 lub p1<p2 lub p1>p2; sprawdzianem hipotezy HO jest statystyka: |
|
|
|||||
|
kolejne etapy konstrukcji testu statystycznego dla wszystkich hipotez są jednakowe i wyglądają jak podpunkty 1-3 z I kol. α oznacza poziom istotności (prawdop. popełnienia błędu) i najczęściej przyjmuje wartości bliskie zeru i na ogół są równe: 0.01; 0.02; 0.05; 0.1. zbiorem krytycznym nazywamy zbiór wartości sprawdzianu hipotezy, które odrzucają H zero |
|
|
|||||
ROZKŁADY |
||||||||
rozkłady dyskretne |
rozkłady ciągłe |
rozkłady związane z rozkładem normalnym |
||||||
zero ~ jedynkowy |
jednostajny w przedziale [a, b] |
chi ~ kwadratowy |
||||||
funkcja rozkładu P (X = 1) = p; P (X = 0) = q; p + q = 1 dystrybuanta
F(x)= wartość oczekiwana E(X)=p wariacja V(X)=pq |
funkcja gęstości f(x)
dystrybuanta F(x)=
wartość oczekiwana E(X)=
wariacja V(X)=
mediana Me= funkcja nie ma modalnej, gdyż funkcja gęstości nie posiada maksimum |
rozkład χ2 jest to rozkład sumy:
X
wartość oczeki-wana: E(χ
wariacja: V(χ tylko z tablic k-stopień swobody P(X>x) P(X<x)=1-P(X≥x)
x=χ
P
k x
k∈<0,30>
jeśli k>30 korzys-tamy z rozkładu zm losowej |
||||||
|
|
|
||||||
Dwumianowy /Bernoulliego/ |
|
|
||||||
B(n, p) ; funkcja rozkładu B(n, p, k)= P(X = k) =
= C dystrybuanta
F(x)= wartość oczekiwana E(X)=np wariacja V(X)=npq |
|
|
||||||
|
|
|
||||||
|
|
|
||||||
|
|
|
||||||
|
|
Studenta |
||||||
|
|
rozkład prawdop. zm losowej Tk
Tk =
gdzie T i χ
N(0, 1), χ wartość oczekiwana: E(Tk)=0
wariacja k-stopień swobody P(X>x) P(X<x)=1-P(X≥x) |
||||||
Poissona |
|
|
||||||
prawdopodobieństwo określone wzorem
P(X=k)=
dystrybuanta F(x)= wartość oczekiwana E(X)=m wariacja V(X)=m |
|
|
||||||
|
|
|
||||||
|
wykładniczy |
|
||||||
|
funkcja gęstości f(x)=
dystrybuanta F(x)=
wartość oczekiwana E(X)=
wariacja V(X)= funkcja nie ma dominanty, gdyż funkcja gęstości nie posiada maksimum |
|
||||||
geometryczny |
|
|
||||||
funkcja rozkładu P(X=k)=pqk-1, k=1,2,.. p /prawdop. sukcesu/, q = 1 - p /prawdop. porażki/, k /liczba doświadczeń do pojawienie się 1-go sukcesu/
dystrybuanta F(x)=
wartość oczekiwana E(X)=
wariacja V(X)= |
|
|
||||||
|
|
|
||||||
|
|
Snedecora |
||||||
|
|
rozkładem Snedecora ze stopniami swobody (r1, r2) nazywamy rozkład prawdopodobieństwa ilorazu:
wartość oczekiwana E(
wariacja |
||||||
|
normalny |
|
||||||
|
X ~ N(m, σ), gdzie m /wartość oczekiwa-na/, σ>0 /odchylenie standardowe/
funkcja gęstości f(x)= dla -∞ < x < +∞
dystrybuanta f(x)= wartość oczekiwana /przeciętna/ E(x) = m wariacja V(x) = σ 2 mediana Me = m modalna Mo = m
standaryzacja zm losowej X:
gęstość standaryzowanej zm losowej:
X ~ N(m, σ), w zadaniach P(T<a) lub P(T≤a) dla
P(a<T<b)=, gdzie a<b /+dodatnie, -ujemne/
dla -a i -b; =Φa-Φb P(T>a)=1-P(T≤a) |
|
||||||
hipergeometryczny |
|
|
||||||
H (N, R, n) rozkład hipergeometryczny P(X=k)=
wartość oczekiwana (X)=
wariacja V(X)=npq
gdzie p=
jeśli populacja jest bardzo duża stosujemy rozkład dwumianowy
P(X=k)= |
|
|
||||||
|
|
|
||||||
|
|
KOMBINATORYKA |
||||||
|
|
PERMUTACJA /wszystkie, ważna kolejność/
KOMBINACJA /z n po k, nieważna kolejność/
WARIACJA /z n po k, ważna kolejność/
|
||||||
|
|
|
||||||
|
|
|
||||||
TESTOWANIE HIPOTEZY O DWÓCH WARIANCJACH |
TESTOWANIE HIPOTEZ NIEPARAMETRYCZNYCH |
|||||||
badamy dwie zbiorowości o rozkładach normalnych N(m1,σ1) i N(m2,σ2); należy więc zweryfikować hipotezę H0: |
miary zależności oparte na chi-kwadrat |
|||||||
|
najczęściej stosowane miary :
1. współczynnik ϕ-Yule'a: r = 2, s - dowolne, to 0 ≤ ϕ ≤ 1, r > 2, s - dowolne, to ϕ może być większe od 1
2. współczynnik T-Czuprowa: r ≠ s, T może być znacznie mniejsze od 1
3. współczynnik V-Cramera: r = s, to V = T; r ≠ s, to V > T interpretacja każdego z podanych współczynników jest taka sama: jeśli przyjmuje on wartość 0, to cechy X i Y są stochastycznie niezależne; im bliższy 1 tym silniejsza jest zależność pomiędzy badanymi cechami X i Y |