MetStatChem 02c notatki


05.03.2013
dr hab. Tomasz Puzyn, prof. UG
Pracownia Chemometrii Środowiska
e-mail: t.puzyn@qsar.eu.org
tel. (58) 523 54 51
Pracownia Chemometrii Środowiska
ź średnia arytmetyczna
 odchylenie standardowe
Standaryzowana wartość mierzonej cechy (x)
2
Pracownia Chemometrii Środowiska
1
f(x) Gęstość prawdopodobieństwa
05.03.2013
Testy statystyczne
Testy parametryczne Testy nieparametryczne
Zakładamy, że próby pochodzą z Nie pytamy czy próby pochodzą z
populacji o rozkładzie normalnym, populacji o rozkładzie normalnym,
porównujemy parametry rozkładów. porównujemy całe rozkłady.
3
Pracownia Chemometrii Środowiska
Testy statystyczne
Testy parametryczne Testy nieparametryczne
Zakładamy, że próby pochodzą z Nie pytamy czy próby pochodzą z
populacji o rozkładzie normalnym, populacji o rozkładzie normalnym,
porównujemy parametry rozkładów. porównujemy całe rozkłady.
4
Pracownia Chemometrii Środowiska
2
05.03.2013
Standaryzowana wartość mierzonej cechy (x)
5
Pracownia Chemometrii Środowiska
Definicja prawdopodobieństwa:
n(A)
P(A) =
0 d" P(A) d" 1
n
Prawdopodobieństwo alternatywy wykluczających się zdarzeń:
P(A albo B)=P(A) + P(B) Ma włosy blond albo rude.
Prawdopodobieństwo koniunkcji zdarzeń niezależnych:
P(A i B)=P(A) x P(B) Ma włosy blond i jest kobietą.
6
Pracownia Chemometrii Środowiska
3
f(x) Gęstość prawdopodobieństwa
05.03.2013
n = 400
m = 7,0
s = 0,58
Zakres n P(A) Ł P(A)
< 5,3 0 0/400 = 0 0/400 = 0
[5,3; 5,8) 6 6/400 = 0,02 0/400 + 6/400 = 0,2
[5,8; 6,3) 41 41/400 = 0,10 0/400 + 6/400 + 41/400 = 0,12
[6,3; 6,9) 114 114/400 = 0,28 0/400 + 6/400 + 41/400 + 114/400 =0,40
[6,9; 7,4) 139 139/400 = 0,35 ...
[7,4; 7,9) 78 78/400 = 0,20 ...
[7,9; 8,5) 22 22/400 = 0,06 ...
8,5 e" 0 0/400 = 0 ...
7
Pracownia Chemometrii Środowiska
Wartości dystrybuanty
yródło: www.statsoft.pl
8
Pracownia Chemometrii Środowiska
4
05.03.2013
9
Pracownia Chemometrii Środowiska
1
2
m
1
s
1
n1
m
2
s
2
2
n
2
2
10
Pracownia Chemometrii Środowiska
5
05.03.2013
Rozkład normalny Dystrybuanta
0.6 1.0
m s n
1 1 1
0.8
0.4
m s n
2 2 2
0.6
0.4
0.2
0.2
0.0 0.0
u-3Sx u-1Sx u+1Sx u+3Sx u-3Sx u-1Sx u+1Sx u+3Sx
u-2Sx u u+2Sx u-2Sx u u+2Sx
Jeżeli z populacji o jakimkolwiek rozkładzie ze średnią i odchyleniem standardowym 
pobieramy próby o dużej liczebności, to rozkład średnich z tych prób będzie rozkładem
normalnym o średniej i odchyleniu sX =/"n
Wielkość sX = /"n nazywana jest błędem standardowym i opisuje odchylenie średnich
z prób od średniej z populacji (nie mylić z odchyleniami pojedynczych pomiarów!).
11
Pracownia Chemometrii Środowiska
Warunek!
m s n
1 1 1
Próby są liczne (n1 i n2 >> 30) oraz odchylenia
standardowe w obu populacjach generalnych
(1 i 2) są znane.
m s n
2 2 2
H : =
0 1 2
H : `" m lub < lub >
A 1 2 1 2 1 2
m1 - m2
u =
2 2
1 
2
+
n1 n2
" Jeżeli u < u => nie ma podstaw do odrzucenia H na założonym poziomie
kr 0
istotności.
" Jeżeli u e" u => H należy odrzucić na założonym poziomie istotności i przyjąć H
kr 0 A.
12
Pracownia Chemometrii Środowiska
6
05.03.2013
Rozkład gęstości prawdopodobieństwa N(0,1) 1 - Dystrybuanta N(0,1)
0.6 1.0
ukr = 1.64
u
0.8
0.4
0.6
0.4
0.2
p
0.2
ą = 0.05
0.0 0.0
-3 -2 -1 0 1 2 3 -3.4 -2.6 -1.8 -1.0 -0.2 0.6 1.4 2.2 3.0
13
Pracownia Chemometrii Środowiska
Rozkład gęstości prawdopodobieństwa N(0,1) 2 x [1 - Dystrybuanta N(0,1)]
0.6 1.0
ukr = -1.96 ukr = 1.96
u
0.8
0.4
0.6
0.4
0.2
ą = 0.05 / 2
p
0.2
0.0 0.0
-3 -2 -1 0 1 2 3 -3.4 -2.6 -1.8 -1.0 -0.2 0.6 1.4 2.2 3.0
14
Pracownia Chemometrii Środowiska
7
Obszar krytyczny
Obszar krytyczny
Obszar krytyczny
05.03.2013
m s n Problem?
1 1 1
Co zrobić jeśli próby są niewielkie i potrafimy
obliczyć jedynie odchylenia standardowe z prób?
m s n
2 2 2
William S. Gosset
(1876-1937)
15
Pracownia Chemometrii Środowiska
Jeżeli z populacji generalnej o rozkładzie normalnym pobieramy próby
n-elementowe, to dla każdej takiej próby można obliczyć statystykę t:
m -
t =
sX
Rozkład wartości t dla tych prób będzie zgodny z teoretycznym rozkładem
t-Studenta a jedynym parametrem tego rozkładu będzie liczba stopni swobody
v = n-1.
Krzywa jest spłaszczona dla prób małolicznych; ze wzrostem liczebności kształt
krzywej dąży do rozkładu normalnego.
16
Pracownia Chemometrii Środowiska
8
05.03.2013
17
Pracownia Chemometrii Środowiska
Co porównujemy? Dodatkowe warunki Nazwa testu
Porównujemy dwa wyniki badań (dwie równe wariancje w test t-Studenta
średnie) między sobą: obydwu rozkładach (dla prób
H0: 1 = 2 2 = 2 niezależnych)
1 2
Porównujemy dwa wyniki badań (dwie wariancje w obydwu test C-Cochrana i
średnie) między sobą: rozkładach różnią się Coxa
H0: 1 = 2 2 `" 2
1 2
Porównujemy wynik badań (średnią) z brak test t-Studenta
wartością odniesienia: (dla średniej)
H0: = 0
Sprawdzamy, czy różnice w parach występowanie tzw. test t-Studenta
odpowiadających sobie wyników nie są par wiązanych (dla prób
różne od zera: zależnych lub
H0: " = 0 par wiązanych)
18
Pracownia Chemometrii Środowiska
9
05.03.2013
H : =
0 1 2
H : `" m lub < lub >
A 1 2 1 2 1 2
m1 - m2
n1 " n2(n1 + n2 - 2)
"
n1 `" n2 t =
2 2
(n1 - 1) " s1 + (n2 - 1) " s2 n1 + n2
m1 - m2
t = " n
n1 = n2 = n
df = n1 + n2 - 2
2 2
s1 + s2
" Jeżeli t < t => nie ma podstaw do odrzucenia H na założonym poziomie
kr 0
istotności.
" Jeżeli t e" t => H należy odrzucić na założonym poziomie istotności i przyjąć H
kr 0 A.
19
Pracownia Chemometrii Środowiska
Zespół Instytutu Chemii Spożywczej opracował nową metodę oznaczania stężenia
Ca2+ (mg/dm3) w próbkach wody mineralnej. W celu potwierdzenia dokładności
nowej metody została ona porównana z metodą referencyjną. Uzyskane wyniki
(kilkukrotne powtórzenia pomiarów obiema metodami) zostały zestawione poniżej.
Należy sprawdzić, czy obie metody istotnie się różnią dokładnością.
Nowa:
19,8 20,1 19,9 20,0 19,8 20,1 19,8
m = 19,93
N
s = 0,14
N
Referencyjna:
19,9 20,2 20,0 20,3 20,1 19,8 20,1
m = 20,06
R
s = 0,17
R
20
Pracownia Chemometrii Środowiska
10
05.03.2013
H : =
0 N R
H : `"
A N R
mN - mR 19,93 - 20,06
ą  poziom istotności,
t = " n = " 7 = 1,56
2 2
test dwustronny
0,0196 + 0,0289
sN + sR
0.200 0.100 0.050
df = 7 + 7 - 2 = 12
6
7
8
9
10
11
12 2.179
13
14
21
Pracownia Chemometrii Środowiska
Rozkład gęstości prawdopodobieństwa (df = 12) 2 x [1 - Dystrybuanta (df = 12)]
1.0
tkr = 2.179 tkr = 2.179
t = -1.56 t = 1.56
0.4 0.8
0.6
0.2 0.4
p = 0.15 / 2
0.2
ą = 0.05 / 2
ą = 0.05 / 2
0.0 0.0
-3 -2 -1 0 1 2 3 -3.4 -2.6 -1.8 -1.0 -0.2 0.6 1.4 2.2 3.0
22
Pracownia Chemometrii Środowiska
11
df  liczba stopni swobody
Obszar krytyczny
Obszar krytyczny
05.03.2013
Rozkład gęstości prawdopodobieństwa (df = 12) 1 - Dystrybuanta (df = 12)
1.0
tkr = 1.782
t = 1.56
0.4 0.8
0.6
0.2 0.4
ą = 0.05
0.2
p = 0.07
0.0 0.0
-3 -2 -1 0 1 2 3 -3.4 -2.6 -1.8 -1.0 -0.2 0.6 1.4 2.2 3.0
23
Pracownia Chemometrii Środowiska
H : =
0 N R
H : `"
A N R
2
2
m1 - m2
s1
s2
C = z1 =
z2 =
n1 - 1 n2 - 1
z1 + z2
z1 " tkr,1 + z2 " tkr,2
Ckr
df2 = n2 - 1
df1 = n1 - 1
z1 + z2
" Jeżeli C < C => nie ma podstaw do odrzucenia H na założonym poziomie
kr 0
istotności.
" Jeżeli C e" C => H należy odrzucić na założonym poziomie istotności i przyjąć H
kr 0 A.
24
Pracownia Chemometrii Środowiska
12
Obszar krytyczny
05.03.2013
Sprawdzono biegłość pewnego laboranta zlecając mu analizę certyfikowanego
materiału odniesienia. Wartość certyfikowana wynosiła 20,0 mg/kg, natomiast
wartości zmierzone przez niego (osiem powtórzeń) były równe odpowiednio:
19,8 20,1 19,9 20,0 19,8 20,1 19,8 19,7. Czy na poziomie istotności ą = 0,05
wynik otrzymany przez laboranta różni się od wartości certyfikowanej?
H : = 0
0
ą  poziom istotności,
H : `" 0
A
test dwustronny
0.200 0.100 0.050
0 = 20,0 mg/kg
m - 0
1 3.078 6.314 12.706
= 19,9 mg/kg
t =
2 1.886 2.920 4.303
sx
s = 0,15 mg/kg
3 1.638 2.353 3.182
n = 8
4 1.533 2.132 2.776
df = n-1 = 7
5 1.476 2.015 2.571
s = s/"n = 0,15/2,83 = 0,053
x
6 1.440 1.943 2.447
7 1.415 1.895 2.365
m - 0 0,1
t = = = 1,89 8 1.397 1.860 2.306
sx 0,053
9 1.383 1.833 2.262
Odp.: Na poziomie ą = 0,05 nie różnią się.
25
Pracownia Chemometrii Środowiska
Zbadano czy stężenie rtęci w tkance tłuszczowej ryb pewnego gatunku przekracza
dopuszczalną normę (norma wynosi 19,8 mg/kg lipidów). Wartości zmierzone
(osiem próbek) były równe odpowiednio: 19,8 20,1 19,9 20,0 19,8 20,1 19,8
19,7. Czy na poziomie istotności ą = 0,05 norma została przekroczona?
H : = 0
0
H : > 0
A
ą  poziom istotności,
test jednostronny
0 = 19,8 mg/kg
0.010 0.050 0.025
= 19,9 mg/kg
m - 0
t =
1 3.078 6.314 12.706
s = 0,15 mg/kg
sx
2 1.886 2.920 4.303
n = 8
3 1.638 2.353 3.182
df = n-1 = 7
4 1.533 2.132 2.776
5 1.476 2.015 2.571
s = s/"n = 0,15/2,83 = 0,053
x
6 1.440 1.943 2.447
7 1.415 1.895 2.365
m - 0 0,1
t = = = 1,89
8 1.397 1.860 2.306
sx 0,053
9 1.383 1.833 2.262
Odp.: Na poziomie ą = 0,05 norma nie została przekroczona.
26
Pracownia Chemometrii Środowiska
13
df liczba stopni swobody
df  liczba stopni swobody
05.03.2013
H : " = 0
0
Seria I Seria II "
H : " `" 0
A
1,25 1,20 0,05
2,45 2,50 0,05
df = n-1 3,30 3,30 0,00
4,25 4,35 0,10
s = s"/"n
x
5,50 5,45 0,05
6,00 5,90 0,10
" - 0
md = 0,008
t =
sX
"  różnica pomiędzy wynikami uzyskanymi dla danej próbki w obu seriach
"  średnia wartość "
27
Pracownia Chemometrii Środowiska
Co porównujemy? Dodatkowe warunki Nazwa testu
Porównujemy między sobą dwie brak test F-Snedecora
wariancje:
H0: 2 = 2
1 2
Porównujemy wariancję w populacji z brak test chi-kwadrat
wariancją  wzorcową :
H0: 2 = 2
0
28
Pracownia Chemometrii Środowiska
14
05.03.2013
Zespół Instytutu Chemii Spożywczej opracował nową metodę oznaczania
stężenia Ca2+ (mg/dm3) w próbkach wody mineralnej. W celu potwierdzenia
precyzji nowej metody została ona porównana z metodą referencyjną. Uzyskane
wyniki (kilkukrotne powtórzenia pomiarów obiema metodami) zostały zestawione
poniżej. Należy sprawdzić, czy obie metody istotnie się różnią precyzją.
Nowa:
19,8 20,1 19,9 20,0 19,8 20,1 19,8
m = 19,93
N
s = 0,14
N
Referencyjna:
19,9 20,2 20,0 20,3 20,1 19,8 20,1
m = 20,06
R
s = 0,17
R
29
Pracownia Chemometrii Środowiska
H :  =  df = n
0 N2 R2 N N - 1 = 6
F = ?
kr,0.05
H :  <  (Fkr dla ą) df = n
A N2 R2 R R - 1 = 6
lub  `"  (Fkr dla ą/2)
N2 R2
2
2
s1 s1 >> s2
2 2 sR 0,172 0,0289
F =
F = = = = 1, 47
2
2
s2
sM 0,142 0,0196
" Jeżeli F < F => nie ma podstaw do odrzucenia H na założonym poziomie
kr 0
istotności.
" Jeżeli F e" F => H należy odrzucić na założonym poziomie istotności i przyjąć
kr 0
H
A.
30
Pracownia Chemometrii Środowiska
15
05.03.2013
df = n
N N - 1 = 6
F = ? df = n
R R - 1 = 6
0.05
31
Pracownia Chemometrii Środowiska
1 - Dystrybuanta
Rozkład F (ą = 0.05, df1 = 6, df2= 6)
1.0
1.4
1.2 0.8
1.0 Fkr = 4.28
0.6
0.8
0.6 0.4
0.4
0.2
0.2
0.0 0.0
0.0 0.6 1.2 1.8 2.4 3.0 3.6 4.2 4.8 0.0 0.6 1.2 1.8 2.4 3.0 3.6 4.2 4.8
32
Pracownia Chemometrii Środowiska
16
Obszar krytyczny
05.03.2013
H : 2 = 2
0
0
H : 2 > 2 (1) lub 2 < 2 (2) lub  `"  (3)
A N2 R2
0 0
n "s2
2 =
2

0
df = n -1
(1) 2 dla poziomu ą (1) Odrzucamy H0 na poziomie ą jeśli 2 > 2
kryt kryt
(2) 2 dla poziomu 1 - ą (2) Odrzucamy H0 na poziomie ą jeśli 2 < 2
kryt kryt
(3) Odrzucamy H0 na poziomie ą jeśli
(3) 2 dla poziomu 1 - ą/2
kryt1
2 < 2
kryt1
2 dla poziomu ą/2
kryt2
lub
2 < 2
kryt2
33
Pracownia Chemometrii Środowiska
Testy statystyczne
Testy parametryczne Testy nieparametryczne
Zakładamy, że próby pochodzą z Nie pytamy czy próby pochodzą z
populacji o rozkładzie normalnym, populacji o rozkładzie normalnym,
porównujemy parametry rozkładów. porównujemy całe rozkłady.
34
Pracownia Chemometrii Środowiska
17
05.03.2013
Co porównujemy? Dodatkowe warunki Nazwa testu
Porównujemy dwie próby między sobą brak " Test serii
H0: Próba 1 = Próba 2 (Walda-
Wolfowitza)
" Test U Manna-
Withneya
Sprawdzamy, czy różnice w parach występowanie tzw. Test Wilcoxona
odpowiadających sobie wyników istotnie par wiązanych dla par
różnią się od siebie wiązanych
H0: Brak różnic w parach
35
Pracownia Chemometrii Środowiska
Pewien związek organiczny można otrzymać w drodze syntezy dwoma metodami:
A i B. W celu porównania wydajności obydwu metod kilkukrotnie przeprowadzono
syntezę metodą A i kilkukrotnie przeprowadzono syntezę metodą B. Następnie
zestawiono uzyskane wyniki (wydajność syntezy w %). Należy zweryfikować na
poziomie istotności 0,05 hipotezę zerową, że wydajności obydwu metod syntezy
się nie różnią.
Metoda A:
37 30 45 52 22 35 27 40 47 32
Metoda B:
48 57 31 53 51 64 44 61 60
36
Pracownia Chemometrii Środowiska
18
05.03.2013
Dane należy uporządkować (łącznie metody A i B), a następnie przydzielić
poszczególnym wynikom rangi:
52
A 22 27 30 32 35 37 40 45 47
1 2 3 5 6 7 8 10 11 14
B 31 44 48 51 53 57 60 61 64
4 9 12 13 15 16 17 18 19
Liczba serii r = 8 Wartość krytyczna (z tablic) dla n1 = 10 i n2 = 9 wynosi rkryt = 6
Jeżeli r < rkryt odrzucamy hipotezę zerową (na poziomie istotności 0,05)
Jeżeli r e" rkryt nie mamy podstaw do odrzucenia hipotezy zerowej
37
Pracownia Chemometrii Środowiska
Dane należy uporządkować (łącznie metody A i B), a następnie przydzielić
poszczególnym wynikom rangi:
14
A 1 2 3 5 6 7 8 10 11
B 4 9 12 13 15 16 17 18 19
UA = 9 + 9 + 9 + 8 + 8 + 8 + 8 + 7 + 7 + 5 = 78
UB = 7 + 3 + 1 + 1 + 0 + 0 + 0 + 0 + 0 = 12
Umin = UB
Wartość krytyczna (z tablic) dla n1 = 10 i n2 = 9 wynosi Ukryt = 20
Jeżeli Umin < Ukryt odrzucamy hipotezę zerową (na poziomie istotności 0,05)
Jeżeli Umin e" Ukryt nie mamy podstaw do odrzucenia hipotezy zerowej
rangi wiązane (te same i różne próby)
38
Pracownia Chemometrii Środowiska
19
05.03.2013
W celu sprawdzenia skuteczności pewnego
# T N
pestycydu wybrano 11 par poletek na łące i
1. 821 810
przeprowadzono doświadczenie polegające na
zastosowaniu pestycydu na jednym z poletek w 2. 655 642
każdej parze (T), pozostawiając drugie poletko w
3. 915 890
parze jako kontrolne (N). Sprawdzano czy sucha
4. 540 540
masa roślinności (w gramach) zebranej w każdej
5. 431 439
parze się różni.
6. 1050 1020
7. 408 388
8. 408 403
9. 724 730
10. 795 780
11. 928 920
39
Pracownia Chemometrii Środowiska
Obliczamy różnice w parach i różnicom przypisujemy rangi zaczynając od różnicy
najmniejszej i biorąc pod uwagę ich wartości bezwzględne:
# T N d Ranga Znak Obliczamy sumy rang dodatnich
T+ = 49,9 i ujemnych T = 5,5
-
1. 821 810 11 5 +
2. 655 642 13 6 +
Tmin = T n = 10
-
3. 915 890 25 9 +
4. 540 540
Jeżeli Tmin d" Tkryt odrzucamy
hipotezę zerową (na poziomie
5. 431 439 8 3,5
istotności 0,05)
6. 1050 1020 30 10 +
7. 408 388 20 8 +
Jeżeli Tmin > Tkryt nie mamy
podstaw do odrzucenia hipotezy
8. 408 403 5 1 +
zerowej
9. 724 730 6 2
10. 795 780 15 7 +
11. 928 920 8 3,5 +
40
Pracownia Chemometrii Środowiska
20


Wyszukiwarka

Podobne podstrony:
MetStatChemb notatki
MetStatChem notatki
MetStatChema notatki
MetStatChemd notatki
MetStatChem notatki
notatki zagadnienia
00 Notatki organizacyjne
Filozofia religii cwiczenia dokladne notatki z zajec (2012 2013) [od Agi]
notatki tw 5
notatki finanse pierwsze zagadnienia
Etyka ogólna i zawodowa notatki

więcej podobnych podstron