Matematyka wyklad


Matematyczne podstawy opracowania pomiarów
" statystyczne metody analizy danych eksperymentalnych (przedziały
ufności, zagadnienia regresji, wybrane testy statystyczne)
" rachunek błędu
1 godzina wykładu (zaliczenie na podstawie wyniku kolokwium)
1 godzina laboratorium (zajęcia komputerowe grupowane po 3 godziny 
zaliczenie na podstawie wyniku kolokwium)
(dyskietka, tablice dystrybuanty rozkładu normalnego i rozkładu t-Studenta)
Literatura:
1. J. B. Czermiński, A. Iwasiewicz, Z. Paszek, A. Sikorski
Metody statystyczne dla chemików
PWN, Warszawa 1992
2. J. Greń
Statystyka matematyczna
PWN, Warszawa 1987
3. J. Greń
Statystyka matematyczna. Modele i zadania
PWN, Warszawa 1978
4. J. R. Taylor
Wstęp do analizy błędu pomiarowego
PWN, Warszawa 1995
5. W. Klonecki
Statystyka dla inżynierów
PWN, Warszawa 1995
6. W. Ufnalski, K. Mądry
Excel dla chemików i nie tylko
WNT, Warszawa 2000
Ramowy program zajęć
Matematyczne podstawy opracowania pomiarów
WYKAADY Ćwiczenia
1. Histogram, średnia, odchylenie stand. Zapisy
2. Rozkłady ciągłe, rozkład normalny
3. Rozkład t-Studenta, przedziały ufności
4. Testy parametryczne, test chi-kwadrat
5.Korelacja, regresja
6. Błędy, ANOVA, Excel
7. Wielomian, regresja wieloraka
8. Regresja nieliniowa linearyzowalna
9. Regresja nieliniowa
10.Rachunek błędu
11. Rachunek błędu, funkcje Kolokwium
12. Kolokwium wykładowe
13. Podsumowanie (błędy, wykresy, prezentacja)
14. Oceny
mediana
Średnia
Cały zbiór
(populacja)
n=17912
ź=7,7
2=30
0 5 10 15 20 25 30
Stężenie x
Średnia
Estymator
n=100
xśr.=7,7
S2=0,3
Próba
0 5 10 15 20 25 30
Stężenie średnie próby
Częstość względna
Częstość względna
12,8 8,2 19,1 22,6 26,1
13,3 9,1 19,2 22,7 26,2
14,5 9,2 19,2 22,7 26,2
15,5 11,1 19,3 22,7 26,3
17,3 11,4 19,4 22,7 26,3
17,5 12,8 19,4 22,7 26,4
17,8 13,1 19,4 22,9 26,4
18,2 13,2 19,7 23 26,5
18,7 13,3 19,8 23 26,5
20,8 13,4 19,8 23,1 26,8
21 13,5 19,9 23,2 27,2
21 13,9 20 23,2 27,2
21,3 14,2 20,1 23,3 27,4
21,8 14,3 20,1 23,3 27,4
22,4 14,4 20,2 23,5 27,5
22,6 14,5 20,2 23,5 27,6
23,6 14,8 20,3 23,6 27,7
24 15,1 20,3 24 28
24,2 15,1 20,4 24,1 28,2
24,5 15,2 20,4 24,2 28,3
25 15,5 20,4 24,2 28,3
25,3 15,6 20,4 24,3 28,3
25,8 15,6 20,5 24,3 28,4
26,1 15,9 20,6 24,3 28,5
26,7 16 20,8 24,3 28,5
26,9 16,4 20,8 24,4 28,7
27,3 16,4 20,8 24,6 28,7
27,3 16,6 20,8 24,6 28,8
27,4 16,7 20,9 24,6 29,2
27,6 16,9 21,1 24,7 29,2
27,7 17,1 21,2 24,7 29,3
27,7 17,2 21,3 24,7 29,3
29,1 17,3 21,4 24,7 29,4
17,4 21,4 24,8
17,4 21,6 24,8
suma 534,3 17,8 21,6 24,9 suma 4021,9
średnia 22,50606 17,8 21,8 25 średnia 21,62312
odch.stand. 4,633974 17,9 21,8 25,1 odch.stand. 4,598443
18 21,9 25,2
18,1 21,9 25,2
18,1 22 25,4
18,3 22 25,5
18,5 22,1 25,5
18,7 22,2 25,6
18,7 22,2 25,6
18,7 22,3 25,8
18,7 22,3 25,8
18,8 22,4 25,8
18,8 22,4 25,9
19 22,4 26
19 22,5 26,1
n n
- x)2
"xi "(xi
i=1 i=1
Średnia x = = 21,6 Odchylenie standardowe S = = 4,6
n n -1
xi xi2
xi - x (xi - x )2
8,2 -13,4 179,56 67,24
9,1 -12,5 156,25 82,81
9,2 -12,4 153,76 84,64
11,1 -10,5 110,25 123,21
11,4 -10,2 104,04 129,96
... ... ... ...
21,4 -0,2 0,04 457,96
21,6 0 0 466,56
21,8 0,2 0,04 475,24
... ... ... ...
29,3 7,7 59,29 858,49
29,4 7,8 60,84 864,36
n n n n
= 4021,9 - x) = 0 - x)2= xi2 = 90878
"xi "(xi "(xi "
i=1 i=1 i=1 i=1
3911,95
n n
2
2
Uwaga: - x)2 = - n x = 90877,97  186*(21,62311828)2 = 3911,95
"(xi "xi
i=1 i=1
Różne definicje średniej:
n
"xi
i=1
x =
średnia arytmetyczna
n
n
x1x2...xn
średnia geometryczna xgeom. =
n
1
"
1 xi
i=1
=
średnia harmoniczna
xharm n
Zakres x Środek Liczebność Częstość Liczebność Dystrybuanta
nL
przedziału nk względna łączna
F(xk ) =
n
Fk=nk/n nL =
"nk
kod 5 do 7,5 6,25 0 0 0 0
od 7,5 do 10 8,75 3 0,01613 3 0,01613
od 10 do 12,5 11,25 2 0,01075 5 0,02688
od 12,5 do 15 13,75 12 0,06452 17 0,0914
od 15 do 17,5 16,25 18 0,09677 35 0,18817
od 17,5 do 20 18,75 28 0,15054 63 0,33871
od 20 do 22,5 21,25 39 0,20968 102 0,54839
od 22,5 do 25 23,75 37 0,19892 149 0,80108
od 25 do 27,5 26,25 29 0,15591 178 0,95699
od 27,5 do 30 28,75 18 0,09677 186 1
F(xk)=P{x d" xk}; F(xk)-F(xp) = P{xp< x d" xk}
0,20
0,15
0,10
0,05
0,00
5 10 15 20 25 30
1,0
0,8
0,6
0,4
0,2
0,0
5 10 15 20 25 30
Temperatura
Fk #
ś#
f = ś# fk " "k = 1ź#
k "
"
# k #
k
Częstość względna
Dystrybuanta
0,20 0,20
0,15 0,15
0,10 0,10
0,05 0,05
0,00 0,00
5 10 15 20 25 30 18,5 19,0 19,5 20,0 20,5 21,0
Badana wielkość
1,0
0,20
0,8
0,15
0,6
0,10
0,4
0,2
0,05
0,0
0,00
5 10 15 20 25 30 5 10 15 20 25 30
Badana wielkość
n
n K
nk K
"xi
"xi "xk
i=1
i=1 k =1
x = x = = = Fk
Średnia Uwaga:
"xk
n n n
k =1
n n
- x)2 - x)2
"(xi "(xi
2 2 i =1
i=1
 = S =
Wariancja lub
n n - 1
n
n
- x)2
- x)2
"(xi
"(xi
i =1
i=1
S =
 =
Odchylenie standardowe lub
n n -1
Częstość względna
Dystrybuanta
0,10
0,20
Fk
fk
0,15
f =
k
"
0,05
k
0,10
# ś#
ś# fk " "k = 1ź#
"
0,05
# k #
0,00 0,00
5 10 15 20 25 30 0 10 20 30 40
Badana wielkość
1,0 1,0
0,8 0,8
0,6 0,6
0,4 0,4
0,2 0,2
0,0 0,0
5 10 15 20 25 30 0 10 20 30 40
Badana wielkość
Rozkłady ciągłe i dyskretne
Wykres Histogram (Fk vs. xk) Funkcja gęstości
prawdopodobieństwa f(x)
y
Dystrybuanta
F(xk ) = / n
"nk
F( y) = f (x)" dx
k -"
n K
+"
Średnia
nk K
"xi "xk
x = x " f (x) " dx
i =1 k =1 +"
x = = = Fk
"xk
-"
n n
k =1
n
+"
Wariancja
2
- x)2
"(xi  = - x)2 " f (x) " dx
K
+"(x
2
i=1
 = = - x)2 " Fk
-"
"(xk
n
k =1
Odchylenie
2 2
 = 
 = 
standardowe
Uwaga:
" f (x) " dx = P{x " (x, x + dx)}
b +"
K
" f (x) " dx = P{a < x < b} f (x) " dx = 1 ( = 1)
"Fk
+" +"
k =1
a -"
Częstość względna
Dystrybuanta
Rozkład normalny N(0,1)
u2
-
1
2
f0,1(u) = e
2Ą
0,4
0,3
0,2
0,1
0,0
-4 -2 0 2 4
1,0
0,8
0,6
0,4
0,2
0,0
-4 -2 0 2 4
100
99,7%
80
95,4%
60
40
68%
20
0
0 1 2 3 4

f(x)
F(x)
m+/-

Prawdopodobieństwo
Rozkład normalny N(m, )
( x-m)2
-
1
2
2
fm, (x) = e
 2Ą
0,8
0,7
0,6
N(2;0,5)
0,5
0,4
N(0,1)
0,3
0,2
N(4,2)
0,1
0,0
-4 -2 0 2 4 6 8 10
x
f(x)
0 b
a
0
b
a
0
b
P{x < b} = f (x) " dx =F(b)
+"
-"
a
"
f (x) " dx = 1- f (x) " dx
P{x > a} = = 1-F(a)
+" +"
a - "
b
P{a < x < b} = f (x) " dx = F(b)  F(a)
+"
a
Uwaga: F(-c)=1 - F(c)
f(x)
f(x)
f(x)
0,4
N(0,1)
0,3
0,2
N(4,2)
0,1
0,0
-4 -2 0 2 4 6 8 10
x
x - m dx
u = du =
Normalizacja xu: ( )
 
b-m
( x-m)2
b b

- -
1 1
2
2
P{a < x < b} = fm, (x) " dx = " dx = e
+" +" 2Ą e +"
2Ą
a-m
a a

b-m

a - m b - m b - m a - m
f0,1(u) " du = P{ < u < } = F( ) - F( )
+"
   
a-m

Przykład:
N(4,2)
P{6f(x)
(x-m)2
-
1
2
2
fm, (x) = e
 2Ą
x N(mx, x) y N(my, y)
q=Bx N(B"mx, B"x)
0,4
N(2,1)
0,3
0,2
N(4,2)
0,1
0,0
010
x
2 2
q=x + y N(my + mx,  +  )
x y
N(5,3)
0,12
0,10
N(10,4)
0,08
N(15,5)
0,06
0,04
0,02
0,00
-10 0 10 20 30
x
f(x)
f(x)
x
x N(m, ) ! N(?, ?)
xi
1
x = = " xi
" "
n n
i i
m
1 1 1 1
x N(m, ) ! " xi N( "m, ") ! " xi N( ,
" " "( )2 )
n n n n n n
i i i
2
=
"( )2 = n " ( )2 =  
n n n
n
i
m
m
= n " = m
"
n n
i

x
x N(m, ) ! N(m, )
n
0,4
N(4,1)
0,2
N(4,5)
0,0
-12 -8 -4 0 4 8 12 16 20
x
f(x)
0,020
0,015
0,010
0,005
74,44634 74,4221
125,5295 101,339
134,6627 101,1795
95,31638 108,4944
78,26599 104,0849
0,000
66,19135 93,33418
40 60 80 100 120 140 160
80,44741 112,1937
x
57,64138 69,32283
91,91905 101,1841
92,69014 101,97
92,59519 116,5623
98,29431 89,17501
89,73585 72,22985
117,3135 62,19394
0,08
86,90187 71,14228
67,75205 79,83114
0,07
118,0438 103,0403
98,30966 97,53895
113,5028 137,4115
0,06
115,1522 158,0141
0,05
94,73557 97,73321
0,04
0,03
0,02
0,01
0,00
40 60 80 100 120 140 160
xśr.
i
n/f(x)
i
n/f(x)
TWIERDZENIE
Suma dużej liczby zmiennych losowych niezależnych ma
asymptotyczny (tzn. graniczny) rozkład normalny.
Rozkład średniej dla różnych populacji
f(x)
f(x)
n=2
n=8
n=50
Przedziały ufności
Przedział zawierający z określonym prawdopodobieństwem wynoszącym 1-ą
(poziom ufności) szacowany parametr np. wartość m rozkładu normalnego.
Model I

x
x N(m, ),  znane lub n>50 ! N(m, )
n
P{-uą < u < uą} = 1-ą (na ogół 1-ą=95%, 99%, 99.9%)
x - m
" n
P{-uą < < uą} = 1-ą

 
x
P{- uą < - m
< uą } = 1-
n n
ą
 
x x
P{ - uą < m < +uą }=
-uą 0 uą
n n
1-ą
Precyzja pomiarowa d
uą
m " (x ą )
2 2
n
uą "
n >
2
d
Znajdowanie uą: P{-uą < u < uą} = 2F(uą)-1 = 1-ą
1-ą F(uą) uą
0,9 0,95 1,645
0,95 0,975 1.96
0,99 0,995 2.575
0,999 0,9995 3,29
Rozkład t-Studenta
k +1
( )
1
2
f (t) = "
kĄ " (k / 2) t2 k +1
2
(1+ )
k
+"
p-1
( p) = x " e- x " dx
gdzie: k=n-1 lb. stopni swobody, dla p>0
+"
0
((n+1)=n!)
y
F( y) = f (t) " dt
Dystrybuanta
+"
-"
TWIERDZENIE Jeżeli z populacji o rozkładzie normalnym N(m,),
gdzie  nie jest znane, losujemy n-elementową próbę prostą to
zmienna losowa
x - m
t = " n
S
ma rozkład t-Studenta o n-1 stopniach swobody.
0,4
0,2
0,0
-4 -2 0 2 4
0,4
N(0,1)
0,2
0,0
-4 -2 0 2 4
t
f(t)
f(x)
Model II
x - m
t = " n
x N(m,),  nie jest znane, n<50 ! podlega rozkładowi
S
t-Studenta o k=n-1 stopniach swobody
P{-tą < t < tą} = 1-ą
x - m
" n
P{-tą < < tą} = 1-ą
S
S S
x
P{- tą < - m
< tą } = 1-ą
n n
S S
x x
P{ - tą < m < +tą } = 1-ą
n n
-tą 0 tą
Precyzja pomiarowa d
tąS
m " (x ą )
2 2
tą " S
n
n >
2
d
Znajdowanie tą
P{| t |> tą} = ą - tablice wartości tą dla różnych k i ą
Testy statystyczne: test dla dwóch średnich
x - x
Test z: z dwiema próbami dla średnich 1 2
u = z =
- rozkłady normalne
2 2
 
1 2
- znane odchylenia standardowe s , s
+
1 2
n1 n2
- gdy próby dla n , n >50 (wykorzystujemu S , S )
1 2 1 2
H0: m1=m2 H1: m1> m2
H0: m1=m2 H1: m1ąm2
f(x)
f(x)
-ua 0 ua
0 ua
Poziom ufności 1-a
P{u > ua}=a 1- F(ua)=a ua
P{|u|>ua}=a 2[1- F(ua)]=a ua
Wynik testu:
Wynik testu:
gdy u > ua hipotezę H0 odrzucamy
gdy qŻ > ua hipotezę H0 odrzucamy
gdy u < ua nie ma podstaw do
gdy qŻ < ua nie ma podstaw do
odrzucenia hipotezy H0
odrzucenia hipotezy H0
Przykład:
roztwór A n1=450, x1=12,3 mM, S12=3,4
roztwór B n2=500, x2=11,9 mM, S22=4,4
a=0,05 a=0,001
Test z: z dwiema próbami dla S
rednich
Test z: z dwiema próbami dla S
rednich
Zmienna 1 Zmienna 2
Zmienna 1 Zmienna 2
R 12,31267 11,943
rednia
R 12,31267 11,943
rednia
Znana wariancja 3,4 4,4
Znana wariancja 3,4 4,4
Obserwacje 450 500
Obserwacje 450 500
Różnica S wg hipotezy 0
rednich
Różnica S wg hipotezy 0
rednich
z 2,890531
z 2,890531
P(Z<=z) jednostronny 0,001923
P(Z<=z) jednostronny 0,001923
Test z jednostronny 3,090245
Test z jednostronny 1,644853
P(Z<=z) jednostronny 0,003846
P(Z<=z) jednostronny 0,003846
Test z dwustronny 3,290479
Test z dwustronny 1,959961
Testy statystyczne: test dla dwóch średnich
x - x
1 2
t =
2
n1S12 + n2S2 1 1
( + )
n1 + n2 - 2 n1 n2
" H0: m1=m2 H1: m1`"m2 " H0: m1=m2 H1: m1> m2
f(x)
f(x)
-tą 0 tą
0 tą
Poziom ufności 1-ą
P{|t|>tą}=ą r=n1+n2-2, ą tą
P{t>tą}=ą r=n1+n2-2, 2ą tą
Wynik testu:
Wynik testu:
gdy t > tą hipotezę H0 odrzucamy
gdy ##> tą hipotezę H0 odrzucamy
t
gdy t < tą nie ma podstaw do
gdy ##< tą nie ma podstaw do
t
odrzucenia hipotezy H0
odrzucenia hipotezy H0
Przykład:
z katalizatorem n1=8; 17, 11, 22, 18, 19, 13, 14, 16
bez katalizatora n2=7; 15, 12, 10, 18, 14, 15, 13
Zmienna 1 Zmienna 2
Zmienna 1 Zmienna 2
R 16,25 13,85714
rednia
R 16,25 13,85714
rednia
Wariancja 12,5 6,47619
Wariancja 12,5 6,47619
Obserwacje 8 7
Obserwacje8 7
Wariancja sumaryczna 9,71978
Różnica Sednich wg hipotezy 0
r
Różnica Sednichwghipotezy 0
r
df 13
df 13
t Stat 1,517122
t Stat 1,482986
P(T<=t) jednostronny 0,076586
P(T<=t) jednostronny 0,080956
Test T jednostronny 1,770932
Test T jednostronny 1,770932
P(T<=t) dwustronny 0,153172
P(T<=t) dwustronny 0,161912
Test t dwustronny 2,160368
Test t dwustronny 2,160368
Test zgodności 2
(służy określeniu czy badana zmienna podlega określonemu rozkładowi)
Przykład
x
n=200 Obliczamy średnią = 2,0 i odchylenie standardowe S = 0,5
xk nk
1,0 - 1,4 15
1,4 - 1,8 45
1,8 - 2,2 70
2,2 - 2,6 50
2,6 - 3,0 20
1,0
0,8
0,6
0,4
0,2
0,0
0,0 0,4 0,8 1,2 1,6 2,0 2,4 2,8 3,2 3,6 4,0
xk nk pk
n"pk (nk- n"pk)2 (nk- n"pk)2/n"pk
1,0 - 1,4 15 0,115 23 64 2,78
1,4 - 1,8 45 0,23 46 1 0,02
1,8 - 2,2 70 0,31 62 64 1,03
2,2 - 2,6 50 0,23 46 16 0,35
2,6 - 3,0 20 0,115 23 9 0,39
2=4,57
1,0
0,8
0,6
0,4
0,2
0,0
0,0 1,4 1, 2,2 2,6 4,0
x N(2; 0,5) ! u=(x-m)/ N(0,1)
p1=P{x<1,4}=P{u<-1,2}=F(-1,2)=1-F(1,2)
p2=P{1,4p3=P{1,8p4=P{2,2p5=P{x>2,6}=P{u>1,2}=1-F(1,2)
H0: badana zmienna podlega testowanemu rozkładowi
H1: badana zmienna nie podlega testowanemu rozkładowi
P{2 e" 2k,ą } = ą
gdzie k = r-m-1 (r -lb. przedziałów, m - lb. parametrów wyznaczanych
na podstawie próby) (dla k=5-2-1 i ą=0,05 ! 2k,ą=5,991)
(nk - n " pk )2
2
 =
"
" Gdy wartość obliczona
n "pk e" 2k,ą
k
to znajduje się ona w obszarze krytycznym i hipotezę H0 należy
odrzucić.
" Gdy 2 < 2k,ą nie ma podstaw do odrzucenia hipotezy H0
2k,ą
1-ą
Estymatory (np. średnia arytmetyczna, odchylenie standardowe,
współczynnik korelacji z próby)
1. nieobciążoność
E(x) = m
xi
1 1
E(x) = E( ) = E(xi ) =
" "m = m
n n n
2
( x1 - m)
-
1
2
2
P{x1, x2, x3...xn} = P{x1} " P{x2} " P{x3} " " " P{xn} = e " dx1 " "" =
 2Ą
2
"( xi - m)
-
1
2
2
= e " dx1 " " " dxn
 2Ą
xi
(xi
" - m)2 2
Pmax ! = min ! =
"(x - m) = 0 ! " m
i
2 2
2 2 n
2. zgodność
n
limP{ x - m < } = 1
 >0 n"
# ś#
x - m   n
n
ź#
P{ x - m < } = P{ < } = 2Fś# -1
n
ś# ź#
 

# #
n n
gdy n to F 1, czyli P 1
q = q(x,y)
"q # ś#
"q
# ś#
qi = q(xi , yi ) E" q(x, y) + " (xi - x) + ś# ź# ( yi - y)
"
ś# ź#
ś# ź#
"x "y
# #x, y
# #
x, y
Ą# ń#
1 1
q = = " ś# ź# "
ś# ź#
"qi "ó#q(x, y) + # "q ś# (xi - x) + # "q ś# (yi - y)Ą# =q(x, y)
ś# ź#
n n "x "y
# #x, y
ó# # #x, y Ą#
Ł# Ś#
2
Ą# ń#
1 1
2
 = - q)2 = " ś# ź# "
ś# ź#
q "(qi "ó#q(x, y) + # "q ś# (xi - x) + # "q ś# ( yi - y) - q(x, y)Ą#
ś# ź#
n n "x "y
# #x, y
ó# # #x, y Ą#
Ł# Ś#
2
2
1 "q 1 # ś# 2 "q "q
"q # ś#
# ś# # ś#
= " - x)2 + " ś# ź# - y)2 + " " ś# ź# - x) " ( y
ś# ź# ś# ź#
"(xi "(yi "(xi
ś# ź# ś# ź#
n "x n "y n "x "y
# # # #
# # # #x, y
x , y x , y
x , y
2
2
"q # ś# "q "q
"q # ś#
# ś# # ś#
2 2
= " + ś# ź# " + 2 " " ś# ź# "
ś# ź# ś# ź#
x y xy
ś# ź# ś# ź#
"x "y "x "y
# # # #
# # # #x, y
x, y x , y
x , y
Kowariancja:
ż# - mx )(yi - my )" pij
""(xi
# i j
#
cov(x, y) =  =
+"+"
#
xy
#
+" +"(x - mx )(y - my ) f (x) f (y)dxdy
#
#-"-"

cov(x, y)
xy
 = = L(-1 d"  d" 1)
Współczynnik korelacji :
 "  "
x y x y
 = 0 x,y nieskorelowane
 `" 0 x,y skorelowane
1. x, y niezależne ! nieskorelowane tzn.  = 0 (Uwaga: gdy x, y zależne to
mogą być nieskorelowane)
2.  `" 0, czyli zmienne losowe są skorelowane to są również zależne
Współczynnik korelacji z próby
1
yi - nx y
"xi
- x)(yi - y)
"(xi
n -1
r = =
2
Sx " Sy
- x)2 - y)
"(xi "(yi
y
r=0,988
x
r=-0,54
r=-0,988
(x-8)2+(y-8)2=49
r=0,06
y
r=0,80
y/z vs. x/z
r=0,06
x
y=x1,5+5
r=0,98
r=0,99
y = b + b x
0 1
y
30
20
POPULACJA
10
0
0 5 10 15
f(b )
0
y
= b + b x
y
0 1
30
PRÓBA
b
0
20
^
e=y-yi
i i
f(b )
1
10
b
0
1
0510 15
40
= b0 + b1x
y
y
30
20
^
e=y-yi
i i
10
0
0510 15
5
e
0
-5
^
e=y-yi
i i
-10
05 15
x10
n
2
2 2
Q = = - yi ) = yi - b1x - b0 ) = min.
"ei "(yi "(
i i=1
"Q
ż#
- b1x - b0 )(-xi ) = 0
2
"(yi
#"b = 2
ż#
"x + b0"x = "x yi
1 i i i
#b
#
1
#
#
"Q
#
"x "
# #b1 i + n "b0 = yi
= 2 - b1x - b0 )(-1) = 0
"(yi
#
#"b0
Gdy jeden z parametrów znany: jedno równanie, jedna niewiadoma
n xi yi - ( xi )( yi ) (xi - x)( yi - y)
b1 = =
2
n - ( )2 - x)2
"xi "xi "(xi
2
( )( yi ) - ( xi)( xi yi )
"xi " " "
b0 =
n - x)2
"(xi
b0 = y - b1x
xi yi (xi - x) (yi - y) (xi - x)2 ( yi - y)2 (xi - x)(yi - y)
1 8 -3 -8 9 64 24
2 13 -2 -3 4 9 6
3 14 -1 -2 1 4 2
4 17 0 1 0 1 0
5 18 1 2 1 4 2
6 20 2 4 4 16 8
7 22 3 6 9 36 18
28 112 0 0 28 134 60
"
średnia 4 16
25
21
b =60/28=2,14
1
17
b =16-2,14"4=7,43
0
r=60/"28"134=0,98
13
y=2,14"x+7,43
9
5
02468
x
y
(yi - yi )2
xi yi yi = b1 xi + b0 ei = yi - yi xi 2
1 8 9,57 1,57 2,4694 1
2 13 11,71 -1,29 1,6531 4
3 14 13,86 -0,14 0,0204 9
4 17 16 -1 1 16
5 18 18,14 0,14 0,0204 25
6 20 20,29 0,29 0,0816 36
7 22 22,43 0,43 0,1837 49
28 112 0 5,4286 140
:
średnia 4 16
1,5
1
S = 1,04
0,5
6 X
0
S = 0,88
b1
02 4 8
-0,5
S = 0,20
b0
^
-1
e=y-yi
i i
-1,5
-2
1
)
S =
"(y -yi )2 = 1 "(y - b1x - b0 )2
i i
n - 2 n - 2
S S
Sb = =
1
2
xi2
"(x - x)2 " - n " x
i
2
xi2
1 x
"
Sb = S " = S " +
0
n
n
"(x - x)2 "(x - x)2
i i
Składniki resztowe
Regresja liniowa: EXCEL
wi = b1 " xi + b0
x y
REGLINW
1 8 9,571429 7,428571 ODCITA
2 13 11,71429 2,142857 NACHYLENIE
3 14 13,85714 7 ILE.LICZB
4 17 16 1,041976 REGBASTD.
5 18 18,14286
6 20 20,28571 8,571429 KOWARIANCJA
7 22 22,42857 0,979535 WSP.KORELACJI
2,142857 7,428571429 b1 b0 REGLINP
0,196915 0,880630572 Sb1 Sb0
0,959488 1,041976145 r2 S
118,4211 5 F df
128,5714 5,428571429 SSR SSE
EXCEL: ORIGIN:
Regresja liniowa 24
22
25
20
23
21 18
19
16
17
15
14
13
12 B
11
Data1B
9
10 UCL
7
LCL
UPL
5
8
0 1 2 3 4 5 6 7 8
LPL
x
6
1 2 3 4 5 6 7
x
y
y
Przedziały ufności w analizie regresji
b1 - 1
P{b -t S < b < b +t S }= 1-a
1 a b1 1 1 a b1
t =
P{b -t S < b < b +t S }= 1-a
Sb 0 a b0 0 0 a b0
1
b0 - 0
t =
k=5, 1-a=0,95b t =2,57
a
Sb0
b (5,16; 9,69)
0
1-ą,k = n - 2
b (1,64; 2,65)
1
-ta 0 ta
Krzywe ufności
Przedział tolerancji
2
2
1 ( xi - x)
1 ( xi - x )
S (ufn.) = S " +
S (tol.) = S " 1 + +
wi
wi
2 2
n n
( xi - x) ( xi - x )
" "
) )
D (ufn.) = yi - S (ufn.) " tą D (tol.) = y - S (tol.) " tą
w i w
i i
) )
G (tol.) = y + S (tol.) " tą
G (ufn.) = yi + S (ufn.) " tą
i wi
w
i
^
xi yi S(ufn.) D(ufn.) G(ufn.) S(tol.) D(tol.) G(tol.)
1 9,57 0,70999 7,74605 11,3968 1,26087 6,32973 12,8131
2 11,71 0,55696 10,2823 13,1462 1,18149 8,67668 14,7519
... ... ... ... ... ... ... ...
25
21
17
Dane
13
Krzyw a regres ji
Krzyw a ufnosci g.
Krzyw a ufnosci d.
9
K. Tolerancji d.
K. Tolerancji g.
5
02468
x
y
y
= b0 + b1x
y
30
SSR =
"( wi - yi )2
i
^i _
y-y
20
SSE =
"( yi - wi )2
_
i
y-yi
i
SSTO = yi - yi )2
"(
i
10
^
e=y-yi
i i
0
0510 15
(yi - y) = (yi - wi ) + (wi - yi )
SSTO=SSE + SSR (gdy b0, b1 sa dopasowane metodą regresji liniowej)
ANALIZA WARIANCJI
df SS MS
Regresja m-1 SSR MSR=SSR/(m-1)
Resztkowy n-m SSE MSE=SSE/(n-m)
Razem n-1 SSTO
df  liczba stopni swobody
m  liczba parametrów regresji (prosta regresja liniowa  b0, b1)
n  lb. punktów pomiarowych
Cd = r2 = SSR/SSTO  współczynnik determinacji (względna miara dopasowania)
1-Cd  współczynnik indeterminacji
EXCEL: Analiza danych: regresja
PODSUMOWANIE - WYJŚCIE
Statystyki regresji
Wielokrotność R 0,979535 r- współczynnik korelacji
R kwadrat 0,959488 r2=SSR/SSTO
Dopasowany R kwadrat 0,951386 R2dop.=1-(n-1)/(n-m)*(SSE/SSTO)
Błąd standardowy 1,041976 S
Obserwacje 7 n
ANALIZA WARIANCJI
df SS MS F Istotność F
Regresja 1 128,5714 128,5714 118,4211 0,000114
Resztkowy 5 5,428571 1,085714
Razem 6 134
ANALIZA WARIANCJI
df SS MS
SSR = wi - yi )2
"(
Regresja m-1 SSR MSR=SSR/(m-1)
i
SSE = yi - wi )2
"(
Resztkowy n-m SSE MSE=SSE/(n-m)
i
SSTO = yi - yi )2
"(
Razem n-1 SSTO
i
Błąd Wartość- Dolne Górne Dolne Górne
Współczynniki standardowy t Stat p 95% 95% 99,0% 99,0%
Przecięcie 7,428571 0,880631 8,435514 0,000384 5,164842 9,692301 3,877766 10,97938
Zmienna X 1 2,142857 0,196915 10,88214 0,000114 1,636672 2,649042 1,348873 2,936841
b0-tą"Sb0 b0+tą"Sb0
b0 Sb0
b1-tą"Sb1 b1+tą"Sb1
b1 Sb1
SKAADNIKI RESZTOWE - WYJŚCIE
Składniki
Obserwacja Przewidywane Y resztowe Std. składniki resztowe
1 9,571429 -1,57143 -1,65207
2 11,71429 1,285714 1,351691
3 13,85714 0,142857 0,150188
4 16 1 1,051315
5 18,14286 -0,14286 -0,15019
6 20,28571 -0,28571 -0,30038
7 22,42857 -0,42857 -0,45056
ei
ei* =
wi = b1 " xi + b0 ei = yi - wi
SSE
n -1
Testy statystyczne w analizie regresji
ANALIZA WARIANCJI
df SS MS F Istotność F
Regresja 1 128,5714 128,5714 118,4211 0,000114
Resztkowy 5 5,428571 1,085714
Razem 6 134
Błąd Wartość- Dolne Górne Dolne Górne
Współczynniki standardowy t Stat p 95% 95% 99,0% 99,0%
cięcie 7,428571 0,880631 8,4355140,000384 5,1648429,692301 3,877766 10,97938
na X 1 2,142857 0,196915 10,882140,000114 1,6366722,649042 1,348873 2,936841
" Test t (Służy testowaniu założenia, że 0=0, lub 1=0)
b1 - 0 b1
b0 - 0 b0
tStat = =
tStat = =
Sb Sb lub Sb Sb
0 0 1 1
H0: 0=0, HA: 0`"0 lub H0: 1=0, HA: 1`"0
Hipotezę H0 odrzucamy gdy #tStat# > tn-2, 1-ą, gdyż uzyskany został wynik mało
prawdopodobny. Wartość-p określa wartość tego prawdopodobieństwa (gdy
mniejsze od wybranego ą to H0 odrzucamy).
" Test F (Dotyczy istotności tylko współczynnika kierunkowego. Dla
prostej regresji liniowej oba testy są równoważne - t2=F)
F=MSR/MSE
H0: 1=0, HA: 1`"0
Hipotezę H0 odrzucamy gdy #F# > F1,n-2, 1-ą, gdyż uzyskany został wynik mało
prawdopodobny. Istotność F określa to samo co Wartość-p, czyli wartość tego
prawdopodobieństwa (gdy mniejsze od wybranego ą to H0 odrzucamy).
ORIGIN: Tools: Linear Fit
Linear Regression for Data1_B:
Y = A + B * X
Parameter Value Error t-Value Prob>|t|
A 7,42857A 0,88063 8,43551 3,84132E-4
B 2,14286 0,19691 10,88214 1,1382E-4
-----------------------------------------------------------------
R R-Square(COD) Adj. R-Square Root-MSE(SD) N
--------------------------------------------------------------------------------------
0,97953 0,95949 0,95139 1,04198 7
--------------------------------------------------------------------------------------
ANOVA Table:
-------------------------------------------------------------------------------------------------
Degrees of Sum of Mean
Item Freedom Squares Square F Statistic
-------------------------------------------------------------------------------------------------
Model 1 128,57143 128,57143 118,42105
Error 5 5,42857 1,08571
Total 6 134
Prob>F
-----------------
1,1382E-4
-----------------
Zmienna X 1 Rozkład reszt
1,5
1
0,5
0
02468
-0,5
-1
-1,5
-2
Zmienna X 1
Zmienna X 1 Rozkład linii dopasowanej
25
23
21
19
17
Y
15
Przewidywane Y
13
11
9
7
5
02468
Zmienna X 1
Składniki resztowe
Y
Wielomian k-tego stopnia
y = 0 + 1 " x + 2 " x2 + ... + k " xk
k
y = b0 + b1 " x + b2 " x2 + ... + bk " xk = " xk
"bk
k =0
k
Q =
"(y -"b " xk )2 = min.
i k
i k =0
2 k
Ą# ń#
n yi
"x "x ... "x ń# Ą#b0 ń# Ą# "
i i i
ó# ó#
2 3 k +1 Ą#
yi " xi Ą#
"x "x "x ... "x Ą# ó#b1 "
i i i i
ó# Ą# ó# Ą#
ó# Ą#
2 3 4 k +2
ó# Ą# ó#
ó# Ą#
... " b2 = yi " xi2 Ą#
"xi "xi "xi "xi "
ó# Ą# ó# Ą#
ó# Ą#
... ... ... ... ... ...
ó# Ą# ó# Ą#
ó#...Ą#
k +1 k +2 2k
ó# Ą# ó#
ó#bk Ą#
xik ... yi " xik Ą#
" "xi "xi "xi Ł# Ś# "
Ł# Ś# Ł# Ś#
12
10
8
6
4
2
0
-2
-4
-6
-8
-10 -5 0 5 10
x
1
S = " xik )2
"( yi - wi )2 = 1 "( yi - "bk
n - k -1 n - k -1
i ik
y
Przykład:
y =A + Bx + Cx2
2
Ą# ń# Ą# yi ń#
n A
Ą# ń#
"xi "xi "
ó# Ą# ó#
2 3 ó#BĄ#
" = yi " xi Ą#
"xi "xi "xi "
ó# Ą# ó# Ą#
ó# Ą#
2 3 4
ó# Ą#
ó#
"
"xi "xi "xi Ł#CĄ# ó# yi " xi2 Ą#
Ś#
Ł# Ś# Ł# Ś#
2
ż#
A" n + B + C = yi
"xi "xi "
#
#A + B 2 + C 3 = yi " xi
#
"xi "xi "xi "
#
2 3 4
#
"xi "xi "xi "
#A + B + C = yi " xi2
xi yi xi2 xi3 xi4 ( yi
yi"xi yi"xi2 yi - wi - wi )2
... ... ... ... ... ... ... ... ...
2 3 4
yi yi " xi yi " xi2
"xi " "xi "xi "xi " " "( yi - wi )2
i
Przykład: Origin:
12
Data: Data1_B
10
Model: wielom3
Chi^2 = 0.39445
8
A=0
B=-0.15685ą0.07716
6
C=0.02049ą0.00355
4
D=-0.00707ą0.001
2
0
-2
-4
-6
y=A+Bx+Cx2+Dx3
-8
-10 -5 0 5 10
x
y
Regresja wieloraka
60
55
50
45
40
190
180
8
9
170
10
11
160
12
150
13
14
140
z =A + Bx + Cy
Ą# ń# Ą# ń#
n xi yi A zi
Ą# ń#
" " "
ó# Ą# ó#
2 ó#BĄ#
yi"xi Ą# " = " xi Ą#
"xi "xi " "zi
ó# ó# Ą#
ó# Ą#
ó#
ó#
yi yi xi yi2 Ą# Ł#CĄ# ó# zi " yi Ą#
" " " "
Ś#
Ł# Ś# Ł# Ś#
ż#
A " n + B yxi = zi
"x + C" "
i
#
#A xi + B 2 + C yi xi =
#
" "x " "z " xi
i i
#
#A yi + B yi xi + C yi2 = i " yi
" " " "z
#
Z Axis
s
i
X
x
A
A
x
i
s
Y
Regresja wieloraka
y x1 x2 x3 x4 x5 x6
44,609 44 89,47 11,37 62 178 182
45,313 40 75,07 10,07 62 185 185
54,297 44 85,84 8,65 45 156 168
59,571 42 68,15 8,17 40 166 172
49,874 38 89,02 9,22 55 178 180
44,811 47 77,45 11,63 58 176 176
45,681 40 75,98 11,95 70 176 180
49,091 43 81,19 10,85 64 162 170
39,442 44 81,42 13,08 63 174 176
60,055 38 81,87 8,63 48 170 186
50,541 44 73,03 10,13 45 168 168
37,388 45 87,66 14,03 56 186 192
44,754 45 66,45 11,12 51 176 176
47,273 47 79,15 10,6 47 162 164
51,855 54 83,12 10,33 50 166 170
49,156 49 81,42 8,95 44 180 185
40,836 51 69,63 10,95 57 168 172
46,672 51 77,91 10 48 162 168
46,774 48 91,63 10,25 48 162 164
50,388 49 73,37 10,08 67 168 168
39,407 57 73,37 12,63 58 174 176
46,08 54 79,38 11,17 62 156 165
45,441 52 76,32 9,63 48 164 166
54,625 50 70,87 8,92 48 146 155
45,118 51 67,25 11,08 48 172 172
39,203 54 91,63 12,88 44 168 172
45,79 51 73,71 10,47 59 186 188
50,545 57 59,08 9,93 49 148 155
48,673 49 76,32 9,4 56 186 188
47,92 48 61,24 11,5 52 170 176
47,467 52 82,78 10,5 53 170 172
EXCEL: Analiza danych: Korelacja
y x1 x2 x3 x4 x5 x6
y 1
x1 -0,30 1
x2 -0,16 -0,23 1
x3 -0,86 0,19 0,14 1
x4 -0,40 -0,16 0,04 0,45 1
x5 -0,40 -0,34 0,18 0,31 0,35 1
x6 -0,24 -0,43 0,25 0,23 0,31 0,93 1
EXCEL: Analiza danych: Regresja
Statystyki regresji
Wielokrotność R 0,8726
R kwadrat 0,7614
Dopasowany R kwadrat 0,7444
Błąd standardowy 2,6933
Obserwacje 31
ANALIZA WARIANCJI
df SS MS F Istotność F
Regresja 2 648,2622 324,1311 44,68146 1,94E-09
Resztkowy 28 203,1194 7,254263
Razem 30 851,3815
Wartość- Dolne Górne
Współczynniki Błąd stand. t Stat p 95% 95%
A 93,09 8,25 11,29 6E-12 76,19 109,99
B -3,14 0,37 -8,41 3E-09 -3,90 -2,38
C -0,07 0,05 -1,46 0,16 -0,18 0,03
Sprawdzmy, czy jeden bądz więcej współczynników kierunkowych jest istotnie
różny od zera.
" Ho: B=C=0 vs. Ha: przynajmniej jeden jest różny od zera
F2,28,0.95 = 3,34 < F=38,64
przynajmniej jeden współczynnik jest różny od zera na 5% poziomie istotności.
Odrzucamy hipotezę Ho na rzecz hipotezy alternatywnej.
Ponieważ t28,0.95 =2.048 ! wnioskujemy, że C nie jest istotnie różne od zera
na 5% poziomie istotności.
Model 1  bierzemy pod uwagę wszystkie zmienne
EXCEL: Analiza danych: Regresja
Statystyki regresji
Wielokrotność R 0,9212
R kwadrat 0,8487
Dopasowany R kwadrat 0,8108
Błąd standardowy 2,3169
Obserwacje 31
ANALIZA WARIANCJI
df SS MS F Istotność F
Regresja 6 722,5436 120,4239 22,43263 9,72E-09
Resztkowy 24 128,8379 5,368247
Razem 30 851,3815
Wartość- Dolne Górne
Współczynniki. Błąd stand. t Stat p 95% 95%
Przecięcie 102,93 12,40 8,30 2E-08 77,33 128,53
x1 -0,23 0,10 -2,27 0,03 -0,43 -0,02
x2 -0,07 0,05 -1,36 0,18 -0,19 0,03
x3 -2,63 0,38 -6,84 5E-07 -3,42 -1,83
x4 -0,02 0,07 -0,33 0,74 -0,16 0,11
x5 -0,37 0,12 -3,09 0,01 -0,62 -0,12
x6 0,30 0,14 2,22 0,04 0,02 0,58
Sprawdzmy, czy jeden bądz więcej parametrów jest istotnie różnych od zera.
" Ho: b1=b2=b3=b4=b5=b6=0 vs. Ha: przynajmniej jeden jest różny od zera
Ponieważ F6,24,0.95 = 2.51 < F=22.43 ! przynajmniej jeden współczynnik jest
różny od zera na 5% poziomie istotności.
Odrzucamy hipotezę Ho na rzecz hipotezy alternatywnej.
" Ponieważ t24,0.95 =2.064 ! Przecięcie, b1, b3, b5, b6 są istotnie różne od zera
na 5% poziomie istotności.
Model 2
Statystyki regresji
Wielokrotność R 0,9148
R kwadrat 0,8368
Dopasowany R kwadrat 0,8117
Błąd standardowy 2,3116
Obserwacje 31
ANALIZA WARIANCJI
df SS MS F Istotność F
Regresja 4 712,4515 178,1129 33,33286 6,91E-10
Resztkowy 26 138,93 5,343462
Razem 30 851,3815
Dolne Górne
Współczynniki Błąd stand. t Stat Wartość-p 95% 95%
Przecięcie 98,15 11,79 8,33 8E-09 73,92 122,37
x1 -0,20 0,10 -2,07 0,048 -0,39 -0,001
x3 -2,77 0,34 -8,13 1E-08 -3,46 -2,07
x5 -0,35 0,12 -2,96 0,01 -0,59 -0,11
x6 0,27 0,13 2,02 0,053 -0,004 0,55
" Dla t26,0.95 =2.056 wnioskujemy, iż tylko b6 nie jest istotnie różne od
zera na 5% poziomie istotności.
Model 3
Statystyki regresji
Wielokrotność R 0,9006
R kwadrat 0,8110
Dopasowany R kwadrat 0,7901
Błąd standardowy 2,4406
Obserwacje 31
ANALIZA WARIANCJI
df SS MS F Istotność F
Regresja 3 690,5509 230,1836 38,64286 6,56E-10
Resztkowy 27 160,8307 5,956692
Razem 30 851,3815
Wartość- Dolne Górne
Współczynniki Błąd stand. t Stat p 95% 95%
Przecięcie 111,72 10,24 10,92 2E-11 90,72 132,72
x1 -0,26 0,10 -2,66 0,01 -0,45 -0,06
x3 -2,83 0,36 -7,89 2E-08 -3,56 -2,09
x5 -0,13 0,05 -2,59 0,02 -0,23 -0,03
Sprawdzmy, czy jeden bądz więcej parametrów jest istotnie różnych od zera.
" Ho: b1=b3=b5=0 vs. Ha: przynajmniej jeden jest różny od zera
F3,27,0.95 = 2.96 < F=38.64,
przynajmniej jeden współczynnik jest różny od zera na 5% poziomie istotności.
Odrzucamy hipotezę Ho na rzecz hipotezy alternatywnej.
" Ponieważ t27,0.95 =2.052 ! wszystkie wybrane parametry są istotnie różne od zera
na 5% poziomie istotności.
Model 4
Statystyki regresji
Wielokrotność R 0,8842
R kwadrat 0,7817
Dopasowany R kwadrat 0,7575
Błąd standardowy 2,6235
Obserwacje 31
ANALIZA WARIANCJI
df SS MS F Istotność F
Regresja 3 665,5506 221,8502 32,23337 4,53E-09
Resztkowy 27 185,8309 6,882626
Razem 30 851,3815
Wartość- Dolne Górne
Współczynniki Błąd stand. t Stat p 95% 95%
Przecięcie 106,00 13,03 8,13 1E-08 79,25 132,74
x1 -0,23 0,11 -2,13 0,04 -0,45 -0,01
x3 -3,01 0,37 -8,03 1E-08 -3,78 -2,24
x6 -0,09 0,06 -1,47 0,15 -0,22 0,03
Ponieważ x5 i x6 są silnie skorelowane sprawdzamy czy ich zamiana nie
doprowadzi do poprawnego modelu.
" Ho: b1=b3=b6=0 vs. Ha: przynajmniej jeden jest różny od zera
F3,27,0.95 = 2.96 < F=32.23,
przynajmniej jeden współczynnik jest różny od zera na 5% poziomie istotności.
Odrzucamy hipotezę Ho na rzecz hipotezy alternatywnej.
" Ponieważ t27,0.95 =2.052 wnioskujemy, że b6 nie jest istotnie różny od zera
na 5% poziomie istotności.
Model 5
Statystyki regresji
Wielokrotność R 0,8726
R kwadrat 0,7614
Dopasowany R kwadrat 0,7444
Błąd standardowy 2,6933
Obserwacje 31
ANALIZA WARIANCJI
df SS MS F Istotność F
Regresja 2 648,2622 324,1311 44,68146 1,94E-09
Resztkowy 28 203,1194 7,254263
Razem 30 851,3815
Wartość- Dolne Górne
Współczynniki Błąd stand. t Stat p 95% 95%
Przecięcie 93,09 8,25 11,29 6E-12 76,19 109,99
x3 -3,14 0,37 -8,41 3E-09 -3,90 -2,38
x5 -0,07 0,05 -1,46 0,16 -0,18 0,03
" Dla t28,0.95 =2.048 wnioskujemy, że b5 nie jest istotnie różne od zera na
5% poziomie istotności.
Model 6
Statystyki regresji
Wielokrotność R 0,8622
R kwadrat 0,7434
Dopasowany R kwadrat 0,7345
Błąd standardowy 2,7448
Obserwacje 31
ANALIZA WARIANCJI
df SS MS F Istotność F
Regresja 1 632,9001 632,9001 84,0076 4,59E-10
Resztkowy 29 218,4814 7,533843
Razem 30 851,3815
Wartość- Dolne Górne
Współczynniki Błąd stand. t Stat p 95% 95%
Przecięcie 82,42 3,86 21,38 3E-19 74,54 90,31
x3 -3,31 0,36 -9,16 5E-10 -4,05 -2,57
" Dla t29,0.95 =2.045 wnioskujemy, że b3 jest istotnie różne od zera na 5%
poziomie istotności.
Podsumowanie
Model x1 x2 x3 x4 x5 x6 MSE R2 F
1 # x # x # # 5,37 0,85 22,4
2 # # # x 5,34 0,84 33,3
3 # # # 5,96 0,81 38,6
4 # # x 6,88 0,78 32,2
5 # # 7,25 0,76 44,7
6 # 7,53 0,74 84,0
Wybieramy model 3. Wszystkie zmienne są istotnie różne od zera na 5%
poziomie istotności i nie obserwuje się istotnego pogorszenia MSE, R2 oraz F.
Funkcja
y=axb x*=ln(x) ln(y)=ln(a) +bln(x)
potęgowa
b>1 y*=ln(y)
a*=ln(a) y*=a* + bx*
np.
kinetyka
0dyspersyjna
k(t)=B"t1-ą
b<0
x
Funkcja
y*=ln(y) ln(y)=ln(a)+xln(b)
y=a"bx
wykładnicza
a*=ln(a)
b>1
b*=ln(b) y*=a*+ xb*
0x
Funkcja
y*=ln(y) ln(y) = ln(a)+bx
y=a"ebx
wykładnicza
a*=ln(a)
b<0
-
y*=a* + bx
eksponencjalna
np. I=I0e-źx
b>0
Q=Q0e-t
x
Funkcja
x*=1/x
y=a"eb/x ln(y) = ln(a)+b1/x
wykładnicza
y*=ln(y)
-
b>0
a*=ln(a)
eksponencjalna y*=a* + bx*
np. zależność
b<0
Arrheniusa
x
k=Ae-E/RT
Funkcja
y=b/x+ x*=1/x y=bx*+a
hiperboliczna
a
np. r. Causiusa-
Clapeyrona
lnpi=-"Hpar/RT + x
const
Funkcja
x*=logx y=bx* + a
y=b"logx
logarytmiczna
+a
np. stała podziału
lg c1=n lg c2 + lg
K
x
f( x)
f(x)
f(x)
f(x)
f(x)
f(x)
Regresja nieliniowa
" metody gradientowe (wymagana znajomość pochodnych funkcji)
" metody bezpośrednie poszukiwania minimum bez liczenia pochodnych
Metoda Simplex
(metoda bezpośrednia, nie jest wymagana znajomość pochodnych funkcji, służy
znajdywaniu min. lub max.)
2
Q =
"e = "[ yi - wi (b)]2 = min.
i
ii
Simplex jest figurą geometryczną, w n wymiarach zbudowaną z
n+1połączonych punktów (w dwóch wymiarach jest to trójkąt, w trzech
czworobok).
Algorytm (przykład dwuwymiarowy):
1. Wybierane są trzy punkty trójkąta i obliczane Q dla każdego punktu (podawane
są początkowe wartości tylko jednego punktu, pozostałe są znajdywane automatycznie).
2. Punkt odpowiadający największej wartości Q jest zastępowany przez punkt
stanowiący jego zwierciadlane odbicie względem pozostałych punktów.
3. Proces jest powtarzany, gdy Q ulega dalszej minimalizacji.
4. Wielkość Simplexu może być redukowana w miarę osiągania minimum.
Metoda Gaussa
Metoda najmniejszych kwadratów w modelu nieliniowym
(model nieliniowy jest nieliniowy w odniesieniu do parametrów - porównaj
wielomian y=b0+b1x+b2x2+...+bkxk i funkcję y=b0+b1exp(b2x):
2
Q = = yi - wi (b)]2 = min .
"e "[
i
ii
"w1 "w2 "wn
ż#
#0 = -2[ y1 - w1(b)] "b0 - 2[ y2 - w2 (b)] "b0 -...- 2[ yn - wn (b)] "b0
#
#
"w1 "w2 "wn
#0 = -2[ y1 - w1(b)] - 2[ y2 - w2 (b)] -...- 2[ yn - wn (b)]
"b1 "b1 "b1
#
#...
#
#
"wi (b(0) ) "wi (b(0) ) "wi
( (0) (
wi (b) H" wi (b(0) ) + (b0 - b00) ) + (b1 - b1 ) + ...+ (bp - bp0) )
"b0 "b1 "
Algorytm obliczeń
1. Wybór parametrów początkowych b(0)
2. Obliczenie macierzy Jacobiego
Ą# ń#
"w1(b(0)) "w1(b(0)) "w1(b(0))
...
ó#
"b0 "b1 "bp Ą#
ó# Ą#
ó#"w2(b(0)) "w2(b(0)) "w2(b(0))Ą#
...
ó#
"b0 "b1 "bp Ą#
ó# Ą#
... ... ... ...
ó# Ą#
"wn (b(0)) "wn (b(0)) "wn(b(0))
ó# Ą#
...
ó#
"b0 "b1 "bp Ą#
Ł# Ś#
1 exp(b2x1) b1x1 exp(b2x1)
Ą# ń#
ó#1 exp(b2x2) b1x2 exp(b2x2) Ą#
ó# Ą#
np. =
ó# Ą#
... ... ...
ó# Ą#
Ł#1 exp(b2xn ) b1xn exp(b2xn ) Ś#
3. Rozwiązanie układu równań prowadzącego do nowego zestawu parametrów
b(k)
4. Obliczenie wartości Q
5. Powrót do pkt. 1 z nowym zestawem parametrów b(k)
6. Program zostaje zatrzymany, gdy Q nie ulega dalszej minimalizacji.
Najbardziej sprawną i ekonomiczną metodą minimalizacji jest obecnie metoda
Levenberga - Marquardta (metoda gradientowa).
x2
min.
b(k)
x1
b(0)
Przykład: regresja nieliniowa linearyzowalna
T k 1/T ln k
289 0,0503 0,00346 -2,98975
297 0,1531 0,003367 -1,87666
305 0,368 0,003279 -0,99967
315 1,556 0,003175 0,442118
333 6,71 0,003003 1,903599
8
2
k[1/s]
6
0 ln k
4
2 -2
1/T[1/K]
T[K]
0
0,0030 0,0032 0,0034
280 300 320 340
k = A exp(-EA/RT) ! ln k = ln A - (EA/R)"(1/T) (y* = b0+b1"x*)
Statystyki regresji ln k = 34,59 - 10838,7"(1/T)
Wielokrotność R 0,996748 k = 1"1015 exp(-10838,7/T)
R kwadrat 0,993507
asowany R kwadrat 0,991342 q=f(x) ! "q=#df/dx#""x
ąd standardowy 0,178982 A=1"1015ą1,7"1015 s-1
Obserwacje 5 EA=21,5ą1 kcal/mol
ANALIZA WARIANCJI
df SS MS F Istotność F
Regresja 1 14,70427 14,70427 459,0119 0,000223
Resztkowy 3 0,096104 0,032035
Razem 4 14,80038
Górne
Współczynniki Błąd stand. t Stat Wartość-p Dolne 95% 95%
Przecięcie 34,5942 1,649504 20,97248 0,000237 29,34474 39,84367
1/T -10838,7 505,8988 -21,4246 0,000223 -12448,7 -9228,66
D
lnk
3
Data1D
UCL
2
LCL
UPL
1
LPL
0
-1
-2
-3
-4
0,0030 0,0031 0,0032 0,0033 0,0034 0,0035
1/T[1/K]
10
k[1/s]
8
Model: y=aexp(b/x)
Chi^2 = 0.02158
a=5.3874E12ą8.1147E12
6
b=-9127.35161ą499.96936
4
2
0
T[K]
300 320 340
k=5,4"1012 exp(-9127,4/T) vs. k = 1"1015 exp(-10838,7/T)
0.5
ei=yi-y^i
[1/s]
0.0
-0.5
-1.0
T[K]
T[K]
290 300 310 320 330 340
300 320 340
regresja liniowa (S=0,18)
po powrocie do początkowych współrzędnych (S=0,63)
regresja nieliniowa (S=0,15)
y*i = ln yi ! yi = exp(y*i)
"yi = #df/dx#""y*i = exp(y*i)""y*i
y*i ei (regresja
"y*i (regresja "yi
nieliniowa)
liniowa)
-2,90981 -0,07994 -0,00419 -0,05328
-1,8996 0,02293 0,00347 -0,0894
-0,94239 -0,05728 -0,02171 -0,17499
0,18576 0,25636 0,35184 0,15195
2,04567 -0,14207 -1,02455 -0,01355
Transformacja współrzędnych prowadzi do redukcji wagi wyników o dużej
wartości y.
Rachunek błędu maksymalnego
x ą "x, y ą "y ! q = f(x,y); q ą "q
błąd względny x = "x/#x#
Suma, różnica
q = x + y
Min. (x - "x) + (y - "y) = (x + y) - ("x + "y)
Max. (x + "x) + (y + "y) = (x + y) + ("x + "y)
q = x - y
Min. (x - "x) - (y + "y) = (x - y) - ("x + "y)
Max. (x + "x) - (y - "y) = (x - y) + ("x + "y)
Niepewność sumy i różnicy
q = x + y "q = "x + "y
q = x - y "q = "x + "y
Iloczyn, iloraz
x ą "x = x(1 ą "x/x) = x(1 ą x)
y ą "y = y(1 ą y)
q = x " y
Min. x(1 - x)"y(1 - y) = x"y(1 - x - y + x"y) H" x"y[1-(x+y)]
Max. x(1 + x)"y(1 + y) = x"y(1 + x + y + x"y) H" x"y[1+ (x+y)]
Ponieważ x i y jako błędy pomiarowe są małe
( na ogół < 0,1) to x"y jest pomijalnie małe.
Niepewność iloczynu i ilorazu
q = x " y q = x + y
q = x/y q = x + y
Mnożenie przez stałą
q = B"x(1 ą x) ! (q = B + x = x) !
"q = q"#q#= x" #B"x#= #B#""x
q ą "q = Bx ą #B#""x
Potęgowanie
q = xn = x"x"..."x ! q = x + x + ... + x = n"x
Porównanie rachunku błędu maksymalnego z metodami statystycznymi
q = x + y N(mx, x) + N(my, y) =
"q = "x + "y N(mq, q)
mq=mx + my;
2 2
 =  + 
q x y
"q = "x2 + "y2
"x
"y
Funkcje jednej zmiennej
q(x)
y=[df(x)/dx]"x+C
"q
q
"x
x
q = q(x) = f(x)
"q = q(x + "x) - q(x)
Ponieważ dla dostatecznie małego przedziału f(x+u)-f(x) = df/dx"u !
Niepewność wartości funkcji jednej zmiennej
"q = #dq/dx#""x
Niepewność wartości funkcji wielu zmiennych q(x, y,...z)
"q = #"q/"x#""x + #"q/"y#""y + ... + #"q/"z#""z
Przykład 1:
Pojemność cieplna kalorymetru: K = i2"R"t/"T gdzie:
i - natężenie prądu = 12 ą 0,225A
R - opór spirali grzejnej = 57 ą 3 
t - czas przepływu prądu = 600 ą 2 s
"T - przyrost temperatury kalorymetru = 30 ą 1K
"K = #"K/"i#""i + #"K/"R#""R + #"K/"t#""t + #"K/"("T)#""("T)
"K = #2iRt/"T#""i + #i2t/"T #""R + # i2R/"T #""t +
+# i2Rt/("T)2 #""("T)
Przykład 2
x + y
q =
Policzyć "q dla x=20 ą 1, y = 2, z = 0
x + z
"q = #"q/"x#""x + #"q/"y#""y + #"q/"z#""z =
1" (x + z) - (x + y) "1
= ""x = 2/400"1=0,005
(x + z)2
22 ą1
=
1,1(1 ą (1/22+1/20) =1,1 ą 0,1
20 ą1


Wyszukiwarka

Podobne podstrony:
Matematyka 2 wykład
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 6
II sem matematyka wyklady
Matematyka 2 wykład
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 2
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 3
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 7
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 5
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 1
Podstawy ekonomii matematycznej wyklady

więcej podobnych podstron