02.05.2013
dr hab. Tomasz Puzyn, prof. UG
Pracownia Chemometrii Środowiska
e-mail: t.puzyn@qsar.eu.org
tel. (58) 523 54 51
1
Pracownia Chemometrii Środowiska
1. Analiza korelacji
- wariancja i współczynnik korelacji
- interpretacja współczynnika korelacji
- wykresy korelacyjne
2. Regresja liniowa typu: y = ax + b
- metoda najmniejszych kwadratów
- szacowanie współczynników regresji
- ocena istotności statystycznej modelu
- ocena istotności statystycznej współczynników regresji
- ocena jakości dopasowania modelu regresyjnego
2
Pracownia Chemometrii Środowiska
1. Analiza korelacji
- wariancja i współczynnik korelacji
- interpretacja współczynnika korelacji
- wykresy korelacyjne
2. Regresja liniowa typu: y = ax + b
- metoda najmniejszych kwadratów
- szacowanie współczynników regresji
- ocena istotności statystycznej modelu
- ocena istotności statystycznej współczynników regresji
- ocena jakości dopasowania modelu regresyjnego
3
Pracownia Chemometrii Środowiska
1
02.05.2013
Wariancja Kowariancja
Zmienność w wektorze x Współzmienność w wektorów x i x
k k l
n n
"(x - xk )2
ik "(x - xk )(xil - xl )
ik
i =1 i =1
var(xk ) = cov(xk,xl ) =
n - 1 n - 1
Współczynnik korelacji
Współczynnik korelacji jest równy kowariancji dla danych standaryzowanych
cov(xk,xl )
var(xk ) = 1 var(xl ) = 1
r(xk,xl ) =
var(xk ) var(xl ) r(xk,xl ) = cov(xk,xl )
4
Pracownia Chemometrii Środowiska
" Współczynnik korelacji r jest miarą
współzmienności liniowej dwóch zmiennych
x i y.
" -1 d" r d" 1
" Jeżeli r > 0 to ze wzrostem wartości
zmiennej x rosną wartości zmiennej y.
cov(xk,xl )
r(xk,xl ) =
var(xk ) var(xl ) " Jeżeli r < 0 to ze wzrostem wartości
zmiennej x maleją wartości zmiennej y.
" Współczynnik determinacji d = r2 wyraża
ułamek ogólnej zmienności (wariancji) jednej
zmiennej wyjaśnianej przez drugą.
" Współczynnik d wyraża się najczęściej w
procentach.
5
Pracownia Chemometrii Środowiska
Żródło: A . Mazerski, Podstawy chemometrii
6
Pracownia Chemometrii Środowiska
2
02.05.2013
y = ax + b
n n n n n n n
n xiyi - " " " " - " "
xi yi xi2 yi xi xiyi
"
xy - x " y cov(x, y)
i=1 i=1 i=1 i=1 i=1 i=1 i=1
a = = = b = = y - ax
2 2 2
n n n n
var(x)
# ś# x2 - (x ) ś#
2
n x2 - ś# " "x # xiź#
xiź# n - ś# "
" i i
# # # #
i=1 i=1 i=1 i=1
n n
"(x - x )2
i "(x - x ) " (yi - y )
i
i=1 i=1
var(x) = cov(x, y) =
n - 1 n -1
cov(x, y)
r(x, y) =
var(x) " var(y)
10
Pracownia Chemometrii Środowiska
Wariancja resztowa Model istotny
F > 0
Wariancja modelu
Model nieistotny
n 1
F = 0
" Im większa wartość statystyki F-Snedecora, tym model jest bardziej istotny statystycznie.
" Wartości krytyczne F znajdujemy w tablicach dla n-1 i n-p-1 stopni swobody odpowiednio dla
licznika i mianownika (p - liczba parametrów modelu).
11
Pracownia Chemometrii Środowiska
2
sE
a
H : a = 0
0
sa =
ta =
2
H : a `" 0 n n
A
sa
# ś#
xi2 ś# "
" - n " xiź#
# #
i=1 i=1
df = n - 2
n
xi2
"
b
H : b = 0
0 2 i=1
sb = sE " tb =
2
H : b `" 0 n n
A
#
sb
2
n " xi - ś# "x ś#
" ź#
i
# #
i=1 i=1
" Jeżeli t d" t => nie ma podstaw do odrzucenia H na założonym poziomie
kr 0
istotności.
" Jeżeli t > t => H należy odrzucić na założonym poziomie istotności i przyjąć H
kr 0 A.
12
Pracownia Chemometrii Środowiska
4
02.05.2013
Miarą jakości dopasowania modelu jest
współczynnik determinacji R2. Wyrażony w
procentach określa, jaka część ogólnej zmienności
odpowiedzi jest wyjaśniana przez model:
Analiza rozkładu różnic:
n
2
yiobs
)
"( - yi pred
2 i =1
R = 1-
n yobs
2
yiobs obs
)
"( - y
i =1
Inną stosowaną miarą dopasowania jest
średniokwadratowy błąd kalibracji RMSEC (ang.
root mean square error of calibration):
n
2
yiobs
) ypred
"( - yi pred
n =1
RMSEC =
n
13
Pracownia Chemometrii Środowiska
5
Wyszukiwarka
Podobne podstrony:
MetStatChemb notatkiMetStatChem notatkiMetStatChema notatkiMetStatChemc notatkiMetStatChem notatkinotatki zagadnienia00 Notatki organizacyjneFilozofia religii cwiczenia dokladne notatki z zajec (2012 2013) [od Agi]notatki tw 5notatki finanse pierwsze zagadnieniaEtyka ogólna i zawodowa notatkiwięcej podobnych podstron