Opracowywanie danych w chemii

background image

Program przedmiotu

“Opracowywanie danych w

chemii”

1.

Wprowadzenie: przegląd rodzajów danych oraz

metod ich opracowywania.

2.

Podstawowe pojęcia rachunku

prawdopodobieństwa i statystyki matematycznej.

3.

Podstawy analizy wyników pomiarów. Statystyczna

weryfikacja hipotez. Analiza wariancji.

4.

Dopasowywanie modeli

a) Regresja liniowa pojedyncza i wielokrotna.
b) Regresja nieliniowa.
c) Analiza konfluentna.
d) Porównywanie modeli.
e) Metoda największej entropii.

5.

Analiza skupień: grupowanie podobnych obiektów.

6.

Analiza czynnikowa.

background image

Literatura

• J. Czermiński i współautorzy, Metody

statystyczne w doświadczalnictwie

chemicznym. PWN, Warszawa.

• S. Brand, Analiza danych, PWN, Warszawa.

• A. Strzałkowski, A. Śliżyński,

Matematyczne metody opracowywania

wyników pomiarów, PWN, Warszawa.

• C. R. Rao, Modele liniowe statystyki

matematycznej, PWN, Warszawa.

• R.G. Brereton, Chemometrics, Wiley.

• Sieber,Wild, Nonlinear regression, Wiley.

background image

Pochodzenie danych

• Pomiar (np. pomiary

fizykochemiczne)

• Obserwacja (np. zapis zmiany

liczebności populacji na określonym
terenie)

• Symulacja (np. symulacje dynamiki

molekularnej ewolucji czasowej
zespołów cząsteczek)

background image

Metody analizy danych

• Analiza statystyczna (obliczanie średnich i

rozrzutu, ocena wiarygodności pomiarów,

ocena istotności różnic wielkości

zmierzonych w różnych miejscach)

• Dopasowywanie modeli matematycznych

do danych pomiarowych (np.analiza

regresyjna i konfluentna)

• Analiza skupień (znajdowanie skupisk

obiektów o podobnych cechach)

• Analiza czynnikowa (wyławianie czynników

określających większość właściwości zbioru

danych lub zjawiska)

background image

Zastosowania

• Analiza statystyczna wyników pomiarów:

chemia analityczna, chemia medyczna,
technologia chemiczna.

• Dopasowywanie modeli: chemia fizyczna,

chemia organiczna, krystalochemia i inne
metody określania struktury cząsteczek,
chemia teoretyczna, technologia chemiczna.

• Analiza skupień: analiza konformacyjna,

QSAR.

• Analiza czynnikowa: QSAR, spektroskopia.

background image

Rachunek

prawdopodobieństwa

A – zdarzenie
E – przestrzeń wszystkich zdarzeń
P(A) – prawdopowobieństwo zdarzenia

A; liczba nieujemna określająca
częstość jego występowania.

P(E)=1
P(A+B)=P(A)+P(B) dla zdarzeń

wykluczających się.

background image

Prawdopodobieństwo

warunkowe i niezależność

zdarzeń

P(A|B)=P(AB)/P(B)
P(AB)=P(A|B)P(B)

Zdarzenia A i B są niezależne jeżeli

P(A|B)=P(A)
czyli
P(AB)=P(A)P(B)

background image

Zmienne losowe i ich

rozkłady

Zmienna losowa: liczba

przyporządkowana zdarzeniu

Dystrybuanta:
F(x)=P(yx)
Gęstość prawdopodobieństwa:
f(x)=dP(x)/dx
Funkcja zmiennej losowej jest też

zmienną losową.

background image

1 2 3 4 5
6

F(x)

x

0.5

1

Dystrybuanta liczby oczek na jednej ścianie kostki dla rzutów
idealnie symetryczną kostką.

background image

Momenty rozkładu

  

n

1

i

i

i

n

1

i

i

i

x

x

P

x

H

)

x

(

H

E

x

x

P

x

})

x

({

E

 

 

 

   

dx

x

f

x

H

x

H

E

dx

x

xf

}

x

{

E

Dla zmiennych
ciągłych:

Jeżeli H(x)=(x-x

c

)

n

to E{H(X)} nazywa się n-

tym momentem x względem c; jeżeli c=

to E

jest n-tym momentem centralnym, 

n

({x}).

background image

Użyteczne momenty

centralne

Wariancja

 

 

 

 

  

dx

x

f

x

x

x

2

2

2

Skrzywienie

 

 

 

 

 

 

 

  

  

dx

x

f

x

x

1

x

x

x

3

3

2

/

3

2

3

Kurtoza

 

 

 

 

 

 

 

  

  

3

dx

x

f

x

x

1

3

x

x

x

4

4

2
2

4

background image

Obliczanie momentów

centralnych zbioru punktów

3

)

1

n

(

x

)

1

n

(

x

x

x

n

1

n

1

x

1

n

1

x

n

1

4

n

1

i

4

i

3

n

1

i

3

i

2

n

1

i

i

n

1

i

2

i

n

1

i

2

i

2

n

1

i

i



background image

Przykłady momentów

centralnych paru rozkładów

background image

x

f(x)

x

x

x

.

m

5

0

Wartość najbardziej prawdopodobna (modalna): x

m

: f’(x

m

)=0,

f’’(x

m

)<0

Mediana: x

0.5

: P(x<x

0.5

)=0.5

Wartość średnia:

 

dx

x

xf

x

background image

Mediana i kwantyle

1.0

0.5

0.2

x

0.5

x

0.2

x

F(x)

median
a

 

 

q

x

q

q

dx

x

f

x

F

x

0.9

background image

Rozkład dwóch zmiennych i

kowariancja

 

 

 

 



 

 

 

   

y

x

y

,

x

cov

y

,

x

y

,

x

cov

y

x

E

y

y

E

x

x

E

y

E

x

E

11

2

2

02

2

2

20

01

10

background image

background image

Sposoby przedstawiania rozkładów zmiennych

losowych:

1. Wykresy liniowe (rozkłady jednowymiarowe).

2. Wykresy „rozproszone” (scatter plots)

(dwuwymiarowe)

3. Histogramy

background image

Rozkład normalny









x

erf

,

;

x

F

2

x

exp

2

1

0

,

1

;

u

f

2

x

exp

2

1

,

;

x

f

2

2

2

U = zmienna
stadardyzowana

background image

Wielowymiarowy rozkład

normalny

 

 





x

A

x

2

1

exp

2

)

A

det(

)

x

(

f

)

x

,...,

x

,

x

(

f

T

2

/

n

n

2

1

background image

Centralne twierdzenie

graniczne

Jeżeli x jest zmienną losową o wartości

średniej a i wariancji b

2

, to zmienna

n

1

i

i

n

x

lim

n

1

Ma rozkład normalny o wartości średniej a i

wariancji b

2

/n.


Document Outline


Wyszukiwarka

Podobne podstrony:
projekt - ZBIERANIE I OPRACOWYWANIE DANYCH, Matematyka dla Szkoły Podstawowej, Gimnazjum
Opracowanie Danych Pomiarowych
Metody opracowania danych I
Opracowanie Danych Pomiarowych
Opracowanie Danych Pomiarowych Nieznany
opracowane pytania z chemii
opracowanie pytań z chemii fiz, wykłady
Chemia fizyczna -WARUNEK, opracowanie pytań z chemii fiz.calosc
zbieranie i opracowywanie danych statystycznych - scenariusz, Matematyka dla Szkoły Podstawowej, Gim
Powtorka opracowanie danych stat cw
14 Gromadzenie i opracowywanie danych z monitoringuid 15667 ppt
PROJEKT NR 1 - Opracowanie danych z roczników hydrologicznych, Hydrologia i Hydraulika
opracowywanie danych statystycznych z komputerem - scenariusz, Matematyka dla Szkoły Podstawowej, Gi
Opracowanie danych pomiarowych 1
opracowanie pytań z chemii fiz.calosc, wykłady
statystyka opracowywanie danych

więcej podobnych podstron