metody statystyczne w chemii 3

background image

Pobieranie próby

Populacja generalna: zbiór wyników

wszystkich możliwych doświadczeń
określonego typu.

Próba n-wymiarowa: zbiór n wyników

doświadczeń.

Wyniki j-tej próby przedstawiamy w

postaci n-wymiarowej zmiennej losowej

x

(j)

=(x

1(j)

,x

2(j)

,...,x

n(j)

). Wektor ten ma rozkład

prawdopodobieństwa g(x)=g(x

1

,x

2

,...,x

n

).

background image

Pobieranie losowe

1. g(x)=g

1

(x

1

)g

2

(x

2

)...g

n

(x

n

)

(prawdopodobieństwa pobrania
poszczególnych elementów próby są
niezależne od siebie),

2. g

1

(x)=g

2

(x)=...=g

n

(x)=f(x)

(poszczególne rozkłady muszą być
identyczne z rozkładem gęstości dla
populacji).

background image

Dystrybuanta empiryczna (rozkład w

próbie)

W

n

(x)=n

x

/n

n

x

– liczba elementów próby takich że

x

j

x.

W

n

(x) dąży do prawdziwej dystrybuanty

F(x) dla n

background image

Przedstawianie rozkładów z

próby

• Wykresy liniowe (jednowymiarowe)
• Histogramy

– Wykresy schodkowe
– Wykresy słupkowe
– Wykresy impulsowe

Konstrukcja histogramu
h(x)=n(x<yx+x)
h(x

1

,x

2

,...,x

n

)=n(x

1

<y

1

x

1

+x

1

,x

2

<y

2

x

2

+x

2

,..., x

n

<y

n

x

n

+x

n

)

background image

Przedstawienie wyników pomiarów

oporu 100 pojedynczych oporników

• Wykres liniowy
• Histogram – wykres słupkowy
• Histogram – wykres schodkowy
• Histogram – wykres z zaznaczonymi

przedziałami błędów

Zależność postaci histogramów
z próby dla czterech różnych
szerokości przedziałów

background image

Statystyki i estymatory

Statystyka: funkcja określona na elementach
próby, np. średnia.

n

x

x

x

n

x

2

1

1

Estymator: przybliżona wartość parametru
rozkładu prawdopodobieństwa wyznaczona z
próby. S=S(x

1

,x

2

,...,x

n

)

Estymator jest nieobciążony jeżeli jego wartość
oczekiwana nie zależy od liczby elementów
próby.

Estymator jest zgodny jeżeli jego wariancja
dąży do zera wraz ze wzrostem liczby
elementów próby.

background image

Obliczanie momentów

centralnych zbioru punktów

3

)

1

(

ˆ

)

1

(

ˆ

1

1

1

ˆ

1

1

1

ˆ

4

1

4

3

1

3

2

1

1

2

1

2

2

1



n

x

x

n

x

x

x

n

x

n

x

x

n

x

n

x

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

background image

Estymator wartości średniej rozkładu

)

(

1

2

)

ˆ

(

)

ˆ

(

)

ˆ

(

1

)

ˆ

(

)

ˆ

(

)

ˆ

(

1

1

ˆ

)

(

)

(

ˆ

)

(

)

(

)

(

1

)

(

2

2

2

2

2

1

2

2

2

1

2

2

2

1

2

2

2

1

x

x

n

n

x

x

x

x

x

x

E

n

x

x

x

x

x

x

E

n

x

x

x

n

x

E

x

E

x

E

x

x

x

E

x

E

x

E

n

x

E

n

n

n

n





Estymator wartości średniej jest zatem
estymatorem nieobciążonym i zgodnym.

background image

Dygresja: błądzenie przypadkowe

(random walk)

start

stop

 

 





 

N

D

D

X

X

D

D

X

X

X

X

D

X

X

X

X

X

X

X

X

X

X

X

X

X

X

D

X

X

X

X

D

N

N

N

N

N

N

N

N

N

N

N

N

N

N

N

N

N

N

N

N

M

M

N

N

2

2

0

2

2

1

0

1

2

0

1

2

0

2

1

2

0

1

2

0

1

2

1

1

0

1

1

2

1

2

1

2

1

background image

Estymator wariancji rozkładu (nieobciążony i
zgodny)

1

2

)

var(

)

(

)

(

1

)

(

1

1

)

)

ˆ

((

)

)

ˆ

((

1

1

)

ˆ

(

)

ˆ

)(

ˆ

(

2

)

ˆ

(

1

1

)]

ˆ

(

)

ˆ

[(

1

1

)

(

)

(

)

(

1

1

)

(

)

(

)

(

)

(

1

1

4

2

2

2

2

2

2

1

2

2

1

2

1

2

2

2

2

1

2

2

2

2

2

1

2





n

s

n

n

n

n

x

x

E

x

x

E

n

x

x

x

x

x

x

x

x

E

n

x

x

x

x

E

n

x

x

x

x

x

x

E

n

s

E

x

x

x

x

x

x

n

s

n

i

i

i

n

i

i

n

i

i

n

n

x

x

x

background image

Estymator wariancji wartości średniej:

 

 

 

n

i

i

x

x

n

n

x

s

n

x

s

1

2

2

2

1

1

1

Estymator odchylenia standardowego wartości
średniej:

1

2 

n

s

s

 

 

n

i

i

x

x

n

n

x

s

1

2

2

1

1

Estymator błędu ochylenia standardowego:

background image

Obliczanie mediany z serii pomiarów

wielkości prostej

n

x

x

x

2

1

1. Sortujemy wyniki pomiarów od najmniejszego do

największego,

2. Jeżeli liczba pomiarów (n) jest nieparzysta to

mediana (x

m

) jest środkowym wynikiem pomiaru o

numerze (n+1)/2

3. Jeżeli liczba pomiarów jest parzysta to mediana jest

średnią arytmetyczną największego wyniku z
“lewej” i najmniejszego z “prawej” połowy.

2

/

1

n

m

x

x

2

/

1

2

/

1

2

/

n

n

m

x

x

x

background image

Przenoszenie błędów

(rachunek błędów)

Niech x=(x

1

,x

2

,...,x

n

) będzie n-wymiarową

zmienną losową złożoną z niezależnych
składników o rozkładach normalnych z
wariancjami 

1

2

, 

2

2

,..., 

n

2

. Wtedy funkcja

skalarna y=f(x) tej zmiennej losowej jest
zmienną losową opisywaną w przybliżeniu
rozkładem normalnym o następującej
wariancji:

2

x

2

n

2

x

2

2

2

x

2

1

2

y

n

2

1

x

f

x

f

x

f













background image

Jeżeli elementy x są skorelowane to we wzorze
występuje pełna macierz wariancji-kowariancji

j

i

j

i

i

x

x

x

x

n

1

i

i

1

j

j

i

2
x

2

n

1

j

i

j

i

n

1

i

j

n

1

j

i

2

y

r

x

f

x

f

2

x

f

)

x

,

x

cov(

x

f

x

f





















background image

Szacowanie błędu “z góry”

n

x

n

x

x

y

r

x

f

r

x

f

r

x

f

r

2

1

2

1

gdzie r

y

jest oszacowanym maksymalnym błędem

wielkości y a r

xi

jest oszacowanym maksymalnym

błędem wielkości x

i

.

background image

Rozkład wariancji z próby (rozkład

2

)

Pobieramy próbę x

1

,x

2

,...,x

n

z rozkładu

normalnego o a=0 i =1. Dystrybuanta

rozkładu zmiennej x

2

=x

1

2

+x

2

2

+...+x

n

2

jest

dana następującą funkcją:

du

u

u

n

F

n

n

 

2

1

exp

2

2

1

1

)

(

2

0

1

2

1

2

gdzie (y) jest funkcją gamma Eulera (silnią

uogólnioną na liczby rzeczywiste).

0

)

1

(

dt

e

t

x

t

x

background image

 

u

2

1

exp

u

2

n

2

1

1

)

(

f

1

n

2

1

n

2

Zatem sam rozkład wariancji jest dany następującą
funkcją

background image

Zasada największej wiarygodności

(Maximum Likelihood Principle)

Mamy próbę (x

1

,x

2

,...,x

n

)

f(x,): funkcja określająca rozkład gęstości

prawdopodobieństwa, gdzie  jest

zestawem parametrów rozkładu.

Zasada największej wiarygodności: najlepsze

 maksymalizuje prawdopodobieństwo

wystąpienia próby.

Ta zasada jest podstawą wszystkich metod

estymowania parametrów rozkładu

prawdopodobieństwa (a zatem i modelu

matematycznego) z próby danych.

background image

Ponieważ poszczególne elementy próby są
niezależne

dx

x

f

dP

j

j

)

,

(

)

(

)

(

λ

N

j

j

dx

x

f

dP

1

)

(

)

;

(

λ

)

(

)

(

)

;

(

)

;

(

2

1

1

2

)

(

1

1

)

(

λ

λ

λ

λ

L

L

x

f

x

f

Q

N

j

j

N

j

j

iloraz wiarygodności

N

j

j

N

j

j

x

f

L

x

f

L

1

)

(

1

)

(

)

;

(

ln

)

;

(

λ

λ

funkcja
wiarygodności

background image

Przykład jakościowego porównywania dwu
modeli poprzez obliczenie ilorazu
wiarygodności

Rzucamy monetą asymetryczną.
Przypuszczamy, że albo prawdopodobieństwo
wyrzucenia reszki jest 2 razy większe niż
prawdopobobieństwo wyrzucenia orła (A) albo
odwrotnie (B). Przypuśćmy, że w 5 rzutach
otrzymaliśmy 1 raz orła i 4 razy reszkę. Wtedy:

8

,

3

2

3

1

,

3

2

3

1

4

4

B

A

B

A

L

L

Q

L

L

background image

Przykład zastosowania zasady największej
wiarygodności: obliczanie wartości średniej przy
założeniu, że rozkład prawdopodobieństwa jest
rozkładem normalnym





N

j

j

N

j

j

j

N

j

j

j

N

j

j

j

N

j

j

j

j

N

j

j

j

j

j

j

x

x

d

d

x

N

L

x

L

dx

x

dx

x

f

1

2

1

2

)

(

*

1

2

*

)

(

1

2

2

)

(

1

2

2

)

(

1

2

2

)

(

)

(

1

0

2

)

(

2

1

ln

)

2

ln(

2

ln

)

(

2

)

(

exp

2

1

2

)

(

exp

2

1

)

;

(

*

background image





)

(

''

)

(

)

(

''

)

(

)

(

'

)

(

'

0

)

;

(

)

;

(

'

)

(

'

*

*

*

*

*

1

)

(

)

(

*

*

N

j

j

j

x

f

x

f

Właściwości asymptotyczne funkcji
wiarygodności

Dla dużych prób

















2

2

*

2

2

*

*

2

*

2

'

)

(

)

(

'

1

)

(

)

(

*

2

)

(

exp

)

(

2

1

)

(

)

(

/

1

)

(

'

)

;

(

)

;

(

'

)

;

(

)

;

(

'

)

(

''

*

*

b

k

L

b

b

NE

x

f

x

f

NE

x

f

x

f

j

j

N

j

j

j

background image

Obszary ufności w przestrzeni

parametrów

Obszar ufności definiujemy jako taki obszar w
otoczeniu wartości oczekiwanej wektora parametrów i
ograniczony powierzchnią o stałej gęstości
prawdopodobieństwa, że prawdopodobieństwo
znalezienia w nim prawdziwych wartości parametrów
jest nie mniejsze niż zadana wartość (kwantyl). W
jednym wymiarze mówimy o przedziale ufności.

1

2

P=g

1

2

*

background image

99

.

0

3

;

683

.

0

)

1

(

)

erf(

2

)

(

)

(

)

(

2

)

(

exp

)

(

*

2

2

*





 





P

P

g

d

L

d

L

P

kg

k

L

W jednym wymiarze

background image

01439

.

0

,

03734

.

0

,

09020

.

0

19875

.

0

,

39347

.

0

,

68269

.

0

2

1

,

2

)

exp(

)

(

1

)

,

(

2

,

2

)

;

(

6

5

4

3

2

1

0

1

0

2

2

W

W

W

W

W

W

n

P

W

dt

t

t

a

x

a

P

g

n

P

d

n

f

W

n

x

a

g

Ogólnie dla wielowymiarowego rozkładu
Gaussa


Document Outline


Wyszukiwarka

Podobne podstrony:
metody statystyczne w chemii 8
metody statystyczne w chemii 5
metody statystyczne w chemii 1
Metody statystyczne cw1, Matematyka, Kombinatoryka, prawdopodobieństwo, statystyka, metody statystyc
Metody statystyczne 2010 poblem1, Matematyka, Kombinatoryka, prawdopodobieństwo, statystyka, metody
Metody statystyczne cw4, Matematyka, Kombinatoryka, prawdopodobieństwo, statystyka, metody statystyc
Metody statystyczne cw2, Matematyka, Kombinatoryka, prawdopodobieństwo, statystyka, metody statystyc
Metody statystyczne 2010 poblem2, Matematyka, Kombinatoryka, prawdopodobieństwo, statystyka, metody
metody statystyczne w chemii 4
Metody statystyczne cw6, Matematyka, Kombinatoryka, prawdopodobieństwo, statystyka, metody statystyc
metody statystyczne w chemii 7
Metody statystyczne cw3, Matematyka, Kombinatoryka, prawdopodobieństwo, statystyka, metody statystyc
metody statystyczne w chemii 6
Metody statystyczne cw5, Matematyka, Kombinatoryka, prawdopodobieństwo, statystyka, metody statystyc
metody statystyczne w chemii 10
metody statystyczne w chemii 2
metody statystyczne w chemii 8
metody statystyczne w chemii 5
metody statystyczne w chemii 1

więcej podobnych podstron