PRAKTYCZNE WYKORZYSTANIE DANYCH Z ZAKRESU MORFOLOGII

background image

PRAKTYCZNE

PRAKTYCZNE

WYKORZYSTANIE

WYKORZYSTANIE

DANYCH Z

DANYCH Z

ZAKRESU

ZAKRESU

MORFOLOGII

MORFOLOGII

mgr Aleksandra
Naczk

background image

Plan zajęć - cz. I

Plan zajęć - cz. I

• Statystyka opisowa
• Testowanie hipotez statystycznych
• Rodzaje testów statystycznych

(dla 2 prób

niezależnych)

• Analiza wariancji ANOVA
• Analizy wielowymiarowe

background image

STATYSTYKA

STATYSTYKA

OPISOWA

OPISOWA

background image

Badaną próbę możemy

Badaną próbę możemy

scharakteryzować za pomocą

scharakteryzować za pomocą

następujących statystyk:

następujących statystyk:

1.

Miary położenia

Miary położenia

(miary tendencji centralnej) wskazują położenie

wartości, która najlepiej charakteryzuje wszystkie elementy naszej
próby:

a.

Miary centralne

Miary centralne

- charakteryzują średni lub typowy poziom

wartości, wokół której skupiają się wszystkie pozostałe wartości
analizowanej cechy.
- modalna (inaczej moda lub dominanta)
- wartości średnie:

średnia arytmetyczna

średnia arytmetyczna

, geometryczna,

harmoniczna
(suma wszystkich wartości zbioru danych podzielona przez
liczebność próby; wartości skrajne; liczebność próby)

b.

Kwantyle (kwartyle i mediana)

Kwantyle (kwartyle i mediana)

- wartości, które dzielą

uporządkowany zbiór danych na części o jednakowej liczbie
elementów.

background image

CENTRALNE MIARY POŁOŻENIA

CENTRALNE MIARY POŁOŻENIA

Średnia arytmetyczna

Średnia arytmetyczna

- suma wszystkich

wartości zmiennej podzielona przez ich liczebność

•służy do oszacowania średniej populacji; wraz ze

wzrostem liczebności próby jej wartość jest coraz
bliższa średniej populacji

•duży wpływ na jej wartość mają wartości skrajne

zmiennej, zwłaszcza przy małej liczebności próby

•obliczanie jej dla rozkładów znacznie odbiegających

od normalnego nie ma sensu →

mediana

mediana

x

background image

N

[mm]

=27,4

x

Rozkład długości liścia pewnego gatunku

Rozkład długości liścia pewnego gatunku

storczyka

storczyka

background image

KWANTYLE

KWANTYLE

KWANTYLE

-

wartości, które dzielą zbiór danych na

części o jednakowej liczbie elementów.

Do najczęściej stosowanych należą:

Kwartyle

(wartości ćwiartkowe) - podział na 4 części

mediana

mediana

= drugi kwartyl (dzieli zbiór na 2 części)

Decyle

- podział na 10 części

Percentyle

(centyle) - podział na 100 części

-3

-2

-1

0

1

2

3

0,0

0,1

0,2

0,3

0,4

0,5

0,6

25%

25%

25%

25%

background image

2.

Miary rozproszenia

Miary rozproszenia

oceniające rozrzut wartości zmiennej:

a.

Rozstęp

Rozstęp

- (wartość minimalna i maksymalna) jest to różnica

między największą i najmniejszą wartością zmiennej w zbiorze
danych; całkowity obszar zmienności badanej cechy.

b.

Odchylenie ćwiartkowe (kwartylne)

c.

Odchylenie standardowe i wariancja

Odchylenie standardowe i wariancja

- są najważniejszymi

miarami rozproszenia danych wokół średniej arytmetycznej.
(SD informuje nas, o
ile przeciętnie poszczególne pomiary różnią się od średniej, czyli
wskazuje na wielkość błędu pojedynczego pomiaru; im mniejsza
wartość odchylenia, tym obserwacje są bardziej skupione wokół
średniej)

background image

Odchylenie standardowe i wariancja

Odchylenie standardowe i wariancja

2

1

1

2

n

x

x

s

n

i

i

Odchylenie standardowe wyrażone jest w tych
samych jednostkach, co średnia arytmetyczna.

Informuje o ile średnio poszczególne pomiary
różnią się od średniej, czyli jaki jest błąd
bezwzględny pojedynczego wyniku.

Jest najważniejszą miarą rozrzutu danych wokół
średniej.

background image

3.

Miary zmienności:

Miary zmienności:

a.

Współczynnik zmienności

- umożliwia porównanie

zmienności zbiorów danych różniących się znacznie wartością
średniej lub zawierających pomiary wykonane w różnych
jednostkach (np. kg i mm)

b.

Wskaźnik różnorodności

(wskaźnik Shannona-Wienera) -

wskaźnik różnorodności biologicznej; jego wartość określa
prawdopodobieństwo, że dwa wylosowane z próbki osobniki
będą należały do różnych gatunków

4.

Miary symetrii i spłaszczenia rozkładu:

Miary symetrii i spłaszczenia rozkładu:

a.

Kurtoza

– wskaźnik spłaszczenia/wskaźnik smukłości;

wskazuje na koncentrację danych wokół średniej

b.

Wskaźnik symetrii rozkładu

– wskaźnik skośności; jego znak

mówi o kierunku asymetrii

background image

MIARA SPŁASZCZENIA ROZKŁADU

MIARA SPŁASZCZENIA ROZKŁADU

Kurtoza

Kurtoza

gdy jest równa 0 – rozkład normalny
(mezokurtyczny)

(A)

gdy jest dodatnia – rozkład wysmukły
(leptokurtyczny)

(B)

gdy jest ujemna – rozkład spłaszczony
(platykurtyczny)

(C)

(A
)


(

B)


(

C)

background image

MIARA SKOŚNOŚCI ROZKŁADU

MIARA SKOŚNOŚCI ROZKŁADU

gdy jest równy 0 – rozkład idealnie
symetryczny

(A)

gdy jest dodatni – rozkład prawoskośny

(B)

gdy jest ujemny – rozkład lewoskośny

(C)

(

A)

(B)

(C)

background image

Skośność = 1,30

Rozkład prawoskośny

Rozkład symetryczny

Skośność = 0,11

Wykres ramkowy

Wykres ramkowy

background image

Testowanie

hipotez

statystycznych

background image

ROZKŁAD NORMALNY

ROZKŁAD NORMALNY

Rozkład normalny o średniej arytmetycznej 0 i odchyleniu

standardowym 1 nazywa się

rozkładem normalnym

rozkładem normalnym

standaryzowanym

standaryzowanym

Rozkład Gaussa

Większość pomiarów w biologii ma rozkład zbliżony do rozkładu

normalnego

-3 -2 -1 0

1

2

3

0,0

0,1

0,2

0,3

0,4

0,5

Rozkład ten jest symetryczny względem wartości średniej

p

δ

background image

HIPOTEZY STATYSTYCZNE

HIPOTEZY STATYSTYCZNE

H

H

0

0

– Hipoteza zerowa – zakłada brak różnicy

– Hipoteza zerowa – zakłada brak różnicy

(nieistotność różnicy)

(nieistotność różnicy)

H

A

: długość skrzydła schwytanego brodźca piskliwego

różni się istotnie od średniej z populacji

H

0

: długość skrzydła schwytanego brodźca piskliwego nie

różni się istotnie od średniej z populacji

H

H

A

A

– Hipoteza alternatywna jest przeciwieństwem

– Hipoteza alternatywna jest przeciwieństwem

hipotezy zerowej

hipotezy zerowej

Każdy test statystyczny rozpoczyna się od sformułowania

hipotez

Następnie przyjmujemy poziom istotności

(prawdopodobieństwo graniczne)

0,05

background image

FORMUŁOWANIE HIPOTEZY ZEROWEJ

FORMUŁOWANIE HIPOTEZY ZEROWEJ

Hipoteza zerowa zawsze zakłada brak

istotnych różnic między badanymi

próbami

H

0

: średni ciężar zięb i wróbli nie różni się istotnie

H

A

: średni ciężar zięb i wróbli różni się istotnie

Test dwukierunkowy (dwustronny)

Test dwukierunkowy (dwustronny)

H

A

: średni ciężar zięb jest większy niż średni ciężar wróbli

H

0

:

średni

ciężar zięb nie jest większy niż ciężar wróbli

Test jednokierunkowy (jednostronny)

Test jednokierunkowy (jednostronny)

background image
background image

TESTY

PARAMERTYCZNE

,

TESTY

NIEPARAMERTYCZNE

TESTY DLA
DWÓCH
PRÓB

TESTY DLA
WIĘCEJ NIŻ
DWÓCH
PRÓB

t-Studenta dla par niezależnych
t-Studenta dla par zależnych
Cochrana-Coxa
test dla 2 wsp. zmienności
test dla 2 wsk. różnorodności
test dla 2 wsp. korelacji
test F (Fishera), Levena
Lilleforsa, Shapiro-Wilka

U Manna-Whitneya
Wilcoxona
test znaków
Walda-Wolfowitza (test serii)
Kołgomorowa-Smirnowa
test mediany dla dwóch prób

ANOVA i testy post hoc:

• Tukeya

• Newman-Keulsa

• Duncana

• Scheffego

• Dunetta

Kruskala-Wallisa i testy post
hoc:

• Duna

• test mediany dla wielu
prób

• test Friedmana

background image

Ocena zgodności rozkładu z rozkładem normalnym

Test Shapiro-Wilka

W=0,89; p<0,0001

Skośność=0,40

Kurtoza=-0,04

Histogram z dopasowanym

rozkładem normalnym

Rozkład normalności

W a r to ś c i o b s e r w o w a n e

O

cz

ek

iw

an

y

ro

zk

ła

d

no

rm

al

ny

background image

116

120

124

128

132

136

[mm]

młode

dorosłe

Maks

Min

X ± SD

X

384

379

background image

Test t-studenta

Test t-studenta

H

0

: Średnia liczba jaj w gniazdach wróbla i mazurka nie różni się

istotnie

H

0

: Średnia liczba jaj w gniazdach wróbla i mazurka różni się

istotnie

N

wr

=68

N

maz

=83

wr

=4,8

maz

=4,2

s

2

=0,93 s

2

=0,54

x

x

Ocena zgodności rozkładów z rozkładem

normalnym

test Shapiro-Wilka; W=0,89; p<0,001

test Shapiro-Wilka; W=0,79; p<0,001

3

4

5

6

0

1 0

2 0

3 0

4 0

5 0

6 0

2

[N ]

7

background image

ANOVA

background image

ANALIZA WARIANCJI

ANALIZA WARIANCJI

Badano wielkość zniesienia u 4 gatunków sikor. Należy

sprawdzić, czy gatunki te różnią się średnią liczbą składanych

jaj.

H

0

: Średnia liczba jaj składanych przez 4 gatunki sikor jest taka

sama.

H

A

: Średnia liczba jaj składanych przez 4 gatunki sikor

nie

jest

taka sama.

4

5

6

7

8

9

1 0 1 1 1 2

0

1 0

2 0

3 0

4 0

4

5

6

7

8

9

1 0 1 1 1 2

4

5

6

7

8

9

1 0 1 1 1 2

4

5

6

7

8

9

1 0 1 1 1 2

0

1 0

2 0

3 0

4 0

N

N

c z a r n o g łó w k a

m o d r a s z k a

s z a r y tk a

b o g a tk a

background image

ANALIZA WARIANCJI

ANALIZA WARIANCJI

Porównanie wielkości zniesienia u 4 gatunków sikor. Linia

pozioma – średnia, prostokąt – odchylenie standardowe,

linia pionowa zakres. Nad słupkami podano liczebności

prób.

background image

Dziękuję za uwagę

Dziękuję za uwagę


Document Outline


Wyszukiwarka

Podobne podstrony:
Dowody za obiektywno¶ci± ewolucji z zakresu morfologii porównawczej 1 cz
CIEN SEJSMICZNY-PRZYCZYNY WYSTEPOWANIA I PRAKTYCZNE WYKORZYSTANIE ZJAWISKA, Geodezja, Geodezja fizy
Przykladowe zadanie egzaminacyjne w etapie praktycznym z wykorzystaniem komputera z, Matura, technik
Praktyczne wykorzystanie?ta minig
praktyczne wykorzystanie narzędzi PR w firmie
inwestowanie pieniędzy w praktyce wykorzystaj okazje jakie?je polski rynek! M4QIMHXY635DCLKVW7JMKZM
praktyczne wykorzystanie prawa archimedesa, Turystyka i Rekreacja, pływanie
Praktyczne wykorzystanie Twierdzenia Talesa
Jak w praktyce wykorzystywać wyniki analiz Activity Based Costing
MOŻLIWOŚĆ PRAKTYCZNEGO WYKORZYSTANIA LOGISTYKI W ODNIESIENIU DO GOSPODARKI ODPADAMI, Logistyka, Przy
inwestowanie pieniędzy w praktyce wykorzystaj okazje jakie daje polski rynek! MQ4ONOX5NJQ4YALTJX2OJF
Scenariusze zajęć terapeutycznych z wykorzystaniem ćwiczeń z zakresu Kinezjologii?ukacyjnej
Dowody za obiektywno¶ci± ewolucji z zakresu morfologii porównawczej 1 cz
16 Jak pomogłem znajomemu czyli o praktycznym wykorzystaniu technik skutecznej komunikacji
Praktyczne wykorzystanie Prawa Parkinsona Pareto 80 20 i Eisenhowera czyli jak to połączyć i stworzy
Programowanie Teoria i praktyka z wykorzystaniem C Wydanie II poprawione 2
Programowanie Teoria i praktyka z wykorzystaniem C Wydanie II poprawione

więcej podobnych podstron