biostat01 id 88978 Nieznany (2)

Biostatystyka,

# 1

/Weterynaria I/

dr n. mat. Zdzisław Otachel

Uniwersytet Przyrodniczy w Lublinie

Katedra Zastosowań Matematyki i Informatyki

ul. Akademicka 15, p.317 bud. Agro II,

e-mail: zdzislaw.otachel@up.lublin.pl

materiały: http://kzmi.up.lublin.pl/˜zotachel/Wet

Lublin, 2013

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Zakres materiału

•

Statystyka opisowa - analiza struktury zjawisk
masowych

•

Podstawowe pojęcia rachunku prawdopodobieństwa

•

Zmienne losowe i ich rozkłady

•

Estymacja punktowa i przedziałowa

•

Testowanie hipotez statystycznych

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Literatura

Hanusz Z., Tarasińska J. Statystyka matematyczna, Wyd. AR
Lublin 2006.

Kala R. Statystyka dla przyrodników, Wyd. AR, Poznań, 2002.

Koronacki J., Mielniczuk J. Statystyka dla studentów
kierunków technicznych i przyrodniczych, WNT, 2001.

Łomnicki A. Wprowadzenie do statystyki dla przyrodników,
PWN, W-wa 2002.

Parlińska M., Parliński J. Badania statystyczne z Excelem,
Wyd. SGGW W-wa 2003.

Smolik S. Zadania z rachunku prawdopodobieństwa i
statystyki matematycznej dla Akademii Rolniczych. Wyd.
SGGW W-wa 1994.

Stanisz A. Biostatystyka. Wyd. UJ, 2006.

Cezary Watała, Biostatystyka - wykorzystanie metod
statystycznych w pracy badawczej w naukach biomedycznych.
Wyd. Alfa Medica Press, Bielsko-Biała 2002.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Przedmiot statystyki

Termin statystyka wywodzi się od włoskiego słowa stato, czyli
państwo. Został on użyty po raz pierwszy przez niemieckiego
politologa Gotfrieda Achenwalla (1719-1772) profesora
uniwersytetów w Magdeburgu i Getyndze, na oznaczenie szeroko
rozumianych wiadomości o państwie. Dla uporządkowania
wywodów ujmowano opisy w tabele, dlatego kierunek ten
ochrzczono mianem statystyki tabelarycznej. Za twórców
współczesnej statystyki uznaje się Anglików Johna Grunta
(1620-1674) i Williama Petty’ego (1623-1687), arytmetyków
politycznych. Na podstawie danych liczbowych szukali oni
prawidłowości wśród pozornie chaotycznych zjawisk masowych.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Przedmiot statystyki

Dalszy rozwój statystyki stymulowała teoria rachunku
prawdopodobieństwa, zapoczątkowana w drugiej połowie XVII w.
przez francuskich matematyków: Blaise Pascala (1623-1662) i
Pierra Fermata (1601-1665). Podwaliny pod metody współczesnej
statystyki położył Carl Friedrich Gauss (1777-1855) tworząc teorię
za pomocą, której na podstawie szeregu pomiarów jakiegoś obiektu
można oszacować jego rzeczywisty wymiar. Najwybitniejsi twórcy
współczesnych metod statystycznych to: Karl Pearson
(1857-1936), Ronald Aylmer Fisher (1890-1962), Jerzy
Spława-Neyman (1894-1981), E.S. Pearson (1895-1980), Abraham
Wald (1902-1950).

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Statystyka opisowa

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Podstawowe pojęcia statystyczne

Przedmiotem badań statystycznych są populacje - określone zbiory
istot, rzeczy lub zjawisk. Będą one badane pod kątem określonych
cech tj. funkcji, które przyporządkowują każdemu elementowi
populacji wartość liczbową, będącą wynikiem pomiaru.
Cechy podzielimy na:

Skokowe - przyjmujące skończoną lub przeliczalną liczbę
wartości np. liczba szczeniąt w miocie, czas oczekiwania na
zadziałanie podanego leku mierzony np. w godzinach,

Ciągłe - przyjmujące dowolne wartości z pewnego przedziału,
np. masa, średnica, długość, itp. określonego obiektu
biologicznego (np. zwierzęcia), poziom przeciwciał we krwi
zwierzęcia po podaniu szczepionki.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Całkowite i częściowe badanie populacji

Wnioskując o cechach pewnej populacji można wykonać
następujące rodzaje badań statystycznych:

Badanie całkowite - mierząc wartości interesujących cech dla
każdego elementu populacji,

Badanie częściowe - oznaczając wartości cech dla
wytypowanych na drodze losowania niektórych elementów
populacji i uogólniając wyniki, za pomocą technik
statystycznych, na całą populację.

Ze statystycznego punktu widzenia interesujący jest tylko ten drugi
rodzaj badania.
Część populacji podlegającą badaniu częściowemu nazywamy
próbą.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Szereg statystyczny

Badanie częściowe określonej cechy prowadzi do uzyskania szeregu
statystycznego (pierwotnego). Jest to ciąg pomiarów tej samej
cechy x na N obiektach populacji, wybranych do badania w sposób
losowy, mianowicie:

, x

, . . . , x

gdzie x

jest wartością (obserwacją lub pomiarem) cechy x dla

i -tego elementu wytypowanego z populacji do badania, a N ilością
przebadanych obiektów (rozmiarem, liczebnością, długością szeregu
statystycznego).
Ciąg pomiarów tej samej cechy nazywa się też próbą liczbową.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Statystyczne szeregi rozdzielcze

Rozstęp szeregu statystycznego (R) to różnica:

R = x

max

− x

min

gdzie x

max

i x

min

oznacza odpowiednio największy i najmniejszy

zaobserwowany pomiar.
Pierwotny szereg statystyczny zawiera nieistotne informacje,
dlatego podlega obróbce mającej na celu pominięcie tychże, a
przez to zyskanie na przejrzystości. Takie zabiegi prowadzą do
otrzymania następujących, przetworzonych danych statystycznych:

Szereg szczegółowy - pomiary uporządkowane w kolejności
rosnącej lub malejącej,
Szereg rozdzielczy - zestawienie uporządkowanych
zaobserwowanych wartości lub zakresów (przedziałów
klasowych) z odpowiadającymi im liczebnościami.

Szeregi rozdzielcze tworzy się z licznych (zawierających więcej niż
30 obserwacji) szeregów statystycznych lub, gdy w szeregu
występują powtarzające się wartości.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Rodzaje szeregów rozdzielczych

Punktowy szereg rozdzielczy - dla cech skokowych
przyjmujących skończoną liczbę wartości; ma on postać
zestawienia:

, l

gdzie x

- i -ta w kolejności wzrostu zaobserwowana wartość, l

- ilość powtórzeń w szeregu statystycznym,
Klasowy szereg rozdzielczy - dla cech ciągłych lub skokowych
o licznych różnych wartościach (w praktyce, więcej niż 30) i
ma on postać zestawienia:

(π

, l

gdzie π

- i -ty przedział klasowy, l

- ilość obserwacji

należących do tego przedziału.

Przedziały klasowe na ogół są jednakowej długości, muszą być
rozłączne i ich suma ma pokrywać wszystkie wartości szeregu
rozdzielczego. Suma liczebności jest zawsze równa długości szeregu
statystycznego: l

+ l

+ · · · + l

= N.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Zależność liczby klas od ilości pomiarów

Liczba pomiarów (N)

Liczba klas (k)

30-60

6-8

60-100

7-10

100-200

9-12

200-500

11-17

500-1500

16-25

Liczbę klas można wyznaczyć także na podstawie jednej z
zależności:

k ¬ 5 ln N, k ≈ 1 + 3, 332 ln N, k ≈

√

Nie stosuje się większej ilości klas niż 30. Długość przedziału
klasowego obliczamy dzieląc rozstęp R przez liczbę klas k.
Graficzne przedstawienie szeregu rozdzielczego to histogram (dla
szeregów klasowych) lub diagram liczebności (dla szeregów
punktowych).

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Charakterystyki używane do opisu danych statystycznych

Zbiór danych statystycznych – szereg statystyczny – zawiera
informację o cesze trudną do przetwarzania.
Łatwiej operować częścią tej informacji, którą zawierają
charakterystyki (miary) danych liczbowych. Są to funkcje
zdefiniowane na elementach szeregu statystycznego.
Do takich charakterystyk (miar) najczęściej wykorzystywanych przy
opisie struktury zbiorowości liczbowych należą:

miary średnie (przeciętne, położenia) – podają one tą wartość
wokół której skupiają się pozostałe liczby (obserwacje), jeżeli
x jest taką miarą, to zawsze

min

¬ x ¬ x

max

;

miary zmienności (rozproszenia, zróżnicowania, dyspersji) –
określają stopień zróżnicowania wartości w analizowanej
zbiorowości, jeżeli d jest taką miarą, to

d 0,

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Charakterystyki używane do opisu danych statystycznych-
cd.

przypadek d = 0 oznacza brak zmienności, wszystkie wartości są
równe swojej średniej;

miary asymetrii (skośności) – określają kierunek zróżnicowania
wartości;

miary koncentracji – określają stopień skupienia wartości
wokół średniej.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Miary średnie (przeciętne)

Dzielą się na:

średnie klasyczne:

średnia arytmetyczna (A),
średnia geometryczna (G),
średnia harmoniczna (H),

średnie pozycyjne:

dominanta (moda, wartość modalna, najczęstsza),
kwantyle

kwartyle – dzielące zbiorowość na cztery części,
decyle – dzielące zbiorowość na dziesięć części,
percentyle – dzielące zbiorowość na sto części.

Średnie klasyczne są obliczane na podstawie wszystkich wartości
szeregu statystycznego, średnie pozycyjne są wartościami
konkretnych wyrazów szeregu wyróżniających się pod pewnym
względem.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Średnia arytmetyczna

Średnią x cechy x na podstawie szeregu statystycznego
x

, x

, . . . , x

najczęściej policzymy posługując się średnią

arytmetyczną:

x =

+ x

+ · · · + x

N
i =1

Ale ta sama średnia dla szeregu rozdzielczego będzie liczona wg
wzoru na średnią ważoną, gdzie wagami są liczebności:

x =

+ x

+ · · · + x

+ l

+ · · · + l

r
i =1

gdzie x

, x

, . . . , x

oznaczają tu wartości zaoobserwowane dla

szeregu punktowego lub środki przedziałów klasowych dla szeregu
klasowego. Średnia arytmetyczna jest miarą wiarygodną tylko dla
zbiorowości o niewielkim stopniu zróżnicowania obserwacji. Gdy
rośnie asymetria (histogram nie ma osi symetrii) lub zbiorowość
jest wielomodalna (histogram ma więcej niż jedno maksimum)
stosowalność wzoru traci sens.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Średnia harmoniczna

Jeżeli obserwowane wartości są określone w jednostkach
względnych (tzn. wielkość/jednostka miary) to wartość przeciętną
szeregu x

, x

, . . . , x

możemy policzyć wg średniej harmonicznej:

H =

N
i =1

Dla szeregów rozdzielczych należałoby stosować wzór z
liczebnościami l

H =

+ l

+ · · · + l

r
i =1

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Średnia geometryczna

W przypadku, gdy chcemy policzyć przeciętną wartość przyrostu
lub spadku badanej cechy użyjemy średniej geometrycznej,
dokładniej: niech x

, x

, . . . , x

będzie szeregiem statystycznym

związanym z cechą x , cecha y to względna zmiana cechy x , a
y

, y

, . . . , y

to szereg z nią związany, gdzie

= x

i −1

, i = 1, 2, . . . N. Wtedy

y =

√

· y

· · · · · y

Dla szeregu rozdzielczego, z wagami l

użyjemy wzoru:

y =

· y

· · · · · y

gdzie N = l

+ l

+ · · · + l

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Średnie pozycyjne

Dominanta (moda) D – to taka wartość obserwacji, która w
szeregu statystycznym występuje najczęściej, ma sens tylko dla
zbiorowości jednomodalnych (o jednej wartości maksymalnej).
Kwartyle: Q

(dolny),Q

(środkowy – mediana), Q

(górny) dzielą

szereg na 4 części, równe pod względem liczebności (po 25%
obserwacji). Mediana (M

) – wartość znajdująca się dokładnie w

środku szeregu uporządkowanego. Liczba obserwacji mniejszych od
mediany jest równa ilości obserwacji większych o mediany. Mediana
to środkowy kwartyl.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Miary zmienności (dyspersji) – wariancja

Wariancja pomiarów cechy x (ozn.: S

:= S

) – średnia

arytmetyczna z kwadratów różnic poszczególnych,
zaobserwowanych wartości cechy x od średniej arytmetycznej x
wszystkich obserwacji.
Dla szeregu surowego lub szczegółowego liczymy ją wg wzoru:

i =1

− x)

Dla szeregów rozdzielczych użyjemy wzoru z wagami:

i =1

− x)

, N =

i =1

gdzie tutaj x

są wartościami zaobserwowanymi lub środkami

przedziałów klasowych, natomiast l

- liczebnościami związanymi z

zaobserwowanymi wartościami x

lub ilościami obserwacji

należących do kolejnych przedziałów klasowych .

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Wariancja - cd.

W każdej sytuacji słuszny jest wzór:

= x

− (x)

gdzie x

oznacza średnią arytmetyczną kwadratów obserwacji (tzw.

średni kwadrat), tj.:

+ x

+ · · · + x

N
i =1

dla szeregu nieuporządkowanego, lub

+ x

+ · · · + x

+ l

+ · · · + l

r
i =1

dla szeregów rozdzielczych, gdzie x

, x

, . . . , x

oznaczają tu

wartości obserwowane (szeregi punktowe) lub środki przedziałów
klasowych (szeregi klasowe) związane z liczebnościami l

, l

, . . . , l

Wariancja jest zawsze liczbą nieujemną, wyrażoną w kwadracie
jednostki fizycznej użytej do pomiaru cechy x . Duża jej wartość
świadczy o dużym zróżnicowaniu (zmienności) obserw a cji.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Poprawka Shepparda

Wariancja liczona dla szeregu nieuporządkowanego i klasowego
różnią się. Gdy histogram badanej cechy ma jedno maksimum (jest
jednomodalny) i liczności klas maleją do 0 w obu kierunkach, to od
wariancji S

liczonej dla szeregu klasowego odejmujemy poprawkę

Shepparda równą 1/12 kwadratu długości klasy d . Wariancja S

∗

uwzględniajaca poprawkę jest określona wzorem:

∗

= S

−

Poprawkę Shepparda stosuje sie w praktyce, gdy liczebność szeregu
N 1000 zaś liczba klas k 20.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Odchylenie standardowe

Odchylenie standardowe pomiarów cechy x (ozn.: S

:= S ) jest

pierwiastkiem kwadratowym z wariancji:

S =

√

i określa o ile średnio obserwacje różnią się od średniej
arytmetycznej pomiarów badanej cechy. Odchylenie standardowe
służy do do konstrukcji typowego przedziału zmienności dla
badanej cechy. W tym obszarze mieści się około 2/3 wszystkich
wartości obserwowanych dla tej cechy. Typowy przedział
zmienności określa wzór:

x − S ¬ x ¬ x + S .

By porównywać zmienność dwóch zbiorowości użyjemy
niemianowanego współczynnika zmienności (ozn. V ):

V =

· 100%.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Momenty

Niech r będzie liczbą naturalną.
Moment zwykły m

rzędu r dla szeregu x

, . . . , x

i =1

Moment centralny M

rzędu r dla szeregu x

, . . . , x

i =1

− x)

Dla szeregów rozdzielczych

, l

), i = 1, . . . , n, l

+ l

+ · · · + l

= N :

i =1

, M

i =1

− x)

Pierwszy moment zwykły m

jest średnią arytmetyczną. Pierwszy

moment centralny M

jest zawsze równy 0. Drugi moment

centralny M

jest wariancją.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Miary asymetrii

Dla rozkładów symetrycznych - histogram ma oś symetrii
przechodzacą przez wspólną wartość średniej arytmetycznej,
dominanty i mediany - momenty centralne rzedów nieparzystych są
równe 0. Stąd trzeci moment centralny wykorzystano do
konstrukcji współczynnika asymetrii (skośności)

Wartość A

jest:

równa zero, dla zbiorowości symetrycznej,

dodatnia, dla zbiorowości o asymetrii prawostronnej,

ujemna, dla zbiorowości o asymetrii lewostronnej.

Im większa wartość bezwzględna współczynnika skośności tym
większa asymetria badanej zbiorowości.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Miary koncetracji

Czwarty moment centralny służy do pomiaru koncentracji
(skupienia)

K =

Współczynnik ten nazywa sie też kurtozą. Inny współczynnik tego
rodzaju to eksces (współczynnik spłaszczenia), obliczamy go
następujaco:

K − 3 =

− 3.

Zachodzi ścisły związek między koncentracją wartości cechy wokół
średniej (smukłość histogramu) a ich dyspersją. Im większa jest
dyspersja tym mniejsza jest koncentracja i vice versa.

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Koncetracja a dyspersja

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Statystyczna analiza danych w Excelu

Excel jest wygodnym narzędziem do podstawowej analizy danych
statystycznych. Arkusz kalkulacyjny powinien mieć załadowany
pakiet ANALYSIS TOOLPAK – w menu NARZĘDZIA powinna się
wyświetlać opcja ANALIZA DANYCH. Jeżeli polecenie jest
niedostępne, to należy pakiet załadować: W menu NARZĘDZIA
kliknąć polecenie DODATKI, Na liście DOSTĘPNE DODATKI
zaznaczyć pole ANALYSIS TOOLPAK i potwierdzić.

Tworzenie szeregów rozdzielczych i ich graficzna prezentacja:
NARZĘDZIA>ANALIZA DANYCH>HISTOGRAM.

Obliczanie liczebności l

dla szeregów rozdzielczych: funkcja

CZĘSTOŚĆ.

Obliczanie średnich z szeregów pierwotnych – funkcje
ŚREDNIA, ŚREDNIA.GEOMETRYCZNA,
ŚREDNIA.HARMONICZNA (kategoria STATYSTYCZNE).

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Statystyczna analiza danych w Excelu - cd.

Obliczanie podstawowych charakterystyk:
NARZĘDZIA>ANALIZA DANYCH>STATYSTYKA
OPISOWA

Obliczanie kwartyli: Funkcja KWARTYL (kategoria
STATYSTYCZNE)

Mediana i moda (dominanta) – funkcje MEDIANA (lub
KWARTYL(·;2)) i WYST.NAJCZĘŚCIEJ

dr n. mat. Zdzisław Otachel

Biostatystyka, # 1 /Weterynaria I/

Wyszukiwarka

Podobne podstrony:
biostatystyka slownik id 88982 Nieznany (2)
Abolicja podatkowa id 50334 Nieznany (2)
4 LIDER MENEDZER id 37733 Nieznany (2)
katechezy MB id 233498 Nieznany
metro sciaga id 296943 Nieznany
perf id 354744 Nieznany
interbase id 92028 Nieznany
Mbaku id 289860 Nieznany
Probiotyki antybiotyki id 66316 Nieznany
miedziowanie cz 2 id 113259 Nieznany
LTC1729 id 273494 Nieznany
D11B7AOver0400 id 130434 Nieznany
analiza ryzyka bio id 61320 Nieznany
pedagogika ogolna id 353595 Nieznany
Misc3 id 302777 Nieznany
cw med 5 id 122239 Nieznany
D20031152Lj id 130579 Nieznany

więcej podobnych podstron