Wprowadzenie do cw1

background image

Statystyka i planowanie

eksperymentów

Janusz Donizak

Kraków, 2011

background image

Podręczniki i źródła

„Analiza danych”, S. Brandt, PWN, 1999

„Statystyka i data mining w badaniach
statystycznych”,

www.statsoft.pl

, 2004

„Statystyka dla fizyków”, Roman Nowak, PWN,
2002

„Przystępny kurs statystyki”, A. Stanisz, Statsoft,
2006

„Rachunek prawdopodobieństwa”, L. Kubik,
PWN, 1973

background image

Statystyka

Statystyka jest polem badań w dziedzinie nauki o
gromadzeniu i analizie ilościowych danych w celu
wyprowadzenia z nich konkluzji w obliczu ich
niepewności.

Statystyka

Statystyka

to

nauka

o

metodach

badania

prawidłowości

występujących

w

zjawiskach

masowych.

A. Sokołowski, Kat. Statystyki AE

Niezależnie od tego, jakie jest źródło danych (zaplanowany i
zrealizowany

eksperyment,

obserwacje

zjawisk

nie

podlegających badaniom eksperymentalnym – zachowania
społeczne, ekonomia etc.) są one obarczone pewnymi
przypadkowymi zakłóceniami. Statystyka jest narzędziem
matematycznym pozwalającym na odróżnienie tego co stałe i
niezmienne od tego co ulotne i przypadkowe.

Statystyka

Statystyka służy więc zatem do tego, by wydobyć
prawdę z chaosu, by uchronić nas przed skutkami
niepewności wynikającej z przypadkowości wielu
czynników i by pomagać nam osiągać pewność i
skuteczność w warunkach niepewności.

R. Tadeusiewicz

background image

STATYSTYKA

 Metody pozyskiwania danych ilościowych

 Metody wykorzystania danych ilościowych i ich

prezentacji

 Metody indukcyjnego wnioskowania oparte o

metody prawdopodobieństwa matematycznego

background image

Pojęcia Podst. Statystyki

POPULACJA

GENERALNA

zbiorowość

o

elementach będących obiektami materialnymi lub
zjawiskami. Każdemu z elementów zbiorowości można
przypisać pewne cechy (zmienne statystyczne).
Zbiorowość może być skończona lub nieskończona.
np. zbiorowość obywateli naszego kraju.
Elementy populacji mogą się różnić określoną cechą,
wtedy

mówimy

o

rozkładzie

danej

cechy

statystycznej (zmiennej statystycznej).
Próbką statystyczną nazywamy podzbiór danych
wybranych z populacji generalnej.
Wnioskowaniem statystycznym nazywamy decyzję,
oszacowanie,

przewidywanie

lub

uogólnienie

dotyczące populacji generalnej oparte na informacji
zawartej w próbce statystycznej.
Jest to główny cel badań statystycznych. Z każdym
wnioskowaniem opartym na niepełnych badaniach
populacji

wiąże

się

pojęcie

wiarygodności

wnioskowania.

background image

4 elementy wspólne

każdemu zagadnieniu

statystycznemu

 Populacja generalna i procedura pobrania

próbki

 Próbka pobrana z populacji, analiza informacji

zawartej w niej

 Wnioskowanie o populacji oparte na informacji

zawartej w próbce

 Miara wiarygodności wnioskowania

background image

Statystyka opisowa

Jednym

z

zadań

realizowanych

metodami

statystycznymi jest prezentacja rezultatów badań
empirycznych.

Często

opis

statystyczny

sprowadza

się

do

wyznaczenia

pewnych

liczbowych

parametrów

określających badany zbiór danych. Taki opis
statystyczny

jest

często

punktem

wyjścia

wnioskowania

statystycznego

na

temat

cech

populacji generalnej.

Jeśli zbiór danych obejmuje całą populację
generalną,

wnioskowanie

statystyczne

jest

zbędne, pozostaje tylko odpowiednia prezentacja
opracowanych rezultatów badań.

Forma prezentacji zebranych danych statystycznych
zależy zatem od sposobu pobierania próbki
statystycznej i rodzaju zbieranych danych.

Empirycznym rozkładem

Empirycznym rozkładem cechy (zmiennej)
statystycznej zwiemy przyporządkowanie określonym
wartościom cechy częstości jej wystąpienia w
badanej próbce.

background image

Prezentacja danych

Częstością bezwzględną dla określonej kategorii
nazywamy całkowita liczbę n

i

danych które mieszczą

się w obrębie tej kategorii.

Częstością względną w

i

będziemy nazywać częstość

bezwzględną kategorii n

i

odniesioną do całkowitej

liczebności pobranej próbki n.

w

i

= n

i

/ n

Szeregiem rozdzielczym

Szeregiem rozdzielczym nazywamy uporządkowaną
tabelę częstości:

Liczba braków

(kategoria)

Liczba partii

produktu
(częstość

bezwzględna)

Częstość partii

produktu
(częstość

względna)

0

5

0.25

1

8

0.40

2

4

0.20

3

3

0.15

20

1.00

background image

Histogramem

Histogramem nazywamy graficzną prezentację
rozkładu częstości w kategoriach (bezwzględnych lub
względnych).

Kategoria (liczba braków)

-1

0

1

2

3

4

Li

cz

ba

o

bs

er

w

ac

ji

0

2

4

6

8

10

background image

Jeśli zmienna (cecha) jest zmienną ciągłą lub
dyskretną ale przyjmująca wiele wartości można
tabele rozdzielczą oraz histogram rozkładu zmiennej
przygotować, wydzieliwszy wcześniej odpowiednie
przedziały wartości zmiennej zwane

przedziałami

przedziałami

klasowymi

klasowymi.

Przykład. Z dokładnością do 1 minuty zmierzono czas
wykorzystany przez 120 pracowników wydziału
poświęcony

na

posiłek

regeneracyjny,

wyniki

przedstawiono w tabeli :

Czas poświęcony

posiłkowi

(kategoria )

Liczba prac.

(częstość

bezw.)

Czas poświęcony

posiłkowi

(kategoria )

Liczba prac.

(częstość bezw.)

3

2

19

8

5

5

20

8

10

7

22

9

12

5

23

3

14

11

25

6

16

8

27

7

17

13

30

8

background image

Kategoria (czas w min)

0

5

10

15

20

25

30

35

40

Li

cz

ba

p

ra

co

w

ni

w

0

2

4

6

8

10

12

14

Nie wszystkie możliwe kategorie posiadają niezerowe
częstości,

histogram

nie

daje

wystarczająco

przejrzystego obrazu rozkładu.

W takiej sytuacji zaleca się wprowadzenie przedziałów
klasowych, których liczba powinna spełniać k < 1+5
log

10

n . Dobrze jest dobrać przedziały o tej samej

rozpiętości, i unikać przedziałów o zbyt nikłej
(np.zerowej) częstości. Podział musi być rozłączny i
obejmować cały zakres zmienności w próbce.

background image

2D Graph 3

0

5

10

15

20

25

30

35

0

5

10

15

20

25

Niewłaściwy podział na

kategorie

mimo k=10

0

5

10

15

20

25

30

35

0

5

10

15

20

25

30

35

Dobry podział na kategorie

k=8

1+5 log

10

100=1+5*2=11

background image

Prezentacja częstości względnych (w

i

= n

i

/ n )

0-4

4-8

8-12

12-
16

16-
20

20-
24

24-
28

28-
32

background image

Dystrybuanta

Dystrybuanta empiryczną nazywamy funkcję

określoną na podstawie częstości względnych

1

1

1

0 dla

dla

1 2

1

1 dla

( )

, ,...,

i

n

s

i

i

s

k

x x

F x

w

x

x x

i

k

x x

+

=

<

=

� <

=

-

Dystrybuanta jest funkcja niemalejącą i ograniczoną
do <0,1>.

background image

Liczba

braków

(kategoria)

Liczba partii

produktu
(częstość

bezwzględna)

Częstość partii

produktu
(częstość

względna)

Dystrybuanta

empiryczna

0

5

0.25

0.25

1

8

0.40

0.65

2

4

0.20

0.85

3

3

0.15

1.00

20

1.00

0

3

1 2

1

0.5

Interpretacja:

F(2)=0.85 określa iż 85%
partii produktu miało co
najwyżej dwa braki.


Document Outline


Wyszukiwarka

Podobne podstrony:
Tablice cw1 Wprowadz do przedsieb
Wykład 1 inżynierskie Wprowadzenie do zarządzania operacyjnego
Wprowadzenie do medycyny rozwojowej 1
PD W1 Wprowadzenie do PD(2010 10 02) 1 1
Wprowadzenie do psychologii
Wprowadzenie do filozofii
(1) Wprowadzenie do nauki o finansach 1id 778 ppt
wprowadzenie do systemu win i podst sieci
wprowadzenie do psychologii społecznej
Wprowadzenie do cw1A
1 Wprowadzenie do psychologii pracy (14)id 10045 ppt
MWB 1 Wprowadzenie do modelowania wymagań w bezpieczeństwie
Wprowadzenie do Kryptografii
Wprowadzenie do pomocy społecznej
ZZL USWyklad 1 Wprowadzenie do tematyki
Wprowadzenie do psychologii religii

więcej podobnych podstron