background image

Statystyka i planowanie 

eksperymentów

Janusz Donizak

Kraków, 2011

background image

Podręczniki i źródła

„Analiza danych”, S. Brandt, PWN, 1999

„Statystyka i data mining w badaniach 
statystycznych”

www.statsoft.pl

, 2004

„Statystyka dla fizyków”, Roman Nowak, PWN, 
2002

„Przystępny kurs statystyki”, A. Stanisz, Statsoft, 
2006

„Rachunek prawdopodobieństwa”, L. Kubik,  
PWN, 1973

background image

Statystyka

Statystyka  jest  polem  badań  w  dziedzinie  nauki  o 
gromadzeniu  i  analizie  ilościowych  danych  w  celu 
wyprowadzenia  z  nich  konkluzji  w  obliczu  ich 
niepewności.

Statystyka

Statystyka 

to 

nauka 

metodach 

badania 

prawidłowości 

występujących 

zjawiskach 

masowych.

A. Sokołowski, Kat. Statystyki AE

Niezależnie  od  tego,  jakie  jest  źródło  danych  (zaplanowany  i 
zrealizowany 

eksperyment, 

obserwacje 

zjawisk 

nie 

podlegających  badaniom  eksperymentalnym  –  zachowania 
społeczne,  ekonomia  etc.)  są  one  obarczone  pewnymi 
przypadkowymi  zakłóceniami.  Statystyka  jest  narzędziem 
matematycznym  pozwalającym  na  odróżnienie  tego  co  stałe  i 
niezmienne od tego co ulotne i przypadkowe. 

Statystyka

Statystyka  służy  więc  zatem  do  tego,  by  wydobyć 
prawdę  z  chaosu,  by  uchronić  nas  przed  skutkami 
niepewności  wynikającej  z  przypadkowości  wielu 
czynników  i  by  pomagać  nam  osiągać  pewność  i 
skuteczność w warunkach niepewności.

R. Tadeusiewicz

background image

STATYSTYKA

 Metody pozyskiwania danych ilościowych

 Metody wykorzystania danych ilościowych i ich 

prezentacji

 Metody indukcyjnego wnioskowania oparte o 

metody prawdopodobieństwa matematycznego 

background image

Pojęcia Podst. Statystyki

POPULACJA 

GENERALNA 

– 

zbiorowość 

elementach  będących  obiektami  materialnymi  lub 
zjawiskami. Każdemu z elementów zbiorowości można 
przypisać  pewne  cechy  (zmienne  statystyczne). 
Zbiorowość  może  być  skończona  lub  nieskończona. 
np. zbiorowość obywateli naszego kraju.
Elementy  populacji  mogą  się  różnić  określoną  cechą, 
wtedy 

mówimy 

rozkładzie 

danej 

cechy 

statystycznej (zmiennej statystycznej).
Próbką  statystyczną  nazywamy  podzbiór  danych 
wybranych  z populacji generalnej.
Wnioskowaniem statystycznym nazywamy decyzję, 
oszacowanie, 

przewidywanie 

lub 

uogólnienie 

dotyczące  populacji  generalnej  oparte  na  informacji 
zawartej w próbce statystycznej. 
Jest  to  główny  cel  badań  statystycznych.  Z  każdym 
wnioskowaniem  opartym  na  niepełnych  badaniach 
populacji 

wiąże 

się 

pojęcie 

wiarygodności 

wnioskowania.

background image

4 elementy wspólne 

każdemu zagadnieniu 

statystycznemu

 Populacja generalna i procedura pobrania 

próbki

 Próbka pobrana z populacji, analiza informacji 

zawartej w niej

 Wnioskowanie o populacji oparte na informacji 

zawartej w próbce

 Miara wiarygodności wnioskowania

background image

Statystyka opisowa

Jednym 

zadań 

realizowanych 

metodami 

statystycznymi  jest  prezentacja  rezultatów  badań 
empirycznych. 

Często 

opis 

statystyczny 

sprowadza 

się 

do 

wyznaczenia 

pewnych 

liczbowych 

parametrów 

określających  badany  zbiór  danych.  Taki  opis 
statystyczny 

jest 

często 

punktem 

wyjścia 

wnioskowania 

statystycznego 

na 

temat 

cech 

populacji generalnej.

Jeśli  zbiór  danych  obejmuje  całą  populację 
generalną, 

wnioskowanie 

statystyczne 

jest 

zbędne, pozostaje tylko odpowiednia prezentacja 
opracowanych rezultatów badań.

Forma  prezentacji  zebranych  danych  statystycznych 
zależy  zatem  od  sposobu  pobierania  próbki 
statystycznej i rodzaju zbieranych danych.

Empirycznym rozkładem

Empirycznym rozkładem cechy (zmiennej) 
statystycznej zwiemy przyporządkowanie określonym 
wartościom cechy częstości jej wystąpienia w 
badanej próbce.

background image

Prezentacja danych 

Częstością  bezwzględną  dla  określonej  kategorii 
nazywamy całkowita liczbę  n

i

 danych które mieszczą 

się w obrębie tej kategorii.

Częstością  względną  w

i

  będziemy  nazywać  częstość 

bezwzględną  kategorii  n

i

  odniesioną  do  całkowitej 

liczebności pobranej próbki n.

 w

i

 = n

i

 / n

Szeregiem rozdzielczym

Szeregiem rozdzielczym nazywamy uporządkowaną 
tabelę częstości:

Liczba braków

(kategoria)

Liczba partii 

produktu
(częstość 

bezwzględna)

Częstość partii 

produktu
(częstość 

względna)

0

5

0.25

1

8

0.40

2

4

0.20

3

3

0.15

20

1.00

background image

Histogramem

Histogramem nazywamy graficzną prezentację 
rozkładu częstości w kategoriach (bezwzględnych lub 
względnych).

Kategoria (liczba braków)

-1

0

1

2

3

4

Li

cz

ba

 o

bs

er

w

ac

ji

0

2

4

6

8

10

background image

Jeśli  zmienna  (cecha)  jest  zmienną  ciągłą  lub 
dyskretną  ale  przyjmująca  wiele  wartości  można 
tabele  rozdzielczą  oraz  histogram  rozkładu  zmiennej 
przygotować,  wydzieliwszy  wcześniej  odpowiednie 
przedziały  wartości  zmiennej  zwane 

przedziałami 

przedziałami 

klasowymi

klasowymi.

Przykład. Z dokładnością do 1 minuty zmierzono czas 
wykorzystany  przez  120  pracowników  wydziału 
poświęcony 

na 

posiłek 

regeneracyjny, 

wyniki 

przedstawiono w tabeli :

Czas poświęcony 

posiłkowi 

(kategoria )

Liczba prac.

(częstość 

bezw.)

Czas poświęcony 

posiłkowi 

(kategoria )

Liczba prac.

(częstość bezw.)

3

2

19

8

5

5

20

8

10

7

22

9

12

5

23

3

14

11

25

6

16

8

27

7

17

13

30

8

background image

Kategoria (czas w min)

0

5

10

15

20

25

30

35

40

Li

cz

ba

 p

ra

co

w

ni

w

0

2

4

6

8

10

12

14

Nie  wszystkie  możliwe  kategorie  posiadają  niezerowe 
częstości, 

histogram 

nie 

daje 

wystarczająco 

przejrzystego obrazu rozkładu.

W takiej sytuacji zaleca się wprowadzenie przedziałów 
klasowych,  których  liczba  powinna  spełniać  k  <  1+5 
log

10

  n  .  Dobrze  jest  dobrać  przedziały  o  tej  samej 

rozpiętości,  i  unikać  przedziałów  o  zbyt  nikłej 
(np.zerowej)  częstości.  Podział  musi  być  rozłączny  i 
obejmować cały zakres zmienności w próbce.

background image

2D Graph 3

0

5

10

15

20

25

30

35

0

5

10

15

20

25

Niewłaściwy podział na 

kategorie

 mimo k=10

0

5

10

15

20

25

30

35

0

5

10

15

20

25

30

35

Dobry podział na kategorie

 k=8

1+5 log

10

 

100=1+5*2=11 

background image

Prezentacja częstości względnych (w

i

 = n

i

 / n )

0-4

4-8

8-12

12-
16

16-
20

20-
24

24-
28

28-
32

background image

Dystrybuanta

Dystrybuanta empiryczną nazywamy funkcję 

określoną na podstawie częstości względnych

1

1

1

0 dla

dla

1 2

1

1 dla

( )

, ,...,

i

n

s

i

i

s

k

x x

F x

w

x

x x

i

k

x x

+

=

<

=

� <

=

-

Dystrybuanta jest funkcja niemalejącą i ograniczoną 
do <0,1>.

background image

Liczba 

braków

(kategoria)

Liczba partii 

produktu
(częstość 

bezwzględna)

Częstość partii 

produktu
(częstość 

względna)

Dystrybuanta 

empiryczna

0

5

0.25

0.25

1

8

0.40

0.65

2

4

0.20

0.85

3

3

0.15

1.00

20

1.00

0

3

1 2

1

0.5

Interpretacja: 

F(2)=0.85 określa iż 85% 
partii produktu miało co 
najwyżej dwa braki.


Document Outline