background image

PARAMETRY 
STATYSTYCZNE 

to wielkości liczbowe, które służą 

do opisu struktury zbiorowości 

statystycznej w sposób 
systematyczny  

background image

Zadania parametrów 
statystycznych 

Określenie przeciętnego rozmiaru i 

rozmieszczenia wartości zmiennej- za 

pośrednictwem miar położenia 

Określenie granic obszaru zmienności wartości 
zmiennej- 

za pośrednictwem miar zmienności 

Określenie skupienia i spłaszczenia (w stosunku 
do krzywej normalnej) oraz stopnia zmiany od 
idealnej asymetrii- 

za pośrednictwem miar 

asymetrii i koncentracji 
 

background image

MIARY POŁOŻENIA 

MIARY POZYCYJNE  

MIARY PRZECIĘTNE 

background image

MIARY POZYCYJNE 

modalna 

kwartyl pierwszy 

mediana (kwartyl drugi) 

kwartyl trzeci 

decyle  

background image

MIARY PRZECIĘTNE 

średnia arytmetyczna 

średnia harmoniczna 

średnia geometryczna 

modalna  

background image

Miary przeciętne 
 

charakteryzują średni lub typowy poziom 

wartości cechy, wokół których skupiają się 

wszystkie pozostałe wartości analizowanej 

cechy 

background image

Średnią arytmetyczną 

definiuje się jako sumę wartości cechy 
mierzalnej podzieloną przez liczbę 
jednostek skończonej zbiorowości 
statystycznej.   

background image

ŚREDNIA NIEWAŻNA STOSOWANA DLA 
SZEREGÓW SZCZEGÓŁOWYCH 

gdzie: 
 n
 - 

liczebność zbiorowości próbnej (próby),  

x

i

 - wariant cechy  

background image

Dwóch pracowników wykonuje detale tego samego typu. Przeprowadzono 
obserwację czasu wykonania pięciu detali przez robotnika A i dziesięciu detali 
przez robotnika B i otrzymano następujące szeregi szczegółowe opisujące czas 
wykonania detalu: 
dla robotnika A: 12, 15, 15, 18, 20 
dla robotnika B: 10, 10, 12, 12, 15, 15, 18, 20, 21, 21 

Korzystając z wzoru na obliczenie 
średniej : 
 

min

16

5

80

5

20

18

15

15

12

A

x

min

4

,

15

10

154

10

21

21

20

18

15

15

12

12

10

10

B

x

background image

W pewnym doświadczeniu medycznym 
bada się czas snu pacjentów leczonych 
na pewną chorobę. Zmierzono u n=12 
losowo wybranych pacjentów czas snu  
i otrzymano następujące wyniki  
(w minutach): 
435,389,533,324,561,395,416,500,499,397,
356,398. 
Należy obliczyć średni czas snu: 

 

 

 

background image

583

,

433

x

background image

ŚREDNIA ARYTMETYCZNA 
WAŻONA- 

wyznacza się w szeregach rozdzielczych 

punktowych i w szeregach rozdzielczych z przedziałami klasowymi 

SZEREG ROZDZIELCZY 
PUNKTOWY 

SZEREG ROZDDZIELCZY Z 
PRZEDZIAŁAMI KLASOWYMI 

background image

Przykład: W tabeli poniżej zestawiono wyniki badań czasu pracy 
wykonania 15 detali. Jest to szereg szczegółowy punktowy. Średnia 
arytmetyczną czasu wyznaczymy na podstawie wzoru: 

Numer 

klasy 

Czas w 

min 

Liczba 

detal

Obliczenia 

pomocnicze 

i 

x

i

 

n

i

 

x

i

*n

i

 

10 

20 

12 

36 

15 

60 

18 

36 

20 

40 

21 

42 

RAZEM 

15 

234 

 

min

6

,

15

234

*

15

1

x

background image

Ćwiczenie 

Dziesięć osób czekających przed 
gabinetami lekarskimi w przychodni 
zapytano, ile razy korzystały z porad 
lekarskich w ciągu ubiegłego roku 
kalendarzowego. Uzyskane informacje 
przedstawiono w postaci 
następującego szeregu rozdzielczego
  

background image

Oblicz ile razy w roku przeciętnie 
korzystały z porad lekarza 
badane osoby? 

Liczba 

porad 

Liczba 

osób 











Razem 

10 

background image

Oblicz średni czas reakcji na nowy lek:

 

Obliczenia pomocnicze 

i

X

i

i

n

X

Numer 

Klasy 

Przedział 
Klasowy 

Liczebność 

klasy 

n

i

 

1 

2 

3 

4 

5 







8-12 

13-17 
18-22 
23-27 
28-32 
33-37 
38-42 

29 
38 
80 
35 


ŁĄCZNIE 

200 

background image

24

200

4800

x

background image

Jeżeli znamy średnie arytmetyczne dla pewnych  
r-

grup i na tej podstawie chcemy wyznaczy średnią 

arytmetyczną dla wszystkich grup łącznie 
wykorzystujemy wówczas następujący wzór: 
 

i

r

i

i

n

x

N

x

1

1

background image

Korzystając z powyższego wzoru możemy obliczy średni 
czas wykonania detalu przez robotnika A i B. Obliczona w 
ten sposób średnia nazywa się średnią ważona, 
wyznaczona na podstawie  
średnich cząstkowych : 

min

6

,

15

15

4

,

15

x

10

16

x

5

x

B

A

x

;

background image

Średnią harmoniczną 

stosuje się wtedy, gdy wartości cechy są 
podane w przeliczeniu na stałą 
jednostkę  innej zmiennej, czyli w postaci 
wskaźników natężenia, np. prędkość 
pojazdu w km/h ; pracochłonność w 
min/szt. ; gęstość zaludnienia w osobach / 
km

.  

background image

WZORY 

SZEREG SZCZEGÓŁOWY 

SZEREG ROZDZIELCZY 

background image

Średnią geometryczną  

stosuje się w 
badaniach średniego 
tempa zmian zjawisk, 
a więc gdy zjawiska 
są ujmowane 
dynamicznie.  

n

n

G

x

x

x

x

*

...

*

*

2

1

background image

Przykład: 

Z danych o ludności pewnego miasta wynika, że 

w trzech kolejnych okresach liczba ludności 

wynosiła odpowiednio : 5000, 7500, 8250. 

Obliczmy średni przyrost względny ludności: 

Wartości cechy (współczynniki względne) w tym 

zadaniu będą następujące: 

      

 

Zgodnie z wzorem na obliczenie średniej 

geometrycznej średni przyrost ludności w trzech 

kolejnych latach wynosił: 

5

,

1

5000

7500

1

X

1

,

1

7500

8250

2

X

28

,

1

1

,

1

5

,

1

G

X

background image

Modalna Mo (dominanta D, 
moda, wartość najczęstsza) 

jest to wartość cechy statystycznej, która 
w danym rozdziale empirycznym 
występuje najczęściej  

background image

Dla 

szeregów szczegółowych oraz 

szeregów rozdzielczych punktowych 
modalna odpowiada wartości cechy o 
największej liczebności (częstości).  

szeregach rozdzielczych z przedziałami 

klasowymi 

bezpośrednio można określić 

tylko przedział, w którym modalna 
występuje, jej przybliżoną wartość 
wyznacza się graficznie z histogramu 
liczebności (częstości) 

background image

gdzie:  

m 

numer przedziału (klasy), w którym występuje modalna,  

 

X

0m

 

dolna granica przedziału, w którym występuje modalna,  

 

n

m

 - 

liczebność przedziału modalnej, tzn. klasy o numerze m

 

n

m-1

n

m+1

 - 

liczebność klas poprzedzającej i następnej, o numerach m – 1 i             

m + 1,  
 

h

m

 

rozpiętość przedziału klasowego, w którym występuje modalna  

background image

Określimy za pomocą modalnej przeciętną 
liczbę przyjmowanych w ciągu dnia przez 
pacjentów leków 

Liczba przyjmowanych leków  % pacjentów 






5 i więcej 


19 
21 
32 
17 

RAZEM 

100 

background image

Obliczyć modalną dla podanych w poniższej 
tabeli danych 
Leczeni pacjenci według czasu reakcji na 
podany lek 

Czas reakcji w minutach  Liczba osób 

8-12 
13-17 
18-22 
23-27 
28-32 
33-37 
38-42 

4 
29 
38 
80 
35 
9 
5 

RAZEM 

200 

background image

Kwantyle 

definiuje się jako wartości cechy badanej 
zbiorowości, przedstawionej w postaci 
szeregu statystycznego, które dzielą 
zbiorowość na określone części pod 
względem liczby jednostek, części te 
pozostają do siebie w określonych 
proporcjach.  

background image

KWARTYL DRUGI 

– MEDIANA Me  

dzieli zbiorowość na dwie równe części; 
połowa jednostek ma wartości cechy 
mniejsze lub równe medianie, a połowa 
wartości cechy równe lub większe od Me
stąd nazwa wartość środkowa 

background image

MEDIANA 

– SZEREG 

SZCZEGÓŁOWY 

background image

Przykład: 

wiek kobiet przyjętych w październiku 1999 na oddział 

ginekologiczny z przyczyn nagłych można przedstawić w 

postaci następującego szeregu statystycznego: 

18, 57, 34, 32, 29, 31, 19, 19, 27, 26, 26, 22, 23, 26,  

26, 34, 26,  

 

Teraz należy ten szereg uporządkować: 

18, 19, 19, 22, 23, 26, 26, 26, 26, 26,27, 29, 31, 32, 

34, 34, 57. 

 

Szereg ten składa się z 

17 

wartości zmiennych. Wartością 

środkową – medianą- w tym przypadku będzie wartość 
znajdująca się na pozycji 

9,

 czyli   

Me =26 

background image

Przykład: 

Weźmy pod uwagę tym razem wiek kobiet przyjętych w 

październiku 1999 roku na oddział położniczy w sposób 
zaplanowany. 

Po uporządkowaniu szereg opisujący wiek tych kobiet 
przedstawia się następująco: 

19,21,22,28,28,29 

Jak widać tym razem mamy przypadków, czyli ilość 

parzystą. Wartościami środkowymi będą wielkości z 
pozycji 3 i 4 , czyli 22 i 28

. Medianą zatem będzie 

średnia arytmetyczna z tych dwóch liczb, czyli 

25

background image

Wyznaczyć  medianę dla wzrostu 
podanego poniżej: 

 

  165, 166,167,170,172,173,175,175,181 

background image

Podejrzewano, że pewna choroba wiąże się z 
podwyższonym poziomem białych krwinek. 
W grupie pacjentów leczonych z powodu tej 
choroby zbadano liczbę białych krwinek        
w 1 mm3 krwi. Otrzymano następujące 
wyniki; 7400, 6400, 7800, 7500, 6900, 7300, 
8000, 15900, 6700, 16300. Należy wyznaczyć  
medianę dla tego szeregu 

background image

MEDIANA 

– SZEREG 

ROZDZIELCZY 

background image

GDZIE 

m - 

numer przedziału (klasy), w którym 

występuje mediana,  

X

0m

 

dolna granica przedziału, w którym 

występuje mediana  

n

m

 - 

liczebność przedziału mediany, tzn. 

klasy o numerze m,  

 

background image

   

 

suma liczebności przedziałów 

poprzedzających przedział mediany, czyli 
liczebność skumulowana,  

 

h

m

 

rozpiętość przedziału klasowego, w którym 

jest mediana,  
N

Me

 - pozycja mediany, czyli   

background image

Zastosowanie mediany 

W mikrobiologii do ustalenia przeciętnej liczby 
drobnoustrojów.  

W hematologii 

– do ustalania przeciętnej 

wartości erytrocytów lub leukocytów we krwi.  

Przy ustalaniu przeciętnej przeżywalności 
pooperacyjnej oraz dożywalności po leczeniu 
wielu nieuleczalnych dotychczas chorób (np. po 
operacjach nowotworów złośliwych).  

background image

Wyznaczyć medianę czasu reakcji na lek, 
korzystając z danych zawartych w tabeli 

Numer  
klasy 

Przedział  
klasowy 

Liczebność 
klasy 

Liczebność 
skumulowana 







8-12 
13-17 
18-22 
23-27 
28-32 
33-37 
38-42 


29 
38 
80 
35 


33 
71 
151 
186 
195 
200 

RAZEM 

200 

background image

KWARTYL PIERWSZY Q

dzieli zbiorowość na dwie części w ten 
sposób, że 25% jednostek zbiorowości ma 
wartości cechy niższe bądź równe 
kwartylowi pierwszemu Q

1, a 75% równe 

bądź wyższe od tego kwartyla  

background image

KWARTYL TRZECI Q

dzieli zbiorowość na dwie części w ten 
sposób, że 75% jednostek zbiorowości ma 
wartości cechy niższe bądź równe 
kwartylowi trzeciemu Q

3, a 25% równe 

bądź wyższe od tego kwartyla  

background image

DECYLE 

Np. decyl pierwszy oznacza, że 10% 
jednostek ma wartości cechy mniejsze 
bądź równe od decyla pierwszego, a 90% 
jednostek wartości cechy równe lub 
większe od decyla pierwszego  

background image

Miary zmienności 
(rozproszenia, 
dyspersji)  

MIARY KLASYCZNE 

MIARY POZYCYJNE 

background image

MIARY KLASYCZNE 

wariancja 

odchylenie standardowe 

odchylenie przeciętne 

współczynnik zmienności  

background image

MIARY POZYCYJNE 

rozstęp 

odchylenie ćwiartkowe 

współczynnik zmienności 

background image

Rozstęp  
 
różnica pomiędzy wartością maksymalną, a minimalną 
cechy - 

jest miarą charakteryzującą empiryczny obszar 

zmienności badanej cechy, nie daje on jednak informacji o 
zróżnicowaniu poszczególnych wartości cechy w 
zbiorowości .
 

background image

Wariancja  
 

jest to średnia arytmetyczna odchyleń kwadratów poszczególnych 

wartości cechy od średniej arytmetycznej  zbiorowości

  

Szereg szczegółowy  
 

Szereg rozdzielczy punktowy  

background image

Szereg rozdzielczy z przedziałami 
klasowymi  

 

 

background image

Odchylenie standardowe s 

jest to pierwiastek kwadratowy z wariancji. 
Stanowi miarę zróżnicowania o mianie 
zgodnym z mianem badanej cechy, 
określa przeciętne zróżnicowanie 
poszczególnych wartości cechy od 
średniej arytmetycznej.  

background image

Wzór  

2

s

s

background image

   

Odchylenie standardowe jest obok 
średniej arytmetycznej najczęściej 
stosowanym parametrem statystycznym 

Jest wielkością obliczoną na podstawie 
wszystkich obserwacji danego szeregu 

Im zbiorowość jest bardziej zróżnicowana, 
tym większa jest wariancja i oczywiście 
odchylenie standardowe 

background image

Z odchyleniem standardowym wiąże się tzw. Reguła trzech 

sigm, oparta na nierówności Czybyszewa, która mówi, ze 

wystąpienie obserwacji o wartości cechy poza przedziałem  

)

3

;

3

(

s

x

s

x

 

Odchylenie standardowe spełnia regułę trzech sigm w 
przypadku rozkładu normalnego lub zbliżonego do 
normalnego ponad 2/3 wszystkich zaobserwowanych wartości 
zmiennej (68,28%) różni się od średniej nie mniej niż o 
wartość odchylenia standardowego (+-s), 95,45% obserwacji 
różni się od średniej o dwa odchylenia standardowe, natomiast 
99,73% obserwacji mieści się w przedziale średnia +-3 
odchylenia standardowe 

Jest mało prawdopodobne 

background image
background image

Odchylenie standardowe 

 

 

Typowy obszar zmienności cechy 

 

 

Reguła trzech sigm 

2

s

s

s

x

x

s

x

typ

)

3

;

3

(

s

x

s

x

background image

Współczynnik zmienności 

jest ilorazem bezwzględnej miary 
zmienności cechy i średniej wartości tej 
cechy, jest wielkością niemianowaną, 
najczęściej podawaną w procentach. 

background image

Współczynnik zmienności stosuje 

się zwykle w porównaniach, gdy 

chcemy ocenić zróżnicowanie: 

 

Kilku zbiorowości pod względem tej samej 
cechy, 

Tej samej zbiorowości pod względem kilku 
różnych cech. 

background image

Klasyczny współczynniki 
zmienności 

x

s

V

background image

Województwa Polski scharakteryzowano przez dwie 

cechy: powierzchnię X i liczbę ludności Y. 

Należy obliczy dla powyższych cech współczynniki 

zmienności 

Wyznaczone dla 
cechy X parametry 
przedstawiają się 
następująco: 

Wyznaczone dla 
cechy Y parametry 
przedstawiają się 
następująco: 

 

24

,

2

;

28

,

6

s

x

590

;

784

s

y

background image

Obliczone współczynniki zmienności wskazują, że zarówno 
pod względem powierzchni jak i liczby ludności 
województwa są silnie zróżnicowane, przy czym różnią się 
one znacznie bardziej pod względem liczby mieszkańców  

%

7

,

35

100

28

,

6

24

,

2

X

V

Powierzchnia 

%

3

,

75

100

784

590

Y

V

Liczba ludności 

background image

Współczynnik zmienności charakteryzuje 
stosunek nasilenia przyczyn ubocznych 
do przyczyn głównych

  

Wartości liczbowe współczynników zmienności 
najczęściej są podawane w procentach. 
Przyjmuje się, że jeżeli współczynnik zmienności 
jest poniżej 10%, to cechy wykazują 
zróżnicowanie nieistotne statystycznie. Duże 
wartości tego współczynnika świadczą o 
zróżnicowania a więc niejednorodności 
zbiorowości. 

background image

MIARY ASYMETRII 

wskaźnik skośności 
współczynnik skośności  

background image

W wielu sytuacjach badanie średniego 
poziomu cechy i rozproszenia jej wartości 
nie wykazuje istnienia różnic między 
analizowanymi zbiorowościami. Obserwacja 
rozkładów empirycznych tych cech wyklucza 
natomiast podobieństwo struktury 
rozważanych zbiorowości. 

background image

W tabeli przedstawiono strukturę 
czasu reakcji na lek w trzech 
grupach 

CZAS REAKCJI 

Odsetek pacjentów 

GRUPA I 

GRUPA II 

GRUPA III 

10-20 

10 

10 

20-30 

20 

35 

25 

30-40 

40 

25 

25 

40-50 

20 

25 

35 

50-60 

10 

10 

RAZEM 

100 

100 

100 

średnia 

35 

35 

35 

odchylenie stand 

120 

120 

120 

mediana 

35 

34 

36 

modalna 

35 

27,5 

42,5 

background image

GRUPA I 

0

5

10

15

20

25

30

35

40

45

Grupa I

   

10    20      30     40      50      60 

 

 

 

background image

GRUPA II 

0

5

10

15

20

25

30

35

40

Grupa II

      

10    20      30      40      50      60 

 

 

background image

GRUPA III 

0

5

10

15

20

25

30

35

40

Grupa III

      

10    20      30      40      50      60 

 

 

 

background image

Rozkłady różnią się między sobą kierunkiem i 
siłą asymetrii (miary klasyczne): 

dla szeregów symetrycznych  

jeżeli    

 

asymetria prawostronna 

jeżeli    

 

asymetria lewostronna. 

Im większe są różnice pomiędzy średnią 
arytmetyczną a modalną, tym bardziej 
asymetryczny jest rozkład badanej cechy. 

background image

         

        

Skośność   dodatnia    (prawostronna)    

ma miejsce wówczas, gdy dłuższe ramię 
krzywej charakteryzującej       rozkład       
liczebności szeregu    znajduje    się   po   
prawej   stronie średniej. 

        

Jeżeli  dłuższe  ramię  krzywej 

znajduje się po  lewej  stronie  średniej,  
wówczas  można mówić  o  skośności  
ujemnej (lewostronnej). 

background image

        

Charakter     asymetrii     można     również 

określać         na        podstawie        punktów 
wyznaczonych   przez   dominantę,   medianę i   
średnią   arytmetyczną.  

        W  szeregu symetrycznym wszystkie miary 

pozycyjne są sobie równe. 

        W    szeregu    asymetrycznym    miary    te 

kształtują     się     na     różnym      poziomie:   im   
większa   skośność,    tym    większe    są różnice     
pomiędzy     dominantą,    medianą i   średnią   
arytmetyczną.    

background image

        

        

Jednym z mierników skośności jest 

wskaźnik skośności (inaczej: bezwzględna 
miara skośności): 

         

        

Wskaźnik    ten    jest    bezwzględną    

miarą asymetrii  posiadającą  miano  
badanej  cechy. Z    tego    względu     ma     
on     ograniczone zastosowanie     w     
analizie    porównawczej. Poza  tym, 
wskaźnik skośności określa jedynie kierunek  
asymetrii  (prawo-, czy lewostronna) nie  
wskazując  jej  siły.   

Mo

x

Ws

background image

W szeregach asymetrycznych wskaźnik 
asymetrii może być większy lub mniejszy 
od zera. Wówczas mówimy o asymetrii 
prawostronnej lub lewostronnej. I tak: 

 asymetria prawostronna 

 

 

- asymetria lewostronna 

 

Mo

Me

x

czyli

Mo

x

0

Mo

Me

x

czyli

Mo

x

0

background image

Współczynniki skośności (asymetrii) 

są stosowane w porównaniach, do określenia siły oraz 

kierunku asymetrii,

  

Wielkość różnicy pomiędzy średnią arytmetyczną a 
wartością modalną jest jednak zależna od wielkości 
jednostek statystycznych . Dla otrzymania miary 
asymetrii, uniezależnionej od wielkości obserwacji, a 
zależnej tylko od struktury zbiorowości statystycznej, 
różnicę pomiędzy średnią i modalną dzielimy przez 
odchylenie standardowe i w ten sposób otrzymujemy 
współczynnik asymetrii,  
 

background image

         

        

Miarą   określającą   zarówno   kierunek   

jak i  siłę  asymetrii  jest  współczynnik 
skośności: 

 

         

        

Współczynnik    ten    przyjmuje   

zazwyczaj    wartości  z  przedziału:        
<-1;1>.  Jedynie  przy  bardzo silnej 
asymetrii wartość współczynnika     może  
wykroczyć  poza  w/w  przedział.  

s

D

x

As

background image

Jeżeli dany rozkład jest symetryczny, 

wówczas              

W przypadku asymetrii prawostronnej: 

                                  

 

Dla rozkładu o asymetrii lewostronnej: 

                                  

         

0

As

0

As

0

As

Współczynniki asymetrii 

background image

Rozkłady symetryczne (mają oś symetrii a po obu 
jej stronach rozkład ilości jest taki sam); rozkłady 
symetryczne można podzielić na normalne, 
spłaszczone i wysmukłe 

n

i

 

x

i

 

n

i

 

x

i

 

n

i

 

x

i

 

 

 

 

r. normalny  

    r. wysmukły 

 

r. spłaszczony 

 

background image

Współczynnik koncentracji 

to wielkość statystyczna 
zwana inaczej 

kurtozą 

lub 

współczynnikiem 

skupienia. Jest to miara 
skupienia, którą możemy 
wyliczyć ze wzoru: 
 
 

4

4

s

m

K

background image

gdzie: 

 

a) dla szeregu 
punktowego  
 

 

b) dla szeregu 
rozdzielczego  

4

1

4

)

(

1

x

x

n

m

n

i

i

i

k

i

i

n

x

x

n

m

4

1

4

)

(

1

background image

Analiza zależności 

korelacyjnej 
pomiędzy cechami 

Współczynnik korelacji 

background image

Przy analizie zjawisk procesów stanowiących 
przedmiot badania zazwyczaj charakteryzujemy 

jednostki badane za pomocą więcej niż jednej 
cechy. 

Bardzo często interesują nas powiązania jakie 

zachodzą pomiędzy analizowanymi cechami i w 

związku z tym zachodzi potrzeba ich łącznego 
badania 

Celem takiej analizy jest stwierdzenie, czy 

między badanymi zmiennymi zachodzą jakieś 

zależności , jaka jest ich siła , jaka jest ich 

postać i kierunek 

background image

Typy zależności 

Zależność funkcyjna 

Zależność statystyczna 

background image

Związek funkcyjny 

Odznacza się tym, że każdej wartości jednej zmiennej 

niezależnej (będziemy ją oznaczać jako X) odpowiada 

tylko jedna, jednoznacznie określona wartość zmiennej 

zależnej (Y).  

Takie jednoznaczne związki funkcyjne obserwujemy w 

zaplanowanym eksperymentach czy urządzeniach 

technicznych. Np. wiemy, że objętość strzykawki jest 

jednoznacznie wyznaczona przez jej wymiary, że droga 

poruszającego się ciała zależy od prędkości według 

zależności funkcyjnej S=vt.  

W badaniach biomedycznych takiej jednoznacznej 

zależności funkcyjnej nie obserwujemy. 

background image

Związek statystyczny 

polega na tym, że określonym wartościom jednej 
zmiennej odpowiadają ściśle określone średnie 
wartości drugiej zmiennej. Można zatem 
obliczyć, jak się zmieni (średnio biorąc) wartość 
zmiennej zależnej Y w zależności od wartości 
zmiennej niezależnej X. Np. jak zmieni się 
średnio hematokryt –HTC w zależności od 
zmian hemoglobiny 

– HGB w krwince czerwonej. 

background image

Zanim przystąpimy do zbadania zależności 
należy uzasadnić logicznie istnienie związku 
pomiędzy badanymi cechami 

Liczbowe stwierdzenie występowania zależności 
nie zawsze oznacza występowanie związku 
przyczynowo-

skutkowego między badanymi 

zmiennymi.                                                    

Współwystępowanie dwóch zjawisk może również 

wynikać z bezpośredniego oddziaływania na nie 
jeszcze innego, trzeciego zjawiska. 

background image

ANALIZA KORELACJI 

jest matematycznym narzędziem 

pozwalającym na stwierdzenie 

powiązania, określenia jego siły i kierunku 

między dwiema zmiennymi X i Y. 

background image

Korelacja między 
zmiennymi 
Y 

jest miarą 

siły liniowego związku 
między tymi zmiennymi.

  

background image

Wykresy rozrzutu 

Analizę związku korelacyjnego między 
badanymi cechami rozpoczynamy zawsze 
od sporządzenia wykresu. Wykresy, które 
reprezentują obrazowo związek pomiędzy 
zmiennymi, nazywane są wykresami 
rozrzutu  

background image

Korelacyjne wykresy rozrzutu; 1 - korelacja liniowa dodatnia, 2 - korelacja 

liniowa ujemna, 3 - brak korelacji, 4 - korelacja krzywoliniowa 

background image

Miara zależności 
 

Powinna przyjmować największe wartości 
dla cech całkowicie zależnych 
(układających się na wykresie w linię 
prostą), 

Powinna odróżniać od siebie cechy o tym 
samym kierunku wzrostu od cech o 
kierunku przeciwnym 

Powinna być łatwa w interpretacji 

background image

Współczynnik korelacji to miara 
zależności liniowej o następujących 
własnościach: 

 

Przyjmuje wartości od -1 do + 1 

Jeżeli wartość współczynnika korelacji wynosi 1, to 

cechy są ściśle zależne a ich wartości równocześnie 

rosną lub maleją 

Jeżeli wartość współczynnika korelacji wynosi – 1, to 

cechy są ściśle zależne, a wzrostowi wartości jednej 

cechy odpowiada spadek wartości drugiej cechy 

Jeżeli wartość współczynnika korelacji wynosi 0 , to 

cechy są niezależne liniowo- to znaczy, że żadna 

funkcja liniowa nie opisuje jakiegokolwiek związku 
obu cech 

background image

Wzrostowi współczynnika korelacji od 0 do 1 

odpowiada wzrost zależności między cechami o 
zgodnej tendencji, natomiast spadkowi od 0 do – 1, 

odpowiada wzrost zależności między cechami o 
przeciwnej tendencji. 

Im większa wartość współczynnika, tym większa jest 

zależność liniowa między zmiennymi. r

xy

 = 0 oznacza 

brak korelacji, r

xy

 = 1 oznacza maksymalną korelację, 

natomiast r

xy

 = - 1 oznacza korelację ujemną, tzn.                                                                                 

    jeżeli zmienna x rośnie, to y maleje i na odwrót. 

Korelacja przyjmuje zawsze wartości w zakresie        
[ - 1,1], co pozwala uniezależnić analizę od dziedziny 
badanych zmiennych. 

 

background image

Interpretacja wartości współczynnika 
korelacji 
 

-1< ρ < - 0,7 – bardzo silna korelacja ujemna 

-0,7< ρ < - 0,5 – silna korelacja ujemna 

-0,5< ρ < - 0,3- korelacja ujemna o średnim natężeniu 

-0,3< ρ < - 0,2 – słaba korelacja ujemna 

-0,2< ρ <  0,2- korelacja nieistotna, nie ma związku 
 

 

 

      liniowego między cechami 

0,2 < ρ < 0,3 – słaba korelacja dodatnia 

0,3 < ρ < 0,5 – korelacja dodatnia o średnim 

natężeniu 

0,5 < ρ < 0,7 – silna korelacja dodatnia 

0,7 < ρ < 1 – bardzo silna korelacja dodatnia 

background image

Współczynnik korelacji Pearsona 

wyliczamy wówczas, gdy obie zmienne są 

mierzalne i mają rozkład zbliżony do 

normalnego, a zależność jest 

prostoliniowa (stąd nazwa). Przy 

interpretacji współczynnika korelacji 

liniowej Pearsona należy więc pamiętać, 

że wartość współczynnika bliska zeru nie 

zawsze oznacza brak zależności, a 

jedynie brak zależności liniowej.  

background image

Znak współczynnika korelacji informuje nas o 
kierunku korelacji, natomiast jego 

bezwzględna wartość - o sile związku. 

Oczywiście r

XY 

jest równe r

YX . 

 Jeśli r

XY

 = 0, 

oznacza to zupełny brak związku 

korelacyjnego między badanymi zmiennymi X 
Y . Im wartość bezwzględna współczynnika 

korelacji jest bliższa jedności, tym zależność 

korelacyjna między zmiennymi jest silniejsza. 
Gdy r

XY 

= |1|, to zależność korelacyjna 

przechodzi w zależność funkcyjną (funkcja 
liniowa). 

background image

Znak „+” przy wartości współczynnika oznacza, że 
wraz ze wzrostem wartości jednej zmiennej 
obserwujemy wzrost wartości drugiej zmiennej. Znak 
„-” przy wartości współczynnika oznacza, że wraz ze 
wzrostem jednej zmiennej obserwujemy spadek 
wartości drugiej zmiennej. 
 

Wartość współczynnika korelacji nie zależy od 
jednostek miary, w jakich wyrażamy badane 
zmienne, np. korelacja miedzy wzrostem a ciężarem 
będzie taka sama bez względu na to w jakich 
jednostkach wyrazimy badane wielkości. 
 

background image

Wielkość współczynnika korelacji zależy 
od zakresu zmienności badanych cech

  

0

5

10

15

20

25

30

35

40

45

50

0

2

4

6

8

Uwzględniając w 
badaniach tylko punkty 
zaznaczone w 
prostokącie moglibyśmy 
wnioskować o braku 
związku pomiędzy 
cechami. Zwiększenie 
liczby obserwacji sprawia, 
ze współczynnik korelacji 
może być znaczący. 

background image

Współczynnik korelacji, podobnie jak średnia 
arytmetyczna podlega wpływom wartości skrajnych-

 

odrzucenie zaznaczonych na wykresie obserwacji zwiększy 
wartość wyznaczanego współczynnika korelacji 

0

5

10

15

20

25

30

35

0

2

4

6

8

10