Dominanta to wartość cechy najczęściej występująca (najpopularniejsza, najmodniejsze ⇒ moda, wartość modalna, tryb)
Dane indywidualne
D( x) - przyjmuje wartość wariantu badanej cechy, który występuje najczęściej
Szereg rozdzielczy
D( x) - przyjmuje wartość wariantu badanej cechy, dla którego wartość ilościowy punktowy
n jest największa
i
Szereg rozdzielczy
( n
n
D −
D − 1 )
D( x) = x
h
OD +
ilościowy przedziałowy
D
(
n
n
n
n
D −
D
+ D −
− 1 )
(
D + 1 )
Oznaczenia:
D( x) - dominanta
xOD - początek przedziału dominującego
h = x
− x
D
1 D
0 D - długość przedziału dominującego, obliczana jako różnica między końcem a początkiem przedziału dominującego
nD - liczebność przedziału dominującego
nD 1
− - liczebność przedziału przed przedziałem dominującym nD 1
+ - liczebność przedziału następnego za przedziałem dominującym
WARUNKI WYZNACZENIA DOMINANTY
NA SZEREGU ROZDZIELCZYM PRZEDZIAŁOWYM
Dominantę, na podstawie szeregu rozdzielczego ilościowego przedziałowego można obliczyć, jeśli: o występuje dokładnie jeden ośrodek dominujący,
o przedział dominujący nie jest przedziałem skrajnym (ani ostatnim ani pierwszym), o przedział dominujący oraz przedziały sąsiednie (przedział wcześniejszy i przedział następny) muszą mieć taką samą długość
1
Na podstawie danych indywidualnych dotyczących długości pobytu w szpitalu pacjentów oddziału
……………………….., obliczyć i zinterpretować wartość dominanty.
Numer pacjenta
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Długość pobytu w
2
3
5
6
4
5
3
2
3
2
4
3
3
4
5
szpitalu (w dniach)
• 2 dni w szpitalu spędziło 3 pacjentów
•
D( x)
3 dni w szpitalu spędziło 5 pacjentów
!!!! (najwięcej pacjentów) !!!!!
= 3
• 4 dni w szpitalu spędziło 3 pacjentów
• 5 dni w szpitalu spędziło 3 pacjentów
• 6 dni w szpitalu spędził 1 pacjent
Interpretacja:
Najwięcej pacjentów (5 pacjentów) spędza 3 dni w szpitalu.
Zadanie 2.
Na podstawie poniższych danych (szereg rozdzielczy punktowy) dotyczących długości pobytu pacjentów w szpitalu, obliczyć i zinterpretować wartość dominantą.
Liczba dni pobytu
Liczba pacjentów
pacjentów szpitalu
xi
ni
1
3
2
8
max ni = 8
3
6
4
6
5
2
SUMA
25
max ni = 8
⇒
xi = 2
⇒
D( x) = 2
Interpretacja:
Najwięcej pacjentów spędza 2 dni w szpitalu.
2
Na podstawie poniższych danych (szereg rozdzielczy przedziałowy) dotyczących wzrostu pacjentów przebywających w szpitalu, obliczyć i zinterpretować wartość dominanty.
wzrost (w cm)
Liczba pacjentów
x − x
oi
i
1
n
n
i
D 1
−
<156 – 165>
4
x 0 D
< 166 – 175>
12
max n
n
i =
D = 12
x
<176 – 185>
7
1 D
<186 – 195>
2
nD 1
+
SUMA
25
( n
n
D −
D − 1 )
D( x) = x
h
OD +
D
(
h
x
x
D =
D −
D = 175 − 166 = 9
n
n
n
n
1
0
D −
D
+ D −
− 1 )
(
D + 1 )
D( x)
(12 − 4)
8
8
= 166 + 9⋅ (
=
+ ⋅
=
+ ⋅
=
12 − 4) + (12 − 7) 166 9
166 9
171 5
, 4
8 + 5
13
Interpretacja:
Najwięcej pacjentów ma wzrost wynoszący 171,54 cm
GRAFICZNE WYZNACZANIE DOMINANTY
Wzrost pacjentów przebywających na oddziale ....
14
12
10
8
Liczba pacjentów
6
4
2
D(X)
0
<156 - 165>
<166 - 175>
<176 - 185>
<186 - 195>
3
Mediana to wartość środkowa – wartość środkowego elementu – środkowej jednostki badania. Mediana rozdziela badaną zbiorowość na dwie liczebnie równe części. Oznacza, że połowa badanej zbiorowości ma wartości badanej cechy nie większe niż wartość mediany, a druga połowa badanej zbiorowości ma wartości badanej cechy nie mniejsze niż wartość dominanty.
Dane indywidualne
M ( x) - po uporządkowaniu wszystkich wartości od najmniejszej do n + 1
największej, mediana przyjmuje wartość jednostki numer 2
Szereg rozdzielczy
n + 1
M ( x) - mediana przyjmuje wartość jednostki numer
, odczytanej na
ilościowy punktowy
2
liczebnościach skumulowanych
Szereg rozdzielczy
+1
M ( x)
n
h
= x +
− F x
OM
( MO) M
ilościowy przedziałowy
2
n
M
Oznaczenia:
M ( x) - mediana
xOM - początek przedziału mediany
n + 1 - numer środkowej jednostki badanej
2
F ( xMO ) - liczebność wszystkich przedziałów klasowych przed przedziałem mediany h = x 1 − x
M
M
OM
- długość przedziału mediany, obliczana jako różnica między końcem a początkiem przedziału mediany
nM - - liczebność przedziału mediany
M(x)
0 %
50 %
100 %
4
n
Kwartyl pierwszy to wartość jednostki badania o numerze
. Wartość kwartyla pierwszego oznacza, że
4
25% badanej zbiorowości ma wartości badanej cechy nie większe niż wartość kwartyla pierwszego, a 75% badanej zbiorowości ma wartości badanej cechy nie mniejsze niż wartość kwartyla pierwszego.
Dane indywidualne
Q
- po uporządkowaniu wszystkich wartości od najmniejszej do 1 ( x )
n
największej, kwartyl pierwszy przyjmuje wartość jednostki numer
. Jeśli
4
n
numer
znajduje się między dwiema różnymi wartościami, to kwartyl 4
pierwszy przyjmie wartość wyższą.
Szereg rozdzielczy
n
Q
- kwartyl pierwszy przyjmuje wartość jednostki numer
. Jeśli
1 ( x )
ilościowy punktowy
4
n
numer
znajduje się między dwiema różnymi wartościami, to kwartyl 4
pierwszy przyjmie wartość wyższą.
Szereg rozdzielczy
n
hQ
Q x = x
+ − F x
1 (
) O 1 Q
( O 1 Q) 1
ilościowy przedziałowy
4
n
1
Q
Oznaczenia:
Q 1( x) - kwartyl pierwszy
xO
- początek przedziału z kwartylem pierwszym
1
Q
n
4
- numer jednostki wyznaczającej kwartyl pierwszy
F ( x
)
O
- liczebność wszystkich przedziałów przed przedziałem z kwartylem pierwszym 1
Q
h
= x − x
Q
1 Q
OQ - długość przedziału z kwartylem pierwszym, obliczana jako różnica 1
1
1
między końcem a początkiem przedziału z kwartylem pierwszym n
- liczebność przedziału z kwartylem pierwszym
1
Q
Q1(x)
M(x)
0 %
50 %
100 %
5
3 n
Kwartyl trzeci to wartość jednostki badania o numerze
. Wartość kwartyla oznacza, że 75% badanej
4
zbiorowości ma wartości badanej cechy nie większe niż wartość kwartyla, a 25% badanej zbiorowości ma wartości badanej cechy nie mniejsze niż wartość kwartyla.
Dane indywidualne
Q
- po uporządkowaniu wartości od najmniejszej do największej, kwartyl 3 ( x )
3 n
3 n
trzeci przyjmuje wartość jednostki numer
. Jeśli numer
znajduje się
4
4
między dwiema różnymi wartościami, to kwartyl trzeci przyjmie wartość wyższą.
Szereg rozdzielczy
3 n
Q
- kwartyl trzeci przyjmuje wartość jednostki numer
. Jeśli numer
3 ( x )
ilościowy punktowy
4
3 n znajduje się między dwiema różnymi wartościami, to kwartyl trzeci 4
przyjmie wartość wyższą.
Szereg rozdzielczy
Q ( x)
3 n
hQ
= x
+
− F x
3
O 3
Q
( O 3 Q) 3
ilościowy przedziałowy
4
n
3
Q
Oznaczenia:
Q 3 ( x) - kwartyl trzeci
xO - początek przedziału z kwartylem trzecim 3
Q
3 n
4
- numer jednostki wyznaczającej kwartyl trzeci
F ( x
)
O
- liczebność wszystkich przedziałów przed przedziałem z kwartylem trzecim 3
Q
h
= x − x
- długość przedziału z kwartylem trzecim, obliczana jako różnica 3
Q
1 Q 3
OQ 3
między końcem a początkiem przedziału z kwartylem trzecim n 3
Q - liczebność przedziału z kwartylem trzecim
Q1(x)
M(x)
Q3(x)
0 %
50 %
100 %
6
Na podstawie danych indywidualnych dotyczących długości pobytu pacjentów w szpitalu na oddziale
……………………….., obliczyć i zinterpretować wartość mediany, kwartyla pierwszego i kwartyla trzeciego.
Numer pacjenta
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Długość pobytu w
2
3
5
6
4
4
3
2
3
2
4
3
3
4
5
szpitalu (w dniach)
Żeby wyznaczyć wartość mediany, kwartyla pierwszego oraz kwartyla trzeciego, należy uporządkować wartości badanej cechy od najmniejszego do największej.
n + 1
15 + 1
16
• Mediana ma wartość obserwacji numer
=
=
= 8
2
2
2
n
15
• Kwartyl pierwszy ma wartość obserwacji numer =
= 75
,
3
4
4
3 n
3 ⋅15
• Kwartyl trzeci ma wartość obserwacji numer
=
= 1 ,
1 25
4
4
uporządkowane wartości cechy badanej (długość pobytu w szpitalu) 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4 , 4, 5, 5, 6,
Obserwacja numer 3,75
Obserwacja
Obserwacja numer 11,25
znajduje się między
numer 8 ma wartość 3,
znajduje się między
wartościami 2 i 3, więc
więc mediana przyjmuje
wartościami 4 i 4, więc
kwartyl pierwszy przyjmuje
wartość 3
kwartyl trzeci przyjmuje
wartość większą (wartość 3)
wartość 4
Q ( x) = 3
M ( x) = 3
Q x =
3 (
) 4
1
Interpretacje:
M ( x) = 3 Połowa badanych pacjentów przebywa w szpitalu nie dłużej niż 3 dni, a druga połowa nie krócej niż 3 dni.
Q ( x) = 3
1
25% badanych pacjentów przebywa w szpitalu nie dłużej niż 3 dni, a 75% badanych pacjentów nie krócej niż 3 dni.
Q ( x) = 4
3
75% badanych pacjentów przebywa w szpitalu nie dłużej niż 4 dni, a 25% badanych pacjentów nie krócej niż 4 dni.
7
Na podstawie poniższych danych (szereg rozdzielczy punktowy) dotyczących długości pobytu pacjentów w szpitalu, obliczyć wartość mediany, kwartyla pierwszego i kwartyla trzeciego.
Liczba dni pobytu
Liczba pacjentów
pacjentów szpitalu
xi
ni
1
3
2
8
3
6
4
6
5
2
SUMA
25
Żeby wyznaczyć wartość mediany, kwartyla pierwszego oraz kwartyla trzeciego, należy wyznaczyć liczebności skumulowane (sumowanie liczebności coraz większej liczby wariantów badanej cechy), n +
+
•
1
25 1
26
Mediana ma wartość obserwacji numer
=
=
= 13 odczytanej na liczebnościach
2
2
2
skumulowanych
•
n
25
Kwartyl pierwszy ma wartość obserwacji numer
=
= ,
6 25 odczytanej na liczebnościach
4
4
skumulowanych
•
3 n
3 ⋅ 25
Kwartyl trzeci ma wartość obserwacji numer
=
= 18 7
, 5 odczytanej na liczebnościach
4
4
skumulowanych
Liczba
Obserwacja numer 6,25 ma
dni
Liczba
Liczebności
wartość 2, więc kwartyl
pobytu
Numery pacjentów
pacjentów
skumulowane
pierwszy przyjmuje wartość 2
pacjentów
Q x =
1 ( )
2
szpitalu
xi
ni
nsk
1
3
3
(1, 2, 3)
Obserwacja
numer 13 ma wartość 3, więc
2
8
3+8=11
(4, 5, 6, 7, 8, 9, 10, 11)
mediana przyjmuje wartość 3
3
6
3+8+6=17
(12, 13, 14, 15, 16, 17)
4
6
3+8+6+6=23
(18, 19, 20, 21, 22, 23)
Obserwacja numer 18,75 ma
wartość 4, więc kwartyl trzeci
przyjmuje wartość 4
5
2
3+8+6+6+2=25
(24, 25)
Q ( x) = 4
3
SUMA
25
8
Zadanie 3.
Na podstawie poniższych danych (szereg rozdzielczy przedziałowy) dotyczących wzrostu pacjentów przebywających w szpitalu, obliczyć i zinterpretować wartość mediany, kwartyla pierwszego kwartyla trzeciego.
MEDIANA
F ( x
)
wzrost (w
Liczba
OM
Liczebności
Numery
cm)
pacjentów skumulowane
pacjentów
n + 1
25 + 1
x − x
oi
i
1
n
n
=
=
x
13
i
sk
0 M
2
2
<156 – 165>
4
4
(1, 2, 3, 4)
< 166 –175>
12
4+12=16
(5, 6, 7, 8, 9, 10,
x 1 M
11, 12, 13, 14, 15,
PRZEDZIAŁ
16)
MEDIANY
n
<176 – 185>
7
4+12+7=23
(17, 18, 19, 20, 21,
M
22, 23)
<186 – 195>
2
4+12+7+2=25
(24, 25)
SUMA
25
+1
M ( x)
n
h
= x +
− F x
OM
( ) M
OM
h
x
x
M =
M −
M = 175 − 166 =
2
n
9
1
)
M
M ( x) = 166 + (13 − 4) 9
3
⋅
= 166 + 9 ⋅ = 166 + ,
6 75 = 172,75
12
4
KWARTYL PIERWSZY
F ( x
)
wzrost (w
Liczba
O
Liczebności
1
Q
cm)
pacjentów skumulowane
Numery pacjentów
n
25
x − x
oi
i
1
n
n
=
= ,
6 25
x
i
sk
4
4
0
1
Q
<156 – 165>
4
4
(1, 2, 3, 4)
< 166 –175>
12
4+12=16
(5, 6, 7, 8, 9, 10, 11,
x
12, 13, 14, 15, 16)
1
PRZEDZIAŁ
1
Q
KWARTYLA 1
<176 – 185>
7
4+12+7=23
(17, 18, 19, 20, 21,
n
22, 23)
1
Q
<186 – 195>
2
4+12+7+2=25
(24, 25)
SUMA
25
n
hQ
Q x = x
+ − F x
1 (
) O
h
x
x
Q =
Q −
Q = 175 − 166 =
1
Q
( OQ ) 1
1
4
n
9
1
1 1
0 1
1
Q
9
− ⋅
=
+
⋅ =
+
=
1
( ,625 4) 9
3
166
,
2 25
166
,
1 69
167 6
, 9
12
4
KWARTYL TRZECI
F ( x
)
wzrost (w
Liczba
O
Liczebności
3
Q
Numery
cm)
pacjentów skumulowane
pacjentów
3 n
3 ⋅ 25
x − x
oi
i
1
n
n
=
= 1 ,
8 75
x
i
sk
4
4
1 Q
3
<156 – 165>
4
4
(1, 2, 3, 4)
<166 –175>
12
4+12=16
(5, 6, 7, 8, 9, 10,
11, 12, 13, 14, 15,
16)
<176 -185>
7
4+12+7=23
(17, 18, 19, 20,
21, 22, 23)
PRZEDZIAŁ
x
KWARTYLA 3
0 Q
3
<186 – 195>
2
4+12+7+2=25
(24, 25)
n
3
Q
SUMA
25
Q ( x)
3 n
hQ
= x
+
− F x
3
O
h
x
x
Q
= Q − Q =185 −176 =
3
Q
( OQ ) 3
3
4
n
9
3
1 3
0 3
3
Q
Q ( x) = 176 +
−
⋅ =
+
⋅ =
+
=
3
(1 ,875 16) 9
9
176
,
2 75
176
5
,
3 4
179 5
, 4
7
7
Q x =
M ( x) = 172 7
, 5
Q x =
3 ( )
179 5
, 4
1 (
) 167 6,9
Interpretacje:
Q x =
25% badanych pacjentów ma wzrost nie większy niż 167, 69 cm, a 75% badanych 1 ( )
16 ,
7 69
pacjentów ma wzrost nie mniejszy niż 167,69 cm.
M ( x) = 17 ,
2 75
Połowa badanych pacjentów ma wzrost nie większy niż 172,75 cm, a druga połowa badanych pacjentów ma wzrost nie mniejszy niż 172,75 cm.
Q x =
3 (
) 179 5,4 75% badanych pacjentów ma wzrost nie większy niż 179,54 cm, a 25% badanych pacjentów ma wzrost nie mniejszy niż 179,54 cm.
10