Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 2 Miary tendencji centraln

background image

Miary tendencji
centralnej

Tendencja centralna to inaczej przeciętna

wartość wyników pomiarów. Wartość ta jest

zazwyczaj bliska punktowi największego

skupienia pomiarów i można ją uwazać za

najbardziej typową dla całego zbioru.

Powszechnie stosowane miary tendencji

centralnej to:

·     średnia arytmetyczna
·     mediana
·     modalna, dominanta

background image

Własności

średniej

arytmetycznej

(M)

Średnia arytmetyczna to suma zbioru pomiarów

podzielona

przez

liczbę

pomiarów

w

zbiorze.Oznacza się ją często przez M (od ang.

mean)

M = (p

1

+p

2

+....p

N

)/N= (p

i

)/N

Niektóre właściwości średniej:

      suma odchyleń wszystkich pomiarów od

średniej arytmetycznej jest równa zeru

suma kwadratów odchyleń od średniej

arytmetycznej jest mniejsza niż suma kwadratów

odchyleń od dowolnej innej wartości.

background image

Mediana (Me)

Mediana jest wartością dzielącą wszystkie pomiary na

pół, tak że połowa pomiarów mieści się poniżej niej, a

połowa powyżej. Medianę oblicza się najczęściej wtedy

gdy pojawiają się bardzo nietypowe wyniki, a nie ma

powodów aby je eliminować

Znajdowanie mediany dla nieparzystej liczby pomiarów

– jest to wynik środkowego pomiaru (wyznaczanie

mediany dla zarobków w tys. zł:

3, 2, 70, 1, 2; Me = 2 ; M = 15,6

Znajdowanie mediany dla parzystej liczby pomiarów –

jest to średni wynik dwóch środkowych osób

(dla zarobków 3, 2,70, 1; Me = 2,5 = (2+3)/2

Znajdowanie mediany dla przedziałów klasowych

background image

Skośność rozkładu a miary tendencji
centralnej

Dominanta (w literaturze częściej nazywana
modalną lub modą Md) jest wartością występującą
najczęściej w rozkładzie wyników.

Związki między wartościami średniej a mediany w
zależności od skośności rozkładu):

(a) dla rozkładu częstości (wyraźnie) skośnego

dodatnio - średnia jest większa niż mediana, zaś
mediana większa niż dominanta

(b) dla rozkładu częstości (wyraźnie) skośnego

ujemnie - średnia jest mniejsza niż mediana., zaś
mediana mniejsza niż dominanta

background image

Skośność a miary tendencji
centralnej

Średnia

3,67

Mediana

3,50

Dominanta

3

Skośność

,857

Dla rozkładu wyraźnie

skośnego dodatnio:

M> Me> Md

STU_CD

5,00

4,50

4,00

3,50

3,00

rozkład ocen studenta CD

rozkład skośny dodatnio

C

st

ć

3,5

3,0

2,5

2,0

1,5

1,0

,5

0,0

Odch.Std = ,82
Średnia = 3,67
N = 6,00

background image

Miary zmienności (rozproszenia)

wyników rozkładu

Oprócz znajomości tendencji centralnej dla danego

rozkładu wyników, podstawową własnością rozkładu jest

zmienność (rozproszenie) wyników.

Oceny Studenta A: 4, 4, 4

 

Oceny studenta B: 2, 4, 6

 
Zmienność różnych właściwości, jako podstawa badań

empirycznych.

 
Podstawowe miary zmienności:
rozstęp, wariancja, odchylenie standardowe.

background image

Miary zmienności

Rozstęp jest rozumiany jako różnica między

największym i najmniejszym pomiarem

Rozstęp dla studenta A =4-4= 0; dla studenta B = 6-2=4

Wariancja (variance) jest to suma kwadratów odchyleń

wszystkich wyników od średniej dzielona przez liczbę

wyników minus 1.

Wariancja = s

2

= (x

i

- M)

2

/(N-1)

Odchylenie standardowe (SD – standard deviation)

to pierwiastek z wariancji.
SD = (s

2

)

background image

Kolejne kroki obliczania wariancji i
odchylenia standardowego (

na przykładzie

ocen studenta B: 2, 4, 6 i A: 4, 4, 4) 

1.    Obliczyć średnią (M = 4).
2.    Obliczyć odchylenia od średniej (odjąć średnią od każdego

wyniku: -2, 0, 2).

3.    Obliczyć kwadraty odchyleń od średniej (4, 0, 4).
4.    Obliczyć sumę kwadratów odchyleń od średniej (4+0+4=8).
5.    Obliczyć średnią kwadratów odchyleń od średniej

(poprzednią sumę podzielić przez liczbę przypadków minus 1;

8/2 = 4).

Obliczyliśmy wariancję

s

2

= 4.

6.    Obliczamy odchylenie standardowe = pierwiastek z

wariancji

SD = 2.
Wariancja i odchylenie standardowe dla ocen studenta A = 0

(brak zmienności wyników)

background image

Wpływ dodawania wartości stałej na
miary tendencji centralnej i miary
rozproszenia

    Dodanie wartości stałej
do wszystkich wyników
zmienia średnią, medianę i
dominantę (modalną) o tę
wartość. Nie zmienia
wariancji i odchylenia
standardowego.

Np. aby zlikwidować liczby

ujemne dla zbioru danych:
2, 3, -3, -4, 2; dodano do
wszystkich wyników
wartość stałą 5, nowe
dane:

7, 8, 2, 1, 7

Statystyki

5

5

6

6

,00

5,00

2,00

7,00

2

7

3,24

3,24

10,50

10,50

7

7

Ważne
Braki danych

N

Średnia
Mediana
Dominanta
Odchylenie standardowe
Wariancja
Rozstęp

D1

D1_P_5

background image

Wpływ mnożenia przez wartość stałą na
miary tendencji centralnej i miary
rozproszenia

   Pomnożenie wszystkich wyników przez stałą zmienia

średnią, medianę i dominantę – są one iloczynem

poprzedniej wartości i stałej.

Zmienia również wariancję (poprzednia wartość razy

kwadrat stałej) oraz odchylenie standardowe (poprzednia

wartość razy wartość bezwzględna stałej).

Analogiczne zmiany zachodzą w przypadku dzielenia

wyników przez stałą.

Weżmy np. kilka czasów reakcji wyrażonych w

mikrosekundach (800; 1600; 1800; 600) i zamieńmy je na

sekundy (0,8; 1,6; 1,8; 0,6)

background image

Dzielenie wszystkich wyników przez stałą -
przykład

Statystyki

4

4

7

7

1200,00

1,2000

1200,00

1,2000

600

a

,60

a

588,78

,5888

346666,67

,3467

1200

1,20

Ważne
Braki danych

N

Średnia
Mediana
Dominanta
Odchylenie standardowe
Wariancja
Rozstęp

T1

T1_1000

Istnieje wiele wartości modalnych. Podano wartość najmniejszą.

a.

background image

Wyniki standardowe
(standaryzowane) – wartości “z”

Wyniki w takiej postaci, w jakiej zostały pierwotnie uzyskane w
badaniu, określa się mianem wyników surowych. Dla
porównania wyników osiąganych na różnych skalach (np.
porównania ocen przy różnych skalach oceniania, lub wyników
testów o różnej ilości punktów) przekształca się wyniki surowe
na wyniki wyrażone w jednostkach odchylenia standardowego –
są to wyniki standardowe (nazywane w SPSS
standaryzowanymi), czyli tzw. wartości „z”.

  z

i

= (x

i

– M)/SD

  M – średnia (mean)
SD – odchylenie standardowe (standard deviation)
wartość standaryzowana “z” danego wyniku “x” = wynik

surowy (x

i

) minus średnia (M) dzielone przez odchylenie

standardowe (SD)

background image

Hipotetyczne stopnie studenta SWPS w

sesji :

6, 2, 4+, 3+, 4

zamiana na wyniki standardowe

średnia M = 4;
wariancja s

2

= (4+4+0,25+0,25+0)/4 = 2,12

odchylenie standardowe SD = 1,46

wartości standaryzowane “z” poszczególnych wyników:
z

1

= (6 – 4)/1,46 = 1,37 (dodatnia wartość “z”)

z

2

= (2 - 4)/1,46 = -1,37 (ujemna wartość “z”)

z

3

= (4,5 - 4)/1,46 = 0,34 (lekko dodatnia wartość „z”)

z

4

= (3,5 - 4)/1,46 = -0,34 (lekko ujemna wartość „z”)

z

5

= (4 - 4)/1,46 = 0 (wynik równy średniej)

background image

Właściwości wyników standardowych
“z” dla danej próby wyników:

   średnia wyników „z” = 0; wariancja = 1
 
  wyniki „z” bliskie średniej M są bliskie

wartości “0”,

wyniki dokładnie równe średniej są równe

zeru.

  
  wyniki “z” mniejsze od średniej M są ujemne
   wyniki “z” większe od średniej M są dodatnie

background image

PYTANIE EGZAMINACYJNE
(termin A, 1999/2000)

Anna otrzymała ocenę 5 z egzaminu (średnia ocen w

jej grupie 3, wariancja ocen 4). Marek otrzymał
ocenę 3,5 z egzaminu (średnia ocen w jego grupie
2,5; odchylenie standardowe ocen 1,5). Który ze
studentów wypadł lepiej na tle swojej grupy?

A.

Anna i Marek jednakowo

B.

Marek

C.

Anna

D.

Nie da się tego określić

C


Document Outline


Wyszukiwarka

Podobne podstrony:
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 3 Wprowadzenie do procesu
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 5 Główne schematy eksperym
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 10 Test na rozpoznawanie
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 4 Statystyki opisowe i kor
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 14 Statystyka
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 7 Wnioskowanie statystyczn
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 6 Rozkład normalny i prawd
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 8 Testy T Studenta
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 5 Rozkład normalny i prawd
Metodologia z elelmentami statystyki dr Izabela Krejtz wyklad 2 Miary tendencji centralnej
MIARY TENDENCJI CENTRALNEJ MIARY POŁOŻENIA (punkt, przedz)
MIARY TENDENCJI CENTRALNEJ MIARY POŁOŻENIA (punkt, przedz)
dzienni 2006 wyklad 2, Sesja, Rok 2 sem 1, WYKŁAD - Metodologia ze statystyką - kurs podstawowy
Metodologia z elelmentami statystyki dr Grzegorz Sędek wykład 15c Rzetelność

więcej podobnych podstron