wyklad 5 oczyszczony[1]

background image

Metodologia ze statystyką:

kurs podstawowy

wykład 5

background image

Eksperyment jednozmiennowy z

powtarzaniem pomiarów na więcej niż

dwóch poziomach. Jednoczynnikowa

analiza wariancji dla prób zależnych.

Porównania planowane i porównania post

hoc.

Współczynniki korelacji. Związek miedzy

współczynnikiem korelacji a testem t-

Studenta. Interpretacja współczynnika

korelacji w kategoriach procentu wariancji

wspólnej. Badania korelacyjne a

korelacyjna analiza danych. Test chi-

kwadrat i wprowadzenie to testów

nieparametrycznych.

background image

Eksperyment jednozmiennowy

z powtarzaniem pomiarów na

więcej niż dwóch poziomach

Te same odmiany co w przypadku
dwóch poziomów

Te same mocne i słabe strony co w
przypadku dwóch poziomów

background image

PRZYPOMNIENIE

Eksperyment jednozmiennowy

z powtarzaniem pomiarów:

Odmiany

Poziom zmiennej niezależnej manipulowany

losowo wewnątrz osób (np ocena bodzców

znanych i nieznanych prezentowanych w losowej

kolejności)

Counterbalansing-zrównoważenie między

osobami (np dla jednej połowy badanych najpierw

frustracja a dla drugiej połowy najpierw brak

frustracje)

Matching czyli dobór parami (dla każdej osoby z

grupy eksperymentalnej pomiar jest

„powtórzony” na jak najbardziej podobnej do

niej osobie z grupy kontrolnej)

background image

PRZYPOMNIENIE

Mocne strony badań z

powtarzanymi pomiarami

Zmniejszenie lub wyeliminowanie
wariancji błędu spowodowanej
różnicami indywidualnymi.

W rezultacie wzrost mocy testu
statystycznego (zmniejszenie ryzyka
błędu drugiego rodzaju)

background image

PRZYPOMNIENIE

Słabe strony badań z powtarzanymi

pomiarami: kolejność losowa lub

counterbalansing

Trudna do zastosowania gdy efekt
manipulacji jest długotrwały

Zwiększone prawdopodobieństwo
odgadnięcia hipotezy

background image

PRZYPOMNIENIE

Słabe strony badań z powtarzanymi

pomiarami: Matching

Pracochłonna dla badacza

Arbitralność kryteriów doboru par

background image

Eksperyment jednozmiennowy

z powtarzaniem pomiarów na

więcej niż dwóch poziomach:

Analiza

Jednoczynnikowa analiza
wariancji dla prób zależnych

background image

Analiza wariancji z powtarzanymi

pomiarami: dwie odmiany

Multivariate solution (Testy

wielu zmiennych)

Univariate solution (Testy

efektów

wewnątrzobiektowych)

W przypadku gdy zmienna

ma tylko dwa poziomy wyniki

takie same

background image

Porównania planowane

Z góry ustalone

Często używa sie testu t

Zwykle stosuje sie je po stwierdzeniu
istotnego F

Alternatywa dla analizy wariancji?

background image

Porównania post hoc

Wszystko ze wszystkim

Zwykle stosuje sie je po stwierdzeniu
istotnego F

Alternatywa dla analizy wariancji?

background image

Porównania post hoc

Istnieje wiele testów post hoc. Najczęściej
używane to test LSD, test Tukey’a, test
Scheffe, test Bonferroniego i test Duncana.

Test Duncana jest szczególnie liberalny i
może prowadzić do błędu 1 rodzaju.

Test LSD jest także bardzo liberalny ale
stosuje sie go zwykle jedynie w przypadku
3 grup.

Test Scheffe jest szczególnie
konserwatywny.

background image

Test t a test F

W przypadku dwóch grup

F=t

2

background image

Wyniki standardowe

(standaryzowane) – wartości “z”

  z

i

= (x

i

– M)/SD

  M – średnia (mean)
SD – odchylenie standardowe

(standard deviation)

wartość standaryzowana (“z”)

danego wyniku “x” = wynik surowy
(x

i

) minus średnia (M) dzielone przez

odchylenie standardowe (SD)

background image

Procenty wyników pod krzywą

normalną (M=0; SD=1)

background image

Właściwości wyników standardowych

“z”

   średnia wyników „z” = 0; wariancja = 1
 
  wyniki surowe bliskie średniej M dają

wyniki „z” bliskie wartości “0”,

wyniki dokładnie równe średniej są

równe zeru.

     wyniki surowe mniejsze od średniej M

dają ujemne wartości „z „

   wyniki surowe większe od średniej M

daja dodatnie wartości „z”

background image

Standardyzacja umożliwia porównania na tle

grupy

Anna i Marek zdawali egzamin z

Metodologii ze Statystyką u różnych
profesorów. Anna otrzymała ocenę 5
z egzaminu (średnia ocen w jej
grupie 4,5; odchylenie standardowe
ocen 2). Marek otrzymał ocenę 3,5 z
egzaminu (średnia ocen w jego
grupie 2,5; odchylenie standardowe
ocen 1). Który ze studentów wypadł
lepiej na tle swojej grupy?

background image

Standardyzacja umożliwia porównania na tle

grupy

Ania: x=5,0 (M= 4,5; S=2);
z=(5,0-4,5) /2 = 0,25
Marek x= 3,5 (M= 2,5; S=1);
z=(3,5-2,5)/1 = 1,00

background image

Standardyzacja umożliwia porównania na tle

grupy

Tomek: x=3,0 (M= 4,0; S=1,0);
z=(3,0-4,0) /1 = -1,0
Krysia: x= 3,5 (M= 4,5; S=2);
z=(3,5-4,5)/2 = -0,50

background image

Korelacja

miara statystyczna określająca

siłę związku między zmiennymi,

mieszcząca się w graniach (-1, 1)

background image

Korelacja dodatnia

wzrostowi jednej zmiennej np.

stopnie towarzyszy wzrost
innej

zmiennej

np.

samoocena

background image

Korelacja ujemna

wzrostowi jednej zmiennej

np.

stopnie

towarzyszy

spadek innej zmiennej np.
nadużywanie alkoholu

background image

Brak korelacji

Zmienne

sa

ze

soba

niepowiązane np. stopnie a
numer buta,

współczynnik korelacji jest

bliski zera (nieistotny)

background image

Związek krzywoliniowy

Np. związek między pobudzeniem a
poziomem wykonania zadania: w
miarę wzrostu pobudzenia wykonanie
jest coraz lepsze, osiąga maksimum
po czy zaczyna się pogarszać

Współczynnik korelacji (liniowej)
będzie bliski zera (nieistotny)

background image

Obliczanie współczynnika

korelacji r Pearsona

r = ZX ZY / N

r - współczynnik korelacji Pearsona

ZX - wartość z dla każdego
przypadku dla zmiennej x

ZY - wartość z dla każdego
przypadku dla zmiennej y

N - liczba przypadków (liczba par
obserwacji)

background image

Istotność statystyczna

współczynnika korelacji

Ten sam współczynnik korelacji może
być lub nie być statystycznie istotny
w zależności od wielkości próby (od
ilości par obserwacji)

Im większa próba tym bardziej
istotny dany współczynnik korelacji

Poziom istotności odczytujemy z
tabeli w podręczniku statystyki lub z
wydruku SPSS

background image

Korelacja a rodzaj skali

pomiarowej

r Pearsona zakłada pomiar obu

zmiennych na skali przedziałowej

Gdy jedna zmienna jest na skali

nominalnej i jest dychotomiczna

(płeć) wyniki takie same jak przy

teście t

współczynnik korelacji rang

Spermana zakłada pomiar na skali

porządkowej

Chi kwadrat zakłada pomiar obu

zmiennych na skali nominalnej

background image

Korelacja a trafność

wewnętrzna

badanie korelacyjne vs.
eksperyment

analiza korelacyjna vs.
porownanie grup

background image

Współczynnik determinacji

r

2

proporcja zmienności jednej zmiennej

dająca się przewidzieć na podstawie
informacji o poziomie drugiej
zmiennej

r

2

x 100 = procent wariancji

wspólnej

background image

IQ a średnia ocen

Współczynnik korelacji między
ocenami a ilorazem inteligencji
r=0,50. W jakiej mierze da sie
przewidzieć średnią ocen na
podstawie IQ (lub odwrotnie)

r

2=

0,50

2

=0,25

25% wspólnej wariancji

background image

Badanie zależności między

dwiema zmiennymi

mierzonymi na skali

nominalnej: test Chi-kwadrat

background image

Czy istnieje zależność między

płcią a wyborem miejsca w

klasie

Tabela krzyżowa PLEC * MIEJSCE

26

20

46

12

35

47

38

55

93

Liczebność
Liczebność
Liczebność

kobieta
mezczyzna

PLEC

Ogółem

przod

tyl

MIEJSCE

Ogółem

Aby sprawdzić czy uzyskany patern
wyników nie powstał przez przypadek (czy
jest statystycznie istotny) stosujemy test
Chi-kwadrat

background image

Informacje konieczne do

obliczenia wartości Chi-

kwadrat

fo - liczebności
zaobserwowane (dla każdej
kratki tabeli)

background image

Liczebności zaobserwowane a

liczebności oczekiwane

fo - liczebności

zaobserwowane: ile obserwacji

(ile osób) znalazło się w każdej z

czterech kratek tabeli

fe - liczebności oczekiwane: ile

obserwacji (ile osób) powinno się

było znaleźć w każdej z czterech

kratek tabeli gdyby zmienne płeć

i wybór miejsca były od siebie

niezależne

background image

Obliczanie liczebności

oczekiwanych f

e

Liczebność wiersza / Całkowita
liczebność x Liczebność kolumny

Np. Oczekiwana liczebność kobiet
siedzących z przodu to

ilość kobiet / ilość studentów x ilość
studentów siedzących z przodu

background image

Liczebności zaobserwowane i

liczebności oczekiwane

Tabela krzyżowa PLEC * MIEJSCE

26

20

46

18,8

27,2

46,0

12

35

47

19,2

27,8

47,0

38

55

93

38,0

55,0

93,0

Liczebność
Liczebność
oczekiwana
Liczebność
Liczebność
oczekiwana
Liczebność
Liczebność
oczekiwana

kobieta

mezczyzna

PLEC

Ogółem

przod

tyl

MIEJSCE

Ogółem

background image

Płeć a wybór miejsca w klasie: Wyniki

obliczeń

Te s ty Chi-kw a dra t

9,239

b

1

,002

8,001

1

,005

9,414

1

,002

,003

,002

9,140

1

,003

93

Ch i-kwad rat
Pearsona
Poprawka na
ciąg łoś ć

a

Iloraz wiaryg od noś ci
Dokład ny tes t
Fis hera
Test związku
liniowego
N Ważn ych
obserwacji

Wartoś ć

d f

Istotn ość

asymp totycz

n a

(d wus tronn

a)

Istotnoś ć

d okładna

(dwu stron n

a)

Is totność

dokład na

(jed nostr

on na)

Ob liczone wyłączn ie d la tabeli 2x2.

a.

,0% komórek (0) ma liczebn oś ć oczekiwaną mn iejs zą niż 5. Min imaln a liczeb noś ć
oczekiwan a wyn osi 18,80.

b.

Sprawdzić czy ilość ważnych obserwacji jest co najmniej

20, jeśli tak można użyć testu Chi-kwadrat

Gdyby ilość obserwacji była niższa niż 20, należałoby

użyć dokładnego testu Fishera

Uwaga: Podejście tradycyjne zezwala na użycie test

Chi-kwadrat jedynie gdy żadna z liczebności

oczekiwanych nie jest niższa niż 5, nawet gdy całkowita

ilość ważnych obserwacji jest wyższa niż 20

background image

Ważne elementy poprzedniej

tabeli

Testy Chi-kwadrat

9,239

1

,002

93

Chi-kwadrat
Pearsona
N Ważnych
obserwacji

Wartość

df

Istotność

asymptotyczna

(dwustronna)

Odczytać poziom istotności dla testu Chi-

kwadrat

Jeśli istotność niższa niż 0,05 to znaczy, że
zależność między płcią studenta w
wyborem miejsca w klasie jest istotna
(mało prawdopodobne by pojawiła się
przez przypadek)

background image

Informacje konieczne do

obliczenia wartości Chi-

kwadrat

fo - liczebności
zaobserwowane (dla każdej
kratki tabeli)

background image

Liczebności zaobserwowane a

liczebności oczekiwane

fo - liczebności

zaobserwowane: ile obserwacji

(ile osób) znalazło się w każdej z

czterech kratek tabeli

fe - liczebności oczekiwane: ile

obserwacji (ile osób) powinno się

było znaleźć w każdej z czterech

kratek tabeli gdyby zmienne płeć

i wybór miejsca były od siebie

niezależne

background image

Obliczanie liczebności

oczekiwanych f

e

Liczebność wiersza / Całkowita
liczebność x Liczebność kolumny

Np. Oczekiwana liczebność kobiet
siedzących z przodu to

ilość kobiet / ilość studentów x ilość
studentów siedzących z przodu

background image

Czy jest istotny związek w

populacji?

Obliczanie Chi-kwadrat

2 - wartość statystyki Chi-kwadrat

fo - liczebność zaobserwowana

fe - liczebność oczekiwana

2 może się wahać od 0 do

nieskończoności

Poziom istotności odczytać można z tabeli

istotności lub z wydruku SPSS

2

=  (f

o

– f

e

)

2

/ f

e

background image

Obliczanie Chi - kwadrat:

Sekret dla leniwych

Dla tabel 2 x 2 kwadraty różnicy

(fo – fe)

2

są takie same w każdej

kratce tabeli

2

=  (f

o

– f

e

)

2

/ f

e

background image

Stopnie swobody dla testu Chi-

kwadrat

Przy odczytywaniu z tabeli

istotności potrzebna informacja o

ilości stopni swobody (df)

Df to iloczyn ilości wierszy – 1

oraz ilości kolumn – 1 w tabeli

danych dla których obliczono

Chi-kwadrat

W naszym przypadku df = (2-1) x

(2-1) = 1

background image

Jak silny jest związek?

Obliczanie współczynnika

korelacji Phi dla tabeli 2x2

 - wartość statystyki Phi

2

- wartość statystyki Chi-

kwadrat

N - liczebność próby

 może się wahać od 0 do 1

 = (

2

/N)

background image

Płeć a wybór miejsca w klasie:

Współczynnik siły związku Phi

Miary symetryczne

,315

,002

,315

,002

93

Phi
V Kramera

Nominalna przez
Nominalna

N Ważnych obserwacji

Wartość

Istotność

przybliżona

Współczynnik Phi interpretować można podobnie
jak r Pearsona i obliczyć współczynnik
determinacji

0,315

2

=0,09

Wybór miejsca w klasie związany jest z płcią w
sposób istotny ale bardzo nieznaczny

background image

Czy mnie jeszcze pamiętasz?

Demonstracja „Związek miedzy
wynikiem rozmowy kwalifikacyjnej z
kandydatem do pracy a późniejszą
jakością pracy”

Czy obliczenia statystyczne da się
zastąpić statystyczną intuicją?

background image

Pytanie:

Czy ogólne wrażenie z rozmowy
wstępnej z kandydatem do pracy
pomaga przewidzieć późniejszą
jakość pracy kandydata?

background image

Kandydat 1

Wynik rozmowy

wstępnej

Jakość pracy

Pozytywny (+)

Wysoka (+)

background image

Czy dane 20 kandydatów wskazują, że

warto używać wyników rozmowy

kwalifikacyjnej przy przyjmowaniu do

pracy?

Jak silny związek?

0,0 – zupełny brak

związku

0,2 - słaby związek

0,5 – średni związek

0,8 – silny związek

1,0 – pełny związek

background image

Jak silny związek?

Pozytywny wynik

rozmowy:

N=16

Prawd. że będą dobrze

pracować 12:16=0,75

Negatywny wynik

rozmowy:

N=4

Prawd. że będą dobrze

pracować 3:4=0,75

Wniosek:

Brak związku!

(Korelacja

pozorna)

Rozmowa

+

Rozmowa

-

Praca

+

12

3

Praca

-

4

1

background image

Korelacja pozorna

Spostrzeganie związku miedzy
zmiennymi gdy w rzeczywistości
żaden związek nie zachodzi

Występuje szczególnie gdy w obrębie
każdej ze zmiennych jedna z
kategorii jest szczególnie liczna

Zapobieganie korelacjom pozornym:
obliczyć wskaźnik siły związku
(korelacji)

background image

Tabela krzyżowa PRACA * ROZMOWA

1

4

5

1,0

4,0

5,0

3

12

15

3,0

12,0

15,0

4

16

20

4,0

16,0

20,0

Liczebność
Liczebność
oczekiwana
Liczebność
Liczebność
oczekiwana
Liczebność
Liczebność
oczekiwana

,00

1,00

PRACA

Ogółem

,00

1,00

ROZMOWA

Ogółem

background image

Testy Chi-kwadrat

,000

b

1

1,000

,000

1

1,000

,000

1

1,000

1,000

,751

,000

1

1,000

20

Chi-kwadrat
Pearsona
Poprawka na
ciągłość

a

Iloraz wiarygodności
Dokładny test
Fishera
Test związku
liniowego
N Ważnych
obserwacji

Wartość

df

Istotność

asymptotyczn

a

(dwustronna)

Istotność

dokładna

(dwustronna)

Istotność

dokładna

(jednostronn

a)

Obliczone wyłącznie dla tabeli 2x2.

a.

75,0% komórek (3) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność
oczekiwana wynosi 1,00.

b.

background image

Dokładny test Fishera

Bardziej konserwatywny niż test Chi –
kwadrat (może zwiększać
prawdopodobieństwo błędu drugiego
rodzaju)

Bardziej pracochłonne obliczenia

Powinien być używany zamiast testu Chi-
kwadrat gdy....

podejście tradycyjne: co najmniej jedna z
liczebności oczekiwanych jest niższa niż 5

podejście nowsze: całkowita liczebność jest
niższa niż 20

background image

Testy Chi-kwadrat

,000

b

1

1,000

1,000

,751

20

Chi-kwadrat
Pearsona
Dokładny test
Fishera
N Ważnych
obserwacji

Wartość

df

Istotność

asymptotyczn

a

(dwustronna)

Istotność

dokładna

(dwustronna)

Istotność

dokładna

(jednostronn

a)

75,0% komórek (3) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność
oczekiwana wynosi 1,00.

b.

background image

Nietypowe zastosowania testu

Chi - kwadrat

Może być używany zamiast testu Studenta dla

prób niezależnych (np. dzielimy badanych na 4

grupy w zależności od manipulacji

eksperymentalnej i od uzyskania w zmiennej

zależnej wyniku powyżej lub poniżej mediany)

Może być używany zamiast współczynnika

korelacji Pearsona (np. dzielimy badanych na 4

grupy w zależności od uzyskania wyników

powyżej lub poniżej mediany w każdej z dwóch

mierzonych zmiennych)

Zaletą takich zastosowań jest prostota, wadą jest

mniejsza moc testu (większe

prawdopodobieństwo błędu drugiego rodzaju)

background image

Chi - kwadrat:

Informacje dodatkowe

Jest tzw. testem nieparametrycznym,
nie opiera się na założeniu o
normalności rozkładu

Może być używany do tabel
większych niż 2 x 2 (więcej niż dwa
poziomy zmiennej lub / i więcej niż
dwie zmienne)

Dane w poszczególnych kratkach
tabeli muszą być od siebie
niezależne!

background image

Niektóre inne testy

nieparametryczne

Test U Manna-Whitney’a – podobny do
testu t Studenta dla prób niezależnych ale
zmienna zależna ma postać rang

Test Wilcoxona oraz test znaków - podobne
do testu t Studenta dla prób zależnych ale
zmienna zależna ma postać rang

Współczynnik korelacji rang Spearmana –
podobny do współczynnika korelacji
Pearsona ale obie zmienne mają postać
rang

background image

W przeciwieństwie do testu Chi – kwadrat,
inne testy nieparametryczne są obecnie
stosunkowo rzadko używane

Testy nieparametryczne są z reguły
prostsze w użyciu

Mają zwykle niższą moc niż odpowiednie
testy parametryczne

Gdy odstępstwa od założeń testów
parametrycznych są bardzo znaczne,
testy nieparametryczne mogą mieć
wyższą moc niż odpowiednie testy
parametryczne


Document Outline


Wyszukiwarka

Podobne podstrony:
Wyklady z oczyszczalni, Studia Inżynieria Środowiska, Oczyszczanie ścieków
PYTANIA Z WYKŁADU OCZYSZCZANIE WODY
opracowanie - scieki, PWr, IS, Oczszczanie ścieków, Wykład oczyszczanie ścieków
Wykład 4 Oczyszczanie enzymów
wykład 5 oczyszczanie gazów
wykład 8 Oczyszczanie ścieków,ETAP 2 złoża biologiczne
Rewelacyjne opracowanie wszystkich zagadnień, PWr, IS, Oczszczanie ścieków, Wykład oczyszczanie ście
wyklad 1 oczyszczony[1]
wyklad 6 oczyszczony[1]
hydraulika reaktorów, Inżynieria Środowiska, Przydomowe oczyszczalnie ścieków, projekt, Przydomowe o
pytania oczyszczanie wody egz (3), Politechnika Wrocławska, Ochrona Środowiska W7, Semestr V, SOW- w
rząd reakcji, Inżynieria Środowiska, Przydomowe oczyszczalnie ścieków, projekt, Przydomowe oczyszcza
pytania (1), Techniki oczyszczania spalin, Mazur wykład
Wykład 15 Oczyszczanie Adsorbcja
Pytania na egzamin z Oczyszczania Wody, wykład(2)
Nadchodzące oczyszczenie-d.wilkerson, wykłady-kazania, Kazania Dawida Wilkersona

więcej podobnych podstron