analizaDyskryminacyjna id 61950 Nieznany (2)

background image

Analiza Dyskryminacyjna

wprowadzenie

background image

Idea

Wykorzystywana do przewidywania

przynależności do kategorii/grup na

podstawie jednego bądź więcej

predyktorów

Predyktor: zmienna ciągła

Zmienna zależna: kategorialna

Odwrotność analizy wariancji

background image

Analiza wariancji

Interesujemy się tym, czy grupy różnią się

od siebie istotnie pod względem

zmiennej zależnej (ANOVA)

liniowo powiązanych ze sobą zmiennych

zależnych (MANOVA)

Jeśli jest to prawdą to w drugą stronę też

można przewidywać:

Te same zmienne zależne można

wykorzystać do przewidywania

przynależności do poszczególnych grup

background image

Co nas nurtuje?

Jaki jest najlepszy predyktor
zaklasyfikowania osoby do danej
grupy.

Jak jest najlepsza kombinacja
predyktorów pozwalająca przewidzieć
znalezienie się uczestnika badania w
danej grupie?

background image

Co nas nurtuje?

Pedagogów może zastanawiać, jakie czynniki
sprawiają, że niektórzy studenci psychologii
decydują się kontynuować naukę na studiach
doktoranckich, inni znajdują pracę w biznesie, a inni
znajdują pracę w terapii.

Badając szereg zmiennych przed ukończeniem
studiów możemy dzięki analizie dyskryminacyjnej
odpowiedzieć na pytanie, która z tych zmiennych
lub jaka kombinacja predyktorów najlepiej
przewiduje wybór drogi życiowej po studiach.

background image

Co się kryje za grupami?

Z matematycznego punktu widzenia analiza wariancji i

analiza dyskryminacyjna są podobne, ale na co innego kładą

nacisk

Jeżeli grupy różnią się istotnie statystycznie pod względem

jakiejś zmiennej to oznacza, że zmienna to dobrze rozdziela

(discriminate) badanych.

w AD skupiamy się na pokategoryzowaniu ludzi do grup i

sprawdzamy jak dobrze/źle udało się nam dokonać

klasyfikacji

interesujemy się tym,

jak można rozróżnić grupy

między sobą

– Jacy ludzie trafiają do jednej a jacy do drugiej

kategorii

a nie czy te różnice są istotne statystycznie

background image

Co się kryje za grupami?

Mierzymy samoocenę w grupie 20 mężczyzn i 20 kobiet.

Mężczyźni posiadają zazwyczaj wyższą samoocenę niż
kobiety, więc uzyskamy istotną statystycznie różnicę między
średnimi w poprównywanych grupach.

Oznacza to, że z prawdopodobieństwem większym niż
przypadkowe możemy wnioskować, że osoba posiadająca
wysoki wynik w skali samooceny należy do grupy mężczyzn,
a osoba posiadająca wynik niski należy do grupy kobiet.

PRZYKŁAD

background image

so far, so good...

Podstawowa idea analizy dyskryminacyjnej to
sprawdzenie czy grupy różnią się pod
względem wyróżnionych zmiennych/zmiennej,

a następnie wykorzystaniu tej
zmiennej/zmiennych do przewidywania
przynależności do grup, np. w przypadku
nowych uczestników badania.

background image

Więcej niż jeden predyktor

Najczęściej analizę dyskryminacyjną
stosujemy wtedy, kiedy chcemy
sprawdzić, która z wielu zbadanych
zmiennych najlepiej przewiduje
przynależność do różnych grup.

W tym wypadku AD podobna jest do
MANOVy

background image

Więcej niż jeden predyktor

Jeżeli mamy większą liczbę
predyktorów to chcemy zbudować
model na podstawie, którego
będziemy mogli w najlepszy sposób
przewidzieć przynależność
poszczególnych przypadków do grup.

background image

Cel

Głównym celem jest:

znalezienie wymiarów na których grupy różnią

się między sobą

stworzenie funkcji klasyfikacyjnych

Czy przynależność do grup może być

trafnie przewidziana na podstawie

zestawu predyktorów?

Czy to w której grupie jest dana osóbka

może być wyjaśnione na postawie np.

tego co myśli o …

background image

Analiza dyskryminacyjna dla dwóch grup

Nazywana liniową analizą
dyskryminacyjną Fishera.

Podobna do wielokrotnej analizy regresji.
Jeżeli zakodujemy wartości zmiennej
grupującej jako 1 i 2, a następnie
potraktujemy tą zmienną jako zależną w
wielokrotnej analizie regresji to uzyskany
wynik będzie podobny do wyniku AD.

background image

Analiza dyskryminacyjna dla dwóch grup

Model jaki jest dopasowywany w tej analizie
jest prostym równaniem liniowym

gdzie, a to stała, b

1

do b

n

wartości współczynników regresji.

Interpretując wyniki porównujemy współczynniki

β. Te zmienne, które mają największe te
współczynniki wyjaśniają najbardziej rozdział
uczestników do grup.

Grupa=a+b

1

x

1

+b

2

x

2

. . .+b

n

x

n

FUNKCJA DYSKRYMINACYJNA

background image

Analiza dyskryminacyjna dla większej liczby

grup

Możemy oszacować i przetestować
więcej niż jedna funkcję
dyskryminacyjną.

wybieramy między którymi grupami
chcemy rozróżniać uczestników badania

• np. jeżeli mamy 3 grupy to możemy

oszacować funkcje dyskryminacyjne 1)
pomiędzy grupą 2 i 3 oraz 2) pomiędzy
grupami 1 vs łącznie 2 i 3.

background image

Wymiary/ funkcje dyskryminacyjne

Na ilu wymiarach grupy różnią się od siebie?

Ile sensownych funkcji możemy wyodrębnić –

liniowych kombinacji predyktorów

Testujemy istotność każdej z nich

Zwykle udaje się wyodrębnić jedną, dwie sensowne
funkcje, reszta nie jest warta zachodu

Funkcje są ortogonalne (niezależne) – ich wkład w

rozróżnienie między grupami nie nachodzi na siebie.

Liczba wymiarów (funkcji dyskryminacyjnych) jest

równa liczbie grup-1 lub liczbie predyktorów w

zależności, która z wartości jest mniejsza

background image

Analiza dyskryminacyjna dla większej liczby

grup

Funkcje dyskryminacyjne dla różnych kombinacji
grup, w popularnych pakietach statystycznych, są
wyliczane automatycznie.

pierwsza funkcja oznacza największe
rozróżnienie między grupami, kolejna mniejsze,
itd.

Obliczeniowo oszacowanie funkcji odbywa się za
pomocą kanonicznej analizy korelacji, która
oszacowuje funkcje dyskryminacyjne oraz ich
wartości własne.

background image

Korelacja kanoniczna

Pozwala sprawdzić związek pomiędzy
dwoma zestawami zmiennych.

np. zestaw czynników ryzyka vs zestaw
objawów chorobowych

background image

Wartości własne funkcji

Każdej funkcji przypisane są wartości

własne (eigenvalues)

Wskazują jak dobrze dana funkcja różnicuje

między grupami

Im większa wartość własna tym lepiej/trafniej

jesteśmy w stanie przypisać osoby do grup

Wartość własna

• proporcja sumy kwadratów międzygrupowej do

wewnątrzgrupowej (ANOVA), gdzie funkcja

dyskryminacyjna jest zmienną zależną a niezależną

grupy jako poziomy czynnika

background image

Trzeba się zastanowić …

Czy wyodrębnione funkcje

dyskryminacyjne są

interpretowalne i sensowne

Jakie są korelacje pomiędzy

funkcjami dyskryminacyjnymi a

każdym z predyktorów?

background image

pytania

Czy na podstawie tych funkcji moglibyśmy

zaklasyfikować nowe osóbki do grup?

Jak dokładni jesteśmy w klasyfikowaniu

Jeśli się mylimy, to czy jest jakaś

tendencyjność w pomyłkach?

Jak silny jest związek między

przynależnością do grup a predyktorami?

background image

Przykład

background image

background image

background image

background image

background image

background image

Statystyki dla grup

44,296

9,87933

27 27,000

2,9517

,64832

27 27,000

5,5556

1,78311

27 27,000

68,259

9,02387

27 27,000

51,837 12,15756

43 43,000

3,1318

,55756

43 43,000

6,4419

1,63740

43 43,000

79,860

9,97039

43 43,000

55,111

8,64317

54 54,000

2,7612

,47821

54 54,000

5,5741

1,65520

54 54,000

69,204

9,23770

54 54,000

51,621 10,97417

124 124,00

2,9312

,56603

124 124,00

5,8710

1,71539

124 124,00

72,694 10,74931

124 124,00

przyjacielski

oceny

historia_pracy

test

przyjacielski

oceny

historia_pracy

test

przyjacielski

oceny

historia_pracy

test

przyjacielski

oceny

historia_pracy

test

pracownik
słaby pracownik

indywidualna gwiazda

zespołowiec

Ogółem

Średnia

Odchylenie

standardowe

Nieważone

Ważone

N Ważnych (usuwanie

obserwacjami)

background image

Testy równości średnich grupowych

,858 10,040

2

121

,000

,916

5,533

2

121

,005

,941

3,813

2

121

,025

,761 19,004

2

121

,000

przyjacielski

oceny

historia_pracy

test

Lambda

Wilksa

F

df1

df2

Istotność

background image

Wyniki testu

26,716

1,265

20

28454

,190

M Boxa

Przybliżenie

df1

df2

Istotność

F

Testuje hipotezę zerową o równości
macierzy kowariancji w populacji.

background image

Wartości własne

,343

a

60,4

60,4

,506

,225

a

39,6

100,0

,429

Funkcja
1

2

Wartość

własna

% wariancji

%

skumulowany

Korelacja

kanoniczna

W analizie użyto pierwszych 2 funkcji dyskryminacyjnych.

a.

background image

Lambda Wilksa

,608

59,527

8

,000

,816

24,243

3

,000

Test funkcji
1 przez 2

2

Lambda

Wilksa

Chi-kwadrat

df

Istotność

background image

Analiza dyskryminacyjna dla większej liczby

grup.

Interpretacja funkcji kanonicznych.

Uzyskaliśmy dwie funkcje istotne
statystycznie.

Jednak nie wiemy między, którymi
grupami funkcje te dokonują
rozróżnień.

background image

Analiza dyskryminacyjna dla większej liczby

grup.

Interpretacja funkcji kanonicznych.

W wynikach uzyskamy wartości b i β
dla każdej zmiennej w każdej funkcji
dyskryminacyjnej.

Im wartość standaryzowana
współczynnik kanonicznej funkcji
dyskryminacyjnej jest większa tym
większy wkład w rozróżnienie między
grupami w danej funkcji.

background image

Współczynniki niewystandaryzowane (b)

funkcji dyskryminacyjnych

Współczynniki kanonicznych funkcji dyskryminacyjnych

-,008

,093

,162 -1,031
,164

,024

,094

,026

-7,798 -3,816

przyjacielski

oceny

historia_pracy

test

(Stała)

1

2

Funkcja

Współczynniki niestandaryzowane.

background image

Standaryzowane współczynniki (β)

funkcji kanonicznych

Standaryzowane współczynniki

kanonicznych funkcji dyskryminacyjnych

-,087

,955

,088

-,563

,275

,040

,884

,245

przyjacielski

oceny

historia_pracy

test

1

2

Funkcja

background image

Macierz struktury czynników

Innym sposobem interpretacji, która zmienna
jest istotna w danej funkcji jest interpretacja
macierzy czynników.

jest to macierz pokazująca współczynniki
korelacji pomiędzy poszczególnymi
predyktorami a wyodrębnionymi funkcjami.

analogiczna do macierzy ładunków w
analizie czynnikowej.

background image

Macierz struktury czynników

Macierz struktury

,953*

,105

,467*

-,272

,428*

,020

,012

,859*

test

oceny

historia_pracy

przyjacielski

1

2

Funkcja

Połączone korelacje wewnątrzgrupowe pomiędzy zmiennymi
dyskryminującymi i standaryzowanymi kanonicznymi
funkcjami dyskryminacyjnymi. Zmienne są uporządkowane
według wartości bezwzględnej korelacji w obrębie funkcji.

Największa wartość bezwzględna korelacji pomiędzy
każdą zmienną i dowolną funkcją dyskryminacyjną.

*.

background image

Standaryzowane współczynniki czy

ładunki czynnikowe?

Najważniejsza różnica:

standaryzowane współczynniki –
wskazują na unikalny wkład każdego
predyktora do funkcji (podobne do
korelacji cząstkowych)

ładunki czynnikowe – proste korelacje
pomiędzy predyktorami i funkcją
(funkcjami).

Wykorzystujemy je do różnych celów.

background image

Kolejne kroki w analizie dyskryminacyjnej

Sprawdź, które funkcje są istotne statystycznie

rozważaj w dalszych analizach wyłącznie te istotne

Następnie patrzymy na standaryzowane
współczynniki funkcji

im wyższe współczynniki tym większy unikalny wkład
predyktora w rozróżnienie między grupami

W celu znalezienia znaczenia istotnych funkcji
patrzymy na macierz ładunków czynnikowych

predyktory najbardziej skorelowane z funkcją nadają jej
znaczenie

Patrzymy na średnie dla poszczególnych funkcji w
grupach

pozwala to wykryć między którymi grupami rozróżniają
poszczególne funkcje.

background image

Średnie dla poszczególnych funkcji w

grupach

Funkcje w środkach ciężkości grup

-,401

-,826

,794

,013

-,432

,403

pracownik
słaby pracownik

indywidualna gwiazda

zespołowiec

1

2

Funkcja

Niestandaryzowane kanoniczne funkcje
dyskryminacyjne ocenione w średnich dla grup.

background image

-3

-2

-1

0

1

2

3

4

Funkcja 1

-3

-2

-1

0

1

2

3

F

u

n

k

c

ja

2

słaby pracownik

indywidualna gwiazda

zespołowiec

pracownik

słaby pracownik
indywidualna

gwiazda

zespołowiec

Środek ciężkości
grupy

Kanoniczne funkcje dyskryminacyjne

background image

background image

Wyniki klasyfikacji

b,c

12

5

10

27

4

27

12

43

4

7

43

54

44,4

18,5

37,0

100,0

9,3

62,8

27,9

100,0

7,4

13,0

79,6

100,0

10

5

12

27

5

25

13

43

5

7

42

54

37,0

18,5

44,4

100,0

11,6

58,1

30,2

100,0

9,3

13,0

77,8

100,0

pracownik
słaby pracownik

indywidualna gwiazda

zespołowiec

słaby pracownik

indywidualna gwiazda

zespołowiec

słaby pracownik

indywidualna gwiazda

zespołowiec

słaby pracownik

indywidualna gwiazda

zespołowiec

Liczebność

%

Liczebność

%

Oryginalne

Sprawdzane krzyżowo

a

słaby

pracownik

indywidualna

gwiazda

zespołowiec

Przewidywana przynależność do grupy

Ogółem

Sprawdzanie krzyżowe jest wykonywane jedynie dla analizowanych obserwacji. W procesie sprawdzania, każda
obserwacja jest klasyfikowana przez funkcję wykorzystującą wszystkie obserwacje, za wyjątkiem danej obserwacji.

a.

66,1% pierwotnie pogrupowanych obserwacji zostało prawidłowo sklasyfikowanych.

b.

62,1% obserwacji sprawdzanych krzyżowo zostało prawidłowo sklasyfikowanych.

c.

background image

background image

background image

background image

background image

Miary symetryczne

,460

,066

7,074

,000

124

Kappa

Miara zgodności

N Ważnych obserwacji

Wartość

Asymptotyczny

błąd

standardowy

a

Przybliżone T

b

Istotność

przybliżona

Nie zakładając hipotezy zerowej.

a.

Użyto asymptotycznego błądu standardowego, przy założeniu hipotezy zerowej.

b.

background image

Standardy prezentacji wyników

Podajemy dla wszystkich istotnych funkcji wartość λ, χ

2

i jej

istotność statystyczną

λ = 0,61; χ

2

(8, N=124) = 59,53; p<0,01

Wyniki wskazują, że predyktory różnicowały przynależność
do trzech grup.

Ponadto wyodrębniono druga funkcję, która niezależnie od
pierwszej pozwalała różnicować istotnie między grupami

• λ = 0,82; χ

2

(3, N=124) = 24,24; p<0,01

Prezentujemy tabele z korelacjami pomiędzy predyktorami i
funkcjami oraz wystandaryzowane współczynniki.

Prezentujemy i interpretujemy średnie wartości dla
poszczególnych funkcji w grupach.

Podajemy procent poprawnie zaklasyfikowanych uczestników
badania.

background image

założenia

Rozkład normalny

rozkłady poszczególnych zmiennych są zbliżone do rozkładu
normalnego

Homogeniczność wariancji/kowariancji

macierze wariancji/kowariancji są homogeniczne w poszczególnych
grupach

najlepiej sprawdzić to za pomocą wykresów rozrzutu

Korelacje pomiędzy średnimi i wariancjami

średnie zmiennych w grupach nie mogą być skorelowane
wariancjami

pojawia się najczęściej jeżeli w jednej z grup istnieje kilka wyników
skrajnych, które zmieniają średni i wariancję.

Zmienne nie mogą być zupełnie redundantne

taka sytuacja może wystąpić jeżeli jedna ze zmiennych jest np.
wskaźnikiem sumarycznym wyciągniętym z trzech innych zmiennych
branych pod uwagę w analizie.

background image

Podsumowanie

Analizę dyskryminacyjną używamy
jeżeli jeżeli chcemy:

znaleźć zmienne, które wyróżniają
naturalnie” pojawiające się grupy,

klasyfikować przypadki do różnych grup z
trafnością lepszą niż przypadkowa.

background image

koniec


Wyszukiwarka

Podobne podstrony:
analizy 2 id 62051 Nieznany
analiza 6 1 id 584986 Nieznany (2)
analiza 3 id 59700 Nieznany (2)
analizatory id 62011 Nieznany (2)
analizaf 5 id 61957 Nieznany (2)
analizaf 3 id 61954 Nieznany (2)
analiza2 id 61920 Nieznany (2)
analizaf 1 id 61953 Nieznany (2)
AnalizaSciezek id 61987 Nieznany (2)
AnalizaSWOT id 61991 Nieznany (2)
analizaf 6 id 61959 Nieznany (2)
analiza 4 id 59704 Nieznany (2)
analiza 5 id 59707 Nieznany (2)
analizaf 4 id 61955 Nieznany (2)
analizaf 8 id 61961 Nieznany (2)
analizaWyklad 3 1 id 62026 Nieznany
analizy 2 id 62051 Nieznany
analiza 6 1 id 584986 Nieznany (2)
analiza 3 id 59700 Nieznany (2)

więcej podobnych podstron