Porządkowanie liniowe obiektów

Powtórka

Ćwiczenie:

Załadować plik Agression i ustalić czy rozkłady agresji dla dziewcząt i chłopców są takie same?

Sprawdzić założenia w teście

(równość wariancji, normalność rozkładów) 1

METODY

PORZĄDKOWANIA

LINIOWEGO

Cel. Metody porządkowania liniowego mają umożliwić ustalenie hierarchii obiektów wielowymiarowych (opisywanych wektorami zmiennych) – uporządkowanie ich od najgorszego do najlepszego.

Problem:

Dla obiektów wielowymiarowych nie ma

„naturalnego” porządku.

Etapy porządkowania liniowego 1. Dobór zmiennych diagnostycznych (należy uważać na zmienne które dublują informacje – czyli zmienne

opisujące

„to

samo”)

np.

liczba

bezrobotnych

kobiet,

liczba

bezrobotnych

mężczyzn, ogólna liczba bezrobotnych.

Albo

Odsetek pracujących oraz Odsetek niepracujących 2. Identyfikacja charakteru zmiennych. Ustalenie czy dana zmienna jest stymulantą, destymulantą, nominantą . Zwykle wymaga wiedzy eksperckiej i nie zawsze jest jednoznaczne

2

3. Ustalamy

wagi

kolejnych

zmiennych.

Wykorzystujemy wagi nadane przez ekspertów albo przyjmujemy równe wagi - uznajemy, że każda zmienna jest tak samo ważna.

4. Transformacja zmiennych – doprowadzamy do porównywalności.

Cel:

• ujednolicenie charakteru zmiennych,

• doprowadzenie różnoimiennych zmiennych do wzajemnej porównywalności,

• ujednolicenie zakresów zmiennych,

• wyeliminowanie z obliczeń wartości ujemnych W

przypadku

wyznaczania

mierników

rozwoju

wykorzystujemy normalizację, w której przez rozstęp dzielona

jest

odległość

danej

wartości

od

zaobserwowanego

minimum

dla

zmiennej.

Dla

stymulanty obliczamy:

x − min x

ij

{ ij}

z =

ij

max{

i

x

− min x

ij }

{ ij}

i

i

dla destymulanty:

max{ x − x

ij }

ij

z = max{ i

ij

x

− min x

ij }

{ ij}

i

i

gdzie subskrypt i oznacza numer obiektu, subskrypt j –

numer zmiennej diagnostycznej.

3

Inne możliwości:

• Standaryzacja zmiennych

x − x

ij

z =

ij

S (

j

x j )

• Normalizacja

xij

z =

ij

x j

5. Agregujemy uzyskane wartości (znormalizowane zmienne). Wyliczamy syntetyczny wskaźnik poziomu zjawiska:

m

100

W

α z

i =

∑ j ij

m

j =1

m- to liczba zmiennych diagnostycznych, α j - waga j-tej zmiennej (tutaj wagi mają się sumować do m )

Wyniki możemy przedstawić na wykresie „ helikopter-helikopter”

4

Ćwiczenie 1.

Wyznaczyć ranking krajów ze względu na kapitał ludzki przyjmując założenia:

• Normalizujemy wzorem

• Wszystkie zmienne mają takie same wagi Wyniki zilustrować na wykresie helikopter-helikopter Ćwiczenie 2.

Wyznaczyć ranking krajów ze względu na kapitał

ludzki…..

Założenia: przekształcanie zmiennych: standaryzacja Wagi dla zmiennych opisujących kształcenie ustawiczne są dwa razy większe od pozostałych Zilustrować wyniki na wykresie helikopter-helikopter Przedstawić

obiekty

przy

pomocy

wykresów

obrazkowych.

Wyniki zinterpretować

5