Transformacja, Wielowymiarowa analiza statystyczna, Panek, wap


TRANSFORMACJA ZMIENNYCH

CELE TRANSFORMACJI

STYMULACJA ZMIENNYCH

Typy zmiennych:

STYMULACJA DESTYMULANT

Przekształcenie ilorazowe

0x01 graphic
, b>0,

gdzie:

0x01 graphic
- wartość j-tej zmiennej destymulanty w i-tym obiekcie,

0x01 graphic
- wartość j-tej zmiennej po transformacji w stymulantę w i-tym obiekcie,

b - stała przyjmowana w sposób arbitralny, najczęściej b=1.

Przekształcenie różnicowe

0x01 graphic
, b>0,

gdzie:

a, b - stałe przyjmowana w sposób arbitralny, najczęściej b=1 i a=0 lub 0x01 graphic

STYMULACJA NOMINANT

Przekształcenie ilorazowe

0x01 graphic
,

gdzie:

0x01 graphic
- nominalna (pożądana) wartość j-tej zmiennej,

0x01 graphic
- wartość j-tej nominanty w i-tym obiekcie.

Przekształcenie różnicowe

0x01 graphic

NORMALIZACJA ZMIENNYCH

Ogólna formuła normalizacji zmiennych diagnostycznych:

0x01 graphic
, i=1,2,..,n; j=1,2,...,m; b0,

gdzie:

zij - znormalizowana wartość j-tej zmiennej w i-tym obiekcie,

a,b,p - parametry normalizacyjne.

Standaryzacja

Cel: jest otrzymanie zmiennych o odchyleniu standardowym (standaryzacja klasyczna) lub medianowym odchyleniu bezwzględnym (standaryzacja pozycyjna) równym 1.

Standaryzacja klasyczna

0x01 graphic
.

0x01 graphic
, i=1,2,...,n; j=1,2,...,m.

Standaryzacja pozycyjna

0x01 graphic
.

0x01 graphic
, i=1,2,...,n; j=1,2,...,m.

Unitaryzacja

Cel: uzyskanie zmiennych o ujednoliconym zakresie zmienności, definiowanym przez różnicę pomiędzy ich wartościami maksymalnymi i minimalnymi w ujęciu klasycznym lub maksimum z medianowych odchyleń bezwzględnych w ujęciu pozycyjnym, równym stale 1.

Unitaryzacja klasyczna

W przypadku unitaryzacji klasycznej parametry normalizacyjne przyjmują najczęściej wartości:

0x01 graphic

0x01 graphic
, i=1,2,...,n; j=1,2,...,m.

Unitaryzacja pozycyjna

0x01 graphic
.

- ogólna formuła normalizacji ma wtedy postać:

0x01 graphic
, i=1,2,...,n; j=1,2,...,m.

Przekształcenie ilorazowe

Cel: odniesienie wartości zmiennej do pewnej stałej.

Ujęcie klasyczne

0x01 graphic

0x01 graphic
, i=1,2,...,n; j=1,2,...,m.

Ujęcie pozycyjne

0x01 graphic
.

0x01 graphic
, i=1,2,...,n; j=1,2,...,m.

Normalizacja rangowa

0x01 graphic
, h,i=1,2,...,n.

gdzie:

h - ranga nadana i-temu obiektowi znajdującemu się na h-tym miejscu w uporządkowanym szeregu obiektów ze względu na j-tą zmienną.

Wyeliminowanie z obliczeń wartości ujemnych

0x01 graphic

gdzie:

0x01 graphic
,

przy czym:

S(zij) - odchylenie standardowe obliczane ze wszystkich elementów macierzy danych znormalizowanych

MIARY PODOBIEŃSTWA OBIEKTÓW

MIARA ODLEGŁOŚCI

dodatniość: 0x01 graphic

zwrotność: 0x01 graphic

symetria: 0x01 graphic

nierówność trójkąta: 0x01 graphic

gdzie:

0x01 graphic
- odległość i-tego obiektu od i'-tego obiektu

MIARA BLISKOŚCI (ZGODNOŚCI)

dodatniość: 0x01 graphic

zwrotność: 0x01 graphic

symetria: 0x01 graphic

PODSTAWOWE MIARY ODLEGŁOŚCI MIĘDZY OBIEKTAMI

Czynniki wpływające na wybór miary odległości:

MIARY ODLEGŁOŚCI OBIEKTÓW PRZY STOSOWANIU ZMIENNYCH MIERZONYCH

NA SKALI PRZEDZIAŁOWEJ LUB ILORAZOWEJ

Metryka Minkowskiego:

0x01 graphic
,

gdzie:

wj - waga j-tej zmiennej,

p - parametr będący liczbą naturalną.

Odległość Euklidesa (p=2):

0x01 graphic

Odległość miejska (Manhattan, Hamminga) (p=1):

0x01 graphic

Odległość Czebyszewa (0x01 graphic
):

0x01 graphic

0x08 graphic
0x08 graphic
0x08 graphic
Rys. 1.1. Odległości punktów według metryk euklidesowej, miejskiej i maksymalnej różnicy na płaszczyźnie.

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
z20x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic

z2

02

01

03 04

z2

02

01

03 04

z2

02

01 03 04

0x08 graphic
z1 z1 z1

Źródło: Opracowanie własne.

Odległość potęgowa:

0x01 graphic
,

gdzie:

a, b - parametry sterujące wagami zmiennych.

Jeżeli parametry a i b są równe 2 odległość potęgowa jest równa odległości euklidesowej.

Odległość Mahalanobisa (oparta na oryginalnych wartościach zmiennych):

0x01 graphic
,

gdzie:

sjj' - jj'-ty element macierzy odwrotnej do macierzy kowariancji zbioru obserwacji S.

MIARY ODLEGŁOŚCI OBIEKTÓW ZMIENNYCH MIERZONYCH NA SKALI NOMINALNEJ

ZMIENNE WIELOSTANOWE

Niezgodność procentowa (miara Sokala i Michenera):

0x01 graphic
,

gdzie:

mr - liczba zmiennych, dla których zachodzi relacja równości między obiektami.

ZMIENNE BINARNE

Wyróżnienie czterech typów liczebności zmiennych

m1,1 - liczebność zmiennych, dla których w porównywanych obiektach, występuje odpowiedni wariant zmiennej (zgodność występowania)

m0,0 - liczebność zmiennych, dla których w porównywanych obiektach, nie występuje odpowiedni wariant zmiennej (zgodność niewystępowania)

m1,0 - liczebność zmiennych, dla których w pierwszym z porównywanych obiektów, występuje wariant danej zmiennej, a w drugim z nich wariant ten nie występuje (niezgodność występowania)

m0,1 - liczebność zmiennych, dla których w pierwszym z porównywanych obiektów, nie występuje wariant danej zmiennej, a w drugim z nich wariant ten występuje (niezgodność występowania)

Miara Sokala i Michenera (jednakowe wagi):

0x01 graphic
.

Miara Czekanowskiego (zróżnicowane wagi):

0x01 graphic
.

- obie miary odległości przyjmują wartość z przedziału [0; 1].

DROGI POSTĘPOWANIA

GDY ZMIENNE CHARAKTERYZUJĄCE OBIEKTY

MIERZONE SĄ NA RÓŻNYCH SKALACH:

Uogólniona miara odległości Walesiaka

0x01 graphic
,

przy czym:

0x01 graphic
oraz 0x01 graphic
.

Podstawienia dla zmiennych mierzonych na skali ilorazowej lub przedziałowej:

0x01 graphic

Podstawienia gdy zmienne mierzone są na skali porządkowej:

0x01 graphic
i*=i',i”,

0x01 graphic
i*=i,i”.

Podstawienie gdy zmienne mierzone są na skali nominalnej:

0x01 graphic

0x01 graphic

i”=1,2,...n; i”i,i'.

MIARY ODLEGŁOŚCI STRUKTUR

Zastosowanie:

stosowane są w sytuacjach gdy obiekty są porównywane ze względu na jedno konkretne zjawisko (np. strukturę wydatków gospodarstw domowych), a przedmiotem tego porównania jest zróżnicowanie zbiorowości tych obiektów ze względu na kształtowanie się tego zjawiska

Warunki dla stosowania miar odległości struktur:

Miara Nowaka:

0x01 graphic
, 0x01 graphic
.

Miara ta jest unormowana w przedziale [0;1].

Miara Kukuły:

0x01 graphic
,

gdzie:

0x01 graphic
.

Miara ta jest unormowana w przedziale [0;1].

Miara Chomątowskiego i Sokołowskiego:

0x01 graphic

MIARY BLISKOŚCI OBIEKTÓW

Miary bliskości obiektów przy zmiennych mierzonych na skali nominalnej

Współczynnik zbieżności Cramera:

0x01 graphic
,

gdzie:

0x01 graphic

Miara ta jest unormowana w przedziale [0;1].

Miary bliskości obiektów stosowane przy zmiennych mierzonych na skali porządkowej

Współczynnik korelacji rang:

0x01 graphic
,

gdzie:

ci - różnica pomiędzy rangami przyporządkowanymi i-temu obiektowi w obu uporządkowanych ich ciągach.

Miary bliskości obiektów stosowane przy zmiennych mierzonych na skali ilorazowej lub przedziałowej

Współczynnik korelacji liniowej Pearsona:

0x01 graphic
0x01 graphic
,

Współczynnik ten jest unormowany w przedziale [-1;1].



Wyszukiwarka

Podobne podstrony:
Rk IV, Wielowymiarowa analiza statystyczna, Panek, wap
Podstawowe pojecia przyklady, Wielowymiarowa analiza statystyczna, Panek, wap
Metody porzadkowani liniowego, Wielowymiarowa analiza statystyczna, Panek, wap
Klasyczna an czynn, Wielowymiarowa analiza statystyczna, Panek, wap
harmonogram wap, Wielowymiarowa analiza statystyczna, Panek, wap
Metody porzadkowania liniowego p, Wielowymiarowa analiza statystyczna, Panek, wap
Analiza korespondencji, Wielowymiarowa analiza statystyczna, Panek, wap
Wybor repr gr obiektow, Wielowymiarowa analiza statystyczna, Panek, wap
Podstawowe pojecia, Wielowymiarowa analiza statystyczna, Panek, wap
Metody grupowania obiektow, Wielowymiarowa analiza statystyczna, Panek, wap
An gl sklad, Wielowymiarowa analiza statystyczna, Panek, wap
analiza kanoniczna p, Wielowymiarowa analiza statystyczna, Panek, wap
Wyb reprezentantow grup obiektow p, Wielowymiarowa analiza statystyczna, Panek, wap
Met porz nieliniowego, Wielowymiarowa analiza statystyczna, Panek, wap
Analiza kanoniczna, Wielowymiarowa analiza statystyczna, Panek, wap
WAS egzamin, Wielowymiarowa analiza statystyczna
wielowymiarowa analiza statystyczna DWJNX64TI3NMLMCMGQW3YQWWUOQSMOA4OWT6I6Q
podstawowe pojecia, WIELOWYMIAROWA ANALIZA PORÓWNAWCZA (WAP)

więcej podobnych podstron