WAP_styczeń 2008
Zadanie 1
Do porównania atrakcyjności inwestycyjnej 10 dużych miast w Polsce wybrano 2 cechy posiadające charakter stymulant. Ich wystandaryzowane wartości zawiera poniższa tablica:
Numery miast |
Wartości wystandaryzowane |
|
|
Zi1 |
Zi2 |
1 |
-1,305 |
-1,211 |
2 |
-1,080 |
-0,802 |
3 |
-0,630 |
-0,802 |
4 |
-0,630 |
0,016 |
5 |
-0,630 |
1,080 |
6 |
-0,180 |
1,244 |
7 |
0,495 |
0,653 |
8 |
0,945 |
0,425 |
9 |
1,170 |
-0,393 |
10 |
1,845 |
-1,211 |
Uporządkować badane miasta ze względu na atrakcyjność inwestycyjną za pomocą dowolnej metody taksonomicznej.
Zadanie 2
Zebrano informacje dotyczące liczby odbiorników radiowych na 100 ludności (cecha X1), liczby uczniów i studentów na 1000 ludności (cecha X2) oraz liczby odbiorników telewizyjnych na 100 ludności (cecha X3) w 6 wybranych krajach Afryki w 2001 roku. Na podstawie powyższych danych, po ich uprzedniej standaryzacji, obliczono następującą macierz odległości euklidesowych pomiędzy wybranymi krajami:
Dokonać grupowania krajów w jednorodne grupy ze względu na wyróżnione w badaniu cechy. Zastosować dowolną procedurę taksonomiczną.
Zadanie 3
Dla porównania zamożności grup społeczno-ekonomicznych gospodarstw domowych wybrano 6 cech. Macierz korelacji pomiędzy tymi cechami przyjęła postać:
Natomiast wektor współczynników korelacji pomiędzy zmiennymi objaśniającymi i poziomem zamożności miał postać:
r = [0,25; 0,48; 0,68; 0,82; 0,70; 0,50]
Przyjmując wartość krytyczną r=0,330 dokonać wyboru cech reprezentantów stosując dowolną procedurę taksonomiczną.
Zadanie 4
Poddano analizie kanonicznej wartości dwóch grup zmiennych opisujących 150 marek samochodów (4 charakteryzujące parametry techniczne samochodów oraz 2 charakteryzujące koszty ich nabycia i eksploatacji). Uzyskano m. in. następujące informacje przedstawione w formie tabelarycznej.
ocenić znaczenie par zmiennych kanonicznych w opisie wyodrębnionych grup zmiennych,
zapisać równania dla pierwszej pary zmiennych kanonicznych oraz dokonać ich interpretacji.
Numer pary zmiennych kanonicznych |
Wartość własna |
Korelacja kanoniczna |
Statystyka Lambda |
Statystyka χ2 |
Liczba stopni swobody |
Poziom istotności |
|
1 |
0,7738 |
0,8797 |
0,2089 |
227,83 |
8 |
0,0000 |
|
2 |
0,0763 |
0,2762 |
0,9237 |
11,55 |
3 |
0,0091 |
|
Współczynniki zmiennych kanonicznych pierwszej grupy zmiennych |
|||||||
CARDATA. cylinder1) |
0,27214 |
-1,26413 |
|
||||
CARDATA. horsepow2) |
-0,20923 |
-1,11814 |
|
||||
CARDATA. accel3) |
0,13753 |
-0,17611 |
|
||||
CARDATA. weight4) |
-1,02008 |
1,98415 |
|
||||
Współczynniki zmiennych kanonicznych drugiej grupy zmiennych |
|||||||
CARDATA. mpg5) |
0,97283 |
0,23178 |
|
||||
CARDATA. price6) |
-0,24218 |
0,97029 |
|
1) liczba cylindrów,
2) moc,
3) przyspieszenie,
4) waga,
5) zużycie paliwa (liczba przejechanych mil na 1galonie paliwa),
6) cena.
Zadanie 5
Poddano analizie głównych składowych 5 cech charakteryzujących 100 marek samochodów, a mianowicie:
CARDATA. liczba cylindrów
CARDATA. moc
CARDATA. przyspieszenie
CARDATA. cena
CARDATA. waga
Uzyskano m.in. następujące informacje przedstawione w formie tabelarycznej:
Numer głównej składowej |
% wyjaśnionej wariancji |
1 |
54.60660 |
2 |
23.18331 |
3 |
17.11052 |
4 |
3.75920 |
5 |
1.34036 |
Ładunki dwóch pierwszych głównych składowych |
|
(1,1) 0.549508 |
(1,2) 0,0416535 |
(2,1) 0.574869 |
(2,2) -0.126433 |
(3,1) -0.240566 |
(3,2) 0.662204 |
(4,1) 0.888968 |
(4,2) 0.686372 |
(5,1) 0.549356 |
(5,2) 0.269553 |
ocenić zasoby informacyjne 2 pierwszych głównych składowych,
wyodrębnić grupy cech reprezentowanych przez dwie pierwsze główne składowe oraz ocenić znaczenie tych składowych w opisie wyróżnionych w badaniu cech.
1
1