Projekt pierwszy obejmuje takie zagadnienia jak porządkowanie według pewnej cechy bezpośrednio nieobserwowalnej i wizualizacja obiektów opisanych wieloma cechami oraz ich podział na jednorodne grupy. Na ocenę dobra i bardzo dobrą muszą być co najmniej dwa punkty w czasie obejmujące te obiekty opisane wieloma cechami.
Zawartość:
Na początku (np. oddzielny arkusz Excela lub Worda) ma zawierać krótkie podsumowanie pracy na 1-2 stron które ma odnośniki do poszczególnych etapów analizy
Co wchodzi w skład analizy?
Opis celu czyli z jakimi obiektami mamy do czynienia i według czego chcemy je uporządkować.
Opis danych wejściowych oraz źródła ich pozyskania
Budowa zmiennych wskaźnikowych (tzn. zmiennych których wartości dotyczące poszczególnych obiektów są porównywalne. (np. PKB na osobe a nie np. na województwo czy kraj)
Uzasadnienie dlaczego te a nie inne zmienne bierzemy do analizy (merytoryczny wybór)
Wstępna analiza danych (chodzi o elementy odstające i wychwycenie zmiennych które są prawie liniowo zależne)
normalizacja danych (co najmniej dwoma sposobami) - w przypadku gdy mamy dwa lub więcej punktów czasowych to normalizacja powinna być wspólna dla całego okresu, a nie robiona dla każdego okresu oddzielnie)
Ustalenie wag
Stworzenie wskaźnika syntetycznego lub innego służącego do porządkowania obiektów. (koniecznie dla co najmniej dwu normalizacji oraz musza to być różne wagi w przypadku wskaźników syntetycznych oraz odległości od wzorca lub/i dwu wzorców
Dokonać podziału na skupienia według wskaźników porządkujących - czyli wykorzystując trzy progi (np. średnia - odchylenie, średnia, średnia + odchylenie bądź inny podział omawiany na wykładzie)
Dokonać wizualizacji zbioru co najmniej dwoma sposobami
Dokonać podziału zbioru na skupienia w oparciu o co najmniej dwie miary niepodobieństwa obiektów i kilka różnych sposobów obliczania odległości pomiędzy zbiorami - robimy to przy użyciu pakietu statystycznego lub programujemy
Zestawiamy podziały oraz porządki i wyciągamy wnioski. W szczególności jeśli mamy dwa lub więcej punktów czasowych to pytanie o zmiany wartości wskaźnika porządkującego (wartość średni i rozproszenie - czy rosną maleją wraz ze zmianą czasu.
Uwaga! Nie chcę papieru tylko w arkuszu EXCELA skopiowane z pakietów statystycznych wyliczenia lub wytworzone w samym EXCELU. Ale musi być z głową podzielone na kartki aby w podsumowaniu można było zręcznie czytelnika odsyłać.