ANALIZA DANYCH (DATA ANALYSIS)
Kierunek / specjalność: Ekonomia / realizowany na kierunku
Forma studiów: studia stacjonarne I stopnia / studia niestacjonarne I stopnia
Wymagania wstępne - zaliczone przedmioty: Technologia informacyjna. Matematyka, Informatyka I, Statystyka opisowa
Charakterystyka zaj |
ć dydaktycznych | |||
Forma zajęć |
Liczba godzin |
Semestr |
Rok studiów |
Punkty ECTS |
wykłady |
10/3 |
V/V |
III/III |
3/2 |
laboratoria |
18/8 |
V/V |
III/III |
Prowadzący: prof. dr hab. Marek Walesiak, dr Andrzej Dudek, dr Artur Zaborski, dr Mirosława Sztemberg-
Lewandowska, dr inż. Tomasz Bartłomowicz, dr Marcin Pełka, dr Bartłomiej Jefmański, dr Justyna Wilk teł. 757538285 (373, 279, 273, 274, 379, 379,277), nr pok.: B8, A80, A84, B27, B26, A94, A94, B28 Treści programowe
Podstawowe zagadnienia analizy danych. Obiekty i zmienne. Klasyfikacja zmiennych: klasyczne i symboliczne; nominalne, porządkowe, przedziałowe i ilorazowe; neutralne i preferencyjne (stymulanty, destymulanty, nominanty) - ujednolicenie charakteru zmiennych. Macierz danych i tablica danych.
Skale pomiarowe: rola skal pomiarowych w badaniach ekonomicznych, typy skal pomiarowych i ich charakterystyka (podstawowe własności skal pomiaru, reguły teorii pomiaru, metody i techniki dopuszczalne w odniesieniu do poszczególnych skal pomiaru).
Transformacja normalizacyjna: cel normalizacji, formuły normalizacyjne i ich właściwości. Pojęcie odległości. Miary odległości obiektów opisanych zmiennymi mierzonymi na poszczególnych skalach pomiaru. Czynniki decydujące o wyborze miary odległości.
Źródła danych: dane pierwotne, dane wtórne. Zebranie danych i ich opracowanie (kodowanie, agregowanie, pogrupowanie, zaprezentowanie). Generowanie danych.
Wizualizacja danych w przestrzeni dwu- i trójwymiarowej. Graficzna prezentacja danych w przestrzeni dwuwymiarowej: wykresy rozrzutu danych metrycznych (scatterplot), wykresy rozrzutu trzech zmiennych metrycznych (bubbleplot), wykresy rozrzutu dwóch zmiennych metrycznych dla każdego poziomu trzeciej zmiennej niemetrycznej (tretlis graphics), wykresy funkcji matematycznych, wykres rozrzutu dla danych niemetrycznych, wykres rozrzutu dla danych symbolicznych interwałowych. Graficzna prezentacja danych w przestrzeni trójwymiarowej: wykres danych metrycznych w przestrzeni trójwymiarowej, wykres dla danych niemetrycznych w przestrzeni trójwymiarowej.
Klasyfikacja metod wielowymiarowej analizy danych. Wielowymiarowe metody analizy danych w badaniach ekonomicznych z wykorzystaniem wybranych programów komputerowych: uogólniona miara odległości GDM w porządkowaniu liniowym, analiza skupień (cluster analysis), analiza dyskryminacyjna, drzewa klasyfikacyjne, skalowanie wielowymiarowe, analiza czynnikowa.
Charakterystyka wykorzystywanego oprogramowania wspomagającego analizę danych: środowisko programistyczne R, GDM dla Windows.
Metody dydaktyczne: ćwiczenia laboratoryjne, zestawy zadań do samodzielnego rozwiązania, opracowanie
projektów laboratoryjnych Założenia i cele przedmiotu
wiadomości: poznanie podstawowych metod analizy danych i możliwości ich zastosowań ekonomicznych,
umiejętności: identyfikacja, zastosowanie i interpretacja właściwych metod analizy danych w rozwiązywaniu postawionych problemów ekonomicznych z wykorzystaniem wybranych programów komputerowych (R, GDM dla Windows)
Forma i warunki zaliczenia przedmiotu: przedmiot kończy się zaliczeniem na ocenę
Forma zaliczenia: aktywność na zajęciach laboratoryjnych, projekty.
Warunki zaliczenia: ocena pozytywna uzyskana na podstawie wykonanych projektów (laboratoria). Literatura podstawowa
[1] Walesiak M., Gatnar E. (red.). Statystyczna analiza danych z wykorzystaniem programu R, Wydawnictwo Naukowe PWN, Warszawa 2009.
[2] Walesiak M., Uogólniona miara odległości w statystycznej analizie wielowymiarowej. Wydanie drugie rozszerzone. Wyd. AE, Wrocław 2006.
[3] Gatnar E., Walesiak M. (red.), Metody statystycznej analizy wielowymiarowej w badaniach marketingowych, Wyd. AE, Wrocław 2004.
[4] R Development Core Team (2011), R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, URL http://www.R-project.org.
[5] Walesiak M., Dudek A. (2011), clusterSim package, URL http://www.R-project.org.
Literatura uzupełniająca
[1] Bąk A., Dekompozycyjne metody pomiaru preferencji w badaniach marketingowych. Prace Naukowe AE we Wrocławiu nr 1013, Seria: Monografie i Opracowania nr 157, Wyd. AE, Wrocław 2004.