10
Analiza danych to nie tylko stosowanie zaawansowanych narzędzi statystyczno-ekonometrycznych, ale również umiejętność budowy procesów przetwarzania ETL (ang. Extraction-Transformation-Loading). System SAS pozwala na naukę procesu analizy danych w ramach schematu E2E, czyli od pozyskania danych do uzyskania wyniku analizy w postaci raportu końcowego. Język 4GL-SAS jest narzędziem zaawansowanego przetwarzania danych jak i stosowania modeli analitycznych w praktyce.
Realizacja przedmiotu składa się z dwóch głównych części:
1. Kursu programowania w wewnętrznym języku SAS/4GL .
2. Nauki budowy modeli analitycznych na przykładach (ang. Case-Study).
W praktyce przyjęto, że wykorzystanie Systemu SAS jest przedłużeniem i rozszerzeniem możliwości oferowanych przez powszechnie stosowany arkusz kalkulacyjny MS Excel, który będzie służył przede wszystkim do wstępnej obróbki danych. Pierwszym powodem jest powszechna znajomość interfejsu Excela oraz większa wygoda w operowaniu danymi przy jego użyciu niż przy pomocy interfejsu Systemu SAS. Druga przyczyna to w zasadzie identyczny sposób formatowania oraz przechowywania danych w formie tabel, w Excelu i w SAS-ie. Ostatnim argumentem jest bardzo prosty i wygodny sposób importu oraz eksportu danych między Excelem i SAS-em w postaci bibliotek.