marcin.mazurek@wat.edu.pl 2006
Wprowadzenie do
systemu SAS
marcin.mazurek@wat.edu.pl 2006
Co to jest SAS ?
www.sas.com
SAS został zbudowany przez J. Goodnight
i zespół z N.C. State University do analizy
danych z zakresu rolnictwa.
System przetwarzania i analizy dużych
wolumenów danych. Nie jest to
transakcyjna baza danych!
Analiza danych
data mining
Hurtownie danych
marcin.mazurek@wat.edu.pl 2006
Aplikacje SAS
Base
Base
SAS
SAS
SAS Enterprise
Miner
SAS CONNECT
SAS ACCESS
SAS GIS
SAS SHARE
SAS QC
SAS EIS
SAS AF
•
SAS ETS
•
SAS GRAPH
•
SAS INSIGHT
•
MDDB Viewer
•
SAS AF
•
SAS STAT
•
STAT OR
•
SAS Warehouse
Administrator
•
...........
marcin.mazurek@wat.edu.pl 2006
Interfejs użytkownika
Log
Output
Edytor programów
Results
Eksplorator
edytor poleceń
marcin.mazurek@wat.edu.pl 2006
Organizacja danych
Biblioteka - Library
Katalog
Pliki programów
(source)
Aplikacje
Makra
Zbiory danych
Dataset
Skróty do plików
•
przezroczysty dostęp do danych przechowywanych w innych systemach
bazodanowych – możliwe jest operowanie na zbiorach zewnętrznych, tak jak
gdyby były to zbiory SAS.
•
przenośność kodu pomiędzy platformami.
marcin.mazurek@wat.edu.pl 2006
Typy danych
Tylko dwa typy danych:
Char
Numeric
Format – precyzują sposób wyświetlenia danych
BEST.
DOLLARw.d
DAYw.
Informat – precyzują format wprowadzanych danych.
DATEw.
DATETIMEw.
YYMMDDw.
FLOATw.d
marcin.mazurek@wat.edu.pl 2006
4GL - język DML
PROC STEP
rodzaj procedury wbudowanej w SAS Base przeznaczonej do
wykonywania określonych operacji związanych z wygenerowaniem
zbioru danych bądź nie.
Mogą być nieskomplikowane funkcjonalnie jak np. procedura sortująca
proc sort, bądź bardziej złożone generujące kostkę wielowymiarową
DATA STEP
wykonanie data-stepu związane jest z wygenerowaniem jednego lub
więcej zbiorów danych
marcin.mazurek@wat.edu.pl 2006
Procedury DATA STEP
sekwencyjne przetwarzanie zbioru
pobranie wiersza ze zbioru ->
dane ładowane do bufora
wykonywane operacje na danych
zapisanie danych do zbioru wynikowego
pobranie kolejnego wiersza
marcin.mazurek@wat.edu.pl 2006
Procedury PROC STEP
proc print
proc sql
proc sort
proc transpose
proc merge
.....
marcin.mazurek@wat.edu.pl 2006
Edycja i uruchamianie
programów
Edycja programu -
Enhanced Editor
Zapis programu w
postaci pliku *.sas
Uruchomienie – Run -
> Submit
Rezultaty:
marcin.mazurek@wat.edu.pl 2006
Podstawowe biblioteki
ś
rodowiska
Biblioteki systemowe:
WORK - biblioteka robocza, jej zawartość jest
kasowania po zakończeniu sesji SAS
SASUSER – biblioteka zawierająca ustawienia
użytkownika
SASHELP - biblioteka zawierająca kody aplikacji
SAS
Mapowanie bibilioteki
libname libref <
engine
>
'SAS-data-library-path'
;
marcin.mazurek@wat.edu.pl 2006
Wprowadzanie danych
SAS ACCESS – sterowniki do systemów
baz danych
import plików: EXCEL, SPSS
skrypty DATA STEP.
marcin.mazurek@wat.edu.pl 2006
Przeglądanie danych
Table Viewer
PROC PRINT => OUTPUT
marcin.mazurek@wat.edu.pl 2006
Literatura
DEC „System SAS”
Getting started with SAS System
(SAS HELP)
http://support.sas.com/91doc/docMainpage.jsp