SAS opisowa


SAS
Statystyka Opisowa
Seweryn Kowalski
2006
SAS  statystyka opisowa
Przykładowe generowanie danych:
libname save 'C:\Temp';
data save.class; input name $ sex $ age height weight;
label name ="Subject's name";
label sex = "Subject's sex";
label age = "Age in years";
label height = "Height in centimeters";
label weight = "Weight in kilograms";
cards;
JOHN M 12 59.0 99.5
JAMES M 12 57.3 83.0
ALFRED M 14 69.0 112.5
WILLIAM M 15 66.5 112.0
JEFFREY M 13 62.5 84.0
RONALD M 15 67.0 133.0
THOMAS M 11 57.5 85.0
PHILIP M 16 72.0 150.0
ALICE F 13 56.5 84.0
ROBERT M 12 64.8 128.0
HENRY M 1463.5 102.5
;
run;
SAS  statystyka opisowa
Wartość średnia:
proc means data=zbiór_wejściowy ;
var zmienne_analizowane;
;
;
>;
run;
opcje:
missing (wymuszenie traktowania braków jako poprawnej grupy klasyfikacyjnej)
noprint (pominięcie raportu)
statystyki:
n  częstość wystąpień bez braków danych
nmiss  częstość wystąpień braków danych
min, max, range, sum  wartości: minimalna, maksymalna, zakres zmian i suma
mean  średnia arytmetyczna
var  wariancja
std  odchylenie standardowe
median  mediana
Qn  rodzina kwantyli
SAS  statystyka opisowa
Przykład 1
proc means data=save.class;
var age;
run;
Przykład 2
proc sort data=save.class;
by sex;
run;
proc means data=save.class;
by sex;
var age height;
run;
SAS  statystyka opisowa
Opis danych:
PROC CONTENTS
DATA= wprowadzenie data set
DETAILS | NODETAILS dodatkowe informacje dotyczące danych
np.. liczba obserwacji, zmiennych
DIRECTORY wydruk list plików SAS w katalogu
FMTLEN wydruk informacji na temat użytego formatu dla danych
ORDER=IGNORECASE wydruk alfabetyczny ignorujący wielkość
liter
OUT= wyjściowy data set
SHORT wydruk skróconego raportu
Przykład:
PROC CONTENTS data=save.class short;
run;
SAS  statystyka opisowa
Procedura univariate
pozwala na wyliczenie prostych statystyk opisowych, oprócz tego
pozwala dane przedstawić graficznie za pomocą histogramu
proc UNIVARIATE data=zbiór_wejściowy ;
var zmienne_analizowane;
;
;
;
>;
run;
Przykład
PROC univariate data=save.class;
var age;
histogram age;
run;
SAS  statystyka opisowa
Przykładowe tworzenie Data Set w Bibliotece
Work o jednej zmiennej A
data myfirst;
do A= 1 to 200;
output;
end;
run;
SAS  statystyka opisowa
Proste obliczenia:
" Funkcje rozkładów prawdopodobieństwa
" Rozkład Poissona
data Work.Myfirst;
length A 8 comp 8;
set Work.Myfirst;
comp=poisson(2,A);/* wywołanie funkcji poisson(wart_oczekiwana,n)=P(X<=n)*/
run;
" Rozkład normalny
aata Work.Myfirst;
length A 8 comp 8;
set Work.Myfirst;
comp=probnorm(A);/* wywołanie funkcji probnorm(A)=P(X<=A)*/
run;
dostępne funkcje to: probbeta (x,a,b), probbnml(p-sukcesu,n-ilość prób,m),
probchi(x, df-ilość stopni swobody), probf(x, ndf, ddf) , probnorm(x),
probt(x,df).
SAS  statystyka opisowa
Kwantyle
Istnieje możliwość wyznaczenia kwantyli dowolnego rzędu dla
określonych rozkładów jak: dla rozkładu:
beta - betainv(p, a, b)
chi kwadrat - cinv(p, df)
Fischera finv(p, ndf , ddf)
gamma- gaminv(p,a)
Normalnego - probit(p)
Studenta tinv(p,df)
data Work.Myfirst;
length A 8 comp 8;
set Work.Myfirst;
comp=probit(A);/* wyznaczenie kwantyli poprzez wywołanie funkcji */
run;
SAS  statystyka opisowa
Prosta statystyka
najczęściej wykorzystywanych funkcji statystycznych
kurtoza  kurtosis(n, n, n, n,...) (co najmniej cztery argumenty),
wartość maksymalna - max(n, n,...) (co najmniej dwa argumenty),
średnia - mean(n,...),
wartość minimalna - min(n,n,...) (co najmniej dwa argumenty),
ilość obserwacji - n(n,...) (co najmniej jeden argument),
ilość obserwacji opuszczonych tzw. missing value - nmiss(n,& ),
wartość maksymalna części listy - ordinal(ilość elementów branych pod
uwagę, n, n, n, ...),
zakres - range(n, n, ...),
skośność - skewness(n, n, n,...) (co najmniej trzy argumenty),
odchylenie standardowe std(n, n, ...),
standardowy błąd stderr(n, n, ...),
suma  sum(n, n, ...),
wariancja  var(n,n, ...).
SAS  statystyka opisowa
Standaryzowanie zmiennych losowych
data Work.Myfirst;
set Work.Myfirst;
comp_new=comp;
run;
proc standard data=Work.Myfirst MEAN=0 STD=1
out=Work.Myfirst;/*wywolanie gotowej procedury
standaryzującej do EX=0, VarX=1*/
var comp_new;
run;
SAS  statystyka opisowa
Ranking zmiennych
pozwala nam na logiczne uporządkowanie według
określonego kryterium
proc rank data=Work.myfirst FRACTION out=Work.mysec;
var A;
ranks A_ranks;
run;
wybrany został ranking ułamkowy. Wartość maksymalna
uzyskuje wartość 1, pozostałe odpowiednia część
ułamkową (np. max wartość 6, to dla zmiennej 1 wielkość
rankigu równa jest 1/6). SAS dopuszcza ranking prosty (od
1 do liczebności próby), ułamkowy, percentylowe (0-100),
decylowe (od 0 do 9), kwartylowe (0-4).
SAS  statystyka opisowa
Generowanie wybrane rozkłady zmiennych losowych
Rozkład normalny
data sample;
retain zm 0;
do i_zm= 1 to 200;
normall=0+1*rannor(zm);
output;
end;
drop zm i_zm;
run;
Rozkład jednostajny
data sample;
retain zm 0;
do i_zm= 1 to 200;
uni=ranuni(zm);
output;
end;
drop zm i_zm;
run;
SAS  statystyka opisowa
Generowanie wybrane rozkłady zmiennych losowych
Rozkład dwumianowy
data sample;
retain zm 0;
do i_zm= 1 to 200;
binomal=ranbin(zm,0,2,0.05);
output;
end;
drop zm i_zm;
run;
Rozkład chi-kwadrat
data sample;
retain zm 0;
do i_zm = 1 to 200;
chisqt=2*rangam(zm,20/2);
output;
end;
drop zm i_zm;
run;
SAS  statystyka opisowa
Generowanie wybrane rozkłady zmiennych losowych
Rozkład Poissona
data sample;
retain zm 0;
do i_zm = 1 to 200;
poisson=ranpoi(zm,1);
output;
end;
drop zm i_zm;
run;
Rozkład chi-kwadrat
data sample;
retain zm 0;
do i_zm = 1 to 200;
chisqt=2*rangam(zm,20/2);
output;
end;
drop zm i_zm;
run;


Wyszukiwarka

Podobne podstrony:
patomorfologia pytania egzamin opisowy
Opisowe
1 wprowadzenie do statystyki statystyka opisowa
patomorfologia opracowane pytania opisowe egzamin
2 Statystyka opisowa S
ocena opisowa didasko klasa II wg nowej podstawy(1)
opisowa kol1;
Gramatyka opisowa języka polskiego ściaga
Gramatyka opisowa
SAS Base 2006
Opisowa5
Statystyka opisowa
Statystyki opisowe
Statystyka opisowa rozwiązane kolowkia

więcej podobnych podstron