Kurs obs艂ugi programu PASW Statistics
Agregacja danych
Autor: dr Dorota Juszczak, dr Joanna Kar艂owska-Pik
Agregowanie polega na wyliczeniu jednej lub wielu statystyk, takich jak 艣rednia, minimum, maksimum itp., dla grup obserwacji wyznaczonych przez kategorie zmiennych grupuj膮cych. W wyniku tej procedury powstaje nowy plik danych, w kt贸rym jedna obserwacja odpowiada jednej kategorii zmiennej grupuj膮cej.
Aby dokona膰 agregacji nale偶y wybra膰 Dane / Agreguj.... Pojawi si臋 wtedy okno, w kt贸rym musimy poda膰 zmienne grupuj膮ce, czyli te, kt贸re tworz膮 nam kategorie, i zmienne agregowane, czyli te, dla kt贸rych statystyki chcemy policzy膰. Mo偶emy wybra膰 funkcje, kt贸rych warto艣ci chcemy obliczy膰 (domy艣lnie jest 艣rednia), i utworzy膰 zmienn膮 odpowiadaj膮c膮 liczbie obserwacji. Agregacji mo偶emy dokona膰 tworz膮c nowy plik danych lub zast臋puj膮c bie偶膮cy plik plikiem z danymi agregowanymi.
膯wiczenie 1.: Plik band.sav zawiera dane dotycz膮ce sprzeda偶y p艂yt CD zespo艂u muzycznego. Na jego podstawie utw贸rz nowy plik o nazwie band_aggr.sav zawieraj膮cy warto艣ci zmiennej performances oraz
zmienn膮 m_sales b臋d膮c膮 艣redni膮 arytmetyczn膮 wielko艣ci sprzeda偶y p艂yt dla grup obserwacji wyznaczonych przez zmienn膮 performances;
zmienn膮 max_web b臋d膮c膮 maksymaln膮 warto艣ci膮 liczby pobra艅 wersji demo dla grup obserwacji wyznaczonych przez zmienn膮 performances;
zmienn膮 liczba b臋d膮c膮 liczb膮 obserwacji w grupie.
膯wiczenie 2.: Plik piwo2.sav zawiera wielko艣膰 zam贸wienia sk艂adanego przez wybrane puby w 15 miastach wojew贸dztwa kujawsko-pomorskiego w dzie艅 powszedni oraz w weekend. Na jego podstawie utw贸rz nowy plik o nazwie piwo2_aggr.sav zawieraj膮cy warto艣ci zmiennej dz_tyg oraz
zmienn膮 m_zam b臋d膮c膮 艣redni膮 arytmetyczn膮 wielko艣ci zam贸wienia dla grup obserwacji wyznaczonych przez zmienn膮 dz_tyg,
zmienn膮 min_zam b臋d膮c膮 minimaln膮 warto艣ci膮 wielko艣ci zam贸wienia dla grup obserwacji wyznaczonych przez zmienn膮 dz_tyg,
zmienn膮 proc_zam oznaczaj膮c膮 procent obserwacji, dla kt贸rych wielko艣膰 zam贸wienia jest wi臋ksza od 1000 dla grup obserwacji wyznaczonych przez zmienn膮 dz_tyg,
zmienn膮 l_obs b臋d膮c膮 liczb膮 obserwacji w grupie.