Kurs obsługi programu PASW Statistics
Agregacja danych
Autor: dr Dorota Juszczak, dr Joanna Karłowska-Pik
Agregowanie polega na wyliczeniu jednej lub wielu statystyk, takich jak
średnia, minimum, maksimum itp., dla grup obserwacji wyznaczonych przez
kategorie zmiennych grupujących. W wyniku tej procedury powstaje nowy plik
danych, w którym jedna obserwacja odpowiada jednej kategorii zmiennej
grupującej.
Aby dokonać agregacji należy wybrać Dane / Agreguj.... Pojawi się wtedy okno, w
którym musimy podać zmienne grupujące, czyli te, które tworzą nam kategorie, i
zmienne agregowane, czyli te, dla których statystyki chcemy policzyć. Możemy
wybrać funkcje, których wartości chcemy obliczyć (domyślnie jest średnia), i
utworzyć zmienną odpowiadającą liczbie obserwacji. Agregacji możemy dokonać
tworząc nowy plik danych lub zastępując bieżący plik plikiem z danymi
agregowanymi.
Ćwiczenie 1.: Plik band.sav zawiera dane dotyczące sprzedaży płyt CD zespołu
muzycznego. Na jego podstawie utwórz nowy plik o nazwie band_aggr.sav
zawierający wartości zmiennej performances oraz
zmienną m_sales będącą średnią arytmetyczną wielkości sprzedaży płyt dla grup
obserwacji wyznaczonych przez zmienną performances;
zmienną max_web będącą maksymalną wartością liczby pobrań wersji demo dla grup
obserwacji wyznaczonych przez zmienną performances;
zmienną liczba będącą liczbą obserwacji w grupie.
Ćwiczenie 2.: Plik piwo2.sav zawiera wielkość zamówienia składanego przez
wybrane puby w 15 miastach województwa kujawsko-pomorskiego w dzień powszedni
oraz w weekend. Na jego podstawie utwórz nowy plik o nazwie piwo2_aggr.sav
zawierający wartości zmiennej dz_tyg oraz
zmienną m_zam będącą średnią arytmetyczną wielkości zamówienia dla grup
obserwacji wyznaczonych przez zmienną dz_tyg,
zmienną min_zam będącą minimalną wartością wielkości zamówienia dla grup
obserwacji wyznaczonych przez zmienną dz_tyg,
zmienną proc_zam oznaczającą procent obserwacji, dla których wielkość
zamówienia jest większa od 1000 dla grup obserwacji wyznaczonych przez zmienną
dz_tyg,
zmienną l_obs będącą liczbą obserwacji w grupie.
Wyszukiwarka
Podobne podstrony:
Agregacja danych w klasyPraca mag Interaktywny system regułowej analizy danych marketingowych dotyczących satysfakcji klieWymagania agregat prądotwórczyKodowanie i kompresja danychKryptografia a bezpieczeństwo danychTypy danych w MySQLBAZY DANYCH Streszczenie z wykładówPHP i Oracle Tworzenie aplikacji webowych od przetwarzania danych po AjaksaUstawa z dnia 29 listopada 2000 o zbieraniu i wykorzystywaniu danych rachunkowych z gospodarstw rolnStrona polecenia do bazy danych[Volmarg ] Hurtownie danych 1 Częściowewięcej podobnych podstron