Kurs obsługi programu PASW Statistics
Autor: dr Dorota Juszczak, dr Joanna Karłowska-Pik
Podstawowe statystyki i ich interpretacja
Podstawowe statystyki program PASW Statistics oblicza w kilku miejscach:
Analiza -> Raporty i zestawienia -> Podsumowania obserwacji... -> Statystyki - lista statystyk do wyboru,
Analiza -> Opis statystyczny -> Częstości... -> Statystyki... - lista statystyk do wyboru, plus tabele częstości oraz wykresy (słupkowy, kołowy lub histogram z lub bez krzywej rozkładu normalnego),
Analiza -> Opis statystyczny -> Statystyki opisowe... -> Opcje... - lista statystyk do wyboru plus standaryzacja zmiennych,
Analiza -> Opis statystyczny -> Eksploracja... obliczane są: średnia, przedział ufności dla średniej (o zadanym poziomie ufności), średnia obcięta, mediana, wariancja, odchylenie standardowe, minimum, maksimum, rozstęp, rozstęp ćwiartkowy, skośność i kurtoza; dodatkowo mogą być liczone M-estymatory, wartości skrajne i percentyle oraz robione wykresy (skrzynkowe, łodyga i liście, histogram oraz wykresy normalności z testami).
Ćwiczenie 1. Średnie kursy EUR Narodowego Banku Polskiego w dniach roboczych od 2009-06-15 do 2009-06-30 wynosiły:
4,50 4,54 4,52 4,55 4,54 4,50 4,55 4,55 4,52 4,51 4,49 4,47
Oblicz podstawowe statystyki opisowe dla tej próby, najpierw rachunkowo (z pomocą Excela), a potem z użyciem programu PASW Statistics.
Ćwiczenie 2. Dla danych zawartych w pliku Dane o zatrudnieniu.sav wykonaj następujące czynności:
dokonaj analizy częstości grup pracowniczych w postaci tabeli i graficznie (wykres słupkowy),
dla stażu pracy wylicz wartość minimalną i maksymalną, średnią i odchylenie standardowe,
oblicz podstawowe statystyki dla bieżącego wynagrodzenia, wykonaj podstawowe wykresy (histogram, skrzynkowy), zastanów się, które ze statystyk najlepiej opisują badaną zmienną, jakich informacji nam dostarczają?
ile wynosi wynagrodzenie, poniżej którego znajdują się zarobki 20% pracowników, a ile takie, powyżej którego znajdują się zarobki tylko 10% pracowników?
Ćwiczenie 3. Plik handel.sav zawiera wysokość obrotów towarowych (w mld zł.) 20 największych firm handlowych w Polsce w 1998 r. Dane są wyrażone w jednostkach waluty krajowej. Posortuj obserwacje malejąco ze względu na wysokość obrotów. Wykonaj podstawową analizę statystyczną wysokości obrotów. Sporządź raport.
Normalizacja
Normalizacja polega na wyliczeniu średniej i odchylenia standardowego zmiennej, a następnie odjęciu średniej od wszystkich wartości średniej i podzieleniu otrzymanej różnicy przez odchylenie standardowe. Pozwala to na porównywanie wartości różnych zmiennych w obrębie obserwacji. Może się okazać, że dla danej obserwacji wartość jednej zmiennej jest większa niż drugiej, ale patrząc ,,na tle grupy'' może się okazać, że wynik pierwszej zmiennej jest ,,gorszy'' niż drugiej. Normalizacja zmiennej dokonuje się automatycznie po wybraniu Analiza -> Opis statystyczny -> Statystyki opisowe i zaznaczeniu Zapisz standaryzowane wartości jako zmienne. W pliku pojawia się wówszas zmienna wartości standaryzowanych.
Ćwiczenie 4. W pliku Employee data.sav znajdują się dane pracowników firmy, m.in. ich początkowe i bieżące wynagrodzenie. Osoba o numerze 29 zarabia teraz 1,7 razy więcej niż na początku, więc jej wynagrodzenie znacznie wzrosło. Jednak pozostali pracownicy również zarabiają więcej. Wykonaj procedurę standaryzacji i odpowiedz na pytanie, czy rzeczywiście, przy uwzględnieniu ogólnego wzrostu wynagrodzeń, sytuacja osoby o numerze 29 poprawiła się. Co można powiedzieć o osobie numer 18?