Analiza statystyczna z wykorzystaniem pakietu
SPSS 8.0 PL Wersja standardowa
(wybrane zagadnienia)
Zadania pakietu
Analiza danych definiowanych w postaci zmiennych (variable) odpowiadających kolumnom oraz obserwacji (case) odpowiadających wierszom.
Wyniki analizy zawsze dotyczą zmiennych (pojedynczych lub pogrupowanych).
Wyniki analizy przedstawiane są w postaci tabel (pivot table) lub wykresów (chart)
Tabele i wykresy można poddawać edycji.
Zasady pracy z pakietem SPSS
Okna
Edytor danych (Data Editor)
Edytor raportów (Viewer)
Uproszczony raport (Draft Viewer)
Edytor tabel przestawnych (Pivot Table Editor)
Edytor wykresów (Chart Editor)
Edytor tekstów (Text Output Editor)
Edytor poleceń (Syntax Editor)
Edytor skryptów (Script Editor)
Typy okien:
wyznaczone (designated) - oznaczone na pasku stanu czerwonym symbolem ! - oraz
aktywne (zgodnie z zasadami Windows).
Nowe okna Edytora danych i raportów są automatycznie oknami aktywnymi i wyznaczonymi.
Wyznaczanie okna:
uaktywnić okno, kliknąć ikonę ze znakiem ! (pasek narzędzi)
Z menu wybrać opcję Narzędzia|Wyznacz okno
Wyznaczanie okien jest ważne wtedy, gdy otwarte jest jednocześnie wiele okien, do których może być skierowany strumień wyników obliczeń lub strumień innych informacji. Jeśli chcemy np. utworzyć nowy raport, to przed wykonaniem obliczeń wybieramy opcję Plik|Nowy|Raport
Paski Menu:
Paski menu zależą od rodzaju okna. Na przykład, dla Edytora danych pasek menu zawiera następujące główne opcje:
Plik (otwieranie i zamykanie plików, zapis, drukowanie)
Edycja (edycja danych)
Widok (ustawianie widoku pasków, czcionka, itp.)
Dane (definiowanie zmiennych, sortowanie, operacje na danych, itp.)
Przekształcenia (tworzenie zmiennych będących wynikiem obliczeń wykonywanych na innych zmiennych, generacja liczb losowych, obróbka brakujących danych, itp.)
Statystyki (wykonywanie obliczeń statystycznych)
Wykresy ( graficzna prezentacja danych)
Narzędzia (opis zmiennych, definiowanie zestawów zmiennych, definiowanie skryptów, edycja menu, ..)
Okno
Pomoc
Dla innych okien zestawy opcji menu są różne (można je poddać edycji)
Paski narzędzi
Paski narzędzi składają się z ikon najczęściej używanych operacji. Zestaw narzędzi można ustawić opcją Widok|Paski narzędzi.
Standardowy zestaw dla edycji danych obejmuje, na przykład, następujące narzędzia (uaktywniane w miarę potrzeb):
Otwórz
Zapisz plik
Drukuj
Przywołaj okno
Cofnij
Przejdź do wykresu
Przejdź do obserwacji
Informacja o zmiennych
Znajdź
Wstaw obserwację
Wstaw zmienną
Podziel dane na podzbiory
Ważenie obserwacji
Wybierz obserwacje
Etykiety wartości
Użyj zestawów
Znaczenie ikon jest wyświetlane na ekranie po najechaniu na daną ikonę kursorem i odczekaniu pewnej chwili.
Pasek narzędzi można przemieszczać na ekranie.
Pasek stanu
Pasek stanu jest umieszczony na dole ekranu. Zawiera informacje o aktualnie wykonywanej czynności oraz informacje dodatkowe takie jak np.: wybór danych do analizy (filtr), podział danych na grupy, itp.
Pasek stanu można ukryć (lub ponownie wyświetlić) przy pomocy opcji Widok|Pasek stanu
Okna dialogowe
Okna dialogowe służą do wyboru zmiennych do analizy oraz do wyboru różnych opcji.
Okno dialogowe zawiera:
Listę zmiennych źródłowych (wszystkie zmienne)
Listę zmiennych docelowych (zmienne wybrane)
Przyciski komend (OK, Wklej, Resetuj, Anuluj, Pomoc)
Przyciski otwierające okna dialogu podrzędnego (opisane w następujący sposób: nazwa.....)
Wyboru zmiennych do analizy dokonujemy przez zaznaczenie tych zmiennych na liście zmiennych źródłowych oraz naciśnięcie przycisku w kształcie trójkąta (skierowanego w stronę listy zmiennych docelowych). Wybrana zmienna pojawia się na liście zmiennych docelowych (target variables). Wybór można odwrócić przez zaznaczenie zmiennej na liście zmiennych docelowych i naciśnięcie przycisku trójkąta (skierowanego w stronę listy zmiennych źródłowych).
Informację o wybieranych zmiennych uzyskujemy przez zaznaczenie danej zmiennej, kliknięcie prawym przyciskiem myszy i wybranie opcji Informacja o zmiennej.
Informację o oknach dialogu podrzędnego uzyskujemy przez naprowadzenie kursora na odpowiedni przycisk i naciśnięcie prawego przycisku myszy.
Edycja danych
Dane w pakiecie SPSS definiowane są w postaci zmiennych, którym odpowiadają kolumny w arkuszu danych. Dla każdej zmiennej dane są obserwacje podane w kolejnych wierszach danej kolumny.
Każda zmienna określona jest przy pomocy następujących cech:
nazwa (max. 8 znaków)
typ danych (numeryczny, tekst, data,...)
etykiety (opisujące zmienną i jej dane)
kody wartości brakujących
poziom pomiaru (ilościowy, porządkowy, nominalny)
Zmienną definiujemy przez dwukrotne kliknięcie etykiety kolumny lub przez wybór opcji Dane|Definiuj zmienną....
Nazwa zmiennej musi zaczynać się od litery, może składać się z co najwyżej 8 liter, cyfr i niektórych znaków i nie powinna kończyć się kropką i podkreśleniem. Te same nazwy nie mogą się powtarzać, przy czym wielkość liter nie ma tu znaczenia.
Typ zmiennej może być: numeryczny, przecinkowy (kropka dziesiętna, przecinki co 3 cyfry), z kropką (przecinek dziesiętny, kropka co 3 cyfry), notacja naukowa (xEy), data i czas, dolar, format użytkownika (numeryczny, zdefiniowany w opcjach) oraz tekstowy.
Etykiety dotyczą zmiennych (opis zmiennej do 255 znaków) oraz danych (przypisanie nazwy dla danej wartości numerycznej).
Kody wartości brakujących stosowane są wtedy gdy dla danego zestawu obserwacji (przypadku odpowiadającemu wierszowi danych) brakuje jakiejś wartości. Wprowadzając odpowiednie kody można zaznaczyć przyczynę braku danej wartości.
Poziom pomiaru dotyczy procedur tworzenia wykresów, w których należy zaznaczyć, czy wykreślane dane dotyczą wyników mierzalnych na skalach, czy też danych porządkowych (kategorie) lub nominalnych (np. tekstowych).
Po określeniu danej zmiennej można wprowadzać dane. Jeżeli dane będziemy wprowadzać przed zdefiniowaniem zmiennej, to program nada domyślną nazwę i przyjmie domyślnie typ numeryczny.
Wprowadzanie danych w formacie innym niż format zdefiniowanej zmiennej jest niemożliwe.
Dane można poddawać normalnej edycji: kopiowanie, wycinanie, wklejanie. Edycji danych można dokonywać w okienku edycji danych (jak w arkuszach kalkulacyjnych).
Poszczególne zmienne można przenosić w ramach arkusza (zaznaczyć kolumnę przez kliknięcie nagłówka, wyciąć i wkleić w nowe miejsce).
Można tworzyć nowe zmienne wykonując operacje na istniejących zmiennych. Korzystamy z opcji Przekształcenia|Oblicz wartości...
Otwiera się okno edytora wzorów z listą dostępnych zmiennych, kalkulatorem z przyciskami operacji arytmetycznych oraz listą funkcji matematycznych. Możliwa jest konstrukcja wyrażeń warunkowych typu jeśli .. to ... .
Operacje na plikach danych.
Otwieranie plików danych: opcja Plik|Otwórz
Pakiet SPSS czyta pliki danych zapisane w jego własnym formacie (nazwa.sav) oraz w formacie innych programów (dBase, Excel, Lotus) ale w starych wersjach. Może też czytać pliki tekstowe z danymi oddzielonymi znakiem tabulatora.
Pliki odczytywane są w postaci prostokątnych obszarów danych bez pól pustych. Pola puste zapisywane są jako dane brakujące.
W przypadku konieczności odczytu danych z plików utworzonych przez programy z mechanizmem ODBC korzysta się z opcji Plik|Przejmij bazę danych.
Wykorzystuje się mechanizm tworzenia kwerend Microsoftu.
W przypadku plików zapisanych w formacie MS Excel (wersja 5 i dalsze) kandydatami do zmiennych importowanych przez SPSS są kolumny danych w arkuszach oraz obszary mające swoją nazwę. Jeżeli w danej kolumnie Excela występuje tekst, to jest on traktowany jako nazwa zmiennej w SPSS.
Opracowaną kwerendę można zapisać (nazwa.spq) i wykorzystać w przyszłości np. do uaktualniania danych.
Przenoszenie danych w systemie Windows
Do przenoszenia danych można także wykorzystać mechanizm kopiowania (Kopiuj, Wklej) systemu Windows. Kopiowane dane muszą być tego samego typu co zmienne SPSS. W przypadku niezgodności typów wpisywane są dane brakujące.
4.3 Zapisywanie plików danych
Pliki danych w SPSS zapisywane są we własnym formacie SPSS komendą Plik|Zapisz.
Wykorzystując komendę Plik|Zapisz jako można te dane zapisać w innych formatach (nie można zapisać w nowych formatach programów windowsowych, np. Excela 7).
Inne operacje na plikach danych
Dane zawarte w plikach danych SPSS można poddawać różnym transformacjom, takim jak
zamiana wierszy z kolumnami poleceniem Dane|Transponuj (Uwaga na typy zmiennych)
sortowanie tabeli danych (obserwacji) poleceniem Dane|Sortuj obserwacje (wg wartości wybranych zmiennych)
tworzenie nowych plików danych przez łączenie (merging) istniejących plików przy pomocy polecenia Dane|Połącz dane. Możliwe jest dodawanie obserwacji (przez połączenie plików zawierających te same zmienne ale różne obserwacje) oraz dodawanie zmiennych (przez połączenie plików zawierających te same obserwacje ale różne zmienne). Jeżeli łączone pliki zawierają również inne obserwacje lub zmienne, to można je wykluczyć z połączenia.
tworzenie nowych zmiennych z wykorzystaniem słownika zmiennych
wybieranie określonych obserwacji do analizy
nadawanie różnych wag poszczególnym obserwacjom
i inne
Obliczenia statystyczne i raporty z obliczeń.
Po wprowadzeniu danych możemy wykonać obliczenia statystyczne korzystając z polecenia Statystyki.
Polecenie Statystyki ma następujące główne opcje:
Opis statystyczny
Tabele specjalne
Porównywanie średnich
Ogólny model liniowy
Korelacje
Regresja
Analizy logliniowe
Klasyfikacja
Redukcja danych
Skalowanie
Testy nieparametryczne
Szeregi czasowe
Analizy przeżycia
Wielokrotne odpowiedzi
Analiza braków danych
Każda z tych opcji ma swoje opcje uruchamiające obliczenia różnych procedur statystycznych.
Po wyborze odpowiedniej procedury otwiera się okno dialogowe służące do wyboru poddawanych analizie zmiennych oraz ustawieniu innych parametrów procedury (np. ustaleniu poziomu istotności testu statystycznego).
Wyniki obliczeń wyświetlane są w Edytorze raportów SPSS w postaci tablic przestawnych (pivot tables), gdzie można je poddać edycji, uzupełnić komentarzami, zapisać w pliku (nazwa.spo) lub wydrukować.
Edytor raportów SPSS
Edytor raportów SPSS składa się z dwu paneli
panelu struktury, w którym wyświetlona jest struktura (outline) raportu,
panelu wyników, w którym wyświetlane sa tabele z wynikami obliczeń, wykresy, komunikaty SPSS, itp.
Panel struktury służy do nawigacji pomiędzy fragmentami raportu oraz do jego edycji. W panelu tym możemy dokonywać operacji usuwania fragmentów raportu (opcja Edycja|Usuń), zamieniania kolejności fragmentów raportu (np. przez przeciąganie ich ikon na drzewie struktury), ukrywania fragmentów raportu bez ich usuwania (zaznaczyć fragment na drzewie struktury, wykonać polecenie Widok|Ukryj) itp.
Właściwy raport wyświetlany jest w panelu wyników. Składa się on z komunikatów SPSS (np. o niemożliwości wykonania pewnych operacji) - w języku angielskim, opisu rezultatów obliczeń numerycznych (nazwa procedury, tabela przestawna z wynikami obliczeń) oraz wykresów.
Tabele przestawne oraz wykresy można poddawać edycji po ich dwukrotnym kliknięciu. W zależności od edytowanego obiektu pojawia się właściwe okno edycyjne.
Do raportu można wklejać (opcja Wstaw) pliki tekstowe, rysunki oraz obiekty systemu Windows (pliki arkuszy kalkulacyjnych, pliki edytorów tekstu, pliki graficzne, pliki dźwiękowe, i wiele innych ..!!!!!!!).
Przygotowany raport można zapisać do pliku i wydrukować.
1
O.Hryniewicz: Analiza statystyczna - komputery (8 godz.) 47