Zastosowanie komputerów
Michał Ścibor-Rylski
Wprowadzenie do SPSS
Zajęcia 1
1. SPSS jest tylko programem
To Wy wykonujecie wszelkie przekształcenia i analizy – opieracie się na własnej
wiedzy. SPSS wykona wszystkie Wasze polecenia – musicie jednak wiedzieć co mu
zlecić. Do pracy na tych zajęciach niezbędna jest zatem Wam wiedza
statystyczna z wykładu oraz systematyka. Bierzcie aktywny udział w zajęciach,
odrabiajcie prace domowe, powtarzajcie materiał przed sprawdzianami, a na
pewno zobaczycie rezultaty w indeksie oraz na piątym roku, gdy zaczniecie
analizować własne prace magisterskie.
Kilka prawd o SPSS
2. SPSS jest aż programem
SPSS to bardzo rozbudowany program. Przy odrobinie cierpliwości pozwoli Wam
sprawnie pracować ze zbiorami danych, analizować własne badania i odczytywać
wyniki. Dzięki temu, że wszystko to wykonujecie samodzielnie, macie okazję
wprowadzić wiedzę statystyczną w praktykę – nie uczycie się pustych wzorów i
reguł, ale zaczynacie je stosować w realnych sytuacjach, w psychologii, którą
zdecydowaliście się studiować przez pięć lat.
3. SPSS ułatwia życie
Nie walczcie ze statystyką. Nie walczcie z SPSSem. Gdy czegoś nie rozumiecie,
pytajcie na zajęciach, na forum e-learningowym, mailowo. Na wszystkie pytania
na pewno odpowiemy. Nie poddawajcie się, gdy któryś temat wydaje się Wam
trudny. Pamiętajcie, że statystyka jest dla Was tylko narzędziem. Nie musicie
wiedzieć wszystkiego. Powinniście starać się raczej rozumieć reguły rządzące
procesem badawczym w psychologii. Wiedza statystyczna jest niezwykle
przydatna w projektowaniu badań. Nie wspomnę już o ich analizie...
Po zainstalowaniu SPSSa i wpisaniu odpowiednich kodów nie powinniście mieć
problemów z uruchomieniem tego programu. Można tak:
START – programy – SPSS for Windows
Po uruchomieniu pojawia się plansza:
Pierwsze kroki – odpalamy SPSS
Można ją zamknąć, lub klinkąć
„wprowadzaj dane” i przystąpić
do wpisywania danych. Dzięki
tej planszy możemy np. szybko
uruchomić ostatnio używany
plik. pamiętajmy tylko, że musi
on mieć taką samą ścieżkę
dostępu, jak wtedy, gdy był
poprzednio otwierany.
Pliki
danych
SPSS
mają
rozszerzenie .sav
Uruchomiliśmy program. Nie mamy jednak żadnych danych. Możemy otworzyć
istniejący plik (analogicznie jak w Wordzie, czy Excelu: Plik – otwórz – dane), lub
zacząć wpisywać dane samodzielnie. Zaczniemy od tej drugiej możliwości. Na
dole po lewej stronie znajdują się zakładki: „dane” i „zmienne”. W
„zmiennych” definiujemy właściwości mierzone w naszym badaniu. Mogą to być
dowolne cechy psychologiczne, demograficzne i pozostałe. Każda właściwość,
która różnicuje badanych może być zmienną. Przykłady zmiennych: płeć, poziom
IQ, poziom ekstrawersji, liczba kotów w gospodarstwie domowym, stosunek do
wyborów itd. Pamiętajmy, że dana zmienna może być mierzona za pomocą
różnych wskaźników (sposobów jej operacjonalizacji): np. sympatię do drugiej
osoby możemy mierzyć liczbą uśmiechów, własną skalą sympatii z 10 pytaniami,
możemy też zapytać o wrażenia drugą osobę.
Pierwsze kroki – dane/zmienne
W SPSSie pod pojęciem „zmienna”
rozumiemy każdy wskaźnik, który
chcemy analizować.
W „danych” wpisujemy informacje
o tym, jaki poziom zdefiniowanych
wcześniej
zmiennych
charakteryzuje nasze osoby. To tutaj
wpisujemy konkretne wyniki: np.
osoba 1 to kobieta, ma 29 lat i
słucha Toola.
Kolejny
slajd
przybliży
istotę
definiowania zmiennych.
SPSS w większości przypadków wymaga od nas wprowadzenia danych w formacie
liczbowym. Pamiętajmy, że jest to program statystyczny i raczej nie ma sensu
operować tylko słowami. Analiza ilościowa (w przeciwieństwie do jakościowej)
polega na jak najbardziej precyzyjnym „domykaniu” uzyskanych kategorii. Nawet
w przypadku zmiennych, które dotyczą opinii respondentów, możemy stworzyć
bardziej ogólne kategorie, do których będziemy mogli zaliczać poszczególne
wypowiedzi. Dzięki temu ograniczymy liczbę informacji i ułatwimy sobie analizy.
Przyjmijmy, że każda informacja wpisywana do SPSSa jest liczbą. Należy zatem
przypisać liczby do poszczególnych poziomów (kategorii) każdej zmiennej. Poziom
zmiennej to inaczej wartość, jaką może ona przyjmować. Weźmy na przykład
płeć. Jest to zmienna dwukategorialna: można być mężczyzna, lub kobietą.
Przypiszmy wartości liczbowe tym poziomom:
np.
1 – kobieta
2 – mężczyzna
W ten sposób powinniśmy postąpić ze wszystkimi zmiennymi, w przypadku
których nie ma jasności, co oznacza dana wartość (po roku możemy nie
pamiętać, co oznaczała 1 przy płci). W przypadku zmiennych ilościowych (o
typach skal pomiarowych dowiecie się później) nie ma potrzeby wpisywania
etykiet wartości (nazw słownych). Wiadomo przecież, że w przypadku wieku,
wartość 29 oznacza 29 lat.
Definiowanie zmiennych
Wyobraźmy sobie proste badanie, w którym dokonujemy pomiaru trzech
zmiennych: imię osoby badanej, jej wiek i to, czy lubi pizzę. Przejdźmy do
zakładki „zmienne” i wpiszmy nazwy tych zmiennych:
Definiowanie zmiennych
Warto
zawsze
stworzyć
dodatkową
zmienną
określającą
numer osoby badanej.
Numeracja w zakładce
„dane” jest stała, a
kolejność osób w pliku
może się zmieniać,
więc
istnieje
zagrożenie
utraty
informacji o tym, na
którą osobę patrzymy.
Zmienna, która na
stałe określa numer
badanego pozwala w
szybki
sposób
np.
dotrzeć
do
kwestionariusza o tym
samym numerze.
Przyjrzyjmy się poszczególnym zmiennym:
IMIĘ –
w tym przypadku możemy wyjątkowo wpisać wartości za pomocą liter.
Trudno byłoby stworzyć kategorie liczbowe dla wszystkich imion. Można pokusić
się o najbardziej popularne, ale przy każdym nowym przypadku musielibyśmy
rozszerzać kafeterię.
WIEK –
sprawa jest prosta. Wpisujemy konkretne wartości w latach.
PIZZA –
musimy ustalić skalę, którą posługiwali się badani. Przecież odpowiedź
na pytanie, czy ktoś lubi pizzę może brzmieć „tak” lub „nie”, może być udzielona
na 5 stopniowej skali Likerta (od „zdecydowanie tak” do „zdecydowanie nie”),
bądź też na 100 stopniowej skali. W naszym przypadku będzie to 5 stopniowa
skala.
Każda zmienna jest definiowana przez kilka własności:
NAZWA –
wpisujemy nazwę zmiennej
TYP –
ustalamy typ wprowadzanych danych – najczęściej będzie to typ
numeryczny. Pozwala on wykonaywać na zmiennych analizy wymagające
policzenia np. średniej. Drugi wykorzystywany typ to tekstowy. Zastosujemy go w
przypadku zmiennej „imię”
ETYKIETA –
rozwinięcie nazwy zmiennej. Warto tu wpisać dokładne informacje o
zmiennej, gdy nazwa nie jest jasna.
WARTOŚCI –
tu definiujemy etykiety wartości – wpisujemy np. że 1 to kobieta, 2
to mężczyzna. W naszym przykładzie wartości zdefiniujemy dla zmiennej „pizza”.
Definiowanie zmiennych
Po zdefiniowaniu zmiennych okno SPSSa powinno wyglądać tak:
Definiowanie zmiennych
Załóżmy, że zbadaliśmy trzy osoby. Pierwsza to Piotr, który ma 27 lat i
odpowiedział, że raczej lubi pizzę.
Przechodzimy do zakładki „dane”. Zobaczcie, że zmienne, dotychczas
umieszczone w wierszach, teraz są w kolumnach. Każdy wiersz to kolejna osoba.
Poprawny zapis danych wygląda tak:
Wprowadzanie danych
To
bardzo
prosta
ankieta, ale w ten
sposób wprowadzamy
dane ze wszystkich
badań
psychologicznych. W
niektórych
przypadkach rejestruje
je komputer (np. czasy
reakcji), a my tylko
musimy przerzucić je
do SPSSa.
Gdy nasze dane są już wprowadzone, możemy je zapisać. Oczywiście proponuję
Zrobić to na samym początku wpisywania (przy większych zbiorach) i potem tylko
sukcesywnie dopisywać nowo wykonaną pracę. W przeciwnym wypadku
ryzykujemy utratę naszej pracy.
Zapisywanie danych
PYTANIA WIELOKROTNEGO WYBORU
Warto wiedzieć, w jaki sposób wprowadzać dane z pytań wielokrotnego wyboru.
W przypadku gdy pytamy np. o to jakie ktoś lubi książki, a mozliwe są trzy
odpowiedzi: 1 – kryminały, 2 – przygodowe, 3 – poezję, może się zdarzyć, że ktoś
lubi wszystkie trzy kategorię. Należy dla każdej kategorii stworzyć oddzielną
zmienną zawierającą jedynie informację o tej kategorii. Powstaną trzy zmienne:
nazwijmy je: ks_krymin, ks_przyg oraz ks_poez. Każda z tych zmiennych może
przyjmować tylko dwie wartości: 1- lubi, 2-nie lubi. Dzięki temu wpiszemy
informację o stosunku osób badanych do każdej kategorii.
IMPORT DANYCH Z EXCELA
Często spotkacie się z bazami danych w Excelu. Takie dane można łatwo otworzyć
w SPSSie, jeśli mają taki sam format, tzn. zmienne są zapisane w kolumnach, a
obserwacje w wierszach. Po prostu w SPSSie otwieramy plik zaznaczając
wcześniej typ pliku MS EXCEL. Mamy możliwość zapisania informacji z pierwszego
wiersza jako nazw zmiennych. Należy pamiętać, że SPSS dopiero od wersji 12.0
umożliwił wprowadzanie dłuższych niż 8 znaków nazw zmiennych. W przypadku
próby otwarcie pliku Excela z dłuższymi niż 8 znaków nazwami zmiennych za
pomocą np. SPSS 11.5, pojawią się błędy.
IMPORT DANYCH Z INNYCH PROGRAMÓW
Wiele programów służących do przeprowadzania eksperymentów (Superlab, E-
prime), zapisuje rezultaty osób badanych w formie pliku Excela, lub pliku
tekstowego. Oczywiście takie dane też można bezboleśnie przenieść do SPSSa.
Informacje dodatkowe