Zajęcia I - 6 października
Przedmiotem zajęć jest nauka analizy danych z pomocą narzędzia, jakim jest pakiet statystyczny SPSS (Statistical Package for Social Sciences)
Po otwarciu programu widoczne są dwie zakładki: Dane i Zmienne
W zakładce Dane wprowadzamy wyniki badania/kwestionariusza: w każdym wierszu wyniki jednej osoby, w kolumnach kolejne zmienne/pytania. Jeżeli wcześniej nie zdefiniujemy zmiennych, komputer zaproponuje nam ustawienia domyślne, na podstawie pierwszej wpisanej w danej kolumnie wartości.
W zakładce Zmienne określamy charakterystyki zmiennych(pytań): nazwę, etykietę, typ, szerokość pola i liczbę miejsc dziesiętnych, wartości przyjmowane przez zmienną i ich etykiety, wartości oznaczające brak danych
Domyślna charakterystyka zmiennej to nazwa "var" i nr kolejny; typ numeryczny; szerokość - 8; miejsc dziesiętnych - 2
Nazwa zmiennej może składać się z ośmiu podstawowych znaków (nie mogą w niej występować znaki polskie i spacja)
Etykieta zmiennej to miejsce w którym możemy ją opisać - np. wpisać pełne brzmienie pytania
Jeśli zmienna dzieli osoby badane na kilka kategorii, najlepiej każdej kategorii przypisać wartość liczbową, a ich znaczenie zapisać jako etykiety tych wartości
Jeśli nie znamy jakiegoś wyniku osoby badanej, możemy nie wpisywać do komórki żadnej wartości Program odczyta to jako systemowy brak danych. Możemy także wpisać wartość spoza zakresu prawidłowych odpowiedzi i zdefiniować ją jako brak danych w zakładce Zmienne.
Plik z danymi zapisujemy wybierając z menu pozycję Plik>Zapisz jako; SPSS zapisuje pliki z danymi pod podaną nazwą dodając rozszerzenie ".sav"
Aby otworzyć gotowy plik z danymi należy wybrać z menu Plik>Otwórz; program zaproponuje pliki z rozszerzeniem ".sav"
W otwartym pliku możemy obejrzeć charakterystyki zmiennych albo w zakładce Zmienne albo w dodatkowym oknie, które pojawi się po wybraniu z menu pozycji Narzędzia>Zmienne
Zajęcia II i III - 13 i 20 października
Dzięki opcjom dostępnym w menu Przekształcenia można utworzyć nowe zmienne na podstawie już istniejących:
polecenie Oblicz wartość zmiennej pozwala na utworzenie nowej zmiennej, będącej np. sumą lub średnią wartości przyjmowanych przez wybrane, istniejące już zmienne
polecenie Zlicz wystąpienia pozwala na utworzenie nowej zmiennej, wskazującej ile razy w grupie wartości przyjmowanych przez wybrane, istniejące już zmienne, pojawiają się wartości wskazane w formularzu
polecenie Rekoduj pozwala na przekodowanie wartości zmiennej, np. na wartości z węższego zakresu lub wartości o odwrotnej kolejności: można wybrać utworzenie nowej zmiennej, zawierającej "poprawione" wartości (bezpieczniej!) lub zapisanie "poprawionych" wartości w tej samej zmiennej.
W każdym z tych poleceń przycisk Jeżeli pozwala ograniczyć przekształcenie do części obserwacji (osób badanych)
Dzięki opcjom dostępnym w menu Dane można zadecydować na jakim zbiorze obserwacji (osób badanych) mają być wykonywane analizy:
Podziel na podzbiory - dane zostaną podzielone na podgrupy i analizy będą wykonywane osobno dla każdej z podgrup
Wybierz obserwacje - analiza zostanie wykonana tylko na wybranych danych, pozostałe zostaną pominięte: odfiltrowane (bezpieczniej!) lub usunięte
Ważenie obserwacji - pozwala na zróżnicowanie wpływu poszczególnych obserwacji na wynik analiz; wymaga stworzenia wcześniej zmiennej ważącej, określającej wagę każdej obserwacji
Zmienne mogą być mierzone na czterech poziomach (skalach)
nominalne: obserwacjom przypisane są różne kategorie - dowiadujemy się, czy jedna obserwacja różni się od drugiej
porządkowe: obserwacjom przypisane są kategorie uporządkowane wg nasilenia badanej cechy - dowiadujemy się, która obserwacja ma większe nasilenie cechy, a która mniejsze
przedziałowe (interwałowe): obserwacjom przypisane są punkty na skali nasilenia cechy posiadającej stałą jednostkę - dowiadujemy się o ile jedna obserwacja ma większe nasilenie cechy od drugiej
stosunkowe (ilorazowe): obserwacjom przypisane są punkty na skali nasilenia cechy posiadającej stałą jednostkę i zero bezwzględne, oznaczające całkowity brak cechy - dowiadujemy się ile razy jedna obserwacja ma większe nasilenie cechy od drugiej
Skale nominalne i porządkowe nazywamy skalami jakościowymi, a skale przedziałowe i stosunkowe - ilościowymi.
Od poziomu pomiaru zależy, jakie przekształcenia na wartościach zmiennej możemy wykonywać.
Zajęcia IV - 27 października
Zmienne stosowane w psychologii często traktujemy jako przedziałowe, choć nie można wskazać w nich skali. Przesłanką do takiego traktowania jest fakt, że "w pewnych sytuacjach uznaje się, ze zmienna porządkowa reprezentuje ukrytą zmienną mierzalną i fakt pomiaru za pomocą skali porządkowej jest tylko efektem niedoskonałości narzędzi badawczych" (Górniak, Wachnicki, 2000).
Zmienna tak traktowana musi być jednowymiarowa, tzn. najniższe jej wartości muszą wskazywać na małe nasilenie cechy, a duże na duże nasilenie cechy. Jeśli wartości zmiennej są powiązane z dwoma kierunkami nasilenia cechy (zły - dobry, piękny - brzydki) zmienna nie może być traktowana jak przedziałowa.
Dla wszystkich zmiennych możemy wykonać analizy częstości (częstość = liczba obserwacji dla których zmienna przybiera każdą ze swoich wartości). Dobrym narzędziem do analizy częstości dwóch zmiennych jakościowych są Tabele krzyżowe. Mamy możliwość pokazania częstości w każdej z celek w postaci: (a) liczebności, (b) % wszystkich obserwacji lub (c) % obserwacji w podgrupie wyodrębnionej na podstawie jednej ze zmiennych
Analiza częstości to inaczej analiza rozkładu zmiennej.
Rozkład zmiennej charakteryzują dwie grupy miar, przy czym możliwość ich zastosowania zależy od poziomu pomiaru:
miary tendencji centralnej opisują to, co jest typowe dla rozkładu: (a) dominanta (modalna) to wartość najczęściej przyjmowana przez zmienną; (b) mediana to wartość, którą zmienna przyjmuje dla środkowej obserwacji; (c) średnia to arytmetycznie wyliczona wartość wynikająca z podzielenia sumy przyjmowanych przez zmienną wartości przez liczbę obserwacji
miary rozproszenia opisują jak blisko centrum rozkładu ułożone są obserwowane wartości zmiennej, podane niżej można stosować przy ilościowym poziomie pomiaru: (a) rozstęp to różnica między najmniejszą a największą wartością zmiennej; (b) wariancja, najczęściej stosowana miara, to średni kwadrat odchylenia wartości zmiennej od średniej; (c) odchylenie standardowe to pierwiastek kwadratowy z wariancji
WAŻNE - wzory obliczeniowe i sposób obliczania średniej, wariancji i odchylenia standardowego.
Literatura polecana:
Górniak, J., Wachnicki, J. (2002). SPSS PL for Windows. Pierwsze kroki w analizie danych. SPSS Polska, Kraków.
Zajęcia V - 3 listopada
W statystyce kluczową rolę pełni szczególny, precyzyjnie opisany przez matematyków, rozkład, nazywany rozkładem normalnym, krzywą normalną lub krzywą Gaussa. Zgodnie z teorią większość zmiennych obserwowanych w przyrodzie ma rozkład normalny.
Aby porównać rozkład otrzymany w naszej próbie z rozkładem normalnym powinniśmy zastosować dwie dodatkowe miary:
kurtoza - mierzy koncentrację rozkładu, przejawiającą się w jego spłaszczeniu lub spiczastości;
dodatnią kurtozę ma rozkład wysmukły - nazywany leptokurtycznym,
ujemną kurtozę ma rozkład spłaszczony, nazywany platykurtycznym
skośność - mierzy asymetrię rozkładu;
dodatnią skośność ma rozkład z większym „ogonem” po stronie wartości większych - średnia jest w nim zazwyczaj większa od mediany i dominanty;
ujemną skośność ma rozkład z większym „ogonem” po stronie wartości mniejszych - średnia jest w nim zazwyczaj mniejsza od mediany i dominanty
Zastosowanie komputerów
mgr Ewa Lipiec
2004/2005 semestr zimowy