JAK KORZYSTAĆ Z SPSS
praktyczna analiza danych
ilościowych
mgr Jacek Bieliński
Collegium Civitas
Podstawy obsługi SPSS
" Interfejs programu SPSS
" Deklarowanie zmiennych
" Wprowadzanie danych
" Zapisywanie i wczytywanie zbioru danych
" Operacje na zmiennych
" Podstawowe obliczenia statystyczne (rozkład
częstości, statystyki opisowe, tabele)
Interfejs programu SPSS
Czyli, jak TO wyglÄ…da
:&
PodglÄ…d zmiennych
Tu deklarujemy
zmienne,
zmieniamy ich
parametry, wartości
jaki mogÄ… one
przyjmować itp.
Wybierz jednostki statystyczne
Grupowanie
Zmienne i ich parametry
Drukowanie
zmiennych
Podziel zbiór danych
Cofnij i ponów
Pasek ikon: dostęp do najczęściej używanych funkcji programu
Szukaj
Ostatnio używane procedury
Włącz wagę dla obliczeń
Zapisywanie pliku
Wstaw zmienne
Otwieranie pliku
Wyświetl etykiety
Wstaw jednostki statystyczne
Idz do jednostki statystycznej
Wykresy
Operacje edycyjne
Operacje na zbiorze danych
Kopiuj, wklej itp
Wyświetlanie/ukrywanie
Analizy statystyczne
elementów interfejsu
Przekształcenia danych
Operacje na plikach
Otwieranie, zapisywanie itp.
Zakładka zmienne: tryb edycji
Zakładka dane: przełącza do trybu
zmiennych, deklarowanie nowych
edycji zbioru danych, dostęp do
zmiennych, edycja parametrów
każdej jednostki statystycznej i
zmiennych w zbiorze
wartości zmiennych
Deklarowanie zmiennych
Deklarowanie zmiennych
" Nazwa zmiennej
" Typ zmiennej (numeryczna, czy tekstowa)
" Wielkość zmiennej
" Etykieta zmiennej (opis)
" Zdeklarowane wartości zmiennej
" Wartości oznaczone jako brak danych
" Poziom pomiaru zmiennej
Nazwa zmiennej
" nazwa zmiennej powinna odzwierciedlać
faktycznie reprezentowanÄ… przez danÄ…
zmiennÄ… cechÄ™
" niektóre (starsze) wersje SPSS
ograniczają długość nazwy zmiennej do 8
znaków, co wymusza stosowanie nazw
skrótowych.
Typ zmiennej
(numeryczna/tekstowa)
" Typ zmiennej określa czy wartości
zmiennej są liczbami, czy ciągiem znaków.
" Na zmiennych, które przyjmują wartości
będące ciągiem znaków nie możliwe jest
wykonywanie większości obliczeń
statystycznych.
" Często ciągi znaków wykorzystuje się dla
pytań otwartych
Wielkość (szerokość) zmiennej
" Dla zmiennych przyjmujących wartości
numeryczne (liczby) określa ilość cyfr i
miejsc po przecinku
" Dla zmiennych przyjmujących wartości
będące ciągami znaków (tekst) określa
długość (liczbę znaków) ciągu znaków
Etykieta zmiennej
" Jest to skrótowy opis zmiennej.
" dzięki temu możemy łatwiej zorientować
siÄ™ do jakiej cechy dana zmienna siÄ™
odnosi.
" Etykiety zmiennych są wyświetlane przy
wynikach obliczeń
Zadeklarowane wartości
(etykiety kodów zmiennej)
" Gdy zmienna przyjmuje wartości numeryczne,
można konkretnym kodom (liczbom) przypisać
etykiety (co dany kod oznacza)
" Np. zmienna PLEC zawierajÄ…ca informacjÄ™ o
płci respondenta przyjmuje wartości 1 dla
kobiet i 2 dla mężczyzn. Dzięki etykietom
kodów łatwo dowiemy się co oznaczają wartości
zmiennej numerycznej
Braki Danych
" Czasem nie chcemy, aby jakieś wartości
zmiennej były uwzględniane przy
obliczeniach statystycznych. Możemy to
uzyskać oznaczając te wartości jako brak
danych
Poziom pomiaru zmiennej
" Poziom nominalny
np. płeć, wyznanie, miejsce urodzenia, kolor oczu (różnice)
" Poziom porzÄ…dkowy
np. poziom wykształcenia, wielkość miejsca zamieszkania
(bardziej/mniej)
" Poziom interwałowy
np. wyniki testów IQ (o ile bardziej)
" i ilorazowy
np. wzrost w metrach, dochód miesięczny
(istnieje PUNKT ZEROWY, iloraz-stosunek ilościowy zmiennych)
Poziomu pomiaru
" Zmienne ilorazowe posiadajÄ… wszystkie
cechy zmiennych interwałowych,
porzÄ…dkowych i nominalnych
" Zmienne interwałowe posiadają wszystkie
cechy zmiennych porzÄ…dkowych i
nominalnych
" Zmienne porzÄ…dkowe posiadajÄ… wszystkie
cechy zmiennych nominalnych
Deklarowanie zmiennych
" Utworzymy zmienne opisujÄ…ce
następujące cechy: płeć, czy pali
papierosy, jakiej marki papierosy pali,
ile papierosów dziennie pali.
Pierwsza zmienna określa płeć respondenta.
Najpierw nadajemy jej nazwÄ™ wpisujÄ…c w kolumnie
Name odpowiedni tekst i naciskamy Enter.
Wybieramy typ numeryczny
0
Określamy typ zmiennej. Będzie ona
przyjmować wartości liczbowe.
Zmienna będzie przyjmować wartości
1 i 2 są to liczby całkowite więc nie
potrzebujemy miejsc dziesiętnych. W
pole Decimal Places wpisujemy 0
Określamy etykietę zmiennej wpisując w
kolumnie Label odpowiedni tekst
Tu wpisujemy wartość dla
której określamy etykietą
1
kobieta
Klikamy OK
Określamy etykiety kodów, czyli
opisujemy wartości przyjmowane
Tu wpisujemy
przez zmiennÄ…
etykietÄ™ dla
wartości 1
Najpierw klikamy add i
podobnie definiujemy etykietÄ™
dla wartości 2 mężczyzna.
Pozostaje określić jeszcze poziom pomiaru.
Zmienna plec ma charakter nominalny
Deklarowanie zmiennych
" Zmienna pali
etykieta: czy pali papierosy
Wartości: 1 tak; 2 nie;
" Zmienna marka
Etykieta: jakiej marki papierosy pali
Wartości: 1 Extra mocne; 2 Fajrant; 3 -Wiarus;
4 -Stołeczne; 5 -różne; 6 -odmowa odpowiedzi; 7 -nie dotyczy
Brak danych: 6; 7;
" Zmienna ilepali
Etykieta: ile papierosów dziennie pali
Brak danych: 0
Wprowadzanie danych
Data View
" Jest to tryb pracy, w którym mamy
bezpośredni dostęp zbioru danych
" Możemy wprowadzać dane i je edytować
W kolumnach znajdujÄ… siÄ™
zadeklarowane zmienne. Nazwa
Wiersze reprezentujÄ… kolejne jednostki
każdej zmiennej znajduje się w
statystyczne (np. respondentów).
nagłówku kolumny
Numer kolejnej jednostki statystycznej
znajduje się w nagłówku wiersza
Ikona wyświetlania etykiet
kodów. Pozwala
włączyć/wyłączyć
wyświetlanie etykiet
wartości zmiennych
Zapisywanie/wczytywanie
zbioru danych
" Zapisywanie i wczytywanie zbioru danych
możemy wykonać używając ikon lub menu
" Ikony zapisywania i wczytywania zbioru danych
" Z menu wybieramy:
File Save
lub
File Open Data
Operacje na zmiennych
" Wybór jednostek statystycznych
Pozwala wybrać do dalszych analiz tylko takie jednostki
statystyczne, które spełniają określone warunki (np. kobiety z
wyższym wykształceniem, mieszkające w miastach powyżej
500tys. Mieszkańców)
" Rekodowanie
Umożliwia przekodowanie lub pogrupowanie wartości zmiennej w
zbiorze. Np. wartości zmiennej określające liczbę lat respondenta
możemy pogrupować w kategorie wiekowe.
" Obliczanie wartości zmiennej
Często podczas prowadzenia analiz musimy obliczyć wartość
nowej zmiennej bazujÄ…c na danych istniejÄ…cych w zbiorze danych.
Np. wyznaczyć ilość lat respondenta znając rok urodzenia.
Wybór jednostek statystycznych
Wybierz wszystkie jednostki
Wybierz te jednostki stat.,
które spełniają określony warunek
Wybierz losową próbkę jednostek
Lista zmiennych w zbiorze
V44<=5 | (v47=5 & v48=3)
Lista zmiennych w zbiorze
Kalkulator, pozwala na wprowadzanie operatorów
logicznych i arytmetycznych do warunku
Pole gdzie zapisujemy warunek,
który spełniać mają wybrane jednostki
Podstawowe operatory logiczne i arytmetyczne:
+ dodawanie
- odejmowanie
/ dzielenie
* mnożenie
** potęgowanie
~ negacja (nie jest tak, że)
= równość
~= nie równa się
< mniejsze niż
> większe niż
<= mniejsze lub równe niż
>= większe lub równe niż
& koniunkcja logiczna i
| alternatywa lub
( )
Rekodowanie
Zmienne poddane przekształceniu
Lista zmiennych w pliku
Tu określamy nazwę i etykietę
Tym przyciskiem dodajemy dla zmiennej wynikowej
zmienne do przekształcenia
Szczegółowe określenie parametrów przekształcenia
Nazwa i etykieta nowej zmiennej
Przekształcenie:
Wartości zmiennej marka zostaną przekodowane
W wartości zmiennej gr_marka
Wartości zródłowe
Wartości wynikowe
Konkretna wartość zmiennej
zródłowej
Systemowe i zadeklarowane
braki danych
Zakres wartości od - do
Zakres wartości od najmniejszej do
Zakres wartości od do wartości
największej
Wszystkie pozostałe wartości
Systemowy brak danych
zmiennej wynikowej
Dodaje przekształcenie do listy
Zmienia utworzone
przekształcenie
Nowa wartość zmiennej wynikowej
Zmienia utworzone
przekształcenie
Przepisuje wartość zmiennej zródłowej
do zmiennej wynikowej
Obliczanie wartości zmiennej
Zmienna wynikowa
Lista zmiennych w pliku
Wyrażenie algebraiczne
Jego wynik zostanie przypisany
zmiennej wynikowej
Podstawowe obliczenia
statystyczne
" Rozkład częstości zmiennej
" Miary tendencji centralnej
" Miary dyspersji rozkładu
" Kurtoza i skośność
" Statystyki opisowe
" Tabele Krzyżowe
" Korelacje
Rozkład częstości zmiennej
" Częstości są najprostszą i najczęściej wykonywaną
procedurÄ… w programie SPSS.
" Dzięki tej procedurze możemy sprawdzić jak wygląda
procentowy rozkład wartości zmiennej (odpowiedzi). Np.
jaki odsetek osób pali papierosy?
" Analyze Descriptive Statistics Frequencies&
Dodatkowe statystyki
Tym przyciskiem dodajemy zmienne do analizy
Lista zmiennych wybranych do analizy
Lista zmiennych w pliku, które możemy wybrać do analizy
Miary
tendencji
centralnej
Miary dyspersji rozkładu
Kurtoza i skośność rozkładu
Otuput: tu wyświetlane
sÄ… wyniki wszystkich
procedur
statystycznych
Outline: jest
to spis
wyników
wykonanych
procedur
Dodatkowe statystyki
wybrane przez
użytkownika
Rozkład
częstości
zmiennej
Miary tendencji centralnej
" Średnia suma wartości zmiennej wszystkich
jednostek badanej zbiorowości podzielona przez liczbę
tych jednostek
" Dominanta (modalna) wartość zmiennej, która w
danym rozkładzie występuje najczęściej
" Kwantyle wartości cechy badanej zbiorowości, które
dzielą ją na określone części pod względem liczby
jednostek.
Kwartyle pierwszy kwartyl 25% do 75%,
drugi kwartyl 50% do 50% (mediana), trzeci kwartyl
75% do 25%
Decyle dzielą zbiorowość na 10 części
Percentyle dzielą zbiorowość na 100 cześci
Miary dyspersji rozkładu
" Odchylenie standardowe o ile wszystkie jednostki danej
zbiorowości różnią sięśrednio ze względu na wartość zmiennej od
średniej arytmetycznej tej zmiennej.
2
"(x - X )
i
s =
N
" Wariancja średnia arytmetyczna z kwadratów odchyleń
poszczególnych wartości od średniej arytmetycznej całej zbiorowości.
Im zbiorowość jest bardziej zróżnicowana tym większa jest wartość
wariancji
"(x - X )2
i
s2 =
N
Kurtoza i skośność
" Współczynnik asymetrii rozkładu przyjmuje wartość
0 dla rozkładu symetrycznego, wartość > 0 dla
asymetrii prawostronnej, wartość < 0 dla asymetrii
lewostronnej.
" Kurtoza miara koncentracji rozkładu zmiennej w
porównaniu do rozkładu normalnego. Wartość >0
koncentracja większa od rozkładu normalnego,
wartość <0 koncentracja mniejsza od rozkładu
normalnego
Kurtoza i skośność
Skośność
Asymetria lewostronna
Rozkład symetryczny Asymetria prawostronna
Kurtoza
Rozkład normalny Rozkład leptokurtyczny
Rozkład platykurtyczny
Statystyki opisowe
" Statystyki opisowe (średnia, odchylenie
std., wariancja, kurtoza, współczynnik
skośności rozkładu itp.,) możemy obliczyć
niezależnie od rozkładu częstości miennej.
" Analyze Descriptive Statistics Descriptive&
Tu wybieramy statystyki
Åšrednia
Odchylenie
standardowe, wariancja,
min, max itp
Kurtoza i skośność
Tabele krzyżowe
" Tabele krzyżowe to tabele zawierające
rozkład częstości wielu zmiennych. Dzięki
nim możemy np. określić jaki odsetek
osób palących pali papierosy marki
Stołeczne
" Analyze Descriptive Statistics Crosstabs&
Zmienne w wierszach
Zmienne w kolumnach
Zmienne warstwujÄ…c
`zawartość komórek tabeli krzyżowej
Lista zmiennych w zbiorze danych
Procenty w wierszach,
procenty w kolumnach,
procenty w całym
zbiorze
płeć * jakiej marki papierosy pali Crosstabulation
jakiej marki papierosy pali
Extra mocne Fajrant Wiarus Stołeczne różne Total
płeć kobieta Count
1 3 2 1 1 8
% within płeć
12,5% 37,5% 25,0% 12,5% 12,5% 100,0%
% within jakiej marki
50,0% 60,0% 50,0% 50,0% 33,3% 50,0%
papierosy pali
% of Total
6,3% 18,8% 12,5% 6,3% 6,3% 50,0%
mężczyzna Count
1 2 2 1 2 8
% within płeć
12,5% 25,0% 25,0% 12,5% 25,0% 100,0%
% within jakiej marki
50,0% 40,0% 50,0% 50,0% 66,7% 50,0%
papierosy pali
% of Total
6,3% 12,5% 12,5% 6,3% 12,5% 50,0%
Total Count
2 5 4 2 3 16
% within płeć
12,5% 31,3% 25,0% 12,5% 18,8% 100,0%
% within jakiej marki
100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
papierosy pali
% of Total
12,5% 31,3% 25,0% 12,5% 18,8% 100,0%
Odsetek kobiet palÄ…cych
określone marki papierosów
płeć * jakiej marki papierosy pali Crosstabulation
jakiej marki papierosy pali
Extra mocne Fajrant Wiarus Stołeczne różne Total
płeć kobieta Count
1 3 2 1 1 8
% within płeć
12,5% 37,5% 25,0% 12,5% 12,5% 100,0%
% within jakiej marki
50,0% 60,0% 50,0% 50,0% 33,3% 50,0%
papierosy pali
% of Total
6,3% 18,8% 12,5% 6,3% 6,3% 50,0%
mężczyzna Count
1 2 2 1 2 8
+
% within płeć
12,5% 25,0% 25,0% 12,5% 25,0% 100,0%
% within jakiej marki
50,0% 40,0% 50,0% 50,0% 66,7% 50,0%
papierosy pali
% of Total
6,3% 12,5% 12,5% 6,3% 12,5% 50,0%
Total Count
2 5 4 2 3 16
=
% within płeć
12,5% 31,3% 25,0% 12,5% 18,8% 100,0%
% within jakiej marki
100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
papierosy pali
% of Total
12,5% 31,3% 25,0% 12,5% 18,8% 100,0%
Odsetek kobiet
palÄ…cych Fajranty
Odsetek
mężczyzn
palÄ…cych
Fajranty
Korelacje
" Współczynnik korelacji liniowej Pearsona.
Mierzy siłę związku prostoliniowego między
dwiema zmiennymi. ZwiÄ…zkiem prostoliniowym
nazywamy taką zależność, w której
jednostkowym przyrostom jednej zmiennej
towarzyszy, średnio, stały przyrost drugiej
zmiennej.
" Współczynnik korelacji kolejnościowej
Spearmana. Służy do opisu korelacji zmiennych,
gdy mają one charakter jakościowy i istnieje
możliwość uporządkowania obserwacji
empirycznych w określonej kolejności.
Korelacje
" Współczynniki korelacji przyjmują wartości
od -1 do +1
" -1 maksymalna korelacja ujemna
(im więcej jednej cechy tym mniej drugiej)
" +1 maksymalna korelacja pozytywna
(im więcej jednej cechy tym więcej drugiej)
" 0 brak związku korelacyjnego między
zmiennymi
Korelacje
China Russia
China Korelacja Pearsona 1 ,926**
Istotność (dwustronna) ,000
N 300 300
Russia Korelacja Pearsona ,926** 1
Istotność (dwustronna) ,000
N 300 300
**. Korelacja jest istotna na poziomie 0.01
Współczynnik
korelacji,
który chcemy
policzyć
Lista zmiennych wybranych do analizy
Lista zmiennych w zbiorze danych
Poziom istotności
" Poziom istotności to prawdopodobieństwo
odrzucenia testowanej hipotezy, gdy jest
ona prawdziwa (błąd I rodzaju).
" W przypadku korelacji w teście istotności
sprawdzamy hipotezę, że istnieje związek
między zmiennymi.
" Przyjmuje się, że korelacja jest istotna
statystycznie, przy poziomie istotności co
najwyżej 0,05
Yi =²0 + ²1X1i+ ²2X2i+ & .. +²pXpi
95% przedział ufności
Prosta regresji
Model - Podsumowanieb
BÅ‚Ä…d
Skorygowane standardowy
Model R R-kwadrat R-kwadrat oszacowania
1 ,926a ,857 ,857 ,25481
a. Predyktory: (Stała), Russia
b. Zmienna zależna: China
Often the independent variables are
measures in different units. The
standardized coefficients or betas are an
attempt to make the regression
coefficients more comparable.
Współczynnikia
Współczynniki Współczynniki
niestandaryzowane standaryzowane
BÅ‚Ä…d
Model B standardowy Beta t Istotność
1 (Stała) 2,825 ,124 22,779 ,000
Russia ,637 ,015 ,926 42,325 ,000
a. Zmienna zależna: China
Wykorzystanie programu
SPSS w analizie
danych CBOS
CBOS marzec 2005
" Jaki odsetek respondentów deklaruje
udział w wyborach prezydenckich?
" Na kogo głosowałoby najwięcej badanych
osób?
" Jaki odsetek respondentów deklaruje
udział w wyborach parlamentarnych?
" Na którą partię głosowałoby najwięcej
badanych osób?
CBOS marzec 2005
" Jakie jest średnie zaufanie do osób
publicznych?
" Jaki jest stosunek respondentów do Partii
Demokratycznej?
" Jaki jest rozkład cech społeczno-
demograficznych przebadanej populacji?
(płeć, wiek, poziom wykształcenia,
miesięczne dochody netto na 1 osobę w
gospodarstwie domowym).
CBOS marzec 2005
" Jaki jest rozkład poziomu wykształcenia w
populacji przebadanych kobiet i populacji
przebadanych mężczyzn?
" Jakie są cechy społ.-demog. osób
zamierzających głosować na poszczególnych
kandydatów do fotela prezydenckiego?
" Czy istnieje związek między zainteresowaniem
politykÄ…, rokiem urodzenia, poziomem
wykształcenia i wielkością miejsca
zamieszkania?
Wyszukiwarka
Podobne podstrony:
how to do mb sd c4 self testHow to Do Viking Chain Knittinglesson plan how to do itYou Can Do It How to Photograph Water Drops PopPhoto June 2006Nawigacja jako GPS do laptopa How to(1)Do It Yourself How To Make Hash OilE Book Art Anime How To Draw IriaHow to Debate Leftists and Win In Their Own Game Travis L HughesHow to Make your Own Tracer Ammunition08 Learn How To FallHow to Fake FingerprintsHOW TO MAKE AN MESSENGE BOXwięcej podobnych podstron