Laboratorium 4 statystyka, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką, Metodologia ze statystyką ćwiczenia


  1. Tworzenie bazy w programie SPSS

Tworzenie bazy danych za pomocą importu z arkusza kalkulacyjnego Excel.

Zadanie 1. Kodowanie zmiennych w arkuszu Excel.

Otwórz Zbiór w Excelu Dane laboratorium 4 statystyka.

Zakoduj wszystkie zmienne tekstowe według formuły:

Płeć: nowa kolumna kod_płeć , sposób zakodowania: kobieta - 1; mężczyzna - 0;

Wykształcenie: nowa kolumna kodwyksz , sposób zakodowania: średnie - 1 ,
maturalne - 2, wyższe - 3, wyższe magisterskie - 4;

Miejscowość zamieszkiwana: nowa kolumna kod_miejscowość , sposób zakodowania: wieś - 1, gmina - 2, miasto - 3;

Czy pali papierosy: nowa kolumna kod_palenie , sposób zakodowania: tak- 1, nie - 0.

Zamknij zbiór.

Zadanie 2. Utworzenie zbioru w programie SPSS

1. Uruchom SPSS.

Plik Otwórz Dane

0x08 graphic

  1. Wybierz plik typu Excel i otwórz plik Dane laboratorium 4 statystyka.

0x08 graphic
Wybierz opcję Czytaj nazwy zmiennych z pierwszego wiersza danych

Jeśli widzisz

0x01 graphic

To dobrze wykonano polecenie.

  1. Wejdź w zakładkę Zmienne

0x01 graphic

W etykietach wpisz nazwy, które mają pojawiać się w tabelach i na wykresach.

  1. Zapisywanie bazy.

  1. Wybierz Plik następnie Zapisz jako i wpisz nazwę pliku Nazwisko_laboratorium4.

0x01 graphic

  1. Wybierz Save.

Pojawi się raport w postaci

0x01 graphic

który można zapisać lub zamknąć.

Analiza pojedynczej zmiennej

Przypomnienie ( a może coś nowego?)

Oznaczmy obserwowane wartości zmiennej X przez x1, x2, …, xn.

Miary położenia

Dla zmiennych wyrażonych w skali interwałowej i ilorazowej klasycznymi miarami tendencji centralnej to najczęściej średnie, które informują o przeciętnym poziomie cechy, nie odzwierciedlając różnic pomiędzy poszczególnymi jednostkami.

W zależności od postaci wartości zmiennej stosujemy:

-średnią arytmetyczną (gdy wartości zmiennej można dodawać),

-średnią geometryczną (gdy wartości zmiennej można mnożyć),

-średnią harmoniczną (gdy wartości zmiennej można dodawać).

Wartość średniej wyznaczamy jeśli wartości zmiennej są jednorodne.

Średnia arytmetyczna

Średnia arytmetyczna równa się sumie wszystkich wartości zmiennej podzielonej przez ich liczbę.

Dla zmiennej, która przyjmuje wartości x1, x2, …, xn średnia arytmetyczna 0x01 graphic
wynosi:

0x01 graphic

5% średnia ucięta - średnia wyznaczona z wartości zmiennej , z których wyeliminowano 5% największych i 5% najmniejszych wartości.

Wartość 5% średniej uciętej wyznacza się gdy chcemy aby zmienne nietypowe nie zakłócały wartości średniej.

Średni błąd średniej (błąd standardowy) 0x01 graphic
.

Błąd standardowy - odchylenie średnie wyników pomiarów tej samej wielkości otrzymanych przy użyciu tego samego narzędzia pomiarowego.

Średnia geometryczna

Średnia geometryczna 0x01 graphic
jest pierwiastkiem n - tego stopnia iloczynu n wartości zmiennej. Stosuje się ją głównie przy badaniu zmian tempa zjawisk . Średnia geometryczna w mniejszym stopniu niż średnia arytmetyczna odzwierciedla wpływ wartości ekstremalnych na przeciętny poziom zmiennej. Średnia geometryczną wyznacza się ze wzoru:

0x01 graphic

Z definicji wynika, że średnią geometryczną możemy wyznaczać tylko wtedy, gdy wartości obserwacje są liczbami dodatnimi i różnymi od zera.

Średnia harmoniczna

Średnią harmoniczna 0x01 graphic
(dla liczb różnych od zera) nazywamy odwrotność średniej arytmetycznej z odwrotności wartości zmiennej. Oblicza się ją, gdy wartości zmiennej są podane w jednostkach względnych. Średnia harmoniczną wyznacza się ze wzoru:

0x01 graphic
przy czym: 0x01 graphic

Dla wszystkich zmiennych, wyrażonych co najmniej na skali porządkowej, można wyznaczać nieklasyczne miary tendencji centralnej. Należą do nich:

-mediana,

-dominanta (moda),

-kwantyle.

Mediana (zwana też wartością środkową) to w wartość w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba wartości zmiennej.

Dominanta (moda) - to najczęściej występująca wartość zmiennej.

Kwantylem rzędu p (Kp), gdzie 1 > p > 0, nazywamy każdą liczbę xp przed, którą znajduje się 100p% wartości zmiennej. Kwantyle dla p = 0,25, p = 0,5, p = 0,75 nazywany kwartylami.

Gdy: p = 0,25 - kwartyl dolny (inaczej kwartyl rzędu 1 oznaczany przez Q1, percentyl 25),

p = 0,5 - mediana (inaczej kwartyl rzędu 2, percentyl 50),

p = 0,75 - kwartyl górny ( inaczej kwartyl rzędu 3 oznaczany przez Q3, percentyl 75).

W programie SPSS wartości kwanty li wyznaczane są kilkoma metodami, są to:

- algorytm standardowy,

- metoda średniej ważonej,

- metoda Empirical,

-metoda Aempirical,

- metoda zawiasów Tukey'a dla wyznaczenia 25, 50 i 75 percentyla (zwanych zawiasami Tukey'a).

W programie SPSS wyznaczane są alternatywne do mediany i średniej wartości tendencji centralnej.

Noszą one nazwę M-estymatorów i wyznaczane są metodami iteracyjnymi. M - estymatory stosowane są gdy rozkład zmiennej jest asymetryczny lub symetryczny lecz z długimi ogonami po lewej i prawej stronie. M - estymatory noszą nazwy pochodzące od nazwisk osób, które je wprowadziły.

Miary zmienności (rozproszenia, dyspersji)

Miary zmienności dzielimy na:

Miary klasyczne:

- wariancja (dla zmiennych, które można mnożyć),
- odchylenie standardowe(dla zmiennych, które można mnożyć),
- odchylenie przeciętne (dla zmiennych, które można dodawać),
- współczynnik zmienności (dla zmiennych, które można mnożyć i dzielić),

Miary pozycyjne:

- rozstęp (dla zmiennych, które można dodawać),
- odchylenie ćwiartkowe (dla zmiennych, które można dodawać),,
- współczynnik zmienności.

Wariancję 0x01 graphic
wyznaczamy ze wzoru:

0x01 graphic
,

odchylenie standardowe:

0x01 graphic
.

Odchylenie standardowe informuje o ile średnio odchylają się wartości zmiennej od wartości średniej 0x01 graphic
. Im mniejsza wartość odchylenia tym wartości zmiennej są bardziej skupione wokół średniej.

Rozstęp R to wartość bezwzględna (moduł) różnicy pomiędzy wartością maksymalną
i minimalną badanej zmiennej.

0x01 graphic
0x01 graphic

Odchylenie ćwiartkowe Q (rozstęp międzykwartylowy) - jest to wielkość określająca odchylenie wartości zmiennej od mediany. Mierzy poziom zróżnicowania tylko części jednostek; po odrzuceniu jednostek o wartościach niewiększych niż Q1 oraz jednostek o wartościach niemniejszych niż Q3. Im większa szerokość rozstępu ćwiartkowego, tym większe zróżnicowanie wartości zmiennej.

0x01 graphic
.

Współczynnik zmienności wyznacza się ze wzoru0x01 graphic
.

Miary asymetrii

Istnieje wiele miar służących do wyznaczania asymetrii rozkładu do najczęściej stosowanych należy trzeci moment centralny , który wyznacza się ze wzoru:

0x01 graphic
,

lub współczynnik skośności 0x01 graphic
.

Współczynnik skośności przyjmuje wartość zero dla rozkładu symetrycznego, wartości ujemne dla rozkładów o lewostronnej asymetrii (wydłużone lewe ramię rozkładu) i wartości dodatnie dla rozkładów o prawostronnej asymetrii (wydłużone prawe ramię rozkładu).

*Błąd skośności : 0x01 graphic

Miary koncentracji

Miary koncentracji mierzą koncentrację wartości zmiennej wokół średniej. Do najczęściej stosowanych współczynników koncentracji należy kurtoza Definiuje się ją następującym wzorem:

0x01 graphic
,

gdzie 0x01 graphic
nazywane czwartym momentem centralnym wyznacza się ze wzoru:

0x01 graphic
.

* Błąd kurtozy: 0x01 graphic

Rozkłady zmiennych można podzielić ze względu na wartość kurtozy na rozkłady:

mezokurtyczne - wartość kurtozy wynosi 0, spłaszczenie rozkładu jest podobne do spłaszczenia rozkładu normalnego (dla którego kurtoza wynosi dokładnie 0)

leptokurtyczne - kurtoza jest dodatnia, wartości cechy bardziej skoncentrowane niż przy rozkładzie normalnym (wykres wysmukły)

platokurtyczne - kurtoza jest ujemna, wartości cechy mniej skoncentrowane niż przy rozkładzie normalnym (wykres spłaszczony).

( *) Wartości błędów skośności i kurtozy mają interpretację, jeśli badane obserwacje traktowane są jako próba z populacji (w statystyce matematycznej).

Jeśli 0x01 graphic
to przyjmuje się że w badanej populacji nie występuje asymetria.

Jeśli 0x01 graphic
to przyjmuje się że w badanej populacji badana zmienna ma rozkład mezokurtyczny.

Zadanie 3. Analiza statystyczna zmiennej jakościowej wyrażonej w skali nominalnej

Przeprowadzić analizę zmiennej Miejscowość zamieszkiwana.

Aby program SPSS wyznaczył wszystkie statystyki wybieramy:

0x08 graphic
0x01 graphic

Pojawi się okno Częstości. Za pomocą strzałki przenosimy do okienka Zmienne nazwę zmiennej, która ma być analizowana

0x01 graphic

A następnie wybieramy Statystyki, które nas interesują.

0x08 graphic
0x01 graphic

Zaznaczono wszystkie statystyki, które można otrzymać w oknie Częstości.

Wynikiem będą tabele.

Tabela 1. Liczba brakujących i ważnych obserwacji

Miejscowość zamieszkiwana

N

Ważne

200

Braki danych

0

Tabela 2. Procent osób mieszkających w miastach, gminach i wsiach

Częstość

Procent

Procent ważnych

Procent skumulowany

Ważne

gmina

103

51,5

51,5

51,5

miasto

35

17,5

17,5

69

wieś

62

31

31

100,0

Ogółem

200

100,0

100,0

Jak widać pomimo zaznaczenia wszystkich statystyk dla zmiennej wyrażonej w skali nominalnej SPSS podaje jedynie podział procentowy.

Zadanie 4. Analiza statystyczna zmiennej jakościowej wyrażonej w skali porządkowej

Przeprowadzić analizę statystyczną zmiennej Wykształcenie i utworzyć histogram . Zmienna Wykształcenie została zakodowana i zapisana jako zmienna kodwyksz. Przeprowadzimy więc analizę zmiennej kodwyksz.

Wyniki analiz ( wykresy i tabele) umieść w dokumencie Word.

0x01 graphic

Ponieważ na kodach nie można wykonywać działań arytmetycznych w oknie Częstości: Statystyki zaznaczyć tylko statystyki, które można wyznaczyć.

0x01 graphic

0x08 graphic
0x01 graphic

Wynikiem będzie histogram oraz odpowiednie tabele ze statystykami.

0x01 graphic

Przenieś otrzymane w raportach tabele i zinterpretuj wszystkie otrzymane wyniki.

Zadanie 5. Analiza statystyczna zmiennej ilościowej

Przeprowadzić analizę statystyczną zmiennej Waga oraz wykonać histogram.

Skorzystamy z Analiza0x01 graphic
Opis statystyczny0x01 graphic
Częstości. Zaznacz w okienku wszystkie statystyki, które można wyznaczyć dla zmiennej Waga.

Przekopiuj do Worda histogram i otrzymane tabele oraz zinterpretuj wszystkie wyznaczone wartości

9 | Strona Statystyka laboratorium 4



Wyszukiwarka

Podobne podstrony:
Pytania - Statystyka, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką
metastata, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką
Statystyka-opracowane, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyk
Metodologia ze statystyk, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statys
stata PYTANIA STATYSTYKA 2 SEMESTR(1), Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodolo
HANDOUT (3), Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką, Metodol
Handout (2), Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką, Metodol
Statystyka - Warszawa - Pytania, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze
statystyka-pytania, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką
Statystyka pytania opracowane-1[1], Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia
stata PYTstata, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką
metodologia, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką
rr RĂłznice Indywidualne Wszytskie pytania, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Psy
wklad czynnika i metoda, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Psychologia Różnic Ind
A18I II Metody - techniki projekcyjne i analiza, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato)
funkcjonalne znaczenie temperamentu dodatek, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Ps
Encyklopedia prawa - materialy do kolokwium, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Za

więcej podobnych podstron