Wykłady ze statystyki opisowej dla psychologów


STATYSTYKA - wykłady, podstawowe pojęcia

  1. Wykład I i II - podstawowe pojęcia statystyki opisowej

    1. Statystyka - nauka zajmująca się metodami ilościowymi , bada prawidłowości zjawisk masowych. Inaczej - to część matematyki stosowanej opisująca za pomocą funkcji statystycznych i liczb prawidłowości, tendencje, trendy w populacji generalnej obiektów.

Zjawiska masowe - takie zjawiska, które teoretycznie występują nieskończoną ilość razy.

    1. Badanie statystyczne - ogół prac mających na celu poznanie struktury badanej zbiorowości statystyczne.

    1. Zbiorowość statystyczna - zbiór dowolnych obiektów - elementów, osób, przedmiotów lub faktów, podobnych pod względem określonych cech, ale nie identycznych i poddanych badaniu statystycznemu

      1. zbiorowość generalna (populacja) - wszystkie potencjalnie dostępne elementy (obiekty), będące przedmiotem badania, co do których chcemy formułować wnioski

      2. zbiorowość próbna (próba) - podzbiór populacji generalnej obejmujący część jej elementów wybranych w określony sposób. (wybór może być np. celowy , kwotowy lub losowy)

właściwości

skale

przykłady

0x08 graphic

0x08 graphic
jakościowe

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
jakościowe - dyskretne, skokowe (nominalne, kategorialne, niemetryczne, np. dychotomiczne lub trychotomiczne)

płeć

kierunek wykształcenia

barwa

typ temperamentu

rasa

obiekty

0x08 graphic
0x08 graphic
(osoby fizyczne, organizacje, firmy, kraje)

porządkowe (porządkujace)

0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic
porządkowe - dyskretne, skokowe (porządkujace, rangowe)

miejsce w rankingu

poziom wykształcenia

ocena skuteczności w rangach

0x08 graphic
0x08 graphic
ilościowe

0x08 graphic

ciągłe inetrwałowe (metryczne)

0x08 graphic
ciągłe ilorazowe

(metryczne)

Wynik sumaryczny (lub średni) w punktach testu psychologicznego (dodatni, ujemny)

waga, wzrost, wiek (wartości dodatnie)

    1. Rodzaje badania statystycznego:

      1. całkowite (wyczerpujące) - gdy obserwacji poddane są wszystkie jednostki populacji generalnej (np. powszechny spis ludności)

      2. częściowe (próba)

    1. Rodzaje cech jednostek statystycznych:

      1. skokowe (dyskretne) - mają przeliczalny lub skończony zbiór wartości (reprezentują właściwości jakościowe i porządkowe, mierzone sa na skalach jakościowych i porządkowych)

      1. ciągłe (metryczne - między dwoma punktami można określić odległość)

    1. Cele badania statystycznego :

Najczęściej stosowane miary opisu statystycznego

Skala pomiarowa

Miary tendencji centralnej

Miary rozproszenia (rozrzutu, dyspersji, zróżnicowania)

Miary asymetrii

Miary koncentracji

Miary współzmien-ności

nominalna

dominanta

współczynnik dyspersji względem klasyfikacji

współczynniki korelacji:

Fi Youle'a,

V Cramera,

niepewności,

kontyngencji,

r tetrachoryczne

porządkowa

dominanta, kwantyle - mediana, kwartyle, tetryle, decyle, percentyle

rozstęp,

rozstęp kwartylowy,

odchylenie ćwiartkowe,

współczynnik zmienności, współczynnik zmienności względem mediany

współczynniki korelacji rs Spearmana,

w Kendalla,

Tau Kendalla

ilościowa (ciągła, interwałowa lub ilorazowa)

średnia arytmetyczna, średnia harmoniczna, średnia geometryczna, średnia logarytmiczna, średnia potęgowa

rozstęp,

rozstęp kwartylowy, kwartylowy współczynnik zmienności, współczynnik zmienności względem mediany, odchylenie przeciętne, wariancja, odchylenie standardowe, współczynnik zmienności względem średniej

współczynnik skośności α3,

współczynnik asymetrii As

współczynnik spłaszczenia - eksces (kurtoza α4 - 3),

współczynnik skupienia - kurioza α4

kowariancja,

współczynniki korelacji liniowej r Pearsona,

współczynniki korelacji krzywoliniowej,

współczynniki korelacji wewnątrzklasowej,

rs Spearmana,

w Kendalla,

Tau Kendalla

    1. Etapy badania statystycznego:

      1. przygotowanie badań

          • sformułowanie celu badawczego (postawienie pytań i hipotez)

          • określenie rzeczowego, przestrzennego i czasowego zasięgu badań

          • rodzaje wykorzystywanego materiału badawczego i metod jego gromadzenia

          • określenie sposobu opracowania i prezentacji zebranego materiału

          • określenie metod analizy tego materiału

          • określenie reguł wnioskowania

      1. gromadzenie materiału badawczego - materiał pierwotny (pozyskany przez nas) lub wtórny (już istniejący, pochodzący np. ze sprawozdawczości)

      1. opracowanie i prezentacja zebranego materiału

          • podział uporządkowanego materiału według kryteriów na podstawie interesujących nas cech

          • zliczenie pogrupowanych danych

          • interpretacja zebranego materiału i pogrupowanie wartości (tabele lub wykresy)

  1. opis statystyczny (analiza badanej zbiorowości) - obliczanie miar, czyli charakterystyk opisowych badanej zbiorowości (statystyka opisowa) za pomocą miar tendencji centralnej, rozproszenia, skosności, asymetrii, koncentracji, współzmienności, struktury

  2. wnioskowanie statystyczne - zastosowanie testów na podstawie których dokonuje się uogólnień do całe zbiorowości

    1. Grupowanie statystyczne:

      1. grupowanie typologiczne - ma na celu wyróżnienie jednorodnych grup jakościowych

      2. grupowanie wariancyjne - ma na celu uporządkowanie badanej zbiorowości i poznanie jej struktury. Polega na łączeniu w klasy jednostek statystycznych o odpowiednich wartościach cech statystycznych

    1. Szeregi statystyczne - występują przy użyciu grupowania wariancyjnego. Jest to ciąg wielkości statystycznych uporządkowanych według określonego kryterium. Rodzaje szeregów statystycznych:

      1. szereg szczegółowy - uporządkowanych ciąg wartości badanej cechy statystycznej, w wypadku małej ilości danych. Można go uporządkować malejąco lub rosnąco.

      2. szereg rozdzielczy - zbiorowość statystyczne podzielona na części (klasy) według określonej cechy mierzalnej jakościowej lub ilościowej, z podaniem liczebności dla każdej z wyodrębnionych klas (rozkład empiryczny)

          • szereg rozdzielczy I typu - każdy wariant cechy stanowi osobną klasę

          • szereg rozdzielczy II typu - występują przedziały „od/do”, które zawsze mają dolną granicę (xd) i górną. Różnica między dolną a górną granicą to rozpiętość przedziału (l).

    1. Przedstawienie graficzne wyników

      1. histogram (wykres słupkowy)- zbiór prostokątów, których podstawy są wyznaczone na osi odciętych, stanowiąc rozpiętości poszczególnych przedziałów klasowych. Natomiast wysokości są określone na osi rzędnych, przez liczebności odpowiadające poszczególnym przedziałom klasowym

      2. wielobok liczebności - linia łamana powstała z połączenia punktów, których współrzędnymi są środki przedziałów klasowych (xi`), czyli średnia arytmetyczna (dolna granica +górna granica / 2)

      3. szereg skumulowany - szereg powstały z szeregu rozdzielczego przez kolejne dodawanie (kumulowanie) przedziałów klasowych oraz odpowiadających im wartości (ncum)

    1. Opis struktury badanej grupy - opisujemy przy pomocy parametrów. Jednym z nich są miary tendencji centralnej:

      1. średnie klasyczne:

          • średnia arytmetyczne

0x01 graphic

      1. średnie pozycyjne (zajmują w szeregu szczególną pozycję)

          • dominanta - wartość tej zmiennej, która w szeregu statystycznym występuje najczęściej

0x01 graphic

xd = dolna granica przedziału najliczniejszego

l = rozpiętość przedziału najliczniejszego

n0 = liczebność najliczniejszego przedziału

nn-1 = liczebność przedziału poprzedzającego najliczniejszy

nn+1 = liczebność przedziału po najliczniejszym

Q1 - wartość szeregu dzieląca zbiorowość na dwie części tak, że 1\4 ≤ Q1 3\4

0x01 graphic

Q3 - wartość szeregu dzieląca zbiorowość na dwie części tak, że 3\4 ≤ Q1 1\4

0x01 graphic

0x01 graphic

xd = dolna granica przedziału mediany

n\2 = wyraz środkowy

ncum-1 = liczebność skumulowana w przedziale poprzedzającym przedział mediany

nM = liczebność zwykła przedziału mediany

  1. Miary rozproszenia (zróżnicowania)

    1. Miary rozproszenia (zróżnicowania): Pozwalają na uogólnienie różnic w wartościach cechy, zaobserwowanych u jednostek w badanej zbiorowości. Klasyczne (odchylenie klasyczne, wariancja, odchylenie standardowe, współczynnik zmienności) i pozycyjne (rozstęp, odchylenie ćwiartkowe, współczynnik zmienności dla miar pozycyjnych)

      1. klasyczne:

          • odchylenie przeciętne (odchylenie średnie) - średnia arytmetyczna bezwzględnych wartości odchyleń wartości cechy od średniej arytmetycznej szeregu. Kolejność postępowania:

            • wyliczamy średnią arytmetyczną szeregu

            • od poszczególnych wartości zmiennej odejmujemy obliczoną średnią

            • obliczone odchylenia sumujemy ignorując znaki

            • dzielimy przez liczebność szeregu

0x01 graphic

0x01 graphic

0x01 graphic

l = rozpiętość przedziału klasowego

0x01 graphic

0x01 graphic

      1. pozycyjne:

0x01 graphic

0x01 graphic

0x01 graphic

M = mediana

Q = odchylenie ćwiartkowe

  1. 29.X

    1. Miary asymetrii

      1. asymetria rozkładu- określana przez porównywanie xA, m i D:

          • jeżeli xA=M=D - szereg symetryczny.

          • jeżeli xA>M>D - rozkład o asymetrii prawostronnej

          • jeżeli xA<M<D - rozkład o asymetrii lewostronnej

      1. rozkłady symetryczne - to takie, w których obserwacje rozłożone są równomiernie po obu stronach osi symetrii.

      1. rozkłady asymetryczne -

          • I - większość obserwacji znajduje się w przedziałach położonych bliżej początku szeregu, większość cech ma wartości i niskich nominałach.

          • II - przedział klasowy zawierający największą liczbę obserwacji przesunięty jest w prawo - w ostatnich przedziałach

          • Rozkłady bimodalne - dwa wyraźne punkty skupienia

0x08 graphic
0x08 graphic

0x08 graphic

0x08 graphic
0x08 graphic

0x08 graphic

0x08 graphic

0x08 graphic

0x08 graphic

      1. miernik skośności - jest podstawowym miernikiem asymetrii rozkładu

0x01 graphic

      1. współczynnik skośności - siła i kierunek skośności

0x01 graphic

Ws∈ (-1, 1)

S = odchylenie standardowe

Ws = 0 - symetria

      1. pozycyjna miara asymetrii

0x01 graphic

As∈ (-1,1)

As∈ (-1,0> - asymetria lewostronna

As∈ <0,1) - asymetria prawostronna

      1. moment centralny trzeci w jednostkach standardowych - najdokładniejsza miara, bo uwzględnia wszystkie wartości

0x01 graphic

0x01 graphic

0x01 graphic
α3∈ (-2,2) - im bliższy 0 tym asymetria jest słabsza

    1. Miary koncentracji - jak bardzo poszczególne obserwacje skupiają się wokół średniej arytmetycznej:

      1. kurtoza

0x01 graphic

0x01 graphic

K∈(-3,3) - jeżeli K= 3 rozkład normalny

  1. 5.XI.

    1. Rozkład normalny

      1. pole powierzchni pod krzywą wynosi 1, takie też jest prawdopodobieństwo, że zmienna znajdzie się w przedziale zawierającym się pod krzywą, czyli (-∞,+∞). Sigma (δ) to odchylenie standardowe w rozkładzie normalnym i od (-δ,+δ) znajduje się 68,26% przypadków (po 34,13% po każdej stronie osi symetrii)

      1. Oś symetrii rozkładu normalnego to średnia arytmetyczna (= mediana = dominanta). Dany jest rozkład normalny X: N(xA, δ)

0x01 graphic

  1. 21.XI.

    1. Estymacja parametrów - rodzaj wnioskowania polegający na szacowaniu parametrów populacji generalnej na podstawie statystyk z próby.

      1. estymacja punktowa - znalezienie konkretnej liczby dla każdego szacowanego parametru.

0x01 graphic

D(Tn) - błąd standardowy szacunku

T - konkretna wartość statystyki tego parametru w próbie

      1. estymacja przedziałowa - wyznaczenie przedziału, w którym z pewnym prawdopodobieństwem znajduje się parametr estymowany. Występuje tu przedział ufności i współczynnik ufności, a długość przedziału ufności wynosi:

0x01 graphic

Q - szacowany parametr

P = 1-α - współczynnik ufności

t +/-zαD(Tn) - granice przedziału ufności

zα - zmienna standaryzowana (wartość krytyczna)

0x01 graphic

0x01 graphic

  1. Testy 2

      1. dla tabeli, dane ilościowe i jakościowe

1. 0x01 graphic

2. 0x01 graphic

ne - liczebności empiryczne, rzeczywiście zaobserwowane w pomiarach

nt - liczebności teoretyczne, oczekiwane w poszczególnych komórkach

0x01 graphic

k - kolumny

w - wiersze

2obl > ℵ2α - nie ma przesłanek do przyjęcia H0, przyjmujemy H1

      1. dla szeregu, dane ilościowe (rozkład normalny)

0x01 graphic

ss = k - r - 1; gdzie r to liczba parametrów, a k to liczba kolumn

0x01 graphic

  1. Siła korelacji

    1. Współczynnik korelacji c Pearsona. <-1;1> , siła związku:

0x01 graphic

    1. Współczynnik korelacji r:

0x08 graphic
0x01 graphic

mniejsza z różnic (k - 1) lub (w - 1)

    1. Współczynnik korelacji V2

0x08 graphic
0x01 graphic

mniejsza z różnic (k - 1) lub (w - 1)

    1. Związek między cechami ilościowymi - współczynnik korelacji r Pearsona

0x01 graphic

r = 0 - nie ma związku

r = 1 - związek całkowity dodatni (jak jeden w rośnie to drugi też)

r = -1 - związek całkowity ujemny

0< r >1 - korelacja dodatnia niedoskonała

-1< r >0 - korelacja ujemna niedoskonała

0< r >0,2 - bardzo słaba

0,2< r >0,3 - słaba

0,3< r >0,5 - średnia

0,5< r >0,7 - silna

0,7< r >1 - bardzo silna

  1. LICZENIE ZADANIA Z DANYMI ILOŚCIOWYMI W TABLICY KORElACJI

    1. Wyznaczamy środki przedziałów klasowych xi i yi.

    2. Wyznaczamy punkty wyjściowe (arbitralne) x0 i y0, czyli środki przedziałów przedziału środkowego (w przypadku liczby parzystej np.4 wziąć drugi lub czwarty).

    3. Obliczamy wartości odchyleń ui i vi, poszczególnych środków przedziałów klasowych od ich punktów arbitralnych wg: 0x01 graphic

0x01 graphic

    1. Obliczamy iloczyny odchyleń i właściwych im liczebności w przedziałach (niui i nivi)

    2. Obliczamy iloczyny kwadratów odchyleń i liczebności w przedziałach

    3. Obliczamy iloczyny odchyleń cechy x i cechy y: uivi (dla każdej komórki) a liczebności te zapisujemy w lewych górnych rogach komórki tablicy

    4. Wpisany w lewym górnym roku iloczyn (uivi) mnożymy przez liczebność a wynik mnożenia wpisujemy w prawym dolnym rogu komórki

    5. Wpisany w prawych dolnych rogach komórek iloczyny - niuivi - sumujemy w poziomie i pionie a wyniki sumowań zapisujemy w ostatnim wierszu i ostatniej kolumnie i to też sumujemy

    6. Sprawdzamy poprawność obliczeń poprzez porównanie sumy w ostatnim wierszu i ostatniej kolumnie. Powinny się równać.

Literatura dodatkowa

L.Gruszczyński „Elementy statystyki dla socjologów”

1



Wyszukiwarka

Podobne podstrony:
wyklad 4 PODSTAWY STATYSTYKI OPISOWEJ
WYKŁADY- DEFINICJE, Konspekt wykładów ze statystyki
wykład 8 regresja, Statystyka opisowa
Zadania na zaliczenie wykładu ze statystyki
PROGRAM WYKŁADÓW ZE STATYSTYKI, statystyka
Boratyńska A Wykłady ze statystyki matematycznej
opracowanie pytań na wykład ze statystyki, STUDIA, SEMESTR IV, Statystyka matematyczna i planowanie
korelacja Wykład 4, Nauka, Statystyka Opisowa
Wymagania odnośnie projektu na zaliczenie wykładu ze Statystyki matematycznej
Zadania ze Statystyki opisowej2, Zadania ze Statystyki opisowej
wyklad 2a STATYSTYKA OPISOWA
Materiały z wykładów ze statystyki z zadaniem

więcej podobnych podstron