statystyka notatki

Cechy statystyczne (zmienne)- opisują liczby:

opis statystyczny danych: miara położenia (np. średnia) + miara rozproszenia (np.SD) + wielkość próby i sposób ej pobierania

Miara położenia: średnia arytmetyczna, średnia arytmetyczna ważona, średnia geometryczna (dla nieujemnych do obliczania średniego jumpa wzrostu populacji), średnia harmoniczna(gdy dane znacznie różnią się wartością)

Modalna (Mo, dominanta D) najczęściej występujące wartość w danych (szczyt rozkłady cechy) śr.=Me=Mo – rozkład symetryczny

Miary rozproszenia:

Skala pomiaru danych:

Określają nie tylko natężenie cechy, ale także róznice wilekości między nimi

Zaokrąglenia

Dokładność:

Tworzenie przedziałów, grupowanie gdy jest dużo danych. liczna klas zależy od liczny pomiarów (pierwiastek z liczby pomiarów) wielkość przedziałów h=(max-min)/k. granice przedziałów o rząd dokładniejsza niż dane.

Rozkład normalny: symetryczny śr.=Me=Mo

Statystyki>statystyki podstawowe>statystyki opisowe >normalność (zaznaczyć test Shapiro-Wilka) >histogramy (karta więcej zaznaczyć kurtoza, skośność, średnia, Mediana, Modalna (można też dodać zmienną grupującą klikając na „grupy” po prawej) >podsumowanie

Statystyki> statystyki podstawowe> tabele liczności> normalność (zaznaczyć test Shapiro-Wilka) >test normalności podajemy skośność do jednego miejsca) podajemy wyniki Shapiro-Wilka: W-dwa miejsca p-trzy miejsca

Można też użyć testu Kołmogorowa-Smirnowa (K-S) (ścieżka taka sama) i podajemy poprawkę Lillieforsa dla małych prób <30 (podajemy d i p + p poprawki)

Dla normalnego rozkładu: wartość przeciętna: średnia, miara rozproszenia: SD, zakres: min-max

Dla skośnego: wartość przeciętna: Mediana, miara rozproszenia: kwartyle (górny i dolny) zkres: min-max

Jeśli w wartościach p mamy 0,0000… to wpisujemy p<0,001

Graficzne przedstawienie:

Klik prawym na nagłówek kolumny> wykresy bloku danych> wykres normalności

Dwa razy kliknąć na tło wykresu>statystyki> zaznaczyć test Shapiro-Wilka

Na wykresie: im bliżej punkty są czerwonej linii tym bardziej zbliżony rozkład do normalnego

Kodowanie: zmiana jednostek, uproszczenie, odejmowanie, mnożenie, dzielenie, nie zmienia charakteru zoskładu

Transformowanie: pierwiastkowanie, potengowanie, odwrotność, log; zmienia charakter rozkładu > dążenie do normalnego

Hipotezy: weryfikujemy testami parametrycznymi:

Procedura:

  1. Dwie hipotezy (czasem więcej) hipoteza zerowa (H0) którą sprawdzamy testem, zakłada, że nie ma istotnych różnic. Hipoteza alternatywna (H1), przeciwstawna do zerowej. Gdy odrzucamy H0 przyjmujemy H1. Celem badań najczęściej jest odrzucenie H0

  2. Poziom istotności (α) – prawdopodobieństwo odrzucenia prawidłowej H0 (błąd pierwszego rodzaju). α=0,05 (5%)

Błędy: α – pierwszego rodzaju; β – drugiego rodzaju: przyjęcie błędnej H0

Moc testu: prawdopodobieństwo nie popełnienia błędu drugiego rodzaju.

  1. Dobieranie testu do hipotezy i liczebności prób i przeprowadzenie go

  2. Decyzja odrzucenie lub nie H0 na podstawie prawdopodobieństwa p

P<α odrzucamy H0

p≥α nie mamy podstaw do obrzucenia H0

  1. Interpretacja wyników. Wyniki istotne statystycznie- wykazana różnica jest większa niż ta, która mogła wyniknąć z błędów statystycznych (więcej niż 0,01 –wysoce istotny)

Test chi kwadrat – nieparametryczny test niezależności zmiennych

H0 – nie ma zależności między zmiennymi

Liczba stopni swobody (df) – (liczba kategorii w wierszu -1)X( liczba kategorii w kolumnie -1)

Testujemy dane nominalne np. różnice we frekfencji

Przy tabeli 2x2 stosujemy poprawkę Yatesa na ciągłość gdy choć jedna z liczebności oczekiwanych jest <10

Podajemy: wynik chi-kwadrat (dwa miejsca), liczbe df i p (trzy miejsca)

Statystyki>statystyki podstawowe> tabele wielodzielcze>określ tabele>ok>opcje (zaznaczamy liczebności oczekiwane i chi-kwadrat i Yatesa gdy potrzebna)

Korelacje liniowe persona (parametryczne) i Spearman (nieparametryczne)

Przed korelacją trzeba sprawdzić czy rozkłady oby grup są normalne (test Shapiro-Wilka): są normalne-persona, nie są normalne-spearman

H0- nie ma zależności gdy r=0, gdy r jest różne od zera jest zależność, p≥0,05- przyjmujemy H0 P<0,05 odrzucamy

podajemy:

Spearman: statystyki>nieparametryczne>korelacje (spearman) oblicz: szczegółowy raport

Persona: statystyki>statystyki podstawowe>dwie listy zmennych, zakładka opcje zaznaczyć wyświetl r,p i N> podsumowanie (można też dodać zmienną grupującą po prawej) (dla przedstawienia graficznego zakładka więcej>wykresy lub wykresy rozrzutu)

Wyniki:

Testowanie różnic między średnimi dwóch grup:

T-student: średnie dwóch grup: zmienne ilościowe, rozkład normalny, n>100 i α=0,01

H0-nie ma różnic w średnich pomiędzy grupami

Statystyki > s. podstawowe > test t dla prób niezależnych (wzgl. Grup) lub (wzgl. zmn.) [zależy od rozkładu danych, czy porównujemy dane w kolumnach(zmienne), czy w grupach(jedna zmenna grupująca)] > zakładka opcje zaznaczyć test z niezal. Estymacją wariancji i test Browna i Forsytha>podsumowanie

Jeśli wariancje dla grup nie są jednorodne: to test Browna i Forsytha, stosujemy test cochrana- coxa (test z oddzielna ocena wariancji) t’, p (nie wiem o co chodzi)

Podajemy: t (dwa miejsca), df i p (trzy miejsca)

Graficzne przedstawienie: wykresy> 2W >ramka-wąsy> zakładka więcej: punkt środkowy: średnia; ramka: odch.std.(współcznnikik:1); wąs:min-max (współcznnikik:1); odstające:wyłączone.

Test t-studenta dla prób zależnych (podobno ma nie być)

Statystyki> test t dla prób zależnych

Graficznie: tak samo jak dla testu t-studenta dla prób niezależnych.

Testy nieparamatryczne:

Test U Manna-Whitneya

Podajemy: p, n (w wynikach podane jest N oddzielnie dla dwóch grup, trzeba je dodać), U (gdy próby ≤20), Z (gdy >20)( dwa miejsca), Z poprawione (gdy obecne są rangi….

Test kolejności par Wilcoxona (chyba ma nie być): nieparametryczny dla prób zależnych liczba par ≥6

Podajemy Z gdy n>25, podajemy T dla n≤25 (dwa miejsca), p, N

Statystyki>s. nieparametryczne> porównanie dwóch grup zależnych> test kolejności prób Wilcoxona

Wykres taki sam jak dla U M-W.

Testy różnic więcej niż 2 grup

Test Kruskala-Wallisa: rozkłady skośne, podobne do siebie, max.10 grup

Statystyka>s. nieparametryczne> porównanie wielu prób niezależnych (grup)> Kruskala-Wallisa i test mediany. (po lewej w wykach wybieramy Anova rang Kruskala-Wallisa) podajemy wyniki znad ramki: Hliczba df, N (podane w nawiasie nad ramką) (dwa miejsca po przecinku), p

Jeśli p<0,05 trzeba wykonać test post hoc Dumna (ścieżka taka sama tylko klikamy wilokr. Porówn. Średnich rang dla wszystkich prób

Wykres taki jak dla U M-W, jeśli test wykaże różnice to należy je zaznaczyć na wykresie i opisać pod nim (strzałkami zaznaczono różnice istotne statystyczne * 0,01<p<0,05;** 0,01<p<0,01 ***<0,001)

Anova: paramatryczny dla więcej niż dwóch prób: anova jedno i dwuczynnikowa, analiza wariancji, zmienne mierzalne, rozkład normalny, jednorodność wariancji (test Browna- Forsytha dla nie równych liczebności grup)jeśli niespełnione > test F-Wersha, liczebność prób >10

Statystyka>s. podstawowe> przekroje, prosta Anova> podsumowanie> zanzaczyć test Welcha w zakłdace testy Anova> analiza wariancji ( sprawdzenie: w zakładce testy anova, skategoryzowany wykres normalności, punkty nie mogą układać się na linii)

Wyniki: podajemy p i F z indeksem dolnym w którym znajdują się odczytane z tabelki wynikowej df Efekt,df Błąd np. F2,47=16,72

Post hoc gdy odrzucamy H0: test Scheffego albo test RIR Tukeya dla nierównych licznosci, taka sama ścieżka jak wcześniej tylko zakładka post-hoc

Graficznie: wykres ramka-wąsy. wykresy> 2W >ramka-wąsy> zakładka więcej: punkt środkowy: średnia; ramka: odch.std.(współcznnikik:1); wąs: min-max (współcznnikik:1); odstające: wyłączone

Zaznaczyć różnice istotne statystycznie na wykresie: strzałkami zaznaczono różnice istotne statystyczne * 0,01<p<0,05;** 0,01<p<0,01 ***<0,001


Wyszukiwarka

Podobne podstrony:
02 06 2012 statystyka notatkiid504
wzory statystyka(1), notatki, III semestr
Statystyka notatki cz1, Statystyka
Wsbif-Wyklad4-Statystyka, notatki ze studiów rok1, statystyka
Wsbif-Wyklad2-Statystyka, notatki ze studiów rok1, statystyka
Wsbif-Wyklad6-Statystyka, notatki ze studiów rok1, statystyka
wzory statystyka, notatki, III semestr
Wsbif-Wyklad7-Statystyka, notatki ze studiów rok1, statystyka
Wsbif-Wyklad1-Statystyka, notatki ze studiów rok1, statystyka
Wsbif-Wyklad5-Statystyka, notatki ze studiów rok1, statystyka
statystyka notatki zaliczenie 2016
statystyka społeczna notatki ze wszystkich wykładów Błaszczak Przybycińska
Zad do rozw r NORMALY, SGH - studia licencjackie - NOTATKI, Statystyka (Tymicki), Statystyka cz1
Wykład 1-1.03.2011, Notatki UTP - Zarządzanie, Semestr II, Statystyka
notatki statystyka, Pedagogika - studia, II semestr - ogólna, Statystyka
Notatki, Rok 2, Statystyka, Na kolokwium
notatki z wykładów od J.Pudełko statystyka nota1
metodologia ćw4 notatki z literatury, Statystyka i metodologia(1)
laboratorium 5, wisisz, wydzial informatyki, studia zaoczne inzynierskie, statystyczne metody wspoma

więcej podobnych podstron