Statystyka 07.06.2009, Statystyka


Kiniuś™

Statystyka

Dr Elżbieta Grabowska

(notatki z wykładu 7)

07.06.2009

WNIOSKOWANIE STATYSTYCZNE

Wnioskowanie statystyczne polega na stosowaniu testów, czyli na podstawie próby losowej, weryfikujemy wnioski o całej populacji.

Bazą teoretyczną wnioskowania statystycznego jest:

Centralne twierdzenie graniczne Linderberga - Levy'ego

Przy liczebność próby m zmieniającej do nieskończoności rozkład 0x01 graphic
jest zbieżny do rozkładu normalnego ze średnią m (0x01 graphic
i odchyleniem standardowym0x01 graphic
)

0x01 graphic
- średnia z próby

0x01 graphic
- średnia z populacji

S - odchylenie standardowe

0x01 graphic
- (mała sigma) odchylenie z populacji

n - liczebność z próby

Na podstawie tego twierdzenia przyjmuje się że przy dostatecznie dużej próbie rozkład średniej jest w przybliżeniu normalny.

Testem statystycznym nazywa się procedurę sprawdzania hipotezy statystycznej na podstawie wyników próby losowej.

Hipoteza statystyczna to przypuszczenie, dotyczące rozkładu cechy w populacji lub wartości jego parametrów w populacji.

Hipoteza Zerowa (weryfikowana)

Która dla testów istotności różnic i testów niezależności ma zawsze brzmienie przekorne w stosunku do zamierzeń badawczych, czyli zawsze zakłada brak istotnych różnic w populacji lub brak istotnych zależności cech w populacji.

Hipoteza Alternatywna

To przypuszczenie, które jesteśmy skłonni przyjąć, gdy odrzucamy hipotezę zerowa.

!!! Wynik testu jest zawsze prawdopodobny (nigdy 100%) pewny tzn. jest obciążony błędem wnioskowania.

Kiniuś™

Błąd I rodzaju

Polega na odrzuceniu hipotezy zerowej mimo, że jest ona prawdziwa.

Poziomem istotności p (0x01 graphic
) nazywa się prawdopodobieństwo popełnienia błędu I rodzaju.

Wartości p są na ogół 0x01 graphic
, oznacza to, że jest 5% ryzyko błędu we wnioskowaniu o populacji, czyli w 5 przypadkach na 100, wynik testu ma prawo okazać się fałszywy.

p=0,05 ufność wniosku : 1-p =0,95

Czyli co najmniej 95% prawdopodobieństwa, że dane w populacji będą takie jak w próbie badanej.

Błąd II rodzaju

Polega na przyjęciu hipotezy zerowej, gdy jest ona fałszywa.

Prawdopodobieństwo popełnienia takiego błędu oznacza się 0x01 graphic

Obszarem krytycznym nazywamy zbiór wartości sprawdzanej hipotezy, które przemawiają za odrzuceniem hipotezy zerowej.

Obszarem przyjęć nazywamy zbiór wartości, które przemawiają za przyjęciem hipotezy zerowej.

0x08 graphic
0x08 graphic
0x01 graphic

0x01 graphic

Jeżeli średnia z populacji równa jest 0x01 graphic
czyli wartości powinny się miescić w pewnym obszarze przyjęć.

Kiniuś™

Hipotezy statystyczne mogą być dwustronne (bezwarunkowe)

i jednostronne (kierunkowe).

Obszar krytyczny lewostronny:

0x08 graphic

0x08 graphic
0x01 graphic

wzrost studentów jest mniejszy od średniej populacyjnej.

Obszar krytyczny prawostronny:

0x08 graphic

0x08 graphic
0x01 graphic

Każdy test statystyczny stosowany jest wg. jednolitej procedury, które obejmują następujące etapy:

1) Określenie celu testowania C

Czy chodzi nam o badanie istotności różnic między grupami czy też o badanie zależności cech w obrębie jednej populacji. Dodatkowo określamy rodzaj danych : jakościowe, porządkowe, ilościowe.

2) Sprawdzenie założeń modelowych M

To zbiór warunków które muszą spełniać dane, aby można było zastosować dany test.

Wszystkie testy dzielą się na:

- parametryczne: wymagają rozkładu normalnego w populacji np. testy studenta, test Lavena, analiza wariancji (w każdej postaci) testy szacowania istotności r Persona.

- nieparametryczne: np. test U Mann - Whitney, test Chi2, test szacowania istotności współczynnika korelacji rho Spearmana.

Wszystkie testy dla cech jakościowych i porządkowych są nieparametryczne. Większość testów dla cech ilościowych to testy parametryczne.

Kiniuś™

3) Opis Prób P

Czyli ustalanie jakie dane z próby są potrzebne, aby można było zastosować

wybrany test.

4) Postawienie hipotezy zerowej ewentualnie też hipotezy alternatywnej.

5) Weryfikacja hipotezy zerowej W

Obliczenie wartości testowej t dla danego testu.

Ustalenie parametrów wartości krytycznej, przyjmujemy odpowieni poziom p i df (stopni swobody)

Parametr df - im wyższa liczba stopni swobody tym trudniej jest wykazać istotność wniosków dla małej próby.

Znalezienie wartości krytycznej w tablicach statystycznych.

SWS - sformułowanie wniosku statystycznego

Jeżeli wartość testowa jest mniejsza lub równa od wartości krytycznej to odrzucamy hipotezę zerową i przyjmujemy że wynik testu jest istotny dla populacji.

Jeżeli jest większy lub równy, to jest brak podstaw do odrzucenia hipotezy zerowej i akceptujemy ją.

TEST STUDENTA DLA 1 ŚR.

Ustalenie czy średnia różni się istotnie od przyjętej wartości 0x01 graphic
przyjmującej pewną konkretną wartość liczbową.

Założenia modelowe:

- 1 populacja

- 1 próba reprezentatywna

- 1 cecha ilościowa wyrażona na skali stosunkowej lub przedziałowej

- rozkład cechy normalny w populacji

Uwaga!

Normalność rozkładu cechy oceniamy:

- przy niektórych cechach np. wzrost wiadomo, że mają rozkład normalny

- można zastosować test zgodności z rozkładem normalnym

- jeżeli nie przyjmuje wartości ekstremalnych to szacuje się, że wartość z próby świadczy o tym że w populacji przyjmuje rozkład normalny

- przy danych liczebnościach prób ( w praktyce >100os.)jeżeli stosujemy jako narzędzie pomiaru wystandaryzowane i znormalizowane testy psychologiczne to w praktyce można przyjąć, że rozkład pomiaru będzie normalny

Kiniuś™

Hipoteza zerowa (dwustronna)

0x01 graphic

zad.

Producent opon samochodowych podaje `długość życia” opony, ma ono rozkład normalny i opona starcza na 50 tys. km. Na podstawie 26 losowo wybranych opon uzyskamy:

0x08 graphic

Czy producent ma rację tzn. czy można uznac że średnia z próby nie różni się istotnie od zakładanej średniej populacyjnej?

t = -3,125

0x08 graphic

średnia rzeczywista różni się od zakładanej

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic

0x01 graphic

Długość życia opon samochodowych różni się istotnie od zakładanego standardu.

Kiniuś™

Badanie istotności różnic jednej cechy ilościowej dla 2 populacji wymaga zawsze baterii dwóch testów:

- Testu Levena dla sprawdzenia istotności różnic między wariancjami

- Testu Studenta dla 2 prób niezależnych dla sprawdzenia istotności różnic między średnimi

Zad.

Postanowiono sprawdzić czy poziom wyobraźni przestrzennej kobiet i mężczyzn różni się istotnie. Zestawiono wyniki w punktach testu kwadratów.

Dane:

0x08 graphic
Kobiety Mężczyźni

0x08 graphic

Czy jest istotna różnica miedzy S2 ? - test Lavena

Czy jest istotna różnica między 0x01 graphic
? - test Studenta

0x08 graphic
0x08 graphic
0x01 graphic

L = 4 p < 0,006

Jest istotna różnica między wariancjami co oznacza, że rozrzut (rozproszenie) poziomu wyobraźni przestrzennej kobiet różni się istotnie od poziomu zróżnicowania mężczyzn.

Założenia modelowe:

- 2 populacje niezależne

- 2 próby reprezentatywne (po jednej z każdej populacji)

- liczebność prób taka sama lub zbliżona

- mierzymy jedną tą sama cechę ilościową w obu grupach. Pomiar musi być wyrażony na skali stosunkowej lub przedziałowej, pożądane jest, aby był ciągły lub w przybliżeniu ciągły

- rozkład cechy w obu populacjach musi być normalny

-jeżeli wariancje różnią się istotnie ( SA heterogeniczne) bądź nie różnią się istotnie (są homogeniczne) to stosujemy odpowiednią wersję testu studenta.

Kiniuś™

Test studenta dla prób zależnych (Gosseta)

Założenia:

- 1 populacja

- 1 próba reprezentatywna

- liczebność próby dowolna

- 1 cecha ilościowa

- pomiar dwukrotny w odstępie czasowym (dotyczący tego samego i w ten sam sposób)

Zad.

W losowo wybranej grupie kursantów dwukrotnie przeprowadzono kwestionariusz sztywności myślenia (wyniki w pkt). Kwestionariusz był wystandaryzowany i znormalizowany (rozkład normalny) pomiar przeprowadzono przed i po kursie twórczego myślenia. Ustalić czy przebyty kurs wpłynął istotnie na poziom sztywności myślenia.

t = 1,25

p = 0,05

df = N - 1 10-1=9

0x01 graphic

7

0x01 graphic

0x01 graphic

0x01 graphic

p/2

odrzucamy hipotezę zerową przyjmujemy alternatywną

p/2

Obszar odrzucenia

Obszar przyjęć

0x01 graphic

t istotne na poziomie 0,05 ; 0,02 ; 0,01 - ryzyka błędu

t na poziomie 0,001 nie istotne (bo 3,745 > 3,125)

wartości t0,09, t0,02 itd. wzięte z tablic statystycznych

0x01 graphic

0x01 graphic

Mniejszy rozrzut wyników



Wyszukiwarka

Podobne podstrony:
PEDIATRIA wykład 07-06-2009
Pytania - test u Pi-ata (energoelektronika), EiE test piłat 07.06.2009, elektronika
Historia i kultura USA notatki 07 06 2009
KIGN 2 STOPIEN 07 06 2009
Statystyka 21.06.2009, Statystyka
2009 07 06 18 52 27 893138 cut 893138 1
07 8 Mieczy II Danuta 15 06 2009
Psychologia społeczna 07.03.2009, Uczelnia, Psychologia społeczna
egz pilotów 15 i 16 06 2009(2), pilot wycieczek
konstr  06 2009
07 05 2009
2003 07 06
odp 06 2009 klucz pis 0X 092
lo orm2 07 06 kp1 Nieznany
dyskoteka 1 06 2009
6.06.2009, zad222
egzamin 06 2009

więcej podobnych podstron