Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 7 Wnioskowanie statystyczn

background image

Wnioskowanie

statystyczne

Facet działający pod pseudonimem Student

Krótkie powtórzenie kolejnych kroków

wnioskowania statystycznego – czyli

marudzenie o pieniądzach

Co dzisiaj?

Dwa rodzaje błędów: Zbyt słabe, albo zbyt

mocne okulary

background image

WNIOSKOWANIE STATYSTYCZNE to szczególny
rodzaj postępowania badawczego, które
dostarcza uzasadnienia dla dokonania kroku
indukcyjnego od znanych właściwości próby
(fragmentu rzeczywistości) do nieznanych (i
badanych) właściwości populacji

Jak wnioskować o

ogromnej populacji

na

podstawie

niewielkiej próby

?

Robimy to zawsze z pewnym prawdopodobieństwem
popełnienia błędu

background image

- wyróżnienie zbioru obiektów tworzących

próbę (losowy dobór)

- wyszczególnienie liczby i rodzaju

zmiennych, za pomocą których
charakteryzujemy populację (zmienne
zależne, zmienne niezależne, zmienne
towarzyszące)

- określenie rodzaju skal pomiarowych,

zastosowanych do wyrażenia wyników

- sprecyzowanie założeń co do charakteru

rozkładu zmiennych (najczęściej chodzi o
rozkład normalny)

background image

Błąd próby

• Jeśli wylosujemy próbę z populacji:

– Średnia w tej próbie może być

większa/mniejsza od średniej w populacji

– Właśnie to, w jakim stopniu statystyka próby

(np. średnia) różni się od odpowiedniego

parametru w populacji (np. średniej w

populacji) określa się błędem próby.

– Im większa badana próba tym mniejszy błąd i

większe prawdopodobieństwo, że średnia z

próby jest bliska średniej w populacji

background image

Wnioskowanie statystyczne

kolejne kroki

1. Hipoteza badawcza

Klasa Jasia to wyjątkowe rozrabiaki
Te dzieci są jakieś dziwne
(Robimy badanie)

2. Hipoteza zerowa

(przeciwieństwo hipotezy

alternatywnej):

Klasa Jasia nie różni się od populacji
Dzieci nie różnią się poziomem rozumienia

od typowej grupy

3. Wybór wzorca do porównań

(rozkładu teoretycznego)

Poziom agresji w populacji
Poziom rozumienia w populacji

background image

Wnioskowanie statystyczne

kolejne kroki

Od którego momentu wynik jest

nietypowy

• Poziom istotności (alfa)

p<0,05
p<0,01
p<0,001

• Wartość krytyczna

Ile wynosi w jednostkach

standardowych wartość

graniczna

Poniżej której jest 95% osób
Poniżej której jest 99% osób
Poniżej której jest 99,9% osób

background image

Z = 1,64; powyżej
tej wartości 5
%wyników

Z = -1,64; poniżej
tej wartości 5
%wyników

background image

WAŻNA
DECYZJA
ŻYCIOWA

Jakiego wybrać
kawalera?

background image

• Dwie możliwości

On jest

dobry

On jest zły

ODRZUCAMY

AKCEPTUJEMY

Utracona miłość

Męczarnia w domu

background image

H0

prawdziwa

H0
fałszywa

ODRZUCAMY

błąd I

błąd I

rodzaju

rodzaju

NIE

ODRZUCAMY

błąd II

błąd II

rodzaju

rodzaju

Co możemy zrobić z hipotezą zerową?

Ryzyko (prawdopodobieństwo) popełnienia błędu I
rodzaju nazywane jest poziomem istotności –

w

badaniach staramy się zminimalizować ten błąd

background image

prawdopodobieństwo popełnienia błędu I
rodzaju (α)

0

1


0,0
5

nie mamy podstaw do
odrzucenia H0

odrzucamy
H0

Jak zapisujemy poziom istotności?

0


0,0
5


0,0
1


0,00
1

p <
0,001

p <
0,01

p <
0,05

background image

Testy statystyczne

Każdy test statystyczny składa się z

następujących specyficznych elementów:

• Hipotezy zerowej i alternatywnej

• Statystyki testu (musimy wiedzieć jak ta

statystyka jest liczona, żeby zrozumieć o co
chodzi – do tej pory była to statystyka Z)

• Rozkładu tej statystyki, który stanowi

podstawę podejmowania decyzji

• Stały element – poziom istotności

W psychologii przyjmuje się trzy poziomy

graniczne p<0,05; p<0,01; p<0,001

H

0

:

H

A

:

background image

Hipotezy teoretyczne kierunkowe i

niekierunkowe

Czy dzieci uznane przez rodziców za uzdolnione

rzeczywiście takie są?

Czy osoby depresyjne mają
trudności z zapamiętywaniem?

Czy osoby poszukujące doznań
lubią sporty ekstremalne?

Czy osoby o wysokim ilorazie
inteligencji są lubiane przez
rówieśników?

Czy osoby o wysokiej potrzebie aprobaty
społecznej różnią się poziomem altruizmu od
osób o niskiej potrzebie aprobaty?

Czy kobiety i mężczyźni różnią się
umiejętnościami prowadzenia samochodu?

background image

Hipotezy teoretyczne kierunkowe i

niekierunkowe

Klasa Jasia to wyjątkowe rozrabiaki
Zakładamy p<0,05 – ale interesuje nas tylko prawy

kraniec rozkładu – wysokie wyniki w skali agresji

Te dzieci są jakieś dziwne
Zakładamy p<0,05 – ale interesują
nas oba krańce rozkładu – zarówno
wysokie jak i niskie wyniki

Poziom
agresji

Poziom rozumienia
tekstu

5%

1,64 Z

2,5%

-1,96

Z

2,5%

1,96 Z

background image

Hipotezy - podsumowanie

Hipotezy teoretyczne
sformułowane w języku teorii psychologicznej
• kierunkowe i niekierunkowe

Trening kreatywności menadżerów firmy „Krówka – ciągutka” poprawił ich

kreatywność

Policjanci, którzy przeczytali dowcipy o głupich policjantach zgłupieją.
Efekt memento mori – myśli o śmierci powodują zmianę ważności pewnych

elementów doświadczenia i zmianę zachowania

Hipoteza zerowa i alternatywna
sformułowane w języku technicznym – statystycznym

H

0

: Nie będzie różnic między średnią kreatywnością menadżerów przed i po

treningu kreatywności. (H

A

: Będą różnice)

H

0:

Policjanci, którzy czytali kawały będą w stanie wykonywać tyle samo

trudnych łamigłówek jak policjanci, którzy nie czytali kawałów (H

A

: Będą

różnice)

H

0:

Osoby, które poproszono o myślenie o własnej śmierci nie różnią się

średnią skłonnością do pomagania od osób, które nie zostały poddane tej

manipulacji (H

A

: Będą różnice)

background image

Poziom teoretyczny – dotyczy zmiennej
teoretycznej (ekstrawersja)

hipoteza teoretyczna

Poziom operacyjny – operacjonalizujemy
zmienną teoretyczną (język wskaźników –
wyniki w kwestionariuszu ekstrawersji)

hipoteza operacyjna

Problemy? – jak znaleźć tę jedną, „prawdziwą”
operacjonalizację

background image

Czy Polacy zarabiają średnią

krajową?

Jeden z badaczy zajmujących się psychologią

ekonomiczną postanowił sprawdzić, czy przeciętnie
Polacy zarabiają tyle ile wynosi średnia krajowa.
Badacz zauważył, że jego znajomi ciągle narzekają
na swoje dochody. Zaczął się zastanawiać, czy jest
aż tak źle, czy też narzekanie na pieniądze jest
zwyczajową wymianą uprzejmości.

Przebadał reprezentatywną 1000 osobową grupę

Polaków. Ustalił też, że średnie dochody w Polsce
wynoszą 2200 brutto a ich odchylenie standardowe
200 złotych (dane GUS – dane o populacji).

Nasi respondenci przeciętnie zarabiają 2700 złotych
Pytanie badawcze: Czy respondenci różnią się

poziomem dochodów od przeciętnego Polaka?

Hipoteza zerowa

:

Średni

dochód respondentów

nie

różni

się od średniej krajowej.

Hipoteza alternatywna

:

Średni

dochód respondentów

różni się

od średniej krajowej

background image

Czy Polacy zarabiają średnią krajową -

obliczenia

Standaryzujemy wynik uzyskany w naszym

badaniu traktując średni dochód krajowy
(wskaźnik GUS) jako punkt odniesienia

.

Z=(2700-2200)/200
Z=2,5

Posługując się rozkładem normalnym sprawdzamy

jakie jest prawdopodobieństwo uzyskania wyniku

powyżej Z=2,5

Zakładamy poziom istotności p<0,05

Dla Z=2,50 procent od średniej wynosi 49,38.

Dodajemy 50% poniżej średniej i mamy 99,38%.

Zatem powyżej tej wartości pozostaje mniej niż

5% zgodnie z zakładanym poziomem istotności.

Odrzucamy zatem hipotezę zerową i przyjmujemy

alternatywną.

Średn
ia

Wynik
2,5Z

50
%

49
%

Mniej niż
5%

background image

Czy Polacy zarabiają średnią krajową?

Jak to opisać

Na podstawie wykonanych obliczeń (Z=2,5; p<0,05)

możemy stwierdzić, że odrzucamy hipotezę zerową a
tym samym przyjmujemy alternatywną. A zatem
przebadana grupa nie zarabia średniej krajowej. Co
więcej na podstawie średnich (patrz wykres) możemy
stwierdzić, że nasi respondenci zarabiają przeciętnie
więcej niż wynosi średnia krajowa.

0

500

1000

1500

2000

2500

3000

dochody w złotych

średnia krajowa

dochody w

badanej grupie

background image

Ale można też inaczej

Test T-Studenta dla jednej próby

Zamiast statystyki Z możemy się posłużyć statystyką T.

Tym bardziej, ż nie zawsze znamy parametry populacji.

Statystyka ta została zaproponowana przez Studenta,

który opracował także rozkład teoretyczny tej

statystyki. Rozkład statystyki T dla dużych grup ma

kształt zbliżony do rozkładu normalnego.

Student (w rzeczywistości Wiliam S. Gosset) stanął przed

poważnym pytaniem jak spowodować, żeby piwo

produkowane z różnych składników miało ten sam

smak, niezależnie od partii. Musiał opublikować swoją

pracę pod pseudonimem bo jego warzelnia bała się ze

sprzeda jej tajemnice i nie zezwoliła na publikację.

„Student” robił błędy obliczeniowe, najważniejsze notatki

robił na kopertach i nie lubił piwa

background image

Podstawowe informacje o teście T dla

jednej próby

Zadaniem tego testu jest porównywanie średniej

grupowej z pewną stałą wartością.

Hipoteza zerowa: Nie ma różnic między średnią

grupową a pewną wartością (stałą), którą
znamy.

Hipoteza alternatywna: Są różnice między stała

a średnią grupową.

Decyzję podejmujemy licząc statystykę T i

odnosząc ją do rozkładu tej statystyki. Jak ją
policzyć?

background image

Badania nad obżarstwem

Czy Amerykanie jedzą za dużo?
Badacz postanowił sprawdzić, czy Amerykanie są

otyli bo jedzą złe rzeczy, czy też jedzą zbyt
często. W tym celu przebadał 10 osób, mierząc
ile posiłków dana osoba zjadła w ciągu jednego
dnia.

Postawił hipotezę, że Amerykanie dlatego są

otyli, że jedzą zbyt wiele posiłków dziennie.

• Hipoteza zerowa: Średnia ilość posiłków

jedzonych przez Amerykanów nie różni się od
4.

• Hipoteza alternatywna: średnia ilość posiłków

różni się istotnie od 4.

background image

Wyniki badania

Na podstawie przebadanej

grupy można powiedzieć,
że Amerykanie jedzą
przeciętnie 2 posiłki

dziennie.

Liczba

posiłków

1 osoba

3

2 osoba

2

3 osoba

1

4 osoba

1

5 osoba

1

6 osoba

2

7 osoba

2

8 osoba

1

9 osoba

4

10 osoba

3

background image

Liczenie statystyki T

Jedyne czego nam brakuje to odchylenie std. średniej

– to nie jest to samo co odchylenie std. wyników.

Średnia w
populacji

t =

Odchylenie std.
średniej

Średnia grupowa
-

S

t

background image

Jak nie dostać wariacji nad wzorami

wariancji

Dwa wzory:

Opis statystyczny - próba

Suma kwadratów odchyleń wyników od

średniej

dzielona przez ich liczbę

(czyli

liczbę osób)

Wnioskowanie statystyczne - populacja

Dokonujemy oszacowania wariancji w

populacji na podstawie próby, więc

dzielimy licznik przez liczbę osób –1

Tak więc licząc odchylenie standardowe

średniej używamy właśnie tego
drugiego wzoru.

2

1

)

(

N

M

X

i

2

)

(

N

M

X

i

background image

Odchylenie std. średniej

Wariancję wyników w próbie (1) dzielimy przez

liczbę osób (10) i pierwiastkujemy, żeby
uzyskać odchylenie standardowe średniej.

Odchylenie to wynosi 0,32

• Liczymy t=(2-3)/0,32=-3,125
Wiemy zatem, że wartość statystyki t w teście

dla jednej próby wynosi -3,125

background image

Odczytywanie poziomu

istotności

Aby odczytać poziom istotności danej wartości testu T

musimy znać

liczbę stopni swobody

(df-degree of

freedom)– uzależnioną od liczby osób.

W teście T dla jednej próby stopnie swobody wynoszą

tyle ile liczba osób pomniejszona o 1 (czyli 9).

Stopnie swobody pojawiają się dlatego, że dla prób o

różnej wielkości rozkład jest troszkę inny.

Oprócz stopni swobody musimy wiedzieć, czy hipoteza

jest kierunkowa (wtedy

test jednostronny

), czy też

niekierunkowa – (wtedy

test dwustronny

)

Dla 9 stopni swobody (test jednostronny) wartość

krytyczna T, dla poziomu istotności p<0,05, wynosi

1,833 lub

–1,833.

background image

Porównujemy wartość graniczną i wartość

uzyskaną w obliczeniach – najlepiej na osi
liczbowej. Zaznaczamy zatem wartość
graniczną statystyki t oraz wartość t obliczoną
przez nas. Wartość t uzyskana w naszym
badaniu wpada w obszar odrzucenia.

Wartość krytyczna

statystyki T dla df=9

t= -1,833

Wartość statystyki t

uzyskana w naszym

badaniu t= -3,125

Obszar odrzucenia H0:
p<0,05

background image

Wnioski

Tak więc na poziomie istotności p<0,05 odrzucamy

hipotezę zerową, że Amerykanie jedzą trzy posiłki

dziennie

t(9)=3,125; p<0,05

(Zapis APA).

Uwaga – przy wartości statystyki t nie piszemy znaku

„-”

Czy to oznacza, że nasza hipoteza się potwierdziła?
Niestety nie!
Myśleliśmy, że Amerykanie jedzą więcej niż trzy

posiłki, podczas, gdy średnia liczba posiłków

wynosi 2, czyli jest mniejsza niż średnia w

populacji.

Oznacza to, nasze poszukiwania wyjaśnienia otyłości

Amerykanów powinny iść nie w kierunku ilości

posiłków, ale ich wielkości.

background image

Czy model rodziny 2+2

jeszcze funkcjonuje?

Statystyki dla jednej próby

4034

1,99

1,567

,025

LICZBA DZIECI

N

Średnia

Odchylenie

standardowe

Błąd

standardowy

średniej

Test dla jednej próby

-,372

4033

,710

-,01

-,06

,04

LICZBA DZIECI

t

df

Istotność

(dwustronna)

Różnica

średnich

Dolna granica Górna granica

95% przedział ufności dla

różnicy średnich

Wartość testowana = 2

Wniosek: Na podstawie statystyk testu T-Studenta dla
jednej
próby nie ma podstaw do odrzucenia hipotezy zerowej
t(4033)=0,372; p>0,05. Zatem przeciętna polska rodzina
zawiera dwójkę dzieci


Document Outline


Wyszukiwarka

Podobne podstrony:
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 3 Wprowadzenie do procesu
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 5 Główne schematy eksperym
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 10 Test na rozpoznawanie
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 4 Statystyki opisowe i kor
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 14 Statystyka
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 2 Miary tendencji centraln
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 6 Rozkład normalny i prawd
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 8 Testy T Studenta
Metodologia Statystyka Grzegorz Sędek kurs podstawowy wykład 5 Rozkład normalny i prawd
Metodologia z elelmentami statystyki dr Grzegorz Sędek wykład 8 Wnioskowanie statystyczne
Metodologia z elelmentami statystyki dr Grzegorz Sędek wykład 7a Statystyczne wnioskowanie
Metodologia z elelmentami statystyki dr Grzegorz Sędek wykład 6a Wnioskowanie
dzienni 2006 wyklad 2, Sesja, Rok 2 sem 1, WYKŁAD - Metodologia ze statystyką - kurs podstawowy

więcej podobnych podstron