Metody statystyczne dla opornych cz 1


Metody statystyczne
dla opornych cz. 1
Podstawowe pojęcia
Inquiry, 2007
Fakt 1
Analiza statystyczna to nie to samo, co wró\enie ze szklanej kuli
Analiza statystyczna to nie to samo, co wró\enie ze szklanej kuli
 Zbieranie, przetwarzanie i interpretacja
Analiza
Analiza
danych według dobrze określonej
statystyczna
statystyczna
procedury
`"
`"
`"
`"
Fakt 2
Procedury zbierania i analizy danych są
Procedury zbierania i analizy danych sąopracowane tak, by wynik
opracowane tak, by wynik
analiz miał
analiz miałjakiś związek z rzeczywistością. Ale z wielu powodów
jakiśzwiązek z rzeczywistością. Ale z wielu powodów
nigdy nie mamy pełnego obrazu
nigdy nie mamy pełnego obrazu
Jesteśmy jednak optymistami
Rzeczywistość Wyniki analizy
Interpretacja
Interpretacja
Zbieranie danych
Zbieranie danych
danych
danych
Przetwarzanie
Przetwarzanie
danych
danych
" Mamy nadzieję, \e nasz opis, czyli wyniki analizy,
mają coś wspólnego z rzeczywistością!
Fakt 3
Analiza danych w statystyce to co najmniej 3 ró\ne rodzaje działalności
Analiza danych w statystyce to co najmniej 3 ró\ne rodzaje działalności
  Redukcja danych
Redukcja danych
" " Poświęcamy niuanse i detale pojedynczych wypowiedzi,
Poświęcamy niuanse i detale pojedynczych wypowiedzi,
ale za to widzimy ogólne zjawiska
ale za to widzimy ogólne zjawiska
-- Tabele
Tabele
-- Statystyki opisowe
Statystyki opisowe
  Wnioskowanie statystyczne
Wnioskowanie statystyczne
" " Sprawdzamy hipotezy mówiące o ró\nicach pomiędzy grupami
Sprawdzamy hipotezy mówiące o ró\nicach pomiędzy grupami
-- Czy mę\czyzni palą
Czy mę\czyzni paląwięcej ni\ kobiety?
więcej ni\kobiety?
-- Czy palacze piją
Czy palacze pijąwięcej od niepalących?
więcej od niepalących?
" " Sprawdzamy hipotezy mówiące o zale\nościach między zmiennymi
Sprawdzamy hipotezy mówiące o zale\nościach między zmiennymi
-- Czy wydatki na sprzęt sportowy rosną, czy maleją
Czy wydatki na sprzęt sportowy rosną, czy malejąwraz z wiekiem?
wraz z wiekiem?
-- Czy poziom zamo\ności wią\e się
Czy poziom zamo\ności wią\e sięliczbą posiadanych kart kredytowych?
liczbąposiadanych kart kredytowych?
  Analiza związków przyczynowo-skutkowych
Analiza związków przyczynowo-skutkowych
" " Eksperymenty
Eksperymenty
Fakt 4
Dane do analizy mają
Dane do analizy mająpostać (czasem wielowymiarowej) tabeli,
postać(czasem wielowymiarowej) tabeli,
zawierającej
zawierającej
  badane obiekty (najczęściej w wierszach)
badane obiekty (najczęściej w wierszach)
  zmienne opisujące te obiekty (najczęściej w kolumnach)
zmienne opisujące te obiekty (najczęściej w kolumnach)
 Obiektem analizy statystycznej mo\e
Obiekt
być niemal wszystko: rzeczy, ludzie,
Obiekt
firmy, zdarzenia...
 W badaniach rynkowych obiektami są
na ogół ludzie
 Zbiór cech badanych obiektów
Zmienna
- ulubiony program telewizyjny
Zmienna
- ocena smaku jogurtu
- wiek
- miejsce zamieszkania
Fakt 5
Zmienne u\yte do opisu badanych obiektów mogą
Zmienne u\yte do opisu badanych obiektów mogąmieć bardzo ró\ne
miećbardzo ró\ne
właściwości. W statystyce mówimy o ró\nych rodzajach skal
właściwości. W statystyce mówimy o ró\nych rodzajach skal
W kwestionariuszach stosowane są
W kwestionariuszach stosowane są4 podstawowe typy skal
4 podstawowe typy skal
Ka\dy typ skali ma inne właściwości; nie ka\da skala dopuszcza
Ka\dy typ skali ma inne właściwości; nie ka\da skala dopuszcza
wszystkie operacje matematyczne
wszystkie operacje matematyczne
  Człowiek i pies mają
Człowiek i pies mająśrednio 3 nogi&
średnio 3 nogi&
 Dostępny zakres wartości
Skala
" Skale opisowe
Skala
" Skale liczbowe
Dla wygody wyniki pomiaru zapisujemy za pomocą liczb,
ale ta sama wartość mo\e oznaczać
za ka\dym razem co innego!
 Marka kawy  Opinie  Rok  Cena
1. Jacobs 1. Zdecydowanie mi się podoba 1. Rok 1 1. 1 PLN
2. Tchibo 2. Raczej mi się podoba 2. Rok 2 2. 2 PLN
3. Pedros 3. Raczej mi się nie podoba 3. Rok 3 3. 3 PLN
4. Astra 4. Zdecydowanie mi się nie 4. Rok 4 4. 4 PLN
podoba
Nominalna Porządkowa Interwałowa Ilorazowa
Nominalna Porządkowa Interwałowa Ilorazowa
Cechy skal
Skala
Nominalna Porządkowa Interwałowa Ilorazowa
Cecha
Kolejność nie ma jest jest jest
Jednakowy
odstęp nie ma nie ma jest jest
Zero absolutne
nie ma nie ma nie ma jest
Jakościowe ró\nice Ranking Ró\nice: o ile Ilość (konieczne
O czym informuje
pomiędzy obiektami (np. preferencje więcej/mniej? jednostki!)
(np. płeć respondenta) wobec marek) (np. temperatura) Częstość
Co wolno, a czego nie
Skala
Nominalna Porządkowa Interwałowa Ilorazowa
Co liczymy
% wystąpień, w
tym wartość tak tak tak tak
modalna*
Mediana,
kwartyle, nie tak tak tak
centyle...
Średnia nie nie tak tak
Suma nie nie nie tak
" Przykład: jeśli wyciągasz średnie z ocen na skali porządkowej,
pamiętaj \e stoi za tym zało\enie o jednakowych odstępach.
" To nie musi być prawda!
Jak opisywać wyniki badania?
TAK
%,
Czy zmienna jest
nominalna?
wartość modalna*
NIE
TAK
Czy wa\na jest
średnia
suma wartości?
NIE
Czy rozkład
TAK
jest silnie
mediana
niesymetryczny?
NIE
*) wartość modalna to ta wartość zmiennej, której częstość
występowania w % jest największa. Na przykład w
średnia
sonda\ach wyborczych wartość modalna = partia, która ma
o najwy\sze poparcie w %
Zagadka
Jak wiadomo, ptaki kiwi mieszkają
Jak wiadomo, ptaki kiwi mieszkająw Nowej Zelandii. Są bardzo rzadkie, a
w Nowej Zelandii. Sąbardzo rzadkie, a
ich wzrost przebiega osobliwie:
ich wzrost przebiega osobliwie:
  gdy wykluwają
gdy wykluwająsię z jajka, majądokładnie 1 stopę wzrostu,
sięz jajka, mają dokładnie 1 stopęwzrostu,
  następnie rosną
następnie rosnąskokami, za ka\dym razem o 1 stopę.
skokami, za ka\dym razem o 1 stopę.
Pewien przyrodnik pojechał
Pewien przyrodnik pojechałdo Nowej Zelandii
do Nowej Zelandii
i znalazł
i znalazłw d\ungli 4 kiwi.
w d\ungli 4 kiwi.
Średni wzrost kiwi w tej próbie wynosi 4 stopy, mediana 3 stopy, a wartość
Średni wzrost kiwi w tej próbie wynosi 4 stopy, mediana 3 stopy, a wartość
modalna 
modalna  2 stopy.
2 stopy.
Jakiego wzrostu są
Jakiego wzrostu sąwszystkie 4 kiwi?
wszystkie 4 kiwi?
Wskazówka: wzrost ka\dego kiwi w stopach jest liczbą całkowitą
Fakt 6
Jedne zmienne są
Jedne zmienne sąbardziej zmienne od drugich
bardziej zmienne od drugich
Gdyby wszyscy mówili to samo, wystarczyłoby spytać
Gdyby wszyscy mówili to samo, wystarczyłoby spytaćjednego. Ale
jednego. Ale
opinie w jednej sprawie mogą
opinie w jednej sprawie mogąbyć bardziej zró\nicowane ni\w innej
byćbardziej zró\nicowane ni\ w innej
W statystyce mówimy o wariancji
Wariancja to termin zarezerwowany dla skal ilorazowych i interwałowych
Wariancja to termin zarezerwowany dla skal ilorazowych i interwałowych
Wariancja z próby dana jest wzorem
Wariancja z próby dana jest wzorem
_
Ł (xi  x )2
s2 =
N - 1
  s nazywamy odchyleniem standardowym
s nazywamy odchyleniem standardowym
  du\a wariancja oznacza, \e wartości zmiennej mają
du\a wariancja oznacza, \e wartości zmiennej majądu\y rozrzut, a więc np.
du\y rozrzut, a więc np.
opinie są
opinie sązró\nicowane
zró\nicowane
Dla słabszych skal miarą
Dla słabszych skal miarązmienności jest np.
zmienności jest np.
  Dla zmiennych nominalnych miara zmienności odnosi się
Dla zmiennych nominalnych miara zmienności odnosi siędo modalnej
do modalnej
" " Współczynnik zmienności VR = 1 -ffm/n, gdzie fm  frekwencja dla wartości modalnej w
/n, gdzie fm frekwencja dla wartości modalnej w
Współczynnik zmienności VR= 1 - m
%, n 
%, n  liczba mo\liwych wartości
liczba mo\liwych wartości
  Dla zmiennych porządkowych -
Dla zmiennych porządkowych -do zakresu wartości:
do zakresu wartości:
" " Odstęp pomiędzy pierwszym i trzecim kwartylem, tzw
3 1
Odstęp pomiędzy pierwszym i trzecim kwartylem, tzwIQR = Q Q1
IQR = Q3  Q
" " Współczynnik zmienności VQ=IQR/(Q3+Q1) *100%
Współczynnik zmienności VQ=IQR/(Q3+Q1) *100%
Fakt 7
Dodatkowo, bardzo wa\ną
Dodatkowo, bardzo wa\nącechą skali jest jej rozkład.
cechąskali jest jej rozkład.
O ile rodzaj skali wynika z konstrukcji pytania w kwestionariusz, o
O ile rodzaj skali wynika z konstrukcji pytania w kwestionariusz, o
rozkładzie mo\emy coś
rozkładzie mo\emy cośpowiedzieć dopiero gdy znamy wyniki
powiedziećdopiero gdy znamy wyniki
Aby w ogóle mówić
Aby w ogóle mówićo statystyce, musimy zapewnić \e nasze zmienne
o statystyce, musimy zapewnić\e nasze zmienne

sązmiennymi losowymi
zmiennymi losowymi
  To dlatego losujemy osoby biorące udział
To dlatego losujemy osoby biorące udziałw sonda\ach!
w sonda\ach!
Rozkład zmiennej to funkcja
Funkcja rozkładu mówi:
Funkcja rozkładu mówi:
" " Jakie jest prawdopodobieństwo uzyskania konkretnej wartości
Jakie jest prawdopodobieństwo uzyskania konkretnej wartości
" " dla zmiennych dyskretnych -
dla zmiennych dyskretnych -przyjmujących wartości
przyjmujących wartości
np. 1, 2, 3, 4
np. 1, 2, 3, 4
LUB
LUB
" " Jakie jest prawdopodobieństwo uzyskania wartości z pewnego
Jakie jest prawdopodobieństwo uzyskania wartości z pewnego
przedziału
przedziału
" " dla zmiennych ciągłych -
dla zmiennych ciągłych -np. o wartościach dodatnich
np. o wartościach dodatnich
Rozkład zmiennej losowej
Zmienna
dyskretna
25%
20%
15%
10%
Zmienna
5%
ciągła
0%
1 2 3 4 5 6 7 8 9 10
Ocena reklamy
Rozkład ciągły (ka\da wartość jest mo\liwa)
Rozkład zmiennej przyjmującej 10 ró\nych wartości
Odsetek przypadków
Fakt 8
Najwa\niejszy rozkład w statystyce to rozkład normalny
Najwa\niejszy rozkład w statystyce to rozkład normalny
Wzór na funkcję
Wzór na funkcjęrozkładu normalnego jest paskudny, ale wykres ma
rozkładu normalnego jest paskudny, ale wykres ma
charakterystyczny 
charakterystyczny  naszym zdaniem piękny  kształt podobny do
naszym zdaniem piękny  kształt podobny do
dzwonu
dzwonu
Rozkład normalny
Zaznaczony obszar jest
równy prawdopodobieństwu
P uzyskania przy losowaniu
wartości x lub mniejszej




= średnia

= średnia

2 = wariancja



2 = wariancja



" Standardowy rozkład normalny (na rysunku) ma
średnią równą 0 i wariancję 1
Przykłady
Ró\ne wartości 


Ró\ne wartości i 
i 



Standardowy rozkład normalny
" Jeśli X to początkowe wartości zmiennej, to wzór na Z
daje wartości zestandaryzowane. W wielu wypadkach
przed jakąkolwiek dalszą analizą procedura wymaga
standaryzacji zmiennych  właśnie wg tego wzoru
Fakt 9
Rozkłady 
Rozkłady  podobnie jak inne funkcje  mogąmieć bardzo ró\ne
podobnie jak inne funkcje  mogą miećbardzo ró\ne
kształty
kształty
Aby móc jakoś je porównywać, wprowadzono odpowiednie miary
Aby móc jakoś je porównywać, wprowadzono odpowiednie miary
Czym się ró\nią rozkłady zmiennych?
Zakres wartości Wartości występujące najczęściej
Wariancja Miejsce skupienia
Wariancja Miejsce skupienia
Symetria
Skośność
Skośność
Fakt 10
Nale\y rozró\nić
Nale\y rozró\nićmiędzy rozkładem teoretycznym i rozkładem
między rozkładem teoretycznym i rozkładem
otrzymywanym w konkretnym eksperymencie
otrzymywanym w konkretnym eksperymencie
Przy bardzo du\ej ilości losowań
Przy bardzo du\ej ilości losowańotrzymywany rozkład zbli\a się do
otrzymywany rozkład zbli\a siędo
teoretycznego
teoretycznego
Podane dalej przykłady pochodzą
Podane dalej przykłady pochodząz eksperymentów wykonanych na
z eksperymentów wykonanych na
komputerze
komputerze
Rozkład jednorodny
losowanie jednej z 10 identycznych,
losowanie jednej z 10 identycznych,
ponumerowanych kul
ponumerowanych kul
N=50
Rozkład
16%
teoretyczny
Rozkład w
14%
losowaniu
12%
10%
8%
6%
4%
2%
0%
1 2 3 4 5 6 7 8 9 10
Wynik losowania
" Prawa statystyki nie zawsze idą w parze z intuicją!
Odsetek przypadków
Rozkład jednorodny:
losowanie jednej z 10 identycznych,
losowanie jednej z 10 identycznych,
ponumerowanych kul
ponumerowanych kul
N=10 000
16%
Rozkład
14%
teoretyczny
Rozkład w
12%
losowaniu
10%
8%
6%
4%
2%
0%
1 2 3 4 5 6 7 8 9 10
Wynik losowania
" Du\a próba umo\liwia dokładniejsze przybli\enie
Odsetek przypadków
Jeszcze jeden wa\ny rozkład
df=N-1



= średnia df=N-1

= średnia

2 = wariancja Liczba  stopni swobody



2 = wariancja Liczba  stopni swobody



Rozkład t Studenta
" Rozkład t Studenta jest podobny do normalnego,
a dla prób N>100 praktycznie przechodzi w rozkład normalny
" Stosowany przy małych próbach


Wyszukiwarka

Podobne podstrony:
Metody statystyczne dla opornych cz 2
statystyka dla opornych
Alt klawiatura numeryczna Kurs dla opornych
Metody modelowania procesow 12 cz I (1)
Wyklad 7 Nieparametryczne metody statystyczne PL [tryb zgodności]
MS Word dla opornych
metody numeryczne dla informatykow

więcej podobnych podstron