Metodologia bada艅 spo艂ecznych ze statystyk膮 09.10.2012r.
Metoda badawcza - to typowe, powtarzalne, zweryfikowane i sprawdzone sposoby zbierania, gromadzenia i interpretacji danych empirycznych, zmierzaj膮ce do uzyskania maksymalnie uzasadnionych odpowiedzi na pytania stawiane w badaniach.
Przedmiot bada艅 - jest to zesp贸艂 zjawisk czy te偶 pewien obszar rzeczywisto艣ci spo艂ecznej, interesuj膮cy badacza (np. rodzina)
Pytanie badawcze - to konkretnie postawiony problem badawczy, interesuj膮cy badacza (np. jaka jest kondycja finansowa przeci臋tnej polskiej rodziny)
Problematyka badawcza - jest to zesp贸艂 (og贸艂) pyta艅 badawczych Populacja ? jest to zbi贸r element贸w, o kt贸rych chcemy wnioskowa膰 Pr贸ba badawcza ? jest to wyselekcjonowany z populacji zbi贸r element贸w, na kt贸rych b臋dziemy realizowa膰 badania
Metodologia -grupa dyscyplin naukowych kt贸rych przedmiotem bada艅 jest dzia艂alno艣膰 poznawcza ludzi rezultaty tej dzia艂alno艣ci rozpatrywana w aspekcie sprawno艣ci lub skuteczno艣ci.
Sprawno艣膰 鈥 dzia艂anie skuteczne i ekonomiczne
Skuteczno艣膰 - dzia艂anie jest skuteczne wtedy gdy prowadzi one do osi膮gni臋cia za艂o偶onego celu lub przynajmniej do tego celu przybli偶a
Ekonomiczno艣膰 鈥 stosunek zysk贸w do nak艂ad贸w gdy zadanie jest ekonomiczne wtedy jest korzystne
Podstawowym zadaniem metodologii jest wprowadzenie zasad skutecznego prowadzenia dzia艂alno艣ci poznawczej
Statystyka grupa dyscyplin naukowych kt贸rych przedmiotem bada艅 s膮 zjawiska kt贸re daj膮 uj膮膰 si臋 w spos贸b liczbowy i wyst臋puj膮 dosy膰 licznie
Dziedziny (dyscypliny) statystyki
Opisowa 鈥 wypracowanie miernik贸w kt贸re w spos贸b subiektywny s膮 w stanie opisa膰 i scharakteryzowa膰 dan膮 zbiorowo艣膰
Indukcyjna - s膮 to wnioskowania statystyczne na podstawie zgromadzonych danych z kt贸rych wyci膮ga si臋 wnioski (np. testy statystyczne)
Temat : planowanie i przygotowanie 16.10.2012
Problem badawczy - to pytanie stawiane z za艂o偶eniem, gdy偶 odpowiedz nie zosta艂a udzielona, a je艣li zosta艂a udzielona to jest odpowiedzi膮 fa艂szyw膮 lub niepe艂n膮. Zatem do uzyskania odpowiedzi prawdziwej niezb臋dne jest przeprowadzenie stosownych bada艅.
Przeprowadzone studium obejmuje literatur臋 poprzez literatur臋 kongresow膮 (Angielski, francuski). Ka偶dy badacz powinien zna膰 jedne j臋zyk kongresowy. Badacz powinien rozwi膮zywa膰 problem poprzez tajemnic臋. Odpowied藕 na pytanie chroniona jest patentem lub licencj膮.
B艂臋dy badacza:
Nie dok艂adne przestudiowanie literatury
Nie znajomo艣膰 j臋zyka kongresowego
Problem badawczy wymagania:
Forma gramatyczna problemu (problem musi by膰 pytaniem)
Problem musi by膰 pozytywnie sformu艂owany analiza w dw贸ch aspektach: merytoryczny problem zosta艂 sformu艂owany wtedy gdy oddaje istot臋 i zakres wiedzy w艂a艣ciwie osobie pytaj膮cej, kt贸r膮 chce ona u偶y膰 w toku prowadzonych bada艅 (brak wiedzy)
J臋zykowy 鈥 d膮偶y si臋 do spe艂nienia szeregu warunk贸w i wymaga艅. Ci膮gle istnieje intersubiektywna komunikacja problemu (j臋zyk s艂u偶y do komunikowania si臋)
Poziom I 鈥 mamy z ni膮 do czynienia wtedy gdy osoba komunikuj膮ca ma by膰 zrozumiana tylko dla niego.
Poziom II komunikatywno艣膰 Intersubiektywna 鈥 autor komunikatu ma go sformu艂owa膰 tak aby by艂 on zrozumia艂y w kr臋gu os贸b. Charakteryzuje ona problem badawczy.
J臋zyk w艂a艣ciwy dla danej dyscypliny naukowej:
Jasno艣膰 czytelno艣膰 i prostota 鈥 u偶ywanie pytania jak najpro艣ciej. Unikanie zaprzecze艅
Jednoznaczno艣膰 i ostro艣膰 wyst臋puj膮cych w nich termin贸w
Poprawno艣膰 gramatyczna problem贸w
Adekwatno艣膰 osoby pytaj膮cej
Problem powinien mie膰 艣ci艣le okre艣lony zakres
Zasi臋g problemu (stopie艅 og贸lno艣ci)
Szczeg贸艂owe 鈥 pytania dotycz膮ce pojedynczych obiekt贸w, os贸b, przedmiot贸w, zdarze艅, zjawisk w tym ich cech i w艂a艣ciwo艣ci
艢rednio-og贸lne (艣rednio- szczeg贸艂owe) 鈥 pytania dotycz膮ce okre艣lonej klasy obiekt贸w, zdarze艅 stanu rzeczy, zjawisk w tym r贸wnie偶 ich cech zale偶no艣ci (np. warunki czasowo-przestrzenne- poziom kszta艂cenia typ szko艂y)
Og贸lne 鈥 pytania dotycz膮ce zjawisk, zale偶no艣ci lub proces贸w jako takich (nie interesuje nas czas, chcemy bada膰 ten problem we wszystkich warunkach czasowych)
Problem powinien by膰 sprawdzalny- poziomy:
Teoretyczny 鈥 wtedy gdy badacz jest w stanie okre艣li膰 jakie dane nale偶y zgromadzi膰 by wykaza膰 prawdziwo艣膰 odpowiedzi na pytanie stanowi膮ce problem.
Praktyczny 鈥 badacz ma mo偶liwo艣膰 pozyskania danych niezb臋dnych do rozwi膮zania problemu.
Dost臋pno艣膰 (zezwolenie)
Problem nie mo偶e by膰 sprzeczny wewn臋trznie. Problem jest wewn臋trznie sprzeczny wtedy gdy wyst臋puj膮 w nim spostrze偶enia kt贸re si臋 wzajemnie wykluczaj膮.
Wybrane klasyfikacje problem贸w:
Ze wzgl臋du na tre艣膰 pytania:
Diagnostyczne czyli opisowe 鈥 to pytania w odpowiedz na kt贸re nale偶y dokona膰 opisu lub fragmentu opisu tego czego problem dotyczy
Eksplantacyjne (wyja艣niaj膮ce) to pytania dotycz膮ce zale偶no艣ci mi臋dzy zmiennymi a szczeg贸lnie zale偶no艣ci przyczynowo skutkowych
Prakseologiczne 鈥 to pytania dotycz膮ce wzajemnych zwi膮zk贸w pomi臋dzy warunkami sposobami dzia艂a艅 i ich rezultatami.
Prognostyczne 鈥 ty pytania dotycz膮ce przysz艂ych stan贸w rzeczy (mo偶liwo艣ci zaistnienia pewnych zjawisk lub ich prawdopodobie艅stwo)
23.10.2012
Temat: pomiar skale pomiarowe
Pomiar nale偶y okre艣li膰 cech臋, w艂a艣ciwo艣膰 by pomiar m贸g艂 by膰 realizowany, kogo ma obj膮膰 pomiar (zbi贸r element贸w mo偶e by膰 jednoelementowy)
Pomiar 鈥 to zabieg polegaj膮cy na przypisywaniu ka偶demu elementowi badanego zbioru symbolu, kt贸ry wska偶e na fakt przys艂ugiwania lub nie przys艂ugiwania mierzonej cechy, w艂a艣ciwo艣ci, zmiennej lub nasilenia z jakim ta dana cecha, w艂a艣ciwo艣膰 danemu elementowi przys艂uguje.
Symbol 鈥 wynik pomiaru dla danego elementu warto艣膰 cechy, zmiennej dla elementu (mog膮 by膰 zr贸偶nicowane)
Si艂a skali pomiarowej - skala jest s艂aba gdy
Nominalna(skala s艂aba) 鈥 pomiar za pomoc膮 skali nominalnej polega na przypisywaniu ka偶demu elementowi symbolu, kt贸ry wskazuje na fakt przynale偶no艣ci tego elementu do okre艣lonego podzbioru wyodr臋bnionego za wzgl臋du na mierzon膮 cech臋.
porz膮dkowa -relacja: wi臋ksze lub mniejsze; pomiar polega na grupowaniu jednostek w klasy (kategorie), kt贸rym przypisuje si臋 nazwy lub liczby i porz膮dkuje si臋 te klasy ze wzgl臋du na stopie艅 nat臋偶enia, w jakim posiadaj膮 one badan膮 cech臋,
interwa艂owa- pomiar polega na przypisywaniu ka偶demu elementowi, badanego zbioru symbolu, kt贸ry wskazuje na odst臋p jaki dzieli dany element od innych element贸w danego zbioru ze wzgl臋du na mierzon膮 cech臋, Np. skala ocen szkolnych (umiej臋tno艣ci)
ilorazowa - to taka skala interwa艂owa, kt贸ra posiada naturalne zakotwiczenie (naturalne 0) to zero umowne np. sta偶 pracy, wzrost, wiek, temperatura(kalwina naturalne 0, Celsjusz umowne 0).
30.10.2012
Temat: transformacja
Sposoby:
Uporz膮dkowanie danych w ci膮g rosn膮cych lub malej膮cych (mo偶na okre艣li膰 modalno艣膰 powtarza si臋 w czynnikach mierzalno艣ci)
Przekszta艂cenie danych surowych w szeregi rozdzielcze wg pojedynczej cechy (maj膮 posta膰 tabelkow膮 podzia艂 pionowy i poziomy)
Zmienna X
Liczba i | Warto艣膰 pomiaru xi | ni | wi | K s ni |
---|---|---|---|---|
1 | 3 | 1 | 0,05 | 1 |
2 | 3,5 | 6 | 0,3 | 7 |
3 | 4 | 7 | 0,35 | 14 |
4 | 4,5 | 4 | 0.2 | 18 |
5 | 5 | 2 | 0,1 | 20 |
Wyniki pomiaru xi
i oznacza nr porz膮dkowy danego porz膮dku szereg rozdzielniczy stanowi liczb臋 porz膮dkow膮 danego pomiaru
K- najwi臋ksza liczba porz膮dkowa
ni - ilo艣膰 element贸w kt贸r膮 uzyska艂 pomiar du偶ego i
szereg rozdzielczy
n 3 = 7
n 20 (studenci)
n - liczba badanych element贸w
(W) 鈥 cz臋sto艣膰 miernik cz臋stego pomiaru jaki si臋 pojawi艂 w danej zbiorowo艣ci
$$Wi = \frac{\text{ni}}{n}$$
Przedzia艂owy szereg rozdzielczy
i | Xi0-Xi1 | ni | Xi0 |
---|---|---|---|
1 | 0-5 | 7 | 2,5 |
2 | (6) 5-10 | 10 | 7,5 |
3 | (11)10-15 | 8 | 12,5 |
4 | (10)15-20 | 3 | 17,5 |
5 | (21) 20-25 | 9 | 22,5 |
x- liczba porz膮dkowa danego podzbioru
xi0 鈥 xi1 鈥 granica dolna i g贸rna przedzia艂u
ni 鈥 liczebno艣膰 np. sta偶 pracy pracownik贸w
Xi0 鈥 艣rodek przedzia艂u
Liczebno艣膰 stymulowana sni 鈥 wskazuj膮 ile element贸w (os贸b) osi膮gn臋艂o inny wynik ITA
Transformacja danych zestawienie danych z wynikami wi臋cej ni偶 jednej zmiennej
Xi Xik 鈥 liczba dzieci w rodzinie
Yj Yjk 鈥 wykszta艂cenie m臋偶a
Xi | xi | 1 | 2 | 3 | $$\sum_{}^{}{}$$ |
---|---|---|---|---|---|
Podstawowe | 艢rednie | Wy偶sze | Wykszta艂cenie | ||
1 | 0 | 6 0,1875 |
11 0,3438 |
15 0,4688 |
32 |
2 | 1 | 6 0,0769 |
18 0,3830 |
23 | 47 |
3 | 2 | 29 | 41 0,1760 |
17 | 87 0,3734 |
4 | 3 | 23 | 14 | 6 | 43 |
5 | Powy偶ej 3 | 14 0,1795 |
8 | 2 | 24 |
$$\sum_{}^{}{}\text{n.j}$$ |
Ilo艣膰 dzieci | 78 | 92 | 63 | 233 |
Nij 鈥搇iczebno艣膰 ze wzgl臋du na dan膮 liczebno艣膰
Nzz=18
W badaniu by艂o 41 zbiorowo艣ci, zbiorowo艣ci posiada艂y 2 dzieci i wykszta艂cenie 艣rednie
ni 鈥 sumy marginesowe 鈥 to ludno艣膰 z rz臋du xni. W badaniu zbiorowo艣ci by艂o 32 zbiorowo艣ci nie posiada艂y dzieci
punktowy szereg dla zmiennej j ile zmienn膮 by艂o wykszta艂cenie ojca
n.j w badaniu zbiorowo艣ci 92 m膮偶 posiada艂 wykszta艂cenie 艣rednie
n 233
Dane przeprowadzane przez wywiad lub ankiet臋. Mo偶na powi膮za膰 jakie艣 zestawienie odpowiedzi, gdzie respondent nie udzieli艂 odpowiedzi
Mo偶na wyliczy膰 cz臋stotliwo艣膰 W
$Wij = \frac{\text{nij}}{n}\ $
$$Wi. = \frac{\text{ni.}}{n}$$
$$Wij = \ \frac{\text{n.j}}{n}$$
Cz臋sto rodziny posiada艂y dw贸jk臋 dzieci i stanowi艂y one 0,37% badanych rodzin
Cz臋sto艣膰 warunkowa 鈥 cz臋sto艣膰 wyst臋powania okre艣lonej jednej zmiennej gdy za艂o偶y si臋 jak膮 warto艣膰 posiada艂a druga zmienna
$\text{Wj}\left( i \right) = \frac{\text{nij}}{\text{ni.}}$ i =1
Jak cz臋sto rodzaj wykszta艂cenia mia艂 m膮偶 w rodzinie w kt贸rej nie by艂o dzieci
W艣r贸d rodzin kt贸re nie posiada艂y dzieci 187,5 % rodzin to rodziny w kt贸rych m膮偶 mia艂 wykszta艂cenie podstawowe
Cz臋sto艣膰 warunkow膮 mo偶na obliczy膰 w przypadku drugiej zmiennej
$$\text{Wi}\left( j \right) = \frac{\text{nij}}{\text{n.j}}$$
W艣r贸d rodzin w kt贸rych m膮偶 mia艂 wykszta艂cenie 艣rednie i posiada艂y dw贸jk臋 dzieci by艂o 3830% rodzin
6.11.2012
Temat: miary tendencji centralnej
Ukazuj膮 charakterystyczn膮 warto艣膰 zmiennej interesuj膮c膮 badacza
Mierniki dzielimy na dwie grupy:
Klasyczne
Pozycyjne
Klasyczne 鈥 do nich nale偶膮 r贸偶nego rodzaju 艣rednie np. 艣rednia arytmetyczna
艢rednia 鈥 ukazuje przeci臋tn膮 warto艣膰 zmiennej dla danej zbiorowo艣ci. 艢rednia mo偶na wybra膰 kiedy dysponujemy danymi jednostkowymi
$\overset{\overline{}}{x}$- 艣rednia zmiennej
n
$\sum_{}^{}.$
$$\overset{\overline{}}{x} = \frac{i - 1\ xi}{n}$$
k
$$\sum_{}^{}.$$
$\overset{\overline{}}{x}$ =$\frac{i = 1\ xi\ ni}{n}$
i | Ocena xi | Liczba os贸b ni | xi ni | ni |
---|---|---|---|---|
1 | 2 | 2 | (2*2) 4 | 2 |
2 | 3 Me | 12 | (3*12) 36 | 14 |
3 | 4 | 6 | 24 | 20 |
4 | 5 | 5 | 25 | 25 |
89 |
Mo = 3 bo wyst膮pi艂a 12 razy
Me wi臋ksza otrzymana ocena ni偶sza ni偶 3
N Me = 13 鈫 $\frac{25 + 1}{2}$
Me = 3 鈥 wskazuje 艣rodek $\overset{\overline{}}{x}$ = $\frac{89}{25}$ = 3,56
n = 25 (os贸b)
艣redni膮 mo偶na wyliczy膰 dzi臋ki danej przedzia艂owej
k
$$\sum_{}^{}.$$
$\overset{\overline{}}{x}$ =$\frac{i = 1\ xi\ ni}{n}$ Xi = $\frac{xoi + x1i}{2}$
i | xoi- x1i | ni | xi | xi-ni | sni |
---|---|---|---|---|---|
1 | 10-14 | 4 | 12 | 48 | 4 |
2 | 14-18 | 7 | 16 | 112 | 11 |
3 | 18-22 | 8 | 20 | 160 | 19 |
4 | 22-26 | 6 | 24 | 144 | 25 |
464 |
NMe =13
(4+7)
Tu znajduje si臋 15 NMe
sni- to suma ni
$\overset{\overline{}}{x}$ = $\frac{464}{25}$ = 18,56
Miara pozycyjna:
Mediana 鈥 Me
Mediana 鈥 warto艣膰 艣rodkowa czyli taki punkt na skali pomiarowej w kt贸rej 50% wynik贸w jest r贸wna a drugie 50% jest wy偶sza b膮d藕 r贸wna
NMe 鈥 numer mediany
NMe = $\frac{n + 1}{2}$
Dane uporz膮dkowane w ci膮g rosn膮cych warto艣ci
Mo = 15 (studenci otrzymali 15 punkt贸w)
X 1,12,13,15,15,16,17,18,19
NMe = 5 =$\ \frac{911}{2}$
1 2 3 4 5 n= 9 Me = 15
Studenci otrzymali 15 punkt贸w, a druga po艂owa co najmniej 15
Me 鈥 mo偶na obliczy膰 dla szeregowego przedzia艂u
Me =xoMe =($\frac{n}{z}$ 鈥 snime 鈥 1) $\frac{\text{hme}}{\text{mMe}}$
h- rozpi臋to艣膰 przedzia艂u (szeroko艣膰)
Me = 18+ (12,5-11)$\frac{4\ \left( 21 \times 18 \right)}{8}$ = 18+1,5 脳 0,5= 18+ 0,75 = 18,75
Ponad p贸艂tora uczni贸w otrzyma艂a wy偶szy wynik od 18,75
Modalna 鈥 Mo
Modalna 鈥 bywa okre艣lana mianem dominanta warto艣ci najcz臋艣ciej pojawia si臋 w艣r贸d wynik贸w pomiaru, mo偶na j膮 wylicza膰 dla danych szczeg贸艂owych i proponowanych
11 ,13,13, 14,15,16,17,18,19,20
Przyk艂ad jedno modalny to 13
11, 13,13, 14,15 ,16,16 ,17 Mo1 - 13
Mo2 -16
Przyk艂ad dwu modalnego to 13,16
Modaln膮 mo偶na wyznacza膰 dla pogrupowanych.
Modalna lokuje si臋 w najliczniejszym przedziale
Mo=XoMo dolna granica przedzia艂u zawieraj膮ca modaln膮
Mo=XoMo + $\frac{\left( nMo - nMo - 1 \right)\text{hno}}{\left( nMo - nMo - 1 \right)\ (\left( nMo - nMo + 1 \right)}$
nMo 鈥 liczebno艣膰 zawieraj膮ca modaln膮
Mo = 18 +$\frac{(8 - 7) \times 4}{\left( 8 - 7 \right) + \ (8 - 6)}$ = 18 + $\frac{4}{3}$ = 19,33
Najcz臋艣ciej studenci uzyskiwali 19,33 punkt贸w
13.11.2012r.
Temat: miary rozproszenia
Miary rozproszenia (mierniki rozproszenia) 鈥 stosuje si臋 je jak wyniki pomiarowe odbiegaj膮 od warto艣ci 艣redniej
S膮 r贸偶ne warto艣ci odchyle艅
Wariancje 鈥 odchylenia kwadratowe
Odchylenia standardowe
Wz贸r na odchylenie kwadratowe dla danych szczeg贸艂owych
n
S2 = $\sum_{}^{}.$+ $\frac{(xi - {\overset{\overline{}}{x}}^{)2}}{n - 1}$
i
jak i pogrupowanych dla punktowego szeregu rozdzielczego
n
S2 = $\sum_{}^{}.$ (xi - $\overset{\overline{}}{x}$)2 $\frac{\text{ni}}{n - 1}$
i | Ocena xi | Liczba os贸b ni | xi- $\overset{\overline{}}{x}$ | ( xi- $\overset{\overline{}}{x}$)2 | xi- $\overset{\overline{}}{x}$y ni2 |
---|---|---|---|---|---|
1 | 2 | 2 | -1,56 | 2,4336 | 4,8672 |
2 | 3 Me | 12 | - 0,56 | 0, 3136 | 3, 7632 |
3 | 4 | 6 | 0,44 | 0,1936 | 1,1616 |
4 | 5 | 5 | 1,44 | 2,0736 | 10,368 |
n=25
x= 3,56
s2= 0,82
s= 0,92
20,16
Odchylenie standardowe s 鈥 jak wyniki odchylaj膮 si臋 od warto艣ci 艣redniej
Wz贸r na przedzia艂 odchylenia S= $\sqrt{s}$2
<$\overset{\overline{}}{x} - s,\overset{\overline{}}{x} + \ s$> liczebno艣膰 przedzia艂u ilu uczni贸w dosta艂o 3 i 4
<2,64;4,48> Mo = 18
<3;4>
Szereg przedzia艂owy
n
S2 = $\sum_{}^{}.\frac{(xi - \ \overset{\overline{}}{x})2}{n - 1}$
i | xoi- x1i | ni | xi | x1-$\ \overset{\overline{}}{x}$ | (x1-$\ \overset{\overline{}}{x}$)2 | (x1-$\ \overset{\overline{}}{x}$)2 *ni |
---|---|---|---|---|---|---|
1 | 10-14 | 4 | 12 | - 6,56 | 43,336 | 172,1344 |
2 | 14-18 | 7 | 16 | -2,56 | 6,5536 | 45,8752 |
3 | 18-22 | 8 | 20 | 1,44 | 2,0736 | 16,5888 |
4 | 22-26 | 6 | 24 | 5,44 | 29,5936 | 177,5616 |
412,16 |
n=25
$\overset{\overline{}}{x}$= 18,56
S2 = 17,1733
S = 4,21
<$\overset{\overline{}}{x} - s,\overset{\overline{}}{x} + \ s$>
<14,35;22,77>
<15;22> np.= 15
S = 32,1
<15,35;21,77>
<16,21>
20.11.2012
Temat: symetryczno艣膰 rozk艂adu
symetryczno艣膰 rozk艂adu 鈥 wyst臋puje wtedy gdy dla ka偶dej liczby $\overset{\check{}}{a}$
A=-a A=a
asymetria lewostronna(-) | Rozk艂ad symetryczny | asymetria prawostronna (+) |
---|---|---|
Mierniki sko艣no艣ci A= $\frac{\overset{\overline{}}{x - Mo}}{s}$ |
Asymetria rozk艂adu | |
Kierunek rozk艂adu
Si艂a asymetrii (tabela interpretacyjna)
A | Si艂a |
---|---|
0,02 | Bardzo s艂aba |
0,21- | s艂aba |
0,41-0,70 | Umiarkowana |
0,71-0,9 | Silna |
Pow. 0,9 | Bardzo silna |
Odchylenie standardowe
68,26%
95,44%
99,74%
3s czyli regu艂a 3 odchyle艅 standardowych
Je偶eli badany uzyska wynik powy偶ej warto艣ci 3 odchyle艅 standardowych wyjd膮 powy偶ej 0,26% to znaczy 偶e badacz pope艂ni艂 b艂膮d
27.11.2012
Temat: statystyka indukcyjna 鈥 wnioskowania statystyczne
Aby m贸c je przeprowadzi膰 wykorzystuje si臋 testy statystyczne 鈥 spos贸b post臋powania w kt贸rym ka偶dej mo偶liwej pr贸bie przyporz膮dkowuje si臋 decyzje o przyj臋ciu lub odrzuceniu sprawdzonej hipotezy.
Hipoteza (H1) 鈥 poddawana sprawdzeniu
Hipoteza alternatywna (zerowa) (H0) 鈥 wzgl臋dnie poddawana sprawdzeniu
Gdy badacz ma prawo odrzuci膰 H0 ma prawo za w艂a艣ciw膮 uzna膰 H1
Ryzyko wi膮偶e si臋 z tym 偶e w wyniku testu statystycznego odrzuci si臋 hipotez臋 prawdziw膮 wyst臋puje wtedy B艁膭D PIERWSZEGO RODZAJU .
Prawdopodobie艅stwo pope艂nienia w/w b艂臋du oznacz si臋 伪 鈮 0,05
Je偶eli za艣 si臋 mie艣ci si臋 w tym je偶eli wyliczony poziom istotno艣ci mie艣ci
przedziale to badacz uznaje za si臋 w tym przedziale to badacz uznaje za
prawdziw膮 H0 prawdziw膮 H1
(伪 鈮 0,02) poziom istotno艣ci oznacza 偶e je艣li badacz 100 razy przeprowadzi badania to 2 razy odrzuci hipotez臋 prawdziw膮
Testy statystyczne r贸偶nicuje si臋 z wzgl臋du na istot臋 hipotez
Testy parametryczne - hipotezy wypowiadaj膮ce si臋 o jakim艣 parametrze badanej grupy (najcz臋艣ciej 艣rednia warto艣膰 mierzona dla danej grupy np. wariancja)
H1 : ${\overset{\overline{}}{x}}_{1}$ 鈮 ${\overset{\overline{}}{x}}_{2}$ 艣rednia pierwszej grupy r贸偶ni si臋 w spos贸b
istotny statystycznie od 艣redniej drugiej grupy
H0 : ${\overset{\overline{}}{x}}_{1}$ = ${\overset{\overline{}}{x}}_{2}$ 艣rednia pierwszej grupy nie r贸偶ni si臋 w spos贸b
istotny statystycznie od 艣redniej drugiej grupy
Testy nieparametryczne - hipotezy wypowiadaj膮ce si臋 b膮d藕 o zale偶no艣ci lub r贸偶nicy ze wzgl臋du na jakie艣 cechy jaki wyst臋puj膮 pomi臋dzy badanymi zbiorowo艣ciami
Wi臋kszo艣膰 test贸w statystycznych to testy istotno艣ci je艣li chcemy wyznaczy膰 na jakim poziomie 鈥︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹.
Test t-studenta (statystyka t + pseudonim pod jakim publikowa艂 tw贸rca testu)
Test ten wyst臋powa膰 mo偶e pod wieloma postaciami:
Dla warto艣ci dw贸ch 艣rednich dla pr贸b niezale偶nych- pr贸by kt贸re zosta艂y dobrane tak i偶 osoba wesz艂a do kt贸rej艣 pr贸b, nie decyduje ch臋膰 przynale偶no艣ci do innej grupy np. przynale偶no艣膰 do grupy kobiet i m臋偶czyzn lub dwie klasy szkolne. Test ten posiada ograniczenie wolno go stosowa膰 gdy rozk艂ad jest normalny lub przybli偶ony do normalnego (krzywa gausa)
Gdy wsp贸艂czynnik A 鈮 0,7
[asymetria jest umiarkowana]
Aby ten test dla danych dw贸ch grup nale偶y wyznaczy膰 parametry i podstawi膰 do wzoru
t = $\frac{\left( {\overset{\overline{}}{x}}_{1 - {\overset{\overline{}}{x}}_{2}\ } \right) \times \sqrt{\frac{n_{1 \times \ n_{2\ \times \left( n_{1\ \ \times {\ n}_{2 -}}2 \right)}}}{n_{1 + n_{2}}}}}{\sqrt{n_{1\ \times}{s_{1}}^{2} + n_{2\ \times {s_{2}}^{2}}}}$
Pytanie: czy 艣rednia statystyczna z grupy pierwszej r贸偶ni si臋 znacznie od 艣redniej grupy drugiej?
1G 2G
n1 = 20 n2 = 20
$\overset{\overline{}}{x_{1}} =$ 3,9 ${\overset{\overline{}}{x}}_{2}$ = 4,3
S12 = 0,31 S22 = 0,35
t= $\frac{\left( 3,9 - 4,3 \right)\sqrt{\frac{20\ \times 20\ \left( 20 + 20 - 2 \right)}{20 + 20}}}{\sqrt{20 \times 0,31 + 20\ \times 0,35}}$
t= $\frac{\left( - 0,4 \right)\frac{\sqrt{400\ \left( 38 \right)}}{40}}{}$ t= - 2,150
|t|聽= 2,150 (warto艣膰 bezwzgl臋dna)
Liczba stponi swobody df = (n1 + n2 鈥 2 )
df = 38
鈥瀊y podj膮膰 decyzj臋 o odrzuceniu hipotez korzystamy z tablic t-studenta 鈥
伪
df | 0,05 | |||
---|---|---|---|---|
30 鈫 |
2,042 鈫 |
|||
df= 38 | |t|= 2,150 |
Poniewa偶 0,05 mie艣ci si臋 w 伪 = 0,05
Wniosek:
艢rednia ocen z egzaminu student贸w grupy pierwszej w spos贸b istotny statystycznie r贸偶ni si臋 od ocen z egzaminu student贸w grupy drugiej poniewa偶 r贸偶nica mi臋dzy tymi 艣rednimi jawi si臋 na poziomie istotno艣ci 伪 = 0,05
Zadanie 1
|t|= 1721
df= 38
Z tablic df = 30 poziom istotnosci 伪 = 0,1
|t|= 1721 鈥 1,697
伪 = 0,1 nie mie艣ci si臋 w 伪 = 0,05 Prawdziwa jest teza H0
艢rednia ocen z egzaminu student贸w grupy pierwszej w spos贸b istotny statystycznie nie r贸偶ni si臋 od ocen z egzaminu student贸w grupy drugiej poniewa偶 r贸偶nica mi臋dzy tymi 艣rednimi jawi si臋 na poziomie istotno艣ci 伪 =0,1
Zadanie 2
|t| = 2,928 z tablic 2,750
df = 32 z tablic 30
poziomi istotno艣ci 伪 =0,1
Prawdziwa jest teza H1
艢rednia ocen z egzaminu student贸w grupy pierwszej w spos贸b istotny statystycznie r贸偶ni si臋 od ocen z egzaminu student贸w grupy drugiej poniewa偶 r贸偶nica mi臋dzy tymi 艣rednimi jawi si臋 na poziomie istotno艣ci 伪 =0,1
04.12.2012
Testy statystyczne dla warto艣ci 艣rednich
Test t-studenta dla pr贸b zale偶nych gdy pomiar warto艣ci dla danych zale偶nych zosta艂 przeprowadzony dwukrotnie w dost臋pie czasu np. por贸wnanie ocen uczni贸w za pierwszy i drugi semestr
Test ten posiada ograniczenie asymetrii gdy je鈥︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹
鈥︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹︹.....
t= $\frac{\overset{\overline{}}{\text{R\ }} \times \sqrt{n - 1}}{S_{R}}$ $\overset{\overline{}}{R}$ 鈥 艢rednia r贸偶nica dwa pomiary dla jednej zmiennej
n-1 鈥 liczebno艣膰 pr贸by 1 x1i x2i 鈫 r贸偶nica pomiar贸w
SR 鈥 wariancja r贸偶nic Ri= x2i- x1i
$\overset{\overline{}}{\left( x \right)}\ \overset{\overline{}}{R}$=
Uczniowie pewnej klasy w pierwszym semestrze otrzymali oceny 艣rednia tych ocen wynios艂a
$\overset{\overline{}}{R}$= 0,4 t= $\frac{0,4 \times \sqrt{19}}{0,67}$
SR = 0,67
n = 20 t = 2,602 (z tablic 2,539)
df = n-1 伪 =0,02
df = 19
艢rednia ocen pewnej klasy w spos贸b istotny statystycznie r贸偶ni si臋 z pierwszego i drugiego semestru poniewa偶 r贸偶nica mi臋dzy tymi 艣rednimi jawi si臋 na poziomie istotno艣ci 伪 =0,02
Wz贸r testu bazuj膮cego na statystyce 鈥濽鈥
鈫
Pr贸by musz膮 by膰 dostateczne liczne je偶eli zawiera co najmniej 120 element贸w (lub chocia偶 oko艂o 100 element贸w) nie zawiera ogranicze艅 asymetrii
U = $\frac{{\overset{\overline{}}{x}}_{1} - {\overset{\overline{}}{x}}_{2}}{\sqrt{\frac{{s_{1}}^{2}}{n_{1}} + \frac{{s_{2}}^{2}}{n_{2}}}}$
X1 = 4,1 X2 = 3,9
n1 =120 n2 = 150 studenci dw贸ch specjalno艣ci dotycz膮ce ocen
S12 = 0.38 S22 = 0,31 jakie uzyskali z egzaminu z pewnego przedmiotu
U = $\frac{{\overset{\overline{}}{x}}_{1} - {\overset{\overline{}}{x}}_{2}}{\sqrt{\frac{{s_{1}}^{2}}{n_{1}} + \frac{{s_{2}}^{2}}{n_{2}}}}$ U= $\frac{4,1 - 3,9}{\sqrt{\frac{0.38}{120} + \ \frac{0,31}{150}}}$ U = $\frac{0,2}{\sqrt{0,005}}$ U= 2,765
df = 鈭 伪 =0,01
Wniosek:
艢rednia ocen z egzaminu student贸w specjalno艣ci pierwszej r贸偶ni si臋 w spos贸b istotny statystycznie od 艣redniej ocen z egzaminu student贸w specjalno艣ci drugiej, poniewa偶 r贸偶nica mi臋dzy tymi 艣rednimi jawi si臋 na poziomie istotno艣ci r贸wnym 伪 =0,01
11.12.2012
Temat: testy nieparametryczne
Orzeczenie na podstawie liczebno艣ci empirycznych (zaobserwowanych). Testy wypowiadaj膮 si臋 o zale偶no艣ci pomiar贸w zmiennych o ile zmienne s膮 nie zale偶ne i zale偶ne
Test
Post臋powanie
Sporz膮dzenie tabeli wielodzielczej dla zaobserwowanych danych (zmienna 1-x1 zmienna Z-Yi)
Wyliczenie oczekiwanych warto艣ci
Wyliczenie warto艣ci
Pytanie I czy badani s膮 zadowoleni z wybranego zawodu
T 鈥 tak
N 鈥 nie
RT 鈥 raczej tak
RN 鈥 raczej nie wiersz i
1 | 2 | 3 | 4 | ||
---|---|---|---|---|---|
ine | T | RT | RN | N | $$\sum_{}^{}.$$ |
1K | 21 | 37 | 41 | 48 | 147 |
2M | 56 | 43 | 21 | 17 | 137 |
$$\sum_{}^{}.$$ |
77 | 80 | 62 | 65 | 284 |
ne 鈥 liczebno艣ci zaobserwowane empirycznie
neij 鈥 obszar mocniej zaznaczony
nezz = 43
nn13 = 41
nei 鈥 liczebno艣膰 dla tej kategorii bez okre艣lenia
jakiego respondent dokona艂 wyboru
wiersz j
ne2 = 137
nej 鈥 suma z wiersza
ne3 = 62
n = 284
2
Ao | 1 | 2 | 3 | 4 | $$\sum_{}^{}.$$ |
---|---|---|---|---|---|
1 | 39,83 | 41,41 | 32,09 | 33,64 | 174 |
2 | 37,14 | 38,59 | 29,91 | 31,36 | 137 |
$$\sum_{}^{}.$$ |
77 | 80 | 62 | 65 | 284 |
noij $\frac{nei1 \times ne \times j}{n}$
(mno偶y si臋 sumy bnegowa)
3 Wyliczenie warto艣ci statystyki
Tezy
Wyliczenie warto艣ci dla poszczeg贸lnych kolumn tabeli
(warto艣ci wyliczamy do 3 miejsca po przecinku) mmmmm
ij | 1 | 2 | 3 | 4 |
---|---|---|---|---|
1 | 6,921 | 0,469 | 2,473 | 6,125 |
2 | 9,572 | 0,504 | 2,653 | 6,572 |
$\frac{\left( \mathbf{neij - noij} \right)\mathbf{\ 2}}{\mathbf{\text{noij}}}$
2 z sumowanie po wierszach (doda膰 do siebie liczby z kolumn z ostatniej tabeli)
$\sum_{}^{}.$ $\sum_{}^{}.$
= i = 1 j=1
3. wyliczanie stopni swobody (df)
df=3 tab. 16,268
伪 = 0.001 (poziom istotno艣ci 伪鈥勨墹鈥0,鈥05)
Wniosek:
Zadowolenie z wykonywania zawodu kobiet r贸偶ni si臋 w spos贸b istotny statystycznie z zadowolenia z wykonywania zawodu m臋偶czyzn, poniewa偶 r贸偶nica zadowolenia jawi si臋 na poziomie istotno艣ci 伪 = 0.001
Wniosek wp艂ywu jednej zmiennej na drug膮 (istotno艣膰 wp艂ywu)
P艂e膰 w spos贸b istotny statystycznie wp艂ywa poniewa偶 poziom istotno艣ci jawi si臋 na poziomie 伪 = 0.001
Gdy zale偶no艣膰 jest istotna statystycznie mo偶emy wyliczy膰 si艂臋 istotno艣ci wsp贸艂czynnik V CRAMERA
V = $\sqrt{\frac{}{n \times \min\left( W - 1 \right)k - 1}}$ funkcja minimum najmniejsza z warto艣ci
V= $\frac{37,289}{284 - 1}$
V = 0,38 argumenty funkcji min (1,3)=1
(zale偶no艣膰 s艂aba lecz wyra藕na) (tabela interpretacyjna 偶eby
si臋 pos艂u偶y膰 warto艣ci膮)
Tabela interpretacyjna
V | Si艂a zale偶no艣ci |
---|---|
0 鈥 0,2 | Zale偶no艣膰 prawie nic nie znacz膮ca |
0,21- 0,4 | Zale偶no艣膰 s艂aba lecz wyra藕na |
0,41 鈥 0,7 | Zale偶no艣膰 umiarkowana |
0,71 鈥 0,9 | Zale偶no艣膰 silna |
0,91 - 1 | Zale偶no艣膰 bardzo silna |
Wniosek o sile zale偶no艣ci:
S艂abo lecz wyra藕nie wp艂ywa na zadowolenie z wykonywanego zawodu w spos贸b istotny statystycznie (伪 = 0.001) (V= 0.38)