Metodologia badań społecznych ze statystyką 09.10.2012r.
Metoda badawcza - to typowe, powtarzalne, zweryfikowane i sprawdzone sposoby zbierania, gromadzenia i interpretacji danych empirycznych, zmierzające do uzyskania maksymalnie uzasadnionych odpowiedzi na pytania stawiane w badaniach.
Przedmiot badań - jest to zespół zjawisk czy też pewien obszar rzeczywistości społecznej, interesujący badacza (np. rodzina)
Pytanie badawcze - to konkretnie postawiony problem badawczy, interesujący badacza (np. jaka jest kondycja finansowa przeciętnej polskiej rodziny)
Problematyka badawcza - jest to zespół (ogół) pytań badawczych Populacja ? jest to zbiór elementów, o których chcemy wnioskować Próba badawcza ? jest to wyselekcjonowany z populacji zbiór elementów, na których będziemy realizować badania
Metodologia -grupa dyscyplin naukowych których przedmiotem badań jest działalność poznawcza ludzi rezultaty tej działalności rozpatrywana w aspekcie sprawności lub skuteczności.
Sprawność – działanie skuteczne i ekonomiczne
Skuteczność - działanie jest skuteczne wtedy gdy prowadzi one do osiągnięcia założonego celu lub przynajmniej do tego celu przybliża
Ekonomiczność – stosunek zysków do nakładów gdy zadanie jest ekonomiczne wtedy jest korzystne
Podstawowym zadaniem metodologii jest wprowadzenie zasad skutecznego prowadzenia działalności poznawczej
Statystyka grupa dyscyplin naukowych których przedmiotem badań są zjawiska które dają ująć się w sposób liczbowy i występują dosyć licznie
Dziedziny (dyscypliny) statystyki
Opisowa – wypracowanie mierników które w sposób subiektywny są w stanie opisać i scharakteryzować daną zbiorowość
Indukcyjna - są to wnioskowania statystyczne na podstawie zgromadzonych danych z których wyciąga się wnioski (np. testy statystyczne)
Temat : planowanie i przygotowanie 16.10.2012
Problem badawczy - to pytanie stawiane z założeniem, gdyż odpowiedz nie została udzielona, a jeśli została udzielona to jest odpowiedzią fałszywą lub niepełną. Zatem do uzyskania odpowiedzi prawdziwej niezbędne jest przeprowadzenie stosownych badań.
Przeprowadzone studium obejmuje literaturę poprzez literaturę kongresową (Angielski, francuski). Każdy badacz powinien znać jedne język kongresowy. Badacz powinien rozwiązywać problem poprzez tajemnicę. Odpowiedź na pytanie chroniona jest patentem lub licencją.
Błędy badacza:
Nie dokładne przestudiowanie literatury
Nie znajomość języka kongresowego
Problem badawczy wymagania:
Forma gramatyczna problemu (problem musi być pytaniem)
Problem musi być pozytywnie sformułowany analiza w dwóch aspektach: merytoryczny problem został sformułowany wtedy gdy oddaje istotę i zakres wiedzy właściwie osobie pytającej, którą chce ona użyć w toku prowadzonych badań (brak wiedzy)
Językowy – dąży się do spełnienia szeregu warunków i wymagań. Ciągle istnieje intersubiektywna komunikacja problemu (język służy do komunikowania się)
Poziom I – mamy z nią do czynienia wtedy gdy osoba komunikująca ma być zrozumiana tylko dla niego.
Poziom II komunikatywność Intersubiektywna – autor komunikatu ma go sformułować tak aby był on zrozumiały w kręgu osób. Charakteryzuje ona problem badawczy.
Język właściwy dla danej dyscypliny naukowej:
Jasność czytelność i prostota – używanie pytania jak najprościej. Unikanie zaprzeczeń
Jednoznaczność i ostrość występujących w nich terminów
Poprawność gramatyczna problemów
Adekwatność osoby pytającej
Problem powinien mieć ściśle określony zakres
Zasięg problemu (stopień ogólności)
Szczegółowe – pytania dotyczące pojedynczych obiektów, osób, przedmiotów, zdarzeń, zjawisk w tym ich cech i właściwości
Średnio-ogólne (średnio- szczegółowe) – pytania dotyczące określonej klasy obiektów, zdarzeń stanu rzeczy, zjawisk w tym również ich cech zależności (np. warunki czasowo-przestrzenne- poziom kształcenia typ szkoły)
Ogólne – pytania dotyczące zjawisk, zależności lub procesów jako takich (nie interesuje nas czas, chcemy badać ten problem we wszystkich warunkach czasowych)
Problem powinien być sprawdzalny- poziomy:
Teoretyczny – wtedy gdy badacz jest w stanie określić jakie dane należy zgromadzić by wykazać prawdziwość odpowiedzi na pytanie stanowiące problem.
Praktyczny – badacz ma możliwość pozyskania danych niezbędnych do rozwiązania problemu.
Dostępność (zezwolenie)
Problem nie może być sprzeczny wewnętrznie. Problem jest wewnętrznie sprzeczny wtedy gdy występują w nim spostrzeżenia które się wzajemnie wykluczają.
Wybrane klasyfikacje problemów:
Ze względu na treść pytania:
Diagnostyczne czyli opisowe – to pytania w odpowiedz na które należy dokonać opisu lub fragmentu opisu tego czego problem dotyczy
Eksplantacyjne (wyjaśniające) to pytania dotyczące zależności między zmiennymi a szczególnie zależności przyczynowo skutkowych
Prakseologiczne – to pytania dotyczące wzajemnych związków pomiędzy warunkami sposobami działań i ich rezultatami.
Prognostyczne – ty pytania dotyczące przyszłych stanów rzeczy (możliwości zaistnienia pewnych zjawisk lub ich prawdopodobieństwo)
23.10.2012
Temat: pomiar skale pomiarowe
Pomiar należy określić cechę, właściwość by pomiar mógł być realizowany, kogo ma objąć pomiar (zbiór elementów może być jednoelementowy)
Pomiar – to zabieg polegający na przypisywaniu każdemu elementowi badanego zbioru symbolu, który wskaże na fakt przysługiwania lub nie przysługiwania mierzonej cechy, właściwości, zmiennej lub nasilenia z jakim ta dana cecha, właściwość danemu elementowi przysługuje.
Symbol – wynik pomiaru dla danego elementu wartość cechy, zmiennej dla elementu (mogą być zróżnicowane)
Siła skali pomiarowej - skala jest słaba gdy
Nominalna(skala słaba) – pomiar za pomocą skali nominalnej polega na przypisywaniu każdemu elementowi symbolu, który wskazuje na fakt przynależności tego elementu do określonego podzbioru wyodrębnionego za względu na mierzoną cechę.
porządkowa -relacja: większe lub mniejsze; pomiar polega na grupowaniu jednostek w klasy (kategorie), którym przypisuje się nazwy lub liczby i porządkuje się te klasy ze względu na stopień natężenia, w jakim posiadają one badaną cechę,
interwałowa- pomiar polega na przypisywaniu każdemu elementowi, badanego zbioru symbolu, który wskazuje na odstęp jaki dzieli dany element od innych elementów danego zbioru ze względu na mierzoną cechę, Np. skala ocen szkolnych (umiejętności)
ilorazowa - to taka skala interwałowa, która posiada naturalne zakotwiczenie (naturalne 0) to zero umowne np. staż pracy, wzrost, wiek, temperatura(kalwina naturalne 0, Celsjusz umowne 0).
30.10.2012
Temat: transformacja
Sposoby:
Uporządkowanie danych w ciąg rosnących lub malejących (można określić modalność powtarza się w czynnikach mierzalności)
Przekształcenie danych surowych w szeregi rozdzielcze wg pojedynczej cechy (mają postać tabelkową podział pionowy i poziomy)
Zmienna X
Liczba i | Wartość pomiaru xi | ni | wi | K s ni |
---|---|---|---|---|
1 | 3 | 1 | 0,05 | 1 |
2 | 3,5 | 6 | 0,3 | 7 |
3 | 4 | 7 | 0,35 | 14 |
4 | 4,5 | 4 | 0.2 | 18 |
5 | 5 | 2 | 0,1 | 20 |
Wyniki pomiaru xi
i oznacza nr porządkowy danego porządku szereg rozdzielniczy stanowi liczbę porządkową danego pomiaru
K- największa liczba porządkowa
ni - ilość elementów którą uzyskał pomiar dużego i
szereg rozdzielczy
n 3 = 7
n 20 (studenci)
n - liczba badanych elementów
(W) – częstość miernik częstego pomiaru jaki się pojawił w danej zbiorowości
$$Wi = \frac{\text{ni}}{n}$$
Przedziałowy szereg rozdzielczy
i | Xi0-Xi1 | ni | Xi0 |
---|---|---|---|
1 | 0-5 | 7 | 2,5 |
2 | (6) 5-10 | 10 | 7,5 |
3 | (11)10-15 | 8 | 12,5 |
4 | (10)15-20 | 3 | 17,5 |
5 | (21) 20-25 | 9 | 22,5 |
x- liczba porządkowa danego podzbioru
xi0 – xi1 – granica dolna i górna przedziału
ni – liczebność np. staż pracy pracowników
Xi0 – środek przedziału
Liczebność stymulowana sni – wskazują ile elementów (osób) osiągnęło inny wynik ITA
Transformacja danych zestawienie danych z wynikami więcej niż jednej zmiennej
Xi Xik – liczba dzieci w rodzinie
Yj Yjk – wykształcenie męża
Xi | xi | 1 | 2 | 3 | $$\sum_{}^{}{}$$ |
---|---|---|---|---|---|
Podstawowe | Średnie | Wyższe | Wykształcenie | ||
1 | 0 | 6 0,1875 |
11 0,3438 |
15 0,4688 |
32 |
2 | 1 | 6 0,0769 |
18 0,3830 |
23 | 47 |
3 | 2 | 29 | 41 0,1760 |
17 | 87 0,3734 |
4 | 3 | 23 | 14 | 6 | 43 |
5 | Powyżej 3 | 14 0,1795 |
8 | 2 | 24 |
$$\sum_{}^{}{}\text{n.j}$$ |
Ilość dzieci | 78 | 92 | 63 | 233 |
Nij –liczebność ze względu na daną liczebność
Nzz=18
W badaniu było 41 zbiorowości, zbiorowości posiadały 2 dzieci i wykształcenie średnie
ni – sumy marginesowe – to ludność z rzędu xni. W badaniu zbiorowości było 32 zbiorowości nie posiadały dzieci
punktowy szereg dla zmiennej j ile zmienną było wykształcenie ojca
n.j w badaniu zbiorowości 92 mąż posiadał wykształcenie średnie
n 233
Dane przeprowadzane przez wywiad lub ankietę. Można powiązać jakieś zestawienie odpowiedzi, gdzie respondent nie udzielił odpowiedzi
Można wyliczyć częstotliwość W
$Wij = \frac{\text{nij}}{n}\ $
$$Wi. = \frac{\text{ni.}}{n}$$
$$Wij = \ \frac{\text{n.j}}{n}$$
Często rodziny posiadały dwójkę dzieci i stanowiły one 0,37% badanych rodzin
Częstość warunkowa – częstość występowania określonej jednej zmiennej gdy założy się jaką wartość posiadała druga zmienna
$\text{Wj}\left( i \right) = \frac{\text{nij}}{\text{ni.}}$ i =1
Jak często rodzaj wykształcenia miał mąż w rodzinie w której nie było dzieci
Wśród rodzin które nie posiadały dzieci 187,5 % rodzin to rodziny w których mąż miał wykształcenie podstawowe
Częstość warunkową można obliczyć w przypadku drugiej zmiennej
$$\text{Wi}\left( j \right) = \frac{\text{nij}}{\text{n.j}}$$
Wśród rodzin w których mąż miał wykształcenie średnie i posiadały dwójkę dzieci było 3830% rodzin
6.11.2012
Temat: miary tendencji centralnej
Ukazują charakterystyczną wartość zmiennej interesującą badacza
Mierniki dzielimy na dwie grupy:
Klasyczne
Pozycyjne
Klasyczne – do nich należą różnego rodzaju średnie np. średnia arytmetyczna
Średnia – ukazuje przeciętną wartość zmiennej dla danej zbiorowości. Średnia można wybrać kiedy dysponujemy danymi jednostkowymi
$\overset{\overline{}}{x}$- średnia zmiennej
n
$\sum_{}^{}.$
$$\overset{\overline{}}{x} = \frac{i - 1\ xi}{n}$$
k
$$\sum_{}^{}.$$
$\overset{\overline{}}{x}$ =$\frac{i = 1\ xi\ ni}{n}$
i | Ocena xi | Liczba osób ni | xi ni | ni |
---|---|---|---|---|
1 | 2 | 2 | (2*2) 4 | 2 |
2 | 3 Me | 12 | (3*12) 36 | 14 |
3 | 4 | 6 | 24 | 20 |
4 | 5 | 5 | 25 | 25 |
89 |
Mo = 3 bo wystąpiła 12 razy
Me większa otrzymana ocena niższa niż 3
N Me = 13 → $\frac{25 + 1}{2}$
Me = 3 – wskazuje środek $\overset{\overline{}}{x}$ = $\frac{89}{25}$ = 3,56
n = 25 (osób)
średnią można wyliczyć dzięki danej przedziałowej
k
$$\sum_{}^{}.$$
$\overset{\overline{}}{x}$ =$\frac{i = 1\ xi\ ni}{n}$ Xi = $\frac{xoi + x1i}{2}$
i | xoi- x1i | ni | xi | xi-ni | sni |
---|---|---|---|---|---|
1 | 10-14 | 4 | 12 | 48 | 4 |
2 | 14-18 | 7 | 16 | 112 | 11 |
3 | 18-22 | 8 | 20 | 160 | 19 |
4 | 22-26 | 6 | 24 | 144 | 25 |
464 |
NMe =13
(4+7)
Tu znajduje się 15 NMe
sni- to suma ni
$\overset{\overline{}}{x}$ = $\frac{464}{25}$ = 18,56
Miara pozycyjna:
Mediana – Me
Mediana – wartość środkowa czyli taki punkt na skali pomiarowej w której 50% wyników jest równa a drugie 50% jest wyższa bądź równa
NMe – numer mediany
NMe = $\frac{n + 1}{2}$
Dane uporządkowane w ciąg rosnących wartości
Mo = 15 (studenci otrzymali 15 punktów)
X 1,12,13,15,15,16,17,18,19
NMe = 5 =$\ \frac{911}{2}$
1 2 3 4 5 n= 9 Me = 15
Studenci otrzymali 15 punktów, a druga połowa co najmniej 15
Me – można obliczyć dla szeregowego przedziału
Me =xoMe =($\frac{n}{z}$ – snime – 1) $\frac{\text{hme}}{\text{mMe}}$
h- rozpiętość przedziału (szerokość)
Me = 18+ (12,5-11)$\frac{4\ \left( 21 \times 18 \right)}{8}$ = 18+1,5 × 0,5= 18+ 0,75 = 18,75
Ponad półtora uczniów otrzymała wyższy wynik od 18,75
Modalna – Mo
Modalna – bywa określana mianem dominanta wartości najczęściej pojawia się wśród wyników pomiaru, można ją wyliczać dla danych szczegółowych i proponowanych
11 ,13,13, 14,15,16,17,18,19,20
Przykład jedno modalny to 13
11, 13,13, 14,15 ,16,16 ,17 Mo1 - 13
Mo2 -16
Przykład dwu modalnego to 13,16
Modalną można wyznaczać dla pogrupowanych.
Modalna lokuje się w najliczniejszym przedziale
Mo=XoMo dolna granica przedziału zawierająca modalną
Mo=XoMo + $\frac{\left( nMo - nMo - 1 \right)\text{hno}}{\left( nMo - nMo - 1 \right)\ (\left( nMo - nMo + 1 \right)}$
nMo – liczebność zawierająca modalną
Mo = 18 +$\frac{(8 - 7) \times 4}{\left( 8 - 7 \right) + \ (8 - 6)}$ = 18 + $\frac{4}{3}$ = 19,33
Najczęściej studenci uzyskiwali 19,33 punktów
13.11.2012r.
Temat: miary rozproszenia
Miary rozproszenia (mierniki rozproszenia) – stosuje się je jak wyniki pomiarowe odbiegają od wartości średniej
Są różne wartości odchyleń
Wariancje – odchylenia kwadratowe
Odchylenia standardowe
Wzór na odchylenie kwadratowe dla danych szczegółowych
n
S2 = $\sum_{}^{}.$+ $\frac{(xi - {\overset{\overline{}}{x}}^{)2}}{n - 1}$
i
jak i pogrupowanych dla punktowego szeregu rozdzielczego
n
S2 = $\sum_{}^{}.$ (xi - $\overset{\overline{}}{x}$)2 $\frac{\text{ni}}{n - 1}$
i | Ocena xi | Liczba osób ni | xi- $\overset{\overline{}}{x}$ | ( xi- $\overset{\overline{}}{x}$)2 | xi- $\overset{\overline{}}{x}$y ni2 |
---|---|---|---|---|---|
1 | 2 | 2 | -1,56 | 2,4336 | 4,8672 |
2 | 3 Me | 12 | - 0,56 | 0, 3136 | 3, 7632 |
3 | 4 | 6 | 0,44 | 0,1936 | 1,1616 |
4 | 5 | 5 | 1,44 | 2,0736 | 10,368 |
n=25
x= 3,56
s2= 0,82
s= 0,92
20,16
Odchylenie standardowe s – jak wyniki odchylają się od wartości średniej
Wzór na przedział odchylenia S= $\sqrt{s}$2
<$\overset{\overline{}}{x} - s,\overset{\overline{}}{x} + \ s$> liczebność przedziału ilu uczniów dostało 3 i 4
<2,64;4,48> Mo = 18
<3;4>
Szereg przedziałowy
n
S2 = $\sum_{}^{}.\frac{(xi - \ \overset{\overline{}}{x})2}{n - 1}$
i | xoi- x1i | ni | xi | x1-$\ \overset{\overline{}}{x}$ | (x1-$\ \overset{\overline{}}{x}$)2 | (x1-$\ \overset{\overline{}}{x}$)2 *ni |
---|---|---|---|---|---|---|
1 | 10-14 | 4 | 12 | - 6,56 | 43,336 | 172,1344 |
2 | 14-18 | 7 | 16 | -2,56 | 6,5536 | 45,8752 |
3 | 18-22 | 8 | 20 | 1,44 | 2,0736 | 16,5888 |
4 | 22-26 | 6 | 24 | 5,44 | 29,5936 | 177,5616 |
412,16 |
n=25
$\overset{\overline{}}{x}$= 18,56
S2 = 17,1733
S = 4,21
<$\overset{\overline{}}{x} - s,\overset{\overline{}}{x} + \ s$>
<14,35;22,77>
<15;22> np.= 15
S = 32,1
<15,35;21,77>
<16,21>
20.11.2012
Temat: symetryczność rozkładu
symetryczność rozkładu – występuje wtedy gdy dla każdej liczby $\overset{\check{}}{a}$
A=-a A=a
asymetria lewostronna(-) | Rozkład symetryczny | asymetria prawostronna (+) |
---|---|---|
Mierniki skośności A= $\frac{\overset{\overline{}}{x - Mo}}{s}$ |
Asymetria rozkładu | |
Kierunek rozkładu
Siła asymetrii (tabela interpretacyjna)
A | Siła |
---|---|
0,02 | Bardzo słaba |
0,21- | słaba |
0,41-0,70 | Umiarkowana |
0,71-0,9 | Silna |
Pow. 0,9 | Bardzo silna |
Odchylenie standardowe
68,26%
95,44%
99,74%
3s czyli reguła 3 odchyleń standardowych
Jeżeli badany uzyska wynik powyżej wartości 3 odchyleń standardowych wyjdą powyżej 0,26% to znaczy że badacz popełnił błąd
27.11.2012
Temat: statystyka indukcyjna – wnioskowania statystyczne
Aby móc je przeprowadzić wykorzystuje się testy statystyczne – sposób postępowania w którym każdej możliwej próbie przyporządkowuje się decyzje o przyjęciu lub odrzuceniu sprawdzonej hipotezy.
Hipoteza (H1) – poddawana sprawdzeniu
Hipoteza alternatywna (zerowa) (H0) – względnie poddawana sprawdzeniu
Gdy badacz ma prawo odrzucić H0 ma prawo za właściwą uznać H1
Ryzyko wiąże się z tym że w wyniku testu statystycznego odrzuci się hipotezę prawdziwą występuje wtedy BŁĄD PIERWSZEGO RODZAJU .
Prawdopodobieństwo popełnienia w/w błędu oznacz się α ≤ 0,05
Jeżeli zaś się mieści się w tym jeżeli wyliczony poziom istotności mieści
przedziale to badacz uznaje za się w tym przedziale to badacz uznaje za
prawdziwą H0 prawdziwą H1
(α ≤ 0,02) poziom istotności oznacza że jeśli badacz 100 razy przeprowadzi badania to 2 razy odrzuci hipotezę prawdziwą
Testy statystyczne różnicuje się z względu na istotę hipotez
Testy parametryczne - hipotezy wypowiadające się o jakimś parametrze badanej grupy (najczęściej średnia wartość mierzona dla danej grupy np. wariancja)
H1 : ${\overset{\overline{}}{x}}_{1}$ ≠ ${\overset{\overline{}}{x}}_{2}$ średnia pierwszej grupy różni się w sposób
istotny statystycznie od średniej drugiej grupy
H0 : ${\overset{\overline{}}{x}}_{1}$ = ${\overset{\overline{}}{x}}_{2}$ średnia pierwszej grupy nie różni się w sposób
istotny statystycznie od średniej drugiej grupy
Testy nieparametryczne - hipotezy wypowiadające się bądź o zależności lub różnicy ze względu na jakieś cechy jaki występują pomiędzy badanymi zbiorowościami
Większość testów statystycznych to testy istotności jeśli chcemy wyznaczyć na jakim poziomie …………………………………………………………………………………………………………………………………………………………………………………………………….
Test t-studenta (statystyka t + pseudonim pod jakim publikował twórca testu)
Test ten występować może pod wieloma postaciami:
Dla wartości dwóch średnich dla prób niezależnych- próby które zostały dobrane tak iż osoba weszła do którejś prób, nie decyduje chęć przynależności do innej grupy np. przynależność do grupy kobiet i mężczyzn lub dwie klasy szkolne. Test ten posiada ograniczenie wolno go stosować gdy rozkład jest normalny lub przybliżony do normalnego (krzywa gausa)
Gdy współczynnik A ≤ 0,7
[asymetria jest umiarkowana]
Aby ten test dla danych dwóch grup należy wyznaczyć parametry i podstawić do wzoru
t = $\frac{\left( {\overset{\overline{}}{x}}_{1 - {\overset{\overline{}}{x}}_{2}\ } \right) \times \sqrt{\frac{n_{1 \times \ n_{2\ \times \left( n_{1\ \ \times {\ n}_{2 -}}2 \right)}}}{n_{1 + n_{2}}}}}{\sqrt{n_{1\ \times}{s_{1}}^{2} + n_{2\ \times {s_{2}}^{2}}}}$
Pytanie: czy średnia statystyczna z grupy pierwszej różni się znacznie od średniej grupy drugiej?
1G 2G
n1 = 20 n2 = 20
$\overset{\overline{}}{x_{1}} =$ 3,9 ${\overset{\overline{}}{x}}_{2}$ = 4,3
S12 = 0,31 S22 = 0,35
t= $\frac{\left( 3,9 - 4,3 \right)\sqrt{\frac{20\ \times 20\ \left( 20 + 20 - 2 \right)}{20 + 20}}}{\sqrt{20 \times 0,31 + 20\ \times 0,35}}$
t= $\frac{\left( - 0,4 \right)\frac{\sqrt{400\ \left( 38 \right)}}{40}}{}$ t= - 2,150
|t| = 2,150 (wartość bezwzględna)
Liczba stponi swobody df = (n1 + n2 – 2 )
df = 38
„by podjąć decyzję o odrzuceniu hipotez korzystamy z tablic t-studenta ”
α
df | 0,05 | |||
---|---|---|---|---|
30 ↓ |
2,042 ↓ |
|||
df= 38 | |t|= 2,150 |
Ponieważ 0,05 mieści się w α = 0,05
Wniosek:
Średnia ocen z egzaminu studentów grupy pierwszej w sposób istotny statystycznie różni się od ocen z egzaminu studentów grupy drugiej ponieważ różnica między tymi średnimi jawi się na poziomie istotności α = 0,05
Zadanie 1
|t|= 1721
df= 38
Z tablic df = 30 poziom istotnosci α = 0,1
|t|= 1721 – 1,697
α = 0,1 nie mieści się w α = 0,05 Prawdziwa jest teza H0
Średnia ocen z egzaminu studentów grupy pierwszej w sposób istotny statystycznie nie różni się od ocen z egzaminu studentów grupy drugiej ponieważ różnica między tymi średnimi jawi się na poziomie istotności α =0,1
Zadanie 2
|t| = 2,928 z tablic 2,750
df = 32 z tablic 30
poziomi istotności α =0,1
Prawdziwa jest teza H1
Średnia ocen z egzaminu studentów grupy pierwszej w sposób istotny statystycznie różni się od ocen z egzaminu studentów grupy drugiej ponieważ różnica między tymi średnimi jawi się na poziomie istotności α =0,1
04.12.2012
Testy statystyczne dla wartości średnich
Test t-studenta dla prób zależnych gdy pomiar wartości dla danych zależnych został przeprowadzony dwukrotnie w dostępie czasu np. porównanie ocen uczniów za pierwszy i drugi semestr
Test ten posiada ograniczenie asymetrii gdy je…………………………………………
……………………………………………………………………………………….....
t= $\frac{\overset{\overline{}}{\text{R\ }} \times \sqrt{n - 1}}{S_{R}}$ $\overset{\overline{}}{R}$ – Średnia różnica dwa pomiary dla jednej zmiennej
n-1 – liczebność próby 1 x1i x2i → różnica pomiarów
SR – wariancja różnic Ri= x2i- x1i
$\overset{\overline{}}{\left( x \right)}\ \overset{\overline{}}{R}$=
Uczniowie pewnej klasy w pierwszym semestrze otrzymali oceny średnia tych ocen wyniosła
$\overset{\overline{}}{R}$= 0,4 t= $\frac{0,4 \times \sqrt{19}}{0,67}$
SR = 0,67
n = 20 t = 2,602 (z tablic 2,539)
df = n-1 α =0,02
df = 19
Średnia ocen pewnej klasy w sposób istotny statystycznie różni się z pierwszego i drugiego semestru ponieważ różnica między tymi średnimi jawi się na poziomie istotności α =0,02
Wzór testu bazującego na statystyce „U”
↓
Próby muszą być dostateczne liczne jeżeli zawiera co najmniej 120 elementów (lub chociaż około 100 elementów) nie zawiera ograniczeń asymetrii
U = $\frac{{\overset{\overline{}}{x}}_{1} - {\overset{\overline{}}{x}}_{2}}{\sqrt{\frac{{s_{1}}^{2}}{n_{1}} + \frac{{s_{2}}^{2}}{n_{2}}}}$
X1 = 4,1 X2 = 3,9
n1 =120 n2 = 150 studenci dwóch specjalności dotyczące ocen
S12 = 0.38 S22 = 0,31 jakie uzyskali z egzaminu z pewnego przedmiotu
U = $\frac{{\overset{\overline{}}{x}}_{1} - {\overset{\overline{}}{x}}_{2}}{\sqrt{\frac{{s_{1}}^{2}}{n_{1}} + \frac{{s_{2}}^{2}}{n_{2}}}}$ U= $\frac{4,1 - 3,9}{\sqrt{\frac{0.38}{120} + \ \frac{0,31}{150}}}$ U = $\frac{0,2}{\sqrt{0,005}}$ U= 2,765
df = ∞ α =0,01
Wniosek:
Średnia ocen z egzaminu studentów specjalności pierwszej różni się w sposób istotny statystycznie od średniej ocen z egzaminu studentów specjalności drugiej, ponieważ różnica między tymi średnimi jawi się na poziomie istotności równym α =0,01
11.12.2012
Temat: testy nieparametryczne
Orzeczenie na podstawie liczebności empirycznych (zaobserwowanych). Testy wypowiadają się o zależności pomiarów zmiennych o ile zmienne są nie zależne i zależne
Test
Postępowanie
Sporządzenie tabeli wielodzielczej dla zaobserwowanych danych (zmienna 1-x1 zmienna Z-Yi)
Wyliczenie oczekiwanych wartości
Wyliczenie wartości
Pytanie I czy badani są zadowoleni z wybranego zawodu
T – tak
N – nie
RT – raczej tak
RN – raczej nie wiersz i
1 | 2 | 3 | 4 | ||
---|---|---|---|---|---|
ine | T | RT | RN | N | $$\sum_{}^{}.$$ |
1K | 21 | 37 | 41 | 48 | 147 |
2M | 56 | 43 | 21 | 17 | 137 |
$$\sum_{}^{}.$$ |
77 | 80 | 62 | 65 | 284 |
ne – liczebności zaobserwowane empirycznie
neij – obszar mocniej zaznaczony
nezz = 43
nn13 = 41
nei – liczebność dla tej kategorii bez określenia
jakiego respondent dokonał wyboru
wiersz j
ne2 = 137
nej – suma z wiersza
ne3 = 62
n = 284
2
Ao | 1 | 2 | 3 | 4 | $$\sum_{}^{}.$$ |
---|---|---|---|---|---|
1 | 39,83 | 41,41 | 32,09 | 33,64 | 174 |
2 | 37,14 | 38,59 | 29,91 | 31,36 | 137 |
$$\sum_{}^{}.$$ |
77 | 80 | 62 | 65 | 284 |
noij $\frac{nei1 \times ne \times j}{n}$
(mnoży się sumy bnegowa)
3 Wyliczenie wartości statystyki
Tezy
Wyliczenie wartości dla poszczególnych kolumn tabeli
(wartości wyliczamy do 3 miejsca po przecinku) mmmmm
ij | 1 | 2 | 3 | 4 |
---|---|---|---|---|
1 | 6,921 | 0,469 | 2,473 | 6,125 |
2 | 9,572 | 0,504 | 2,653 | 6,572 |
$\frac{\left( \mathbf{neij - noij} \right)\mathbf{\ 2}}{\mathbf{\text{noij}}}$
2 z sumowanie po wierszach (dodać do siebie liczby z kolumn z ostatniej tabeli)
$\sum_{}^{}.$ $\sum_{}^{}.$
= i = 1 j=1
3. wyliczanie stopni swobody (df)
df=3 tab. 16,268
α = 0.001 (poziom istotności α ≤ 0, 05)
Wniosek:
Zadowolenie z wykonywania zawodu kobiet różni się w sposób istotny statystycznie z zadowolenia z wykonywania zawodu mężczyzn, ponieważ różnica zadowolenia jawi się na poziomie istotności α = 0.001
Wniosek wpływu jednej zmiennej na drugą (istotność wpływu)
Płeć w sposób istotny statystycznie wpływa ponieważ poziom istotności jawi się na poziomie α = 0.001
Gdy zależność jest istotna statystycznie możemy wyliczyć siłę istotności współczynnik V CRAMERA
V = $\sqrt{\frac{}{n \times \min\left( W - 1 \right)k - 1}}$ funkcja minimum najmniejsza z wartości
V= $\frac{37,289}{284 - 1}$
V = 0,38 argumenty funkcji min (1,3)=1
(zależność słaba lecz wyraźna) (tabela interpretacyjna żeby
się posłużyć wartością)
Tabela interpretacyjna
V | Siła zależności |
---|---|
0 – 0,2 | Zależność prawie nic nie znacząca |
0,21- 0,4 | Zależność słaba lecz wyraźna |
0,41 – 0,7 | Zależność umiarkowana |
0,71 – 0,9 | Zależność silna |
0,91 - 1 | Zależność bardzo silna |
Wniosek o sile zależności:
Słabo lecz wyraźnie wpływa na zadowolenie z wykonywanego zawodu w sposób istotny statystycznie (α = 0.001) (V= 0.38)