stat 2JAEWWOEVXCCIBDBK4HS3IUMMLOQHYNUUC3B3YA


1. ZMIENNA - właściwość, pod względem której elementy grupy lub zbioru różnią się między sobą. Elementami grupy mogą być jednostki ludzkie, które mogą różnić się miedzy sobą płcią, wiekiem, kolorem oczu, inteligencją, ostrością słuchu itp.

ZMIENNĄ nazywa się w badaniach socjologicznych dowolną cechę, która może przyjąć

co najmniej dwie wartości.

PODZIAŁ ZMIENNYCH:

  1. z. zależna - jej wartość wynika bezpośrednio z kształtu zmian wartości innej zmiennej

(niezależnej). Zmienną Y, czyli zmienną, której wartość przewidujemy, przyjęło się określać mianem zmiennej zależnej, ponieważ jej przewidywanie zależy od wartości X

i od znanej nam wartości funkcyjnej.

z. niezależna - jej określona wartość bezpośrednio wpływa na wartość innych zmiennych (zależnych). Zmienną X określa się mianem zmiennej niezależnej.

2) z. ilościowa - wyraża określoną właściwość lub cechę danego obiektu, której poziom

lub natężenie można wyrazić liczbowo(wzrost, wiek, zarobki)

z. jakościowa-( zaliczamy do nich z. dychotomiczne) Wyraża określoną właściwość

lub cechę danego obiektu nie przy pomocy wartości liczbowych, ale przez

Skategoryzowanie tych cech czy właściwości

(np. kobieta - mężczyzna)

3) z. dwuwartościowa - (zerojedynkowa) - powstaje przez określenie czy dany obiekt,

posiada cechę czy jej nie posiada, przy czym abstrahuje się faktu, że obiekty mogą

posiadać cechę o różnym stopniu natężenia.(przykładem jest zdanie - niezdanie egzaminu na studiach)

z. wielowartościowa -(przykładem są wyniki testu zdolności akademickich)

4) z.. dyskretna - może przyjmować tylko niektóre wartości

z. ciągła -Wtedy, gdy jej zbiór tworzy kontinuum i jeżeli pomiędzy dwiema sąsiednimi wartościami zmiennej możliwe jest znalezienie trzeciej wartości.

Może przyjmować dowolną wartość z określonego zbioru wartości. Możliwe wartości zmiennej należą do pewnego ciągu. Między dowolnymi dwiema wartościami

zmiennej znajduję się nieskończenie wielka liczba wartości pośrednich. Przykładami

zmiennych ciągłych mogą być wzrost, ciężar i czas.

5) z. dychotomiczna - Która w naturalny sposób przyjmuję tylko wartości ze zbioru

dwuelementowego

zmienna dwukategorialna (płeć, odp: tak, nie)

z. zdychotomizowana - Faktycznie wielowartościowe, ale badacz dla jakiś celów

sprowadził do postaci dwuwartościowej (np. wzrost niski - równy i poniżej 170

wysoki -powyżej 170)

2. POMIAR - Jeżeli dane o jakimś zjawisku społecznym stanowią wynik pojęciowo ustrukturowanych, systematycznych i kontrolowanych obserwacji cech jednostek badawczych, to ów proces obserwacji jest równoznaczny z najogólniej pojętym dokonywaniem pomiarów, czyli uzyskiwaniem danych. Dane o obiektach badanych, uzyskane w wyniku pomiaru, mogą dostarczać informacji o tym:

  1. jaka jest wartość jakiejś cechy jakiegoś obiektu badanego w danym momencie

  2. jakiej zmianie uległa wartość danej cechy w nie zmienionych warunkach

  3. jakiej zmianie uległa wartość danej cechy w warunkach, które zmieniły się w sposób

znany

Każda z tych możliwości wymaga spełnienie następujących warunków wstępnych, bez których pomiar nie odpowiadałby koniecznym wymogom strukturalizacji pojęciowej

i kontrolowalności.

  1. Zbiór obiektów badawczych musi być określony tak jednoznacznie, aby w każdym przypadku można było rozstrzygnąć, czy określony obiekt należy do niego czy nie.

  2. Warunki sytuacyjne towarzyszące pomiarom, jeśli badacz nie może nimi odpowiednio manipulować, muszą być znane na tyle, aby można było kontrolować ich ewentualny wpływ na przebieg pomiarów.

  3. Należy dokładnie ustalić metody pomiaru i zbierania danych.

  4. Cechę, której dotyczyć mają dane, należy zdefiniować, tak aby można było dokładnie

podać, jakiego rodzaju obserwacje mają być przeprowadzone za pomocą danego narzędzia.

POMIAR w węższym znaczeniu oznacza podlegający określonym regułom proces przyporządkowania symboli zaobserwowanym wartościom badanych cech.. Stosowanie do owych reguł można wyróżnić cztery poziomy pomiaru i odpowiadające im cztery skale:

  1. skala nominalna

  2. skala porządkowa

  3. skala interwałowa

  4. skala ilorazowa

SKALA NOMINALNA - pozwala tylko na pogrupowanie obiektów (osób)

pomiar na poziomie nominalnym jest najprostszą formą pomiaru. Opiera się on na regułach dwuwartościowej logiki predykatorów i polega na klasyfikowaniu obiektów ze względu na posiadanie lub brak określonej cechy (jakościowej). Zgodnie z tym, ludzi można podzielić na mężczyzn i kobiety, na osoby wyznania protestanckiego, katolickiego i mojżeszowego.

Przy pomiarze nominalnym muszą być spełnione następujące warunki:

  1. W odniesieniu do dwóch obiektów badanych musi być rozstrzygalne, czy ze względu na badaną cechę są one takie same czy nie. Możliwa jest tylko jedna z dwu sytuacji:

A=B lub A≠B

  1. Identyczność dwu obiektów badanych musi być relacją symetryczną, jeżeli obiekt A ma tę samą cechę badaną co obiekt B, to obiekt B ma tę samą cechę badaną co obiekt A: jeżeli A=B, to B=A

  2. Jeżeli obiekt badany A ma tę samą wartość cechy co obiekt badany B, obiekt zaś B tę samą wartość cechy co obiekt C, to obiekt A ma tę samą wartość cechy co obiekt C:

Jeżeli A=B i B=C, to A=C

Cechy mierzone za pomocą skali nominalnej charakteryzują się tym, że ogół możliwych wartości tych cech stanowi zbiór nieuporządkowany. Między poszczególnymi kategoriami tych wartości nie da się ustalić żadnych stosunków metrycznych.

ZMIENNA NOMINALNA - to cechy, których wartości mogą być uporządkowane

w dowolnej kolejności. Nie ma znaczenia, czy w zmiennej „płeć” wyróżni się wartości

w kolejności: 1/mężczyzna, 2/kobieta czy też odwrotnie

SKALA PORZĄDKOWA - możemy nie tylko stwierdzać o równości lub różności, ale także wskazać któremu z obiektów zmienna przysługuje w wyższym stopniu

reprezentuje ona wyższy od nominalnej poziom pomiaru. Pozwala na porządkowanie obiektów badanych odpowiednio do wartości danej cechy, ponieważ cecha ta ma charakter ilościowy. Ten poziom pomiaru uwzględnia natężenie, siłę i wielkość określonej cechy u poszczególnych obiektów badanych.

Aby jakąś cechę można było uznać za mierzalną na poziomie porządkowym, dane muszą spełniać następujące warunki:

  1. Jeżeli obiekt A pod względem danej cechy jest większy od obiektu B, to obiekt B pod względem tej samej cechy nie jest większy od obiektu A: jeżeli A>B, to B>A

to także A>C

Liczby określające rangę są wartościami rangowymi lub liczbami porządkowymi.

ZMIENNA PORZĄDKOWA - takie cechy, których wartości są lub mogą być uporządkowane w oparciu o wyraźne kryterium tego uporządkowania. Zmienną porządkową jest z pewnością wykształcenie.

SKALA INTERWAŁOWA - pozwala na stwierdzenie o ile natężenie zmiennej X dla obiektu A jest większe (mniejsze) od natężenia tej zmiennej dla obiektu B

informuje, jak wielkie są odstępy między poszczególnymi punktami. Warunkiem podstawowym jest tu istnienie powtarzalnej jednostki miary, którą można uznać za standard.

ZMIENNA INTERWAŁOWA - cechy o wartościach między którymi można określić odległość. Odległość ta nie musi być jednakowa. Ważne jest natomiast, aby można ją było w sposób uzasadniony wyznaczyć , zmierzyć. Zmienną interwałową jest zmienna wykształcenia, mierzonego ilością ukończonych lat nauki w szkole.

SKALA ILORAZOWA - pozwala na stwierdzenie, że natężenie zmiennej X dla obiektu A jest k razy większe niż natężenie tej zmiennej dla obiektu B

gdy skala ma ponadto naturalny punkt zerowy, mamy do czynienia ze skalą ilorazową.

ZMIENNA ILORAZOWA - to takie cechy, których wartości pozostają do siebie

w stosunkach liczbowych. Przykładowo, w zmiennej wieku można ustalić relacje liczbowe i proporcje między poszczególnymi wartościami. Sensowne jest więc powiedzenie, że osoba 60-letnia jest dwukrotnie starsza od osoby 30-letniej.

  1. SZEREG LICZEBNOŚCI (CZĘSTOŚCI). GRUPOWANIE, KUMULOWANIE I RANGOWANIE DANYCH

GRUPOWANIE -(ustalanie wielkości przedziału klasowego - zasady)

RANGOWANIE DANYCH -przypisanie zjawiskom liczby w taki sposób, że zjawiska te zostają umiejscowione wg kolejności. Pomiary wyrażone rangami dają nam po prostu uporządkowanie szeregowe rzeczy.

  1. GRAFICZNA PREZENTACJA DANYCH

(histogram, wielobok liczebności i krzywa kumulatywna)

HISTOGRAM - rodzaj wykresu, często wykorzystywany w badaniach opinii społecznej

do prezentacji danych statystycznych, w którym różnym wartościom danej zmiennej odpowiadają różne wysokości pionowych prostokątów. W histogramie zakładamy, że wszystkie przypadki w obrębie przedziału klasowego rozkładają się równomiernie.

WIELOBOK LICZEBNOŚCI - przyjmujemy, że wszystkie przypadki w każdym przedziale skupiają się w jego środku.

KRZYWA KUMULATYWNA -

  1. MIARY TENDENCJI CENTRALNEJ

( średnia arytmetyczna, mediana, wartość modalna)

ŚREDNIA ARYTMETYCZNA - to suma zbiorów pomiarów podzielona przez liczbę pomiarów

w zbiorze.

CECHY:

  1. Suma odchyleń wszystkich pomiarów w zbiorze od ich średniej arytmetycznej równa

jest 0.

  1. Suma kwadratów odchyleń od średniej arytmetycznej jest mniejsza niż suma kwadratów odchyleń od dowolnej innej wartości.

  2. Każda średnia obliczona z próby o liczebności N stanowi estymator średniej

w populacji.

  1. W przypadku większości rozkładów średnia jest dokładniejsza bądź skuteczniejsza jako estymator średniej w populacji aniżeli takie miary tendencji centralnej, jak mediana i wartość modalna jako estymatory odpowiadających im wartości w populacji.

MEDIANA - jest wartością dzielącą wszystkie pomiary na pół, czyli tak, że połowa pomiarów mieści się poniżej niej, a połowa powyżej.

WARTOŚĆ MODALNA - w sytuacjach, w których różne wartości zmiennej X występują więcej niż raz, wartość modalna jest wartością występującą najczęściej

  1. MIARY DESPERSJI

( odchylenie standardowe, odchylenie ćwiartkowe)

ODCHYLENIE STANDARDOWE - (σ) jest miarą stopnia zmienności najpowszechniej stosowaną i najbardziej rzetelną. To znaczy zmienia się ono najmniej między próbami pobranymi losowo z tej samej populacji. Jest rodzajem przeciętnej wszystkich odchyleń od średniej w próbie.

ODCHYLENIE ĆWIARTKOWE -

WSPÓŁCZYNNIK ZMIENNOŚCI - nie powinien być stosowany, jeśli nie jesteśmy dość pewni, że nasza skala pomiarowa posiada równe jednostki, a przede wszystkim, jeśli nie występuje punkt zera bezwzględnego.

  1. MIARY POLOŻENIA (kwartyle) I MIARY ASYMETRII (skośność)

MIARA SKOŚNOŚCI - wykorzystuje trzeci moment. Uzasadnienie tej statystyki opiera się na zaobserwowanym fakcie, że gdy rozkład jest symetryczny, to suma odchyleń powyżej średniej podniesiona do trzeciej potęgi jest równoważna sumie odchyleń poniżej średniej podniesionych do trzeciej potęgi. Zatem dla rozkładu symetrycznego

m3 =0 i g1=0. Jeżeli rozkład jest asymetryczny, to sumy odchyleń powyżej i poniżej średniej podniesionych do trzeciej potęgi nie są sobie równoważne.

  1. ROZKŁADY PRAWDOPODOBIEŃSTWA (zero-jedynkowe, skokowe, ciągle)

ROZKŁAD NORMALNY PRAWO TRZECH SIGM. STANDARYZACJA ROZKŁADU

Terminu prawdopodobieństwo można używać subiektywnie, określając nim pewną postawę albo wątpliwość dotyczącą jakiegoś zdarzenia przyszłego.

ROZKŁAD NORMALNY -(właściwości)

  1. Krzywa jest symetryczna. Średnia, mediana i wartość modalna zbiegają się

w jednym punkcie.

  1. Najwyższa rzędna krzywej występuje w punkcie średniej, czyli gdy

z=0 i w jednostkowej krzywej normalnej równa jest 0,3989

  1. Krzywa jest asymptotyczna. Zbliża się ona do osi poziomej, lecz nigdy do niej nie dochodzi i rozciąga się od minus nieskończoności do plus nieskończoności.

  2. Punkty zagięcia krzywej znajdują się w miejscach plus lub minus jedną jednostkę odchylenia standardowego powyżej lub poniżej średniej. W tych miejscach krzywa zmienia się względem osi poziomej z wypukłej we wklęsłą.

  3. Mniej więcej 68% powierzchni pod krzywą mieści się w granicach plus lub minus jednej jednostki odchylenia standardowego od średniej

  4. W jednostkowej krzywej normalnej granice z= +1,96 obejmują 95%, a granice

z=+2,58 obejmują 99% całkowitej powierzchni pod krzywą, przy czym odpowiednio 5% i 1% powierzchni mieści się poza tymi granicami.

STANDARYZACJA - O teście psychologicznym mówimy, że jest standaryzowany, gdy dysponujemy wynikami przekształconymi, opartymi na odpowiednio dużej grupie odniesienia. Same wyniki przekształcone nazywamy normami.

PRAWO TRZECH SIGM - 3 odchylenia w prawo od średniej , 3 odchylenia w lewo od średniej

  1. WSPÓŁCZYNNIK KORELACJI (r-Pearsona, rs-Spearmanna,

Fi-Yulla, V-Cramera)

R-Pearson

Najpowszechniej stosowaną miarą korelacji jest współczynnik Pearsona według momentu iloczynowego (mieszanego). Jest to statystyka typu przedziałowo-stosunkowego

WSPÓŁCZYNNIK KORELACJI - jest statystyką określającą siłę związku między dwiema zmiennymi. Na oznaczenie wartości współczynnika korelacji z próby stosuje się powszechnie symbol, r. Natomiast parametr populacji, czyli korelację w populacji, z której została pobrana próba, oznacza się symbolem p.

rs -Spearmann Miara inwersji ∑d2, występuje w definicji współczynnika korelacji rangowej. Współczynnik korelacji rangowej jest statystyką zdefiniowaną w taki sposób, że przyjmuje wartość +1, gdy pary rang są uszeregowane w tym samym porządku, wartość -1, gdy są uszeregowane w porządku odwrotnym względem siebie, oraz wartość oczekiwaną 0, gdy rangi są uszeregowane względem siebie losowo.

fi-Yulla - ϕ

Obie zmienne zdychotomizowane, najlepiej w punkcie mediany (lub dychotomiczne)

ϕ= +1 tylko wtedy, gdy rozkłady brzegowe obu zmiennych są zmienne, oraz gdy liczebność pól leżących na tej samej przekątnej jest zerowa

V-Cramera -

Tabela typu w x k

Min (w-1)(k-1) - mniejsza z dwóch liczb albo (w-1) albo (k-1)

Wartość maksymalna V jest niezależna od liczby wierszy i kolumn tabeli obliczeniowej

  1. POPULACJA A PRÓBA. SCHEMATY DOBORU DO PRÓBY (losowy, celowy, ochotniczy)

POPULACJA - jest to dowolny określony zespół przedmiotów, osób, zdarzeń, zmiennych stosowanych jako podstawa klasyfikacji bądź pomiarów, które się wyszczególnia

np. w postaci listy.

PARAMETR- to właściwość opisująca populację

To całościowy zbiór zjawisk, obiektów lub osób, które zostały poddane badaniu statystycznemu przez wydzielone spośród nich próby.

PRÓBA - jest to dowolny podzespół pobrany z populacji.

To określona liczba elementów zbiorowości, podlegająca badaniu, na podstawie którego wnioskuje się o cechach całej zbiorowości.

ESTYMATOR- jest właściwością próby pobranej losowo z populacji.

SCHEMATY DOBORU DO PRÓBY:

DOBÓR PRÓBY to zabieg badawczy polegający na wyodrębnieniu pewnej części zbiorowości w celu oszacowania jakiejś zmiennej lub relacji między zmiennymi, charakteryzującej jednostki wchodzące w skład danej zbiorowości.

Dobór próby stosuje się w sytuacjach, gdy przebadanie całej zbiorowości jest ze względu na jej liczebność zbyt kosztowne i czasochłonne.

Wyróżnia się trzy rodzaje doboru próby:

w taki sposób, by każdej jednostce losowania przyporządkować określone

prawdopodobieństwo dostania się do konstruowanej próby. Najczęściej stosowane

rodzaje losowego doboru próby to:

  1. prosty dobór losowy - gdy każda jednostka losowania lub zespół jednostek ma jednakowe szanse na wylosowanie

  2. losowanie systematyczne - dobór z listy obejmującej wszystkie elementy danej zbiorowości co n-tej (np. co pięćdziesiątej) jednostki losowania

  3. dobór warstwowy - podział danej zbiorowości na jednolite warstwy, a następnie losowanie z nich

  4. dobór grupowy - podział danej zbiorowości na szereg grup, a następnie wylosowanie pewnej ich liczby do dokładnych badań obejmujących na ogół wszystkie elementy danej grupy.

SCHEMATY LOSOWEGO DOBORU DO PRÓBY

  1. losowanie nieograniczone indywidualne - polega na tym, iż próbę pobieramy

z całej, nie podzielonej na części populacji. Jednostką losowania jest element

populacji (np. osoba). Każdy element ma takie samo prawdopodobieństwo

znalezienia się w próbie. Losowanie przeprowadzamy w sposób bezzwrotny.

  1. losowanie systematyczne indywidualne - pierwszy krok to ustalenie tzw. odstępu losowania. Drugą czynnością jest wybór losowy liczby naturalnej No odpowiadającej następującemu kryterium: 1<No<k. Liczba No jednoznacznie określa pobraną próbę.

  2. losowanie warstwowe - polega na podzieleniu całej populacji na warstwy

i losowaniu w sposób niezależny z każdej warstwy określonej liczby elementów

  1. losowanie grupowe - cechą charakterystyczną tego schematu jest to, że jednostkami losowania nie są poszczególne elementy populacji, ale ich skupiska, czyli tzw. grupy.

  2. losowanie wielostopniowe - jest to schemat losowania dwustopniowego.

W pierwszym etapie losowania dobieramy na podstawie odpowiedniego operatu losowania próbę złożoną z k grup ( etap losowania grupowego). W drugim etapie sporządzamy dla każdej z k grup odrębny operat losowania i losujemy z każdej grupy pewną liczbę elementów (etap losowania nieograniczonego indywidualnego). Sposób przeprowadzania losowania wielostopniowego:

ETAP 1 - warstwujemy populację

ETAP 2 - z każdej warstwy losujemy niezależnie wg oddzielnych operatów losowania pewną liczbę grup

ETAP 3 - z każdej grupy w ramach każdej warstwy oddzielnie losujemy niezależnie pewną liczbę elementów ( wg schematu nieograniczonego indywidualnego albo systematycznego)

PRAWO WIELKICH LICZB - Jeżeli kolejno pobieramy próby losowe z populacji o rozkładzie dowolnym μ i wariancji σ2 wtedy wraz ze wzrostem liczebności prob rozkłąd liczebności dązy do normalnego rozkładu.

CENTRALNE TWIERDZENIE GRANICZNE - mówi ono, że rozkład średnich z prób zbliża się coraz bardziej do postaci normalnej, w miarę jak rośnie liczebność kolejnych prób, mimo odchyleń od normalności rozkładów w populacji.

Teoretyczny rozkład z próby średnich pobranych z populacji normalnej jest rozkładem normalnym. Zatem, jeżeli wiemy, że rozkład w populacji jest normalny, wiemy też, że rozkład z próby średnich jest normalny. Niezależnie od kształtu rozkładu w populacji, rozkład z próby średnich pobranych z populacji o wariancji σ2 i średniej μ zbliża się do rozkładu normalnego ze średnią μ i wariancją σ2/N, w miarę jak wzrasta N.

  1. WNIOSKOWANIE STATYSTYCZNE

PODZIAŁ TESTÓW STATYSTYCZNYCH

Testy parametryczne

Testy nieparametryczne

Skala ilorazowa i interwałowa

  • Dla dużych prób test z

  • Dla małych prob test t

  • Test F- analizy wariancyjnej

Skala porządkowa i nominalna

skala porządkowa

  • Test Kołmogorowa zgodności rozkładu

z rozkładem normalnym

  • Test Kołmogorowa-Smirnowa

  • dla rang: test Manna-Whitneha

  • test znaków

  • dla rang: test Wilcoxona

  • dla rang: test Kruskala-Wallisa

  • dla rang -test Friedmana

skala nominalna

  • test χ2 zgodności rozkładu

z rozkładem teoretycznym

  • test χ2

  • test dokładnego prawdopodobieństwa

Fishera

  • test McNemara

  • test χ2

  • test Q Cochrana

12 i 13 ETAPY WNIOSKOWANIA STATYSTYCZNEGO

Testowanie hipotezy statystycznej polega na postępowaniu wg schematu (Blalock)

  1. Przewidziano wszystkie możliwe wyniki eksperymentu lub obserwacji zanim zastosowano test.

  2. Ustalono z góry czynności i sposoby postępowania użyte dla określenia, które spośród możliwych wyników faktycznie wystąpiły

  3. Eksperyment został przeprowadzony lub zaobserwowano zdarzenie, zanotowano wyniki i podjęto decyzję - odrzucić, czy nie odrzucić hipotezy.

PODZIAŁ PROCESU WNIOSKOWANIA STATYSTYCZNEGO

ETAP 1: Sformułowanie hipotez: zerowej (Ho) i roboczej (H1)

ETAP 2:Określenie skali pomiarowej zmiennej zależnej Y

ETAP 3: Wybór testu statystycznego

ETAP 4: Określenie poziomu istotności α i wielkości próby N

ETAP 5: Określenie rozkładu z próby statystyki danego testu statystycznego przy założeniu słuszności Ho

ETAP 6: Określenie obszaru odrzuceń Ho

ETAP 7: Obliczenie wartości statystyki testu i podjęcie decyzji odnośnie do Ho

Hipotezę H określa się mianem hipotezy roboczej i oznacza jako H1. Natomiast hipotezę H' określa się mianem hipotezy zerowej i oznacza jako Ho. Obie hipotezy wzajemnie się wykluczają.

Hipotezy mogą być bądź jednostronne, kierunkowe, bądź dwustronne, dwukierunkowe, bez określonego kierunku.

Rodzaje hipotez

błąd I rodzaju - polegający na odrzuceniu Ho gdy w rzeczywistości jest ona prawdziwa

błąd II rodzaju - polegający na nie odrzuceniu Ho, gdy w rzeczywistości jest ona fałszywa

poziom istotności - (poziom α) jest prawdopodobieństwem uzyskania z testu statystycznego takiej wartości, która nakazuje badaczowi odrzucenie Ho na rzecz hipotezy roboczej, pomimo to, że w rzeczywistości hipoteza zerowa jest prawdziwa.

moc testu - definiuje się jako prawdopodobieństwo odrzucenia Ho, gdy w rzeczywistości jest ona fałszywa.

Moc= 1 - prawdopodobieństwo błędu II rodzaju = 1-β

statystyka testowa, rozkład statystyki testu jest to rozkład teoretyczny. Otrzymaliśmy go w przypadku wylosowania niezależnie wszystkich możliwych prób o wielkości N

z populacji. W każdej z wylosowanych prób statystyka testu, np. statystyka t test

t-Studenta przybiera określoną wartość.

Znajomość tego rozkładu pozwala ocenić prawdopodobieństwo wystąpienia wartości statystyki testu.

obszar odrzuceń hipotezy zerowej (obszar krytyczny) Jest to część powierzchni pod krzywą rozkładu statystyki danego testu przy założeniu słuszności Ho. Na obszar ten składa się część wartości statystyki testu. Prawdopodobieństwo wystąpienia jakiejkolwiek

wartości statystyki testu należącej do podzbioru wartości stanowiącego obszar odrzuceń Ho jest równe lub mniejsze niż α, gdy zachodzi Ho. Obszar krytyczny znajduję się na krańcach rozkładu.

Jeżeli hipoteza jest jednostronna, to i obszar odrzuceń jest jednostronny (lewostronny lub prawostronny) a jego wielkość wynosi α.

Gdy hipoteza jest dwustronna, obszar odrzuceń równy α jest podzielony na dwie równe części o wielkości α/2, znajdujące się na dwóch krańcach rozkładu.

decyzja statystyczna Jeżeli wartość testu ”wpadła” w obszar krytyczny, odrzucamy Ho, jeżeli nie „wpadła” w obszar odrzuceń , nie mamy podstaw do odrzucenia Ho.

Strategia podejmowania decyzji odnośnie Ho wg McNemar'a::

  1. odrzucić Ho, jeżeli α<0,01

  2. nie odrzucać Ho, jeżeli α>0,10

  3. wstrzymać się od wydania sądu, jeżeli 0,10>α>0

14. ROZKŁADY TEORETYCZNE JAKO ROZKŁADY ŚREDNIEJ

Z PRÓBY (rozkład normalny, rozkład t-Studenta,rozkład F-Fishera-Snedecora, rozkład chi-kwadrat)

ROZKŁAD NORMALNY -(właściwości)

  1. Krzywa jest symetryczna. Średnia, mediana i wartość modalna zbiegają się

w jednym punkcie.

  1. Najwyższa rzędna krzywej występuje w punkcie średniej, czyli gdy

z=0 i w jednostkowej krzywej normalnej równa jest 0,3989

  1. Krzywa jest asymptotyczna. Zbliża się ona do osi poziomej, lecz nigdy do niej nie dochodzi i rozciąga się od minus nieskończoności do plus nieskończoności.

  2. Punkty zagięcia krzywej znajdują się w miejscach plus lub minus jedną jednostkę odchylenia standardowego powyżej lub poniżej średniej. W tych miejscach krzywa zmienia się względem osi poziomej z wypukłej we wklęsłą.

  3. Mniej więcej 68% powierzchni pod krzywą mieści się w granicach plus lub minus jednej jednostki odchylenia standardowego od średniej

  4. W jednostkowej krzywej normalnej granice z= +1,96 obejmują 95%, a granice

z=+2,58 obejmują 99% całkowitej powierzchni pod krzywą, przy czym odpowiednio 5% i 1% powierzchni mieści się poza tymi granicami.

ROZKŁAD t- STUDENTA

Stosunek t zawiera nie jedną, lecz dwie wartości oszacowane , X i sx. Obie te wartości są różne przy wielokrotnym pobieraniu prób. W rezultacie sprawia to, że rozkład t nie jest normalny, aczkolwiek zbliża się do postaci normalnej wraz ze wzrostem N.

Rozkład t odbiega odbiega znacznie od postaci normalnej w przypadku małego N. Teoretyczny rozkład z próby t jest rozkładem symetrycznym ze średnią 0. Zbiega on do nieskończoności na obu krańcach. Krańce te są grubsze niż w rozkładzie normalnym. Rozkład t nie jest rozkładem pojedynczym, lecz rodziną rozkładów. Dla każdej liczby stopni swobody istnieje inna wartość t. Przy obliczaniu wariancji s2 liczba stopni swobody wynosi N-1. Wraz ze wzrostem liczby stopni swobody rozkład t zbliża się do postaci normalnej.

ROZKŁAD F (TEORETYCZNY ROZKŁAD Z PRÓBY STOSUNKÓW WARIANCJI)

Aby wyobrazić sobie taki rozkład z próby, rozważmy dwie normalne populacje A i B o tej samej wariancji σ2. Pobieramy próby o liczebności N1 z A i N2 z B, obliczamy nie obciążone estymatory s2 i s2, po czym obliczamy stosunek s2 / s2. Postępujemy tak, aż otrzymamy duża liczbę stosunków wariancji. Wariancję z próby A umieszczamy zawsze w liczniku, a wariancję z próby pobranej z B w mianowniku.

ROZKŁAD CH-KWADRAT (chi-kwadrat) - jest sumą stosunków [można sumować dowolną ich liczbę]. Każdy stosunek jest stosunkiem kwadratu rozbieżności lub różnicy do oczekiwanej liczebności. Rozbieżność występuje między liczebnością zaobserwowaną a liczebnością oczekiwaną na podstawie hipotezy, którą sprawdzamy.

W teście chi-kwadrat hipoteza zerowa oznacza, że nie ma korelacji między zmiennymi,

są one niezależne w badanej populacji.

15. MODELE TESTÓW STATYSTYCZNYCH

Ho : μ1 - μ2 = 0

o wariancję. Zagadnienie, czy należy łączyć kilka prób, aby uzyskać większą próbę, zależy czasami od odpowiedzi na to pytanie ( oraz na inne pytania, np. czy średnie są również jednorodne). Stosowanie testu jednorodności średnich opiera się także na założeniu, że wariancje są jednorodne. Założenie, że próby zostały pobrane

z populacji o jednakowej wariancji. [założenie o jednorodności (homogeniczności) wariancji]

Test jednorodności Bartletta Gdy wartości N są różne dla poszczególnych prób, poniższy wzór daje statystykę z próby dla testu Bartletta na jednorodność wariancji

Hipoteza badan aprzez ten test powiada, że próby pochodzą z populacji o tym samym rozkładzie ciągłym. Łączymy ze soba pomiary N1 i N2 , pomiary N1 +N2

porządkujemy następnie wg kolejności. Rangę 1 przypisujemy wartości najmniejszej, rangę 2 kolejnej wartości wyższej itd. Sumę rang R1, obliczamy dla mniejszej z dwóch prób, jeżeli próby są niejednakowych rozmiarów. Jeżeli próby są jednakowe, możemy psołużyć się którą kolwiek z rang.

W teście chi-kwadrat hipoteza zerowa oznacza, że nie ma korelacji między zmiennymi,

są one niezależne w badanej populacji.

1



Wyszukiwarka

Podobne podstrony:
prezentacja 1 Stat 2014
A dane,inf,wiedza,uj dyn stat proc inf w zarz 2008 9
stat 10 2
stat
inst pneumatyczna su-22 wnioski przemek, PWR [w9], W9, 5 semestr, aaaOrganizacja SEM5, Od sebka, Wyp
Mat Stat WykĹ ad 3 (2013L)(1)
2 stat zadania
1 stat wyklad
Matematyka zaawansowana, stat opisowa zadania
ASG EUPOS stat id 70476 Nieznany
(2462) stat mat 02, zootechnika, statystykka
MECHANIKA I STAT
Stat FiR TEORIA II (miary cd, sggw - finanse i rachunkowość, studia, II semestr, Statystyka ĆW
Stat a prawdopod
cw1 pro stat rozc
Rodowód, przedmiot?dań i podstawowe pojęcia statystyczne Uwagi na temat organizacji?dań stat
C WINDOWS TEMP plugtmp plugin stat gmin sp 112
05 analiza stat www przeklej pl Nieznany

więcej podobnych podstron