Biostatystyka - zagadnienia licencjackie, Biostatystyka - zagadnienia licencjackie


  1. Nieparametryczne testy istotności, testy rozkładów:

NIEPARAMETRYCZNE TESTY ISTOTNOŚCI:

Ogólne informacje odnośnie testów nieparametrycznych:

BADANIE RÓŻNIC MIĘDZY PRÓBAMI NIEZALEŻNYMI:

Zastosowanie:

Przygotowanie do przeprowadzenia testu:

Punktem wyjścia w teście Manna i Whitney'a jest nadanie wynikom obserwacji rang.

Rangowanie przeprowadzamy następująco:

1. Porządkowanie rosnąco wartości obu prób.

2. Zaczynając od wartości najmniejszej (lub największej), przyporządkowuje się poszczególnym obserwacjom kolejne liczby naturalne.

3. W przypadku wystąpienia wartości jednakowych przyporządkowywanie im tzw. rangi wiązane (średnia arytmetyczna z rang, jakie powinno im się przypisać).

Procedura:

  1. Formułowanie hipotezy zerowej H0 oraz alternatywnej H1

H0: nie ma różnic pomiędzy medianami

H1: jest istotna różnica pomiędzy medianami

  1. Poziom istotności α=0,05 lub α=0,01

  2. Sprawdzenie założeń modelu:
    rozważana zmienna jest mierzalna lub w skali porządkowej (rangowej)

  3. Z dwóch prób tworzy się jedną próbę uporządkowaną i ranguje obserwacje.

  4. Wyliczenie wartości sprawdzianu
    U1 = n1*n2 + ½ * n1 (n1 + 1) - R1 R1 - suma rang określonych dla pierwszej próby
    U2 = n1*n2 + ½ * n2 (n2 + 1) - R2
    Bierzemy mniejszą z otrzymanych wartości (oznaczoną jako Ud) i porównuje się ją z wartością krytyczną odczytaną z tablic.

  5. Decyzja o odrzuceniu lub przyjęciu hipotezy zerowej:
    p<α - odrzucamy H0 i przyjmujemy H1
    p>α - nie ma podstaw do odrzucenia H0
    Ud < Uk - odrzucamy H0 i przyjmujemy H1

  6. Interpretacja wyników.

BADANIE RÓŻNIC MIĘDZY PRÓBAMI ZALEŻNYMI:

Zastosowanie:

Procedura:

  1. Formułowanie hipotezy zerowej H0 oraz alternatywnej H1

H0: wyniki obu prób są jednakowe
badane próby pochodzą z tej samej populacji
nie ma istotnej różnicy między rozkładami danych w dwóch grupach

H1: wyniki obu prób są różne
badane próby pochodzą z różnych populacji
jest istotna różnica między rozkładami danych w dwóch grupach

  1. Poziom istotności α=0,05 lub α=0,01

  2. Sprawdzenie założeń modelu:
    zmienna mierzalna lub typu porządkowego

  3. Obliczenie wartości statystyki testu na podstawie danych z badanej próby:

  1. obliczenie różnicy między wartości uzyskaną w pierwszym badaniu i wartością uzyskaną w drugim badaniu

  2. uporządkowanie różnic w szereg rosnący i przypisanie im rang

  3. osobne sumowanie rang różnic dodatnich i rang różnic ujemnych

  4. mniejsza z otrzymanych sum to wartość testu Wilcoxona

  1. Decyzja o odrzuceniu lub przyjęciu hipotezy zerowej

  2. Interpretacja wyników.

BADANIE n PRÓB - NIEPARAMETRYCZNE ODPOWIEDNIKI ANALIZY WARIANCJI:

Zastosowanie:

Przygotowanie do przeprowadzenia testu:

Rangi nadane wynikom obserwacji są punktem wyjścia do wyliczenia wartości opisywanych testów.

Proces rangowania przebiega następująco:

  1. Porządkujemy rosnąco wartości obu prób.

  2. Zaczynając od wartości najmniejszej (lub największej), przyporządkowujemy poszczególnym obserwacjom kolejne liczby naturalne.

  3. W przypadku wystąpienia wartości jednakowych przyporządkowujemy im tzw. rangi wiązane (średnia arytmetyczna z rang, jakie powinno się im przypisać).

Procedura:

  1. Formułowanie hipotezy zerowej H0 oraz alternatywnej H1

H0: nie ma istotnej różnicy między medianami zmiennej w badanych populacjach
pomiary we wszystkich porównanych próbach pochodzą z tej samej populacji

H1: jest istotna różnica między medianami zmiennej w badanych populacjach
pomiary nie we wszystkich porównanych próbach pochodzą z tej samej populacji

  1. Poziom istotności α=0,05

  2. Sprawdzenie założeń modelu:
    zmienna mierzalna lub typu porządkowego

  3. Obliczenie wartości statystyki testu na podstawie danych z badanej próby:

  1. wyznaczenie rang dla każdej wartości w badanych grupach

  2. sumowanie rang w poszczególnych grupach

  3. jeżeli wszystkie próby pochodzą z tej samej populacji, to średnia z rang będzie we wszystkich grupach równa
    Test sumy rang Kruskala-Wallisa - rozkład χ2, df=k-1
    0x01 graphic
    n=n1+n2+nk Ti - suma rang w każdej próbie oddzielnie, k-ilość elementów w próbie

  1. Decyzja o odrzuceniu lub przyjęciu hipotezy zerowej
    p<α - odrzucamy H0 i przyjmujemy H1
    p>α - nie ma podstaw do odrzucenia H0

  2. Interpretacja wyników.

KORELACJE NIEPARAMETRYCZNE:

TESTY ROZKŁADÓW: - testy zgodności rozkładów, zagadnienie 9

  1. Zależność stochastyczna i funkcyjna pary cech, siła zależności, analiza regresji liniowej:

Przy analizie zjawisk i procesów stanowiących przedmiot badania zazwyczaj charakteryzujemy jednostki badane za pomocą więcej niż jednej cechy.

Bardzo często interesują nas powiązania jakie zachodzą pomiędzy analizowanymi cechami i w związku z tym zachodzi potrzeba ich łącznego badania

Celem analizy jest stwierdzenie, czy między badanymi zmiennymi zachodzą jakieś zależności, oraz jaka jest ich

Teoria współzależności zajmuje się badaniem związków między kilkoma zmiennymi.

Zmienna niezależna - objaśniająca - X - predyktor

Zmienna zależna - objaśniana - Y - zmienna, której kształtowanie się chcemy wyjaśnić lub przewidzieć

ZALEŻNOŚĆ STOCHASTYCZNA I FUNKCYJNA PARY CECH:

Współzależność między zmiennymi może być dwojakiego rodzaju:

0x01 graphic

0x01 graphic

Badanie związków korelacyjnych ma sens wtedy, gdy między zmiennymi istnieje zależność przyczynowo-skutkowa, którą da się logicznie wytłumaczyć. W innym wypadku mamy do czynienia z zależnością iluzoryczną (pozorną), np. liczba zajętych gniazd bocianich a liczba urodzeń na danym terenie, liczba zarejestrowanym odbiorników radiowych a liczba chorych umysłowo.

Dlatego związki między zjawiskami należy zawsze analizować dwukierunkowo: jakościowo i ilościowo. Na postawie analizy merytorycznej należy uzasadnić logiczne występowanie związku a następnie można przystąpić do określenia siły i kierunku zależności.

Związki korelacyjne badamy wtedy, gdy przynajmniej jedna zmienna jest mierzalna.

Ilościowa analiza współzależności obejmuje:

  1. Analizę korelacji - pomiar siły i kierunku zależności (stopnia zależności) między dwiema losowymi zmiennymi X, Y.

  2. Analizę regresji - badanie mechanizmu powiązań między cechami, którego wyrazem są funkcje regresji. Zmienne nie są losowe.
    Umożliwia odpowiedź na pytanie, jakiej zmiany średniej wartości zmiennej zależnej należy oczekiwać przy zmianie wartości zmiennej niezależnej o jednostkę (daje możliwość oszacowania (estymacji) wartości zmiennej zależnej na podstawie wartości przyjmowanych przez zmienną niezależną)

Obie te metody odpowiadają na różne, lecz wzajemnie uzupełniające się pytania. Analiza korelacji jest niezależna od analizy regresji, aczkolwiek jeśli chcemy przeprowadzić analizę regresji, to najpierw musimy wykonać analizę korelacji.

SIŁA ZALEŻNOŚCI: - zadadnienie 8 i 3

Korelacja między dwiema losowymi zmiennymi X i Y jest miarą siły (stopnia) liniowego związku między tymi zmiennymi.

Formy prezentacji materiału statystycznego:

W analizie współzależności zjawisk materiał statystyczny możemy ujmować w postaci:

xi: x1 x2 … xn

yi: y1 y2 … yn

Jeśli między dwiema zmiennymi jest związek o charakterze prostoliniowym , to na wykresie XY jest to smuga punktów zbliżona kształtem do linii prostej.

Analizę związku korelacyjnego zaczynamy od sporządzenia takiego wykresu XY.

W prostokątnym układzie współrzędnych na osi odciętych zaznaczamy wartości jednaj zmiennej, a na osi rzędnych - drugiej zmiennej. Punkty odpowiadające poszczególnym wartościom cech tworzą korelacyjny wykres rozrzutu. Rzadko się zdarza, że zaznaczone punkty leżą dokładnie na linii prostej. Częściej zaznaczone punkty na wykresie są rozrzucone, ale układają się mniej więcej wzdłuż linii prostej.

Interpretacja:

0x01 graphic
Silna korelacja 0x01 graphic
Brak korelacji

ANALIZA REGRESJI LINIOWEJ:

Analiza regresji to aparat matematyczny służący do badania wpływu zmiennych niezależnych na zmienne zależne.

Funkcja regresji to analityczny wyraz przyporządkowania średnich wartości zmiennej zależnej konkretnym wartościom zmiennych niezależnych. Wskazuje, jak zmieniają się średnie wartości zmiennej zależnej przy zmianie wartości zmiennej niezależnej.
Wyróżnia się:

E(XY=y) = f(y)

Warunkowa wartość oczekiwana zmiennej X względem zmiennej Y jest funkcją zmiennej Y.

Model regresji jest to postać formalnego opisu zależności między zmiennymi X i Y, którego narzędziem jest funkcja regresji. Model regresji można wykorzystać do przewidywania wartości które przyjmie zmienna Y przy ustalonych wartościach zmiennej niezależnej X.

Model regresji liniowej dla populacji opisujący prawdziwą zależność zmiennej Y od zmiennej X ma postać:

Y = β0 + β1X + ε

Y- zmienna zależna

X - zmienna niezależna

ε - błąd losowy, jedyne w modelu źródło losowości Y, reprezentuje losowe zakłócenia funkcyjnego powiązania między wartościami zmiennej zależnej a wartościami zmiennej niezależnej. Składnik ten wyraża wpływ wszystkich czynników, które obok X mogą wpływać na zmienną objaśnianą Y. Jest on związany z brakiem pełnego dopasowania analitycznej postaci funkcji regresji do rzeczywistego powiązania między analizowanymi zmiennymi. Składnik losowy pozwala obliczyć dokładność szacunku parametrów liniowej funkcji regresji.
Przyczyny występowania składnika losowego w równaniu regresji:

Parametry modelu:

Założenia, które musi spełniać przedstawiony model liniowy:

          1. związek między X i Y jest związkiem liniowym

          2. wartości zmiennej niezależnej są ustalone (nie są losowe). Losowość wartości Y pochodzi wyłącznie ze składnika (błędu) losowego.

          3. składniki (błędy) losowe mają rozkład normalny o średniej 0 i stałej wariancji σ2. Składniki (błędy) losowe związane z kolejnymi obserwacjami nie są ze sobą skorelowane (są od siebie niezależne)

Etapy wyznaczania modelu regresji:

Cel: Chcemy oszacować związek w populacji na podstawie informacji zawartych w próbie; znaleźć prostą regresji najlepiej pasującą do danych empirycznych Y = β0 + β1X

            1. Pobranie n-elementowej, losowej próby obserwacji obu zmiennych X i Y.

            2. Obliczenie wartości współczynnika korelacji (liniowej r) - sprawdzamy, czy występuje związek liniowy pomiędzy dwoma zmiennymi

            3. 0x08 graphic
              Ocenienie istotności współczynnika korelacji liniowej:
              Współczynnik korelacji r (z próby) stanowi ocenę współczynnika korelacji ρ w zbiorowości generalnej. W związku z tym pojawia się potrzeba testowania jego istotności statystycznej.
              H0: ρ = 0

H1: ρ ≠ 0

Obliczenie statystyki:

porównujemy jej wartość z odpowiednią wartością krytyczną t,n-2 i podejmujemy odpowiednią decyzję co do prawdziwości H0

            1. Sporządzenie wykresu rozrzutu - sprawdzamy, czy zachodzi zależność liniowa lub zbliżona do liniowej.
              Może się bowiem okazać, że wyliczona wartość współczynnika korelacji jest zbliżona do zera, a mimo to pomiędzy korelowanymi zmiennymi występuje współzależność, tyle że nieliniowa.

0x08 graphic
0x01 graphic

            1. Oszacowanie parametrów modelu β0, β1 - wykorzystanie metody najmniejszych kwadratów

            2. Wyznaczenie prostej o równaniu Y = b0 + b1X + e, która jest oszacowanym równaniem regresji, jest to tzw. estymata rzeczywistej prostej.

b0 - ocena (oszacowanie) β0
b1 - ocena (oszacowanie) β1
e - zaobserwowane błędy, czyli reszty z dopasowania linii prostej b0+b1X do zbioru n wyników obserwacji obu zmiennych. Zmienna resztowa zawiera w sobie efekty łącznego oddziaływania (bez X), nieuwzględnionych w modelu zmiennych niezależnych:

- efekty źle wybranej funkcji

- błędy pomiarowe

- efekty błędów czysto losowych.

Parametry prostej mają być tak dobrane, aby reszty miały rozkład normalny o średniej równej zeru i odchyleniu standardowym stałym i większym od zera.

Równaniem linii regresji jest równanie w postaci (bez uwzględnienia reszty):
^
Y = b0 + b1X
^
Y - reprezentuje wartość Y leżącą na dopasowanej linii regresji przy danym X.

0x01 graphic

            1. Interpretacja merytoryczna:

  1. b1>0 jeśli x wzrośnie o 1 jednostkę, to y wzrośnie średnio o b1 jednostek.

  2. b1<0 jeśli x wzrośnie o 1 jednostkę, to y spadnie średnio o b1 jednostek.

    1. Ocena jakości dopasowania:

      • Współczynnik determinacji (określoności) r2 - informuje, jaka część zmian wartości zmiennej zależnej została wyjaśniona przez oszacowaną funkcję regresji.
        Im jest on bliższy 1, tym lepsze jest dopasowanie modelu regresji do danych empirycznych.

      • Współczynnik indeterminacji φ2 - φ2=1-r2 - informuje, jaka część zmian wartości zmiennej zależnej nie została wyjaśniona zmianami zmiennych niezależnych przyjętych w funkcji regresji.
        Im jest on bliższy 0, tym oszacowana funkcja regresji jest lepiej dopasowana do wartości empirycznych zmiennej zależnej.

  3. Weryfikacja istotności modelu i jego parametrów - test F i t

  4. Estymacja przedziałów ufności dla parametrów:

Oszacowanie parametrów prostej regresji należy do analizy opisowej populacji próby. Za pomocą przedziałów ufności dla parametrów regresji, można dowiedzieć się, gdzie, z dowolnie dobranym prawdopodobieństwem, leży prawdziwa prosta regresji, ta z populacji generalnej.

0x01 graphic

Szerokość przedziału ufności podobnie jak wariancja rośnie wraz z odchyleniem od punktu środkowego prostej regresji.

Obszar zawarty między krzywymi ufności nazywamy realizacją obszaru ufności dla prostej regresji na poziomie ufności 1-α.

Cel:

Pozwala wyznaczyć najlepsze, nieobciążone estymatory parametrów regresji:

Technika szacowania:

MNK polega na takim dobraniu ocen parametrów prostej, by spełniony był warunek:

0x01 graphic

tzn. aby suma kwadratów odległości punktów pomiarowych od wyznaczonej prostej była najmniejsza. Jest to zagadnienie wyznaczania minimum funkcji dwóch zmiennych. Do wyznaczania tego minimum stosuje się rachunek różniczkowy, który pozwala na wyznaczenie wzorów na obliczenie estymatorów b0 i b1:

0x01 graphic

0x01 graphic

Współczynnikiem regresji jest parametr b1 po przekształceniach b1=r(Sy/Sx), gdzie:
r - współczynnik korelacji
Sy i Sx - odchylenia standardowe zmiennej Y i X

Jego wartość pozwala na stwierdzenie, o ile średnio zmieni się zmienna zależna Y, jeżeli zmienna niezależna X zmieni się o jednostkę (wzrośnie). Na podstawie samej wartości r nie mogliśmy tego dokonać.

→Przykład:
Współczynnik regresji równy: b1=0,522 oznacza, że np. zmiana zawartości tłuszczu w mleku o 1% będzie szła w parze ze zmianą zawartości białka o 0,522%.

1

0x01 graphic



Wyszukiwarka

Podobne podstrony:
ZAGADNIENIA word 97-2003, Studia licencjackie- UTH Ekonomia
licencjat zagadnienia
Budżet państwa i budżety samorządowe, Studia - Finanse i Rachunkowość, Licencjat, Licencjat!, opraco
Socjologia moralnosci-Ossowska streszczenie, Pedagogika, Studia stacjonarne I stopnia, Rok 3, Praca
Zestawienie bibliograficzne na temat młodzieży i ich aspiracji, Pedagogika, Studia stacjonarne I st
liberalizminterwencjonizmfolie, licencjat, rok 2 semestr 1, polityka gospodarcza, zagadnienia
Zagadnienia na zaliczenie, Studia UPH Siedlce, Administracja licencjat, Semestr I, Podstawy prawozna
odpowiedzi na pytania z filozofii, Studia, Oligofrenopedagogika - st. licencjackie, Filozofia-zagadn
Geografia zagadnienia licencjat 1
Zagadnienia 2013, Kulturoznawstwo UAM, licencjat
zagadnienia 2, Zag 54 - v2, ZAGADNIENIA DO EGZAMINU LICENCJACKIEGO
zagadnienia 2, Zag 54 - v2, ZAGADNIENIA DO EGZAMINU LICENCJACKIEGO
Analiza sprawozdania finansowego, Studia - Finanse i Rachunkowość, Licencjat, Licencjat!, opracowane
PR - zagadnienia sprawdzaj ce 2013, WSB, LICENCJAT, Public Relations PR
Wybrane zagadnienia z hematologii - dr Barbara Dziedzic - obieralny, Biotechnologia Medyczna, Pytani
Zagadnienia na egzamin licencjacki, studia stacjonarne

więcej podobnych podstron