Statystyka - wykład 2, farmacja, II sem, statystyka


Kurtoza

Wprowadzenie

Wyniki doświadczeń naukowych zbiera się zawsze i opracowuje z myślą udowodnieniem postawionej wcześniej hipotezy.

Statystyka - z łacińskiego STATUS ozn. stan rzeczy

Jako nauka posiada określony przedmiot badań oraz własne metody badania różnych zjawisk.

Schemat postępowania

1. Określenie problemu badawczego

2. Sprecyzowanie hipotezy badawczej

3. Wybór właściwego testu statystycznego

4. Właściwy wybór próby badawczej

5. Zebranie danych

6. Zastosowanie właściwego testu statystycznego

7. Decyzja o wyniku doświadczenie

Sprecyzowanie hipotezy badawczej

Zbadano stężęnie fibrynogenu w osoczu krwi u pacjentów z chorobą wieńcvową oraz u ludzi zdrowych w tym samym przedziale wieku.

Czy chorobie wieńcowej towarzyszy podwyższone stężenie fibrynogenu w osoczu krwi?

Właściwy wybór/dobór próby badanej

Zebranie danych

Zastosowanie właściwego testu statystycznego

O wyborze testu czy metody statystycznej analiz danych decyduje wiele czynników i często niewłaściwe przeprowadzenie doświadczenia - wg. niewłaściwego schematu badania różnic czy zależności - może dyskwalifikować wnioski badania naukowego.

Algorytmy wyboru właściwego testy/metody analizy statystycznej

Ocena statystyczna nie może być dokonana dla danych zebranych w sposób arbitralny i przypadkowy, ponieważ każdy test statystyczny ma swoje wymagania, i ich niespełnienie dyskwalifikuje często wiarygodność tego testu.

Rozkłady danych (ciągłe)

Zjawisko losowe- zjawisko, które może zajść lub nie (np. rzut monetą - nie wiemy czy wypadnie orzeł czy reszka).

Wyniku losowania nie da się z góry dokładnie przewidzieć. Rezultaty losowania będziemy nazywać zmiennymi losowymi.

Prawdopodobieństwo zdarzenia A - jest to stosunek liczby przypadków sprzyjających zajściu tego zdarzenia do ogólnej liczby przypadków (sprzyjających i nie sprzyjających) przy założeniu, że wszystkie przypadki są jednakowo możliwe (klasyczna definicja Laplace'a).

0<= P(A) <= 1

Zmienna losowe przyjmują swoje wartości z określonym prawdopodobieństwami.

Funkcja przyporządkowująca określonym wartościom zmiennej losowej odpowiednie prawdopodobieństwo nosi nazwę rozkładu zmiennej losowej.

Rozkład normalny Gaussa - Laplace'a

Teoretycznie rozkłady zmiennych losowych ciągłych charakteryzuje się za pomocą tzw. funkcji gęstości prawdopodobieństwa

Parametrami rozkładu są średnia arytmetyczna i

Rozkład normalny

Lewe i prawe ramię wykresu zbliżają się asymptotycznie do osi odciętych, co jest spowodowane tym, że zmienna losowa o rozkładzie normalnym przyjmuje wartości od minus nieskończoności do plus nieskończoności

Średnia przesuwa "w lewo" lub "w prawo" krzywą normalną.

Parametr odchylenia standardowego powoduje, że krzywa jest bardziej płaska lub bardziej wysmuklona.

Rozkład normalny ze średnią 0 oraz odchyleniem standardowym 1 nazywamy standardowym rozkładem normalnym i oznaczamy przez N(0,1).

Reguła 3 sigm

Reguła 3 sigm odchylenia standardowego otrzymanie wartości dowolnej zmiennej losowej poza przedziałem jest mało prawdopodobne (P = 0,27%).

Rozkład T-Studenta

Rozkład Fishera - Sindecora (nie obowiązuje NAS, HA,HA)

Rozkład CHI 2

Weryfikacja normalności rozkładu

Test Shapiro - Willka - jest on najbardziej zalecanym testem normalności rozkładu. Jednak wskazane jest, aby liczebność próby była poniżej 2000, gdyż w przeciwnym wypadku daje mylne wyniki. Test ten wymaga, aby cecha miała rozkład ciągły.

Test Kołmogorowa-Smirowa (K-S) - wymaga znajomości średniej i odchylenia standardowego dla populacji. W sytuacji gdy nie znamy wyżej wymienionych parametrów stosujemy test K-S z poprawką Lileforsa. Test K-S wymaga, aby cecha była ciągła.

Jeżeli jest p > 0,01 można stosować te 2 testy !

Histogram

Box - Plot

RYSUNEK WYKRESU BOX - PLOT

Elementy odstające

Jeżeli dane posiadają rozkład normalny, to IQR - 1,35 odchylenie standardowe, gdzie odchylenie jest odchyleniem standardowym populacji.

Wykres Kwantyl - Kwantyl

dwóch zmiennych losowych X i Y



Wyszukiwarka