Statystyka biomedyczna 5.10.2011
Charakterystyki położenia – inaczej wartości średnie. (Miary tendencji centralnej)
Średnie klasyczne - średnia arytmetyczna, średnia geometryczna, średnia harmoniczna, średnia kwadratowa, średnia potęgowa rzędu p ( wszystkie występują, jako ważone również).
W skrypcie występują średnie arytmetyczne, geometryczne.
Przeciętne pozycyjne –
Mediana – wartość środkowa, gdy wartości są uporządkowane, szereg nie parzysty.
Modalna – (moda, dominanta)
Percentyle – centyle – wyróżniamy kwartyle (3) – Q1, Q2, Q3 – dzielą uporządkowany szereg statystyczny prosty na 4 równoliczne części. 25% wartości mniejszych od I kwartyla. Kwartyl I to 25 percentyl. Kwartyl II jest 50 percentylem, kwartyl II jest 75 percentylem.
Dane liczbowe, przedstawiają czas trwania ciąży w dniach. 70 kobiet. To jest próba duża. Liczebność próby jest większa niż 30. Im liczniejsza próba tym lepiej.
, n – liczebnosc próby
251 | 264 | 234 | 283 | 226 | 244 | 269 | 241 | 276 | 274 |
---|---|---|---|---|---|---|---|---|---|
263 | 243 | 254 | 276 | 241 | 232 | 260 | 248 | 285 | 253 |
265 | 235 | 259 | 279 | 256 | 256 | 254 | 256 | 250 | 269 |
240 | 261 | 263 | 262 | 259 | 230 | 268 | 284 | 259 | 261 |
268 | 268 | 264 | 271 | 263 | 259 | 294 | 259 | 263 | 278 |
267 | 293 | 247 | 244 | 250 | 266 | 286 | 263 | 274 | 253 |
281 | 286 | 266 | 249 | 255 | 233 | 245 | 266 | 265 | 264 |
Macierz danych
X – czas trwania ciąży (w dniach) – jest to zmienna numeryczna, ilościowa. Jest to zmienna typu ciągłego.
Mediana = 261,5 $m_{e} = \ \frac{\text{\ x}_{\frac{n}{2\ }\ }}{2} + \ \ \ $
260 – średnia
X, x, xi i =1,2,3…
X35 = 261 dni
X36 = 262 dni
Mediana – nazywamy taką wartość badanej cechy statystycznej, która oznacza, ze wartości mniejszych pd mediany lub równych medianie jest tyle samo, co wartości większych lub równych mediany.
Pozycja medialna – 1 + n/2 = 35,5
Wartość najmniejsza wynosi 226 dni ( jedna pacjentka Cali)
Wartość największa wynosi 294 dni (jedna pacjentka)
Jest to przedział domknięty. Przedział zmienności jest dość szeroki.
R= miara rozproszenia, jest to max- min.
R= 68 (ponad 2 miesiące)
Zaletą rozstępu jest to, ze daje się łatwo wyznaczyć.
Wady :
- można go stosować w przypadku tylko dwóch wartości,
- zniekształcany przez wartości odskakujące,
- ma tendencje do wzrostu, gdy rośnie wielkość próby,
∑ = suma
Szereg statystyczny jednocechowy.
Zalety średniej arytmetycznej
Można ją stosować w przypadku wszystkich wartości
Zdefiniowana algebraicznie, łatwa w algorytmizacji
Znamy rozkład próbkowania ( rozdział 9 w książce)
Wady
Zniekształcana na przez wartości odskakujące
Zniekształcana w przypadku rozkładów skośnych (nie jest symetryczny )