Miara zróżnicowania rozkładu to taka miara rozkładu

Miara zróżnicowania rozkładu to taka miara rozkładu, która opisuje relację pomiędzy rozkładami różniącymi się zróżnicowaniem (rozproszeniem) wartości cechy wokół wartości centralnych.

  1. odchylenie standardowe - odchylenie standardowe mówi, jak szeroko wartości jakiejś wielkości są rozrzucone wokół jej średniej. Im mniejsza wartość odchylenia tym obserwacje są bardziej skupione wokół średniej. Im większa wartość odchylenia standardowego tym bardziej obserwowane wielkości oddalone są od średniej. Jej wartość jest zawsze liczbą nieujemną.

  2. wariancja - klasyczna miara zmienności. Jest średnią arytmetyczną kwadratów odchyleń (różnic) poszczególnych wartości cechy od wartości oczekiwanej. Wariancja informuje o tym, jak duże jest zróżnicowanie wyników w danym zbiorze wyników (zmiennej). Inaczej mówiąc, czy wyniki są bardziej skoncentrowane wokół średniej, czy są małe różnice pomiędzy średnią a poszczególnymi wynikami czy może rozproszenie wyników jest duże, duża jest różnica poszczególnych wyników od średniej.

  3. współczynnik zmienności - informuje nas o zmienności wyników, obserwacji w odniesieniu do "wielkości średniej". Daje nam informacje o rozproszeniu wyników, ale w odniesieniu do tego, jak duża jest średnia (mediana). To pozwala nam na określenie względnej miary rozproszenia i ułatwia nam porównanie zmienności danych cech wśród tej samej grupy osób bądź dwóch grup badanych osób pod względem tej samej cechy. Współczynnik zmienności wyrażany jest w procentach, czyli uzyskane wyniki z wzorów należy przemnożyć przez 100%

  4. rozstęp - różnica między wartością maksymalną a minimalną z naszego zbioru obserwacji. Pokazuje zatem jedynie jaki jest zakres naszych obserwacji nie informuje w żaden sposób co dzieje się "w środku" tego zakresu np. jaka wartość występowała najczęściej, czy jaka jest średnia dla tego zbioru obserwacji.

  5. rozstęp ćwiartkowy - różnica pomiędzy trzecim i pierwszym kwartylem. Ponieważ pomiędzy tymi kwartylami znajduje się z definicji 50% wszystkich obserwacji, dlatego im większa szerokość rozstępu ćwiartkowego, tym większe zróżnicowanie cechy.

Miary pozycyjne:
a) Kwantyle - definiuje się jako wartości cechy badanej zbiorowości, przedstawionej w postaci szeregu statystycznego, które dzielą zbiorowość na określone części pod względem liczby jednostek, części te pozostają do siebie w określonych proporcjach.

b) Kwartyl pierwszy Q1 dzieli zbiorowość na dwie części w ten sposób, że 25% jednostek zbiorowości ma wartości cechy niższe bądź równe kwartylowi pierwszemu Q1, a 75% równe bądź wyższe od tego kwartyla.
c) Kwartyl drugi (mediana Me) dzieli zbiorowość na dwie równe części; połowa jednostek ma wartości cechy mniejsze lub równe medianie, a połowa wartości cechy równe lub większe od Me; stąd nazwa wartość środkowa.
d) Kwartyl trzeci Q3 dzieli zbiorowość na dwie części w ten sposób, że 75% jednostek zbiorowości ma wartości cechy niższe bądź równe kwartylowi pierwszemu Q3, a 25% równe bądź wyższe od tego kwartyla.
e) Decyle np. decyl pierwszy oznacza, że 10% jednostek ma wartości cechy mniejsze bądź równe od decyla pierwszego, a 90% jednostek wartości cechy równe lub większe od decyla pierwszego.

Miary asymetrii - dostarcza informacji na temat symetrii rozkładu lub jej braku. Miary asymetrii charakteryzują rodzaj i stopień odstępstwa od symetrii rozkładu badanej cechy. Zaliczamy do nich:
a) współczynnik asymetrii - iloraz trzeciego momentu centralnego przez trzecią potęgę odchylenia standardowego. Podobnie jak trzeci moment centralny, współczynnik asymetrii przyjmuje wartość zero dla rozkładu symetrycznego.
b) współczynnik skośności - współczynnik skośności powyżej 0 świadczy o prawostronnej asymetrii rozkładu (inaczej nazywanym rozkładem dodatnioskośnym), a wyniki poniżej 0 świadczą o lewostronnej asymetrii rozkładu (inaczej nazwanym ujemnoskośnym rozkładem).
c) trzeci moment centralny - suma trzecich potęg odchyleń wartości cechy statystycznej od wartości średniej arytmetycznej, podzielona przez n, gdzie n – liczba obserwacji. Trzeci moment centralny przyjmuje wartość zero dla rozkładu symetrycznego, wartości ujemne dla rozkładów o lewostronnej asymetrii (wydłużone lewe ramię rozkładu) i wartości dodatnie dla rozkładów o prawostronnej asymetrii (wydłużone prawe ramię rozkładu).

Współczynnik korelacji - mówi nam o sile związku. Jest ona określana jako wartość w przedziale od -1 do 1. Im współczynnik jest "dalej" od 0 (zarówno na plus jak i na minus) tym siła związku jest większa. Jeżeli współczynnik korelacji jest dodatni to można powiedzieć, że gdy wzrastają wartości jednej zmiennej to wzrastają wartości drugiej zmiennej (i na odwrót, maleją jednej zmiennej - maleją również drugiej). O doskonałej współzależności między cechami mówimy wówczas, gdy r przyjmuje wartość „-1” (korelacja doskonała ujemna) lub „1” (korelacja doskonała dodatnia).
a) współczynnik korelacji liniowej Pearsona - współczynnik określający poziom zależności liniowej między zmiennymi losowymi. Współczynnik ten (rxy) jest miernikiem siły związku prostoliniowego między dwoma cechami mierzalnymi.

Kowariancja - to miara natężenia współzmienności dwóch cech. Znak kowariancji informuje o charakterze współzmienności – dodatni oznacza zgodne kierunki zmian, ujemny – kierunki zmian przeciwne.

Współczynnik determinacji - informuje o tym, jaka część zmienności zmiennej objaśnianej została wyjaśniona przez model. Jest on więc miarą stopnia, w jakim model wyjaśnia kształtowanie się zmiennej objaśnianej. Można również powiedzieć, że współczynnik determinacji opisuje tę część zmienności objaśnianej, która wynika z jej zależności od uwzględnionych w modelu zmiennych objaśniających. Współczynnik determinacji przyjmuje wartości z przedziału [0;1]. Jego wartości najczęściej są wyrażane w procentach. Dopasowanie modelu jest tym lepsze, im wartość R2 jest bliższa jedności

Współczynnik zbieżności - Współczynnik zbieżności określa, jaka część zmienności zmiennej objaśnianej nie została wyjaśniona przez model. Można również powiedzieć, że współczynnik zbieżności opisuje tę część zmienności zmiennej objaśnianej, która wynika z jej zależności od innych czynników niż uwzględnione w modelu. Współczynnik zbieżności przyjmuje wartości z przedziału [0;1]; wartości te najczęściej są wyrażane w procentach. Dopasowanie modelu jest tym lepsze, im wartość jest bliższa zeru.

Rozkład Gaussa - Rozkład normalny, inaczej zwany rozkładem Gaussa, krzywą Gaussa jest najważniejszym rozkładem teoretycznym prawdopodobieństwa w statystyce. Rozkład normalny jest też najbardziej intuicyjnym rozkładem statystycznym. W wielkim skrócie opisuje on sytuacje w świecie, gdzie większość przypadków jest bliska średniemu wynikowi, a im dany wynik bardziej odchyla się od średniej tym jest mniej reprezentowany. Najwięcej jest przypadków blisko przeciętnej. Im dalej oddalamy się od średniego wyniku, tym przypadków jest mniej. Można to z łatwością odnieść do rzeczywistych sytuacji. Model odgrywa ważną rolę w statystycznym opisie zagadnień przyrodniczych, przemysłowych, medycznych, socjalnych itp. Wykres funkcji prawdopodobieństwa tego rozkładu jest krzywą dzwonową.

Przyczyną jego znaczenia jest częstość występowania w naturze. Jeśli jakaś wielkość jest sumą lub średnią bardzo wielu drobnych losowych czynników, to niezależnie od rozkładu każdego z tych czynników, jej rozkład będzie zbliżony do normalnego[2], stąd można go bardzo często zaobserwować w danych[3]. Ponadto rozkład normalny ma interesujące właściwości matematyczne, dzięki którym oparte na nim metody statystyczne są proste obliczeniowo[4].


Wyszukiwarka

Podobne podstrony:
Immunologia - Wyklady, Immunologia, Antygen - to taka substancja która wprowadzona do organizmu wy
Osoba znacząca dla dziecka to taka, dziecko
Struktura liniowa to taka w której sprężenia funkcjonalne pokrywają się ze sprężeniami funkcyjnymix
Rodzina zastępcza to taka rodzina
Miara tendencji?ntralnej rozkładu
Miara tendencji centralnej rozkładu, Statystyka
przeszlosc to dzis 2013 rozklad mat kl ii 2
Rozkład materiał to dopiero1, Różności, Dla nauczycieli
przeszlosc to dzis 2012 rozklad mat kl i cz 2
Naprężenia ok, Naprężenie to miara gęstości powierzchniowej sił wewnętrznych występujących w ośrodku
13 Rozkład materiału to dokument tworzony przez nauczyciela na podstawie
Wielobok liczebności to jedna z graficznych form prezentacji rozkładu cechy statystycznej
Rozklady alarmowe
02b Rozkład normalnyid 4039 ppt
WM1 08 Rozkład naprężeń
Nie kochać w taką noc to grzech, TEKSTY POLSKICH PIOSENEK, Teksty piosenek

więcej podobnych podstron