Rozkład normalny
Podstawowym teoretycznym rozkładem zmiennych losowych ciągłych XC jest rozkład normalny, zwany rozkładem Gaussa - Laplace'a. Jego znaczenie metodologiczne i analityczne wynika z trzech jego najważniejszych właściwości:
Przy nieograniczonym wzroście liczby niezależnych doświadczeń statystycznych, wszystkie znane teoretyczne rozkłady zmiennych losowych ciągłych i skokowych są szybko zbieżne do rozkładu normalnego. Stanowi on zatem najbardziej ogólne odniesienie do rozumienia sensu działania prawa wielkich liczb,
W statystycznym wnioskowaniu o parametrach i rozkładach w populacjach generalnych na podstawie wyników badań prób losowych popełniane są błędy przypadkowe, kórych rozkład jest normalny lub granicznie normalny. Zawiera się w tym merytoryczny sens statystycznej indukcji, czyli wnioskowania. Na podstawie tej prawidłowości, skonstruowane zostały wszystkie metody estymacji parametrów oraz metody weryfikacji hipotez,
W niektórych sytuacjach badawczych ale w badaniach zjawisk ekonomicznych raczej rzadko, rozkłady empiryczne obserwowanych zmiennych mogą być zbliżone swoim kształtem do rozkładu normalnego. Wtedy też prawidłowości statystyczne ujawniają się w swojej najczystszej postaci, ale może mieć to miejsce tylko wtedy, kiedy badane zjawisko podlega wpływowi bardzo wielu czynników, działających mniej więcej równomierni, przyczyn głównych, a także i w tym zjawisk losowych, Dlatego właśnie stwierdzono, że badane zjawiska ekonomiczna, a także społeczne i demograficzne mają na ogół rozkłady empiryczne znacząco odkształcone od rozkładu normalnego.
O zmiennej losowej ciągłej powiemy, że posiada rozkład normalny, jeżeli funkcja gęstości f(x) tego rozkładu ma postać:
dla wszystkich możliwych realizacji x, gdzie:
m - wartość oczekiwana z rozkładu,
- wariancja,
- odchylenie standardowe
Sa to trzy parametry rozkładu normalnego, przy czym fakt posiadania przez zmienną losową ciągłą rozkładu normalnego (N) zapisujemy:
co oznacza, że kształt tego rozkładu jest całkowicie określony przez te parametry, tzn.: wartość oczekiwaną m oraz odchylenie standardowe.
Oprócz parametrów determinujących kształt rozkładu normalneo, wyró�żniamy dodatkowa dwa dalsze parametry, a mianowicie współczynnik zmienności:
oraz współczynnik asymetrii A = 0. Wynika stąd, że rozkład normalne są zmienne ze względu na położenie wartości oczekiwanej i rozmaty zróżnicowania, ale jednocześnie identyczne ze względu na brak asymetrii. Rozkłady te są zatem zawsze symetryczne.
Dystrybuanta rozkładu normalnego jest funkcją niemalejącą postaci :
przy czym wiadomo, że;
okres dolny ciągu dystybuant:
połowa pod krzywą normalną:
kres górny ciągu dystybuant:
Funkcja gęstości rozkładu normalnego ma pewne ogólne własności, do których przede wszystkim należy zaliczyć:
symetryczność, czyli spełnienie równania: P(Xm)=1/2,
własność określoności - jak to zostało wcześniej napisane rozkład jest określony przez dwa parametry,
własność jdnego maksimum, czyli: x = m, f(x) = max,
własność dwóch punktów przeięcia,
włsność zbieżności.
Istotną dla rozkładu normalnego jest tzw.: reguła trzech sigm, znana z prawa wielkich liczb. Reguła ta określa biorąc za podstawę odchylenie standardowe z danego rozkładu, czy odpowiednio duża ilość przypadków tego rozkładu znajduje się kolejno w przedziałach: +-1 odchylenie standardowe, +-2 odchylenia standardowe, +-3 odchylenia standardowe. Przypadki w większej liczbie, odstające za trzeci z podanych przedziałów mogą świadczyć o braku normalności rozkładu i uważane są za nietypowe dla danej zbiorowości statystycznej.
Standaryzacja rozkładu normalnego
Aby mówić o rozkładzie normalnym standaryzowanym, należy w pierwszym rzędzie zająć się zagadnieniem standaryzacji zmiennej losowej. Proces ten jest nieskomplikowany, polega on bowiem na odnalezieniu standaryzowanej zmiennej U, co jest niczym innym, jak obliczeniem jej odchylenia standardowego i kolejnym ilorazom, różnicy każdej z osobna realizacji zmiennej X i jej średniej arytmetycznej, co zapisać można w postaci: U = (X - m)/Odchylenie standardoweX. Standaryzowany rozkład normalny SN jest określany w całości przez dwa parametry, a mianowicie; wartość oczekiwaną E(U) = 0 oraz przez wariancję i odchylenie standardowe równe: D2(U) = D(U) = 1.
W rezultacie procesu standaryzacji zmiennej losowej ,b>XC otrzymujemy transformację rozkładu normalnego z danymi parametrami na standaryzowany rozkład normalny z parametrami określonymi liczbowo, czyli N(0,1), dla którego funkcja gęstości F(u)u przybiera następującą postać:
dla wszystkich możliwych realizacji zmiennej standaryzowanej U.
Szczególnie ważne znaczenie ma w praktyce dystrybuanta zmiennej standaryzowanej U, definiowana podobnie, jak dystrybuanta rozkładu normalnego, czyli:
z tym, jednak iż:
Poziomy dystrybuant można odczytywać z tablic statystycznych posługując się zależnością następującą; dla u większego od 0
Patrz: A. Luszniewicz, T. Słaby; Statystyka z pakietem komputerowym StatisticaPl., C. H. Beck, Warszawa 2001, s. 120.
Rozkład logarytmiczno - normalny
Rozkład normalny może być transformowany na często spotykaną w analizach statystycznych postać rozkładu logarytmiczno - normalnego (LN). Jżeli logarytm zmiennej losowej ciągłej ma rozkład normalny, to można powiedzieć, że ta zmienna losowa ma rozkład logonormalny opisany funkcją:
gdzie ln jest logarytmem naturalnym, przy czym zakładane jest, że x oraz parametry mlnx(wartość oczekiwana) i odchylenie standardowe są większe od zera, co zapisuje się następująco:
XC dąży do LN(mlnx,odchylenie standardowelnx). Wyznaczenie parametrów rozkładu logarytmiczno - normalnego, czyli: wartości oczekiwanej, wariancji, odchylenia standardowego dla tego rozkładu jest bardzo skomplikowanie numerycznie i w praktyce nie da się tego zrobić bez użycia komputera i oprogramowania, które do tego służy: