2 Rozklad normalny 1 i wielo wymiarowy, mechanika, BIEM- POMOCE, metrologia


  1. Rozkład normalny Gaussa

Rozkład Gaussa to rozkład gęstości prawdopodobieństwa z 2 parametrami:

0x01 graphic
- wartość oczekiwana, średnia,

0x01 graphic
- wariancja.

Rozkład Gaussa (normalny) opisany jest funkcją gęstości prawdopodobieństwa:

0x01 graphic
.

Standardowy rozkład normalny, to taki, którego wartość średnia jest zerowa a wariancja równa 1:

0x01 graphic

0x01 graphic

Funkcja gęstości prawdopodobieństwa przyjmuje postać:

0x01 graphic
.

Centralne twierdzenie graniczne

Suma 0x01 graphic
niezależnych zmiennych losowych, takich że: o wartości średniej 0x01 graphic
i wariancji 0x01 graphic
, jest także zmienna losową o wartości średniej 0x01 graphic
i wariancji 0x01 graphic
.

  1. Wielowymiarowy rozkład normalny. Elipsy kowariancji

Dla ogólnego przypadku n-wymiarowych zmiennych losowych, x i 0x01 graphic
są wektorami o n elementach każdy. Łączna gęstość prawdopodobieństwa wyrażona jest wzorem:

0x01 graphic

Okazuje się, można to udowodnić, że macierz B jest równa odwrotności macierzy kowariancji C (zdefiniowanej w p. 1.4):

0x01 graphic
,

Przypomnijmy macierz C::

0x01 graphic

Rozważmy przypadek 2 zmiennych losowych:

0x01 graphic

Zgodnie z powyższym, macierz kowariancji C ma postać:

0x01 graphic
gdzie 0x01 graphic

a poszukiwana macierz odwrotna 0x01 graphic
, po odpowiednich przekształceniach, wynosi:

0x01 graphic
.

Gdy zmienne losowe są niezależne, i 0x01 graphic
, wtedy macierz B ma postać:

0x01 graphic
.

W przypadku 2 zmiennych losowych, rolę przedziału ufności przejmują elipsy kowariancji. Gdy zmiennych jest więcej, mówimy o elipsoidach kowariancji w przestrzeni wielowymiarowej. Pozostańmy przy elipsach kowariancji.

Aby wyznaczyć linie stałej gęstości prawdopodobieństwa, wykładnik exponenty funkcji gęstości prawdopodobieństwa 0x01 graphic

0x01 graphic

należy przyrównać do wartości stałej, np. do 1:

0x01 graphic

Obierzmy przykład 2 zmiennych 0x01 graphic
o wartościach średnich 0x01 graphic
i o wariancjach 0x01 graphic
, dla których macierz B wynosi:

0x01 graphic

Podstawmy powyższe wielkości do równania na elipsę kowariancji 0x01 graphic
:

0x01 graphic

Po wymnożeniu otrzymujemy równanie:

0x01 graphic

Jest to równanie elipsy na płaszczyźnie 0x01 graphic
, o osiach 0x01 graphic
i o środku w punkcie o współrzędnych 0x01 graphic
. Kąt nachylenia osi elipsy zależy od znaku i wartości współczynnika korelacji 0x01 graphic
(patrz Rys.3). Trzy przedstawione na Rys. 3 przypadki różnią się wartością i znakiem współczynnika korelacji 0x01 graphic
.

0x01 graphic

Rys.3. Elipsy kowariancji.

0x01 graphic

Rys. 4. Gęstość prawdopodobieństwa dla dwuwymiarowego rozkładu Gaussa i odpowiadająca mu elipsa kowariancji. Przypadki różnią się tylko wartością współczynnika korelacji 0x01 graphic
.

Na Rys.4 przedstawione są gęstości prawdopodobieństwa 0x01 graphic
dla dwuwymiarowego rozkładu Gaussa i odpowiadające im elipsy kowariancji dla współczynnika korelacji: ρ=-0.5, ρ=0.0, ρ=+0.90.

Poziome przekroje tych funkcji są elipsami wzajemnie koncentrycznymi. Dla maksymalnej wartości funkcji elipsa przechodzi w punkt o współrzędnych 0x01 graphic
: rzut wierzchołka na płaszczyznę 0x01 graphic
ma współrzędne 0x01 graphic
.

Pionowe przekroje przechodzące przez wierzchołek to krzywe Gaussa, których szerokości są wyznaczone przez punkty leżące na elipsie kowariancji i są różne dla różnych przekrojów.

Wszystkie inne linie stałego prawdopodobieństwa, gdy wykładnik jest przyrównany do innej stałej c≠1, to także elipsy. Leżą one wewnątrz (gdy c>1) lub na zewnątrz (gdy c<1) elipsy powstałej dla c=1.

Znaczenie elipsy kowariancji dodatkowo ilustruje Rys.5. Punkty leżące na elipsie są jednakowo prawdopodobne co jest określone przez prawdopodobieństwo 0x01 graphic
. Każdy z punktów leżących wewnątrz elipsy jest bardziej prawdopodobny od punktu leżącego na elipsie, a każdy punkt na elipsie jest bardziej prawdopodobny od punktu leżącego na zewnątrz elipsy. Jest tak niezależnie od tego jakie są geometryczne odległości tych punktów od środka elipsy. Ilustruje to Rys.5.

0x01 graphic

Rys.5 Względne prawdopodobieństwo dla kilku punktów dla 2-wymiarowego rozkładu normalnego. Punkty na elipsie: 0x01 graphic
, punkt wewnątrz elipsy: 0x01 graphic
, punkt na zewnątrz elipsy: 0x01 graphic

Gdyby x miało nie 2 wymiary lecz n wymiarów, wówczas analogiczne rozumowanie doprowadziłoby do równania:

0x01 graphic

Jest to równanie elipsoidy w przestrzeni n-wymiarowej, to tzw. hiperpowierzchnia. Interpretacja i właściwości są takie same jak w przypadku 2-wymiarowym.

  1. Pobieranie próby

Próbą nazywamy skończony zbiór doświadczeń dokonywanych w celu określenia rozkładu badanej zmiennej. Częściej zmierzamy do wyznaczenia parametrów znanego rozkładu, np. wartości średniej i wariancji dla rozkładu normalnego.

Zbiór wszystkich możliwych doświadczeń jest zazwyczaj nieskończony i nazywamy go populacją generalną. Próba n-wymiarowa, to taka, która zawiera n elementów.

Na przykład: W wybranej szkole badamy wzrost uczniów z klas pierwszych. Mamy 6 klas po 30 uczniów. Zatem zbiór wszystkich możliwych przypadków, populacja generalna, to 180 uczniów. W każdej klasie badamy 10 uczniów. Oznacza to, że pobrano próbę 60-wymiarową.

Załóżmy, że pobraliśmy p prób n-wymiarowych dla zmiennej x:

próba 1-sza

(ważymy uczniów z klasy nr 1)

0x01 graphic

(n=10 wyników pomiaru)

.............

.....................

próba i-ta

(ważymy uczniów z klasy nr i)

0x01 graphic

(n=10 wyników pomiaru)

.............

....................

próba p-ta

(ważymy uczniów z klasy nr p=6)

0x01 graphic

(n=10 wyników pomiaru)

Aby pobieranie próby było pobieraniem losowym, łączna gęstość prawdopodobieństwa badanej zmiennej losowej 0x01 graphic
musi spełniać następujące warunki formalne:

  1. poszczególne 0x01 graphic
    muszą być niezależne, tzn. 0x01 graphic
    ,

  2. poszczególne rozkłady muszą być jednakowe i identyczne z rozkładem 0x01 graphic
    dla populacji generalnej, tzn. 0x01 graphic
    =...=0x01 graphic
    =0x01 graphic

(w klasach są dzieci w równym wieku, żadna klasa nie skupia np. samych przerośniętych repetentów).

Należy podkreślić, że w rzeczywistym pobieraniu próby często dosyć trudno jest zapewnić pełną losowość procesu. O ile 1-szy warunek można zweryfikować porównując poszczególne rozkłady, o tyle warunek 2-gi, odnoszący się do populacji generalnej czasami jest niełatwy do sprawdzenia.

Aby móc posłużyć się wynikami z próby do wyznaczenia parametrów rozkładu, po prostu zakładamy, że próba została pobrana losowo. Nie mamy innej możliwości, należy jednak wiedzieć co to założenie oznacza.

Funkcja zmiennej losowej x, będąca sama zmienną losową, to statystyka. Ważnym przykładem takiej statystyki jest wartość średnia z próby: 0x01 graphic
. Kolejna n-wymiarowa próba tej zmiennej losowej dostarczy kolejną średnią. W tym sensie wartość średnia z próby jest zmienną losową: 0x01 graphic

Rozważmy obecnie typowy problem, będący przedmiotem zainteresowania analizy danych: załóżmy, że znamy analityczną postać funkcji, ale nie znamy jednego (lub więcej) parametrów tej funkcji. Parametr ten (parametry) chcemy wyznaczyć na podstawie próby. Mamy tu do czynienia z problemem estymacji parametrów. Estymowane parametry są wyznaczane z próby, są to więc statystyki zwane estymatami, estymatorami (nowa próba, to nowa wartość estymat). Oznaczmy jako0x01 graphic
pewien estymator (np. estymator parametru o prawdziwej wartości a wyznaczany jako średnia na podstawie n-wymiarowej próby 0x01 graphic
).

Estymator S nazywamy nieobciążonym, jeśli 0x01 graphic
dla każdego n.

Estymator S nazywamy zgodnym, jeśli 0x01 graphic
.

Estymator nieobciążony i zgodny to taki, którego średnia jest równa wartości rzeczywistej a wariancja jest równa zero.

  1. Wartość średnia z próby i wariancja z próby

Pamiętamy, że średnia arytmetyczna z próby (0x01 graphic
) to nie jest to samo co wartość oczekiwana (0x01 graphic
):

0x01 graphic
, zachodzi natomiast 0x01 graphic
.

Oznacza to, że wartość oczekiwana zmiennej losowej (jaką jest średnia z próby) jest równa wartości oczekiwanej tej zmiennej. Inaczej mówiąc: to średnia z wielu średnich staje się bliska wartości oczekiwanej. Nie dotyczy to jednej, dowolnej z takich średnich 0x01 graphic
.

Uporządkujemy wyrażenia dotyczące średnich, wariancji i dokładności.

Załóżmy, że zmienna losowa x jest mierzona n-krotnie. Czyli: pobieramy próbę o liczebności n z populacji generalnej o gęstości prawdopodobieństwa 0x01 graphic
odpowiadającej np. rozkładowi normalnemu. Jest to najczęściej spotykana sytuacja pomiarowa.

Dla populacji generalnej

Dla próby n-wymiarowej pobranej z populacji generalnej

Wartość średnia

0x01 graphic

Wartość średnia

0x01 graphic

Wariancja z populacji

0x01 graphic

Wariancja z próby

0x01 graphic

-

-

Wariancja wartości średniej

0x01 graphic

-

-

Błąd dowolnego elementu próby

0x01 graphic

-

-

Błąd wartości średniej

0x01 graphic

2001-02-09 19



Wyszukiwarka

Podobne podstrony:
pom wymiary wewnetrznych, mechanika, BIEM- POMOCE, metrologia
ćw 5-6, mechanika, BIEM- POMOCE, metrologia
metrologia ćw1, mechanika, BIEM- POMOCE, metrologia
rozkład sił na nakrętce, mechanika, BIEM- POMOCE
ćw4, mechanika, BIEM- POMOCE, metrologia
ćw.3, mechanika, BIEM- POMOCE, metrologia
ĆW1, mechanika, BIEM- POMOCE, metrologia
maszyny2, mechanika, BIEM- POMOCE, eksploatacja i niezawodność

więcej podobnych podstron