EstymPunktMiaryDlaPopProby1, Miary dla populacji i próby (estymacja punktowa)


Miary dla populacji i próby (estymacja punktowa)

Populacją generalną nazywamy skończoną lub nieskończoną zbiorowość, w stosunku do której mogą być sformułowane wnioski.

Próbą jest natomiast skończona część populacji podlegająca badaniu statystycznemu.

Sposób wyboru elementów z populacji: próba reprezentatywna - wnioski wyprowadzone na podstawie próby będą wiarygodne, losowanie - losowość, niezależność, liczebność - wielkość próby.

Próba losowa prosta to próba, w której każdy układ n elementów populacji ma to samo prawdopodobieństwo reprezentowania populacji oraz wybór jakiegokolwiek elementu z populacji do próby nie zmienia prawdopodobieństwa wyboru pozostałych elementów; losowanie niezależne - zwrotne (ze zwracaniem), zależne - bezzwrotne (bez zwracania).

Skala nominalna - do umieszczania osobników w różnych grupach systematycznych (małe, duże - wymaga określenia dokładnego progu - skala nominalna dychotomczna - dwa podzbiory), porządkowa - dokładniejsza, przyporządkowuje kolejność (rangi), interwałowa - przypisuje elementom wartość mierzoną w ściśle określonych jednostkach.

Statystyką nazywamy dowolną funkcję zmiennych losowych X1, X2, ..., Xn, stanowiących próbę i nie zawierającą nieznanych parametrów.

Miary charakterystyki statystyki położenia, rozproszenia i kształtu.

Miary położenia dla próby: średnia arytmetyczna, ważona, geometryczna i harmoniczna (wzory napisane w kolejności nazw).

0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic

Parametry rozkładu zmiennych losowych (miary położenia i rozrzutu - rpozproszenia dla populacji)

Wybrana miara położenia

Wartość oczekiwana zmiennej losowej (wartość przeciętna, średnia, nadzieja matematyczna, moment zwykły pierwszego rzędu - środek ciężkości masy rozkładu prawdopodobieństwa).

0x01 graphic
dla zmiennej losowej dyskretnej

E(X)

0x01 graphic
dla zmiennej losowej ciągłej

Miary rozproszenia

1. Wariancja zmiennej losowej (moment centralny drugiego rzędu) - wartość oczekiwana kwadratu odchylenia zmiennej losowej X od jej wartości oczekiwanej.

0x01 graphic
dla zmiennej losowej dyskretnej

D2(X)

0x01 graphic
dla zmiennej losowej ciągłej

2. Odchylenie standardowe

0x01 graphic

3. Współczynnik zmienności (charakteryzuje rozrzut - rozproszenie, podobnie jak wariancja i odchylenie standardowe)

0x01 graphic

Statystyki (miary położenia i rozrzutu - rozproszenia dla próby)

Miary położenia

Średnia w próbie (średnia arytmetyczna obserwacji)

0x01 graphic

Mediana (Me) jest wartością środkową w przypadku nieparzystej liczby obserwacji lub średnią dwóch wartości środkowych w przypadku parzystej liczby obserwacji. Obserwacje muszą być uporządkowane od najmniejszej do największej - szereg pozycyjny.

Moda (dominanta)

xi - dla którego pi = P(X=xi) osiąga maksimum dla zmiennej losowej dyskretnej

x0 - dla którego funkcja f(x) osiąga maksimum dla zmiennej ciągłej

Kwartyl dolny (Q1) to mediana tych obserwacji, które nie są większe od mediany w całej próbie.

Kwartyl górny (Q3) to mediana tych obserwacji, które nie są mniejsze od mediany w całej próbie.

Średnia ucięta to średnia arytmetyczna obserwacji w próbie po usunięciu z niej obserwacji największych i najmniejszych w określonej proporcji (zazwyczaj 5%).

Rozstęp (R) w próbie, to różnica między obserwacją największą i najmniejszą

Miary rozproszenia

Wariancja z próby (średnie odchylenie kwadratowe) z próby to statystyka określona wzorem:

0x01 graphic
lub 0x01 graphic

Odchylenie standardowe z próby, to pierwiastek kwadratowy ze średniego odchylenia kwadratowego

0x01 graphic

Współczynnik zmienności 0x01 graphic

Przy obliczaniu momentów z szeregu rozdzielczego dla cechy ciągłej zwykle zakłada się, że wszystkie wartości z próby należące do pewnego przedziału klasowego leżą w środkowym punkcie tego przedziału.

0x01 graphic
, dla cechy dyskretnej (li - liczebność klasy, xi - wart. zmiennej los w klasie)

0x01 graphic
, dla cechy ciągłej (0x01 graphic
- wart. zmiennej los dla środka i-tego przedziału kl.)

W związku z tym obliczone wartości momentów szeregu rozdzielczego są tylko pewnym przybliżeniem momentów wyznaczonych z próby. Przybliżenie jest zależne od długości przedziałów klasowych i jest lepsze, gdy te długości przedziałów są mniejsze. w celu poprawienia obliczonych wartości momentów stosujemy poprawki Shepparda (odejmujemy od wartości momentu).

0x01 graphic
poprawka Shepparda dla momentu centralnego drugiego stopnia

Podsumowanie

Średnia arytmetyczna wyliczona z próby jest odpowiednikiem wartości oczekiwanej (w populacji). W języku matematycznym trzeba by napisać: Średnia arytmetyczna wyliczona z próby jest estymatorem wartości oczekiwanej (w populacji).

Średnie odchylenie kwadratowe (wariancja z próby) jest estymatorem wariancji (w populacji)

Zadania

Zad. 1. (n nieparzyste) Badając nieśność kur Leghorn w fermie, w ciągu miesiąca uzyskano następujące obserwacje.

26, 25, 24, 28, 22, 26, 24, 25, 25, 27, 23, 24, 28, 21, 22, 25, 23, 22, 24, 26, 22.

Wyznaczyć średnią, medianę, modę, kwartyle, rozstęp, średnie odchylenie kwadratowe, odchylenie standardowe, współczynnik zmienności.

Zad. 2. (n parzyste) Badając nieśność kur Leghorn w fermie, w ciągu miesiąca uzyskano następujące obserwacje.

26, 25, 24, 28, 22, 26, 24, 25, 25, 27, 23, 24, 28, 21, 22, 25, 23, 22, 24, 26, 22.

Wyznaczyć średnią, medianę, modę, kwartyle, rozstęp, średnie odchylenie kwadratowe, odchylenie standardowe, współczynnik zmienności.

Zad. 3.

Próba dotycząca obserwacji poziomu hemoglobiny dla 15 kaczek rasy pekin zawiera następujące pomiary (g/100ml krwi):

11,6 11,3 13,8 14,2 13,0 14,2 12,6 13,8 12,4 13,6 12,0 13,0

12,2 12,6 12,8.

Wyznaczyć miary położenia i rozproszenia.

Zad. 4.

Rzucamy dwa razy symetryczną kostką. Zmienna losowa X każdej parze (k, l) wyrzuconych oczek przyporządkowuje sumę k + l. Wyznacz zbiór wartości zmiennej losowej X i określ rozkład (wartości xi oraz odpowiadające im pi. Wyznacz parametry (miary) rozkładu.

Zad. 5.

Oblicz miary położenia i rozproszenia dla zmiennej losowej X mając podany, w postaci tabeli, jej rozkład:

a)

xi

-10

-4

4

5

8

pi

0,10

0,25

0,25

0,30

0,10

b)

xi

1

2

3

5

6

7

pi

0,1

0,1

0,2

?

0,1

0,1

Przed przystąpieniem do obliczeń uzupełnij brakującą wartość prawdopodobieństwa dla zmiennej losowej x4=5

c)

xi

-5

2

6

5

6

pi

0,15

0,20

0,25

0,30

0,10



Wyszukiwarka