Wnioskowanie statystyczne w ekonomii.
Konsultacje:
-od
13 do 14 pokój 111
Estymacja parametrów populacji. Pojęcie estymatora i jego własności. Estymacja punktowa i przedziałowa. Ogólna postać przedziału ufności. Przedziały ufności dla wartości oczekiwanej, wariancji, odchylenia standardowego i wskaźnika struktury.
Weryfikacja hipotez statystycznych. Hipotezy parametryczne i nieparametryczne. Test statystyczny. Błąd I i II rodzaju. Statystyczne testy istotności. Procedura weryfikacyjna i zasady podejmowania decyzji weryfikacyjnych. Parametryczne testy istotności (testy dla wartości średniej, wskaźnika struktury, wariancji), Nieparametryczne testy istotności (test zgodności x2 , test zgodności - Kołmogorowa, test zgodności kołmogorowa – Smirnowa).
Zależność stochastyczna/ korelacyjna. Test niezależności x2. Współczynniki zbieżności oparte na statystyce x2. Współczynnik korelacji liniowej Pearsona i badanie jego istotności. Wskaźniki korelacyjne Pearsona i badania ich istotności. Testowanie linowości związku między zmiennymi (test F). Współczynniki korelacji kolejnościowej (rang) Spearmana, Kendalla i ich istotności.
Wnioskowanie statystyczne w zakresie regresji. Szacowanie parametrów modelu regresji z jedną zmienną objaśniającą oraz weryfikacja głównych założeń. Regresja wieloraka. Testowanie istotności regresji (-t – Studenta, F). Testy liniowości (serii, White’a, RESET). Testy jednorodności (F, White’a). Testy normalności rozkładu reszt (JB, Hellwiga).
Wnioskowanie w przyszłość – prognozowanie. Pojęcia: predykcja, predyktor, prognoza. Metody prognozowania, kryteria wyboru odpowiedniej metody. Prognozowanie na podstawie równych modeli szeregów czasowych (trendu, z trendem i sezonowością, autoregresyjnych) oraz modeli przyczynowo – opisowych. Prognozy punktowe i przedziałowe. Błędy prognoz ex ante i ex post. Dopuszczalność i trafność prognoz.
Literatura:
a)
podstawowa:
-Piłatowska M., Repetytorium ze statystyki, PWN,
Warszawa 2006
-Sobczyk M., Statystyka, wyd 4 zmienione, PWN
Warszawa 2004.
b) uzupełniająca:
-Frątczak, E., Kamińska
A., Kordosa A., (red), Statystyka. Zastosowania biznesowe i
społeczne, WSM, Warszawa 2014.
Efekty:
a)
wiedza:
-student zna metody i narzędzia z zakresu wnioskowania
statystycznego do badania zjawisk ekonomicznych
-zna zasady
przeprowadzania badań
b) umiejętności:
-student potrafi
stosować metody i narzędzia wnioskowania do badania zjawisk
ekonomicznych. Samodzielnie przeprowadza analizy i wyciąga wnioski
posługując się zasadami logiki.
-Sumiennie i dokładnie
wykonuje wyznaczone zadania. Postępuje etycznie.
Zasady
zaliczenia
Wykład – egzamin pisemny.
Ćwiczenia:
-ocena
bieżącej aktywności studenta podczas zajęć w laboratorium
oraz
-rozwiązanych przez niego samodzielnie (w domu)
zadań
-praca kontrolna/ kolokwium
Uwagi wprowadzające
Czym jest
statystyka?
Termin „statystyka” oznacza naukę
społeczną, która bada ilościową stronę zjawisk masowych oraz
formułuje prawidłowości rozwoju tych zjawisk.
Czy i do czego
jest nam potrzebna?
„Brniemy przez życie, podejmując
decyzje oparte na niepewnej informacji…”
„Wyjątkowość statystyki polega na tym, że pozwala ona skwantyfikować, a co za tym idzie sprecyzować poziom niepewności, dzięki temu statystyk może wygłaszać stwierdzenia, będąc pewnym poziomu swojej niepewności”.
Główne
obszary analiz statystycznych to:
-statystyka opisowa
(zbieranie, opisywanie i prezentowanie danych)
-rachunek
prawdopodobieństwa (wyrażanie praw rządzących zdarzeniami
losowymi)
-wnioskowanie statystyczne (wyciąganie wniosków z
dnych w oparciu o znajomość rachunku prawdopodobieństwa)
Wnioskowanie statystyczne należy do zakresu zainteresowań statystyki matematycznej. Narzędzia i metody statystyki matematycznej bazują na statystyce opisowej.
„Statystyka jest nauka o wnioskowaniu, nauką o uogólnianiu polegającym na przechodzeniu od części (losowo wybranej próby) do całości (populacji)” Aczel, 2000, s. 186.
Uwaga, nie cała statystyka zajmuje się wnioskowaniem o populacji. Ta dziedzina jest przedmiotem zainteresowania tzw. Statystyki matematycznej. Natomiast część statystyki zwana statystyką opisową, zajmuje się opisem zbiorów danych (wyników obserwacji), bez wchodzenia w to, z jakiej populacji pochodzą (por., jak wyżej).
Przedmiot i
zakres badań statystycznych
-Przedmiotem badań
statystycznych są to zbiorowości osób, rzeczy i zjawisk.
Określenie przedmiotu i zakresy badań statystycznych polega więc
na dokładnym ustaleniu zbiorowości, jednostki statystycznej oraz
cech statystycznych.
-badania statystyczne mogą być pełne
(przeprowadzane w ramach tzw. statystyki opisowej) i częściowe (
będące postawa tzw. Wnioskowania statystycznego).
Zastosowania:
-sprawozdawczość,
kontrola obiektów ekonomicznych,
-diagnozy i prognozy zjawisk
ekonomicznych
-statystyczna kontrola jakości produkcji
-
analizy rynków produktów/dóbr, pracy, rynków finansowych
Metody
i narzędzia z zakresy statystki stosują:
-urzędnicy
państwowi
-pracownicy administracji w przedsiębiorstwach,
firmach, instytucjach
-analitycy gospodarczy
Statystyka
opisowa a statystyka matematyczna – kilka uwag ogólnych –
EGZAMIN
-punktem wyjścia badania statystycznego jest
przeprowadzenia analiz przy wykorzystaniu narzędzi statystyki
opisowej lub odwołanie się do takich analiz
-narzędzia i
metoda statystyki matematycznej bazują na statystyce
opisowej
-podstawowe pojęcia statystyki oposowej to: zbiorowość
statystyczna, jednostka statystyczna, cecha statystyczna
-we
wnioskowaniu statystycznym odpowiednikami w. w. pojęć będą:
populacja generalna, jednostka statystyczna, zmienna losowa.
Dodatkowo pojawia się pojęcie próby statystycznej.
Statystyka opisowa a statystyka matematyczna – zestawienie zagadnień
Statystyka
opisowa obejmuje:
1) badanie struktury zjawisk masowych, w tym:
-badanie zbiorowości ze względu na jedną cechę, np.
określenie poziomu średniego, zróżnicowania, asymetrii rozkładu,
koncentracji
2) badanie zależności zjawisk masowych,
tj.:
-badanie zbiorowości ze względu na dwie cechy
jednocześnie, np.: staż pracy i wydajność, kwalifikacje i
zarobki, sprzedaż i wydatki na reklamę, wielkość produkcji i
liczba braków
3) badanie dynamiki zjawisk masowych,
Statystyka
matematyczna obejmuje następujące zagadnienia:
1) w zakresie
struktury zjawisk masowych – wnioskowanie statystyczne z podziałem
na:
-estymację ..
2) w zakresie zależności zjawisk
masowych wnioskowanie statystyczne dotyczące: korelacji i regresji
(wyznaczanie przedziałów ufności, weryfikacja hipotez – ocena
istotności związku, testowanie założeń modelu.
3) w
zakresu dynamiki zjawisk masowych:
-wnioskowanie statystyczne
określane mianem prognozowania.
Wnioskowanie statystyczne – wprowadzenie
Wnioskowaniem statystycznym nazywamy proces myślowy polegający na formułowaniu sądów dotyczących całej zbiorowości (populacji generalnej) na podstawie wyników z próby.
Wnioskowanie
statystyczne obejmuje:
-estymację (szacowanie) parametrów
populacji generalnej
-weryfikację hipotez statystycznych
Próba statystyczna jest to część zbiorowości tzn. pewna liczba jej elementów wybranych w określony sposób.
Próba może być losowa lub nielosowa (celowa). Próba powinna być reprezentatywna, tzn. jej struktura pod względem badanych cech powinna być zbliżona do struktury populacji generalnej, z której próba pochodzi.
Dobór
nielosowy:
-kwotowy
-typowy lub przez
eliminację
-przypadkowy
-na zasadzie „kuli śniegowej”
Dobór
losowy:
-losowy prosty
-warstwowy
-grupowy/
zespołowy (jednostopniowy, dwustopniowy)
-systematyczny
Próba jest
reprezentatywna, gdy:
1) elementy do próby są w sposób losowy
2) próba jest dostatecznie liczna
Nieprobalistyczne a probalistyczne sposoby doboru jednostek do próby – uwagi ogólne.
Klasyfikacja
technik wyboru próby:
-Neprobabilistyczne (Nonprobility
sampling techniques) – inaczej nielosowe (określenie prostsze,
bardziej popularne). Z drugiej strony, określenie to lepiej oddaje
istotę, polegającą na tym, że w analizie wyników uzyskanych na
podstawie prób tego rodzaju nie mają zastosowania metody rachunku
prawdopodobieństwa. Są to takie techniki wyboru próby, w których
nie stosuje się procedur losowania, dających jednakową szansę
wyboru każdej jednostce populacji, lecz inne procedury, oparte
przede wszystkim na subiektywnej ocenie badacza luba na wyborze „na
chybił trafił”.
-Probablistyczne (probabilisty sampling
techniques)- losowe, czyli przeciwnie do w. w. – opierają się na
mechanizmach losujących elementy do próby w taki sposób, aby każda
jednostka populacji miała jednakową szansę dostania się do próby.
Uwaga: Nie należy mylić losowania z wyborem „na chybił trafił”.
Losowości zaprzecza tutaj np. arbitralne ustalenie czasu i miejsca
wyboru poszczególnych jednostek.
Najczęstsze
powody stosowania nieprobabilistycznych technik wyboru próby:
-brak
wiarygodnego operatu losowania (i równocześnie niemożność
sporządzenia takiego operatu, ze względu na specyfikę populacji,
np. zbiorowość klientów supermarketu.
-ograniczenia budżetowe
bądź czasowe przeprowadzenia danego badania
-bogata wiedza a
priori na temat populacji (jej struktury)
Przypomnijmy, próba powinna być reprezentacyjna dla populacji, w tym sensie, że jej struktura odzwierciedla strukturę populacji. Dlatego dysponując wiedzą na temat tej struktury możemy lepiej (bardziej) spróbować zaingerować w strukturę próby, niż zdać się na los (mechanizm losowania).
Nielosowe
techniki wyboru próby:
-przypadkowy (wybór według wygody)
– jednostki do próby dostają się przypadkowo (nie
losowo).
-celowy
-kwotowy
-metoda kuli śnieżnej
Wybór przypadkowy (wybór według wygody)- jednostki do próby dostają się przypadkowo (nie losowo). Stosowany często do badania opinii konsumentów (na ulicy, w sklepach, ankiety radiowe i telewizyjne, w gazetach, ankiety internetowe. Stosowany raczej do badań wstępnych, pilotażowych.
Wybór celowy (niektórzy autorzy ogół sposobów nielosowych określają tym mianem) – badacz na podstawie swojej wiedzy o populacji sam wskazuje jednostki które zostają włączone do próby. Przykłady doboru celowego: prawybory w wybranym okręgu wyborczym, wybór kilku ekspertów w danej dziedzinie, wybór rynków dla przetestowania nowego produktu lub nowej usługi. Uwaga, przy zastosowaniu wyboru celowego, potrzebna jest pewna wiedza a priori o populacji, podczas gdy przy wyborze przypadkowym żadna wiedza tego typu nie jest potrzebna.
Wybór kwotowy – preferowany w porównaniu z innymi sposobami. Prowadzi do uzyskania założonej z góry struktury próby ze względu na wyróżnienie charakterystyki (zmienne) strukturę „narzuca się” próbie, i do próby wybiera się kwoty jednostek reprezentujących poszczególne subpopulacje w proporcjach takich, jaki jest udział tych subpopulacji w całej populacji. Uwaga, przy tej technice doboru elementów do próby chodzi o zapewnienie określonej struktury ze względu na ustalone cechy, ale sam sposób wyboru jednostek może odbyć się w sposób celowy albo przypadkowy.
Zalety wybory
kwotowego:
-niewielki koszt uzyskania reprezentatywnej (ze
względu na wyróżnione cechy kontrolne) próby
-wykorzystanie
informacji spoza próby o cechach populacji
Wady
(ograniczenie) wybory kwotowego”
-brak możliwości
uwzględnienia wszystkich istotnych dla celu badania cech
-możliwość
błędów wyboru jednostek do próby, gdy decyzja w zakresie tego
wyboru ma charakter subiektywny
-brak możliwości oszacowania
błędu próbkowania (błędu statystycznego)
Metoda kuli śnieżnej – polega na tym, że początkowo badaniu zostaje poddana mała liczebnie grupa respondentów. Następnie każdy członek tej grupy określa (poleca) inne jednostki należące do populacji. Uważa się, że uzyskane w ten sposób próby są słabo reprezentatywne.
Rekomendowana w
sytuacjach:
-gdy brak jest dobrego operatu (w odniesieniu do
populacji, dla których nie prowadzi się rejestrów urzędowych (np.
mniejszości narodowe)
-w badaniach opinii konsumenckiej w
odniesieniu do specyficznych, wąskich zbiorowości, np. graczy w
szachy, tenisa itd., oraz badanach opinii jakiś wąskich, słabo
rozpoznanych populacji, na tematy społeczne.
Probablistyczne
techniki wyboru próby
Warunki jakie muszą być spełnione przy
losowym doborze jednostek/ zespołów do próby:
-każda
jednostka populacji ma dodatnie i znane prawdopodobieństwo dostania
się do próby
-dla każdego zespołu jednostek populacji można
ustalić prawdopodobieństwo, że w całości znajdzie się on w
próbie
-przed losowaniem nie jest wiadomo, która jednostka
(zespół) populacji znajdzie się w próbie.
Metody
losowania jednostek do próby:
-losowanie niezależne i
zależne: w losowaniu niezależnym jednostka wylosowana za każdym
razem wraca do populacji, a zatem nie zmieniają się warunki
losowania kolejnych jednostek
-losowanie indywidualne i
zbiorowe (zespołowe): jednostka losowania jest jednocześnie
jednostka badana. Losuje się tutaj pojedyncze elementy z populacji
generalnej. Zespołowe - tworzy się zespoły jednostek a następnie
losuje się zespoły według ustalonej reguły.
-losowanie
jedno i wieloetapowe: w losowaniu jednoetapowym losuje się
bezpośrednio jednostki badania.
W losowaniu wieloetapowy
najpierw całą populację dzieli się na N grup zwanych jednostkami
losowania pierwszego stopnia. Każda grupa (jednostka pierwszego
stopnia) dzielona jest na K grup, tzw. Jednostek losowania drugiego
stopnia. Te z kolei dzielone są na L grup zawierających jednostki
losowania trzeciego stopnia itd. Losowanie polega na tym, że
najpierw losujemy n jednostek stopnia I, dalej z każdej jednostki
stopnia I losuje się k jednostek stopnia II a z każdej wylosowanej
jednostki stopnia II losuje się I jednostek stopnia III.
-losowanie
ograniczone i nieograniczone: Losowanie ograniczone i nieograniczone
odbywa się z poszczególnych części populacji oddzielnie,
natomiast nieograniczone – z całej populacji.
Schematy
losowania:
- losowanie proste ( indywidualne, nieograniczone,
niezależne)
- losowanie systematyczne (indywidualne,
ograniczone, zależne)
-losowanie warstwowe (ograniczone,
indywidualne, niezależne)
-losowanie zespołowe (ograniczone,
zbiorowe/ indywidualne, zależne)
Losowanie proste
indywidualne
Własności próby losowej prostej:
-nieobciążoność
– każdy element zostaje wybrany z jednakowym prawdopodobieństwem
-niezależność – wybranie jednego elementu nie ma wpływu
na wybór innych.
W badaniach marketingowych i badaniach opinii losowanie wg tego schematu nie zawsze jest uzasadnione, szczególnie w sytuacji, gdy wewnętrzne zróżnicowanie populacji jest duże. Ponadto, wskazuje się na powody ekonomiczne (finansowe) małej popularności tego schematu losowania jako samodzielnej głównej techniki doboru jednostek do próby. Częściej wykorzystuje się ją do losowania na określonym (zwykle ostatnim) etapie losowania zespołowego lub warstwowego.
Wspomniane powody to: wysoki koszt zakupu lub opracowaniu operatu losowania oraz wysoki koszt pomiaru (obserwacji statystycznej, ankietowanej) wylosowanych jednostek, głównie z racji znacznego rozproszenia w terminie.
Losowanie
systematyczne:
polega ono na wybraniu co któregoś elementu,
począwszy od pewnego elementu, który wybiera się na początku, po
pewnym uporządkowaniu jednostek populacji. Określenie
„systematyczne” odnosi się do opisu sposobu poruszania się w
operacie populacji. Efektywność tego schematu losowania zależy od
sposobu (kryterium) uporządkowania jednostek w operacie losowania.
Etapy w losowaniu
systematycznym:
1. Ustalenie tzw. Interwału losowania:
ԏ=N/n
gdzie: N –
liczebność populacji, n- liczebność próby
2. Losowy wybór
jednostki populacji z pierwszego interwału losowania (1, ԏ) –
zwykle w drodze losowania prostego indywidualnego. Jednostkę tę
oznacza się przez k.
3. Wskazanie
pozostałych jednostek, które zostają włączone do próby.
k
+ ԏ, k+2ԏ, k+ 3ԏ, …, k + (n-1)r.
Założenia m rozłącznych warstw o Ni elementach w każdej warstwie (i=1, 2,…, m; ). Definiujemy wagę Wi= . Pobieramy ni elementów z i – tej warstwy tak, że ni+n2+..+nm=n. Funkcja próby w i – tej warstwie wynosi fi= .
Losując elementy z każdej warstwy zapewnia się odpowiednią ich (tych warstwa) reprezentacje w próbie. Powstaje pytanie, ile elementów z każdej warstwy należy pobrać, aby zapewnić sobie wystarczającą wielkość próby.
Losowanie warstwowe – jest to dwustopniowa procedura, według której najpierw populację dzieli się na subpopulacje, zwane warstwami, a następnie z poszczególnych warstw losuje się w sposób propablistyczny elementy do próby. Warstwowanie populacji należy wykonać w taki sposób, aby otrzymane warstwy były rozłączne, a warstwowanie wyczerpujące.
Losując elementy z każdej warstwy zapewnia się odpowiednią ich (tych warstw) reprezentacje w próbie. Powstaje pytanie, ile elementów z każdej warstwy należy pobrać, aby zapewnić sobie wystarczającą wielkość próby.
Może to
być:
-alokacja proporcjonalna – w próbie każda warstwa ma
reprezentacje proporcjonalną do swego udziału w
populacji;
-alokacja równomierna – oznacza losowanie z każdej
warstwy tej samej liczby elementów do próby, niezależnie od
wielkości warstw.
-alokacja Neymana – określona odpowiednim
wzorem na liczebność w próbie z każdej warstwy, które zapewniają
najmniejszą wariancję, czyli najmniejszy błąd
wnioskowania;
-alokacja optymalna – bierze pod uwagę
zróżnicowany koszt badania elementów w poszczególnych warstwach.
Schemat losowania warstwowego z alokacją proporcjonalną (warstwowe losowanie proporcjonalne) – dla każdej warstwy zachodzi równość: (tzn. frakcja warstwy w próbie jest równa frakcji tej warstwy w całej populacji).
Alokacja
optymalna
Rozmiary próby z każdej w warstw dobieramy tak, aby
spełnione było jedno z dwóch kryteriów.
-minimalizacja
kosztu przeprowadzenia badań ankietowych dla danej wartości
wariancji estymatora;
-minimalizacja wariancji estymatora dla
danej wartości kosztu przeprowadzenia badań….
Gdzie C – całkowity koszt badań, C0 – koszt stały związany z zorganizowaniem badań , Ci – koszt zmienny przypadający na element i – tej warstwy.
(*)
Z równania (*) wynika, że dla danej warstwy powinniśmy pobrać z niej większą próbę, jeśli warstwa ta jest bardziej zróżnicowana wewnętrznie, jeśli względny rozmiar tej warstwy jest większy lub jeśli dobór elementów próby z tej warstwy jest tańszy.
Losowanie
zespołowe:
polega na tym, że populacja jest dzielona na pewną
liczbę grup. Np. w sytuacji, gdy populacja jest bardzo duża i
rozmieszczona na dużym obszarze. Wówczas wybiera się losowe grupy
(zespoły) i każda jednostka wchodząca w skład zespołu zostaje
zaklasyfikowana do próby (losowanie jednostopniowe), lub z każdemu
wybranego zespołu losuje się niezależne poszczególne jednostki i
te włącza do próby (losowanie dwustopniowe). Stosowane dla bardzo
dużych populacji przy dużych kosztach uzyskania aparatu losowania,
uwzględniającego wszystkie ostateczne jednostki badania.
Losowanie zespołowe jest tym efektywniejsze, im wewnętrzne zróżnicowanie jednostek w zespołach jest większe a zróżnicowanie między zespołami mniejsze.
Losowanie
zespołowe a losowanie warstwowe
W losowaniu warstwowym
poszczególne elementy losowane są z każdej warstwy. W rezultacie
wszystkie części populacji są reprezentowane w próbie. W
losowaniu zespołowym wybiera się elementy tylko z niektórych
zespołów. Celem losowania warstwowego jest zmniejszenie ogólnej
wariancji. Z kolei losowanie zespołowe ma na celu ułatwienie i
redukcję kosztów przeprowadzenia doboru próby.
Szczegółowe
techniki losowania:
-na chybił trafił
-wykorzystanie
tablic liczb losowych
-wykorzystanie komputera (generatory
liczb losowych)
Reszta z prezentacji która wysłała.
Zad 1
Zaproponować plan doboru próby potrzebnej do przeprowadzenia konkretnego (ustalonego przez siebie) badania empirycznego.
Zad 2 (dla zaawansowanych)
Zapoznać się z publikacją pt,: „Znaczenie próbkowania w badaniach statystycznych”, M. Szreder, (w:) Ekonometria dla praktyki, red M. Piłatowska, PTE, Toruń, 2012.
Uwaga w kwestii literatury patrz także: Szreder M, Metody i techniki sondażowych badań opinii, PWE, Warszawa 2004 (2010).
Błędy losowe próby – pojawiają się niejako w sposób naturalny i są praktycznie nie do uniknięcia. Można je jedynie zredukować poprzez odpowiednia wielkość próby i technikę losowania.
Błędy nielosowe badania (tzw. Błędy treści) – polegają na wygenerowaniu w wyniku przeprowadzonego badania informacji nieprawdziwej (błędy pomiaru, błędy wynikające z zastosowania nieodpowiednich metod, błędy w interpretacji i prezentacji uzyskanych wyników oraz błędy wnioskowania)
Błędy wyboru – są rezultatem przyjętego schematu doboru jednostek do próby
Błędy braku reakcji- np. brak odpowiedzi respondentów
Estymacja parametrów populacji generalnej
Istota:
Estymacja
polega na szukaniu najlepszych ocen nieznanych parametrów
opisujących rozkład zmiennej w zbiorowości hipotetycznej
(populacji generalnej), przy czym ocena ta dokonywana jest na
podstawie danych z próby………………….
Parametry populacji generalnej – liczbowe charakterystyki całej populacji
Statystyka z próby – liczbowa charakterystyka próby
Uwaga,
Parametry
populacji szacuje się korzystając ze statystyk z próby. Statystyka
z próby wykorzystywana do oszacowania parametru produkcji, nazywa
się estymatorem tego parametru.
Oznaczenia:
Q-
parametry populacji generalnej
Tn- estymator
t
– wartość estymatora (ocena parametru)
Określenie,
Estymator
jest to funkcja matematyczna w oparciu o którą można wyznaczyć
ocenę (szacunek, wartość) interesującego nas parametru. Inaczej
estymator, to funkcja wyników obserwacji dokonywanych na zmiennej
losowej X, na podstawie której wnioskujemy o wartości parametru Q w
populacji generalnej.
Zatem,
Estymatorem parametru populacji jest statystyka z próby
używana do oszacowania tego parametru. Ocena lub szacunkiem
parametru jest konkretna wartość liczbowa estymatora z danej próby.
Jeżeli jako ocenę (szacunek) podejmujemy jedna wartość liczbową,
nazywamy ją oceną punktową (szacunkiem punktowym) parametru
populacji, jeśli zaś wyznaczamy przedział, który z określonym
prawdopodobieństwem pokryje prawdziwą wartość parametru, to
uzyskamy ocenę przedziałową (metoda przedziałowa).
Można zapisać:
Tn= (x1
Estymatory jako wielości uzyskiwane z próby losowej są zmiennymi losowymi.
Uzasadnienie:
-
mamy n elementowe próby, tzn. Liczące: n= n1=n2=…=nk
jednostek
-wartości jednostek w tych próbach mogą być różne
dla różnych prób
-dlatego dla poszczególnych prób można
uzyskać różne T: T1,..
Wniosek: można mówić o
rozkładzie estymatora, a jeśli tak, to istnieje wartość
oczekiwana tego rozkładu, jak również jego warincja (ozn.
Odpowiednio przez: E(Tn), D2(Tn))
Symbolicznie można zapisać:
Tn-R[E(Tn)…
Typ rozkładu
estymatora zależy od:
-rodzaju rozkładu zmiennej losowej w
populacji generalnej
-liczebności próby
Istnieje wiele estymatorów tego samego parametru. Podstawą wyboru odpowiedniego estymatora dla danego parametru są jego (tego estymatora) własności.
Własności
estymatora
-nieobciążoność – wartość oczekiwana
estymatora powinna być równa wartości nieznanego populacji tj.:
E(Tn)= Q. Powiemy wówczas, że estymator stanowi
nieobciążoną ocenę parametru, krótko – estymator jest
nieobciążony. Własność nieobciążoności oznacza brak błędu
systematycznego przy estymacji. Można mówić także o tzw.
Asymptotycznej nieobciążoności. Wtedy limn->nieskończoność…..
Zgodność.
Własność te można zapisać następującą:
limn->nieskończonośćP
{Tn-Q|<E..
03.12.2019
Etapy weryfikacji hipotez statystycznych (procedura weryfikacyjna)
Formułujemy układ hipotez, składający się z hipotezy zerowej oraz hipotezy alternatywnej.
Wybieramy test oraz obliczamy jego wartość. Test statystyczny jest to konkretny wzór, do którego podstawia się wynik z próby.
.
Wyznaczamy obszar krytyczny (obszar odrzuceń hipotezy zerowej). Wyznaczanie obszaru krytycznego związane jest z określonym układem hipotez. Jeżeli:
Przy wyznaczeniu obszaru krytycznego bierze się pod uwagę typ rozkładu