linie regresji w przypadku dwumianowego r. normalnego??
Różnice między
a) błedem pierwszego rzędu a błedem drugiego rzędu
-Błąd I rodzaju polega na odrzuceniu hipotezy zerowej, która jest prawdziwa. (że na podstawie wyników testu statystycznego twierdzimy, że jakiś fakt jest statystycznie istotny, natomiast w rzeczywistości jest on dziełem przypadku)Prawd. popełnienia błędu I rodzaju oznaczamy α i nazywamy poziomem istotności testu. Najczęściej przyjmuje się wartości 0,05; 0,01 lub 0,001.
-Błąd II(błąd drugiego typu, błąd przyjęcia, beta-błąd )rodzaju polega na nie odrzuceniu hipotezy zerowej, która jest fałszywa. (że na podstawie wyników testu statystycznego twierdzimy, że jakiś fakt jest dziełem przypadku, natomiast w rzeczywistości jest on statystycznie istotny)Prawd. popełnienia błędu II rodzaju oznaczamy symbolem β, a jego dopełnienie do jedności nazywane jest mocą testu.
b) estymacją punktową a estymacją przedziałową
Estymacja punktowa polega na tym, że za ocenę parametru przyjmuje się konkretną liczbę otrzymaną na podstawie próby losowej.
Estymacja przedziałowa polega na tym, że konstruuje się pewien przedział (zwany przedziałem ufności), o którym możemy powiedzieć, iż z określonym prawdopodobieństwem 1- pokryje wartość szacowanego parametru. Prawdopodobieństwo 1- jest nazywane współczynnikiem ufności.
Zależności między
a)błędem pierwszego rzędu a poziomem istotności
Prawdopodobieństwo popełnienia błędu pierwszego rodzaju oznaczamy α i nazywamy poziomem istotności testu bądź mocą testu.
b) przedziałem ufności i poziomem ufności
im bliższy 1 jest współczynnik ufności, tym szerszy otrzymuje się przedział ufności.
Estymator to funkcja obserwacji z próby służąca do szacowania nieznanego parametru a. Jest to statystyka służąca do oszacowania nieznanej wartości parametru w populacji generalnej.
Statystyka - jest nauką traktującą o ilościowych metodach badania zjawisk (procesów) masowych.
Zjawisko masowe - dotyczy dużej liczby jednostek. Prawidłowości, które można ujawnić w drodze obserwacji zjawisk masowych nazywamy prawidłowościami statystycznymi.
Populacja - zbiorowość generalna, na którą składają się wszystkie jednostki, tworzące wyodrębnioną zbiorowość statystyczną, będącą przedmiotem badania statystycznego
Populacja skończona - zbiór elementów jest skończony, np. ludność Polski
Populacja nieskończona - zbiór elementów jest nieskończony, np. zbiór rzutów monetą
Rodzaje badań statystycznych - wyróżniamy trzy rodzaje badań statystycznych: a)pełne (całkowite, wyczerpujące) - obejmują wszystkie jednostki danej zbiorowości statystycznej. b)niepełne (częściowe) - obejmują niektóre jednostki zbiorowości statystycznej. c)szacunki interpolacyjne i ekstrapolacyjne - Interpolacja polega na szacowaniu nieznanych wartości cechy na podstawie znanych wartości sąsiednich (wcześniejszych i późniejszych). Ekstrapolacja polega na szacowaniu wartości wykraczających poza przedział wartości znanych.
Przyczyny przeprowadzania badań częściowych: - populacja jest nieskończona, - badania mają charakter niszczący, - skończona, ale bardzo liczna populacja.
Statystyka opisowa i matematyczna - opisowa opracowuje dane bez posługiwania się rachunkiem prawdopodobieństwa. Matematyczna - (wnioskowanie statystyczne) ustala prawidłowości, podejmuje decyzje dotyczące całej zbiorowości na podstawie próby dobranej losowo, posługuje się rachunkiem prawdopodobieństwa.
Podział cech statystycznych - właściwości jednostek wchodzących w skład badanej zbiorowości. Biorąc pod uwagę liczbę cech poddanych badaniu, zbiorowości możemy podzielić na jednowymiarowe (jednocechowe) i wielowymiarowe (wielocechowe) 1)Cechy stałe - określają jednostki (jednocześnie zbiorowość) pod względem rzeczowym (co?). czasowym (kiedy?) i przestrzennym (gdzie?). Są wspólne wszystkim jednostkom badanej zbiorowości, zatem nie podlegają badaniu, a jedynie decydują o zaliczeniu jednostek do danej zbiorowości.2)Cechy zmienne - to właściwości, którymi różnią się poszczególne jednostki statystyczne.a)Jakościowe (niemierzalne), np. płeć, kolor włosów.b)Ilościowe (mierzalne): (-)Skokowe - ich wartości mogą wyrażać się jedynie określonymi liczbami, bez wartości pośrednich, np. liczba studentów w grupie.(-)Quasi-ciągłe - cechy skokowe przyjmujące bardzo dużo wartości, np. zarobki pracowników wyrażone w groszach.(-)Ciągłe - mogą przyjmować każdą wartość z określonego skończonego przedziału liczbowego, np. wiek, wzrost, waga
Dystrybuanta - wartość dystrybuanty zmiennej losowej to prawdopodobieństwo, że zmienna losowa przyjmie wartość niewiększą od określonego poziomu F(xi)=P(x≤xi)
Dominanta - (modalna, wartość najczęstsza) taka wartość zmiennej, która w danym rozkładzie empirycznym występuje najczęściej
Mediana i kwartale - wśród kwarty li wyróżniamy: (a)Kwartyl pierwszy (dolny) - dzieli zbiorowość uporządkowaną na dwie części w ten sposób, że 25% jednostek ma wartości niższe, a 75% wyższe od kwartyla pierwszego. F(Q1)=P(X≤Q1)=0,25 (b)Kwartyl drugi (mediana, wartości środkowej) - dzieli zbiorowość uporządkowaną na dwie równe części w ten sposób, że 50% jednostek ma wartości niższe i 50% wyższe od mediany. F(Q2)=P(X≤Q2)=0,5 (c)Kwartyl trzeci (górny) - dzieli zbiorowość uporządkowaną na dwie części w ten sposób, że 75% jednostek ma wartości cechy niższe, a 25% wyższe od kwartyla trzeciego. F(Q3)=P(X≤Q3)=0,75
Losowanie jednostopniowe- wylosowanie pewnej liczby grup i utworzenie próby ze wszystkich jednostek wchodzących w skład wylosowanych grup. Jeśli z wylosowanych grup do badania wybiera się pojedyncze elementy bądź mniejsze zespoły jednostek drogą dalszego losowania, to mamy do czynienia ze schematem dwu stopniowym lub wielostopniowym
Czym charakteryzuje się rozkład warunkowy i linia regresji dla zmiennej losowej dwuwymiarowej
Rozkłady brzegowe:
Brzegowe funkcje gęstości
Rozkłady warunkowe:
Warunkowe funkcje gęstości
Wybrać dwa estymatory wariancji i je opisać
Wariancja z próby
Estymator ten można otrzymać metodą największej wiarygodności i metoda momentu. Jeżeli będzie to metoda największej wiarygodności, to estymator będzie zgodny, asymptotycznie najefektywniejszy, asymptotycznie nieobciążony. W małych próbach estymator jest obciążony. Wraz ze wzrostem liczebności próby obciążenie maleje.
Wartość oczekiwana:
Estymator nieobciążony wariancji
Estymator ten jest nieobciążony, zgodny, nie jest najefektywniejszy.
Relacja między estymatorem obciążonym, a nieobciążonym:
Cechy średniej arytmetycznej z próby jako estymatora wartości oczekiwanej z populacji
nieobciążony
efektywny
zgodny
jeżeli próba jest pobrana z populacji o rozkładzie X~N(m,σ) to średnia z próby
~N(m,
jeżeli pobieramy próbę z rozkładu innego nić normalny, to możnaby skorzystać z twierdzenia granicznego
Napisać z jakiego wzoru wyznacza się minimalną wielkość próby przy estymacji przedziałowej wskaźnika frakcji, opisać symbole we wzorze i napisać warunki, jakie musi spełnić model, żeby zastosować ten wzór
Minimalna liczebność próby estymacja przedziałowa frakcji
znany rząd frakcji równy przyjmujemy, że p=p0 (np. na podstawie wcześniejszych badań lub próby pilotażowej)
nieznany rząd frakcji przyjmuje się, że p=0,5 (wówczas iloczyn p(1-p), przyjmuje maksymalną wartość p(1-p)=0,25)
Tu trzeba napisać wzór i opisać każdą literkę. Przy opisywaniu symboli ze wzoru nie zapomnieć też o Uα i α (tutaj akurat jest, że Uα to taka wartość, że
Warunki zastosowania modelu:
populacja ma rozkład dwupunktowy z parametrem p,
próba pobrana w losowaniu niezależnym,
duża próba (n>100)
Własności współczynnika Pearsona:
-1≤ rxy≤+1
rxy = 0- zmienne X oraz Y nie są skorelowane
rxy < 0- zmienne X oraz Y są skorelowane ujemnie
rxy > 0- zmienne X oraz Y są skorelowane dodatnio
rxy = +1- zależność funkcyjna dodatnia
rxy = -1- zależność funkcyjna ujemna
Badanie istotności współczynnika Pearsona:
H0: ρ xy = 0; H1: ρ xy ≠ 0 gdzie ρ xy -współczynnik korelacji populacji generalnej. W przypadku małych prób (n≤120) do badania istotności współczynnika korelacji wykorzystujemy statystykę t o postaci:
t=
, statystyka przy prawdziwości H0 ma rozkład t-Studenta o n-2 stopniach swobody. W przypadku dużych prób (n>120) stosujemy statystykę standaryzowanego rozkładu normalnego N(0;1), o postaci:
u=
.
W jakiej sytuacji można zastosować dany test nieparametryczny np.?
Jeżeli chcemy zbadać zgodność z rozkładem Poissona
Jeżeli porównujemy dwie populacje
Wyznaczyć minimalną liczebność próby