wykład 7a 2

background image

Wnioskowanie

statystyczne c. d.

Wykład 7

background image

Skala nominalna – jeden z rodzajów

skal pomiarowych

.

Zmienne

są na

skali nominalnej, gdy przyjmują
wartości (etykiety), dla których nie
istnieje wynikające z natury danego
zjawiska uporządkowanie.

Skala nominalna

(

Zmienna nominalna

)

Nawet jeśli wartości zmiennej nominalnej
są wyrażane liczbowo, to liczby te są
tylko umownymi identyfikatorami, nie
można więc wykonywać na nich działań
arytmetycznych, ani ich porównywać.

background image

Przykłady zmiennych nie
będących nominalnymi:

prędkość samochodu, wiek

Przykłady zmiennych

nominalnych:

stan zdrowia, m - ce

zamieszkania, płeć.

Szczególnym przypadkiem skali

nominalnej jest

skala dychotomiczna

, w przypadku

której istnieją tylko dwie możliwe
wartości zmiennej (np. płeć,
odpowiedzi na pytania typu: tak/nie .

background image

-zliczanie,
-obliczanie frakcji (procent
całości),
-modalna,
-binaryzacja (zamiana zmiennej
nominalnej x na szereg
zmiennych dychotomicznych xi,
przyjmujących np. wartość 1, gdy
x = i i 0 w przeciwnym wypadku).

Dopuszczalne operacje

statystyczne

background image

Skala dychotomiczna – jeden

z rodzajów

skal pomiarowych

,

szczególny przypadek
skali nominalnej.

Zmienne

są na

skali dychotomicznej, gdy
przyjmują tylko dwie wartości.
Przykłady zmiennych
dychotomicznych:
płeć,
odpowiedzi na pytania tak/nie.
Zmienną nominalną można
przekształcić w ciąg zmiennych
dychotomicznych za pomocą

binaryzacji

.

Skala dychotomiczna

background image

Czułość testu

diagnostycznego

Czułość – w badaniach naukowych, na

przykład testach diagnostycznych

stosowanych w medycynie, jest

stosunkiem wyników prawdziwie

dodatnich do sumy prawdziwie dodatnich

i fałszywie ujemnych. Czułość 100%

oznaczałaby, że wszystkie osoby chore lub

ogólnie z konkretnymi poszukiwanymi

zaburzeniami zostają rozpoznane. Pojęcie

interpretuje się jako zdolność testu do

prawidłowego rozpoznania choroby tam,

gdzie ona występuje.

background image

Ocena cech przyjmujących

wartości w skali

dychotomicznej

zestawionych w tabelce

2x2

Stan (np. choroba)

Określona jako "złoty" standard.

Prawdziwy

Fałszywy

Wynik

testu

Dodatni

Prawdziwie dodatni

Fałszywie dodatni

→ Wartość predykcyjna dodatnia

Ujemny

Fałszywie ujemny

Prawdziwie ujemny

→ Wartość predykcyjna ujemna

Czułość

Swoistość

background image

Występowanie choroby

Tak

(Cukrzyca)

nie

Wyni

k

testu

Dodat

ni

Prawdziwie

dodatni

(a=74)

Fałszywie

dodatni

(b=21)

→ Wartość

predykcyjna

(a+b=95)

dodatniej

wynosi

a/(a+b)

Ujem

ny

Fałszywie

ujemny

(c=10)

Prawdziwie

ujemny

(d=303)

→ Wartość

predykcyjna

(c+d=313)

ujemna

wynosi c/

(c+d)

↓ (a+c=84)

Czułość

=a/(a+c)

↓(b+d=324)

Swoistość

=d/(b+d

OR- iloraz szansz
OR= (a/(a+b))/ (c/
(c+d))

Przykład

background image

Powstało też wiele metod
przewidujących wartości
zmiennych na tej skali, np.

regresja logistyczna

.

W odróżnieniu od innych
zmiennych na skali nominalnej, do
zmiennych dychotomicznych po
ich zakodowaniu jako 0 i 1 można
też stosować niektóre metody
dostosowane do skali ilorazowej.

Istnieją specjalne metody

statystyczne dostosowane do skali

dychotomicznej, np.

chi kwadrat

background image

Skala ilorazowa

Skala ilorazowa (także: skala stosunkowa) – jeden

z rodzajów

skal pomiarowych

.

Zmienna

jest na skali

ilorazowej, gdy

stosunki

miedzy dwiema jej

wartościami mają interpretację w świecie
rzeczywistym.

Przykłady zmiennych ilorazowych: temperatura w

kelwinach

(temperatura w

stopniach Celsjusza

jest na

skali interwałowej

),

napięcie elektryczne

,

inflacja

,

bezrobocie

• Skala ilorazowa, w odróżnieniu od uboższych skal, nie

nakłada ograniczeń w stosowaniu operacji
matematycznych i metod statystycznych. W
odróżnieniu jednak od

skali absolutnej

z natury

zjawiska nie wynika naturalna

jednostka miary

, jaką

należy zastosować.

background image

Zastosowania skali

stosunkowej w

pomiarach

pedagogicznych

Skala stosunkowa nie wnosi żadnych ograniczeń w

stosowaniu operacji arytmetycznych do wyników

pomiaru. Oprócz obliczeń uprawnionych dla

skali przedziałowej

, dopuszcza ona przekształcenia

logarytmiczne

i ustalanie

współczynnika

zmienności.

Przykładem skali stosunkowej w dziedzinie

pomiaru dydaktycznego

może być czas rozwiązywania

testu

szybkości. Początek testowania jest tu

naturalnym punktem zerowym, a

sekunda

(lub

minuta

) pracy badanego

jednostką miary

. Dzięki tym dwu

stałym

wartościom

potrafimy ustalać stosunki między

osiągnięciami

szkolnymi

, np. stwierdzić, że dany

uczeń

rozwiązuje pewnego typu tekst dwa razy

szybciej od innego ucznia

background image

Skala interwałowa

Skala interwałowa (przedziałowa) – jeden z

rodzajów

skal pomiarowych

.

Zmienna

jest na

skali interwałowej, gdy

różnice

miedzy dwiema

jej wartościami dają się obliczyć i mają
interpretację w świecie rzeczywistym, jednak
nie ma sensu dzielenie dwóch wartości
zmiennej przez siebie. Innymi słowy określona
jest

jednostka miary

, jednak punkt zero jest

wybrany umownie.

Przykłady zmiennych interwałowych: daty,

np. data urodzenia, temperatura w

stopniach Celsjusza

,

energia potencjalna

,

potencjał elektryczny

background image

Dopuszczalne operacje

statystyczne

Przekształcenie liniowe

jednej lub

większej liczby zmiennych interwałowych
daje także wielkość na skali interwałowej.

• Różnica dwóch wielkości na skali

interwałowej jest na

skali ilorazowej

.

• Rangowanie zmienia skalę interwałową

na

porządkową

Obliczanie:

średnia arytmetyczna

,

wariancja

,

odchylenie standardowe

,

korelacja

Pearsona,

metody rangowe

,

regresja liniowa

i

regresja logistyczna

background image

Niedopuszczalne są:

• wyliczanie zmian względnych

(procentowych) w szeregu czasowym

• mnożenie i dzielenie dwóch wielkości

interwałowych

• logarytmowanie
• potęgowanie

średnie potęgowe

oprócz arytmetycznej,

takie jak

średnia kwadratowa

,

harmoniczna

,

geometryczna

background image

Skala porządkowa

Skala porządkowa – jeden z rodzajów

skal pomiarowych

.

Zmienne

są na skali

porządkowej, gdy przyjmują wartości, dla

których dane jest

uporządkowanie

(kolejność),

jednak nie da się w sensowny sposób określić

różnicy

ani

ilorazu

miedzy dwiema

wartościami.

Przykłady zmiennych porządkowych:

wykształcenie, kolejność zawodników na

podium.

Przykłady zmiennych nie będących

porządkowymi: płeć, wiek, temperatura

background image

Dopuszczalne operacje

statystyczne:

• porównywanie, która wartość jest mniejsza, a

która większa (ale bez określania o ile)

• zliczanie,
• obliczanie

frakcji

(procent całości),

binaryzacja

(zamiana zmiennej nominalnej x na

szereg zmiennych dychotomicznych xi,
przyjmujących np. wartość 1, gdy x = i i 0 w
przeciwnym wypadku).

moda

,

rangowanie

i

metody rangowe

, w szczególności:

korelacja rangowa Spearmana

– obliczanie

centyli

, w tym

mediany

– wyliczanie

minimum i maksimum

background image

Nie są jednak

dopuszczalne takie operacje,
jak

działania arytmetyczne

,

średnia arytmetyczna

,

odchylenie standardowe

,

klasyczna

korelacja

,

regresja liniowa

• Dowolną zmienną na skali

interwałowej bądź ilorazowej można
przekształcić w porządkową za
pomocą

rangowania

background image

Skala absolutna

Skala absolutna – najbogatszy rodzaj skal

pomiarowych, w którym z natury danego
zjawiska wynika zarówno umiejscowienie
zera na skali, jak i jednostka miary. Skala
absolutna łączy cechy skali interwałowej i
ilorazowej. Dla zmiennych na skali
absolutnej interpretację mają zarówno
iloraz, jak i różnica dwóch pomiarów.

Przykład zmiennej na skali absolutnej:

liczba jabłek, liczba pacjentów.

background image

Prawdopodobieństwo

subiektywistyczne

P(X) jest więc obserwowanym

prawdopodobieństwem X, zaś P(X | T) to

prawdopodobieństwo, że X nastąpi według teorii T.

Z kolei P(T) to prawdopodobieństwo, że teoria T

jest prawdziwa, P(T | X) to prawdopodobieństwo,

że teoria T jest prawdziwa, jeśli zaobserwowano X.

• Zdania typu "prawdopodobieństwo, że teoria T jest

prawdziwa" są z punktu widzenia interpretacji

obiektywistycznej nie do przyjęcia – teoria jest

prawdziwa (prawdopodobieństwo równe jedności)

lub też nie (prawdopodobieństwo równe zeru), czyli

prawdziwość teorii nie jest zdarzeniem losowym.

background image

Przykład użycia

Twierdzenia Bayesa można użyć do

interpretacji rezultatów badania przy użyciu

testów wykrywających narkotyki. Załóżmy, że

przy badaniu narkomana test wypada

pozytywnie w 99% przypadków, zaś przy

badaniu osoby nie zażywającej narkotyków

wypada negatywnie w 99% przypadków.

Pewna firma postanowiła przebadać swoich

pracowników takim testem wiedząc, że 0,5%

z nich to narkomani. Chcemy obliczyć

prawdopodobieństwo, że osoba u której test

wypadł pozytywnie rzeczywiście zażywa

narkotyki. Oznaczmy następujące zdarzenia:

background image

D - dana osoba jest narkomanem

N - dana osoba nie jest narkomanem

+ - u danej osoby test dał wynik pozytywny

− - u danej osoby test dał wynik

negatywny

Wiemy, że:

P(D) = 0,005, gdyż 0,5% pracowników to

narkomani

P(N) = 1 − P(D) = 0,995

P( + | D) = 0,99, gdyż taką skuteczność ma

test przy badaniu narkomana

P( − | N) = 0,99, gdyż taką skuteczność

ma test przy badaniu osoby nie będacej

narkomanem

P( + | N) = 1 − P( − | N) = 0,01

background image

Mając te dane chcemy obliczyć
prawdopodobieństwo,
że osoba u której test wypadł pozytywnie,
rzeczywiście jest narkomanem. Tak więc:

Mimo potencjalnie wysokiej skuteczności

testu, prawdopodobieństwo, że narkomanem jest
badany pracownik u którego test dał wynik
pozytywny, jest równe około 33%, więc jest
nawet bardziej prawdopodobnym, ze taka osoba
nie zażywa narkotyków. Ten przykład pokazuje,
dlaczego ważne jest, aby nie polegać na
wynikach tylko pojedynczego testu.

background image

Wnioskowanie statystyczne - polega na uogólnianiu
wyników otrzymanych na podstawie próby losowej
na całą populację generalną, z której próba została
pobrana

Wnioskowanie statystyczne dzieli się na:

1.  

Estymację

szacowanie

wartości

parametrów lub postaci rozkładu zmiennej na
podstawie próby – na podstawie wyników próby
formułujemy wnioski dla całej populacji

2. Weryfikację hipotez statystycznych
sprawdzanie określonych założeń sformułowanych
dla

parametrów

populacji

generalnej

na

podstawie wyników z próby – najpierw wysuwamy
założenie, które weryfikujemy na podstawie
wyników próby

background image

Estymator – wielkość (charakterystyka, miara),
obliczona na podstawie próby, służąca do oceny
wartości nieznanych parametrów populacji
generalnej.

Najlepszym z pośród wszystkich estymatorów
parametru w populacji generalnej jest ten, który
spełnia wszystkie właściwości estymatorów
(jest

równocześnie

nieobciążony,

zgodny,

efektywny, dostateczny).

background image

Przedział ufności jest podstawowym
narzędziem estymacji przedziałowej.
Pojęcie to zostało wprowadzone do
statystyki przez amerykańskiego
matematyka polskiego pochodzenia
Jerzego Spławę-Neymana

• Niech cecha X ma rozkład w populacji z nieznanym

parametrem θ. Z populacji wybieramy próbę losową
(X1, X2, ..., Xn). Przedziałem ufności (θ - θ1, θ +
θ2) o współczynniku ufności 1 - α nazywamy taki
przedział (θ - θ1, θ + θ2), który spełnia warunek:

P(θ1 < θ < θ2) = 1 − α
• gdzie θ1 i θ2 są funkcjami wyznaczonymi na

podstawie próby losowej.

background image

Podobnie jak w przypadku

estymatorów definicja pozwala

na dowolność wyboru funkcji z

próby, jednak tutaj kryterium

wyboru najlepszych funkcji

narzuca się automatycznie -

zazwyczaj będziemy

poszukiwać przedziałów

najkrótszych

background image

Współczynnik ufności 1 - α jest

wielkością, którą można interpretować w
następujący sposób: jest to
prawdopodobieństwo, że rzeczywista wartość
parametru θ w populacji znajduje się w
wyznaczonym przez nas przedziale ufności.
Im większa wartość tego współczynnika, tym
szerszy przedział ufności, a więc mniejsza
dokładność estymacji parametru. Im
mniejsza wartość 1 - α, tym większa
dokładność estymacji, ale jednocześnie tym
większe prawdopodobieństwo popełnienia
błędu. Wybór odpowiedniego współczynnika
jest więc kompromisem pomiędzy
dokładnością estymacji a ryzykiem błędu. W
praktyce przyjmuje się zazwyczaj wartości:
0,99; 0,95 lub 0,90, zależnie od parametru.

background image

Przykłady przedziałów

ufności

Ponieważ szukamy jak najkrótszych przedziałów

ufności, dlatego przy wyznaczaniu przedziału
staramy się wykorzystać jak najwięcej dostępnych
informacji o rozkładzie cechy w populacji. Jeśli np.
cecha ma rozkład normalny z odchyleniem
standardowym σ, to zastosowanie wzoru na przedział
ufności dla nieznanego σ również da poprawny
wynik, jednak przedział otrzymany tą metodą będzie
szerszy, czyli mniej dokładny. Z kolei wzory
ogólniejsze, np. dla nieznanego rozkładu, często
korzystają z rozkładów granicznych estymatorów i
dlatego wymagają dużej liczebności próby.

background image

Estymacja przedziałowa

polega na budowie przedziału zwanego przedziałem
ufności, który z określonym prawdopodobieństwem
będzie zawierał nieznaną wartość szacowanego
parametru

1

)}

(

)

(

{

2

1

n

n

Z

g

Q

Z

g

P

gdzie:
Q – nieznany parametr populacji generalnej,

końce przedziałów (dolna i górna
granica przedziału), będące funkcją
wylosowanej próby

)

(

1

n

Z

g

)

(

2

n

Z

g

background image

1–α współczynnik ufności – prawdopodobieństwo
tego, że wyznaczając na podstawie n-elementowych

prób wartość funkcji g

1

i g

2

(dolną i górną granicę

przedziału) średnio w (1-α)·100% przypadkach
otrzymamy przedziały pokrywające nieznaną
wartość parametru Q – z prawdopodobieństwem (1-
α) przedział ufności pokrywa nieznaną wartość
szacowanego parametru

Im krótszy przedział (różnica między górną i dolną

granicą przedziału),

tym bardziej precyzyjna jest estymacja

przedziałowa.

Im wyższa jest wartość współczynnika ufności,

tym większa jest długość przedziału.

background image

Przedział ufności dla średniej w populacji o
rozkładzie normalnym ze znanym
odchyleniem standardowym

Estymatorem średniej w populacji jest średnia
arytmetyczna z próby , która ma rozkład
.

X

)

,

(

n

m

N

Przedział ufności dla średniej w populacji ma
postać:

1

}

{

n

n

u

X

u

X

P

- wartość odczytana z tablic rozkładu
normalnego dla danego poziomu istotności
α

- odchylenie standardowe w populacji
generalnej

u

background image

Względna miara precyzji oszacowania
jako miara dokładności dopasowania
określona jest wzorem:

%

100

)

(

n

X

u

X

B

Jeżeli:

- oszacowanie charakteryzuje się dużą

precyzją

- uogólnienia wyników na populację

generalną

należy dokonywać ostrożnie

- nie należy dokonywać żadnych uogólnień

na

populację generalną

%

5

)

(

X

B

%

10

)

(

%

5

X

B

%

10

)

(

X

B

background image

Zadanie 1.
Firma telefoniczna oszacowała przeciętną długość

rozmów lokalnych w czasie weekendu, których czas ma

rozkład normalny z odchyleniem standardowym 5,5

minuty. Z losowej próby 50 rozmów otrzymano średnią

14,5 minuty. Wyznacz z prawdopodobieństwem 1- α

=0,9 przedział ufności dla średniej długości rozmów

lokalnych.
Skorzystaj z funkcji w MS Excel „Ufność”

Zadanie 2.

Wyznacz granice liczbowe krańców przedziału ufności
pomiaru odległości między dwoma wierzchołkami gór
(w metrach) przy poziomie ufności 1- =0.95 , jeśli

wykonano 80 pomiarów ze średnią równą 3000 m.
Rozkład odległości jest rozkładem normalnym z
odchyleniem standardowym równym 10 m.

Skorzystaj z funkcji w MS Excel „Ufność”

background image

Przedział ufności dla średniej w populacji o
rozkładzie normalnym z nieznanym
odchyleniem standardowym

n < 30

Jeżeli próba jest mało liczna - stosujemy statystykę
t o rozkładzie t–Studenta dla n-1 stopni swobody

1

}

{

1

1

,

1

1

,

n

S

n

n

S

n

t

X

m

t

X

P

gdzie:

- odchylenie standardowe z próby

- wartość odczytana z tablic rozkładu
Studenta dla
poziomu istotności α oraz n–1 stopni

swobody

n

i

i

n

x

x

S

1

2

1

)

(

1

, 

n

t

background image

Gdy n > 30, wartość odczytaną z tablic

rozkładu Studenta możemy zastąpić wartością ,

odczytaną z tablic rozkładu normalnego oraz

.

1

}

{

n

S

n

S

u

X

m

u

X

P

1

, 

n

t

u

S

- wartość odczytana z tablic rozkładu
normalnego dla danego poziomu istotności
α

- odchylenie standardowe w próbie

u

S

background image

Względną precyzję oszacowania oceniamy
następująco:

dla n < 30

%

100

)

(

1

1

,

n

X

S

t

n

X

B

dla n > 30

%

100

)

(

n

X

S

u

X

B

background image

1. W pewnej klasie wybrano losowo grupę 8 osobową,

która miała za zadanie rozwiązać zadanie z
matematyki. Zmierzono czas rozwiązania zadania
przez każdego z uczniów: 25, 16, 12, 10, 12, 21, 25,
20.

Oszacuj

metodą

przedziałową

dla

współczynnika ufności średni czas niezbędny do
rozwiązania zadania w całej zbiorowości uczniów.
Przyjmując poziom istotności  = 0,05.

2. W grupie losowo wybranych 625 pracowników w

dużym

koncernie

produkującym

samochody

osobowe, średnia liczba dni nieobecności w pracy
w badanym roku wynosiła 18, natomiast odchylenie
standardowe 3. Przyjmując poziom ufności na
poziomie

0,90

oszacować

średni

poziom

nieobecności

pracowników

w

całym

przedsiębiorstwie

oraz

ocenić

precyzję

oszacowania.

background image

Problem minimalnej liczebność

próby

Minimalna liczebność próby - taka liczebność

próby, która zapewni wymaganą dokładność

(precyzję oszacowania) przy danym poziomie

wiarygodności (prawdopodobieństwa).

Przykład. Chcemy oszacować procent (frakcję)

mieszkańców

pewnego miasta, mających grupę „0”. Ilu należy

wylosować mieszkańców do próby, aby szacowanie

dokonać z błędem maksymalnym 5% przy

współczynniku 0,95.

background image

Rozwiązanie

• Korzystamy ze wzoru: n* ^2/4d^2
Ztablicy rozkładu normalnego N(0,1) dla

wsp. ufności 0,95 odczytujemy wartość
1,96.

Podstawiając do wzoru, mamy:
n= !,96^2/4*0,05^2= 384

u

u

background image

Dla estymacji przedziałowej średniej m w
populacji przy znanym odchyleniu
standardowym σ
w populacji

Poszukujemy takiej liczebność próby n, dla której
przy danym współczynniku ufności (1-α) połowa
długości przedziału ufności d – maksymalny błąd
szacunku – nie przekroczy ustalonej z góry
wartości.

2

2

2

d

u

n

2

2

2

d

u

n

stąd

background image

Dla estymacji przedziałowej średniej m w
populacji przy nieznanym odchyleniu
standardowym σ
w populacji

Losujemy próbę wstępną n

0

, obliczamy średnią i

wariancję z próby i na jej podstawie wyznaczamy
właściwą liczebność próby:

2

2

2

1

,

ˆ

0

d

S

t

n

n

t

α,n0-1

– wartość odczytana z tablic rozkładu Studenta

dla α i n

0

-1

n

i

i

n

X

X

S

1

1

1

2

)

(

ˆ

Jeżeli n ≤ n

0

to próbę wstępną traktujemy

jako właściwą. Jeżeli zaś n > n

0

to musimy

próbę powiększyć o n – n

0

.

background image

1.

Firma

zajmująca

się

wyszukiwaniem

stanowisk

dla

personelu

kierowniczego

chce

oszacować średnią pensję, jaką może uzyskać
pracownik

pełniący

funkcję

kierowniczą,

z

dokładnością do 2000 $, przy poziomie ufności 95%.
Wiadomo, że rozkład pensji kierowniczych jest
rozkładem normalnym o wariancji 40 mln. Jak liczna
powinna być próba do oszacowania średniej pensji
kierowników?

2. W celu wyznaczenia przeciętnej długości

drogi

hamowania

samochodu

na

asfalcie,

przeprowadzono przy prędkości 40 km/h 12 prób i
otrzymano wyniki w metrach: 17,0; 19,0; 22,0; 20,5;
20,0; 21,0; 20,5; 20,0; 21,0; 18,0; 20,0; 21,0. Czy
liczba prób jest wystarczająca do wyznaczenia
przedziału ufności średniej o długości 0,5 m i dla 1- α
= 0,95. Ewentualnie, jaką liczbę prób należy jeszcze
przeprowadzić?

background image

Przedział ufności dla

średniej.

Znane odchylenie

standardowe

• Cecha ma w populacji rozkład normalny

N(m, σ), przy czym odchylenie
standardowe σ jest znane. Przedział
ufności dla parametru m tego rozkładu
ma postać:

• lub równoznacznie:

lub
równoznacznie

background image

gdzie:

n to liczebność próby losowej

oznacza średnią z próby
losowej

σ to odchylenie

standardowe populacji

u

α

jest statystyką,

spełniającą warunek:
P( − u

α

< U < u

α

) = 1 −

α, gdzie U jest zmienną

P( − uα < U < uα) = 1 − α, gdzie U
jest zmienną losową o rozkładzie
normalnym N(0,1).

ora
z

i

rozkładu N(0,1).

background image

Nieznane odchylenie

standardowe

• Cecha ma w populacji rozkład normalny

N(m, σ), przy czym odchylenie standardowe

σ jest nieznane. Przedział ufności dla

parametru m tego rozkładu ma postać:

• gdzie:

n to liczebność próby losowej

• oznacza średnią z próby losowej

S to odchylenie standardowe z próby

ma rozkład Studenta z n - 1 stopniami
swobody

background image

Zwykle stosuje się ten wzór

dla małej próby (n<30). Tak
naprawdę działa on dla każdej
wielkości próby, jednak dla
dużych prób można przybliżyć
rozkład t Studenta rozkładem
normalnym, co jest łatwiejsze
do wyliczenia a dające niemal
takie same wartości (patrz
niżej

background image

Nieznane odchylenie

standardowe – Duża próba

(n>30

• Cecha ma w populacji rozkład normalny N(m,

σ), przy czym odchylenie standardowe σ jest

nieznane, a próba jest duża (n>30). Granica

30 jest czysto umowna, im n jest większe, tym

wzór dokładniejszy. Przedział ufności dla

parametru m tego rozkładu ma postać:

gdzie:

n to liczebność próby losowej

oznacza średnią z próby losowej

S to odchylenie standardowe z próby

jest statystyką ze zmienną
losową o rozkładzie normalnym N(0, 1

).

background image

Przedział ufności dla

wariancji

• Poniższy wzór pozwala wyznaczyć

przedział ufności dla wariancji w
populacji o rozkładzie normalnym N(m,
σ)

gdzie: n to liczebność próby losowej, S to
odchylenie standardowe z próby,
i

i

to statystyki spełniające odpowiednio równości:

gdzie χ2 ma rozkład chi-kwadrat z n - 1 stopniami
swobody

Podobnie jak poprzednio zwykle stosuje się ten wzór dla
małej próby (n<30), choć również działa on dla każdej
wielkości próby.

background image

Duża próba (n>30)

• Poniższy wzór pozwala wyznaczyć

przedział ufności dla wariancji w
populacji o rozkładzie normalnym N(m,
σ) dla dużej próby, czyli umownie dla
n>30.

gdzie: n to liczebność próby losowej, S to odchylenie
standardowe z próby, uα jest statystyką, spełniającą
warunek:

gdzie U jest zmienną losową o rozkładzie normalnym N(0, 1).

P( − uα < U < uα) =
1 − α

background image

Przedział ufności dla odsetka

(wskaźnik struktury)

• Poniższy wzór pozwala wyznaczyć

przedział ufności dla odsetka w
populacji o rozkładzie normalnym N(m,
σ).

gdzie:
n to liczebność próby losowej
m to liczebność wybranej grupy z próby
uα jest statystyką, spełniającą warunek:
P( − uα < U < uα) = 1 − α gdzie U jest zmienną
losową o rozkładzie normalnym N(0, 1).

background image

Przedział ufności dla

współczynnika korelacji

• Poniższy wzór pozwala wyznaczyć

przedział ufności dla współczynnika
korelacji w populacji o rozkładzie
normalnym N(m, σ). Tak jak poprzednio
działa on dla dowolnej próby choć jest
zwykle stosowany tylko dla prób małych,
n<30.

gdzie: n to liczebność próby losowej, uα jest statystyką,
spełniającą warunek:

P( − uα < U < uα) = 1 − α gdzie U jest
zmienną losową o rozkładzie normalnym
N(0, 1).

r to wspólczynnik korelacji

background image

Duża próba (n>30)

• Poniższy wzór pozwala wyznaczyć

przedział ufności dla współczynnika
korelacji w populacji o rozkładzie
normalnym N(m, σ)

gdzie: n to liczebność próby losowej, uα jest statystyką,
spełniającą warunek: P( − uα < U < uα) = 1 − α gdzie U
jest zmienną losową o rozkładzie normalnym N(0, 1),

r to wspólczynnik
korelacji

background image

Przedział ufności dla

współczynnika α1

• Poniższy wzór pozwala wyznaczyć

przedział ufności dla współczynnika α1
w populacji o rozkładzie normalnym
N(m, σ)

gdzie: X to wartość z próby
losowej

oznacza średnią z próby losowej, t

α

ma rozkład

Studenta z n - 2 stopniami swobody


Document Outline


Wyszukiwarka

Podobne podstrony:
ŚrodkiTransportu Dalekiego wykład 7a
MP Wykład 7A Prognozowanie na podstawie modelu ekonometrycznego
wykład 7a
PWiK - Wykład 7a, Budownictwo S1, Semestr IV, PWiK, Wykłady, PWiK 1, Wykład 7
Psychologia osobowości dr Kofta wykład 7a Podstawowe funkcje osobowości w ujęciu poznawczym ppt
Wyklad 7a Struktury
ZARZ SRODOWISKIEM wyklad 7a

więcej podobnych podstron