Wnioskowanie
statystyczne c. d.
Wykład 7
Skala nominalna – jeden z rodzajów
.
są na
skali nominalnej, gdy przyjmują
wartości (etykiety), dla których nie
istnieje wynikające z natury danego
zjawiska uporządkowanie.
Skala nominalna
(
)
Nawet jeśli wartości zmiennej nominalnej
są wyrażane liczbowo, to liczby te są
tylko umownymi identyfikatorami, nie
można więc wykonywać na nich działań
arytmetycznych, ani ich porównywać.
Przykłady zmiennych nie
będących nominalnymi:
prędkość samochodu, wiek
Przykłady zmiennych
nominalnych:
stan zdrowia, m - ce
zamieszkania, płeć.
Szczególnym przypadkiem skali
nominalnej jest
, w przypadku
której istnieją tylko dwie możliwe
wartości zmiennej (np. płeć,
odpowiedzi na pytania typu: tak/nie .
-zliczanie,
-obliczanie frakcji (procent
całości),
-modalna,
-binaryzacja (zamiana zmiennej
nominalnej x na szereg
zmiennych dychotomicznych xi,
przyjmujących np. wartość 1, gdy
x = i i 0 w przeciwnym wypadku).
Dopuszczalne operacje
statystyczne
Skala dychotomiczna – jeden
z rodzajów
,
szczególny przypadek
skali nominalnej.
są na
skali dychotomicznej, gdy
przyjmują tylko dwie wartości.
Przykłady zmiennych
dychotomicznych: płeć,
odpowiedzi na pytania tak/nie.
Zmienną nominalną można
przekształcić w ciąg zmiennych
dychotomicznych za pomocą
Skala dychotomiczna
Czułość testu
diagnostycznego
• Czułość – w badaniach naukowych, na
przykład testach diagnostycznych
stosowanych w medycynie, jest
stosunkiem wyników prawdziwie
dodatnich do sumy prawdziwie dodatnich
i fałszywie ujemnych. Czułość 100%
oznaczałaby, że wszystkie osoby chore lub
ogólnie z konkretnymi poszukiwanymi
zaburzeniami zostają rozpoznane. Pojęcie
interpretuje się jako zdolność testu do
prawidłowego rozpoznania choroby tam,
gdzie ona występuje.
Ocena cech przyjmujących
wartości w skali
dychotomicznej
zestawionych w tabelce
2x2
Stan (np. choroba)
Określona jako "złoty" standard.
Prawdziwy
Fałszywy
Wynik
testu
Dodatni
Prawdziwie dodatni
Fałszywie dodatni
→ Wartość predykcyjna dodatnia
Ujemny
Fałszywie ujemny
Prawdziwie ujemny
→ Wartość predykcyjna ujemna
↓
Czułość
↓
Swoistość
Występowanie choroby
Tak
(Cukrzyca)
nie
Wyni
k
testu
Dodat
ni
Prawdziwie
dodatni
(a=74)
Fałszywie
dodatni
(b=21)
→ Wartość
predykcyjna
(a+b=95)
dodatniej
wynosi
a/(a+b)
Ujem
ny
Fałszywie
ujemny
(c=10)
Prawdziwie
ujemny
(d=303)
→ Wartość
predykcyjna
(c+d=313)
ujemna
wynosi c/
(c+d)
↓ (a+c=84)
Czułość
=a/(a+c)
↓(b+d=324)
Swoistość
=d/(b+d
OR- iloraz szansz
OR= (a/(a+b))/ (c/
(c+d))
Przykład
Powstało też wiele metod
przewidujących wartości
zmiennych na tej skali, np.
.
W odróżnieniu od innych
zmiennych na skali nominalnej, do
zmiennych dychotomicznych po
ich zakodowaniu jako 0 i 1 można
też stosować niektóre metody
dostosowane do skali ilorazowej.
Istnieją specjalne metody
statystyczne dostosowane do skali
dychotomicznej, np.
Skala ilorazowa
• Skala ilorazowa (także: skala stosunkowa) – jeden
z rodzajów
.
jest na skali
ilorazowej, gdy
miedzy dwiema jej
wartościami mają interpretację w świecie
rzeczywistym.
• Przykłady zmiennych ilorazowych: temperatura w
(temperatura w
jest na
),
,
,
• Skala ilorazowa, w odróżnieniu od uboższych skal, nie
nakłada ograniczeń w stosowaniu operacji
matematycznych i metod statystycznych. W
odróżnieniu jednak od
z natury
, jaką
należy zastosować.
Zastosowania skali
stosunkowej w
pedagogicznych
•
Skala stosunkowa nie wnosi żadnych ograniczeń w
stosowaniu operacji arytmetycznych do wyników
pomiaru. Oprócz obliczeń uprawnionych dla
, dopuszcza ona przekształcenia
zmienności.
•
Przykładem skali stosunkowej w dziedzinie
może być czas rozwiązywania
szybkości. Początek testowania jest tu
naturalnym punktem zerowym, a
(lub
) pracy badanego —
. Dzięki tym dwu
potrafimy ustalać stosunki między
osiągnięciami
, np. stwierdzić, że dany
rozwiązuje pewnego typu tekst dwa razy
szybciej od innego ucznia
Skala interwałowa
• Skala interwałowa (przedziałowa) – jeden z
rodzajów
.
jest na
skali interwałowej, gdy
miedzy dwiema
jej wartościami dają się obliczyć i mają
interpretację w świecie rzeczywistym, jednak
nie ma sensu dzielenie dwóch wartości
zmiennej przez siebie. Innymi słowy określona
jest
, jednak punkt zero jest
wybrany umownie.
• Przykłady zmiennych interwałowych: daty,
np. data urodzenia, temperatura w
,
,
Dopuszczalne operacje
statystyczne
•
jednej lub
większej liczby zmiennych interwałowych
daje także wielkość na skali interwałowej.
• Różnica dwóch wielkości na skali
interwałowej jest na
.
• Rangowanie zmienia skalę interwałową
na
Obliczanie:
,
,
Pearsona,
,
i
Niedopuszczalne są:
• wyliczanie zmian względnych
(procentowych) w szeregu czasowym
• mnożenie i dzielenie dwóch wielkości
interwałowych
• logarytmowanie
• potęgowanie
•
oprócz arytmetycznej,
takie jak
,
,
Skala porządkowa
• Skala porządkowa – jeden z rodzajów
.
są na skali
porządkowej, gdy przyjmują wartości, dla
których dane jest
(kolejność),
jednak nie da się w sensowny sposób określić
miedzy dwiema
wartościami.
• Przykłady zmiennych porządkowych:
wykształcenie, kolejność zawodników na
podium.
• Przykłady zmiennych nie będących
porządkowymi: płeć, wiek, temperatura
Dopuszczalne operacje
statystyczne:
• porównywanie, która wartość jest mniejsza, a
która większa (ale bez określania o ile)
• zliczanie,
• obliczanie
(procent całości),
•
(zamiana zmiennej nominalnej x na
szereg zmiennych dychotomicznych xi,
przyjmujących np. wartość 1, gdy x = i i 0 w
przeciwnym wypadku).
•
,
•
i
, w szczególności:
–
– obliczanie centyli, w tym mediany
– wyliczanie minimum i maksimum
Nie są jednak
dopuszczalne takie operacje,
jak działania arytmetyczne,
średnia arytmetyczna,
odchylenie standardowe,
klasyczna korelacja, regresja
liniowa
• Dowolną zmienną na skali
interwałowej bądź ilorazowej można
przekształcić w porządkową za
pomocą rangowania
Skala absolutna
• Skala absolutna – najbogatszy rodzaj skal
pomiarowych, w którym z natury danego
zjawiska wynika zarówno umiejscowienie
zera na skali, jak i jednostka miary. Skala
absolutna łączy cechy skali interwałowej i
ilorazowej. Dla zmiennych na skali
absolutnej interpretację mają zarówno
iloraz, jak i różnica dwóch pomiarów.
• Przykład zmiennej na skali absolutnej:
liczba jabłek, liczba pacjentów.
Prawdopodobieństwo
subiektywistyczne
• P(X) jest więc obserwowanym
prawdopodobieństwem X, zaś P(X | T) to
prawdopodobieństwo, że X nastąpi według teorii T.
Z kolei P(T) to prawdopodobieństwo, że teoria T
jest prawdziwa, P(T | X) to prawdopodobieństwo,
że teoria T jest prawdziwa, jeśli zaobserwowano X.
• Zdania typu "prawdopodobieństwo, że teoria T jest
prawdziwa" są z punktu widzenia interpretacji
obiektywistycznej nie do przyjęcia – teoria jest
prawdziwa (prawdopodobieństwo równe jedności)
lub też nie (prawdopodobieństwo równe zeru), czyli
prawdziwość teorii nie jest zdarzeniem losowym.
Przykład użycia
• Twierdzenia Bayesa można użyć do
interpretacji rezultatów badania przy użyciu
testów wykrywających narkotyki. Załóżmy, że
przy badaniu narkomana test wypada
pozytywnie w 99% przypadków, zaś przy
badaniu osoby nie zażywającej narkotyków
wypada negatywnie w 99% przypadków.
Pewna firma postanowiła przebadać swoich
pracowników takim testem wiedząc, że 0,5%
z nich to narkomani. Chcemy obliczyć
prawdopodobieństwo, że osoba u której test
wypadł pozytywnie rzeczywiście zażywa
narkotyki. Oznaczmy następujące zdarzenia:
D - dana osoba jest narkomanem
N - dana osoba nie jest narkomanem
+ - u danej osoby test dał wynik pozytywny
− - u danej osoby test dał wynik
negatywny
Wiemy, że:
P(D) = 0,005, gdyż 0,5% pracowników to
narkomani
P(N) = 1 − P(D) = 0,995
P( + | D) = 0,99, gdyż taką skuteczność ma
test przy badaniu narkomana
P( − | N) = 0,99, gdyż taką skuteczność
ma test przy badaniu osoby nie będacej
narkomanem
P( + | N) = 1 − P( − | N) = 0,01
Mając te dane chcemy obliczyć
prawdopodobieństwo,
że osoba u której test wypadł pozytywnie,
rzeczywiście jest narkomanem. Tak więc:
Mimo potencjalnie wysokiej skuteczności
testu, prawdopodobieństwo, że narkomanem jest
badany pracownik u którego test dał wynik
pozytywny, jest równe około 33%, więc jest
nawet bardziej prawdopodobnym, ze taka osoba
nie zażywa narkotyków. Ten przykład pokazuje,
dlaczego ważne jest, aby nie polegać na
wynikach tylko pojedynczego testu.