1
WSFiZ Materiały dydaktyczne Metodologia
Materiały dodatkowe do zajęć z metodologii
WSFIZ 2012
Wskaźniki
Prowadzący: Andrzej Tarłowski antarlow@gmail.com
W poniższym materiale przedstawiam pojęcie prawdopodobieństwa warunkowego i mocy
odrzucenia oraz zawierania wskaźników w trzech przykładach.
1. Ciąża
Wyobraźmy sobie cechę która ma dwie wartości występuje lub nie i wskaźnik, który daje dwa rodzaje
odczytu – odczyt pozytywny lub negatywny. Niech naszą cechą będzie ciąża – cecha ta ma dwie
wartości – kobieta może być w ciąży lub nie być w ciąży innej opcji nie ma.
Wskaźnikiem jest test ciążowy który ma dwa możliwe odczyty – ciąża lub brak ciąży.
Odczyt ze wskaźnika nie jest jednoznaczny z faktyczną ciążą lub jej brakiem. Jeśli test ciążowy daje
odczyt pozytywny (ciąża) to może być tak że kobieta jest w ciąży lub nie jest w ciąży. Jeśli test ciążowy
daje odczyt negatywny (brak ciąży) to kobieta może nie być w ciąży ale może też być w ciąży. Test
może dać wynik poprawny – zasygnalizować istniejącą ciążę lub zasygnalizować brak ciąży gdy jej nie
ma. Może też dać odczyt błędny – fałszywy alarm- odczyt pozytywny gdy ciąży nie ma i brak
wskazania ciąży gdy jest ciąża.
Cały przekrój sytuacji można przedstawić w tabelce:
wskaźnik\ Cecha
Kobieta jest w ciąży C+
Kobieta nie jest w ciąży
C-
Test daje wynik
pozytywny W+
Test daje wynik
negatywny W-
Wyobraźmy sobie że mamy 100 młodych kobiet (posługuję się liczbą 100 w tym pierwszym
przykładzie bo dla takiej liczby prawdopodobieństwo wyrażone w procentach jest tożsame z liczbą
kobiet), wszystkie one wykonały test ciążowy a 30 z nich jest w ciąży. Oznacza to że przed
wykonaniem testu prawdopodobieństwo że kobieta z naszej grupy jest w ciąży P(C+) wynosi 30/100
czyli 0.3 lub 30%. Aby wyliczyć prawdopodobieństwo zdarzenia dzielimy liczbę przypadków w
których to zdarzenie zachodzi (kobiet w ciąży w naszej grupie) przez liczbę wszystkich przypadków (
wszystkich kobiet w naszej grupie)
2
WSFiZ Materiały dydaktyczne Metodologia
P(C+) = 0.3
Oczywiście P(C-) – prawdopodobieństwo że kobieta nie jest w ciąży – wynosi 1- P(C+)=0.7 i można
je wyliczyć dzieląc liczbę kobiet nie w ciąży przez liczbę kobiet. Prawdopodobieństwo zdarzenia
przeciwnego do naszego zdarzenia zawsze wynosi 1-P
wskaźnik\ Cecha
Kobieta jest w ciąży
Kobieta nie jest w ciąży
Test daje wynik
pozytywny
Test daje wynik
negatywny
30
70
100
Wyobraźmy sobie bezbłędny test ciążowy (MATERNITY MAX)
Gdyby test ciążowy się nie mylił nigdy nasza tabelka wyglądałaby tak:
wskaźnik\ Cecha
Kobieta jest w ciąży
(C+)
Kobieta nie jest w ciąży
(C-)
Test daje wynik
pozytywny (W+)
30
0
30
Test daje wynik
negatywny (W-)
0
70
70
30
70
100
Prawdopodobieństwo warunkowe że kobieta jest w ciąży jeśli test dał wynik pozytywny wynosiłoby
P(C+| W+) = 30/30 = 1. (a P(C-|W+)=0/30=0)
Jak rozumieć prawdopodobieństwo warunkowe? Prawdopodobieństwo że kobieta jest w ciąży pod
warunkiem że test dał wynik pozytywny. Ograniczamy naszą uwagę tylko do sytuacji kiedy warunek
jest spełniony – czyli tylko do grupy kobiet dla których wynik testu okazał się pozytywny. Jest tych
kobiet w sumie 30. Wśród kobiet z wynikiem pozytywnym jest 30 kobiet w ciąży. Dla kobiety która
chce wiedzieć czy jest w ciąży informacja jest taka: na podstawie pozytywnego wyniku testu mam
pewność że jestem w ciąży. Inaczej, kobieta może powiedzieć „Niemożliwe żebym nie była w ciąży”,
ale to trudno zrozumieć bo za dużo w tym zdaniu NIE.
Prawdopodobieństwo, że kobieta nie jest w ciąży jeśli test dał wynik negatywny wyniosłoby
P(C-|W-)=70/70=1 (albo P(C+|W-)=0/70=0)
Mamy 70 kobiet dla których warunek (test dał wynik negatywny) jest spełniony. Wśród nich
wszystkie nie są w ciąży. Dlatego 70 dzielimy przez 70 i uzyskujemy 1. Dla kobiety która chce wiedzieć
czy jest w ciąży informacja jest taka: „na podstawie negatywnego wyniku testu uzyskałam pewność
że nie jestem w ciąży”. Inaczej kobieta może powiedzieć „Niemożliwe że jestem w ciąży”
3
WSFiZ Materiały dydaktyczne Metodologia
Niestety wszystkie lub niemal wszystkie pomiary cechy wskaźnikami obarczone są błędem. Oznacza
to, że w kratkach C-W+ i C+W- pojawią się jakieś osoby.
Wyobraźmy sobie test PRE TEST który dla naszych 100 kobiet daje takie odczyty:
wskaźnik\ Cecha
Kobieta jest w ciąży
(C+)
Kobieta nie jest w ciąży
(C-)
Suma osób
Test daje wynik
pozytywny (W+)
20
1
21
Test daje wynik
negatywny (W-)
10
69
79
Suma osób
30
70
100
Rzeczywistość się nie zmienia – nadal 30 ze 100 kobiet jest w ciąży. Zmienia się diagnoza
rzeczywistości – odczyt wskaźnika.
Czego dowiadujemy się na podstawie odczytu ze wskaźnika PRE TEST? Inaczej, jak zmienia się
prawdopodobieństwo że kobieta jest w ciąży gdy mamy dane ze wskaźnika?
Prawdopodobieństwo warunkowe, że kobieta jest w ciąży jeśli wskaźnik dał odczyt pozytywny:
Ile mamy teraz kobiet z odczytem pozytywnym? 21
Ile wśród tych kobiet jest w ciąży? 20
A zatem
P(C+|W+)=20/21= 0.95 (lub 95%).
Porównajmy to z prawdopodobieństwem że kobieta jest w ciąży przed testem P(C+) =0.3
Widać wyraźnie że nasza pewność na temat występowania cechy w przypadku odczytu pozytywnego
wyraźnie wzrasta. 0.95 to dużo więcej niż 0.3. Dla kobiety wykonującej test wynik pozytywny wiele
zmienia, ma ona teraz NIEMAL pewność, że jest w ciąży. (Jedna na około 20 kobiet będzie w błędzie)
Ale czego dowiadujemy się gdy wskaźnik da odczyt negatywny?
Jakie jest prawdopodobieństwo warunkowe, że kobieta nie jest w ciąży jeśli wynik testu jest
negatywny? Mamy 79 kobiet z wynikiem negatywnym. Wśród nich 69 nie jest w ciąży
P(C-|W-) = 69/79=0.87 (lub 87%).
Co wynik negatywny mówi kobiecie: przed wykonaniem testu wiedziała na 70% że nie jest w ciąży,
teraz wie na 87% że nie jest w ciąży. Widać, że jej wiedza nie zmieniła się radykalnie. (jedna na około
8 kobiet będzie w błędzie)
PRE TEST ma DUŻĄ MOC ODRZUCENIA: ogranicza prawdopodobieństwo, że wśród osób z
pozytywnym odczytem pojawią się osoby nie posiadające cechy – jest dobry w ODRZUCANIU osób,
4
WSFiZ Materiały dydaktyczne Metodologia
które nie mają cechy (w naszym przypadku kobiet które nie są w ciąży) – tylko jedna z 70 kobiet nie w
ciąży nie została odrzucona.
Teraz przyjrzyjmy się innemu testowi BABY BOOM
wskaźnik\ Cecha
Kobieta jest w ciąży
(C+)
Kobieta nie jest w ciąży
(C-)
Suma osób
Test daje wynik
pozytywny (W+)
29
20
49
Test daje wynik
negatywny (W-)
1
50
51
Suma osób
30
70
100
Ten test zachowuje się wyraźnie inaczej.
Jakie jest prawdopodobieństwo że kobieta jest w ciąży jeśli nasz nowy test dał wynik pozytywny?
Ile mamy kobiet z wynikiem pozytywnym testu? 49
Ile wśród nich jest kobiet w ciąży? 29
A zatem
P(C+|W+)=29/49=0.59 (59%)
Kobieta przed testem wiedziała, że na 30% jest w ciąży, teraz wie, że na 59% jest w ciąży. Trochę to
zmienia, ale niewiele.
A teraz co z kobietami którym test dał wynik negatywny?
Jakie jest prawdopodobieństwo że kobieta nie jest w ciąży jeśli test dał wynik negatywny? Kobiet z
wynikiem negatywnym mamy 51 a w śród nich 50 nie jest w ciąży
P(C-|W-)=50/51=0.98 (98%)
Na podstawie negatywnego wyniku testu kobieta uzyskuje niemal pewność że nie jest w ciąży.
Inaczej, negatywny wynik testu redukuje prawdopodobieństwo że kobieta nie jest w ciąży niemal do
0.
Mówimy, że BABY BOOM ma DUŻĄ MOC ZAWIERANIA: ogranicza prawdopodobieństwo że wśród
osób z negatywnym odczytem znajdą się osoby posiadające cechę – jest dobry w ZAWIERANIU osób
posiadających cechę. Tylko jedna osoba z 30 kobiet w ciąży nie została zawarta.
5
WSFiZ Materiały dydaktyczne Metodologia
Warto się pomyśleć który z testów BABY BOOM czy PRE TEST jest bardziej wartościowy z punktu
widzenia kobiety, która zastanawia się czy jest w ciąży. Jeśli kobieta prowadzi niezdrowy tryb życia
(np. pije alkohol i pali papierosy) i na podstawie wyniku testu podejmie decyzję o tym czy przestać
palić i pić, a także czy udać się na badania prenatalne.
W przypadku testu PRE TEST mamy taką sytuację: tylko jedna kobieta niepotrzebnie zawiesiła picie i
palenie i niepotrzebnie udała się na badania. Zmarnowała czas i pozbawiła się pozytywnych doznań
związanych z zażywaniem substancji psychoaktywnych. Tymczasem aż 10 kobiet które były w ciąży
nie przestały pić i palić, nie poszły na badania prenatalne i naraziły swoje dziecko na pojawienie się
poważnych wad rozwojowych.
W przypadku testu BABY BOOM sytuacja wygląda w sposób następujący: aż 20 kobiet bez potrzeby
zawiesiło picie i palenie i zmarnowało czas na badania. Za to tylko jedna kobieta w ciąży nie przestała
palić i pić, nie poszła na badania i naraziła swoje dziecko na pojawienie się wad rozwojowych.
Który test należałoby zatem polecać?
Teraz dwa inne przykłady z życia wzięte
2. Pijani kierowcy
Pierwszy odwołujący się bardziej do doświadczeń mężczyzn żeby nie czuli się poszkodowani:
Wyobraźmy sobie dwa alkomaty chińskiej produkcji, każdy w cenie 5.99 zł (Hang Dong i Lau Siau) Są
takie tanie bo zamiast dokonać ilościowego pomiaru stężenia alkoholu w wydychanym powietrzu
dają tylko dwa rodzaje informacji: dozwolone stężenie przekroczone (C+), dozwolone stężenie nie
przekroczone (C-).
Mamy grupę 500 mężczyzn którzy coś wypili i z skorzystali z obu alkomatów. Dodam jeszcze, że 100 z
nich ma przekroczone dozwolone stężenie alkoholu
Tak wygląda rozkład naszych mężczyzn dla alkomatu Hang Dong
wskaźnik\ Cecha
(C+)
(C-)
Suma osób
(W+)
95
80
175
(W-)
5
320
325
Suma osób
100
400
500
Tak wygląda rozkład naszych mężczyzn dla alkomatu Lau Siau
wskaźnik\ Cecha
(C+)
(C-)
Suma osób
(W+)
60
7
67
(W-)
40
393
433
Suma osób
100
400
500
6
WSFiZ Materiały dydaktyczne Metodologia
Proszę policzyć prawdopodobieństwo że mężczyzna ma przekroczone dozwolone stężenie alkoholu w
wydychanym powietrzu jeśli Lau Siau dał wynik pozytywny i jeśli Hang Dong dał wynik pozytywny i
prawdopodobieństwo że mężczyzna nie ma przekroczonego dozwolonego stężenia alkoholu jeśli Lau
Siau dał wynik negatywny oraz jeśli Hang Dong dał wynik negatywny. Proszę określić który z testów
ma dużą moc zawierania a który ma dużą moc odrzucenia
HANG DONG
P(C+|W+)=
P(C-|W-)=
Hang Dong ma …. ……. moc ……..
Lau Siau
P(C+|W+)=
P(C-|W-)=
Lau Siau ma …. ……. moc ……..
Z którego testu należałoby korzystać żeby uniknąć problemów na drodze?
CO wiemy o stanie mężczyzny dla którego oba testy dały wynik pozytywny (Hang Dong+ i Lau Siau+)?
CO wiemy o stanie mężczyzny z odczytem Hang Dong- i Lau Siau-?
CO wiemy o stanie mężczyzny z odczytem Hang Dong+ i Lau Siau-?
CO wiemy o stanie mężczyzny z odczytem Hang Dong- i Lau Siau+?
3. Analiza pirotechniczna
Kolejny przykład dotyczy śledztwa w sprawie katastrofy smoleńskiej. Mam nadzieję, że nikogo tutaj
nie obrażę, ale przykład jest idealny. Pokazuje jak rozumienie własności wskaźników przydaje się w
rozumieniu zdarzeń politycznych!
Biegli pirotechnicy używają do analizy próbek zebranych z różnych miejsc katastrof pod kątem
wystąpienia materiałów wybuchowych dwóch rodzajów narzędzi: Detektora XYZ15 i testu
laboratoryjnego PQR33. (tak jak dotychczas wszystkie dane i urządzenia są zmyślone)
Przeanalizowali obiema metodami 1456 próbek z różnych miejsc katastrof (nie tylko smoleńskiej). W
329 próbkach znajdują się materiały wybuchowe a tak wygląda rozkład przypadków dla obu testów
(C+ oznacza wystąpienie w próbce materiałów wybuchowych, C- brak tych materiałów, W+, W-
wskazania detektora i testu)
7
WSFiZ Materiały dydaktyczne Metodologia
XYZ15
wskaźnik\ Cecha
(C+)
(C-)
Suma przypadków
(W+)
127
345
472
(W-)
2
982
984
Suma przypadków
129
1327
1456
PQR33
wskaźnik\ Cecha
(C+)
(C-)
Suma przypadków
(W+)
64
4
68
(W-)
65
1323
1388
Suma przypadków
129
1327
1456
Proszę dokonać odpowiednich obliczeń i oszacowania mocy testów
XYZ15
P(C+|W+)=
P(C-|W-)=
XYZ 15 ma …. ……. moc ……..
PQR33
P(C+|W+)=
P(C-|W-)=
PQR33 ma …. ……. moc ……..
Którego testu należałoby użyć we wstępnej fazie śledztwa?
Którego testu należałoby użyć w końcowej fazie śledztwa?
Czy na podstawie pozytywnego wyniku testu XYZ15 można twierdzić, że w próbkach znajdują się
materiały wybuchowe?
Czy na podstawie negatywnego wyniku testu XYZ15 można twierdzić, że w próbkach nie znajdują się
materiały wybuchowe?
Czy na podstawie pozytywnego wyniku testu PQR33 można twierdzić, że w próbkach znajdują się
materiały wybuchowe?
Czy na podstawie negatywnego wyniku testu PQR33 można twierdzić, że w próbkach nie znajdują się
materiały wybuchowe?
8
WSFiZ Materiały dydaktyczne Metodologia
Co wiemy na temat próbki dla której XYZ15 dał wynik pozytywny (XYZ15+) a PQR33 także dał odczyt
pozytywny (PQR33+)?
CO wiemy na temat próbki z odczytem XYZ15-, PQR33-?
CO wiemy na temat próbki z odczytem XYZ15+, PQR33-?
CO wiemy na temat próbki z odczytem XYZ15-, PQR33+?