Materiały dodatkowe do zajęć z metodologii WSKA¬NIKI

background image

1

WSFiZ Materiały dydaktyczne Metodologia

Materiały dodatkowe do zajęć z metodologii

WSFIZ 2012

Wskaźniki

Prowadzący: Andrzej Tarłowski antarlow@gmail.com

W poniższym materiale przedstawiam pojęcie prawdopodobieństwa warunkowego i mocy
odrzucenia oraz zawierania wskaźników w trzech przykładach.

1. Ciąża

Wyobraźmy sobie cechę która ma dwie wartości występuje lub nie i wskaźnik, który daje dwa rodzaje
odczytu – odczyt pozytywny lub negatywny. Niech naszą cechą będzie ciąża – cecha ta ma dwie
wartości – kobieta może być w ciąży lub nie być w ciąży innej opcji nie ma.

Wskaźnikiem jest test ciążowy który ma dwa możliwe odczyty – ciąża lub brak ciąży.

Odczyt ze wskaźnika nie jest jednoznaczny z faktyczną ciążą lub jej brakiem. Jeśli test ciążowy daje
odczyt pozytywny (ciąża) to może być tak że kobieta jest w ciąży lub nie jest w ciąży. Jeśli test ciążowy
daje odczyt negatywny (brak ciąży) to kobieta może nie być w ciąży ale może też być w ciąży. Test
może dać wynik poprawny – zasygnalizować istniejącą ciążę lub zasygnalizować brak ciąży gdy jej nie
ma. Może też dać odczyt błędny – fałszywy alarm- odczyt pozytywny gdy ciąży nie ma i brak
wskazania ciąży gdy jest ciąża.

Cały przekrój sytuacji można przedstawić w tabelce:

wskaźnik\ Cecha

Kobieta jest w ciąży C+

Kobieta nie jest w ciąży
C-

Test daje wynik
pozytywny W+

Test daje wynik
negatywny W-


Wyobraźmy sobie że mamy 100 młodych kobiet (posługuję się liczbą 100 w tym pierwszym
przykładzie bo dla takiej liczby prawdopodobieństwo wyrażone w procentach jest tożsame z liczbą
kobiet), wszystkie one wykonały test ciążowy a 30 z nich jest w ciąży. Oznacza to że przed
wykonaniem testu prawdopodobieństwo że kobieta z naszej grupy jest w ciąży P(C+) wynosi 30/100
czyli 0.3 lub 30%. Aby wyliczyć prawdopodobieństwo zdarzenia dzielimy liczbę przypadków w
których to zdarzenie zachodzi (kobiet w ciąży w naszej grupie) przez liczbę wszystkich przypadków (
wszystkich kobiet w naszej grupie)

background image

2

WSFiZ Materiały dydaktyczne Metodologia

P(C+) = 0.3

Oczywiście P(C-) – prawdopodobieństwo że kobieta nie jest w ciąży – wynosi 1- P(C+)=0.7 i można
je wyliczyć dzieląc liczbę kobiet nie w ciąży przez liczbę kobiet. Prawdopodobieństwo zdarzenia
przeciwnego do naszego zdarzenia zawsze wynosi 1-P

wskaźnik\ Cecha

Kobieta jest w ciąży

Kobieta nie jest w ciąży

Test daje wynik
pozytywny

Test daje wynik
negatywny

30

70

100

Wyobraźmy sobie bezbłędny test ciążowy (MATERNITY MAX)

Gdyby test ciążowy się nie mylił nigdy nasza tabelka wyglądałaby tak:

wskaźnik\ Cecha

Kobieta jest w ciąży
(C+)

Kobieta nie jest w ciąży
(C-)

Test daje wynik
pozytywny (W+)

30

0

30

Test daje wynik
negatywny (W-)

0

70

70

30

70

100

Prawdopodobieństwo warunkowe że kobieta jest w ciąży jeśli test dał wynik pozytywny wynosiłoby

P(C+| W+) = 30/30 = 1. (a P(C-|W+)=0/30=0)

Jak rozumieć prawdopodobieństwo warunkowe? Prawdopodobieństwo że kobieta jest w ciąży pod
warunkiem że test dał wynik pozytywny. Ograniczamy naszą uwagę tylko do sytuacji kiedy warunek
jest spełniony – czyli tylko do grupy kobiet dla których wynik testu okazał się pozytywny. Jest tych
kobiet w sumie 30. Wśród kobiet z wynikiem pozytywnym jest 30 kobiet w ciąży. Dla kobiety która
chce wiedzieć czy jest w ciąży informacja jest taka: na podstawie pozytywnego wyniku testu mam
pewność że jestem w ciąży. Inaczej, kobieta może powiedzieć „Niemożliwe żebym nie była w ciąży”,
ale to trudno zrozumieć bo za dużo w tym zdaniu NIE.

Prawdopodobieństwo, że kobieta nie jest w ciąży jeśli test dał wynik negatywny wyniosłoby

P(C-|W-)=70/70=1 (albo P(C+|W-)=0/70=0)

Mamy 70 kobiet dla których warunek (test dał wynik negatywny) jest spełniony. Wśród nich
wszystkie nie są w ciąży. Dlatego 70 dzielimy przez 70 i uzyskujemy 1. Dla kobiety która chce wiedzieć
czy jest w ciąży informacja jest taka: „na podstawie negatywnego wyniku testu uzyskałam pewność
że nie jestem w ciąży”. Inaczej kobieta może powiedzieć „Niemożliwe że jestem w ciąży”

background image

3

WSFiZ Materiały dydaktyczne Metodologia

Niestety wszystkie lub niemal wszystkie pomiary cechy wskaźnikami obarczone są błędem. Oznacza
to, że w kratkach C-W+ i C+W- pojawią się jakieś osoby.

Wyobraźmy sobie test PRE TEST który dla naszych 100 kobiet daje takie odczyty:

wskaźnik\ Cecha

Kobieta jest w ciąży
(C+)

Kobieta nie jest w ciąży
(C-)

Suma osób

Test daje wynik
pozytywny (W+)

20

1

21

Test daje wynik
negatywny (W-)

10

69

79

Suma osób

30

70

100

Rzeczywistość się nie zmienia – nadal 30 ze 100 kobiet jest w ciąży. Zmienia się diagnoza
rzeczywistości – odczyt wskaźnika.

Czego dowiadujemy się na podstawie odczytu ze wskaźnika PRE TEST? Inaczej, jak zmienia się
prawdopodobieństwo że kobieta jest w ciąży gdy mamy dane ze wskaźnika?

Prawdopodobieństwo warunkowe, że kobieta jest w ciąży jeśli wskaźnik dał odczyt pozytywny:

Ile mamy teraz kobiet z odczytem pozytywnym? 21

Ile wśród tych kobiet jest w ciąży? 20

A zatem

P(C+|W+)=20/21= 0.95 (lub 95%).

Porównajmy to z prawdopodobieństwem że kobieta jest w ciąży przed testem P(C+) =0.3

Widać wyraźnie że nasza pewność na temat występowania cechy w przypadku odczytu pozytywnego
wyraźnie wzrasta. 0.95 to dużo więcej niż 0.3. Dla kobiety wykonującej test wynik pozytywny wiele
zmienia, ma ona teraz NIEMAL pewność, że jest w ciąży. (Jedna na około 20 kobiet będzie w błędzie)

Ale czego dowiadujemy się gdy wskaźnik da odczyt negatywny?

Jakie jest prawdopodobieństwo warunkowe, że kobieta nie jest w ciąży jeśli wynik testu jest
negatywny? Mamy 79 kobiet z wynikiem negatywnym. Wśród nich 69 nie jest w ciąży

P(C-|W-) = 69/79=0.87 (lub 87%).

Co wynik negatywny mówi kobiecie: przed wykonaniem testu wiedziała na 70% że nie jest w ciąży,
teraz wie na 87% że nie jest w ciąży. Widać, że jej wiedza nie zmieniła się radykalnie. (jedna na około
8 kobiet będzie w błędzie)

PRE TEST ma DUŻĄ MOC ODRZUCENIA: ogranicza prawdopodobieństwo, że wśród osób z
pozytywnym odczytem pojawią się osoby nie posiadające cechy – jest dobry w ODRZUCANIU osób,

background image

4

WSFiZ Materiały dydaktyczne Metodologia

które nie mają cechy (w naszym przypadku kobiet które nie są w ciąży) – tylko jedna z 70 kobiet nie w
ciąży nie została odrzucona.

Teraz przyjrzyjmy się innemu testowi BABY BOOM

wskaźnik\ Cecha

Kobieta jest w ciąży
(C+)

Kobieta nie jest w ciąży
(C-)

Suma osób

Test daje wynik
pozytywny (W+)

29

20

49

Test daje wynik
negatywny (W-)

1

50

51

Suma osób

30

70

100

Ten test zachowuje się wyraźnie inaczej.

Jakie jest prawdopodobieństwo że kobieta jest w ciąży jeśli nasz nowy test dał wynik pozytywny?

Ile mamy kobiet z wynikiem pozytywnym testu? 49

Ile wśród nich jest kobiet w ciąży? 29

A zatem

P(C+|W+)=29/49=0.59 (59%)

Kobieta przed testem wiedziała, że na 30% jest w ciąży, teraz wie, że na 59% jest w ciąży. Trochę to
zmienia, ale niewiele.

A teraz co z kobietami którym test dał wynik negatywny?

Jakie jest prawdopodobieństwo że kobieta nie jest w ciąży jeśli test dał wynik negatywny? Kobiet z
wynikiem negatywnym mamy 51 a w śród nich 50 nie jest w ciąży

P(C-|W-)=50/51=0.98 (98%)

Na podstawie negatywnego wyniku testu kobieta uzyskuje niemal pewność że nie jest w ciąży.
Inaczej, negatywny wynik testu redukuje prawdopodobieństwo że kobieta nie jest w ciąży niemal do
0.

Mówimy, że BABY BOOM ma DUŻĄ MOC ZAWIERANIA: ogranicza prawdopodobieństwo że wśród
osób z negatywnym odczytem znajdą się osoby posiadające cechę – jest dobry w ZAWIERANIU osób
posiadających cechę. Tylko jedna osoba z 30 kobiet w ciąży nie została zawarta.

background image

5

WSFiZ Materiały dydaktyczne Metodologia

Warto się pomyśleć który z testów BABY BOOM czy PRE TEST jest bardziej wartościowy z punktu
widzenia kobiety, która zastanawia się czy jest w ciąży. Jeśli kobieta prowadzi niezdrowy tryb życia
(np. pije alkohol i pali papierosy) i na podstawie wyniku testu podejmie decyzję o tym czy przestać
palić i pić, a także czy udać się na badania prenatalne.

W przypadku testu PRE TEST mamy taką sytuację: tylko jedna kobieta niepotrzebnie zawiesiła picie i
palenie i niepotrzebnie udała się na badania. Zmarnowała czas i pozbawiła się pozytywnych doznań
związanych z zażywaniem substancji psychoaktywnych. Tymczasem aż 10 kobiet które były w ciąży
nie przestały pić i palić, nie poszły na badania prenatalne i naraziły swoje dziecko na pojawienie się
poważnych wad rozwojowych.

W przypadku testu BABY BOOM sytuacja wygląda w sposób następujący: aż 20 kobiet bez potrzeby
zawiesiło picie i palenie i zmarnowało czas na badania. Za to tylko jedna kobieta w ciąży nie przestała
palić i pić, nie poszła na badania i naraziła swoje dziecko na pojawienie się wad rozwojowych.

Który test należałoby zatem polecać?

Teraz dwa inne przykłady z życia wzięte

2. Pijani kierowcy

Pierwszy odwołujący się bardziej do doświadczeń mężczyzn żeby nie czuli się poszkodowani:

Wyobraźmy sobie dwa alkomaty chińskiej produkcji, każdy w cenie 5.99 zł (Hang Dong i Lau Siau) Są
takie tanie bo zamiast dokonać ilościowego pomiaru stężenia alkoholu w wydychanym powietrzu
dają tylko dwa rodzaje informacji: dozwolone stężenie przekroczone (C+), dozwolone stężenie nie
przekroczone (C-).

Mamy grupę 500 mężczyzn którzy coś wypili i z skorzystali z obu alkomatów. Dodam jeszcze, że 100 z
nich ma przekroczone dozwolone stężenie alkoholu

Tak wygląda rozkład naszych mężczyzn dla alkomatu Hang Dong

wskaźnik\ Cecha

(C+)

(C-)

Suma osób

(W+)

95

80

175

(W-)

5

320

325

Suma osób

100

400

500

Tak wygląda rozkład naszych mężczyzn dla alkomatu Lau Siau

wskaźnik\ Cecha

(C+)

(C-)

Suma osób

(W+)

60

7

67

(W-)

40

393

433

Suma osób

100

400

500

background image

6

WSFiZ Materiały dydaktyczne Metodologia

Proszę policzyć prawdopodobieństwo że mężczyzna ma przekroczone dozwolone stężenie alkoholu w
wydychanym powietrzu jeśli Lau Siau dał wynik pozytywny i jeśli Hang Dong dał wynik pozytywny i
prawdopodobieństwo że mężczyzna nie ma przekroczonego dozwolonego stężenia alkoholu jeśli Lau
Siau dał wynik negatywny oraz jeśli Hang Dong dał wynik negatywny. Proszę określić który z testów
ma dużą moc zawierania a który ma dużą moc odrzucenia

HANG DONG

P(C+|W+)=

P(C-|W-)=

Hang Dong ma …. ……. moc ……..

Lau Siau

P(C+|W+)=

P(C-|W-)=

Lau Siau ma …. ……. moc ……..

Z którego testu należałoby korzystać żeby uniknąć problemów na drodze?

CO wiemy o stanie mężczyzny dla którego oba testy dały wynik pozytywny (Hang Dong+ i Lau Siau+)?

CO wiemy o stanie mężczyzny z odczytem Hang Dong- i Lau Siau-?

CO wiemy o stanie mężczyzny z odczytem Hang Dong+ i Lau Siau-?

CO wiemy o stanie mężczyzny z odczytem Hang Dong- i Lau Siau+?

3. Analiza pirotechniczna

Kolejny przykład dotyczy śledztwa w sprawie katastrofy smoleńskiej. Mam nadzieję, że nikogo tutaj
nie obrażę, ale przykład jest idealny. Pokazuje jak rozumienie własności wskaźników przydaje się w
rozumieniu zdarzeń politycznych!

Biegli pirotechnicy używają do analizy próbek zebranych z różnych miejsc katastrof pod kątem
wystąpienia materiałów wybuchowych dwóch rodzajów narzędzi: Detektora XYZ15 i testu
laboratoryjnego PQR33. (tak jak dotychczas wszystkie dane i urządzenia są zmyślone)

Przeanalizowali obiema metodami 1456 próbek z różnych miejsc katastrof (nie tylko smoleńskiej). W
329 próbkach znajdują się materiały wybuchowe a tak wygląda rozkład przypadków dla obu testów
(C+ oznacza wystąpienie w próbce materiałów wybuchowych, C- brak tych materiałów, W+, W-
wskazania detektora i testu)

background image

7

WSFiZ Materiały dydaktyczne Metodologia

XYZ15

wskaźnik\ Cecha

(C+)

(C-)

Suma przypadków

(W+)

127

345

472

(W-)

2

982

984

Suma przypadków

129

1327

1456

PQR33

wskaźnik\ Cecha

(C+)

(C-)

Suma przypadków

(W+)

64

4

68

(W-)

65

1323

1388

Suma przypadków

129

1327

1456

Proszę dokonać odpowiednich obliczeń i oszacowania mocy testów

XYZ15

P(C+|W+)=

P(C-|W-)=

XYZ 15 ma …. ……. moc ……..

PQR33

P(C+|W+)=

P(C-|W-)=

PQR33 ma …. ……. moc ……..

Którego testu należałoby użyć we wstępnej fazie śledztwa?

Którego testu należałoby użyć w końcowej fazie śledztwa?

Czy na podstawie pozytywnego wyniku testu XYZ15 można twierdzić, że w próbkach znajdują się
materiały wybuchowe?

Czy na podstawie negatywnego wyniku testu XYZ15 można twierdzić, że w próbkach nie znajdują się
materiały wybuchowe?

Czy na podstawie pozytywnego wyniku testu PQR33 można twierdzić, że w próbkach znajdują się
materiały wybuchowe?

Czy na podstawie negatywnego wyniku testu PQR33 można twierdzić, że w próbkach nie znajdują się
materiały wybuchowe?

background image

8

WSFiZ Materiały dydaktyczne Metodologia

Co wiemy na temat próbki dla której XYZ15 dał wynik pozytywny (XYZ15+) a PQR33 także dał odczyt
pozytywny (PQR33+)?

CO wiemy na temat próbki z odczytem XYZ15-, PQR33-?

CO wiemy na temat próbki z odczytem XYZ15+, PQR33-?

CO wiemy na temat próbki z odczytem XYZ15-, PQR33+?


Wyszukiwarka

Podobne podstrony:

więcej podobnych podstron