Statystyka- nauka dot ilośc met bad zjaw (proc) mas. O zjaw mas mów, gdy bad podl wystarcz duża l jedn. Prawidłowości ujawn w drodze obserw zjaw mas- prawidł statyst. Przedm bad stat są określ zbior os, rzecz i zjaw. Zbior stat[n] (pop/ masa stat)- zbiór dowol el objęt Bad stat. Jedn stat– poszczeg el skład bad pop. Cechy stat- właśc jedn wchodz w skład bad zbior. Podz: stałe i zmien. C.stałe [Xst]– określ jedn pod wzgl rzecz(co?), czas(kiedy?) oraz przestrzen (gdzie?). wspólne dla wszystk jedn w bad zbior. Nie podleg bad, decyd o zalicz jedn do danej zbior. C.zmienne [Xzm]– właściw którymi różnią się poszczeg jedn stat. określ jako zmienna los. W każd bad stat l.cech zmien >1. Podział: *jak (niemierz)– nie można zmierz a określ się tylko słown (np. płeć). Można je wyr w różn miar np. cm, lat, zł, *iloś (mierz)- podz na: zmien skok [wart można wyr jedyn w licz zmien się skok np: l.student w gr; Cechy skok, które przyjm b duże wart- cech quasi ciągłymi np: zarobki prac wyraż w gr], zm ciągłe [przyjm każdą wart z określ przedz liczb: wiek, wzrost, waga]. Zbior statyst [n]– taki zbiór jedn, który podleg obserw statyst i który char się takimi samymi wariant przynajm 1 cechy stał oraz różnymi Przyn 1cech zmien. Cech char poszczeg jedn zbior różne warianty (rodz). Np: cech jak, płeć 2wariant: kobieta i mężcz- dwudzieln (dychotomicznym) podz. wariantom cechy przyporz się wart 0 i 1, 1- wystep cennego wariant u cech, 0 brak- zmienna 0– jedynkowej. Liczb cech podd bad zbior statyst podz: 1wymiarowe (jednocech), wielo- (wielocech). Pomiar: określ jest wlk (nasil) bad zmien. Pol na podporz cech statyst ustal symb, którymi mogą być l, litery, kolor, form geometr itp. W stat cech stat najcz podporz się l, które powin wiern odzwierc mierz zmien np: cieżar[g], dł[m], czas[s]- pomiar bezpośred. SKALE POMIAR: 1.Niemetr (jakośc): *nominal, *porządk (rangowa). 2.Metrycz (ilośc): *przedział (interwał), *stosunk. S.nominal najmniej precyz spos pomiar. L pełnią rolę umown symb służ do ident jedn w cel ich klasyf do określ gr. Jedyn oper matem zalicz jedn w obręb gr i oblicz np. prop, odset itp. S.porządk (rang)- wszystk cech skali nom, pozwal na podporz jedn w obręb gr pod wzgl natęż bad cechy. stwierdz typ: większ niż, mniej niż. liczby, zwan rang, wyzn kolejn występ jedn, nie określ odleg między nimi. Podporządk jedn wg bad cechy przy wyk rang- uporządk słabym/ mocn. U.słabe- występ rel między jedn typ: mniejsz bądź = i więks bądź =. U.mocne- char je relac typ większ/ mniejsz. W s.porządk (rang) określ są: kl owoc i warzyw; mlek; jaj, 9-stop skala Richtera; stop wojsk, miejsca na zawod, wykształć; prefer konsum. S.przedział (interwał)– zach właśc s.porządk, dod umożl określ odleg (dystan) między jedn. Jednak różnic między stop właśc bad jedn odpow jednak różn między przyporz im liczb. pnkt zerowy jest ustal arbitralnie– brak jest 0 absol. S.stos (iloraz) właśc3 poprzed skal, cech char jest posiad nat pnktu zerow- oznacza brak danej cechy. Umożl dokon wszystk oper matem. mierzy się: wiek, dochod, wielk sprzed, dł, ciężar, wielk zaniecz. Wszystk 4skale kumulatyw char tzn. char się narast stop dokład pomiar. Każda skala jest mocn od poprzed. Zaw wszyst własn poprzed oraz dod. Rodz Bad stat: metody: 1.bad pełne (całk)– obejm wszystk jedn danej zbior statyst, 2.niepełn (częśc)– obejm niektóre jedn zbior statyst, 3.szacunki interpol i ekstrapolac. Bad pełne i częśc mogą być: ciągłe (ewiden ur, pracow w firm), okres (podejm w ścisł odstęp czas– co10 lat powsz spis ludn), doraźn (w sytuac szczeg straty mat spow klęsk). Bad pełne: spis statyst(doraź/ okres obej wszystk jedn zbior stat), rejestr bież (system not określ fakt będąc przed bad– ruch wędr ludn). Bad częściowe: ankiet (info zbier za pom ankiet rozesł do określ os, instyt), monograf (szczeg opis i anal wybr jedn stat, wybr jako typ dla danej zbior), reprez– częścio bad stat opart na prób pobr ze zbior w spos los- najb prawidł form bad stat. Brak możliw zastos bad bezp- szacunek statyst- ustal wielk/ właśc nieznan zbior na podst zbior znanej i pozost z nią w określ zw. Met szacunku: interpolacja (rach interpol)– oszac znanych wart sąsied (wcześniej/ późn-ych), ekstrapolacja (r.ekstrapol)– szac wart wykracz poza przedz wart znan. Mogą mieć char liniowy/ nie-. Interpol i ekstrapol liniowa opiera się na założ propor rozkład wart cech pomiędzy liczeb/ jedn czasu.
ORG BAD STAT: etap: przygot (program) bad, obserw stat, oprac i prezent mat stat, opis/ wniosk stat. IE: czyn przygot: ust cel i met bad, określ zbior stat i cech podleg bad, zdefin jedn stat i sprawozd. Zbior i jedn stat ściśle określ pod wzg: rzecz (co), czas (kiedy), przestrzen (gdzie). Jedn sprawozda: jedn, któr posiad odpow źród info niezbęd w bad (firmy, instyt). IIE: obserw: ustal wart cech il, lub odmian cech jak wszystk jedn tworz zbior stat. odbyw za pomoc: bezp pom, zbier info od jedn sprawozd. Zbiór dan uzysk w wyn obserw- materiał stat. dane gromadz specjal do cel bad stat- materiał pierw (np. dane zbier przy spis powsz). dane grom z in powodów, wyk do Bad stat- mat wtórny (dane o podatnik). Zebr mat stat tworzą surowy mat stat, który obciąż jest pewn błęd. Błędy: systemat- zniekszt tendenc (zawyż/ zaniż dane sumar w stos do rzecz), przypadk- nieumyśl (nieuwag, niedbal, niewiedz). IIIE- Oprac mat stat, które dzieli się na: gr-nie, zlicz. Gr-nie– wyodręb jednorod cech w ramach większ zbior np. wg płci, stanu cyw. Jedn zal do tej sam gr nie powin być zbyt zróżn pod wzgl bad cech i l gr nie powin być zbyt duża. Jednolit syst grup- klasyfikacja. Gr-nie podz: proste- względ 1 cechy (podz studen ze wzg na płeć), złoż- wzgl kilku cech (podz stud ze wzgl na przynal do gr admin oraz śred), lub na: typologiczne- [wyodręb jednorod gr na podst wariant cech jak (podz ludzi akt zawod wg gr społ-ekon prac na pełn etac w spółdz rol], wariancyjne [opier się na cech il (podz stud 1rocznik wg mca ur)].
SZEREG STAT- uporząd zbiór wynik obserw wg pewnej cechy. Służy do prezent mat stat, może być przedst w postaci tabl i wykres. może być: nieuporząd (wart/ cechy jedn spis wg kolejn bad); uporządk (w określ spos– wg mal/ rosnąc wart). Klasyfik: 1.szczeg (wylicz), 2.rozdziel (struktur): a)cech mierz: punkt, przedział (kl), b)cech niemierz, 3.przestrzen (geograf), 4.czaso(dynam): a)moment, b)okres. Sz.szczegół– prez mat stat uporządk wył wg wart bad cech (mal/ rosn). Sz.rozdziel- zbiór wart l uporząd wg wariant bad cechy mierz/ nie-, poszczeg wariant zmien przyporz są odpow im liczebn. określ struk bad zbior. Tworząc sz.rozdziel na podst cechy mierz, jej wariant określ punktowo/ przedział. Sz.rozdziel punkt bud się dla cechy skok. Sz.rozdziel przedział– plan się na począt bad (bez uniw zalec stat). Szer ten powin być zbud, aby klasyf dan przeprow była w spos: rozłącz (poszczeg przedz nie mogą zach na siebie),wyczerp (kl powin obejm wszystk jedn bad zbior). L.przedział (kl) zal od: liczeb zbior, zmien bad cech. Zbyt mała l.kl- zbyt skondens mat stat (zacier prawidł rozkł zmien). zbyt duża- nadmier szczeg, utrud anal i wyciąg wniosk. L.kl: prawidł dobor odpow il: Yulle i Kendall– 15-25 (nie mniej niż 10jedn ale dop również 100), Szulc– 10-20 (nie mniej niż 10, dop 100), Zając– 4-6 (przy liczeb 40-60 jedn), -7-10 (przy l 60-100); 9-12 (przy l 100-200), 12-17 (200-500jedn). wzor do wylicz orient l kl w zal od licz zbior: k=1+3,322logn (k- l.kl, n-l.zbior). Rozpięt przedział= dług, interwał/ rozstęp przedział- różnica między górn i dol gran kl. Jest uwar obszar zmien bad cechy, l.ustal kl. i = xmax – xmin /k (i = xmax – xmin / 1+3,322 log n, i- interw przedz, k- l.kl, xmax- najwięk wart cech, xmin- najmn). Szer przestrzen (geog/ teryt)– przedst rozmieszcz wielk stat wg jedn admin np.: woj, państ, cz świat. Sz.dynam (czas– chronol)– prez rozwój zjaw w czas. IVE: form: opis stat, wniosk stat. Opis stat- dot tylko danej zbior gener/ próby. char sumar- nie odnosi się do poszcz jedn ale do całej zbior. dok za pom odpow miar: śred aryt, odchyl stand, współ korel. Wniosk stat- ma miejsce gdy bad jest reprezent (próba los) i jego wyn są uogól na całą pop, z której zost pobr próba. Możliw uogól wynik z próby los na całą pop daje rach prawdopod. Po oblicz char liczb można przystąp do analiz: struktury (estym przedział– przedz ufności),
współzal zjaw mas (korel, regresje, Chi-kwadrat), dynam zjaw los (szer dynam, indek zespoł). Cel bad stat- realiz 1/kilku zad: poznanie rozkład zbior pod wzgl wybr/ wyb-ych cech (analiz strukt), ocen rodz zw występ między cech (a.współzal), poznanie zmian zbior w czasie (a.dynam).
Stat opis: Podst anal dan powinna doprow do zwięzł przedst ogól char istot właśc bad zbior.L.dające taki sumar opis zbior-param stat. Param tak char zbior, że porówn różnych zbior stat można sprow do ich porównań. Podst zad param opis: 1.określ przecięt rozm i rozmieszcz wart zmien, 2.określ granic obszar zmien wart zmien, 3.określ skup i spłaszcz oraz stop zmian od ideal symetrii Rozkł empir 1 zmien- podporządk kolej wart zmien (x) odpow im liczeb(n). odzwiercied strukt bad zbior z pnku widz określ cech. ustal na podst konkret obserw. Od rodz rozkł empir zal dobór odpow stat służ do opis zbior. Rozkłady empir: 1.cechy skok: a)wielomod, b)jednomod: *symetrycz: -norm, -leptokurtyczne (spłaszcz), -plato- (wysmókły), *umiark symetr: -prawoskośne, -lewo-, *skraj symetr: -praw-, -lewo, 2.cech ciągł: a)1mod: j.w, b)wielomod. R.jednomod- krzywa liczebn (dla cechy ciągłej)/diagram (skok) ma 1maksim. R.symetr jednomod- liczebn odpow wart zmien rozkład się symetr wokół liczeb najwięk. R.asymetr- liczebn mogą się skup wokół nis/ wys wart cech. mogą być: umiark asymetr, skrajnie asym. R.asymetr prawostron (skośny) dużo jedn posiad stos nis wart cechy, niewiele jedn ma wys wart. R.asym lewostr (skośny)- stos niewiele jedn nis wart cechy, liczne występ jedn o ich wys wart. Rozkł w których praw wszyst jedn mają nis/ wys wart cechy- r.skrajnie asym- rozkład jednostr względ wart cechy o max liczeb. rozkł kompoz 2rozkład asym- r.U/ siodłow. R.bimod- o wyraźn zarys 2punkt skup obserw. Rozkłady mając więc niż 2maks lokalne- wielomodaln. R.symetrycz i umiark asymetr char zbior jednorod ze wzg na bad cech. R.asymetr, wielomod i siodł dot zbior, w których cech są znacz zróżnic.
Miary przy opis strukt zbior: m.średnie (położ/ przeciętne/ poziom zmien)- określ tej wart zmien opis przez rozkład, wokół której skup się wszyst pozost wart zmien, m.rozprosz ( zmienności, zróżnic, dyspersji)- bad stop zróżnic wart zmien, m.asymetrii (skośności)- bad kier zróżnic wart zmien, m.koncentr- bad stop nierównomier rozkł ogól sumy wart zmien pomiędzy poszczeg jedn zbior, -anal stop skup poszczeg jedn wokół śred. Char opis: Pozwal w spos syntet określ właśc bad rozkład i dok porówn różn zbior. Wyróż się porówn: porów 2różn zbior pod wzgl tej sam cechy Bad; porówn dot 1 zbior 2 różn cech.
Miary średnie: M.położ: 1.śred klasycz: śred aryt, harm, geometr, 2.modal, 3.kwartyle, 4.kwintyle 5.decyle, 6.centyle, 7.percentyle. Śred arytma- suma wart zmien wszystk jedn Bad zbior podziel przez l wszystk jedn. Geometr- bad śred tempa zmian. harmon- stos kiedy wart zmien pod są w jedn względ np: km/h, osób/km. Modalna [Mo]- wart cechy, która w rozkł empir występ najczęściej. W szer szczeg i rozdziel tej wart cechy odpow najwięk liczeb. Kwantyle- wart cech bad zbior, które dziel się na określ cz pod wzgl l jedn. Cz te mogą być = lub pozost do siebie w określ prop. 1.kwartyle: pierwszy/dolny, drugi/ miediany, trzeci/ górn.2.Decyle- dziel zbior na 10cz pod wzgl licz. 3.Centyle (percentyle)100cz. Miary zmien to zjaw mas uwar dział: przyczyn głów (wywoł zmien stat), ubocznych (wywoł zmien przypadk).
Liczbowy rozmiar badanego zjawiska masowego może być zatem rozłożony na dwa składniki, będące rezultatami zmienności systematycznej i przypadkowej. Przybliż miernik skład system zbior stat są miary średnie. Odchyl poszczeg wart jedn od wart śred powst pod wpł przyczyn przypadk. Do pomiar tych odchyl wyk się miary zmien (zróżnicowania, dyspersji, rozproszenia), które info o zmieni bad cechy.Dyspers- zróżnic jedn zbior stat ze wzgl na wart bad cech. Miary zmien: bezwzgl (absol), względ (relat). bezwzgl miary: obszar zmien, warianc, odchyl stand, przecięt, ćwiartk. Odchyl przecięt– o ile wszystk jedn dan zbior różnią się śred ze wzgl na wart zmien od śred arytm tej zmien. jest śred aryt bezwzgl wart (moduł) odchyl wart cech od jej śred arytm. Wariancja- śred arytm z kwadrat odchyl poszczeg wart cechy od śred arytm całej zbior. Odchyl stand jest pierw kwadrat z wariancji; określa, o ile wszystk jedn bad zbior różnią się śred ze wzgl na wart bad zmien od śred aryt tej zmien. reguła trzech sigm- wystąp obserw o wart cechy spoza przedziału jest mało prawdop. Wg tej reg blisko 3część wszystk obserw wart zmienj rózni się od śred arytm o więcej niż +/- s, ok1 na 20obserw przekr tę śred o +/-2s, a tylko 1na 370 przekr śred arytm o +/-3s. w anal dyspers powsz stos się względ miarę zróżnic– współczyn zmien- iloraz bezwzgl miary dyspers do odpow wart śred. wyraż w %. info o sile dyspers. Duże wart liczb świad o niejednorod zbior.
Statystyka a prawdopodobieństwo:
*rachunek prawdopodobieństwa– statystyka,
*zmienna losowa– cecha,
*prawdopodobieństwo– częstość względna,
*dystrybuanta zmiennej losowej– dystrybuanta empiryczna,
*rozkład zmiennej losowej– rozkład empiryczny.
Elementy rachunku prawdopodobieństwa:
Rachunek prawdopodobieństwa zajmuje się badaniem praw rządzących zdarzeniami losowymi (przypadkowymi).
Doświadczenie nazywamy losowym, jeżeli pomimo sprecyzowania warunków, w których jest ono realizowane nie jesteśmy w stanie przewidzieć jego wyniku.
Z każdym doświadczeniem losowym związany jest zbiór zdarzeń najprostszych – wyników doświadczenia, tzw. zdarzeń elementarnych i oznaczamy przez omegę (Ω).
Zdarzenia elementarne (małą omegę ω) mają własności:
*dane zdarzenie elementarne może zajść lub nie,
*jedno ze zdarzeń elementarnych na pewno zajdzie,
*zajście jednego zdarzenia elementarnego wyklucza zajście innego zdarzenia elementarnego w tym samym doświadczeniu.
Przykłady:
1)Rzucamy monetą. Zbiór zdarzeń elementarnych Ω składa się z dwóch elementów ω1 i ω2 (orzeł lub reszka) Ω={ω1, ω2}.
2)Rzucamy kostką symetryczną do gry. Elementów jest 6: Ω={ω1, ω2, ω3, ω4, ω5, ω6}. Zdarzenie polegające na wyrzuceniu i- oczek, gdzie i = E -{ω1, ω2, ω3, ω4, ω5, ω6}.
Dwukrotny rzut monetą. Ω={(o, o); (o, r); ( r, o); (r, r)}, przedziału 0-1.
Zdarzenie polegające na wyrzuceniu i-oczek, ganc i E{1,2,3,4,5,6}.
Każdy podzbiór przestrzeni zdarzeń elementarnych nazywamy zdarzeniem losowym.
(np. zdarzenie polegające na wyrzuceniu parzystej liczby oczek Ω={ω2, ω4, ω6}).
Różnicą zdarzeń A i B (A-B, A/B) nazywamy zdarzenie oznaczone A-B, które składa się z tych wszystkich zdarzeń elementarnych, które należą do A i nie należą do B.
Czyli polegające na zajściu zdarzenia A i nie zajściu zdarzenia B.
Przykład:
A-padła parzysta liczba oczek,
B-wypadła liczba oczek większa niż 3.
A-B = {e2, e4, e6}- {e4, e5, e6}= {e2}
Tzn. A-B jest zdarzeniem „wypadły dwa oczka“.
Sumą lub alternatywą zdarzeń A i B (A∪B) nazywamy zdarzenie składające się z tych wszystkich zdarzeń elementarnych, które należą do A lub do B.
Czyli polegające na zajściu przynajmniej jednego z tych zdarzeń.
Przykład:
A-padła nieparzysta liczba oczek na ścianie kostki,
B-wypadła liczba oczek nie mniejsza niż 4.
Zdarzeniu A sprzyjają zdarzenia elementarne: e1, e3, e5
Zdarzeniu B sprzyjają zdarzenia elementarne: e1, e2, e3
Zdarzenie C jest sumą zbiorów A i B:
A∪B = C
Koniunkcją lub iloczynem zdarzeń A i B (A∩B) nazywamy zdarzenie złożone z tych wszystkich zdarzeń elementarnych, które należą do A i do B.
Czyli polegające na tym, że zawiera te i tylko te zdarzenia elementarne, które sprzyjają jednocześnie zdarzeniu A i B.
Przykład:
A-wylosowanie z listy mężczyzny,
B-wylosowanie osoby palącej.
Wtedy (A∩B) oznacza wylosowanie palącego mężczyzny.
Jeżeli iloczyn zdarzeń A i B tworzy zbiór pusty (zdarzenie niemożliwe) to zdarzenia A i B nazywamy wykluczającymi się (wyłączającymi).
Przykład:
A-wyrzucenie liczby oczek mniejszej niż 2,
B-wyrzucenie liczby oczek większej niż 4.
Zdarzeniem przeciwstawnym do zdarzenia A nazywamy zdarzenie oznaczane symbolem A’, do którego należą wszystkie zdarzenia elementarne nie należące do A.
Czyli A jest zdarzeniem dowolnym.
Przykład:
A-wyrzucenie nieparzystej liczby oczek,
E-wyrzucenie jakiejkolwiek liczby oczek (zdarzenie elementarne).
A’ = E-A
A’= E- {e1, e3, e5} = {e2, e4, e6}
Mówimy, że zdarzenie A pociąga za sobą (implikuje) zdarzenie B (lub B jest następstwem zdarzenia A). Wszystkie zdarzenia elementarne wchodzące w skład zdarzenia A wchodzą tez w skład zdarzenia B.
Czyli każde zdarzenie elementarne sprzyjające zdarzeniu A sprzyja zdarzeniu B.
Przykład:
Dla dwukrotnego rzutu kostką zdarzenie „suma oczek = 3” pociąga za sobą zdarzenie „na jednej z kostek wypadło =1”.
WYKRESY EULERA:
Przestrzeń zdarzeń elementarnych symbolizuje kwadrat, a zdarzenia A i B koła w tym kwadracie.
Podał ją P. Laplace w 1812r.
Jeżeli wszystkie zdarzenia elementarne są jednakowo możliwe, to prawdopodobieństwo zdarzenia losowego A jest ilorazem liczby zdarzeń elementarnych sprzyjających temu zdarzeniu i liczby wszystkich zdarzeń elementarnych czyli:
P(A)=k/n
gdzie:
k- liczba zdarzeń elementarnych sprzyjających zdarzeniu A,
n- liczba wszystkich zdarzeń elementarnych (przestrzeń zdarzeń elementarnych).
Przy obliczeniu prawdopodobieństwa zdarzeń za pomocą klasycznej definicji prawdopodobieństwa wykorzystuje się często pojęcie kombinacji bez powtórzeń.
Ze zbioru A= {a, b, c, d} można utworzyć cztery 3-elementowe kombinacje bez powtórzeń: abc, abd, acd, bcd.
Więc liczba k-elementowych kombinacji bez powtórzeń dla zbioru n-elementowego określa się wzorem:
Ckn = (nk) = n!/ k!(n-k)!
gdzie:
n!- jest iloczynem kolejnych liczb naturalnych na 1 do n, tzn. n!= 1*2*3...(n-1)*n.
Warto zapamiętać, że 0!=1.
P(A2) = (64)*(432)/ (496) = 0,0009686
P(A3) = (65)*(431)/ (496)= 0,00001845
P(A4) = (56)*(430)/ (490)= 0,0000000715
Jak wynika z powyższych wyliczeń, grając w toto-lotka możemy się 100 razy spodziewać, że w 98 przypadkach nic nie wygramy.
Prawdopodobieństwo całkowite:
WZÓR BAYESA:
Zakładamy, że zdarzenie A może zajść jeśli zajdzie jedno z wykluczających się zdarzeń B1, B2,... Bn tworzących układ zupełny zdarzeń.
Układ zdarzeń jest zupełny, jeśli zdarzenia te wyłączają się parami, a suma ich prawdopodobieństw wynosi 1, czyli jest zdarzeniem pewnym.
Jeśli są spełnione warunki:
P(B1), P(B2),... P(Bn)- prawdopodobieństwa tych zdarzeń są znane,
P(A/B1), P)A/B2),.... P(A/Bn)- prawdopodobieństwa warunkowe są znane.
Prawdopodobieństwo zdarzenia A oblicza się wówczas następująco:
P(A) = P(B1) P(A/B1+... P(Bn) P(A/Bn)
P(A) =Σni=1 P(Bi) P(A/B)
Jest to wzór na prawdopodobieństwo całkowite (zupełne).
Zakładając, że w wyniku przeprowadzonego doświadczenia zaszło zdarzenie A. Mogło zajść tylko wówczas, gdy zajdzie jedno z wyłączających je zdarzeń B1, B2,... Bn, tworzących układ zupełny.
Ponieważ nie wiemy, które z tych zdarzeń zajdzie, więc zdarzenia te nazywa się hipotezami.
Aby obliczyć prawdopodobieństwo hipotez w związku z tym: zdarzenie A już zaszło należy obliczyć prawdopodobieństwo warunkowe:
P(A/B1), P(A/B2),... P(A/Bn)
Na bazie wyliczonych prawdopodobieństw warunkowych każdej z postawionych hipotez można wyprowadzić wzór na prawdopodobieństwo warunkowe dowolnej hipotezy B(i=1,2,...n)
P(Bi/A) = P(Bi) P(A/Bi) / P(B1) P(A/B1) +....+ P(Bn) P(A/Bn)
Zdarzenia B1- nazywane są hipotezami, ich hipotezy:
P(Bi)- prawdopodobieństwami a priori,
P(A/Bi)- prawdopodobieństwami a posteriori.
Jest to wzór Bayesa (od angielskiego matematyka, który wprowadził go w 1763r.)
Pozwala on obliczyć prawdopodobieństwo hipotez wówczas, gdy wiadomo, że w wyniku doświadczenia zaszło zdarzenie A.
Przykład:
Sieć handlowa sprowadza środki ochrony roślin od 3 producentów. Na podstawie obserwacji wiadomo, że środki sprowadzane od producenta:
1.zawierają 2% preparatów z ukrytymi wadami,
2.10 % preparatów z ukrytymi wadami,
3.4 % preparatów z ukrytymi wadami.
Znaleziono kolejny nieoznakowany preparat z wadą ukrytą. Od którego producenta pochodzi?
Prawdopodobieństwa a priori wynoszą:
P(B1)=0,1
P(B2)=0,3
P(B3)=0,6
A-zdarzenie- wylosowany preparat ma ukrytą wadę.
Więc:
P(A/B1)=0,02
P(A/B2)=0,1
P(A/B3)=0,04
Prawdopodobieństwo całkowite zdarzenia A jest równe:
P(A)= Σ3i=1 P(Bi) P(A/Bi)=0,1*0,02+ 0,3*0,1+ 0,6*0,04= 0,056
Stąd prawdopodobieństwa a posteriori będą równe:
P(B1/A)= (0,1*0,02)/0,056 = 0,036
P(B2/A)= (0,3*0,01)/ 0,056= 0,536
P(B3/A)= (0,6*0,04)/0,056= 0,429
Z przeproawdzonych wyliczeń wynika, że najprawdopodobniej od producenta 2 pochodzi niepełnowartościowy preparat.