Sieci bayesowskie sprawozdanie


Sieci Bayesowskie
WSTP
Prognozowanie jest  racjonalnym i naukowym przewidywaniem przyszłych zdarzeń
takich jak wielkość obrotów przedsiębiorstwa. Przez racjonalność prognozowania rozumie się
konieczność korzystania z dorobku nauki, czyli teorii oraz narzędzi badawczych. Z kolei
prognozą nazywa się osąd dotyczący przyszłości i prognozowanego zjawiska  precyzyjnym
i niepewnym. Prognozę, której stopień niepewności jest akceptowalny przez jej odbiorcę,
określa się mianem prognozy dopuszczalnej. Prognozy rzadko są trafne, dlatego ich
wykorzystanie w procesie decyzyjnym powinno być oparte na założeniu, że okażą się celne,
jednak równocześnie należy mieć świadomość błędu prognozy. Istotnym pojęciem w procesie
budowania prognozy są przesłanki prognostyczne, które stanowią hipotezy (założenia)
przyjęte na podstawie wiedzy o prawidłowościach występujących w prognozowanym
zjawisku lub występujących między nim a innymi zjawiskami. Okres, dla którego tworzona
jest prognoza nazywany jest okresem prognozy, a liczbę okresów objętych prognozą 
horyzontem prognozy. Czas dzielący moment sporządzania kolejnych prognoz to interwał
prognozy. Jeśli horyzont prognozy jest dłuższy niż jej interwał, a prognozy są budowane
ponownie w każdym okresie, mówi się wówczas o prognozowaniu kroczącym [2].
Prognozy mogą mieć charakter ilościowy (gdy ich stan jest określany liczbą) lub
jakościowy (gdy stan jest opisywany słownie). Wsród prognoz ilościowych wyróżnia się
prognozy [2]:
·ð punktowe  formuÅ‚owane w postaci okreÅ›lonej wartoÅ›ci jakÄ… przyjmie zmienna
prognozowana w przyszłości,
·ð przedziaÅ‚owe  formuÅ‚owane w postai okreÅ›lonego przedziaÅ‚u liczbowego, który
obejmie przyszłą wartość zmiennnej prognozowanej,
·ð wariantowe  formuÅ‚owane w postaci okreÅ›lonych wartoÅ›ci, które może przyjąć
zmienne praognozowana w okresie prognozy.
W zależności od tego, które ze zmian  ilościowe czy jakościowe  dominują w
prognozowanym zjawisku, prognozy dzieli się na: krótkookresowe, średniookreosowe i
długookresowe. Z prognozą krótkookreosową ma się do czynienia, kiedy w
prognozowanym zjawisku zachodzą tylko zmiany ilościowe (horyzont wynosi od 1-3
miesięcy). Średniookresową prognozę konstruuje się dla horyzontu wynoszącego od 3
miesięcy do 2 lat, gdzie obserwowane są oprócz dominujących zmian ilościowych także
niewielkie zmiany jakościowe. Natomiast dla prognozy długookresowej horyzont prognozy
1
wynosi od 2-5 lat, przy czym prognoza dotyczy takiego odcinka czasu, w którym w
prognozowanym zjawisku mogą wystąpić poważne zmiany jakościowe [2].
1. PrzeglÄ…d moetod prognozowania
W literaturze główną klasyfikacją prognoz jest ta, wyróżniająca metody ilościowe i
jakościowe. Metody ilościowe są oparte na formalnych modelach prognostycznych
zbudowanych na podstawie danych dotyczących kształtowania się wartości zmiennej
prognozowanej zmiennej objaśniającej w przeszłości, a należą do nich modele: szeregów
czasowych, ekonometryczne, analogowe, zmiennych wiodÄ…cych, analizy kohortowej oraz
testy rynkowe.
Analiza szeregów czasowych ma dwa główne cele [7]:
·ð wykrywanie natury zjawiska reprezentowanego przez sekwencjÄ™ obserwacji,
·ð prognozowanie (przewidywanie przyszÅ‚ych wartoÅ›ci szeregu czasowego).
Oba te cele wymagają zidentyfikowania i opisania, w sposób mniej lub bardziej formalny,
elementów szeregu czasowego. Raz ustalony wzorzec może zostać zastosowany do innych
danych (tzn. wykorzystany w teorii badanego zjawiska, np. sezonowych cen towarów).
Niezależnie od trafności teoretycznego uzasadnienia postaci modelu, zawsze możemy
przewidywać przyszłe wartości szeregu czasowego na drodze ekstrapolacji [2].
Istotą modelowania ekonometrycznego jest konstruowanie modelu, który pozwoli
wyjaśnić mechanizm zmian zachodzących w prognozowanym zjawisku pod wpływem
zmiennych objaśniających. Model ekonometryczny (model regresji) jest konstrukcją
formalną, przedstawiającą za pomocą równania zależność między zmienną objaśnianą, która
charakteryzuje dane zjawisko, a zmiennymi objaśniającymi opisującymi inne zjawiska. Model
regresji umożliwia zarówno ocenę wpływu zmiennych objaśniających na zmienną objaśnianą,
jak i sformułowanie dla niej prognozy [2].
Modele analogowe mogą być stosowane do sporządzania średnio- i długookresowych
prognoz sprzedaży określonego produktu w przedsiębiorstwie na podstawie danych o
sprzedaży tego produktu w innych rejonach lub innych produktów w tym samym rejonie, gdy
nie ma podstaw do przypuszczeń o ich przyczynowym powiązaniu ze zmienną
prognozowanÄ…. StosujÄ…c modele analogowe odchodzi siÄ™ od ekstrapolacji dotychczas
obserwowanych prawidłowości w kształtowaniu się sprzedaży danego produktu, a przyjmuje
2
założenie o podobieństwie krzywych życia różnych produktów (analogie historyczne) lub
krzywych życia produktu dla tego samego rejonu (analogie przestrzenno-czasowe) [2].
Badania koniunktury wykazały, że istnieje możliwość przewidywania jej zmian na
podstawie zachodzących wcześniej zmian w pewnej klasie zmiennych, nazywanych
zmiennymi wiodącymi. Zmienne wiodące charakteryzują się określonymi zmianami swoich
wartości, zachodzącymi wcześniej niż zmiany wartości innej grupy zmiennych, które określa
się jako zmienne naśladujące. Zmienne te z pewnym opóznieniem naśladują zmiany
zachodzące w wartościach zmiennych wiodących. Znalezienie zmiennej wiodącej pozwala
konstruować prognozy dotyczące zmiennej naśladującej, a więc stosowania modeli ze
zmiennymi wiodÄ…cymi [2].
Metody jakościowe prognozowania opierają się na opiniach ekspertów, którymi są osoby
zaproszone do udziału w badaniu ze względu na posiadaną wiedzę. Używane modele
prognostyczne nie są modelami formalnymi, ale myślowymi, choć modele formalne mogą
być stosowane jako dodatkowa pomoc [2].
Metoda delficka ma charakter jakościowy i składa się z kilku etapów [2]:
1. Zdefiniowanie problemu,
2. Wybór grona ekspertów,
3. Przygotowanie i wysłanie ankiety,
4. Analiza odpowiedzi zwrotnych,
5. Czy zgoda została osiągnięta:
- Tak, przejście do pkt. 8,
- Nie, przejście do pkt 6,
6. Przygotowanie i wysłanie następnej ankiety,
7. Kolejna analiza odpowiedzi, powrót do pkt 5,
8. Przedstawienie wyników.
Metoda delficka zapewnia dużą efektywność prognozowania długookresowego, ale
główną jej wada jest mniejsza trafność w przypadku, gdy niezgodność poglądów jest duża.
Burza mózgów polega na stymulowaniu jak największej liczby pomysłów mających na
celu rozwiązanie zadania prognostycznego. Po sprecyzowaniu problemu i wyborze ekspertów
reprezentujących różne dziedziny wiedzy organizuje się spotkanie, na którym osoby te
zgłaszają różne pomysły rozwiązań. Spośród zgłoszonych wariantów postępowania eksperci
wybierajÄ… najlepszy [2].
3
2. Analiza dyskryminacyjna
Wśród prognoz ilościowych wyróżnia się analizę dyskryminacyjną służącą do
wielowymiarowej analizy danych ilościowych. Zaletą klasycznej analizy dyskryminacyjnej
jest prostota jak i wysoka skuteczność na homogenicznych danych, wadą natomiast -
nieprzenośność i brak skuteczności na niehomogenicznych danych. Analiza dyskryminacyjna
jest metodą najczęściej wykorzystywaną do konsultowania modeli oceniających kondycję
finansową przedsiębiorstw. Dynamiczny rozwój dyskryminacyjnych modeli wczesnego
ostrzegania przedsiębiorstw zapoczątkowały prace E. Altmana, który na podstawie 5
wskazników finansowych, dla 66 amerykańskich przedsiębiorstw (z których 33
zbankrutowało, a pozostałe 33 znajdowało się w dobrej sytuacji finansowej), wyznaczył
liniową funkcję dyskryminacyjną . Funkcja ta miała za zadanie odróżnić jednostki zagrożone
bankructwem od tych, których kondycja nie budziła niepokoju. Badania kontynuowane były
następnie przez wielu autorów z różnych krajów. Metoda ta cieszy się dużą popularnością
(także w Polsce), gdyż pozwala przekształcić wielowymiarową przestrzeń w jeden wymiar, w
którym na podstawie określonego miernika dokonuje się oceny sytuacji przedsiębiorstwa.
Modele konstruowane przy jej pomocy uzyskają wysokie oceny trafności klasyfikacji
obiektów w porównaniu dolinnych alternatywnych metod. Wiele programów statystycznych
jest wyposażona w moduł analizy dyskryminacyjnej. Wielowymiarowa analiza
dyskryminacyjna umożliwia dokonanie klasyfikacji obiektów na podstawie wielu zmiennych
objaśniających. Zmienna objaśniana w modelach dyskryminacyjnych jest zmienną jakościową
(np. dobra lub zła kondycja firmy). Zakwalifikowania obiektu do jednej z grup przy
wykorzystaniu wielowymiarowej analizy dyskryminacyjnej dokonuje siÄ™ na podstawie
liniowej funkcji dyskryminacyjnej lub liniowych funkcji klasyfikacyjnych. Podczas budowy
funkcji dyskryminacyjnej przyjmuje się następujące założenia [3]:
Øð zmienne objaÅ›niajÄ…ce posiadajÄ… wielowymiarowy rozkÅ‚ad normalny,
Øð macierze wariancji/kowariancji zmiennych diagnostycznych sÄ… równe w grupach,
Øð wystÄ™puje podzielność zmiennych, która przejawia siÄ™ w systematycznej różnicy
wartości średnich między grupami.
Liniowa funkcja dyskryminacji ma zazwyczaj postać [3]:
5ØMÜ = 5ØOÜ0 + 5ØOÜ15ØKÜ1 + 5ØOÜ25ØKÜ2 + ï" + 5ØOÜ5Ø[Ü5ØKÜ5Ø[Ü,
gdzie:
Z  jest zmienną zależną (objaśnianą),
4
bi  współczynniki dyskryminacyjne dla i=1,2,& ,n,
b0  stała,
Xi  zmienne niezależne (objaśniające) dla i=1,2,& ,n.
Tworząc funkcję dyskryminacyjną należy dążyć do tego, by stosunek zmienności
międzygrupowej do zmienności wewnątrz grup osiągał maksymalną wartość. W analizie
dyskryminacyjnej możemy wyróżnić dwa etapy: uczenia (podczas którego w oparciu o tzw.
zbiór uczący znajduje się reguły klasyfikacyjne) i klasyfikacji (gdzie w oparciu o znalezione
charakterystyki klas dokonuje się klasyfikacji zasadniczego zbioru obiektów, których
przynależność jest nieznana). Analiza najczęściej przebiega krokowo (postępująca lub
wsteczna analiza krokowa). Pakiety statystyczne, oprócz licznych statystyk wykreślają też tak
zwane funkcje klasyfikacyjne, stanowiące doskonałą ilustrację otrzymanych wyników. Co
prawda postać tych funkcji może być dowolna, w praktyce jednak najczęściej
wykorzystywane są funkcje liniowe. W tym podejściu opisowym obiekt przydzielany jest do
tej klasy, dla której funkcja dyskryminacyjna osiąga największą wartość [6].
Do zalet analizy dyskryminacyjnej zalicza się je prostotę i wysoką skuteczność. Jej
efektywność obniża się jednak w przypadku niejednorodnych danych, co stanowi jej wadę.
Dodatkowym minusem jest nieprzenośność.
3. Sieci bayesowskie
Sieci Bayesowskie (ang. Bayesian Netowrks) są graficznymi modelami służącymi do
przedstawienia łącznego rozkładu prawdopodobieństwa w zbiorze zmiennych U 
wykorzystując regułę łańcucha można przedstawić ją w postaci grafu DAG. Wierzchołki
grafu reprezentują wówczas analizowane zmienne, a krawędzie bezpośrednie zależności
pomiędzy nimi. Skierowanie krawędzi pozwala uchwycić kierunek tych zależności. Jeśli para
wierzchołków jest ze sobą niepołączona, wówczas odpowiadające im zmienne są
(warunkowo) niezależne. Dokładna definicja sieci bayesowskich wywodzi się z koncepcji
sieci przyczynowych, które stanowią graficzny opis relacji pomiędzy zmiennymi w postaci
grafu skierowanego. Wyróżnia się trzy rodzaje połączeń zmiennych w sieciach
przyczynowych [4]:
·ð Å‚aÅ„cuchowe (rys. 3. 1a),
·ð zbieżne (rys. 3. 1b),
5
·ð rozbieżne (rys. 3. 1c).
Rys. 3. 1. Połączenia zmiennych w sieciach przyczynowych  a) połączenie łańcuchowe, b)
połączenie zbieżne, c) połączenie rozbieżne
yródło: [4]
Sieci bayesowskie opierają się na rachunku prawdopodobieństwa. Prawdopodobieństwo
bezwarunkowe (a priori) określa liczbowo szansę wystąpienia jakiegoś zjawiska, gdy nie są
znane żadne okoliczności związane z tym zjawiskiem. Prawdopodobieństwo warunkowe (a
posteriori) jest to prawdopodobieństwo zdarzania A obliczane w sytuacjach, w których zaszło
zdarzenie B. Wyraża się ono wzorem [1]:
( | )
5ØCÜ 5Ø5Ü 5Ø4Ü 5ØCÜ(5Ø4Ü)
( | )
5ØCÜ 5Ø4Ü 5Ø5Ü = .
5ØCÜ(5Ø5Ü)
Bayesowska sieć przekonań jest acyklicznym grafem skierowanym, złożonym z węzłów
reprezentujących zmienne objaśniające i łączących je krawędzi. Krawędzie określają związki
przyczynowo - skutkowe pomiędzy węzłami [1].
6
3. Cel i zakres pracy
Celem niniejszego projektu jest rozwiÄ…zanie problemu decyzyjnego, polegajÄ…cego na
określeniu prawdopodobieństwa zepsucia się rolek młynowych w ciągu miesiąca. Dzięki tej
informacji dział zaopatrzenia będzie mógł zamówić odpowiednią ilość materiałów
potrzebnych do ich naprawy (łożyska, smar itp.). Ułatwi to pracę działu zaopatrzenia,
ograniczy przestoje taśmociągu wynikające z opóznień w naprawach, pozwoli efektywniej
ulokować czynniki produkcji. Aby móc wyznaczyć dokładną liczbę zepsutych rolek
młynowych należałoby dodatkowo zastosować metodę analizy szeregów czasowych.
Okres prognozy to jeden miesiąc, natomiast przyjęty interwał wynosi 1 dzień. Horyzont
prognozy, czyli liczba okresów wynosi 6, czyli pół roku. Stąd prognozę określa się jako
średnioterminową. W prognozowaniu wykorzystane zostaną dane wewnętrzne elektrowni 
dane historyczne o charakterze ilościowym pochodzące z różnych działów.
Część właściwa projektu składa się z trzech etapów, tj.: charakterystyki modelu
prognozowania, opracowania projektu budowy sieci bayesowskiej dla wybranego problemu
decyzyjnego, przedstawienie prognozy przy pomocy programu Netica.
4. Charakterystyka przedsiębiorstwa
Elektrownia Opole jest kondensacyjną elektrownią cieplną blokową, z zamkniętym
układem wody chłodzącej. Eksploatowane są 4 bloki energetyczne uruchomione w latach
1993-1997 o Å‚Ä…cznej mocy zainstalowanej 1492 MW (1×376 MW; 1×373 MW; 1×373 MW;
1×370 MW). Paliwem podstawowym jest wÄ™giel kamienny. Wszystkie bloki wyposażone sÄ…
w mokrą instalację odsiarczania spalin. Podstawowym przedmiotem działalności Spółki jest
wytwarzanie energii elektrycznej, dystrybucja energii elektrycznej, produkcja ciepła (pary
wodnej i gorącej wody) oraz prowadzenie działalności wykonawczej, usługowej i
inwestycyjnej z zakresu budownictwa energetycznego, cieplnego i innego.
Przedmiotem prognozy jest określenie liczby zużywanych miesięcznie łożysk w rolkach
młynowych (rys.4.1). Są one używane w taśmociągach celem transportu węgla do
zasobników węglowych.
7
Rys. 4.1. Rolki młynowe
yródło: [4]
5. Charakterystyka modelu prognozowania
Zmienną objaśnianą w utworzonym modelu jest stan rolek młynowych. Psucie się rolek
młynowych jest głównie wynikiem dewastacji umieszczonych wewnątrz łożysk. Inną
przyczyną jest duże obciążenie taśmy transportującej węgiel do młynów węglowych, co
negatywnie wpływa na wytrzymałość rolki.
Przy wyborze zmiennych objaśniających kierowano się istotnością wpływu danych
czynników na kształtowanie się badanego zjawiska (czyli zmiennej objaśnianej). Określono
dwuelementowy zbiór zmiennych objaśniających, a należą do nich: przeciążenie taśmociągu
oraz wytrzymałość łożyska. Są to zmienne zależne, gdyż na obciążenie taśmociągu wpływają
dwie kwestie  efektywność przesyłu oraz własności węgla. Natomiast wytrzymałość łożysk
jest zależna od posiadanej osłony lub jej braku, a także konserwacji.
Aby móc wnioskować w oparciu o dane ilościowe elektrowni, należy w pierwszej
kolejności zbudować sieć bayesowską. Utworzenie takiej sieci wymaga pomocy eksperta z
danej dziedziny, gdyż konieczne jest określenie właściwych zależności przyczynowych i
prawdopodobieństw warunkowych. Możliwe jest także zastosowanie technik uczenia. Na
rysunku poniżej przestawiona została sieć bayesowska dla omawianego problemu (rys. 5.1).
Do każdej zmiennej przyporządkowano określające ją stany wraz z parametrami. Zmienne
powiÄ…zano ze sobÄ… tworzÄ…c zwiÄ…zki przyczynowo-skutkowe, przy czym rodzicami nazwano
przyczyny zdarzeń, a potomkami ich skutki. Ostateczny potomek opisany został przez dwie
wartości:  dobry i  zły , gdzie przez  zły rozumie się sytuację, w której rolka kierowana
jest do naprawy. W pózniejszym etapie dla każdego węzła X (zdarzenia) zostanie
zdefiniowana tablica prawdopodobieństwa.
8
Rodzajem przyjętego wnioskowania jest wnioskowanie w przód (progresywne), które
polega na tworzeniu pewnych stwierdzeń na podstawie faktów. Dysponując danymi na temat
efektywności przesyłu, własności węgla, osłon łożysk, konserwacji, obciążenia taśmociągu
oraz stanu łożysk można wykazać zależności pomiędzy tymi zdarzeniami bazując na
rachunku prawdopodobieństwa. Tym samym prognozuje się jakie jest prawdopodobieństwo,
że przy danych warunkach rolki będą wymagały naprawy. Uzyskana informacja pozwoli na
oszacowanie odpowiedniej ilości materiałów potrzebnych do wykonania tzw. remontu rolek.
Rys. 5.1. Sieć Bayesa dla określenia stanu rolek młynowych.
yródło: Opracowanie własne.
W dalszej części pracy zostaną omówione poszczególne zmienne objaśniające. Analiza
uzasadniająca wybór zmiennych zostanie rozpoczęta od charakterystyki przodków
(rodziców), dla których prawdopodobieństwo będzie miało charakter bezwarunkowy (a
priori):
·ð Efektywność przesyÅ‚u  im wyższa efektywność przesyÅ‚u, tym wiÄ™ksze
obciążenie taśmociągu, które z kolei wpływa na stan rolek młynowych.
9
Wyróżniono trzy poziomy efektywności przesyłu mierzone w m3 węgla
transportowanego w ciÄ…gu godziny,
·ð WÅ‚asnoÅ›ci wÄ™gla  im wiÄ™ksze rozdrobnienie, tym wiÄ™kszy jest tonaż
przesyłanego węgla na m2 taśmy, co powoduje większe obciążenie taśmociągu i
zużycie rolek młynowych. Wyróżniono dwa poziomy rozdrobnienia przyjmując za
jednostkÄ™ kg/m2,
·ð Konserwacja Å‚ożyska - im czÄ™stsza konserwacja tym stan Å‚ożyska jest lepszy, co
wpływa na stan ogólny rolek młynowych. Wyróżniono trzy przedziały
częstotliwości  konserwacja: częsta (2-4 razy w ciągu miesiąca), rzadka (raz w
miesiącu), brak (łożyska w ogóle niekonserwowane),
·ð OsÅ‚ona Å‚ożyska  Å‚ożysko może mieć osÅ‚onÄ™  wówczas jest mniej narażone na
urazy mechaniczne  lub jej nie mieć, co skutkuje większą awaryjnością.
W dalszym etapie omówione zostaną zmienne będące potomkami, a więc:
·ð Obciążenie taÅ›mociÄ…gu  jest uzależnione od efektywnoÅ›ci przesyÅ‚u i wÅ‚asnoÅ›ci
węgla. Może być duże, średnie lub małe, co określane jest za pomocą przedziałów
procentowych. Im większe obciążenie taśmociągu tym szybsze zużycie się rolek i
większe prawdopodobieństwo wystąpienia zepsutych rolek w ciągu miesiąca
pracy,
·ð Stan Å‚ożyska  wpÅ‚ywajÄ… na niego: konserwacja Å‚ożyska i jego osÅ‚ona. Wyróżnia
się dwa stany łożysk w rolkach młynowych: wytrzymałe i mało wytrzymałe. Do
określenia stanu służą próby wytrzymałościowe lub ogólny wygląd (jeśli
definitywnie wskazuje na uszkodzenie wymagające naprawy rolki). Im większe
prawdopodobieństwo występowania łożysk mało wytrzymałych, tym większa
pewność, że stan ogólny rolek będzie zły, co wymusi konieczność wymiany.
Ostatnim elementem grafu skierowanego jest jego korzeń, czyli zmienna objaśniana 
stan rolek młynowych. Występują tu dwie możliwości - stany: dobry lub zły.
Aby ułatwić opisanie struktury sieci bayesowskiej przyporządkowano każdej zmiennej
innÄ… literÄ™ alfabetu (tab. 5.1).
10
Tab. 5.1. Oznaczenia zmiennych w sieci Bayesa.
Zmienna Oznaczenie
Efektywność przesyłu A
Własności węgla B
Konserwacja łożyska C
Osłony łożyska D
Obciążenie taśmociągu E
Stan łożyska F
Stan rolek młynowych G
yródło: Opracowanie własne.
Nadane oznaczenia wykorzystano do zbudowania uproszczonej sieci Bayesa (rys. 5.2).
B C D
A
E
F
G
Rys. 5.2. Uproszczona sieć bayesowska z wykorzystaniem oznaczeń zmiennych problemu.
yródło: Opracowanie własne
Zatem model omawianego problemu (zgodnie z opracowanÄ… sieciÄ… Bayesa i
przyporządkowanymi oznaczeniami) prezentuje się następująco:
·ð prawdopodobieÅ„stwo a priori (z zaÅ‚ożenia) zdarzenia G przed uzyskaniem
informacji (tzw. prawdopodobieństwo całkowite)
( ) ( ) ( ) ( ) ( | ) ( ) ( ) ( | ) ( ) ( )
5Ø]Ü 5Ø:Ü = 5Ø]Ü 5Ø:Ü|5Ø8Ü, 5Ø9Ü 5Ø]Ü 5Ø8Ü 5Ø]Ü 5Ø9Ü + 5Ø]Ü 5Ø:Ü Å¹5Ø8Ü, 5Ø9Ü 5Ø]Ü Å¹5Ø8Ü 5Ø]Ü 5Ø9Ü + 5Ø]Ü 5Ø:Ü 5Ø8Ü, Ź5Ø9Ü 5Ø]Ü 5Ø8Ü 5Ø]Ü Å¹5Ø9Ü +
( | ) ( )
5Ø]Ü 5Ø:Ü Å¹5Ø8Ü, Ź5Ø9Ü 5Ø]Ü Å¹5Ø8Ü 5Ø]Ü(Ź5Ø9Ü),
11
·ð prawdopodobieÅ„stwo a posteriori (po fakcie) zdarzenia G po uzyskaniu informacji
A
( | ) ( | ) ( | ) ( | )
5Ø]Ü 5Ø:Ü 5Ø4Ü = 5Ø]Ü 5Ø:Ü 5Ø8Ü 5Ø]Ü 5Ø:Ü 5Ø4Ü + 5Ø]Ü 5Ø:Ü Å¹5Ø8Ü 5Ø]Ü(Ź5Ø8Ü|5Ø4Ü),
·ð prawdopodobieÅ„stwo a posteriori (po fakcie) zdarzenia G po uzyskaniu informacji
B
( | ) ( | ) ( | ) ( | )
5Ø]Ü 5Ø:Ü 5Ø5Ü = 5Ø]Ü 5Ø:Ü 5Ø8Ü 5Ø]Ü 5Ø:Ü 5Ø5Ü + 5Ø]Ü 5Ø:Ü Å¹5Ø8Ü 5Ø]Ü(Ź5Ø8Ü|5Ø5Ü),
·ð prawdopodobieÅ„stwo a posteriori (po fakcie) zdarzenia G po uzyskaniu informacji
C
( | ) ( | ) ( | ) ( | )
5Ø]Ü 5Ø:Ü 5Ø6Ü = 5Ø]Ü 5Ø:Ü 5Ø9Ü 5Ø]Ü 5Ø:Ü 5Ø6Ü + 5Ø]Ü 5Ø:Ü Å¹5Ø9Ü 5Ø]Ü(Ź5Ø9Ü|5Ø6Ü),
·ð prawdopodobieÅ„stwo a posteriori (po fakcie) zdarzenia G po uzyskaniu informacji
D
( | ) ( | ) ( | ) ( | )
5Ø]Ü 5Ø:Ü 5Ø7Ü = 5Ø]Ü 5Ø:Ü 5Ø9Ü 5Ø]Ü 5Ø:Ü 5Ø7Ü + 5Ø]Ü 5Ø:Ü Å¹5Ø9Ü 5Ø]Ü(Ź5Ø9Ü|5Ø7Ü).
Powyżej przedstawiono równania pozwalające obliczyć prawdopodobieństwo
poszczególnych zdarzeń opisanych w modelu sieci. Aby móc wyciągnąć wnioski z
pózniejszych obliczeń, należy opracować interpretację możliwych przedziałów
prawdopodobieństwa dla zmiennej objaśnianej. W tym celu sporządzono tabelę (tab.5.2) z
określonymi przedziałami prawdopodobieństwa i ich opisem.
Tab. 5.2. Interpretacja przedziałów prawdopodobieństwa dla stanu:  zły .
Przedziały
Interpretacja
prawdopodobieństwa
Bardzo małe prawdopodobieństwo wadliwości rolek
młynowych. W tym przypadku dział zaopatrzenia nie powinien
0 - 0,25
dokonywać zakupu materiałów do naprawy rolek, gdyż można
spodziewać się, że zachowają one sprawność.
Małe prawdopodobieństwo wadliwości rolek młynowych. W tym
przypadku dział zaopatrzenia nie musi dokonywać zakupu
materiałów do naprawy rolek jeśli elektrownia posiada zapasy
0,2  0,5
buforowe na bieżące naprawy. W innym razie może rozważyć
zakup, ale należy się spodziewać, że ewentualna liczba rolek
wadliwych będzie mała.
yródło: Opracowanie własne.
12
Tab. 5.2. Interpretacja przedziałów prawdopodobieństwa dla stanu:  zły , c.d.
Przedziały
Interpretacja
prawdopodobieństwa
Duże prawdopodobieństwo wadliwości rolek młynowych. W tym
przypadku dział zaopatrzenia powinien dokonać zakupu
0,5  0,75 materiałów do naprawy rolek, nawet jeśli w magazynie istnieją
małe zapasy na bieżące naprawy. Należy się bowiem spodziewać,
że liczba rolek, które ulegną awarii będzie dość duża.
Bardzo duże prawdopodobieństwo wadliwości rolek
młynowych. W tym przypadku dział zaopatrzenia musi dokonać
zakupu materiałów do naprawy rolek w dużych ilościach. Co
więcej należy przeanalizować jak przebiegała dotychczasowa
0,75  1
eksploatacja rolek i spróbować wyeliminować czynniki, które
wpływają negatywnie na stan rolek (np. rzadka konserwacja).
Należy się spodziewać, że liczba rolek, które ulegną awarii będzie
bardzo duża.
yródło: Opracowanie własne.
Aby móc wyznaczyć dokładną liczbę zepsutych rolek młynowych należałoby dodatkowo
zastosować metodę analizy szeregów czasowych. Analiza historycznych danych ilościowych
zepsutych rolek w miesiącu w powiązaniu z zastosowaniem sieci Bayesa, ukazałaby
dokładnie całą sytuację. Stosując do rozwiązania problemu sieć bayesowską można jedynie
określić stopień prawdopodobieństwa wystąpienia wadliwych rolek i szacować ich liczbę.
6. Prawdopodobieństwo a priori i a posteriori
W tej części projektu zostanie określone prawdopodobieństwo a priori, czyli
prawdopodobieństwo bezwarunkowe. Bazuje ono na częstości występowania i statystyce,
stąd konieczne jest zaprezentowanie jak dotychczas kształtowały się zmienne.
13
6.1. Obliczanie prawdopodobieństwa warunkowego dla zmiennej
 obciążenie taśmociągu
Dane historyczne elektrowni z ostatnich 20 miesięcy zostały zamieszczone w tabelach
(tab.: 6.1, 6.2) i na ich podstawie obliczono prawdopodobieństwo a priori. Dane statystyczne
rodziców charakteryzujących się prawdopodobieństwem a priori zestawiono parami w jednej
tabeli wraz z ich potomkiem. W następnym kroku obliczone prawdopodobieństwa
wprowadzono do programu Netica.
Mając określone prawdopodobieństwo a priori, oblicza się prawdopodobieństwo a
posteriori. Prawdopodobieństwo warunkowe jest to prawdopodobieństwo zdarzania A
obliczane w sytuacjach, w których zaszło zdarzenie B. Wyraża się ono wzorem [4]:
( | )
5ØCÜ 5Ø5Ü 5Ø4Ü 5ØCÜ(5Ø4Ü)
( | )
5ØCÜ 5Ø4Ü 5Ø5Ü = .
5ØCÜ(5Ø5Ü)
W celu wyznaczenia łącznego prawdopodobieństwa należy skorzystać ze wzoru [4]:
( ) ( | ) ( )
5ØCÜ 5Ø4Ü, 5Ø5Ü = 5ØCÜ 5Ø5Ü 5Ø4Ü " 5ØCÜ 5Ø4Ü .
Na podstawie łącznego prawdopodobieństwa P(A,B) można wyznaczyć
prawdopodobieństwo P(B) według następującego wzoru [4]:
( ) ( )
5ØCÜ 5Ø5Ü = " 5ØCÜ 5Ø4Ü, 5Ø5Ü .
5Ø4Ü
Powyższe wzory zostaną wykorzystane do obliczenia prawdopodobieństwa
warunkowego, którym charakteryzują się zmienne E, F i G. Dla sprawdzenia poprawności
obliczeń oraz ukazania możliwości sprawniejszego sposobu liczenia, uzyskane tablice
prawdopodobieństwa zostaną wprowadzone do programu Netica.
Tab. 6.1. Dane historyczne dla zmiennych efektywność przesyłu, własności węgla i
obciążenie taśmociągu
E  Obciążenie
A - Efektywność
B - Własności węgla
taśmociągu
(warianty:
przesyłu (warianty: w -
L.p.
(warianty:
d - duże rozdrobnienie, m -
wysoka, ś - średnia,
d - duże, ś  średnie,
małe rozdrobnienie)
n - niska)
m - małe)
1 w m Å›
2 n m Å›
3 w d Å›
4 Å› m Å›
5 w m d
yródło: Opracowanie własne.
14
Tab. 6.1. Dane historyczne dla zmiennych efektywność przesyłu, własności węgla i
obciążenie taśmociągu, c.d.
E  Obciążenie
A - Efektywność
B - Własności węgla
taśmociągu
(warianty:
przesyłu (warianty: w -
L.p.
(warianty:
d - duże rozdrobnienie,
wysoka, ś - średnia,
d - duże, ś  średnie,
m - małe rozdrobnienie)
n - niska)
m - małe)
6 Å› d m
7 Å› d m
8 Å› m m
9 w m d
10 n d m
11 n d m
12 w m d
13 Å› m m
14 w d Å›
15 Å› d Å›
16 w m Å›
17 Å› m m
18 Å› d Å›
19 w d Å›
20 w d d
P(E=d) = 5/20 =
P(A=w) = 9/20 = 0,45
P(B=m) = 10/20 =
0,25
Prawdopodobieństwo 0,50
P(A=Å›) = 8/20 = 0,40 P(E=Å›) = 8/20 = 0,4
a priori
P(E=m) = 7/20 =
P(A=n) = 3/20 = 0,15 P(B=d) = 10/20 = 0,50
0,35
yródło: Opracowanie własne.
Aby obliczyć prawdopodobieństwa warunkowe poszczególnych stanów zdarzenia E
(obciążenia taśmociągu), należy sporządzić tablicę prawdopodobieństwa, która uwzględnia
zależność przyczynowo-skutkową pomiędzy zajściem prawdopodobieństwa iloczynu
zmiennych A i B oraz prawdopodobieństwem wystąpienia E.
Liczba możliwych kombinacji stanów pomiędzy A i B wynosi 6 (3*2), a są to:
1. wysoka - duże rozdrobnienie,
2. wysoka - małe rozdrobnienie,
3. średnia - duże rozdrobnienie,
4. średnia - małe rozdrobnienie,
5. niska - duże rozdrobnienie,
6. niska - małe rozdrobnienie.
15
Natomiast jeśli chodzi o kombinacje stanów iloczynu zmiennych A i B i stanów zmiennej
E to jest ich 18 (3*2*3) i kształtują się następująco:
1. wysoka - duże rozdrobnienie  duże,
2. wysoka - duże rozdrobnienie  średnie,
3. wysoka - duże rozdrobnienie  małe,
4. wysoka - małe rozdrobnienie  duże,
5. wysoka - małe rozdrobnienie  średnie,
6. wysoka - małe rozdrobnienie  małe,
7. średnie - duże rozdrobnienie  duże,
8. średnie - duże rozdrobnienie  średnie,
9. średnie - duże rozdrobnienie  małe,
10. średnie - małe rozdrobnienie  duże,
11. średnie - małe rozdrobnienie  średnie,
12. średnie - małe rozdrobnienie  małe,
13. niskie - duże rozdrobnienie  duże,
14. niskie - duże rozdrobnienie  średnie,
15. niskie - duże rozdrobnienie  małe,
16. niskie - małe rozdrobnienie  duże,
17. niskie - małe rozdrobnienie  średnie,
18. niskie - małe rozdrobnienie  małe.
Kombinacje zmiennych ujęto w macierzy (tab. 6.2). Wiersze zawierają kombinacje
iloczynu zmiennych A i B, a kolumny  kombinacje zmiennej E. W miejscu skrzyżowania
kolumn i wierszy wpisywane jest prawdopodobieństwo wystąpienia zdarzenia E (jego
konkretnego stanu) pod warunkiem zajścia iloczynu zdarzeń A i B (konkretnego stanu).
Prawdopodobieństwa warunkowe dla danego stanu oblicza się dzieląc liczbę występowań
kombinacji zmiennych A, B i E przez liczbę występowań kombinacji zmiennych iloczynu A i
B. Tak więc dla przypadku P(E=d|A=w,B=d) obliczenia będą wyglądały następująco:
5ØYÜ. 5ØdÜ5ØfÜ5Ø`Ü5ØaÜÄ™5Ø]Ü5Ø\Ü5ØdÜ5ØNÜÅ„ 5Ø8Ü = 5ØQÜ, 5Ø4Ü = 5ØdÜ, 5Ø5Ü = 5ØQÜ 1
( | )
5ØCÜ 5Ø8Ü = 5ØQÜ 5Ø4Ü = 5ØdÜ, 5Ø5Ü = 5ØQÜ = = = 5ØÎß, 5ØÐß5ØÓß.
5ØYÜ. 5ØdÜ5ØfÜ5Ø`Ü5ØaÜÄ™5Ø]Ü5Ø\Ü5ØdÜ5ØNÜÅ„ 5Ø4Ü = 5ØdÜ, 5Ø5Ü = 5ØQÜ 4
Pozostałe prawdopodobieństwa w tablicy zostały uzupełnione w oparciu o powyższe
równanie.
16
Tab. 6.2. Tablica prawdopodobieństwa dla P(E|A,B).
P(E|A,B) d Å› m
wd 0,25 0,75 0
wm 0,8 0,2 0
śd 0 0,5 0,5
śm 0 0,25 0,75
nd 0 0 1
nm 0 1 0
yródło: Opracowanie własne.
Jak już wspomniano, prawdopodobieństwa będę równolegle wyliczane za pomocą
programu Netica. Uzyskanie rozwiÄ…zania ostatecznego w postaci prognozy wymaga
zrealizowania następujących etapów:
1. wstawienie węzłów sieci,
2. wprowadzenie relacji przyczynowych,
3. określenie tablic prawdopodobieństw warunkowych,
4. skompilowanie sieci.
Aby móc obliczyć prawdopodobieństwo całkowite P(E) przy pomocy programu, należy
wprowadzić do Netici opracowane tablice prawdopodobieństwa dla P(A), P(B) i P(E|A,B), co
przedstawiono na rys. 6.1,6.2 i 6.3.
Rys. 6.1. Tablica prawdopodobieństwa dla zmiennej A  efektywność przesyłu.
yródło: Opracowanie własne.
Rys. 6.2. Tablica prawdopodobieństwa dla zmiennej B  własności węgla.
yródło: Opracowanie własne.
17
Rys. 6.3. Tablica prawdopodobieństwa dla zmiennej E  obciążenie taśmociągu.
yródło: Opracowanie własne.
Prawdopodobieństwo w węzłach A i B ma charakter bezwarunkowy, dlatego obliczone
ówcześnie wartości nie ulegną już zmianie (rys. 6.4).
A - Efektywność przesyłu
B -Własności węgla
wysoka 45.0
duze rozdrobnienie 50.0
srednia 40.0
male rozdrobnienie 50.0
niska 15.0
0.5 Ä… 0
0.385 Ä… 0.1
Rys. 6.4. Węzły sieci: efektywność przesyłu i własności węgla wraz z
prawdopodobieństwami bezwarunkowymi dla poszczególnych wartości dyskretnych
(stanów).
yródło: Opracowanie własne.
W dalszej części projektu obliczane będzie prawdopodobieństwo P(E), czyli
prawdopodobieństwo łączne. Do tego celu zostanie zastosowany następujący wzór,
wynikający z twierdzenia o prawdopodobieństwie całkowitym:
( ) ( | ) ( )
5ØCÜ 5Ø4Ü, 5Ø5Ü, 5Ø8Ü = 5ØCÜ 5Ø8Ü 5Ø4Ü, 5Ø5Ü " 5ØCÜ 5Ø4Ü, 5Ø5Ü .
Zdarzenia A i B są od siebie niezależne i zachodzą jednocześnie, mowa więc o iloczynie
zdarzeń. Aby przejść do obliczeń prawdopodobieństwa całkowitego P(E), należy obliczyć
prawdopodobieństwo równoczesnego zajścia zdarzenia A i B. Wyniki obliczeń przedstawiono
w tabeli 6.3.
18
Tab. 6.3. Tablica prawdopodobieÅ„stwa dla P(5Ø4Ü, 5Ø5Ü).
P(5ØhÜ, 5ØiÜ)
0,45 " 0,5 = 0,225
wd
0,45 " 0,5 = 0,225
wm
0,4 " 0,5 = 0,2
śd
0,4 " 0,5 = 0,2
śm
0,15 " 0,5 = 0,075
nd
0,15 " 0,5 = 0,075
nm
yródło: Opracowanie własne.
Kolejnym krokiem jest podstawienie otrzymanych prawdopodobieństw do wzoru na
prawdopodobieństwo całkowite oraz ich zsumowanie zgodnie ze wzorem:
( ) ( )
5ØCÜ 5Ø8Ü = " 5ØCÜ 5Ø4Ü, 5Ø5Ü, 5Ø8Ü .
5Ø4Ü
Tab. 6.4. Tablica prawdopodobieństwa całkowitego dla P(A,B,E)
i prawdopodobieństwa P(E).
P(A,B,E) d Å› m
wd 0,25 " 0,225 = 0,05625 0,75 " 0,225 = 0,16875 0 " 0,225 = 0
wm 0,8 " 0,225 = 0,18 0,2 " 0,225 = 0,045 0 " 0,225 = 0
śd 0 " 0,2 = 0 0,5 " 0,2 = 0,1 0,5 " 0,2 = 0,1
śm 0 " 0,2 = 0 0,25 " 0,2 = 0,05 0,75 " 0,2 = 0,15
nd 0 " 0,075 = 0 0 " 0,075 = 0 1 " 0,075 = 0,075
nm 0 " 0,075 = 0 1 " 0,075 = 0,075 0 "0,075 = 0
P(E) ="P(A,B,E) 0,23625 0,43875 0,325
yródło: Opracowanie własne.
Wyniki otrzymane jako suma jednoczesnego zajścia A, B i E stanowią
prawdopodobieństwo warunkowe P(E), które otrzymywane jest automatycznie w programie
Netica (rys. 6.5).
19
A - Efektywność przesyłu
B -Własności węgla
wysoka 45.0
duze rozdrobnienie 50.0
srednia 40.0
male rozdrobnienie 50.0
niska 15.0
0.5 Ä… 0
0.385 Ä… 0.1
E - Obciążenie taśmociągu
duze 23.6
srednie 43.9
male 32.5
0.416 Ä… 0.35
Rys. 6.5. Węzły sieci: efektywność przesyłu, własności węgla i obciążenie taśmociągu wraz z
prawdopodobieństwami dla poszczególnych wartości dyskretnych (stanów).
yródło: Opracowanie własne.
6.2. Obliczanie prawdopodobieństwa warunkowego dla zmiennej  stan
łożysk
Kolejnym etapem rozwiązywania problemu stanu rolek młynowych jest obliczenie
prawdopodobieństwa warunkowego dla poszczególnych stanów zmiennej F, czyli stanu
łożysk. W tym celu postępuje się analogicznie jak przy obliczaniu prawdopodobieństwa
zdarzenia  obciążenie taśmociągu . Na początku następuje zebranie danych statystycznych
odnośnie: konserwacji łożyska, osłony łożyska i stanu łożyska (tab. 6.5.).
Tab. 6.5. Dane historyczne dla zmiennych konserwacja łożyska i osłona łożyska.
F - Stan łożyska
C - Konserwacja
D - łożyska (warianty: t - (warianty: w 
L.p.
łożyska (warianty: c -
tak, n - nie) wytrzymałe, m  mało
częsta, r - rzadka, b - brak)
wytrzymałe)
1 r t w
2 r n w
3 r n w
4 b n m
5 r n m
6 r n m
7 r n w
8 r n w
9 r n w
10 r t w
11 r n m
yródło: Opracowanie własne.
20
Tab. 6.5. Dane historyczne dla zmiennych konserwacja łożyska i osłona łożyska, c.d.
F - Stan łożyska
C - Konserwacja
D - Osłona łożyska (warianty: w 
L.p.
łożyska (warianty: c -
(warianty: t - tak, n - nie) wytrzymałe, m 
częsta, r - rzadka, b - brak)
mało wytrzymałe)
12 r n m
13 b n m
14 r n m
15 r n m
16 b n m
17 r n w
18 r n m
19 b t m
20 r n m
P(C=c) = 2/20 = 0,1 P(D=t) = 3/20 = 0,15 P(F=w) = 8/20
=0,4
Prawdopodobieństwo a
P(C=r) = 14/20 = 0,7 P(F=m) = 12/20 =
priori
0,6
P(D=n) = 17/20 = 0,85
P(C=b) = 4/20 = 0,2
yródło: Opracowanie własne.
Aby obliczyć prawdopodobieństwa warunkowe poszczególnych stanów zdarzenia F (stan
łożyska), należy sporządzić tablicę prawdopodobieństwa, która uwzględnia zależność
przyczynowo-skutkową pomiędzy zajściem prawdopodobieństwa iloczynu zmiennych C i D
oraz prawdopodobieństwem wystąpienia F.
Liczba możliwych kombinacji stanów pomiędzy C i D wynosi 6 (3*2), a są to:
1. częsta - tak,
2. częsta - nie,
3. rzadka - tak,
4. rzadka - nie,
5. brak - tak,
6. brak - nie.
Natomiast jeśli chodzi o kombinacje stanów iloczynu zmiennych C i D i stanów zmiennej
F to jest ich 12 (3*2*2) i kształtują się następująco:
1. częsta  tak  wytrzymałe,
2. częsta  tak  mało wytrzymałe,
3. częsta  nie  wytrzymałe,
4. częsta  nie  mało wytrzymałe,
5. rzadka  tak  wytrzymałe,
6. rzadka  tak  mało wytrzymałe,
21
7. rzadka  nie  wytrzymałe,
8. rzadka  nie  mało wytrzymałe,
9. brak  tak  wytrzymałe,
10. brak  tak  mało wytrzymałe,
11. brak  nie  wytrzymałe,
12. brak  nie  mało wytrzymałe.
Kombinacje zmiennych ujęto w macierzy (tab. 6.6). Wiersze zawierają kombinacje
iloczynu zmiennych C i D, a kolumny  kombinacje zmiennej F. W miejscu skrzyżowania
kolumn i wierszy wpisywane jest prawdopodobieństwo wystąpienia zdarzenia F (jego
konkretnego stanu) pod warunkiem zajścia iloczynu zdarzeń C i D (konkretnego stanu).
Tab. 6.6. Tablica prawdopodobieństwa dla P(F|C,D).
P(F|C,D) w m
ct 1 0
cn 1 0
rt 1 0
rn 0,384615 0,615385
bt 1 0
bn 0 1
yródło: Opracowanie własne.
Aby móc obliczyć prawdopodobieństwo całkowite P(F) przy pomocy programu, należy
wprowadzić do Netici opracowane tablice prawdopodobieństwa dla P(C), P(D) i P(F|C,D), co
przedstawiono na rys. 6.6,6.7 i 6.8.
Rys. 6.6. Tablica prawdopodobieństwa dla zmiennej C  konserwacja łożyska.
yródło: Opracowanie własne.
22
Rys. 6.6. Tablica prawdopodobieństwa dla zmiennej D  osłona łożyska.
yródło: Opracowanie własne.
Rys. 6.7. Tablica prawdopodobieństwa dla zmiennej F  stan łożyska.
yródło: Opracowanie własne.
Prawdopodobieństwo w węzłach C i D ma charakter bezwarunkowy, dlatego obliczone
ówcześnie wartości nie ulegną już zmianie (rys. 6.8).
C - Konserwacja łożysk
D - Osłona łożyska
czesta 10.0
tak 15.0
rzadka 70.0
nie 85.0
brak 20.0
0.78 Ä… 0.29
0.6 Ä… 0.31
Rys. 6.8. Węzły sieci: konserwacja łożyska i osłona łożyska wraz z prawdopodobieństwami
bezwarunkowymi dla poszczególnych wartości dyskretnych (stanów).
yródło: Opracowanie własne.
Dalsze postępowanie jest analogiczne do obliczania prawdopodobieństwa P(E). Zatem
korzystając z odpowiednich twierdzeń obliczane są iloczyny zdarzeń C i D, czyli P(C,D),
prawdopodobieństwo łączne P(C,D,F) oraz prawdopodobieństwo P(F). Wyniki obliczeń
przedstawiajÄ… tabele 6.7 i 6.8.
23
Tab. 6.7. Tablica prawdopodobieÅ„stwa dla P(5Ø6Ü, 5Ø7Ü).
P(C,D)
ct
0,015
cn
0,085
rt
0,105
rn
0,595
bt
0,03
bn
0,17
PF
1,00
yródło: Opracowanie własne.
Tab. 6.8. Tablica prawdopodobieństwa całkowitego dla P(C,D,F)
i prawdopodobieństwa P(F).
P(C,D,F) w m
ct 0,015 0
cn 0,085 0
rt 0,105 0
rn 0,228846 0,366154
bt 0,03 0
bn 0 0,17
P(F) ="P(C,D,F) 0,463846 0,536154
yródło: Opracowanie własne.
Wyniki otrzymane jako suma jednoczesnego zajścia C, D i F stanowią
prawdopodobieństwo warunkowe P(F), które otrzymywane jest automatycznie w programie
Netica (rys. 6.8).
C - Konserwacja łożysk
D - Osłona łożyska
czesta 10.0
tak 15.0
rzadka 70.0
nie 85.0
brak 20.0
0.78 Ä… 0.29
0.6 Ä… 0.31
F - Stan łożysk
wytrzymale 46.4
malo wytrzymale 53.6
0.522 Ä… 0.3
Rys. 6.8. Węzły sieci: konserwacja łożyska, osłona łożyska i stan łożyska wraz z
prawdopodobieństwami dla poszczególnych wartości dyskretnych (stanów).
yródło: Opracowanie własne.
24
6.3. Obliczenie prawdopodobieństwa warunkowego dla zmiennej  stan
rolek młynowych
Aby obliczyć prawdopodobieństwa poszczególnych stanów dla zmiennej G ( stan rolek
młynowych ) trzeba zestawić w jednej tabeli dane statystyczne obciążenia taśmociągu (E),
stanu łożysk (F) i stanu rolek młynowych. P(E) i P(F) wpływają na P(G), czyli ostateczną
prognozę. W tabeli 6.9 zaprezentowano jak kształtują się poszczególne prawdopodobieństwa
a priori omawianych zmiennych.
Tab. 6.9. Dane historyczne dla obciążenia taśmociągu, stanu łożysk i stanu rolek
młynowych c.d.
E  Obciążenie F - Stan łożysk
(warianty: w  G  Stan rolek
taśmociągu
wytrzymałe, m  mało
L.p.
(warianty: młynowych (warianty:
wytrzymałe)
d - duże, ś  średnie, d  dobry, z  zły)
m - małe)
1 Å› w d
2 Å› w d
3 Å› w d
4 Å› m z
5 d m z
6 m m d
7 m w d
8 m w d
9 d w z
10 m w d
11 m m d
12 d m z
13 m m d
14 Å› m d
15 Å› m d
16 Å› m z
17 m w d
18 Å› m d
19 Å› m z
20 d m z
P(E=d) = 5/20 = 0,25 P(G=d) = 13/20 = 0,65
P(F=w) = 8/20 =0,4
Prawdopodobieństwo
P(E=Å›) = 8/20 = 0,4
a priori
P(F=m) = 12/20 = 0,6 P(G=z) = 7/20 = 0,35
P(E=m) = 7/20 = 0,35
yródło: Opracowanie własne.
25
W dalszej części sprawozdania postępuje się jak w poprzednich przypadkach, kiedy to
obliczane było prawdopodobieństwo warunkowe. Zatem aby obliczyć prawdopodobieństwa
warunkowe poszczególnych stanów zdarzenia G (stan rolek młynowych), należy sporządzić
tablicę prawdopodobieństwa, która uwzględnia zależność przyczynowo-skutkową pomiędzy
zajściem prawdopodobieństwa iloczynu zmiennych E i F oraz prawdopodobieństwem
wystÄ…pienia F.
Liczba możliwych kombinacji stanów pomiędzy E i F wynosi 6 (3*2), a są to:
1. duże  wytrzymałe,
2. duże  mało wytrzymałe,
3. średnie  wytrzymałe,
4. średnie  mało wytrzymałe,
5. małe  wytrzymałe,
6. małe  mało wytrzymałe.
Natomiast jeśli chodzi o kombinacje stanów iloczynu zmiennych E i F i stanów zmiennej
G to jest ich 12 (3*2*2) i kształtują się następująco:
1. duże  wytrzymałe  dobry,
2. duże  wytrzymałe  zły,
3. duże  mało wytrzymałe  dobry,
4. duże  mało wytrzymałe  zły,
5. średnie  wytrzymałe  dobry,
6. średnie  wytrzymałe  zły,
7. średnie  mało wytrzymałe  dobry,
8. średnie  mało wytrzymałe  zły,
9. małe  wytrzymałe  dobry,
10. małe  wytrzymałe  zły,
11. małe  mało wytrzymałe  dobry,
12. małe  mało wytrzymałe - zły
Kombinacje zmiennych ujęto w macierzy (tab. 6.10). Wiersze zawierają kombinacje
iloczynu zmiennych E i F, a kolumny  kombinacje zmiennej G. W miejscu skrzyżowania
kolumn i wierszy wpisywane jest prawdopodobieństwo wystąpienia zdarzenia G (jego
konkretnego stanu) pod warunkiem zajścia iloczynu zdarzeń E i F (konkretnego stanu).
26
Tab. 6.10. Tablica prawdopodobieństwa dla P(G|E,F).
P(G|E,F) d z
dw 1 0
dm 0 1
św 1 0
śm 0,6 0,4
mw 1 0
mm 1 0
yródło: Opracowanie własne.
Aby móc obliczyć prawdopodobieństwo całkowite P(G) przy pomocy programu, należy
wprowadzić do Netici opracowane tablice prawdopodobieństwa dla P(E), P(F) i P(G|E,F), co
przedstawiono na rys. 6.3,6.7 i 6.9.
Rys. 6.9. Tablica prawdopodobieństwa dla zmiennej G  stan rolek młynowych.
yródło: Opracowanie własne.
Dalsze postępowanie jest nieco inne niż obliczanie prawdopodobieństwa P(F). Tak jak
wcześniej z odpowiednich równań obliczane są iloczyny zdarzeń E i F, czyli P(E,F),
prawdopodobieństwo łączne P(E,F,G) oraz prawdopodobieństwo P(G). Jednak w przypadku
iloczynu zdarzeń E i F są brane pod uwagę prawdopodobieństwa warunkowe, czyli te, które
zostały podane jako efekty pracy z poprzednich podrozdziałów (tab. 6.11). Aby wykazać tą
drobną różnicę w tabeli z prawdopodobieństwem P(E,F) zostaną zawarte również obliczenia
(tab. 6.12). Tablica zawierająca prawdopodobieństwo całkowite P(E,F,G) oraz
prawdopodobieństwo P(G) przedstawia gotowe wyniki obliczeń (tab. 6.13).
27
Tab. 6. 11. Zestawienie prawdopodobieństw warunkowych P(E) i P(F) dla
poszczególnych stanów zmiennych E i F.
E F
0,23625 0,463846
d w
0,43875 0,536154
Å› m
0,325
m
yródło: Opracowanie własne.
Tab. 6.12. Tablica prawdopodobieÅ„stwa dla P(5Ø8Ü, 5Ø9Ü).
P(E,F)
dw 0,23625*0,463846 = 0,109584
dm 0,23625*0,536154 =0,126666
św 0,43875*0,463846 =0,203512
śm 0,43875*0,536154 = 0,235238
mw 0,325*0,463846 = 0,15075
mm 0,325*0,536154 = 0,17425
yródło: Opracowanie własne.
Tab. 6.13. Tablica prawdopodobieństwa całkowitego dla P(E,F,G)
i prawdopodobieństwa P(G).
P(E,F,G) d z
dw 0,109584 0
dm 0 0,126666
św 0,203512 0
śm 0,141143 0,094095
mw 0,15075 0
mm 0,17425 0
P(G) ="P(E,F,G)
0,779239 0,220761
yródło: Opracowanie własne.
Wyniki otrzymane jako suma jednoczesnego zajścia E, F, G stanowią
prawdopodobieństwo warunkowe P(G), które otrzymywane jest automatycznie w programie
Netica (rys. 6.10).
28
A - Efektywność przesyłu C - Konserwacja łożysk
B -Własności węgla D - Osłona łożyska
wysoka 45.0 czesta 10.0
duze rozdrobnienie 50.0 tak 15.0
srednia 40.0 rzadka 70.0
male rozdrobnienie 50.0 nie 85.0
niska 15.0 brak 20.0
0.5 Ä… 0 0.745 Ä… 0.25
0.385 Ä… 0.1 0.54 Ä… 0.25
E - Obciążenie taśmociągu
F - Stan łożysk
duze 23.6
wytrzymale 46.4
srednie 43.9
malo wytrzymale 53.6
male 32.5
0.507 Ä… 0.1
0.348 Ä… 0.059
G - Stan rolek młynowych
dobry 77.9
zly 22.1
0.584 Ä… 0.12
Rys. 6. 10. Sieć bayesowska z gotowym rozwiązaniem problemu dotyczącego stanu rolek
młynowych.
yródło: Opracowanie własne.
UWAGA: Należy pamiętać, że prawdopodobieństwa są wprowadzane do tablicy w
ułamku dziesiętnym, jednak w węzle sieci prawdopodobieństwa przeliczane są na procenty i
w takiej też formie wyświetlane.
6.4. Wnioski
W wyniku wprowadzenia danych do programu Netica (wstawieniu węzłów sieci,
wprowadzeniu relacji przyczynowych, określeniu tablic prawdopodobieństw warunkowych) i
skompilowaniu sieci, otrzymano wartości prawdopodobieństwa warunkowego określającego
stan rolek młynowych. Zgodnie z obliczeniami prawdopodobieństwo wystąpienia dobrego
stanu rolek wynosi 0,779 natomiast złego  0,221. Odnosząc się do tabeli 5.2, w której to
zamieszczono interpretację poszczególnych przedziałów prawdopodobieństwa wnioskuje się,
że istnieje bardzo małe prawdopodobieństwo wadliwości rolek młynowych. W tym
przypadku dział zaopatrzenia nie powinien dokonywać zakupu materiałów do naprawy rolek,
gdyż można spodziewać się, że zachowają one sprawność. Jak już wspomniano wcześniej, do
dokładnego określenia ilości zepsutych rolek należy posłużyć się metodą szeregów
czasowych.
29
7. Symulacja skonstruowanej sieci Bayesa
Kolejnym etapem projektu będzie wykonanie symulacji zdarzeń zawartych w
skonstruowanej sieci. Przez symulacjÄ™ rozumie siÄ™ badanie rzeczywistego systemu za pomocÄ…
eksperymentowania na modelu, dokonywanego przez wprowadzanie różnych założeń, co do
warunków działania systemu. W ten sposób otrzymuje się zbiór prognoz badawczych. W
rozpatrywanym przypadku została sporządzona tylko jedna symulacja, która da możliwość
porównania prognoz przy różnych wartościach parametrów zmiennych objaśniających.
Aby nie powtarzać ponownie całego procesu obliczeniowego przedstawiono gotową sieć
z wyliczonymi wartościami prawdopodobieństw (rys. 7.1).
A - Efektywność przesyłu C - Konserwacja łożysk
B -Własności węgla D - Osłona łożyska
wysoka 60.0 czesta 0
duze rozdrobnienie 60.0 tak 70.0
srednia 40.0 rzadka 20.0
male rozdrobnienie 40.0 nie 30.0
niska 0 brak 80.0
0.5 Ä… 8.6e-5 0.36 Ä… 0.32
0.43 Ä… 0.024 0.3 Ä… 0.2
E - Obciążenie taśmociągu
F - Stan łożysk
duze 28.2
wytrzymale 72.3
srednie 47.8
malo wytrzymale 27.7
male 24.0
0.455 Ä… 0.089
0.346 Ä… 0.063
G - Stan rolek młynowych
dobry 86.9
zly 13.1
0.611 Ä… 0.1
Rys. 7.1. Sieć bayesowska z gotowym rozwiązaniem problemu dotyczącego stanu rolek
młynowych (symulacja).
yródło: Opracowanie własne.
Symulację dokonano na całkiem zmienionych wartościach stanów zmiennych. Poniżej
zestawiono ze sobą wybrane elementy sieci bayesowskiej z prognozy właściwej i symulacji
(rys. 7.2, 7.3, 7.4., 7.5).
30
A - Efektywność przesyłu
A - Efektywność przesyłu
B -Własności węgla
wysoka 60.0
B -Własności węgla
wysoka 45.0
srednia 40.0 duze rozdrobnienie 60.0
srednia 40.0 duze rozdrobnienie 50.0
niska 0 male rozdrobnienie 40.0
niska 15.0 male rozdrobnienie 50.0
0.43 Ä… 0.024 0.5 Ä… 8.6e-5
0.385 Ä… 0.1 0.5 Ä… 0
E - Obciążenie taśmociągu
E - Obciążenie taśmociągu
duze 28.2
duze 23.6
srednie 47.8
srednie 43.9
male 32.5 male 24.0
0.416 Ä… 0.35 0.346 Ä… 0.063
a) b)
Rys. 7.2. Porównanie węzłów sieci: efektywność przesyłu, własności węgla i obciążenie
taśmociągu - a) prognoza właściwa, b) symulacja.
yródło: Opracowanie własne.
Jak widać niewielkie zmiany co do wartości prawdopodobieństw bezwarunkowych
zmiennych A i B słabo wpłynęły na wartości stanów zmiennej E. Zaobserwowano
stosunkowo małe różnice (P1  prawdopodobieństwo pierwszej prognozy, P2 
prawdopodobieństwo drugiej prognozy, po symulacji):
·ð P1(E=d) = 0,236, P2(E=d) = 0,282,
·ð P1(E=Å›) = 0,439, P2(E=Å›) = 0,478,
·ð P1(E=m) = 0,325, P2(E=Å›) = 0,240.
C - Konserwacja łożysk
C - Konserwacja łożysk
D - Osłona łożyska
D - Osłona łożyska
czesta 10.0
czesta 0
tak 15.0
rzadka 70.0
tak 70.0
rzadka 20.0
nie 85.0
brak 20.0
nie 30.0
brak 80.0
0.745 Ä… 0.25
0.54 Ä… 0.25
0.36 Ä… 0.32
0.3 Ä… 0.2
F - Stan łożysk
F - Stan łożysk
wytrzymale 46.4 wytrzymale 72.3
malo wytrzymale 53.6 malo wytrzymale 27.7
0.507 Ä… 0.1 0.455 Ä… 0.089
a) b)
Rys. 7.3. Porównanie węzłów sieci: konserwacja łożysk, osłona łożysk i stan łożysk -
a) prognoza właściwa, b) symulacja.
yródło: Opracowanie własne.
31
Porównując ze sobą prawdopodobieństwa zmiennych C, D i F dostrzega się bardzo duże
różnice co do wartości prawdopodobieństw bezwarunkowych i warunkowych. Oto
zestawienie prawdopodobieństw dla poszczególnych stanów zmiennej F:
·ð P1(F=w) = 0,464, P2(E=w) = 0,723,
·ð P1(F=m) = 0,536, P2(E=m) = 0,277.
G - Stan rolek młynowych G - Stan rolek młynowych
dobry 77.9 dobry 86.9
zly 22.1 zly 13.1
0.584 Ä… 0.12 0.611 Ä… 0.1
a) b)
Rys. 7.4. Porównanie węzłów sieci: stan rolek młynowych -
a) prognoza właściwa, b) symulacja.
yródło: Opracowanie własne.
Ostatnim krokiem analizy wykonanej symulacji jest omówienie zmian jakie zaszły w
przypadku zmiennej objaśnianej. Na powyższym rysunku widać, że zwiększyło się
prawdopodobieństwo dobrego stanu rolek, jednak ogólna interpretacja wyniku prognozy nie
zmienia się (tab. 5.2). Oto zestawienie prawdopodobieństw dla poszczególnych stanów
zmiennej G:
·ð P1(G=dw) = 0,779, P2(G=d) = 0,869,
·ð P1(G=z) = 0,221, P2(G=z) = 0,131.
7.1. Wnioski
Podsumowując wykonana symulację należy zauważyć, że niewielkie zmiany w
efektywności przesyłu i własnościach węgla (w porównaniu do sporządzonej prognozy), słabo
oddziaływają na zmianę obciążenie taśmociągu. Można dopuścić się tezy, że podwyższenie
efektywności przesyłu i zwiększenie rozdrobnienia węgla wzajemnie niwelują wpływ na
obciążenie taśmociągu. Wniosek ten wiąże się z następującym faktem  im większa
efektywność przesyłu węgla, tym większe obciążenie taśmociągu oraz im większe
32
rozdrobnienie węgla tym mniejsze obciążenie taśmociągu. Drugi wniosek jaki można
wyciągnąć z porównanie sytuacji rzeczywistej z symulowaną dotyczy zmian wprowadzonych
przy konserwacji łożysk i osłonie łożysk. Mianowicie uwidacznia się silny wpływ dużych
zmian tych zmiennych na ogólny stan łożysk. Co ciekawe, zwiększenie prawdopodobieństwa
stosowania łożysk z osłoną kosztem zmniejszenia częstotliwości konserwacji łożysk wpłynęło
pozytywnie na ich wytrzymałość. Stad można przypuszczać, że konserwacja łożysk nie ma
dużego wpływu na stan łożysk. Zwracając uwagę na fakt, że konserwacja jest uciążliwą
operacją ze względu na konieczność zatrzymania taśmociągu i zaangażowanie pracowników,
warto pomyśleć nad ograniczeniem tej czynności i stosować w większej mierze łożyska z
osłonami. Można również utrzymać dotychczasową częstotliwość konserwacji jeżeli korzyści
z niej płynące uznane zostaną za wystarczające. Oczywiście, aby podjąć tego typu decyzje
należałoby się przekonać, czy zależność potwierdzi się przy innych założeniach
początkowych dla zmiennych  konserwacja łożyska i  osłona łożysk . Trzeci i ostatni
wniosek z analizy prognozy i symulacji płynie z obserwacji zmian zmiennej objaśnianej, czyli
stanu rolek młynowych. Zmiana ta wynosi dokładnie 9%. Tak więc prawdopodobieństwo
stanu  dobry wzrosło z 0,779 do 0,869, a prawdopodobieństwo stanu  zły spadło z 0,221 do
0,131. W takiej sytuacji interpretacja wyniku jest taka sama jak dla prognozy właściwej z
tym, że prawdopodobieństwo wystąpienia wadliwej rolki zmniejsza się jeszcze bardziej.
Wracając na koniec do kwestii optymalizacji warunków pracy rolek młynowych, warto
podkreślić, że nawet dokonanie małej zmiany w postaci zakupu łożysk z osłoną sprawi, że
rolki młynowe będą trwalsze. W celu dalszego zmniejszenia prawdopodobieństwa
wystąpienia zepsutych rolek, należałoby wykonać kolejne symulacje. Dzięki temu można
zbliżyć się do najbardziej optymalnych warunków eksploatacji rolek młynowych.
Symulacja zdarzeń opisanych w modelu jest dobrym uzupełnieniem prognozy. Na
podstawie obszernego zbioru prognoz badawczych uzyskanych w wyniku symulacji, można
nie tylko przewidzieć skutki pewnych zdarzeń, ale również określić jakie są optymalne
warunki pracy rolek. Dzięki temu możliwe jest dostosowanie parametrów efektywności
przesyłu, własności węgla, konserwacji i osłony łożysk do takich, które pozytywnie wpływają
na pracę rolek młynowych. Do tego celu może się również przysłużyć analiza korelacji
poszczególnych zmiennych objaśniających i zmiennej objaśnianej. Po zweryfikowaniu, która
ze zmiennych wpływa najsilniej na zmienną objaśnianą można zadecydować o zmianie jej
parametrów - przykładowo przesyłać węgiel o dużym rozdrobnieniu i przez to odciążyć
taśmociąg a w konsekwencji rolki młynowe. Wówczas reguluje się tylko jeden czynnik
wpływu, co z pewnością jest mniej kłopotliwe i kosztochłonne od pełnej maksymalizacji
33
korzyści. Oczywiście należy również uwzględnić takie kwestie jak opłacalność tego typu
operacji, zaangażowanie siły roboczej czy przestoje w pracy urządzeń.
34
Bibliografia
[1] BEDNARSKI M.: Metody doskonalenia sieci bayesowskich stosowanych w
diagnostycznych systemach doradczych. Gliwice: Zeszyty Naukowe Katedry Podstaw
Konstrukcji Maszyn Politechniki ÅšlÄ…skiej 2006
[2] DITTMAN P.: Prognozowanie w przedsiębiorstwie. Kraków: Oficyna a Wolters Kluwer
Business 2009
[3] KUCZMOWSKA B.: Prognozowanie kondycji ekonomiczno-finansowej przedsiębiorstw
z wykorzystaniem sieci przekonań Bayesa.  Barometr regionalny 2006 nr 2 s. 82-87
[4] PONIKOWSKA T.: Sieci bayesowskie i sieci (samo)wspierania, teoria i zastosowania do
danych z systemu USOS. Praca magisterska na kierunku informatyka Wydziału Matematyki,
Informatyki i Mechaniki Uniwersytetu Warszawskiego 2012
[5] www.danrol.pl/index.php/pl/rolki, 10.04.2013
[6] www.mp.pl, 14.04.2013
[7] www.statsoft.pl, 14.04.2013
35


Wyszukiwarka