Analiza baz danych na temat materiałów betonopodobnych


XLVIII KONFERENCJA NAUKOWA
KOMITETU INŻYNIERII LDOWEJ I WODNEJ PAN
I KOMITETU NAUKI PZITB
Opole  Krynica 2002
Janusz KASPERKIEWICZ1
ANALIZA BAZ DANYCH NA TEMAT MATERIAAÓW BETONOPODOBNYCH
1. O potrzebie automatyzacji analizy danych inżynierskich
Opracowanie niniejsze poświęcone jest prawidłowemu postępowaniu przy naborze danych oraz
możliwościom ich automatycznej eksploatacji.
Rozwój nowych technologii powoduje ciągły napływ rozproszonych, nieuporządkowa-
nych informacji, które trudno jest wykorzystać ograniczając się tylko do tradycyjnych metod
analizy, polegajÄ…cych np. na budowaniu modeli empirycznych i poszukiwaniu prostych kore-
lacji. W dziedzinie tworzyw betonopodobnych dotyczy to zwłaszcza tzw. "wysokich technolo-
gii", takich jak stosowanie betonów wysokiej wartości (BWW), betonów samopoziomujących
się czy kompozytów zawierających mikrowłókna.
Nowe składniki i technologie pojawiają się obecnie w coraz krótszych odstępach czasu,
wpływając na podobnie szybki wzrost oczekiwań i standardów. Wykres poniżej  rys. 1  ma
ilustrować dynamikę zachodzących zmian na przykładzie betonu. Wytrzymałość betonu stanowi
tu jedynie przykład, a spostrzeżenie dotyczy także innych cech podobnych kompozytów.
Urabialność betonu, jego ścieralność czy mrozoodporność, ulegały polepszeniu stosunkowo
powoli w czasie pierwszych 150 lat historii nowoczesnego budownictwa. Natomiast w drugiej
połowie XX wieku nastąpiło niemal jednoczesne pojawienie się nowych składników (np.
domieszki napowietrzające, plastyfikatory i superplastyfikatory, pyły krzemionkowe, włókna
i mikrowłókna), nowe metody projektowania, nowe techniki wykonawcze (takie jak pompo-
wanie, naparzanie, próżniowanie, torkret, wirowanie, wyciskanie), nowe oddziaływania,
(obciążenia) oraz nowe techniki badawcze (automatyczna analiza obrazów, badanie cienkich
szlifów, SEM, rezonans magnetyczny, badania akustyczne, itd.).
Rys. 1. Dynamika zmian na przykładzie wytrzymałości betonu
1
Prof., dr inż. hab., Instytut Podstawowych Problemów Techniki PAN, Warszawa
36
Rozwój technologii powoduje, że zasoby wiedzy rosną niemal wykładniczo w czasie
(rys. 1), i niezbędne są bardziej efektywne narzędzia do ich eksploatacji.
Rozwiązaniem problemu jest wyzyskanie metod zautomatyzowanych, określanych często
jako "metody sztucznej inteligencji". Konieczne jednak jest wówczas zachowanie pewnej
dyscypliny i pewnego formalizmu sposobów zbierania danych, co gwarantuje możność ich
pózniejszego, skutecznego wykorzystywania.
Referat dotyczy racjonalnego tworzenia baz danych oraz niektórych wymagań, co do ich
formy tak, aby łatwa była ich analiza i eksploatacja z pomocą rozmaitych technik komputacyjnych.
Prezentację oparto na prostym przykładzie niewielkiego zbioru danych z zakresu
mrozoodporności betonu konstrukcyjnego. Pokazano poprawny sposób przygotowywania
danych oraz efekty ich analizy za pomocą dwóch wybranych metod z zakresu ML (ML -
Machine Learning  Uczenie Maszyn).
Nowość pracy stanowi zademonstrowana możliwość efektywnego użycia omawianych
metod nawet w wypadku danych niezbyt licznych, a nawet niekompletnych.
2. Wnioskowanie na podstawie przykładów
Uczenie i wnioskowanie na podstawie przykładów jest podstawowym elementem szeregu
technik obliczeniowych, utożsamianych najczęściej z terminem "sztuczna inteligencja", chociaż
bardziej adekwatne byłoby skromniejsze określenie "metody komputacyjne". Uczenie takie
stanowi ważny cel kompletowania i zajmowania się bazami danych. Niestety, wbrew
naturalnemu oczekiwaniu większość informacji powstających w cyklach produkcyjnych i
wykonawczych w rozmaitych działach budownictwa i inżynierii lądowej, kolekcjonowana jest
raczej ze względów prawno-administracyjnych, a nie w celu dalszej eksploatacji naukowej.
Uwidacznia siÄ™ to natychmiast, gdy tylko zaistnieje potrzeba przedstawienia ich w formie
elektronicznej, kiedy to trzeba mozolnie wpisywać dane z dzienników budowy czy z wytwórni
do elektronicznych arkuszy kalkulacyjnych.
Nawet pomimo takich ograniczeń technologowie dysponują obecnie dostępem do coraz
większej ilości masowych danych, często i pozornie słabo ze sobą powiązanych. Na dodatek
ciągle napływają dane nowe, pochodzące z różnych ośrodków, publikacji, raportów czy atestów,
a oczywistą staje się konieczność możliwie szybkiego i wiarygodnego analizowania wszystkich
takich informacji równocześnie.
Posiadając wiarygodny i uporządkowany zbiór danych, na podstawie znanych przykładów
trenujących można klasyfikować zestawy danych nowych lub pojedyncze nowe rekordy do
rozpoznanych już wcześniej klas, co otwiera możliwości szacowania (predykcji) właściwości
dotyczące materiałów o zbliżonych cechach, które to materiały nie były jeszcze pod danym
względem badane.
Zadania, o jakich tu mowa, dają się realizować wyłącznie dzięki postępowi komputeryzacji.
Należy pamiętać, że wnioskowanie na podstawie przykładów może być poprawne jedynie
w odniesieniu do atrybutów (cech, właściwości) objętych zakresem przykładów trenujących.
Wszelkie próby ekstrapolacji wyników poza taki zakres są zawsze bardzo ryzykowne.
3. Struktura bazy danych
Dane, z jakimi styka się technolog konstrukcji betonowych próbujący uogólnić nowe
osiągnięcia, np. celem oceny i akceptacji nowych propozycji rynkowych, pochodzą z
rozmaitych zródeł. Opisy kolekcji danych w kontekście szeroko rozumianych metod sztucznej
inteligencji pojawiajÄ… siÄ™ w ciÄ…gle jeszcze stosunkowo nielicznych opracowaniach, a do kwestii
formalizmu i poprawnego kształtowania takich zbiorów przykładana jest niedostateczna uwaga.
Zbiory danych, z jakich można korzystać w celach projektowania, i optymalizacji
materiałów konstrukcyjnych powstają w wyniku:
37
obserwacji stanów naturalnych elementów konstrukcji (in situ)
obserwacji podczas badań laboratoryjnych
realizacji pracochłonnych obliczeń o znanym algorytmie
symulowania procesów technologicznych o założonych cechach rozkładu
procesów automatycznego przekształcania obrazów materiału
Analiza danych, co przyjęło się w nomenklaturze angielskiej określać jako "górnictwo danych"
(data mining), obejmuje liczne dziedziny wiedzy, najczęściej bardzo odległe od inżynierii
lądowej. Poniżej mowa jest o znacznie zawężonym zakresie badań materiałowych, reali-
zowanych z pomocÄ… rozmaitych metod, poczynajÄ…c od metod statystycznego rozpoznawania
struktur  np. 0, poprzez rozmaite realizacje sztucznych sieci neuronowych, np. 0, kończąc na
metodach z zakresu uczenia maszynowego, np. 0, 0.
Bazę danych w niniejszym tekście definiuje się jako odpowiednio uporządkowany zbiór
rekordów o ustalonej strukturze. Od luznych notatek z rzeczywistych obserwacji bazę różni jej
sformalizowanie. Dobrym obyczajem jest rozpoczęcie pracy nad analizą danych od opracowania
tablicy charakteryzującej strukturę bazy. Dotyczący omawianych dalej prób przykład pokazano
poniżej  tab. 1.
Tablica 1. Charakterystyka atrybutów bazy danych
zakres
opis atrybutu jedn. symbol typ funkcja min max zmienn. uwagi
lub lista
1 2 3 4 5 6 7 8 9
1 etykieta [ - ] Key label inf np. numer
rekordu serii próbek
2 gęstość [kg/m3] gest con input 2250 2520 270 badanie
normowe
3 wytrz. 28d na [MPa] wytrz con input 20 120 100 badanie
ścisk. normowe
4 porowatość [ % ] porow con input 0.1 12.0 11.9 wg szlifu
5 wskaznik [mm] L-factor con input 0.01 0.6 0.59 wg szlifu
rozmieszcz.
porów
6 pow. porów [mm-1] alfa lin input 10 60 50 wg szlifu
7 klasa mrozo- MrzOdp nom output - - odporny metoda
odporności nieodporny Boras
Niezależnie od sposobu faktycznego jej przechowywania na nośnikach elektronicznych
bazę danych można wyobrazić sobie jako tablicę, w której dokładnie ustalony jest zbiór
możliwych wartości poszczególnych pól. Ustalanie zawartości pól następuje przez podanie
zakresu w wypadku zmiennych liczbowych, lub przez podanie katalogu (listy) możliwych
wartości, w wypadku zmiennych jakościowych. Pola tablicy wypełniają liczby lub oznaczenia
alfanumeryczne, co oznacza, że jej elementami składowymi mogą być nie tylko liczby, ale i
łańcuchy tekstowe (łańcuchy alfanumeryczne - strings). Jednym z dopuszczalnych oznaczeń
może być także symbol braku informacji (tutaj przedstawiany jako '?').
Tablica danych zbudowana jest z wierszy i kolumn. W wypadku danych czysto
numerycznych tablica odpowiada prostokÄ…tnej macierzy znanej z algebry liniowej. Wygodnie
jest jednak korzystać z oczywistej analogii i baza danych utożsamiana jest w tekście poniżej z
macierzÄ… o wymiarach m×n. Macierz danych ma m wierszy i n+1 kolumn, (etykiety sÄ… kolumnÄ…
dodatkową). Liczby m i n określają odpowiednio liczby rekordów w danej bazie (m) i liczbę
występujących atrybutów (n). W podanym przykładzie w tab. 1 i tab. 2  poniżej, mowa jest o
macierzy o wymiarach 25×6.
38
Każdy rekord jest pojedynczym wynikiem obserwacji, może także stanowić uśrednienie
z kilku obserwacji. Przykład układu prostej bazy zestawionej celem demonstracji w tym
opracowaniu pokazany jest poniżej  tab. 2.
Tablica 2. Fragment (początek i koniec) macierzy rozważanej bazy danych;
w pierwszym wierszu dołączono objaśnienia kolumn; symbole atrybutów wg tab. 1
Key gest wytrz porow L-factor alfa MrzOdp
1 2333 49.3 4.8 0.22 28 odporny
2 2348 50.0 4.2 ? ? nieodporny
3 2369 52.7 5.6 ? ? nieodporny
4 2351 57.2 5.6 ? ? nieodporny
5 2359 53.1 4.4 0.20 44 nieodporny
... ... ... ... ... ... ...
23 2371 ? ? ? 38 odporny
24 2371 ? ? 0.50 ? nieodporny
25 2371 ? ? 0.10 ? odporny
Do celów demonstracji 25 rekordów bazy danych uzyskano bądz z badań własnych, bądz z
monografii 0 i 0. Ponieważ poszczególne zródła były niekompatybilne, dlatego na 125 pól w
macierzy danych występowało aż 56 braków (ok. 42% całości), oznaczonych symbolem '?'.
Listę możliwych typów atrybutów pokazano w tab. 3.
Tablica 3. Możliwe typy atrybutów
typ symbol przykład
1 ciągły con x " { x: x > 3.15 AND x d" 14.00 }
2 cykliczny cyc x " { wiosna, lato, jesien, zima }
3 identyfikator label dowolny, zgodny z wymaganiami systemu
4 liniowy lin x " { 1, 7, 8, 11, 72, 356, 1435 }
5 logiczny log x " { FALSE, TRUE }
6 nominalny nom x " { bazalt, granit, wapień, pospółka-A, pospółka-C }
7 strukturalny str x " { r2-4, r2-8, r8-10, r10plus }
8 wyłączony ign - może zastąpić dowolny inny typ atrybutu
Atrybuty dzielą się na objaśniające i objaśniane, oznaczane w (tab.1) jako - odpowiednio - input
i output. Jak widać baza pomyślana została tak aby na podstawie wybranych informacji na temat
próbki betonu stwardniałego  są to: gęstość betonu, jego wytrzymałość na ściskanie, zawartość
powietrza oraz dwa parametry wynikajÄ…ce z analizy struktury napowietrzenia, np. zgodnie z
PrPN-EN 480-11, 0, określić można było czy beton będzie mrozoodporny czy też nie, przy
badaniu mrozoodporności metodą złuszczania powierzchniowego (metoda Boras).
Wybrany przykład jest bardzo prosty i jednoznaczny. Jest on także stosunkowo
niekorzystny, jako że baza zawierała zarówno niewiele danych (tylko 25 rekordów) jak i duży
procent pól pustych (45% ubytków).
Atrybuty objaśniające dzielić się mogą dodatkowo na atrybuty podstawowe lub pierwotne
(np. zawartości w mieszance wody i cementu) oraz atrybuty pochodne (derived; np. stosunek
w/c w tej samej mieszance). Liczba tych ostatnich jest właściwie nieograniczona.
39
Należy dodać, że dodatkowo, jeśli zachodzi potrzeba przejścia ze zmiennych nominalnych
(jakościowych) na ilościowe, będzie się to wiązało z trudnymi do przewidzenia skutkami.
Operacji takich należy unikać. Inną komplikacją jest obecność w strukturze danych całych
rekordów niepewnych lub niepewnych wartości niektórych składowych. Opisywanie ich
wymaga dołączenia dalszych atrybutów. W każdym zbiorze danych dopuszczać trzeba ponadto
ewentualność występowania outliersów  i to zarówno outliersów rekordów jak i outliersów
atrybutów. Ich usunięcie, ewentualnie zaakceptowanie można oprzeć wyłącznie na analizie
statystycznej.
Efektywność niektórych programów typu ML zależeć może od kolejności analizowania
rekordów i od uporządkowania atrybutów. Optymalne uporządkowanie wybrać można z
pomocą zaawansowanych technik statystycznych, np. GCA  technika pozwalająca ustalić które
atrybuty są "bliżej siebie" w sensie wyrazniejszej korelacji dodatniej lub ujemnej. Innym
rozwiązaniem jest stosowanie metody prób.
Dopuszczać należy współobecność w bazie atrybutów aktywnych i nieaktywnych. W
wielu sytuacjach warto przechowywać informację o atrybutach pozbawionych oczywistego
wpływu na interesująca użytkownika cechę, ponieważ dana informacja przydatna może okazać
się dopiero pózniej.
Ważnym elementem bazy danych jest jej liczność, jednoznaczność i wiarygodność. Tę
ostatnią można jednak ocenić wyłącznie na podstawie oszacowania eksperta.
W opisie struktury bazy poza określeniem atrybutów w sensie ich treści podać trzeba
(tab. 1): jednostki (kolumna 2), oznaczenia symboliczne, niezbędne przy definiowaniu
przekształceń (kolumna 3), typ atrybutu (kolumna 4), funkcję w procesie predykcji (kolumna 5)
oraz zakresy dopuszczalnych wartości (kolumny 6-8).
4. Techniki i narzędzia porządkowania i analizowania baz danych
Przy przygotowaniu i porzÄ…dkowaniu danych najpierw stosuje siÄ™ procedury statystyczne. M.in.
umożliwiają one wstępne badanie danych, identyfikację rekordów nietypowych, (outliers), a
także uzupełnianie pól brakujących.
Przeszukiwanie danych celem wygenerowania reguł decyzyjnych realizuje się
następnie za pomocą metod sztucznej inteligencji, Szczególną cechą tych metod jest
okoliczność, że w wielu z nich występują jednostki wnioskujące (inference machines),
których sposób funkcjonowania sprawdzić można wyłącznie poprzez odpowiednie
eksperymenty na zbiorach danych. Jednostki te zawierajÄ… pewne "czarne skrzynki",
których stanów w procesie rozpoznawania nie analizuje się, a jedynie korzysta z nich po
wytrenowaniu, jako z narzędzi poszukiwanego odwzorowywania, np. przestrzeni
zmiennych wejś ciowych na wyjściowe.
Zestaw narzędzi komputacyjnych z zakresu omawianych tu badań charakteryzuje
tab. 4. Z pośród wzmiankowanych w tej tablicy narzędzi, w przykładzie poniższym
zastosowano dwa rozwiÄ…zania z zakresu uczenia siÄ™ maszyn - ML - Machine learning;
pozycje 4 i 5.
5. Przykład: reguły wykryte metodami ML
Reguły decyzyjne wygenerowano w odniesieniu do zbiorów wg tab. 1 i tab. 2 metodą tworzenia
pokryć zbioru danych. Program pozwala wyspecyfikować wielkości współczynnika rozmiesz-
czenia włókien (L z kreską), gęstości stwardniałego betonu (gest), oraz współczynnika
charakteryzującego powierzchnię porów widzianych na szlifie próbki (alfa), warunkujące
przynależność rekordu do jednej z dwóch klas mrozoodporności: "odporny" lub "nieodporny".
40
Tablica 4. Narzędzia obliczeniowe stosowane w próbach klasyfikacji i aproksymacji
właściwości kompozytów betonopodobnych
cele rozwiÄ…zanie algorytm ocena
1 MatLab- sztuczne sieci neuronowe ze wyłącznie kompletne bazy danych;
NeuralNet wsteczną propagację błędu atrybuty ilościowe; kiepska
works aproksymacja przy opisach
nieciągłych
2 SSN ART. sieci typu Fuzzy ARTMAP wyłącznie atrybuty ilościowe;
3 aiNet pseudo SSN oparta na doborze wyłącznie atrybuty ilościowe; łatwy
optymalnej wartości estymatora w stosowaniu
4 ML ML - tworzenie reguł na zasadzie szerokie możliwości określania
AQ 19 uczenia indukcyjnego warunków pracy
5 ML ML - tworzenie reguł na podstawie nazbyt proste reguły; duża łatwość
See5 budowy drzew decyzyjnych obsługiwania
6 MatLab- podstawowa analiza statystyczna, duże możliwości jednak wyłącznie
Statistics regresja wielowymiarowa, PCA, odnośnie baz z atrybutami czysto
analiza skupisk ilościowymi
7 GradeStat gradacyjna analiza danych specjalistyczny program z IPI PAN
umożliwiająca ocenę i racjonalne
ich przygotowanie do badań ML
8 SPSS statystyczne badania podstawowe, kosztowny program, który w wersji
analiza skupisk, składowych podstawowej nie udostępnia
głównych, etc. możliwości typu SSN czy ML
9 Rosetta zastosowanie teorii zbiorów niska przydatność, skutkiem
przybliżonych generowania nadmiernych ilości
bardzo specyficznych reguł
Wynik uzyskany przez program AQ19 ma formÄ™ skryptu 0:
odporny-outhypo
# rule
1 [L-factor<0.27] (t:5, u:4, n:3, q:0.479619)
2 [gest>2371.00] [porow>3.80] (t:4, u:3, n:1, q:0.552771)
3 [gest>2371.00] [alfa=30..44] (t:1, u:1, n:0, q:0.333333)
nieodporny-outhypo
# rule
1 [porow<4.80] (t:10, u:8, n:1, q:0.6835)
2 [gest>2371.00] [alfa=0..24] (t:3, u:1, n:0, q:0.433013)
który przekłada się na sformułowanie słowne (anglojęzyczne operatory "OR" i "AND" poniżej
zastÄ…piono przez - odpowiednio: "ALBO" i "ORAZ"):
jeżeli zachodzi warunek: to analizowany beton należy do klasy:
L-factor<0.27 ALBO
gest>2371.00 ORAZ porow>3.80 ALBO odporny
gest>2371.00 ORAZ alfa " (30, 44)
natomiast, przy warunku: analizowany beton należy do klasy:
porow<4.80 ALBO
nieodporny
gest>2371.00 ORAZ alfa " (0, 24)
41
Na 25 analizowanych rekordów bazy reguły te odpowiadały 18 rozpoznaniom poprawnym
i 6 błędnym, przy czym wśród poprawnie rozpoznanych rekordów aż 10 dotyczyło informacji
niepełnej (pola rekordów zawierały symbole '?').
W wypadku programu zastosowania programu See5, działającego na zasadzie tworzenia i
adaptacji drzew decyzyjnych 0, wynik działania programu pozwala narysować drzewo pokazane
dalej  rys. 3.
Przy odpowiednim nastawieniu program ten oprócz drzew decyzyjnych generuje również
reguły decyzyjne. Przykład pokazany jest w ramce poniżej:
Rule 4/1: (6.9/1.8, lift 1.6)
porow > 4.4
-> class odporny [0.681]
Rule 4/2: (7.2, lift 1.5)
porow <= 4.4
-> class nieodporny [0.891]
W zbiorze 25 rekordów (9 w klasie "odporny" i "16 w klasie "nieodporny"), podane powyżej
reguły przy ocenie badanego zbioru 25 rekordów dają 10 poprawnych ocen "nieodporny", bez
żadnej oceny błędnej oraz 5 poprawnych i dwie błędne oceny klasy "odporny". Reguła podana
w ramce powyżej jest nazbyt prosta z punktu widzenia posługiwania się nią w praktyce,
natomiast przynależność konkretnego rekordu do danej kategorii oceniana jest w programie na
zasadzie głosowania ("komitet reguł"), co w efekcie daje wysoką jakość kwalifikowania
poszczególnych rekordów do odpowiednich klas, 0 0.
Aatwo zauważyć, że generowane przez oba programy w sposób automatyczny reguły
zgodne są z oceną danych przez eksperta. Reguły nie są analogiczne, można natomiast
podejmować próby ich łączenie (komplementarność).
Rys. 2. Drzewo decyzyjne wygenerowane przez See5; dane wg tab. 1 i tab. 2
6. Wnioski końcowe
Prawidłowo przygotowana i racjonalnie eksploatowana baza danych umożliwia automatyczne
uzyskiwanie poprawnych predykcji z pomocÄ… rozmaitych metod komputacyjnych (metod
42
sztucznej inteligencji). Postępowanie może być skuteczne nawet wówczas, jeżeli baza zawiera
znaczne ubytki informacji. W szczególnych wypadkach pozwoli to na łączenie baz wiedzy nie w
pełni kompatybilnych (tzn. o zróżnicowanych strukturach).
Otwarte jednak pozostaje wówczas zagadnienie odnośnie oceny tego jak określić
graniczny poziom takich ubytków w bazie danych, przy którym predykcja właściwości
materiałów lub wykrywanie reguł pozostają jeszcze sensowne. Jest niewykluczone, że podobnie
jak przy zagadnieniach doboru architektury lub ustawiania parametrów sztucznych sieci
neuronowych, odpowiedz na powyższe pytanie może być tylko oparta na odpowiednich
eksperymentach informatycznych, dających zadowalającą przydatność uzyskiwanych wyników.
Zestawianie bazy danych należy poprzedzić formalnym sporządzeniem opisu tej struktury,
tak jak pokazano w przykładzie (tab. 1). W miarę możliwości bazę należy konstruować biorąc
pod uwagę możliwości jej przyszłej rozbudowy, przestrzegając zwłaszcza zasad poprawności
identyfikacji, w tym jednoznaczności i niezmienności nazewnictwa. Wskazana jest nawet
rejestracja szczegółów "na zapas", ponieważ nakład pracy przy uzupełnianiu bazy danych może
być porównywalny z nakładem pracy przy tworzeniu całej bazy od początku.
Literatura
[1] WEBB A., Statistical pattern recognition. ARNOLD, London 1999, 454 ss.
[2] KASPERKIEWICZ J., ALTERMAN D., Wykorzystanie metod sztucznej inteligencji
przy projektowaniu mieszanek betonowych. Referaty XLVII Konferencji Naukowej KILW
PAN I KN PZITB, Opole-Krynica 2001, t.1  Materiały budowlane, 331-338
[3] QUINLAN J.R., C4.5: Programs for machine learning. Morgan Kaufmann Publishers,
San Mateo, California 1993, 302 ss.
[4] MITCHELL T.M., Machine learning. WCB/MacGraw-Hill, Boston MA 1997, 414 ss.
[5] NEVILLE A.M., Właściwości betonu. Polski Cement, Kraków 2000, 874 ss.
[6] FAGERLUND G., Trwałość konstrukcji betonowych. Arkady, Warszawa 1997, 93 ss.
[7] ZAAOCHA D., KASPERKIEWICZ J., Automatyzacja wyznaczania charakterystyki
napowietrzenia betonu w świetle normy PrPN-EN 480-11. Referaty XLVII Konferencji
Naukowej KILW PAN I KN PZITB, Opole-Krynica 2001, t.1  Mat.budowl., 437-444.
[8] MICHALSKI R.S., KAUFMAN K.A., The AQ19 system for machine learning and
patterndiscovery: a general description and user s guide, George Mason University,
MLI 01-2, March 2001, 39 ss.
[9] CICHOSZ P., Systemy uczÄ…ce siÄ™. WNT, Warszawa 2000, 894 ss.
ANALYSIS OF DATABASES IN CONCRETE-LIKE MATERIALS
Summary
Rapid progress in technology of concrete and of similar composite materials imposes changing from the
conventional methods of data analysis (like constructing specific models of materials or models of
processes, based on a small number of precisely designed experiments) to automatic analysis, enabling
quick processing of large databases obtained from laboratories or building sites by machine learning
(ML), artificial neural networks and similar computing tools. Database preparation procedure is shortly
explained and an example of correct rule generation process with help of two ML programs (AQ19 and
See5) is presented. The experiment gave correct predictions of concrete frost resistance class (estimated by
Boros method), in spite of the base being of minimal size (25 records of 5 attributes) and having 45%
voids (empty spaces) in its structure.
Wyniki uzyskano z pomocą finansowania ze środków KBN  Projekt KBN: 8 T11F 01317-Predykcja
właściwości kompozytów betonopodobnych przy zastosowaniu metod uczenia się maszyn oraz
NATO  Projekt 97 1888 SfP-Concrete Diagnosis.


Wyszukiwarka

Podobne podstrony:
3 Szkup Jabłońska M Analiza opinii społecznych na temat wy
cwiczonko drugie z baz danych na stopieniek
Czy neutrina mogą nam coś powiedzieć na temat asymetrii między materią i antymaterią we Wszechświeci
Wykorzystanie baz danych przy określaniu cech cieplnych materiałów budowlanych
22 zalacznik 1 material na temat dobrego menedzera oraz stylow zarzadzaniaid)558
Materiały na temat Żeglugi Liniowej
KOMENDY PSQL NA KOLOKWIUM Z BAZ DANYCH
Materiały na temat Konosamentu
Materiały na temat Umowy Czarterowej i Klauzul
Analiza?N Ocena dzialan na rzecz?zpieczenstwa energetycznego dostawy gazu listopad 09
Refleksje na temat Kodeksu Etyki Zawodowej
Opinie uczniów gimnazjów na temat dostępności do nielegalnych substancji psychoaktywnych i przyczyn
Metodologia pracy umysłowej Esej na temat Metody uczenia się
15 Język Instruction List Układy sekwencyjne Działania na liczbach materiały wykładowe
Ocena wiedzy kobiet z Podkarpacia na temat profilaktyki
Wprowadzenie do baz danych
Podstawy baz danych zajecia 2 z SQL Tabela Biblioteka
2004 11 Porównanie serwerów relacyjnych baz danych Open Source [Bazy Danych]

więcej podobnych podstron