background image

1

Sieci Neuronowe i Uczenie Maszynowe:

próba integracji

:áRG]LVáDZ'XFK .DURO*UXG]LVNL

.DWHGUD0HWRG.RPSXWHURZ\FK8QLZHUV\WHW0LNRáDMD.RSHUQLNDXO*U

u-

G]LG]ND7RUX

E-mail:{duch, kagru}@phys.uni.torun.pl

Abstrakt

0HWRG\ RSDUWH QD RFHQLH SRGRELHVWZD NODV\ILNRZDQ\FK SU]\SDGNyZ GR SU]\SDGNyZ

Z]RUFRZ\FKGDMF] VWRGRVNRQDáHUH]XOWDW\LPDMOLF]QH]DOHW\2JyOQ\VFKHPDWG]LDáa-

QLDPHWRGRSDUW\FKQDSRGRELHVWZLHRSDUW\MHVWQDSDUDPHWU\]DFMLSUDZGRSRGRELHVWZD

NODV\ILNDFMLLXZ]JO GQLDZ\EyUZHNWRUyZUHIHUHQF\MQ\FKRSW\PDOL]DFM LFKSRáR*HQLDL

VNDORZDQLHLFKZSá\ZXZ\EyUIXQNFMLRFHQLDMFHMSRGRELHVWZRIXQNFMLNRV]WXVSRVo-

EX XUHGQLDQLD Z\QLNyZ ORNDOQ\FK PRGHOL VHOHNFM  FHFK L ZLHOH LQQ\FK SURFHGXU =a-
równo sieci neuronowe typu radialnych funkcji bazowych jak i typowe perceptrony wie-

ORZDUVWZRZHVWDQRZLV]F]HJyOQHSU]\SDGNLWHJRVFKHPDWX6FKHPDWWHQSR]ZDODUyw-

QLH*QDWZRU]HQLHQRZ\FKPHWRGNODV\ILNDFMLLDSURNV\PDFMLPLHG]\LQQ\PLPHWRGSo-

VLDGDMF\FKQDWXUDOQUHDOL]aFM ZSRVWDFLVLHFLneuropodobnych.

1. Wprowadzenie

.ODV\ILNDFMD MHVW MHGQ\P ] JáyZQ\FK ]DVWRVRZD V\VWHPyZ LQWHOLJHQWQ\FK 0R*QD GR QLHM

VSURZDG]Lü ZLHOH LQQ\FK ]DVWRVRZD WDNLFK MDN UR]SR]QDZDQLH RELHNWyZ GLDJQR]RZDQLH

DXWRLKHWHURDVRFMDFM DQDZHWDSURNV\PDFM  ZJUDQLF\QLHVNRF]RQHMOLF]E\NODV %DGDQLD

HPSLU\F]QHZLHOXNODV\ILNDWRUyZ VWDW\VW\F]Q\FKLQGXNFMLUHJXáGU]HZGHF\]MLVLHFLQHXUo-
nowych, 

PLQLPDOQRRGOHJáRFLRZ\FKLWG Z]DVWRVRZDQLXGROLF]Q\FKED]GDQ\FKZ\NRQDQH

np. w ramach projektu STATLOG (Michie i inni 1994) lub w pracy Rhowera i Morcinca

 SRND]XM*HQLHPDMHGQHJRXQLZHUVDOQHJRNODV\ILNDWRUDQDMOHSV]HJRGODZV]\VWNLFK

GDQ\FK±GODND*GHJRNODV\ILNDWRUDPR*QD]QDOH(ü]ELyUGDQ\FKGODNWyUHJRUH]XOWDW\E G

GRVNRQDáHMDNLWDNLGODNWyUHJRZ\QLNLE GVáDEH:VND]XMHWRQDNRQLHF]QRüRSUDFRZDQLD

PHWRGRORJLLRFHQ\V\VWHPyZNODV\ILNXMF\FKJG\*F] VWRUH]XOWDW\SRGDZDQHVGODMHGQHJR

Z\EUDQHJR]ELRUXGDQ\FKGODNWyUHJRX]\VNDQRGREUHZ\QLNL&] VWRPHWRG\RSDUWHQDSo-

GRELHVWZLHGRNWyU\FKQDOH*\PHWRGDQDMEOL*V]\FKVVLDGyZ k11 G]LDáDMOHSLHMRGLn-
nych. Np. w projekcie STATLOG (Michie i inni 1994) w jednej trzeciej przypadków metoda
k-NN daje najlepsze lub prawie najlepsze rezultaty i to dla k=1 bez optymalizacji k. Algorytm
k

11MHVW]DWHPFHQQPHWRGL]HZ]JO GXQDVZRMDSURVWRW SRZLQLHQE\üX*\ZDQ\MDNR

PHWRGD UHIHUHQF\MQD GOD LQQ\FK NODV\ILNDWRUyZ 7\PF]DVHP WUXGQR MHVW ]QDOH(ü GREU\ SUo-

JUDPUHDOL]XMF\WPHWRG QLHEUDNXMHQDWRPLDVWGDUPRZ\FKLNRPHUF\MQ\FKV\PXODWRUyZ
neuronowych.

0HWRGD QDMEOL*V]\FK VVLDGyZ PD OLF]QH ]DVWRVRZDQLD Z UR]SR]QDZDQLX Z]RUFyZ  pattern
recognition) i budowie systemów ekspertowych opartych na prototypach (case-based reason-
ing expert systems). Algorytm k

11MHVWWDNSRSXODUQ\*HZV]WXF]QHMLQWHOLJHQFMLSRGHMFLH

background image

2

oparte na tym modelu nazywane jest instance-based reasoning (prototypy w bazie danych

PDMSRVWDüZHNWRUyZOLF]EREOLF]DVL RGOHJáRFLRGZV]\VWNLFKZHNWRUyZ±PHWRGDbrute-
force), memory-based reasoning 

ZW\PSRGHMFLXNáDG]LHVL QDFLVNQD]RUJDQL]RZDQLHED]\

WUHQLQJRZHMZSDPL FLZSRVWDFLGU]HZDLQDV]XNDQLHRELHNWyZZSDPL FLZFHOXSU]\VSLe-

V]HQLD G]LDáDQLD V\VWHPX SRVáXJXMF VL  UyZQROHJá\PL WHFKQLNDPL SURJUDPRZDQLD  RUD]
case-based reasoning 

SURWRW\S\PDMSRVWDüVNRPSOLNRZDQ\FKVWUXNWXUGDQ\FK±QDMF] FLHM

RELHNWyZLVSU]HFKRZ\ZDQHZZ\VSHFMDOL]RZDQ\FKED]DFKGDQ\FKZ\NRU]\VWXMHVL ZLe-

G] RJyOQRQDWXU]HSUREOHPXdomain knowledge RUD]ZEDUG]LHM]áR*RQ\FKV\VWHPDFK

VáDER MHV]F]H UR]ZLQL W WHFKQLN  DGDSWDFML SURWRW\SX QDMEDUG]LHM SRGREQHJR GR SU]\SDGNX
nieznanego).

0HWRG\RSDUWHQDSRGRELHVWZLH Similarity-Based Methods, SBM UR]ZLMDá\VL GRW\FKF]DV

QLH]DOH*QLH RG VLHFL QHXURQRZ\FK L LQQ\FK PHWRG SU]\GDWQ\FK GR NODV\ILNDFML : ]QDF]QHM

PLHU]HZ\QLNDWR]RGPLHQQ\FK(UyGHá]MDNLFKZ\ZRG]VL WHPHWRG\MHGQDN*HSUyED]Uo-

]XPLHQLD]ZL]NyZSRPL G]\QLPLLLQWHJUDFMLUy*Q\FKPHWRGXF]HQLDVL ]GDQ\FKZ\GDMH

VL E\üEDUG]RRELHFXMFD3RQLHZD*QLHXGDáRVL GRW\FKF]DV]QDOH(üWDNLHMFKDUDNWHU\VW\NL

GDQ\FKNWyUDSR]ZROLáDE\QDRNUHOHQLHMDNLHPHWRG\E GVL QDMOHSLHMQDGDZDüGRLFKNOa-

V\ILNDFMLQDOH*\]DSURSRQRZDüLQQHSRGHMFLHJZDUDQWXMFHZ\QLNLNWyUHSRZLQQ\E\üQLe-

UR]Uy*QLDOQH SU]\VWDW\VW\F]QHMRFHQLHGRNáDGQRFL RGQDMOHSV]\FKPR*OLZ\FKGRRVLJQL -

FLDZGDQ\PSU]\SDGNXZ\QLNyZ3URSRQRZDQDWXPHWRGRORJLDSROHJDQDX*\FLXVFKHPDWX

PHWRG 6%0 R Z]UDVWDMF\P VWRSQLX NRPSOLNDFML : SU]HVWU]HQL ZV]\VWNLFK PHWRG MDNLH

PR*QDZ\JHQHURZDüZUDPDFKGDQHJRVFKHPDWXQDOH*\SRV]XNLZDüQDMSURVWV]HJRUR]V]e-

U]HQLDDNWXDOQLHX*\ZDQHMPHWRG\NWyUH]QDF]FRSRSUDZLDZ\QLNL6WDUWXMFQS]PHWRG\

QDMEOL*V]HJRVVLDGDPR*QDGRNRQDüRSW\PDOL]DFMLOLF]E\VVLDGyZOXEX*\ZDQHMIXQNFMLRd-

OHJáRFL7DNLHSRVW SRZDQLHUyZQRZD*QHMHVWJUDGLHQWRZHMPHWRG]LHSU]HV]XNLZDQLDF]\OL

PHWRG]LHÄSLHUZV]\QDMOHSV]\´-HV]F]HOHSV]HUH]XOWDW\GDüPR*HEDUG]LHMNRV]WRZQHREOi-

F]HQLRZRSU]HV]XNLZDQLHZL]N
2SW\PDOL]DFMDMDNRFLRZRUy*Q\FKSDUDPHWUyZDGDSWDF\MQ\FKSRZVWDMFHMZHIHNFLHNRFo-

Z\PPHWRG\GDMHJZDUDQFM GREUDQLDRGSRZLHGQLHMPHWRG\GODDQDOL]RZDQ\FKGDQ\FK3o-

PLPRWHJR*HVLHFL0/3]IXQNFMDPLVLJPRLGDOQ\PLVXQLZHUVDOQ\PLDSURNV\PDWRUDPL]áo-

*RQRü VLHFLOLF]ED SDUDPHWUyZ DGDSWDF\MQ\FK NRQLHF]Q\FK GR UR]ZL]DQLD ]DGDQLD D W\P

VDP\PLF]DVXF]HQLDPR*HE\üQDZHWZSURVW\FKSU]\SDGNDFKQLHSRWU]HEQLHGX*D1DSU]y-

NáDGZ\G]LHOHQLHMHGQHJRUR]NáDGXRJDXVVRZVNLPFKDUDNWHU]H]WáDZ\PDJDMHGQHJRSURWo-

W\SX]RGSRZLHGQLIXQNFMRGOHJáRFLOXESRMHG\QF]HMIXQNFML*DXVVDZVLHFLDFK]UDGLDl-

Q\PLIXQNFMDPLED]RZ\PLF]\OLRNRáRN parametrów w N-wymiarowej przestrzeni danych.

1DWRPLDVWQDMSURVWV]DVLHü0/3NWyUDUR]ZL*HWR]DGDQLHPXVLPLHüSU]\QDMPQLHMN+1 neu-

URQyZF]\OLRNRáR N+1)

2

SDUDPHWUyZ :VND]XMHWRQDZD*QURO MDN JUDü PR*H Z\EyU

odpowiednich funkcji transferu (Duch i Jankowski 1999).

: QDVW SQ\P UR]G]LDOH SU]HGVWDZLP\ RJyOQ\ VFKHPDW PHWRG RSDUW\FK QD SRGRELHVWZLH

RPDZLDMFPR*OLZRFLSDUDPHWU\]DFMLLSURFHGXU\RSW\PDOL]DFMLSDUDPHWUyZUy*QHJRW\SXZ

W\P]XSHáQLHQRZPHWRG W\SXÄNRQV\OLXPHNVSHUWyZ´áF]FZ\QLNLZLHOXPRGHOL]HVo-

E 1DVW SQLH SU]HGVWDZLP\ NLOND SU]\NáDGyZ ]QDQ\FK L QRZ\FK PHWRG NODV\ILNDFML E G-

F\FKV]F]HJyOQ\PLSU]\SDGNDPLVFKHPDWXRSDUWHJRQDSRGRELHVWZLH=DSURSRQXMHP\Uyw-

QLH*QDWXUDOQ\VSRVyELQWHJUDFMLPHWRGW\SX6%0LVLHFLQHXURQRZ\FKRUD]VLHFLRZHUHDOL]a-

FMHQLHNWyU\FKDOJRU\WPyZ6%0&KRFLD*GRW\FKF]DVSU]HWHVWRZDQD]RVWDáDMHG\QLHQLHZLHl-

NDF] üZV]\VWNLFKPR*OLZRFLUH]XOWDW\REOLF]HQDSUDZG]LZ\FKLV]WXF]Q\FKED]DFKGa-

Q\FKSU]HGVWDZLRQHZNROHMQ\PUR]G]LDOHVEDUG]R]DFK FDMFH

background image

3

2. 

6FKHPDWPHWRGRSDUW\FKQDSRGRELHVWZLH

=DJDGQLHQLHNODV\ILNDFMLPR*QDVIRUPXáRZDüZQDVW SXMF\VSRVyEPDMFGDQ\]ELyUZHNWo-
rów treningowych {X

p

, C(X

p

)}, p=1 .. n, gdzie C(X

p

MHVWHW\NLHWNODV\ZHNWRUDX

p

 i wektor

X

 QDOH*F\ GR QLH]QDQHM NODV\ QDOH*\ RNUHOLü SUDZGRSRGRELHVWZR p(C

i

,|X;M)  zakwalifi-

kowania wektora X do zadanych klas C

i

, gdzie 

MHVWPRGHOHPNODV\ILNDF\MQ\PRSLVXMF\P

ZV]\VWNLHSDUDPHWU\LZ\NRQ\ZDQHSURFHGXU\1LHMHVWWRQDMEDUG]LHMRJyOQHVIRUPXáRZDQLH

JG\*]DNáDGDMHGQDNRZGáXJRüZHNWRUyZX2JyOQ\PRGHOV\VWHPXDGDSWDF\MQHJRX*\Za-

QHJRGODSRWU]HENODV\ILNDFMLPR*H]DZLHUDüQLHNWyUHOXEZV]\VWNLH]SDUDPHWUyZGDQ\FKSo-

QL*HM

M

k d

r

G d

E

K

p

=

, ( ; , ), ( ( )),{

}, [ ], ( )

ρ

R

<

A

    (1)

gdzie:

 

MHVWOLF]EXZ]JO GQLDQ\FKZHNWRUyZUHIHUHQF\MQ\FKZRWRF]HQLXZHNWRUDX;

 

d(

;  r,

ρ

 MHVW IXQNFM RGOHJáRFL  SRGRELHVWZD  r  jest maksymalnym promieniem sfery

REHMPXMFHMRWRF]HQLHZHNWRUDX,

 ρ  

WRSR]RVWDáHSDUDPHWU\DGDSWDF\MQH

 

G(d(XR

p

MHVWIXQNFMZD*FZSá\ZZHNWRUyZUHIHUHQF\MQ\FKR

p

 na prawdopodobie

-

stwo klasyfikacji;

 

{R

p

} jest zbiorem wektorów referencyjnych, wygenerowanym ze zbioru wektorów tre-

ningowych {X

p

};

 

E[

@MHVWFDáNRZLWIXQNFMNRV]WXPLQLPDOL]RZDQSRGF]DVXF]HQLD

 

K[

@MHVWIXQNFMVNDOXMFZSá\ZEá GXGODGDQHJRSURWRW\SX]ED]\WUHQLQJRZHMQDFDá-

NRZLWIXQNFM NRV]WX

2SUyF] Z\PLHQLRQ\FK SRZ\*HM IXQNFML L SDUDPHWUyZ PHWRG\ NODV\ILNDFML PRJ Uy*QLü VL

SURFHGXUDPL VHOHNFML FHFK VSRVREHP WUDNWRZDQLD ZDUWRFL EUDNXMF\FK DOJRU\WPDPL PLQi-

PDOL]DFMLX*\ZDQ\PLZFHOX]QDOH]LHQLDRSW\PDOQ\FKSDUDPHWUyZRUD]VSRVREDPLUHDOL]DFML
w postaci sieci 

QHXURSRGREQ\FK0R*QDWH*]EXGRZDüZL FHMQL*MHGHQPRGHOLX*\ZDüUy*-

Q\FKSURFHGXUáF]HQLDZ\QLNyZ2PyZLP\WHUD]GRNáDGQLHMZV]\VWNLHWHPR*OLZRFL

:\EyUNLSUDZGRSRGRELHVWZDDSULRU\F]QH
:QDMSURVWV]\PSU]\SDGNXSUDZGRSRGRELHVWZRNODV\ILNDFMLp(C

i

,|XM) jest sparametryzo-

wane przez p(C

i

,|Xkd(

),{X

p

}), co prowadzi do metody k

QDMEOL*V]\FKVVLDGyZk-NN, w

NWyUHMFDá\]ELyUWUHQLQJRZ\MHVWX*\W\MDNR]ELyUUHIHUHQF\MQ\8VWDODMFMDNPHWU\N d(

),

QSPHWU\N (XNOLGHVRZOLF]EDQDMEOL*V]\FKVVLDGyZk jest jedynym parametrem podlega-

MF\PRSW\PDOL]DFML=Z\NOHMHVWRQDVWRVXQNRZRPDáDL]ZL NV]DMFk dokonujemy wyboru

SDWU]F QD OLF]E  Eá GyZ NODV\ILNDFML RWU]\P\ZDQ\FK GOD NROHMQ\FK k. W metodzie k-NN

NRV]WREOLF]HQLRZ\RFHQ\GRNáDGQRFLNODV\ILNDFML]DSRPRFSURFHGXU\WHVWRZHMRNUHODM-
cej dla wszystkich n

ZHNWRUyZ]ELRUXWUHQLQJRZHJRNODV GDQHJRZHNWRUDELRUF]D]ELyUUe-

ferencyjny {X

p

`SR]RVWDáHn-1 wektorów (test leave-one-out), równy jest kosztowi jednokrot-

nej klasyfikacji wszystkich n

 ZHNWRUyZ 7HQ QLHZLHONL NRV]W XPR*OLZLD GREU\ Z\EyU k  z

SXQNWXZLG]HQLDQDMOHSV]HMJHQHUDOL]DFMLPHWRG\3UDZGRSRGRELHVWZRNODV\ILNDFMLp(C

i

|X;k)

k

i

 /k równe jest liczbie wektorów referencyjnych z klasy C

i

G]LHORQHMSU]H]OLF]E ZV]\Vt-

NLFKZHNWRUyZXZ]JO GQLaQ\FKZRFHQLHSUDZGRSRGRELHVWZD
3HZQHVXEWHOQRFLGRW\F]VSRVREXREOLF]DQLDEá GXNODV\ILNDFMLGODSU]\SDGNyZZNWyU\FK

ZV]\VWNLHSUDZGRSRGRELHVWZDp(C

i

|X;k

VMHGQDNRZH&] VWR]ZL NV]DVL ZWDNLFKSU]y-

background image

4

padkach k

E\Z\EUDüMHGQ]NODV=Dáy*P\*HPDP\CNODVLXSRU]GNXMP\MHWDNE\RVWDt-

QL]QLFKE\áDNODVDZL NV]RFLRZ,QWHUHVXMFPR*OLZRFL]DSHZQLDMFSU]\RND]MLOHp-

V]]JRGQRüZ\QLNyZNODV\ILNDFML]SUDZGRSRGRELHVWZDPLaprioryczymi, jest wprowadze-
nie dodatkowych parametrów 

κ

i

 dla pierwszych C-1 klas:

1

1

(

|

;

),   

1

 ,  

[0,1]  

C

i

i

i

C

i

i

i

p

p C

M

p

p

κ

κ

=

=

= −

X

(2)

-HOL

κ

i

 =0 to otrzymamy zawsze p

c

 =

GODNODV\ZL NV]RFLRZHMDZLHFZ\QLNLQLHPRJE\ü

JRUV]HRGZ\QLNyZNODV\ILNDWRUDZL NV]RFLRZHJRGOD

κ

i

 =1 otrzymamy poprzednie wyniki,

pC

i

|X;M

2SW\PDOL]XMFSDUDPHWU\

κ

i

 (dla dwóch klas jest to jednoparametrowa optymali-

zacja) mo

*HP\MHG\QLHSROHSV]\üRWU]\PDQHZ\QLNL

Metoda k-NN ma liczne zalety:

1)

 

Liczba klas nie jest ograniczona.

2)

 

6\VWHP PR*H SUDFRZDü MDNR SDPL ü KHWHURDVRFMDF\MQD Z\G]LHODMF GRZROQ SRGSU]e-

VWU]H]QDQ\FKFHFKLSU]HZLGXMFSR]RVWDáHHOHPHQW\ZHNWRUDDQLHW\ONRNODV FKRFLD*

GODND*GHMSRGSU]HVWU]HQLQDOH*\QLH]DOH*QLH]RSW\PDOL]RZDük.

3)

 

àDWZRMHVWGRGDüLQWHUSRODFM OLQLRZSR]ZDODMFQDORNDOQHXUHGQLHQLHZDUWRFLL]a-
stosowanie tej metody do aproksymacji.

4)

 

6WDELOQRüMDNSRND]DáBreiman (1996) sieci neuronowe, drzewa decyzji  i wiele innych

NODV\ILNDWRUyZWRV\VWHP\QLHVWDELOQH±QLHZLHOND]PLDQD]ELRUXXF]FHJRPR*HVSRZo-

GRZDüGUDVW\F]Q]PLDQ VWUXNWXU\NODV\ILNDWRUDLUHDOL]RZDQ\FKSU]H]QLHJRJUDQLFGe-

F\]ML0HWRGDQDMEOL*V]\FKVVLDGyZMHVWQDWRPLDVWPHWRGVWDELOQ %UHLPDQ JG\*

ORNDOQH]PLDQ\GDQ\FK]PLHQLDMJUDQLFHGHF\]MLW\ONRZQLHZLHlkim stopniu.

3DUDPHWU\]DFMDPLDU\SRGRELHVWZD
:L NV]RüVWRVRZDQ\FKPLDUSRGRELHVWZDZ\ZRG]LVL ]PLDURGOHJáRFLNWyUHSU]HNV]WDá-

FRQH ]D SRPRF IXQNFML ZD*FHM G(d(X,  R

p

 SR]ZDODM RFHQLü SRGRELHVWZR :LHOH PLDU

SRGRELHVWZDRSLVDQ\FK]RVWDáRZSUDFDFK 'XFKL-DQNRZVNL RUD] Wilson i Martinez
1997). W metodach minimalnoodleg

áRFLRwychQDMF] FLHMVWRVXMHVL PHWU\N (XNOLGHVRZ

GODGDQ\FKFLJá\FKLPLDU Hamminga dla cech binarnych. Dodatkowe parametry, które mo-

JSRGOHJDüRSW\PDOL]DFMLVDOERJOREDOQH WDNLHVDPHZFDáHMSU]HVWU]HQL DOERORNDOQH Uy*-

QHGODND*GHJRZHNWRUDUHIHUHQF\MQHJR 0HWU\NDMinkowskiego posiada jeden globalny pa-
rametr adaptacyjny 

α

8Z]JO GQLDMFF]\QQLNLVNDOXMFH ZDJL GODWHMPLDU\RWU]\PXMHP\

d

s d A B

i

i

i

i

N

A B s

, ;

,

1 6

1 6

α

α

=

=

1

 (3)

gdzie za d(A

i

,B

i

SU]\MPXMHVL ]Z\NOHUy*QLF _A

i

-B

i

|. Dla 

α

 

 RWU]\PXMHP\PHWU\N (XNOi-

GHVRZDGOD

α

 

 PLDU 0DQKDWWDQ3RQLHZD*NV]WDáWJUDQLFGHF\]MLMHVWRGPLHQQ\GODUy*-

Q\FKZDUWRFLZ\NáDGQLND

α

 

ZDUWRJRZL F]RSW\PDOL]RZDü

:UR]ZLMDQ\PSU]H]QDVV\VWHPLH]DLPSOHPHQWRZDOLP\GZLHJUXS\PHWRGNWyUHDXWRPa-

W\F]QLHGRELHUDMF]\QQLNLVNDOXMFHs

i

'RSLHUZV]HMJUXS\QDOH*PHWRG\RSDUWHQDPLQLPa-

OL]DFML IXQNFML NRV]WX GR GUXJLHM ]D PHWRG\ RSDUWH QD V]XNDQLX W\SX ÄQDMSLHUZ QDMOHSV]\´

]G\VNUHW\]RZDQ\FK ZDUWRFL F]\QQLNyZ VNDOXMF\FK 6]F]HJyOQ\P SU]\SDGNLHP WDNLHJR

V]XNDQLDMHVWXZ]JO GQLHQLHW\ONRELQDUQ\FKZDUWRFLF]\QQLNyZVNDOXMF\FK±RGSRZLDGDWR

VHOHNFMLFHFKRPyZLRQHMSRQL*HM

background image

5

,QWHUHVXMFIXQNFM RGOHJáRFL 'XFKL-DQNRZVNL RWU]\PDP\SU]H]NRPELQDFM NLONX
funkcji 

VLJPRLGDOQ\FK 5\V GDQZ]RUHP

d A B

A

B

d A B

d A B

i

i

ij

ij

i

i

ij

j

i

i

i

N

(

,

)

;

( , )

(

,

)

=

=

=

α σ β

γ

α

α

3

8



1

(4)

Parametry 

α, β, γ

 SR]ZDODM QD PLQLPDOL]DFM  RGOHJáRFL ZHZQWU] NODV L PDNV\PDOL]DFM

RGOHJáRFLSRPL G]\NODVDPL*UDQLFHGHF\]MLSU]\X*\FLXWDNVSDUDPHWU\]RZDQ\FKIXQNFML

PRJVWDüVL SURVWRNWQHSR]ZDODMFQDLQWHUSUHWDFM G]LDáDQLDNODV\ILNDWRUD]DSRPRFUe-

JXáORJiki klasycznej.
:D*QNDWHJRULIXQNFMLRGOHJáRFLVPLDU\SUREDELOLVW\F]QH0R*QDMH]DVWRVRZDüGODGa-

Q\FKRFHFKDFKV\PEROLF]Q\FKEH]]DPLDQ\W\FKFHFKQDZDUWRFLQXPHU\F]QH0LDUD]QDQD
jako VDM (Value Difference Metric) dana jest przez:

D

A B

p C A

p C B

p C A

N C A

N A

q

V

i

j

i

j

q

i

C

j

N

i

j

i

j

j

( , )

|

|

,

|

(

|

) /

(

)

=

=

=

=

3 8 3 8 3 8

1

1



(5)

gdzie N(C

i

|A

j

MHVWOLF]EZ\VWSLHZDUWRFLDWU\EXWXA

j

ZZHNWRUDFKQDOH*F\FKGRNODV\C

i

N(A

j

MHVWOLF]EZ\VWSLHZHZV]\VWNLFKNODVDFK8RJyOQLHQLHWHMPLDU\GODZDUWRFLFL-

Já\FKPR*OLZHMHVWSR]GHILQLRZDQLXIXQNFMLUR]NáDGXJ VWRFLSUDZGRSRGRELHVWZD0LDU
VDM i jej modyfikacje (Wilson i 

0DUWLQH] PR*QDWH*SRáF]\ü]LQQ\PLPLDUDPL]a-

VWRVRZDQ\PLGRDWU\EXWyZRZDUWRFLDFKQXPHU\F]Q\FK:V]F]HJyOQRFL]DPLHQLDMFV\m-

EROLF]QHZDUWRFLA

j

 

QD]ELyUSUDZGRSRGRELHVWZp(C

i

|A

j

PR*QDRGWZRU]\üRGOHJáRFL9'0

NRU]\VWDMF]ZDUWRFLQXPHU\F]Q\FK7DNPHWRG PR*QD]DVWRVRZDüGODGRZROQHJRNODVy-
fikatora.

Selekcja i skalowanie cech

Istnieje bardzo wiele metod selekcji cech (por. Hernandez, 

)HUQDQGH]   NWyUH PRJ

]QDOH(ü]DVWRVRZDQLHZPHWRGDFKRSDUW\FKQDSRGRELHVWZLH7HRUHW\F]QLHU]HF]ELRUFPi-

QLPDOL]DFMDIXQNFMLNRV]WX]HZ]JO GXQDF]\QQLNLs

i

 

VNDOXMFHZNáDGRGSRV]F]HJyOQ\FKFHFK

SRZLQQDQDGDüFHFKRP]E GQ\PPDáHZDUWRFL-HGQ]PR*OLZRFLMHVWXVWDOHQLHZDUWRFL

F]\QQLNDVNDOXMFHJRGODQDMZD*QLHMV]HMFHFK\QDLGRGDQLHGRIXQNFMLNRV]WXF]áRQXregu-

ODU\]XMFHJR QS VXP\ NZDGUDWyZ SR]RVWDá\FK F]\QQLNyZ VNDOXMF\FK Z FHOX RWU]\PDQLD

MDNQDMZL NV]HMOLF]E\]HURZ\FKs

i

.

-HOLZGDQHMPHWRG]LHNODV\ILNDFMLPR*QDX*\üPLQLPDOi-

]DFMLJUDGLHQWRZHMWDNLHSRGHMFLHPR*HGDüGREUHZ\QLNLZSU]HFLZQ\PSU]\SDGNXWU]HED

Rys. 1. Suma 3 funkcji sigmoidalnych –

X*yWHF]QDIXQNFMDRGOHJáRFL

background image

6

VWRVRZDüPHWRG\V]XNDMFHJOREDOQHJRPLQLPXPEH]Z\NRU]\VWDQLDJUDGLHQWX 'XFKLKor-

F]DN FRMHVWF]DVRFKáRQQH'ODWHJROHSLHMMHVWQDMSLHUZSU]HSURZDG]LüVHOHNFM FHFKL

Z\VWDUWRZDü]ELQDUQ\FKF]\QQLNyZVNDOXMF\FKs

i

.

3RQL*HMRSLVDQH]RVWDá\SURVWHPHWRG\VHOHNFMLFHFKRSDUWHQDZDULDQWDFKV]XNDQLDW\SXÄQDj-

SLHUZQDMOHSV]\´ 'XFKL*UXG]LVNLD $OJRU\WP\VHOHNFMLFHFKSRZLQQ\RGU]XFLüWH

FHFK\NWyUHQLHZLHOHZQRV]GRRFHQ\SRGRELHVWZD'REU\PWHVWHPWDNLFKPHWRGMHVWGo-

GDQLHQRZ\FKFHFK]DZLHUDMF\FKMHG\QLHV]XP SRZLQQ\]RVWDüRGU]XFRQH RUD]GRGDQLH

FHFK\ E GFHM OLQLRZ IXQNFM NODV\ GOD GDQHJR ZHNWRUD  SRZLQQD ]RVWDü MDNR MHG\QD So-

]ZDODMFDQDNODV\ILNDFM 7DNLWHVWSRZLQLHQE\üX*\W\GODZV]\VWNLFKPHWRGVHOHNFML
cech.

:VW SQ RFHQ  FHFK QD]\ZDQ GDOHM UDQNLQJLHP GRNRQDü PR*QD VSUDZG]DMF GRNáDGQRü

NODV\ILNDFMLSU]\X*\FLXZV]\VWNLFKFHFKDQDVW SQLHVWRVXMFNURVZDOLGDFM QD]ELRU]HWUe-

QLQJRZ\PZ\áF]DüNROHMQHFHFK\MHGQSRGUXJLHM]DSDPL WXMF]DND*G\PUD]HPGRNáDd-

QRüNODV\ILNDFMLLZDULDQFM 1DMZD*QLHMV]FHFKMHVWWDNWyUDSRHOLPLQDFMLSRZRGXMHQDj-

ZL NV] GHJUDGDFM  GRNáDGQRFL NODV\ILNDFML 1DVW SQLH VWDUWXMF RG MHGQRHOHPHQWRZ\FK

ZHNWRUyZ]DZLHUDMF\FKFHFK X]QDQ]DQDMZD*QLHMV]VSUDZG]DVL GRNáDGQRüNODV\ILNa-

FMLSRZL NV]DMFOLF]E HOHPHQWyZZHNWRUyZRNROHMQHFRUD]PQLHMZD*QHFHFK\7\ONRWH

FHFK\NWyUHSRGRGDQLXGRURVQFHMOLF]E\FHFKSRZRGXMZ]URVWGRNáDGQRFLNODV\ILNDFMLV

DNFHSWRZDQH3RGF]DVGRGDZDQLDFHFKPR*QDRSW\PDOL]RZDüSDUDPHWU\NODV\ILNDWRUDFRMHVW

RF]\ZLFLHEDUG]LHMNRV]WRZQH
'RNáDGQLHMV]\Z\EyUF]\QQLNyZVNDOXMF\FKs

i

 

GRNRQDüPR*QD]DSRPRFPHWRGRSDUW\FK

QDV]XNDQLXNWyUHF] VWRVV]\EV]HL]QDMGXMOHSV]HUR]ZL]DQLDQL*PHWRG\RSDUWHQDPi-

QLPDOL]DFML 5R]ZLQ OLP\ WU]\ WDNLH PHWRG\ R]QDF]DQH MDNR 6 6 L ÄPHWRGD GRVWUDMDQLD

ZDJ´7DRVWDWQLDVWDUWXMH]UR]ZL]DRWU]\PDQ\FKSU]H]PHWRG\minimalizacyjne lub meto-

G\6F]\6LMHVWEDUG]RV]\END6WRVXMFPHWRG\V]XNDQLDQDOH*\SU]\MüG\VNUHWQHZDUWo-

FLF]\QQLNyZVNDOXMF\FKPR*QDWRMHGQDN]URELüVWRSQLRZR]ZL NV]DMFLFKSUHFy]M 
: PHWRG]LH 6 QDMSLHUZ Z\ELHUDP\ QDMZD*QLHMV] FHFK  DQDOL]XMF UH]XOWDW\ RWU]\PDQH ]

NURVZDOLGDFML QD ]ELRU]H WHVWRZ\P ] ZáF]RQ W\ONR MHGQ FHFK &HFK\ GOD NWyU\FK RVL-

JQL WR QDMZ\*V] GRNáDGQRü NODV\ILNDFML V GREU\PL NDQG\GDWDPL GR XZ]JO GQLHQLD Z

SLHUZV]\PU] G]LH,FKLQGHNV\VSDPL WDQHZWDEOLF\ZNROHMQRFLRGQDMOHSV]HMGRQDMJRr-

V]HM'ODQDMZD*QLHMV]HMFHFK\XVWDODVL s

1

 GHILQLXMFW\PVDP\PZ]JO GQVNDO RGOHJáo-

FL&]\QQLNVNDOXMF\GODQDVW SQHMFHFK\Z\]QDF]DQ\MHVWQDSRGVWDZLHUH]XOWDWyZRWU]y-

PDQ\FKSU]\GZyFKFHFKDFKZáF]RQ\FK]PLHQLDMFs

2

 z krokiem 

 (np. 

  WDN*Hs

2

 =

m

 

>@1DMOHSV]DZDUWRüs

2

 

LGRNáDGQRüNODV\ILNDFMLMHVW]DSDPL W\ZDQDLRSLVDQ\SUo-

FHVSRZWDU]DP\GODNROHMQHMFHFK\Z\EUDQHM]JRGQLH]HZVW SQ\PUDQNLQJLHPSU]\XVWDOo-

Q\FKZDUWRFLDFKs

i 

 

s

2

3R]DNRF]HQLXXF]HQLDGRNáDGQRüNODV\ILNDFMLVSUDZG]DQDMHVWQD

]ELRU]HWHVWRZ\P]HVNDORZDQIXQkFMRGOHJáRFL
0R*H VL  RF]\ZLFLH RND]Dü*H WHVWRZDQLH SRMHG\QF]\FK FHFK QLH GD GREUHJR Z\QLNX ER

GRSLHURNRPELQDFMDNLONXFHFKSR]ZDODQDNODV\ILNDFM -HOLDOJRU\WP6QLHGDMHGREU\FK

UH]XOWDWyZ QDOH*\ ]DVWRVRZDü QLHFR EDUG]LHM NRV]WRZQ\ REOLF]HQLRZR DOJRU\WP 6 NWyU\

VWDUWXMHRGZV]\VWNLFKFHFKSRNROHLMHRGU]XFDMF:SRF]WNRZ\PUDQNLQJXFHFKZV]\VWNLH

ZDJLXVWDZLDQHVQDs

=1,  i=1..N, gdzie N

MHVWOLF]EFHFKSRF]\PUDQNLQJGRNRQXMHVL

SU]H]NROHMQHZ\áF]DQLHSRMHG\QF]HMFHFK\:QDVW SQ\PHWDSLHF]\QQLNVNDOXMF\QDMZD*-

QLHMV]HMFHFK\XVWDODVL QDDRSW\PDOQ\F]\QQLNVNDOXMF\GODGUXJLHMFHFK\]QDMGRZDQ\

MHVWSU]H]SRV]XNLZDQLHPLQLPXPGODG\VNUHWQ\FKZDUWRFL s

i

XWU]\PXMFZDUWRFLSR]RVWa-

á\FK F]\QQLNyZ MDNR  7DNLH V]XNDQLH F]\QQLNyZ VNDOXMF\FK SRZWDU]D VL  GOD NROHMQ\FK

FHFK]UDQNLQJXSRGF]DVJG\SR]RVWDáHFHFK\PDMZDJLUyZQH2GPLDQDWHMPHWRG\VWDr-
tuje z binarnego wektora s

i

∈{

`RWU]\PDQHJR]DSRPRFMDNLHJRDOJRU\WPXVHOHNFMLFHFK

background image

7

3RZ\]QDF]HQLXSU]\EOL*RQHJRZHNWRUDRSW\PDOQ\FKF]\QQLNyZVNDOXMF\FKPR*QDMHÄGo-

VWURLü´V]XNDMFOHSV]HJRUR]ZL]DQLDZRNyáZHNWRUDMX*]QDOH]LRQHJR'RND*GHJRF]\QQLND

VNDOXMFHJRGRGDZDQDMHVWOXERGHMPRZDQDVWDáDZDUWRü

δ

]DGDQD]JyU\SU]H]X*\WNRZQLND

(np. 0.5): s

i

 

  s

i

 

±

δ

 -HOL ]PLDQD ZDJL SURZDG]L GR SROHSV]HQLD G]LDáDQLD NODV\ILNDWRUD

czynnik ten zostaje uaktualniony, w przeciwnym przypadku pozostaje bez zmian. Gdy
ZV]\VWNLHZDJL]RVWDQVSUDZG]RQHL*DGQD]PLDQDRF]\QQLN

δ

  nie poprawia rezultatu po-

ZWDU]DVL SURFHGXU ]

δ

 

 

δ/2

3URFHGXUDNRF]\VL MHOLUy*QLFDZGRNáDGQRFLNODV\ILNDFML

w dwóch kolejnych iteracjach jest mniejsza od zadanej warto

FL

=DLPSOHPHQWRZDQRUy*QHZDULDQW\RSLVDQ\FKSRZ\*HMPHWRGQS]DZ *DMFSURFHGXU V]u-

NDQLDW\ONRGRSRG]ELRUXFHFK]LGHQW\ILNRZDQ\FKMDNRLVWRWQHSRGF]DVUDQNLQJX&KRFLD*V

WRSURVWHPHWRG\ZSUDNW\FHG]LDáDMUyZQLHGREU]HMDNEDUG]LHMZ\UDILQRZDQH SRUHPSi-
ryczne oceny algorytmów selekcji cech, Fernandez, Hernandez 1999).

3DUDPHWU\]DFMDIXQNFMLZD*F\FKZSá\ZZHNWRUyZUHIHUHQF\MQ\FK
:HNWRU\ UHIHUHQF\MQH NWyUH V QDMEDUG]LHM SRGREQH GR SU]\SDGNX WHVWRZHJR X, powinny

PLHü ZL NV]\ ZSá\Z QD SUDZGRSRGRELHVWZR NODV\ILNDFML RG W\FK NWyUH OH* GDOHM

8Z]JO GQLDQLHGRNáDGQLHkVVLDGyZRGSRZLDGDIXQNFMRPWUDQVIHUXW\SXÄWZDUGDVIHUD´=a-

PLDQD W\FK IXQNFML QD EDUG]LHM JáDGNLH SR]ZDOD QD XZ]JO GQLHQLH WDNLHJR VNDORZDQLD 1D

SU]\NáDG ZH(P\ VWR*NRZ UDGLDOQ IXQNFM  SU]\QDOH*QRFL ]QDQ ] ORJLNL UR]P\WHM SU]\j-

PXMHRQDZDUWRü]HURQD]HZQWU]SURPLHQLDRUD]URQLHOLQLRZRGRZDUWRFLZHZQWU]

SURPLHQLD3UDZGRSRGRELHVWZRNODV\ILNDFMLMHVWREOLF]DQHSU]H]QHXURQ\Z\MFLRZHNRU]y-

VWDMF]HZ]RUX

(

)

(

)

;

,

(

|

; )

;

,

i

p

p

i

p

p

G

r

p

r

G

r

=

C

X R

C X

X R

(

)

(

)

(

)

;

; ,

max 0,1

d

G

r

r

=

X R

X R

(6)

G(XRr

JUDWXURO ZDJLVNDOXMFHMZSá\ZQDSUDZGRSRGRELHVWZRNODV\ILNDFMLZHNWRUyZ

UHIHUHQF\MQ\FKXPLHV]F]RQ\FKZRGOHJáRFLd(X;R). W przypadku algorytmu r-NN parametr
r

MHVWRSW\PDOL]RZDQ\6LHFLW\SX5%)RJDXVVRZVNLFKIXQNFMDFKWUDQVIHUXVWDQRZLV]F]e-

JyOQ\SU]\SDGHNWDNLHMVNDORZDQHMPHWRG\6%0,QQX*\WHF]QIXQNFMVNDOXMFMHVWNRm-
binacja dwóch funkcji sigmoidalnych:

G d

d

r

d

r

n

n

( )

=

− −

+

σ

σ

X R

X R

2

7

4

9 2

7

4

9

(7)

-DNR IXQNFML VNDOXMFHM ZHNWRU\ ZHZQWU] SURPLHQLD r PR*QD X*\ü ]PLHQQHJR r równego

RGOHJáRFLGRkWHJRVVLDGD-HOLSU]H]r

k

R]QDF]\üRGOHJáRüGRkWHJRVVLDGDLr

 r

i

, dla

i=1...k

 ZWHG\ VWR*NRZD IXQNFMD VNDOXMFD G(d) = 1

d/

α

r

k

α

 

! SU]\MPXMH ZDUWRFL

G(0)=1 oraz G(r

k

)=1

1/

α

'ODGX*HJR

α

 

VWR*HNMHVWEDUG]RV]HURNLLZV]\VWNLHZHNWRU\Ze-

ZQWU]VXZ]JO GQLRQHMHGQDNRZRGOD

α

 

]PLHU]DMFHJRGRZDUWRFLVVLDGQDMGDOHMSRáo-

*RQ\PDZDJ EOLVN]HUX0HWRGDRSLVDQDSRZ\*HMPXVLG]LDáDüQLHJRU]HMQL*NRQZHQFMo-
nalny k-NN.

=DPLDVWZ\PXV]DüGRNáDGQLHkVVLDGyZPR*QDX*\üSURPLHQLDVIHU\rZRNyáZHNWRUyZWe-
stowych X

MDNRSDUDPHWUXDGDSWDF\MQHJR:W\PSU]\SDGNXOLF]EDEá GyZNODV\ILNDFMLOXE

SUDZGRSRGRELHVWZRNODV\ILNDFMLp(C

i

|X;r) = N

i

  /

j

  N

j

  jest optymalizowane na zbiorze tre-

QLQJRZ\P]DSRPRFNURVZDOLGDFML:QHXURQRZHMZHUVMLWHJRDOJRU\WPXQDOH*\X*\üIXQk-

background image

8

FMLWUDQVIHUXW\SXÄWZDUGDVIHUD´-HOL*DGHQZHNWRUUHIHUHQF\MQ\QLHZSDGDGRVIHU\RSUo-
mieniu r

OXERVLJQL WRWDNLHVDPRSUDZGRSRGRELHVWZRNODV\ILNDFMLp(C

i

|X;r) dla wszystkich

klas, wektor testowy X

PR*HE\üSU]HVXQL W\GR]ELRUXSU]\SDGNyZQLHPR*OLZ\FKGRVNODVy-

ILNRZDQLD$E\XQLNQüWDNLFKSUREOHPyZSRZLQQRE\ü]ZL NV]RQDD*]RVWDQLHSU]HáDPDQ\

LPSDV0R*QDWH*ZSURZDG]Lü]PLHQQHSURPLHQLHr

i

GODND*GHJRZHNWRUDUHIHUHQF\MQHJRFR

]QDF]QLHSRZL NV]DOLF]E SDUDPHWUyZDGDSWDF\jnych.

Selekcja i parametryzacja wektorów referencyjnych

:QDMSURVWV]\PSU]\SDGNXZV]\VWNLHZHNWRU\WUHQLQJRZHPR*QDSU]\MüMDNRZHNWRU\UHIe-

UHQF\MQH=NLONXZ]JO GyZPR*HWRE\üQLHQDMOHSV]HUR]ZL]DQLH
 -HOLGDQ\FKMHVWEDUG]RGX*RZL NV]RüZHNWRUyZLWDNQLFQLHZQRVLVSRZDOQLDMFQLHSo-
trzebnie poszukiwanie najbardziej podobnych kandydatów.

 -HOLGDQ\FKMHVWPDáRZDUWRGRVWDZLüZLUWXDOQHZHNWRU\UHIHUHQF\MQHOXE]RSW\PDOL]RZDü

SRáR*HQLHLVWQLHMF\FK
 -HOLGDQHV]DV]XPLRQHOXE]DZLHUDMEá G\]PQLHMV]HQLHOLF]E\ZHNWRUyZUHIHUHQF\MQ\FK

PR*HSROHSV]\üZ\QLNL
'RGDWNRZ]DOHWUHGXNFMLOLF]E\ZHNWRUyZUHIHUHQF\MQ\FKMHVWPR*OLZRüLGHQW\ILNDFMLFLe-

NDZ\FKSURWRW\SyZSR]ZDODMFDOHSLHM]UR]XPLHüVWUXNWXU GDQ\FK:\ERUXZHNWRUyZUHIe-

UHQF\MQ\FKGRNRQDüPR*QDQDZLHOHVSRVREyZ3LHUZV]DJUXSDPHWRGG]LDáDMFDGREU]HGOD

GX*\FK ED] WUHQLQJRZ\FK RSDUWD MHVW QD PHWRGDFK NODVWHU\]DFML 1DOH*\ Z\EUDü Z]JO GQLH

PDá\ ]ELyU ZHNWRUyZ UHIHUHQF\MQ\FK VSRUyG ZHNWRUyZ OH*F\FK EOLVNR FHQWUyZ NODVWUyZ

1DVW SQLHVSUDZG]DVL GRNáDGQRüNODV\ILNDFMLQD]ELRU]HWUHQLQJRZ\P=DND*G\PUD]HP

NLHG\ V\VWHP SRSHáQL EáG SU]\ NODV\ILNDFML ZHNWRUD WUHQLQJRZHJR MHVW RQ SU]HVXZDQ\ GR
zbioru referencyjnego.

Wariantem metod 

NODVWHU\]DF\MQ\FK MHVW VWRSQLRZH ]PQLHMV]DQLH UR]G]LHOF]RFL GDQ\FK

3U]\MPXMFUR]G]LHOF]RürQLHUR]Uy*QLDP\GDQ\FKZSU]HG]LDOH>aa+r 8*\ZDMFIXQNFML

]DRNUJODQLDPR*HP\RWU]\PDüUR]G]LHOF]RüCSU]HG]LDáyZ]DSRPRFZ]RUX

(

)

(

)

(

)

min

min

max

min

( )

Round

/

;

/

r

X

X

X

r

X

X

r

r

X

X

C

=

+

=

Dla C

 ZV]\VWNLHZDUWRFLX

r

 

SU]HFKRG]ZX

min

 lub X

max

DGODGX*HJRCVWDMVL FRUD]EDr-

G]LHMSRGREQHGRSLHUZRWQ\FKZDUWRFLSR]ZDODMFQDXWZRU]HQLHZL NV]HMOLF]E\NODVWUyZ
'UXJDJUXSDPHWRGRSLHUDVL QDXVXZDQLX]FDáHJR]ELRUXWUHQLQJRZHJRW\FKZHNWRUyZGOD
których k

QDMEOL*V]\FKVVLDGyZMHVW]WHMVDPHMNODV\7HZHNWRU\OH*GDOHNRRGEU]HJyZ

REV]DUyZGHF\]MLLGODWHJRZV]\VWNLHQRZHZHNWRU\]LFKVVLHG]WZDE GLWDNMHGQR]QDF]QLH

NODV\ILNRZDQH'REU\SURWRW\SOH*F\ZURGNXNODVWUDPR*QD]QDOH(üSRV]XNXMFZHNWRUyZ

NWyUHPDMQDMZL NV]OLF]E VVLDGyZ]WHMVDPHMNODV\GRSXV]F]DMFSHZLHQSURFHQWEá -
dów.

0HWRG\]WU]HFLHMJUXS\HOLPLQXM]H]ELRUXUHIHUHQF\MQHJR NROHMQH ZHNWRU\WUHQLQJRZH ]D

ND*G\P UD]HP WHVWXMF NODV\ILNDWRU QD FDá\P ]ELRU]H WUHQLQJRZ\P -HOL K

≤δ

, gdzie K to

RVLJQL WDGRNáDGQRüNODV\ILNDFMLZ\UD*RQDZSURFHQWDFKD

δ

 

 

MHVWGRNáDGQRFL

Z\PDJDQSU]H]X*\WNRZQLNDREOLF]RQQS]DSRPRFWHVWXleave-one-outQDFDá\P]ELRU]H

WUHQLQJRZ\PWRZ\EUDQ\ZHNWRUPXVLSR]RVWDüLVáX*\üMDNRZHNWRUUHIHUHQF\MQ\ZSU]e-

FLZQ\PSU]\SDGNXZHNWRUWDNLPR*QDRGU]XFLü'RELHUDMFRGSRZLHGQLRZDUWRü

δ

PR*QDZ

SU]\EOL*RQ\VSRVyEUHJXORZDüOLF]E ZHNWRUyZUHIHUHQF\MQ\FK LPPQLHMV]H

δ

  tym w zbiorze

UHIHUHQF\MQ\PSR]RVWDMHPQLHMZHNWRUyZ :DGWHMPHWRG\MHVWWR*HMHVWGRüNRV]WRZQD

background image

9

SRQLHZD*WU]HEDSU]HSURZDG]LüW\OHRFHQEá GXLOHMHVWZHNWRUyZWUHQLQJRZ\FK'R]DOHW]a-

OLF]\üPR*QDWR*HPHWRGDJHQHUXMHEDUG]RPDáH]ELRU\WUHQLQJRZHSU]\PLQLPDOQHMGHJUa-

GDFMLGRNáDGQRFLNODV\ILNDFMLF]DVDPLQDZHWSRSUDZLDMFJHQHUDOL]DFM 
6HOHNFMDZHNWRUyZUHIHUHQF\MQ\FKSR]ZDODZ]QDF]Q\VSRVyE]PQLHMV]\ü]ELyUWUHQLQJRZ\D

FR]DW\PLG]LHSU]\VSLHV]\üREOLF]HQLD0R*QDSyMüMHV]F]HGDOHMLRSW\PDOL]RZDüSRáR*e-

QLDZ\EUDQ\FKZHNWRUyZUHIHUHQF\MQ\FKFRSRZLQQR]PQLHMV]\üEáGXF]HQLD Laaksonen,

2MD 3URZDG]LWRGRDGDSWDF\MQ\FKPHWRGNZDQW\]DFMLZHNWRURZHM /94 3RáR*HQLH
wektora referencyjnego R

 ]QDMGXMFHJR VL  Z RWRF]HQLX ZHNWRUD WUHQLQJRZHJRX powinno

E\üXDNWXDlniane zgodnie ze wzorem:

R

R

C X C R

X R

nowy

stary

stary

stary

=

+

η δ

2

1

1 6 3 8

4

9

4

93

8

,

 

(8)

gdzie 

η

MHVWVWDáXF]HQLDNWyUDPR*HE\üVWRSQLRZR]PQLHMV]DQD-HVWRQDPQR*RQDSU]H]

 MHOLX i R

stary

QDOH*GRWHMVDPHMNODV\OXE  ZSU]HFLZQ\PSU]\SDGNX:L FHMQD

WHPDWUy*Q\FKZHUVMLPHWRG\/94]QDOH(üPR*QDZSUDF\ Laaksonen, 2MD %á G\Z

Z\EUDQ\FKREV]DUDFKSU]HVWU]HQLFHFKPR*QD]OLNZLGRZDüZSURZDG]DMFGRGDWNRZHÄZLr-
tualne” wektory referencyjne, pomagaj

FHZ\RVWU]\üJUDQLFHGHF\]ML

Funkcja kosztu i metody minimalizacji

1DMSURVWV]IXQNFMNRV]WXMHVWOLF]EDSRSHáQLDQ\FKEá GyZ-HVWWRRF]\ZLFLHIXQNFMD]PLe-

QLDMFDVL VNRNRZRFRZ\NOXF]DVWRVRZDQLHV]\ENLFKJUDGLHQWRZ\FKPHWRGPLQLPDOL]DFML

-HOLREOLF]RQHSUDZGRSRGRELHVWZDNODV\ILNDFML]PLHQLDMVL ZVSRVyEFLJá\PR*HP\VWo-

VRZDüIXQNFM RFHQLDMFDU\]\NRNODV\ILNDFML

E

M

R C C

p C

M

C C

R

i

p

i p

i

p

i

p

{ };

, (

)

|

;

, (

)

,

X

X

X

X

1

6

2

7 2

7 2

7

=

δ

2

(9)

1DOH*\MHGQDNSDPL WDü*HPLQLPXPWHMIXQNFMLQLHPXVLE\üLGHQW\F]QH]PLQLPXPEá GX

NODV\ILNDFML6LHFLQHXURQRZHXF]RQHVQDMF] FLHMPHWRGZVWHF]QHMSURSDJDFMLNWyUDPi-

QLPDOL]XMH IXQNFM  PLHU]F UHGQL EáG NZDGUDWRZ\  06(  DOH PHWRG\ JUDGLHQWRZH QLH

JZDUDQWXM ]QDOH]LHQLD PLQLPDOQHJR Eá GX NODV\ILNDFML NWyUHJR RFHQD SRGDZDQD MHVW MDNR

Z\QLNNRFRZ\7RZáDQLH]WHJRSRZRGXGODQLHNWyU\FKED]GDQ\FKOHSV]HUH]XOWDW\RVL-

JQüPR*QD]DSRPRFSURVWHMG\VNU\PLQDFMLOLQLRZHMFKRFLD*PRJáRE\VL Z\GDZDü*HWH

VDPHUH]XOWDW\SRZLQQDGDüVLHü0/3]MHGQ\PQHXURQHP 'XFKL$GDPF]DN ,QLFMDOi-
zacja sieci wagami otrzymanymi z liniowej dyskryminacji (LDA) daje równie dobre rezultaty

FR /'$ W\ONR GOD GX*\FK VNRVyZ IXQNFML VLJPRLGDOQ\FK : Z\QLNX XF]HQLD QHXURQX EáG

06(PR*HPDOHüSU]\URVQF\PEá G]LHNODV\ILNDFML
W lokalnej regresji opartej na 

PLQLPDOQRRGOHJáRFLRZ\FKRFHQDFK]DIXQNFM Eá GXSU]\j-

PXMHVL 

E

M

K d

F

M

Y

R

i

p

i p

p

p

{ };

,

;

,

X

R X

X

1

6

2

7

4

9 2

7

=

2

(10)

gdzie Y

MHVWSR*GDQZDUWRFLIXQNFMLZSXQNFLHX

p

, a funkcja K

G RFHQLDZSá\ZRNROLFz-

Q\FK ZHNWRUyZ UHIHUHQF\MQ\FK QD PLDU  Eá GX -HOL IXQNFMD WD PD RVWUH PDNVLPXP ZRNyá
d

  WR Z\PXV]D RQD SU]HFKRG]HQLH GRNáDGQLH SU]H] SXQNW\  X

p

,Y

p

 MHOL MHVW RQD VWDáD WR

ZV]\VWNLHSXQNWXWUDNWRZDQHVMHGQDNRZR:SU]\SDGNXNODV\ILNDFMLPR*QDZWHQVSRVyE

Z\PXVLüUR]PLDU\VVLHG]WZDZRNyáZHNWRUyZUHIHUHQF\MQ\FKZNWyU\FK*GDP\]ZL NV]o-
nej do

NáDGQRFLNODV\ILNDFML

0HWRG\JUDGLHQWRZHVSRGVWDZXF]HQLDVLHFLQHXURQRZ\FKMHGQDN*HQLHQDGDMVL GRPi-

QLPDOL]DFMLQLHFLJá\FKIXQNFMLNRV]WX:W\PFHOXX*\ZDOLP\WU]HFKPHWRGPLQLPDOL]DFML

background image

10

lokalnej metody sympleksów (Nelder i Mead 1965), adaptacyjnej metody symulowanego wy-

*DU]DQLD$6$ Ingberg 1996; jest to globalna metoda minimalizacji) oraz globalnej metody
multisympleks (

'XDQLLQQL 1DMV]\EV]PHWRGMHVWRF]\ZLFLHORNDOQDPHWRGDsym-

SOHNVyZNWyUD]DSHZQLDZ]JO GQLHV]\EN]ELH*QRüQDZHWGODGX*\FKED]GDQ\FK-HVWWR

FHQQDPHWRGDJG\*SR]ZDODRFHQLüF]\GODGDQHMED]\GDQ\FKVNDORZDQLHPDV]DQV G]LDáDü

LF]\ZDUWRVWRVRZDüNRV]WRZQLHMV]HPHWRG\RSW\PDOL]DFML-HMZDGMHVWGX*DZDULDQFMDZy-

QLNyZFRZL*HVL ]ORNDOQRFLPHWRG\'ODED]GDQ\FK]RVREQRZ\G]LHORQ\P]ELRUHPWe-
stowym metody ASA i 

PXOWLVLPSOHNVGDMSRGREQHUH]XOWDW\GODZLHOXXUXFKRPLHV\VWHPX

]DOHWDJOREDOQHMPLQLPDOL]DFML VWRMHGQDNPHWRG\EDUG]RNRV]WRwne.

Mieszanie wielu modeli

6WDELOL]DFM Uy*Q\FKPHWRGRVLJQüPR*QDQDNLONDVSRVREyZSU]H]PHWRG\VWDW\VW\F]QHJR
próbkowania danych, takie jak arcing, bagging, stacking

 SR]ZDODMFH Z\JHQHURZDü ZLHOH

PRGHOL GOD WHJR VDPHJR NODV\ILNDWRUD XF]RQHJR QD Uy*Q\FK SRG]ELRUDFK GDQ\FK OXE SU]H]

VWZRU]HQLH ÄNRPLWHWX HNVSHUWyZ´ NWyU\FK Z\QLNL XUHGQLDQH V GOD ZLHOX PRGHOL =Z\NOH

SU]\MPXMHVL RSLQL ZL NV]RFLHNVSHUWyZOXEVWRVXMHEDUG]LHM]áR*RQHPHWRG\NRPELQDFML
wyników (Merz 1999).

3U]\WZRU]HQLXPRGHOLNRU]\VWDMF\FK]Z\QLNyZUy*Q\FKNODV\ILNDWRUyZQDOH*\Z\NRU]y-

VWDüZV]\VWNLHLQIRUPDFMHNWyUHPDP\GRG\VSR]\FML:SU]\SDGNXPRGHOLRSDUW\FKQDSo-

GRELHVWZLHLQIRUPDFMWDNPR*HE\üRFHQDNRPSHWHQFMLGDQHJRPRGHOXZSREOL*XND*GHJR

] ZHNWRUyZ UHIHUHQF\MQ\FK 'ODWHJR ]DPLDVW ]Z\NáHM NRPELQDFML OLQLRZHM Z\QLNyZ ZLHOX

PRGHOLQDOH*\]DVWRVRZDüNRPELQDFM ]HZVSyáF]\QQLNDPLSRPQR*RQ\PLSU]H]IXQNFM RFe-
ny kompetencji w danym obszarze.

(

)

(

) (

)

|

;

;

|

;

i

l

l

i

l

l

p C

M

W g

p C

M

=

X

X R

X

(11)

gdzie funkcja g

l

(X;R

SU]\MPXMHPDáHZDUWRFLZSREOL*XW\FKZHNWRUyZUHIHUHQF\MQ\FKNWó-

UHQLHVNODV\ILNRZDQHSRSUDZQLHDZSR]RVWDá\FKREV]DUDFKMHVWVWDáD:VSyáF]\QQLNLW

l

GRSDVRZDüPR*QDPHWRGQDMPQLHMV]\FKNZDGUDWyZ

3. 

6LHFL0/3DPHWRG\RSDUWHQDSRGRELHVWZLH

0R*HVL Z\GDZDü*HSRPL G]\VLHFLDPLQHXURQRZ\PLRSDUW\PLQD]ORNDOL]RZDQ\FKIXQk-

FMDFKUDGLDOQ\FKNWyUHZQDWXUDOQ\VSRVyEX]QDüPR*QD]DZHUVM PHWRGRSDUW\FKQDSRGo-

ELHVWZLH D VLHFLDPL W\SX SHUFHSWURQyZ ZLHORZDUVWZRZ\FK LVWQLHMH ]DVDGQLF]D Uy*QLFD

']LDáDQLHVLHFLSLHUZV]HJRURG]DMXEOL*V]HMHVWPHWRGRPDQDOL]\VNXSLHLSROHJDQDSU]\EOi-

*DQLX UR]NáDGX J VWRFL SUDZGRSRGRELHVWZD ZHNWRUyZ QDOH*F\FK GR Uy*Q\FK NODVWUyZ D

ZL FREOLF]DQLXZDUXQNRZHJRSUDZGRSRGRELHVWZDP(X|C 6LHFLGUXJLHJRURG]DMXEOL*V]HV

DQDOL]LHG\VNU\PLQDF\MQHMSRVáXJXMVL KLSHUSáDV]F]\]QDPLE\GRNRQDüSRG]LDáXSU]HVWU]HQL

FHFKQDUR]áF]QHREV]DU\REOLF]DMFSU]\W\PSUDZGRSRGRELHVWZDa posteriori P(C|X). Ko-

U]\VWDMF]WZLHrdzenia Bayesa:

(

)

(

)

|

( )

|

( )

P

C P C

P C

P

=

X

X

X

=DNáDGDMFGZLHNODV\C

1

 C

2

 

PR*HP\WR]DSLVDüZSRVWDFL

background image

11

(

)

(

)

(

)

(

)

(

)

(

)

1

1

1

2

2

1

1

2

2

1

1

|

(

)

1

|

|

(

)

|

(

)

|

(

)

1

|

(

)

P

C P C

P C

P

C

P C

P

C P C

P

C

P C

P

C P C

=

=

+

+

X

X

X

X

X

X

3U]HGVWDZLDMFWHUD]

(

)

(

)

(

)

(

)

2

2

1

1

1

1

2

2

|

(

)

|

(

)

exp

ln

ln

e

|

(

)

|

(

)

P

C

P C

P

C

P C

P

C P C

P

C

P C

χ

=

=

X

X

X

X

PR*HP\IRUPDOQLH]DSLVDü

(

)

( )

1

|

P C

σ χ

=

X

3U]\MPXMFdZ\PLDURZIXQNFM *DXVVDGODSUDZGRSRGRELHVWZDZDUXQNRZHJRRUD]MHd-
nakowe macierze kowariancji 

Σ

 dla obu klas:

(

)

(

) (

)

(

)

1

1

2

/ 2

1/ 2

1

|

;

,

(2 )

|

|

T

i

i

C

C

i

i

d

P

C

e

G

C

π

Σ

=

=

Σ

Σ

X

X

X

X

áDWZRMHVW]DSLVDüSUDZGRSRGRELHVWZDposterioryczne w postaci funkcji logistycznej:

(

)

(

)

1

|

T

P C

σ

θ

=

X

W X

gdzie

(

)

1

1

1

1

1

2

1

1

2

2

2

1

1

(

)

,

ln

2

2

(

)

T

T

P C

C

C

C

C

C

C

P C

θ

= Σ

=

Σ

Σ

+

W

:W\PV]F]HJyOQ\PSU]\SDGNXPR*QDZL FSU]HMüRGIXQNFML*DXVVRZVNLFKGRIXQNFMLsig-

PRLGDOQ\FK1LHWUXGQR]DXZD*\ü*HGODGLDJRQDOQ\FKPDFLHU]\NRZDULDQFMLrenormalizacja
funkcji Gaussowskich prowadzi do funkcji sigmoidalnych:

(

)

(

)

(

) (

)

(

)

; ,

; ,

; ,

;

,

T

R

G

C

G

C

G

C

G

C

σ

Σ

Σ =

=

Σ +

− Σ

X

X

W X

X

X

gdzie W

i

=4C

i

/

Σ

ii

3DU\QHXURQyZUHDOL]XMFHIXQNFM *DXVVDPRJZL F]DVWSLüIXQNFM ORJi-

VW\F]Q0R*HP\VL WXSRVáX*\üSURVWV]\PLEDUG]LHMLQWXLF\MQ\PDUJXPHQWHPXND]XMF\P

]ZL]HNPHWRGRSDUW\FKQDSRGRELHVWZLHLDQDOL]\G\VNU\PLQDFML+LSHUSáDV]F]\]QDVWDQo-

ZLFDJUDQLF GHF\]MLPL G]\NODVDPLMHVWUyZQRRGOHJáDRGGRZROQ\FKGZyFKSXQNWyZNWó-

UH OH* QD SURVWHM GR QLHM SURVWRSDGáHM 3U]\MPXMF WH SXQNW\ ]D ZHNWRU\ SURWRW\SRZH GOD

GZyFKNODVZPHWRG]LHQDMEOL*V]\FKVVLDGyZLREOLF]DMFRGOHJáRü(XNOLGHVRZRWU]\PDP\

ZL F UyZQRZD*Q\ V\VWHP NODV\ILNXMF\ :\EyU QDMOHSV]HM SáDV]F]\]Q\ UR]G]LHODMFHM GZLH

NODV\]DSRPRFOLQLRZHMDQDOL]\G\VNU\PLQDF\MQHMOXEXF]HQLDSHUFHSWURQXMHVWUyZQRZD*Q\

background image

12

XVWDOHQLXSRáR*HQLDMHGQHJR]ZHNWRUyZSURWRW\SRZ\FKLSRV]XNLZDQLXQDMOHSV]HJRSRáR*e-
nia drugiego z tych wektorów.

-HOL]DáR*\P\ELQDUQHV\JQDá\ZHMFLRZH^X

i

=

±

1} i wagi {W

i

=

±

1}, to neuron o N

ZHMFLDFK

i progu 

θ

  reali

]XMHQDVW SXMFIXQNFM 

(

)

(

)

0

if

/ 2

1

if

/ 2

N

i

i

i

N

W X

N

θ

θ

θ

>

 

Θ

= 

 

W

X

W

X

(12)

gdzie norma ||

__MHVW]GHILQLRZDQDSU]H]RGOHJáRüHamminga. Wagi neuronów w pierwszej

ZDUVWZLH XNU\WHM PR*QD LQWHUSUHWRZDü MDNR DGUHV\ ZHNWRUyZ UHIHUHQF\MQ\FK ] SU]HVWU]HQL

ZHMFLRZHM1HXURQ\SURJRZHVZ]EXG]DQHSU]H]ZHNWRU\ZHMFLRZHZSDGDMFHZVIHU R
promieniu 

θ

VFHQWURZDQZW=PLHQLDMFZDUWRFLELQDUQHQDU]HF]\ZLVWHRUD]SURJRZ

IXQNFM  WUDQVIHUX QD VLJPRLGDOQ RUD] GRNRQXMF QRUPDOL]DFML __X||=||W__  PR*QD X]\VNDü

PL NNLHZ]EXG]HQLHQHXURQyZSU]H]ZHNWRU\ZHMFLRZHEOLVNLHW na sferze jednostkowej.

:RJyOQRFLIXQNFMDWUDQVIHUXQHXURQyZPDSRVWDü

σ

σ

σ

(

)

(

, )

W X

W

X

W

X

W X

=

+





=

1

2

2

2

2

4

9 1

6

I

d

max

(13)

'OD]QRUPDOL]RZDQ\FKZHNWRUyZZHMFLRZ\FKsigmoidalne (lub inne monotonicznie rosn-

FH IXQNFMHWUDQVIHUXREOLF]DMZSá\ZZHNWRUyZUHIHUHQF\MQ\FKWQDSUDZGRSRGRELHVWZR
klasyfikacji  p

i

(

| ;{

, })

C X W

θ

Z]DOH*QRFLRGLFKRGOHJáRFLd(W,X -DNRIXQNFMDRGOHJáRFL

funkcja transferu 

σ 

(I

max

 

− 

d(W,X

 PRQRWRQLF]QLH PDOHMH RVLJDMF ZDUWRü  GOD

d(W,X)=I

max

'OD]QRUPDOL]RZDQ\FKZDJLZHNWRUyZZHMFLRZ\FK

σ 

(I

max

 

− 

d(W,X)) 

 [0.5,

σ

(1)],

przy czym 0 

 d(W,X

FRR]QDF]D*HW\ONRF] ü]DNUHVXIXQNFMLsigmoidalnej jest wy-

korzystana. Dla znormalizowanych X i dowolnego zakres argumentu 

VLJPRLG\ OH*\ Z

przedziale [

|W|,+|W|]. 

6LJPRLGDXQLSRODUQDPDPDNV\PDOQNU]\ZL]Q RNRáRZDUWRFL

±

2.4

LGODWHJRZDJLPQLHMV]HRGWHMZDUWRFLR]QDF]DM*HVLHüE G]LHG]LDáDüZREV]DU]HSUDZLH
liniowym. Metody 

UHJXODU\]DFMLGRGDMF]áRQ\NDU\GRIXQNFMLEá GXVS\FKDMFZDJLGRPa-

á\FKZDUWRFLLW\PVDP\PZ\JáDG]DMFGRSDVRZDQLHVLHFLGRGDQ\FKWUHQLQJRZ\FK'ODQLe-

NWyU\FKGDQ\FKSROHSV]DWRJHQHUDOL]DFM VLHFL-HOLMHGQDNSRWU]HEQHVRVWUHJUDQLFHGHF\]ML

OXEVLOQHQLHOLQLRZRFLUHJXODU\]DFMDPR*HSRJRUV]\üJHQHUDOL]DFM 
W perceptronach wielowarstwowych funkcje 

VLJPRLGDOQH RFHQLDM ZSá\Z ZDJ ]DOH*QLH RG

RGOHJáRFLSRPL G]\ZDJDPLDZHNWRUDPLWUHQLQJRZ\PL:VLHFLDFKW\SX5%)X*\ZDQHV

(XNOLGHVRZH PLDU\ RGOHJáRFL d(R,X)=||X-R|| i eksponencjalne funkcje wagowe exp(

d

2

).

=PLHQLDMFIXQNFM RGOHJáRFLZUyZQDQLX(13)QSX*\ZDMFPLDU RGOHJáRFLMinkowskie-

JRPR*QDWZRU]\üQRZHW\S\VLHFLQHXURQRZ\FKQD]ZDQHSU]H]QDV 'XFKLLQQL '
MLP (od Distance-based MLPs).

1DU\VXQNDFKSU]HGVWDZLRQ\MHVWHIHNWZSURZDG]HQLDGRGDWNRZHJRZ\PLDUXQDNV]WDáWJUa-
nic decyzji dla danych 

,ULV&KRFLD*WHGDQHPDMFHFK\GODZ\JRG\SRND]DQRW\ONRGZLH

RVWDWQLH FHFK\ SR]ZDODMFH QD ]QDOH]LHQLH RSW\PDOQHJR  ] SXQNWX ZLG]HQLD JHQHUDOL]DFML

UR]ZL]DQLDRGSRZLDGDMFHJRFRQDMZ\*HMEá GRP0LQLPDOQDVLHü0/3PDZW\PSU]y-

SDGNXGZDZHMFLDQHXURQ\XNU\WHLZ\MFLD SRMHGQ\PGODNODV\ DMHMJUDQLFHGHF\]ML

SRND]DQHVQDU\VXQNXSRQL*HM

background image

13

:SURZDG]HQLHGRGDWNRZHJRZ\PLDUXSR]ZDOD]UH]\JQRZDü]XNU\W\FKQHXURQyZSR]RVWa-

ZLDMF W\ONR  QHXURQ\ ZHMFLRZH L  QHXURQ\ Z\MFLRZH =DVWRVXMHP\ XRJyOQLRQ PLDU
Minkowskiego

(

)

(

)

1

, ;

,

N

i

i

i

i

d

s d A B

α

β

=

=

A B s

Dla 

α

 = 1 i 

β

 GRVWDMHP\ZUyZQDQLX  NZDGUDWRGOHJáRFLRGSRZLDGDMF\]Z\Ná\P

KLSHUSáDV]F]\]QRPGOD

α

 = 

β

 GRVWDMHP\RGOHJáRü(XNOLGHVRZRGSRZLDGDMFSRZVWa-

QLXMHGQRVWHNNRáRZ\FK'OD

α

 =2 a 

β

GX*HJR QS

β

  NV]WDáWJUDQLFGHF\]ML]EOL*DVL GR

SURVWRNWQHJR7HGZDSU]\SDGNLSRND]DQH]RVWDá\QDU\VXQNDFKSRQL*HM'OD

β

 =1 lub mniej-

V]HJR NV]WDáW JUDQLF GHF\]ML UREL VL  SRF]WNRZR URPERLGDOQ\ D Sy(QLHM SU]\ELHUD NV]WDáW

ZNO Vá\MDNSRND]DQRQDGZyFKNROHMQ\FKU\VXQNDFK

  

   

Granice decyzji dla 

α

 = 

β

 = 2 oraz 

α

 = 2, 

β

 = 7

background image

14

  

Granice decyzji dla 

α

 = 2, 

β

 = 1 oraz 

α

 = 2, 

β

 = 0.5

4. 

3DPL üDVRFMDF\MQDG

o

SHáQLDQLHZ]RUFyZLEUDNXMFHZDUWRFL

0HWRG\QDOH*FHGRVFKHPDWX6%0WDNLHMDNPHWRG\QDMEOL*V]\FKVVLDGyZPR*QDZQDWu-

UDOQ\VSRVyEZ\NRU]\VWDüMDNRSDPL üDXWROXEKHWHURDVRFMDF\MQ0DMFGDQ\ZHNWRUX=
(X

d

, X

n

), w którym X

d

WRZDUWRFL]QDQHDX

n

WRZDUWRFLV]XNDQHPR*HP\V]XNDüQDMEDr-

dziej podobnych wektorów w podprzestrzeni znanych cech X

d

%UDNXMFHZDUWRFLFHFKX

n

PR*QDRNUHOLü]DSRPRFLQWHUSRODFMLELRUFQDMEOL*V]\FKZHNWRUyZUHIHUHQF\MQ\FK-HOL
znana jest klasa wektora X

WRPR*QDVL RJUDQLF]\üW\ONRGRZHNWRUyZUHIHUHQF\MQ\FK]WHM

NODV\MHOLNODVDQLHMHVW]QDQDWRQDOH*\Z\EUDüZHNWRU\]NODV\GRPLQXMFHMZSREOL*XX

d

.

/LF]E VVLDGyZkPR*QD]RSW\PDOL]RZDüZSRGSU]HVWU]HQLX

d

Z\NRQXMFRGSRZLHGQLHWe-

sty.

8]XSHáQLDQLHEUDNXMF\FKZDUWRFL]UHDOL]RZDüPR*QDQDNLONDVSRVREyZ:ZLHOXSU]\SDd-

NDFKZHNWRU\]DZLHUDMFHEUDNXMFHZDUWRFLXVXZDQHV]H]ELRUXWUHQLQJRZHJROXEZVWa-

ZLDQHVXUHGQLRQHOXEQDMF] FLHMVSRW\NDQHZDUWRFL3URZDG]LWRGRXWUDW\FHQQHMLQIRr-

PDFMLOXEZSURZDG]DP\OQLQIRUPDFM 1DSU]\NáDGGDQHÄechocardiogram” z repozytorium
UCI (Mertz i 

0XUSK\ ]DZLHUDMZHNWRU\RFHFKDFK]NWyU\FKW\ONRFHFK\

VX*\WHF]QH GUXJD]QLFKWRNODVD %UDNXMHZDUWRFLGODFHFK\ZDUWRFLGODFHFK\

LWG-HOLFHFK\]DZLHUDMFHEUDNXMFHZDUWRFL]RVWDQ]LJQRURZDQHX*\ZDMFVLHFL)60]
gaussowskimi funkcjami  transferu (Duch i Diercksen 1995; Duch i inni 1997) 10-krotna
stratyfikowana 

NURVZDOLGDFMDGDMHGRNáDGQRüGODUHGQLHMOLF]E\QHXURQyZUyZQHM

:NRQVWUXNW\ZLVW\F]Q\PDOJRU\WPLHMDNLPSRVáXJXMHVL )60SRZVWDMUy*QHOLF]E\QHXUo-

QyZGODUy*Q\FKSRG]LDáyZGDQ\FK/LF]EDWZRU]RQ\FKQHXURQyZ]DOH*QDMHVWRG]áR*RQRFL
danych.

:VWDZLDQLH ZDUWRFL UHGQLFK GOD ZV]\VWNLFK NODV ]PQLHMV]\áR GRNáDGQRü GR   SU]\

UHGQLRQHXURQDFK DZVWDZLDQLHQLHW\SRZ\FKZDUWRFL QS± REQL*\áRGRNáDGQRü

MHV]F]HEDUG]LHMGR SU]\UHGQLRQHXURQDFK 'DQHHepatitis, z tego samego repo-

]\WRULXP 8&, PDM  ZHNWRUyZ R  FHFKDFK  ] QLFK WR FHFK\ ELQDUQH D SR]RVWDáH

SU]\MPXMNLONDZDUWRFLFDáNRZLW\FK2VWDWQLDFHFKDPDEUDNXMF\FKZDUWRFLFHFKD

PDEUDNXMF\FKZDUWRFLLWG,JQRURZDQLHFHFK]DZLHUDMF\FKEUDNXMFHZDUWRFLGOD
krotnej stratyfikowanej 

NURVZDOLGDFML GDMH GRNáDGQRü   SU]\ UHGQLR  QHXURQDFK 

ZVWDZLDQLHUHGQLFKGDMH QHXURQyZ DZVWDZLHQLHZDUWRFLQLHW\SRZHM 

QHXURQyZ 3RGREQH]DFKRZDQLH]DREVHUZRZDüPR*QDQDLQQ\FKGDQ\FK
=Dáy*P\*HGZXZ\PLDURZHZHNWRU\VNXSLRQHVZRNyáGZyFKFHQWUyZ  RUD]  D

SLHUZV]HVNXSLHQLH]DZLHUDGZDUD]\ZL FHMZHNWRUyZQL*GUXJLH:H(P\ZHNWRUX dla któ-
rego pierwsza cecha X

1

 

 DGUXJDMHVWQLH]QDQD3RV]XNXMFVVLDGyZZHNWRUDX w pod-

background image

15

przestrzeni X

1

LLQWHUSROXMFZDUWRüX

2

QDSRGVWDZLHZDUWRFL]QDOH]LRQ\FKZZHNWRUDFKUe-

IHUHQF\MQ\FK]QDMG]LHP\SU]\EOL*RQSRSUDZQZDUWRü RNRáR 8*\ZDMFZDUWRFLUHd-

QLFK OXE ZDUWRFL QDMF] FLHM Z\VW SXMF\FK RWU]\PDP\ QLHSUDZLGáRZ ZDUWRü  EOLVN  

0DP\WXGRF]\QLHQLD]H]QDQ\PZVWDW\VW\FHG\OHPDWHPZRSDUFLXRMDNJUXS GDQ\FK

PR*QDURELüSU]HZLG\ZDQLD"3RZLQQ\WRE\üGDQHQDMEDUG]LHMVSHF\ILF]QHW]QGDQHGRWy-

F]FHORNDOQ\FKVNXSLHDQLHUHGQLHOXEQDMF] FLHMZ\VW SXMFHZDUWRFL'\OHPDWSROHJD

QDW\P*HLPEDUG]LHMVSHF\ILF]QHVNXSLHQLDUR]SDWUXMHP\W\PPQLHMOLF]QHVGDQHQDSRd-

VWDZLHNWyU\FKPR*HP\GRNRQDüLQWHUSRODFML
:ZLHOX]DVWRVRZDQLDFKGDQH]ELHUDQHVZVSRVyEKLHUDUFKLF]Q\SRF]WNRZDJUXSDWHVWyZ

SR]ZDODVWDZLDüKLSRWH]\NWyUHVQDVW SQLHSRWZLHUG]DQHOXERGU]XFDQHSU]H]NROHMQHWHVW\

2GNU\FLH WDNLHM KLHUDUFKLF]QHM VWUXNWXU\ QD SRGVWDZLH VDP\FK GDQ\FK MHVW GX*\P Z\]Za-

QLHP àF]QD DQDOL]D NZHVWLRQDULXV]\ ] Uy*Q\FK EDGD SRZLQQD UR]Uy*QLDü GZLH V\WXDFMH

EUDNRGSRZLHG]LQD]DGDQHS\WDQLDRUD]EUDNRGSRZLHG]LSRQLHZD*S\WDQLHQLH]RVWDáR]DGa-
ne. W statystyce problem ten znany jest jako „wielokrotna imputacja danych” (multiple im-
putation

LUR]SDWU\ZDQ\F] VWRZNRQWHNFLHDQDOL]\SUHIHUHQFMLSROLW\F]Q\FKRNUHODQ\FK]D

SRPRF NZHVWLRQDULXV]\ SU]H] Uy*QH LQVW\WXFMH 6WDQGDUGRZD WHRULD SRFKRG]FD RG Rubina

 RSLHUDVL QD]DáR*HQLDFKRJDXVVRZVNLPUR]NáDG]LHGDQ\FK=DáR*HQLDWHF] VWRQLHV
spe

ánione.

: NRQWHNFLH PHWRG RSDUW\FK QD SRGRELHVWZLH ]DVWRVRZDü PR*QD X]XSHáQLDQLH ZDUWRFL

ZHNWRUyZWUHQLQJRZ\FKRSDUWHQDLQWHUSRODFMLZDUWRFLSREOLVNLFKZHNWRUyZ3RX]XSHáQLHQLX

ZHNWRU\ WH Z\NRU]\VW\ZDQH V GR XF]HQLD PRGHOX 1DMEDUG]LHM SUDZGRSRGREQH QLH]QDQH

ZDUWRFLRFHQLüPR*QDPDNV\PDOL]XMF

(

)

'

',

(

|

;

)

max (

|

,

;

)

u

d

i

d

u

u i

P

M

P C

M

=

X

X

X X

dla danego modelu M

VWRSQLRZRGRVNRQDORQHJRG]L NLGRGDZDQLXGRED]\UHIHUHQF\MQHMFo-

UD]ZL NV]HMOLF]E\ZHNWRUyZ]X]XSHáQLRQ\PLEUDNXMF\PLZDUWRFLDPL3RV]XNLZDQLDPDk-

VLPXP SUDZGRSRGRELHVWZD GRNRQ\ZDQH V Z SRGSU]HVWU]HQL FHFK R QLH]QDQ\FK ZDUWo-

FLDFKGODXVWDORQ\FKZDUWRFLX

d

-HOLEUDNXMHW\ONRMHGQDZDUWRüPR*QDMX]XSHáQLüGo-

NRQXMF MHGQRZ\PLDURZHJR SU]HV]XNLZDQLD ORNDOQHJR PDNVLPXP 3RF]WNRZ\ PRGHO M

RSDUW\MHVWQDZHNWRUDFKQLH]DZLHUDMF\FKEUDNXMF\FKGDQ\FK-HOLWDNLFKZHNWRUyZQLHPD

QDOH*\ ]QDOH(ü QDMZL NV]\ ]ELyU ZHNWRUyZ WUHQLQJRZ\FK NWyUH PDM QDMZL FHM ]QDQ\FK

ZVSyOQ\FKFHFK7DNZL FFHFKDNWyUDQLHPDGODZL NV]RFLZHNWRUyZRNUHORQ\FKZDUWRFL

QLHMHVWEUDQDSRGXZDJ ZNRQVWUXNFMLSRF]WNRZHJRPRGHOXMHGQDN*HQDSy(QLHMV]\PHWa-

SLH ]QDMG\ZDQH V MHM QDMEDUG]LHM SUDZGRSRGREQH ZDUWRFL L PRGHO NRU\JRZDQ\ MHVW SU]\

X*\FLX ZHNWRUyZ ]DZLHUDMF\FK ZV]\VWNLH FHFK\ 1D ND*G\P NURNX QDOH*\ MHGQDN VSUDw-

G]DüF]\GRGDZDQLHQRZHMFHFK\LVWRWQLHSROHSV]DDNWXDOQLHLVWQLHMF\PRGHOZ\NRQXMFWe-
sty 

NURVZDOLGDF\MQHPR*HVL ERZLHPRND]Dü*HQRZDFHFKDQLH]DZLHUDLVWRWQ\FKLQIRUPa-

FMLLMHMXZ]JO GQLHQLHMHG\QLHSRJDUV]DZ\QLNL
'ODVLOQLH]DVREVSU] *RQ\FKFHFKSUREOHPZ\ERUXSRF]WNRZ\FKFHFKMDNLSRU]GNXZ

NWyU\PX]XSHáQLDQHVEUDNXMFHZDUWRFLPR*HE\üEDUG]R]áR*RQ\1LHPDZL FJZDUDQFML

*HXGDVL ]QDOH(üPRGHORSW\PDOQ\:SUDNW\FHVLHFLRZDUHDOL]DFMDPRGHOL6%0]QDF]QLH

XáDWZLD SRV]XNLZDQLH PDNV\PDOQLH SUDZGRSRGREQ\FK ZDUWRFL JG\* ]DPLDVW NRV]WRZQ\FK

SURFHVyZV]XNDQLD Z ZLHORZ\PLDURZ\FK SU]HVWU]HQLDFK Z\VWDUF]\ VSUDZG]Lü ZLHONRü So-

EXG]HSRV]F]HJyOQ\FKZ ]áyZVLHFLLX*\üJUDGLHQWRZ\FKPHWRGZREV]DU]HEOLVNLPFHn-

WUXPZ ]áDQDMEDUG]LHMZ]EXG]RQHJR3RQLHZD*VLHFLRIHUXMDQDOLW\F]QHSU]\EOL*HQLHGRZy-

UD*H QD J VWRFL SUDZGRSRGRELHVWZD PR*QD WH* ]DVWRVRZDü VWDW\VW\F]QH PHWRG\ SUyENo-
wania danych (Neal 1996).

background image

16

=DVWRVRZDQLH RSLVDQHM SRZ\*HM PHWRG\ PDNV\PDOL]DFML SUDZGRSRGRELHVWZD GOD echokar-

GLRJUDPyZSRSUDZLáR Z\QLNL WHVWyZ NURVZDOLGDF\MQ\FK GDMF GRNáDGQRü  L ]PQLHj-

V]DMFOLF]E QHXURQyZGR'ODGDQ\FKKHSDWLWLVRWU]\PXMHP\GODUHGQLRQHu-

URQyZ=DUyZQRGRNáDGQRüMDNL]áR*RQRüV\VWHPXXOHJá\Z\UD(QHMSRSUDZLH

5.  Implementacja i realizacja sieciowa

/LF]EDPR*OLZ\FKZDULDQWyZPHWRGRSDUW\FKQDSRGRELHVWZLHMHVWEDUG]RGX*DLQDUD]LHMe-

G\QLHF] ü]RSLVDQ\FKWXDOJRU\WPyZ]RVWDáD]DLPSOHPHQWRZDQDZUR]ZLMDQ\PSU]H]QDV

V\VWHPLH:QDMSURVWV]HM]QLFKPHWRG]LHQDMEOL*V]\FKVVLDGyZREOLF]DVL ZV]\VWNLHRGOe-

JáRFL RG ZHNWRUD WHVWRZHJR GR ZHNWRUyZ WUHQLQJRZ\FK Z\ELHUDMF k QDMEOL*V]\FK 7DNL

V\VWHPSRWU]HEXMHQLHZLHOHF]DVXQDRSW\PDOL]DFM SDUDPHWUyZ ZQDMSURVWV]\PSU]\SDGNX

MHVWWRW\ONROLF]EDVVLDGyZk DOHMHVWVWRVXQNRZRZROQ\QDHWDSLHNODV\ILNDFML&KRFLD*La-
aksonen i 

2MD    WZLHUG] *H Ä GOD ED] GDQ\FK FKDUDNWHU\]XMF\FK VL  QLH]E\W GX*

Z\PLDURZRFLGDQ\FKWUXGQR]QDOH(üZDULDQWPHWRG\k11NWyU\E\áE\]QDF]FRV]\EV]\

QL*PHWRGDbrute force´Uy*QHXVSUDZQLHQLDSU]\VSLHV]DMFHG]LDáDQLHWHJRDOJRU\WPX]RVWDá\
opisane w literaturze (np. Daelemans 1998).

:QDV]\PV\VWHPLHVWRVXMHP\EXIRURZDQLHWDEOLF\RGOHJáRFL SODQXMHP\]DLPSOHPHQWRZDü

UyZQLH* LQQH XVSUDZQLHQLD  3DPL WDQD MHVW WDEOLFD ] REOLF]RQ\PL RGOHJáRFLDPL PL G]\
wektorami treningowymi (dla potrzeb testu leave-one-out lub 

NURVZDOLGDFML  RUD]MHOLSOLN

WHVWRZ\MHVWZ\G]LHORQ\WDEOLFDRGOHJáRFLPL G]\ZHNWRUDPLWUHQLQJRZ\PLDWHVWRZ\PL:

SU]\SDGNXZLHORNURWQ\FKREOLF]HQDWHMVDPHMED]LHGDQ\FK QSZF]DVLHRSW\PDOL]DFMLSa-

UDPHWUyZNODV\ILNDWRUD MX*GODNLONXG]LHVL FLXDWU\EXWyZPR*QD]QDF]QLH]UHGXNRZDüF]DV

REOLF]H-HOLNODV\ILNDFMLE G]LHP\GRNRQ\ZDüF] VWRQDW\FKVDP\FKGDQ\FKLQQ\PURz-

ZL]DQLHPMHVW]PQLHMV]HQLHED]\WUHQLQJRZHM]DSRPRFVHOHNFMLZHNWRUyZUHIHUHncyjnych.

Realizacja sieciowa

$OJRU\WPPHWRG\QDMEOL*V]\FKVVLDGyZPR*H]RVWDüSU]HGVWDZLRQ\ZSRVWDFLVLHFLNWyUDPD

Z ]á\ XNU\WH REOLF]DMFH RGOHJáRFL d(X,  R

p

).  k

 Z ]áyZ R QDMPQLHMV]HM RGOHJáRFL REOLF]D

HW\NLHW NODV\h(XR

p

) = C

j

DSR]RVWDáHZ ]á\GDMh

j

(XR

p

 :DUVWZDZ\MFLRZDVLHFL

REOLF]DSUDZGRSRGRELHVWZDNRU]\VWDMF]HZ]RUyZ

P

M

h

p

M

P

M

P

M

i

ij

j

j

i

i

i

i

C X

W

X

C X

C X

C X

| ;

( ),

| ;

| ;

| ;

1

6

1

6 1

6

1

6

=

=

 (14)

Wagi 

W

ij

GODSRáF]H]MHGQRVWNDPLZ\MFLRZ\PLREOLF]DMF\PLSUDZGRSRGRELHVWZDGOD

poszczególnych klas C

i

SU]\MPXMZDUWRFLW

ij

 = S(C

i

C

j

)/C

j

, gdzie S(

MHVWPDFLHU]RFe-

QLDMFSRGRELHVWZRSRPL G]\NODVDPL:SU]\SDGNXWUDG\F\MQHMPHWRG\k-NN zamiast tej

PDFLHU]\ X*\ZD VL  GHOW\ .URQHFNHUD .D*G\ ZHNWRU QDOH*F\ GR k QDMEOL*V]\FK VVLDGyZ

ZQRVLZNáDGRZDUWRFLS(C

i

C

j

GRSUDZGRSRGRELHVWZDGODNODV\C

i

. Struktura sieci przed-

VWDZLRQD MHVW QD U\VXQNX SRZ\*HM -DNR IXQNFM  NRV]WX SRGOHJDMF RSW\PDOL]DFML PR*QD

SU]\Mü

E

M

R

p

M

i

i

i

i

(

;

)

,

| ;

,

W

C C X

C X

C C X

X

=

1 6

2

7 1

6

1 6

2

7

3

8

δ

2

(15)

background image

17

gdzie model M zawiera k jako parametr i S(C

i

C

j

)

MHVWPDFLHU]SRGRELHVWZPL G]\NODVo-

Z\FK&KFF]PLQLPDOL]RZDüOLF]E Eá GyZNODV\ILNDFMLSUDZGRSRGRELHVWZDSRZLQQ\E\ü

]DPLHQLRQHQDZDUWRFLELQDUQHSU]H]SURFHGXU ÄZ\JU\ZDMF\ELHU]HZV]\VWNR´:DJL

Z\MFLRZHUyZQHSRF]WNRZRW

ij

 = S(C

i

C

j

)/C

j

PRJE\üWUDNWRZDQHMDNRSDUDPHWU\DGDp-

WDF\MQH:SURZDG]HQLHVNDORZDQLDZSá\ZXZHNWRUyZUHIHUHQF\MQ\FKG(d(

)) pozwala na za-

stosowanie gradientowych metod optymalizacji.

'ODZLHOXED]GDQ\FK ]ZáDV]F]DGODREUD]yZ WDNDVLHüSRZLQQDG]LDáDüOHSLHMQL*VLHFLW\SX

0/3LLQQHNODV\ILNDWRU\MDNR*HUH]XOWDW\SRZLQQ\E\üQLHJRUV]HQL*WHRWU]\PDQH]NOa-
sycznej metody k-NN (por. Michie i inni 1994).

3RMHG\QF]\QHXURQGRVWDUF]DMF\KLSHUSáDV]F]\]Q\JUDQLF]QHMPR*QD]DVWSLüRGSRZLHGQLR

XPLHMVFRZLRQ\PZHNWRUHPUHIHUHQF\MQ\P8*\ZDMFUy*Q\FKIXQNFMLRGOHJáRFLPR*HP\Z

]QDF]QHMPLHU]HZSá\ZDüQDNV]WDáWJUDQLFGHF\]ML-HOLPDP\W\ONRMHGHQZHNWRUUHIHUHn-
cyjny R

i

GODND*GHMNODV\SU]\QDOH*QRüGRGDQHMNODV\RNUHORQDMHVWSU]H]IXQNFM G\VNUy-

PLQDF\MQ'ODGZyFKNODVPDRQDSRVWDü

(

)

(

)

1

1

2

2

( )

,

,

z

W D

W D

θ

=

X

X R

X R

gdzie próg 

θ

MHVWSDUDPHWUHPDGDSWDF\MQ\P5D]HP]ZDJDPLRUD]SRáR*HQLDPLZHNWRUyZ

referencyjnych daje to 2n+3 parametry adaptacyjne (dla n-wymiarowych wektorów). Przed-

VWDZLDMF REOLF]HQLD IXQNFML G\VNU\PLQDF\MQ\FK Z SRVWDFL VLHFL QDOH*\ ZSURZDG]Lü Z ]Há

Z\MFLRZ\VXPXMF\ZDUWRFLIXQNFMLG\VNU\PLQXMF\FKSRSURWRW\SDFKSU]\SLVDQ\FKGRSo-
szczególnych klas:

X

1

X

2

X

3

X

4

X C

1

1

,

X C

2

1

,

X C

3

2

,

X C

4

2

,

X C

5

3

,

p

M

C X

1

| ;

1

6

p

M

C X

2

| ;

1

6

p

M

C X

3

| ;

1

6

Rys. 1. Sieciowe uogólnienie metody k-NN.

background image

18

(

)

(

)

1

2

( )

,

,

i

i

i

i

i C

i C

z

W D

W D

θ

=

X

X R

X R

6NDORZDQLHFDáHMVXP\]DPLDVWSRV]F]HJyOQ\FKRGOHJáRFL]PQLHMV]DOLF]E SDUDPHWUyZDd-

DSWDF\MQ\FKXSUDV]F]DMFNV]WDáW\PR*OLZ\FKGRRWU]\PDQLDJUDQLFGHF\]ML:HNWRU\UHIHUHn-

F\MQH PR*QD Z\EUDü ] ED]\ WUHQLQJRZHM L ]RSW\PDOL]RZDü ]D SRPRF DOJRU\WPX /94 OXE

PLQLPDOL]XMF RGSRZLHGQL IXQNFM  NRV]WX 1D U\VXQNX SU]HGVWDZLRQR JUDQLFH GHF\]ML GOD

SU]\SDGNXGZXZ\PLDURZHJRZNWyU\PZ\Uy*QLRQRSURWRW\S\SRMHGQ\PGODNODV\:DJD

SLHUZV]HJRSURWRW\SXMHVWUD]\ZL NV]DQL*SR]RVWDáHZDJL3RV]F]HJyOQHU\VXQNLRGSRZLa-

GDMUy*Q\PZDUWRFLRPZ\NáDGQLNyZGODRGOHJáRFLMinkowskiego.

6. 

3U]\NáDGRZHZ\QLNL

1DZHWZVZRMHMQDMSURVWV]HMSRVWDFLPHWRGDQDMEOL*V]\FKVVLDGyZGDáDZHPSLU\F]Q\FKSo-
równaniach projektu STATLOG (Michie i inni, 1994) w 4 z 22 baz danych najlepsze rezultaty

LZQDVW SQ\FKSUDZLHQDMOHSV]HUH]XOWDW\'RW\F]\WR]ZáDV]F]DED]GDQ\FK]ZL]DQ\FK]

REUD]DPL3URVWHPRG\ILNDFMHWHMPHWRG\WDNLHMDNVHOHNFMDFHFKRSW\PDOL]DFMDOLF]E\VVLa-

GyZLIXQNFMLRGOHJáRFLSR]ZROLá\QDPQDRVLJQL FLHQDMOHSV]\FKUH]XOWDWyZZSRQDGSRáo-
wie wszystkich przypadków.

background image

19

Metoda

%, zbiór
trening.

%, zbiór
testowy

Uwagi

IB2-IB4

81.2-85.5

43.6-44.6 WEKA, nasze obliczenia

Klasyfikator Bayesowski

--

46.6 WEKA, nasze obliczenia

1R (

UHJXáRZ\

58.4

50.3 WEKA, nasze obliczenia

7 UHJXá\]GU]HZDGHF\]ML

67.5

53.3 WEKA, nasze obliczenia

FOIL (indukcja, logiczny)

99

60.1 WEKA, nasze obliczenia

)60NODV\F]Q\FKUHJXá

Logicznych

83.5

63.2 FSM, nasze obliczenia

LDA (liniowa dyskryminacja)

68.4

65.0 nasze obliczenia

'/94 Z ]áyZ

100

66.0 nasze obliczenia

&±UHJXá\]GU]HZDGHF\]ML

64.5

66.3 nasze obliczenia

Najlepsze rozmyte MLP

75.5

66.3 Mitra i inni (1997)

MLP z algorytmem RPROP

 

68.0 nasze obliczenia

MLP – Korelacja Kaskadowa

 

71.0 nasze obliczenia

5R]P\WDVLHüQHXURQRZD

100

75.5 Hayashi i inni (1990)

C4.5 drzewo decyzji

94.4

75.5 nasze obliczenia

FSM, funkcje Gaussa

93

75.6 nasze obliczenia

)60IXQNFMLWUyMNWQ\FK

93

75.8 nasze obliczenia

IB1c (

PLQLPDOQRRGOHJáRFLRZD

--

76.7 WEKA, nasze obliczenia

1-NN, Manhattan

79.1

77.9 nasze obliczenia

K* method

--

78.5 WEKA, nasze obliczenia

1-NN, bez 4 cech, Manhattan

76.9

80.4 nasze obliczenia, KG

11ZD*RQH $6$

83.4

82.8 nasze obliczenia, KG

'ODQLHNWyU\FKED]GDQ\FKQSSUREOHPyZ]ZWURE Ähepatobiliary disorders”, zbiór otrzy-
many z Tokyo Dental and Medical University (Hayashi i inni 1990)

]DZLHUDMF\SU]y-

SDGNyZZHNWRU\WHVWRZHFHFKLNODV\ RVLJQL WHSU]H]QDVZ\QLNLV]QDF]QLHOHp-

V]\QL*Z\QLNLRWU]\PDQH]DSRPRFNLONXQDVWXLQQ\FKPHWRG]DVWRVRZDQ\FKZW\PSU]y-
padku (WEKA jest pakietem programów otrzymanym z Waikato University, Nowa Zelandia).

1DMOHSV]HZ\QLNLXGDáRVL RVLJQüVWRVXMFQDMSLHUZVHOHNFM DSRWHPVNDORZDQLHSR]RVWa-

á\FKFHFK:\QLNR]EOL*RQHMGRNáDGQRFLGDáWH*NRPLWHWVLHFL)60 'XFKLLQQL 0o-

GHOWHQPLHFLVL UyZQLH*ZVFKemacie metod SBM.

7. Podsumowanie

6FKHPDWPHWRGRSDUW\FKQDSRGRELHVWZLHMHVWEDUG]RERJDW\]DZLHUDZVRELHZQDWXUDOQ\

VSRVyEZL NV]RüPRGHOLVLHFLQHXURQRZ\FKLLQQ\FKNODV\ILNDWRUyZ-HJR]DVWRVRZDQLDQLH

RJUDQLF]DM VL  GR ]DJDGQLH ]ZL]DQ\FK ] NODV\ILNDFM 2SLVDOLP\ WX PR*OLZRFL X]XSHá-
niania wzorców (pattern completion

 SR]ZDODMFH Z\NRU]\VWDü PRGHOH 6%0 MDNR SDPL FL

hetero lub 

DXWRDVRFMDF\MQH0RGHOH6%0PR*QDUyZQLH*]DVWRVRZDüGR]DJDGQLHZ\PDJa-

MF\FKZLHORZ\PLDURZHMDSURNV\PDFMLZSURZDG]DMFUy*QHPHWRG\LQWHUSRODFMLSU]\Z\No-
rzystaniu stosowanych metryk.

0DP\QDG]LHM *HEDGDQLDSURZDG]RQHZW\PNLHUXQNXSU]\QLRVGZRMDNLHNRU]\FL=MHd-

QHMVWURQ\EDGDQLDWHSRZLQQ\GRSURZDG]LüGRLQWHJUDFMLLOHSV]HJR]UR]XPLHQLD]ZL]NyZ

background image

20

SRPL G]\ZLHORPDPHWRGDPLLQWHOLJHQFMLREOLF]HQLRZHMZ\UDVWDMF\PL]WHFKQLNUR]SR]Qa-
wania wzorców (pattern recognition), metod statystycznych, uczenia maszynowego, logiki

UR]P\WHMLVLHFLQHXURQRZ\FK=GUXJLHMVWURQ\UR]ZLMDP\RSURJUDPRZDQLHNWyUHGRELHUDMF

QDMEDUG]LHMRGSRZLHGQLPHWRG QDOH*FGRVFKHPDWX6%0GRDQDOL]RZDQ\FKGDQ\FKSo-

ZLQQRGDüUH]XOWDW\VWDW\VW\F]QLHQLHRGUy*QLDOQHRGQDMOHSV]\FKMDNLHPR*QDX]\VNDü3U]y-

F]\Q VWRVXQNRZR QLHZLHONLHM SRSXODUQRFL PHWRG RSDUW\FK QD SRGRELHVWZLH MHVW SU]HGH

ZV]\VWNLPEUDNSRZV]HFKQLHGRVW SQHJRRSURJUDPRZDQLD
3RG]L NRZDQLD Za wsparcie finansowe w ramach grantu QU  7)   MHVWHP\

ZG]L F]QL.RPLWHWRZL%DGD1DXNRZ\FK-HVWHP\UyZQLH*ZG]L F]QL5DIDáRZLAdamcza-

NRZL]DGRVWDUF]HQLHZ\QLNyZGRW\F]F\FKX]XSHáQLDQLDGDQ\FK]DSRPRFVLHFL)60RUD]

Z\NRQDQLHREOLF]HSRUyZQDZF]\FK]DSRPRFSDNLHWX:(.$

Literatura

Breiman L., The heuristics of instability in model selection. Annals of Statistics 24 (1996)
2350-2383

Breiman L., Bias-Variance, regularization, instability and stabilization. W: C. Bishop, ed.
Neural Networks and Machine Learning. Springer 1998

Daelemans W., Zavrel J., Ko van der Sloot, Antal van den Bosh, (1998) TiMBL: Tilburg
Memory Based Learner, version 1.0, Reference Guide, ILK Technical Report – ILK 98-03,
http://ilk.kub.nl/~ilk/papers/ilk9803.ps.gz

Duan, Q., V.K. Gupta i S. Sorooshian, (1993): A Shuffled Complex Evolution Approach for
Effective and Efficient Global Minimization
, Journal of Optimization Theory and Applica-
tions, 76 (1993) 501-521

Duch W, Adamczak R, Jankowski N. (!997): Initialization of adaptive parameters in density
networks
, Third Conference on Neural Networks and Their Applications, Kule, 

3D(G]LHUQLN

1997, pp. 99-104

Duch W., Adamczak R., Jankowski N. (1997a): New developments in the Feature Space
Mapping model
, 3

rd

 Conference on Neural Networks and Their Applications, Kule, 

3D(d-

ziernik 1997, pp. 65-70;

Duch W, Adamczak R, (1998): Statistical methods for construction of neural networks. Inter-
national Conference on Neural Information Processing, ICONIP’98, Kitakyushu, Japonia,

3D(dziernik 1998, Vol. 2, pp. 629-642
Duch W i Jankowski N, (1999): Survey of neural transfer functions, Neural Computing Sur-
veys 2 (1999) 163-213

Duch W., Diercksen G.H.F., (1995): Feature Space Mapping as a universal adaptive system.
Computer Physics Communications 87 (1995) 341-371
'XFK : L *UXG]LVNL .    Weighting and selection of features in Similarity Based
Methods
. Intelligent Information Systems 

9,,,8VWURPoland, 14-18.06.1999, pp. 32-36

'XFK:L*UXG]LVNL. D Search and global minimization in similarity-based meth-
ods.
 International Joint Conference on Neural Networks (IJCNN’99), Washington, July 1999,
praca #742

Duch W. i Korczak J.: Optimization and global minimization methods suitable for neural
networks
, Neural Computing Surveys 

Z\VáDQH

background image

21

Fernandez M., Hernandez C., (1999): Neural networks input selection by using the training
set, 
Proc. of the 1999 IEEE International Joint Conference on Neural Networks, Washington
D.C., 1999 (w druku)

Gupta H.V., Hsu K. i S. Sorooshian, Superior training of artificial neural networks using
weight-space partitioning
, W Proc. of International Conference on Neural Networks, pp.
1919-1923, Houston, USA, 1997

Hayashi Y., Imura A., Yoshida, K. (1990): Fuzzy neural expert system and its application to
medical diagnosis
, w: 8

th

 International Congress on Cybernetics and Systems, New York City

1990, pp. 54-61

Ingberg L., (1996) Adaptive simulated annealing (ASA): Lessons learned, J. Control and Cy-
bernetics25 (1996) 33-54

Laaksonen J. i E. Oja (1996), Classification with Learning k-Nearest Neighbors. W: Proc. of
ICNN’96, Washington, D.C., June 1996, pp. 1480-1483

Merz C.J., Using Correspondence Analysis to Combine Classifiers. Machine Learning 36
(1999) 33-58

Mertz C.J., Murphy P. M., UCI repository,
http://www.ics.uci.edu/pub/machine-learning-databases

Michie D., Spiegelhalter D.J., Taylor C.C., Machine learning, neural and statistical classifi-
cation,
 Elis Horwood, London 1994

Neal R.M, Bayesian Learning in Neural Networks. Springer Lecture Notes in Statistics vol.
118 (1996)

Nelder, J.A., and Mead, R., Computer Journal 7 (1965) 308-313

Rubin D.B., Multiple imputation after 18+ years. J. of the American Statistical Association
91 (1996) 473-489

Rohwer R. i Morciniec M., A Theoretical and Experimental Account of n-tuple Classifier
Performance, 
Neural Computation 8 (1996) 657-670

Wilson D.R. i Martinez T.R., Improved Heterogeneous Distance Functions, Journal of Artifi-
cial Intelligence Research  6 (1997) 1-34