1
Ocena jakoœci kompresowanych stratnie obrazów
Ocena jakoœci obrazów rekonstruowanych na podstawie reprezentacji utworzonej w procesie
stratnej kompresji jest zagadnieniem wieloaspektowym, silnie zale¿nym od konkretnej aplikacji (klasy
obrazów i sposobów ich wykorzystania), a przy tym jego waga roœnie wraz z rozwojem coraz
doskonalszych technik kompresji w rozszerzaj¹cej siê gamie zastosowañ. Nale¿y przy tym dodaæ, ¿e
dla wielu bardziej wymagaj¹cych zastosowañ zagadnienie to nie jest jeszcze w pe³ni rozwi¹zane.
Dobrym przyk³adem jest ocena jakoœci kompresowanych stratnie obrazów medycznych. Zastosowanie
wyrafinowanych metod kompresji nieodwracalnej, daj¹cych znaczne oszczêdnoœci czasowo-sprzêtowe,
jest tutaj praktycznie niemo¿liwe, gdy¿ spotyka siê z ostrym sprzeciwem wielu lekarzy lub te¿ w wielu
krajach (np. w USA) niedopuszczalne przez prawo jest wykorzystanie w diagnozie obrazów
rekonstruowanych po stratnej kompresji. Nie ma bowiem wystarczaj¹co pewnych metod oceny jakoœci
tych obrazów oraz okreœlenia wartoœci dopuszczalnych stopni kompresji, tj. granicznych wartoœci
powy¿ej których zniekszta³cenia w obrazie rekonstruowanych osi¹gaj¹ poziom niemo¿liwy do
zaakceptowania z punktu widzenia konkretnych zastosowañ. W zastosowaniach stratnych metod do
kompresji obrazów medycznych wartoœci dopuszczalnych stopni kompresji zale¿¹ silnie od typu
systemu obrazowania, w którym powstaje konkretny obraz, oraz od rodzaju badania diagnostycznego.
Warunkiem koniecznym akceptowalnoœci jest tutaj zachowanie diagnostycznej wiarygodnoœci
rekonstruowanego obrazu.
W tym krótkim omówieniu zaprezentowano ogóln¹ charakterystykê metod oceny jakoœci, a
nastêpnie na przyk³adzie problemu kompresji obrazów medycznych ró¿nych modalnoœci przedstawiono
praktyczne zastosowanie tych metod i dalsz¹ perspektywê ich rozwoju. Zdecydowana wiêkszoœæ
prezentowanych zagadnieñ dotyczy znacznie szerszego krêgu zastosowañ. Analiza cech obrazów z
punktu widzenia efektywnoœci ich kompresji jest w wielu aspektach analogiczna do rozwa¿añ
dotycz¹cych dok³adnoœci odwzorowania przedmiotu obrazowania w tworzonym obrazie. Obraz ten jest
jedynie pewnym przybli¿eniem prezentowanych obiektów, obarczonym szeregiem zniekszta³ceñ
powstaj¹cych w czasie ca³ego procesu konstruowania obrazu. Przedstawione metody oceny jakoœci
obrazów rekonstruowanych po stratnej kompresji mog¹ byæ niekiedy wykorzystane do oceny jakoœci
systemów obrazowania (obrazem odniesienia s¹ wówczas ró¿nego typu fantomy).
Istotn¹ spraw¹ we wszelkich rozwa¿aniach na temat sposobów oceny jakoœci
rekonstruowanych obrazów jest jakoœæ obrazu oryginalnego. Trzeba pamiêtaæ o tym, ¿e ka¿dy system
obrazowania ma swoje ograniczenia, nie wszystkie cechy prezentowanych obiektów s¹ odzwierciedlane
w rejestrowanych obrazach. Ka¿dy system obrazowania mo¿na opisaæ funkcj¹ przenoszenia (czasowo-
czêstotliwoœciow¹), która stanowi kompletny opis danego systemu [1]. Przyk³adowo funkcja ta okreœla
czêstotliwoœæ graniczn¹, a obiekty sk³adaj¹ce siê z czêstotliwoœci wy¿szych (w analizie fourierowskiej)
mog¹ byæ w ogóle nie reprezentowane w zarejestrowanym obrazie. Ponadto wystêpuje w tych obrazach
szereg dodatkowych elementów (zniekszta³ceñ), które nie maj¹ nic wspólnego z przedstawianymi
obiektami. A skoro obraz oryginalny jest zniekszta³cony, to po pierwsze mo¿na stosuj¹c ró¿ne techniki
przetwarzania w wielu przypadkach poprawiæ jego jakoœæ, a po drugie sam proces stratnej kompresji,
bêd¹cy pewnego rodzaju filtracj¹, nie musi oznaczaæ automatycznie pogorszenia jakoœci obrazu
oryginalnego. £atwo mo¿na sobie wyobraziæ sytuacjê, w której obraz rekonstruowany jest lepszej
jakoœci od orygina³u, bo w stratnej kompresji usuniêto wysokoczêstotliwoœciowe pasmo szumów,
znacznie pogarszaj¹ce jakoœæ obrazu oryginalnego. Formu³uj¹c wiêc problem oceny jakoœci obrazów
rekonstruowanych, w³aœciwie powinniœmy porównywaæ ten obraz z domniemanym idealnym obrazem
prezentowanych struktur (co jest oczywiœcie w praktyce szalenie trudne, czy wrêcz niemo¿liwe), a
przynajmniej pamiêtaæ, ¿e podlegaj¹cy kompresji obraz oryginalny jest równie¿ zniekszta³cony, a pewne
jego w³asnoœci mog¹ nawet ulec poprawie podczas nieodwracalnej jego kompresji (co jest mo¿liwe,
szczególnie przy projektowaniu i przeprowadzaniu subiektywnej oceny jakoœci).
1. Metody oceny jakoœci kompresowanych stratnie obrazów
W przypadku stratnych algorytmów kompresji pojêcie efektywnoœci w znaczeniu przede
wszystkim mo¿liwie ma³ej œredniej bitowej czy du¿ego stopnia kompresji musi wystêpowaæ
2
nieroz³¹cznie w kontekœcie wnoszonych strat. Straty te rozumiane s¹ przewa¿nie jako zniekszta³cenie
danych rekonstruowanych w stosunku do zbioru danych oryginalnych, przy czym miara tych
zniekszta³ceñ mo¿e byæ ró¿na. St¹d te¿ definiuj¹c efektywnoœæ stratnej metody kompresji trzeba podaæ
obok przyk³adowo uzyskanego stopnia kompresji tak¿e odpowiadaj¹cy mu poziom zniekszta³ceñ (np.
jako b³¹d œredniokwadratowy). Porównywanie skutecznoœci ró¿nych algorytmów mo¿e siê odbywaæ na
poziomie œrednich bitowych uzyskanych przy tej samej wartoœci zniekszta³cenia.
Mo¿na podejmowaæ problem efektywnoœci na ró¿ne sposoby. Najpierw buduje siê coraz
doskonalsze modele Ÿróde³ danych oraz miary zniekszta³ceñ, przy pomocy których mo¿na teoretycznie
wyznaczaæ granicê efektywnoœci kompresji metod stratnych - teoria stopnia zniekszta³ceñ. Potem coraz
doskonalsze miary zniekszta³ceñ wykorzystuje siê do oceny skutecznoœci technik stratnych, które w
fazie konstrukcji wykorzystuj¹ czêsto ró¿ne modele statystyczne przybli¿aj¹ce kompresowane zbiory
danych.
1.1. Stopieñ zniekszta³ceñ kompresowanego obrazu (Rate-Distortion Theory).
Graniczna wartoœæ stopnia kompresji informacji zawartej w obrazie wyznaczana przez entropiê
Ÿród³a modeluj¹cego dane obrazowe ma zastosowanie jedynie w przypadku bezstratnych metod
kompresji. W przypadku kompresji stratnej pojawia siê równie¿ pytanie o wartoœæ graniczn¹ mo¿liwych
do uzyskania stopni kompresji danego obrazu przy poziomie zniekszta³ceñ nie przekraczaj¹cym
pewnego poziomu. OdpowiedŸ na to pytanie adresowane jest w pierwszej kolejnoœci do ga³êzi teorii
informacji rozwa¿aj¹cej stopieñ zniekszta³ceñ Ÿróde³ informacji (rate - distortion theory). Teoria ta w
zastosowaniu do zagadnieñ kompresji zakreœla teoretyczne granice efektywnoœci technik stratnej
rekonstrukcji danych w oparciu o pewien model Ÿród³a informacji oraz okreœlone kryterium dok³adnoœci.
Pozwala na wyznaczenie zale¿noœci miary wielkoœci kompresji (najczêœciej œredniej bitowej) w funkcji
przyjêtej miary zniekszta³ceñ (rate-distortion function), oznaczonej jako BR(D), która posiada dwie
bardzo istotne w³asnoœci:
•
dla danego poziomu zniekszta³ceñ D, mo¿liwym jest znalezienie algorytmu kodowania w stopniu
dowolnie bliskim BR(D) i œrednim poziomie zniekszta³ceñ dowolnie bliskim D;
•
niemo¿liwym jest znalezienie kodu, który pozwala odtworzyæ oryginalne Ÿród³o informacji ze
zniekszta³ceniem D lub mniejszym i stopniem kompresji poni¿ej BR(D).
BR(D) jest wypuk³¹ , ci¹g³¹ i monotonicznie malej¹c¹ funkcj¹ D (rys. 3). Zasadniczo mo¿na stwierdziæ,
¿e bardziej wyrafinowane algorytmy kompresji, które lepiej modeluj¹ statystykê Ÿród³a osi¹gaj¹
efektywnoœæ bli¿sz¹ granicy BR(D). Przedstawiaj¹ to dwie funkcje opisuj¹ce skutecznoœæ kompresji dwu
ró¿nych technik na rys. 1.
Zastosowanie tej teorii do praktycznych zastosowañ w kompresji obrazów nie jest jednak
³atwe. Zagadnienie staje siê matematycznie niezbyt skomplikowane, gdy Ÿród³o jest modelowane jako
DMS (Ÿród³o bez pamiêci, gdzie prawdopodobieñstwo wyst¹pienia ka¿dego symbolu z alfabetu
opisuj¹cego Ÿród³o nie zale¿y od kontekstu) oraz miara zniekszta³cenia w punktach nie zale¿y od
otoczenia tych punktów, a kryterium formu³owane jest z wykorzystaniem b³êdu œredniokwadratowego
lub œredniego b³êdu bezwzglêdnego. W przypadkach bardziej skomplikowanych rozwi¹zania
poszukiwane s¹ metodami numerycznymi.
3
Zniekszta³cenia (D)
Œrednia bitowa (BR)
Bardziej z³o¿ona technika kompresji (z lepszym modelem
kompresowanego zbioru danych)
Prosta technika kompresji
Funkcja stopnia zniekszta³ceñ - BR(D) - dla
Ÿród³a idealnego
Rys.1. Przyk³ad krzywej okreœlaj¹cej wielkoœæ kompresji w funkcji poziomu zniekszta³ceñ - BR(D) oraz
przyk³adowe krzywe okreœlaj¹ce skutecznoœæ kompresji dwu stratnych kompresorów.
Takie rozwi¹zanie w przypadku obrazów medycznych, jak te¿ wielu innych, jest jednak
nieu¿yteczne ze wzglêdu na du¿¹ korelacjê wartoœci poszczególnych pikseli. Podobnie miara
zniekszta³cenia powinna tak¿e uwzglêdniaæ otoczenie poszczególnych pikseli. Próbuje siê stosowaæ
rozwi¹zania oparte na Gaussowskim Ÿródle z miar¹ zniekszta³ceñ opart¹ na wa¿onym b³êdzie
kwadratowym, czy te¿ modelowanie obrazu jako dwuwymiarowe Ÿród³o Gaussa-Markowa ze
wspó³czynnikami korelacji bliskimi 1 otrzymuj¹c znacznie lepsze przybli¿enie obrazu. Jednak okreœlenie
R(D) dla modelu Ÿród³a, które wiernie przybli¿a obraz (medyczny b¹dŸ naturalny) oraz dla miary
zniekszta³ceñ, która dok³adnie uwzglêdnia wizualne, czy diagnostyczne kryteria oceny jakoœci obrazu
pozostaje nadal frapuj¹cym problemem badawczym.
Ogóln¹ postaæ wyra¿enia okreœlaj¹cego wartoœæ zniekszta³cenia przy statystycznym
modelowaniu Ÿród³a informacji X (opisuj¹cego kompresowany zbiór danych) oraz modelu
zrekonstruowanej informacji Y (opisuj¹cego zrekonstruowany zbiór danych) mo¿na przedstawiæ
nastêpuj¹co:
D
d x y p x p y x
i
j
N
j
i
j
i
i
N
=
=
−
=
−
∑
∑
( , ) ( ) ( / )
0
1
0
1
2
1
N
N
1
2
i
oznaczaj¹ liczbê symboli w alfabecie Ÿróde³ X i Y,
p x
i
( )
4
Przyjmuj¹c jednak, ¿e dla rozpatrywanej klasy algorytmów alfabet modelu Y jest jednakowy
(mo¿e byæ taki sam jak Ÿród³a X) mo¿na stwierdziæ, ¿e zniekszta³cenie D jest funkcj¹ jedynie zbioru
prawdopodobieñstw warunkowych:
D D p y x
j
i
=
({ ( / )})
.
1.2. Miary jakoœci kompresowanych stratnie obrazów
Obraz uzyskany w wyniku przetwarzania obrazów jest "dobrej" jakoœci zazwyczaj wtedy, gdy
wed³ug naszej percepcji wzrokowej wygl¹da przyjemnie (bez rzucaj¹cych siê w oczy zniekszta³ceñ),
b¹dŸ te¿ jest u¿yteczny do pewnych zastosowañ. Nie istnieje niestety jedna skuteczna miara
pozwalaj¹ca okreœliæ jakoœæ odtwarzanego obrazu w ka¿dym przypadku, stosowane s¹ natomiast trzy
zasadnicze metody okreœlania jakoœci:
- obliczeniowo obiektywne miary zniekszta³ceñ (miary automatyczne) - wielkoœci skalarne b¹dŸ
wektorowe wyznaczane automatycznie;
- subiektywne miary jakoœci (miary obserwacyjne) - psychowizualne testy porównawcze ze
wskazywaniem obrazów o wy¿szej jakoœci lub te¿ klasyfikacja w pewnej skali ocen (wyra¿onej
najczêœciej liczbowo);
- miary oparte na symulacji i analizie statystycznej (miary symulacyjne), najbardziej z³o¿one,
dotycz¹ konkretnej aplikacji - mo¿liwie wierna symulacja rzeczywistych warunków analizy obrazów
i wnikliwa analiza statystyczna odpowiednio opracowanych wyników psychowizualnych testów
klasyfikacyjnych.
Obiektywne miary zniekszta³ceñ i czêœciowo miary subiektywne stosowane s¹ zazwyczaj do
porównania efektywnoœci kompresji ró¿nych technik, podczas gdy metody symulacji i analizy
statystycznej (SiAS) oraz bardziej rozbudowane miary subiektywne s³u¿y³y do okreœlania
dopuszczalnych stopni kompresji.
1.2.1. Obiektywne miary jakoœci
Wobec szeregu oczywistych wad subiektywnych miar jakoœci obrazu ci¹gle istnieje ogromne
zainteresowanie rozwojem obiektywnych miar iloœciowych, w formie zarówno liczbowej jak i graficznej,
zbie¿nych z psychowizualn¹ ocen¹ jakoœci. B³¹d œredniokwadratowy (MSE), najpopularniejsza z miar
obliczeniowych, nie najlepiej koreluje z subiektywn¹ ocen¹ jakoœci. Niewielkie przestrzenne
przesuniêcie obrazu powoduje du¿e liczbowe zniekszta³cenie MSE, przy praktycznie zupe³nym braku
wizualnego zniekszta³cenia. Odwrotnie, uœredniaj¹ca cecha tego kryterium powoduje, ¿e nawet
znaczne artefakty pojawiaj¹ce siê w obszarach istotnych diagnostycznie o niewielkich rozmiarach,
mog¹ mieæ bardzo niewielki wp³yw na wartoœæ MSE.
Obiektywna obliczeniowo miara jakoœci winna mieæ trzy podstawowe cechy:
•
³atwoœæ obliczeniow¹,
•
du¿¹ korelacjê z jakoœci¹ perceptualn¹ (psychowizualna ocena jakoœci przez obserwa-torów),
•
podatnoœæ w analizie (bogactwo narzêdzi do analizy oraz ³atwoœæ interpretacji).
Cecha podatnoœci w analizie daje mo¿liwoœæ prostego powi¹zania optymalizacji procesu
przetwarzania obrazu z perceptualnie najlepsz¹ jakoœci¹ wynikowych obrazów. Przyk³adem jest
popularnoœæ metod œredniokwadratowych, która wi¹¿e siê g³ównie z bogactwem teorii oraz metod
numerycznych dostêpnych w analizie i syntezie systemów, które zazwyczaj s¹ optymalizowane pod
k¹tem minimalizacji b³êdu œredniokwadratowego. Jednoczeœnie przez proste wa¿enie lokalnych b³êdów
w danej dziedzinie (najlepiej czêstotliwoœciowej) mo¿na wprowadziæ model ‘korekcji psychowizualnej’
takiej miary. Najlepszym rozwi¹zaniem by³oby posiadanie miary odpowiadaj¹cej subiektywnym
kryteriom oceny, która mog³aby byæ w³¹czona w fazê projektowania techniki kompresji. Wówczas
mo¿na by np. zaprojektowaæ proces kwantyzacji i przydzia³u bitów poszczególnym wspó³czynnikom
transformaty ze wzglêdu na ich psychowizualne znaczenie, albo zastosowaæ - jako element wstêpny
kompresji - filtracjê wzmacniaj¹c¹ istotne pasma informacji zawartej w obrazie.
Do najczêœciej stosowanych obiektywnych miar jakoœci obrazów nale¿¹:
1)
Œrednia ró¿nica:
AD
f x y
f x y
M N
y
N
x
M
=
−
⋅
=
=
∑
∑
[ ( , )
( , )]/
^
1
1
5
2)
ZawartoϾ strukturalna (structual content):
AC
f x y
f x y
y
N
x
M
y
N
x
M
=
=
=
=
=
∑
∑
∑
∑
[ ( , )] /
[ ( , )]
^
2
2
1
1
1
1
3)
Znormalizowana korelacja skroœna (normalized cross-correlation):
NK
f x y f x y
f x y
y
N
x
M
y
N
x
M
=
⋅
=
=
=
=
∑
∑
∑
∑
( , )
( , ) /
[ ( , )]
^
2
1
1
1
1
4)
JakoϾ korelacji (correlation quality):
CQ
f x y f x y
f x y
y
N
x
M
y
N
x
M
=
⋅
=
=
=
=
∑
∑
∑
∑
( , )
( , ) /
( , )
^
1
1
1
1
5)
Maksymalna ró¿nica (maximum difference), zwana te¿ szczytowym b³êdem bezwzglêdnym (peak
absolute error-PAE):
MD
Max f x y
f x y
=
−
{| ( , )
( , )|}
^
6)
WiernoϾ obrazu (image fidelity):
IF
f x y
f x y
f x y
y
N
x
M
y
N
x
M
= −
−
=
=
=
=
∑
∑
∑
∑
1
6
14) Stosunek sygna³u do szumu (signal to noise ratio):
SNR
f x y
f x y
f x y
y
N
x
M
y
N
x
M
=
−
=
=
=
=
∑
∑
∑
∑
10
10
2
2
1
1
1
1
log (
[ ( , )] /
[ ( , )
( , )] )
^
15) Szczytowy stosunek sygna³u do szumu (peak signal to noise ratio):
PSNR
f x y
f x y
f x y
y
N
x
M
y
N
x
M
=
−
=
=
=
=
∑
∑
∑
∑
10
10
2
2
1
1
1
1
log (
[max{ ( , )}] /
[ ( , )
( , )] )
^
,
przy czym wartoϾ max{ ( , )}
f x y jest zwykle sta³a (niezale¿na od obrazu) i wynosi np. 255 dla
danych 8-mio bitowych
16) Wykresy Hosaka: graficzna miara jakoœci obrazów. Powierzchnia oraz kszta³t wykresów okreœlaj¹
rodzaj oraz stopieñ degradacji jakoœci rekonstruowanego obrazu.
17) Histogram: inna graficzna miara jakoœci obrazu. Przedstawia dyskretny rozk³ad
prawdopodobieñstwa wartoœci pikseli w ró¿nicowym obrazie.
f(x,y) i
f x y
^
( , )
oznaczaj¹ wartoœci pikseli odpowiednio obrazu oryginalnego i zrekonstruowanego.
Systemy HVS.
Próbowano na ró¿ne sposoby (wykorzystuj¹c wiedzê o ludzkich zdolnoœciach
psychowizualnych) stworzyæ metodê oceny stopnia i rodzaju zniekszta³ceñ rekonstruowanego obrazu o
w³asnoœciach zbli¿onych do uk³adu percepcji wzrokowej cz³owieka, tzw. systemy HVS (human visual
system). Jako miary wykorzystuje siê wówczas najczêœciej ró¿ne odmiany normy Minkowskiego z
liniowymi wspó³czynnikami, odpowiadaj¹cymi w³asnoœciom HVS. Mo¿na tak¿e dokonaæ transformacji
obrazu oraz liniowego wa¿enia w dziedzinie przestrzennych czêstotliwoœci i w ten sposób uwzglêdniæ
perceptualne znaczenie zniekszta³ceñ.
Przyk³adem jednego z modeli HVS jest zaproponowany przez Nilla model zwi¹zany z
kosinusow¹ transformat¹ o nastêpuj¹co zdefiniowanych funkcjach:
H r
e
r
e
r
r
r
( )
.
,
,
.
.
log
log
|]
=
<
≥
−
−
0 05
7
7
0 554
10
10
2 3
9[|
9
dla
dla
,
gdzie
r
u
v
=
+
(
)
/
2
2 1 2
, a u oraz v s¹ wspó³rzêdnymi w dziedzinie transformaty.
Wykorzystanie modelu HSV w konstruowaniu obiektywnych miar jakoœci mo¿e przynieœæ
niekiedy poprawê korelacji miary z wra¿eniem obserwatorów. Modyfikacja np. miary NMSE
wykorzystuj¹ca model Nilla przedstawia siê nastêpuj¹co:
NMSE
H u
v
k u v
k u v
H u
v
k u v
v
N
u
M
v
N
u
M
=
+
⋅
−
+
⋅
=
=
=
=
∑
∑
∑
∑
{(
) } [ ( , )
( , )] /
[ {(
) } ( , )]
/
^
/
2
2 1 2 2
2
2
2 1 2
2
1
1
1
1
gdzie k(u,v) i
k u v
^
( , )
- wspó³czynniki w dziedzinie kosinusowej transformaty przed i po kwantyzacji.
Bardzo trudnym zadaniem jest wiêc wiarygodne porównanie jakoœci rekonstruowanych
obrazów wy³¹cznie przy pomocy metody obiektywnej. Pojedyncza wartoœæ skalarna nie mo¿e opisaæ
szeregu ró¿norodnych zniekszta³ceñ. Z kolei graficzne miary jakoœci (histogram obrazu ró¿nicowego,
wykresy Hosaka [2], miara Eskicioglu [3] i wiele innych) pozwalaj¹ lepiej rozró¿niæ zarówno rodzaj
zniekszta³ceñ, jak te¿ ich wielkoœæ i w po³¹czeniu z miarami numerycznymi mog¹ daæ lepsz¹ wyk³adniê
jakoœci, s¹ jednak du¿o bardziej czasoch³onne i trudne do porównañ.
Poniewa¿ ocena jakoœci obrazów przy pomocy miar obiektywnych wykazuje znacz¹cy poziom
korelacji z ocen¹ psychowizualn¹, mo¿e byæ ona wykorzystana do ogólnych porównañ efektywnoœci
7
stratnych metod kompresji obrazów medycznych, przy czym w kwestiach bardziej szczegó³owych
konieczne jest wspomaganie tej metody ocen¹ subiektywn¹.
1.2.2. Miary obserwacyjne (subiektywne)
Poniewa¿ ostatecznym u¿ytkownikiem obrazów s¹ ludzie, mo¿na skonstruowaæ sposób oceny
jakoœci wykorzystuj¹cy opinie obserwatorów. Ka¿da ludzka opinia jest jednak zagro¿ona pewnym
subiektywizmem, tote¿ kluczowym zadaniem przy opracowywaniu miar obserwacyjnych jest
minimalizacja czynnika subiektywizmu (wynikaj¹cego z samej natury tych metod) zwi¹zanego z
decyzjami poszczególnych osób. Z drugiej jednak strony to specjaliœci w danej dziedzinie
wykorzystuj¹cy rozpatrywane zbiory danych wiedz¹ najlepiej, co decyduje o jakoœci obrazu, jakie cechy
obrazu s¹ brane pod uwagê przy jego analizie i to oni potrafi¹ najlepiej sformu³owaæ kryteria
przydatnoœci obrazów oraz wed³ug nich przeprowadziæ proces oceny jakoœci.
W przeprowadzanych testach wykorzystuje siê przewa¿nie dwie grupy obserwatorów:
ekspertów z danej dziedziny lub te¿ grupê przygodnych ludzi, zupe³nie przypadkow¹. Mo¿na te¿ do
przeprowadzenia testu zaprosiæ grupê specjalistów od analizy obrazów, znaj¹cych ogólne czynniki,
które decyduj¹ o jakoœci obrazu.
Subiektywna ocena jakoœci rekonstruowanych obrazów mo¿e byæ przeprowadzana na wiele
sposobów. Istniej¹ dwa zasadnicze rodzaje miar subiektywnych:
•
miary absolutne (bezwzglêdne): obserwatorzy stosownie do jakoœci obrazu umieszczaj¹ go w
odpowiedniej kategorii wed³ug przyjêtej skali ocen,
•
miary porównawcze: obserwatorzy klasyfikuj¹ obrazy z danej grupy na podstawie wzajemnych
porównañ jakoœci poszczególnych obrazów tej grupy.
A:
5.
Wspania³y
4. Dobry
3. Zadawalaj¹cy (mo¿liwy)
2. S³aby
1. Nie satysfakcjonuj¹cy (z³y)
C:
1. Niezauwa¿alne (niedostrzegalne)
2. Lekko zauwa¿alne (dostrzegalne)
3. WyraŸnie zauwa¿alne (dostrzegalne),
ale tylko lekkie os³abienie
4. Os³abienie nie nieprzyjemne
5. Nieco nieprzyjemne
6. WyraŸnie nieprzyjemne
7. Ekstremalnie nieprzyjemnie (niew³aœciwe)
E:
5. Niedostrzegalne
4. Dostrzegalne ale nie dokuczliwe
3. Nieco dokuczliwe
2. Dokuczliwe
1. Bardzo dokuczliwe
B:
7. Najlepiej
6. WyraŸnie powy¿ej œredniej
5. Nieznacznie powy¿ej œredniej
4. Œrednio
3. Nieznacznie poni¿ej œredniej
2. WyraŸnie poni¿ej œredniej
1. Najgorzej
D:
3. Znacznie lepiej
2. Lepiej
1. Nieznacznie lepiej
0. Tak samo
-1. Nieznacznie gorzej
-2. Gorzej
-3. Znacznie gorzej
F:
10, 9 Bardzo dobry
8, 7
Dobry
6, 5, 4 Zadawalaj¹cy
3, 2
Z³y
1, 0
Bardzo z³y
Rys. 2. Przyk³adowe skale ocen jakoœci obrazów stosowane w psychowizualnych testach miar
subiektywnych.
8
Dla miar absolutnych stosowana skala ocen winna zawieraæ skalê liczbow¹ i skojarzony z
ka¿d¹ liczb¹ opis s³owny, który mo¿liwie trafnie wyrazi ró¿ne kategorie mo¿liwych ocen obrazów
danego typu (w zale¿noœci od aplikacji). W odpowiednio przygotowanych warunkach zbiór obrazów jest
prezentowany obserwatorom, którzy oceniaj¹ je w pewnej skali (rys. 2).
Sposób prezentacji obrazów winien byæ tak zaprojektowany, by zminimalizowaæ wp³yw
wszelkich czynników zmniejszaj¹cych obiektywnoœæ ocen (efektu uczenia, skojarzeñ podobieñstwa lub
porz¹dku wyœwietlania itd.). Nastêpnie przeprowadzana analiza statystyczna polega najczêœciej na
wyznaczeniu wartoœci œredniej zebranych ocen, tzw. oceny œredniej oraz wariancji zbioru tych¿e
wartoœci. Ró¿norodnoœæ rozwi¹zañ dotyczy g³ównie zakresu liczbowego stosowanej skali ocen oraz
opisu ka¿dego poziomu skali (s¹ nieraz stosowane skale bez opisu s³ownego). W przypadkach
konkretnych aplikacji opis ten mo¿e zawieraæ obok cech psychowizualnej oceny jakoœci obrazu tak¿e
charakterystykê pewnych cech obrazu ,szczególnie istotnych z punktu widzenia np. diagnozy.
Metody porównawcze oceny jakoœci mo¿na podzieliæ na trzy podstawowe kategorie:
•
porównywanie z orygina³em,
•
porównywanie dwóch obrazów,
•
porównywanie wielu obrazów.
Niektóre oceny s¹ dokonywane poprzez porównanie przez obserwatora obrazów
zniekszta³conych po stratnej kompresji z orygina³em i okreœlenie stopnia podobieñstwa lub
niepodobieñstwa tych obrazów w pewnej skali mo¿liwych ocen. Przyk³adowo, radiolodzy mog¹ oceniaæ
jakoœæ rekonstruowanych obrazów w skali 0-100 poprzez porównanie ich z jednoczeœnie
obserwowanym orygina³em, przy czym 0 oznacza zupe³n¹ nieakceptacjê obrazu do celów klinicznych,
natomiast wartoœæ 100 - identycznoœæ z orygina³em.
Porównywanie jakoœci dwóch obrazów jednoczeœnie obserwowanych i podjêcie decyzji
klasyfikacyjnej dla tej pary obrazów jest podstaw¹ drugiej grupy metod porównawczych. Przyk³adowo
rozpatrzmy grupê piêciu obrazów np. skompresowanych w tym samym stopniu piêcioma ró¿nymi
technikami, którym przypisano losowo kolejne litery A, B, C, D, E. Proces klasyfikacji rozpoczyna siê od
porównania jakoœci obrazów A i B. Za³ó¿my, ¿e obserwator ustala jako w³aœciw¹ kolejnoœæ BA, czyli ¿e
obraz z literk¹ B jest wy¿szej jakoœci ni¿ A. Nastêpnie prezentowane mu s¹ jednoczeœnie obrazy A i C
i ustala on kolejnoœæ powiedzmy CA. W tym przypadku nale¿y przeprowadziæ teraz porównanie
obrazów B i C. Przyjmijmy, ¿e obserwator zdecydowa³ BC, czyli ostateczna klasyfikacja jest
nastêpuj¹ca: BCA. Teraz analizowana jest jakoœæ obrazu D poprzez kolejne porównanie z obrazami,
zaczynaj¹c od obrazów o ni¿szej jakoœci i nastêpuje ewentualne przesuwanie obrazu D w górê
klasyfikacji itd.
Innym rozwi¹zaniem jest schemat klasyfikacji zbioru obrazów w kolejnoœci od obrazu o
najwy¿szej jakoœci do obrazu o najni¿szej jakoœci przy jednoczesnej obserwacji ca³ego zbioru obrazów.
W przypadku, gdy ró¿nice pomiêdzy obrazami s¹ praktycznie niezauwa¿alne, klasyfikacja bêdzie doœæ
przypadkowa, natomiast jednoznaczne decyzje wydzielaj¹ce obrazy o wyraŸnie zdegradowanej jakoœci
s¹ wskaŸnikiem przekroczenia progu dopuszczalnoœci strat.
1.2.3.
Miary oparte na symulacji i analizie statystycznej
Najczêœciej metody oceny jakoœci nale¿¹ce do tej grupy oparte s¹ na analizie charakterystyki
dzia³ania obserwatora ROC (scharakteryzowan¹ w punkcie 2.3.3), która wywodzi siê z teorii detekcji
sygna³u. Eksperci obserwuj¹cy odpowiednio przygotowane obrazy dokonuj¹ ich oceny, która jest
zazwyczaj oparta na detekcji pewnych cech czy lokalnych w³asnoœci obrazu. Wyniki ich binarnych
decyzji (jest lub nie) dla wielu testowanych obrazów (dla wiarygodnej statystyki przeprowadza siê
zazwyczaj przynajmniej sto takich decyzji) nanoszone s¹ w postaci punktów na charakterystyce ROC,
przy czym ka¿dy punkt wyra¿a prawdopodobieñstwo prawdziwej i fa³szywej decyzji kolejnego
specjalisty. Wykorzystywane s¹ te¿ czêsto wielostopniowe skale ocen. Przyk³adowo w skali
piêciostopniowej kolejnym stopniom odpowiada nastêpuj¹cy opis s³owny: pewna cecha jest
zdecydowanie obecna, prawdopodobnie obecna, mo¿e obecna, prawdopodobnie nieobecna lub te¿
definitywnie nieobecna. Wówczas wyra¿one ju¿ w kategoriach prawdopodobieñstwa poszczególne
decyzje specjalistów pozwalaj¹ lepiej okreœliæ prawdopodobieñstwo decyzji prawdziwej i fa³szywej,
podejmowanych przez danego obserwatora na podstawie obrazów rekonstruowanych.
9
Praktyczny sposób zastosowania metod oceny jakoœci opartych na symulacji, gdzie
podstawowym kryterium jest okreœlenie wiarygodnoœci diagnostycznej rekonstruowanych obrazów na
zadawalaj¹cym poziomie przedstawiono w nastêpnym rozdziale.
2. Ocena wiarygodnoœci diagnostycznej obrazów medycznych
Podstawowym problemem w ocenie przydatnoœci stratnych technik kompresji jest du¿a
trudnoœæ w ocenie rodzaju i iloœci zniekszta³ceñ w rekonstruowanych obrazach. Przy stratnej kompresji
obrazów medycznych szczególnie wa¿ne jest okreœlenie jakoœci, a przede wszystkim wiarygodnoœci
diagnostycznej rekonstruowanych obrazów, czyli wiernego odtworzenia wszystkich informacji istotnych
diagnostycznie zawartych w obrazie oryginalnym. Wielu specjalistów-lekarzy wyra¿a siê sceptycznie o
mo¿liwoœci zastosowania tych metod kompresji w medycznych systemach obrazowania i archiwizacji,
g³ównie ze wzglêdu na du¿¹ odpowiedzialnoœæ i ryzyko obni¿enia jakoœci obrazów, a wiêc pogorszenia
warunków diagnozy. St¹d te¿ szczególnie istotne jest opracowanie takich miar wiarygodnoœci
diagnostycznej rekonstruowanych obrazów, które pozwol¹ okreœliæ wyraŸne, bezpieczne granice
dopuszczalnej redukcji informacji z obrazów oryginalnych w celu efektywnej ich archiwizacji i transmisji.
2.1. Charakterystyka klasy obrazów medycznych
Odmienny charakter ró¿nych technik obrazowania w medycynie wp³ywa na parametry
tworzonych obrazów, a tym samym predestynuje te obrazy do mniej lub bardziej oszczêdnej
archiwizacji (czy te¿ sprawniejszej transmisji) lub te¿ decyduje o wyborze ró¿nych technik prezentacji i
poprawy jakoœci tych¿e obrazów.
Sposób konstruowania obrazu decyduje tak¿e o wyborze optymalnych wariantów algorytmów
kompresji, dostarczaj¹c a priori pewnych informacji na temat przetwarzanej klasy obrazów.
2.1.1. Medyczne systemy obrazowania
Obrazy medyczne, tworzone wskutek ró¿norodnych zabiegów technologicznych, umo¿liwiaj¹
specjalistom obserwacjê ró¿nego typu struktur i procesów fizjologicznych zachodz¹cych we wnêtrzu
cia³a ludzkiego. Analiza obrazów s³u¿y podjêciu w³aœciwej diagnozy, a tak¿e planowaniu ewentualnej
terapii. Obrazy medyczne s¹ jakby oknem do ludzkiego cia³a. ¯adne z tych okien nie ukazuje
wszystkiego. Poszczególne metody obrazowania ujawniaj¹ ró¿ne cechy charakterystyczne cia³a
pacjenta. Przyk³adowo badania MRI (magnetic resonance imaging) - tomografii rezonansu
magnetycznego - czy te¿ CT (computed tomography) - rentgenowskiej tomografii komputerowej -
uwidaczniaj¹ g³ównie morfologiê (budowê strukturaln¹) prezentowanych narz¹dów. Z kolei badania
PET (positron emission tomography) - emisyjnej tomografii pozytonowej - czy SPECT (single photon
emission computed tomography) - jednofotonowej tomografii emisyjnej - przede wszystkim ich funkcje
dynamiczne. Badania USG - ultrasonograficzne - pozwalaj¹ natomiast przy pomocy stosunkowo
niedrogiej aparatury oceniæ w³asnoœci zarówno statyczne jak i dynamiczne struktur zbudowanych z
tkanki miêkkiej. Ró¿ne techniki radiografii cyfrowej CR (computed radiography) pozwalaj¹ uzyskaæ
tomograficzne obrazy ró¿nych struktur tkanki kostnej i miêkkiej w postaci cyfrowej o jakoœci czêsto
przewy¿szaj¹cej mo¿liwoœci tradycyjnego zapisu analogowego na filmach.
10
a)
b)
c)
d)
Rys. 3. Przyk³ady badañ z ró¿nych systemów obrazowania w medycynie: a) USG, b) CT, c) MRI, d) CR.
Przyk³adowe obrazy z ró¿nych medycznych systemów obrazowania, pozwalaj¹ce dostrzec
podstawowe ró¿nice co do charakteru prezentowanej informacji diagnostycznej, przedstawia rys. 3.
Piêæ g³ównych elementów wp³ywaj¹cych na proces obrazowania w medycynie to: osoby
pacjenta, operatora systemu i specjalisty-obserwatora, a tak¿e konkretny system obrazowania i sam
obraz. W wielu przypadkach lekarz specjalista, bêd¹cy obserwatorem tworzonych obrazów, jest
jednoczeœnie operatorem systemu. Widocznoœæ cech anatomicznych czy funkcjonalnych zale¿na jest
od w³aœciwoœci systemu obrazowania, jakoœci urz¹dzeñ obrazuj¹cych, algorytmów przetwarzaj¹cych i
prezentuj¹cych rejestrowane dane.
Wiêkszoœæ systemów medycznego obrazowania posiada pewn¹ liczbê wariantowych
rozwi¹zañ, które s¹ dobieranie w zale¿noœci od rodzaju badañ, cech pacjenta, wymagañ specjalisty
dokonuj¹cego diagnozy itp. Mog¹ to byæ wymienne czêœci systemu (ekrany, p³ytki wzmacniaj¹ce,
kolimatory w radiografii, przetworniki w ultrasonografii, czy cewki w tomografii rezonansu
magnetycznego) lub te¿ odpowiednio dobierane wartoœci ró¿nych wielkoœci fizycznych zwi¹zanych z
procesem tworzenia obrazu (wielkoœæ napiêcia na lampie rentgenowskiej, wielkoœæ wzmocnienia
odbieranej wi¹zki ultradŸwiêków w USG, czas echa w MRI, czy te¿ aktywnoœæ radionuklidu w badaniu
scyntygraficznym). Wszystkie te elementy wp³ywaj¹ na jakoœæ obrazu i decyduj¹ o dobrej widocznoœci
prezentowanych struktur wewnêtrznych. Wizualna czu³oœæ systemów medycznego obrazowania zale¿y
wiêc od wielu czynników na drodze od obiektu do oka obserwatora obrazu i mo¿e byæ, za pomoc¹
11
adaptacyjnych metod, optymalizowana w celu jak najlepszego psychowizualnego odbioru
prezentowanych struktur.
Technika formowania obrazów w du¿ym stopniu wp³ywa na ró¿nego typu nadmiarowoœæ
oryginalnej reprezentacji tworzonych obrazów. Parametry systemów obrazowania medycznego mog¹
byæ tak¿e optymalizowane pod k¹tem podatnoœci tworzonych obrazów na kompresjê zwiêkszaj¹c
efektywnoœæ metod archiwizacji lub transmisji. Obowi¹zuj¹ tutaj nastêpuj¹ce ogólne zasady:
•
zwiêkszanie rozdzielczoœci powoduje silniejsz¹ korelacjê pomiêdzy wartoœciami pikseli, co
pozwala na osi¹ganie wy¿szych stopni kompresji (oczywiœcie roœnie najczêœciej liczba bitów
potrzebna do zapisu skompresowanego obrazu, gdy¿ zwiêksza siê automatycznie liczba pikseli w
obrazie, lecz przyrost wzglêdny iloœci bitów jest mniejszy);
•
zwiêkszanie liczby poziomów kwantyzacji wartoœci pikseli (b¹dŸ zapewnienie wiêkszej ich
dynamiki w procesie formowania obrazu) zmniejsza korelacjê pomiêdzy pikselami, co redukuje
mo¿liwoœci kompresji;
•
wystêpowanie jakichkolwiek szumów w obrazie, wprowadzanych na ró¿nych etapach
konstruowania obrazu, zmniejsza korelacjê pomiêdzy pikselami, a wiêc ogranicza uzyskiwane
stopnie kompresji.
2.2. Wartoœæ diagnostyczna obrazów medycznych
Zasadniczym czynnikiem wp³ywaj¹cym na dopuszczalny poziom redukcji informacji z obrazów
medycznych w procesie stratnej kompresji jest wartoœæ diagnostyczna tych obrazów. Jest ona zwi¹zana
ze zdolnoœci¹ obserwatora do detekcji symptomów patologicznych i zale¿y od trzech zasadniczych
czynników:
- jakoœci obrazu,
- warunków obserwacji,
- charakterystyki pracy lekarza-specjalisty.
Proces kompresji nieodwracalnej wp³ywa bezpoœrednio na jakoœæ obrazów. Zmiany w jakoœci przy
takich samych warunkach obserwacji mog¹ byæ nieistotne z punktu widzenia konkretnego sposobu
diagnozowania, mniej czy bardziej ograniczaæ mo¿liwoœci podejmowania poprawnych decyzji lub te¿ w
pewnych przypadkach zwiêkszaæ skutecznoœæ detekcji patologii.
2.2.1. JakoϾ obrazu
Jakoœæ obrazów medycznych jest bezpoœrednio zwi¹zana z metod¹ obrazowania,
w³asnoœciami konkretnych urz¹dzeñ oraz wartoœciami zmiennych parametrów systemu dobieranymi
przez operatora. Sk³ada siê na ni¹ co najmniej piêæ istotnych elementów: kontrast, rozdzielczoœæ,
stosunek sygna³u u¿ytecznego do szumów, poziom artefaktów oraz zniekszta³cenia przestrzenne.
Ludzkie cia³o zawiera wiele struktur i obiektów, które w wiêkszoœci metod obrazowania s¹
prezentowane jednoczeœnie. Zazwyczaj interesuje nas jednak pojedynczy obiekt w otoczeniu
bezpoœredniego t³a i jego relacja do tego¿ doraŸnego otoczenia. Praktycznie, w wiêkszoœci metod
widocznoœæ obiektów jest okreœlana w³aœnie przez tê relacjê, a nie przez ogólne charakterystyki
wyznaczane na ca³ym obrazie. Zadaniem ka¿dego systemu obrazowania w medycynie jest wyra¿enie w
skali szaroœci i przestrzeni obrazu specyficznych ró¿nic pomiêdzy tkankami cia³a pacjenta.
Kontrastowoœæ obrazu zale¿y zarówno od w³asnoœci przedstawianego obiektu, jak te¿ systemu.
Decyduje o niej zró¿nicowanie wielkoœci charakteryzuj¹cej tkanki w danej metodzie obrazowania
(impedancji akustycznej w USG, liniowych wspó³czynników poch³aniania w metodach rentgenowskich,
iloœæ zgromadzonego izotopu o danej aktywnoœci w MN, czy te¿ gêstoœæ aktywnych protonów, czas
ustawiania siê protonów równolegle do linii zewnêtrznego pola magnetycznego po zaniku impulsu
radiowego T1 oraz czas zaniku namagnesowania poprzecznego T2 w badaniach MR). Ponadto,
technika przetworzenia tych ró¿nic na wartoœci pikseli obrazu wp³ywa tak¿e znacz¹co na kontrast
obrazu. Dobry kontrast pozwala na wyraŸne rozró¿nienie struktur przy zachowaniu ostrych krawêdzi i
prezentacji ca³ej ró¿norodnoœci obrazowanych obiektów. Uzyskuje siê to poprzez odpowiednie
wykorzystanie ca³ej dynamiki danych obrazowych. Do najczêœciej stosowanych globalnych miar
kontrastu nale¿y histogram ca³ego obrazu, a do lokalnych miar kontrastu mo¿na zaliczyæ lokalny
12
histogram, wariancjê rozk³adu wartoœci funkcji jasnoœci w pewnym obszarze, a tak¿e czêsto stosowan¹
zale¿noœæ:
K
f
f
f
f
=
−
+
max
min
max
min
,
gdzie K - kontrast, f
f
max
min
,
- maksymalna i minimalna wartoœæ funkcji jasnoœci w lokalnym obszarze
lub te¿ œrednie wartoœci funkcji jasnoœci w s¹siednich obszarach jednorodnych.
Kontrast jest najbardziej fundamentaln¹ cech¹ charakterystyczn¹ obrazu i jest zwi¹zany
bezpoœrednio z dynamik¹ danych obrazowych. Format zapisu danych winien odpowiadaæ mo¿liwej do
uzyskania dynamice danych w konkretnym systemie obrazowania, a sposób prezentacji obrazu winien
umo¿liwiæ obserwacjê danych z ca³ego zakresu tej dynamiki. W praktyce dynamika medycznych danych
obrazowych jest bardzo zró¿nicowana, zarówno w obrêbie jednej metody obrazowania, jak te¿
pomiêdzy ró¿nymi metodami tworzenia obrazów w medycynie. Algorytmy kompresji mo¿liwie szerokiej
klasy obrazów medycznych winny byæ wiêc dostosowane do ró¿nej dynamiki danych, zazwyczaj z
zakresu 6-16 bitów. Najczêœciej spotykan¹ dynamikê ró¿nego typu obrazów medycznych przedstawia
tabela 1.
Tabela 1. Dynamika medycznych danych obrazowych.
NM
USG
MRI
CR
CT
6 - 12 bitów
6 - 8 bitów
8 - 12 bitów
10 - 14 bitów
12 - 14 bitów
Wœród ró¿nych metod obrazowania szczególne miejsce w dziedzinie kontrastu zajmuje
technika CT. Obrazy otrzymywane w rentgenowskiej tomografii komputerowej maj¹ wy¿sz¹ czu³oœæ
kontrastu (inaczej rozdzielczoœæ kontrastu) ni¿ w przypadku konwencjonalnej radiografii. Demonstruje
siê to w mo¿liwoœci pokazywania na obrazie tych obiektów z miêkkiej tkanki, które s¹ niewidoczne w
radiografii. Ze wzglêdu na du¿¹ czu³oœæ kontrastu w obrazach CT wystêpuje zazwyczaj du¿a liczba
ostrych krawêdzi, które maj¹ znaczenie diagnostyczne. Wymusza to stosowanie technik kompresji
wiernie odtwarzaj¹cych wysokoczêstotliwoœciowe sk³adowe obrazu, co jest szczególnie wymagaj¹cym
warunkiem dla wszystkich metod stratnej kompresji.
Wszystkie metody obrazowania wprowadzaj¹ pewne zamazanie (rozmycie) w procesie
przetwarzania cech rzeczywistych struktur wewnêtrznych na postaæ obrazu. Podstawowym efektem
rozmycia jest redukcja kontrastu i widocznoœci ma³ych obiektów lub szczegó³ów, podczas gdy
widocznoœæ du¿ych obiektów praktycznie siê nie zmienia. Wiêksza rozdzielczoœæ tworzonych w
systemie obrazów eliminuje efekt rozmycia i czyni lepiej widocznymi struktury zawieraj¹ce drobne
elementy o du¿ej wadze diagnostycznej. Orientacyjne porównanie zdolnoœci rozdzielczej ró¿nych metod
obrazowania zosta³o przedstawione na rys. 4.
Inn¹ cech¹ charakterystyczn¹ wszystkich obrazów medycznych jest szum, który pojawia siê
czêsto w obrazie w postaci cêtkowanej tekstury czy ziarna. Rodzaj i poziom szumu zale¿y od metody
obrazowania. Ogólnie rzecz bior¹c, wy¿szy poziom szumów w stosunku do sygna³u u¿ytecznego w
obrazie powoduje obni¿enie widocznoœci obiektów. Najsilniej wp³ywa on na obiekty o niskim kontraœcie,
które znajduj¹ siê blisko progu widocznoœci. •ród³em szumów mo¿e byæ ka¿dy kolejny etap tworzenia
obrazu dan¹ metod¹, np. ró¿nica energii kwantów promieniowania X, statystyka rejestrowanych
kwantów, ró¿nice w prêdkoœciach rozchodzenia siê ultradŸwiêków w tkankach, ugiêcia na s¹siednich
drobinach, szumy elektroniki itd.
Szum w obrazie staje siê bardziej widoczny, jeœli zwiêksza siê œredni poziom przenoszenia
kontrastu w obrazie. Z kolei widocznoœæ szumu mo¿e byæ czêsto zredukowana przez efekt rozmycia,
poniewa¿ szum ma zazwyczaj strukturê sk³adaj¹c¹ siê z drobnych elementów. Wyg³adzenie
przypadkowej struktury szumów czyni je mniej widocznymi. Oczywiœcie, rozmycie mo¿e spowodowaæ
tak¿e pogorszenie widocznoœci u¿ytecznych szczegó³ów obrazu.
13
Scyntygrafia
USG
MRI
CT
Fluoroskopia
Radiografia
10
1
0.1
ZdolnoϾ rozdzielcza (mm)
Rys. 4. Porównanie typowych zdolnoœci rozdzielczych ró¿nych metod obrazowania w medycynie.
Stratne metody kompresji powoduj¹ zazwyczaj dodatkowe zjawisko rozmycia obrazu
oryginalnego, które mo¿e nawet poprawiæ jego jakoœæ poprzez redukcjê szumów. Warunkiem jest
jednak zachowanie informacji diagnostycznej. Orientacyjne œrednie wartoœci stosunku sygna³u
u¿ytecznego do szumów w obrazach medycznych przedstawia tabela 2.
Tabela 2. Orientacyjne wartoœci stosunku sygna³u do szumów w obrazach medycznych.
NM
USG
MRI
CR
CT
15 dB
30 dB
50 dB
60 dB
50 dB
Problemem wystêpuj¹cym w ró¿nych metodach obrazowania jest powstawanie pewnych cech
obrazu, nazywanych artefaktami, które nie reprezentuj¹ ¿adnej struktury cia³a, ani dodatkowego obiektu
umieszczanego niekiedy celowo w polu obrazowania. W wielu przypadkach artefakty nie wp³ywaj¹
znacz¹co na widocznoœæ obiektów i dok³adnoœæ diagnozy, jednak niekiedy mog¹ pogorszyæ widocznoœæ
w pewnych obszarach obrazu lub te¿ byæ b³êdnie interpretowane jako cechy anatomiczne. Wiele
ró¿nych czynników zwi¹zanych z dan¹ metod¹ mo¿e powodowaæ powstanie artefaktów, poczynaj¹c od
sposobu przetwarzania danych i algorytmów konstruowania obrazu w systemie, a koñcz¹c na
poruszeniu pacjenta czy chocia¿by przesuniêciu kolimatora w lampie rentgenowskiej. Do typowych
artefaktów pojawiaj¹cych siê w obrazach mo¿na zaliczyæ powstawanie cieni, przejaskrawieñ i
rewerberacji w badaniach USG (rys. 5a), nak³adanie zwi¹zane z kodowaniem czêstotliwoœci, fazy i
selekcj¹ warstw, chemiczne przesuniêcie i obcinanie danych w badaniach MR, ruch obiektu czy te¿
obecnoœæ metalowych obiektów w polu obrazowania (rys 5b). itd.
Obraz medyczny powinien uwidoczniæ wewnêtrzne narz¹dy cia³a, ale winien tak¿e w³aœciwie
oddaæ ich rozmiar, kszta³t oraz wzglêdne po³o¿enie. Proces obrazowania mo¿e wprowadzaæ
zniekszta³cenia tych parametrów, utrudniaj¹ce diagnozê. Wp³yw stratnej kompresji, eliminuj¹cy
wysokoczêstotliwoœciowe szczegó³y obrazu i wprowadzaj¹cy artefakty, mo¿e wprowadzaæ dodatkowe
zniekszta³cenia kszta³tu i wzajemnego po³o¿enia struktur obrazu. Uzyskanie maksymalnej widocznoœci
struktur w danej metodzie ograniczone jest wieloma kompromisami pomiêdzy przeciwstawnymi
wp³ywami poszczególnych elementów systemu obrazowania na jakoœæ obrazu i warunki badania, np.
pomiêdzy wielkoœci¹ dawki poch³oniêt¹ przez pacjenta a czasem badania w MN. W wielu sytuacjach,
jeœli optymalizujemy parametry systemu pod k¹tem jednego z elementów jakoœci obrazu, np. szumów,
czêsto wp³ywa to nie najlepiej na inne czynniki sk³adaj¹ce siê na jakoœæ obrazu, takie jak kontrast czy
rozmycie szczegó³ów. Tak wiêc w³aœciwoœci techniki obrazowania musz¹ byæ starannie dobrane do
specyficznych wymagañ klinicznej oceny obrazów przez specjalistów.
14
a)
b)
Rys. 5 a) artefakty w badaniach USG - przyk³ad rewerberacji czyli wielokrotnych odbiæ fali
ultradŸwiêkowej pomiêdzy na granicach dwóch oœrodków o wyraŸnie zró¿nicowanych wartoœciach
impedancji akustycznej; b) artefakty w badaniach MRI - przyk³ad zaburzeñ obrazu spowodowanych
obecnoœci¹ metalu w ustach pacjenta (metalowy z¹b). Obrazy pochodz¹ ze Ÿróde³ internetowych.
a)
b)
Rys. 6. Skale barwne w obrazowaniu medycznym: a) badanie USG serca - kolorowy doppler, b)
pseudokolorowane PET-owych badañ mózgu.
2.2.2. Warunki obserwacji
Kombinacja dwóch wskaŸników stanowi o wyj¹tkowoœci ka¿dej z metod obrazowania. S¹ to
widoczne na obrazie cechy charakterystyczne tkanki oraz perspektywa obserwacji. Ró¿nica wartoœci
specyficznej dla danej metody w³asnoœci tkanek jest odwzorowana w skali szaroœci daj¹c pewien
kontrast obrazu. Z kolei nasza zdolnoœæ do widzenia pewnych obiektów lub cech w obrazie zale¿y silnie
od warunków, w jakich ogl¹damy ten obraz. Odpowiedzialny za to jest z jednej strony sposób
prezentacji obrazu w danym systemie (jakoœæ karty graficznej, monitora, mo¿liwoœci zmiany palety itd.),
z drugiej zaœ warunki zewnêtrzne, w których pracuje specjalista (oœwietlenie pomieszczenia, ergonomia
pracy itp.). Sposób prezentacji obrazów jest bardzo zró¿nicowany i zasadniczo powinien byæ powi¹zany
z jakoœci¹ tych obrazów. W aparatach USG stosowane s¹ najczêœciej niewielkie monitory o ma³ej
15
kontrastowoœci i rozdzielczoœci, a dodatkow¹ informacjê np. prêdkoœæ przep³ywu z badañ
dopplerowskich nanosi siê na podstawowy obraz (w skali szaroœci) jako kolorowanie tego obrazu w
miejscach przep³ywu (barwy okreœlonej skali pokazuj¹ prêdkoœci przep³ywu) - rys. 6a. Lepsz¹ jakoœæ
maj¹ urz¹dzenia do prezentacji stosowane w systemach rezonansu magnetycznego, podczas gdy do
obserwacji badañ CT u¿ywany jest zazwyczaj sprzêt wysokiej jakoœci, umo¿liwiaj¹cy dok³adn¹
obserwacjê danych obrazowych z wykorzystaniem ca³ej ich dynamiki (przesuwane okno). Obrazy
scyntygraficzne prezentowane s¹ czêsto w systemach MN z wykorzystaniem interpolacji i filtracji w celu
poprawy wizualnej jakoœci obrazów oryginalnych. Wprowadza siê te¿ zazwyczaj pseudokolorowanie
(rys. 6b).
2.2.3. Charakterystyka pracy specjalisty
W wielu przypadkach obecnoϾ zmian patologicznych w analizowanym obrazie nie jest
oczywista i, aby j¹ wykryæ, konieczna jest wiedza, doœwiadczenie i uwa¿na praca obserwatora-
specjalisty. Zarówno sposób okreœlania patologii, jak i stosowane kryteria zale¿¹ od tak wielu czynników
(rodzaj badania, cechy pacjenta, dodatkowe informacje z innych badañ, przebieg choroby itd.), ¿e nie
jest mo¿liwe jednoznaczne scharakteryzowanie pracy specjalisty metodami cybernetycznymi.
Stosowane s¹ wiêc metody oparte na subiektywnej zdolnoœci obserwatora do stwierdzania pewnych
faktów istotnych diagnostycznie na podstawie analizowanych obrazów. Najpopularniejsz¹ obecnie
metod¹, polegaj¹c¹ na rozpoznawaniu patologii w statystycznie istotnym zbiorze badañ obrazowych
przez zespó³ specjalistów danej dziedziny z ró¿nych oœrodków medycznych, jest wyznaczanie krzywych
ROC (receiver operating characteristic) [4]. W trakcie przeprowadzanych testów obok poprawnych
decyzji, potwierdzaj¹cych rzeczywist¹ obecnoœæ patologii w prezentowanym obrazie (decyzje
prawdziwie pozytywne) oraz jej brak (decyzje prawdziwie negatywne), zdarzaj¹ siê te¿ wskazania
b³êdne (fa³szywe negatywne i fa³szywe pozytywne), tym liczniejsze im silniejszy jest wp³yw czynników
pogarszaj¹cych jakoœæ obrazów (ograniczenia danej metody obrazowania, wybór niew³aœciwych
parametrów systemu, s³abe warunki obserwacji, niedoœwiadczenie czy nieuwaga obserwatora).
Krzywa ROC powstaje poprzez naniesienie wyników w uk³adzie wspó³rzêdnych, w którym oœ
odciêtych reprezentuje trafnoœæ (specificity), a oœ rzêdnych czu³oœæ (sensitivity). Czu³oœæ okreœlona jest
przez procentow¹ zawartoœæ iloœci decyzji prawdziwie pozytywnych (czyli specjalista decyduje, ¿e
patologia jest obecna i rzeczywiœcie obraz zawiera patologiê) wœród wszystkich werdyktów wydanych
dla obrazów zawieraj¹cych patologie -
N
N
pp
pat.
[%]. Procentowy udzia³ decyzji diagnostycznie prawdziwie
negatywnych (decyzja: brak patologii dla obrazu bez patologii) we wszystkich decyzjach dotycz¹cych
obrazów bez patologii -
N
N
pn
bez pat
.
[%] wyra¿a trafnoœæ decyzji, przy czym wówczas skala wartoœci
trafnoœci jest odwrócona i w pocz¹tku uk³adu wspó³rzêdnych znajduje siê 100%. Czêœciej jako miara
trafnoœci decyzji stosowany jest procentowy stosunek iloœci decyzji fa³szywie pozytywnych (decyzja: jest
patologia dla obrazu bez patologii) do iloœci obrazów bez patologii -
N
N
fp
bez pat
.
[%], gdzie skala wartoœci
nie jest odwrócona - 0% w pocz¹tku uk³adu wspó³rzêdnych. Przyk³adowe krzywe przedstawione s¹ na
rys. 7. Oczywiœcie idea³em jest, by w czasie testu zarówno czu³oœæ jak i trafnoœæ wynios³a 100%,
wówczas statystycznie (nie ma pewnoœci co do konkretnego badania) liczba badañ z patologi¹ i bez
patologii oceniona przez specjalistów pokrywa siê dok³adnie z wzorcem. Na podstawie wykreœlonej
krzywej ROC oblicza siê ró¿ne wielkoœci charakterystyczne (kszta³t, nachylenie, pole powierzchni pod
krzyw¹ itp.), które s³u¿¹ do porównañ i ostatecznej oceny systemu obrazowania (wartoœci
diagnostycznej tworzonych w nim obrazów).
Zalet¹ tej metody jest wzglêdna niezale¿noœæ od "dobrych intencji" obserwatora. Gdyby,
przyk³adowo, obserwator wykazywa³ cechy zbytniego krytycyzmu i próbowa³ zwiêkszyæ liczbê
wykrywanych patologii (roœnie czu³oœæ), liczba fa³szywie pozytywnych (trafnoœæ) decyzji tak¿e wzroœnie.
16
100
80
60
40
20
0
20
40
60
80
100
0
TrafnoϾ =
N fp
Nbez pat.
⋅
100%
Czu³oœæ =
N pp
N pat.
⋅
100%
Test idealny
Test niezdeterminowany
Test
rzeczywisty
Rys.7. Porównanie krzywych ROC dla przypadku idealnego, przyk³adowego testu praktycznego i dla
przypadkowej selekcji, zupe³nie niezdeterminowanej u¿yteczn¹ informacj¹.
Metody charakterystyki pracy specjalisty wykorzystywane s¹ w technikach oceny
dopuszczalnych stopni kompresji obrazów medycznych. Czynniki decyduj¹ce o wartoœci diagnostycznej
obrazu stawiaj¹ okreœlone wymagania odnoœnie jego jakoœci. Wynikaj¹ one najczêœciej z mo¿liwoœci
samej techniki obrazowania, jak te¿ ze sposobu diagnozy w danym rodzaju badania.
W badaniach CR, CT, MRI decyduj¹ce w rozpoznawaniu patologii s¹ czêsto drobne fragmenty
struktur, rozga³êzienia czy zgrubienia wystêpuj¹ce w newralgicznych obszarach obrazu, zazwyczaj o
ostrych krawêdziach i nieregularnych kszta³tach. Wymagana jest wiêc dobra jakoœæ tych obrazów. W
innych rodzajach badañ przestrzenne relacje pomiêdzy wiêkszymi strukturami oraz ich kszta³t stanowi¹
zasadnicz¹ informacjê diagnostyczn¹ (g³ównie badania USG i NM), a wiêc silniejsze rozmycie czy
wy¿szy poziom szumów nie musi powodowaæ od razu degradacji wartoœci diagnostycznej tych obrazów.
Obok obserwacyjnych metod diagnozowania stosowane s¹ tak¿e techniki obliczenia
parametrów istotnych diagnostycznie bezpoœrednio z obrazów, czêsto w sposób zupe³nie
automatyczny, wykorzystuj¹ce ró¿ne metody przetwarzania obrazów (wyznaczania konturów,
segmentacji itd.). Mo¿na wiêc oceniaæ wiarygodnoœæ diagnostyczn¹ poprzez analizê wartoœci tych
parametrów obliczanych z rekonstruowanych obrazów. WyraŸna zmiana tych wartoœci wskutek silnej
redukcji informacji w zakresie ma³ych œrednich bitowych kompresji stratnej jest sygna³em, ¿e
przekroczono akceptowaln¹ wartoœæ stopnia kompresji [5].
2.2.4. Podsumowanie
Obrazy medyczne stanowi¹ bardzo zró¿nicowan¹ pod wzglêdem jakoœci klasê obrazów. Na
podstawie analizy w³asnoœci tych obrazów oraz czynników decyduj¹cych o wartoœci diagnostycznej
mo¿na dokonaæ ogólnego podzia³u obrazów medycznych na dwie grupy:
a) obrazy o 'ni¿szej jakoœci' charakteryzuj¹ce siê wiêkszym poziomem szumów,
mniejsz¹
rozdzielczoœci¹ i ³agodniejszymi kryteriami okreœlenia ich wartoœci diagnostycznej (dotycz¹cymi
g³ównie kszta³tu i przestrzennych relacji prezentowanych struktur); do grupy tej mo¿na zaliczyæ
przede wszystkim
obrazy scyntygraficzne, USG i czêœæ obrazów MRI;
b) obrazy o 'wy¿szej jakoœci' wyró¿niaj¹ce siê znacznie ni¿szym poziomem szumów, wiêksz¹
rozdzielczoœci¹ oraz ostrymi kryteriami wartoœci diagnostycznej (zwi¹zanej najczêœciej z wiernym
odtworzeniem drobnych szczegó³ów prezentowanych struktur oraz wielkoœci¹ i kszta³tem
charakterystycznych niewielkich obszarów); do obrazów tej grupy mo¿na zaliczyæ wysokiej jakoœci
obrazy MRI (g³owy, uk³adu nerwowego), CT oraz cyfrowe obrazy rentgenowskie CR.
17
2.3. Metody oceny wiarygodnoœci diagnostycznej obrazów oparte na symulacji i analizie
statystycznej
Cechami charakterystycznymi tych metod s¹ przede wszystkim: du¿¹ z³o¿onoœæ i
czasoch³onnoœæ, wykorzystanie subiektywnych opinii lekarzy-specjalistów w danej dziedzinie, przy
jednoczesnym d¹¿eniu do maksymalnej obiektywizacji tych ocen, stworzenie warunków oceny jakoœci
obrazów rekonstruowanych zbli¿onych do codziennej praktyki lekarskiej.
2.3.1.
Krótka charakterystyka metod
Metody oceny diagnostycznej wiarygodnoœci obrazów medycznych wykorzystuj¹ najczêœciej
krzyw¹ ROC. Eksperci dokonuj¹ diagnozy, korzystaj¹c najczêœciej z piêciostopniowej skali ocen (1 -
zdecydowana nieobecnoœæ pewnej patologii w obrazie, 5 - definitywna obecnoœæ patologii). S¹ oni
wczeœniej przygotowywani do podejmowania decyzji diagnostycznych w prze³o¿eniu na skalê ocen.
Ponadto, zapewnia siê takie warunki testu, które z jednej strony jak najbardziej odpowiadaj¹ klinicznym
warunkom pracy, z drugiej zaœ ograniczaj¹ do minimum czynniki zak³ócaj¹ce obiektywn¹ ocen¹ (proces
uczenia, skojarzenia, zmienne warunki obserwacji itd.). Wyniki diagnozy poszczególnych specjalistów
s¹ nastêpnie zbierane razem, zgodnie z charakterem danych w celu wyznaczenia sumarycznych
wskaŸników wyra¿aj¹cych wiarygodnoœæ diagnostyczn¹.
PRZYK£AD
Wykonano testy oceny jakoœci kompresowanych stratnie obrazów medycznych w warunkach
jak najbardziej zbli¿onych do rzeczywistych, przy czym zapewniono niezale¿noœæ wydawanych ocen
oraz zminimalizowano proces uczenia u lekarzy-specjalistów bior¹cych udzia³ w testach. Do analizy
wykorzystano krzyw¹ ROC. Przygotowano 20 obrazów radiografii cyfrowej, w tym 10 z nich zawiera³o
patologie, które zosta³y poddane kompresji w stopniu 10 i 25, a po rekonstrukcji by³y obserwowane
przez 10 specjalistów. Oczywiœcie w praktyce liczba wykonanych decyzji jest znacznie wiêksza
(wiarygodna statystycznie - przyjmuje siê, ¿e jeden punkt na krzywej winien byæ wynikiem przynajmniej
stu decyzji), a uzyskane wartoœci prawdopodobieñstw bardziej wiarygodne. W naszym przyk³adzie
uzyskano nastêpuj¹ce wyniki testu:
lekarze
1
2
3
4
5
6
7
8
9
10
CR=10
Npp
9
5
6
9
9
10
8
8
9
7
Nfp
5
1
1
3
4
7
2
3
6
2
CR=25
Npp
6
2
5
7
9
9
8
6
8
4
Nfp
4
1
2
5
7
8
6
3
7
2
gdzie Npp - liczba decyzji prawdziwie pozytywnych, Nfp - liczba decyzji fa³szywie pozytywnych, CR -
stopieñ kompresji. Na podstawie tych wyników wykreœlono krzyw¹ ROC dla obu stopni kompresji (rys.
8).
18
Rys. 8. Wykres krzywej ROC dla danych z przyk³adu.
Jakkolwiek technika ROC jest dominuj¹ca przy okreœlaniu wartoœci diagnostycznej obrazów
medycznych, zawiera ona szereg s³abych stron zwi¹zanych z jej aplikacj¹. Pierwsza - to koniecznoœæ
zamiany normalnego trybu diagnozowania w praktyce klinicznej na wyra¿enie opinii w pewnej skali
ocen. Nastêpnie, poniewa¿ technika ROC zosta³a stworzona przy za³o¿eniu Gaussowskiego rozk³adu
szumów w zbiorze analizowanych danych, jej stosowanie do oceny danych obrazowych o zazwyczaj
nie-Gaussowskim charakterze nasuwa pewne w¹tpliwoœci (istniej¹ pewne metody redukcji b³êdów
wynikaj¹cych z tych Gaussowskich za³o¿eñ). Ponadto, wiele praktycznych zadañ diagnostycznych,
jakie stoj¹ przed specjalistami, nie sprowadza siê do decyzji dwupoziomowej: tak lub nie. W niektórych
patologiach wystêpuje kilka nieprawid³owoœci w ró¿nych fragmentach obrazu, a proces decyzyjny jest
du¿o bardziej z³o¿ony. Jak wówczas odpowiedzieæ na pytanie o nieobecnoœæ anormalnoœci w obrazie
(parametr trafnoœci), której z nich? Dla przypadków bliskich decyzjom dwupoziomowym mo¿na jeszcze
zdefiniowaæ trafnoœæ jako œredni¹ wa¿on¹ decyzji dla ka¿dej patologii w zale¿noœci od konkretnego
obrazu. Przy z³o¿onych zadaniach detekcji nieprawid³owoœci - stosowane s¹ rozszerzenia techniki
ROC.
Jedno z takich rozwi¹zañ zawiera nieco inny sposób oceny wiarygodnoœci diagnostycznej,
eliminuj¹cy czêœæ tych ograniczeñ, pozwala, w opinii autorów, lepiej oceniæ wartoœæ diagnostyczn¹
obrazów (CT i MR) poprzez wiêksze odzwierciedlenie w testach rzeczywistych klinicznych zadañ
radiologów. Specjaliœci obserwuj¹ obrazy i zaznaczaj¹ obecnoœæ pewnych anormalnoœci np.
powiêkszonych wêz³ów ch³onnych w obrazie CT klatki piersiowej, lub te¿ obecnoœæ guzków w p³ucach,
przy czym liczba anormalnoœci jest ró¿na w poszczególnych obrazach testowych. Warstwa decyzyjna
zostaje wiêc rozszerzona na kilka, czy nawet kilkanaœcie poziomów. Analizê tak otrzymanych wyników
mo¿na przeprowadziæ przy pomocy dwu parametrów: czu³oœci i przewidywanej wartoœci pozytywnej
(predictive value positive-PVP). Jeœli obserwator zakreœli wszystkie anormalnoœci w obrazie, wówczas
osi¹ga maksymaln¹ wartoœæ czu³oœci 1, a jeœli mniej - odpowiedni u³amek wyra¿a czu³oœæ jego decyzji.
Natomiast PVP okreœla szansê rzeczywistej obecnoœci anormalnoœci w zaznaczonych miejscach. Je¿eli
wiêc ekspert by³by zbyt agresywny w wykrywaniu anormalnoœci, wówczas du¿ej wartoœci czu³oœci
bêdzie towarzyszyæ ma³a wartoœæ PVP, a w przypadku zbytniej ostro¿noœci wyniki bêd¹ dok³adnie
odwrotne. Nastêpnie, na wykresach przedstawiane s¹ œrednie wartoœci czu³oœci i PVP (oddzielnie) dla
ka¿dego stopnia kompresji badanych obrazów, które aproksymuje siê odpowiedni¹ funkcj¹, np.
kwadratow¹ funkcjê sklejan¹ z kryterium minimalizacji b³êdu œredniokwadratowego. Porównanie
czu³oœci i PVP dla ró¿nych stopni kompresji przeprowadzono przy pomocy testu t-Studenta z
wykorzystaniem rozk³adu permutacji dwuelementowych (nazywanego czasami testem Behrensa-
Fishera [6].
Jak widaæ poziom z³o¿onoœci tych metod roœnie w miarê przybli¿ania metody oceny jakoœci do
rzeczywistego procesu decyzyjnego lekarza. Staje siê to jednak zbyt uci¹¿liwe, by mog³o byæ
stosowane w praktyce.
19
2.3.2. Perspektywa dalszych badañ
Metody oceny diagnostycznej wiarygodnoœci rekonstruowanych obrazów, a wiêc rzeczywistej
ich jakoœci w punktu widzenia celu ich aplikacji, rozwijane s¹ obecnie w kierunku mo¿liwie pe³nego
wprowadzenia zrekonstruowanych obrazów w rzeczywiste warunki pracy klinicznej i wnioskowania o ich
jakoœci na podstawie testów, które coraz silniej naœladuj¹ realn¹ ocenê diagnostyczn¹ prezentowanych
struktur. W efekcie testy te staj¹ siê coraz bardziej z³o¿one, praco- i czasoch³onne, drogie, tote¿ coraz
trudniejsze do praktycznego wykorzystania.
Ten kierunek poszukiwañ, jakkolwiek zrozumia³y, zawiera w sobie jednak wiele
niebezpieczeñstw i mo¿e doprowadziæ do rozwi¹zañ zupe³nie nieprzydatnych w praktyce, a zatem -
nieistotnych. Diagnoza jest tylko œrodkiem s³u¿¹cym w³aœciwej ocenie stanu zdrowia pacjenta i
ewentualnemu podjêciu odpowiedniej metody leczenia. Mo¿e wiêc lepiej oceniaæ jakoœæ
rekonstruowanych obrazów na podstawie przebiegu procesu leczenia, albo wrêcz jego wyników, czyli
stanu zdrowia pacjentów po zakoñczeniu procesu terapeutycznego. Oczywiœcie, jest to myœlenie ma³o
rozs¹dne, bowiem same metody leczenia jak i wynik ich stosowania, jakkolwiek mog¹ byæ
potwierdzeniem przydatnoœci danej metody medycznego obrazowania i wykorzystywanych do diagnozy
obrazów, zale¿¹ równie¿ od tak wielu innych, nieraz du¿o bardziej istotnych czynników, tak ¿e nikt nie
jest w stanie oceniæ w ten sposób jakoœci obrazów.
Problem okreœlenia wiarygodnoœci diagnostycznej jest wiec nie³atwy, a przecie¿ istnieje
jeszcze inny powa¿ny problem. Metody szacuj¹ce tê wiarygodnoœæ oparte s¹ na tzw. "z³otym
standardzie", który wyra¿a 'prawdê' diagnostyczn¹ ka¿dego oryginalnego obrazu (wykorzystywanego w
teœcie) i s³u¿y jako baza do porównañ wyników diagnoz dokonywanych na podstawie ró¿nych wersji (po
kompresji) tego obrazu. Z³oty standard mo¿e byæ wyznaczany na wiele sposobów (standard zgodny,
osobisty, niezale¿ny, osobny), w zale¿noœci od tego, co tak naprawdê powinien wyra¿aæ; czy osobiste
przekonanie pojedynczego lekarza, czy te¿ pewien kompromis pomiêdzy kilku specjalistami
oceniaj¹cymi póŸniej tak¿e obrazy rekonstruowane lub te¿ zupe³nie niezale¿nymi od póŸniejszych ocen.
Koncepcja standardu osobnego proponuje w celu sformu³owania prawdy obiektywnej o obrazie
oryginalnym skorzystanie z innych badañ (chirurgicznej biopsji, innych badañ obrazowych), obserwacji
pacjenta itd. Ka¿de z tych sformu³owañ z³otego standardu ma s³abe strony i wprowadza pewne
zafa³szowanie w ocenê jakoœci obrazu, b¹dŸ te¿, mówi¹c dok³adniej, podnosi poziom subiektywnoœci tej
oceny, a wiêc jej zale¿noœci od przygotowania ekspertów, metody pracy klinicznej, rodzaju badañ itd.
Niezaprzeczalny jest tak¿e fakt, i¿ redukcja informacji zawartej w obrazie w procesie stratnej
kompresji mo¿e w pewnych przypadkach poprawiæ zarówno jakoœæ tego obrazu, jak te¿ jego wartoœæ
diagnostyczn¹, chocia¿by przez redukcjê szumów w obrazach NM, os³abienie artefaktów w obrazach
USG itp. Poprawa jakoœci obrazu w stosunku do obrazu oryginalnego nie by³a brana pod uwagê
zarówno w obiektywnych metodach oceny jakoœci, jak te¿ w subiektywnych miarach wiarygodnoœci
diagnostycznej rekonstruowanych obrazów.
Bardzo istotne jest opracowanie doskonalszej ni¿ istniej¹ce, bardziej obiektywnej metody
okreœlania wiarygodnoœci diagnostycznej rekonstruowanych obrazów w celu wyznaczenia
dopuszczalnych stopni stratnej kompresji, warunkuj¹cych jej stosowanie.
Najlepszym, chodŸ bardzo trudnym do realizacji rozwi¹zaniem, by³oby wyznaczenie z³otego
standardu, który na miarê dostêpnych œrodków wspó³czesnej medycyny stanowi³by obiektywn¹
diagnozê rzeczywistoœci przedstawianej przez dany obraz, a nastêpnie ocenianie wzglêdem tego
standardu jakoœci obrazów zarówno oryginalnych, jak te¿ rekonstruowanych. Takie kryterium oceny
pozwoli³oby obiektywniej porównaæ skutecznoœæ kompresji ró¿nych technik, jak te¿ w bezpieczniejszy
sposób okreœliæ poziom dopuszczalnych stopni kompresji, jako np. nie wnosz¹cy wiêkszych
zniekszta³ceñ ni¿ obraz oryginalny.
Najnowsze rozwi¹zania dotycz¹ce metod oceny wiarygodnoœci kompresowanych stratnie
obrazów medycznych koncentruj¹ siê na najlepszym sposobie okreœlenia z³otego standardu, a tak¿e
protokó³u oceny jakoœci obrazów, w którym lekarze wyra¿aj¹ swe opinie w kategoriach jak najbardziej
diagnostycznych [7]. W analizie statystycznej zrezygnowano z krzywych ROC, a jako obiektywn¹
diagnozê zastosowano analizê obrazów analogowych. Wartoœæ diagnostyczna oryginalnych obrazów
cyfrowych by³a oceniana wzglêdem tych¿e analiz, podobnie jak obrazów rekonstruowanych.
Rozwi¹zania te s¹ stosowane dla oceny jakoœci obrazów mamograficznych. Niestety, nie we wszystkich
systemach obrazowania istnieje analogowy orygina³. Trzeba wiêc szukaæ innych rozwi¹zañ.
20
3. Podsumowanie
Zakres zarysowanych zagadnieñ jest jedynie prób¹ ukazania wa¿koœci zagadnienia oceny
jakoœci obrazów cyfrowych. Obrazy te powstaj¹ w ró¿nych systemach obrazowania i poddawane s¹
wielorakim metodom przetwarzania w celu poprawy ich jakoœci b¹dŸ te¿ usprawnienia warunków ich
aplikacji. Na podkreœlenie zas³uguje fakt du¿ej wagi zagadnienia oceny jakoœci obrazów, jak równie¿
brak w pe³ni satysfakcjonuj¹cych rozwiazañ. St¹d te¿ powstaje obecnie wiele rozwi¹zañ dotycz¹cych
konstrukcji coraz doskonalszych modeli systemu HVS, obliczeniowych miar jakoœci o cechach ca³kowo-
ró¿niczkowych (s¹ to najczêœciej miary wektorowe jak chocia¿by w [8]), opracowywane s¹ nowe
sposoby przeprowadzania testów psychowizualnej oceny jakoœci obrazów i bardziej przydatne metody
statystycznej analizy wyników tych testów.
Inn¹ strona tego zagadnienia jest fakt, ¿e w zdecydowanej wiêkszoœci prowadzonych badañ z
dziedziny przetwarzania obrazów jako miarê jakoœci rekonstruowanych obrazów stosuje siê
obliczeniowe miary skalarne: SNR lub MSE, przede wszystkim ze wzglêdu na ich prostotê i ³atwoœæ
prowadzenia porównañ. Prowadzi to oczywiœcie do konstruowania nowych metod przetwarzania pod
k¹tem minimalizacji b³êdu œredniokwadratowego, a bardziej wnikliwa analiza jakoœci wytwarzanych
obrazów okazuje siê potrzebna tylko w pewnych okolicznoœciach.
Istnieje bowiem pewna grupa krytycznych zastosowañ, jak wspomniana w tym rozdziale
kompresja obrazów medycznych czy te¿ np. zagadnienie wprowadzenia nowych p³yt obrazowych
(imaging plate) w cyfrowej radiografii, która z racji zaostrzonych kryteriów (jakie narzuca np. ochrona
zdrowia pacjenta) wymaga bardziej z³o¿onych metod oceny jakoœci stosowanych metod przetwarzania
danych oraz wynikowych obrazów. Ostatecznym celem nowych rozwi¹zañ w tej dziedzinie jest nie tylko
mo¿liwie najwiêksza korelacja z psychowizualn¹ ocen¹ specjalisty przy jednoczesnej obiektywizacji
sposobu oceny, ale wrêcz wspomaganie ocen specjalisty i obiektywne wyznaczenie z³otego standardu
jako punktu odniesienia do wszelkich porównañ i wyznacznia progów akceptowalnoœci nowych technik
konstrukcji i przetwarzania obrazów.
Literatura
1.
H. H. Barret, J. N. Aarsvold, T. J. Roney, „Null functions and eigenfunctions: tools for the analysis of
imaging systems”, Information Processing in Medical Imaging, pp. 211-226, 1991.
2.
Hosaka K., „A new picture quality evaluation method”, Proc. International Picture Coding
Symposium, Tokyo, Japan, April 1986.
3.