1
POB – Odpowiedzi na pytania
1.) Na czym polega próbkowanie a na czym kwantyzacja w procesie akwizycji obrazu,
jakiemu rodzajowi rozdzielczości odpowiada próbkowanie a jakiemu kwantyzacja
Próbkowanie – inaczej dyskretyzacja przestrzenna, czyli konwersja obrazu ciągłego do komponentów
dyskretnych, podział obrazu na określoną liczbę próbek o określonym poziomie szarości lub intensywności
koloru. Odpowiada rozdzielczości przestrzennej, która określa stopień rozróżnialności detali – lepsza, im
większa wartość N.
Kwantyzacja – inaczej dyskretyzacja amplitudowa, czyli redukcja poziomu szarości do wartości dyskretnej –
całkowitej, z przedziału <L
min
, L
max
>. Odpowiada rozdzielczości poziomów szarości – lepsza, im większa
wartość M.
2.) Podać strukturę siatki dyskretnej, rodzaje sąsiedztwa, podać przykład spełnienia zasady
dualizmu węzeł – oczko.
Siatka dyskretna to wzorzec według którego dokonywana jest dyskretyzacja przestrzenna obrazu, posiada
linie, oczka i węzły. Najczęściej stosowana jest siatka prostokątna, gdzie oczko siatki jest kwadratem.
Rodzaje sąsiedztwa: 8-spójne, 4-spójne.
Zasada dualizmu węzeł-oczko polega na tym, że zachowane zostają zasady sąsiedztwa np. 8-spójnego
zarówno dla węzłów, jak i dla oczek. Jest ona spełniona dla siatki prostokątnej.
3.) Podać przykład paradoksu spójności oraz sposób jego uniknięcia.
Paradoks spójności polega na tym, że istnieje niejednoznaczność, jeśli chodzi o określenie czy piksel należy
do obiektu czy do tła. Powstaje w przypadku, gdy zarówno dla obiektów jak i tła jest przypisany ten sam
rodzaj sąsiedztwa.
4.) W jaki sposób zmiana w wyglądzie obrazu (np. z niejednolitego rozkładu poziomów
jasności na jednolity rozkład poziomów jasności ) wpływa na wygląd jego histogramu.
Zmiana w wyglądzie obrazu może sprawić, że histogram stanie się bardziej „spłaszczony” (jednolity na
niejednolity) lub bardziej „ostry”, „postrzępiony” (z niejednolitego na jednolity).
5.) Na czym polega korekcja sumacyjna a na czym korekcja iloczynowa zniekształceń
radiometrycznych w obrazie.
Korekcja sumacyjna dotyczy jednorodnego jasnego obrazu odniesienia. Tworzony jest obraz P
KORA
gdzie
każdy element jest różnicą odpowiadającego pola jasnego obrazu odniesienia i ciemnego obrazu odniesienia.
Korekcja iloczynowa odbywa się w dwóch etapach. Najpierw liczona jest tablica współczynników korekcji
jako iloraz maksymalnej wartości uzyskanej przy korekcji sumacyjnej i wartości danego pola uzyskanej w
korekcji sumacyjnej. Następnie liczona jest wartość piksela obrazu wynikowego – od obrazu pierwotnego
odejmowane są wartości ciemnego obrazu odniesienia i jest to mnożone przez odpowiedni współczynnik
korekcji.
2
6.) Podać uporządkowaną strukturę podziału operacji na obrazach na podstawowe grupy i
podgrupy (jednopunktowe, sąsiedztwa, liniowe, nieliniowe, arytmetyczne, logiczne itd.)
Jednopunktowe
Sąsiedztwa:
Jednoargumentowe
Wygładzanie
Operacja identyczności
Liniowe
Operacja odwrotności (negacji)
Konwolucja
Operacja progowania (binaryzacji)
Nieliniowe
Operacja odwrotnego progowania
Logiczna
Operacje progowania przedziałami
Medianowa
Operacje progowania z zachowaniem poziomów szarości
Wyostrzanie
Operacja rozciągania
Gradientowe
Operacja redukcji poziomów szarości
Laplasjan
Wieloargumentowe
Dodawanie
Odejmowanie
Mnożenie
Logiczne (AND, OR, XOR)
7.) Na przykładowym obrazie podać dwa sposoby zastosowania tablicy LUT: a) w
przedstawieniu histogramu, b) w przedstawieniu uniwersalnego operatora punktowego.
LUT jako histogram – indeksy tablicy to
wartości kolejnych poziomów szarości,
elementy tablicy to liczba pikseli o zadanym poziomie szarości.
LUT jako UOP –
indeksy tablicy to
wartości kolejnych poziomów jasności obrazu,
elementy tablicy to
odpowiednie poziomy jasności pikseli obrazu wynikowego.
8.) Przeprowadzić operacje logiczne AND, OR, XOR na dwóch obrazach [p] i [q] o
parametrach M=16, Lmin= 0 na przykładzie pikseli: p(2,2)=5, q(2,2)= 8
5 AND 8 = 0101 AND 1000 = 0000 = 0
5 OR 8 = 0101 OR 1000 = 1101 = 13
5 XOR 8 = 0101 XOR 1000 = 1101 = 13
AND
0 0
0
0 1
0
1 0
0
1 1
1
9.) Na przykładowym fragmencie obrazu pokazać, w jaki sposób obliczana jest wartość piksla
w trakcie realizacji operacji medianowej a) dla otoczenia 3x3, b) dla otoczenia 5x5.
Dla otoczenia 3x3 brane jest po uwagę 8 pikseli otaczających piksel (razem 9), a dla otoczenia 5x5 – 24
piksele otaczające piksel (razem 25). Dla wygładzania medianowego są one sortowane rosnąco i wybierana
jest mediana z posortowanego ciągu.
XOR
0 0 0
0 1 1
1 0 1
1 1 0
OR
0 0
0
0 1
1
1 0
1
1 1
1
3
10.) Na przykładowym fragmencie obrazu pokazać, w jaki sposób obliczana jest wartość
piksla w trakcie realizacji operacji liniowej (konwolucyjnej) wygładzania dla otoczenia 3x3
przy wartościach współczynnika maski K=1/9 i K=1/10.
Dla otoczenia 3x3 brane jest po uwagę 8 pikseli otaczających piksel (razem 9). Dla operacji linowej są one
sumowane, a następnie mnożone przez K. Daje to wartość piksela wynikowego.
11.) Podać 5 przykładowych metod operacji na pikslach wchodzących w skład skrajnych
kolumn i wierszy tablic reprezentujących obrazy pierwotne (w trakcie wykonywania operacji
sąsiedztwa w otoczeniu 3x3).
1. Pozostawić wartości pikseli bez zmian.
2. Wartości pikseli pozostawić jako nieokreślone.
3. Nadać pikselom wartości arbitralnie zadane przez operatora.
4. Zdublować górny, dolny wiersz oraz prawą, lewą kolumnę.
5. Wykorzystać tylko piksele z istniejącego sąsiedztwa.
12.) Na przykładowym fragmencie obrazu pokazać - z wykorzystaniem linii profilu -
podstawową różnicę pomiędzy operacją wyostrzania opartą na gradiencie a operacją
wyostrzania opartą na laplasjanie.
Gradient jest wrażliwy na intensywność zmiany i jest
używany tylko do detekcji krawędzi.
Laplasjan podaje dodatkową informację o położeniu
piksela względem krawędzi (po jasnej czy ciemnej
stronie).
13.) W przypadku których operacji sąsiedztwa może zaistnieć potrzeba skalowania tablic
obrazów wynikowych? Podać 3 metody skalowania.
W przypadku wyostrzania (laplasjanu, gradientu) może zaistnieć potrzeba skalowania tablic obrazów
wynikowych.
1. Metoda równomierna
2. Metoda trójwartościowa
3. Metoda obcinająca
14.) Na przykładowym fragmencie obrazu przedstawić przebieg operacji erozji z
wykorzystaniem elementu strukturalnego w postaci a) kwadratu, b) rombu.
Erozja dla kwadratu – wybór najmniejszej wartości z sąsiedztwa 8-spójnego i wstawienie wartości na
ś
rodek.
Erozja dla rombu – wybór najmniejszej wartości z sąsiedztwa 4-spójnego i wstawienie wartości na środek.
4
15.) Na przykładowym fragmencie obrazu przedstawić przebieg operacji dylatacji z
wykorzystaniem elementu strukturalnego w postaci a)kwadratu, b) rombu.
Dylatacja dla kwadratu – wybór największej wartości z sąsiedztwa 8-spójnego i wstawienie wartości na
ś
rodek.
Dylatacja dla rombu – wybór największej wartości z sąsiedztwa 4-spójnego i wstawienie wartości na środek.
16.) Na przykładowym fragmencie obrazu przedstawić przebieg operacji otwarcia z
wykorzystaniem elementu strukturalnego w postaci kwadratu.
Otwarcie:
najpierw erozja, potem dylatacja (kwadrat – sąsiedztwo 8-spójne).
17.) Na przykładowym fragmencie obrazu przedstawić przebieg operacji zamknięcia z
wykorzystaniem elementu strukturalnego w postaci rombu.
Zamknięcie: najpierw dylatacja, potem erozja (romb – sąsiedztwo 4-spójne).
18.) Naszkicować przykładową krzywą ciągłą i zrealizować jej dyskretyzację według schematu
Freemana a następnie podać jej zapis w postaci kodu łańcuchowego o stałej długości.
Schemat dyskretyzacji Freemana:
001 001 000 010 001 000 000 010 000
19.) Podać definicję metryki pamiętając o jej 3 podstawowych własnościach.
20.) Podać 3 sposoby przeglądu obrazu a następnie przedstawić przykładowy obraz o
parametrach N=4, M=4, Lmin=0 w postaci a) tablicy, b) wektora stosując jeden z 3 sposobów
przeglądu obrazu.
1. Linia po linii (wiersz po wierszu) 1-szy sposób (maszyna do pisania)
2. Linia po linii (wiersz po wierszu) 2-gi sposób (wężykiem)
3. Według krzywej Hilberta rzędu k.
5
21.) Przedstawić 2 różniące się między sobą obrazy o parametrach N1=4, N2=2, M=4, Lmin=0
w postaci tablic a następnie wektorów stosując jeden ze znanych sposobów przeglądu obrazu.
Wyznaczyć różnicę pomiędzy tymi obrazami z zastosowaniem metryki ulicznej (Manhattan).
22.) Podać zależność na stopień kompresji obrazu; podać definicję kompresji bezstratnej w
kategoriach wartości metryki odniesionej do obrazu pierwotnego i wynikowego
(zrekonstruowanego).
23.) Podać zależność na stopień kompresji obrazu; podać definicję kompresji stratnej w
kategoriach wartości metryki odniesionej do obrazu pierwotnego i wynikowego
(zrekonstruowanego).
6
24.) Które ze współczynników kształtu (W1, W2, W3, W9, W7, W8) są niezmiennicze
względem skali (wielkości obiektu) i dlaczego?
W3 i W9 są niezmiennicze względem skali, co wynika ze wzoru oraz W7 i W8.
25.) Pokazać na przykładzie, na czym polega główna zaleta metody 3 najbliższych sąsiadów 3-
NN w porównaniu z metodą jednego najbliższego sąsiada 1-NN.
Przy metodzie 1-NN jest brany pod uwagę tylko 1 najbliższy sąsiad, a
przy 3-NN – aż trzech, przy czym większość decyduje, w związku z
czym 3-NN jest mniej podatny na błędy.
26.) Podać przykładowy sposób ukrycia informacji a) obrazowej b) tekstowej w obrazie.
Informacja obrazowa jest ukrywana na najmniej znaczącym bicie obrazu, dla tekstowej – do zapisu jednego
znaku potrzeba dwóch pikseli. Stosuje się przy tym operacje jednopunktowe – progowanie, reedukację
poziomów szarości, rozciąganie, UOP, arytmetyczne i logiczne.