Wprowadzenie do przetwarzania obrazów
Akwizycja obrazu jest procesem pozyskiwania informacji o otaczającym świecie i przekształcania jej na postać obrazu będącego notacją „wyglądu” obserwowanej sceny. Klasyczne obrazy są obrazami analogowymi. Obraz cyfrowy powstaje z obrazu analogowego w wyniku procesów próbkowania i
kwantowania. Do akwizycji obrazów cyfrowych mogą zostać wykorzystane różne urządzenia
techniczne, takie jak cyfrowy aparat fotograficzny, kamera cyfrowa, skaner.
Przetwarzanie obrazu jest to stosowanie szeregu przekształceń poprawiających jakość obrazu (np. eliminujących jego zbędne lub szkodliwe składowe/zakłócenia/) pod kątem uwypuklenia treści istotnych dla analizy obrazu. Proces poprawy jakości obrazu nie prowadzi do zwiększenia jego treści, ale może ułatwić jej wydobycie.
Analiza obrazu jest procesem wyodrębniania z obrazu informacji istotnej z punktu
widzenia rozpoznawania obrazu. Wynikiem analizy obrazu są dane (informacja) stanowiące opis obrazu. Opis obrazu jest znacznie bardziej podatny na zastosowanie metod i algorytmów
rozpoznawania niż sam obraz. Podczas analizy obrazu gubiona jest bezpowrotnie pewna część informacji.
Rodzaje obrazów - w technice cyfrowej korzysta się z następujących rodzajów obrazów: obrazu czarno-białego (binarnego), obrazu monochromatycznego, obrazu kolorowego.
Obraz czarno-biały - wyróżnia się w nim tylko dwa poziomy szarości, najczęściej czarny i biały.
Obraz monochromatyczny – obraz o większej od dwóch liczbie poziomów szarości.
Barwa – wrażenie psychiczne wywoływane w mózgu człowieka (i zwierząt), gdy oko odbiera promieniowanie elektromagnetyczne z widzialnej części fal świetlnych.
Modele przestrzeni barw - zaliczamy: model RGB, model CMYK, model HSV.
Nazwa modelu CMYK powstała ze złożenia pierwszych liter angielskich nazw barw: C – Cyan (cyjan), M – Magenta (magenta), Y – Yellow (żółta) i ostatniej litery angielskiej nazwy barwy czarnej – blacK. Nazwa modelu RGB powstała ze złożenia pierwszych liter angielskich nazw barw: R – Red (czerwonej), G – Green (zielonej) i B – Blue (niebieskiej). Model RGB ma zastosowanie zarówno w technice analogowej, jak i cyfrowej. Jest szeroko wykorzystywany w urządzeniach wyświetlających obraz (np. telewizory, monitory komputerowe) oraz w urządzeniach analizujących obraz (np. aparaty cyfrowe, skanery) . HSV - Model jest rozpatrywany jako stożek, którego podstawą jest koło barw. Wymiary stożka opisuje składowa S (nasycenie barwy) jako promień podstawy oraz składowa V (wartość barwy – jasność barwy) jako wysokość stożka.
Macierz binarna służy do zapisu obrazu czarno-białego i jest macierzą, której elementy przyjmują tylko dwie wartości – czerni przypisuje się wartość 0 (zerowa jasność), a bieli wartość 1 (maksymalna jasność). Do zapamiętania pojedynczego punktu obrazu wystarczy jeden bit pamięci.
Macierz poziomów szarości - służy do zapisu obrazu monochromatycznego, a wartości jej elementów kodują jasności poszczególnych punktów obrazu. Do zapamiętania stopnia szarości pojedynczego punktu stosuje się zazwyczaj 8 bitów pamięci (klasa uint8). Pozwala to na zapamiętanie 28, czyli 256 stopni (poziomów) szarości – poszczególne elementy macierzy przyjmują wartości
całkowite z przedziału [0, 255].
Macierz RGB to macierz o wymiarach M×N×3 (M×N – rozmiar obrazu), będąca w zasadzie złożeniem macierzy poziomów nasycenia trzech podstawowych barw składowych: M×N×R, M×N×G, M×N×B (trzeci wymiar macierzy wskazuje odpowiednią barwę składową). W przypadku kodowania obrazu danymi klasy uint8, poszczególne elementy kolejnych macierzy M×N×R, M×N×G, M×N×B przyjmują wartości całkowite z przedziału [0, 255], co odpowiada 256 poziomom nasycenia odpowiednio barw czerwonej, zielonej lub niebieskiej.
Macierz indeksów - podobnie jak macierz RGB, służy do zapisu obrazu kolorowego.
Stosuje się tutaj inną niż poprzednio metodę zapisu kolorów poszczególnych elementów
obrazu. Obraz indeksowany składa się z dwóch macierzy: macierzy (o wymiarach M×N)
indeksów (klasy uint lub double) do macierzy kolorów oraz trójkolumnowej macierzy
(mapy) kolorów (dane klasy double).
Grafika rastrowa (mapa pikseli) – obraz opisany jest za pomocą siatki (macierzy, tablicy) pikseli. Formaty: JPEG, GIF, PNG, TIFF, RAW.
Grafika wektorowa (obiektowa) – obraz opisany jest za pomocą figur geometrycznych (w przypadku grafiki dwuwymiarowej) lub brył geometrycznych (w przypadku grafiki trójwymiarowej), umiejscowionych w matematycznie zdefiniowanym układzie współrzędnych, odpowiednio dwu- lub
trójwymiarowym. Formaty: CDR, DWG, WMF, SVG, SWF, VSD.
Obraz cyfrowy powstaje na etapie akwizycji sprzętowej w wyniku procesu dyskretyzacji, składającego się z procesów próbkowania i kwantowania.
Próbkowanie obrazu (dyskretyzacja przestrzenna obrazu) powoduje podział przestrzenny ciągłego
analogowego obszaru obrazu na jego elementarne jednolite części zwane pikselami.
Próbkowanie przestrzenne obrazu – wyznaczenie średniej wartości obrazu z bardzo małego obszaru
obrazu odpowiadającego rozmiarowi elementu światłoczułego matrycy.
Kwantowanie obrazu (dyskretyzacja barwna obrazu) powoduje podział zakresu wartości (poziomów szarości /dla obrazów monochromatycznych/ lub poziomów intensywności /nasycenia/ barw /dla obrazów kolorowych/) obrazu analogowego na skończoną liczbę rozłącznych przedziałów i przyporządkowanie tym przedziałom wartości dyskretnych, czyli tak zwanych poziomów reprezentacji.
Rozdzielczość przestrzenną obrazu można zdefiniować jako uporządkowaną parę liczb:
(N/dx, M/dy) gdzie: dx, dy – liniowy rozmiar obrazu analogowego odpowiednio w poziomie i w pionie; N, M – liczba punktów (pikseli) obrazu cyfrowego odpowiednio w poziomie i w pionie
(liczba kolumn i wierszy macierzy /tablicy/ pikseli). Rozdzielczość przestrzenną obrazu (gęstość punktów próbkowania) podaje się w pikselach na milimetr lub punktach na cal (ppi – pixels per inch, dpi – dots per inch, spi – samples per inch). Rozdzielczość barwną obrazu determinuje liczba dostępnych poziomów reprezentacji szarości lub intensywności barwy punktów (pikseli) obrazu cyfrowego.
Rozdzielczość barwną obrazu determinuje liczba dostępnych poziomów reprezentacji szarości lub intensywności barwy punktów (pikseli) obrazu cyfrowego. Wartość poziomu szarości lub intensywności barwy punktu (piksela) L obrazu cyfrowego spełnia warunek:
L(m,n) e P/(wmax – wmin) gdzie: m, n – dyskretne współrzędne punktu (piksela) obrazu cyfrowego;
wmax, wmin – odpowiednio najwyższa i najniższa wartość szarości lub intensywności barwy;
P – zbiór liczb całkowitych z przedziału [0, 2B– 1].
Dla obrazów binarnych do zapamiętania stanu jednego piksela wystarczy 1 bit pamięci. Dla obrazów monochromatycznych do zapamiętania stanu jednego piksela używa się zazwyczaj 8 bitów (bajt). Dla obrazów kolorowych (macierz RGB) do zapamiętania wartości poziomu intensywności (nasycenia) każdej barwy podstawowej używa się zazwyczaj 8 bitów, zatem do zapamiętania stanu jednego piksela potrzeba wówczas 24 bitów.
Przekształcenia punktowe obrazu cyfrowego są to przekształcenia dotyczące stopnia szarości lub intensywności barwy poszczególnych punktów (pikseli) obrazu.
Normalizacja obrazu polega na sprowadzeniu przedziału zmian wartości poziomów szarości lub intensywności barwy punktów (pikseli) obrazu źródłowego do pewnego, ustalonego zakresu.
Histogram danych obrazu jest funkcją przypisującą każdemu poziomowi szarości lub intensywności barwy liczbę punktów (pikseli) obrazu o tym poziomie jasności.
Wyrównywanie histogramu polega na takim przekształceniu wartości poziomów szarości lub intensywności barwy poszczególnych punktów (pikseli) obrazu źródłowego, aby liczba punktów w każdym z przedziałów histogramu była w przybliżeniu taka sama (aby w miarę równomiernie rozmieszczone słupki miały podobną wysokość).
Binaryzacja polega na przekształceniu źródłowego obrazu mającego wiele poziomów
szarości lub intensywności barwy w wynikowy obraz binarny, którego punkty (piksele) mogą przyjmować tylko dwie wartości.
Korekcja gamma to przekształcenie punktowe mające za zadanie przeskalowanie wartości jasności obrazu.
Współczynnik gamma - określa stopień korekcji nierównomiernego przedstawiania jasnych i ciemnych pikseli w stosunku do średnich w monitorach.
Wyjaśnij pojęcia: akwizycja, analiza, przetwarzanie i rozpoznawanie obrazów.
Akwizycja obrazu - przetworzenie obrazu obiektu fizycznego (f(x,y)) do postaci zbioru danych dyskretnych (obraz cyfrowy) nadających się do dalszego przetwarzania.
Elementy procesu akwizycji:
- Oświetlenie obrazu. - Formowanie obrazu (optyczne). - Detekcja obrazu. - Formowanie wyjściowego sygnału z urządzenia (kamera, skaner)
Przetwarzanie obrazów – To stosowanie szeregu przekształceń mających na celu poprawić jakość obrazu i uwypuklenie treści istotnych w kontekście analizy obrazu. Przetwarzanie cyfrowe obrazów obejmuje m.in. operacje: - filtrowania - binaryzacji - transformacji geometrycznej
Analiza obrazu – wyodrębnianie z obrazu informacji istotnej z punktu widzenia rozpoznawania obrazu. Wynikiem analizy są dane stanowiące opis obrazu. Podczas analizy tracone są bezpowrotnie pewne informacje o obrazie.
Rozpoznawanie obrazu – interpretacja zawartości obrazu, wynikiem rozpoznawania jest decyzja. Może to być np. identyfikacja elementow obrazu, rozpoznanie elementow i ich stanów.
Dokonaj podziału obrazów pod względem zakresu reprezentacji barw. Wymień podstawowe modele przestrzeni barw i rozwiń ich nazwy.
Model RGB Red Green Blue (biały 255 255 255) jest jednym z pierwszych praktycznych modeli przestrzeni kolorów zawierającym receptę dla tworzenia barw. Barwy podstawowe: są to trzy barwy proste, dobrane tak, że przez zmieszanie dowolnych dwóch spośród nich nie jest możliwe uzyskanie trzeciej, natomiast przez mieszanie trzech można uzyskać wrażenie dowolnej barwy prostej.
Czerń znajduje się w początku układu, i ma wartości R=0, G=0, B=0, czyli brak światła. Przeciwległy róg to biel, o wartościach R=100%, G=100%, B=100%. Zauważmy, że na krawędziach niestykających się z punktem czerni i bieli znajdują się barwy proste. Przekątna sześcianu, od punktu czerni do bieli, reprezentuje skalę szarości, czyli wszystkie punkty, dla których R=G=B. Poszczególne wartości składowe tego modelu mogą przyjmować wartości od 0 do 255
Model CMYK Cyan Magenta Yellow blacK w praktyce barwy CMY nie sumują się do czerni. Pomijając skomplikowane zagadnienia ściśle kolorymetryczne, trzeba podkreślić, że drukowanie jest zawsze konkretnym procesem fizyko-chemicznym dalekim od ideału. Co zaś najważniejsze, aby osiągnąć sumowanie się barwnika, farby są półprzeźroczyste, "rozwodnione". W efekcie pełnego nałożenia na siebie farb C, M i Y otrzymujemy taką samą szaro-brązową barwę, jaką ma woda po malowaniu akwarelkami. Dlatego w praktyce używa się jeszcze czwartej farby, czarnej, dla wydobycia głębi kolorów i podkreślenia kontrastów (oznaczonej K, jak kontrast lub jak blacK).
Model HSV (Hue Saturation Value) określa wartości opisujące barwę (ang. Hue), nasycenie (ang. saturation) i jasność (ang. brightness). Są to cechy, które odbiera ludzkie oko na podstawie wrażenia psychofizycznego. W modelu HSB nie jest stosowane mieszanie kolorów składowych. To powoduje, że często odnalezienie koloru za pomocą tych wartości jest łatwiejsze
Zapisz kolor biały za pomocą parametrów poznanych modeli barw.
RGB 255 255 255 CMYK 0 0 0 HSV 0 0 100%
Wyjaśnij określenia macierz RGB i macierz indeksów zwracając uwagę na istniejące między nimi różnice.
Macierz RGB macierz MxNx3, MxN wymiary obrazu. Trzeci wymiar macierzy to wartości nasycenia poszczególnych kolorow. Umozliwia to odwzorowanie 256 stopni kolorów i około 16mln kolorów
Macierz indeksow – obraz tworzy się na podstawie 2 macierzy – macierzy indeksow MxN i macierzy kolorów – 3kolumnowej gdzie poszczególne kolory RGB mieszcza się pomiedzy wartościami 0,1. Macierz indeksow wskazuje wiersze macierzy kolorow i tym samym kolor przyporządkowany konkretnemu punktowi obrazu
Wyjaśnij różnice między obrazem w postaci mapy pikseli (bitmapy) a reprezentacją wektorową obrazu.
Bitmapa – obraz zapisany jest za pomocą siatki pikseli.
Reprezentacja wektorowa – obraz zapisany jest za pomocą figur Bryl geometrycznych umiejscowionym w matematycznie zdefiniowanym układzie współrzędnych.
Wyjaśnij pojęcia próbkowanie i kwantowanie obrazu oraz określenia piksel i BPP.
Próbkowanie obrazu podział analogowego, ciągłego obrazu, na dyskretyzowany. Polega na odczycie wartości z ustalonym krokiem (stala czasowa). Podczas próbkowania w dół (zmniejszania ilości pikseli), pewne informacji są usuwane z obrazu. Podczas ponownego próbkowania w górę obraz jest uzupełniany o nowe piksele. Użytkownik sam określa interpolację, czyli metodę dodawania lub usuwania pikseli z obrazu
Kwantowanie – podzial zakresu wartości sygnaly analogowego na skonczona liczbe przedziałów i przyporzadowanie tym przedziałom konkretnych wartości dyskretnych czyli tzw poziomów reprezentacji
Piksel – połaczenie słów Picture+Element – najmniejszy jednolity element obrazu.
Wyjaśnij na czym polegają i czym się charakteryzują przekształcenia punktowe obrazu. Podaj i opisz przykłady.
Przekształcenia punktowe, zwane inaczej przekształceniami bezkontekstowymi, są to przekształcenia dotyczące stopnia szarości lub nasycenia barwy każdego punktu obrazu oddzielnie. W przekształceniach punktowych wartości stopnia szarości lub nasycenia barwy poszczególnych punktów obrazu stanowią wynik operacji algebraicznych prowadzonych tylko na tym punkcie.
Wyjaśnij pojęcie histogram obrazu. Naszkicuj przykładowe histogramy obrazu ciemnego, jasnego, o niskim kontraście, o wysokim kontraście.
Histogram obrazu w odcieniach szarości wyznaczany jest jako suma wszystkich pikseli o danej wartości. W histogramie zawarta jest informacja o kontraście i jasności obrazu. Dane zawarte w histogramie umożliwiają również polepszenie jakości obrazu. Możliwe operacje to m.in. rozjaśnianie i przyciemnianie obrazu, zwiększanie i zmniejszanie kontrastu, korekcja gamma, wyrównywanie histogramu oraz rozciąganie histogramu.
Wyjaśnij pojęcie korekcja gamma obrazu. Zdefiniuj określenie współczynnik gamma.
Korekcja gamma to przekształcenie punktowe mające za zadanie przeskalowanie wartości jasności obrazu.
Współczynnik gamma - określa stopień korekcji nierównomiernego przedstawiania jasnych i ciemnych pikseli w stosunku do średnich w monitorach
Wyjaśnij na czym polega normalizacja i wyrównywanie histogramu obrazu. Naszkicuj przykładowy histogram obrazu ciemnego i histogram wyrównany tego obrazu.
Wyrównywanie histogramu - ma na celu takie dobranie wartosci aby wykres był mozliwie "płaski". W praktyce wyrównywanie histogramu sprowadza się do wykonania przeksztalcenia obraz. Operacja wyrównywania histogramu pozwala na uwypuklenie tych szczegółów w obrazie, które z uwagi na niewielki kontrast sa mało widoczne.
Normalizacja histogramu jest prostą operacją punktową stosowaną w celu poprawy obrazów o złym kontraście. Zakładamy że wartości pikseli należą do podprzedziału <0,255>. wyszukujemy minimalną (minPix) oraz maksymalną (maxPix) wartość piksela. Następnie dla każdego piksela na obrazie wykonujemy następujące przekształcenie:
pixel[x,y]=255*(pixel[x,y]-minPix)/(maxPix-minPix)