Podstawy informatyki – dr inż. Kamil Sitarski
1
System binarny, szesnastkowy
• System dziesiętny (decimal)
0,1,2,3,4,5,6,7,8,9 10 cyfr
623
(10)
= 6*10
2
+ 2*10
1
+ 3*10
0
• System dwójkowy (binary)
0,1 2 cyfry
101
(2)
= 1*2
2
+ 0*2
1
+ 1*2
0
= 4 + 0 + 1 = 5
(10)
• System szesnastkowy (hexadecimal)
0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F – 16 cyfr
CF
(16)
= 12*16
1
+ 15*16
0
= 192 + 15 = 207
(10)
Podstawy informatyki – dr inż. Kamil Sitarski
2
Reprezentacja danych
• Bit (binary digit) – przyjmuje wartości 1 lub 0 (tak/nie,
prawda/fałsz, jest napięcie/brak napięcia)
• Bajt (byte) – zestaw bitów – najczęściej 8 (oktet)
0111 – bajt o długości 4 bitów
1101 0001 – oktet (zamiennie z bajtem)
1110 0011 1100 - bajt o długości 12 bitów
• Słowo (word)
– 8, 16, 32, 48, 64 bitów na których dokonuje się działań
• Jaką liczbę można reprezentować za pomocą zestawu
bitów o długości n
111 – od 0 do 7 n=3
1111 – od 0 do 15 n=4
x = 2
n
- 1
There are 10 kinds of
people in the world:
those who understand
binary notation, and
those who don't
Podstawy informatyki – dr inż. Kamil Sitarski
3
Reprezentacja danych
• Pojemność dysku twardego 750GB
– Liczba sektorów: 1 465 149 168 * 512 bajtów = 750 156 374
016 bajtów
– 750 156 374 016 / 10
9
= ok. 750,16 GB
– 750 156 374 016 / 2
30
= ok. 698.63 GB
Podstawy informatyki – dr inż. Kamil Sitarski
4
Reprezentacja tekstu - ASCII
ASCII, Strony kodowe, Unicode
Podstawy informatyki – dr inż. Kamil Sitarski
5
Reprezentacja tekstu - ASCII
Podstawy informatyki – dr inż. Kamil Sitarski
6
Reprezentacja tekstu - ASCII
Podstawy informatyki – dr inż. Kamil Sitarski
7
Reprezentacja tekstu - ASCII
Podstawy informatyki – dr inż. Kamil Sitarski
8
Reprezentacja tekstu – strony kodowe
Podstawy informatyki – dr inż. Kamil Sitarski
9
Reprezentacja tekstu – Unicode/Unikod
Unikod przypisuje unikalny
numer każdemu znakowi,
niezależny od używanej
platformy, programu czy
języka.
Podstawy informatyki – dr inż. Kamil Sitarski
10
Reprezentacja obrazu
• Grafika rastrowa
– Siatka pikseli (1024 x 768)
– Każdy piksel przechowuje informację o kolorze
• 1 bit – czarno-biały,
• 8 bitów - pseudokolor (256 kolorów),
• 16 bitów - kolor pełny (65536 kolorów)
• 24 bity - kolor wierny, prawdziwy (16.8 mln barw)
– Reprezentacja kolorów
• RGB (#FF0000, #00FF00, #0000FF)
• CMYK (Cyan, Magenta, Yellow, blacK)
Podstawy informatyki – dr inż. Kamil Sitarski
11
Reprezentacja obrazu
Podstawy informatyki – dr inż. Kamil Sitarski
12
Reprezentacja obrazu
• Popularne formaty plików (raster)
– BMP (bitmap)
• Format uniwersalny (systemy Windows i OS/2)
– GIF (Graphics Interchange Format)
• Kolor 8-bitowy (z 24 bitowej palety)
• Kompresja LZW (bezstratna)
• Możliwość zapisywania informacji o przezroczystości (kanał
alfa) i animacji
• Spopularyzowany przez usługę WWW
– JPEG (Joint Photographic Experts Group)
• Kompresja stratna
• Spopularyzowany przez usługę WWW
Podstawy informatyki – dr inż. Kamil Sitarski
13
Jak wygląda kompresja JPEG
• Transformacja kolorów i redukcja rozdzielczości
– Ludzkie oko jest dużo bardziej wrażliwe na małe zmiany w jasności niż
na małe zmiany w barwie
– Zmniejszamy rozdzielczość barw
• Dekompozycja obrazu na bloki
– 8x8 pikseli + uzupełnianie jeśli nie ma podziału przez 8
• Wykonanie DCT na każdym z bloków obrazu
– DCT (Discrete Cosine Transform)
• Kwantyzacja
– Tu następuje „kompresja stratna”
– Można ustali poziom jakości od 0 do 100
• Przestawienie zygzakowe macierzy DCT i kodowanie Huffmana
– Uporządkowanie macierzy z DCT (grupowanie zer)
– Kodowanie Huffmana – poszukiwanie innej reprezentacji informacji z
wykorzystanie prawdopodobieństwa występowania znaków
Podstawy informatyki – dr inż. Kamil Sitarski
14
Reprezentacja obrazu
• Popularne formaty plików (raster)
– PNG (Portable Network Graphics)
• Format bezstratny
• Możliwość zapisywania informacji o przezroczystości
• „połączenie GIF i JPG”
– TIFF (Tagged Image File Format)
• Podstawowy format w DTP
• Wiele trybów kolorów
• Wybór kompresji: stratna i bezstratna
– RAW
• brak kompresji stratnej
• „cyfrowy odpowiednik negatywu”
• dane z matrycy aparatu (surowe, bez użycia transformacji na JPG –
raw)
Podstawy informatyki – dr inż. Kamil Sitarski
15
Reprezentacja obrazu
• Grafika wektorowa
– Matematyczne odwzorowanie obrazu
• Figury geometryczne
• Bryły geometryczne
– Popularne formaty
• SVG (Scalable Vector Graphics) – standard W3C
dla grafiki wektorowej dla WWW
• CDR – standard firmy Corel Draw
• SWF – standard firmy Adobe (częściowo otwarty)
• EPS – część języka PostScript
Podstawy informatyki – dr inż. Kamil Sitarski
16
Reprezentacja obrazu
• Grafika wektorowa
<svg>
<circle style="fill:yellow; stroke:red;" cx="300" cy="300"
r="20"/>
</svg>
Podstawy informatyki – dr inż. Kamil Sitarski
17
Reprezentacja dźwięku
• Jak przedstawić dźwięk?
– Problemy
• Sygnał analogowy
• Brak odpowiedniego opisu
matematycznego (tylko do prostych
dźwięków)
– Rozwiązanie
• Digitalizacja
– Próbkowanie
– Jakość
» Częstotliwość próbkowania - prawo
Shannona
» Dokładność zapisu wartości
– Konwersja AD/DA
Podstawy informatyki – dr inż. Kamil Sitarski
18
Reprezentacja dźwięku
• Kodowanie dźwięku na płycie CD
– częstotliwość próbkowania 44,1 KHz
• Więcej niż dwukrotna maksymalna częstotliwość
dźwięku słyszalnego
– 16-bitów = 2^16 poziomów = 65536
– Format WAV (WAVeform audio format) – nie
do końca
• Kodowanie PCM
– Ile zajmuje godzina dźwięku?
• 44100 Hz (1/s) * 16 bitów * 3600 s * 2 kanały
= ???
Podstawy informatyki – dr inż. Kamil Sitarski
19
Reprezentacja dźwięku
• Kompresja dźwięku - MP3
– MPEG-1 Layer III
• ISO/IEC-11172-3
• MPEG – Moving Picture Experts Group (grupa
robocza ISO)
– Kompresja stratna
• właściwości ludzkiego ucha (model
psychoakustyczny)
• usuwanie słabszych dźwięków (które i tak pomijamy)
• tryb joint-stereo
• VBR – Variable Bit Rate
Podstawy informatyki – dr inż. Kamil Sitarski
20
Reprezentacja multimediów
• Strumień
– jest serią danych, której kolejne elementy oddziela zmienny
interwał czasu.
• Kontener multimedialny (w jednym pliku różne
strumienie danych)
– Obraz
– Audio
– Wideo
– Tekst
– Metadane
• Formaty
– AVI, MOV, 3GP, ...
Podstawy informatyki – dr inż. Kamil Sitarski
21
Reprezentacja multimediów
• AVI - Audio Video Interleave
– Podział na „kawałki” (FourCC – kodowanie czteroznakowe)
– Możliwość przechowywania danych kodowanych i niekodowanych
• MOV – QuickTime
– Strumień audio:
• MPEG-1 Layer 3 Audio (.mp3)
• MPEG-4 AAC Audio (.m4a, .m4b, .m4p)
• Waveform Audio (WAV)
– Strumień wideo:
• BMP, GIF, JPEG, PNG, ...
• MPEG-1, MPEG-2, MPEG-4 Video
• 3GP - 3rd Generation Partnership Project
– Strumień wideo (MPEG-4 część 2)
– Strumień audio (AMR-NB lub AAC-LC)
Podstawy informatyki – dr inż. Kamil Sitarski
22
Reprezentacja multimediów
• Kodeki (codec – coder / decoder)
– DivX
• Własność firmy DivX, Inc.
• Stratna kompresja – MPEG-4 część 2
• Nie jest to oprogramowanie otwarte
– Xvid
• Jest to oprogramowanie otwarte (dostępność na wiele
platform)
• Stratna kompresja – MPEG-4 część 2
– MPEG-4 Part 2
• Używa DCT (jak w JPEG)
• Jest to międzynarodowy standard, a DivX i Xvid to jego
implementacje