prezentacja nr2

Informacja podstawowe pojęcia i teoria informacji
TECHNOLOGIA INFORMACYJNA
PODSTAWOWE POJCIA
�� Informacja (łac. informatio - wyobrażenie, pojęcie)
to pojęcie o wielu definicjach w różnych
dziedzinach.
�� Zasadniczo mamy dwa podstawowe punkty
widzenia na informację:
�� Pierwszy, który można nazwać obiektywnym
(wywodzącym się z nauk ścisłych), gdzie informacja
oznacza pewną własność fizyczną lub strukturalną
obiektów
�� Drugi, subiektywny (kogniwistyczny), gdzie informacją
jest to, co umysł jest w stanie przetworzyć i wykorzystać
do własnych celów.
INFORMACJA SUBIEKTYWNA
�� W tym ujęciu informacja jest indywidualną lub
grupową interpretacją otrzymanego ciągu
sygnałów i musi zawsze opisywać stan jakiejś
dziedziny.
�� Informacja jest przetwarzana przez naszą wiedzę i
w wyniku daje inną informację lub nową wiedzę. W
zależności od tzw. indywidualnego systemu
konceptualizacji, ten sam ciąg sygnałów/znaków
może być zródłem różnych informacji dla różnych
osób lub robotów.
INFORMACJA OBIEKTYWNA
�� W teorii informacji Shannona, informacja jest
mierzona jako prawdopodobieństwo zajścia
zdarzenia. Zdarzenia mniej prawdopodobne dają
więcej informacji
�� Podejście obiektywne pomija znaczenie
(semantykę), jakie niesie komunikat, a skupia się
jedynie na jego składni (syntaktyce).
�� Jeżeli danymi nazywamy wszystko to co jest
przetwarzane, to informacja jest danymi, ale nie
każde dane są informacją (np. 5 a 5�C)
POSTAĆ PRZETWARZANEJ INFORMACJI
�� Współczesne systemy informacyjne to >
przeważającej części systemy cyfrowe operujące
na sygnałach cyfrowych będących dyskretną
reprezentacją danych ze świata rzeczywistego -
determinantą tego trendu są systemy
komputerowe w swojej naturze będące binarną
podgrupą systemów cyfrowych.
�� Reprezentacja informacji ograniczona jest tu do
zaledwie dwóch stanów znamiennych umownie
oznaczanych wartościami 0 i 1 - pojedynczy
symbol (bit) pozwala na reprezentowanie
informacji typu Prawda Fałsz, Tak - Nie itp.
POSTAĆ ANALOGOWA A CYFROWA
�� Przebieg napięcia jest sygnałem ciągłym, ponieważ
może przyjmować dowolną wartość z określonego
zakresu zmienności. Tak prosta definicja sygnału
analogowego jest w zupełności wystarczająca dla
potrzeb analizy systemów przetwarzania danych
�� Urządzenia transmisji danych wykorzystują sygnały
cyfrowe, które mogą znajdować się w jednym z
możliwych stanów znamiennych ze skończonego
zbioru stanów.
�� Szczególnym przypadkiem sygnału cyfrowego jest
sygnał binarny przyjmujący tylko dwie wartości (np.
poziomy napięcia 0 i 5V)
POSTAĆ ANALOGOWA A CYFROWA
�� Poniższy rysunek przedstawia sygnał cyfrowy, który
przyjmuje jeden z dwóch stanów +5 V lub 0 V, jest to
zatem przykład sygnału binarnego
�� Sygnał składa się z binarnych elementów, nazywanych
bitami, o czasie trwania równym T sekund (elementowa
podstawa czasu). Jeżeli napięcie +5 V reprezentuje stan
binarny 1", a napięcie 0 V stan binarny 0" (dodatnia
konwencja logiczna), to sygnał cyfrowy z rysunku
odpowiada sekwencji binarnej 1011".
BUDOWA BAJTU
�� Pojedynczy symbol binarny może odpowiadać 21=2
stanom, a zatem informacja, którą przenosi to nic
innego jak włączony/wyłączony , prawda/fałsz
itp.
�� Jeżeli chcemy przekazywać większą ilość
informacji użytecznej, grupujemy pojedyncze bity w
grupy zawierające osiem bitów, nazywane bajtami
�� Przyporządkowanie każdemu bajtowi, a więc
każdej sekwencji ośmiu bitów, jednego znaku
pozwala przekazywać użyteczne informacje.
Przyporządkowanie to jest znane pod nazwą
kodowania
BUDOWA BAJTU
�� 256 kombinacji ośmiu bitów w zupełności wystarcza do
oznaczenia wszystkich klawiszy w klawiaturze
komputerowej
�� Podobnie jak w notacji dziesiętnej położenie
poszczególnych bitów w liczbie dwójkowej ma istotne
znaczenie: bit o numerze 0 generuje wkład 20=1 w
wartość liczby dwójkowej, bit 3 generuje wkład 23=8, itd.
BUDOWA BAJTU
�� Dla powyższego przykładu mamy:
�� Pomijamy wszystkie bity o wartości 0 (bit
0,2,3,4,5,6)
�� Dla pozostałych realizujemy sumę ich wartości": bit
o numerze 1 generuje wkład 21 = 2 w wartość liczby
dwójkowej, bit 7 generuje wkład 27 =128.
�� Suma wartości to 2 + 128 = 130 - czyli sekwencja
1000010 w systemie dwójkowym jest równoważna
liczbie 130 w systemie dziesiętnym
BUDOWA BAJTU
�� W wielu zastosowaniach praktycznych
wykorzystywane są grupy 4 bitów w szczególności
w szesnastkowym systemie liczbowym
(oznaczanym hex od hexadecimal) z podstawą
rozwinięcia równą 16
�� W takim ujęciu bity 7..4 nazywa się górnym
półbajtem, natomiast bity 3..0 dolnym półbajtem
�� W notacji szesnastkowej sekwencję 1000001
interpretujemy jako
1000 0010 czyli 82 hex ( = 130 dec)
�� W systemach komputerowych o Unix'owych
korzeniach" często wykorzystywany jest system
ósemkowy (octalny, oznaczany skrótem oct)
KODY ZNAKOWE
�� Kody znakowe służą do kodowania zbioru znaków lub
symboli, na przykład znaków występujących na
klawiaturze komputerowej
�� Efektywna komunikacja nie jest możliwa, jeżeli
wymieniające informację urządzenia nie będą
interpretować kombinacji kodowych dokładnie w ten
sam sposób
�� ASCII jest skrótem od American Standard Code for
Information Interchange - Standardowy Kod
Amerykański dla Wymiany Informacji.
�� Kod ASCII został opracowany przez ANSI (ang. American
National Standards Institute -Amerykański Instytut
Normalizacji), a z upływem czasu uzyskał powszechną
akceptację na aronie międzynarodowej.
KODY ZNAKOWE
�� Kod ASCII wykorzystuje 7-bitowe kombinacje kodowe do
reprezentacji następujących znaków:
Litery duże ABCD...Z
Litery małe abcd...z
Cyfry 0123...9
Znaki interpunkcji ,.!:;?
Znaki specjalne ESC CTRL STX ETX XON XOFF itp.
�� Dosyć często kod ASCII jest traktowany jako podstawa
do kodów ośmiobitowych
�� W komputerach IBM PC dodatkowych 128 kombinacji
bitów służy do kodowania znaków graficznych oraz
znaków narodowych
KODOWANIE yRÓDAOWE
�� Zadaniem nadajnika jest przekształcenie danych
zródłowych do postaci przystosowanej do transmisji w
kanale telekomunikacyjnym
�� Celem operacji jest maksymalizacja szybkości transmisji
danych, a to nie zawsze jest równoznaczne z szybkością
transmisji informacji
�� Jeżeli informacje generowane przez zródło zawierają
nadmiar, odpowiednia kompresja danych może skrócić
przekazywane wiadomości
�� Prostym przykładem jest transmisja pliku tekstowego
pomiędzy dwoma komputerami, gdzie modem zródłowy
usuwa nadmiarowe bajty danych jeszcze przed ich
transmisją.
KODOWANIE yRÓDAOWE
�� Załóżmy że przesłany plik zawiera ciąg znaków
�� NUMER RACHUNKU~~~~~~~SALDO,
gdzie ~ oznacza znak spacji.
�� Nadajnik przekazuje tę sekwencję w postaci
NUMER RACHUNKU$7SALDO,
gdzie znak $ jest znakiem usuwania spacji.
�� Odbiornik po napotkaniu symbolu specjalnego $
wykonuje operację odwrotną do nadajnika
odtwarzając w ten sposób sekwencję pierwotną (w
tym przypadku dodaje 7 spacji)
KODOWANIE yRÓDAOWE ALFABET MORSE A
�� Wynaleziony w 1830 r. przez amerykańskiego
malarza-portrecistę Samuela F.B. Morse'a
�� Pierwszy próbny przekaz odbył się w 1844 r
pomiędzy miastami Washington a Baltimore
�� W systemie tym poszczególnym symbolom
przypisane są określone sekwencje kropek i
kresek.
�� Czas trwania kropki traktuje się jako jednostkę
czasu w strukturze sygnału. Kreska odpowiada
trzem kropkom. Odstęp pomiędzy znakami to 3
kropki, słowa oddziela się przerwą o długości 3
kresek
ALFABET MORSE A
DETEKCJA BADÓW - PARZYSTOŚĆ
�� Parzystość umożliwia wykrywanie pewnych błędów, które
mogą pojawić się w wiadomości przekazywanej od
nadajnika do odbiornika. W celu skorygowania błędu
zniekształcony znak musi być przesłany jeszcze raz
�� Pojedynczy bit parzystości jest wystarczający do detekcji
błędów w wiadomościach o długości nie przekraczającej
ok. 12 bitów
�� Wszystkie schematy wykrywania i korekcji błędów
opierają się na dodawaniu do przekazywanej
wiadomości redundancji umożliwiającej po stronie
odbiorczej rozróżnienie wiadomości uszkodzonych od
poprawnych
DETEKCJA BADÓW - PARZYSTOŚĆ
�� Bez uzupełniającej redundancji każda wiadomość musi
zostać uznana za poprawną gdyż nie ma sposobu na
rozróżnienie wiadomości uszkodzonych od poprawnych
�� Rozważmy dla przykładu zdanie pits miał ogon , które
bez trudu odczytamy jako pies miał ogon . Język polski
zawiera redundancję, co umożliwia wykrywanie
przekłamań oraz ich korekcję
�� Jeżeli jednak pits miał ogon" nie jest zdaniem, a tylko
ciągiem przypadkowych kombinacji dowolnych czterech
liter (tzn. usunęliśmy redundancję), nie istnieje sposób
stwierdzenia, czy kombinacje są poprawne czy też nie.
DETEKCJA BADÓW - PARZYSTOŚĆ
�� Kontrola parzystości polega na dodaniu do
przekazywanej wiadomości tzw. bitu parzystości w taki
sposób, że przekazywana wiadomość zawiera albo
parzystą, albo nieparzystą liczbę jedynek, w zależności
od tego, czy jest stosowana normalna czy negatywna
kontrola parzystości.
�� Kontrola parzystości umożliwia detekcję dowolnej
nieparzystej liczby błędów
�� Kontrola parzystości dodaje redundancję wystarczającą
do wykrycia przypadku przekłamania informacji nie daje
natomiast możliwości korekty wykrytego błędu w inny
sposób niż poprzez ponowne przesłanie zniekształconej
informacji
DETEKCJA BADÓW - CIEKAWOSTKA
�� Proszę szybko przeczytać poniższe akapity:
�� Zdognie z nanjwoymszi baniadmai
perzporawdzomyni na bytyrijskch uweniretasytch
nie ma zenacznia kojnolesc Itier przy zpiasie
dengao solwa.
�� Nwajzanszyeim jest, aby prieszwa i otatsnia Iteria
była na siwom mijsecu, ptzosałoe mgoą być w
niaedziłe i w dszalym cąigu nie pwinono to
sawrztać polbemórw ze zozumierniem tksetu.
�� Dzijee sie tak datgelo, ze nie czamyty wyszistkch
Iteir w sołwie, ale cłae sołwa od razu.
TEORIA INFORMACJI
�� Teoria informacji dostarcza odpowiedzi na
fundamentalne pytanie inżynierii informacyjnej:
czym jest informacja?
�� Pierwszą zasadą jaka funkcjonuje w teorii
informacji jest fakt, iż teoria informacji nie
interesuje się wagą czy znaczeniem
przypisywanym przez nas do wiadomości (zatem
informację wylądowali kosmici traktujemy na
równi z przypaliłeś grzankę )
�� Drugą istotną prawidłowością jest zasada iż
zaskakująca nas wiadomość niesie ze sobą duży
ładunek informacyjny, wiadomość oczekiwana
dostarcza nam niewiele informacji.
TEORIA INFORMACJI
�� Zawartość informacyjna wiadomości (I) w teorii
informacji jest wielkością nieujemną, I >= 0.
�� Korzystając z rachunku prawdopodobieństwa
możemy przypisać wiadomości oczekiwanej duże
prawdopodobieństwo odbioru (wiadomość
prawdopodobna), natomiast wiadomości
zaskakującej małe prawdopodobieństwo
(wiadomość nieprawdopodobna)
�� Prawdopodobieństwo (P) jest miarą przypisywaną
zdarzeniu, przyjmującą wartości z zakresu
1 e" P e" O, przy czym P = 0 oznacza zdarzenie
nieprawdopodobne, przy P = 1 zdarzenie jest
pewne
TEORIA INFORMACJI
�� Wystąpienie zdarzenia pewnego nie powie nam
niczego nowego, a więc jeżeli P = 1, to również
I = 0. Wystąpienie zdarzenie niemożliwego niesie
nieskończoną ilość informacji, tzn. przy
P = 0 mamy także I = ".
�� Zawartość informacyjna jest mierzona w bitach, a
związek pomiędzy zawartością informacyjną (I)
wiadomości, a prawdopodobieństwem (P) jego
nadania wyraża zależność:
1
I log2
P
TEORIA INFORMACJI
�� Rozważmy doświadczenie o dwóch możliwych
wynikach A oraz B, pojawiających się z
jednakowym prawdopodobieństwem, odpowiednio
PA oraz PB. Stąd:
�� PA + PB = 1, oraz PA = PB = 0,5.
�� Zawartość informacyjna wiadomości podającej
otrzymany wynik doświadczenia wynosi
I = Iog2(1/0,5) = 1 bit, zatem taka wiadomość
może być przekazana za pomocą jednego bitu
�� Jeżeli prawdopodobieństwa zdarzeń nie są
jednakowe, ilość informacji zawartej w
pojedynczym znaku binarnym jest mniejsza od
jednego bitu
TEORIA INFORMACJI
�� Średnia zawartość informacyjna wiadomości
jest znana pod nazwą entropii (H).
�� Rozważmy ponownie dwa zdarzenia A oraz B, o
niekoniecznie jednakowych
prawdopodobieństwach PA oraz PB ich
wystąpienia:
1 1
H PA log2 PB log2
PA PB
�� Stąd ponieważ PB = 1 - PA otrzymujemy:
1 1
H PA log2 1 PA log2
PA 1 PA
TEORIA INFORMACJI
�� Na poniższym rysunku przedstawiono wykres
średniej zawartości informacyjnej (H)
przekazywanej w pojedynczym znaku binarnym w
funkcji prawdopodobieństwa PA, przy założeniu
bezpamięciowości zródła:
TEORIA INFORMACJI
�� W przypadku n jednakowo prawdopodobnych
wiadomości prawdopodobieństwo każdej z nich
wynosi P = 1/n, a zawartość informacyjna przypisana
do każdej wiadomości jest równa
I = log2(n) bitów
�� Jeżeli wiadomości nie są jednakowo prawdopodobne,
zawartość informacyjna przypisana poszczególnym
wiadomościom jest równa:
1
Ii log2
Pi
�� Oczekiwana ilość informacji przekazywanej przez
wiadomość wynosi:
n n
1
.
H PiIi Pi log2 bitów
Pi
i 1 i 1
KODOWANIE HUFFMANA
�� Jest jednym z możliwych zastosowań teorii
informacji, mającym na celu powiększenie
szybkości transmisji informacji poprzez eliminację
redundancji w przekazywanej informacji.
�� Rozpatrzmy przykład:
KODOWANIE HUFFMANA TWORZENIE DRZEWA
�� W każdym kroku procedury kodowania Huffmana
zmniejszamy ilość uwzględnianych jeszcze symboli
o jeden poprzez połączenie dwóch symboli o
najmniejszych prawdopodobieństwach.
�� Dla danych z rysunku w pierwszym kroku należy
połączyć symbole E oraz F w symbol złożony
E lub F o prawdopodobieństwie wystąpienia 0,2
�� Symbole złożone należy ustawiać w kolejnych
kolumnach (kolejne etapy) możliwie jak najwyżej.
�� Procedurę tę powtarzamy tak długo, aż w kolumnie
pozostaną dokładnie dwa symbole.
KODOWANIE HUFFMANA TWPRZENIE
SAOWNIKA NA PODSTAWIE DRZEWA
�� W utworzonym drzewie każde dwa łączone
symbole oznaczamy arbitralnie 1 lub O
(ostatnie elementy każdej kolumny).
�� Po zakończeniu procedury należy z otrzymanego
diagramu odczytać słowa kodowe przypisane do
poszczególnych symboli poruszając się od
korzenia do liści utworzonego drzewa
�� Przykładowo symbolowi A zostaje
przyporządkowane słowo kodowe 01
�� Utworzony w ten sposób słownik ma dodatkową
cechę: żaden z jego symboli kodowych nie jest
prefiksem któregokolwiek innego symbolu

Wyszukiwarka

Podobne podstrony:
instrukcja prezentacja2
Prezentacja MG 05 2012
Prezentacja ekonomia instytucjonalna na Moodle
Sekrety skutecznych prezentacji multimedialnych
413 (B2007) Kapitał własny wycena i prezentacja w bilansie cz II
18 Prezentacja
prezentacja z budo
Antygeny i Imunogennosc PREZENTACJA
Etapy tworzenia prezentacji
Geneza polityki spójności Unii Europejskiej prezentacja
Prezentacja VI dzia
Prezent urodzinowy dla Hitlera

więcej podobnych podstron