ZESP脫艁 LABORATORI脫W TELEMATYKI TRANSPORTU POLITECHNIKA WARSZAWSKA WYDZIA艁 TRANSPORTU Zak艂ad Telekomunikacji w Transporcie |
---|
LABORATORIUM TELEKOMUNIKACJA KOLEJOWA |
SPRAWOZDANIE Z 膯WICZENIA NR 5
Kompresja danych
Zesp贸艂: Jakub Gruszczy艅ski Barbara Kozak Krystian Lewczuk |
GRUPA LiTTK |
SEMESTR V |
---|
Data wykonania 膰wiczenia 16/01/2014 |
Data oddania sprawozdania 22/01/2014 |
---|
6.2
Pasy.bmp
Szum.bmp
Widok.bmp
W 膰wiczeniu otrzymali艣my trzy przyk艂adowe pliki. Po poddaniu ich kompresji InfranView zmieni艂y one format na .jpg. Wyniki tej kompresji potwierdzaj膮 fakt, 偶e im wi臋kszy wsp贸艂czynnik jako艣ci tym mniejsza wielko艣膰 pliku. Dlatego najmniejsz膮 kompresj臋 ale najwi臋ksz膮 jako艣膰 otrzymywali艣my dla wsp贸艂czynnika 80.
6.5
Pliki s膮 zaprezentowane wg wzoru:
Plik nieskompresowany(nazwa)
Plik skompresowany programem WinZip
Plikskompresowany programem WinRAR
Plik skompresowany programem WinAce
L.p. | Plik | Rozmiar[B] | Entropia | Roz.min.[B] | Wsp.maks[%] | WinZIP[B] | WinRAR[B] | WinACE[B] | Wsp.ZIP | Wsp. RAR | Wsp. ACE |
---|---|---|---|---|---|---|---|---|---|---|---|
1 | szum.bmp | 230454 | 5,837 | 168150 | 27,04 | 176111 | 178698 | 196990 | 0,06 | 0,03 | 4,92 |
2 | szum80.jpg | 31722 | 7,964 | 31580 | 0,45 | 31789 | 31795 | - | 0,09 | 0,45 | 0,46 |
3 | szum50.jpg | 15800 | 7,959 | 15720 | 0,51 | 15886 | 15862 | 15897 | 0,18 | 0,13 | 0,54 |
4 | szum30.jpg | 10363 | 7,939 | 10482 | 0,77 | 10644 | 10631 | 10660 | 0,24 | 0,28 | 0,79 |
5 | pasy.bmp | 230455 | 0,999 | 28765 | 87,52 | 7624 | 3026 | 3464 | 43,38 | 44,60 | 46,98 |
6 | pasy80.jpg | 5001 | 7,504 | 4691 | 6,20 | 2065 | 2026 | 2056 | 1,88 | 1,78 | 1,37 |
7 | pasy50.jpg | 4456 | 6,952 | 3872 | 13,11 | 623 | 610 | 642 | 10,00 | 5,24 | 4,87 |
8 | pasy30.jpg | 4079 | 8,759 | 3,446 | 15,51 | 583 | 575 | 610 | 9,34 | 6,48 | 5,48 |
9 | widok.bmp | 518455 | 7881 | 510737 | 1,49 | 425404 | 340266 | 2653,7 | 0,04 | 0,07 | 1,75 |
10 | widok80.jpg | 52695 | 7975 | 52530 | 0,31 | 52779 | 52770 | 52794 | 0,1 | 0,32 | 0,32 |
11 | widok50.jpg | - | - | - | - | - | - | - | - | - | - |
12 | widok30.jpg | - | - | - | - | - | - | - | - | - | - |
13 | tekst.doc | 220161 | 4087 | 112485 | 4,891 | 45111 | 37232 | 38518 | 0,33 | 0,09 | 0,13 |
14 | tekst.txt | - | - | - | - | - | - | - | - | - | - |
15 | 123.txt | - | - | - | - | - | - | - | - | - | - |
16 | wykonaj.exe | 1243969 | 7958 | 1038480 | 0,52 | 1005090 | 1004605 | 1007420 | 0,00 | 0,00 | 0,01 |
17 | faktura.xls | 274433 | 4950 | 169798 | 38,13 | 86181 | 77787 | 78152 | 0,10 | 0,05 | 0,07 |
18 | biblio.mdb | - | - | - | - | - | - | - | - | - | - |
POR脫WNANIA HISTOGRAM脫W WYJ艢CIOWYCH ORAZ PO KOMPRESJI:
Plik faktura.xls nieskompresowana. Rozmiar pliku to 274 000B.
[WinRAR]: Z tego histogramu mo偶emu odczyta膰, 偶e du偶a ilo艣膰 danych w pliku zosta艂a skompresowana r贸wnomiernie. Rozmiar pliku skompresowanego 77 000B.
[WinZip]: Sytuacja podobna jak powy偶ej, du偶a ilo艣膰 danych skompresowana r贸wnomiernie. Rozmiar pliku skompresowanego 86 000B.
[WinACE]: R贸wnie偶 i w tej sytuacji kompresja danych pliku faktura.xls wygl膮da podobnie. Rozmiar pliku skompresowanego 78聽000B.
Plik wykonaj. exe bez kompresji. Rozmiar pliku to 1 243 000 B.
[WinRAR]: Plik o bardzo du偶ej entropii oraz bardzo ma艂ej podatno艣ci na kompresj臋. Rozmiar pliku skompresowanego 1 000聽000B.
[WinZIP]: Bardzo du偶a r贸wnomierno艣膰, kompresja podobnie jak w poprzednim przypadku. Rozmiar pliku skompresowanego 1 000聽000B.
[WinACE]: Sytuacja identyczna jak w dw贸ch poprzednich pr贸bach kompresji. Rozmiar pliku skompresowanego 1 000聽000B.
Plik tekst.doc nieskompresowany. Rozmiar pliku to 220 000B.
[WinRAR]: Bardzo du偶a podatno艣膰 na kompresj臋, r贸wnomierne roz艂o偶enie danych. Rozmiar pliku to 37 000B.
[WinZip]: Bardziej chaotyczne roz艂o偶enie danych ani偶eli w programi WinRAR, jednak plik ci膮gle wykazuje bardzo du偶膮 podatno艣膰 na kompresj臋. Rozmiar pliku to 45 000B.
[WinACE]: Tak samo jak w przypadku WinRAR r贸wnomierne uporz膮dkowanie danych, du偶a podatno艣膰 na kompresj臋. Rozmiar pliku to 38 000B.
Plik pasy.bmp nieskompresowany. Rozmiar pliku to 230 000B.
[WinRAR]: Bardzo dobra kompresja danych ze wzgl臋du na prostot臋 pliku graficznego. Rozmiar pliku to 3000B.
[WinZip]: Histogram przedstawia kompresje pas贸w w spos贸b r贸wnomierny. Rozmiar pliku po kompresji 7600B
[WinACE]: Sytuacja podobna jak wcze艣niej. Rozmiar pliku to 1000B
[InfranView]:
Plik pasy30.bmp nieskompresowany ma艂a ilo艣膰 danych roz艂o偶onych r贸wnomiernie.
Ma艂a ilo艣膰 danych kompresowana na pocz膮tku procesu du偶a efektywno艣膰 kompresji.
Plik pasy50.bmp Wzrost jako艣膰 pliku powoduje nier贸wnomierno艣膰 rozk艂adu danych
Plik o 艣redniej jako艣ci o lekkim rozrzucie danych poddany kompresji o du偶ej efektywno艣ci i r贸wnomierno艣ci.
Plik pasy80.bmp o najwi臋kszej jako艣ci najwi臋kszym rozmiarze i du偶ej ilo艣ci danych.
Plik o ma艂ej podatno艣ci na kompresje dane uk艂adaj膮 si臋 r贸wnomiernie w ka偶dym przypadku.
Plik szum.bmp nieskompresowany du偶a ilo艣c danych roz艂o偶ona nier贸wnomiernie.
Plik szum30.bmp nieskompresowany du偶a r贸wnomierno艣膰 danych i entropia wskazuj膮 na ma艂a podatno艣膰 na kompresj臋
Plik szum50.bmp Choatyczno艣膰 rozk艂adu danych du偶a entropia ma艂a podatno艣膰 na kompresje
Plik o du偶ej ilo艣ci danych roz艂o偶onych choatycznie minimum podatno艣ci na kompresje
Plik szum80.bmp dane roz艂o偶one chaotycznie entropia du偶a ma艂a podatno艣膰 na kompresje
Plik o du偶ej jako艣ci wizualnej a co za tym idzie ma艂ej podatno艣ci na kompresje dane rozk艂adaj膮 si臋 w spos贸b chaotyczny.
Plik widok.bmp nieskompresowany du偶a r贸wnomierno艣膰 danych plik podatny na kompresje
Plik o 艣redniej podatno艣ci na kompresje o czym 艣wiadczy du偶a entropia i histragramy
Plik widok30.jpg nieskompresowany du偶a chaotyczno艣膰 danych ma艂a podatno艣膰 na kompresje
Du偶a z艂o偶ono艣膰 pliku wp艂ywa na jego problemy z kompresj膮 dane kompresowane s膮 w spos贸b chaotyczny i nier贸wnomierny co wp艂ywa na znikomo艣膰 kompresji ca艂ego pliku
Plik widok50.jpg nieskompresowany plik o du偶ej entropii i minimalnej podatno艣ci na kompresj臋
Plik .jpg o z艂o偶onej strukturze tzn du偶ej ilo艣ci danych kompresuje si臋 w spos贸b minimalny o czym 艣wiadcz膮 histogramy kt贸re s膮 niemal identyczne
Plik widok80.jpg du偶a ilo艣膰 informacji chaotyczno艣膰 roz艂o偶enia minimalna podatno艣膰 na komrpesje
Plik .jpg o z艂o偶onej strukturze tzn du偶ej ilo艣ci danych kompresuje si臋 w spos贸b minimalny o czym 艣wiadcz膮 histogramy kt贸re s膮 niemal identyczne
6.6
Na podstawie obserwacji podczas zaj臋膰 stwierdzamy, 偶e warto艣膰 wsp贸艂czynnika jako艣ci ma wprosproporcjonalny wp艂yw na rozmiar pliku .jpg. Je偶eli plik tekstowy lub graficzny zawiera bardzo du偶o szczeg贸艂贸w (np. widok.bmp) to kompresja takiego pliku jest minimalna. Entropia pokazuje swoj膮 warto艣ci膮, 偶e im mniejsza jest tym wsp贸艂czynnik kompresji jest wi臋kszy. Najwi臋ksz膮 podatno艣膰 na kompresj臋 wykazuj膮 pliki tekstowe. Pliki kompresowali艣my za pomoc膮 3 program贸w, najwi臋ksz膮 zdolno艣膰 kompresji plik贸w wykazuje program WinRAR.
Wnioski:
Histogramy plik贸w w kt贸rych wyst臋puje ma艂a entropia oraz wersje skompresowane tych plik贸w wykazuj膮 du偶膮 podatno艣膰 na kompresj臋. Dlatego mo偶emy wysn膮膰 tez臋, 偶e im wi臋ksza jest entropia tym mniejsza podatno艣膰 pliku na kompresj臋. Najmniejsz膮, praktycznie minimaln膮 podatno艣膰 na kompresj臋 danych wykazuj膮 np. pliki wykonawcze Windows oraz bazy danych o du偶ej entropii. Dane na histogramach s膮 roz艂o偶one chaotycznie z powodu du偶ej ilo艣ci danych. Pliki graficzne w kt贸rych jest mniejsza ilo艣膰 danych (tj. o mniejszej jako艣ci) s膮 bardziej podatne na kompresj臋 ni偶 pliki graficzne o lepszej jako艣ci.