PSK2-2

Název školy: Vyšší odborná škola a Střední průmyslová škola, Božetěchova 3
Autor: Ing. Marek Nožka
Anotace: Princip ztrátové komprese dat
Vzdělávací oblast: Informační a komunikační technologie
Předmět: Počítačové sítě a komunikační technika (PSK)
Tematická oblast: Vrstvy protokolu TCP/IP
Výsledky vzdělávání: Žák objasňuje princip ztrátové komprese dat a ukazuje ho na konkrétních příkladech.
Klíčová slova: zdrojové kódování, komprese dat, ztrátová komprese dat, redundance, irelevance
Druh učebního materiálu: Online vzdělávací materiál
Typ vzdělávání: Střední vzdělávání, 3. ročník, technické lyceum
Ověřeno: VOŠ a SPŠE Olomouc; Třída: 3L
Zdroj: Vlastní poznámky, Wikipedia, Wikimedia Commons

Ztrátová komprese

Kompresní poměr

Kompresní poměr je podíl velikosti nekomprimovaných (vstupních) dat ku velikosti komprimovaných (výstupních) dat. Například při kompresi souboru o velikosti 10MB do souboru s velikostí 2MB je poměr 10:2 = 5 (tj. poměr 5:1). Kompresní poměr je ovlivněn volbou kompresního algoritmu i typem komprimovaných dat.

Ztrátová komprese

Ztrátová komprese dat je založena na snížení tzv. irelevance (irelevantní znamená bezvýznamný, nepodstatný, vedlejší). To znamená, že z přenášených dat odstraníme informace, které jsou nedůležité.

Tento způsob komprese je často velmi výhodný protože vykazuje mnohem lepší kompresní poměr. Ztrátu některých informací vyvažuje velmi výrazné zmenšení objemu dat. Například video se komprimuje vždy ztrátově.

Pozor: Jedna a ta stejná informace může být v jednom případě velice důležitá, a v jiném úplně nepodstatná.

Zcela jinak budeme vnímat detaily na stejné fotografii zhotovené jednou na formátu $9\times{13}$ cm a podruhé na formátu $30\times40$ cm.

Při ztrátové kompresi se některé méně důležité informace nenávratně ztrácejí a z takto zkomprimovaných dat již nelze zrekonstruovat data původní.

Na následujících obrázcích je stejná fotografie JPEG. Velice zjednodušeně se dá říct, že tento formát slévá pixely podobné barvy do jedné oblasti.

_
Kvalita 90%. Velikost: 114 KB.

_
Kvalita 20%. Velikost: 17 KB.

_
Kvalita 7%. Velikost: 7,3 KB.

Princip činnosti

Po úvodním předzpracování se přeskupí a/nebo transformují data tak, aby bylo možno lehce oddělit důležité informace od nedůležitých. Nedůležité informace se pak potlačí mnohem více než důležité a nakonec se výsledek zkomprimuje některým z bezztrátových kompresních algoritmů.

Je nutné mít k dispozici, kvalitní psychovizuální nebo sychoakustický model, který určuje, jaká data mohou být potlačena nebo dokonce úplně odstraněna. Využívá se zde například:

Nedokonalost lidského zraku:
Lidské oko vnímá více detailů v jasu (tedy pomocí kontrastu) a méně v barvě. Rozlišuje jen omezený počet barev a odstínů šedi. Schopnost ostrého vidění závisí na intenzitě světla.
Nedokonalost lidského sluchu:
Pokud znějí dva tóny současně, může jeden z nich potlačit slyšitelnost toho druhého. Tato neschopnost slyšet oba současné tóny se nazývá frekvenční maskování. Podobně funguje tzv. časové maskování. Pokud po hlasitém tónu následuje stejný tón s menší hlasitostí, je jeho vnímání potlačeno.

Běžně používané kompresní formáty počítačových souborů

Pod pojmem soubor se v informatice rozumí pojmenovaná uspořádaná kolekce dat uložená na nějakém datovém médiu. Formát souboru pak udává, jak do něj data zakódovat a jak je číst. Přehled nejpoužívanějších formátů souborů podává následující tabulka.

Ztrátová komprese Bezztrátová komprese
Data ZIP, 7-zip, RAR, Gzip, bzip2
Obrázky JPEG, JPEG 2000 TIFF, GIF, PNG
Zvuk FLAC MP3, WMA, Ogg Vorbis, AAC
Video MPEG-1, MPEG-2, MPEG-4, Ogg