PSK2-3

Název školy: Vyšší odborná škola a Střední průmyslová škola, Božetěchova 3
Autor: Ing. Marek Nožka
Anotace: Běžně používané kompresní formáty počítačových souborů
Vzdělávací oblast: Informační a komunikační technologie
Předmět: Počítačové sítě a komunikační technika (PSK)
Tematická oblast: Vrstvy protokolu TCP/IP
Výsledky vzdělávání: Žák vyjmenovává správně zařazuje běžně používané kompresní souborové formáty; rozeznává výhody a nevýhody jednotlivých formátů
Klíčová slova: komprese dat, ztrátová komprese dat, data, zvuk, obraz
Druh učebního materiálu: Online vzdělávací materiál
Typ vzdělávání: Střední vzdělávání, 3. ročník, technické lyceum
Ověřeno: VOŠ a SPŠE Olomouc; Třída: 3L
Zdroj: Vlastní poznámky, Wikipedia, Wikimedia Commons

Běžně používané souborové formáty

Běžně používané kompresní formáty počítačových souborů

Pod pojmem soubor se v informatice rozumí pojmenovaná uspořádaná kolekce dat uložená na nějakém datovém médiu. Formát souboru pak udává, jak do něj data zakódovat a jak je číst. Přehled nejpoužívanějších formátů souborů podává následující tabulka.

Ztrátová komprese Bezztrátová komprese
Data ZIP, 7-zip, RAR, Gzip, bzip2
Obrázky JPEG, JPEG 2000 TIFF, GIF, PNG
Zvuk FLAC MP3, WMA, Ogg Vorbis, AAC
Video MPEG-1, MPEG-2, MPEG-4, Ogg

Formáty pro obecná data

ZIP je populární, nicméně už několik let překonaný souborový formát pro kompresi a archivaci dat. Jeho vylepšená varianta 7-Zip má mnohem lepší kompresní poměr. Nespornou výhodou ZIP je jeho standardnost a všudypřítomnost na všech platformách.

7-Zip je vylepšenou variantou formátu ZIP a dosahuje lepšího kompresního poměru. Cenou za něj je větší výpočetní náročnost, která ale díky dnešním rychlím počítačům nemá tak velký význam.

RAR stejně jako formát 7-Zip (7z) dosahuje při kompresi velmi dobrých výsledků a nabízí řadu pokročilých funkcí, které ostatní formáty nenabízí. Hlavním programem pro manipulaci s tímto formátem je WinRAR, který zvládá jak kompresi, tak dekompresi. Autor WinRARu dal k dispozici zdrojové kódy dekomprimačního programu, díky tomu je možné RAR dekomprimovat i v jiných programech na různých platformách.

Gzip je formát rozšířený zejména v operačních systémech typu UNIX. Výhodou je jeho volná šiřitelnost. Je obsažen také v protokolu http, který pomocí něj umožňuje přenášet data komprimovaně.

bzip2 pochází taky z prostředí operačního systému UNIX, a je také volně šiřitelný. Je mladší než Gzip a podobá se moderním formátům jako RAR a 7-zip, které ho v některých případech překonávají.

TAR je formát pouze pro archivaci, ne pro kompresi. Umožňuje sdružit více souborů nebo adresářů do jednoho archivačního souboru. Používá se v součinnosti s formáty Gzip a bzip2, které umí komprimovat pouze jediný soubor. Toto rozdělení úloh na archivaci a komprimaci vychází z filozofie operačního systému UNIX. Soubor s koncovkou .tar.gz nebo .tgz je archivován TARem a komprimován GZIPem. Podobně je tomu u přípony .tar.bz2

Na následující obrázcích je perokresba jednou ve formátu PNG a podruhé ve formátu JPEG. Povšimněte si "smetí", které JPEG udělá kolem hran.

JPEG
_
JPEG

PNG
_
PNG

Formáty pro obrázky

JPEG je používán pro ukládání počítačových obrázků ve fotorealistické kvalitě. Používá ztrátovou kompresi, jejíž úroveň lze nastavit. Je to nejčastější formát používaný na World Wide Webu pro fotografie. Není však vhodný pro perokresbu, zobrazení textu nebo ikony, protože kompresní metoda JPEG vytváří v takovém obrazu viditelné a rušivé artefakty (obrazy, které původní data neobsahují). Pro tyto účely se většinou používají soubory PNG a GIF.

JPEG 2000 je vylepšenou variantou formátu JPEG. Při stejném kompresním poměru poskytuje lepší kvalitu než klasický JPEG. Není zatím příliš rozšířen.

TIFF je grafický formát, určený pro podobné účely jako JPEG -- zejména pro fotografie. Data mohou být uložena buď bez komprese nebo pomocí bezztrátové komprese. Ve srovnání s JPEG je tedy kvalitnější, ale data mají větší objem.

GIF na rozdíl od formátu JPEG, používá bezztrátovou kompresi. Je tedy vhodný pro uložení perokresby (nápisy, plánky, loga). GIF umožňuje také jednoduché animace a podporuje průhlednost. Jeho výrazným omezením je maximální počet současně použitých barev -- 256.

PNG byl vyvinut jako zdokonalení a náhrada formátu GIF, který byl patentově chráněný (dnes jsou patenty prošlé). Nemá jako GIF omezení na maximální počet 256 barev a nabízí lepší kompresi. Na druhou stranu PNG nepodporuje jednoduché animace. Může být použit i pro fotografie, ale oproti JPEG má výrazně menší kompresní poměr.

Formáty pro Zvuk

FLAC (Free Lossless\footnote{bezztrátový} Audio Codec) je open source zvukový bezztrátový kodek. Princip jeho fungování se dá přirovnat ke komprimačním programům typu RAR nebo ZIP s tím rozdílem, že tyto programy se používají na jakákoliv data. FLAC se specializuje na hudbu, a proto je jeho stupeň komprese vyšší. Patří pod Ogg.

MP3 (MPEG-1\footnote{viz video} Layer 3) je formát ztrátové komprese zvukových souborů, založený na kompresním algoritmu MPEG. Při zachování CD kvality umožňuje zmenšit velikost hudebních souborů přibližně na desetinu, u mluveného slova však dává výrazně horší výsledky.

MP3 se snaží odstranit irelevanci zvukového signálu na základě psycho-akustického modelu. Tedy ze vstupního signálu se odeberou informace, jež člověk neslyší, nebo si je neuvědomuje. Využívá se principů časového a frekvenčního maskování.

WMA (Windows Media Audio) je formát vyvinutý jako součást Windows Media. Byl původně určen jako náhrada za MP3. Je kvalitnější, ale méně rozšířený.

Ogg je celá rodina formátů a kodeků. Je to zároveň i multimediální kontejner. Ogg si klade za cíl vyvinout open-source komponenty pro kódování a dekódování multimediálního obsahu.

Z projektu Ogg je nejznámější Vorbis. Ten má stejný účel jako dnes už mírně zastaralý ale stále nejvíce používaný MP3 oproti kterému vykazuje mírně lepší vlastnosti. Dále je známí formát a kodek Speex pro kompresi lidské řeči.