Úvod do metód spracovania zvuku v súčasnom multimediálnom prostredí

<< Späť - Kapitola 6: Porovnanie zvukových formátov <<
^^ Hore - Kapitola 6: Porovnanie zvukových formátov ^^
>> Ďalej - Časť 6.2: Porovnanie bezstratových kompresných schém >>

Časť 6.1: Porovnanie stratových kompresných schém

Ako sme prv spomínali, je náročné kvantifikovať všetky vlastnosti jednotlivých formátov. Na poli stratových kompresných schém je mnoho etablovaných štandardných konkurentov, majú veľmi dobrú softvérovú podporu a niektoré i dobrú hardvérovú podporu. Výpočtová zložitosť transformačných kódovaní je vo všeobecnosti nízka, dokonca sa dá povedať, že je inherentnou vlastnosťou danej schémy a je nemenná, bez ohľadu na zvolený dátový tok či náročnosť skladbyPozn. 1.

Siedme kritérium spomenuté v predošlom texte (úspešnosť kompresie), vzhľadom na stratovosť návrhov, možno len ťažko definovať. V prvom rade si treba uvedomiť, že neexistuje objektívna mierka – filozofia stratových formátov je založená na odstraňovaní psychoakustickej irelevancie, teda jediný, kto môže posúdiť ich úspešnosť, je poslucháč. Posluchový test je jediný spôsob ako rozhodnúť, ktorý formát má „lepšiu kompresiu“.

Ideálne by bolo vedieť vytvoriť škálu kvalít zvukových záznamov a pre jednotlivé algoritmy zistiť, pri akom dátovom toku dosiahnu zvolenú kvalitu. Takýto prístup by však bol veľmi náročný, preto sa používa iný: zvolia sa kategórie, vyjadrené typickým (resp. priemerným) dátovým tokom. Tieto kategórie odzrkadľujú rôzne spôsoby použitia formátu, napr. 40 kbps pre nekvalitné rozhlasové vysielanie, 64 kbps pre kvalitnejšie rozhlasové vysielanie, 80 a 96 kbps pre posluch na prenosných zariadeniach, 128 kbps pre počúvanie na počítači. Len málokedy sa použijú ďalšie kategórie (160 kbps), keďže pri nich už len zriedkavo badať rozdiel medzi originálom a stratovo skomprimovaným záznamom (tzv. priesvitnosť kódovania). Formáty v jednej kategórii sa potom navzájom porovnávajú podľa subjektívnej kvality.

Posluchové testy možno vykonávať na profesionálnej úrovni: starostlivo sa zvolia zvukové záznamy, vyberú vhodní poslucháči a umiestnia sa do vhodnej miestnosti s profesionálnymi slúchadlami na ušiach. Nasleduje posluch, po ňom rozbor výsledkov. Metódy na ich vyhodnotenie sú navrhnuté expertmi. Príkladom profesionálneho testu môže byť napr. verifikácia úspešnosti kódovacej schémy AAC vypracovaná pre MPEG (http://www.tnt.uni-hannover.de/project/mpeg/audio/public/w2006.pdf), alebo posluchový test zvukových formátov pri nízkych dátových tokoch, vypracovaný inštitúciou EBU (http://www.ebu.ch/CMSimages/en/tec_doc_t3296_tcm6-10497.pdf).

Častejšie však iniciujú rôzne posluchové testy „laici“. Zostavia vlastnú zbierku záznamov a umiestnia ju na svoju internetovú lokalitu, aby záujemci otestovali zvolené formáty a odoslali späť výsledky. Testovanie prebieha jedným zo štandardných spôsobov, pochádzajúcich zo sféry profesionálnych posluchových testov. Najrozšírenejšia je metóda ABC/HR. Pri každom zázname („vzorke“) a testovanom formáte má používateľ možnosť prehrať zvuk A, B alebo originál. Jeden zo zvukov A a B je pôvodný záznam (originál), druhý je zakódovaný. Používateľ si zvolí, ktorý z nich (A/B) podľa jeho mienky bol podrobený stratovej kompresii a aká je jeho kvalita. Tú vyjadruje na stupnici 1 (najhoršia) až 5 (neodlíšiteľné od originálu). K použitým formátom sa často dodá tzv. dolná kotva (reprezentujúca veľmi nekvalitný záznam originálu), v prípade testu pri nízkych dátových tokoch aj horná kotva (reprezentujúca veľmi kvalitnú kompresiu), aby zvolené hodnotenie (1-5) viac reprezentovalo objektívnu mierku, nie relatívne zoradenie formátov. Výsledky sa zakreslia do grafu alebo vyjadria číselne ako priemerná odpoveď a štatistická odchýlka pre ten-ktorý formát.

Pre nízke dátové toky sa často používa systém MUSHRA, kde poslucháč jednoducho ohodnotí záznam známkou, pričom si je vedomý, že ide o komprimovaný formát (len nevie, ktorý, keďže ich je v teste viac). Možno sa stretnúť aj s ABX testmi, tie však vykonávajú najmä jednotlivci, aby našli dátový tok, kedy zvolený formát dosahuje pre daný súbor skladieb priesvitnosť. Princíp spočíva v prehratí pôvodného záznamu, zakódovanej verzie a neznámeho záznamu X, ktorý je A alebo B. Úlohou poslucháča je zistiť identitu záznamu X.

Na internete možno násjť niekoľko posluchových testov pochádzajúcich od „nadšencov“ (teda nie profesionálne testy). Základný úvod do techniky posluchových testov, všeobecné rady a niekoľko starých testov (všetko z rokov 2000 až 2002) možno nájsť na stránke používateľa menom ff123 (http://ff123.net). Internetová stránka Brazílčana menom Roberto José de Amorim (http://www.rjamorim.com/test) obsahuje testy vykonané v rokoch 2003 a 2004 pre rôzne formáty a dátové toky. Rumun Sebastian Mares (http://www.maresweb.de/listening-tests) inicioval posluchový test pre 128 kbps pred niekoľkými mesiacmi (20005-12). Ďalším zdrojom výsledkov (aj keď použitá metodika je otázna) je poloprofesionálna stránka http://www.soundexpert.info, na ktorej sú vždy aktuálne výsledky, navyše ich môžu obohatiť návštevníci stránky krátkym posluchom.

Uvádzame tabuľku (tab. 6.1) poskytujúcu prehľad rôznych vlastností a čŕt stratových zvukových formátov. Keď nejaký údaj nebol k dispozícii, alebo je otázny, uvedený je otáznik. Hlavným zdrojom informácií boli spomenuté internetové stránky a stránka http://en.wikipedia.org/wiki/Comparison_of_audio_codecs, o ktorej aktuálnosť sa starajú mnohí jej návštevníci. Treba uviesť, že zistiť všetky vlastnosti a vykonať „objektívne“ ohodnotenie (stĺpce 3-10) formátov pre daný dátový tok je vo svojej podstate nemožné – posluchové testy sa vykonávajú zriedka a testujú sa len malé množiny formátov, zvukových záznamov a dátových tokov, ktoré majú nejakú relevantnú výpoveď. Preto na mnohých miestach známky chýbajú a aj tie udelené sú len aproximáciou relatívnej kvality formátu v uplynulom období (keďže mnoho formátov sa neustále vyvíja a zlepšuje – najlepšími príkladmi sú Ogg Vorbis a AAC). Popis jednotlivých položiek tabuľky:

(Poznámka: technológie DD a CAC sa nezvyknú priamo porovnávať s konkurenciou, keďže ich použitie je špecifické a sú optimalizované na kódovanie priestorového zvuku. Podobne formát Speex – je určený na kompresiu hovoreného slova.)

1
LC3248648096105128256SHVEPOS
MP3ŠT (L)33322211AAWin, Lin, Mac, +
MP3proŠT (L)1111221?AAWin, Lin, Mac, +
AACŠT (L)2222221111AAAWin, Lin, Mac, +
HE-AACŠT (L)112211AAAWin, Lin, Mac, +
WMAPR (L)233323312AAAWin, Mac
WMA ProPR (L)1125AAAWin, Mac
RAPR (L)3431(3)A?AWin, Lin, Mac
ATRACPR (L)3344144??AWin, Lin, Mac, +
DD (AC-3)ŠT (L)Win, Lin, Mac, +
CAC (DTS)ŠT (L)Win, Lin, Mac, +
Ogg VorbisOSI1221112AAAWin, Lin, Mac, +
MPCPR/OS1123AAWin, Lin, Mac, +
SpeexOSI25AAWin, Lin, Mac, +
Tab. 6.1 – Prehľad vlastností vybraných formátov na stratovú kompresiu zvuku

Ťažko určovať víťaza, najmä preto, že každý poslucháč má „iné uši“. Sú ľudia, ktorý nevedia odlíšiť originál od súboru MP3 pri 96 kbps (pri použití kodeku LAME). Nájdu sa však aj takí, pre ktorých je MP3 (LAME) pri 192 kbps ľahko odlíšiteľný od originálu. Najlepšie je teda vyberať podľa osobného sluchu, požiadaviek atď. Čo sa týka kvality pri dátových tokoch 96-192 kbps, zrejme treba odporučiť jeden z formátov MP3 (LAME), Ogg Vorbis (AuTuV), AAC (iTunes a NERO) alebo MPC. To je však aktuálny stav – všeobecne sa predpokladá, že AAC má najväčšiu možnosť zlepšovania a doladzovania kodérov, Ogg Vorbis je na tom svojou konštrukciou veľmi podobne. MP3 a MPC sú na tom kvalitou dobre (napriek zastaranosti návrhov samotných formátov – dôvodom je len veľmi kvalitné doladenie kodérov), no ich ďalšie zlepšovanie sa už nepredpokladá. Z pohľadu komerčného využitia má najväčšie šance na úspech formát AAC.


Poznámka 1: Výnimkou je azda len Ogg Vorbis, ktorý zo svojho návrhu podporuje možnú „asymetrickosť“ schémy – dlhý čas kódovania za účelom zmenšenia dátového toku, no bez zmeny času potrebného na dekódovanie – aj keď v súčasnosti pre tento prístup nejestvuje softvérová podpora.


<< Späť - Kapitola 6: Porovnanie zvukových formátov <<
^^ Hore - Kapitola 6: Porovnanie zvukových formátov ^^
>> Ďalej - Časť 6.2: Porovnanie bezstratových kompresných schém >>

(c) 2006 Pavol Adam
kontakt
Powered by:
ATRIP software