Úvod do metód spracovania zvuku v súčasnom multimediálnom prostredí

<< Späť - Časť 4.2: MPEG-1/2 Audio (MP3) <<
^^ Hore - Kapitola 4: Prehľad stratových zvukových formátovu ^^
>> Ďalej - Časť 4.4: Windows Media Audio (WMA) >>

Časť 4.3: MPEG-2/4 Audio (AAC)

V tejto časti práce sa oboznámime s formátom AAC (angl. Advanced Audio Coding) a jeho modifikáciami. AAC v súčasnosti ponúka asi najefektívnejšie kódovanie zvuku od silno stratového kódovania (počnúc dátovým tokom 2 kbps) po úplne priesvitný záznam pri dátových tokoch nižších než MP3. (Pre bližšie informácie týkajúce sa štandardov MPEG čitateľa odporúčame na odsek 3.5.10 MPEG.)

AAC bol navrhnutý ako nástupca MP3 v štandardoch MPEG-2 a MPEG-4, ako štandard bol schválený v apríli r. 1997. Hlavný podiel na jeho vývoji mala firma Dolby. Ponúka široké spektrum nastavení – vzorkovacia frekvencia od 8 kHz do 96 kHz, počet kanálov 1 až 48 (celý frekvenčný rozsah), navyše do 15 LFE kanálov (frekvenčný rozsah do 120 Hz) a 15 nezávislých dátových kanálov. Bitová hĺbka vzorky 8, 16, 24 bitov, dátový tok na kanál do 256 kbps.

Na okná veľkosti 2048 vzoriek (prekrývanie okien 50%, teda veľkosť rámca je polovičná) sa priamo aplikuje MDCT, v prípade náročných pasáží možno veľkosť okna zmenšiť na 256 vzoriek. Formát AAC je navrhnutý modulárne – používateľ si môže vybrať z viacerých druhovPozn. 1:

Formát AAC sa zväčša ukladá do kontajnera definovaného ako súčasť MPEG-4 (part 14), ktorý je len vylepšeným kontajnerom .mov QuickTime od ApplePozn. 5. Štandardná prípona by mala byť .mp4, používatelia sa však skôr stretnú s príponami používanými službou iTunes – .m4a (súbory s prídavnými informáciami ako audio knižky, albumy s hyperlinkami atď.) a .m4p (klasické audio súbory, chránené DRM schémou). AAC zahŕňa niekoľko stupňov ochrany pred chybami v prenosovom kanáli, počnúc úpravou kódových tabuliek, cez algoritmy na detekciu chyby, končiac samoopravnými kódmiPozn. 6. Formát AAC uložený podľa špecifikácie MPEG-2 (s tým sa možno stretnúť už len zriedkaPozn. 7) používa príponu .aac a nepodporuje DRM schémy. Používa vlastnú identifikačnú značku, ktorej špecifikácia však nie je verejne dostupnáPozn. 8.

Ďalšou technológiou použitou v AAC je percepčná náhrada šumu (angl. Perceptual Noise Substitution, PNS), ktorej úlohou je detegovať v signáli šumové zložky a tie nekódovať štandardnými technikami, ale parametricky popísať. Dekodér dostane informácie o frekvenčnom pásme, ktoré šum zaberá, a jeho energii. Výsledkom je teda nedeterministické dekódovanie signálu (generovaný šum má charakter pseudonáhodných čísel). AAC v sebe zahŕňa aj technológiu tvarovania šumu v časovej doméne (angl. Temporal Noise Shaping, TNS). Ide o spätne adaptívnu predikciuPozn. 9 spektrálnej charakteristiky záznamu v časovom priebehu, ktorá sa prispôsobuje signálu – v prípade bohatého frekvenčného spektra reaguje znížením rozlíšenia vo frekvenčnej doméne, stáva sa však citlivejšou v časovej doméne, redukujúc tak problém predozveny. Z TNS údajne ťažia najmä záznamy hovoreného slova – ich kvalita sa má drasticky zvýšiťPozn. 10. Presnejší popis možno nájsť napr. v HERRE, Jürgen. Temporal Noise Shaping … 1999.

O spopularizovanie AAC sa postarala najmä firma Apple, ktorá ho od r. 2003 natívne podporuje vo svojich produktoch a službách (iTunes, iPod). Dôvodom je najmä možnosť integrovania DRM schém (FairPlay a HymnPozn. 11). Licencovaním je poverená dcérska spoločnosť konzorcia Dolby – Via Licensing (http://www.vialicensing.com).


Poznámka 1: V MPEG-2 označovaných profil, v MPEG-4 zas typ objektu. Z pohľadu MPEG-4 sú unikátne len prvé štyri, ostatné sú len špeciálnymi prípadmi predošlých, resp. nachádzajú sa v osobitných špecifikáciách.

Poznámka 2: Občas tiež Sample Rate Scalable, AAC-SRS.

Poznámka 3: P. časť 4.11 Kompresia hovoreného slova.

Poznámka 4: Princíp škálovateľného kódovania p. v odseku 3.4.3 Hybridné a škálovateľné kódovanie.

Poznámka 5: Preto je jeho štruktúra takmer zhodná s týmto formátom, ktorý je lepšie popísaný napr. na stránkach http://developer.apple.com/documentation/QuickTime/RM/PDF.htm.

Poznámka 6: Na stránke http://www.iis.fraunhofer.de/amm/techinf/mpeg4/error.html možno nájsť prehľad použitých technológií.

Poznámka 7: Šírenie zvuku vo formáte AAC v kontajneri definovanom v MPEG-2 je však hojne využívané v prípade internetových rádií, keďže tento spôsob je pre nich bezplatný. Komerčné používanie kontajneru MPEG-4 so sebou prináša platenie licenčných poplatkov.

Poznámka 8: „AAC uses yet another tagging format, which does not at present have a published spec as of 3/1/2006.“ (Zdroj: http://www.id3.org/faq.html.)

Poznámka 9: Porov. termín dopredne adaptívna predikcia v odseku 3.4.2 Kódovanie lineárnou predikciou.

Poznámka 10: Zdroj: http://www.iis.fraunhofer.de/amm/techinf/aac/index.html.

Poznámka 11: Obe nakoniec boli prelomené – zásluhu na tom mal najmä Jon Johansen („DVD Jon“).

Odsek 4.3.1: HE-AAC (AACplus)

Formát s názvom Vysokoefektívne AAC (angl. High Efficiency AAC, HE-AAC) nazývaný tiež AACplus, je jedným z rozšírení pôvodného formátu štandardom MPEG-4. Je určený na nízke dátové toky. K AAC dodáva technológiu SBR. Ak sa navyše použije technológia PS (parametrické stereo, tiež z dielne Coding Technologies), ide o HE-AAC v2 (AACplus v2). Princíp PS spočíva v hĺbkovej analýze stereofonickej informácie v zázname, pričom rozdiely medzi kanálmi (nielen frekvenčné a amplitúdové, ale podľa potreby už aj fázové) sa následne efektívne popíšu v „postranných informáciách“ pôvodného toku dát (s nízkym dátovým tokom). Pôvodné dva signály sú sčítané a komprimované ako mono záznam. Vďaka tejto technológii podáva HE-AAC pri dátovom toku 48-64 kbps v porovnaní s konkurenciou vynikajúci výkon, rovnako exceluje pri 5.1 zvuku a dátovom toku 160 kbpsPozn. 1.


Poznámka 1: Porov. MELTZER, Stefan – MOSER, Gerald. MPEG-4 HE-AAC v2 ….

Odsek 4.3.2: Zhrnutie

Medzi výhody formátu AAC oproti MP3 patrí lepšia podpora pre zvuky s vysokým rozlíšením, viackanálový zvuk, presnejšia reprodukcia (priama analýza MDCT bez stratovej dekompozície na subpásma), vyššia kvalita pri rovnakom dátovom toku, lepšia ochrana pred chybami, flexibilnejšie využívanie stereofonickej redundancie (osobitné techniky pre rôzne časti frekvenčného spektra), podpora pre gapless playback (ak je formát uložený v kontajneri MPEG-4) a mnoho iného. Existuje niekoľko rozšírených kodérov, za najlepší sa považuje ten od firmy Apple (iTunes AAC), okrem neho ponúka svoje algoritmy aj napr. Nero (Nero AAC), medzi bezplatnými opensource projektmi dominuje FAAC.

AAC je však pre veľa ľudí celkom neznámy formát – napriek jeho veku, hovorí sa o ňom málo. Zatiaľ. Jeho podpora stále rastie a v súčasnosti ho možno prehrať na veľkom množstve multimediálnych mobilných telefónov, niektorých hracích konzolách atď.

Rôzne referencie a technické detaily možno nájsť napr. na stránkach http://www.audiocoding.com/modules/wiki/?page=AAC a http://www.chiariglione.org/MPEG/tutorials/papers/icj-mpeg4-si/09-natural_audio_paper/gacoding.html.


<< Späť - Časť 4.2: MPEG-1/2 Audio (MP3) <<
^^ Hore - Kapitola 4: Prehľad stratových zvukových formátovu ^^
>> Ďalej - Časť 4.4: Windows Media Audio (WMA) >>

(c) 2006 Pavol Adam
kontakt
Powered by:
ATRIP software