Úvod do metód spracovania zvuku v súčasnom multimediálnom prostredí

<< Späť - Časť 3.4: Princípy bezstratovej kompresie zvuku <<
^^ Hore - Kapitola 3: Digitálny svet zvuku ^^
>> Ďalej - Kapitola 4: Prehľad stratových zvukových formátov >>

Časť 3.5: Zvuk v súčasnom svete elektroniky

Čitateľa sme v predošlých častiach práce (3.3 a 3.4) oboznámili s rozličnými spôsobmi kompresie zvuku. Chýba však celkový pohľad na spracovanie zvuku, na súčasný stav a trendy v práci s ním. V tejto časti práce, pozostávajúcej až z jedenástich odsekov, preberieme technologické aspekty, štandardy a normy v spracovaní zvuku do tej miery, aby sme tento základný prehľad poskytli.

Začneme hardvérom v odseku 3.5.1 Štruktúra zvukového systému PC. V odsekoch 3.5.2 Priestorový zvuk a zvukové kanály a 3.5.3 Priestorový zvuk v softvéri sa oboznámime so stereofonickými technikami v praxi. Odseky 3.5.4 Zvuková syntéza a MIDI a 3.5.5 Hudobné sekvencery, moduly nám poskytnú alternatívne pohľady na prácu s hudbou a jej komponovanie. Odsek 3.5.6 Ochrana duševného vlastníctva je pojednaním o autorských právach a ich dôsledkoch a prínosoch do sveta multimédií. V odsekoch 3.5.7 Úložné médiá a 3.5.8 Zvuk a video sa čitateľ dozvie čosi o minulých, aktuálnych i budúcich trendoch v ukladaní zvukových dát a ich komerčnej využiteľnosti. Krátky odsek 3.5.9 Rozhrania na prenos zvuku popíše rôzne spôsoby na prenos digitálneho zvuku. Odsek 3.5.10 MPEG prináša prehľad o funkcii tejto organizácie a jej vplyve na svet multimédií. Tematiku uzatvára odsek 3.5.11 Predpokladaný vývoj.

Odsek 3.5.1: Štruktúra zvukového systému PC

Napriek názvu tohto odseku sa tu uvedený opis vzťahuje do značnej miery na všetky osobné počítače, nielen na PC. Popíšeme si základné funkčné jednotky zvukového systému a zhrnieme jeho vývoj v priebehu uplynulých rokov.

Jadrom spracovania zvuku na PC je zvuková karta. V podstate ide o prídavné zariadenie (nemusí byť v PC prítomné), aj keď je v súčasnosti zvuková karta súčasťou asi každej matičnej dosky na trhu. Na matičnú dosku sa zvyčajne pripája rozhraním PCI, výnimočne cez USB či Firewire, v budúcnosti sa zrejme presadí nové sériové rozhranie PCI-Express. Zvukové karty majú niekoľko analógových vstupov (linkový vstup, mikrofónny vstup) a výstupov (dvojice výstupných reproduktorov), občas je prítomný aj digitálny výstup S/PDIF. Koncovky sú realizované ako samičie jack konektory (3,5 mm), okrem mikrofónneho vstupu zvyknú byť typu stereo. Počet výstupných koncoviek je závislý od počtu podporovaných kanálov. V prípade dvojkanálovej zvukovej karty je to jedna (stereo) koncovka, štvorkanálová používa dve, šesťkanálová tri, osemkanálová štyri. (S väčším množstvom kanálov sa v praxi nestretávame.) Zvukové karty rozšírené na trhu zväčša používajú štandardné farebné odlíšenie jednotlivých konektorov – mikrofónnemu vstupu je priradená ružová farba, linkovému vstupu modrá, hlavnému výstupu (predné reproduktory) zelená, druhému čierna; digitálny výstup používa oranžovú farbu. S príchodom viackanálového zvuku a potrebou vtesnať na malú plochu karty dostatok vstupných a výstupných koncoviek prišla aj potreba multifunkčných koncoviek – tak sa stáva, že oranžová koncovka je popri digitálnom výstupe použitá i na stredný a basový reproduktor (piaty a šiesty kanál; samozrejme, cez digitálny výstup sa môžu prenášať všetky kanály naraz, nemusí teda vzniknúť potreba používať digitálny i analógový výstup súčasne). Zadným priestorovým reproduktorom (siedmy a ôsmy kanál) sa priraďuje koncovka rozličných farieb (zväčša hnedá). V najnovších zvukových kartách sa dokonca objavuje technológia „jack sensing“Pozn. 1, ktorá umožňuje karte zistiť (resp. softvérovo nastaviť) význam jednotlivých koncoviek (vrátane toho, či ide o vstupný alebo výstupný signál).

Na zvukovej karte sa nachádza niekoľko obvodov. V prvom rade je to kodek, teda kombinácia A/D a D/A prevodníkaPozn. 2. Ďalším (s kodekom historicky najstarším) základným obvodom je operátor frekvenčnej modulácie, generujúci zvukové charakteristiky hudobných nástrojov. Najväčšiu popularitu získali čipy od japonskej firmy Yamaha a OPLPozn. 3 sa stalo de-facto štandardom. Až omnoho neskôr, s rastom výpočtovej kapacity a pamäte počítačov, sa na zvukové karty určené pre domácich používateľov dostáva digitálny signálový procesor (DSP), ktorý jej umožňuje v reálnom čase spracúvať a upravovať digitálne zvukové dáta (kompresia akustickej hladiny, frekvenčné filtre, umelý dozvuk, efekty atď.). Prvé zvukové karty zvykli mať jeden alebo dva kanály (tvoriace stereofonickú bázu) a neboli plne duplexné (nemohli súčasne zaznamenávať a reprodukovať zvuk). Neskôr pribudla nielen plná duplexnosť, ale najmä počet nezávislých kanálov, s ktorými mohla zvuková karta pracovaťPozn. 4. V súčasnosti je tento počet aspoň 16. Na plošnom spoji zvukovej karty sa nachádzajú ešte vstupné a výstupné zosilňovače a rôzne podporné obvody.

Komunikácia so zvukovou kartou prebieha zo strany softvéru použitím ovládačov zvukovej karty, nainštalovaných v použitom operačnom systéme (komunikujú cez zbernicu s DSP). Možno zachytávať priamy zvuk zo vstupov (linkový vstup, mikrofón), resp. posielať zvuk priamo na výstup (resp. výstupy). Dáta sa prenášajú vo forme PCM, počet kanálov, vzorkovaciu frekvenciu a rozlíšenie vzorky možno vybrať z rozsahu podporovaného zvukovou kartou. V súčasnosti sú rozšírené najmä stereo (2.0) a 5.1 (ojedinele 7.1 alebo 4.0) karty, podporované vzorkovacie frekvencie sú 44.1 kHz, 48 kHz, začína sa objavovať 96 kHz (ojedinele 192 kHz; samozrejme, karty podporujú aj niektoré nižšie frekvencie, zväčša 32 kHz, 24 kHz, 22,05 kHz, 16 kHz), podporovaná bitová hĺbka vzorky je 8 bitov a 16 bitov, objavujú sa však aj 24-bitové a 32-bitové zvukové karty. Reprodukciu možno rôznymi spôsobmi dotvárať – využitím rozličných nastavení súvisiacich s reprodukciouPozn. 5. Osobitnou kapitolou riadenia výstupu zvukovej karty je protokol MIDI.

Kvalitnejšie či veľmi kvalitné (tzv. high end) rady zvukových kariet niektorých výrobcov sa vyrábajú aj v externom vyhotovení, obyčajne pripojiteľné k počítaču cez rozhranie FireWire alebo USB, nie ako interná PCI karta. Výhodou je menšia náchylnosť na elektromagnetické rušenie, prítomné v skrinke počítača, a tak vyššia vernosť (angl. high fidelity, hi-fi) reprodukcie zvuku, čo je hlavná požiadavka náročných poslucháčov (tzv. audiofilov).


Poznámka 1: Akoby „citlivosť na koncovky typu jack“. Vlastnosť väčšiny súčasných kariet, ale i „kodekov“ (p. nasledujúcu poznámku) – napr. Intel HD Audio (kde sa táto črta nazýva „jack retasking“).

Poznámka 2: Na základe kodeku možno vybudovať zvukovú kartu – prevodníky a digitálny mikrokontrolér toku dát sú riešené hardvérovo na matičnej doske (angl. on-board audio ako náprotivok prídavných kariet – add-on card, tiež nazývaných samostatné - standalone), pokročilejšia mixáž zvuku a syntéza nástrojov potom prebieha len softvérovo, na úrovni ovládačov zvukovej karty, zaťažujúc procesor počítača. Takéto riešenia, určené do lacných domácich a kancelárskych počítačov, si vďaka tejto jedinej hardvérovej súčasti vyslúžili tiež prezývku „kodek“. Najrozšírenejším štandardom v tomto segmente je bezpochyby AC'97 od Intelu (najviac 20-bitová hĺbka a 48kHz pre najviac 6 kanálov cez S/PDIF, resp. 96 kHz a 24 bitov pre stereo), v súčasnosti ho začína nahrádzať novší štandard Intel High Definition Audio (32 bitov, 192 kHz, 8 kanálov, podporuje „jack retasking“, čo je označenie pre jack sensing). Pre tento pokrok a postačujúcu kvalitu už nemožno hovoriť o „kodekoch“ ako o nekvalitnom riešení.

Poznámka 3: Slangová skratka z „FM Operator type L“ – samozrejme, skutočné názvy čipov boli odlišné.

Poznámka 4: Netreba si mýliť s počtom výstupných kanálov, na ktoré bolo možné tieto „vnútorné kanály“ vo zvolenom pomere prenášať.

Poznámka 5: P. napr. odsek 3.5.3 Priestorový zvuk v softvéri.

Odsek 3.5.2: Priestorový zvuk a zvukové kanály

Aj keď sa slovo „stereofonický“ v súčasnej slovenčine spája s „dvojkanálovým systémom záznamu a reprodukcie zvuku“Pozn. 1, pôvodný význam tohto slova je „viackanálový“. Často používaný termín stereo pre historicky prvé rozšírené zariadenia pracujúce s dvoma kanálmi (narozdiel od tých predošlých, jednokanálových, mono) však tento pôvodný význam vytlačil, preto my tiež pod pojmom stereo budeme chápať dvojkanálový zvuk (v primárnom význame: zvuk určený pre ľavé a pravé ucho). Pre viackanálový zvuk (viac než dva kanály) sa v súčasnosti skôr ujal termín priestorový zvuk (angl. surround sound). Pri kompresii takéhoto záznamu sa využívajú metódy podobné tým, ktoré sme uviedli v súvislosti s kompresiou stereofonického záznamu (p. odseky 3.3.5 a 3.4.4).

Treba však odlíšiť počet (diskrétnych) kanálov v zázname od počtu reprodukovaných kanálov. Tento počet možno totiž nezávislo meniť – napríklad použitím maticového dekódovania zvuku (matrix decoding). Vstupný (dekódovaný) signál s istým počtom kanálov sa prevedie do každého výstupného kanálu s intenzitou určenou hodnotami matice. Najjednoduchším príkladom je zmena mono nahrávky na stereo reprodukciu – do každého výstupného kanálu smeruje pôvodný zvuk. Tento postup – zvýšenie počtu reprodukovaných kanálov – sa v angličtine označuje upmix. Naopak, prevod väčšieho množstva kanálov na menší počet (napr. zmena stereo záznamu na mono za účelom reprodukcie na jednom reproduktore) sa označuje ako downmix. Matice, ktoré by na spomínané prevody poslúžili, by vyzerali takto:
A_1=(1##1), A_2=(0,5 0,5)
Vstupné kanály vyjadrujú stĺpce, výstupné kanály riadky matice. Matica A1 jediný vstupný kanál prevedie do oboch výstupných kanálov s pôvodnou intenzitou, matica A2 zmieša do jedného výstupného kanála polovičnú úroveň oboch vstupných kanálov (ochrana pred orezávaním). V praxi sa, samozrejme, často používajú omnoho väčšie matice (p. ďalej).

Navyše, je potrebné odlíšiť počet reprodukovaných kanálov od skutočného počtu reproduktorov. Jeden kanál totiž možno reprodukovať viacerými blízko seba umiestnenými reproduktormi. Jeden z kanálov môže byť vyhradený na reprodukciu hlbokých tónov – veľké rozmery k nemu priradeného reproduktora ho môžu na to predurčovať. Nízkofrekvenčné zložky zo všetkých kanálov sú často presmerované práve do tohto kanála (či už pri zostavovaní záznamu, alebo až / aj tesne pred reprodukciou), využívajúc fakt, že zdroj hlbokých tónov je ťažšie lokalizovateľný (basy „naplnia miestnosť“ bez narúšania zážitku z priestorového zvuku).

Za účelom odlíšenia všetkých týchto aspektov záznamu zvuku alebo reprodukčnej sústavy sa zaužívalo nasledovné číselné označenie. Prvé číslo indikuje počet (frekvenčne) celorozsahových diskrétnych kanálov. Nasleduje ho bodka a počet frekvenčne obmedzených kanálov (zväčša jeden kanál LFElow frequency effectsPozn. 2, teda nízkofrekvenčné efekty). Prvé číslo môže byť rozdelené lomkou na počet kanálov reprodukovaných pred poslucháčom a zvyšný počet kanálov. Pri použití maticového dekódovania zvuku sa navyše toto číslo môže upresniť počtom vypočítaných kanálov za chrbtom poslucháča, oddeleným dvojbodkou. (Napr. zápis „3/2:3.1“ indikuje 5 celorozsahových kanálov, z toho tri sú pred poslucháčom, tri v jeho okolí – aj keď len dva z týchto troch sú diskrétne prítomné v pôvodnom zázname – a v miestnosti sa nachádza aj jeden subwoofer.)

Čitateľ si isto všimol, že s reprodukovanými kanálmi súvisí aj umiestnenie reproduktorov (reprodukčných sústav), ktoré ich „realizujú“ – koniec koncov, to je zmysel reprodukcie priestorového zvuku. Zaužívalo sa niekoľko štandardnýchPozn. 3 konfigurácií reproduktorov / kanálov:

Je namieste popísať jednotlivé rozšírené formáty priestorového zvuku; také, čo síce boli vyvinuté pre film, no našli uplatnenie aj v domácnostiach. Väčšinu štandardov v tomto odvetví určite vlastní spoločnosť Dolby Laboratories. Medzi prvé formáty priestorového zvuku patrili Dolby Stereo, Dolby Surround a Dolby Analog SR zo 70. a 80. rokov minulého storočia. (Posledný menovaný sa doteraz používa na filmových kotúčoch do kín, zväčša už popri digitálnom zázname zvuku). Používajú maticové dekódovanie na obohatenie stereofonického záznamu o stredový a priestorový kanál (teda spolu štyri reprodukované kanály v dvoch diskrétnych kanáloch; priestorový kanál má zväčša obmedzenú frekvenčnú charakteristiku). Digitálnej verzie sa dekódovanie týchto štandardov dočkalo v podobe Dolby Pro Logic a jeho nasledovníkov, ktoré poskytujú 5.1 (Dolby Pro Logic II), ba až 7.1 (Dolby Pro Logic IIx) zvuk v plnom frekvenčnom rozsahu, maticovo zakódovaný v dvoch diskrétnych kanáloch.

Dolby Digital (DD), často nazývaný aj Adaptive Transform Coder 3 (AC-3) je ďalším dielom tejto spoločnosti. Uviedla ho v r. 1992 a zahrnutím do špecifikácie DVD-Video si získal všeobecnú popularitu. Stratová kompresia s ním spojená je bližšie predstavená v časti 4.7 (str. 104). Používa šesť diskrétnych kanálov v rozložení 5.1, vzorkovaciu frekvenciu 48 kHz a rozlíšenie vzorky 24 bitov. Dolby Digital EX zvyšuje počet kanálov na 6.1 použitím maticového dekódovania. Novšia verzia Dolby Digital Plus (DD+, AC3plus) zvyšuje tento počet na 13.1 a je povinná pre HD DVD prehrávače (nepovinná pre BD), rovnako ako bezstratová kompresia Dolby TrueHDPozn. 4.

Konkurentom je štandard DTS firmy Digital Theater Systems z r. 1993, určený predovšetkým do filmov premietaných v kinách. Možno sa s ním stretnúť aj na diskoch DVD-Video, jeho podpora na strane prehrávačov je však voliteľná. Ide o stratovú kompresiu používajúcu kodek Coherent Acoustics (CAC)Pozn. 5, má vyšší štandardne používaný dátový tok oproti DD (typicky 768 alebo 1536 kbps namiesto 384 alebo 448 kbps), základná verzia ponúka rozlíšenie 24 bitPozn. 6 a 48 kHz pre 5.1 kanálov (LFE kanál do 80, resp. 150 Hz – v prípade DD je to 120 Hz). Ďalším štandardom je formát DTS-ES, ktorý pripomína Dolby Digital EX, no vie pracovať i so skutočným diskrétnym kanálom (vtedy sa označuje DTS-ES 6.1). DTS NEO:6 je obdobou technológie Dolby Pro Logic, DTS 96/24 rozširuje podporu zvuku s vysokým rozlíšením na všetky kanály. DTS-HD Master Audio ponúka teoreticky neobmedzený počet kanálov a škálovateľnú kompresiu siahajúcu od klasického DTS až po bezstratovú kompresiu. Technológia CAC je povinnou súčasťou štandardov HD DVD a BD, výpočtovo (napriek vyšším typickým dátovým tokom) je menej náročná ako DD, navyše má aj nižšiu latenciu.


Poznámka 1: Krátky slovník slovenského jazyka. Bratislava: Veda. 2003. Možno overiť na internetovej stránke http://kssj.juls.savba.sk [cit. 2006-03-13].

Poznámka 2: Takýto názov používa (najmä) štandard Dolby Digital. Používajú sa aj názvy Low Frequency Enhancement, zriedkavo Low Frequency Extension. Úlohou LFE kanála je reprodukcia veľmi hlbokých tónov. Žiadané je aj dosiahnutie vyššieho akustického tlaku kvôli menšej citlivosti ľudského sluchu na nízke frekvencie (v prípade AC-3 je to +10 dB oproti ostatným kanálom – p. ATSC. Digital Audio Compression Standard (AC-3, E-AC-3). Rev. B. 2005. str. 24). LFE sa realizuje reproduktorom typu subwoofer.

Poznámka 3: „Štandardy“ v tomto zozname sú zapísané skôr marketingovým označením, ktoré nie je celkom zhodné so značením uvedeným vyššie.

Poznámka 4: Vychádza z MLP, ponúka navyše mnoho metadát, ako napr. vlastná konfigurácia (umiestnenie) reprodukovaných kanálov, kontrola dynamického rozsahu a normalizácie a podobne.

Poznámka 5: Tu hovoríme o formáte určenom pre domácich používateľov. Verzia určená do kín (apt-X100) má rozlíšenie vzorky 16 bitov, používa delenie na štyri subpásma a upravené ADPCM, podobne ako CAC (stručný popis možno nájsť na http://www.aptx.com/sitefiles/resources/aptxoverview.pdf).

Poznámka 6: Avšak rovnako ako DD, i DTS používa typicky len 18 bitov, čo poskytuje dostatočný dynamický rozsah a umožňuje úsporu dátového toku.

Odsek 3.5.3: Priestorový zvuk v softvéri

Doteraz sme spomínali hardvérovú realizáciu na uľahčenie lokalizácie zdroja – viackanálový zvukPozn. 1. Na priestorový dojem zo zvuku však vplýva viac faktorov, ktoré možno simulovať výpočtovou kapacitou (zväčša) DSP čipov na zvukových kartách – v prvom rade môže ísť o akustickú lokalizáciu zdroja ponad skutočné možnosti reproduktorovPozn. 2. Ak uvažujeme o dvoch reproduktoroch, 3D efekty možno rozdeliť do troch skupín:

Druhou kategóriou sú jednoduchšie, no o to dôležitejšie faktory vplývajúce na lokalizáciu zvuku (predovšetkým v interaktívnom prostredí hier), najmä prirodzený dozvuk miestnosti, neskoršie odrazy (echo), útlm (medzi zdrojom zvuku a poslucháčom je prekážka) atď. Najrozšírenejším štandardom v tomto smere je EAX (Environmental Audio Extensions), ktorý vyvíja líder vo zvukových kartách pre hráčsku komunitu – Creative Labs. Na trhu je od r. 1998 (s príchodom kariet Sound Blaster Live!, tie umožňovali len jednoduchý dozvuk). V súčasnosti (s príchodom kariet Sound Blaster X-Fi a piatou generáciou EAX, konkrétne EAX Advanced HD 5.0) možno simulovať množstvo detailne konfigurovateľných akustických prostredí s rôznymi spôsobmi šírenia zvuku a celkovým dojmom z neho.

Akoby medzistupňami medzi viacerými diskrétnymi kanálmi a softvérovým prístupom ku konštrukcii priestorového dojmu zo zvuku sú technológie ako MP3 Surround alebo jej zovšeobecnenie - MPEG SurroundPozn. 3, stále vo vývoji.


Poznámka 1: Programátor si nemusí robiť starosti s obsluhou všetkých výstupných kanálov zvukovej karty používateľa – v prostredí Windows sa napríklad môže spoľahnúť na bezplatnú knižnicu DirectSound, ktorá mu umožňuje zvuk lokalizovať bez ohľadu na druh reprodukcie.

Poznámka 2: P. časť 2.5 Priestor vo zvuku a jej odseky, najmä 2.5.3 Súčasné trendy.

Poznámka 3: Viac informácii o ňom na stránke http://www.chiariglione.org/MPEG/technologies/mpd-mps. Môže používať lubovoľný kompresný formát, napr. MP3, AAC atď.

Odsek 3.5.4: Zvuková syntéza a MIDI

V tomto odseku si v stručnosti popíšeme črty protokolu MIDI, najprv si však predstavíme zvukovú syntézu ako takú.

Skôr než sa zvuk úspešne zaznamenával a následne reprodukoval, existovali umelé spôsoby tvorby (syntézy) zvuku (angl. audio synthesis) – teda zväčša tónov rôznych nástrojov. Spočiatku na elektronickej úrovni: jednoduchý oscilátor generoval elektrickú vlnu tvaru sinusoidy, ktorá po napojení na reproduktor produkovala tón frekvencie zhodnej s frekvenciou oscilátora. Ako sme si objasnili v časti 2.3, dodaním harmonických násobkov s vhodnou amplitúdou získavame zvuk podobný danému hudobnému nástroju. Táto metóda sa nazýva aditívna syntéza, pre kvalitnejší zvuk však potrebujeme veľké množstvo dodaných harmonických zložiek, teda i generátorov impulzu. Z toho dôvodu je často vhodnejšia subtraktívna syntéza. Pri nej sa použitím upraveného oscilátora získa priebeh vlny zhodný so štvorcovou, trojuholníkovou či pílovou vlnou (obsahujúcich množstvo harmonických zložiek). Aplikovaním frekvenčného filtra možno upraviť amplitúdu jednotlivých harmonických frekvencií v signáli (prípadne ich celkom potlačiť), a tak získať želaný signál.

Dokonalejšiu manipuláciu so zvukom ponúka syntéza frekvenčnou moduláciou. Frekvenčná modulácia znamená upravovať nosný signál (sinusoida istej frekvencie) modulačným signálom tak, že nosnému signálu rastie či klesá aktuálna frekvencia vo zvolenom rozsahu podľa aktuálnej hodnoty (úrovne amplitúdy) modulačného signálu. V praxi má nosná vlna základnú frekvenciu želaného nástroja, modulačným signálom je potom nejaký jej harmonický (resp. disharmonický, ak ide o zvony, činely, …) násobok. Tento postup bol patentovaný v r. 1975 a patent odpredaný firme Yamaha (vypršal v r. 1995, odvtedy ho možno komerčne používať bez poplatkov) a nie je náročné realizovať ho v elektronických obvodoch. V praxi sa však používa zriedka – jeho úlohu zastúpila fázová modulácia, omnoho ľahšie realizovateľná v digitálnych čipoch. Pri tej má modulovaná vlna tvar f(t)=sin(2 π f t + a s(t)) , kde s(t) je modulačný signál a nosná vlna frekvencie f je fázovo modulovaná s amplitúdou a. Napriek faktu, že súčasné čipy realizujú fázovú moduláciu, z historických dôvodov sa takto syntetizovaný zvuk označuje ako syntéza frekvenčnou moduláciou (FM synthesis).

Ešte dokonalejší zvuk ponúka syntéza použitím vzoriek (wavetable synthesisPozn. 1). Zvukový čip má prístup k tzv. vzorkámPozn. 2, krátkym úryvkom (zväčša jedna-dve vlny) zo záznamu skutočných nástrojov. Tieto sú zaznamenané s istou nominálnou frekvenciou, pričom do požadovaného tónu sú prevzorkované (za pomoci interpolácie pôvodných hodnôt). Tento prístup je náročnejší – požaduje nielen omnoho väčšiu pamäť a výpočtový výkon, ale najmä vytvára potrebu dokonalej nahrávky a spracovania bohatej sady nástrojov. Pri drahších syntézach je zaznamenaných viac tónov rovnakého nástroja, aby sa dosiahla vyššia vernosť syntetizovaných zvukov, príp. sa zaznamenajú pre rovnaký tón aj odlišné nuansy hry (napr. silný alebo slabý úder do klávesu atď.).

Nakoniec, existuje aj metóda syntézy zvuku na základe fyzikálneho modelovania nástroja (physical modelling synthesis). Zakladá sa na metóde matematického vyjadrenia zvuku (vlnenia), ktorý vzniká v nástroji (napr. bubon ako úder paličky na dvojrozmernú membránu kruhového tvaru s daným polomerom a uchytením, útlmom atď.) Je veľmi náročná vo fáze návrhu aj realizácie (v súčasnosti je už výpočtová sila čipov na tento druh syntézy úplne postačujúca) a používa sa zriedka, podobnosť takto syntetizovaného zvuku so skutočnými nástrojmi je však výnimočne vysoká.

Ako v odseku 2.3.2 Zvuky hudobných nástrojov i tu musíme spomenúť javy pri hre na skutočných nástrojoch: nábeh, útlm, držanie, doznenie. Sú realizované zaznamenaním tzv. ADSRPozn. 3 obálok pre každý nástroj – tie určujú intenzitu zvuku v danej fáze zvukového prejavu, realizované sú teda úpravou hlasitosti výstupnej vlny tak, aby ju daná obálka „obklopovala“ (konvolúcia). Tieto obálky možno kvôli lepšej vernosti zvuku navrhnúť aj pre jednotlivé frekvenčné zložky. Pre rozdielnosť zvuku v jednotlivých spomenutých javoch sa v prípade syntézy typu wavetable často osobitne mikrofonicky zaznamenáva každý spomenutý jav.

Na trhu boli rôzne druhy syntetizátorov dávno pred rozšírením osobných počítačov (nehovoriac o zvukových kartách), ktoré sa delili do rôznych kategórií. Lacné neprofesionálne modely ponúkali zväčša jednoduchú aditívnu či subtraktívnu syntézu (v lepších modeloch i FM), obmedzený počet nástrojov a možností. Drahé profesionálne modely podporovali zas okrem syntézy použitím vzoriek i množstvo drobných nastavení ovplyvňujúcich zvuk nástroja (sila úderu, modulácia, panoramatický efekt, vibrácia, dozvuk, legato atď.). Mali nepreberné množstvo rôznych nástrojov (harmonických nástrojov a perkusií), ktoré sa líšili od modelu k modelu (v lepšom prípade od výrobcu k výrobcovi); ďalšie vzorky nástrojov si používateľ mohol dodať do syntetizátora pomocou pamäťových kariet a rôznych proprietárnych rozhraní. Poriadok do tohto sveta priniesol štandard MIDI.

MIDI (Musical Instrument Digital Interface) je komunikačný protokol definovaný konzorciom Audio Engineering Society v r. 1983 (verzia 1.0). Jeho úlohou je prenášať informácie o hraných tónoch (nie hudbu samotnú) z jedného zariadenia do druhého – tak môže hranie hudby a jej samotná reprodukcia byť na odlišných miestach, dokonca v odlišnom čase (túto komunikáciu možno zaznamenať – napr. aj v súboroch, o ktorých si povieme nižšie). MIDI však dokáže omnoho viac – zvuková karta môže kontrolovať syntetizátor, ten zas zvukovú kartu alebo iný MIDI nástroj (konštrukčne je najjednoduchšie vyrobiť MIDI klaviatúru, ale existujú aj MIDI gitary, husle, bicie, …), alebo dokonca pohybovať svetlami na pódiu – to všetko vo vzájomnej synchronizácii všetkých napojených zariadení. Komunikácia rozhraním MIDI prebieha prostredníctvom krátkych správ („udalostí“), vyjadrujúcich napr. tón, jeho výšku, hlasitosť, úpravy na kanáloch, perkusie, časový kód na synchronizáciu atď. Jedno zo zariadení potom môže byť použité na reprodukciu (zväčša metódami syntézy opísanými vyššie), resp. záznam. Rýchlosť protokolu je 31 250 bitov za sekundu, čo mierne komplikuje zložitejšie pasáže (veľa udalostí nastane v jednom čase, treba ich však preniesť sekvenčne, čo istú dobu trvá). V súčasnosti existujú štandardy na prenos MIDI správ aj cez USB, ethernet a i.

MIDI 1.0 bolo určené pre profesionálnych hudobníkov, ktorí si naaranžovali svoje nástroje sami. Rozhranie im ponúkalo 128 nástrojov („programov“) a 16 kanálov, 128 rôznych tónov a 128 úrovní hlasitostí. Konfigurovateľnosť bola vysoká, predsa však vznikla potreba jednotného rozloženia nástrojov. V r. 1991 preto vznikol štandard General MIDI (GM), ktorý mapoval na všeobecnú číselnú škálu konkrétne nástroje (napr. 1 – akustický klavír, 14 – xylofón, 72 – klarinet, 128 – výstrel z revolvera) a perkusie (obsadzujúce kanál 10). Navyše, GM špecifikoval minimálne množstvo tónov, ktoré zariadenie muselo byť schopné naraz hrať (polyfónia) – 24. Vytvorila sa tým živná pôda pre skutočné rozšírenie MIDI hudby vo svete PC či herných zariadení. V nasledujúcich rokoch bol dopĺňaný o ďalšie sady nástrojov a nastavenia (často išlo o „štandardy“ veľkých spoločností, nie štandardizačných komisií). Jedným z rozšírení je aj SP-MIDI (scalable polyphony, teda škálovateľná polyfónia), s ktorým sa môžeme stretnúť v súčasných mobilných telefónoch.

Okrem vystúpenia „naživo“ však MIDI umožňoval najmä tvorbu a opakovanú reprodukciu hudobných diel. Keďže MIDI sám osebe je protokol, vznikla potreba ukladania jednotlivých správ do súboru, v ktorom by bol špecifikovaný aj čas, kedy je potrebné tieto správy poslať na MIDI výstup. Definovaný bol štandard SMF (standard MIDI file), používajúci príponu .midPozn. 4. Komunikácia rozhraním MIDI je dátovo nenáročná, veľkosť súborov je teda extrémne malá (mnohominútové skladby môžu mať niekoľko desiatok kB). Neskôr sa objavil aj štandard XMF (extensible music file), ponúkajúci možnosť integrovať k hudobnému zápisu i vzorky (wavetable) použitých nástrojov.

Tento spôsob reprodukcie hudby (najmä v počítačových hrách a videohrách) dominoval do druhej polovice deväťdesiatych rokov dvadsiateho storočia, keď ho vytlačili postupne moduly (p. nižšie) a skutočné hudobné nahrávky (zväčša uložené v stratových formátoch ako MP3). MIDI bolo (a ostáva) podporované prakticky všetkými zvukovými kartami, v tých lacných (aj najviac rozšírených) však pre jednoduchú syntézu znela takto reprodukovaná hudba nekvalitnePozn. 5, preto si MIDI hudba vyslúžila povesť nekvalitnej alternatívy k digitálnemu záznamu hudby (pričom opak je pravdou – v profesionálnej sfére sa pri tvorbe hudby naďalej používa MIDI). Predsa však ostáva štandardom, ktorý ťažko možno nahradiť čímsi iným. Konzorcium MIDI Manufacturers Association už niekoľko rokov pracuje na koncepte, ktorý by ho doplnil – High Definition MIDI (HD-MIDI).


Poznámka 1: V anglickej terminológii sa technika popísaná v tomto odstavci síce nazýva sample-based synthesis, tvorcovia zvukových kariet však z marketingových dôvodov používajú termín wavetable synthesis, preto sa prikláňame tiež k termínu „wavetable“. (Skutočná syntéza typu wavetable je zložitejšia, používa sa skôr v profesionálnych syntetizátoroch a nebudeme sa jej venovať).

Poznámka 2: Ide o sled PCM vzoriek. Aby sme odlíšili tieto dva významy slova vzorka, budeme tento význam používať v kontexte wavetable.

Poznámka 3: Z anglických ekvivalentov spomenutých fáz zvukového prejavu: attack, decay, sustain, release.

Poznámka 4: Spĺňa špecifikáciu RIFF, až na chýbajúcu úvodnú hlavičku. To napravil štandard súboru s príponou .rmi (RMID, zo slov RIFF a MIDI) z dielne Microsoftu, ktorý však nezískal takú širokú podporu.

Poznámka 5: Tvorca hudby vo formáte MIDI nemohol ovplyvniť samotný zvukový dojem zo svojej skladby – na drahších modeloch zvukových kariet s dobrou syntézou mohol znieť jeho výtvor ako nahrávka orchestra, na veľmi lacných zas znel celkom synteticky a nekvalitne.

Odsek 3.5.5: Hudobné sekvencery, moduly

Termínom sekvencer označujeme softvérový produkt určený na komponovanie hudby vo formáte MIDI, v ktorom je hudobný záznam zapisovaný do notovej osnovy. Príbuzný softvérový produkt označovaný anglickým slovom tracker realizuje zápis tónov zväčša alfanumericky a slúžia ako editory iných hudobných formátov – modulov.

Modul je označenie súboru, v ktorom je zapísané hudobné dielo vo forme tónov (a ich vlastností, rôznych efektov atď.) a nástrojov reprezentovaných wavetable vzorkami. Vzorky sú uložené vo forme PCM (niektoré novšie moduly poznali jednoduché kompresie vzoriek) pre referenčný tón (v závislosti od formátu). Program prehrávajúci moduly z týchto vzoriek v reálnom čase prevzorkováva zvolené tóny a hlasitosť, mixuje ich (moduly podporujú niekoľko kanálov) a posiela na zvukový výstup. Podobá sa teda na MIDI súbory, no obsahuje aj samotné nástroje a výstup sa získava výpočtom na procesore počítača. Rozšírili sa najmä na počítačoch tried Amiga a Atari, odkiaľ prenikli aj do sveta PC. Dôvod ich vzniku bol zrejmý: na začiatku deväťdesiatych rokov bola výpočtová sila počítačov a možnosti zvukových kariet dostatočné na spracúvanie vzoriek v reálnom čase. Syntéza frekvenčnou moduláciou neponúkala dostatočnú kvalitu (resp. vernosť) zvuku, slobodu v tvorbe (ľubovoľné wavetable vzorky – aj nezvyčajné zvuky a slová, určite nie prítomné v štandarde General MIDI) a nespĺňala požiadavku na rovnakú reprodukciu (nezávislú od implementácie). Karty so syntézou pomocou vzoriek boli drahé a riešili iba časť problémov. Moduly tak boli akýmsi prechodom medzi MIDI hudbou a skutočnými nahrávkami (na ktoré kapacita vtedajších médií nestačila, ich stratová kompresia bola zas pre výpočtovú náročnosť neuskutočniteľná).

Na trhu sa uchytilo viacero formátov modulov. Celkom prvým bol formát .mod (prípona .mod) so štyrmi kanálmi, medzi ďalšie rozšírené patrili .s3m, .xm, .it (16 až 32 kanálov, rôzne nastavenia ovplyvňujúce prehrávanie atď.). Pre jednoduchosť tvorby a pekný (i keď trochu syntetický) zvukový prejav za cenu len malej veľkosti súboru boli a sú veľmi obľúbené najmä pre tvorcov zo sveta demoscény, istý čas boli populárne aj medzi tvorcami hier (spomeňme napr. slovenskú hru Quadrax od firmy Cauldron).

Odsek 3.5.6: Ochrana duševného vlastníctva

Každé „umelecké dielo …, ktoré je výsledkom vlastnej tvorivej duševnej činnosti autora, najmä … hudobné dielo s textom alebo bez textu a audiovizuálne dielo“Pozn. 1 je na území Slovenskej Republiky predmetom autorského práva. Autor má výlučné práva určiť, ako sa s jeho dielom bude nakladať, aký podiel na zisku bude z diela mať atď. V praxi je však situácia iná. Digitálne uloženie autorských diel (či už ide o počítačové programy, filmy, hudbu, …) spôsobilo, že je neuveriteľne jednoduché rozmnožovať ich, reprodukovať, pozmeňovať, dokonca komerčne predávať (keď autorské dielo bolo odovzdané verejnosti na bezplatné používanie, ktosi ho však pozmení a predáva ako vlastné autorské dielo)Pozn. 2. Preto vznikali rôzne iniciatívy, postupy, technológie v snahe obmedziť možnosť voľne kopírovať či reprodukovať dáta. Narážajú na seba dve požiadavky: slobodné používanie legálne zakúpeného diela v rámci možností ustanovených zákonomPozn. 3 na jednej strane a snahaPozn. 4 brániť nelegálnemu používaniu diela. Nelegálna je i snaha o odstránenie každej technológie ochrany, presnejšie podľa dikcie zákona: „(1) Neoprávnený zásah do autorského práva je aj: a) odstránenie alebo zmena akejkoľvek elektronickej informácie na správu práv, b) verejné rozširovanie originálu diela alebo jeho rozmnoženín vrátane ich dovozu, ako aj verejný prenos diela, pri ktorých boli elektronické informácie na správu práv odstránené alebo zmenené bez súhlasu autora. (2) Informácie na správu práv podľa odseku 1 sú údaje, ktoré identifikujú dielo, autora diela alebo nositeľa akéhokoľvek práva k dielu, informácie o termíne a podmienkach použitia diela a akékoľvek číslice alebo kódy, ktoré vyjadrujú takéto informácie, ak je ktorákoľvek z týchto informačných položiek pripojená k rozmnoženine diela alebo ak sa zobrazí v súvislosti s verejným prenosom diela.“Pozn. 5

Autori si však zriedkakedy uplatňujú svoje práva sami, často sa spoliehajú na inštitúciu umožňujúcu kolektívnu ochranu ich práv. Poslanie takýchto inštitúcii je jasné, uveďme zdôvodnenie jednej z nichPozn. 6: „Sme tu preto, lebo je nereálne, aby si autor alebo vydavateľ sám vyhľadával používanie svojich diel. Rovnako nie je reálne, aby sa používatelia hudby kontaktovali pri každej skladbe s jej autormi, či vydavateľmi. SOZA na jednej strane používateľom udeľuje licencie na použitie hudby a vyberá za to od nich odmeny a na druhej strane vybrané odmeny rozdeľuje autorom a vydavateľom hudby. Recipročné zmluvy s organizáciami v zahraničí nás oprávňujú zastupovať na území Slovenska práva autorov hudobných diel z celého sveta.“ Na Slovensku pôsobí viac takýchto organizácií, menovite SOZA (Slovenský ochranný zväz autorský pre práva k hudobným dielam – http://www.soza.sk) a SLOVGRAM (nezávislá spoločnosť výkonných umelcov – http://www.slovgram.sk). Zvyšné tri organizácie (LITA, OZIS, SAPA) sa nevenujú zvukovým a hudobným dielam. Nad dodržiavaním autorských práv má záštitu Ministerstvo kultúry SR.

Okrem práva Európskej Únie, pod ktorej právnym vplyvom stojíme, je hlavným určujúcim faktorom v prípade ochrany autorských práv vývoj na území USA (ovplyvnené globálnosťou sveta a internetovej komunity a v súčasnosti dominantným postavením Spojených Štátov vo svetovom hospodárstve, politike a moderných technológiách). Momentálne znenie zákonov silne ovplyvňuje loby autorských spoločností, veľkých firiem a verejnej mienky (zastupovanej rôznymi organizáciami na ochranu práv spotrebiteľa). Každá táto stránka sleduje najmä svoje záujmy a je náročné vytvoriť „spravodlivý“ kompromis. Navrch v tomto boji majú zväčša autorské spoločnosti, zastupované najmä konzorciom RIAA (Recording Industry Association of America; loby vykonáva často spoločne s organizáciami MPAA – Motion Picture Association of America – a BSA – Business Software Alliance). Tie sa často vydajú cestou súdnych sporov s jednotlivcami používajúcimi, tvoriacimi či rozširujúcimi „nelegálny“ obsah. Našťastie, aj tí majú občas väčších zástupcov – na pôde USA je to najmä Electronic Frontier Foundation.

Jedna z prvých lastovičiek na poli právnej ochrany diel v digitálnom svete bol americký zákon o domácom zázname zvuku (angl. Audio Home Recording Act, AHRA) z r. 1992, ktorý bol reakciou na zariadenia DATPozn. 7 od Sony. Tá bojovala za „práva používateľov“ – slobodnú možnosť záznamu a možnosť vytvárať kópie originálu pre osobné nekomerčné použitie. RIAA zas stála „na strane umelcov“, v opozícii k možnosti vytvárať identické digitálne kópie za lacný peniaz. Zákon priniesol akýsi kompromis – podiel z ceny každého zapisovateľného média a nahrávacej mechaniky šiel nahrávacím spoločnostiam ako potenciálne „odškodné“. Napriek pochybnej etickej správnosti takéhoto riešenia platia podobné zákony i u nás. Zaujímavosťou je i fakt, že ďalšie zákony (najmä známy Digital Millennium Copyright Act – DMCA z r. 1998 a podobné legislatívne úpravy inde vo svete), ktoré stavajú nahrávacie zariadenia nerešpektujúce DRM (p. nižšie) mimo zákon, vo svojej podstate urobili zákony typu AHRA zbytočnými – poplatky sa i napriek tomu naďalej vyberajú.

Rôzne technológie slúžiace účelu ochrany autorských práv vo svete digitálnej hudby (ale aj obrazu, kníh atď.) sa dajú spoločne označiť názvom Digitálna správa práv (Digital Rights Management, DRM). Informácie sú obyčajne súčasťou samotnej dátovej reprezentácie chráneného diela (ako metadáta) a určujú spôsob a rozsah povoleného použitia dielaPozn. 8. Najnovšie sa často kombinujú s kryptografickými postupmi – dielo je šifrované, bežný používateľ ho neprečíta, pristupovať k obsahu môže len špecializované zariadenie, resp. softvér (prehrávač). Samozrejme, obe riešenia sa dajú ľahko obísť (zväčša niekto vytvorí program, ktorý túto ochranu prekoná, odstráni atď., tento program sa následne rýchlo šíri po internete), a aj keď je to nelegálne, málokedy sa podarí právne postihnúť vinníkaPozn. 9. Tvorcovia nových technológií tak vytvárajú stále zložitejšie schémy, ktoré viac a viac obmedzujú používateľov, často v ich legálnych právach (napr. vytvorenie záložnej kópie produktu atď.) Známy je aj nedávny prípad, keď firma Sony na zvukové CD médiá umiestňovala špeciálny softvér s „agresívnym“ správaním, ktorého úlohou bolo sledovať používateľa a jeho nakladanie s produktomPozn. 10. DRM schémy sú obľúbené najmä v internetových obchodoch s hudbou (iTunes, Napster atď.). Najväčším problémom tejto technológie však v súčasnosti je: „1) ochrana súkromia pred neoprávneným zbieraním osobných údajov a on-line správania sa používateľa prostredníctvom DRM, 2) interoperabilita, ktorá si vyžaduje kompatibilné systémy umožňujúce legálne použitie diela, napr. na rozličných platformách (napr. Windows vs Linux).“Pozn. 11 Slovensko sa riadi legislatívnym procesom v rámci EÚ, pričom v priebehu tohto roka (2006) sa plánuje schválenie odporúčania členským štátom EÚ ohľadom DRM; zároveň sa ráta zo zrušením poplatkov za zapisovateľné médiá v štýle zákona AHRA.


Poznámka 1: Zákon č. 618/2003 Z. z. o autorskom práve …, výňatok z § 7.

Poznámka 2: Dôsledok rozšírenia nelegálnych výmenných sietí a digitálnych technológií na spracovanie zvuku možno vidieť na uvedenom príklade: „V roce 1997, kdy se stále ještě vypalovačky vyskytovali v cenových výšinách deseti tisíc korun za kus a internet ve střední Evropě se začínal otevírat průměrnému uživateli, dosahovaly zisky hudebního průmyslu u nás (v ČR – poznámka autora) zhruba tří miliard korun. O pět let později, roku 2002, kdy stojí vypalovačka v průměru patnáct set, internet užívá třicet procent populace, na sídlištích je převaha broadband internetového připojení přes přípojku kabelové televize a na našem trhu je minimálně padesát různých kapesních přehrávačů MP3, jsou zisky českého hudebního průmyslu čtyřikrát nižší, na úrovni sedmi set padesáti milionů.“ (cit. NEUBAUER, Tomáš. Komprimované formáty v praxi. In: Muzikus 2004/01.)

Poznámka 3: Garantované práva (na citáciu, derivát práce atď.) sú v USA známe pod menom fair use.

Poznámka 4: V podstate by malo ísť o snahu štátu, hlavnými bojovníkmi na tomto poli sú však rôzne nahrávacie spoločnosti.

Poznámka 5: Zákon č. 618/2003 Z. z. o autorskom práve …, § 60.

Poznámka 6: Text zo stránky http://www.soza.sk [cit. 2006-03-21].

Poznámka 7: P. ďalší odsek 3.5.7 Úložné médiá.

Poznámka 8: P. tiež druhý odsek citovaného § 60.

Poznámka 9: Ako príklad poslúži známy nórsky programátor „DVD Jon“ Jon Lech Johansen, ktorý prekonal mnoho rôznych DRM ochrán na DVD, v systéme iPod a iTunes, súboroch WMV9 atď.

Poznámka 10: Viac informácií o tejto téme sa nachádza napr. na [cit. 2006-03-21] http://en.wikipedia.org/wiki/2005_Sony_CD_copy_protection_controversy.

Poznámka 11: Citát [2006-03-21] zo stránok MK SR: http://www.culture.gov.sk/main/index.php3?ida=1546.

Odsek 3.5.7: Úložné médiá

V tomto odseku si opíšeme štandardné spôsoby ukladania zvuku z pohľadu používateľa. Vynecháme analógové médiá (rôzne druhy gramofónových platní, analógový záznam na drôte a rozličných druhoch pások), ktoré hrajú už len okrajovú úlohu, a prejdeme hneď k tým digitálnym.

Digitálna zvuková páska (Digital Audio Tape, DAT) sa objavila v polovici osemdesiatych rokov 20. storočia ako výsledok práce japonskej spoločnosti Sony a holandskej firmy Philips. Jej úlohou bolo poskytnúť možnosť ukladať zvuk na kompaktné médium (kazetu asi dvakrát menšiu ako v prípade známej a rozšírenej kompaktnej audiokazety), keďže CD bolo príliš drahé, rozmerné a v tej dobe neexistovali prepisovateľné CD médiá. DAT umožňuje záznam pri 48, 44,1 a 32 kHz a 16-bitovej hĺbke (stereo) vo formáte PCM. Uchytil sa skôr ako poloprofesionálne riešenie, medzi bežnými používateľmi nemal veľký úspech. Časom sa z neho vyvinul aj štandard na zálohovanie dát vo svete počítačov (DDS – Digital Data Storage) – s podobným osudom. Predajnosť zariadení pracujúcimi s DAT je v súčasnosti nízka, preto Sony posledné kusy expedovala v decembri minulého roka (2005). Formát sa používa naďalej, aj keď už zriedka, stále vytláčaný modernými harddiskovými zariadeniami.

MiniDisc (MD) uviedla firma Sony na začiatku roka 1992 ako ďalšiu snahu o nahradenie kompaktnej audiokazety. Rozmermi sa podobá na 3,5-palcovú disketu, v skutočnosti však ide o magneto-optické médium. Poskytuje dostatočnú kapacitu (74 min., 80 min. pri 160-175 MB zvukových dát) použitím stratovej kompresnej schémy (algoritmus ATRAC, zväčša 292 kbps, nezávislé kódovanie oboch kanálov – p. časť 4.6, str. 102) pri nenáročnej cene médií a zariadení. Získal si veľkú popularitu v Japonsku; v Európe a USA však nebol natoľko rozšírený, preto nemá do budúcnosti veľkú perspektívu (aj keď ešte v roku 2005 Sony uvádzala rôzne doplnky a vylepšené verzie tohto formátu, ktorých v súčasnosti už existuje nepreberné množstvo). Prakticky jediný spôsob spojenia MD zariadení s PC je však proprietárny softvérový produkt firmy Sony menom SonicStage.

Digitálna kompaktná kazeta (Digital Compact Cassette, DCC) vyvinuli firmy Philips a Matsushita (známa skôr svojou produktovou líniou Panasonic) na konci r. 1992 ako konkurenciu MD od Sony. Výhodou bol najmä fakt, že médiami boli obyčajné kompaktné audiokazety, ktoré sa dali kúpiť na trhu za lacný peniaz – nové zariadenia tak dokázali pracovať aj s nimi, aj s DCC. Kvalita bola vysoká (proprietárny algoritmus PASC založený na MP1, 48 kHz, 16 bitov, stereo, 384 kbps), pre jednoduchosť média však dosiahnutá kapacita nekonkurovala iným médiám (45 min.). Ľudia si však už dávno zvykli na pohodlie náhodného prístupu, ktoré im poskytovali CD a MD, preto boli tieto páskové zariadenia trhom prijaté s rozpakmi. Philips upustil od výroby DCC zariadení v novembri 1996.

Kompaktný disk (Compact Disc, CD, resp. CDDA – Digital Audio), hoci vznikol prv než predošlé médiá, uvádzame až tu – na rozdiel od nich je totiž ešte stále hojne používaný a pokladá sa de facto za štandardný spôsob ukladania hudby, pripomínajúc tak gramofónové platne, ktoré tiež sprevádzali ľudstvo dlhú dobu (CD ich v predajnosti za rok predbehlo v r. 1988). CD je spoločným dielom firiem Sony a Philips a uvedené bolo na konci roka 1982. Zvukové dáta sú uložené na optickom médiu s priemerom 120 mm (existuje aj menší štandard – 80 mm) a kapacitou 74 min.Pozn. 1 (resp. 20 min. pre menší formát; neskôr však boli predstavené disky s vyššími kapacitami ako 80, 90, 99 min.). Na disku je uložená hudba vo forme PCM, čo vedie (pri 44,1 kHz, 16 bitov, stereo) k dátovému toku 1411,2 kbps (176,4 kBps) a pre 74 min. médium veľkosti zvukových dát 783 MB. Vzhľadom na špecifikáciu je frekvenčný rozsah CD niečo vyše 20 kHz a maximálna dynamika nahrávky 96 dBPozn. 2. CD už pár rokov po uvedení získalo veľkú popularitu – bolo ozaj kompaktné, pohodlné, odolné voči škrabancom (vďaka použitiu samoopravných kódov), poskytovalo vysokú kapacitu aj kvalitu, cena výroby pritom nebola vysoká. Čoskoro nato vznikli rôzne deriváty CD (pričom CD teraz často označujeme Audio CD, aby sme ho odlíšili od nasledujúcich variantov), ako napr. CD-ROM, CD-R, CD-RW (s najrozšírenejšou kapacitou 80 min., teda pribl. 703 MiBPozn. 3 dát – dôsledok iného kódovania, použitého kvôli vyššej dátovej ochrane), ktoré sú čitateľovi dobre známe. Celkový úspech rodiny CD médií potvrdzuje fakt, že v r. 2004 bolo predaných asi 30 miliárd nosičovPozn. 4. CD v sebe nezahrnovalo žiadnu ochranu pred kopírovaním, s príchodom CD-ROM jednotiek do sveta PC teda bolo jednoduché vytvárať kópie originálnych nosičov. Od r. 2002 začali mnohé spoločnosti vydávať audio CD s integrovanými chybami (od výroby vytvorené nezhody medzi dátami a kontrolnými sumami, dátové stopy v rozpore so špecifikáciou atď.), o ktorých vedeli, že sú ignorované väčšinou CD prehrávačov, predsa však nie CD-ROM mechanikami na trhu, ktorým to sťažovalo / znemožňovalo kopírovanie. Tieto postupy sa však stretli s veľkou nevôľou konzumentov.

Super Audio CD (SACD) uviedli Sony a Philips v r. 1999 ako vylepšenú verziu CD (po prehratom boji o formát DVD-Audio). Ako médium využíva mierne upravenú špecifikáciu DVD (zväčša jednovrstvové médium kapacity 4,7 GB, dvojvrstvové médium kapacity 8,46 GB, resp. dvojvrstvové médium, kde prvá vrstva je kompatibilná s CD, druhá zas s SACD; rozdiel oproti DVD je najmä v premenlivosti šírky stôp – to je spôsob kódovania dodatočných informácií na ochranu pred kopírovaním), tok dát tvorí jednobitové kódovanie zvuku (2 822,4 kHz, teda 64-krát vyššie než CD) formou PDMPozn. 5 s marketingovým názvom Direct Stream Digital (dátový tok je znížený proprietárnym bezstratovým postupom menom Direct Stream Transfer založenom na dopredne adaptívnej predikciiPozn. 6). Každé médium povinne obsahuje dvojkanálový záznam, navyše môže obsahovať i viackanálový záznam – 4.0 alebo 5.1 (v SACD označované multi-channel, nie surround sound). PCM a PDM možno len ťažko priamo porovnávať, v propagačných materiáloch sa uvádza dynamický rozsah 120 dB pri frekvenčnom rozsahu 20 Hz až 20 kHz a najvyššia zaznamenateľná frekvencia 100 kHz. Formát sa preto ujal hlavne medzi audiofilmi (napr. v máji r. 2005 vyšlo 3000 titulov, 40% z nich tvorila klasická hudba) – pre normálnych používateľov je aj kvalita CD veľmi vysoká, preto nemajú potrebu získať „vyššiu vernosť“. Formát však stále hrá svoju rolu a Sony ho neodpísalo – hracia konzola Playstation 3, ktorá vyjde v novembri 2006, ho bude natívne podporovať. V súčasnosti nie je známy prípad nelegálneho kopírovania SACD – obsah je šifrovaný (80-bitová šifra) a pre odlišnosť fyzickej realizácie disku oproti DVD pre SACD neexistujú počítačové mechaniky, len licencované prehrávače, neposkytujúce pôvodný dátový tok.

DVD-Audio (DVD-A) pochádza z dielní firmy Matsushita, ktorých návrh konkuroval návrhu firiem Sony a Philips v boji o priazeň zoskupenia DVD Forum. Na trhu je prakticky od r. 2000. Fyzicky ide o klasické DVD médium, uložený zvuk je zväčša vo forme PCM, 24 bit, 44,1 kHz až 192 kHz, jeden až 6 kanálov. (V prípade 192 kHz je to najviac stereo – pre 4700 MB médium aj to vystačí len na 70 minút záznamu; pre 96 kHz podporuje špecifikácia záznam typu 5.1) Zvuk však možno kódovať bezstratovou kompresnou schémou MLP, čo takmer zdvojnásobuje kapacitu média. Rozšírené sú i „hybridné“ DVD-A, ktoré na druhú stranu média ukladajú hudbu stratovo vo formáte Dolby Digital alebo DTS, aby ju mohli prehrávať i klasické DVD-Video prehrávače, resp. média DualDisc, kde sa na druhej strane nachádza klasické CD s rovnakým záznamom. Na DVD-A sa môžu nachádzať i videosekvencie, interaktívne menu, texty piesní atď., podobne ako na DVD-Video. DVD-A má nielen šifrovaný obsah, ale používa i princíp digitálneho vodoznakuPozn. 7, jednoznačne identifikujúc zhodu média a obsahuPozn. 8. Značnou nevýhodou je, že DVD-Audio prehrávače kvôli licenčnej politike zoskupenia DVD Forum požadujú priamy analógový šesťkanálový výstup do reprodukčnej sústavy (občas sú vybavené aj stereo výstupom zníženej kvality), všetko pre ochranu pred kopírovaním.


Poznámka 1: Priemer kompaktnej audiokazety bol 11,5 cm, CD s takým rozmerom by so zachovaním ostatných parametrov mohlo zaznamenať 60 min. hudby. Existuje rozšírená legenda, ktorá hovorí, že priemer CD bol zvýšený preto, aby sa naňho zmestil záznam Beethovenovej deviatej symfónie (trvajúcej niečo vyše 70 minút). Nie je pravdivá (ako uvádza spolutvorca CD, Kees Immink z firmy Philips, p. IMMINK, K. A. S. The Compact Disc Story). V skutočnosti priemer 12 cm vznikol jednoduchým zaokrúhlením, ktoré len minimálne zväčšilo rozmer, poskytlo však oproti LP platniam dostatočný priestor na umiestnenie bonusových skladieb

Poznámka 2: Ide o dynamický rozsah hladiny akustického tlaku. Ak berieme do úvahy rôznu citlivosť na rôzne frekvencie (napr. váhovanie ITU-R 468, p. odsek 2.2.2 Vnímanie hlasitosti), je najmenšia hlasitosť v rozsahu 20 Hz až 20 kHz -86 dB oproti úplnému rozsahu. Psychoakusticky je však táto hodnota vyššia vďaka použitiu rozptyľovania v procese kvantovania (p. odsek 3.1.2 Kvantovanie).

Poznámka 3: 1 MiB = 210 bajtov = 1 048 576 bajtov. 703 MiB = 737 MB (1 MB = 1 000 000 bajtov).

Poznámka 4: P. http://en.wikipedia.org/wiki/Compact_disc [cit. 2006-03-22].

Poznámka 5: P. odsek 3.1.2 Kvantovanie.

Poznámka 6: P. odsek 3.4.2 Kódovanie lineárnou predikciou.

Poznámka 7: Digitálny vodoznak (angl. digital watermark) je označenie technológií snažiacich sa do digitálnej reprezentácie multimediálneho obsahu (zvuk, obraz) vniesť nebadateľné „značky“, ktoré nepočuť resp. nevidieť, no poskytujú (v prípade znalosti postupu ich dekódovania) dodatočné informácie, ako napr. identifikáciu zdroja, skladby, výrobného kódu atď. Jeden z príkladov môže byť aj A©WA od Fraunhoferovho Inštitútu pre grafické spracovanie dát (http://www.igd.fraunhofer.de/igda8/syscop/audio.html).

Poznámka 8: Jediný rozumný spôsob prekonania ochrany je získanie jedného z dešifrovacích kľúčov – napr. v r. 2004 sa ho podarilo získať rozborom kódu programu WinDVD. Nepodarilo sa však odstrániť vodoznak (teda po napálení dát na DVD-R médium sa prehrávače zaseknú, zistiac rozdiel vo výrobnom kóde medzi zvukovým záznamom a médiom). Navyše, novovyrobené médiá možno vybaviť kódom, ktorý sa nedá dekódovať kľúčom, o ktorom sa vie, že je vyzradený. Viac informácií na stránke http://www.highfidelityreview.com/news/news.asp?newsnumber=14550899.

Odsek 3.5.8: Zvuk a video

Gramofónové platne, CD a rádiá majú silnú konkurenciu v médiách na ukladanie obrazu, televízii, videohrách, interaktívnych dielach atď. Tie totiž rovnako zahŕňajú zvuk, ale aj čosi navyše – obraz, interakciu. Zvuk sa stáva akoby „bočným“ médiom a druhoradou, predsa veľmi podstatnou súčasťou obsahu týchto médií. Faktom je, že človeku napr. pri pozeraní filmu viac prekáža nekvalitný zvuk ako nekvalitný obraz. Dokazuje to i nasledujúci prehľad rozličných štandardov na ukladanie filmovej tvorby, ktorý ponúkame na doplnenie predošlého odseku.

Prvou lastovičkou na poli digitálneho ukladania zvuku spolu s obrazom bola technológia Laserdisc. Philips a MCA (Music Corporation of America) ho uviedli na americký trh v r. 1978. Ide o extrémne veľký disk (priemer 30 cm), na ktorom je obraz (kompozitný signál) uložený analógovo moduláciou typu PWM. Zvuk môže byť prítomný v analógovej forme (stereo), ale aj digitálnej (PCM, AC-3, DTS, 2 až 6 kanálov – obmedzené len dátovým tokom a dekódovacími zariadeniami na strane používateľa; často obsahoval viac zvukových stôp, napr. komentár k filmu atď.). Formát je na ústupe – v USA sa uchytil medzi videofilmi (ktorí neskôr prešli na DVD-Video, štandard určený pre všetkých), v súčasnosti je tam už menej než milión prehrávačov; v Japonsku mala technológia väčší úspech, v súčasnosti sú tam asi 4 milióny prehrávačov (10% domácností); inde vo svete sa nikdy neujal. Konkurentom je mu omnoho kvalitnejší, lacnejší a pohodlnejší formát DVD-Video.

Video CD (VCD) bol štandard navrhnutý spoločnosťami Sony, Philips, Matsushita a JVC v r. 1993, používa štandardný CD disk a jeho úlohou bolo konkurovať videokazetám. Tomu zodpovedala aj nízka kvalita obrazu (MPEG-1, 1150 kbps, 352×240 pre NTSC, 352×288 pre PAL). Zvuk bol však dosť kvalitný (MP2, 224 kbps, stereo, 44,1 kHz). Tento štandard sa ujal len v Ázii – nielen neponúkal žiadne skutočné zlepšenie kvality, ale najmä umožňoval lacné kopírovanie filmov a nemal žiadne ochranné prvky, čo spôsobilo jeho odmietnutie zo strany nahrávacích spoločností z USA a Európy. V r. 1998 sa tento formát dočkal vylepšenej verzie, Super VCD (SVCD), s kvalitnejším obrazom a lepším zvukom (128-384 kbps, podpora viac zvukových stôp, najviac 8 kanálov použitím technológie MPEG Multichannel). Vytvorili ho pôvodné spoločnosti v spolupráci s čínskymi vedcami na objednávku čínskej vlády, v snahe oslobodiť sa od licenčných poplatkov za DVD. Tento formát sa ujal v mnohých domácnostiach nielen v Juhovýchodnej Ázii, ale aj v USA a Európe, kde sa používa najmä na amatérske snímky (rodinné oslavy zaznamenané lacnými kamerami atď.).

DVD-Video je asi hlavným dôvodom vzniku štandardu DVD (neoficiálne významy: Digital Versatile Disk, Digital Video Disc). Uviedlo ho v r. 1996 zoskupenie DVD Consortium (potom premenované na DVD Forum), hlavný podiel na technológii týchto 12 cm optických diskov mala firma Matshushita. Obrazovej zložke sa nebudeme venovať, zvuk musí byť vo formátoch PCM, DTS, MP2 alebo AC-3. Zväčša sú zvukové stopy (býva ich viac) kódované vo formáte AC-3, 48 kHz, 16 bit (5.1 a 448 kbps alebo 384 kbps, resp. 2.0 a 192 kbps) a sú súčasťou celého toku dát, chráneného šifrovaním a regionálnymi kódmiPozn. 1. Zvukový výstup z prehrávačov je analógový (zväčša downmixovaný na stereo) aj digitálny (S/PDIF, prenáša pôvodný zvukový tok dát). Pre súčasnú rozšírenosť a popularitu DVD-Videa je výrazný útlm v predajnosti nosičov nepravdepodobný. O pár rokov sa mu však vážnym konkurentom stanú disky novej generácie ako HD DVD a BD.

HD DVD je návrhom firiem Toshiba, NEC a Sanyo (s podporou spoločností z IT priemyslu ako Microsoft, HP, Intel), ktorý DVD Forum v r. 2003 ustanovilo ako nástupcu DVD pre obraz s vysokým rozlíšením. Fyzicky používa takmer rovnaké médiá, kapacita jednej vrstvy je však 15 GB (oproti 4,7 GB na DVD). Plánujú sa jednovrstvové a dvojvrstvové médiá (existujú však prototypy trojvrstvových). Výhodou je fakt, že výrobné linky na médiá nepotrebujú takmer žiadne úpravy v technológii výroby. Navyše, čítanie DVD a HD DVD možno kombinovať v jednej optike, dokonca na jednom médiu môžu byť dve vrstvy – DVD a HD DVD, uľahčujúc tak filmovým spoločnostiam i používateľom prechod na nový formát. Medzi podporované formáty zvuku patria PCM, Dolby TrueHD, DTS-HD, DD+, ochranné prvky sú vylepšením technológií prítomných v DVD-Audio. Prvé mechaniky a filmy prišli na trh v marci 2006.

Blu-ray Disc (BD) je spoločným návrhom mnohých firiem, medziiným Sony, Philips, Pioneer (tiež s veľkou podporou firiem z IT branže ako Apple, Dell, no i HP), ktorého špecifikácia bola uverejnená už v r. 2002. Použitie zložitejšej optiky a ochrannej vrstvy hrúbky len 0,1 mm (šesťkrát menej než DVD a HD DVD, preto je ich povrch chránený špeciálnym polymérom menom Durabis) umožňuje vysokú kapacitu 25 GB na vrstvu, za cenu náročnejšej výroby mechaník i médií. Predpokladá sa používanie jednovrstvových a dvojvrstvových médií (existujú však prototypy so štyrmi či ôsmimi vrstvami, JVC dokonca vyvinulo prototyp kombinovaného DVD/BD média). Podporované zvukové formáty zahrnujú PCM, Dolby TrueHD, DTS-HD a DD+. Čo sa týka bezpečnostných opatrení, sú podobné štandardu HD DVD. Podpora mnohých nových technológií (napr. Java zabezpečuje interaktivitu, dokonca sa ráta s prístupom na internet) a podpora veľkých spoločností zo sveta IT zaručujú, že BD sa udrží – ba dokonca v dlhodobom horizonte možno aj zvíťazí nad HD DVD, a to i napriek vyššej cene.

Existujú aj rôzne iné alternatívne formáty, no schopnú konkurenciu ponúka len tchajvanský FVD (Forward Versatile Disc – oproti DVD má navyše podporu zvukového formátu WMA), aj to len na území tohto štátu. Otázny je formát VMD (Versatile Multilayer Disc), ktorý má slabú podporu, má vyjsť v treťom kvartáli roku 2006 a zvukové formáty, ktoré bude podporovať, nie sú bližšie známe. Jeho primárnym cieľom je však indický a čínsky trh.


Poznámka 1: Prvú ochranu možno ľahko prekonať pomocou hrubej sily, druhú upraveným softvérom či prehrávačmi.

Odsek 3.5.9: Rozhrania na prenos zvuku

Základným a najviac rozšíreným rozhraním na prenos zvuku je klasický dvojžilový (mono zvuk) alebo trojžilový (stereo) elektrovodivý kábel, zväčša typu jack (3,5 mm), výnimočne RCA (cinch). Okrem týchto analógových však existujú i digitálne rozhrania.

V súčasnosti najrozšírenejším štandardom na prenos audiosignálu digitálnym spôsobom je štandard S/PDIF (Sony/Philips Digital Interface Format), ktorý je zväčša realizovaný koaxiálnym káblom alebo optickým vláknom (to nie je náchylné na elektromagnetický šum). Podporuje zvuk vo formáte PCM (najviac 2 kanály, 48 kHz, 24 bitov; výnimočne 4 kanály a 16 bitov – nad pôvodnú špecifikáciu) a komprimovaný zvuk (vo formáte MPEG-2, AC-3, DTS, atď. s dátovým tokom nepresahujúcim 3 Mbps). V druhom prípade sa v koncovom zariadení musí nachádza dekodér, ktorý skomprimovaný zvuk spracuje. Na začiatku vzniklo S/PDIF za účelom prenosu signálu v rámci hi-fi zostáv (najmä drahé CD prehrávače pre audiofilov, aj keď využitie našlo aj v digitálnych páskových záznamových zariadeniach), kde sa DAC umiestňoval často až pred zosilňovač v reproduktore, aby sa zabránilo prípadnému rušeniu signálu elektromagnetickým smogom. Dnes sa s ním stretneme najmä v systémoch „domáceho kina“, na prenos zvykového signálu medzi DVD prehrávačom a reproduktorovou zostavou (resp. zosilňovačom, na ktorý je napojená) opatrenou vhodným dekodérom.

Rozhraním budúcnosti pre konzumný trh sa však má stať High-Definition Multi-media Interface (HDMI). Navrhlo ho konzorcium firiem Sony, Philips, Hitachi, Matsushita, Thomson, Toshiba a Silicon Image na konci roku 2002. Ako názov napovedá, ide o multimediálne rozhranie, okrem obrazu (vo formáte zhodnom so starším DVI) teda prenáša aj zvuk (celkovo dátový tok pre jednu linku do 5 Gbps). Pre univerzálnosť riešenia sú všetky dáta nekomprimované. HDMI podporuje osem kanálov vo formáte PCM (do 192 kHz a 24 bitov, resp. 2 822,4 kHz a 1 bit). Ochrana pred nelegálnym kopírovaním je garantovaná zložitým proprietárnym návrhom High-Bandwidth Digital Content Protection (HDCP) od firmy IntelPozn. 1. V prípade prepojenia HD zariadenia (High-Definition, či už ide o obraz alebo zvuk) cez iný kábel než HDMI, (resp. zo zariadením nepodporujúcim HDCP) sa kvalita obrazu aj zvuku znižuje – na 48 kHz, 16 bitov, stereo. Napriek chybám v implementácii DRM ochrany bude toto rozhranie dominovať, keďže podporu mu vyjadrili nielen veľké spoločnosti, ale aj úrady v Európe či USA. Uchytiť sa má najmä v segmente HDTV. (Vysielanie High Definition TV, teda televízie s vysokým rozlíšením – 1280×720, resp. 1920×1080 – je už dnes stále rozšírenejšie, najmä v západných krajinách.)

Treba podotknúť, že HDMI je určené predovšetkým do segmentu konzumnej elektroniky, v počítačovom priemysle však podľa mienky mnohých nestačí – napr. pre rozlíšenie monitora 1600×1200 umožňuje len 85 snímok za sekundu (frekvencia pixelov 165 Mhz pre jednolinkové spojenie). Riešením by mohol byť dvojlinkový kábel (tiež súčasť špecifikácie), implementácia je však náročnejšia. Preto je možné, že sa vo svete PC skôr stretneme so štandardom Unified Display Interface (UDI, dátový tok 16 Gbps, prenáša však len obraz, a to vo formáte kompatibilnom s HDMI a DVI, presná špecifikácia UDI má uzrieť svetlo sveta v druhom kvartáli tohto roku). Zaujímavé bude aj sledovať vývoj a prijatie štandardu DisplayPort, ktorý má byť použiteľný bez poplatkov (spravuje ho VESA, medzi firmami pracujúcimi na jeho návrhu však pracovali spoločnosti ako ATI, Dell, HP, Philips či Samsung) a je flexibilnejší než všetky doterajšie formáty a rozhrania (s vynikajúcou rýchlosťou do 10,8 Gbps, čo mu umožňuje zahrnúť toky dát predošlých existujúcich štandardov do seba). Prenáša aj zvuk, no presná špecifikácia nie je k dispozícii (podľa predpokladov VESA má byť vypracovaná na konci prvého kvartálu tohto roku).


Poznámka 1: Tieto bezpečnostné opatrenia však majú veľa „osudových chýb“, ktoré ich umožňujú prelomiť, p. http://apache.dataloss.nl/~fred/www.nunce.org/hdcp/hdcp111901.htm, http://www.macfergus.com/niels/dmca/cia.html.

Odsek 3.5.10: MPEG

Skratka MPEG znamená Moving Picture Experts Group (teda skupina expertov na pohyblivé obrázky) a označuje pracovnú skupinu pri organizáciách ISO (International Standards Organization) a IEC (International Electro-Technical Commision; oficiálne označenie skupiny MPEG je ISO/IEC JTC1/SC29 WG11), ktorá sa od r. 1988 pod vedením talianskeho vedca menom Leonardo Chiariglione zaoberá vývojom štandardov na kódovanie a kompresiu videa, zvuku a médií vôbec. Táto skupina, resp. vedci, ktorí za ňou stoja, významnou mierou ovplyvnili vývoj zvukových formátov spomínaných v našej práci. Tu si spomenieme niekoľko štandardov z ich dielne. Presný popis formátov MP3 a AAC môže čitateľ nájsť v príslušných častiach práce (4.2, str. 89, resp. 4.3, str. 94). (Poznámka: v bežne používanej reči sa pod slovom MPEG myslí aj súbor štandardov, ktorý táto skupina vyvinula a spravuje.)

Najstarší štandard (dokončený roku 1992) má označenie MPEG-1 a popisuje jednoduché techniky na kompresiu zvuku a obrazu (s nízkym rozlíšením, vhodným na digitálnu telefóniu, vysielanéPozn. 1 video atď.) na základe psychoakustickej a psychovizuálnej redundancie zdroja. Časť štandardu zaoberajúca sa zvukom navrhuje tri rôzne stupne komplexnosti kompresie, v závislosti od želanej výpočtovej náročnosti: MP1, MP2 a MP3 (celým názvom MPEG-1, part 3: audio, layer 1-3). Podporované vzorkovacie frekvencie sú 32 kHz, 44,1 kHz a 48 kHz pri 8-bitovej alebo 16-bitovej hĺbke; počet kanálov bol nanajvýš dva (možnosti mono, dva nezávislé mono kanály a v prípade MP3 aj stereo – nezávislé alebo spojené kódovanie). Dátový tok siahal od 32 kbps po 320 kbps (MP3, pre MP2 je stropom 384 kbps, pre MP1 až 448 kbps).

MPEG-2 (špecifikácia dokončená roku 1994), čo sa týka kompresie zvuku, v časti MPEG-2 part 3 dodáva možnosť kompresie viacerých kanálov (do 5.1 – pri ňom môže dátový tok siahať do 1024 Mbps – MPEG Multichannel; zväčša v kombinácii s MP2) a umožňuje použiť aj menšie vzorkovacie frekvencie (16 kHz, 22,05 kHz, 24 kHz)Pozn. 2 pri dátovom toku 8 kbps až 160 kbps. Vzniká však aj nová vetva kompresie zvuku (part 7) – AAC (Advanced Audio Coding), nekompatibilná s MPEG-1, no efektívnejšia. Kompresia obrazu sa naďalej zdokonaľuje (za cenu vyššej výpočtovej náročnosti) a je vhodná na obraz s vyšším a vysokým rozlíšením (PAL a HDTV) pri vysokých dátových tokoch.

MPEG-4Pozn. 3 nevznikal kvôli dosiahnutiu vyššej kompresie, ale predovšetkým preto, aby poskytol omnoho vyššiu funkcionalitu ako predošlé verzie. Zahrnoval v sebe databázové služby, interaktivitu, mobilné aplikácie atď. To všetko s cieľom poskytnúť multimediálne informácie v najrozličnejšej forme. Kompresia obrazu i zvuku siahala od veľmi nízkeho dátového toku (napr. 2 kbps ako dolný limit na kompresiu hovoreného slova) k vysokým dátovým tokom (v prípade zvuku realizovaných algoritmom AAC). MPEG-4 part 3 rozširuje špecifikáciu AAC medziiným o technológie HE-AAC, AAC-SSR a BSAC. Z formátov na kódovanie zvuku spomeňme ešte štruktúrovaný zvuk (angl. structured audio), formát popisujúci model syntézy zvuku a inštrukcie na reprodukciu. Trh však oň zatiaľ neprejavil záujem. Zavádza sa podpora škálovateľného kódovania zvuku – možnosti meniť (zmenšovať vynechaním časti dátPozn. 4) dátový tok, a tým docieliť znižovanie výslednej kvality zvuku. Súčasťou štandardu je aj podpora pre vektorové kvantovanie frekvenčnej domény – štandard TwinVQ (nezískal veľkú popularitu kvôli vysokej výpočtovej náročnosti). Kompresia obrazu sa tiež zdokonaľuje. Prvá verzia MPEG-4 bola schválená roku 1998, odvtedy sa však tento štandard dočkal mnohých dodatkov a je ešte v súčasnosti stále obohacovaný o nové technológie a postupy. Obsahuje podporu pre DRM schémy.

Treba podotknúť, že spomínané zvukové štandardy skupiny MPEG sú do značnej miery kompromisom medzi normatívnosťou a informatívnosťou. Štandard definuje formát výstupného toku dát a štandardný (referenčný) dekodér, konštrukcia kodéra je však ponechaná voľne na tvorcu. Dokonca sú prípustné dekodéry spĺňajúce stanovenú odchýlku od referenčného dekodéra – umožňujúc implementovať ich aj použitím celočíselnej aritmetiky.

Konzorcium MPEG ešte vyvíja štandardy s označením MPEG-7 (zaoberajúce sa štandardizáciou popisu multimediálneho obsahu) a MPEG-21 (zaoberajúce sa správou a univerzálnym popisom práv pri používaní a šírení multimédií).


Poznámka 1: Angl. streaming, teda šírenie toku (prúdu) dát (napr. cez internet) a ich prehrávanie počas príjmu signálu. Je alternatívou prehrávania súborov, teda lokálne (úplne) dostupných dát.

Poznámka 2: Proprietárne rozšírenie MPEG-2 navrhnuté Fraunhoferovým Inštitútom pre integrované obvody, tiež označované „MPEG-2.5“, ponúka i vzorkovacie frekvencie 8 kHz, 11,025 kHz, 12 kHz.

Poznámka 3: MPEG-3 mal pôvodne ponúknuť špecifické postupy pre kompresiu obrazu s vysokým rozlíšením (HDTV), pri vtedajšej výpočtovej sile zariadení však nebolo možné využiť mnohé navrhované postupy, preto sa od nich upustilo a výskum sa spojil s ešte prebiehajúcim postupom štandardizácie MPEG-2. Navyše, skratka MP3 sa v ušiach verejnosti spájala so zvukovým formátom, preto MPEG od označenia MPEG-3 celkom upustil.

Poznámka 4: P. odsek 3.4.3 Hybridné a škálovateľné kódovanie. Porovnaj s technológiou peeling formátu Ogg Vorbis.

Odsek 3.5.11: Predpokladaný vývoj

V súčasnosti žijeme v digitálnej ére, používanie digitálnych technológií a služieb sa neustále prehlbuje. Človek predvčerajška potreboval „vlastniť“ nahrávku, aby vedel, že je jeho, že s ňou môže manipulovať, že si ju môže vždy vypočuť. Ak by však mal vlastniť všetky nahrávky, ktoré sa mu páčia, vyšlo by ho to draho. Človek včerajška si zvykal na isté kompromisy, nemusel fyzicky „vlastniť“ zvukový záznam, stačilo, ak ho vedel v prípade potreby získať – počnúc piesňami na želanie v rádiách, končiac sieťami peer-to-peer na výmenu digitalizovanej hudby.

Človek dneška je iný. Zvykol si na svet informácií, svet pohodlia. Do popredia už celkom prenikla služba. Aj keď nahrávacie spoločnosti reagujú pomaly (rýchlejšie v implementácii stále komplikovanejších DRM schém ako v poskytovaní nových služieb, vhodných v informatizovanom svete), svet sa mení. Ľudia počúvajú satelitné rádiá (v USA najmä v autePozn. 1), online rádiá a digitálne terestriálne rádiá. Najnovšie sa stávajú účastníkmi podcast sietí, sťahujúc si z internetu hudbu na svoje prenosné prehrávače, v snahe počúvať ich kedy chcú, kde chcú a ako chcú, a najmä bez reklám. V súčasnosti si médiá určené pre spotrebnú (tzv. „čiernu“, „obývačkovú“) elektroniku (napr. DVD-Video) môžeme pozrieť už i na počítači a počítačové multimédiá môžeme často spokojne pozerať použitím spotrebnej elektroniky. Spolu s prienikom „multimediálnych centier“ (účelových počítačov) do obývačiek sa stiera hranica medzi domácou zábavou a svetom počítačov, čo vydavateľské spoločnosti spočiatku sledovali s nevôľou. Teraz si však začínajú uvedomovať, že dôležitejší je komerčný úspech medzi používateľmi, popularita a jednoduchosť služby ako neustále obviňovanie používateľov z nelegálnych praktík. Poskytovanie často drahých a nedokonalých nahrávok, predsa však pohodlným spôsobom, prináša úspech, ako vidno v extrémne rýchlo rastúcom obrate on-line obchodov s hudbou. V r. 2008 sa v U.S.A. tržby z digitálnej hudby odhadujú na 4,6 miliárd dolárov, čím prekonajú nielen predaj CD nosičovPozn. 2.


Poznámka 1: Dokonca väčšina Američanov počúva hudbu najmä v aute – p. SCHADLER, T. et al. The Future of Digital Audio. 2005. Figure 1.

Poznámka 2: Tamže, odstavec „The future of digital audio is bright“.


<
<< Späť - Časť 3.4: Princípy bezstratovej kompresie zvuku <<
^^ Hore - Kapitola 3: Digitálny svet zvuku ^^
>> Ďalej - Kapitola 4: Prehľad stratových zvukových formátov >>

(c) 2006 Pavol Adam
kontakt
Powered by:
ATRIP software