Úvod do metód spracovania zvuku v súčasnom multimediálnom prostredí

<< Späť - Časť 2.1: Zvuk ako fyzikálny fenomén <<
^^ Hore - Kapitola 2: Analógový svet zvuku ^^
>> Ďalej - Časť 2.3: Charakteristiky zvuku >>

Časť 2.2: Psychoakustika

Zvuk má mnoho objektívne merateľných vlastností, tie však nemusia podávať dobrý obraz o tom, čo človek ozaj zachytí sluchom. Vzduch je spojité prostredie, teda jeho molekuly môžu teoreticky prenášať ľubovoľnú zmes frekvencií, každú s osobitou amplitúdou a fázou. Faktom však je, že nie všetko je pre ľudské ucho dôležité, a preto to nie je potrebné zaznamenávať. Je napríklad všeobecne známou skutočnosť, že človek zachytí zvuky od 20 Hz (nižšie kmitočty pri dostatočnej hlasitosti vníma skôr v podobe vibrácie tela) do 20 kHz (táto hranica klesá s dospievaním a starnutím na asi 16 kHz).

To je len jeden zo záverov psychoakustiky, teda náuky o vnímaní zvuku človekom, o ktorej si bližšie porozprávame v tejto časti práce. Obsahuje šesť odsekov: 2.2.1 Fyziológia ľudského ucha, 2.2.2 Vnímanie hlasitosti, 2.2.3 Vnímanie kvality, harmonické tóny, 2.2.4 Maskovanie zvukov, 2.2.5 Vnímanie frekvencie a 2.2.6 Hudobný vnem.

Odsek 2.2.1: Fyziológia ľudského ucha

Ucho sa skladá z vonkajšieho, stredného a vnútorného ucha. Vonkajšie ucho má dve časti - ušnicu a zvukovod. Zvukové vlny zo zdroja zvuku sú sústreďované ušnicou do zvukovodu. Jej nesymetrický tvar spôsobuje, že zvukové vlny prichádzajúce z rôznych smerov sú mierne odlišné (odraz zvuku od ľubovoľného povrchu, najmä mäkkého, ho pozmeňuje vo fáze, amplitúde i frekvenčnom spektre), čo pomáha pri lokalizácii zdroja (p. časť 2.5 Priestor vo zvuku). Zvukové vlny pokračujú zvukovodom, jednoduchým valcovým otvorom (ten však mierne zosilňuje zvuky v rozsahu 3 až 12 kHz) až k bubienku.

Bubienok tvorí hranicu medzi vonkajším uchom a stredným uchom. Aj keď sa v strednom uchu tiež nachádza vzduch, zvuk už prúdi prostredníctvom kostičiek, pomenovaných kladivko, nákovka a strmienok. Tie privádzajú vibrácie vo forme tlakových vĺn na oválne okienko.

Oválne okienko je vstupnou bránou do vnútorného ucha, teda najmä slimáka (kochlea), v ktorom sa už nachádza nie vzduch, ale zmes tekutín (endolymfa). Dno slimáka tvorí bazilárna membrána, na ktorej je uložený tzv. Cortiho orgán. Na ňom sa nachádzajú vláskové bunky. Bazilárna membrána reaguje na chvenie vnútornej tekutiny rozkmitaním na danom mieste membrány (v závislosti od frekvencie). Na tom mieste dochádza k vzájomnému pohybu vláskových buniek, čo spôsobuje zmenu ich elektrického potenciálu; chvenie vnútornej tekutiny teda premieňajú na elektrické impulzy, ktoré spracúva mozog – a vzniká sluchový vnem.

Odsek 2.2.2: Vnímanie hlasitosti

V predošlej časti práce (2.1) sme zaviedli logaritmický spôsob merania hladiny akustického tlaku (aj hladiny intenzity zvuku – p. odsek 2.1.2 Hlasitosť zvuku), teraz je načase vysvetliť jeho opodstatnenie. Ľudské ucho je úžasne citlivý orgán. Zachytí už veľmi tiché zvuky, ale vie si poradiť i so zvukmi vysokej hlasitosti. Pomer akustického tlaku medzi týmito druhmi zvukov môže byť až jeden k miliónu (a keďže intenzita zvuku sa v porovnaní s akustickým tlakom správa kvadraticky, je v jej prípade pomer medzi najtichším a najhlučnejším bezbolestne počuteľným zvukom až jeden k biliónu). Vtedy nám príde vhod spomenutý logaritmický výpočet, ktorý dáva rozsah 120 dB (v oboch prípadoch). Takýmto spôsobom môžeme zachytiť malými číslami veľký rozsah, pričom na začiatku škály je citlivosť (presnosť) vysoká, na vyšších číslach zas nižšia. Logaritmické vyjadrenie akustickej úrovne umožňuje lepšie porovnanie hlasitostí dvoch signálov. Ak vzrastie hlasitosť zvuku napr. z 25 dB na 35 dB, človeku sa ten nárast subjektívne zdá porovnateľný s nárastom zo 70 dB na 80 dB. Prevláda názor, že nárast o 10 dB je subjektívne vnímaný ako „zdvojnásobenie hlučnosti“ (čo sa, samozrejme, len ťažko dá kvantifikovať). Ak rátame ako referenčný akustický tlak prah počuteľnosti, môžeme si urobiť obraz o jednotlivých úrovniach hlasitosti na základe tabuľky 2.1.

Lp [dB(SPL)]p [Pa]zdroj zvuku, udalosť s danou hlasitosťou
00,000 020prah počuteľnosti (zdravého jedinca, 1 kHz)
100,000 063ľudský dych zo vzdialenosti 3 metrov
300,000 632ticho v divadle, noc na púšti
400,002 000ticho na sídlisku v noci, ľudský šepot
500,006 325tichá kaviareň
600,020zvyčajná hlasitosť normálnej konverzácie
800,200vysávač zo vzdialenosti 1 meter
900,632nákladné auto zo vzdialenosti 1 meter
1002diskotéka, televízor alebo veža pri najvyššej hlasitosti
12020rockový koncert, vzlet prúdového lietadla (100 m)
telo cíti vibrácie pri nízkych frekvenciách
13063vojenský dychový orchester zblízka
prah bolesti pre všetky frekvencie
150632prúdový motor (30 m)
bolesť v hrudníku, rozmazané videnie
poškodzovanie sluchu pri všetkých frekvenciách
18020 000motor rakety (30 m), dunenie vráskavca ozrutného (1 m)
Výbuch sopky Krakatau (r. 1883) zo vzdialenosti 160 km!
Tab. 2.1 – Porovnanie hladiny akustického tlaku (Lp) s akustickým tlakom (p), ktoré generujú rôzne zdroje zvuku

V laboratórnych podmienkach je človek schopný rozlíšiť rozdiel v hlasitosti pre tón danej frekvencie už od 1 dB, pre všeobecné zvuky a prostredie je táto úroveň 3 dB a viac.

Keďže však človek nevníma rôzne frekvencie pri zhodnom akustickom tlaku rovnako, Medzinárodná elektrotechnická komisia (International Electrotechnical Commision, IEC) definuje aj tzv. A-váhovanie (angl. A-weighting), ktoré na základe štatistických prieskumov upravuje zmeranú hladinu akustického tlaku v závislosti od frekvencie zdroja. Ľudské ucho je totiž najcitlivejšie na frekvencie v rozsahu 3 kHz až 6 kHz, pričom pre frekvencie nad 20 kHz a pod 20 Hz nastáva úplný útlm (ľudský sluch ich nezachytí). Toto váhovanie sa opiera o výsledky zostavené Fletcherom a Munsonom z Bell Laboratories v r. 1933 (ich výsledky boli neskôr – v r. 2003 – upresnené normou ISO 226:2003), ktorí krivkami (izofónami) vyjadrili subjektívne vnímanie rovnakej úrovne hlasitosti (obr. 2.1Pozn. 1) v závislosti od frekvencie (os x) a hladiny akustického tlaku (os y) pre referenčný kmitočet 1 kHz. Zatiaľ čo pre 1 kHz je prahom počuteľnosti akustický tlak p0 (teda 0 dB), pre 20 Hz je to vyše 3000-krát vyššia hodnota (70 dB). Najnižšia krivka teda vyjadruje absolútny prah počuteľnosti, ktorý je závislý od frekvencie. Najvyššia krivka je zas absolútny prah bolesti. (Pri vysokej hlasitosti dochádza k tzv. akustickému reflexu, keď svaly vo vnútornom uchu odtiahnu kladivko od bubienka a strmienok od slimáka, aby lepšie chránili sluch pred poškodením.) A-váhovanie je potom prenosová funkcia totožná s krivkou pre 1 kHz a 40 dB. Takto vyjadrená hlasitosť sa kedysi merala v jednotkách fón (phon), v súčasnej dobe sa o nej skôr hovorí ako o A-váhovanej hlasitosti, ktorú možno označiť aj LA=x dB(SPL) , čo vyjadruje použitie referenčnej hodnoty p0, predsa však pri aplikácii frekvenčného filtra A-váhovania.Pozn. 2

Obr. 2.1 - Krivky rovnakej subjektívnej hlasitosti v závislosti od frekvencie tónu
Obr. 2.1 - Krivky rovnakej subjektívnej hlasitosti v závislosti od frekvencie tónu

Treba poznamenať, že výsledky Fletchera a Munsona boli namerané použitím slúchadiel, ktoré, nasadené na ušiach, takmer bez skreslenia prenášajú až na bubienok ucha nízke frekvencie, zatiaľ čo pri vysokých frekvenciách vznikajú v malých priestoroch medzi reproduktorom a zvukovodom rôzne ozveny a rezonancie. Podobný výskum ako Fletcher a Munson robili v r. 1956 Robinson a Dadson, ale použili jeden reproduktor umiestnený pred poslucháčom – výsledky boli aj preto trochu odlišné, aj keď ich hodnovernosť je tak či tak často spochybňovaná, keďže signifikantné rozdiely oproti Fletcherovi a Munsonovi nemožno vysvetliť len spôsobom reprodukcie. Odlišné výsledky by zrejme boli namerané aj pri použití dvojice reproduktorov.

Práca Fletchera a Munsona navyše rátala len s jednoduchým (čistým) tónom, nie so šumom alebo inými zvukmi. V šesťdesiatych rokoch 20. storočia urobilo preto rozsiahlejší prieskum výskumné centrum BBC. Na základe ich výsledkov zostavil Rádiokomunikačný sektor Medzinárodnej telekomunikačnej únie (ITU-R) štandard váhovania ITU-R 468. Táto prenosová funkcia zosilňuje najmä pásmo okolo 6 kHz, keďže na šum s touto frekvenciou je ľudský sluch najcitlivejší. Vo všeobecnosti lepšie vyjadruje subjektívny vnem hlasitosti pre ľubovoľné zvuky, je však na elektronickej úrovni ťažšie konštruovateľný (čo v súčasnej digitálnej ére už nie je podstatné). Ujal sa najmä v Európe, predovšetkým v profesionálnej sfére, zatiaľ čo v USA ostáva rozšírené „nedokonalé“ A-váhovanie, vhodné skôr pre tiché zvuky (40 dB). Nezabudnime však na fakt, že všetky tieto váhovania sú len štatistickou aproximáciou, a aj keď vnímanie hlasitosti je pre ľudí podobné, predsa je pre každého z nich jedinečné.


Poznámka 1: Autor obrázku: SKIRROW, Peter. Zdroj [cit. 2006-02-14]: http://upload.wikimedia.org/wikipedia/en/thumb/4/47/Lindos1.svg/400px-Lindos1.svg.png.

Poznámka 2: Ešte presnejšou jednotkou môže byť 1 són (angl. sone, navrhnutý americkým psychológom menom Stanley Smith Stevens), definovaný ako hlasitosť 1 kHz tónu pri 40 dB(SPL). Zvýšenie váhovanej hlasitosti o 10 dB znamená zdvojnásobenie hodnoty – napr. tón frekvencie 1 kHz pri 70 dB(SPL) má hlasitosť 8 sónov.

Odsek 2.2.3: Vnímanie kvality, harmonické tóny

Aby sme vôbec mohli zvažovať kvalitu zvuku, jeho prenosu či reprodukcie, musíme sa podrobnejšie oboznámiť s rozšírenými spôsobmi výpočtu skreslenia zvuku. Vec komplikuje fakt, že na to, čo chápeme ako „kvalitné“, neexistuje žiadne skutočne objektívne meradlo. Matematický aparát preto môžeme použiť len ako „barličku“.

V ideálnom prípade má zariadenie prenášajúce alebo spracujúce zvuk (zväčša vo forme elektrického prúdu a napätia) lineárnu prenosovú funkciu, ktorá je navyše časovo invariantná (nemenná). Miera skreslenia zvuku indikuje, do akej miery sa skutočná prenosová funkcia líši od ideálnej. Začneme však niekoľkými potrebnými pojmami, ktoré treba objasniť.

Základný tón (angl. fundamental tone) je nosný tón zvuku (zväčša hlasu, hudobného nástroja), teda tón, ktorý pri počutí zvuku subjektívne vnímame ako hlavný. Táto základná frekvencia je zároveň najnižšia frekvencia vo zvuku, pričom ostatné prítomné frekvencie sú jej násobkami. Táto charakteristika platí pre väčšinu prirodzených zdrojov zvuku, ako bližšie objasníme v odseku 2.3.2 Zvuky hudobných nástrojov.

Frekvencie prítomné vo zvuku, ktoré sú násobkami základnej frekvencie, sa nazývajú alikvotné tóny (angl. overtone). Ak je tento násobok celočíselný, ide o harmonický tón. Prvý harmonický tón je zhodný so základným tónom, druhý harmonický (alebo prvý alikvotný) tón má dvojnásobnú frekvenciu, tretí harmonický (druhý alikvotný) tón má trojnásobnú frekvenciu atď. Ak násobok nie je celočíselný, ide o tzv. čiastkový tón.

Vyššie harmonické tóny (2, 3, …) vznikajú v prostredí alebo pri prenose elektrických signálov často samovoľnePozn. 1 a ľudské ucho je na ne zvyknuté, dokonca s nimi „ráta“ a na základe ich prítomnosti a frekvencie dedukuje aj frekvenciu základného tónuPozn. 2, aj keď tento ani nemusí byť vo zvuku prítomný. Vtedy hovoríme o chýbajúcom základnom tóne.

Celkové harmonické skreslenie (angl. total harmonic distortion, THD) potom vyjadruje skreslenie, ktoré nastane neželaným vznikom vyšších harmonických tónov. Je to podiel súčtu ich energií P2, P3, …, Pn a energie základného tónu P1, teda:
THD=(P_2+P_3+...+P_n)/P_1

Keďže energia rastie kvadraticky s akustickým tlakom, môžeme ju vyjadriť aj priemerným napätím, ktoré bolo zaznamenané, resp. použité pri reprodukcii uvedených frekvenčných zložiek:
THD=sqrt(V_2+V_3+...+V_n)/V_1

Skreslenie sa zväčša vyjadruje priamo ako THD (v percentách), alebo po aplikovaní desiatkového logaritmu v dB. Počet vyšších harmonických tónov zahrnutých do výpočtu (n) určuje presnosť merania.

Možno sa stretnúť tiež s jednotkou THD+N, čo je skreslenie vrátane šumu (angl. noise). Počíta sa ako podiel súčtu energií vyšších harmonických frekvencií a šumu (teda celkovej energie prijatého zvuku po odfiltrovaní tónu, ktorý sme poslali na vstup) a energie tónu na vstupe. Navyše, všetky neželané zložky výstupu možno jednoducho pokladať za šum – hovoríme o odstupe signálu od šumu (angl. signal-to-noise ratio, SNR).

Aby sme však boli objektívni, musíme myslieť aj na subjektívnu stránku, veď tieto miery boli navrhnuté pre ľudí. Faktom je, že vyjadriť skreslenie ako jedno číslo je nedostačujúce. Pri jednom počuteľnom „ťuku“ v tichej pasáži zvuku a vernom prenose zvyšku signálu môže vyjsť pri výpočte THD+N nízke číslo, zatiaľ čo pri signáli s nepočuteľným nepretržitým šumom vyjde číslo vysoké. Podobne, symetrická nelinearita prenosového kanála zapríčiňuje vznik nepárnych harmonických tónov, ktoré sú sluchu príjemnejšie než párne, spôsobené nesymetrickou nelinearitou. Vznikli preto aj iné testy (napr. od Európskej rozhlasovej únie, alebo od Lindos Electronics), ktoré zahŕňajú sekvenciu testovacích vzoriek a metodiku ich vyhodnocovania. Ich popis však zďaleka presahuje rámec tejto práce.

Otázna je navyše potreba „dokonalého zvuku“. Samozrejme, často možno odlíšiť zvuk kvalitnejší od menej kvalitného. (Stačí, ak k zvukovej karte počítača, alebo inému elektronickému zdroju zvuku pripojíme najprv malé reproduktory a potom kvalitnejšiu reproduktorovú sústavu; rozdiel je jasne počuteľný, druhé riešenie označíme ako „kvalitný zvuk“ v porovnaní s prvým; ten zas bude „nekvalitný“.) Ale existuje niečo ako „dokonalý zvuk“? Túto otázku budeme ešte zvažovať v časti 2.4 Analógové spracovanie zvuku. Tu stačí spomenúť, že napr. na prenos hovoreného slova v telefónnom signáli sa používa frekvenčný rozsah 400 Hz až 3 400 Hz. Možno sa to zdá málo, ale ľudskému sluchu to spokojne stačí na porozumenie hovoreného slova.


Poznámka 1: Viac v odseku 2.3.2 Zvuky hudobných nástrojov.

Poznámka 2: Viac v odseku 2.4.3 Reprodukcia zvuku.

Odsek 2.2.4: Maskovanie zvukov

V úplnom tichu človek začuje aj pád ihly na koberec, ak však stojí na hlučnej ulici plnej áut, nepočuje ani zvonenie svojho mobilného telefónu. Tento jav je v psychoakustike známy ako maskovanie zvukov (v angličtine sa používa termín masking). Zvuk s väčšou inenzitou zhoršuje vnímanie iného prítomného zvuku s nižšou intenzitou, alebo ho úplne prekrýva, takže tichší zvuk ani nepočuť. Ľudský sluch totiž zachytáva zvuk ako súčet všetkých zvukových signálov (frekvencií, amplitúd, fáz), ktoré dorazia na ušný bubienok, a vďaka adaptivite na rôzne úrovne hlasitosti sa mení aj presnosť (rozlíšenie), s ktorou ich zachytí.

Ak sú vo zvuku prítomné dva signály, v ktorom jeden maskuje ten druhý, hovoríme o frekvenčnom (alebo simultánnom) maskovaní. Či a do akej miery nastáva jav maskovania, závisí od frekvencie (tóny s blízkou frekvenciou sú náchylné na jav maskovania; prítomnosť veľmi odlišných frekvencií, ak nejde o harmonické násobky, je ľahko počuteľná), tvaru signálu (čistý sínusový signál ťažko prekrýva zvuk podobný šumu, zvuk podobný šumu ľahko prekrýva nevýraznú sinusoidu) a, samozrejme, pomeru hlasitostí maskovacieho a maskovaného signálu. Dôvodom je najmä konštrukcia ľudského ucha – rozkmitanie bazilárnej membrányPozn. 1 na jednom mieste (v dôsledku dominantnej frekvenčnej zložky zvuku) spôsobuje aj jej chvenie v blízkom okolí. To zapríčiňuje fyziologickú detekciu tónov s frekvenciami blízkymi dominantnej, ktoré však mozog ignoruje (keďže v pôvodnom zvuku nie sú prítomné). Na dodanie tónov kmitočtom blízkych (v rámci tzv. kritického pásma) dominantnému tónu je preto poslucháč len slabo citlivýPozn. 2. Jednou z hojne používaných mierok tejto tolerancie je Barkova mierka (angl. Bark scale), deliaca počuteľné spektrum na 24 kritických pásiemPozn. 3.

Špeciálny prípad javu maskovania je aj časové maskovanie (angl. temporal masking). Sluch nezachytí veľmi tichý zvuk znejúci po hlasnom zvuku (do času najviac 50 ms, tento jav sa nazýva dopredné maskovanie, angl. forward masking, post-masking), dokonca ani tichý zvuk znejúci tesne pred hlasným signálom (asi 10 ms; spätné maskovanie, angl. backward masking, pre-masking). Na vine je oneskorená adaptácia sluchu na rôzne hlasitosti, zapríčinená najmä chvením bazilárnej membrány.


Poznámka 1: P. odsek 2.2.1 Fyziológia ľudského ucha.

Poznámka 2: Alebo tieto pridané tóny nezachytí vôbec. Samozrejme, hovoríme o „čistých tónoch“ (sínusových).

Poznámka 3: Hraničné frekvencie sú 0, 100, 200, 300, 400, 510, 630, 770, 920, 1080, 1270, 1480, 1720, 2000, 2320, 2700, 3150, 3700, 4400, 5300, 6400, 7700, 9500, 12000, 15500. Zdroj: http://en.wikipedia.org/wiki/Bark_scale.

Odsek 2.2.5: Vnímanie frekvencie

Jednou z objektívnych mierok zvuku je kmitočet. Tu by však bolo vhodnejšie hovoriť o „výške tónu“, keďže práve tá odzrkadľuje subjektívny vnem poslucháča. Faktom však je, že „výšku“ počutého zvuku nemožno dobre kvantifikovať. Ovplyvňuje ju najmä frekvenčný rozklad zvuku, ale aj jeho hlasitosť a trvanie. Strojovo sme však schopní spracúvať len merateľné vlastnosti zvuku – rozhodujúcim atribútom je spomenutý frekvenčný rozklad zvuku, najmä základná frekvencia.

Človek však nárast či pokles vo frekvencii tónu vníma logaritmicky – nepočujeme skutočnú frekvenciu tónu (lineárne), ale jej logaritmusPozn. 1. Ak pomer medzi frekvenciami dvoch tónov je zhodný s pomerom medzi frekvenciami iných dvoch tónov, frekvenčný nárast alebo pokles ľudskému sluchu pripadá rovnaký. Tento princíp odzrkadľovali mnohé systémy ladenia a radenia tónov, vrátane pytagorejského ladenia, ktoré bolo neskôr v európskej kultúre úplne nahradené súčasným rovnomerne temperovaným ladením. Tón o oktávu vyššie než referenčný tón má dvakrát vyššiu frekvenciu (teda je jeho prvým alikvotným tónom) – charakteristikou akoby išlo o ten istý tón, len s frekvenciou o „stupeň“ vyššou. Oktáva sa navyše rovnomerne delí na 12 poltónov, čo znamená, že každý ďalší poltón má frekvenciu oproti predošlému o 122 vyššiu. Tón o oktávu vyššie ( (12212=2 ) je teda druhý harmonický tón, ďalšia oktáva znamená štvornásobnú (2×2) frekvenciu, ďalšia osemnásobnú (ôsmy harmonický tón). (Teda „výška“ – ako subjektívne vnímanie frekvencie – harmonických tónov je stále bližšie, hustejšie pri sebe.) Podľa normy má tón a1 frekvenciu 440 Hz.

Ešte presnejšie možno frekvenčný interval, teda pomer frekvencií, deliť na centy – 1 cent=12002 . Výskumy ukázali, že ľudia s citlivým sluchom sú schopní zachytiť rozdiel v dvoch tónoch s intervalom už od 5 centov vyššiePozn. 2. Človek sluchom vedome vníma len frekvenciu zvuku, nie fázu, aj keď fáza vlnenia je tiež spracovaná mozgom a aj na jej základe dokáže poslucháč lokalizovať zdroj zvuku.

Pri súčasnom posluchu dvoch tónov však sme schopní zistiť rozdielnosť ich frekvencií už pri omnoho nižších rozdieloch vďaka záznejom (angl. beat), ktoré vznikajú interferenciou dvoch vlnení s veľmi blízkou frekvenciou. Výsledný tón ponesie akoby jednoliatu frekvenciu (tóny od seba neodlíšime, zachytíme priemer ich kmitočtu), ale jeho intenzita (hlasitosť) bude kmitať na frekvencii zhodnej s rozdielom frekvencií pôvodných tónov. Tento jav je badateľný od rozdielu niekoľkých desatín Hz až po 15 Hz. Samozrejme, interferencia vznikne aj pri použití alikvotných tónov miesto základného tónu. Zázneje sa využívajú napr. aj pri ladení gitár.

Ľudský sluch má dobrú citlivosť na čas zachytenia vysokých tónov, v prípade tónov s nízkofrekvenčnou charakteristikou je vnímanie času zachytenia tónu menej presné. Naopak, frekvenčné rozlíšenie nízkych tónov v dôsledku uvedeného logaritmického vnímania je omnoho presnejšie než v prípade vysokých tónov.


Poznámka 1: Ide o Weberov-Fechnerov psychologický zákon – p. napr. HALUŠKA, Ján. The Mathematical Theory of Tone Systems. 2004. s. 5. Pre muzikálny vnem však nie je dôležitá absolútna hodnota frekvencie alebo jeho logaritmu, ale najmä kontext ostatných tónov; triedu tónov človek vníma ako vektorový priestor (tamže). Tiež treba spomenúť, že logaritmický vnem sa uplatňuje najmä pre frekvencie nad 800 Hz. Na začiatku frekvenčnej škály, pri nižších frekvenciách (najmä pod 500 Hz) vníma poslucháč nárast frekvencie takmer ako lineárny nárast výšky tónu.

Poznámka 2: Tamže. Treba však uviesť, že v prípade hudobného vnemu je poslucháč omnoho tolerantnejší – akceptuje intervaly až do 20-30 centov (p. tamže, Garbuzovove zóny, s. 57).

Odsek 2.2.6: Hudobný vnem

Hudba v tom najširšom zmysle je ťažko definovateľná, ale medzi jej základné charakteristiky patria rytmus, tempo, melódia, príp. harmónia. Pre nás bude podstatná len harmónia tónov. Harmonické tóny vznikajú v hudobných nástrojoch samovoľnePozn. 1 a ľudský sluch v nich vidí súzvuk. Vezmime si ako príklad tón s frekvenciou 440 Hz (komorné a – v medzinárodnom značení tón A4). Druhý harmonický tón má kmitočet 880 Hz (a2), tretí harmonický tón 1 320 Hz. Frekvencia e3 má v rovnomerne temperovanom ladení kmitočet 1 318,5 Hz, čo je takmer totožný tón. Aj v dôsledku toho tóny a a e, ak sú vo zvuku prítomné aj ich harmonické kmitočty, znejú poslucháčovi akosi „zladene“, keďže zdieľajú spoločné harmonické frekvencie.

Pomer frekvencií tónov e3 a a2 je teda v ideálnom prípade 3:2. Podobnými úvahami možno získať i ideálny pomer d3 a a2 (4:3), ktorý by vyžadoval od d3 frekvenciu 1 173 Hz (v súčasnom rovnomerne temperovanom ladení je to 1 175 Hz) a ostatné tóny oktávy, všetky s jednoduchým racionálnym pomerom k základnému tónu. Zdá sa teda, že by pytagorejské ladenie mohlo byť výhodnejšie. Opak je však pravdou – možno s ním vytvoriť úžasný súzvuk v jednom akorde, z pohľadu iného akordu (ak by sme začínali trebárs od tónu h) by miesto „pekných“ malých pomerov vychádzali podiely dvoch vysokých čísel, ktoré by vytvárali disharmonický zvuk. Súčasné rovnomerne temperované ladenie je teda nielen vhodnou matematickou konštrukciou, ale aj praktickou výhodou pre všetkých hudobníkov (umožňuje ľahko transponovať hudobný zápis o ľubovoľný počet poltónov). Nevýhodou je disharmónia, ktorá je však príliš slabá (rozdiely do 1% frekvencie), aby ju ľudské ucho vnímalo natoľko kriticky. Tá spôsobuje (z pohľadu následnej frekvenčnej analýzy, potrebnej pri stratovej kompresii zvuku) „zbytočné“ obohatenie frekvenčného spektra hranej hudby (ktoré ináč pri väčšine súčasnej hudby nie je veľmi bohaté).


Poznámka 1: P. odsek 2.3.2 Zvuky hudobných nástrojov.


<< Späť - Časť 2.1: Zvuk ako fyzikálny fenomén <<
^^ Hore - Kapitola 2: Analógový svet zvuku ^^
>> Ďalej - Časť 2.3: Charakteristiky zvuku >>

(c) 2006 Pavol Adam
kontakt
Powered by:
ATRIP software