Percepce zvuku: Porovnání verzí
Řádek 4: | Řádek 4: | ||
(viz též kapitola [[Stavba_sluchového_ústrojí|Fyziologická fonetika: Stavba sluchového ústrojí]]) | (viz též kapitola [[Stavba_sluchového_ústrojí|Fyziologická fonetika: Stavba sluchového ústrojí]]) | ||
− | [[File:HumanEar.jpg|400px|thumb|Anatomie ucha]] | + | [[File:HumanEar.jpg|400px|thumb|Anatomie ucha.]] |
=== Vnější ucho === | === Vnější ucho === |
Verze z 6. 9. 2014, 12:16
- zkoumá vztahy mezi fyzikálními jevy a jejich tělesnou odezvou
Obsah
Ucho
(viz též kapitola Fyziologická fonetika: Stavba sluchového ústrojí)
Vnější ucho
- boltec
- - možnost lokalizace zvuku
- zevní zvukovod
- - rezonance asi 3 000–5 000 Hz
- - asi 2–3 cm dlouhý
- bubínek
- - blána, na niž dopadají vibrace
Střední ucho
- kůstky kladívko + kovadlinka + třmínek
- převod vibrací z řídkého prostředí vzduchu do hustého prostředí kapaliny
- rezonanční frekvence 1 000 Hz – při ní kůstky nejlépe kmitají
Vnitřní ucho
- kůstky středního ucha navazují na hlemýžď (kochleu) přes oválné okénko
- každé místo bazilární membrány je schopné přenášet jen některé frekvence (na začátku nejvyšší zvuky, uprostřed nejnižší)
- Cortiho ústrojí – z něj vedou řasinkovité buňky a jejich pohyb dráždí nervy
- první spektrální filtr v cestě zvuku → excitační vzorce
Akustické hledisko
- z hlediska akustiky můžeme sledovat vnímání výšky, hlasitosti a kvality
- ! neplést výšku a frekvenci – přesná veličina × objektivní vjem !
Vnímání výšky
- závisí na základní frekvenci, ale vztah není lineární
- i když základní frekvence chybí, slyšíme ji
- při vnímání výšky hraje malou roli i amplituda – láme se to kolem 1 500 Hz – silnější hlubší tóny zní ještě hlubší, silnější vyšší tóny zní ještě vyšší
- nejnižší slyšitelná frekvence je asi (16)-20 Hz
- nejvyšší slyšitelná frekvence je asi 20 000 Hz
- < 20 Hz = infrazvuk – lze vnímat taktilně (vibrace na pokožce)
- > 20 000 Hz = ultrazvuk (protože kůstky nedokážou rychleji vibrovat) (netopýři slyší asi až 100 kHz)
- presbyakuse – snižování horní hranice slyšitelnosti s rostoucím věkem
Diference limen
- = nejmenší vnímatelný rozdíl
- liší se v závislosti na frekvenci
- nejefektivnější v nízkých frekvencích asi kolem 100 Hz (pak rovnoměrně stoupá)
- počítá se jako x/200 → u větších čísel větší hodnoty
- Hz nejsou pro percepci tolik relevantní
- asi do 800 Hz vnímáme lineárně, nad 800 se začíná logaritmovat (větší rozdíl se vnímá jako menší) (graf se jakoby zplošťuje)
- pro různé druhy akustické analýzy se hodí různé stupnice:
- - pro analýzu intonace půltóny
- - pro formanty např. mely (nejstarší), barky, erby (nejnovější)
Melová stupnice
- vynalezena ve 30. letech 20. století
- dvojice zvuků, které jsou od sebe vzdáleny stejný počet melů, vnímáme jako stejný interval (→ rozdíl třeba 100 melů je vždycky percepčně stejný)
- stejně jako u diference limen se do 800 Hz vnímá lineárně, pak se logaritmuje
- na rozdíl od oktávové stupnice (která zahrnuje i libozvučnost) využívá jen výšku
- 20 kHz = 2 400 melů
Barková a erbová stupnice
- pojem "kritické pásmo slyšení" (CB – „critical bandwidth“)
- - jak reaguje bazilární membrána na zvuky s podobnou frekvencí?
- - nejblíže jsou rázy, pak nějaká ošklivá kombinace, od hranice pak relativně melodické (z jednoho vrcholku se stanou dva odlišné, a to je právě to kritické pásmo)
- - průběh diference limen a kritického pásma je stejný (tvarem)
- - v rámci jednoho kritického pásma rozlišíme asi 20-30 diferencí limen
- vzdálenost kritických pásem se udává právě v barcích / erbech
- - frekvenčně může být jiná, ale percepčně je vždy stejná stejná
Barky
- odfiltrovaný bílý šum vystředěný kolem tónu → postupně rozšiřovali pásmo toho šumu – šlo o to, najít, v jakém okamžiku už nebude tón slyšet nebo kdy se začne měnit jeho detekce = šířka kritického pásma (šum zaplní celý filtr kolem tónu → tón už není slyšet) = 1 bark
- asi do 500 Hz pořád stejná šířka kritického pásma (asi 100 Hz), nad 500 Hz se zvyšuje (asi 20% f)
- - některé osoby se zhoršeným sluchem mají kritické pásmo širší → hůře slyší jednotlivé tóny, slévá se to
- převod: 200 melů = 2 barky, 1 000 melů = 10 barků
- nevýhoda barků – rozlišení až od 500 Hz → rozlišení v nízkých frekvencích je špatné
Erby
- signální tón, kus od něj na obě strany šum (mezi nimi „průslech“) → šum se postupně přibližuje tónu (průslech se zužuje)
- v okamžiku, kdy je to moc blízko a začne to ovlivňovat jeho detekci = šířka kritického pásma (= opačný postup než u barků → odstraňuje problém s rázováním) → lepší rozlišení v nízkých frekvencích
- ve středních frekvencích je šířka pásma asi 12% f
- problém barků i erbů je, že jejich průběh byl nějak zjištěn a až pak se musela najít rovnice, která by tomu průběhu odpovídala → víc různých rovnic
- pro zjednodušení se používá:
- - bark = 1/3 oktávy
- - erb = 1/6 oktávy
Objektivní popis síly zvuku
- RMS („root mean square“) → umocnit max. výchylky, ze součtu vypočítat průměr a odmocnit = překlopení záporných hodnot do kladných a zprůměrovat → efektivní amplituda
- - efektivní amplituda - průměrný tlak působící např. na bubínek
- - průměr sinusovky je 0
Dynamické rozpětí zvuku
- nejmenší změna tlaku vnímaná jako zvuk je asi 10 mikropaskalů (asi 10 mld× míň než atmosferický tlak)
- největší změna tlaku, co ještě není vnímáno jako bolest, je 64 paskalů
- → ne moc vhodné pro hodnocení, moc velký rozdíl hodnot
- zvuk se sílou 10 (něčeho nedefinovaného) je 2× silnější než zvuk se sílou 1
- poměrové, ne lineární vnímání
- logaritmická stupnice - porovnává intenzitu dvou zvuků:
- - dB = 10 * log ( intenzita 1 / intenzita 2 )
- - decibely nemají žádnou referenční jednotku, slouží jen jako poměrná jednotka
Intenzita
- energie, která za 1 s dorazí na plochu 1 m2 (zvuk za sekundu urazí 340 m)
- ta samá energie po 2 s dorazí na 4 m2
- → intenzita klesá kvadraticky se vzdáleností (po 3 s 1/9 intenzity) („inverse square law“)
- - dB = 20 * log (tlak 1 / tlak 2)
- např. rozdíl 60 dB je milionkrát větší intenzita
- aby se mohly uvádět konkrétní hodnoty, musela se stanovit 0:
- - 0 dB = 10-12 W/m2
- = intenzita 1 000 Hz tónu, který těsně nebyl zachycen
- - je-li stanovena intenzita, používá se termín hladina zvuku (ang. SPL)
Subjektivní popis síly zvuku
Hladina hlasitosti
- značka "H"
- týká se čistých tónů
- vyjadřuje se ve fonech
- jako reference byla stanovena hodnota 1 000 Hz
- - 1 000 Hz tón o 35 dB = 35 fonů
- izofona = křivka stejné hlasitosti – v závislosti na Hz musí mít zvuk různou sílu v dB, aby byl slyšet jako stejně silný
- - nejlépe se vnímají frekvence asi 1 000 – 4 000 Hz (pro pocit stejné hlasitosti stačí menší intenzita než u jiných frekvencí)
- - další propad kolem 13 000 Hz = druhá rezonance zevního zvukovodu
- práh bolesti asi 120–130 dB
- asi 10–15 dB pod tím je práh nepříjemnosti
- celková percepční dynamika (fony) je ve všech frekvencích stejná, i když podle dB se to třeba zplošťuje
Hlasitost
- týká se celkové hlasitosti (zkratka "L")
- jednotka son
- - 1 son = 40 dB tisícihertzového tónu
- → rozdíl o 40 dB = 1 son, 50 dB = 2 sony, 60 dB = 4 sony, 70 dB = 8 sonů
- je to poměrové vnímání → zvýšení o 10 dB = 2 × L
- jednotky jako takové se nepoužívají, ale vztahy platí
- pokud má zvuk pásmo širší než je šířka kritického pásma, je slyšet jako silnější
- hlasitost je ovlivněna i trváním – pod 100 ms dochází k integraci a síla zvuku se nevnímá objektivně (jinak delší tóny jsou vnímány jako silnější)
Praktický výpočet
- dB SPL = rozdíl obou hodnot (např. dva zvuky o 40 dB a 100 dB) → vznikne číslo (zde 60) → vydělit 10 (→ zde 6)
- poměr intenzit: 10n (zde 106) → kolikrát je silnější = intenzita
- poměr hlasitosti: 2n (zde 26) → kolikrát silněji vnímáme = hlasitost
Vnímání kvality zvuku
- kvalita hlasu = barva, témbr
- jak něco vnímáme, závisí na tom, jaké to má frekvenční složení
- objektivní korelát je zvukové spektrum
- kvalita je velmi složitá, definice je vždy negativní (např. něco ve smyslu „pokud jsou dva zvuky stejné, ale vnímáme je jinak, je to rozdíl v kvalitě)
- rozdíl v kvalitě je např. stejný tón zahraný na různé nástroje
- zajímá nás poloha spektrálního těžiště = které frekvence jsou nejsilnější, je v nich nejvíce energie (= nejvyšší amplituda)?
- - temný zvuk – nejvíc energie je v nízkých frekvencích
- - ostrý zvuk – nejvíc energie je v nejvyšších frekvencích
- - středně ostrý zvuk – nejvíc energie je ve středních frekvencích
- schematická spektrální obálka – vyrovnání obloučků (úzkopásmová maxima = formanty) do jednoho velkého oblouku
- formanty = úzkopásmová maxima, která přispívají ke vnímání kvality zvuku
- HNR = harmonicita („harmonic-to-noise ratio“) – poměr harmonických a šumových složek ve spektru
- - údaj, který vypovídá o periodičnosti signálu
- - používá se pro popis patologické fonace
- - udává se v dB – pokud má harmonicita 20 dB, jsou harmonické složky 100× silnější než šumové
Reference
- Ptáček, M. (1993): Úvod do fonetické akustiky. Praha: Karolinum.
- Palková, Z. (1994): Fonetika a fonologie češtiny. Praha: Karolinum. (vybrané části)
- Fant, G. (1970): Acoustic theory of speech production. The Hague: Mouton.
- Ladefoged, P. (1996): Elements of acoustic phonetics. Chicago: University of Chicago Press.
- Johnson, K. (2003): Acoustic and auditory phonetics. Oxford: Blackwell Publishing.
- Kent, R. D. - Read, C. (1992): The acoustic analysis of speech. San Diego: Whurr Publishers.
- Syrový, V. (2003): Hudební akustika. Praha: Akademie múzických umění. (vybrané části)