Percepce zvuku: Porovnání verzí
(Není zobrazeno 14 mezilehlých verzí od 2 dalších uživatelů.) | |||
Řádek 2: | Řádek 2: | ||
== Ucho == | == Ucho == | ||
− | (viz též Fyziologická fonetika) | + | (viz též kapitola [[Stavba_sluchového_ústrojí|Fyziologická fonetika: Stavba sluchového ústrojí]]) |
− | [[File:HumanEar.jpg|thumb|Anatomie ucha]] | + | [[File:HumanEar.jpg|400px|thumb|Anatomie ucha.]] |
=== Vnější ucho === | === Vnější ucho === | ||
Řádek 45: | Řádek 45: | ||
* '''presbyakuse''' – snižování horní hranice slyšitelnosti s rostoucím věkem | * '''presbyakuse''' – snižování horní hranice slyšitelnosti s rostoucím věkem | ||
− | * | + | |
− | + | ==== Diference limen ==== | |
− | + | * = nejmenší vnímatelný rozdíl | |
− | + | * liší se v závislosti na frekvenci | |
− | + | * nejefektivnější v nízkých frekvencích asi kolem 100 Hz (pak rovnoměrně stoupá) | |
− | + | * počítá se jako '''x/200''' → u větších čísel větší hodnoty | |
+ | * Hz nejsou pro percepci tolik relevantní | ||
+ | * asi do 800 Hz vnímáme lineárně, nad 800 se začíná logaritmovat (větší rozdíl se vnímá jako menší) (graf se jakoby zplošťuje) | ||
* pro různé druhy akustické analýzy se hodí různé stupnice: | * pro různé druhy akustické analýzy se hodí různé stupnice: | ||
Řádek 63: | Řádek 65: | ||
* na rozdíl od oktávové stupnice (která zahrnuje i libozvučnost) využívá jen výšku | * na rozdíl od oktávové stupnice (která zahrnuje i libozvučnost) využívá jen výšku | ||
* 20 kHz = 2 400 melů | * 20 kHz = 2 400 melů | ||
+ | |||
==== Barková a erbová stupnice ==== | ==== Barková a erbová stupnice ==== | ||
Řádek 68: | Řádek 71: | ||
: - jak reaguje bazilární membrána na zvuky s podobnou frekvencí? | : - jak reaguje bazilární membrána na zvuky s podobnou frekvencí? | ||
: - nejblíže jsou rázy, pak nějaká ošklivá kombinace, od hranice pak relativně melodické (z jednoho vrcholku se stanou dva odlišné, a to je právě to kritické pásmo) | : - nejblíže jsou rázy, pak nějaká ošklivá kombinace, od hranice pak relativně melodické (z jednoho vrcholku se stanou dva odlišné, a to je právě to kritické pásmo) | ||
− | : - průběh diference limen a kritického pásma je stejný (tvarem) | + | : - průběh diference limen a kritického pásma je stejný (tvarem) |
: - v rámci jednoho kritického pásma rozlišíme asi '''20-30 diferencí limen''' | : - v rámci jednoho kritického pásma rozlišíme asi '''20-30 diferencí limen''' | ||
* vzdálenost kritických pásem se udává právě v barcích / erbech | * vzdálenost kritických pásem se udává právě v barcích / erbech | ||
Řádek 74: | Řádek 77: | ||
===== Barky ===== | ===== Barky ===== | ||
− | * odfiltrovaný bílý šum vystředěný kolem tónu → postupně rozšiřovali pásmo toho šumu – šlo o to, najít, v jakém okamžiku už nebude tón slyšet nebo kdy se začne měnit jeho detekce = '''šířka kritického pásma''' (šum zaplní celý filtr kolem tónu → tón už není slyšet) | + | * odfiltrovaný bílý šum vystředěný kolem tónu → postupně rozšiřovali pásmo toho šumu – šlo o to, najít, v jakém okamžiku už nebude tón slyšet nebo kdy se začne měnit jeho detekce = '''šířka kritického pásma''' (šum zaplní celý filtr kolem tónu → tón už není slyšet) = 1 bark |
* asi do 500 Hz pořád stejná šířka kritického pásma (asi 100 Hz), nad 500 Hz se zvyšuje ('''asi 20% f''') | * asi do 500 Hz pořád stejná šířka kritického pásma (asi 100 Hz), nad 500 Hz se zvyšuje ('''asi 20% f''') | ||
: - některé osoby se zhoršeným sluchem mají kritické pásmo širší → hůře slyší jednotlivé tóny, slévá se to | : - některé osoby se zhoršeným sluchem mají kritické pásmo širší → hůře slyší jednotlivé tóny, slévá se to | ||
Řádek 89: | Řádek 92: | ||
: - '''bark = 1/3 oktávy''' | : - '''bark = 1/3 oktávy''' | ||
: - '''erb = 1/6 oktávy''' | : - '''erb = 1/6 oktávy''' | ||
+ | |||
+ | === Objektivní popis síly zvuku === | ||
+ | |||
+ | * '''RMS''' („root mean square“) → umocnit max. výchylky, ze součtu vypočítat průměr a odmocnit = překlopení záporných hodnot do kladných a zprůměrovat → efektivní amplituda | ||
+ | : - '''efektivní amplituda''' - průměrný tlak působící např. na bubínek | ||
+ | : - průměr sinusovky je 0 | ||
+ | |||
+ | |||
+ | ==== Dynamické rozpětí zvuku ==== | ||
+ | |||
+ | * nejmenší změna tlaku vnímaná jako zvuk je asi 10 mikropaskalů (asi 10 mld× míň než atmosferický tlak) | ||
+ | * největší změna tlaku, co ještě není vnímáno jako bolest, je 64 paskalů | ||
+ | * → ne moc vhodné pro hodnocení, moc velký rozdíl hodnot | ||
+ | * zvuk se sílou 10 (něčeho nedefinovaného) je 2× silnější než zvuk se sílou 1 | ||
+ | |||
+ | * poměrové, ne lineární vnímání | ||
+ | * '''logaritmická stupnice''' - porovnává intenzitu dvou zvuků: | ||
+ | : - ''dB = 10 * log ( intenzita 1 / intenzita 2 )'' | ||
+ | : - decibely nemají žádnou referenční jednotku, slouží jen jako poměrná jednotka | ||
+ | |||
+ | ===== Intenzita ===== | ||
+ | |||
+ | * energie, která za 1 s dorazí na plochu 1 m<sup>2</sup> (zvuk za sekundu urazí 340 m) | ||
+ | * ta samá energie po 2 s dorazí na 4 m<sup>2</sup> | ||
+ | * → intenzita klesá kvadraticky se vzdáleností (po 3 s 1/9 intenzity) („inverse square law“) | ||
+ | : - ''dB = 20 * log (tlak 1 / tlak 2)'' | ||
+ | |||
+ | * např. rozdíl 60 dB je milionkrát větší intenzita | ||
+ | |||
+ | * aby se mohly uvádět konkrétní hodnoty, musela se stanovit 0: | ||
+ | : - ''0 dB = 10-12 W/m2'' | ||
+ | : = intenzita 1 000 Hz tónu, který těsně nebyl zachycen | ||
+ | : - je-li stanovena intenzita, používá se termín '''hladina zvuku''' (ang. SPL) | ||
+ | |||
+ | |||
+ | === Subjektivní popis síly zvuku === | ||
+ | |||
+ | ==== Hladina hlasitosti ==== | ||
+ | |||
+ | * značka "H" | ||
+ | * týká se čistých tónů | ||
+ | * vyjadřuje se ve '''fonech''' | ||
+ | * jako reference byla stanovena hodnota 1 000 Hz | ||
+ | : - ''1 000 Hz tón o 35 dB = 35 fonů'' | ||
+ | |||
+ | * izofona = křivka stejné hlasitosti – v závislosti na Hz musí mít zvuk různou sílu v dB, aby byl slyšet jako stejně silný | ||
+ | : - nejlépe se vnímají frekvence asi 1 000 – 4 000 Hz (pro pocit stejné hlasitosti stačí menší intenzita než u jiných frekvencí) | ||
+ | : - další propad kolem 13 000 Hz = druhá rezonance zevního zvukovodu | ||
+ | |||
+ | * '''práh bolesti''' asi 120–130 dB | ||
+ | * asi 10–15 dB pod tím je '''práh nepříjemnosti''' | ||
+ | * celková percepční dynamika (fony) je ve všech frekvencích stejná, i když podle dB se to třeba zplošťuje | ||
+ | |||
+ | |||
+ | ==== Hlasitost ==== | ||
+ | |||
+ | * týká se celkové hlasitosti (zkratka "L") | ||
+ | * jednotka '''son''' | ||
+ | : - ''1 son = 40 dB tisícihertzového tónu'' | ||
+ | : → rozdíl o 40 dB = 1 son, 50 dB = 2 sony, 60 dB = 4 sony, 70 dB = 8 sonů | ||
+ | |||
+ | * je to poměrové vnímání → zvýšení o 10 dB = 2 × L | ||
+ | |||
+ | * jednotky jako takové se nepoužívají, ale vztahy platí | ||
+ | * pokud má zvuk pásmo širší než je šířka kritického pásma, je slyšet jako silnější | ||
+ | * hlasitost je ovlivněna i trváním – pod 100 ms dochází k integraci a síla zvuku se nevnímá objektivně (jinak delší tóny jsou vnímány jako silnější) | ||
+ | |||
+ | |||
+ | ===== Praktický výpočet ===== | ||
+ | |||
+ | * dB SPL = rozdíl obou hodnot (např. dva zvuky o 40 dB a 100 dB) → vznikne číslo (zde 60) → vydělit 10 (→ zde 6) | ||
+ | * '''poměr intenzit:''' 10<sup>n</sup> (zde 10<sup>6</sup>) → kolikrát je silnější = <sup>intenzita</sup> | ||
+ | * '''poměr hlasitosti''': 2<sup>n</sup> (zde 2<sup>6</sup>) → kolikrát silněji vnímáme = '''hlasitost''' | ||
+ | |||
+ | |||
+ | === Vnímání kvality zvuku === | ||
+ | |||
+ | * kvalita hlasu = '''barva, témbr''' | ||
+ | * jak něco vnímáme, závisí na tom, jaké to má frekvenční složení | ||
+ | * objektivní korelát je zvukové spektrum | ||
+ | * kvalita je velmi složitá, definice je vždy negativní (např. něco ve smyslu „pokud jsou dva zvuky stejné, ale vnímáme je jinak, je to rozdíl v kvalitě) | ||
+ | * rozdíl v kvalitě je např. stejný tón zahraný na různé nástroje | ||
+ | |||
+ | * zajímá nás poloha spektrálního těžiště = které frekvence jsou nejsilnější, je v nich nejvíce energie (= nejvyšší amplituda)? | ||
+ | : - '''temný zvuk''' – nejvíc energie je v nízkých frekvencích | ||
+ | : - '''ostrý zvuk''' – nejvíc energie je v nejvyšších frekvencích | ||
+ | : - '''středně ostrý zvuk''' – nejvíc energie je ve středních frekvencích | ||
+ | |||
+ | * schematická spektrální obálka – vyrovnání obloučků (úzkopásmová maxima = formanty) do jednoho velkého oblouku | ||
+ | * '''formanty''' = úzkopásmová maxima, která přispívají ke vnímání kvality zvuku | ||
+ | |||
+ | * '''HNR''' = '''harmonicita''' („harmonic-to-noise ratio“) – poměr harmonických a šumových složek ve spektru | ||
+ | : - údaj, který vypovídá o periodičnosti signálu | ||
+ | : - používá se pro popis patologické fonace | ||
+ | : - udává se v dB – pokud má harmonicita 20 dB, jsou harmonické složky 100× silnější než šumové | ||
== Reference == | == Reference == | ||
Řádek 101: | Řádek 199: | ||
Zpět na rozcestník: [[Akustika|Akustika]] | [[Portál:Fonetika|Fonetika]] | Zpět na rozcestník: [[Akustika|Akustika]] | [[Portál:Fonetika|Fonetika]] | ||
+ | |||
+ | [[Kategorie: Akustika|*]] | ||
+ | [[Kategorie: Fonetika|*]] |
Aktuální verze z 20. 1. 2015, 00:57
- zkoumá vztahy mezi fyzikálními jevy a jejich tělesnou odezvou
Obsah
Ucho
(viz též kapitola Fyziologická fonetika: Stavba sluchového ústrojí)
Vnější ucho
- boltec
- - možnost lokalizace zvuku
- zevní zvukovod
- - rezonance asi 3 000–5 000 Hz
- - asi 2–3 cm dlouhý
- bubínek
- - blána, na niž dopadají vibrace
Střední ucho
- kůstky kladívko + kovadlinka + třmínek
- převod vibrací z řídkého prostředí vzduchu do hustého prostředí kapaliny
- rezonanční frekvence 1 000 Hz – při ní kůstky nejlépe kmitají
Vnitřní ucho
- kůstky středního ucha navazují na hlemýžď (kochleu) přes oválné okénko
- každé místo bazilární membrány je schopné přenášet jen některé frekvence (na začátku nejvyšší zvuky, uprostřed nejnižší)
- Cortiho ústrojí – z něj vedou řasinkovité buňky a jejich pohyb dráždí nervy
- první spektrální filtr v cestě zvuku → excitační vzorce
Akustické hledisko
- z hlediska akustiky můžeme sledovat vnímání výšky, hlasitosti a kvality
- ! neplést výšku a frekvenci – přesná veličina × objektivní vjem !
Vnímání výšky
- závisí na základní frekvenci, ale vztah není lineární
- i když základní frekvence chybí, slyšíme ji
- při vnímání výšky hraje malou roli i amplituda – láme se to kolem 1 500 Hz – silnější hlubší tóny zní ještě hlubší, silnější vyšší tóny zní ještě vyšší
- nejnižší slyšitelná frekvence je asi (16)-20 Hz
- nejvyšší slyšitelná frekvence je asi 20 000 Hz
- < 20 Hz = infrazvuk – lze vnímat taktilně (vibrace na pokožce)
- > 20 000 Hz = ultrazvuk (protože kůstky nedokážou rychleji vibrovat) (netopýři slyší asi až 100 kHz)
- presbyakuse – snižování horní hranice slyšitelnosti s rostoucím věkem
Diference limen
- = nejmenší vnímatelný rozdíl
- liší se v závislosti na frekvenci
- nejefektivnější v nízkých frekvencích asi kolem 100 Hz (pak rovnoměrně stoupá)
- počítá se jako x/200 → u větších čísel větší hodnoty
- Hz nejsou pro percepci tolik relevantní
- asi do 800 Hz vnímáme lineárně, nad 800 se začíná logaritmovat (větší rozdíl se vnímá jako menší) (graf se jakoby zplošťuje)
- pro různé druhy akustické analýzy se hodí různé stupnice:
- - pro analýzu intonace půltóny
- - pro formanty např. mely (nejstarší), barky, erby (nejnovější)
Melová stupnice
- vynalezena ve 30. letech 20. století
- dvojice zvuků, které jsou od sebe vzdáleny stejný počet melů, vnímáme jako stejný interval (→ rozdíl třeba 100 melů je vždycky percepčně stejný)
- stejně jako u diference limen se do 800 Hz vnímá lineárně, pak se logaritmuje
- na rozdíl od oktávové stupnice (která zahrnuje i libozvučnost) využívá jen výšku
- 20 kHz = 2 400 melů
Barková a erbová stupnice
- pojem "kritické pásmo slyšení" (CB – „critical bandwidth“)
- - jak reaguje bazilární membrána na zvuky s podobnou frekvencí?
- - nejblíže jsou rázy, pak nějaká ošklivá kombinace, od hranice pak relativně melodické (z jednoho vrcholku se stanou dva odlišné, a to je právě to kritické pásmo)
- - průběh diference limen a kritického pásma je stejný (tvarem)
- - v rámci jednoho kritického pásma rozlišíme asi 20-30 diferencí limen
- vzdálenost kritických pásem se udává právě v barcích / erbech
- - frekvenčně může být jiná, ale percepčně je vždy stejná stejná
Barky
- odfiltrovaný bílý šum vystředěný kolem tónu → postupně rozšiřovali pásmo toho šumu – šlo o to, najít, v jakém okamžiku už nebude tón slyšet nebo kdy se začne měnit jeho detekce = šířka kritického pásma (šum zaplní celý filtr kolem tónu → tón už není slyšet) = 1 bark
- asi do 500 Hz pořád stejná šířka kritického pásma (asi 100 Hz), nad 500 Hz se zvyšuje (asi 20% f)
- - některé osoby se zhoršeným sluchem mají kritické pásmo širší → hůře slyší jednotlivé tóny, slévá se to
- převod: 200 melů = 2 barky, 1 000 melů = 10 barků
- nevýhoda barků – rozlišení až od 500 Hz → rozlišení v nízkých frekvencích je špatné
Erby
- signální tón, kus od něj na obě strany šum (mezi nimi „průslech“) → šum se postupně přibližuje tónu (průslech se zužuje)
- v okamžiku, kdy je to moc blízko a začne to ovlivňovat jeho detekci = šířka kritického pásma (= opačný postup než u barků → odstraňuje problém s rázováním) → lepší rozlišení v nízkých frekvencích
- ve středních frekvencích je šířka pásma asi 12% f
- problém barků i erbů je, že jejich průběh byl nějak zjištěn a až pak se musela najít rovnice, která by tomu průběhu odpovídala → víc různých rovnic
- pro zjednodušení se používá:
- - bark = 1/3 oktávy
- - erb = 1/6 oktávy
Objektivní popis síly zvuku
- RMS („root mean square“) → umocnit max. výchylky, ze součtu vypočítat průměr a odmocnit = překlopení záporných hodnot do kladných a zprůměrovat → efektivní amplituda
- - efektivní amplituda - průměrný tlak působící např. na bubínek
- - průměr sinusovky je 0
Dynamické rozpětí zvuku
- nejmenší změna tlaku vnímaná jako zvuk je asi 10 mikropaskalů (asi 10 mld× míň než atmosferický tlak)
- největší změna tlaku, co ještě není vnímáno jako bolest, je 64 paskalů
- → ne moc vhodné pro hodnocení, moc velký rozdíl hodnot
- zvuk se sílou 10 (něčeho nedefinovaného) je 2× silnější než zvuk se sílou 1
- poměrové, ne lineární vnímání
- logaritmická stupnice - porovnává intenzitu dvou zvuků:
- - dB = 10 * log ( intenzita 1 / intenzita 2 )
- - decibely nemají žádnou referenční jednotku, slouží jen jako poměrná jednotka
Intenzita
- energie, která za 1 s dorazí na plochu 1 m2 (zvuk za sekundu urazí 340 m)
- ta samá energie po 2 s dorazí na 4 m2
- → intenzita klesá kvadraticky se vzdáleností (po 3 s 1/9 intenzity) („inverse square law“)
- - dB = 20 * log (tlak 1 / tlak 2)
- např. rozdíl 60 dB je milionkrát větší intenzita
- aby se mohly uvádět konkrétní hodnoty, musela se stanovit 0:
- - 0 dB = 10-12 W/m2
- = intenzita 1 000 Hz tónu, který těsně nebyl zachycen
- - je-li stanovena intenzita, používá se termín hladina zvuku (ang. SPL)
Subjektivní popis síly zvuku
Hladina hlasitosti
- značka "H"
- týká se čistých tónů
- vyjadřuje se ve fonech
- jako reference byla stanovena hodnota 1 000 Hz
- - 1 000 Hz tón o 35 dB = 35 fonů
- izofona = křivka stejné hlasitosti – v závislosti na Hz musí mít zvuk různou sílu v dB, aby byl slyšet jako stejně silný
- - nejlépe se vnímají frekvence asi 1 000 – 4 000 Hz (pro pocit stejné hlasitosti stačí menší intenzita než u jiných frekvencí)
- - další propad kolem 13 000 Hz = druhá rezonance zevního zvukovodu
- práh bolesti asi 120–130 dB
- asi 10–15 dB pod tím je práh nepříjemnosti
- celková percepční dynamika (fony) je ve všech frekvencích stejná, i když podle dB se to třeba zplošťuje
Hlasitost
- týká se celkové hlasitosti (zkratka "L")
- jednotka son
- - 1 son = 40 dB tisícihertzového tónu
- → rozdíl o 40 dB = 1 son, 50 dB = 2 sony, 60 dB = 4 sony, 70 dB = 8 sonů
- je to poměrové vnímání → zvýšení o 10 dB = 2 × L
- jednotky jako takové se nepoužívají, ale vztahy platí
- pokud má zvuk pásmo širší než je šířka kritického pásma, je slyšet jako silnější
- hlasitost je ovlivněna i trváním – pod 100 ms dochází k integraci a síla zvuku se nevnímá objektivně (jinak delší tóny jsou vnímány jako silnější)
Praktický výpočet
- dB SPL = rozdíl obou hodnot (např. dva zvuky o 40 dB a 100 dB) → vznikne číslo (zde 60) → vydělit 10 (→ zde 6)
- poměr intenzit: 10n (zde 106) → kolikrát je silnější = intenzita
- poměr hlasitosti: 2n (zde 26) → kolikrát silněji vnímáme = hlasitost
Vnímání kvality zvuku
- kvalita hlasu = barva, témbr
- jak něco vnímáme, závisí na tom, jaké to má frekvenční složení
- objektivní korelát je zvukové spektrum
- kvalita je velmi složitá, definice je vždy negativní (např. něco ve smyslu „pokud jsou dva zvuky stejné, ale vnímáme je jinak, je to rozdíl v kvalitě)
- rozdíl v kvalitě je např. stejný tón zahraný na různé nástroje
- zajímá nás poloha spektrálního těžiště = které frekvence jsou nejsilnější, je v nich nejvíce energie (= nejvyšší amplituda)?
- - temný zvuk – nejvíc energie je v nízkých frekvencích
- - ostrý zvuk – nejvíc energie je v nejvyšších frekvencích
- - středně ostrý zvuk – nejvíc energie je ve středních frekvencích
- schematická spektrální obálka – vyrovnání obloučků (úzkopásmová maxima = formanty) do jednoho velkého oblouku
- formanty = úzkopásmová maxima, která přispívají ke vnímání kvality zvuku
- HNR = harmonicita („harmonic-to-noise ratio“) – poměr harmonických a šumových složek ve spektru
- - údaj, který vypovídá o periodičnosti signálu
- - používá se pro popis patologické fonace
- - udává se v dB – pokud má harmonicita 20 dB, jsou harmonické složky 100× silnější než šumové
Reference
- Ptáček, M. (1993): Úvod do fonetické akustiky. Praha: Karolinum.
- Palková, Z. (1994): Fonetika a fonologie češtiny. Praha: Karolinum. (vybrané části)
- Fant, G. (1970): Acoustic theory of speech production. The Hague: Mouton.
- Ladefoged, P. (1996): Elements of acoustic phonetics. Chicago: University of Chicago Press.
- Johnson, K. (2003): Acoustic and auditory phonetics. Oxford: Blackwell Publishing.
- Kent, R. D. - Read, C. (1992): The acoustic analysis of speech. San Diego: Whurr Publishers.
- Syrový, V. (2003): Hudební akustika. Praha: Akademie múzických umění. (vybrané části)