Percepce zvuku: Porovnání verzí

Řádek 44: Řádek 44:
 
* > 20 000 Hz = '''ultrazvuk''' (protože kůstky nedokážou rychleji vibrovat) (netopýři slyší asi až 100 kHz)
 
* > 20 000 Hz = '''ultrazvuk''' (protože kůstky nedokážou rychleji vibrovat) (netopýři slyší asi až 100 kHz)
 
* '''presbyakuse''' – snižování horní hranice slyšitelnosti s rostoucím věkem
 
* '''presbyakuse''' – snižování horní hranice slyšitelnosti s rostoucím věkem
 +
  
 
==== Diference limen ====
 
==== Diference limen ====

Verze z 3. 9. 2014, 18:30

  • zkoumá vztahy mezi fyzikálními jevy a jejich tělesnou odezvou

Ucho

(viz též Fyziologická fonetika)

Anatomie ucha

Vnější ucho

  • boltec
- možnost lokalizace zvuku
  • zevní zvukovod
- rezonance asi 3 000–5 000 Hz
- asi 2–3 cm dlouhý
  • bubínek
- blána, na niž dopadají vibrace

Střední ucho

  • kůstky kladívko + kovadlinka + třmínek
  • převod vibrací z řídkého prostředí vzduchu do hustého prostředí kapaliny
  • rezonanční frekvence 1 000 Hz – při ní kůstky nejlépe kmitají

Vnitřní ucho

  • kůstky středního ucha navazují na hlemýžď (kochleu) přes oválné okénko
  • každé místo bazilární membrány je schopné přenášet jen některé frekvence (na začátku nejvyšší zvuky, uprostřed nejnižší)
  • Cortiho ústrojí – z něj vedou řasinkovité buňky a jejich pohyb dráždí nervy
  • první spektrální filtr v cestě zvuku → excitační vzorce


Akustické hledisko

  • z hlediska akustiky můžeme sledovat vnímání výšky, hlasitosti a kvality
  •  ! neplést výšku a frekvenci – přesná veličina × objektivní vjem !


Vnímání výšky

  • závisí na základní frekvenci, ale vztah není lineární
  • i když základní frekvence chybí, slyšíme ji
  • při vnímání výšky hraje malou roli i amplituda – láme se to kolem 1 500 Hz – silnější hlubší tóny zní ještě hlubší, silnější vyšší tóny zní ještě vyšší
  • nejnižší slyšitelná frekvence je asi (16)-20 Hz
  • nejvyšší slyšitelná frekvence je asi 20 000 Hz
  • < 20 Hz = infrazvuk – lze vnímat taktilně (vibrace na pokožce)
  • > 20 000 Hz = ultrazvuk (protože kůstky nedokážou rychleji vibrovat) (netopýři slyší asi až 100 kHz)
  • presbyakuse – snižování horní hranice slyšitelnosti s rostoucím věkem


Diference limen

  • = nejmenší vnímatelný rozdíl
  • liší se v závislosti na frekvenci
  • nejefektivnější v nízkých frekvencích asi kolem 100 Hz (pak rovnoměrně stoupá)
  • počítá se jako x/200 → u větších čísel větší hodnoty
  • Hz nejsou pro percepci tolik relevantní
  • asi do 800 Hz vnímáme lineárně, nad 800 se začíná logaritmovat (větší rozdíl se vnímá jako menší) (graf se jakoby zplošťuje)
  • pro různé druhy akustické analýzy se hodí různé stupnice:
- pro analýzu intonace půltóny
- pro formanty např. mely (nejstarší), barky, erby (nejnovější)


Melová stupnice

  • vynalezena ve 30. letech 20. století
  • dvojice zvuků, které jsou od sebe vzdáleny stejný počet melů, vnímáme jako stejný interval (→ rozdíl třeba 100 melů je vždycky percepčně stejný)
  • stejně jako u diference limen se do 800 Hz vnímá lineárně, pak se logaritmuje
  • na rozdíl od oktávové stupnice (která zahrnuje i libozvučnost) využívá jen výšku
  • 20 kHz = 2 400 melů


Barková a erbová stupnice

  • pojem "kritické pásmo slyšení" (CB – „critical bandwidth“)
- jak reaguje bazilární membrána na zvuky s podobnou frekvencí?
- nejblíže jsou rázy, pak nějaká ošklivá kombinace, od hranice pak relativně melodické (z jednoho vrcholku se stanou dva odlišné, a to je právě to kritické pásmo)
- průběh diference limen a kritického pásma je stejný (tvarem)
- v rámci jednoho kritického pásma rozlišíme asi 20-30 diferencí limen
  • vzdálenost kritických pásem se udává právě v barcích / erbech
- frekvenčně může být jiná, ale percepčně je vždy stejná stejná
Barky
  • odfiltrovaný bílý šum vystředěný kolem tónu → postupně rozšiřovali pásmo toho šumu – šlo o to, najít, v jakém okamžiku už nebude tón slyšet nebo kdy se začne měnit jeho detekce = šířka kritického pásma (šum zaplní celý filtr kolem tónu → tón už není slyšet) = 1 bark
  • asi do 500 Hz pořád stejná šířka kritického pásma (asi 100 Hz), nad 500 Hz se zvyšuje (asi 20% f)
- některé osoby se zhoršeným sluchem mají kritické pásmo širší → hůře slyší jednotlivé tóny, slévá se to
  • převod: 200 melů = 2 barky, 1 000 melů = 10 barků
  • nevýhoda barků – rozlišení až od 500 Hz → rozlišení v nízkých frekvencích je špatné
Erby
  • signální tón, kus od něj na obě strany šum (mezi nimi „průslech“) → šum se postupně přibližuje tónu (průslech se zužuje)
  • v okamžiku, kdy je to moc blízko a začne to ovlivňovat jeho detekci = šířka kritického pásma (= opačný postup než u barků → odstraňuje problém s rázováním) → lepší rozlišení v nízkých frekvencích
  • ve středních frekvencích je šířka pásma asi 12% f
  • problém barků i erbů je, že jejich průběh byl nějak zjištěn a až pak se musela najít rovnice, která by tomu průběhu odpovídala → víc různých rovnic
  • pro zjednodušení se používá:
- bark = 1/3 oktávy
- erb = 1/6 oktávy

Objektivní popis síly zvuku

  • RMS („root mean square“) → umocnit max. výchylky, ze součtu vypočítat průměr a odmocnit = překlopení záporných hodnot do kladných a zprůměrovat → efektivní amplituda
- efektivní amplituda - průměrný tlak působící např. na bubínek
- průměr sinusovky je 0


Dynamické rozpětí zvuku

  • nejmenší změna tlaku vnímaná jako zvuk je asi 10 mikropaskalů (asi 10 mld× míň než atmosferický tlak)
  • největší změna tlaku, co ještě není vnímáno jako bolest, je 64 paskalů
  • → ne moc vhodné pro hodnocení, moc velký rozdíl hodnot
  • zvuk se sílou 10 (něčeho nedefinovaného) je 2× silnější než zvuk se sílou 1
  • poměrové, ne lineární vnímání
  • logaritmická stupnice - porovnává intenzitu dvou zvuků:
- dB = 10 * log ( intenzita 1 / intenzita 2 )
- decibely nemají žádnou referenční jednotku, slouží jen jako poměrná jednotka
Intenzita
  • energie, která za 1 s dorazí na plochu 1 m2 (zvuk za sekundu urazí 340 m)
  • ta samá energie po 2 s dorazí na 4 m2
  • → intenzita klesá kvadraticky se vzdáleností (po 3 s 1/9 intenzity) („inverse square law“)
- dB = 20 * log (tlak 1 / tlak 2)
  • např. rozdíl 60 dB je milionkrát větší intenzita
  • aby se mohly uvádět konkrétní hodnoty, musela se stanovit 0:
- 0 dB = 10-12 W/m2
= intenzita 1 000 Hz tónu, který těsně nebyl zachycen
- je-li stanovena intenzita, používá se termín hladina zvuku (ang. SPL)


Subjektivní popis síly zvuku

Hladina hlasitosti

  • značka "H"
  • týká se čistých tónů
  • vyjadřuje se ve fonech
  • jako reference byla stanovena hodnota 1 000 Hz
- 1 000 Hz tón o 35 dB = 35 fonů
  • izofona = křivka stejné hlasitosti – v závislosti na Hz musí mít zvuk různou sílu v dB, aby byl slyšet jako stejně silný
- nejlépe se vnímají frekvence asi 1 000 – 4 000 Hz (pro pocit stejné hlasitosti stačí menší intenzita než u jiných frekvencí)
- další propad kolem 13 000 Hz = druhá rezonance zevního zvukovodu
  • práh bolesti asi 120–130 dB
  • asi 10–15 dB pod tím je práh nepříjemnosti
  • celková percepční dynamika (fony) je ve všech frekvencích stejná, i když podle dB se to třeba zplošťuje


Hlasitost

  • týká se celkové hlasitosti (zkratka "L")
  • jednotka son
- 1 son = 40 dB tisícihertzového tónu
→ rozdíl o 40 dB = 1 son, 50 dB = 2 sony, 60 dB = 4 sony, 70 dB = 8 sonů
  • je to poměrové vnímání → zvýšení o 10 dB = 2 × L
  • jednotky jako takové se nepoužívají, ale vztahy platí
  • pokud má zvuk pásmo širší než je šířka kritického pásma, je slyšet jako silnější
  • hlasitost je ovlivněna i trváním – pod 100 ms dochází k integraci a síla zvuku se nevnímá objektivně (jinak delší tóny jsou vnímány jako silnější)


Praktický výpočet
  • dB SPL = rozdíl obou hodnot (např. dva zvuky o 40 dB a 100 dB) → vznikne číslo (zde 60) → vydělit 10 (→ zde 6)
  • poměr intenzit: 10n (zde 106) → kolikrát je silnější = intenzita
  • poměr hlasitosti: 2n (zde 26) → kolikrát silněji vnímáme = hlasitost


Vnímání kvality zvuku

  • kvalita hlasu = barva, témbr
  • jak něco vnímáme, závisí na tom, jaké to má frekvenční složení
  • objektivní korelát je zvukové spektrum
  • kvalita je velmi složitá, definice je vždy negativní (např. něco ve smyslu „pokud jsou dva zvuky stejné, ale vnímáme je jinak, je to rozdíl v kvalitě)
  • rozdíl v kvalitě je např. stejný tón zahraný na různé nástroje
  • zajímá nás poloha spektrálního těžiště = které frekvence jsou nejsilnější, je v nich nejvíce energie (= nejvyšší amplituda)?
- temný zvuk – nejvíc energie je v nízkých frekvencích
- ostrý zvuk – nejvíc energie je v nejvyšších frekvencích
- středně ostrý zvuk – nejvíc energie je ve středních frekvencích
  • schematická spektrální obálka – vyrovnání obloučků (úzkopásmová maxima = formanty) do jednoho velkého oblouku
  • formanty = úzkopásmová maxima, která přispívají ke vnímání kvality zvuku
  • HNR = harmonicita („harmonic-to-noise ratio“) – poměr harmonických a šumových složek ve spektru
- údaj, který vypovídá o periodičnosti signálu
- používá se pro popis patologické fonace
- udává se v dB – pokud má harmonicita 20 dB, jsou harmonické složky 100× silnější než šumové


Reference

  • Ptáček, M. (1993): Úvod do fonetické akustiky. Praha: Karolinum.
  • Palková, Z. (1994): Fonetika a fonologie češtiny. Praha: Karolinum. (vybrané části)
  • Fant, G. (1970): Acoustic theory of speech production. The Hague: Mouton.
  • Ladefoged, P. (1996): Elements of acoustic phonetics. Chicago: University of Chicago Press.
  • Johnson, K. (2003): Acoustic and auditory phonetics. Oxford: Blackwell Publishing.
  • Kent, R. D. - Read, C. (1992): The acoustic analysis of speech. San Diego: Whurr Publishers.
  • Syrový, V. (2003): Hudební akustika. Praha: Akademie múzických umění. (vybrané části)

Zpět na rozcestník: Akustika | Fonetika