Percepce zvuku: Porovnání verzí

 
(Není zobrazeno 14 mezilehlých verzí od 2 dalších uživatelů.)
Řádek 2: Řádek 2:
  
 
== Ucho ==
 
== Ucho ==
(viz též Fyziologická fonetika)
+
(viz též kapitola [[Stavba_sluchového_ústrojí|Fyziologická fonetika: Stavba sluchového ústrojí]])
  
[[File:HumanEar.jpg|thumb|Anatomie ucha]]
+
[[File:HumanEar.jpg|400px|thumb|Anatomie ucha.]]
  
 
=== Vnější ucho ===
 
=== Vnější ucho ===
Řádek 45: Řádek 45:
 
* '''presbyakuse''' – snižování horní hranice slyšitelnosti s rostoucím věkem
 
* '''presbyakuse''' – snižování horní hranice slyšitelnosti s rostoucím věkem
  
* '''diference limen''' = nejmenší vnímatelný rozdíl
+
 
: - liší se v závislosti na frekvenci
+
==== Diference limen ====
: - nejefektivnější v nízkých frekvencích asi kolem 100 Hz (pak rovnoměrně stoupá)
+
* = nejmenší vnímatelný rozdíl
: - počítá se jako '''x/200''' → u větších čísel větší hodnoty
+
* liší se v závislosti na frekvenci
: - Hz nejsou pro percepci tolik relevantní
+
* nejefektivnější v nízkých frekvencích asi kolem 100 Hz (pak rovnoměrně stoupá)
: - asi do 800 Hz vnímáme lineárně, nad 800 se začíná logaritmovat (větší rozdíl se vnímá jako menší) (graf se jakoby zplošťuje)
+
* počítá se jako '''x/200''' → u větších čísel větší hodnoty
 +
* Hz nejsou pro percepci tolik relevantní
 +
* asi do 800 Hz vnímáme lineárně, nad 800 se začíná logaritmovat (větší rozdíl se vnímá jako menší) (graf se jakoby zplošťuje)
  
 
* pro různé druhy akustické analýzy se hodí různé stupnice:
 
* pro různé druhy akustické analýzy se hodí různé stupnice:
Řádek 63: Řádek 65:
 
* na rozdíl od oktávové stupnice (která zahrnuje i libozvučnost) využívá jen výšku
 
* na rozdíl od oktávové stupnice (která zahrnuje i libozvučnost) využívá jen výšku
 
* 20 kHz = 2 400 melů
 
* 20 kHz = 2 400 melů
 +
  
 
==== Barková a erbová stupnice ====
 
==== Barková a erbová stupnice ====
Řádek 68: Řádek 71:
 
: - jak reaguje bazilární membrána na zvuky s podobnou frekvencí?
 
: - jak reaguje bazilární membrána na zvuky s podobnou frekvencí?
 
: - nejblíže jsou rázy, pak nějaká ošklivá kombinace, od hranice pak relativně melodické (z jednoho vrcholku se stanou dva odlišné, a to je právě to kritické pásmo)
 
: - nejblíže jsou rázy, pak nějaká ošklivá kombinace, od hranice pak relativně melodické (z jednoho vrcholku se stanou dva odlišné, a to je právě to kritické pásmo)
: - průběh diference limen a kritického pásma je stejný (tvarem) – mocninově stoupá
+
: - průběh diference limen a kritického pásma je stejný (tvarem)
 
: - v rámci jednoho kritického pásma rozlišíme asi '''20-30 diferencí limen'''
 
: - v rámci jednoho kritického pásma rozlišíme asi '''20-30 diferencí limen'''
 
* vzdálenost kritických pásem se udává právě v barcích / erbech
 
* vzdálenost kritických pásem se udává právě v barcích / erbech
Řádek 74: Řádek 77:
  
 
===== Barky =====
 
===== Barky =====
* odfiltrovaný bílý šum vystředěný kolem tónu → postupně rozšiřovali pásmo toho šumu – šlo o to, najít, v jakém okamžiku už nebude tón slyšet nebo kdy se začne měnit jeho detekce = '''šířka kritického pásma''' (šum zaplní celý filtr kolem tónu → tón už není slyšet)
+
* odfiltrovaný bílý šum vystředěný kolem tónu → postupně rozšiřovali pásmo toho šumu – šlo o to, najít, v jakém okamžiku už nebude tón slyšet nebo kdy se začne měnit jeho detekce = '''šířka kritického pásma''' (šum zaplní celý filtr kolem tónu → tón už není slyšet) = 1 bark
 
* asi do 500 Hz pořád stejná šířka kritického pásma (asi 100 Hz), nad 500 Hz se zvyšuje ('''asi 20% f''')
 
* asi do 500 Hz pořád stejná šířka kritického pásma (asi 100 Hz), nad 500 Hz se zvyšuje ('''asi 20% f''')
 
: - některé osoby se zhoršeným sluchem mají kritické pásmo širší → hůře slyší jednotlivé tóny, slévá se to
 
: - některé osoby se zhoršeným sluchem mají kritické pásmo širší → hůře slyší jednotlivé tóny, slévá se to
Řádek 89: Řádek 92:
 
: - '''bark = 1/3 oktávy'''
 
: - '''bark = 1/3 oktávy'''
 
: - '''erb = 1/6 oktávy'''
 
: - '''erb = 1/6 oktávy'''
 +
 +
=== Objektivní popis síly zvuku ===
 +
 +
* '''RMS''' („root mean square“) → umocnit max. výchylky, ze součtu vypočítat průměr a odmocnit = překlopení záporných hodnot do kladných a zprůměrovat → efektivní amplituda
 +
: - '''efektivní amplituda''' - průměrný tlak působící např. na bubínek
 +
: - průměr sinusovky je 0
 +
 +
 +
==== Dynamické rozpětí zvuku ====
 +
 +
* nejmenší změna tlaku vnímaná jako zvuk je asi 10 mikropaskalů (asi 10 mld× míň než atmosferický tlak)
 +
* největší změna tlaku, co ještě není vnímáno jako bolest, je 64 paskalů
 +
* → ne moc vhodné pro hodnocení, moc velký rozdíl hodnot
 +
* zvuk se sílou 10 (něčeho nedefinovaného) je 2× silnější než zvuk se sílou 1
 +
 +
* poměrové, ne lineární vnímání
 +
* '''logaritmická stupnice''' - porovnává intenzitu dvou zvuků:
 +
: - ''dB = 10 * log ( intenzita 1 / intenzita 2 )''
 +
: - decibely nemají žádnou referenční jednotku, slouží jen jako poměrná jednotka
 +
 +
===== Intenzita =====
 +
 +
* energie, která za 1 s dorazí na plochu 1 m<sup>2</sup> (zvuk za sekundu urazí 340 m)
 +
* ta samá energie po 2 s dorazí na 4 m<sup>2</sup>
 +
* → intenzita klesá kvadraticky se vzdáleností (po 3 s 1/9 intenzity) („inverse square law“)
 +
: - ''dB = 20 * log (tlak 1 / tlak 2)''
 +
 +
* např. rozdíl 60 dB je milionkrát větší intenzita
 +
 +
* aby se mohly uvádět konkrétní hodnoty, musela se stanovit 0:
 +
: - ''0 dB = 10-12 W/m2''
 +
: = intenzita 1 000 Hz tónu, který těsně nebyl zachycen
 +
: - je-li stanovena intenzita, používá se termín '''hladina zvuku''' (ang. SPL)
 +
 +
 +
=== Subjektivní popis síly zvuku ===
 +
 +
==== Hladina hlasitosti ====
 +
 +
* značka "H"
 +
* týká se čistých tónů
 +
* vyjadřuje se ve '''fonech'''
 +
* jako reference byla stanovena hodnota 1 000 Hz
 +
: - ''1 000 Hz tón o 35 dB = 35 fonů''
 +
 +
* izofona = křivka stejné hlasitosti – v závislosti na Hz musí mít zvuk různou sílu v dB, aby byl slyšet jako stejně silný
 +
: - nejlépe se vnímají frekvence asi 1 000 – 4 000 Hz (pro pocit stejné hlasitosti stačí menší intenzita než u jiných frekvencí)
 +
: - další propad kolem 13 000 Hz = druhá rezonance zevního zvukovodu
 +
 +
* '''práh bolesti''' asi 120–130 dB
 +
* asi 10–15 dB pod tím je '''práh nepříjemnosti'''
 +
* celková percepční dynamika (fony) je ve všech frekvencích stejná, i když podle dB se to třeba zplošťuje
 +
 +
 +
==== Hlasitost ====
 +
 +
* týká se celkové hlasitosti (zkratka "L")
 +
* jednotka '''son'''
 +
: - ''1 son = 40 dB tisícihertzového tónu''
 +
: → rozdíl o 40 dB = 1 son, 50 dB = 2 sony, 60 dB = 4 sony, 70 dB = 8 sonů
 +
 +
* je to poměrové vnímání → zvýšení o 10 dB = 2 × L
 +
 +
* jednotky jako takové se nepoužívají, ale vztahy platí
 +
* pokud má zvuk pásmo širší než je šířka kritického pásma, je slyšet jako silnější
 +
* hlasitost je ovlivněna i trváním – pod 100 ms dochází k integraci a síla zvuku se nevnímá objektivně (jinak delší tóny jsou vnímány jako silnější)
 +
 +
 +
===== Praktický výpočet =====
 +
 +
* dB SPL = rozdíl obou hodnot (např. dva zvuky o 40 dB a 100 dB) → vznikne číslo (zde 60) → vydělit 10 (→ zde 6)
 +
* '''poměr intenzit:''' 10<sup>n</sup> (zde 10<sup>6</sup>) → kolikrát je silnější = <sup>intenzita</sup>
 +
* '''poměr hlasitosti''': 2<sup>n</sup> (zde 2<sup>6</sup>) → kolikrát silněji vnímáme = '''hlasitost'''
 +
 +
 +
=== Vnímání kvality zvuku ===
 +
 +
* kvalita hlasu = '''barva, témbr'''
 +
* jak něco vnímáme, závisí na tom, jaké to má frekvenční složení
 +
* objektivní korelát je zvukové spektrum
 +
* kvalita je velmi složitá, definice je vždy negativní (např. něco ve smyslu „pokud jsou dva zvuky stejné, ale vnímáme je jinak, je to rozdíl v kvalitě)
 +
* rozdíl v kvalitě je např. stejný tón zahraný na různé nástroje
 +
 +
* zajímá nás poloha spektrálního těžiště = které frekvence jsou nejsilnější, je v nich nejvíce energie (= nejvyšší amplituda)?
 +
: - '''temný zvuk''' – nejvíc energie je v nízkých frekvencích
 +
: - '''ostrý zvuk''' – nejvíc energie je v nejvyšších frekvencích
 +
: - '''středně ostrý zvuk''' – nejvíc energie je ve středních frekvencích
 +
 +
* schematická spektrální obálka – vyrovnání obloučků (úzkopásmová maxima = formanty) do jednoho velkého oblouku
 +
* '''formanty''' = úzkopásmová maxima, která přispívají ke vnímání kvality zvuku
 +
 +
* '''HNR''' = '''harmonicita''' („harmonic-to-noise ratio“) – poměr harmonických a šumových složek ve spektru
 +
: - údaj, který vypovídá o periodičnosti signálu
 +
: - používá se pro popis patologické fonace
 +
: - udává se v dB – pokud má harmonicita 20 dB, jsou harmonické složky 100× silnější než šumové
  
 
== Reference ==
 
== Reference ==
Řádek 101: Řádek 199:
  
 
Zpět na rozcestník: [[Akustika|Akustika]] | [[Portál:Fonetika|Fonetika]]
 
Zpět na rozcestník: [[Akustika|Akustika]] | [[Portál:Fonetika|Fonetika]]
 +
 +
[[Kategorie: Akustika|*]]
 +
[[Kategorie: Fonetika|*]]

Aktuální verze z 20. 1. 2015, 00:57

  • zkoumá vztahy mezi fyzikálními jevy a jejich tělesnou odezvou

Ucho

(viz též kapitola Fyziologická fonetika: Stavba sluchového ústrojí)

Anatomie ucha.

Vnější ucho

  • boltec
- možnost lokalizace zvuku
  • zevní zvukovod
- rezonance asi 3 000–5 000 Hz
- asi 2–3 cm dlouhý
  • bubínek
- blána, na niž dopadají vibrace

Střední ucho

  • kůstky kladívko + kovadlinka + třmínek
  • převod vibrací z řídkého prostředí vzduchu do hustého prostředí kapaliny
  • rezonanční frekvence 1 000 Hz – při ní kůstky nejlépe kmitají

Vnitřní ucho

  • kůstky středního ucha navazují na hlemýžď (kochleu) přes oválné okénko
  • každé místo bazilární membrány je schopné přenášet jen některé frekvence (na začátku nejvyšší zvuky, uprostřed nejnižší)
  • Cortiho ústrojí – z něj vedou řasinkovité buňky a jejich pohyb dráždí nervy
  • první spektrální filtr v cestě zvuku → excitační vzorce


Akustické hledisko

  • z hlediska akustiky můžeme sledovat vnímání výšky, hlasitosti a kvality
  •  ! neplést výšku a frekvenci – přesná veličina × objektivní vjem !


Vnímání výšky

  • závisí na základní frekvenci, ale vztah není lineární
  • i když základní frekvence chybí, slyšíme ji
  • při vnímání výšky hraje malou roli i amplituda – láme se to kolem 1 500 Hz – silnější hlubší tóny zní ještě hlubší, silnější vyšší tóny zní ještě vyšší
  • nejnižší slyšitelná frekvence je asi (16)-20 Hz
  • nejvyšší slyšitelná frekvence je asi 20 000 Hz
  • < 20 Hz = infrazvuk – lze vnímat taktilně (vibrace na pokožce)
  • > 20 000 Hz = ultrazvuk (protože kůstky nedokážou rychleji vibrovat) (netopýři slyší asi až 100 kHz)
  • presbyakuse – snižování horní hranice slyšitelnosti s rostoucím věkem


Diference limen

  • = nejmenší vnímatelný rozdíl
  • liší se v závislosti na frekvenci
  • nejefektivnější v nízkých frekvencích asi kolem 100 Hz (pak rovnoměrně stoupá)
  • počítá se jako x/200 → u větších čísel větší hodnoty
  • Hz nejsou pro percepci tolik relevantní
  • asi do 800 Hz vnímáme lineárně, nad 800 se začíná logaritmovat (větší rozdíl se vnímá jako menší) (graf se jakoby zplošťuje)
  • pro různé druhy akustické analýzy se hodí různé stupnice:
- pro analýzu intonace půltóny
- pro formanty např. mely (nejstarší), barky, erby (nejnovější)


Melová stupnice

  • vynalezena ve 30. letech 20. století
  • dvojice zvuků, které jsou od sebe vzdáleny stejný počet melů, vnímáme jako stejný interval (→ rozdíl třeba 100 melů je vždycky percepčně stejný)
  • stejně jako u diference limen se do 800 Hz vnímá lineárně, pak se logaritmuje
  • na rozdíl od oktávové stupnice (která zahrnuje i libozvučnost) využívá jen výšku
  • 20 kHz = 2 400 melů


Barková a erbová stupnice

  • pojem "kritické pásmo slyšení" (CB – „critical bandwidth“)
- jak reaguje bazilární membrána na zvuky s podobnou frekvencí?
- nejblíže jsou rázy, pak nějaká ošklivá kombinace, od hranice pak relativně melodické (z jednoho vrcholku se stanou dva odlišné, a to je právě to kritické pásmo)
- průběh diference limen a kritického pásma je stejný (tvarem)
- v rámci jednoho kritického pásma rozlišíme asi 20-30 diferencí limen
  • vzdálenost kritických pásem se udává právě v barcích / erbech
- frekvenčně může být jiná, ale percepčně je vždy stejná stejná
Barky
  • odfiltrovaný bílý šum vystředěný kolem tónu → postupně rozšiřovali pásmo toho šumu – šlo o to, najít, v jakém okamžiku už nebude tón slyšet nebo kdy se začne měnit jeho detekce = šířka kritického pásma (šum zaplní celý filtr kolem tónu → tón už není slyšet) = 1 bark
  • asi do 500 Hz pořád stejná šířka kritického pásma (asi 100 Hz), nad 500 Hz se zvyšuje (asi 20% f)
- některé osoby se zhoršeným sluchem mají kritické pásmo širší → hůře slyší jednotlivé tóny, slévá se to
  • převod: 200 melů = 2 barky, 1 000 melů = 10 barků
  • nevýhoda barků – rozlišení až od 500 Hz → rozlišení v nízkých frekvencích je špatné
Erby
  • signální tón, kus od něj na obě strany šum (mezi nimi „průslech“) → šum se postupně přibližuje tónu (průslech se zužuje)
  • v okamžiku, kdy je to moc blízko a začne to ovlivňovat jeho detekci = šířka kritického pásma (= opačný postup než u barků → odstraňuje problém s rázováním) → lepší rozlišení v nízkých frekvencích
  • ve středních frekvencích je šířka pásma asi 12% f
  • problém barků i erbů je, že jejich průběh byl nějak zjištěn a až pak se musela najít rovnice, která by tomu průběhu odpovídala → víc různých rovnic
  • pro zjednodušení se používá:
- bark = 1/3 oktávy
- erb = 1/6 oktávy

Objektivní popis síly zvuku

  • RMS („root mean square“) → umocnit max. výchylky, ze součtu vypočítat průměr a odmocnit = překlopení záporných hodnot do kladných a zprůměrovat → efektivní amplituda
- efektivní amplituda - průměrný tlak působící např. na bubínek
- průměr sinusovky je 0


Dynamické rozpětí zvuku

  • nejmenší změna tlaku vnímaná jako zvuk je asi 10 mikropaskalů (asi 10 mld× míň než atmosferický tlak)
  • největší změna tlaku, co ještě není vnímáno jako bolest, je 64 paskalů
  • → ne moc vhodné pro hodnocení, moc velký rozdíl hodnot
  • zvuk se sílou 10 (něčeho nedefinovaného) je 2× silnější než zvuk se sílou 1
  • poměrové, ne lineární vnímání
  • logaritmická stupnice - porovnává intenzitu dvou zvuků:
- dB = 10 * log ( intenzita 1 / intenzita 2 )
- decibely nemají žádnou referenční jednotku, slouží jen jako poměrná jednotka
Intenzita
  • energie, která za 1 s dorazí na plochu 1 m2 (zvuk za sekundu urazí 340 m)
  • ta samá energie po 2 s dorazí na 4 m2
  • → intenzita klesá kvadraticky se vzdáleností (po 3 s 1/9 intenzity) („inverse square law“)
- dB = 20 * log (tlak 1 / tlak 2)
  • např. rozdíl 60 dB je milionkrát větší intenzita
  • aby se mohly uvádět konkrétní hodnoty, musela se stanovit 0:
- 0 dB = 10-12 W/m2
= intenzita 1 000 Hz tónu, který těsně nebyl zachycen
- je-li stanovena intenzita, používá se termín hladina zvuku (ang. SPL)


Subjektivní popis síly zvuku

Hladina hlasitosti

  • značka "H"
  • týká se čistých tónů
  • vyjadřuje se ve fonech
  • jako reference byla stanovena hodnota 1 000 Hz
- 1 000 Hz tón o 35 dB = 35 fonů
  • izofona = křivka stejné hlasitosti – v závislosti na Hz musí mít zvuk různou sílu v dB, aby byl slyšet jako stejně silný
- nejlépe se vnímají frekvence asi 1 000 – 4 000 Hz (pro pocit stejné hlasitosti stačí menší intenzita než u jiných frekvencí)
- další propad kolem 13 000 Hz = druhá rezonance zevního zvukovodu
  • práh bolesti asi 120–130 dB
  • asi 10–15 dB pod tím je práh nepříjemnosti
  • celková percepční dynamika (fony) je ve všech frekvencích stejná, i když podle dB se to třeba zplošťuje


Hlasitost

  • týká se celkové hlasitosti (zkratka "L")
  • jednotka son
- 1 son = 40 dB tisícihertzového tónu
→ rozdíl o 40 dB = 1 son, 50 dB = 2 sony, 60 dB = 4 sony, 70 dB = 8 sonů
  • je to poměrové vnímání → zvýšení o 10 dB = 2 × L
  • jednotky jako takové se nepoužívají, ale vztahy platí
  • pokud má zvuk pásmo širší než je šířka kritického pásma, je slyšet jako silnější
  • hlasitost je ovlivněna i trváním – pod 100 ms dochází k integraci a síla zvuku se nevnímá objektivně (jinak delší tóny jsou vnímány jako silnější)


Praktický výpočet
  • dB SPL = rozdíl obou hodnot (např. dva zvuky o 40 dB a 100 dB) → vznikne číslo (zde 60) → vydělit 10 (→ zde 6)
  • poměr intenzit: 10n (zde 106) → kolikrát je silnější = intenzita
  • poměr hlasitosti: 2n (zde 26) → kolikrát silněji vnímáme = hlasitost


Vnímání kvality zvuku

  • kvalita hlasu = barva, témbr
  • jak něco vnímáme, závisí na tom, jaké to má frekvenční složení
  • objektivní korelát je zvukové spektrum
  • kvalita je velmi složitá, definice je vždy negativní (např. něco ve smyslu „pokud jsou dva zvuky stejné, ale vnímáme je jinak, je to rozdíl v kvalitě)
  • rozdíl v kvalitě je např. stejný tón zahraný na různé nástroje
  • zajímá nás poloha spektrálního těžiště = které frekvence jsou nejsilnější, je v nich nejvíce energie (= nejvyšší amplituda)?
- temný zvuk – nejvíc energie je v nízkých frekvencích
- ostrý zvuk – nejvíc energie je v nejvyšších frekvencích
- středně ostrý zvuk – nejvíc energie je ve středních frekvencích
  • schematická spektrální obálka – vyrovnání obloučků (úzkopásmová maxima = formanty) do jednoho velkého oblouku
  • formanty = úzkopásmová maxima, která přispívají ke vnímání kvality zvuku
  • HNR = harmonicita („harmonic-to-noise ratio“) – poměr harmonických a šumových složek ve spektru
- údaj, který vypovídá o periodičnosti signálu
- používá se pro popis patologické fonace
- udává se v dB – pokud má harmonicita 20 dB, jsou harmonické složky 100× silnější než šumové

Reference

  • Ptáček, M. (1993): Úvod do fonetické akustiky. Praha: Karolinum.
  • Palková, Z. (1994): Fonetika a fonologie češtiny. Praha: Karolinum. (vybrané části)
  • Fant, G. (1970): Acoustic theory of speech production. The Hague: Mouton.
  • Ladefoged, P. (1996): Elements of acoustic phonetics. Chicago: University of Chicago Press.
  • Johnson, K. (2003): Acoustic and auditory phonetics. Oxford: Blackwell Publishing.
  • Kent, R. D. - Read, C. (1992): The acoustic analysis of speech. San Diego: Whurr Publishers.
  • Syrový, V. (2003): Hudební akustika. Praha: Akademie múzických umění. (vybrané části)

Zpět na rozcestník: Akustika | Fonetika