Základní pojmy foneticke statistiky

  • 2 druhy výzkumu:
- kvalitativní – řeší, s čím vším je třeba při řešení problému počítat (hledání hypotéz) – nepotřebuje statistiku
- kvantitativní – prověřování hypotéz – statistika potřeba je


Statistické postupy

Deskriptivní

  • přehledné a úsporné vyjádření údajů
  • odhaluje typické trendy v datech a atypické případy


Analytické

Inferenční (induktivní)

  • testování hypotéz
  • p < 0,05 = nejvyšší pravděpodobnost náhodného výsledku musí být nižší než 5%
  • základním výstupem je údaj o pravděpodobnosti omylu při zobecňování


Exploratorní

  • složité, pro méně přehledná data


Základní a výběrový soubor

  • základní soubor = populace – množina objektů, kterou chceme popsat a z které vybíráme vzorek
  • výběrový soubor = vzorek populace – vybraný vzorek
  • princip náhodnosti
  • princip reprezentativnosti
  • → pokud má výběrový soubor reprezentovat základní, musí z něj být vybrán náhodně
  • výběrová chyba – i při správném výběru se vzorek s populací přesně neshoduje
  • je to rozdíl mezi určitým ukazatelem v základním a výběrovém souboru
  • nulová hypotéza – předpokládá, že různé vztahy mezi proměnnými nebo rozdíly mezi soubory jsou čistě náhodné
  • → statistický test to potvrdí, nebo vyvrátí


Používané symboly

výběrový soubor základní soubor
počet případů n N
aritmetický průměr μ
směrodatná odchylka s σ
rozptyl s2 σ2


  • výběrový soubor má většinou poskytnout informaci o jedné skutečnosti za různých podmínek
  • nezávislá měření (nezávislý výběr) – výběrový soubor rozdělíme na dvě skupiny
  • závislá (opakovaná) měření (spárované výběry) – výběrový soubor se nedělí, měří se dvakrát za jiných podmínek


Typy proměnných

Proměnné podle matematických vlastností

  • proměnná (znak) – vlastnost, kterou sledujeme
- nabývá alespoň dvou hodnot → případy se liší

Nominální

  • pouze odkazují na příslušnost ke skupině či kategorii
  • existuje jen rovnost a nerovnost
  • např. proměnná „žena, hlasatel, afrikáta, ...“


Řadové

  • také řadí do kategorií
  • lze řadit „je větší / menší než“
  • např. hodnocení artikulačního stylu podle určené stupnice – můžeme přiřadit, ale nemůžeme také říct, o kolik je třeba něco „nedbajelšího“ než to „pečlivé“
  • stupnice „neměřitelných“ hodnocení


Numerické

  • odkazují na pozici na škále exaktně měřitelných hodnot
  • lze vyjádřit číslem
  • např. frekvence v Hz
  • 1) intervalové – zjišťují rozdíly mezi hodnotami, ne poměry ← ty závisí na tom, kam dáme nulu
- např. půltóny
  • 2) poměrové – mají objektivní absolutní nulu
- zjišťují, o kolik i kolikrát se hodnoty liší
- např. sekundy
  • 1) spojité – libovolné hodnoty v rámci intervalu
- např. výška F0
  • 2) nespojité – pouze vybrané hodnoty v rámci intervalu
- např. počet slabik ve slově
  • nominální + řadové → neparametrické metody
  • numerické → parametrické metody


Proměnné podle role ve zkoumaných vztazích

Nezávislá proměnná

  • spojována s příčinou
  • ovlivňujeme ji → bude mít následek?


Závislá proměnná

  • ověřovaná vlastnost
  • mění se podle ovlivňování nezávislé proměnné
  • např. zkoumáme srozumitelnost řeči ovlivňováním (vynecháváním) frekvenčích pásem → pásma jsou nezávislá proměnná, srozumitelnost je závislá


Typy chyb

Vnější proměnná

  • přehlédnuté či opomenuté nezávislé proměnné, které fungují ve zkoumaném vztahu
  • systematické chyby
  • např. efekt pořadí – vnímání položek může být ovlivněno těmi předchozími


Rušivá proměnná

  • náhodné vnější vlivy
  • náhodné chyby


  • pracovní (alternativní) hypotéza – × nulová
- předpokládá hledaný vztah
  • chyba 1. druhu – nesprávně zamítnutá nulová hypotéza, vztah ve skutečnosti neexistuje
  • chyba 2. druhu – nesprávně přijatá nulová hypotéza, vztah ve skutečnosti existuje
  • snižujeme-li riziko jedné chyby, zvyšujeme riziko té druhé


Pravděpodobnost

  • jistý jev – dá se jednoznačně popsat a je vždy stejný
  • náhodný jev – vlastnosti se dají více či méně předpovídat, ale budou se vyskytovat jen s nějakou pravděpodobností
  • stochastika – nauka o počtu pravděpodobnosti
- zjišťuje, jakými principy se řídí fungování „náhody“


p

  • odkazuje většinou na pravděpodobnost chyby 1. druhu
  • hodnoty 0–1:
- 0 – jev nenastane nikdy
- 1 – jev nastane vždy
  • hladiny významnosti (α)
- je třeba nastavit ještě před výpočtem p
- p < 0,05 → významný výsledek
- p < 0,001 → vysoce významný výsledek


Reference

  • Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
  • Meloun, M. - Militký, J. (2001): Kompendium statistického zpracování dat. Praha: Academia. (vybrané části)
  • Robson, C. (1973): Experiment, design and statistics in psychology. Harmondsworth: Penguin Books Ltd.
  • Urdan, T. C. (2001): Statistics in plain English. London: Lawrence Erlbaum Associates.
  • Lamser, V. - Růžička, L. (1970): Základy statistiky pro sociology. Praha: Svoboda.


Zpět na rozcestník: Statistické metody ve fonetickém výzkumu | Fonetika