Základní pojmy foneticke statistiky

  • 2 druhy výzkumu:
    • kvalitativní – řeší, s čím vším je třeba při řešení problému počítat (hledání hypotéz) – nepotřebuje statistiku
    • kvantitativní – prověřování hypotéz – statistika potřeba je

Statistické postupy

Deskriptivní

  • přehledné a úsporné vyjádření údajů
  • odhaluje typické trendy v datech a atypické případy

Analytické

Inferenční (induktivní)

  • testování hypotéz
  • p < 0,05 = nejvyšší pravděpodobnost náhodného výsledku musí být nižší než 5%
  • základním výstupem je údaj o pravděpodobnosti omylu při zobecňování

Exploratorní

  • složité, pro méně přehledná data

Základní a výběrový soubor

  • základní soubor = populace – množina objektů, kterou chceme popsat a z které vybíráme vzorek
  • výběrový soubor = vzorek populace – vybraný vzorek
  • princip náhodnosti
  • princip reprezentativnosti
  • → pokud má výběrový soubor reprezentovat základní, musí z něj být vybrán náhodně
  • výběrová chyba – i při správném výběru se vzorek s populací přesně neshoduje
  • je to rozdíl mezi určitým ukazatelem v základním a výběrovém souboru
  • nulová hypotéza – předpokládá, že různé vztahy mezi proměnnými nebo rozdíly mezi soubory jsou čistě náhodné
  • → statistický test to potvrdí, nebo vyvrátí

Používané symboly

výběrový soubor základní soubor
počet případů n N
aritmetický průměr μ
směrodatná odchylka s σ
rozptyl s2 σ2
  • výběrový soubor má většinou poskytnout informaci o jedné skutečnosti za různých podmínek
  • nezávislá měření (nezávislý výběr) – výběrový soubor rozdělíme na dvě skupiny
  • závislá (opakovaná) měření (spárované výběry) – výběrový soubor se nedělí, měří se dvakrát za jiných podmínek

Typy proměnných

Proměnné podle matematických vlastností

  • proměnná (znak) – vlastnost, kterou sledujeme
    • nabývá alespoň dvou hodnot → případy se liší

Nominální

  • pouze odkazují na příslušnost ke skupině či kategorii
  • existuje jen rovnost a nerovnost
  • např. proměnná „žena, hlasatel, afrikáta, ...“

Řadové

  • také řadí do kategorií
  • lze řadit „je větší / menší než“
  • např. hodnocení artikulačního stylu podle určené stupnice – můžeme přiřadit, ale nemůžeme také říct, o kolik je třeba něco „nedbajelšího“ než to „pečlivé“
  • stupnice „neměřitelných“ hodnocení

Numerické

  • odkazují na pozici na škále exaktně měřitelných hodnot
  • lze vyjádřit číslem
  • např. frekvence v Hz
  • 1) intervalové – zjišťují rozdíly mezi hodnotami, ne poměry ← ty závisí na tom, kam dáme nulu
    • např. půltóny
  • 2) poměrové – mají objektivní absolutní nulu
    • zjišťují, o kolik i kolikrát se hodnoty liší
    • např. sekundy
  • 1) spojité – libovolné hodnoty v rámci intervalu
    • např. výška F0
  • 2) nespojité – pouze vybrané hodnoty v rámci intervalu
    • např. počet slabik ve slově
  • nominální + řadové → neparametrické metody
  • numerické → parametrické metody

Proměnné podle role ve zkoumaných vztazích

Nezávislá proměnná

  • spojována s příčinou
  • ovlivňujeme ji → bude mít následek?

Závislá proměnná

  • ověřovaná vlastnost
  • mění se podle ovlivňování nezávislé proměnné
  • např. zkoumáme srozumitelnost řeči ovlivňováním (vynecháváním) frekvenčích pásem → pásma jsou nezávislá proměnná, srozumitelnost je závislá

Typy chyb

Vnější proměnná

  • přehlédnuté či opomenuté nezávislé proměnné, které fungují ve zkoumaném vztahu
  • systematické chyby
  • např. efekt pořadí – vnímání položek může být ovlivněno těmi předchozími

Rušivá proměnná

  • náhodné vnější vlivy
  • náhodné chyby
  • pracovní (alternativní) hypotéza – × nulová
    • předpokládá hledaný vztah
  • chyba 1. druhu – nesprávně zamítnutá nulová hypotéza, vztah ve skutečnosti neexistuje
  • chyba 2. druhu – nesprávně přijatá nulová hypotéza, vztah ve skutečnosti existuje
  • snižujeme-li riziko jedné chyby, zvyšujeme riziko té druhé

Pravděpodobnost

  • jistý jev – dá se jednoznačně popsat a je vždy stejný
  • náhodný jev – vlastnosti se dají více či méně předpovídat, ale budou se vyskytovat jen s nějakou pravděpodobností
  • stochastika – nauka o počtu pravděpodobnosti
    • zjišťuje, jakými principy se řídí fungování „náhody“

p

  • odkazuje většinou na pravděpodobnost chyby 1. druhu
  • hodnoty 0–1:
    • 0 – jev nenastane nikdy
    • 1 – jev nastane vždy
  • hladiny významnosti (α)
    • je třeba nastavit ještě před výpočtem p
    • p < 0,05 → významný výsledek
    • p < 0,001 → vysoce významný výsledek

Odkazy

Reference


Použitá literatura

  • Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
  • Meloun, M. - Militký, J. (2001): Kompendium statistického zpracování dat. Praha: Academia. (vybrané části)
  • Robson, C. (1973): Experiment, design and statistics in psychology. Harmondsworth: Penguin Books Ltd.
  • Urdan, T. C. (2001): Statistics in plain English. London: Lawrence Erlbaum Associates.
  • Lamser, V. - Růžička, L. (1970): Základy statistiky pro sociology. Praha: Svoboda.

Zpět na rozcestník: Statistické metody ve fonetickém výzkumu | Fonetika