Základní pojmy foneticke statistiky: Porovnání verzí

 
Řádek 1: Řádek 1:
 
* 2 druhy výzkumu:
 
* 2 druhy výzkumu:
: - '''kvalitativní''' – řeší, s čím vším je třeba při řešení problému počítat (hledání hypotéz) – nepotřebuje statistiku
+
** '''kvalitativní''' – řeší, s čím vším je třeba při řešení problému počítat (hledání hypotéz) – nepotřebuje statistiku
: - '''kvantitativní''' – prověřování hypotéz – statistika potřeba je
+
** '''kvantitativní''' – prověřování hypotéz – statistika potřeba je
 
 
  
 
== Statistické postupy ==
 
== Statistické postupy ==
Řádek 10: Řádek 9:
 
* přehledné a úsporné vyjádření údajů
 
* přehledné a úsporné vyjádření údajů
 
* odhaluje typické trendy v datech a atypické případy
 
* odhaluje typické trendy v datech a atypické případy
 
  
 
=== Analytické ===
 
=== Analytické ===
Řádek 19: Řádek 17:
 
* ''p'' < 0,05 = nejvyšší pravděpodobnost náhodného výsledku musí být nižší než 5%
 
* ''p'' < 0,05 = nejvyšší pravděpodobnost náhodného výsledku musí být nižší než 5%
 
* základním výstupem je '''údaj o pravděpodobnosti omylu''' při zobecňování
 
* základním výstupem je '''údaj o pravděpodobnosti omylu''' při zobecňování
 
  
 
==== Exploratorní ====
 
==== Exploratorní ====
  
 
* složité, pro méně přehledná data
 
* složité, pro méně přehledná data
 
  
 
== Základní a výběrový soubor ==
 
== Základní a výběrový soubor ==
Řádek 40: Řádek 36:
 
* '''nulová hypotéza''' – předpokládá, že různé vztahy mezi proměnnými nebo rozdíly mezi soubory jsou čistě náhodné
 
* '''nulová hypotéza''' – předpokládá, že různé vztahy mezi proměnnými nebo rozdíly mezi soubory jsou čistě náhodné
 
* → statistický test to potvrdí, nebo vyvrátí
 
* → statistický test to potvrdí, nebo vyvrátí
 
  
 
=== Používané symboly ===
 
=== Používané symboly ===
Řádek 66: Řádek 61:
 
| ''σ<sup>2</sup>''
 
| ''σ<sup>2</sup>''
 
|}
 
|}
<br />
+
 
 
* výběrový soubor má většinou poskytnout informaci o jedné skutečnosti za různých podmínek
 
* výběrový soubor má většinou poskytnout informaci o jedné skutečnosti za různých podmínek
 
* '''nezávislá měření''' (nezávislý výběr) – výběrový soubor rozdělíme na dvě skupiny
 
* '''nezávislá měření''' (nezávislý výběr) – výběrový soubor rozdělíme na dvě skupiny
 
* '''závislá (opakovaná) měření''' (spárované výběry) – výběrový soubor se nedělí, měří se dvakrát za jiných podmínek
 
* '''závislá (opakovaná) měření''' (spárované výběry) – výběrový soubor se nedělí, měří se dvakrát za jiných podmínek
 
  
 
== Typy proměnných ==
 
== Typy proměnných ==
Řádek 77: Řádek 71:
  
 
* '''proměnná''' (znak) – vlastnost, kterou sledujeme
 
* '''proměnná''' (znak) – vlastnost, kterou sledujeme
: - nabývá alespoň dvou hodnot → případy se liší
+
** nabývá alespoň dvou hodnot → případy se liší
  
 
==== Nominální ====
 
==== Nominální ====
Řádek 84: Řádek 78:
 
* existuje jen rovnost a nerovnost
 
* existuje jen rovnost a nerovnost
 
* např. proměnná ''„žena, hlasatel, afrikáta, ...“''
 
* např. proměnná ''„žena, hlasatel, afrikáta, ...“''
 
  
 
==== Řadové ====
 
==== Řadové ====
Řádek 92: Řádek 85:
 
* např. hodnocení artikulačního stylu podle určené stupnice – můžeme přiřadit, ale nemůžeme také říct, o kolik je třeba něco „nedbajelšího“ než to „pečlivé“
 
* např. hodnocení artikulačního stylu podle určené stupnice – můžeme přiřadit, ale nemůžeme také říct, o kolik je třeba něco „nedbajelšího“ než to „pečlivé“
 
* stupnice „neměřitelných“ hodnocení
 
* stupnice „neměřitelných“ hodnocení
 
  
 
==== Numerické ====
 
==== Numerické ====
Řádek 101: Řádek 93:
  
 
* 1) '''intervalové''' – zjišťují rozdíly mezi hodnotami, ne poměry ← ty závisí na tom, kam dáme nulu
 
* 1) '''intervalové''' – zjišťují rozdíly mezi hodnotami, ne poměry ← ty závisí na tom, kam dáme nulu
: - např. půltóny
+
** např. půltóny
 
* 2) '''poměrové''' – mají objektivní absolutní nulu
 
* 2) '''poměrové''' – mají objektivní absolutní nulu
: - zjišťují, o kolik i kolikrát se hodnoty liší
+
** zjišťují, o kolik i kolikrát se hodnoty liší
: - např. sekundy
+
** např. sekundy
  
 
* 1) '''spojité''' – libovolné hodnoty v rámci intervalu
 
* 1) '''spojité''' – libovolné hodnoty v rámci intervalu
: - např. výška F0
+
** např. výška F0
 
* 2) nespojité – pouze vybrané hodnoty v rámci intervalu
 
* 2) nespojité – pouze vybrané hodnoty v rámci intervalu
: - např. počet slabik ve slově
+
** např. počet slabik ve slově
  
 
* nominální + řadové → '''neparametrické metody'''
 
* nominální + řadové → '''neparametrické metody'''
 
* numerické → '''parametrické metody'''
 
* numerické → '''parametrické metody'''
 
  
 
=== Proměnné podle role ve zkoumaných vztazích ===
 
=== Proměnné podle role ve zkoumaných vztazích ===
Řádek 121: Řádek 112:
 
* spojována s příčinou
 
* spojována s příčinou
 
* ovlivňujeme ji → bude mít následek?
 
* ovlivňujeme ji → bude mít následek?
 
  
 
==== Závislá proměnná ====
 
==== Závislá proměnná ====
Řádek 128: Řádek 118:
 
* mění se podle ovlivňování nezávislé proměnné
 
* mění se podle ovlivňování nezávislé proměnné
 
* např. zkoumáme srozumitelnost řeči ovlivňováním (vynecháváním) frekvenčích pásem → pásma jsou nezávislá proměnná, srozumitelnost je závislá
 
* např. zkoumáme srozumitelnost řeči ovlivňováním (vynecháváním) frekvenčích pásem → pásma jsou nezávislá proměnná, srozumitelnost je závislá
 
  
 
== Typy chyb ==
 
== Typy chyb ==
Řádek 137: Řádek 126:
 
* → '''systematické chyby'''
 
* → '''systematické chyby'''
 
* např. efekt pořadí – vnímání položek může být ovlivněno těmi předchozími
 
* např. efekt pořadí – vnímání položek může být ovlivněno těmi předchozími
 
  
 
=== Rušivá proměnná  ===
 
=== Rušivá proměnná  ===
Řádek 143: Řádek 131:
 
* náhodné vnější vlivy
 
* náhodné vnější vlivy
 
* → '''náhodné chyby'''
 
* → '''náhodné chyby'''
 
  
 
* '''pracovní''' (alternativní) '''hypotéza''' – × '''nulová'''
 
* '''pracovní''' (alternativní) '''hypotéza''' – × '''nulová'''
: - předpokládá hledaný vztah
+
** předpokládá hledaný vztah
 
* '''chyba 1. druhu''' – nesprávně zamítnutá nulová hypotéza, vztah ve skutečnosti neexistuje
 
* '''chyba 1. druhu''' – nesprávně zamítnutá nulová hypotéza, vztah ve skutečnosti neexistuje
 
* '''chyba 2. druhu''' – nesprávně přijatá nulová hypotéza, vztah ve skutečnosti existuje
 
* '''chyba 2. druhu''' – nesprávně přijatá nulová hypotéza, vztah ve skutečnosti existuje
 
* snižujeme-li riziko jedné chyby, zvyšujeme riziko té druhé
 
* snižujeme-li riziko jedné chyby, zvyšujeme riziko té druhé
 
  
 
== Pravděpodobnost ==
 
== Pravděpodobnost ==
Řádek 158: Řádek 144:
  
 
* '''stochastika''' – nauka o počtu pravděpodobnosti
 
* '''stochastika''' – nauka o počtu pravděpodobnosti
: - zjišťuje, jakými principy se řídí fungování „náhody“
+
** zjišťuje, jakými principy se řídí fungování „náhody“
 
 
  
=== ''p'' ===
+
=== p ===
  
 
* odkazuje většinou na pravděpodobnost chyby 1. druhu
 
* odkazuje většinou na pravděpodobnost chyby 1. druhu
 
* hodnoty 0–1:
 
* hodnoty 0–1:
: - 0 – jev nenastane nikdy
+
** 0 – jev nenastane nikdy
: - 1 – jev nastane vždy
+
** 1 – jev nastane vždy
 
* '''hladiny významnosti''' (α)
 
* '''hladiny významnosti''' (α)
: - je třeba nastavit ještě před výpočtem ''p''
+
** je třeba nastavit ještě před výpočtem ''p''
: - ''p'' < 0,05 → významný výsledek
+
** ''p'' < 0,05 → významný výsledek
: - ''p'' < 0,001 → vysoce významný výsledek
+
** ''p'' < 0,001 → vysoce významný výsledek
  
 +
== Odkazy ==
  
 +
=== Reference ===
  
== Reference ==
 
 
<references />
 
<references />
 +
 +
=== Použitá literatura ===
 +
 
* Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
 
* Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
 
* Meloun, M. - Militký, J. (2001): Kompendium statistického zpracování dat. Praha: Academia. (vybrané části)  
 
* Meloun, M. - Militký, J. (2001): Kompendium statistického zpracování dat. Praha: Academia. (vybrané části)  
Řádek 182: Řádek 171:
 
* Lamser, V. - Růžička, L. (1970): Základy statistiky pro sociology. Praha: Svoboda.
 
* Lamser, V. - Růžička, L. (1970): Základy statistiky pro sociology. Praha: Svoboda.
  
 +
Zpět na rozcestník: [[Statistické_metody_ve_fonetickém_výzkumu|Statistické metody ve fonetickém výzkumu]] | [[Portál:Fonetika|Fonetika]]
  
Zpět na rozcestník: [[Statistické_metody_ve_fonetickém_výzkumu|Statistické metody ve fonetickém výzkumu]] | [[Portál:Fonetika|Fonetika]]
+
[[Kategorie: Fonetika|*]]
 +
[[Kategorie: Statistika|*]]

Aktuální verze z 20. 1. 2015, 00:52

  • 2 druhy výzkumu:
    • kvalitativní – řeší, s čím vším je třeba při řešení problému počítat (hledání hypotéz) – nepotřebuje statistiku
    • kvantitativní – prověřování hypotéz – statistika potřeba je

Statistické postupy

Deskriptivní

  • přehledné a úsporné vyjádření údajů
  • odhaluje typické trendy v datech a atypické případy

Analytické

Inferenční (induktivní)

  • testování hypotéz
  • p < 0,05 = nejvyšší pravděpodobnost náhodného výsledku musí být nižší než 5%
  • základním výstupem je údaj o pravděpodobnosti omylu při zobecňování

Exploratorní

  • složité, pro méně přehledná data

Základní a výběrový soubor

  • základní soubor = populace – množina objektů, kterou chceme popsat a z které vybíráme vzorek
  • výběrový soubor = vzorek populace – vybraný vzorek
  • princip náhodnosti
  • princip reprezentativnosti
  • → pokud má výběrový soubor reprezentovat základní, musí z něj být vybrán náhodně
  • výběrová chyba – i při správném výběru se vzorek s populací přesně neshoduje
  • je to rozdíl mezi určitým ukazatelem v základním a výběrovém souboru
  • nulová hypotéza – předpokládá, že různé vztahy mezi proměnnými nebo rozdíly mezi soubory jsou čistě náhodné
  • → statistický test to potvrdí, nebo vyvrátí

Používané symboly

výběrový soubor základní soubor
počet případů n N
aritmetický průměr μ
směrodatná odchylka s σ
rozptyl s2 σ2
  • výběrový soubor má většinou poskytnout informaci o jedné skutečnosti za různých podmínek
  • nezávislá měření (nezávislý výběr) – výběrový soubor rozdělíme na dvě skupiny
  • závislá (opakovaná) měření (spárované výběry) – výběrový soubor se nedělí, měří se dvakrát za jiných podmínek

Typy proměnných

Proměnné podle matematických vlastností

  • proměnná (znak) – vlastnost, kterou sledujeme
    • nabývá alespoň dvou hodnot → případy se liší

Nominální

  • pouze odkazují na příslušnost ke skupině či kategorii
  • existuje jen rovnost a nerovnost
  • např. proměnná „žena, hlasatel, afrikáta, ...“

Řadové

  • také řadí do kategorií
  • lze řadit „je větší / menší než“
  • např. hodnocení artikulačního stylu podle určené stupnice – můžeme přiřadit, ale nemůžeme také říct, o kolik je třeba něco „nedbajelšího“ než to „pečlivé“
  • stupnice „neměřitelných“ hodnocení

Numerické

  • odkazují na pozici na škále exaktně měřitelných hodnot
  • lze vyjádřit číslem
  • např. frekvence v Hz
  • 1) intervalové – zjišťují rozdíly mezi hodnotami, ne poměry ← ty závisí na tom, kam dáme nulu
    • např. půltóny
  • 2) poměrové – mají objektivní absolutní nulu
    • zjišťují, o kolik i kolikrát se hodnoty liší
    • např. sekundy
  • 1) spojité – libovolné hodnoty v rámci intervalu
    • např. výška F0
  • 2) nespojité – pouze vybrané hodnoty v rámci intervalu
    • např. počet slabik ve slově
  • nominální + řadové → neparametrické metody
  • numerické → parametrické metody

Proměnné podle role ve zkoumaných vztazích

Nezávislá proměnná

  • spojována s příčinou
  • ovlivňujeme ji → bude mít následek?

Závislá proměnná

  • ověřovaná vlastnost
  • mění se podle ovlivňování nezávislé proměnné
  • např. zkoumáme srozumitelnost řeči ovlivňováním (vynecháváním) frekvenčích pásem → pásma jsou nezávislá proměnná, srozumitelnost je závislá

Typy chyb

Vnější proměnná

  • přehlédnuté či opomenuté nezávislé proměnné, které fungují ve zkoumaném vztahu
  • systematické chyby
  • např. efekt pořadí – vnímání položek může být ovlivněno těmi předchozími

Rušivá proměnná

  • náhodné vnější vlivy
  • náhodné chyby
  • pracovní (alternativní) hypotéza – × nulová
    • předpokládá hledaný vztah
  • chyba 1. druhu – nesprávně zamítnutá nulová hypotéza, vztah ve skutečnosti neexistuje
  • chyba 2. druhu – nesprávně přijatá nulová hypotéza, vztah ve skutečnosti existuje
  • snižujeme-li riziko jedné chyby, zvyšujeme riziko té druhé

Pravděpodobnost

  • jistý jev – dá se jednoznačně popsat a je vždy stejný
  • náhodný jev – vlastnosti se dají více či méně předpovídat, ale budou se vyskytovat jen s nějakou pravděpodobností
  • stochastika – nauka o počtu pravděpodobnosti
    • zjišťuje, jakými principy se řídí fungování „náhody“

p

  • odkazuje většinou na pravděpodobnost chyby 1. druhu
  • hodnoty 0–1:
    • 0 – jev nenastane nikdy
    • 1 – jev nastane vždy
  • hladiny významnosti (α)
    • je třeba nastavit ještě před výpočtem p
    • p < 0,05 → významný výsledek
    • p < 0,001 → vysoce významný výsledek

Odkazy

Reference


Použitá literatura

  • Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
  • Meloun, M. - Militký, J. (2001): Kompendium statistického zpracování dat. Praha: Academia. (vybrané části)
  • Robson, C. (1973): Experiment, design and statistics in psychology. Harmondsworth: Penguin Books Ltd.
  • Urdan, T. C. (2001): Statistics in plain English. London: Lawrence Erlbaum Associates.
  • Lamser, V. - Růžička, L. (1970): Základy statistiky pro sociology. Praha: Svoboda.

Zpět na rozcestník: Statistické metody ve fonetickém výzkumu | Fonetika