Základní pojmy foneticke statistiky: Porovnání verzí
Řádek 1: | Řádek 1: | ||
* 2 druhy výzkumu: | * 2 druhy výzkumu: | ||
− | + | ** '''kvalitativní''' – řeší, s čím vším je třeba při řešení problému počítat (hledání hypotéz) – nepotřebuje statistiku | |
− | + | ** '''kvantitativní''' – prověřování hypotéz – statistika potřeba je | |
− | |||
== Statistické postupy == | == Statistické postupy == | ||
Řádek 10: | Řádek 9: | ||
* přehledné a úsporné vyjádření údajů | * přehledné a úsporné vyjádření údajů | ||
* odhaluje typické trendy v datech a atypické případy | * odhaluje typické trendy v datech a atypické případy | ||
− | |||
=== Analytické === | === Analytické === | ||
Řádek 19: | Řádek 17: | ||
* ''p'' < 0,05 = nejvyšší pravděpodobnost náhodného výsledku musí být nižší než 5% | * ''p'' < 0,05 = nejvyšší pravděpodobnost náhodného výsledku musí být nižší než 5% | ||
* základním výstupem je '''údaj o pravděpodobnosti omylu''' při zobecňování | * základním výstupem je '''údaj o pravděpodobnosti omylu''' při zobecňování | ||
− | |||
==== Exploratorní ==== | ==== Exploratorní ==== | ||
* složité, pro méně přehledná data | * složité, pro méně přehledná data | ||
− | |||
== Základní a výběrový soubor == | == Základní a výběrový soubor == | ||
Řádek 40: | Řádek 36: | ||
* '''nulová hypotéza''' – předpokládá, že různé vztahy mezi proměnnými nebo rozdíly mezi soubory jsou čistě náhodné | * '''nulová hypotéza''' – předpokládá, že různé vztahy mezi proměnnými nebo rozdíly mezi soubory jsou čistě náhodné | ||
* → statistický test to potvrdí, nebo vyvrátí | * → statistický test to potvrdí, nebo vyvrátí | ||
− | |||
=== Používané symboly === | === Používané symboly === | ||
Řádek 66: | Řádek 61: | ||
| ''σ<sup>2</sup>'' | | ''σ<sup>2</sup>'' | ||
|} | |} | ||
− | + | ||
* výběrový soubor má většinou poskytnout informaci o jedné skutečnosti za různých podmínek | * výběrový soubor má většinou poskytnout informaci o jedné skutečnosti za různých podmínek | ||
* '''nezávislá měření''' (nezávislý výběr) – výběrový soubor rozdělíme na dvě skupiny | * '''nezávislá měření''' (nezávislý výběr) – výběrový soubor rozdělíme na dvě skupiny | ||
* '''závislá (opakovaná) měření''' (spárované výběry) – výběrový soubor se nedělí, měří se dvakrát za jiných podmínek | * '''závislá (opakovaná) měření''' (spárované výběry) – výběrový soubor se nedělí, měří se dvakrát za jiných podmínek | ||
− | |||
== Typy proměnných == | == Typy proměnných == | ||
Řádek 77: | Řádek 71: | ||
* '''proměnná''' (znak) – vlastnost, kterou sledujeme | * '''proměnná''' (znak) – vlastnost, kterou sledujeme | ||
− | + | ** nabývá alespoň dvou hodnot → případy se liší | |
==== Nominální ==== | ==== Nominální ==== | ||
Řádek 84: | Řádek 78: | ||
* existuje jen rovnost a nerovnost | * existuje jen rovnost a nerovnost | ||
* např. proměnná ''„žena, hlasatel, afrikáta, ...“'' | * např. proměnná ''„žena, hlasatel, afrikáta, ...“'' | ||
− | |||
==== Řadové ==== | ==== Řadové ==== | ||
Řádek 92: | Řádek 85: | ||
* např. hodnocení artikulačního stylu podle určené stupnice – můžeme přiřadit, ale nemůžeme také říct, o kolik je třeba něco „nedbajelšího“ než to „pečlivé“ | * např. hodnocení artikulačního stylu podle určené stupnice – můžeme přiřadit, ale nemůžeme také říct, o kolik je třeba něco „nedbajelšího“ než to „pečlivé“ | ||
* stupnice „neměřitelných“ hodnocení | * stupnice „neměřitelných“ hodnocení | ||
− | |||
==== Numerické ==== | ==== Numerické ==== | ||
Řádek 101: | Řádek 93: | ||
* 1) '''intervalové''' – zjišťují rozdíly mezi hodnotami, ne poměry ← ty závisí na tom, kam dáme nulu | * 1) '''intervalové''' – zjišťují rozdíly mezi hodnotami, ne poměry ← ty závisí na tom, kam dáme nulu | ||
− | + | ** např. půltóny | |
* 2) '''poměrové''' – mají objektivní absolutní nulu | * 2) '''poměrové''' – mají objektivní absolutní nulu | ||
− | + | ** zjišťují, o kolik i kolikrát se hodnoty liší | |
− | + | ** např. sekundy | |
* 1) '''spojité''' – libovolné hodnoty v rámci intervalu | * 1) '''spojité''' – libovolné hodnoty v rámci intervalu | ||
− | + | ** např. výška F0 | |
* 2) nespojité – pouze vybrané hodnoty v rámci intervalu | * 2) nespojité – pouze vybrané hodnoty v rámci intervalu | ||
− | + | ** např. počet slabik ve slově | |
* nominální + řadové → '''neparametrické metody''' | * nominální + řadové → '''neparametrické metody''' | ||
* numerické → '''parametrické metody''' | * numerické → '''parametrické metody''' | ||
− | |||
=== Proměnné podle role ve zkoumaných vztazích === | === Proměnné podle role ve zkoumaných vztazích === | ||
Řádek 121: | Řádek 112: | ||
* spojována s příčinou | * spojována s příčinou | ||
* ovlivňujeme ji → bude mít následek? | * ovlivňujeme ji → bude mít následek? | ||
− | |||
==== Závislá proměnná ==== | ==== Závislá proměnná ==== | ||
Řádek 128: | Řádek 118: | ||
* mění se podle ovlivňování nezávislé proměnné | * mění se podle ovlivňování nezávislé proměnné | ||
* např. zkoumáme srozumitelnost řeči ovlivňováním (vynecháváním) frekvenčích pásem → pásma jsou nezávislá proměnná, srozumitelnost je závislá | * např. zkoumáme srozumitelnost řeči ovlivňováním (vynecháváním) frekvenčích pásem → pásma jsou nezávislá proměnná, srozumitelnost je závislá | ||
− | |||
== Typy chyb == | == Typy chyb == | ||
Řádek 137: | Řádek 126: | ||
* → '''systematické chyby''' | * → '''systematické chyby''' | ||
* např. efekt pořadí – vnímání položek může být ovlivněno těmi předchozími | * např. efekt pořadí – vnímání položek může být ovlivněno těmi předchozími | ||
− | |||
=== Rušivá proměnná === | === Rušivá proměnná === | ||
Řádek 143: | Řádek 131: | ||
* náhodné vnější vlivy | * náhodné vnější vlivy | ||
* → '''náhodné chyby''' | * → '''náhodné chyby''' | ||
− | |||
* '''pracovní''' (alternativní) '''hypotéza''' – × '''nulová''' | * '''pracovní''' (alternativní) '''hypotéza''' – × '''nulová''' | ||
− | + | ** předpokládá hledaný vztah | |
* '''chyba 1. druhu''' – nesprávně zamítnutá nulová hypotéza, vztah ve skutečnosti neexistuje | * '''chyba 1. druhu''' – nesprávně zamítnutá nulová hypotéza, vztah ve skutečnosti neexistuje | ||
* '''chyba 2. druhu''' – nesprávně přijatá nulová hypotéza, vztah ve skutečnosti existuje | * '''chyba 2. druhu''' – nesprávně přijatá nulová hypotéza, vztah ve skutečnosti existuje | ||
* snižujeme-li riziko jedné chyby, zvyšujeme riziko té druhé | * snižujeme-li riziko jedné chyby, zvyšujeme riziko té druhé | ||
− | |||
== Pravděpodobnost == | == Pravděpodobnost == | ||
Řádek 158: | Řádek 144: | ||
* '''stochastika''' – nauka o počtu pravděpodobnosti | * '''stochastika''' – nauka o počtu pravděpodobnosti | ||
− | + | ** zjišťuje, jakými principy se řídí fungování „náhody“ | |
− | |||
− | === | + | === p === |
* odkazuje většinou na pravděpodobnost chyby 1. druhu | * odkazuje většinou na pravděpodobnost chyby 1. druhu | ||
* hodnoty 0–1: | * hodnoty 0–1: | ||
− | + | ** 0 – jev nenastane nikdy | |
− | + | ** 1 – jev nastane vždy | |
* '''hladiny významnosti''' (α) | * '''hladiny významnosti''' (α) | ||
− | + | ** je třeba nastavit ještě před výpočtem ''p'' | |
− | + | ** ''p'' < 0,05 → významný výsledek | |
− | + | ** ''p'' < 0,001 → vysoce významný výsledek | |
+ | == Odkazy == | ||
+ | === Reference === | ||
− | |||
<references /> | <references /> | ||
+ | |||
+ | === Použitá literatura === | ||
+ | |||
* Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha. | * Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha. | ||
* Meloun, M. - Militký, J. (2001): Kompendium statistického zpracování dat. Praha: Academia. (vybrané části) | * Meloun, M. - Militký, J. (2001): Kompendium statistického zpracování dat. Praha: Academia. (vybrané části) | ||
Řádek 182: | Řádek 171: | ||
* Lamser, V. - Růžička, L. (1970): Základy statistiky pro sociology. Praha: Svoboda. | * Lamser, V. - Růžička, L. (1970): Základy statistiky pro sociology. Praha: Svoboda. | ||
+ | Zpět na rozcestník: [[Statistické_metody_ve_fonetickém_výzkumu|Statistické metody ve fonetickém výzkumu]] | [[Portál:Fonetika|Fonetika]] | ||
− | + | [[Kategorie: Fonetika|*]] | |
+ | [[Kategorie: Statistika|*]] |
Aktuální verze z 20. 1. 2015, 00:52
- 2 druhy výzkumu:
- kvalitativní – řeší, s čím vším je třeba při řešení problému počítat (hledání hypotéz) – nepotřebuje statistiku
- kvantitativní – prověřování hypotéz – statistika potřeba je
Obsah
Statistické postupy
Deskriptivní
- přehledné a úsporné vyjádření údajů
- odhaluje typické trendy v datech a atypické případy
Analytické
Inferenční (induktivní)
- testování hypotéz
- p < 0,05 = nejvyšší pravděpodobnost náhodného výsledku musí být nižší než 5%
- základním výstupem je údaj o pravděpodobnosti omylu při zobecňování
Exploratorní
- složité, pro méně přehledná data
Základní a výběrový soubor
- základní soubor = populace – množina objektů, kterou chceme popsat a z které vybíráme vzorek
- výběrový soubor = vzorek populace – vybraný vzorek
- princip náhodnosti
- princip reprezentativnosti
- → pokud má výběrový soubor reprezentovat základní, musí z něj být vybrán náhodně
- výběrová chyba – i při správném výběru se vzorek s populací přesně neshoduje
- je to rozdíl mezi určitým ukazatelem v základním a výběrovém souboru
- nulová hypotéza – předpokládá, že různé vztahy mezi proměnnými nebo rozdíly mezi soubory jsou čistě náhodné
- → statistický test to potvrdí, nebo vyvrátí
Používané symboly
výběrový soubor | základní soubor | |
---|---|---|
počet případů | n | N |
aritmetický průměr | x̅ | μ |
směrodatná odchylka | s | σ |
rozptyl | s2 | σ2 |
- výběrový soubor má většinou poskytnout informaci o jedné skutečnosti za různých podmínek
- nezávislá měření (nezávislý výběr) – výběrový soubor rozdělíme na dvě skupiny
- závislá (opakovaná) měření (spárované výběry) – výběrový soubor se nedělí, měří se dvakrát za jiných podmínek
Typy proměnných
Proměnné podle matematických vlastností
- proměnná (znak) – vlastnost, kterou sledujeme
- nabývá alespoň dvou hodnot → případy se liší
Nominální
- pouze odkazují na příslušnost ke skupině či kategorii
- existuje jen rovnost a nerovnost
- např. proměnná „žena, hlasatel, afrikáta, ...“
Řadové
- také řadí do kategorií
- lze řadit „je větší / menší než“
- např. hodnocení artikulačního stylu podle určené stupnice – můžeme přiřadit, ale nemůžeme také říct, o kolik je třeba něco „nedbajelšího“ než to „pečlivé“
- stupnice „neměřitelných“ hodnocení
Numerické
- odkazují na pozici na škále exaktně měřitelných hodnot
- lze vyjádřit číslem
- např. frekvence v Hz
- 1) intervalové – zjišťují rozdíly mezi hodnotami, ne poměry ← ty závisí na tom, kam dáme nulu
- např. půltóny
- 2) poměrové – mají objektivní absolutní nulu
- zjišťují, o kolik i kolikrát se hodnoty liší
- např. sekundy
- 1) spojité – libovolné hodnoty v rámci intervalu
- např. výška F0
- 2) nespojité – pouze vybrané hodnoty v rámci intervalu
- např. počet slabik ve slově
- nominální + řadové → neparametrické metody
- numerické → parametrické metody
Proměnné podle role ve zkoumaných vztazích
Nezávislá proměnná
- spojována s příčinou
- ovlivňujeme ji → bude mít následek?
Závislá proměnná
- ověřovaná vlastnost
- mění se podle ovlivňování nezávislé proměnné
- např. zkoumáme srozumitelnost řeči ovlivňováním (vynecháváním) frekvenčích pásem → pásma jsou nezávislá proměnná, srozumitelnost je závislá
Typy chyb
Vnější proměnná
- přehlédnuté či opomenuté nezávislé proměnné, které fungují ve zkoumaném vztahu
- → systematické chyby
- např. efekt pořadí – vnímání položek může být ovlivněno těmi předchozími
Rušivá proměnná
- náhodné vnější vlivy
- → náhodné chyby
- pracovní (alternativní) hypotéza – × nulová
- předpokládá hledaný vztah
- chyba 1. druhu – nesprávně zamítnutá nulová hypotéza, vztah ve skutečnosti neexistuje
- chyba 2. druhu – nesprávně přijatá nulová hypotéza, vztah ve skutečnosti existuje
- snižujeme-li riziko jedné chyby, zvyšujeme riziko té druhé
Pravděpodobnost
- jistý jev – dá se jednoznačně popsat a je vždy stejný
- náhodný jev – vlastnosti se dají více či méně předpovídat, ale budou se vyskytovat jen s nějakou pravděpodobností
- stochastika – nauka o počtu pravděpodobnosti
- zjišťuje, jakými principy se řídí fungování „náhody“
p
- odkazuje většinou na pravděpodobnost chyby 1. druhu
- hodnoty 0–1:
- 0 – jev nenastane nikdy
- 1 – jev nastane vždy
- hladiny významnosti (α)
- je třeba nastavit ještě před výpočtem p
- p < 0,05 → významný výsledek
- p < 0,001 → vysoce významný výsledek
Odkazy
Reference
Použitá literatura
- Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
- Meloun, M. - Militký, J. (2001): Kompendium statistického zpracování dat. Praha: Academia. (vybrané části)
- Robson, C. (1973): Experiment, design and statistics in psychology. Harmondsworth: Penguin Books Ltd.
- Urdan, T. C. (2001): Statistics in plain English. London: Lawrence Erlbaum Associates.
- Lamser, V. - Růžička, L. (1970): Základy statistiky pro sociology. Praha: Svoboda.
Zpět na rozcestník: Statistické metody ve fonetickém výzkumu | Fonetika