Některé typy rozdělení: Porovnání verzí

Aktuální verze z 20. 1. 2015, 01:46

1) rozdělení vlastnosti v rámci zkoumaných souborů
- např. histogram – rozdělení na různé míry vlastnosti podle výskytu
2) rozdělení pravděpodobností
- s jakou pravděpodobností bude mít např. realizace hlásky nějakou vlastnost a s jakou pravděpodobností jí buď nedosáhne, nebo překročí

Obsah

1 Binomické rozdělení
2 Poissonovo rozdělení
3 Tvary rozdělení
4 Normální rozdělení a z-skóre
5 Odkazy
- 5.1 Reference
- 5.2 Použitá literatura

Binomické rozdělení

proměnná nabývá pouze dvou hodnot
vzorec (p+p‘)2 = 1
- součet pravděpodobností obou variant
- dejme tomu, že z osmi vzorků vyjde 6 výskytů 1. hodnoty a 2 výskyty 2. hodnoty
- jak je to pravděpodobné?
- musíme sečíst všechny varianty rozdělení, tedy:
- p8 + p7p‘ + p6p‘2 + ... + pp‘7 + p‘8
- předpokládáme stejnou pravděpodobnost pro obě hodnoty (p = p‘ = 0,5)
- → můžeme zjednodušit na p8 + p8 + ... + p8
- pomocí kombinací musíme zjistit binomické koeficienty (kolik kombinací o k případech jde vytvořit z množiny n prvků – n nad k)
- výsledkem je koeficient 28, kterým vynásobíme původní pravděpodobnost, tedy 28 × 0,58 (← 8 vzorků)
- → pravděpodobnost, že náhodný vzorek 8 výsledků bude 6:2, je cca 11%
- jaká je pravděpodobnost, že z populace vybereme náhodně 6 případů s jednou hodnotou proměnné a 2 s druhou?
- 2× vyšší výsledek → 22% (6:2 + 2:6)
- → jednostranné × dvoustranné testy

znaménkový test – zjišťuje pravděpodobnost určitého poměru binárních hodnot
- tzv. kumulativní pravděpodobnost – určitá hodnota + do extrému (tzn. pro pravděpodobnost 4:4 bude p = 1 – vždy je rovno, nebo blíže extrému)

Poissonovo rozdělení

limitní varianta binomického rozdělení
binomické rozdělení se Poissonovu podobá tím více, čím více se pravděpodobnost jevu p blíží k nule a počet pozorování n k nekonečnu
dobrá aproximace už od p ≈ 0,1 a n > 30
používá se tam, kde se náhodné jevy mohou vyskytnout, ale stává se tak jen zřídka → = „rozdělení vzácných jevů“
průměr a rozptyl jsou zhruba stejné, = 1 (hodně drobných odchylek, ale žádná velká)

Tvary rozdělení

rozdělení mohou mít různé tvary → pravděpodobnost zaujímá nějaký prostor
podle počtu vrcholů (nejčastější hodnota, takový kopečky) – unimodální × bimodální × multimodální
u-ové – nejčastější krajní hodnoty
obdélníkové – všechno stejně časté
podle pozice vrcholu – pozitivně / pravostranně sešikmené (doprava klesá pomaleji) × negativně / levostranně sešikmené
- musí se určit míra šikmosti, oblast od -1 do +1 se bere jako pořád střed
podle špičatosti rozdělení (excesu) – ploché (platykurtické) × špičaté (leptokurtické)

Normální rozdělení a z-skóre

= Gaussovo
unimodální a symetrické
sešikmení a špičatost = 0
na obou stranách se limitně blíží nule
určeno dvěma veličinami – aritmetickým průměrem (μ) a směrodatnou odchylkou (σ)
do prostoru 1σ se vejde 68,26% případů, do 2σ 95,44% a do 3σ 99,74%

je to spojité rozdělení → normalizované z-skóre
všechna normální rozdělení si jsou podobná → je možné převést na normalizovaná
→ můžeme srovnávat různé jednotky a řády
od každé naměřené hodnoty x se odečte aritmetický průměr x̅ a vydělí se směrodatnou odchylkou s
normalizované normální rozdělení má x̅ = 0 a s = 1
nelineární – např. u výsledků 0,3 + 0,7 a 1,3 + 1,7 zůstává stejné, o kolik od sebe jsou, ale poměry jsou jiné
95% případů se vejde do intervalu ± 1,96

konvertované skóre – z-skóre konvertované do jiné stupnice (→ odstranění desetinných míst a záporných čísel)
ke všem hodnotám přičteme stejnou konstantu či je vynásobíme – jen se to posune či roztáhne pole

rozdělení může být deformováno podlahovým či stropovým efektem – všichni jsou lepší / horší než hranice měřené oblasti
nesymetričnost – např. u počtu hlásek ve slabice nebo slabik ve slově
normální rozdělení je výhodné → snaha na něj transformovat i nesymetrická:
- pozitivní sešikmení se opravuje logaritmem, odmocninou či inverzí
- negativní se opravuje mocninou

Odkazy

Reference

Použitá literatura

Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
Meloun, M. - Militký, J. (2001): Kompendium statistického zpracování dat. Praha: Academia. (vybrané části)
Robson, C. (1973): Experiment, design and statistics in psychology. Harmondsworth: Penguin Books Ltd.
Urdan, T. C. (2001): Statistics in plain English. London: Lawrence Erlbaum Associates.
Lamser, V. - Růžička, L. (1970): Základy statistiky pro sociology. Praha: Svoboda.

Zpět na rozcestník: Statistické metody ve fonetickém výzkumu | Fonetika

@@ Řádek 1: / Řádek 1: @@
 * 1) rozdělení vlastnosti v rámci zkoumaných souborů
-: - viz např. histogram – rozdělení na různé míry vlastnosti podle výskytu
+** např. [[Histogram|histogram]] – rozdělení na různé míry vlastnosti podle výskytu
 * 2) rozdělení pravděpodobností
-: - s jakou pravděpodobností bude mít např. realizace hlásky nějakou vlastnost a s jakou pravděpodobností jí buď nedosáhne, nebo překročí
+** s jakou pravděpodobností bude mít např. realizace hlásky nějakou vlastnost a s jakou pravděpodobností jí buď nedosáhne, nebo překročí
 == Binomické rozdělení ==
 * proměnná nabývá pouze dvou hodnot
 * vzorec ''(p+p‘)2 = 1''
-: - součet pravděpodobností obou variant
+** součet pravděpodobností obou variant
-: - dejme tomu, že z osmi vzorků vyjde 6 výskytů 1. hodnoty a 2 výskyty 2. hodnoty
+** dejme tomu, že z osmi vzorků vyjde 6 výskytů 1. hodnoty a 2 výskyty 2. hodnoty
-: - jak je to pravděpodobné?
+** jak je to pravděpodobné?
-: - musíme sečíst všechny varianty rozdělení, tedy:
+** musíme sečíst všechny varianty rozdělení, tedy:
-: - ''p8 + p7p‘ + p6p‘2 + ... + pp‘7 + p‘8''
+** ''p8 + p7p‘ + p6p‘2 + ... + pp‘7 + p‘8''
-: - předpokládáme stejnou pravděpodobnost pro obě hodnoty (''p = p‘ = 0,5'')
+** předpokládáme stejnou pravděpodobnost pro obě hodnoty (''p = p‘ = 0,5'')
-: - → můžeme zjednodušit na ''p8 + p8 + ... + p8''
+** → můžeme zjednodušit na ''p8 + p8 + ... + p8''
-: - pomocí kombinací musíme zjistit binomické koeficienty (kolik kombinací o ''k'' případech jde vytvořit z množiny ''n'' prvků – ''n'' nad ''k'')
+** pomocí kombinací musíme zjistit binomické koeficienty (kolik kombinací o ''k'' případech jde vytvořit z množiny ''n'' prvků – ''n'' nad ''k'')
-: - výsledkem je koeficient 28, kterým vynásobíme původní pravděpodobnost, tedy 28 × 0,58 (← 8 vzorků)
+** výsledkem je koeficient 28, kterým vynásobíme původní pravděpodobnost, tedy 28 × 0,58 (← 8 vzorků)
-: - → pravděpodobnost, že náhodný vzorek 8 výsledků bude 6:2, je cca 11%
+** → pravděpodobnost, že náhodný vzorek 8 výsledků bude 6:2, je cca 11%
-: - jaká je pravděpodobnost, že z populace vybereme náhodně 6 případů s jednou hodnotou proměnné a 2 s druhou?
+** jaká je pravděpodobnost, že z populace vybereme náhodně 6 případů s jednou hodnotou proměnné a 2 s druhou?
-: - 2× vyšší výsledek → 22% (6:2 + 2:6)
+** 2× vyšší výsledek → 22% (6:2 + 2:6)
-: - → '''jednostranné × dvoustranné testy'''
+** → '''jednostranné × dvoustranné testy'''
 * '''znaménkový test''' – zjišťuje pravděpodobnost určitého poměru binárních hodnot
-: - tzv. '''kumulativní pravděpodobnost''' – určitá hodnota + do extrému (tzn. pro pravděpodobnost 4:4 bude ''p'' = 1 – vždy je rovno, nebo blíže extrému)
+** tzv. '''kumulativní pravděpodobnost''' – určitá hodnota + do extrému (tzn. pro pravděpodobnost 4:4 bude ''p'' = 1 – vždy je rovno, nebo blíže extrému)
@@ Řádek 35: / Řádek 33: @@
 * používá se tam, kde se náhodné jevy mohou vyskytnout, ale stává se tak jen zřídka → = ''„rozdělení vzácných jevů“''
 * průměr a rozptyl jsou zhruba stejné, = 1 (hodně drobných odchylek, ale žádná velká)
 == Tvary rozdělení ==
@@ Řádek 44: / Řádek 41: @@
 * '''obdélníkové''' – všechno stejně časté
 * podle pozice vrcholu – '''pozitivně / pravostranně sešikmené''' (doprava klesá pomaleji) × '''negativně / levostranně sešikmené'''
-: - musí se určit míra šikmosti, oblast od -1 do +1 se bere jako pořád střed
+** musí se určit míra šikmosti, oblast od -1 do +1 se bere jako pořád střed
 * podle špičatosti rozdělení (excesu) – '''ploché (platykurtické) × špičaté (leptokurtické)'''
 == Normální rozdělení a z-skóre ==
@@ Řádek 71: / Řádek 67: @@
 * nesymetričnost – např. u počtu hlásek ve slabice nebo slabik ve slově
 * normální rozdělení je výhodné → snaha na něj transformovat i nesymetrická:
-: - pozitivní sešikmení se opravuje logaritmem, odmocninou či inverzí
+** pozitivní sešikmení se opravuje logaritmem, odmocninou či inverzí
-: - negativní se opravuje mocninou
+** negativní se opravuje mocninou
+== Odkazy ==
+=== Reference ===
-== Reference ==
 <references />
+=== Použitá literatura ===
 * Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
 * Meloun, M. - Militký, J. (2001): Kompendium statistického zpracování dat. Praha: Academia. (vybrané části)
@@ Řádek 84: / Řádek 84: @@
 * Lamser, V. - Růžička, L. (1970): Základy statistiky pro sociology. Praha: Svoboda.
+Zpět na rozcestník: [[Statistické_metody_ve_fonetickém_výzkumu|Statistické metody ve fonetickém výzkumu]] | [[Portál:Fonetika|Fonetika]]
-Zpět na rozcestník: [[Statistické_metody_ve_fonetickém_výzkumu|Statistické metody ve fonetickém výzkumu]] | [[Portál:Fonetika|Fonetika]]
+[[Kategorie: Fonetika|*]]
+[[Kategorie: Statistika|*]]