Některé typy rozdělení: Porovnání verzí

 
(Nejsou zobrazeny 2 mezilehlé verze od 2 dalších uživatelů.)
Řádek 1: Řádek 1:
 
* 1) rozdělení vlastnosti v rámci zkoumaných souborů
 
* 1) rozdělení vlastnosti v rámci zkoumaných souborů
: - viz např. histogram – rozdělení na různé míry vlastnosti podle výskytu
+
** např. [[Histogram|histogram]] – rozdělení na různé míry vlastnosti podle výskytu
 
* 2) rozdělení pravděpodobností
 
* 2) rozdělení pravděpodobností
: - s jakou pravděpodobností bude mít např. realizace hlásky nějakou vlastnost a s jakou pravděpodobností jí buď nedosáhne, nebo překročí
+
** s jakou pravděpodobností bude mít např. realizace hlásky nějakou vlastnost a s jakou pravděpodobností jí buď nedosáhne, nebo překročí
 
 
  
 
== Binomické rozdělení ==
 
== Binomické rozdělení ==
  
 
* proměnná nabývá pouze dvou hodnot
 
* proměnná nabývá pouze dvou hodnot
 
 
* vzorec ''(p+p‘)2 = 1''
 
* vzorec ''(p+p‘)2 = 1''
: - součet pravděpodobností obou variant
+
** součet pravděpodobností obou variant
: - dejme tomu, že z osmi vzorků vyjde 6 výskytů 1. hodnoty a 2 výskyty 2. hodnoty
+
** dejme tomu, že z osmi vzorků vyjde 6 výskytů 1. hodnoty a 2 výskyty 2. hodnoty
: - jak je to pravděpodobné?
+
** jak je to pravděpodobné?
: - musíme sečíst všechny varianty rozdělení, tedy:
+
** musíme sečíst všechny varianty rozdělení, tedy:
: - ''p8 + p7p‘ + p6p‘2 + ... + pp‘7 + p‘8''
+
** ''p8 + p7p‘ + p6p‘2 + ... + pp‘7 + p‘8''
: - předpokládáme stejnou pravděpodobnost pro obě hodnoty (''p = p‘ = 0,5'')
+
** předpokládáme stejnou pravděpodobnost pro obě hodnoty (''p = p‘ = 0,5'')
: - → můžeme zjednodušit na ''p8 + p8 + ... + p8''
+
** → můžeme zjednodušit na ''p8 + p8 + ... + p8''
: - pomocí kombinací musíme zjistit binomické koeficienty (kolik kombinací o ''k'' případech jde vytvořit z množiny ''n'' prvků – ''n'' nad ''k'')
+
** pomocí kombinací musíme zjistit binomické koeficienty (kolik kombinací o ''k'' případech jde vytvořit z množiny ''n'' prvků – ''n'' nad ''k'')
: - výsledkem je koeficient 28, kterým vynásobíme původní pravděpodobnost, tedy 28 × 0,58 (← 8 vzorků)
+
** výsledkem je koeficient 28, kterým vynásobíme původní pravděpodobnost, tedy 28 × 0,58 (← 8 vzorků)
: - → pravděpodobnost, že náhodný vzorek 8 výsledků bude 6:2, je cca 11%
+
** → pravděpodobnost, že náhodný vzorek 8 výsledků bude 6:2, je cca 11%
: - jaká je pravděpodobnost, že z populace vybereme náhodně 6 případů s jednou hodnotou proměnné a 2 s druhou?
+
** jaká je pravděpodobnost, že z populace vybereme náhodně 6 případů s jednou hodnotou proměnné a 2 s druhou?
: - 2× vyšší výsledek → 22% (6:2 + 2:6)
+
** 2× vyšší výsledek → 22% (6:2 + 2:6)
: - → '''jednostranné × dvoustranné testy'''
+
** → '''jednostranné × dvoustranné testy'''
  
 
* '''znaménkový test''' – zjišťuje pravděpodobnost určitého poměru binárních hodnot
 
* '''znaménkový test''' – zjišťuje pravděpodobnost určitého poměru binárních hodnot
: - tzv. '''kumulativní pravděpodobnost''' – určitá hodnota + do extrému (tzn. pro pravděpodobnost 4:4 bude ''p'' = 1 – vždy je rovno, nebo blíže extrému)
+
** tzv. '''kumulativní pravděpodobnost''' – určitá hodnota + do extrému (tzn. pro pravděpodobnost 4:4 bude ''p'' = 1 – vždy je rovno, nebo blíže extrému)
  
  
Řádek 35: Řádek 33:
 
* používá se tam, kde se náhodné jevy mohou vyskytnout, ale stává se tak jen zřídka → = ''„rozdělení vzácných jevů“''
 
* používá se tam, kde se náhodné jevy mohou vyskytnout, ale stává se tak jen zřídka → = ''„rozdělení vzácných jevů“''
 
* průměr a rozptyl jsou zhruba stejné, = 1 (hodně drobných odchylek, ale žádná velká)
 
* průměr a rozptyl jsou zhruba stejné, = 1 (hodně drobných odchylek, ale žádná velká)
 
  
 
== Tvary rozdělení ==
 
== Tvary rozdělení ==
Řádek 44: Řádek 41:
 
* '''obdélníkové''' – všechno stejně časté
 
* '''obdélníkové''' – všechno stejně časté
 
* podle pozice vrcholu – '''pozitivně / pravostranně sešikmené''' (doprava klesá pomaleji) × '''negativně / levostranně sešikmené'''
 
* podle pozice vrcholu – '''pozitivně / pravostranně sešikmené''' (doprava klesá pomaleji) × '''negativně / levostranně sešikmené'''
: - musí se určit míra šikmosti, oblast od -1 do +1 se bere jako pořád střed
+
** musí se určit míra šikmosti, oblast od -1 do +1 se bere jako pořád střed
 
* podle špičatosti rozdělení (excesu) – '''ploché (platykurtické) × špičaté (leptokurtické)'''
 
* podle špičatosti rozdělení (excesu) – '''ploché (platykurtické) × špičaté (leptokurtické)'''
 
  
 
== Normální rozdělení a z-skóre ==
 
== Normální rozdělení a z-skóre ==
Řádek 71: Řádek 67:
 
* nesymetričnost – např. u počtu hlásek ve slabice nebo slabik ve slově
 
* nesymetričnost – např. u počtu hlásek ve slabice nebo slabik ve slově
 
* normální rozdělení je výhodné → snaha na něj transformovat i nesymetrická:
 
* normální rozdělení je výhodné → snaha na něj transformovat i nesymetrická:
: - pozitivní sešikmení se opravuje logaritmem, odmocninou či inverzí
+
** pozitivní sešikmení se opravuje logaritmem, odmocninou či inverzí
: - negativní se opravuje mocninou
+
** negativní se opravuje mocninou
  
 +
== Odkazy ==
  
 +
=== Reference ===
  
== Reference ==
 
 
<references />
 
<references />
 +
 +
=== Použitá literatura ===
 +
 
* Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
 
* Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
 
* Meloun, M. - Militký, J. (2001): Kompendium statistického zpracování dat. Praha: Academia. (vybrané části)  
 
* Meloun, M. - Militký, J. (2001): Kompendium statistického zpracování dat. Praha: Academia. (vybrané části)  
Řádek 84: Řádek 84:
 
* Lamser, V. - Růžička, L. (1970): Základy statistiky pro sociology. Praha: Svoboda.
 
* Lamser, V. - Růžička, L. (1970): Základy statistiky pro sociology. Praha: Svoboda.
  
 +
Zpět na rozcestník: [[Statistické_metody_ve_fonetickém_výzkumu|Statistické metody ve fonetickém výzkumu]] | [[Portál:Fonetika|Fonetika]]
  
Zpět na rozcestník: [[Statistické_metody_ve_fonetickém_výzkumu|Statistické metody ve fonetickém výzkumu]] | [[Portál:Fonetika|Fonetika]]
+
[[Kategorie: Fonetika|*]]
 +
[[Kategorie: Statistika|*]]

Aktuální verze z 20. 1. 2015, 00:46

  • 1) rozdělení vlastnosti v rámci zkoumaných souborů
    • např. histogram – rozdělení na různé míry vlastnosti podle výskytu
  • 2) rozdělení pravděpodobností
    • s jakou pravděpodobností bude mít např. realizace hlásky nějakou vlastnost a s jakou pravděpodobností jí buď nedosáhne, nebo překročí

Binomické rozdělení

  • proměnná nabývá pouze dvou hodnot
  • vzorec (p+p‘)2 = 1
    • součet pravděpodobností obou variant
    • dejme tomu, že z osmi vzorků vyjde 6 výskytů 1. hodnoty a 2 výskyty 2. hodnoty
    • jak je to pravděpodobné?
    • musíme sečíst všechny varianty rozdělení, tedy:
    • p8 + p7p‘ + p6p‘2 + ... + pp‘7 + p‘8
    • předpokládáme stejnou pravděpodobnost pro obě hodnoty (p = p‘ = 0,5)
    • → můžeme zjednodušit na p8 + p8 + ... + p8
    • pomocí kombinací musíme zjistit binomické koeficienty (kolik kombinací o k případech jde vytvořit z množiny n prvků – n nad k)
    • výsledkem je koeficient 28, kterým vynásobíme původní pravděpodobnost, tedy 28 × 0,58 (← 8 vzorků)
    • → pravděpodobnost, že náhodný vzorek 8 výsledků bude 6:2, je cca 11%
    • jaká je pravděpodobnost, že z populace vybereme náhodně 6 případů s jednou hodnotou proměnné a 2 s druhou?
    • 2× vyšší výsledek → 22% (6:2 + 2:6)
    • jednostranné × dvoustranné testy
  • znaménkový test – zjišťuje pravděpodobnost určitého poměru binárních hodnot
    • tzv. kumulativní pravděpodobnost – určitá hodnota + do extrému (tzn. pro pravděpodobnost 4:4 bude p = 1 – vždy je rovno, nebo blíže extrému)


Poissonovo rozdělení

  • limitní varianta binomického rozdělení
  • binomické rozdělení se Poissonovu podobá tím více, čím více se pravděpodobnost jevu p blíží k nule a počet pozorování n k nekonečnu
  • dobrá aproximace už od p ≈ 0,1 a n > 30
  • používá se tam, kde se náhodné jevy mohou vyskytnout, ale stává se tak jen zřídka → = „rozdělení vzácných jevů“
  • průměr a rozptyl jsou zhruba stejné, = 1 (hodně drobných odchylek, ale žádná velká)

Tvary rozdělení

  • rozdělení mohou mít různé tvary → pravděpodobnost zaujímá nějaký prostor
  • podle počtu vrcholů (nejčastější hodnota, takový kopečky) – unimodální × bimodální × multimodální
  • u-ové – nejčastější krajní hodnoty
  • obdélníkové – všechno stejně časté
  • podle pozice vrcholu – pozitivně / pravostranně sešikmené (doprava klesá pomaleji) × negativně / levostranně sešikmené
    • musí se určit míra šikmosti, oblast od -1 do +1 se bere jako pořád střed
  • podle špičatosti rozdělení (excesu) – ploché (platykurtické) × špičaté (leptokurtické)

Normální rozdělení a z-skóre

  • = Gaussovo
  • unimodální a symetrické
  • sešikmení a špičatost = 0
  • na obou stranách se limitně blíží nule
  • určeno dvěma veličinami – aritmetickým průměrem (μ) a směrodatnou odchylkou (σ)
  • do prostoru se vejde 68,26% případů, do 95,44% a do 99,74%
  • je to spojité rozdělení → normalizované z-skóre
  • všechna normální rozdělení si jsou podobná → je možné převést na normalizovaná
  • → můžeme srovnávat různé jednotky a řády
  • od každé naměřené hodnoty x se odečte aritmetický průměr a vydělí se směrodatnou odchylkou s
  • normalizované normální rozdělení má = 0 a s = 1
  • nelineární – např. u výsledků 0,3 + 0,7 a 1,3 + 1,7 zůstává stejné, o kolik od sebe jsou, ale poměry jsou jiné
  • 95% případů se vejde do intervalu ± 1,96
  • konvertované skóre – z-skóre konvertované do jiné stupnice (→ odstranění desetinných míst a záporných čísel)
  • ke všem hodnotám přičteme stejnou konstantu či je vynásobíme – jen se to posune či roztáhne pole
  • rozdělení může být deformováno podlahovým či stropovým efektem – všichni jsou lepší / horší než hranice měřené oblasti
  • nesymetričnost – např. u počtu hlásek ve slabice nebo slabik ve slově
  • normální rozdělení je výhodné → snaha na něj transformovat i nesymetrická:
    • pozitivní sešikmení se opravuje logaritmem, odmocninou či inverzí
    • negativní se opravuje mocninou

Odkazy

Reference


Použitá literatura

  • Volín, J. (2007): Statistické metody ve fonetickém výzkumu. Praha: Epocha.
  • Meloun, M. - Militký, J. (2001): Kompendium statistického zpracování dat. Praha: Academia. (vybrané části)
  • Robson, C. (1973): Experiment, design and statistics in psychology. Harmondsworth: Penguin Books Ltd.
  • Urdan, T. C. (2001): Statistics in plain English. London: Lawrence Erlbaum Associates.
  • Lamser, V. - Růžička, L. (1970): Základy statistiky pro sociology. Praha: Svoboda.

Zpět na rozcestník: Statistické metody ve fonetickém výzkumu | Fonetika