Míry polohy: Porovnání verzí
(Revert na poslední verzi neobsahující odkazy na wikisofia.cz) |
|||
Řádek 3: | Řádek 3: | ||
=== Aritmetický průměr === | === Aritmetický průměr === | ||
(''The Arithmetic Mean'', AVG – average) je statistická veličina, kterou vypočtěme jako součet všech naměřených údajů vydělený jejich počtem.<br /> | (''The Arithmetic Mean'', AVG – average) je statistická veličina, kterou vypočtěme jako součet všech naměřených údajů vydělený jejich počtem.<br /> | ||
− | Vzorec: <br /> | + | Vzorec: <br /><br /> |
− | < | + | <math>x̄ =\frac{1}{n}(x_1+x_2+...+x_n)=\frac{1}{n}\sum_{i=1}^{n} x_i</math><br /><br /> |
− | |||
* ''Vlastnosti'' - součet odchylek od měření od průměru se rovná nule; fyzikálně si aritmetický průměr představujeme jako těžiště dat. | * ''Vlastnosti'' - součet odchylek od měření od průměru se rovná nule; fyzikálně si aritmetický průměr představujeme jako těžiště dat. | ||
* ''Výhody'' - je použitelný při odvozování dalších důležitých vztahů, jeho hodnota závisí na všech prvcích souboru dat. | * ''Výhody'' - je použitelný při odvozování dalších důležitých vztahů, jeho hodnota závisí na všech prvcích souboru dat. | ||
Řádek 11: | Řádek 10: | ||
* ''Použití'' – jestliže jsou jsou data získaná minimálně v intervalovém měřítku, pokud je rozdělení symetrické nebo pokud chceme použít statistické testy. | * ''Použití'' – jestliže jsou jsou data získaná minimálně v intervalovém měřítku, pokud je rozdělení symetrické nebo pokud chceme použít statistické testy. | ||
'''Vážený průměr''' je celkový průměr ze všech dat, který vypočteme z jednotlivých průměrů podmnožin dat. Pro jeho výpočet použijeme vzorec: | '''Vážený průměr''' je celkový průměr ze všech dat, který vypočteme z jednotlivých průměrů podmnožin dat. Pro jeho výpočet použijeme vzorec: | ||
− | + | [[File:Vážený průměr.png|150px]]<br /> | |
− | |||
− | |||
Někdy se místo s aritmetickým průměrem počítá s geometrickým průměrem, jehož vzorec je následující:<br /> | Někdy se místo s aritmetickým průměrem počítá s geometrickým průměrem, jehož vzorec je následující:<br /> | ||
− | + | [[File:Geometrický průměr.png|350px]] | |
− | |||
=== Medián === | === Medián === | ||
Dalším způsobem jak kvantifikovat střed rozdělení naměřených hodnot je skrze sledování prostřední hodnoty skórů v momentě, kdy jsou hodnoty skórů seřazeny. Jinými slovy se jedná o hodnotu, jež dělí řadu podle velikosti seřazených výsledků na ''dvě stejně početné'' poloviny.<br /> | Dalším způsobem jak kvantifikovat střed rozdělení naměřených hodnot je skrze sledování prostřední hodnoty skórů v momentě, kdy jsou hodnoty skórů seřazeny. Jinými slovy se jedná o hodnotu, jež dělí řadu podle velikosti seřazených výsledků na ''dvě stejně početné'' poloviny.<br /> | ||
− | * Je-li hledané číslo n ''sudé'', vypočítáme medián jako ( | + | * Je-li hledané číslo n ''sudé'', vypočítáme medián jako (xn/2, xn/2 +1 ): |
− | ** ''' | + | ** '''Me=0,5(xn/2 + xn/2 +1)'''. |
* Je-li hledané číslo ''liché'', vypočítáme medián jako: | * Je-li hledané číslo ''liché'', vypočítáme medián jako: | ||
− | ** ''' | + | ** '''Me= x(n+1/2)''' |
Na rozdíl od aritmetického průměru je medián málo citlivý k odlehlým hodnotám. Medián minimalizuje součet absolutních odchylek měření od zvoleného čísla, zatímco aritmetický průměr minimalizuje součet kvadratických odchylek.<br /> | Na rozdíl od aritmetického průměru je medián málo citlivý k odlehlým hodnotám. Medián minimalizuje součet absolutních odchylek měření od zvoleného čísla, zatímco aritmetický průměr minimalizuje součet kvadratických odchylek.<br /> | ||
Kdy použít medián: | Kdy použít medián: | ||
Řádek 30: | Řádek 26: | ||
* Obsahují-li data odlehlé hodnoty | * Obsahují-li data odlehlé hodnoty | ||
* Rozdělení dat je silně zešikmené | * Rozdělení dat je silně zešikmené | ||
− | |||
=== Modus === | === Modus === | ||
Nazývaná jako modální hodnota ukazuje hodnotu, která se v datech vyskytuje ''nejčastěji''. Používá se nejvíce u kategoriálních dat a označuje se jako Mo. Pro výpočet modusu si seřadíme data vzestupně, spočteme, kolikrát se každý skór objevuje a skór, který se objevuje nejčastěji je modus.<br /> | Nazývaná jako modální hodnota ukazuje hodnotu, která se v datech vyskytuje ''nejčastěji''. Používá se nejvíce u kategoriálních dat a označuje se jako Mo. Pro výpočet modusu si seřadíme data vzestupně, spočteme, kolikrát se každý skór objevuje a skór, který se objevuje nejčastěji je modus.<br /> | ||
Řádek 40: | Řádek 35: | ||
== Reference == | == Reference == | ||
<references /> | <references /> | ||
− | # | + | # FIELD, Andy. Discovering Statistics Using IBM SPSS Statistics. 4. ed. London: Sage Publications Ltd, 2012, 856 s. ISBN: 14-462-4917-4. |
− | # | + | # HENDL, Jan. Přehled statistických metod zpracování dat: analýza a metaanalýza dat. 1. vyd. Praha: Portál, 2004, 583 s. ISBN: 80-717-8820-1. |
− | # | + | # CHRÁSKA., MIROSLAV. Metody pedagogického výzkumu. Základy kvantitativního výzkumu. 1.vyd. Praha: Grada Publishing a.s., 2007, 272 s. ISBN: 978-80-247-1369-4. |
[[Kategorie: Statistika|*]] | [[Kategorie: Statistika|*]] |
Verze z 13. 4. 2016, 15:45
Míry centrální tendence
Popisná statistika zachycuje různé charakteristiky dat. Pro tyto účely je využíváno výpočtu různých číselných charakteristik – popisné statistiky – které vypovídají o různých aspektech dat. Míry centrální tendence (známe také jako míry střední hodnoty, míry polohy) zachycují typickou hodnotu dat. Určují, kde na číselné ose je vzorek rozložen. Mezi nejznámější patří aritmetický průměr, medián a modus.
Aritmetický průměr
(The Arithmetic Mean, AVG – average) je statistická veličina, kterou vypočtěme jako součet všech naměřených údajů vydělený jejich počtem.
Vzorec:
Nelze pochopit (MathML, alternativně SVG nebo PNG (doporučeno pro moderní prohlížeče a kompenzační pomůcky): Neplatná odpověď („Math extension cannot connect to Restbase.“) od serveru „https://en.wikipedia.org/api/rest_v1/“:): {\displaystyle x̄ =\frac{1}{n}(x_1+x_2+...+x_n)=\frac{1}{n}\sum_{i=1}^{n} x_i}
- Vlastnosti - součet odchylek od měření od průměru se rovná nule; fyzikálně si aritmetický průměr představujeme jako těžiště dat.
- Výhody - je použitelný při odvozování dalších důležitých vztahů, jeho hodnota závisí na všech prvcích souboru dat.
- Nevýhody – je značně citlivý k extrémním hodnotám (značně se odchylující).
- Použití – jestliže jsou jsou data získaná minimálně v intervalovém měřítku, pokud je rozdělení symetrické nebo pokud chceme použít statistické testy.
Vážený průměr je celkový průměr ze všech dat, který vypočteme z jednotlivých průměrů podmnožin dat. Pro jeho výpočet použijeme vzorec:
Někdy se místo s aritmetickým průměrem počítá s geometrickým průměrem, jehož vzorec je následující:
Medián
Dalším způsobem jak kvantifikovat střed rozdělení naměřených hodnot je skrze sledování prostřední hodnoty skórů v momentě, kdy jsou hodnoty skórů seřazeny. Jinými slovy se jedná o hodnotu, jež dělí řadu podle velikosti seřazených výsledků na dvě stejně početné poloviny.
- Je-li hledané číslo n sudé, vypočítáme medián jako (xn/2, xn/2 +1 ):
- Me=0,5(xn/2 + xn/2 +1).
- Je-li hledané číslo liché, vypočítáme medián jako:
- Me= x(n+1/2)
Na rozdíl od aritmetického průměru je medián málo citlivý k odlehlým hodnotám. Medián minimalizuje součet absolutních odchylek měření od zvoleného čísla, zatímco aritmetický průměr minimalizuje součet kvadratických odchylek.
Kdy použít medián:
- Data alespoň v ordinálním měřítku
- Když chceme znát střed rozdělení dat
- Obsahují-li data odlehlé hodnoty
- Rozdělení dat je silně zešikmené
Modus
Nazývaná jako modální hodnota ukazuje hodnotu, která se v datech vyskytuje nejčastěji. Používá se nejvíce u kategoriálních dat a označuje se jako Mo. Pro výpočet modusu si seřadíme data vzestupně, spočteme, kolikrát se každý skór objevuje a skór, který se objevuje nejčastěji je modus.
U spojitých dat vypočítáme modus odečtením pomocí sestrojení histogramu jako průměr krajních hodnot intervalu, který obsahuje nejvíce dat. V datech se může objevit více modusů. Je li více vrcholů v histogramu, uvádíme všechny a udáváme, že se jedná o rozdělení dvou-, tří- nebo více vrcholové.
Kdy použít modus:
- Rozdělení s více vrcholy
- Zisk jen základního přehledu o rozdělení
- Jestli-že se slovem průměrně míní nejčastější hodnota
Reference
- FIELD, Andy. Discovering Statistics Using IBM SPSS Statistics. 4. ed. London: Sage Publications Ltd, 2012, 856 s. ISBN: 14-462-4917-4.
- HENDL, Jan. Přehled statistických metod zpracování dat: analýza a metaanalýza dat. 1. vyd. Praha: Portál, 2004, 583 s. ISBN: 80-717-8820-1.
- CHRÁSKA., MIROSLAV. Metody pedagogického výzkumu. Základy kvantitativního výzkumu. 1.vyd. Praha: Grada Publishing a.s., 2007, 272 s. ISBN: 978-80-247-1369-4.