Míry variability: Porovnání verzí
(Revert na poslední verzi neobsahující odkazy na wikisofia.cz) |
|||
Řádek 1: | Řádek 1: | ||
− | Pokud chceme charakterizovat náhodně proměnlivé údaje v určitém souboru, nestačí charakterizovat jen | + | Pokud chceme charakterizovat náhodně proměnlivé údaje v určitém souboru, nestačí charakterizovat jen střední hodnotu, ale je vhodné určit i míru, v jaké jsou jednotlivé údaje od sebe navzájem rozptýlené. To vymezují míry variability, mezi které se řadí variační rozpětí, rozptyl, směrodatná odchylka a variační koeficient. <ref name="Hendl">Hendl, J. (2006). ''Přehled statistických metod zpracování dat''. Praha: Portál.</ref> |
== Variační rozpětí (Range) == | == Variační rozpětí (Range) == | ||
− | * Variační rozpětí je definováno jako | + | * Variační rozpětí je definováno jako rozdíl mezi nejnižší a nejvyšší hodnotou daného souboru a podává informace o tom, v jaké šířce jsou dané údaje rozprostřené na příslušné škále. Označení pro variační rozpětí je R. |
− | + | '''R = Xmax - Xmin'''*<br /> | |
<sup>''*U diskrétních proměnných někteří autoři preferují pro výpočet R = (Xmax - Xmin) + 1.''</sup><br /> | <sup>''*U diskrétních proměnných někteří autoři preferují pro výpočet R = (Xmax - Xmin) + 1.''</sup><br /> | ||
Nevýhodou variačního rozpětí je velká citlivost vůči extrémním hodnotám a také nereflektování způsobu, jakým jsou údaje rozložené uvnitř souboru<ref name="Ferjencik">Ferjenčík, J. (2006). ''Základy štatistických metód v sociálnych vedách''. Košice: Univerzita Pavla Jozefa Šafárika.</ref>.<br /><br /> | Nevýhodou variačního rozpětí je velká citlivost vůči extrémním hodnotám a také nereflektování způsobu, jakým jsou údaje rozložené uvnitř souboru<ref name="Ferjencik">Ferjenčík, J. (2006). ''Základy štatistických metód v sociálnych vedách''. Košice: Univerzita Pavla Jozefa Šafárika.</ref>.<br /><br /> | ||
Modelový příklad: {1,2,3,4,5}<br /> | Modelový příklad: {1,2,3,4,5}<br /> | ||
− | + | R = 5 – 1<br /> | |
− | + | R = 4 | |
== Rozptyl == | == Rozptyl == | ||
− | Rozptyl je definován jako | + | Rozptyl je definován jako průměrná kvadratická odchylka mezi údaji souboru a jejich aritmetickým průměrem<ref name="Ferjencik" />.<br /> |
− | + | <math>s^2=\frac{\sum\left(x_i-x̄ \right)^2} {n-1}</math><br /> | |
− | + | ([[Soubor:Vzorec_rozptyl.jpg|obrázek rovnice]])<br /> | |
Podle Hendla<ref name="Hendl" /> není při větších rozsazích významný rozdíl mezi číslem ''n'' nebo ''n – 1''. Dělení číslem ''n'' se používá v případě, kdy počítáme rozptyl pro všechny prvky populace.<br /> | Podle Hendla<ref name="Hendl" /> není při větších rozsazích významný rozdíl mezi číslem ''n'' nebo ''n – 1''. Dělení číslem ''n'' se používá v případě, kdy počítáme rozptyl pro všechny prvky populace.<br /> | ||
Modelový příklad: {1,2,3,4,5}<br /><br /> | Modelový příklad: {1,2,3,4,5}<br /><br /> | ||
− | + | [[Soubor:Modelovy priklad rozptyl.jpg|bezrámu|Modelový příklad]]<br /> | |
− | |||
− | |||
− | |||
− | |||
Interpretace rozptylu může být někdy nesrozumitelná, a proto se v praxi jako nejčastější ukazovatel míry variability používá druhá odmocnina z rozptylu označovaná jako směrodatná odchylka<ref name="Ferjencik" />. | Interpretace rozptylu může být někdy nesrozumitelná, a proto se v praxi jako nejčastější ukazovatel míry variability používá druhá odmocnina z rozptylu označovaná jako směrodatná odchylka<ref name="Ferjencik" />. | ||
− | |||
== Směrodatná odchylka == | == Směrodatná odchylka == | ||
Směrodatná odchylka je '''průměrná vzdálenost mezi jednotlivými údaji a jejich aritmetickým průměrem'''. Informuje nás o tom, jak daleko jsou v průměru jednotlivé údaje rozprostřené kolem svého aritmetického průměru<ref name="Ferjencik" />. Vypočítá se jako odmocnina z rozptylu a na rozdíl od rozptylu má stejný fyzikální rozměr jako původní veličina<ref name="Zvara">Zvára, K. (2004). ''Biostatistika''. Praha: Nakladatelství Karolinum.</ref>.<br /> | Směrodatná odchylka je '''průměrná vzdálenost mezi jednotlivými údaji a jejich aritmetickým průměrem'''. Informuje nás o tom, jak daleko jsou v průměru jednotlivé údaje rozprostřené kolem svého aritmetického průměru<ref name="Ferjencik" />. Vypočítá se jako odmocnina z rozptylu a na rozdíl od rozptylu má stejný fyzikální rozměr jako původní veličina<ref name="Zvara">Zvára, K. (2004). ''Biostatistika''. Praha: Nakladatelství Karolinum.</ref>.<br /> | ||
− | + | [[Soubor:Vzorec smer.odchylka.jpg|bezrámu|Směrodatná odchylka]] | |
− | |||
− | |||
− | |||
Modelový příklad: {1,2,3,4,5}<br /><br /> | Modelový příklad: {1,2,3,4,5}<br /><br /> | ||
− | + | [[Soubor:Modelovy priklad smer.odchylka.jpg|bezrámu|Modelový příklad SO]] | |
− | |||
− | |||
− | |||
== Variační koeficient == | == Variační koeficient == | ||
− | Variační koeficient se používá v případě, kdy chceme posoudit | + | Variační koeficient se používá v případě, kdy chceme posoudit relativní velikost rozptýlenosti dat vzhledem k průměru a někdy se uvádí v procentech<ref name="Hendl" />. Slouží k porovnání variability souborů, které mají nestejné průměry<ref name="Zvara" />.<br /> |
− | + | [[Soubor:Vzorec variacni koeficient.jpg|bezrámu|Variační koeficient]] | |
− | |||
− | |||
Modelový příklad: {1,2,3,4,5}<br /><br /> | Modelový příklad: {1,2,3,4,5}<br /><br /> | ||
− | + | [[Soubor:Modelovy priklad variacni koeficient.jpg|bezrámu|Modelový příklad VK]] | |
− | + | == Zdroje == | |
− | |||
− | |||
− | == | ||
<references/> | <references/> | ||
[[Kategorie: Statistika|*]] | [[Kategorie: Statistika|*]] |
Verze z 13. 4. 2016, 15:45
Pokud chceme charakterizovat náhodně proměnlivé údaje v určitém souboru, nestačí charakterizovat jen střední hodnotu, ale je vhodné určit i míru, v jaké jsou jednotlivé údaje od sebe navzájem rozptýlené. To vymezují míry variability, mezi které se řadí variační rozpětí, rozptyl, směrodatná odchylka a variační koeficient. [1]
Variační rozpětí (Range)
- Variační rozpětí je definováno jako rozdíl mezi nejnižší a nejvyšší hodnotou daného souboru a podává informace o tom, v jaké šířce jsou dané údaje rozprostřené na příslušné škále. Označení pro variační rozpětí je R.
R = Xmax - Xmin*
*U diskrétních proměnných někteří autoři preferují pro výpočet R = (Xmax - Xmin) + 1.
Nevýhodou variačního rozpětí je velká citlivost vůči extrémním hodnotám a také nereflektování způsobu, jakým jsou údaje rozložené uvnitř souboru[2].
Modelový příklad: {1,2,3,4,5}
R = 5 – 1
R = 4
Rozptyl
Rozptyl je definován jako průměrná kvadratická odchylka mezi údaji souboru a jejich aritmetickým průměrem[2].
Nelze pochopit (MathML, alternativně SVG nebo PNG (doporučeno pro moderní prohlížeče a kompenzační pomůcky): Neplatná odpověď („Math extension cannot connect to Restbase.“) od serveru „https://en.wikipedia.org/api/rest_v1/“:): {\displaystyle s^2=\frac{\sum\left(x_i-x̄ \right)^2} {n-1}}
()
Podle Hendla[1] není při větších rozsazích významný rozdíl mezi číslem n nebo n – 1. Dělení číslem n se používá v případě, kdy počítáme rozptyl pro všechny prvky populace.
Modelový příklad: {1,2,3,4,5}
Interpretace rozptylu může být někdy nesrozumitelná, a proto se v praxi jako nejčastější ukazovatel míry variability používá druhá odmocnina z rozptylu označovaná jako směrodatná odchylka[2].
Směrodatná odchylka
Směrodatná odchylka je průměrná vzdálenost mezi jednotlivými údaji a jejich aritmetickým průměrem. Informuje nás o tom, jak daleko jsou v průměru jednotlivé údaje rozprostřené kolem svého aritmetického průměru[2]. Vypočítá se jako odmocnina z rozptylu a na rozdíl od rozptylu má stejný fyzikální rozměr jako původní veličina[3].
Modelový příklad: {1,2,3,4,5}
Variační koeficient
Variační koeficient se používá v případě, kdy chceme posoudit relativní velikost rozptýlenosti dat vzhledem k průměru a někdy se uvádí v procentech[1]. Slouží k porovnání variability souborů, které mají nestejné průměry[3].
Modelový příklad: {1,2,3,4,5}