Základy deskriptivní statistiky

Deskriptivní statistika (nebo též statistika popisná) nám slouží k tomu, abychom se vyznali v datech. Často se totiž stává, že hodnoty, které jsme nasbírali, mají vysokou komplexitu a je tak těžké o datech mluvit. Deskriptivní statistika nám pomáhá tuto komplexitu značně zjednodušit, abychom byli schopní o nasbíraných datech přemýšlet. Je nutné si přitom ale vždy uvědomit, že jakákoli popisná statistika má své specifické způsoby, jak toto zjednodušení provádí, a tak se každá hodí pro jiné situace a účely.

Základní dělení deskriptivní statistiky zahrnuje tři velká témata^[1] :

Metody popisování polohy - zahrnuje pojmy jako modus, medián, průměr, které popisují, kde se zhruba hodnoty nacházejí.
Metody popisování rozptylu - zahrnuje pojmy jako rozptyl, směrodatná odchylka, průměrná odchylka, které popisují disperzi hodnot (jak moc se od sebe hodnoty liší).
Metody popisování tvaru - zahrnuje pojmy jako šikmost, špičatost, tedy jaký má distribuce hodnot tvar.

Jednotlivé míry polohy,rozptylu a tvaru mají pak určitý vztah k typům proměnných (to ovšem neplatí absolutně!) a různým specifikám popisovaných dat. Obvykle potřebujeme více statistických indikátorů k dobrému popsání dané proměnné.

Důležitou součástí popisování statistického souboru je zobrazování dat v grafech. Díky vizualizacím toho dokážeme o nasbíraných hodnotách kolikrát říci více, než několika odstavci textů.

↑ HENDL, J. Přehled statistických metod: Analýza a metaanalýza dat. 4. vydání Praha: Portál, 2012, 736 s. ISBN 978-80-262-0200-4.

[Hendl-1] HENDL, J. Přehled statistických metod: Analýza a metaanalýza dat. 4. vydání Praha: Portál, 2012, 736 s. ISBN 978-80-262-0200-4.

[1]