Testy v kontingenčních tabulkách: Porovnání verzí
(Založena nová stránka s textem „'''Testy v kontingenčních tabulkách'''<big>Zvětšený text</big> Kontingenční tabulky využíváme při analýze vztahu dvou kategoriálních prom…“) |
|||
(Nejsou zobrazeny 3 mezilehlé verze od 2 dalších uživatelů.) | |||
Řádek 1: | Řádek 1: | ||
− | + | Kontingenční tabulky využíváme při analýze vztahu dvou kategoriálních [[Proměnná|proměnných]]. | |
− | + | == Typy kontingenčních tabulek == | |
− | ''' | + | '''Dvoudimenzionální kontingenční tabulky''' |
− | + | * slouží k vyjádření závislosti dvou statistických znaků v přehledné podobě. | |
+ | * většinou se používají tabulky dvoudimenzionální, ale existují také vícerozměrné | ||
+ | * rozlišujeme řádky a sloupce → v řádcích uvádíme hodnoty první proměnné, ve sloupcích hodnoty druhé proměnné. | ||
+ | * sečtením hodnot ve sloupcích (či řádcích) získáme informaci o [[Četnost|četnosti]] výskytu jevu. | ||
− | + | '''Vícerozměrné kontingenční tabulky''' | |
− | |||
− | |||
− | |||
− | |||
− | ''Vícerozměrné kontingenční tabulky'' | ||
* namísto dvou znaků lze sledovat obecně libovolné množství znaků. | * namísto dvou znaků lze sledovat obecně libovolné množství znaků. | ||
− | * kontingenční tabulka se tvoří pomocí stejného principu | + | * kontingenční tabulka se tvoří pomocí stejného principu. |
* lze testovat mnohem víc typů závislostí mezi jednotlivými znaky, testování je však technicky mnohem komplikovanější než u dvojrozměrné tabulky | * lze testovat mnohem víc typů závislostí mezi jednotlivými znaky, testování je však technicky mnohem komplikovanější než u dvojrozměrné tabulky | ||
− | + | == Testy v kontingenčních tabulkách == | |
− | + | === Test dobré shody === | |
− | Jeho pomocí testujeme hypotézu homogenity a nezavislosti. Porovnáváme očekávané četností v jednotlivých políčcích tabulky za předpokladu, že hodnoty obou sledovaných znaků na sobě nezávisí, a skutečných četností. Tento test ale nevypovídá nic o síle vztahu, pouze zamítá/nezamítá nulovou hypotézu o závislosti nebo homogenitě na dané hladině významnosti alfa. | + | Jeho pomocí testujeme '''hypotézu homogenity a nezavislosti'''. Porovnáváme očekávané četností v jednotlivých políčcích tabulky za předpokladu, že hodnoty obou sledovaných znaků na sobě nezávisí, a skutečných četností. Tento test ale nevypovídá nic o síle vztahu, pouze zamítá/nezamítá nulovou hypotézu o závislosti nebo homogenitě na dané [[Statistická významnost|hladině významnosti]] alfa. |
− | a) | + | a) '''Hypotéza homogenity''' |
− | * | + | * Statistické testy, které zjišťují homogenitu, se někdy nazývají testy dobré shody |
− | * | + | * Tato hypotéza předpokládá, že jeden znak bude rozložen v populacích nezávisle na druhém znaku (např. obliba sportu nebude závislá na pohlaví) |
− | |||
− | b) | + | b) '''Hypotéza nezávislosti''' |
− | * | + | * U této hypotézy považujeme obě proměnné A a B za náhodné proměnné, které jsou na sobě vzájemně naprosto nezávislé (hodnota proměnné A neovlivňuje podmíněné rozdělení hodnoty proměnné B) |
− | + | * Např. pravorukost/levorukost nemá vliv na pohlaví, pohlaví nerozhoduje o pravorukosti/levorukosti | |
− | |||
− | * | ||
− | + | === Cochranův test a test podle Bowkera === | |
Testujeme homogenitu ve více závislých výběrech. Testuje se hypotéza, že všechny výběry pocházejí ze stejné populace. Vychází z McNemarova testu pro dva výběry. | Testujeme homogenitu ve více závislých výběrech. Testuje se hypotéza, že všechny výběry pocházejí ze stejné populace. Vychází z McNemarova testu pro dva výběry. | ||
+ | |||
Bowkerův test je zobecněním McNemarova testu. Testuje, zda se alespoň jeden pár pravděpodobností symetricky položených políček v tabulce od sebe liší. Lze použít například pro testování vedlejších účinků léku. | Bowkerův test je zobecněním McNemarova testu. Testuje, zda se alespoň jeden pár pravděpodobností symetricky položených políček v tabulce od sebe liší. Lze použít například pro testování vedlejších účinků léku. | ||
− | + | === Kappa koeficient shody === | |
+ | |||
+ | Řeší rozdíly mezi rozdělením do kategorií u jednotlivých pozorovatelů. ''K = 1'' při úplné shodě pozorovatelů, ''K = 0'' při náhodné shodě. Záporných čísel může nabývat, když je shoda slabší, než očekávaná shoda při náhodné shodě obou pozorovatelů. Je navržen pro nominální klasifikace, používá se zřídka. | ||
+ | |||
+ | === Analýza párových dichotomických proměnných === | ||
− | + | Sledujeme dichotomickou proměnnou dvakrát, před a po pokusu a zjišťujeme, zda došlo ke statisticky významné změně v rozdělení této proměnné (např. McNemarův test). | |
− | + | == Stručný přehled testů v kontingenčních tabulkách dle typu veličiny == | |
− | + | '''Nominální veličiny''' | |
+ | * poměr šancí | ||
+ | * Cramerovo V | ||
+ | * koeficient kontingence podle Pearsona | ||
− | ''' | + | '''Ordinální veličiny''' |
+ | * 2 ordinální veličiny: | ||
+ | ** [[Wilcoxonův test]] | ||
+ | ** [[Mann-Whitney test]] | ||
+ | ** Kendallův korelační koeficient | ||
+ | ** Goodman-Kruskalův koeficient | ||
+ | * 1 ordinální veličina: | ||
+ | ** Kruskal-Wallisův test | ||
− | + | == Zdroje == | |
− | |||
− | + | === Použitá literatura === | |
− | |||
− | |||
− | + | # Hendl, J. (2006). Přehled statistických metod zpracování dat. Portál: Praha. | |
+ | # Kontingenční tabulka. Retrieved from: http://cs.wikipedia.org/wiki/Kontingen%C4%8Dn%C3%AD_tabulka | ||
− | + | [[Kategorie: Statistika|*]] | |
− |
Aktuální verze z 14. 1. 2015, 03:42
Kontingenční tabulky využíváme při analýze vztahu dvou kategoriálních proměnných.
Obsah
Typy kontingenčních tabulek
Dvoudimenzionální kontingenční tabulky
- slouží k vyjádření závislosti dvou statistických znaků v přehledné podobě.
- většinou se používají tabulky dvoudimenzionální, ale existují také vícerozměrné
- rozlišujeme řádky a sloupce → v řádcích uvádíme hodnoty první proměnné, ve sloupcích hodnoty druhé proměnné.
- sečtením hodnot ve sloupcích (či řádcích) získáme informaci o četnosti výskytu jevu.
Vícerozměrné kontingenční tabulky
- namísto dvou znaků lze sledovat obecně libovolné množství znaků.
- kontingenční tabulka se tvoří pomocí stejného principu.
- lze testovat mnohem víc typů závislostí mezi jednotlivými znaky, testování je však technicky mnohem komplikovanější než u dvojrozměrné tabulky
Testy v kontingenčních tabulkách
Test dobré shody
Jeho pomocí testujeme hypotézu homogenity a nezavislosti. Porovnáváme očekávané četností v jednotlivých políčcích tabulky za předpokladu, že hodnoty obou sledovaných znaků na sobě nezávisí, a skutečných četností. Tento test ale nevypovídá nic o síle vztahu, pouze zamítá/nezamítá nulovou hypotézu o závislosti nebo homogenitě na dané hladině významnosti alfa.
a) Hypotéza homogenity
- Statistické testy, které zjišťují homogenitu, se někdy nazývají testy dobré shody
- Tato hypotéza předpokládá, že jeden znak bude rozložen v populacích nezávisle na druhém znaku (např. obliba sportu nebude závislá na pohlaví)
b) Hypotéza nezávislosti
- U této hypotézy považujeme obě proměnné A a B za náhodné proměnné, které jsou na sobě vzájemně naprosto nezávislé (hodnota proměnné A neovlivňuje podmíněné rozdělení hodnoty proměnné B)
- Např. pravorukost/levorukost nemá vliv na pohlaví, pohlaví nerozhoduje o pravorukosti/levorukosti
Cochranův test a test podle Bowkera
Testujeme homogenitu ve více závislých výběrech. Testuje se hypotéza, že všechny výběry pocházejí ze stejné populace. Vychází z McNemarova testu pro dva výběry.
Bowkerův test je zobecněním McNemarova testu. Testuje, zda se alespoň jeden pár pravděpodobností symetricky položených políček v tabulce od sebe liší. Lze použít například pro testování vedlejších účinků léku.
Kappa koeficient shody
Řeší rozdíly mezi rozdělením do kategorií u jednotlivých pozorovatelů. K = 1 při úplné shodě pozorovatelů, K = 0 při náhodné shodě. Záporných čísel může nabývat, když je shoda slabší, než očekávaná shoda při náhodné shodě obou pozorovatelů. Je navržen pro nominální klasifikace, používá se zřídka.
Analýza párových dichotomických proměnných
Sledujeme dichotomickou proměnnou dvakrát, před a po pokusu a zjišťujeme, zda došlo ke statisticky významné změně v rozdělení této proměnné (např. McNemarův test).
Stručný přehled testů v kontingenčních tabulkách dle typu veličiny
Nominální veličiny
- poměr šancí
- Cramerovo V
- koeficient kontingence podle Pearsona
Ordinální veličiny
- 2 ordinální veličiny:
- Wilcoxonův test
- Mann-Whitney test
- Kendallův korelační koeficient
- Goodman-Kruskalův koeficient
- 1 ordinální veličina:
- Kruskal-Wallisův test
Zdroje
Použitá literatura
- Hendl, J. (2006). Přehled statistických metod zpracování dat. Portál: Praha.
- Kontingenční tabulka. Retrieved from: http://cs.wikipedia.org/wiki/Kontingen%C4%8Dn%C3%AD_tabulka