Testy v kontingenčních tabulkách: Porovnání verzí

m (odsazení řádku)
Řádek 1: Řádek 1:
'''<u>Testy v kontingenčních tabulkách</u>'''
+
Kontingenční tabulky využíváme při analýze vztahu dvou kategoriálních [[Proměnná|proměnných]].
  
Kontingenční tabulky využíváme při analýze vztahu dvou kategoriálních proměnných.
+
== Typy kontingenčních tabulek ==
  
'''Typy kontingenčních tabulek:'''
+
'''Dvoudimenzionální kontingenční tabulky'''
  
''Dvoudimenzionální kontingenční tabulky''
+
* slouží k vyjádření závislosti dvou statistických znaků v přehledné podobě.
 +
* většinou se používají tabulky dvoudimenzionální, ale existují také vícerozměrné
 +
* rozlišujeme řádky a sloupce → v řádcích uvádíme hodnoty první proměnné, ve sloupcích hodnoty druhé proměnné.
 +
* sečtením hodnot ve sloupcích (či řádcích) získáme informaci o [[Četnost|četnosti]] výskytu jevu.
  
* slouží k vyjádření závislosti dvou statistických znaků v přehledné podobě
+
'''Vícerozměrné kontingenční tabulky'''
*většinou se používají tabulky dvoudimenzionální, ale existují také vícerozměrné
 
* rozlišujeme řádky a sloupce v KT → v řádcích uvádíme hodnoty první proměnné, ve sloupcích hodnoty druhé proměnné
 
* sečtením hodnot ve sloupcích (či řádcích) získáme informaci o četnosti výskytu jevu
 
 
 
''Vícerozměrné kontingenční tabulky''  
 
  
 
* namísto dvou znaků lze sledovat obecně libovolné množství znaků.  
 
* namísto dvou znaků lze sledovat obecně libovolné množství znaků.  
* kontingenční tabulka se tvoří pomocí stejného principu
+
* kontingenční tabulka se tvoří pomocí stejného principu.
 
* lze testovat mnohem víc typů závislostí mezi jednotlivými znaky, testování je však technicky mnohem komplikovanější než u dvojrozměrné tabulky
 
* lze testovat mnohem víc typů závislostí mezi jednotlivými znaky, testování je však technicky mnohem komplikovanější než u dvojrozměrné tabulky
  
'''Testy v kontingenčních tabulkách:'''
+
== Testy v kontingenčních tabulkách ==
  
''Test dobré shody''
+
=== Test dobré shody ===
  
Jeho pomocí testujeme hypotézu homogenity a nezavislosti. Porovnáváme očekávané četností v jednotlivých políčcích tabulky za předpokladu, že hodnoty obou sledovaných znaků na sobě nezávisí, a skutečných četností. Tento test ale nevypovídá nic o síle vztahu, pouze zamítá/nezamítá nulovou hypotézu o závislosti nebo homogenitě na dané hladině významnosti alfa.
+
Jeho pomocí testujeme '''hypotézu homogenity a nezavislosti'''. Porovnáváme očekávané četností v jednotlivých políčcích tabulky za předpokladu, že hodnoty obou sledovaných znaků na sobě nezávisí, a skutečných četností. Tento test ale nevypovídá nic o síle vztahu, pouze zamítá/nezamítá nulovou hypotézu o závislosti nebo homogenitě na dané [[Statistická významnost|hladině významnosti]] alfa.
  
a) hypotéza homogenity
+
a) '''Hypotéza homogenity'''
* statistické testy, které zjišťují homogenitu, se někdy nazývají testy dobré shody
+
* Statistické testy, které zjišťují homogenitu, se někdy nazývají testy dobré shody
* tato hypotéza předpokládá, že jeden znak bude rozložen v populacích nezávisle na
+
* Tato hypotéza předpokládá, že jeden znak bude rozložen v populacích nezávisle na druhém znaku (např. obliba sportu nebude závislá na pohlaví)
            druhém znaku (např. obliba sportu nebude závislá na pohlaví)
 
  
b) hypotéza nezávislosti
+
b) '''Hypotéza nezávislosti'''
* u této hypotézy považujeme obě proměnné A a B za náhodné proměnné, které jsou na
+
* U této hypotézy považujeme obě proměnné A a B za náhodné proměnné, které jsou na sobě vzájemně naprosto nezávislé (hodnota proměnné A neovlivňuje podmíněné rozdělení hodnoty proměnné B)
            sobě vzájemně naprosto nezávislé (hodnota proměnné A neovlivňuje podmíněné
+
* Např. pravorukost/levorukost nemá vliv na pohlaví, pohlaví nerozhoduje o pravorukosti/levorukosti
            rozdělení hodnoty proměnné B)
 
* např. pravorukost/levorukost nemá vliv na pohlaví, pohlaví nerozhoduje o pravorukosti/levorukosti
 
  
''Cochranův test a test podle Bowkera''
+
=== Cochranův test a test podle Bowkera ===
  
 
Testujeme homogenitu ve více závislých výběrech. Testuje se hypotéza, že všechny výběry pocházejí ze stejné populace. Vychází z McNemarova testu pro dva výběry.
 
Testujeme homogenitu ve více závislých výběrech. Testuje se hypotéza, že všechny výběry pocházejí ze stejné populace. Vychází z McNemarova testu pro dva výběry.
 +
 
Bowkerův test je zobecněním McNemarova testu. Testuje, zda se alespoň jeden pár pravděpodobností symetricky položených políček v tabulce od sebe liší. Lze použít například pro testování vedlejších účinků léku.
 
Bowkerův test je zobecněním McNemarova testu. Testuje, zda se alespoň jeden pár pravděpodobností symetricky položených políček v tabulce od sebe liší. Lze použít například pro testování vedlejších účinků léku.
  
''Kappa koeficient shody''
+
=== Kappa koeficient shody ===
 +
 
 +
Řeší rozdíly mezi rozdělením do kategorií u jednotlivých pozorovatelů. ''K = 1'' při úplné shodě pozorovatelů, ''K = 0'' při náhodné shodě. Záporných čísel může nabývat, když je shoda slabší, než očekávaná shoda při náhodné shodě obou pozorovatelů. Je navržen pro nominální klasifikace, používá se zřídka.
  
Řeší rozdíly mezi rozdělením do kategorií u jednotlivých pozorovatelů. K=1 při úplné shodě pozorovatelů, K=0 při náhodné shodě. Záporných čísel může nabývat, když je shoda slabší, než očekávaná shoda při náhodné shodě obou pozorovatelů.  Je navržen pro nominální klasifikace, používá se zřídka.
+
=== Analýza párových dichotomických proměnných ===
  
''Analýza párových dichotomických proměnných''
+
Sledujeme dichotomickou proměnnou dvakrát, před a po pokusu a zjišťujeme, zda došlo ke statisticky významné změně v rozdělení této proměnné (např. McNemarův test).
  
Sledujeme dichotomickou proměnnou dvakrát, před a po pokusu a zjišťujeme, zda došlo ke statisticky významné změně v rozdělení této proměnné. (např. McNemarův test)
+
== Stručný přehled testů v kontingenčních tabulkách dle typu veličiny ==
  
'''Stručný přehled testů v kontingenčních tabulkách dle typu veličiny:'''
+
'''Nominální veličiny'''
 +
* poměr šancí
 +
* Cramerovo V
 +
* koeficient kontingence podle Pearsona
  
Nominální veličiny:  
+
'''Ordinální veličiny'''
* poměr šancí, Cramerovo V, koeficient kontingence podle Pearsona
+
* 2 ordinální veličiny:
 +
** Wilcoxonův test
 +
** Mann-Whitney test
 +
** Kendallův korelační koeficient
 +
** Goodman-Kruskalův koeficient
 +
* 1 ordinální veličina:
 +
** Kruskal-Wallisův test
  
Ordinální veličiny:
+
== Zdroje ==
* 2 ordinální veličiny: Wilcoxonův test, Mann-Whitney test, Kendallův korelační koeficient, Goodman-Kruskalův koeficient
 
* 1 ordinální veličina: Kruskal-Wallisův test
 
  
'''Zdroje'''
+
=== Použitá literatura ===
  
Hendl, J. (2006). Přehled statistických metod zpracování dat. Portál: Praha.
+
# Hendl, J. (2006). Přehled statistických metod zpracování dat. Portál: Praha.
 +
# Kontingenční tabulka. Retrieved from: http://cs.wikipedia.org/wiki/Kontingen%C4%8Dn%C3%AD_tabulka
  
Kontingenční tabulka. Retrieved from: http://cs.wikipedia.org/wiki/Kontingen%C4%8Dn%C3%AD_tabulka
+
[[Kategorie: Statistika|*]]

Verze z 14. 1. 2015, 03:33

Kontingenční tabulky využíváme při analýze vztahu dvou kategoriálních proměnných.

Typy kontingenčních tabulek

Dvoudimenzionální kontingenční tabulky

  • slouží k vyjádření závislosti dvou statistických znaků v přehledné podobě.
  • většinou se používají tabulky dvoudimenzionální, ale existují také vícerozměrné
  • rozlišujeme řádky a sloupce → v řádcích uvádíme hodnoty první proměnné, ve sloupcích hodnoty druhé proměnné.
  • sečtením hodnot ve sloupcích (či řádcích) získáme informaci o četnosti výskytu jevu.

Vícerozměrné kontingenční tabulky

  • namísto dvou znaků lze sledovat obecně libovolné množství znaků.
  • kontingenční tabulka se tvoří pomocí stejného principu.
  • lze testovat mnohem víc typů závislostí mezi jednotlivými znaky, testování je však technicky mnohem komplikovanější než u dvojrozměrné tabulky

Testy v kontingenčních tabulkách

Test dobré shody

Jeho pomocí testujeme hypotézu homogenity a nezavislosti. Porovnáváme očekávané četností v jednotlivých políčcích tabulky za předpokladu, že hodnoty obou sledovaných znaků na sobě nezávisí, a skutečných četností. Tento test ale nevypovídá nic o síle vztahu, pouze zamítá/nezamítá nulovou hypotézu o závislosti nebo homogenitě na dané hladině významnosti alfa.

a) Hypotéza homogenity

  • Statistické testy, které zjišťují homogenitu, se někdy nazývají testy dobré shody
  • Tato hypotéza předpokládá, že jeden znak bude rozložen v populacích nezávisle na druhém znaku (např. obliba sportu nebude závislá na pohlaví)

b) Hypotéza nezávislosti

  • U této hypotézy považujeme obě proměnné A a B za náhodné proměnné, které jsou na sobě vzájemně naprosto nezávislé (hodnota proměnné A neovlivňuje podmíněné rozdělení hodnoty proměnné B)
  • Např. pravorukost/levorukost nemá vliv na pohlaví, pohlaví nerozhoduje o pravorukosti/levorukosti

Cochranův test a test podle Bowkera

Testujeme homogenitu ve více závislých výběrech. Testuje se hypotéza, že všechny výběry pocházejí ze stejné populace. Vychází z McNemarova testu pro dva výběry.

Bowkerův test je zobecněním McNemarova testu. Testuje, zda se alespoň jeden pár pravděpodobností symetricky položených políček v tabulce od sebe liší. Lze použít například pro testování vedlejších účinků léku.

Kappa koeficient shody

Řeší rozdíly mezi rozdělením do kategorií u jednotlivých pozorovatelů. K = 1 při úplné shodě pozorovatelů, K = 0 při náhodné shodě. Záporných čísel může nabývat, když je shoda slabší, než očekávaná shoda při náhodné shodě obou pozorovatelů. Je navržen pro nominální klasifikace, používá se zřídka.

Analýza párových dichotomických proměnných

Sledujeme dichotomickou proměnnou dvakrát, před a po pokusu a zjišťujeme, zda došlo ke statisticky významné změně v rozdělení této proměnné (např. McNemarův test).

Stručný přehled testů v kontingenčních tabulkách dle typu veličiny

Nominální veličiny

  • poměr šancí
  • Cramerovo V
  • koeficient kontingence podle Pearsona

Ordinální veličiny

  • 2 ordinální veličiny:
    • Wilcoxonův test
    • Mann-Whitney test
    • Kendallův korelační koeficient
    • Goodman-Kruskalův koeficient
  • 1 ordinální veličina:
    • Kruskal-Wallisův test

Zdroje

Použitá literatura

  1. Hendl, J. (2006). Přehled statistických metod zpracování dat. Portál: Praha.
  2. Kontingenční tabulka. Retrieved from: http://cs.wikipedia.org/wiki/Kontingen%C4%8Dn%C3%AD_tabulka