Testy v kontingenčních tabulkách

Kontingenční tabulky využíváme při analýze vztahu dvou kategoriálních proměnných.

Typy kontingenčních tabulek

Dvoudimenzionální kontingenční tabulky

  • slouží k vyjádření závislosti dvou statistických znaků v přehledné podobě.
  • většinou se používají tabulky dvoudimenzionální, ale existují také vícerozměrné
  • rozlišujeme řádky a sloupce → v řádcích uvádíme hodnoty první proměnné, ve sloupcích hodnoty druhé proměnné.
  • sečtením hodnot ve sloupcích (či řádcích) získáme informaci o četnosti výskytu jevu.

Vícerozměrné kontingenční tabulky

  • namísto dvou znaků lze sledovat obecně libovolné množství znaků.
  • kontingenční tabulka se tvoří pomocí stejného principu.
  • lze testovat mnohem víc typů závislostí mezi jednotlivými znaky, testování je však technicky mnohem komplikovanější než u dvojrozměrné tabulky

Testy v kontingenčních tabulkách

Test dobré shody

Jeho pomocí testujeme hypotézu homogenity a nezavislosti. Porovnáváme očekávané četností v jednotlivých políčcích tabulky za předpokladu, že hodnoty obou sledovaných znaků na sobě nezávisí, a skutečných četností. Tento test ale nevypovídá nic o síle vztahu, pouze zamítá/nezamítá nulovou hypotézu o závislosti nebo homogenitě na dané hladině významnosti alfa.

a) Hypotéza homogenity

  • Statistické testy, které zjišťují homogenitu, se někdy nazývají testy dobré shody
  • Tato hypotéza předpokládá, že jeden znak bude rozložen v populacích nezávisle na druhém znaku (např. obliba sportu nebude závislá na pohlaví)

b) Hypotéza nezávislosti

  • U této hypotézy považujeme obě proměnné A a B za náhodné proměnné, které jsou na sobě vzájemně naprosto nezávislé (hodnota proměnné A neovlivňuje podmíněné rozdělení hodnoty proměnné B)
  • Např. pravorukost/levorukost nemá vliv na pohlaví, pohlaví nerozhoduje o pravorukosti/levorukosti

Cochranův test a test podle Bowkera

Testujeme homogenitu ve více závislých výběrech. Testuje se hypotéza, že všechny výběry pocházejí ze stejné populace. Vychází z McNemarova testu pro dva výběry.

Bowkerův test je zobecněním McNemarova testu. Testuje, zda se alespoň jeden pár pravděpodobností symetricky položených políček v tabulce od sebe liší. Lze použít například pro testování vedlejších účinků léku.

Kappa koeficient shody

Řeší rozdíly mezi rozdělením do kategorií u jednotlivých pozorovatelů. K = 1 při úplné shodě pozorovatelů, K = 0 při náhodné shodě. Záporných čísel může nabývat, když je shoda slabší, než očekávaná shoda při náhodné shodě obou pozorovatelů. Je navržen pro nominální klasifikace, používá se zřídka.

Analýza párových dichotomických proměnných

Sledujeme dichotomickou proměnnou dvakrát, před a po pokusu a zjišťujeme, zda došlo ke statisticky významné změně v rozdělení této proměnné (např. McNemarův test).

Stručný přehled testů v kontingenčních tabulkách dle typu veličiny

Nominální veličiny

  • poměr šancí
  • Cramerovo V
  • koeficient kontingence podle Pearsona

Ordinální veličiny

  • 2 ordinální veličiny:
    • Wilcoxonův test
    • Mann-Whitney test
    • Kendallův korelační koeficient
    • Goodman-Kruskalův koeficient
  • 1 ordinální veličina:
    • Kruskal-Wallisův test

Zdroje

Použitá literatura

  1. Hendl, J. (2006). Přehled statistických metod zpracování dat. Portál: Praha.
  2. Kontingenční tabulka. Retrieved from: http://cs.wikipedia.org/wiki/Kontingen%C4%8Dn%C3%AD_tabulka