Testu Tukey je metoda, která má za cíl porovnat jednotlivé prostředky, z analýzy rozptylu několika vzorků podrobených různým ošetřením.
Test, předložený v roce 1949 John.W. Tukey, umožňuje nám rozlišit, zda jsou získané výsledky výrazně odlišné nebo ne. To je také známé jako Tukeyův upřímně významný rozdílový test (Tukeyův HSD test).
Obrázek 1. Tukeyův test nám umožňuje rozeznat, zda rozdíly ve výsledcích mezi třemi nebo více různými ošetřeními aplikovanými na tři nebo více skupin se stejnými charakteristikami mají výrazně a upřímně odlišné střední hodnoty.
V experimentech, kde jsou srovnávány tři nebo více různých ošetření aplikovaných na stejný počet vzorků, je nutné rozeznat, zda jsou výsledky výrazně odlišné nebo ne.
Experiment je považován za vyvážený, když velikost všech statistických vzorků je stejná pro každé ošetření. Pokud je velikost vzorků pro každé ošetření odlišná, je proveden nevyvážený experiment.
Někdy nestačí s analýzou rozptylu (ANOVA) vědět, zda při srovnání různých ošetření (nebo experimentů) aplikovaných na několik vzorků splňují nulovou hypotézu (Ho: „všechny ošetření jsou stejné“), nebo naopak, splňuje alternativní hypotézu (Ha: „alespoň jedno z ošetření je jiné“).
Tukeyův test není ojedinělý, existuje mnoho dalších testů pro porovnání průměrů vzorků, ale je to jeden z nejznámějších a nejpoužívanějších.
Tukey komparátor a tabulka
Při použití tohoto testu se vypočítá hodnota zvaná Tukeyův komparátor, jejíž definice je následující:
w = q √ (MSE / r)
Kde je faktor q získán z tabulky (Tukeyova tabulka), která se skládá z řad q hodnot pro různé počty ošetření nebo experimentů. Sloupce označují hodnotu faktoru q pro různé stupně volnosti. Dostupné tabulky mají obvykle relativní význam 0,05 a 0,01.
V tomto vzorci se v druhé odmocnině objeví faktor MSE (Mean Square of Error) dělený r, což znamená počet opakování. MSE je číslo, které se obvykle získá z analýzy rozptylů (ANOVA).
Když rozdíl mezi dvěma středními hodnotami přesáhne hodnotu w (Tukeyův komparátor), pak se dospěje k závěru, že se jedná o různé průměry, ale pokud je rozdíl menší než Tukeyovo číslo, jedná se o dva vzorky se statisticky identickou střední hodnotou.
Číslo w je také známé jako číslo HSD (Honestly Significant Difference).
Toto jediné srovnávací číslo lze použít, pokud je počet vzorků použitých pro test každého ošetření stejný v každém z nich.
Nevyvážené experimenty
Pokud se z nějakého důvodu velikost vzorků liší v každém ošetření, které se má porovnat, pak se výše popsaný postup mírně liší a je známý jako Tukey-Kramerův test.
Nyní se získá komparátorové číslo w pro každou dvojici ošetření i, j:
w (i, j) = q √ (½ MSE / (ri + rj))
V tomto vzorci je faktor q získán z Tukeyovy tabulky. Tento faktor q závisí na počtu ošetření a stupních volnosti chyby. r i je počet opakování v léčbě i, zatímco r j je počet opakování v léčbě j.
Příklad případu
Chovatel králíků chce provést spolehlivou statistickou studii, která mu řekne, která ze čtyř značek potravin pro výkrm králíků je nejúčinnější. Pro studii vytvořil čtyři skupiny se šesti králíčky jednoho a půl měsíce, které do té doby měly stejné podmínky krmení.
Důvodem bylo to, že ve skupinách A1 a A4 došlo k úmrtím v důsledku příčin, které nelze připsat potravě, protože jeden z králíků byl pokousán hmyzem a ve druhém případě smrt byla určitě příčinou vrozené vady. Skupiny jsou tedy nevyvážené a je nutné použít Tukey-Kramerův test.
Cvičení vyřešeno
Aby se výpočty příliš neprodloužily, bude jako řešené cvičení považován vyvážený případ experimentu. Za data se považují:
V tomto případě existují čtyři skupiny odpovídající čtyřem různým ošetřením. Zjistili jsme však, že všechny skupiny mají stejný počet dat, takže se jedná o vyvážený případ.
K provedení analýzy ANOVA byl použit nástroj, který je začleněn do tabulky Libreoffice. Ostatní tabulky, například Excel, obsahují tento nástroj pro analýzu dat. Níže je uvedena souhrnná tabulka, která vyústila po provedení analýzy rozptylu (ANOVA):
Z analýzy rozptylu máme také hodnotu P, která je například 2,24E-6, výrazně pod hladinou významnosti 0,05, což přímo vede k odmítnutí nulové hypotézy: Všechna ošetření jsou stejná.
To znamená, že mezi léčbami mají různé střední hodnoty, ale je nutné vědět, které jsou statisticky významně a čestně odlišné (HSD) pomocí Tukeyova testu.
Pro nalezení čísla wo, jak je také známo číslo HSD, musíme najít střední čtverec chyby MSE. Z analýzy ANOVA se získá, že součet čtverců ve skupinách je SS = 0,2; a počet stupňů volnosti ve skupinách je df = 16, s těmito údaji můžeme najít MSE:
MSE = SS / df = 0,2 / 16 = 0,0125
Je také nutné najít Tukeyho faktor q, pomocí tabulky. Sloupec 4, který odpovídá 4 skupinám nebo ošetřením, které mají být porovnány, a řádek 16 jsou prohledávány, protože analýza ANOVA poskytla uvnitř skupin 16 stupňů volnosti. To nás vede k hodnotě q rovné: q = 4,33, což odpovídá 0,05 významnosti nebo 95% spolehlivosti. Nakonec je nalezena hodnota pro „upřímně významný rozdíl“:
w = HSD = q √ (MSE / r) = 4,33 √ (0,0125 / 5) = 0,2165
Chcete-li vědět, které jsou skutečně různé skupiny nebo ošetření, musíte znát průměrné hodnoty každé léčby:
Je také nutné znát rozdíly mezi průměrnými hodnotami párů ošetření, které jsou uvedeny v následující tabulce:
Dospělo se k závěru, že nejlepšími ošetřeními, pokud jde o maximalizaci výsledku, jsou T1 nebo T3, které jsou ze statistického hlediska indiferentní. Při výběru mezi T1 a T3 by bylo třeba hledat další faktory mimo tu prezentovanou analýzu. Například cena, dostupnost atd.
Reference
- Cochran William a Cox Gertrude. 1974. Experimentální návrhy. Mlácení. Mexiko. Třetí dotisk. 661p.
- Snedecor, GW a Cochran, WG 1980. Statistické metody. Sedmá edice Iowa, The Iowa State University Press. 507p.
- Steel, RGD and Torrie, JH 1980. Principy a postupy statistiky: Biometrický přístup (2. vydání). McGraw-Hill, New York. 629p.
- Tukey, JW 1949. Porovnání jednotlivých prostředků v analýze rozptylu. Biometrics, 5: 99-114.
- Wikipedia. Tukeyův test. Obnoveno z: en.wikipedia.com