- Vyjádření problému v testu Mann-Whitney U
- Kvalitativní proměnné versus kvantitativní proměnné
- Normální případ
- Případ s neobvyklým trendem
- Spárované nebo nepárové vzorky
- Charakteristiky testu Mann Whitney U
- Mann - Whitney vzorec
- Kroky k provedení testu
- Příklad praktické aplikace
- - Krok 1
- - Krok 2
- Region A
- Region B
- Krok 3
- Krok 4
- Srovnávací kritéria
- Online kalkulačky pro test Mann - Whitney U
- Reference
Test Mann - Whitney U se používá pro srovnání dvou nezávislých vzorků, pokud mají málo údajů nebo pokud se neřídí normální distribucí. Tímto způsobem je považován za neparametrický test, na rozdíl od svého homologního Studentova t testu, který se používá, když je vzorek dostatečně velký a sleduje normální rozdělení.
Frank Wilcoxon to poprvé navrhl v roce 1945 pro vzorky stejných velikostí, ale o dva roky později byl rozšířen o vzorky různých velikostí Henrym Mannem a DR Whitney.
Obrázek 1. Pro porovnání nezávislých vzorků se použije Mann-Whitney U test. Zdroj: Pixabay.
Test se často používá ke kontrole, zda existuje vztah mezi kvalitativní a kvantitativní proměnnou.
Ilustrativním příkladem je odebrat soubor hypertoniků a extrahovat dvě skupiny, od nichž se zaznamenávají denní údaje o krevním tlaku po dobu jednoho měsíce.
Léčba A se aplikuje na jednu skupinu a léčba B. Na druhou krevní tlak je kvantitativní proměnná a typ léčby je kvalitativní.
Chceme vědět, zda je střední hodnota naměřených hodnot statisticky stejná nebo odlišná, abychom zjistili, zda existuje rozdíl mezi oběma léčbami. Pro získání odpovědi se použije Wilcoxonova statistika nebo Mann - Whitney U test.
Vyjádření problému v testu Mann-Whitney U
Dalším příkladem, ve kterém lze test použít, je následující:
Předpokládejme, že chcete vědět, zda se spotřeba nealkoholických nápojů ve dvou regionech země výrazně liší.
Jeden z nich se nazývá region A a druhý region B. O litrech spotřebovaných týdně se vede záznam ve dvou vzorcích: jeden z 10 lidí pro region A a jiný z 5 osob pro region B.
Data jsou následující:
-Region A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
-Region B: 12,14, 11, 30, 10
Vyvstává následující otázka:
Kvalitativní proměnné versus kvantitativní proměnné
- Kvalitativní proměnná X: Region
- Kvalitativní proměnná Y: spotřeba nealkoholických nápojů
Pokud je spotřebované množství litrů v obou regionech stejné, dojde k závěru, že neexistuje žádná závislost mezi oběma proměnnými. Způsob, jak to zjistit, je porovnat střední nebo střední trend obou regionů.
Normální případ
Pokud data sledují normální rozdělení, jsou navrženy dvě hypotézy: nulová H0 a alternativní H1 porovnáním mezi prostředky:
- H0: neexistuje žádný rozdíl mezi průměrem obou regionů.
- H1: prostředky obou regionů jsou odlišné.
Případ s neobvyklým trendem
Naopak, pokud údaje nesledují normální rozdělení nebo vzorek je prostě příliš malý na to, aby to věděl, namísto srovnání střední hodnoty by byl porovnán medián obou regionů.
- H0: není žádný rozdíl mezi střední hodnotou obou regionů.
- H1: střední hodnoty obou regionů jsou odlišné.
Pokud se střední hodnoty shodují, je splněna nulová hypotéza: neexistuje žádný vztah mezi konzumací nealkoholických nápojů a regionem.
A pokud se stane opak, alternativní hypotéza je pravdivá: existuje vztah mezi spotřebou a regionem.
V těchto případech je indikován test Mann - Whitney U.
Spárované nebo nepárové vzorky
Další důležitou otázkou při rozhodování, zda použít Mann Whitney U test, je, zda je počet dat v obou vzorcích identický, to znamená, že jsou na par.
Pokud jsou oba vzorky spárovány, použije se původní verze Wilcoxon. Pokud ne, jak je tomu v příkladu, pak se použije modifikovaný Wilcoxonův test, což je přesně Mann Whitney U test.
Charakteristiky testu Mann Whitney U
Test Mann - Whitney U je neparametrický test, který je použitelný pro vzorky, které nesledují normální distribuci nebo s malými daty. Má následující vlastnosti:
1.- Porovnejte střední hodnoty
2.- Funguje na objednaných rozsazích
3.- Je méně výkonný, což znamená, že moc je pravděpodobnost odmítnutí nulové hypotézy, když je skutečně nepravdivá.
S ohledem na tyto vlastnosti se Mann - Whitney U test použije, když:
- Data jsou nezávislá
- Nedodržují normální rozdělení
- Nulová hypotéza H0 je akceptována, pokud se střední hodnoty obou vzorků shodují: Ma = Mb
- Alternativní hypotéza H1 je akceptována, pokud se liší střední hodnoty těchto dvou vzorků: Ma ≠ Mb
Mann - Whitney vzorec
Proměnná U je statistika kontrastu použitá v Mann - Whitneyově testu a je definována takto:
To znamená, že U je nejmenší z hodnot mezi Ua a Ub, aplikovanými na každou skupinu. V našem příkladu by to bylo pro každou oblast: A nebo B.
Proměnné Ua a Ub jsou definovány a vypočteny podle následujícího vzorce:
Ua = Na Nb + Na (Na +1) / 2 - Ra
Ub = Na Nb + Nb (Nb +1) / 2 - Rb
Zde jsou hodnoty Na a Nb velikosti vzorků odpovídajících regionům A a B, a Ra a Rb jsou jejich součty pořadí, které budeme definovat níže.
Kroky k provedení testu
1.- Objednejte hodnoty obou vzorků.
2.- Ke každé hodnotě přiřaďte pořadí objednávek.
3.- Opravte existující vazby v datech (opakované hodnoty).
4.- Vypočítejte Ra = součet řad vzorku A.
5. - Najděte Rb = součet řad vzorku B.
6.- Určete hodnotu Ua a Ub podle vzorců uvedených v předchozí části.
7. - Porovnejte Ua a Ub a menší z nich je přiřazen experimentální statistice U (tj. Dat), která je porovnána s teoretickou nebo normální statistikou U.
Příklad praktické aplikace
Nyní aplikujeme výše uvedené na problém nealkoholických nápojů vzniklých dříve:
Oblast A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
Region B: 12,14, 11, 30, 10
V závislosti na tom, zda jsou prostředky obou vzorků statisticky stejné nebo různé, je nulová hypotéza přijata nebo zamítnuta: neexistuje žádný vztah mezi proměnnými Y a X, to znamená, že konzumace nealkoholických nápojů nezávisí na regionu:
H0: Ma = Mb
H1: Ma ≠ Mb
Obrázek 2. Údaje o spotřebě nealkoholických nápojů v regionech A a B. Zdroj: F. Zapata.
- Krok 1
Postupně objednáváme data společně pro dva vzorky a hodnoty seřazujeme od nejnižší po nejvyšší:
Všimněte si, že hodnota 11 se objeví dvakrát (jednou v každém vzorku). Původně má pozice nebo rozsahy 3 a 4, ale aby nedošlo k podceňování nebo podceňování jednoho nebo druhého, průměrná hodnota je vybrána jako rozmezí, tj. 3,5.
Podobně postupujeme s hodnotou 12, která se opakuje třikrát s rozsahy 5, 6 a 7.
No, hodnotě 12 je přiřazen průměrný rozsah 6 = (5 + 6 + 7) / 3. Stejně jako u hodnoty 14, která má ligaturu (objevuje se v obou vzorcích) v pozicích 8 a 9, je jí přiřazen průměrný rozsah 8,5 = (8 + 9) / 2.
- Krok 2
Dále jsou data pro region A a B znovu oddělena, ale nyní jsou jim odpovídající rozsahy přiřazeny v jiném řádku:
Region A
Region B
Rozsahy Ra a Rb jsou získány ze součtu prvků druhé řady pro každý případ nebo oblast.
Krok 3
Vypočítají se příslušné hodnoty Ua a Ub:
Ua = 10 × 5 + 10 (10 + 1) / 2 - 86 = 19
Ub = 10 × 5 + 5 (5 + 1) / 2 -34 = 31
Experimentální hodnota U = min (19, 31) = 19
Krok 4
Předpokládá se, že teoretické U následuje normální distribuci N s parametry danými výhradně velikostí vzorků:
N (na⋅nb) / 2, √)
Pro porovnání experimentálně získané proměnné U s teoretickým U je nutné provést změnu proměnné. Přejdeme z experimentální proměnné U na její standardizovanou hodnotu, která se bude jmenovat Z, abychom mohli provést srovnání s normalizovanou normální distribucí.
Změna proměnné je následující:
Z = (U - na.nb / 2) / √
Je třeba poznamenat, že pro změnu proměnné byly použity parametry teoretické distribuce pro U. Poté je nová proměnná Z, která je hybridem mezi teoretickou U a experimentální U, kontrastována se standardizovanou normální distribucí N (0,1)).
Srovnávací kritéria
Pokud Z ≤ Zα ⇒, je akceptována nulová hypotéza H0
Pokud Z> Zα ⇒ odmítne nulovou hypotézu H0
Standardizované kritické hodnoty Za závisí na požadované úrovni spolehlivosti, například pro hladinu spolehlivosti a = 0,95 = 95%, což je nejběžnější, se získá kritická hodnota Za = 1,96.
Pro zde uvedená data:
Z = (U - nb / 2) / √ = -0,73
Což je pod kritickou hodnotou 1,96.
Konečným závěrem je, že je akceptována nulová hypotéza H0:
Online kalkulačky pro test Mann - Whitney U
Existují specifické programy pro statistické výpočty, včetně SPSS a MINITAB, ale tyto programy jsou placené a jejich použití není vždy snadné. Je to proto, že poskytují tolik možností, že prakticky jejich použití je vyhrazeno odborníkům ve statistice.
Naštěstí existuje řada velmi přesných, bezplatných a snadno použitelných online programů, které vám umožní mimo jiné spustit test Mann-Whitney U.
Jedná se o tyto programy:
-Sociální vědní statistika (socscistatistics.com), která má jak Mann-Whitney U test, tak Wilcoxon test v případě vyvážených nebo spárovaných vzorků.
-AI Therapy Statistics (ai-therapy.com), která má několik obvyklých testů popisné statistiky.
-Statistic to Use (physics.csbsju.edu/stats), jeden z nejstarších, takže jeho rozhraní může vypadat datované, přestože se jedná o velmi účinný bezplatný program.
Reference
- Dietrichson. Kvantitativní metody: hodnostní test. Obnoveno z: bookdown.org
- Marín J P. SPSS Guide: Analýza a postupy v neparametrických testech. Obnoveno z: halweb.uc3m.es
- USAL MOOC. Neparametrické testy: Mann-Whitney U. Obnoveno z: youtube.com
- Wikipedia. Mann-Whitney U test. Obnoveno z: es.wikipedia.com
- XLSTAT. Centrum nápovědy. Mann - Whitney testovací kurz v Excelu. Obnoveno z: help.xlsat.com