- Důležité úvahy
- Co je to stratifikovaný odběr vzorků?
- Proces provádění stratifikovaného vzorkování
- Typy
- Proporcionální stratifikovaný odběr vzorků
- Jednotné vrstvené vzorkování
- Výhody a nevýhody
- - Výhoda
- Sbírejte klíčové funkce
- Vyšší statistická přesnost
- Menší velikost vzorku
- - Nevýhody
- Obtížné nalezení vrstev
- Složitost organizovat
- Příklad
- Tvorba vrstev
- Reference
Stratifikovaný odběr vzorků nebo rozvrstvení, je metoda, odběr vzorků, které zahrnuje rozdělování souboru do menších podskupin, známých jako vrstvy. Tyto vrstvy jsou zase vytvářeny na základě sdílených atributů nebo charakteristik členů, jako je například úroveň příjmu nebo vzdělání.
Používá se pro zvýraznění rozdílů mezi skupinami v populaci, na rozdíl od jednoduchého vzorkování, které zachází se všemi členy populace jako se stejnými pravděpodobnostmi, že budou vzorkovány.
Zdroj: needpix.com
Cílem je zlepšit přesnost vzorku snížením chyby vzorkování. Může produkovat vážený průměr s menší variabilitou než aritmetický průměr jednoduchého vzorku populace.
Stratifikace je proces fragmentace členů populace do homogenních podskupin před odběrem vzorků. Prostřednictvím vrstev je definováno rozdělení populace.
To znamená, že musí být souhrnně vyčerpávající a vzájemně se vylučovat, takže každému prvku populace musí být přidělena jediná vrstva. Poté je v každé vrstvě aplikován systematický nebo jednoduchý odběr vzorků.
Důležité úvahy
Je důležité si uvědomit, že vrstvy by neměly být umístěny vedle sebe. S překrývajícími se podskupinami budou mít někteří lidé větší šanci být vybráni jako předměty. To zcela otupuje představu stratifikovaného vzorkování jako prototypu vzorkování.
Stejně důležité je, aby výzkumný pracovník používal jednoduchý odběr vzorků v různých vrstvách.
Nejběžnější vrstvy používané ve stratifikovaném výběru vzorků jsou věk, pohlaví, socioekonomický status, náboženství, národnost a úroveň vzdělání.
Co je to stratifikovaný odběr vzorků?
Při dokončení analýzy na skupině subjektů s podobnými charakteristikami může vyšetřovatel zjistit, že velikost populace je příliš velká na dokončení šetření.
Chcete-li ušetřit čas a peníze, lze z pohledu malé skupiny obyvatel vybrat realističtější perspektivu. Tato malá skupina se nazývá velikost vzorku, což je podmnožina populace používané k reprezentaci celé populace.
Vzorek z populace lze vybrat několika způsoby, jedním z nich je stratifikovaný odběr vzorků. To zahrnuje rozdělení celkové populace do homogenních skupin nazývaných vrstvy. Poté jsou z každé vrstvy vybrány náhodné vzorky.
Proces provádění stratifikovaného vzorkování
- Rozdělte populaci na podskupiny nebo menší vrstvy podle atributů a charakteristik sdílených členy.
- Z každé vrstvy odeberte náhodný vzorek v počtu, který je úměrný velikosti vrstvy.
- Seskupte podmnožiny vrstev do náhodného vzorku.
- Proveďte analýzu.
Zvažte například výzkumného pracovníka, který chce znát počet studentů podnikání, kteří obdrželi pracovní nabídku do tří měsíců po ukončení studia v roce 2018. Brzy zjistí, že toho roku bylo téměř 200 000 absolventů obchodu.
Můžete se rozhodnout jednoduše odebrat náhodný vzorek 5 000 absolventů a provést průzkum. Ještě lepší je, že byste mohli rozdělit populaci na vrstvy a z těchto vrstev odebrat náhodný vzorek.
Za tímto účelem byste vytvořili skupiny obyvatel na základě věku, rasy, národnosti nebo profesionálního zázemí.
Z každé vrstvy by byl odebrán náhodný vzorek v poměru k velikosti vrstvy s ohledem na celkovou populaci. Tyto podmnožiny by byly seskupeny do jednoho vzorku.
Typy
Proporcionální stratifikovaný odběr vzorků
V tomto typu je velikost vzorku pro každou vrstvu úměrná velikosti populace vrstvy ve srovnání s celkovou populací. To znamená, že každá vrstva má stejnou vzorkovací frekvenci.
Když je pro definování vrstev vybrána charakteristika jednotlivců, výsledné podskupiny mají často různé velikosti.
Například chcete studovat procento mexické populace, která kouří, a vy se rozhodnete, že věk by bylo dobrým kritériem pro stratifikaci, protože se věří, že kouření se může v závislosti na věku výrazně lišit. Jsou definovány tři vrstvy:
- Do 20 let.
- Mezi 20 a 44.
- Více než 44.
Když je populace Mexika rozdělena do těchto tří vrstev, neočekává se, že tyto tři skupiny budou stejné velikosti. Skutečné údaje to ve skutečnosti potvrzují:
- Stratum 1: 42,4 milionu (41,0%).
- Stratum 2: 37,6 milionu (36,3%).
- Stratum 3: 23,5 milionu (22,7%).
Pokud se použije proporcionální stratifikovaný odběr vzorků, měl by vzorek sestávat ze vrstev, které si zachovávají stejné proporce jako populace. Pokud chcete vytvořit vzorek 1 000 jednotlivců, musí mít vzorky následující velikosti:
Je to velmi podobné shromažďování menší populace, určené relativními podíly vrstev v populaci.
Jednotné vrstvené vzorkování
U tohoto typu je všem definovaným vrstvám přiřazena stejná velikost vzorku, bez ohledu na hmotnost těchto vrstev v populaci.
Rovnoměrný stratifikovaný odběr vzorků podle předchozího příkladu by vytvořil následující vzorek pro každou vrstvu:
Tato metoda upřednostňuje vrstvy, které mají v populaci menší váhu, a uděluje jim stejnou úroveň důležitosti jako relevantnější vrstvy.
To snižuje celkovou účinnost vzorku, ale umožňuje přesnější studium jednotlivých charakteristik každé vrstvy.
V příkladu, pokud chcete učinit konkrétní prohlášení o populaci vrstvy 3 (nad 44), můžete snížit vzorkovací chyby pomocí vzorku 333 jednotek namísto vzorku 227 jednotek, jak bylo získáno z proporcionální stratifikovaný odběr vzorků.
Výhody a nevýhody
Vrstvený vzorkování funguje dobře pro populace, které mají různé atributy, ale jinak nebude efektivní, pokud nelze vytvořit podskupiny.
- Výhoda
Sbírejte klíčové funkce
Hlavní výhodou stratifikovaného vzorkování je to, že shromažďuje klíčové charakteristiky populace ve vzorku.
Podobně jako vážený průměr tato metoda vzorkování vytváří ve vzorku charakteristiky, které jsou úměrné celkové populaci.
Vyšší statistická přesnost
Rozvrstvení dává při odhadu méně chyb než jednoduchá metoda vzorkování. Čím větší je rozdíl mezi vrstvami, tím větší je přesnost.
Ve srovnání s jednoduchým vzorkováním existuje vyšší statistická přesnost. Důvodem je skutečnost, že v podskupinách je variabilita nižší ve srovnání s odchylkami, ke kterým dochází u celkové populace.
Menší velikost vzorku
Protože tato technika má vysokou statistickou přesnost, znamená to také, že vyžaduje menší velikost vzorku, což může vědcům ušetřit spoustu úsilí, peněz a času.
- Nevýhody
Tuto výzkumnou metodu bohužel nelze použít ve všech studiích. Nevýhodou metody je, že pro správné použití musí být splněno několik podmínek.
Obtížné nalezení vrstev
Hlavní nevýhodou je, že může být obtížné určit vhodné vrstvy pro studii. Kromě toho může být náročné najít úplný a konečný seznam celé populace.
Složitost organizovat
Druhou nevýhodou je, že je složitější organizovat a analyzovat výsledky ve srovnání s jednoduchým vzorkováním.
Vědci musí identifikovat každého člena studijní populace a klasifikovat ji pouze do jedné subpopulace. Výsledkem je, že stratifikovaný výběr vzorků je nevýhodný, pokud vědci nemohou s jistotou klasifikovat každého člena populace do podskupiny.
Juxtaposition může být problém, pokud existují předměty, které spadají do více podskupin. Při provádění jednoduchého vzorkování je pravděpodobnější, že budou vybrány vzorky ve více podskupinách. Výsledkem by mohla být nesprávná prezentace nebo nepřesná reflexe populace.
Příklady, jako jsou vysokoškoláci, absolventi, muži a ženy, to usnadňují, protože jsou jasně definovanými skupinami.
V jiných situacích by to však mohlo být mnohem obtížnější. Dokážete si představit začlenění charakteristik, jako je rasa, etnika nebo náboženství. Proces klasifikace by se stal obtížnějším, což by dělalo stratifikovaný odběr vzorků neúčinnou metodou.
Příklad
Předpokládejme, že výzkumný tým chce určit průměrný bodový průměr vysokoškolských studentů ve Spojených státech.
Výzkumný tým má zjevné potíže se shromažďováním těchto údajů od 21 milionů vysokoškolských studentů. Proto se rozhodnete odebrat vzorek z populace za použití pouze 4 000 studentů.
Tým zkoumá různé atributy účastníků a zázraků, pokud existuje rozdíl mezi průměrem bodů a specializací studentů.
Ve vzorku je zjištěno, že 560 studentů jsou studenti angličtiny, 1 135 vědy, 800 informatiky, 1 090 inženýrství a 415 matematiky.
Tým chce použít proporcionální stratifikovaný vzorkování, kde jsou vrstvy vzorku úměrné vzorku populace.
Tvorba vrstev
Za tímto účelem tým zkoumá statistiky vysokoškolských studentů v USA a zjistí oficiální procento studentů, kteří se specializují: 12% v angličtině, 28% ve vědě, 24% v informatice, 21% ve strojírenství a 15% v matematice.
Proto se z stratifikovaného vzorkovacího procesu vytvoří pět vrstev. Tým musí potvrdit, že vrstva populace je úměrná vrstvě vzorku. Zjistí však, že proporce nejsou stejné.
V důsledku toho musí tým přeorientovat populaci 4 000 studentů, ale tentokrát náhodně vybírat 480 (12%) studentů angličtiny, 1120 (28%) vědy, 960 (24%) počítačové vědy, 840 (21%) ve strojírenství a 600 (15%) v matematice.
Díky tomu máme poměrný stratifikovaný vzorek studentů vysokých škol, který poskytuje lepší zastoupení studentů vysokých škol v USA.
Vědci budou moci zvýraznit určitou vrstvu, sledovat různá studia amerických vysokoškolských studentů a pozorovat různé průměry bodů.
Reference
- Adam Hayes (2019). Stratifikovaný náhodný odběr vzorků. Převzato z: investopedia.com.
- Wikipedia, encyklopedie zdarma (2019). Vrstvený odběr vzorků. Převzato z: en.wikipedia.org.
- Rozložitelný (2019). Metoda stratifikovaného vzorkování. Převzato z: explorable.com.
- Průzkum Gizmo (2019). Co je to stratifikovaný vzorkování a kdy se používá? Převzato z: surveygizmo.com.
- Ashley Crossman (2019). Porozumění stratifikovaným vzorkům a jejich vytváření. Thought Co. Převzato z: thinkco.com.
- Carlos Ochoa (2017). Náhodný výběr: stratifikovaný odběr vzorků. Převzato z: netquest.com.