- Kroky pro vzorkování podle kvót
- Krok 1
- Krok 2
- Krok 3
- Krok 4
- Krok 5
- Praktický případ
- Kvóta na vrstvu
- Použitelnost, výhody a nevýhody
- Výhoda
- Nevýhody
- Jednoduchý příklad aplikace
- Stanovení kvót podle věku
- Stanovení kvót podle věku a pohlaví
- Aplikace průzkumů a studium výsledků
- Rozdíl se stratifikovaným náhodným vzorkováním
- Navrhované cvičení
- Reference
Vzorkování kvóta je non - pravděpodobnostní způsob pořizování dat z ukázkové vrstev přidělování kvót. Kvóty musí být úměrné frakci, kterou tato vrstva představuje vzhledem k celkové populaci, a součet kvót musí být roven velikosti vzorku.
Vědec je ten, kdo rozhodne, které skupiny nebo vrstvy budou, například může rozdělit populaci na muže a ženy. Dalším příkladem vrstev jsou věkové rozmezí, například od 18 do 25, od 26 do 40 a od 40 let, které lze takto označit: mladí, staří a staří.
Obrázek 1. Vzorkovací kvóty jsou členěny podle rozdílů v celkové populaci. Zdroj: Pixabay.
Je velmi vhodné předem vědět, jaké procento celkové populace představuje každou vrstvu. Poté je vybrána statisticky významná velikost vzorku a poměrné kvóty jsou přiřazeny k procentu každé vrstvy s ohledem na celkovou populaci. Součet kvót na vrstvu se musí rovnat celkové velikosti vzorku.
Nakonec se vezmou data kvót přidělených každé vrstvě a vyberou se první prvky, které doplňují kvótu.
Právě tento náhodný způsob výběru prvků je považován za nepravděpodobný.
Kroky pro vzorkování podle kvót
Krok 1
Rozdělte celkovou populaci do vrstev nebo skupin s nějakou společnou charakteristikou. O této charakteristice bude dříve rozhodovat statistický výzkumný pracovník provádějící studii.
Krok 2
Určete, jaké procento celkové populace představuje každou ze vrstev nebo skupin vybraných v předchozím kroku.
Krok 3
Odhadněte statisticky významnou velikost vzorku podle kritérií a metodik statistické vědy.
Krok 4
Vypočítejte počet prvků nebo kvót pro každou vrstvu tak, aby byly úměrné procentuálnímu podílu, který každá z nich představuje vzhledem k celkové populaci a celkové velikosti vzorku.
Krok 5
Vezměte data prvků v každé vrstvě, dokud nedokončíte kvótu odpovídající každé vrstvě.
Praktický případ
Předpokládejme, že chcete znát úroveň spokojenosti se službou metra ve městě. Předchozí studie o populaci 2 000 lidí prokázaly, že 50% uživatelů jsou mladí lidé ve věku 16 až 21 let, 40% jsou dospělí ve věku 21 až 55 let a pouze 10% uživatelů je starších 55 let.
S využitím výsledků této studie je členěna nebo stratifikována podle věku uživatelů:
-Mladí lidé: 50%
- Dospělí: 40%
- Starší: 10%
Vzhledem k omezenému rozpočtu je třeba tuto studii použít na malý, ale statisticky významný vzorek. Je vybrána velikost vzorku 200, tj. Průzkum úrovně spokojenosti bude použit celkem na 200 lidí.
Nyní zbývá určit kvótu nebo počet průzkumů pro každý segment nebo vrstvu, která musí být úměrná velikosti vzorku a procentuálním podílům na vrstvě.
Kvóta na vrstvu
Kvóta pro počet průzkumů na vrstvu je následující:
Mládež: 200 * 50% = 200 * (50/100) = 100 průzkumů
Dospělí: 200 * 40% = 200 * (40/100) = 80 průzkumů
Senioři: 200 * 10% = 200 * (10/100) = 20 průzkumů
Obrázek 2. Kvóty ve vzorku 200 jedinců podle věkové vrstvy. Zdroj: F. Zapata.
Pamatujte, že součet poplatků se musí rovnat velikosti vzorku, tj. Celkovému počtu průzkumů, které budou použity. Poté jsou průzkumy předávány, dokud nejsou splněny kvóty pro každou vrstvu.
Je důležité poznamenat, že tato metoda je mnohem lepší než vzít všechny průzkumy a předat je prvním 200 lidem, kteří se objeví, protože podle předchozích údajů je velmi pravděpodobné, že menšinová vrstva bude ze studie vynechána.
Použitelnost, výhody a nevýhody
Aby byla metoda použitelná, je pro vytvoření vrstev vyžadováno kritérium, které závisí na cíli studie.
Vzorkování kvót je vhodné, chcete-li znát preference, rozdíly nebo charakteristiky podle sektorů pro směrování konkrétních kampaní podle vrstvy nebo segmentu.
Jeho použití je také užitečné, když je z nějakého důvodu zajímavé znát charakteristiky nebo zájmy menšinových sektorů, nebo když je nechtějí opustit studii.
Aby bylo možné použít, musí být známa hmotnost nebo význam každé vrstvy s ohledem na celkovou populaci. Je velmi důležité, aby tyto znalosti byly spolehlivé, jinak budou získány chybné výsledky.
Výhoda
-Snižte dobu studia, protože poplatky za vrstvu jsou obvykle malé
-Zjednodušuje analýzu dat.
-Minimalizuje náklady, protože studie je aplikována na malé, ale dobře reprezentativní vzorky celkové populace.
Nevýhody
- Protože jsou vrstvy definovány a priori, je možné, že některá odvětví populace budou ze studie vynechána.
- Zřízením omezeného počtu vrstev je možné, že ve studii dojde ke ztrátě detailů.
-Při vyloučení nebo začlenění určité vrstvy jako součásti jiné mohou být ve studii vyvodeny nesprávné závěry.
- Znemožňuje odhadnout maximální chybu vzorkování.
Jednoduchý příklad aplikace
Chceme provést statistickou studii o úrovni úzkosti v populaci 2000 lidí.
Vědec, který řídí výzkum, si uvědomuje, že rozdíly ve výsledcích musí být nalezeny v závislosti na věku a pohlaví. Z tohoto důvodu se rozhodne vytvořit tři věkové vrstvy označené: First_Age, Second_Age a Third_Age. Pokud jde o pohlavní segment, jsou definovány dva obvyklé typy: muž a žena.
First_Age je definován, jeden mezi 18 a 25 lety, Second_Age ten mezi 26 a 50 lety a konečně Third_Age ten mezi 50 a 80 lety.
Při analýze údajů o celkové populaci je nutné:
45% populace patří do First_Age.
40% je v Second_Age.
A konečně, pouze 15% studované populace patří do třetího věku.
Použitím vhodné metodiky, která zde není podrobně popsána, je vzorek 300 lidí určen jako statisticky významný.
Stanovení kvót podle věku
Dalším krokem pak bude nalezení odpovídajících kvót pro segment Věk, což se provede následovně:
First_Age: 300 * 45% = 300 * 45/100 = 135
Second_Age: 300 * 40% = 300 * 40/100 = 120
Třetí věk: 300 * 15% = 300 * 15/100 = 45
Je ověřeno, že součet kvót udává celkovou velikost vzorku.
Stanovení kvót podle věku a pohlaví
Dosud nebyl zohledněn pohlavní segment populace, pro tento segment již byly definovány dvě vrstvy: žena a muž. Znovu musíme analyzovat údaje o celkové populaci, které poskytují následující informace:
- 60% celkové populace jsou ženy.
- Mezitím 40% populace, která má být studována, patří muži.
Je důležité si uvědomit, že předchozí procenta týkající se rozdělení populace podle pohlaví nezohledňují věk.
Vzhledem k tomu, že nejsou k dispozici žádné další informace, předpokládá se, že tyto podíly pohlaví jsou rovnoměrně rozloženy ve 3 věkových vrstvách, které byly pro tuto studii definovány. S těmito úvahami nyní přistupujeme ke stanovení kvót podle věku a pohlaví, což znamená, že nyní bude existovat 6 dílčích vrstev:
S1 = First_Age and Female: 135 * 60% = 135 * 60/100 = 81
S2 = First_Age a Male: 135 * 40% = 135 * 40/100 = 54
S3 = Second_Age and Female: 120 * 60% = 120 * 60/100 = 72
S4 = Second_Age a Male: 120 * 40% = 120 * 40/100 = 48
S5 = třetí věk a žena: 45 x 60% = 45 * 60/100 = 27
S6 = Third_Age a Male: 45 * 40% = 45 * 40/100 = 18
Aplikace průzkumů a studium výsledků
Jakmile je stanoveno šest (6) segmentů a jejich odpovídající kvóty, je připraveno 300 průzkumů, které budou použity podle již vypočtených kvót.
Průzkumy budou použity následovně, bude provedeno 81 průzkumů a bude dotazováno prvních 81 lidí, kteří jsou v segmentu S1. Pak se to provede stejným způsobem se zbývajícími pěti segmenty.
Sled studia je následující:
- Analyzovat výsledky průzkumu, které jsou poté diskutovány, analyzovat výsledky podle segmentu.
- Proveďte srovnání výsledků podle segmentu.
- Konečně vyvinout hypotézy, které vysvětlují příčiny těchto výsledků.
Rozdíl se stratifikovaným náhodným vzorkováním
V našem příkladu, ve kterém uplatňujeme vzorkování kvót, je nejprve třeba stanovit kvóty a poté provést studii. Tyto kvóty samozřejmě nejsou nijak rozmarné, protože byly založeny na předchozích statistických informacích o celkové populaci.
Pokud nemáte předchozí informace o studované populaci, je lepší obrátit postup, tj. Nejprve definovat velikost vzorku a poté, co byla velikost vzorku stanovena, pokračujte v průzkumu v náhodně.
Jedním ze způsobů, jak zajistit náhodnost, by bylo použití generátoru náhodných čísel a průzkumu zaměstnanců, jejichž počet zaměstnanců odpovídá číslu náhodného generátoru.
Jakmile jsou data k dispozici, a protože cílem studie je zjistit úrovně úzkosti podle věkových a pohlavních vrstev, jsou data rozdělena podle šesti kategorií, které jsme dříve definovali. Ale bez stanovení předchozího poplatku.
Z tohoto důvodu se stratifikovaná metoda náhodného vzorkování považuje za pravděpodobnostní metodu. Zatímco odběr vzorků podle dříve stanovených kvót tomu tak není.
Pokud jsou však kvóty stanoveny s informacemi založenými na statistikách populace, lze metodu vzorkování kvót považovat za přibližně pravděpodobnou.
Navrhované cvičení
Navrhuje se následující cvičení:
Na střední škole chcete provést průzkum preferencí mezi studiem vědy nebo studiem humanitních oborů.
Předpokládejme, že škola má podle roku studia celkem 1000 studentů rozdělených do pěti úrovní. Je známo, že v prvním roce je 350 studentů, 300 ve druhém, 200 ve třetím, 100 ve čtvrtém a konečně 50 v pátém ročníku. Je také známo, že 55% studentů školy jsou chlapci a 45% dívky.
Určete vrstvy a kvóty podle vrstvy, abyste věděli, kolik průzkumů se má použít podle roku studia a podle pohlaví. Předpokládejme dále, že vzorek bude 10% z celkové populace studentů.
Reference
- Berenson, M. 1985. Statistika pro management a ekonomiku, koncepty a aplikace. Redakční Interamericana.
- Statistika. Odběr vzorků kvót. Obnoveno z: encyclopediaeconomica.com.
- Statistika. Vzorkování. Obnoveno z: Estadistica.mat.uson.mx.
- Rozložitelný. Odběr vzorků kvót. Obnoveno z: explorable.com.
- Moore, D. 2005. Aplikované základní statistiky. 2. Edice.
- Netquest. Pravděpodobnostní odběr: stratifikovaný odběr. Obnoveno z: netquest.com.
- Wikipedia. Statistické vzorkování. Obnoveno z: en.wikipedia.org