- Vzorce a rovnice
- Důležité statistické proměnné
- Model a vlastnosti
- Hlavní vlastnosti hypergeometrického rozdělení
- Aproximace pomocí binomického rozdělení
- Příklad 2
- Řešená cvičení
- Cvičení 1
- Řešení
- Cvičení 2
- Řešení
- Cvičení 3
- Řešení
- Řešení c
- Reference
Hypergeometrické rozdělení je diskrétní statistické funkce, vhodné pro výpočet pravděpodobnosti v randomizovaných experimentů se dvěma možnými výsledky. Podmínkou pro její uplatnění je to, že se jedná o malé populace, ve kterých se výběry nenahrazují a pravděpodobnosti nejsou konstantní.
Pokud je tedy některý prvek populace zvolen tak, aby znal výsledek (pravdivý nebo nepravdivý) určité vlastnosti, nelze tentýž prvek znovu vybrat.
Obrázek 1. V populaci šroubů jsou tyto vzorky jistě vadné. Zdroj: Pixabay.
Určitě je tedy pravděpodobné, že další vybraný prvek získá skutečný výsledek, pokud předchozí prvek měl negativní výsledek. To znamená, že pravděpodobnost se mění, jak jsou prvky extrahovány ze vzorku.
Hlavní aplikace hypergeometrického rozdělení jsou: kontrola kvality v procesech s malou populací a výpočet pravděpodobnosti v hazardních hrách.
Pokud jde o matematickou funkci, která definuje hypergeometrické rozdělení, skládá se ze tří parametrů, které jsou:
- Počet prvků populace (N)
- Velikost vzorku (m)
- Počet událostí v celé populaci s příznivým (nebo nepříznivým) výsledkem studované charakteristiky (n).
Vzorce a rovnice
Vzorec pro hypergeometrické rozdělení udává pravděpodobnost P, že nastanou x příznivé případy určité charakteristiky. Matematický způsob zápisu na základě kombinatorických čísel je:
V předchozím výrazu N, n a ma jsou parametry a x je samotná proměnná.
- Celkový počet obyvatel je N.
- Počet pozitivních výsledků určité binární charakteristiky s ohledem na celkovou populaci je n.
- Množství prvků ve vzorku je m.
V tomto případě je X náhodná proměnná, která bere hodnotu x a P (x) označuje pravděpodobnost výskytu x příznivých případů studované charakteristiky.
Důležité statistické proměnné
Další statistické proměnné pro hypergeometrické rozdělení jsou:
- průměrný μ = m * n / N
- Varianta σ ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1)
- směrodatná odchylka σ, která je druhou odmocninou rozptylu.
Model a vlastnosti
Abychom dospěli k modelu hypergeometrického rozdělení, vycházíme z pravděpodobnosti získání x příznivých případů ve vzorku o velikosti m. Tento vzorek obsahuje prvky, které vyhovují studované vlastnosti, a prvky, které tomu tak není.
Připomeňme, že n představuje počet příznivých případů v celkové populaci prvků N. Pravděpodobnost by se pak vypočítala takto:
Vyjádřením výše uvedeného ve formě kombinatorických čísel je dosaženo následujícího modelu distribuce pravděpodobnosti:
Hlavní vlastnosti hypergeometrického rozdělení
Jsou to následující:
- Vzorek musí být vždy malý, i když je populace velká.
- Prvky vzorku se extrahují jeden po druhém, aniž by se začleňovaly zpět do populace.
- Vlastnost, která má být studována, je binární, tj. Může mít pouze dvě hodnoty: 1 nebo 0, nebo true nebo false.
V každém kroku extrakce prvku se pravděpodobnost mění v závislosti na předchozích výsledcích.
Aproximace pomocí binomického rozdělení
Další vlastností hypergeometrického rozdělení je to, že může být aproximováno binomickým rozdělením, označeným Bi, pokud je populace N velká a alespoň 10krát větší než vzorek m. V tomto případě by to vypadalo takto:
Pravděpodobnost, že jsou x = 3 šrouby ve vzorku vadné, je: P (500, 5, 60, 3) = 0,0129.
Pravděpodobnost, že x = 4 šrouby ze šedesáti vzorků jsou vadné, je: P (500, 5, 60; 4) = 0,0008.
Konečně je pravděpodobnost, že x = 5 šroubů v tomto vzorku vadných, je: P (500, 5, 60; 5) = 0.
Pokud však chcete znát pravděpodobnost, že v tomto vzorku jsou více než 3 vadné šrouby, musíte získat kumulativní pravděpodobnost a přidat:
Tento příklad je znázorněn na obrázku 2, získaném pomocí GeoGebry, bezplatného softwaru široce používaného ve školách, ústavech a univerzitách.
Obrázek 2. Příklad hypergeometrického rozdělení. Připravil F. Zapata s GeoGebra.
Příklad 2
Paluba ve Španělsku má 40 karet, z nichž 10 má zlato a zbývajících 30 nemá. Předpokládejme, že z tohoto balíčku je náhodně vylosováno 7 karet, které nejsou znovu začleněny do balíčku.
Je-li X počet zlatých přítomných na 7 vylosovaných kartách, je pravděpodobnost, že v losování na 7 kartách budete mít x zlata, dána hypergeometrickým rozložením P (40,10,7; x).
Podívejme se na to takto: Pro výpočet pravděpodobnosti, že budou mít 4 zlato v losování na 7 kartách, použijeme vzorec hypergeometrického rozdělení s následujícími hodnotami:
Výsledkem je: 4,57% pravděpodobnost.
Pokud ale chcete znát pravděpodobnost získání více než 4 karet, musíte přidat:
Řešená cvičení
Následující sada cvičení je určena k ilustraci a přizpůsobení konceptů, které byly prezentovány v tomto článku. Je důležité, aby se čtenář pokusil je vyřešit sám, než se podívá na řešení.
Cvičení 1
Továrna na kondomy zjistila, že z každých 1000 kondomů vyrobených určitým strojem je 5 vadných. Pro kontrolu kvality se náhodně odebere 100 kondomů a šarže se odmítne, pokud je alespoň jeden nebo více vadných. Odpovědět:
a) Jaká je možnost, že bude zlikvidováno hodně 100?
b) Je toto kritérium kontroly kvality účinné?
Řešení
V tomto případě se objeví velmi velká kombinatorická čísla. Výpočet je obtížný, pokud nemáte vhodný softwarový balíček.
Ale protože je to velká populace a vzorek je desetkrát menší než celková populace, je možné použít aproximaci hypergeometrického rozdělení binomickým rozdělením:
Ve výše uvedeném výrazu C (100, x) je kombinatorické číslo. Pravděpodobnost výskytu více než jedné vady se pak vypočítá takto:
Je to vynikající aproximace ve srovnání s hodnotou získanou použitím hypergeometrického rozdělení: 0,4102
Dá se říci, že s pravděpodobností 40% by měla být zlikvidována šarže 100 profylaktik, což není příliš účinné.
Pokud však bude proces kontroly kvality o něco méně náročný a bude vyřazen ze stovky, pouze pokud budou mít dva nebo více defektů, pravděpodobnost vyřazení ze šarže klesne na pouhých 8%.
Cvičení 2
Stroj na výrobu plastových bloků pracuje takovým způsobem, že z každých 10 kusů se jeden deformuje. Jak je pravděpodobné, že je ve vzorku 5 kusů vadný pouze jeden kus?
Řešení
Obyvatelstvo: N = 10
Počet n defektů pro každé N: n = 1
Velikost vzorku: m = 5
Proto existuje 50% pravděpodobnost, že ve vzorku 5 bude blok deformován.
Cvičení 3
Na setkání mladých absolventů středních škol je 7 dám a 6 pánů. Mezi dívkami studují humanitní vědy a 3 věda. Ve skupině chlapců 1 studuje humanitní vědy a 5 věd. Vypočítejte následující:
a) Výběr náhodně tří dívek: jak je pravděpodobné, že všichni studují humanitní obory?
b) Pokud jsou náhodně vybráni tři účastníci setkání přátel: Jaká je možnost, že tři z nich, bez ohledu na pohlaví, studují vědu všechny tři nebo humanitní obory také všechny tři?
c) Nyní náhodně vyberte dva přátele a zavolejte x náhodnou proměnnou „počet těch, kdo studují humanitní obory“. Mezi dvěma vybranými určete střední nebo očekávanou hodnotu x a rozptyl σ ^ 2.
Řešení
Hodnoty, které se mají nyní použít, jsou:
-Populace: N = 14
- Množství, které studuje písmena, je: n = 6 a
- Velikost vzorku: m = 3.
- Počet přátel studujících humanitní obory: x
Podle toho, x = 3 znamená, že všechny tři studijní humanitní obory, ale x = 0 znamená, že žádné studijní humanitní obory. Pravděpodobnost, že všechny tři studie budou stejné, je dána součtem:
P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0,0560 + 0,1539 = 0,2099
Potom máme 21% pravděpodobnost, že tři náhodně vybraní účastníci schůzek budou studovat stejnou věc.
Řešení c
Zde máme následující hodnoty:
N = 14 celková populace přátel, n = 6 celkový počet v populaci studující humanitní obory, velikost vzorku je m = 2.
Naděje je:
E (x) = m * (n / N) = 2 * (6/14) = 0,8572
A rozptyl:
σ (x) ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) =
= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / (13) = 0,4521
Reference
- Diskrétní rozdělení pravděpodobnosti. Obnoveno z: biplot.usal.es
- Statistika a pravděpodobnost. Hypergeometrické rozdělení. Obnoveno z: projectdescartes.org
- CDPYE-UGR. Hypergeometrické rozdělení. Obnoveno z: ugr.es
- Geogebra. Klasická geogebra, pravděpodobnostní počet. Obnoveno z geogebra.org
- Zkuste snadno. Řešené problémy hypergeometrického rozdělení. Obnoveno z: probafacil.com
- Minitab. Hypergeometrické rozdělení. Obnoveno z: support.minitab.com
- University of Vigo. Hlavní diskrétní distribuce. Obnoveno z: anapg.webs.uvigo.es
- Vittor. Statistika a kombinatorika. Obnoveno z: vitutor.net
- Weisstein, Eric W. Hypergeometrická distribuce. Obnoveno z: mathworld.wolfram.com
- Wikipedia. Hypergeometrické rozdělení. Obnoveno z: es.wikipedia.com