- Vzorec a rovnice
- Rozdíly v binomickém rozdělení
- Příklady
- Praktické aplikace
- Přibližování binomického rozdělení s Poissonovým rozdělením
- Řešená cvičení
- Cvičení 1
- Řešení c)
- Cvičení 2
- Řešení)
- Reference
Poisson distribuce je diskrétní rozdělení pravděpodobnosti, pomocí kterých je možné zjistit pravděpodobnost, že ve velké velikosti vzorku a v určitém intervalu, události, jejíž pravděpodobnost je malá dojde.
Poissonovo rozdělení lze často použít místo binomického rozdělení, pokud jsou splněny následující podmínky: velký vzorek a malá pravděpodobnost.
Obrázek 1. Graf Poissonova rozdělení pro různé parametry. Zdroj: Wikimedia Commons.
Siméon-Denis Poisson (1781-1840) vytvořil toto rozdělení, které nese jeho jméno, velmi užitečné, pokud jde o nepředvídatelné události. Poisson publikoval jeho výsledky v 1837, práce vyšetřování pravděpodobnosti výskytu chybných trestních trestů.
Později jiní vědci upravili distribuci v jiných oblastech, například počet hvězd, které lze nalézt v určitém objemu prostoru, nebo pravděpodobnost, že voják zemře na kop koně.
Vzorec a rovnice
Matematická forma Poissonovy distribuce je následující:
- μ (také někdy označované jako λ) je průměr nebo parametr distribuce
- Eulerovo číslo: e = 2,71828
- Pravděpodobnost získání y = k je P
- k je počet úspěchů 0, 1,2,3…
- n je počet testů nebo událostí (velikost vzorku)
Diskrétní náhodné proměnné, jak naznačuje jejich název, závisí na náhodě a berou pouze diskrétní hodnoty: 0, 1, 2, 3, 4…, k.
Průměr distribuce je dán:
Variace σ, která měří šíření dat, je dalším důležitým parametrem. Pro Poissonovu distribuci je to:
σ = μ
Poisson určil, že když n → ∞ a p → 0, střední μ - také nazývaná očekávaná hodnota - má sklon ke konstantě:
- Události nebo uvažované události jsou na sobě nezávislé a vyskytují se náhodně.
- Pravděpodobnost P určité události, ke které dojde během určitého časového období, je velmi malá: P → 0.
- Pravděpodobnost výskytu více než jedné události v časovém intervalu je 0.
- Průměrná hodnota se přibližuje konstantě dané: μ = np (n je velikost vzorku)
- Protože se disperze σ rovná μ, protože přijímá větší hodnoty, mění se také variabilita.
- Události musí být rovnoměrně rozloženy v použitém časovém intervalu.
- Sada možných hodnot události y je: 0,1,2,3,4….
- Součet proměnných i, které sledují Poissonovo rozdělení, je také další Poissonovou proměnnou. Jeho průměrná hodnota je součtem průměrných hodnot těchto proměnných.
Rozdíly v binomickém rozdělení
Poissonovo rozdělení se liší od binomického rozdělení následujícími důležitými způsoby:
- Binomické rozdělení je ovlivněno jak velikostí vzorku n, tak pravděpodobností P, ale Poissonovo rozdělení je ovlivněno pouze průměrným μ.
- V binomickém rozdělení jsou možné hodnoty náhodné proměnné y 0,1,2,…, N, zatímco v Poissonově rozdělení neexistuje horní hranice pro tyto hodnoty.
Příklady
Poisson zpočátku používal jeho slavnou distribuci k soudním sporům, ale na průmyslové úrovni, jeden z jeho nejčasnějších použití byl ve vaření piva. V tomto procesu se kvasinkové kultury používají k fermentaci.
Kvasinky se skládají z živých buněk, jejichž populace se časem mění. Při výrobě piva je nutné přidat potřebné množství, proto je nutné znát množství buněk, které jsou na jednotku objemu.
Během druhé světové války byla Poissonova distribuce používána, aby se zjistilo, zda Němci vlastně mířili na Londýn z Calais, nebo jen náhodně stříleli. To bylo důležité pro spojence, aby určili, jak dobrá byla nacistům dostupná technologie.
Praktické aplikace
Aplikace Poissonovy distribuce vždy odkazují na počty v čase nebo počty v prostoru. A protože pravděpodobnost výskytu je malá, je známá také jako „zákon vzácných událostí“.
Zde je seznam událostí, které spadají do jedné z těchto kategorií:
-Registrace částic v radioaktivním rozpadu, který je stejně jako růst kvasinkových buněk exponenciální funkcí.
- Počet návštěv určitého webu.
-Příspěvek lidí k linii, kterou zaplatí nebo se jí zúčastní (teorie front).
- Počet aut, která projdou určitým bodem na silnici v daném časovém intervalu.
Obrázek 2. Počet aut projíždějících bodem zhruba sleduje Poissonovo rozdělení. Zdroj: Pixabay.
-Mutace utrpěly v určitém řetězci DNA po vystavení záření.
- Počet meteoritů o průměru větším než 1 m klesl za rok.
-Defekty na metr čtvereční tkaniny.
- Množství krevních buněk v 1 kubickém centimetru.
- Výzvy za minutu k telefonní ústředně.
- Čokoládové lupínky přítomné v 1 kg těsta.
- Počet stromů infikovaných určitým parazitem na 1 ha lesa.
Všimněte si, že tyto náhodné proměnné představují počet výskytů události během pevného časového období (volání za minutu do telefonní ústředny) nebo v dané oblasti prostoru (defekty textilie na metr čtvereční).
Tyto události, jak již bylo stanoveno, jsou nezávislé na době, která uplynula od posledního výskytu.
Přibližování binomického rozdělení s Poissonovým rozdělením
Poissonovo rozdělení je dobrým přiblížením k binomickému rozdělení, pokud:
- Velikost vzorku je velká: n ≥ 100
- Pravděpodobnost p je malá: p ≤ 0,1
- μ je v pořadí: np ≤ 10
V takových případech je Poissonovo rozdělení vynikajícím nástrojem, protože v těchto případech může být obtížné použít binomické rozdělení.
Řešená cvičení
Cvičení 1
Seismologická studie zjistila, že za posledních 100 let bylo na celém světě 93 velkých zemětřesení, nejméně 6,0 v Richterově stupnici - logaritmická -. Předpokládejme, že Poissonova distribuce je v tomto případě vhodným modelem. Nalézt:
a) Průměrný výskyt velkých zemětřesení za rok.
b) Pokud P (y) je pravděpodobnost zemětřesení, ke kterému dojde během náhodně vybraného roku, najděte následující pravděpodobnosti:
Je to docela méně než P (2).
Výsledky jsou uvedeny níže:
P (0) = 0,395, P (1) = 0,367, P (2) = 0,171, P (3) = 0,0529, P (4) = 0,0123, P (5) = 0,00229, P (6) = 0,000355, P (7) = 0,0000471.
Mohli bychom například říci, že existuje 39,5% pravděpodobnost, že v daném roce nedojde k žádnému velkému zemětřesení. Nebo že v tom roce došlo k 5,29% ze 3 velkých zemětřesení.
Řešení c)
c) Frekvence se analyzují vynásobením n = 100 let:
39,5; 36,7; 17,1; 5,29; 1,23; 0,229; 0,0355 a 0,00471.
Například:
- Frekvence 39,5 naznačuje, že 0 velkých zemětřesení nastane za 39,5 ze 100 let, můžeme říci, že je to téměř skutečný výsledek 47 let bez velkého zemětřesení.
Porovnejme další Poissonův výsledek se skutečnými výsledky:
- Hodnota 36,7 znamená, že v období 37 let dochází k 1 velkému zemětřesení. Skutečným výsledkem je, že za 31 let došlo k jednomu velkému zemětřesení, což se hodí k modelu.
- 17,1 let se očekává se dvěma velkými zemětřeseními a je známo, že za 13 let, což je blízká hodnota, skutečně došlo ke dvěma velkým zemětřesením.
Poissonův model je proto pro tento případ přijatelný.
Cvičení 2
Jedna společnost odhaduje, že počet komponent, které selhaly před dosažením 100 provozních hodin, následuje poissonovskou distribuci. Pokud je průměrný počet poruch v této době 8, najděte následující pravděpodobnosti:
a) Že součást selže za 25 hodin.
b) Porucha méně než dvou součástí za 50 hodin.
c) Nejméně tři komponenty selhají za 125 hodin.
Řešení)
a) Je známo, že průměrný počet poruch za 100 hodin je 8, takže za 25 hodin se očekává čtvrtina poruch, tj. 2 poruchy. Bude to parametr μ.
Je požadována pravděpodobnost, že 1 komponenta selže, náhodná proměnná je "komponenty, které selhají před 25 hodinami" a její hodnota je y = 1. Nahrazením ve funkci pravděpodobnosti:
Otázkou však je pravděpodobnost, že méně než dvě složky selhají za 50 hodin, ne to, že přesně 2 komponenty selhají za 50 hodin, proto musíme přidat pravděpodobnosti, že:
-Ne selhání
- Pouze porucha 1
Parametr μ distribuce je v tomto případě:
μ = 8 + 2 = 10 poruch za 125 hodin.
P (selhání 3 nebo více součástí) = 1- P (0) - P (1) - P (2) =
Reference
- MathWorks. Poissonova distribuce. Obnoveno z: es.mathworks.com
- Mendenhall, W. 1981. Statistika pro management a ekonomiku. 3. edice. Grupo Editorial Iberoamérica.
- Stat Trek. Naučte se statistiky. Poissonova distribuce. Obnoveno z: stattrek.com,
- Triola, M. 2012. Elementární statistika. 11. Ed. Pearson Education.
- Wikipedia. Poissonova distribuce. Obnoveno z: en.wikipedia.org