- Vzorec
- Charakteristiky normálního rozdělení
- Intervaly spolehlivosti
- Aplikace normální distribuce
- Příklad
- Cvičení vyřešeno
- Reference
Normální distribuce nebo Gaussovo rozdělení je rozdělení pravděpodobnosti v kontinuální proměnné, ve kterém je funkce hustoty pravděpodobnosti popsaného exponenciální funkce kvadratické a negativní argumentu, který vede ke vzniku tvaru zvonu.
Název normální distribuce vychází ze skutečnosti, že toto rozdělení je takové, které platí pro největší počet situací, kdy je v dané skupině nebo populaci zapojena nějaká souvislá náhodná proměnná.
Obrázek 1. Normální rozdělení N (x; μ, σ) a jeho hustota pravděpodobnosti f (s; μ, σ). (Vlastní zpracování)
Příklady, kde se používá normální rozdělení, jsou: výška mužů nebo žen, odchylky v míře nějaké fyzické velikosti nebo měřitelné psychologické nebo sociologické rysy, jako je intelektuální kvocient nebo konzumní zvyklosti určitého produktu.
Na druhé straně se nazývá gaussovské rozdělení nebo gaussovský zvon, protože právě tento německý matematický génius je připisován jeho objevu pro použití, které dal, aby popsal statistickou chybu astronomických měření již v roce 1800.
Uvádí se však, že toto statistické rozdělení dříve publikoval další velký matematik francouzského původu, jako je Abraham de Moivre, již v roce 1733.
Vzorec
Normální distribuční funkce v spojité proměnné x, s parametry μ a σ, je označena:
N (x; μ, σ)
a je výslovně napsáno takto:
N (x; μ, σ) = ∫ -∞ x f (s; μ, σ) ds
kde f (u; μ, σ) je funkce hustoty pravděpodobnosti:
f (s; μ, σ) = (1 / (σ√ (2π)) Exp (- s 2 / (2σ 2))
Konstanta, která násobí exponenciální funkci ve funkci hustoty pravděpodobnosti, se nazývá normalizační konstanta a byla vybrána tak, aby:
N (+ ∞, μ, σ) = 1
Předchozí výraz zajišťuje, že pravděpodobnost, že náhodná proměnná x je mezi -∞ a + ∞, je 1, tj. 100% pravděpodobnost.
Parametr μ je aritmetický průměr kontinuální náhodné proměnné x a σ směrodatná odchylka nebo druhá odmocnina rozptylu téže proměnné. V případě, že μ = 0 a σ = 1, pak máme standardní normální rozdělení nebo typické normální rozdělení:
N (x; μ = 0, σ = 1)
Charakteristiky normálního rozdělení
1 - Pokud náhodná statistická proměnná následuje normální rozdělení hustoty pravděpodobnosti f (s; μ, σ), je většina dat seskupena kolem střední hodnoty μ a rozptýlena kolem ní tak, že o něco více než ⅔ údajů jsou mezi μ - σ a μ + σ.
2- Standardní odchylka σ je vždy kladná.
3- Tvar funkce hustoty f je podobný tvaru zvonku, proto se tato funkce často nazývá Gaussovský zvon nebo Gaussova funkce.
4- V Gaussově rozdělení se střední hodnota, střední hodnota a režim shodují.
5- Inflexní body funkce hustoty pravděpodobnosti jsou přesně v μ - σ a μ + σ.
6- Funkce f je symetrická vzhledem k ose procházející její střední hodnotou μ a má asymptoticky nulu pro x ⟶ + ∞ a x ⟶ -∞.
7- Čím vyšší je hodnota σ, tím větší je rozptyl, šum nebo vzdálenost dat kolem střední hodnoty. Jinými slovy, čím vyšší je tvar zvonu otevřenější. Na druhé straně, σ small označuje, že kostky jsou blízko střední a tvar zvonku je uzavřenější nebo špičatější.
8- Distribuční funkce N (x; μ, σ) označuje pravděpodobnost, že náhodná proměnná je menší nebo rovna x. Například na obrázku 1 (výše) je pravděpodobnost P, že proměnná x je menší nebo rovná 1,5, 84% a odpovídá ploše pod funkcí hustoty pravděpodobnosti f (x; μ, σ) od -∞ až x.
Intervaly spolehlivosti
9- Pokud údaje sledují normální rozdělení, pak 68,26% z nich je mezi μ - σ a μ + σ.
10- 95,44% údajů, které sledují normální rozdělení, jsou mezi μ - 2σ a μ + 2σ.
11 - 99,74% údajů, které sledují normální rozdělení, jsou mezi μ - 3σ a μ + 3σ.
12 - Pokud náhodná proměnná x následuje distribuci N (x; μ, σ), pak proměnná
z = (x - μ) / σ odpovídá standardní normální distribuci N (z; 0,1).
Změna proměnné x na z se nazývá standardizace nebo psaní a je velmi užitečná při použití tabulek standardní distribuce na data, která sledují nestandardní normální distribuci.
Aplikace normální distribuce
Pro použití normálního rozdělení je nutné projít výpočet integrálu hustoty pravděpodobnosti, který z analytického hlediska není snadný a není vždy počítačový program, který umožňuje jeho numerický výpočet. K tomuto účelu se používají tabulky normalizovaných nebo standardizovaných hodnot, což není nic jiného než normální rozdělení v případě μ = 0 a σ = 1.
Normalizovaná normální distribuční tabulka (část 1/2)
Normalizovaná normální distribuční tabulka (část 2/2)
Je třeba poznamenat, že tyto tabulky neobsahují záporné hodnoty. Použitím symetrických vlastností Gaussovy funkce hustoty pravděpodobnosti však lze získat odpovídající hodnoty. Řešené cvičení ukázané níže ukazuje použití tabulky v těchto případech.
Příklad
Předpokládejme, že máte sadu náhodných dat x, která sledují normální rozdělení střední hodnoty 10 a směrodatnou odchylku 2. Budete požádáni, abyste zjistili pravděpodobnost, že:
a) Náhodná proměnná x je menší nebo rovna 8.
b) je menší nebo rovno 10.
c) že proměnná x je pod 12.
d) Pravděpodobnost, že hodnota x je mezi 8 a 12.
Řešení:
a) K zodpovězení první otázky stačí spočítat:
N (x; μ, σ)
S x = 8, μ = 10 a σ = 2. Uvědomujeme si, že se jedná o integrál, který nemá analytické řešení v elementárních funkcích, ale řešení je vyjádřeno jako funkce chybové funkce erf (x).
Na druhé straně existuje možnost řešení integrálu v numerické podobě, což je to, co dělá mnoho kalkulaček, tabulek a počítačových programů, jako je GeoGebra. Následující obrázek ukazuje numerické řešení odpovídající prvnímu případu:
Obrázek 2. Hustota pravděpodobnosti f (x; μ, σ). Stínovaná oblast představuje P (x ≤ 8). (Vlastní zpracování)
a odpověď je, že pravděpodobnost, že x je pod 8, je:
P (x ≤ 8) = N (x = 8; μ = 10, σ = 2) = 0,1587
b) V tomto případě se pokusíme zjistit pravděpodobnost, že náhodná proměnná x je pod průměrem, což je v tomto případě hodnota 10. Odpověď nevyžaduje žádný výpočet, protože víme, že polovina dat je pod průměr a druhá polovina nadprůměrná. Odpověď je tedy následující:
P (x ≤ 10) = N (x = 10; μ = 10, σ = 2) = 0,5
c) K zodpovězení této otázky musíme vypočítat N (x = 12; μ = 10, σ = 2), což lze provést pomocí kalkulačky, která má statistické funkce nebo pomocí softwaru, jako je GeoGebra:
Obrázek 3. Hustota pravděpodobnosti f (x; μ, σ). Stínovaná oblast představuje P (x ≤ 12). (Vlastní zpracování)
Odpověď na část c je vidět na obrázku 3 a je:
P (x <12) = N (x = 12; μ = 10, a = 2) = 0,8413.
d) Pro zjištění pravděpodobnosti, že náhodná proměnná x je mezi 8 a 12, můžeme použít výsledky částí a a c takto:
P (8 <x <12) = P (x <12) - P (x <8) = 0,8413 - 0,1587 = 0,6826 = 68,26%.
Cvičení vyřešeno
Průměrná cena akcií společnosti je 25 USD se standardní odchylkou 4 $. Určete pravděpodobnost, že:
a) Náklady na akci jsou nižší než 20 USD.
b) To má cenu vyšší než 30 $.
c) Cena je mezi 20 a 30 $.
Odpovědi získáte pomocí standardních normálních distribučních tabulek.
Řešení:
Aby bylo možné tabulky využít, je nutné předat normalizovanou nebo zadanou proměnnou z:
20 $ v normalizované proměnné se rovná z = ($ 20 - 25 $) / $ 4 = -5/4 = -1,25 a
30 $ v normalizované proměnné se rovná z = (30 - 25 $) / 4 $ = +5/4 = +1,25.
a) $ 20 se v normalizované proměnné rovná -1,25, ale tabulka nemá záporné hodnoty, proto klademe hodnotu +1,25, která dává hodnotu 0,8944.
Pokud se od této hodnoty odečte 0,5, bude výsledkem plocha mezi 0 a 1,25, která je mimochodem identická (symetricky) s oblastí mezi -1,25 a 0. Výsledkem odečtení je 0,8944 - 0,5 = 0,3944, což je oblast mezi -1,25 a 0.
Zajímavá je však oblast od -∞ do -1,25, což bude 0,5 - 0,3944 = 0,1056. Dospělo se proto k závěru, že pravděpodobnost, že populace je pod 20 USD, je 10,56%.
b) 30 USD v zadané proměnné z je 1,25. Pro tuto hodnotu v tabulce je uvedeno číslo 0,8944, což odpovídá oblasti od -∞ do +1,25. Plocha mezi +1,25 a + ∞ je (1 - 0,8944) = 0,1056. Jinými slovy, pravděpodobnost, že akcie stojí více než 30 USD, je 10,56%.
c) Pravděpodobnost, že akce má cenu mezi 20 a 30 $, se vypočítá takto:
100% -10,56% - 10,56% = 78,88%
Reference
- Statistika a pravděpodobnost. Normální distribuce. Obnoveno z: projectdescartes.org
- Geogebra. Klasická geogebra, pravděpodobnostní počet. Obnoveno z geogebra.org
- MathWorks. Gaussovo rozdělení. Obnoveno z: es.mathworks.com
- Mendenhall, W. 1981. Statistika pro management a ekonomiku. 3. edice. Grupo Editorial Iberoamérica.
- Stat Trek. Naučte se statistiky. Poissonova distribuce. Obnoveno z: stattrek.com,
- Triola, M. 2012. Elementární statistika. 11. Ed. Pearson Education.
- University of Vigo. Hlavní nepřetržité distribuce. Obnoveno z: anapg.webs.uvigo.es
- Wikipedia. Normální distribuce. Obnoveno z: es.wikipedia.org