- Odkud pochází empirické pravidlo?
- Tchebyshevova věta
- Normální distribuce
- Jak aplikovat empirické pravidlo?
- 1 - Sestavte intervaly pravidla
- 2 - Vypočítejte počet studentů v každém intervalu podle procent
- 3- Věkové intervaly jsou spojeny s počtem studentů a tlumočením
- K čemu je pravidlo?
- Řešená cvičení
- Králíci v rezervaci
- Průměrná hmotnost dětí v zemi
- Reference
Pravidlem je výsledkem praktických zkušeností a reálného života pozorováním. Například je možné vědět, které druhy ptáků lze pozorovat na určitých místech v každém ročním období a od tohoto pozorování lze stanovit „pravidlo“, které popisuje životní cykly těchto ptáků.
Ve statistikách empirické pravidlo odkazuje na to, jak jsou pozorování seskupena kolem centrální hodnoty, průměru nebo průměru, v jednotkách směrodatné odchylky.
Předpokládejme, že máte skupinu lidí s průměrnou výškou 1,62 metru a směrodatnou odchylkou 0,25 metru, pak by nám empirické pravidlo umožnilo definovat například, kolik lidí by bylo v intervalu střední plus nebo mínus jedna standardní odchylka?
Podle pravidla je 68% údajů více či méně jedna standardní odchylka od průměru, to znamená, že 68% lidí ve skupině bude mít výšku mezi 1,37 (1,62-0,25) a 1,87 (1,62 + 0,25)) metrů.
Odkud pochází empirické pravidlo?
Empirické pravidlo je zobecnění Tchebyshevovy věty a normální distribuce.
Tchebyshevova věta
Tchebyshevova věta říká, že: pro nějakou hodnotu k> 1 je pravděpodobnost, že náhodná proměnná leží mezi střední mínus k násobkem standardní odchylky a střední plus k krát, standardní odchylka je větší nebo rovna (1 - 1 / k 2).
Výhodou této věty je, že je aplikována na diskrétní nebo spojité náhodné veličiny s libovolným rozdělením pravděpodobnosti, ale pravidlo z něj definované není vždy velmi přesné, protože závisí na symetrii rozdělení. Čím asymetričtější je rozdělení náhodných proměnných, tím méně je přizpůsobeno pravidlu jeho chování.
Empirické pravidlo definované z této věty je:
Pokud k = √2, říká se, že 50% dat je v intervalu:
Pokud k = 2, údajně je v intervalu 75% dat:
Pokud je k = 3, údajně je v intervalu 89% dat:
Normální distribuce
Normální rozdělení, neboli Gaussův zvon, umožňuje stanovit empirické pravidlo nebo pravidlo 68 - 95 - 99.7.
Pravidlo je založeno na pravděpodobnosti výskytu náhodné proměnné v intervalech mezi střední mínus jedna, dvě nebo tři směrodatné odchylky a střední plus jedna, dvě nebo tři směrodatné odchylky.
Empirické pravidlo definuje následující intervaly:
68,27% dat je v intervalu:
95,45% dat je v intervalu:
99,73% dat je v intervalu:
Na obrázku můžete vidět, jak jsou tyto intervaly zobrazeny, a vztah mezi nimi při zvětšování šířky základny grafu.
Empirické pravidlo. Melikamp Standardizace náhodné proměnné, tj. Vyjádření náhodné proměnné ve smyslu z nebo standardní normální proměnné, zjednodušuje použití empirického pravidla, protože proměnná z má střední hodnotu rovnou nule a směrodatnou odchylku rovnou jedné.
Proto použití empirického pravidla v měřítku standardní normální proměnné, z, definuje následující intervaly:
68,27% dat je v intervalu:
95,45% dat je v intervalu:
99,73% dat je v intervalu:
Jak aplikovat empirické pravidlo?
Empirické pravidlo umožňuje zkrácené výpočty při práci s normální distribucí.
Předpokládejme, že skupina 100 vysokoškolských studentů má průměrný věk 23 let se standardní odchylkou 2 roky. Jaké informace umožňuje empirické pravidlo získat?
Použití empirického pravidla zahrnuje následující kroky:
1 - Sestavte intervaly pravidla
Protože průměr je 23 a standardní odchylka je 2, pak intervaly jsou:
= =
= =
= =
2 - Vypočítejte počet studentů v každém intervalu podle procent
(100) * 68,27% = přibližně 68 studentů
(100) * 95,45% = přibližně 95 studentů
(100) * 99,73% = přibližně 100 studentů
3- Věkové intervaly jsou spojeny s počtem studentů a tlumočením
Nejméně 68 studentů je ve věku 21 až 25 let.
Nejméně 95 studentů je ve věku 19 až 27 let.
Téměř 100 studentů je ve věku 17 až 29 let.
K čemu je pravidlo?
Empirické pravidlo je rychlý a praktický způsob, jak analyzovat statistická data a stává se stále spolehlivější, protože distribuce se blíží symetrii.
Jeho užitečnost závisí na oblasti, ve které se používá, a na otázkách, které jsou předkládány. Je velmi užitečné vědět, že výskyt hodnot tří směrodatných odchylek pod nebo nad průměrem je téměř nepravděpodobný, a to i pro neobvyklé distribuční proměnné, nejméně 88,8% případů je v intervalu tří sigma.
Ve společenských vědách je obecně přesvědčivým výsledkem rozmezí průměrného plusu nebo mínus dva sigma (95%), zatímco v částicové fyzice vyžaduje nový efekt, aby se za objev považoval interval pěti sigma (99,99994%).
Řešená cvičení
Králíci v rezervaci
V rezervaci divočiny se odhaduje, že v průměru existuje 16 000 králíků se standardní odchylkou 500 králíků. Není-li rozdělení proměnné „počet králíků v rezervě“ neznámé, je možné odhadnout pravděpodobnost, že populace králíků bude mezi 15 000 a 17 000 králíků?
Interval lze vyjádřit takto:
15000 = 16000 - 1000 = 16000 - 2 (500) = u - 2 s
17000 = 16000 + 1000 = 16000 + 2 (500) = u + 2 s
Proto: =
Při použití Tchebyshevovy věty máme pravděpodobnost alespoň 0,75, že populace králíků v rezervaci divoké zvěře je mezi 15 000 a 17 000 králíků.
Průměrná hmotnost dětí v zemi
Průměrná hmotnost jednoletých dětí v zemi je obvykle rozdělena s průměrem 10 kilogramů a standardní odchylkou přibližně 1 kilogram.
a) Odhadněte procento jednoletých dětí v zemi, které mají průměrnou hmotnost mezi 8 a 12 kilogramy.
8 = 10 - 2 = 10 - 2 (1) = u - 2 s
12 = 10 + 2 = 10 + 2 (1) = u + 2 s
Proto: =
Podle empirického pravidla lze konstatovat, že 68,27% jednoletých dětí v zemi má hmotnost 8 až 12 kilogramů.
b) Jaká je pravděpodobnost nalezení jednoletého dítěte vážícího 7 kilogramů nebo méně?
7 = 10 - 3 = 10 - 3 (1) = u - 3 s
Je známo, že 7 kilogramů hmotnosti představuje hodnotu µ - 3 s, a také je známo, že 99,73% dětí má hmotnost mezi 7 a 13 kilogramy. To ponechává jen 0,27% z celkového počtu dětí pro extrémy. Polovina z nich, 0,135%, je 7 kilogramů nebo méně a druhá polovina, 0,135%, je 11 kilogramů nebo více.
Lze tedy dojít k závěru, že existuje pravděpodobnost 0,00135, že dítě váží 7 kilogramů nebo méně.
c) Pokud populace v zemi dosáhne 50 milionů obyvatel a 1-leté děti představují 1% obyvatelstva, kolik jednoletých dětí bude vážit mezi 9 a 11 kilogramy?
9 = 10 - 1 = µ - s
11 = 10 + 1 = u + s
Proto: =
Podle empirického pravidla je v intervalu 68,27% jednoletých v zemi
V zemi je 500 000 ročních (1% z 50 milionů), takže 341 350 dětí (68,27% z 500 000) váží mezi 9 a 11 kilogramy.
Reference
- Abraira, V. (2002). Standardní odchylka a standardní chyba. Semergen Magazine. Obnoveno z web.archive.org.
- Freund, R.; Wilson, W.; Mohr, D. (2010). Statistické metody. Třetí ed. Academic Press-Elsevier Inc.
- Server Alicante (2017). Empirické pravidlo (statistické pojmy). Obnoveno z glosarios.servidor-alicante.com.
- Lind, D; Marchal, W.; Wathen, S. (2012). Statistiky aplikované na podnikání a ekonomiku. Patnácté vydání. McGraw-Hill / Interamericana de México SA
- Salinas, H. (2010). Statistiky a pravděpodobnosti. Obnoveno z uda.cl.
- Sokal, R.; Rohlf, F. (2009). Úvod do biostatistiky. Druhé vydání. Publikace Dover, Inc.
- Spiegel, M. (1976). Pravděpodobnost a statistika. Schaumova řada. McGraw-Hill / Interamericana de México SA
- Spiegel, M.; Stephens, L. (2008). Statistika. Čtvrté ed. McGraw-Hill / Interamericana de México SA
- Recenze Stat119 (2019). Řešení otázek empirického pravidla. Obnoveno ze stat119review.com.
- (2019). 68-95-99.7 pravidlo. Obnoveno z en.wikipedia.org.