- Seskupená data
- Příklad
- 3 hlavní opatření centrální tendence
- 1 Aritmetický průměr
- 2- Střední
- 3 - Móda
- Reference
Míra centrální tendence seskupených údajů se ve statistikách používá k popisu určitých chování skupiny dodaných údajů, jako je například jaká hodnota se jim blíží, jaký je mimo jiné průměr shromážděných údajů.
Při pořizování velkého množství dat je užitečné je seskupit, aby je bylo možné lépe uspořádat, a tak bylo možné vypočítat určitá měřítka centrální tendence.

Mezi nejpoužívanější míry centrální tendence patří aritmetický průměr, medián a režim. Tato čísla vypovídají o určitých vlastnostech údajů shromážděných v určitém experimentu.
Chcete-li tato opatření použít, musíte nejprve vědět, jak seskupit datovou sadu.
Seskupená data
Chcete-li seskupit data, musíte nejprve vypočítat rozsah dat, který je získán odečtením nejvyšší hodnoty minus nejnižší hodnota dat.
Pak je vybráno číslo "k", což je počet tříd, ve kterých chceme data seskupit.
Rozsah je dělen „k“ pro získání amplitudy tříd, které mají být seskupeny. Toto číslo je C = R / k.
Nakonec začíná seskupení, pro které je vybráno číslo menší než nejnižší hodnota získaných dat.
Toto číslo bude dolní limit první třídy. K tomu se přidá C. Získaná hodnota bude horní mez první třídy.
Poté se k této hodnotě přidá C a získá se horní mez druhé třídy. Tímto způsobem přistoupíme k získání horní hranice poslední třídy.
Po seskupení údajů lze vypočítat průměr, medián a režim.
Abychom ilustrovali, jak se počítá aritmetický průměr, medián a režim, pokračujeme příkladem.
Příklad

Proto při seskupování dat bude získána tabulka podobná následující:

3 hlavní opatření centrální tendence
Nyní budeme pokračovat ve výpočtu aritmetického průměru, mediánu a režimu. Pro ilustraci tohoto postupu bude použit výše uvedený příklad.
1 Aritmetický průměr
Aritmetický průměr sestává z násobení každé frekvence průměrem intervalu. Poté jsou přidány všechny tyto výsledky a nakonec je děleno celkovými údaji.
Použitím předchozího příkladu by bylo získáno, že aritmetický průměr je roven:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,111111
To znamená, že průměrná hodnota dat v tabulce je 5.11111.
2- Střední
Pro výpočet mediánu datové sady nejprve uspořádáme všechna data od nejnižší k největší. Mohou nastat dva případy:
- Pokud je počet dat lichý, pak mediánem jsou data, která jsou přímo ve středu.
- Pokud je počet dat sudý, pak je střední hodnota průměrem dvou dat, která jsou ve středu.
Pokud jde o seskupená data, výpočet mediánu se provádí takto:
- N / 2 se počítá, kde N jsou celkové údaje.
- Hledá se první interval, ve kterém je nashromážděná frekvence (součet frekvencí) větší než N / 2 a je vybrána spodní hranice tohoto intervalu, nazývaná Li.
Medián je dán následujícím vzorcem:
Me = Li + (Ls-Li) * (N / 2 - Akumulovaná frekvence před Li) / frekvence [Li, Ls)
Ls je horní mez výše uvedeného intervalu.
Pokud se použije předchozí datová tabulka, N / 2 = 18/2 = 9. Kumulované frekvence jsou 4, 8, 14 a 18 (jedna pro každý řádek tabulky).
Proto musí být vybrán třetí interval, protože kumulativní frekvence je větší než N / 2 = 9.
Li = 5 a Ls = 7. Při použití výše popsaného vzorce musíte:
Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.
3 - Móda
Režim je hodnota, která má nejvyšší frekvenci mezi všemi seskupenými daty; to znamená, že se jedná o hodnotu, která se nejčastěji opakuje v počáteční sadě dat.
Pokud máte velmi velké množství dat, použije se následující vzorec pro výpočet režimu seskupených dat:
Mo = Li + (Ls-Li) * (frekvence Li - frekvence L (i-1)) / ((frekvence Li - frekvence L (i-1))) + (frekvence Li - frekvence L (i + 1)))
Interval [Li, Ls) je interval, ve kterém je nalezena nejvyšší frekvence. Pro příklad uvedený v tomto článku je režim daný:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
Další vzorec, který se používá k získání přibližné hodnoty režimu, je následující:
Mo = Li + (Ls-Li) * (frekvence L (i + 1)) / (frekvence L (i-1) + frekvence L (i + 1)).
Podle tohoto vzorce jsou účty následující:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Reference
- Bellhouse, DR (2011). Abraham De Moivre: Nastavení fáze pro klasickou pravděpodobnost a její aplikace. CRC Stiskněte.
- Cifuentes, JF (2002). Úvod do teorie pravděpodobnosti. Národní univerzita v Kolumbii.
- Daston, L. (1995). Klasická pravděpodobnost v osvícení. Princeton University Press.
- Larson, HJ (1978). Úvod do teorie pravděpodobnosti a statistického odvozování. Redakční Limusa.
- Martel, PJ a Vegas, FJ (1996). Pravděpodobnost a matematická statistika: aplikace v klinické praxi a řízení zdraví. Vydání Díaz de Santos.
- Vázquez, AL, & Ortiz, FJ (2005). Statistické metody pro měření, popis a kontrolu variability. Ed. University of Cantabria.
- Vázquez, SG (2009). Manuál matematiky pro přístup na univerzitu. Editorial Centro de Estudios Ramon Areces SA.
