- Výhody a nevýhody
- Nevýhody rozsahu jako měřítka rozptylu
- Mezikvartilní rozsah, kvartily a zpracovaný příklad
- - Výpočet kvartilů
- První kvartil
- Druhý kvartil nebo medián
- Třetí kvartil
- Příklad práce
- Řešení
- B. Řešení
- Řešení c
- Reference
Rozsah, rozsah nebo amplitudy, ve statistikách, je rozdíl (odčítání) mezi maximální hodnotou a minimální hodnotou ze sady dat ze vzorku nebo populace. Pokud je rozsah reprezentován písmenem R a data jsou reprezentována x, je vzorec rozsahu jednoduše:
R = x max - x min
Kde x max je maximální hodnota dat a x min je minimum.
Obrázek 1. Rozsah údajů odpovídající počtu obyvatel Cádizu za poslední dvě století. Zdroj: Wikimedia Commons.
Koncept je velmi užitečný jako jednoduchá míra rozptylu k rychlému zhodnocení variability dat, protože označuje prodloužení nebo délku intervalu, kde jsou nalezena.
Předpokládejme například, že se měří výška skupiny 25 studentů prvního ročníku strojírenství na univerzitě. Nejvyšší student ve skupině je 1,93 ma nejkratší 1,67 m. Toto jsou extrémní hodnoty vzorových dat, proto jejich cesta je:
R = 1,93 - 1,67 m = 0,26 m nebo 26 cm.
Výška studentů v této skupině je rozložena po tomto rozmezí.
Výhody a nevýhody
Dosah je, jak jsme již řekli, měřítkem rozložení dat. Malý rozsah znamená, že data jsou více či méně blízko a šíření je nízké. Na druhé straně větší rozsah naznačuje, že data jsou více rozptýlena.
Výhody výpočtu rozsahu jsou zřejmé: je velmi snadné a rychlé najít, protože jde o jednoduchý rozdíl.
Má také stejné jednotky jako data, se kterými pracuje a koncept je pro každého pozorovatele velmi snadno interpretovatelný.
V příkladu výšky studentů technických oborů, pokud by byl dosah 5 cm, bychom řekli, že studenti jsou přibližně stejní velikosti. Ale s rozsahem 26 cm, okamžitě předpokládáme, že ve vzorku jsou studenti všech středních výšek. Je tento předpoklad vždy správný?
Nevýhody rozsahu jako měřítka rozptylu
Pokud se podíváme pozorně, je možné, že v našem vzorku 25 studentů technických oborů pouze jeden z nich měří 1,93 a zbývajících 24 má výšky blízké 1,67 m.
Dosah však zůstává stejný, i když opak je naprosto možný: výška většiny je kolem 1,90 ma pouze jeden je 1,67 m.
V obou případech je distribuce dat zcela odlišná.
Nevýhody rozsahu jako míry rozptylu jsou proto, že používá pouze extrémní hodnoty a ignoruje všechny ostatní. Protože většina informací je ztracena, nemáte ponětí, jak jsou distribuována vzorová data.
Další důležitou charakteristikou je, že rozsah vzorku nikdy neklesá. Pokud přidáme další informace, to znamená, že vezmeme v úvahu více dat, rozsah se zvětší nebo zůstane stejný.
A v každém případě je to užitečné pouze při práci s malými vzorky, jeho jediné použití jako míra rozptylu ve velkých vzorcích se nedoporučuje.
Je třeba ji doplnit výpočtem dalších rozptylových měr, které zohledňují informace poskytnuté celkovými údaji: mezikvartilní rozsah, rozptyl, směrodatná odchylka a variační koeficient.
Mezikvartilní rozsah, kvartily a zpracovaný příklad
Uvědomili jsme si, že slabost rozsahu jako měřítka rozptylu spočívá v tom, že využívá pouze extrémní hodnoty distribuce dat, vynechává ostatní.
Aby se zabránilo této nepříjemnosti, používají se kvartily: tři hodnoty známé jako měření polohy.
Rozdělují nes seskupená data do čtyř částí (dalšími široce používanými pozičními opatřeními jsou decily a percentily). To jsou jeho vlastnosti:
- První kvartil Q 1 je hodnota dat taková, že 25% všech z nich je menší než Q 1.
- Druhý kvartil Q 2 je medián distribuce, což znamená, že polovina (50%) dat je menší než tato hodnota.
-Finally, třetí kvartil Q 3 ukazuje, že 75% z dat jsou méně než Q 3.
Potom se interkvartilní rozsah nebo mezikvartilového rozsah je definován jako rozdíl mezi třetí kvartil Q 3 a prvním kvartilu Q 1 údajů:
Mezikvartilní rozsah = R Q = Q 3 - Q 1
Tímto způsobem není hodnota rozsahu R Q tak ovlivněna extrémními hodnotami. Z tohoto důvodu je vhodné jej použít při řešení šikmých distribucí, jako jsou distribuce velmi vysokých nebo velmi krátkých studentů popsaných výše.
- Výpočet kvartilů
Existuje několik způsobů, jak je vypočítat, zde navrhneme jeden, ale v každém případě je nutné znát číslo objednávky „N o “, což je místo, které příslušný kvartil zabírá v distribuci.
To znamená, že v případě, například termín, který odpovídá Q 1 je druhý, třetí nebo čtvrtý a tak distribuce.
První kvartil
N nebo (Q 1) = (N + 1) / 4
Druhý kvartil nebo medián
N nebo (Q 2) = (n + 1) / 2
Třetí kvartil
N nebo (Q 3) = 3 (n + 1) / 4
Kde N je počet dat.
Medián je hodnota, která je přímo uprostřed distribuce. Pokud je počet dat lichý, není problém s jejich nalezením, ale pokud je sudý, pak jsou dvě střední hodnoty zprůměrovány, aby se z nich stala jedna.
Po výpočtu čísla objednávky je dodrženo jedno z těchto tří pravidel:
- Pokud neexistují žádná desetinná místa, prohledávají se data uvedená v distribuci a to bude hledaný kvartil.
- Pokud je číslo objednávky na půli cesty mezi dvěma, pak jsou data označená celočíselnou částí zprůměrována s následujícími daty a výsledkem je odpovídající kvartil.
-V každém jiném případě je zaokrouhleno na nejbližší celé číslo a to bude poloha kvartilu.
Příklad práce
Na stupnici od 0 do 20 získala skupina 16 studentů matematiky I v průběžném testu následující body (body):
16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
Nalézt:
a) Rozsah nebo rozsah dat.
b) Hodnoty kvartilů Q 1 a Q 3
c) Mezikvartilní rozsah.
Obrázek 2. Mají skóre v tomto matematickém testu tolik variabilitu? Zdroj: Pixabay.
Řešení
První věcí, kterou musíte najít, je vyhledat data ve vzestupném nebo klesajícím pořadí. Například ve vzestupném pořadí máte:
1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
S použitím vzorce uvedeného na začátku: R = x max - x min
R = 20 - 1 bod = 19 bodů.
Podle výsledku mají tato hodnocení velký rozptyl.
B. Řešení
N = 16
N nebo (Q 1) = (N + 1) / 4 = (16 + 1) / 4 = 17/4 = 4,25
Je to číslo s desetinnou čárkou, jehož celá část je 4. Pak jdeme k rozdělení, hledáme data, která zaujímají čtvrté místo a jeho hodnota je průměrována s hodnotou páté pozice. Protože jsou oba 9, průměr je také 9 a tak:
Q 1 = 9
Nyní opakujeme postup pro nalezení Q 3:
N nebo (Q 3) = 3 (n + 1) / 4 = 3 (16 + 1) / 4 = 12.75
Opět je to desetinné místo, ale protože to není na půl cesty, je zaokrouhleno na 13. Hledaný kvartil zaujímá třináctou pozici a je:
Q 3 = 16
Řešení c
R Q = Q 3 - Q 1 = 16 - 9 = 7 bodů.
Což je, jak vidíme, mnohem menší než rozsah dat vypočtených v části a), protože minimální skóre bylo 1 bod, hodnota mnohem dále od ostatních.
Reference
- Berenson, M. 1985. Statistiky pro management a ekonomiku. Interamericana SA
- Canavos, G. 1988. Pravděpodobnost a statistika: Aplikace a metody. McGraw Hill.
- Devore, J. 2012. Pravděpodobnost a statistika pro inženýrství a vědu. 8. Edice. Cengage.
- Příklady kvartilů. Obnoveno z: matematicas10.net.
- Levin, R. 1988. Statistiky pro administrátory. 2. Edice. Prentice Hall.
- Walpole, R. 2007. Pravděpodobnost a statistika pro inženýrství a vědy. Pearson.