- Příklady kvazi-rozptylu
- Proč dělit n-1?
- Alternativní způsob výpočtu kvasivariance
- Standardní skóre
- Cvičení vyřešeno
- Řešení
- B. Řešení
- Reference
Quasivariance, kvazi rozptyl nebo odchylka objektivní je statistickou mírou disperze vzorku dat ve vztahu k průměru. Vzorek zase sestává z řady dat odebraných z většího vesmíru, nazývaných populace.
Označuje se několika způsoby, zde byl vybrán s c 2 a pro jeho výpočet se používá následující vzorec:
Obrázek 1. Definice kvazi-rozptylu. Zdroj: F. Zapata.
Kde:
Kvazi-rozptyl je podobný variantě s 2, s jediným rozdílem, že jmenovatel rozptylu je n-1, zatímco jmenovatel rozptylu je dělen pouze n. Je zřejmé, že když je n velmi velké, hodnoty obou mají tendenci být stejné.
Když znáte hodnotu kvazi-rozptylu, můžete okamžitě znát hodnotu rozptylu.
Příklady kvazi-rozptylu
Často chcete znát vlastnosti každé populace: lidé, zvířata, rostliny a obecně jakýkoli typ objektu. Analýza celé populace však nemusí být snadná, zvláště pokud je počet prvků velmi velký.
Vzorky se poté odebírají v naději, že jejich chování odráží chování obyvatelstva, a tak o tom budou moci dovodit závěry, díky nimž jsou zdroje optimalizovány. Toto je známé jako statistická inference.
Zde je několik příkladů, ve kterých kvazi-rozptyl a přidružená kvazi-standardní odchylka slouží jako statistický ukazatel indikující, jak daleko jsou získané výsledky od střední hodnoty.
1. - Marketingový ředitel společnosti, která vyrábí automobilové baterie, musí v měsících odhadnout průměrnou životnost baterie.
Za tímto účelem náhodně vybere vzorek 100 zakoupených baterií této značky. Společnost vede záznamy o kupujících 'a může s nimi pohovory zjistit, jak dlouho baterie vydrží.
Obrázek 2. Kvazi-rozptyl je užitečný pro vytváření závěrů a kontrolu kvality. Zdroj: Pixabay.
2.– Akademické vedení univerzitní instituce musí odhadnout zápis do následujícího roku a analyzovat počet studentů, u nichž se očekává absolvování předmětů, které právě studují.
Například z každé ze sekcí, které aktuálně využívají Fyziku I, si vedení může vybrat vzorek studentů a analyzovat jejich výkon v dané židli. Tímto způsobem můžete usoudit, kolik studentů bude brát Physics II v dalším období.
3.- Skupina astronomů zaměřuje svou pozornost na část oblohy, kde je pozorován určitý počet hvězd s určitými charakteristikami: například velikost, hmotnost a teplota.
Člověk si klade otázku, jestli hvězdy v jiné podobné oblasti budou mít stejné vlastnosti, dokonce i hvězdy v jiných galaxiích, jako jsou sousední Magellanova mračna nebo Andromeda.
Proč dělit n-1?
V kvasivarizaci je děleno n-1 namísto n a je to proto, že kvasivariate je nestranný odhadce, jak bylo řečeno na začátku.
Stává se, že ze stejné populace je možné extrahovat mnoho vzorků. Rozptyl každého z těchto vzorků lze také zprůměrovat, ale průměr těchto rozptylů se nerovná rozptylu populace.
Ve skutečnosti má průměr rozptylů ve vzorku tendenci podceňovat populační rozptyl, pokud se ve jmenovateli nepoužije n-1. Lze ověřit, že očekávaná hodnota kvazi-rozptylu E (s c 2) je přesně s 2.
Z tohoto důvodu se říká, že kvasivariaát je nezaujatý a je lepším odhadcem rozptylu populace s 2.
Alternativní způsob výpočtu kvasivariance
Je snadno ukázáno, že kvasivariance lze také vypočítat takto:
s c 2 = -
Standardní skóre
Pomocí odchylky vzorku můžeme zjistit, kolik standardních odchylek má konkrétní hodnota x, buď nad nebo pod středem.
K tomu se používá následující bezrozměrný výraz:
Standardní skóre = (x - X) / s c
Cvičení vyřešeno
863 903 957 1041 1138 1204 1354 1624 1698 1745 1802 1883
a) Použijte definici kvasivariance uvedenou na začátku a také zkontrolujte výsledek pomocí alternativního formuláře uvedeného v předchozí části.
b) Vypočítejte standardní skóre druhé části dat, odečte se shora dolů.
Řešení
Problém lze vyřešit ručně pomocí jednoduché nebo vědecké kalkulačky, pro kterou je třeba postupovat v pořádku. A proto není nic lepšího než uspořádání dat do tabulky, jako je tabulka níže:
Díky tabulce jsou informace uspořádány a množství, která budou ve vzorcích potřebná, jsou na konci příslušných sloupců a jsou připravena k okamžitému použití. Shrnutí je uvedeno tučně.
Střední sloupec se vždy opakuje, ale vyplatí se to, protože je vhodné mít hodnotu v zobrazení, aby se vyplnil každý řádek tabulky.
Nakonec se použije rovnice pro kvasivariate uvedená na začátku, nahradí se pouze hodnoty a pro sumaci ji již vypočítáme:
to c 2 = 1593770 / (12-1) = 1,593,770 / 11 = 144,888.2
Toto je hodnota kvasivariatu a jeho jednotky jsou „na druhou mocninu“, což nedává příliš praktický smysl, takže se vypočítává kvazi-standardní odchylka vzorku, což není nic jiného než druhá odmocnina kvasivariatu:
s c = (144 144 88,2) $ = 380,64 $
Okamžitě je potvrzeno, že tato hodnota je také získána alternativní formou kvazi-rozptylu. Potřebná částka je na konci posledního sloupce vlevo:
s c 2 = - = -
= 2,136,016,55 - 1 991 128,36 = 144 888 $ na druhou
Je to stejná hodnota získaná pomocí vzorce uvedeného na začátku.
B. Řešení
Druhá hodnota od shora dolů je 903, její standardní skóre je
Standardní skóre 903 = (x - X) / s c = (903 - 1351) / 380,64 = -1,177
Reference
- Canavos, G. 1988. Pravděpodobnost a statistika: Aplikace a metody. McGraw Hill.
- Devore, J. 2012. Pravděpodobnost a statistika pro inženýrství a vědu. 8. Edice. Cengage.
- Levin, R. 1988. Statistiky pro administrátory. 2. Edice. Prentice Hall.
- Míra rozptylu. Obnoveno z: thales.cica.es.
- Walpole, R. 2007. Pravděpodobnost a statistika pro inženýrství a vědy. Pearson.