- Typy stupňů volnosti
- V mechanickém případě
- V sadě náhodných hodnot
- Příklady
- Variace a stupně volnosti
- V distribuci na náměstí Chi
- V testu hypotéz (S vyřešeným příkladem)
- Reference
Tyto stupně volnosti v statistik počet nezávislých složek náhodného vektoru. Pokud vektor má n složek a existují jeho lineární rovnice, pak je stupeň volnosti np.
Koncept stupňů volnosti se objevuje také v teoretické mechanice, kde jsou zhruba ekvivalentem dimenze prostoru, kde se částice pohybuje, mínus počet vazeb.
Obrázek 1. Kyvadlo se pohybuje ve dvou rozměrech, ale má pouze jeden stupeň volnosti, protože je nuceno pohybovat se v oblouku o poloměru L. Zdroj: F. Zapata.
Tento článek pojednává o konceptu stupňů volnosti aplikovaných na statistiku, ale mechanický příklad je snadnější vizualizovat v geometrické podobě.
Typy stupňů volnosti
Způsob výpočtu počtu stupňů volnosti se může lišit v závislosti na kontextu, ve kterém je aplikován, ale základní myšlenka je vždy stejná: celkové rozměry menší počet omezení.
V mechanickém případě
Uvažujme oscilační částici vázanou na provázek (kyvadlo), který se pohybuje ve svislé rovině xy (2 rozměry). Částice je však nucena pohybovat po obvodu poloměru, který se rovná délce akordu.
Protože se částice může pohybovat pouze na této křivce, počet stupňů volnosti je 1. To je vidět na obrázku 1.
Způsob výpočtu počtu stupňů volnosti spočívá v rozdílu počtu rozměrů mínus počet omezení:
stupně volnosti: = 2 (rozměry) - 1 (ligatura) = 1
Další vysvětlení, které nám umožňuje dospět k výsledku, je následující:
- Víme, že pozice ve dvou rozměrech je reprezentována bodem souřadnic (x, y).
- Ale protože bod musí odpovídat rovnici obvodu (x 2 + y 2 = L 2) pro danou hodnotu proměnné x, proměnná y je určena uvedenou rovnicí nebo omezením.
Tímto způsobem je nezávislá pouze jedna z proměnných a systém má jeden (1) stupeň volnosti.
V sadě náhodných hodnot
Pro ilustraci, co tento pojem znamená, předpokládejme vektor
x = (x 1, x 2,…, x n)
Reprezentace vzorku n normálně distribuovaných náhodných hodnot. V tomto případě náhodný vektor x má n nezávislých složek, a proto se x říká, že má n stupňů volnosti.
Nyní vytvořme vektor r zbytků
r = (x 1 -
Kde
Takže částka
(x 1 -
Je to rovnice, která představuje restrikci (nebo vazbu) v prvcích vektoru r zbytků, protože pokud jsou známy n-1 složky vektoru r, určuje restrikční rovnice neznámou složku.
Proto vektor r dimenze n s omezením:
∑ (x i -
Má (n - 1) stupňů volnosti.
Znovu se použije, že výpočet počtu stupňů volnosti je:
stupně volnosti: = n (rozměry) - 1 (omezení) = n-1
Příklady
Variace a stupně volnosti
Rozptyl s 2 je definován jako průměr druhé mocniny odchylek (nebo zbytků) vzorku n dat:
s 2 = (r • r) / (n-1)
kde r je vektor zbytků r = (x1 -
s 2 = ∑ (x i -
V každém případě je třeba poznamenat, že při výpočtu průměru druhé mocniny zbytků je děleno (n-1) a ne n, protože, jak je uvedeno v předchozí části, počet stupňů volnosti vektoru r je (n-1).
Pokud by pro výpočet rozptylu bylo vyděleno n namísto (n-1), výsledek by měl zkreslení, které je velmi významné pro hodnoty n menší než 50.
V literatuře se varianční varianta objevuje také s dělitelem n místo (n-1), pokud jde o rozptyl populace.
Ale množina náhodných proměnných zbytků, reprezentovaná vektorem r, ačkoli má rozměr n, má pouze (n-1) stupně volnosti. Pokud je však počet dat dostatečně velký (n> 500), oba vzorce konvergují ke stejnému výsledku.
Kalkulačky a tabulky poskytují obě verze rozptylu i směrodatnou odchylku (což je druhá odmocnina rozptylu).
Naše doporučení, s ohledem na analýzu zde prezentovanou, je vždy zvolit verzi s (n-1) pokaždé, když je třeba vypočítat rozptyl nebo směrodatnou odchylku, aby nedošlo k předpojatým výsledkům.
V distribuci na náměstí Chi
Některé rozdělení pravděpodobnosti v souvislé náhodné proměnné závisí na parametru nazvaném stupeň svobody, jedná se o distribuci Chi square (χ 2).
Název tohoto parametru vychází přesně ze stupňů volnosti základního náhodného vektoru, na který se toto rozdělení vztahuje.
Předpokládejme, že máme g populace, ze kterých se odebírají vzorky o velikosti n:
X 1 = (x1 1, x1 2,…..x1 n)
X2 = (x2 1, x2 2,….. x 2 n)
….
X j = (xj 1, xj 2,…..xj n)
….
Xg = (xg 1, xg 2,…..xg n)
Populace j, která má průměr
Standardizovaná nebo normalizovaná proměnná zj i je definována jako:
zj i = (xj i -
A vektor Zj je definován takto:
Zj = (zj 1, zj 2,…, zj i,…, zj n) a následuje normalizované normální rozdělení N (0,1).
Proměnná:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 +… + Zg 1 ^ 2),…, (Z1 n ^ 2 + z2 n ^ 2 +…. + Zg n ^ 2))
sleduje distribuci χ 2 (g) zvanou distribuce chi-kvadrát se stupněm svobody g.
V testu hypotéz (S vyřešeným příkladem)
Pokud chcete testovat hypotézy založené na určité sadě náhodných údajů, musíte znát počet stupňů volnosti g, abyste mohli použít test Chi-square.
Obrázek 2. Existuje vztah mezi preferencí zmrzliny FLAVOR a GENDERem zákazníka? Zdroj: F. Zapata.
Jako příklad budou analyzovány údaje o preferencích čokoládové nebo jahodové zmrzliny mezi muži a ženami v určitém zmrzlinářském salónu. Četnost, s jakou muži a ženy volí jahody nebo čokoládu, je shrnuta na obrázku 2.
Nejprve se vypočítá tabulka očekávaných frekvencí, která se připraví vynásobením součtu řádků součtem sloupců a vydělením součtem údajů. Výsledek je znázorněn na následujícím obrázku:
Obrázek 3. Výpočet očekávaných frekvencí na základě pozorovaných frekvencí (hodnoty v modré barvě na obrázku 2). Zdroj: F. Zapata.
Potom se vypočte čtverec Chi (z dat) pomocí následujícího vzorce:
χ 2 = ∑ (F o - F e) 2 / F e
Kde F o jsou pozorované frekvence (obrázek 2) a F e jsou očekávané frekvence (obrázek 3). Sumace jde přes všechny řádky a sloupce, které v našem příkladu uvádějí čtyři termíny.
Po provedení operací získáte:
χ 2 = 0,2043.
Nyní je nutné porovnat s teoretickým Chi čtvercem, který závisí na počtu stupňů volnosti g.
V našem případě je toto číslo stanoveno takto:
g = (# řádky - 1) (# sloupce - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Ukázalo se, že počet stupňů volnosti g v tomto příkladu je 1.
Pokud chcete zkontrolovat nebo odmítnout nulovou hypotézu (H0: neexistuje žádná korelace mezi TASTE a GENDER) s hladinou významnosti 1%, vypočte se teoretická hodnota Chi-kvadrátu se stupněm volnosti g = 1.
Hledá se hodnota, která činí akumulovanou frekvenci (1 - 0,01) = 0,99, tj. 99%. Tato hodnota (kterou lze získat z tabulek) je 6 636.
Protože teoretická Chi překračuje vypočítanou, je ověřena nulová hypotéza.
Jinými slovy, se shromážděnými údaji není pozorován žádný vztah mezi proměnnými TASTE a GENDER.
Reference
- Minitab. Jaké jsou stupně volnosti? Obnoveno z: support.minitab.com.
- Moore, Davide. (2009) Základní aplikovaná statistika. Antoni Bosch editor.
- Leigh, Jennifer. Jak vypočítat stupně volnosti ve statistických modelech. Obnoveno z: geniolandia.com
- Wikipedia. Stupeň svobody (statistika). Obnoveno z: es.wikipedia.com
- Wikipedia. Stupeň svobody (fyzický). Obnoveno z: es.wikipedia.com