Ako nájsť rozptyl v rade čísel. Matematické očakávanie diskrétnej náhodnej premennej

Pre zoskupené údaje zvyšková disperzia- priemer vnútroskupinových disperzií:

Kde σ 2 j je vnútroskupinový rozptyl j -tej skupiny.

Pre nezoskupené údaje zvyšková disperzia je mierou presnosti aproximácie, t.j. aproximácia regresnej priamky k pôvodným údajom:
kde y(t) je predpoveď podľa trendovej rovnice; y t – počiatočný rad dynamiky; n je počet bodov; p je počet koeficientov regresnej rovnice (počet vysvetľujúcich premenných).
V tomto príklade je to tzv nestranný odhad rozptylu.

Príklad #1. Rozdelenie pracovníkov troch podnikov jedného združenia podľa tarifných kategórií charakterizujú tieto údaje:

Kategória mzdy pracovníkaPočet pracovníkov v podniku
podnik 1podnik 2podnik 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

Definuj:
1. rozptyl pre každý podnik (vnútroskupinový rozptyl);
2. priemer vnútroskupinových disperzií;
3. medziskupinová disperzia;
4. celkový rozptyl.

Riešenie.
Pred pokračovaním v riešení problému je potrebné zistiť, ktorá funkcia je efektívna a ktorá je faktoriálna. V uvažovanom príklade je efektívnym atribútom „Kategória tarify“ a atribútom faktora je „Číslo (názov) podniku“.
Potom máme tri skupiny (podniky), pre ktoré je potrebné vypočítať skupinový priemer a vnútroskupinové rozptyly:


Spoločnosťpriemer skupiny,rozptyl v rámci skupiny,
1 4 1,8

Priemer vnútroskupinových rozptylov ( zvyšková disperzia) vypočítané podľa vzorca:


kde si môžete vypočítať:
alebo:


potom:
Celková disperzia sa bude rovnať: s 2 \u003d 1,6 + 0 \u003d 1,6.
Celkový rozptyl možno vypočítať aj pomocou jedného z nasledujúcich dvoch vzorcov:

Pri riešení praktických problémov sa človek často musí zaoberať znakom, ktorý má len dve alternatívne hodnoty. V tomto prípade nehovoria o váhe konkrétnej hodnoty vlastnosti, ale o jej podiele na súhrne. Ak je podiel jednotiek populácie, ktoré majú študovaný znak, označený ako „ R"a nie vlastniť - cez" q“, potom sa disperzia môže vypočítať podľa vzorca:
s2 = p×q

Príklad č. 2. Podľa údajov o vývoji šiestich pracovníkov brigády určte medziskupinový rozptyl a zhodnoťte vplyv pracovnej zmeny na ich produktivitu práce, ak je celkový rozptyl 12,2.

č pracovnej brigádyPracovný výkon, ks.
v prvej zmenev 2. zmene
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

Riešenie. Počiatočné údaje

Xf1f2f 3f4f5f6Celkom
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
Celkom 31 33 37 37 40 38

Potom máme 6 skupín, pre ktoré je potrebné vypočítať skupinový priemer a vnútroskupinové rozptyly.
1. Nájdite priemerné hodnoty každej skupiny.







2. Nájdite strednú hodnotu štvorca každej skupiny.







Výsledky výpočtu zhrnieme do tabuľky:
Číslo skupinyPriemer skupinyVnútroskupinový rozptyl
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. Vnútroskupinový rozptyl charakterizuje zmenu (variáciu) študovaného (výsledného) znaku v rámci skupiny pod vplyvom všetkých faktorov, okrem faktora, ktorý je základom zoskupenia:
Priemer vnútroskupinových disperzií vypočítame pomocou vzorca:


4. Medziskupinový rozptyl charakterizuje zmenu (variáciu) študovaného (výsledného) znaku pod vplyvom faktora (faktoriálneho znaku), ktorý je základom zoskupenia.
Medziskupinová disperzia je definovaná ako:

Kde


Potom

Celkový rozptyl charakterizuje zmenu (variáciu) skúmaného (výsledného) znaku pod vplyvom všetkých faktorov (faktorových znakov) bez výnimky. Podľa stavu problému sa rovná 12,2.
Empirický korelačný vzťah meria, koľko z celkového kolísania výsledného atribútu je spôsobené skúmaným faktorom. Toto je pomer faktoriálneho rozptylu k celkovému rozptylu:

Určíme empirický korelačný vzťah:

Vzťahy medzi vlastnosťami môžu byť slabé alebo silné (úzke). Ich kritériá sa hodnotia na Chaddockovej stupnici:
0,1 0,3 0,5 0,7 0,9 V našom príklade je vzťah medzi prvkom Y faktor X slabý
Koeficient determinácie.

Definujme koeficient determinácie:

Teda 0,67 % variácie je spôsobených rozdielmi medzi vlastnosťami a 99,37 % je spôsobených inými faktormi.
Záver: v tomto prípade výkon pracovníkov nezávisí od práce v konkrétnej zmene, t.j. vplyv pracovnej zmeny na ich produktivitu práce nie je významný a je spôsobený inými faktormi.

Príklad č. 3. Na základe údajov o priemernej mzde a kvadratických odchýlok od jej hodnoty pre dve skupiny pracovníkov nájdite celkový rozptyl použitím pravidla sčítania rozptylu:

Riešenie:
Priemer odchýlok v rámci skupiny

Medziskupinová disperzia je definovaná ako:


Celkový rozptyl bude: 480 + 13824 = 14304

Rozptyl v štatistike sa nachádza ako jednotlivé hodnoty prvku v štvorci . V závislosti od počiatočných údajov sa určuje pomocou jednoduchých a vážených vzorcov rozptylu:

1. (pre nezoskupené údaje) sa vypočíta podľa vzorca:

2. Vážená odchýlka (pre sériu variácií):

kde n je frekvencia (faktor opakovateľnosti X)

Príklad hľadania rozptylu

Táto stránka popisuje štandardný príklad hľadania odchýlky, môžete sa pozrieť aj na ďalšie úlohy na jej nájdenie

Príklad 1. Máme nasledujúce údaje pre skupinu 20 korešpondenčných študentov. Je potrebné zostaviť intervalový rad distribúcie prvkov, vypočítať strednú hodnotu prvku a študovať jeho rozptyl

Zostavme intervalové zoskupenie. Určme rozsah intervalu podľa vzorca:

kde X max je maximálna hodnota funkcie zoskupenia;
X min je minimálna hodnota funkcie zoskupenia;
n je počet intervalov:

Akceptujeme n=5. Krok je: h \u003d (192 - 159) / 5 \u003d 6,6

Urobme intervalové zoskupenie

Pre ďalšie výpočty vytvoríme pomocnú tabuľku:

X'i je stred intervalu. (napríklad stred intervalu 159 – 165,6 = 162,3)

Priemerný rast študentov je určený vzorcom aritmetického váženého priemeru:

Disperziu určíme podľa vzorca:

Vzorec rozptylu možno previesť takto:

Z tohto vzorca to vyplýva rozptyl je rozdiel medzi priemerom druhých mocnín možností a druhou mocninou a priemerom.

Rozptyl vo variačných sériách s rovnakými intervalmi podľa metódy momentov možno vypočítať nasledujúcim spôsobom pomocou druhej vlastnosti disperzie (vydelením všetkých možností hodnotou intervalu). Definícia rozptylu, vypočítaná metódou momentov, podľa nasledujúceho vzorca je časovo menej náročná:

kde i je hodnota intervalu;
A - podmienená nula, pre ktorú je vhodné použiť stred intervalu s najvyššou frekvenciou;
m1 je druhá mocnina okamihu prvého rádu;
m2 - moment druhého rádu

(ak sa v štatistickej populácii atribút zmení tak, že existujú iba dve vzájomne sa vylučujúce možnosti, potom sa takáto variabilita nazýva alternatívna) možno vypočítať podľa vzorca:

Dosadením do tohto disperzného vzorca q = 1- p dostaneme:

Typy disperzie

Celkový rozptyl meria variáciu vlastnosti v celej populácii ako celku pod vplyvom všetkých faktorov, ktoré túto variáciu spôsobujú. Rovná sa strednej štvorci odchýlok jednotlivých hodnôt atribútu x od celkovej priemernej hodnoty x a možno ju definovať ako jednoduchý rozptyl alebo vážený rozptyl.

charakterizuje náhodnú variáciu, t.j. časť variácie, ktorá je spôsobená vplyvom nezohľadnených faktorov a nezávisí od znakového faktora, ktorý je základom zoskupenia. Tento rozptyl sa rovná strednej štvorci odchýlok jednotlivých hodnôt atribútu v rámci skupiny X od aritmetického priemeru skupiny a možno ho vypočítať ako jednoduchý rozptyl alebo ako vážený rozptyl.

teda merania rozptylu v rámci skupiny variácia vlastnosti v rámci skupiny a je určená vzorcom:

kde xi - priemer skupiny;
ni je počet jednotiek v skupine.

Napríklad vnútroskupinové odchýlky, ktoré je potrebné určiť pri úlohe študovať vplyv kvalifikácie pracovníkov na úroveň produktivity práce v obchode, vykazujú odchýlky vo výstupe v každej skupine spôsobené všetkými možnými faktormi (technický stav zariadení, dostupnosť nástrojov a materiálov, vek pracovníkov, pracovná náročnosť a pod.), okrem rozdielov v kvalifikačnej kategórii (v rámci skupiny majú všetci pracovníci rovnakú kvalifikáciu).

Priemer odchýlok v rámci skupiny odzrkadľuje náhodnú, t. j. tú časť variácie, ktorá sa vyskytla pod vplyvom všetkých ostatných faktorov, s výnimkou faktora zoskupovania. Vypočítava sa podľa vzorca:

Charakterizuje systematickú variáciu výsledného znaku, ktorá je spôsobená vplyvom znaku-faktora, ktorý je základom zoskupenia. Rovná sa strednej štvorci odchýlok skupinových priemerov od celkového priemeru. Medziskupinový rozptyl sa vypočíta podľa vzorca:

Pravidlo sčítania rozptylu v štatistike

Podľa pravidlo sčítania rozptylu celkový rozptyl sa rovná súčtu priemeru vnútroskupinových a medziskupinových rozptylov:

Význam tohto pravidla je, že celkový rozptyl, ktorý sa vyskytuje pod vplyvom všetkých faktorov, sa rovná súčtu rozptylov, ktoré vznikajú pod vplyvom všetkých ostatných faktorov, a rozptylu, ktorý vzniká vplyvom zoskupovacieho faktora.

Pomocou vzorca na sčítanie rozptylov je možné z dvoch známych rozptylov určiť tretiu neznámu a tiež posúdiť silu vplyvu atribútu zoskupenia.

Vlastnosti disperzie

1. Ak sú všetky hodnoty atribútu znížené (zvýšené) o rovnakú konštantnú hodnotu, potom sa rozptyl od tejto hodnoty nezmení.
2. Ak sa všetky hodnoty atribútu znížia (zvýšia) o rovnaký počet krát n, potom sa rozptyl zodpovedajúcim spôsobom zníži (zvýši) n^2 krát.

Spomedzi mnohých ukazovateľov, ktoré sa používajú v štatistike, je potrebné vyzdvihnúť výpočet rozptylu. Treba poznamenať, že manuálne vykonávanie tohto výpočtu je dosť únavná úloha. Našťastie existujú funkcie v Exceli, ktoré umožňujú automatizovať postup výpočtu. Poďme zistiť algoritmus pre prácu s týmito nástrojmi.

Rozptyl je indikátor variácie, čo je priemerný štvorec odchýlok od matematického očakávania. Vyjadruje teda rozptyl čísel o priemere. Výpočet rozptylu možno vykonať pre všeobecnú populáciu aj pre vzorku.

Metóda 1: výpočet na všeobecnú populáciu

Na výpočet tohto ukazovateľa v Exceli pre všeobecnú populáciu sa používa funkcia DISP.G. Syntax tohto výrazu je nasledovná:

DISP.G(Číslo1;Číslo2;…)

Celkovo možno použiť 1 až 255 argumentov. Argumenty môžu byť číselné hodnoty aj odkazy na bunky, v ktorých sú obsiahnuté.

Pozrime sa, ako vypočítať túto hodnotu pre rozsah číselných údajov.


Metóda 2: vzorový výpočet

Na rozdiel od výpočtu hodnoty pre všeobecnú populáciu nie je pri výpočte pre vzorku menovateľom celkový počet čísel, ale o jedno menej. Toto sa robí s cieľom opraviť chybu. Excel zohľadňuje túto nuansu v špeciálnej funkcii, ktorá je určená pre tento typ výpočtu - DISP.V. Jeho syntax je reprezentovaná nasledujúcim vzorcom:

VAR.B(číslo1;číslo2;…)

Počet argumentov, ako v predchádzajúcej funkcii, môže byť tiež v rozsahu od 1 do 255.


Ako vidíte, program Excel dokáže výrazne uľahčiť výpočet rozptylu. Túto štatistiku môže aplikácia vypočítať pre populáciu aj vzorku. V tomto prípade sú všetky akcie používateľa v skutočnosti redukované iba na špecifikáciu rozsahu čísel, ktoré sa majú spracovať, a Excel vykoná hlavnú prácu sám. Používateľom to samozrejme ušetrí značné množstvo času.

Poďme počítať vPANIEXCELrozptyl a štandardná odchýlka vzorky. Vypočítame aj rozptyl náhodnej premennej, ak je známe jej rozdelenie.

Najprv zvážte disperzia, potom smerodajná odchýlka.

Ukážkový rozptyl

Ukážkový rozptyl (vzorový rozptyl,vzorkarozptyl) charakterizuje rozšírenie hodnôt v poli vzhľadom na .

Všetky 3 vzorce sú matematicky ekvivalentné.

Z prvého vzorca je vidieť, že rozptyl vzorky je súčet štvorcových odchýlok každej hodnoty v poli od priemeru delené veľkosťou vzorky mínus 1.

disperzia vzorky používa sa funkcia DISP(), inž. názov VAR, t.j. VARIance. Od MS EXCEL 2010 sa odporúča používať jeho analóg DISP.V() , eng. názov VARS, t.j. Vzorový rozptyl. Okrem toho je od verzie MS EXCEL 2010 k dispozícii funkcia DISP.G (), eng. Názov VARP, t.j. VARIANTA populácie, ktorá počíta disperzia Pre populácia. Celý rozdiel spočíva v menovateli: namiesto n-1 ako DISP.V() má DISP.G() v menovateli len n. Pred MS EXCEL 2010 sa na výpočet rozptylu populácie používala funkcia VARP().

Ukážkový rozptyl
=SQUARE(Ukážka)/(POČET(Vzorka)-1)
=(SUMSQ(vzorka)-POCET(vzorka)*priemer (vzorka)^2)/ (POCET(vzorka)-1)- obvyklý vzorec
=SUM((Vzorka -PREMERNÝ(Vzorka))^2)/ (POČET(Vzorka)-1) –

Ukážkový rozptyl sa rovná 0 iba vtedy, ak sú všetky hodnoty navzájom rovnaké, a preto sú rovnaké stredná hodnota. Zvyčajne platí, že čím je hodnota väčšia disperzia, tým väčšie je rozšírenie hodnôt v poli.

Ukážkový rozptyl je bodový odhad disperzia rozdelenie náhodnej premennej, z ktorej vzorka. O budovaní intervaly spoľahlivosti pri hodnotení disperzia si môžete prečítať v článku.

Rozptyl náhodnej premennej

Kalkulovať disperzia náhodná premenná, musíte to vedieť.

Pre disperzia náhodná premenná X často používa označenie Var(X). Disperzia sa rovná štvorcu odchýlky od priemeru E(X): Var(X)=E[(X-E(X)) 2 ]

disperzia vypočítané podľa vzorca:

kde x i je hodnota, ktorú môže nadobudnúť náhodná premenná a μ je priemerná hodnota (), p(x) je pravdepodobnosť, že náhodná premenná nadobudne hodnotu x.

Ak má náhodná premenná , potom disperzia vypočítané podľa vzorca:

Rozmer disperzia zodpovedá druhej mocnine mernej jednotky pôvodných hodnôt. Napríklad, ak sú hodnoty vo vzorke merania hmotnosti dielu (v kg), potom rozmer rozptylu bude kg 2 . To môže byť ťažké interpretovať, a preto charakterizovať šírenie hodnôt, hodnotu rovnajúcu sa druhej odmocnine z disperziasmerodajná odchýlka.

Niektoré vlastnosti disperzia:

Var(X+a)=Var(X), kde X je náhodná premenná a a je konštanta.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X))2]=E=E(X2)-E(2*X*E(X))+(E(X))2=E(X2)- 2*E(X)*E(X)+(E(X))2 =E(X2)-(E(X))2

Táto disperzná vlastnosť sa využíva v článok o lineárnej regresii.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), kde X a Y sú náhodné premenné, Cov(X;Y) je kovariancia týchto náhodných premenných.

Ak sú náhodné premenné nezávislé, potom ich kovariancia je 0, a teda Var(X+Y)=Var(X)+Var(Y). Táto vlastnosť rozptylu sa používa vo výstupe.

Ukážme, že pre nezávislé veličiny Var(X-Y)=Var(X+Y). Skutočne, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var(X) + (- 1) 2 Var (Y) \u003d Var (X) + Var (Y) \u003d Var (X + Y). Táto vlastnosť rozptylu sa používa na vykreslenie .

Štandardná odchýlka vzorky

Štandardná odchýlka vzorky je mierou toho, do akej miery sú hodnoty vo vzorke rozptýlené vzhľadom na ich .

A-priory, smerodajná odchýlka sa rovná druhej odmocnine z disperzia:

Smerodajná odchýlka nezohľadňuje veľkosť hodnôt v vzorkovanie, ale iba stupeň rozptylu hodnôt okolo nich stredná. Na ilustráciu si uveďme príklad.

Vypočítajme smerodajnú odchýlku pre 2 vzorky: (1; 5; 9) a (1001; 1005; 1009). V oboch prípadoch s=4. Je zrejmé, že pomer štandardnej odchýlky k hodnotám poľa je pre vzorky výrazne odlišný. Pre takéto prípady použite Variačný koeficient(Variačný koeficient, CV) - pomer smerodajná odchýlka k priemeru aritmetika, vyjadrené v percentách.

V MS EXCEL 2007 a starších verziách na výpočet Štandardná odchýlka vzorky používa sa funkcia =STDEV(), inž. názov STDEV, t.j. smerodajná odchýlka. Od MS EXCEL 2010 sa odporúča používať jeho analóg = STDEV.B () , eng. názov STDEV.S, t.j. Ukážka štandardnej odchýlky.

Okrem toho je od verzie MS EXCEL 2010 k dispozícii funkcia STDEV.G () , eng. názov STDEV.P, t.j. Populácia štandardná odchýlka, ktorá počíta smerodajná odchýlka Pre populácia. Celý rozdiel spočíva v menovateli: namiesto n-1 ako STDEV.V() má STDEV.G() v menovateli len n.

Smerodajná odchýlka možno vypočítať aj priamo zo vzorcov nižšie (pozri súbor s príkladom)
=SQRT(SQUADROTIV(Vzorka)/(POČET(Vzorka)-1))
=SQRT((SUMSQ(vzorka)-POČET(vzorka)*PREMERNÝ(vzorka)^2)/(POČET (vzorka)-1))

Iné rozptylové opatrenia

Funkcia SQUADRIVE() počíta s umm štvorcových odchýlok hodnôt od ich hodnôt stredná. Táto funkcia vráti rovnaký výsledok ako vzorec =VAR.G( Ukážka)*SKONTROLOVAŤ( Ukážka) , Kde Ukážka- odkaz na rozsah obsahujúci pole vzorových hodnôt (). Výpočty vo funkcii QUADROTIV() sa vykonávajú podľa vzorca:

Funkcia SROOT() je tiež mierou rozptylu množiny údajov. Funkcia SIROTL() vypočítava priemer absolútnych hodnôt odchýlok hodnôt od stredná. Táto funkcia vráti rovnaký výsledok ako vzorec =SÚČETNÝ PRODUKT(ABS(vzorka-priemer (vzorka)))/POČET (vzorka), Kde Ukážka- odkaz na rozsah obsahujúci pole vzorových hodnôt.

Výpočty vo funkcii SROOTKL () sa vykonávajú podľa vzorca:

.

Naopak, ak je nezáporné a.e. funkciu takú, že , potom existuje absolútne spojitá miera pravdepodobnosti na takej, ktorou je jej hustota.

    Zmena miery v Lebesgueovom integráli:

,

kde je ľubovoľná Borelova funkcia integrovateľná vzhľadom na mieru pravdepodobnosti .

Disperzia, druhy a vlastnosti disperzie Pojem disperzia

Rozptyl v štatistike sa zistí ako štandardná odchýlka jednotlivých hodnôt vlastnosti na druhú od aritmetického priemeru. V závislosti od počiatočných údajov sa určuje pomocou jednoduchých a vážených vzorcov rozptylu:

1. jednoduchý rozptyl(pre nezoskupené údaje) sa vypočíta podľa vzorca:

2. Vážená odchýlka (pre sériu variácií):

kde n - frekvencia (faktor opakovateľnosti X)

Príklad hľadania rozptylu

Táto stránka popisuje štandardný príklad hľadania odchýlky, môžete sa pozrieť aj na ďalšie úlohy na jej nájdenie

Príklad 1. Určenie skupiny, priemeru skupiny, medziskupiny a celkového rozptylu

Príklad 2. Nájdenie rozptylu a variačného koeficientu v zoskupovacej tabuľke

Príklad 3. Nájdenie rozptylu v diskrétnom rade

Príklad 4. Máme nasledujúce údaje pre skupinu 20 korešpondenčných študentov. Je potrebné zostaviť intervalový rad distribúcie prvkov, vypočítať strednú hodnotu prvku a študovať jeho rozptyl

Zostavme intervalové zoskupenie. Určme rozsah intervalu podľa vzorca:

kde X max je maximálna hodnota funkcie zoskupenia; X min je minimálna hodnota funkcie zoskupenia; n je počet intervalov:

Akceptujeme n=5. Krok je: h \u003d (192 - 159) / 5 \u003d 6,6

Urobme intervalové zoskupenie

Pre ďalšie výpočty vytvoríme pomocnú tabuľku:

X "i - stred intervalu. (napríklad stred intervalu 159 - 165,6 \u003d 162,3)

Priemerný rast študentov je určený vzorcom aritmetického váženého priemeru:

Disperziu určíme podľa vzorca:

Vzorec je možné previesť takto:

Z tohto vzorca to vyplýva rozptyl je rozdiel medzi priemerom druhých mocnín možností a druhou mocninou a priemerom.

Rozptyl vo variačných sériách s rovnakými intervalmi podľa metódy momentov možno vypočítať nasledujúcim spôsobom pomocou druhej vlastnosti disperzie (vydelením všetkých možností hodnotou intervalu). Definícia rozptylu, vypočítaná metódou momentov, podľa nasledujúceho vzorca je časovo menej náročná:

kde i je hodnota intervalu; A - podmienená nula, pre ktorú je vhodné použiť stred intervalu s najvyššou frekvenciou; m1 je druhá mocnina okamihu prvého rádu; m2 - moment druhého rádu

Rozptyl vlastností (ak sa v štatistickej populácii atribút zmení tak, že existujú iba dve vzájomne sa vylučujúce možnosti, potom sa takáto variabilita nazýva alternatívna) možno vypočítať podľa vzorca:

Dosadením do tohto disperzného vzorca q = 1- p dostaneme:

Typy disperzie

Celkový rozptyl meria variáciu vlastnosti v celej populácii ako celku pod vplyvom všetkých faktorov, ktoré túto variáciu spôsobujú. Rovná sa strednej štvorci odchýlok jednotlivých hodnôt atribútu x od celkovej priemernej hodnoty x a možno ju definovať ako jednoduchý rozptyl alebo vážený rozptyl.

Vnútroskupinový rozptyl charakterizuje náhodnú variáciu, t.j. časť variácie, ktorá je spôsobená vplyvom nezohľadnených faktorov a nezávisí od znakového faktora, ktorý je základom zoskupenia. Tento rozptyl sa rovná strednej štvorci odchýlok jednotlivých hodnôt atribútu v rámci skupiny X od aritmetického priemeru skupiny a možno ho vypočítať ako jednoduchý rozptyl alebo ako vážený rozptyl.

teda merania rozptylu v rámci skupiny variácia vlastnosti v rámci skupiny a je určená vzorcom:

kde xi - priemer skupiny; ni je počet jednotiek v skupine.

Napríklad vnútroskupinové odchýlky, ktoré je potrebné určiť pri úlohe študovať vplyv kvalifikácie pracovníkov na úroveň produktivity práce v obchode, vykazujú odchýlky vo výstupe v každej skupine spôsobené všetkými možnými faktormi (technický stav zariadení, dostupnosť nástrojov a materiálov, vek pracovníkov, pracovná náročnosť a pod.), okrem rozdielov v kvalifikačnej kategórii (v rámci skupiny majú všetci pracovníci rovnakú kvalifikáciu).

Priemer odchýlok v rámci skupiny odráža náhodnú variáciu, to znamená tú časť variácie, ktorá sa vyskytla pod vplyvom všetkých ostatných faktorov, s výnimkou faktora zoskupovania. Vypočítava sa podľa vzorca:

Medziskupinový rozptyl charakterizuje systematickú variáciu výsledného znaku, ktorá je spôsobená vplyvom znaku-faktora, ktorý je základom zoskupenia. Rovná sa strednej štvorci odchýlok skupinových priemerov od celkového priemeru. Medziskupinový rozptyl sa vypočíta podľa vzorca: