Definícia variačného radu. Variačný rad a jeho charakteristika

Variačné série je séria číselných hodnôt funkcie.

Hlavné charakteristiky variačného radu: v - variant, p - frekvencia jeho výskytu.

Typy variačných sérií:

    podľa frekvencie výskytu variantov: jednoduchý - variant sa vyskytuje raz, vážený - variant sa vyskytuje dva a viackrát;

    opcie podľa miesta: zoradené - opcie sú usporiadané zostupne a vzostupne, nezoradené - opcie sa nezapisujú v určitom poradí;

    zoskupením možnosti do skupín: zoskupené - možnosti sa spájajú do skupín, nezoskupené - možnosti sa nezdružujú;

    podľa hodnoty opcie: spojité - možnosti sú vyjadrené ako celé číslo a zlomkové číslo, diskrétne - možnosti sú vyjadrené ako celé číslo, komplexné - opcie sú vyjadrené relatívnou alebo priemernou hodnotou.

Na výpočet priemerných hodnôt sa zostaví a zostaví variačná séria.

Forma zápisu variačného radu:

8. Priemerné hodnoty, druhy, spôsob výpočtu, aplikácia v zdravotníctve

Priemerné hodnoty- celková zovšeobecňujúca charakteristika kvantitatívnych charakteristík. Aplikácia priemerov:

1. Charakterizovať organizáciu práce zdravotníckych zariadení a zhodnotiť ich činnosť:

a) v poliklinike: ukazovatele vyťaženosti lekárov, priemerný počet návštev, priemerný počet obyvateľov v okolí;

b) v nemocnici: priemerný počet lôžkodní za rok; priemerná dĺžka pobytu v nemocnici;

c) v centre hygieny, epidemiológie a verejného zdravia: priemerná plocha (alebo kubický objem) na 1 osobu, priemerné výživové normy (bielkoviny, tuky, sacharidy, vitamíny, minerálne soli, kalórie), hygienické normy a normy atď.;

2. Charakterizovať telesný vývoj (hlavné antropometrické znaky morfologické a funkčné);

3. Zisťovať medicínske a fyziologické parametre organizmu za normálnych a patologických stavov v klinických a experimentálnych štúdiách.

4. V špeciálnom vedeckom výskume.

Rozdiel medzi priemernými hodnotami a ukazovateľmi:

1. Koeficienty charakterizujú alternatívny znak vyskytujúci sa len v niektorej časti štatistického tímu, ktorý sa môže, ale nemusí uskutočniť.

Priemerné hodnoty pokrývajú znaky vlastné všetkým členom tímu, ale v rôznej miere (hmotnosť, výška, dni liečenia v nemocnici).

2. Koeficienty sa používajú na meranie kvalitatívnych znakov. Priemerné hodnoty sú pre rôzne kvantitatívne znaky.

Typy priemerov:

    aritmetický priemer, jeho charakteristiky - smerodajná odchýlka a priemerná chyba

    režim a medián. Móda (Po)- zodpovedá hodnote vlastnosti, ktorá sa najčastejšie vyskytuje v tejto populácii. Medián (ja)- hodnota atribútu, ktorý v tejto populácii zaberá strednú hodnotu. Rozdeľuje sériu na 2 rovnaké časti podľa počtu pozorovaní. Aritmetický priemer (M)- na rozdiel od modu a mediánu sa spolieha na všetky vykonané pozorovania, preto je dôležitou charakteristikou pre celé rozdelenie.

    iné typy priemerov, ktoré sa používajú v špeciálnych štúdiách: odmocninový priemer, kubický, harmonický, geometrický, progresívny.

Aritmetický priemer charakterizuje priemernú úroveň štatistickej populácie.

Pre jednoduchú sériu kde

∑v – možnosť súčtu,

n je počet pozorovaní.

pre vážený rad, kde

∑vr je súčet súčinov každej možnosti a frekvencie jej výskytu

n je počet pozorovaní.

Smerodajná odchýlka aritmetický priemer alebo sigma (σ) charakterizuje rôznorodosť znaku

- pre jednoduchý riadok

Σd 2 - súčet druhých mocnín rozdielu medzi aritmetickým priemerom a každou možnosťou (d = │M-V│)

n je počet pozorovaní

- pre vážené série

∑d 2 p je súčet súčinov druhých mocnín rozdielu medzi aritmetickým priemerom a každou možnosťou a frekvenciou jej výskytu,

n je počet pozorovaní.

Mieru diverzity možno posúdiť podľa hodnoty variačného koeficientu
. Viac ako 20 % – silná diverzita, 10 – 20 % – stredná diverzita, menej ako 10 % – slabá diverzita.

Ak sa k aritmetickému priemeru pripočíta a odpočíta jedna sigma (M ± 1σ), potom pri normálnom rozdelení bude aspoň 68,3 % všetkých variantov (pozorovaní) v rámci týchto limitov, čo sa považuje za normu pre skúmaný jav. Ak k 2 ± 2σ, potom 95,5 % všetkých pozorovaní bude v rámci týchto limitov a ak k M ± 3σ, potom 99,7 % všetkých pozorovaní bude v rámci týchto limitov. Smerodajná odchýlka je teda smerodajná odchýlka, ktorá umožňuje predpovedať pravdepodobnosť výskytu takej hodnoty skúmaného znaku, ktorá je v stanovených medziach.

Priemerná chyba aritmetického priemeru alebo chyba reprezentatívnosti. Pre jednoduché, vážené série a podľa momentového pravidla:

.

Na výpočet priemerných hodnôt je potrebné: ​​homogenita materiálu, dostatočný počet pozorovaní. Ak je počet pozorovaní menší ako 30, vo vzorcoch na výpočet σ a m sa použije n-1.

Pri hodnotení výsledku získaného veľkosťou priemernej chyby sa používa koeficient spoľahlivosti, ktorý umožňuje určiť pravdepodobnosť správnej odpovede, to znamená, že výsledná vzorková chyba nebude väčšia ako skutočná chyba vykonaná v dôsledku nepretržitého pozorovania. V dôsledku toho sa so zvyšovaním pravdepodobnosti spoľahlivosti zvyšuje šírka intervalu spoľahlivosti, čo zase zvyšuje spoľahlivosť úsudku, podporu získaného výsledku.

Osobitné miesto v štatistickej analýze patrí určovaniu priemernej úrovne študovaného znaku alebo javu. Priemerná úroveň funkcie sa meria priemernými hodnotami.

Priemerná hodnota charakterizuje všeobecnú kvantitatívnu úroveň skúmaného znaku a je skupinovou vlastnosťou štatistickej populácie. Vyrovnáva, oslabuje náhodné odchýlky jednotlivých pozorovaní jedným alebo druhým smerom a vyzdvihuje hlavnú, typickú vlastnosť skúmaného znaku.

Priemery sú široko používané:

1. Zhodnotiť zdravotný stav obyvateľstva: charakteristiky telesného vývoja (výška, hmotnosť, obvod hrudníka a pod.), zisťovanie prevalencie a trvania rôznych ochorení, rozbor demografických ukazovateľov (prirodzený pohyb obyvateľstva, priemerná dĺžka života, reprodukcia obyvateľstva, priemerný počet obyvateľov a pod.).

2. Študovať činnosť zdravotníckych zariadení, zdravotníckeho personálu a posudzovať kvalitu ich práce, plánovanie a zisťovanie potrieb obyvateľstva v rôznych typoch zdravotnej starostlivosti (priemerný počet žiadostí alebo návštev na obyvateľa za rok, priemerná dĺžka pobytu pacienta v nemocnici, priemerná dĺžka vyšetrenia pacienta, priemerné zabezpečenie lekárov, lôžka a pod.).

3. Charakterizovať sanitárny a epidemiologický stav (priemerná prašnosť vzduchu v dielni, priemerná plocha na osobu, priemerná spotreba bielkovín, tukov a sacharidov a pod.).

4. Zisťovať medicínske a fyziologické parametre v norme a patológii, pri spracovaní laboratórnych údajov, zisťovať spoľahlivosť výsledkov výberovej štúdie v sociálno-hygienických, klinických, experimentálnych štúdiách.

Výpočet priemerných hodnôt sa vykonáva na základe variačných sérií. Variačné série- ide o kvalitatívne homogénny štatistický súbor, ktorého jednotlivé jednotky charakterizujú kvantitatívne rozdiely skúmaného znaku alebo javu.

Kvantitatívna variácia môže byť dvoch typov: nespojitá (diskrétna) a spojitá.

Nespojitý (diskrétny) znak je vyjadrený iba ako celé číslo a nemôže mať žiadne stredné hodnoty (napríklad počet návštev, počet obyvateľov lokality, počet detí v rodine, závažnosť ochorenia v bodoch atď.).

Súvislé znamienko môže nadobudnúť akékoľvek hodnoty v rámci určitých limitov, vrátane zlomkových, a je vyjadrené iba približne (napríklad hmotnosť - pre dospelých môže byť obmedzená na kilogramy a pre novorodencov - gramy; výška, krvný tlak, čas strávený návštevou pacienta atď.).



Digitálna hodnota každého jednotlivého znaku alebo javu zahrnutého v sérii variácií sa nazýva variant a označuje sa písmenom V . V matematickej literatúre sú napríklad aj iné zápisy X alebo r.

Variačná séria, kde je každá možnosť označená raz, sa nazýva jednoduchá. Takéto série sa používajú vo väčšine štatistických problémov v prípade počítačového spracovania údajov.

S nárastom počtu pozorovaní sa spravidla opakujú hodnoty variantu. V tomto prípade vytvára zoskupené variačné série, kde je uvedený počet opakovaní (frekvencia označená písmenom " R »).

Hodnotené série variácií pozostáva z možností usporiadaných vo vzostupnom alebo zostupnom poradí. Jednoduché aj zoskupené série môžu byť zostavené podľa poradia.

Intervalové variačné série sú zostavené s cieľom zjednodušiť následné výpočty vykonávané bez použitia počítača s veľmi veľkým počtom pozorovacích jednotiek (viac ako 1000).

Kontinuálne variačné série zahŕňa varianty hodnôt, ktoré môžu byť ľubovoľné.

Ak sú v sérii variácií hodnoty atribútu (možnosti) uvedené vo forme samostatných špecifických čísel, potom sa takáto séria nazýva diskrétne.

Všeobecné charakteristiky hodnôt atribútu odrážajúcich sa v sérii variácií sú priemerné hodnoty. Medzi najpoužívanejšie patria: aritmetický priemer M, móda Mo a medián ja. Každá z týchto vlastností je jedinečná. Nemôžu sa navzájom nahradiť a iba v súhrne, celkom úplne a stručne, sú znaky variačného radu.

Móda (Mo) pomenujte hodnotu najčastejšie sa vyskytujúcich možností.

Medián (ja) je hodnota variantu, ktorý delí rozsahový variačný rad na polovicu (na každej strane mediánu je polovica variantu). V zriedkavých prípadoch, keď existuje symetrický rad variácií, modus a medián sú si navzájom rovné a zhodujú sa s hodnotou aritmetického priemeru.

Najtypickejšou charakteristikou variantných hodnôt je aritmetický priemer hodnota( M ). V matematickej literatúre sa označuje .

Aritmetický priemer (M, ) je všeobecná kvantitatívna charakteristika určitého znaku skúmaných javov, ktoré tvoria kvalitatívne homogénny štatistický súbor. Rozlišujte medzi jednoduchým aritmetickým priemerom a váženým priemerom. Jednoduchý aritmetický priemer sa vypočíta pre jednoduchý variačný rad sčítaním všetkých možností a vydelením tohto súčtu celkovým počtom možností zahrnutých v tomto variačnom rade. Výpočty sa vykonávajú podľa vzorca:

,

Kde: M - jednoduchý aritmetický priemer;

Σ V - možnosť výberu sumy;

n- počet pozorovaní.

V zoskupených radoch variácií sa určí vážený aritmetický priemer. Vzorec na jeho výpočet:

,

Kde: M - aritmetický vážený priemer;

Σ vp - súčet produktov variantu na ich frekvenciách;

n- počet pozorovaní.

Pri veľkom počte pozorovaní v prípade manuálnych výpočtov možno použiť metódu momentov.

Aritmetický priemer má tieto vlastnosti:

súčet odchýlok variantu od priemeru ( Σ d ) sa rovná nule (pozri tabuľku 15);

Pri vynásobení (delení) všetkých možností rovnakým koeficientom (deliteľom) sa aritmetický priemer vynásobí (vydelí) rovnakým koeficientom (deliteľom);

Ak pridáte (odčítate) rovnaké číslo ku všetkým možnostiam, aritmetický priemer sa zvýši (zníži) o rovnaké číslo.

Aritmetické priemery ako také, bez zohľadnenia variability radov, z ktorých sú vypočítané, nemusia plne odrážať vlastnosti variačných radov, najmä ak je potrebné porovnanie s inými priemermi. Priemerné hodnoty blízke hodnote možno získať zo sérií s rôznym stupňom rozptylu. Čím sú si jednotlivé možnosti svojimi kvantitatívnymi charakteristikami bližšie, tým menej rozptyl (kolísanie, premenlivosť) série, tým typickejší je jej priemer.

Hlavné parametre, ktoré umožňujú posúdiť variabilitu znaku, sú:

· rozsah;

amplitúda;

· Smerodajná odchýlka;

· Variačný koeficient.

Približne fluktuáciu vlastnosti možno posúdiť podľa rozsahu a amplitúdy variačných sérií. Rozsah označuje maximálnu (V max) a minimálnu (V min) možnosti v sérii. Amplitúda (A m) je rozdiel medzi týmito možnosťami: A m = V max - V min .

Hlavným, všeobecne akceptovaným meradlom fluktuácie variačných radov sú disperzia (D ). Najčastejšie sa však používa vhodnejší parameter vypočítaný na základe rozptylu - smerodajná odchýlka ( σ ). Zohľadňuje hodnotu odchýlky ( d ) každého variantu variačného radu z jeho aritmetického priemeru ( d = V - M ).

Keďže odchýlky variantu od priemeru môžu byť kladné a záporné, pri súčte dávajú hodnotu „0“ (S d = 0). Aby sa tomu zabránilo, hodnoty odchýlok ( d) sa zvýšia na druhú mocninu a spriemerujú sa. Rozptyl variačného radu je teda priemernou druhou mocninou odchýlok variantu od aritmetického priemeru a vypočíta sa podľa vzorca:

.

Je to najdôležitejšia charakteristika variability a používa sa na výpočet mnohých štatistických testov.

Pretože rozptyl je vyjadrený ako štvorec odchýlok, jeho hodnotu nemožno použiť v porovnaní s aritmetickým priemerom. Na tieto účely sa používa smerodajná odchýlka, ktorý je označený znakom „Sigma“ ( σ ). Charakterizuje priemernú odchýlku všetkých variantov variačného radu od aritmetického priemeru v rovnakých jednotkách ako samotný priemer, takže ich možno použiť spolu.

Smerodajná odchýlka je určená vzorcom:

Tento vzorec sa používa pre počet pozorovaní ( n ) je väčší ako 30. S menším číslom n hodnota štandardnej odchýlky bude mať chybu spojenú s matematickou odchýlkou ​​( n - 1). V tomto ohľade možno získať presnejší výsledok zohľadnením takejto odchýlky vo vzorci na výpočet štandardnej odchýlky:

smerodajná odchýlka (s ) je odhad štandardnej odchýlky náhodnej premennej X vo vzťahu k jeho matematickému očakávaniu na základe nezaujatého odhadu jeho rozptylu.

Pre hodnoty n > 30 štandardná odchýlka ( σ ) a smerodajná odchýlka ( s ) bude rovnaký ( σ=s ). Preto sa vo väčšine praktických príručiek s týmito kritériami zaobchádza ako s rôznymi význammi. V Exceli je možné vykonať výpočet smerodajnej odchýlky pomocou funkcie =STDEV(rozsah). A aby ste mohli vypočítať smerodajnú odchýlku, musíte vytvoriť vhodný vzorec.

Odmocnina alebo štandardná odchýlka vám umožňuje určiť, do akej miery sa môžu hodnoty funkcie líšiť od strednej hodnoty. Predpokladajme, že existujú dve mestá s rovnakou priemernou dennou teplotou v lete. Jedno z týchto miest sa nachádza na pobreží a druhé na kontinente. Je známe, že v mestách ležiacich na pobreží sú rozdiely v denných teplotách menšie ako v mestách ležiacich vo vnútrozemí. Preto bude štandardná odchýlka denných teplôt v blízkosti pobrežného mesta menšia ako v druhom meste. V praxi to znamená, že priemerná teplota vzduchu každého konkrétneho dňa v meste ležiacom na kontinente sa bude líšiť od priemeru viac ako v meste na pobreží. Okrem toho štandardná odchýlka umožňuje odhadnúť možné teplotné odchýlky od priemeru s požadovanou úrovňou pravdepodobnosti.

Podľa teórie pravdepodobnosti existuje vo javoch, ktoré sa riadia zákonom normálneho rozdelenia, prísny vzťah medzi hodnotami aritmetického priemeru, smerodajnej odchýlky a možností ( pravidlo troch sigma). Napríklad 68,3 % hodnôt premenného atribútu je v rozmedzí M ± 1 σ , 95,5 % - v rámci M ± 2 σ a 99,7 % - v rámci M ± 3 σ .

Hodnota smerodajnej odchýlky umožňuje posúdiť povahu homogenity série variácií a skúmanej skupiny. Ak je hodnota smerodajnej odchýlky malá, znamená to dostatočne vysokú homogenitu skúmaného javu. Aritmetický priemer by sa v tomto prípade mal považovať za celkom charakteristický pre tento variačný rad. Príliš malá sigma však núti myslieť na umelý výber pozorovaní. Pri veľmi veľkej sigme aritmetický priemer charakterizuje variačný rad v menšej miere, čo naznačuje významnú variabilitu študovaného znaku alebo javu alebo heterogenitu skúmanej skupiny. Porovnanie hodnoty smerodajnej odchýlky je však možné len pre znaky rovnakého rozmeru. Ak totiž porovnáme hmotnostnú diverzitu novorodencov a dospelých, vždy dostaneme vyššie hodnoty sigma u dospelých.

Porovnanie variability znakov rôznych rozmerov je možné vykonať pomocou koeficient variácie. Diverzitu vyjadruje ako percento priemeru, čo umožňuje porovnanie rôznych vlastností. Variačný koeficient v lekárskej literatúre je označený znakom " S "a v matematickom" v» a vypočíta sa podľa vzorca:

.

Hodnoty variačného koeficientu menšie ako 10% naznačujú malý rozptyl, od 10 do 20% - približne priemer, viac ako 20% - silný rozptyl okolo aritmetického priemeru.

Aritmetický priemer sa zvyčajne vypočítava na základe údajov vzorky. Pri opakovaných štúdiách pod vplyvom náhodných javov sa aritmetický priemer môže zmeniť. Je to spôsobené tým, že sa spravidla skúma len časť možných jednotiek pozorovania, teda vzorová populácia. Informácie o všetkých možných jednotkách reprezentujúcich skúmaný jav možno získať štúdiom celej všeobecnej populácie, čo nie je vždy možné. Zároveň, aby sa zovšeobecnili experimentálne údaje, je zaujímavá hodnota priemeru vo všeobecnej populácii. Preto, aby bolo možné sformulovať všeobecný záver o skúmanom jave, výsledky získané na základe výberovej populácie musia byť štatistickými metódami prenesené na všeobecnú populáciu.

Aby bolo možné určiť mieru zhody medzi vzorovou štúdiou a všeobecnou populáciou, je potrebné odhadnúť množstvo chýb, ktoré nevyhnutne vznikajú pri pozorovaní vzorky. Takáto chyba sa nazýva chyba reprezentatívnosti“ alebo „Priemerná chyba aritmetického priemeru“. Ide v skutočnosti o rozdiel medzi priemermi získanými zo selektívneho štatistického pozorovania a podobnými hodnotami, ktoré by sa získali pri kontinuálnom štúdiu toho istého objektu, t. pri štúdiu bežnej populácie. Keďže priemer vzorky je náhodná premenná, takáto predpoveď sa robí s prijateľnou úrovňou pravdepodobnosti pre výskumníka. V lekárskom výskume je to minimálne 95 %.

Chyba reprezentatívnosti by sa nemala zamieňať s chybami v registrácii alebo s chybami v pozornosti (chybné tlačové chyby, nesprávne výpočty, tlačové chyby atď.), ktoré by sa mali minimalizovať vhodnou metodikou a nástrojmi použitými v experimente.

Veľkosť chyby reprezentatívnosti závisí tak od veľkosti vzorky, ako aj od variability znaku. Čím väčší je počet pozorovaní, tým je vzorka bližšie k bežnej populácii a tým menšia je chyba. Čím variabilnejšia je vlastnosť, tým väčšia je štatistická chyba.

V praxi sa na určenie chyby reprezentatívnosti vo variačných radoch používa nasledujúci vzorec:

,

Kde: m – chyba reprezentatívnosti;

σ – štandardná odchýlka;

n je počet pozorovaní vo vzorke.

Zo vzorca je vidieť, že veľkosť priemernej chyby je priamo úmerná štandardnej odchýlke, t.j. variabilite študovaného znaku, a nepriamo úmerná druhej odmocnine počtu pozorovaní.

Pri vykonávaní štatistickej analýzy založenej na výpočte relatívnych hodnôt nie je vytvorenie série variácií povinné. V tomto prípade je možné určiť priemernú chybu pre relatívne ukazovatele pomocou zjednodušeného vzorca:

,

Kde: R- hodnota relatívneho ukazovateľa vyjadrená v percentách, ppm atď.;

q- prevrátená hodnota P a vyjadrená ako (1-P), (100-P), (1000-P) atď., v závislosti od základu, pre ktorý sa ukazovateľ počíta;

n je počet pozorovaní vo vzorke.

Uvedený vzorec na výpočet chyby reprezentatívnosti pre relatívne hodnoty sa však môže použiť iba vtedy, keď je hodnota ukazovateľa nižšia ako jeho základ. V mnohých prípadoch výpočtu intenzívnych ukazovateľov táto podmienka nie je splnená a ukazovateľ možno vyjadriť ako číslo viac ako 100 % alebo 1000 %o. V takejto situácii sa vytvorí variačná séria a chyba reprezentatívnosti sa vypočíta pomocou vzorca pre priemerné hodnoty založené na štandardnej odchýlke.

Predpovedanie hodnoty aritmetického priemeru vo všeobecnej populácii sa vykonáva s uvedením dvoch hodnôt - minimálnej a maximálnej. Tieto extrémne hodnoty možných odchýlok, v rámci ktorých môže kolísať požadovaná priemerná hodnota bežnej populácie, sa nazývajú „ Hranice dôvery».

Postuláty teórie pravdepodobnosti dokázali, že pri normálnom rozdelení znaku s pravdepodobnosťou 99,7 % nepresiahnu extrémne hodnoty odchýlok priemeru hodnotu trojitej chyby reprezentatívnosti ( M ± 3 m ); v 95,5 % - nie viac ako hodnota zdvojnásobenej priemernej chyby priemernej hodnoty ( M ±2 m ); v 68,3 % - nie viac ako hodnota jednej priemernej chyby ( M ± 1 m ) (obr. 9).

P%

Ryža. 9. Hustota pravdepodobnosti normálneho rozdelenia.

Všimnite si, že vyššie uvedené tvrdenie platí len pre funkciu, ktorá sa riadi normálnym Gaussovým zákonom rozdelenia.

Väčšina experimentálnych štúdií, vrátane tých z oblasti medicíny, je spojená s meraniami, ktorých výsledky môžu mať v danom intervale takmer akúkoľvek hodnotu, preto sú spravidla popísané modelom spojitých náhodných premenných. V tomto ohľade väčšina štatistických metód zvažuje spojité distribúcie. Jedno z týchto rozdelení, ktoré hrá zásadnú úlohu v matematickej štatistike, je normálne alebo Gaussovo rozdelenie.

Je to z viacerých dôvodov.

1. Po prvé, mnohé experimentálne pozorovania možno úspešne opísať pomocou normálneho rozdelenia. Ihneď treba poznamenať, že neexistujú žiadne distribúcie empirických údajov, ktoré by boli presne normálne, pretože normálne rozložená náhodná premenná je v rozsahu od do , čo sa v praxi nikdy nevyskytuje. Normálne rozdelenie je však veľmi často dobrou aproximáciou.

Bez ohľadu na to, či sa vykonávajú merania hmotnosti, výšky a iných fyziologických parametrov ľudského tela - všade ovplyvňuje výsledky veľmi veľké množstvo náhodných faktorov (prirodzené príčiny a chyby merania). A spravidla je účinok každého z týchto faktorov nevýznamný. Skúsenosti ukazujú, že výsledky v takýchto prípadoch budú rozdelené približne normálne.

2. Mnohé distribúcie spojené s náhodnou vzorkou, so zvýšením objemu náhodnej vzorky, sa stanú normálnymi.

3. Normálne rozdelenie je vhodné ako približný popis iných spojitých rozdelení (napríklad asymetrických).

4. Normálne rozdelenie má množstvo priaznivých matematických vlastností, ktoré do značnej miery zabezpečili jeho široké využitie v štatistike.

Zároveň je potrebné poznamenať, že v lekárskych údajoch existuje veľa experimentálnych rozdelení, ktoré nemožno opísať modelom normálneho rozdelenia. Na tento účel štatistiky vyvinuli metódy, ktoré sa bežne nazývajú „neparametrické“.

Výber štatistickej metódy, ktorá je vhodná na spracovanie údajov konkrétneho experimentu, by sa mal robiť v závislosti od toho, či získané údaje patria do zákona normálneho rozdelenia. Testovanie hypotéz o podriadenosti znamienka zákonu normálneho rozdelenia sa vykonáva pomocou histogramu rozdelenia frekvencií (grafu), ako aj množstva štatistických kritérií. Medzi nimi:

Kritérium asymetrie ( b );

Kritériá na kontrolu špičatosti ( g );

Shapiro-Wilksovo kritérium ( W ) .

Pre každý parameter sa vykoná analýza povahy rozloženia údajov (nazýva sa aj test normality rozdelenia). Aby bolo možné s istotou posúdiť súlad rozdelenia parametrov s normálnym zákonom, je potrebný dostatočne veľký počet pozorovacích jednotiek (najmenej 30 hodnôt).

Pre normálne rozdelenie majú kritériá šikmosti a špičatosti hodnotu 0. Ak je rozdelenie posunuté doprava b > 0 (pozitívna asymetria), s b < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона g =0. O g > 0 distribučná krivka je ostrejšia, ak g < 0 пик более сглаженный, чем функция нормального распределения.

Na testovanie normality pomocou Shapiro-Wilksovho testu je potrebné nájsť hodnotu tohto kritéria pomocou štatistických tabuliek na požadovanej hladine významnosti a v závislosti od počtu jednotiek pozorovania (stupňov voľnosti). Príloha 1. Hypotéza normality sa zamieta pre malé hodnoty tohto kritéria, spravidla pre w <0,8.

Koncept variačnej série. Prvým krokom pri systematizácii materiálov štatistického pozorovania je počítanie počtu jednotiek, ktoré majú jednu alebo druhú vlastnosť. Po zoradení jednotiek vzostupne alebo zostupne podľa ich kvantitatívneho atribútu a spočítaní počtu jednotiek s konkrétnou hodnotou atribútu dostaneme variačný rad. Variačný rad charakterizuje rozdelenie jednotiek určitej štatistickej populácie podľa nejakého kvantitatívneho atribútu.

Séria variácií pozostáva z dvoch stĺpcov, ľavý stĺpec obsahuje hodnoty atribútu premennej nazývané varianty a označené (x) a pravý stĺpec obsahuje absolútne čísla, ktoré ukazujú, koľkokrát sa každý variant vyskytuje. Hodnoty v tomto stĺpci sa nazývajú frekvencie a sú označené (f).

Schematicky možno sériu variácií znázorniť vo forme tabuľky 5.1:

Tabuľka 5.1

Typ série variácií

Možnosti (x)

Frekvencie (f)

V pravom stĺpci možno použiť aj relatívne ukazovatele charakterizujúce podiel frekvencie jednotlivých variantov na celkovom množstve frekvencií. Tieto relatívne ukazovatele sa nazývajú frekvencie a konvenčne sa označujú , t.j. . Súčet všetkých frekvencií sa rovná jednej. Frekvencie môžu byť vyjadrené aj v percentách a ich súčet sa potom bude rovnať 100 %.

Variabilné znaky môžu mať rôznu povahu. Varianty niektorých znakov sú vyjadrené celými číslami, napríklad počet izieb v byte, počet vydaných kníh atď. Tieto znaky sa nazývajú nespojité alebo diskrétne. Varianty iných znakov môžu nadobudnúť akékoľvek hodnoty v rámci určitých limitov, ako je plnenie plánovaných cieľov, mzdy a pod. Tieto znaky sa nazývajú spojité.

Séria diskrétnych variácií. Ak sú varianty variačného radu vyjadrené ako diskrétne hodnoty, potom sa takýto variačný rad nazýva diskrétny a jeho vzhľad je uvedený v tabuľke. 5.2:

Tabuľka 5.2

Rozdelenie študentov podľa známok získaných na skúške

Hodnotenia (x)

Počet študentov (f)

V % z celkového počtu ()

Charakter rozloženia v diskrétnych radoch je graficky znázornený ako polygón rozloženia, Obr.5.1.

Ryža. 5.1. Rozdelenie študentov podľa známok získaných na skúške.

Intervalové variačné série. Pre spojité znaky sú rady variácií konštruované ako intervalové rady, t.j. hodnoty vlastností v nich sú vyjadrené ako intervaly „od a do“. V tomto prípade sa minimálna hodnota prvku v takomto intervale nazýva dolná hranica intervalu a maximálna hodnota sa nazýva horná hranica intervalu.

Intervalové variačné série sú zostavené pre nespojité funkcie (diskrétne), ako aj pre tie, ktoré sa líšia vo veľkom rozsahu. Intervalové riadky môžu mať rovnaké a nerovnaké intervaly. V hospodárskej praxi sa väčšinou používajú nerovnaké intervaly, ktoré sa postupne zväčšujú alebo zmenšujú. Takáto potreba vzniká najmä v prípadoch, keď sa kolísanie znamenia vykonáva nerovnomerne a vo veľkých medziach.

Zvážte typ intervalového radu s rovnakými intervalmi, tabuľka. 5.3:

Tabuľka 5.3

Rozdelenie pracovníkov podľa výkonu

Výstup, tr. (X)

Počet pracovníkov (f)

Kumulatívna frekvencia (f´)

Séria intervalového rozdelenia je graficky znázornená ako histogram, Obr.5.2.

Obr.5.2. Rozdelenie pracovníkov podľa výkonu

Akumulovaná (kumulatívna) frekvencia. V praxi vzniká potreba previesť distribučné série na kumulatívna séria, postavené na akumulovaných frekvenciách. Môžu sa použiť na definovanie štrukturálnych priemerov, ktoré uľahčujú analýzu údajov distribučných radov.

Kumulatívne frekvencie sa určujú postupným sčítaním frekvencií (alebo frekvencií) prvej skupiny týchto ukazovateľov nasledujúcich skupín distribučného radu. Kumulácie a ogivy sa používajú na ilustráciu distribučných radov. Na ich zostavenie sú hodnoty diskrétneho prvku (alebo konce intervalov) označené na osi x a rastúce súčty frekvencií (kumulované) sú vyznačené na osi ordinátov, obr.5.3.

Ryža. 5.3. Kumulatívne rozdelenie pracovníkov podľa vývoja

Ak sa zamieňajú stupnice frekvencií a variantov, t.j. odrážať akumulované frekvencie na osi x a hodnoty možností na osi y, potom sa krivka charakterizujúca zmenu frekvencií od skupiny ku skupine bude nazývať distribučný ogive, obr. 5.4.

Ryža. 5.4. Ogiva rozdeľovanie pracovníkov do výroby

Variačné rady s rovnakými intervalmi poskytujú jednu z najdôležitejších požiadaviek na štatistické distribučné rady, zabezpečujúc ich porovnateľnosť v čase a priestore.

Hustota distribúcie. Frekvencie jednotlivých nerovnakých intervalov v týchto radoch však nie sú priamo porovnateľné. V takýchto prípadoch sa na zabezpečenie potrebnej porovnateľnosti vypočíta hustota rozloženia, t.j. určiť, koľko jednotiek v každej skupine pripadá na jednotku hodnoty intervalu.

Pri konštrukcii distribučného grafu variačného radu s nerovnakými intervalmi sa výška obdĺžnikov určuje v pomere nie k frekvenciám, ale k ukazovateľom hustoty distribúcie hodnôt študovaného znaku v zodpovedajúcich intervaloch.

Zostavenie variačného radu a jeho grafické znázornenie je prvým krokom spracovania počiatočných údajov a prvým krokom analýzy skúmanej populácie. Ďalším krokom pri analýze variačných radov je určenie hlavných zovšeobecňujúcich ukazovateľov, ktoré sa nazývajú charakteristiky radu. Tieto charakteristiky by mali poskytnúť predstavu o priemernej hodnote atribútu v jednotkách populácie.

priemerná hodnota. Priemerná hodnota je zovšeobecnená charakteristika študovaného znaku v skúmanej populácii, odrážajúca jeho typickú úroveň na jednotku populácie v špecifických podmienkach miesta a času.

Priemerná hodnota je vždy pomenovaná, má rovnaký rozmer ako atribút jednotlivých jednotiek populácie.

Pred výpočtom priemerných hodnôt je potrebné zoskupiť jednotky študovanej populácie, pričom treba zvýrazniť kvalitatívne homogénne skupiny.

Priemer vypočítaný pre populáciu ako celok sa nazýva všeobecný priemer a pre každú skupinu - skupinové priemery.

Existujú dva typy priemerov: mocniny (aritmetický priemer, harmonický priemer, geometrický priemer, kvadratický priemer); štrukturálne (mód, medián, kvartily, decily).

Výber priemeru pre výpočet závisí od účelu.

Typy výkonových priemerov a metódy ich výpočtu. V praxi štatistického spracovania zozbieraného materiálu vznikajú rôzne problémy, na riešenie ktorých sú potrebné rôzne priemery.

Matematická štatistika odvodzuje rôzne prostriedky zo vzorcov mocninných priemerov:

kde je priemerná hodnota; x - jednotlivé možnosti (hodnoty vlastností); z - exponent (pri z = 1 - aritmetický priemer, z = 0 geometrický priemer, z = - 1 - harmonický priemer, z = 2 - stredný kvadratický priemer).

Otázku, aký typ priemeru by sa mal použiť v každom jednotlivom prípade, však rieši špecifická analýza skúmanej populácie.

Najbežnejším typom priemeru v štatistike je aritmetický priemer. Vypočítava sa v tých prípadoch, keď je objem spriemerovaného atribútu tvorený súčtom jeho hodnôt pre jednotlivé jednotky študovanej štatistickej populácie.

V závislosti od povahy počiatočných údajov sa aritmetický priemer určuje rôznymi spôsobmi:

Ak údaje nie sú zoskupené, výpočet sa vykoná podľa vzorca jednoduchej priemernej hodnoty

Výpočet aritmetického priemeru v diskrétnom rade prebieha podľa vzorca 3.4.

Výpočet aritmetického priemeru v intervalovom rade. V sérii variácií intervalu, kde sa stred intervalu podmienečne berie ako hodnota znaku v každej skupine, sa aritmetický priemer môže líšiť od priemeru vypočítaného z nezoskupených údajov. Navyše, čím väčší je interval v skupinách, tým väčšie sú možné odchýlky priemeru vypočítaného zo zoskupených údajov od priemeru vypočítaného z nezoskupených údajov.

Pri výpočte priemeru pre sériu variácií intervalov sa na vykonanie potrebných výpočtov postupuje od intervalov k ich stredom. A potom vypočítajte priemernú hodnotu podľa vzorca aritmetického váženého priemeru.

Vlastnosti aritmetického priemeru. Aritmetický priemer má niektoré vlastnosti, ktoré nám umožňujú zjednodušiť výpočty, zvážme ich.

1. Aritmetický priemer konštantných čísel sa rovná tomuto konštantnému číslu.

Ak x = a. Potom .

2. Ak sa proporcionálne zmenia váhy všetkých opcií, t.j. zvýšiť alebo znížiť o rovnaký počet, potom sa aritmetický priemer nového radu od tohto nezmení.

Ak sa všetky váhy f znížia o k krát, potom .

3. Súčet kladných a záporných odchýlok jednotlivých opcií od priemeru vynásobený váhami sa rovná nule, t.j.

Ak potom . Odtiaľ.

Ak sa všetky možnosti znížia alebo zvýšia o nejaké číslo, aritmetický priemer novej série sa zníži alebo zvýši o rovnakú hodnotu.

Znížte všetky možnosti X na a, t.j. X´ = Xa.

Potom

Aritmetický priemer počiatočnej série možno získať pripočítaním k redukovanému priemeru čísla, ktoré sa predtým odpočítalo od variantov a, t.j. .

5. Ak sú všetky možnosti znížené alebo zvýšené v k krát, potom sa aritmetický priemer nového radu zníži alebo zvýši o rovnakú hodnotu, t.j. V k raz.

Nechaj potom .

Preto, t.j. na získanie priemeru pôvodnej série sa musí aritmetický priemer novej série (so zníženými možnosťami) zvýšiť o k raz.

Priemerná harmonická. Harmonický priemer je prevrátená hodnota aritmetického priemeru. Používa sa vtedy, keď štatistické informácie neobsahujú frekvencie pre jednotlivé možnosti populácie, ale sú prezentované ako ich súčin (M = xf). Harmonický priemer sa vypočíta pomocou vzorca 3.5

Praktickou aplikáciou harmonického priemeru je výpočet niektorých indexov, najmä cenového indexu.

Geometrický priemer. Pri použití geometrického priemeru sú jednotlivé hodnoty atribútu spravidla relatívne hodnoty dynamiky, zostavené vo forme reťazových hodnôt, ako pomer k predchádzajúcej úrovni každej úrovne v sérii dynamiky. Priemer teda charakterizuje priemernú mieru rastu.

Geometrický priemer sa tiež používa na určenie ekvidistantnej hodnoty z maximálnych a minimálnych hodnôt atribútu. Poisťovňa napríklad uzatvára zmluvy o poskytovaní služieb poistenia automobilov. V závislosti od konkrétnej poistnej udalosti sa výška poistného môže pohybovať od 10 000 do 100 000 dolárov ročne. Priemerná výplata poistenia je USD.

Geometrický priemer je hodnota použitá ako priemer pomerov alebo v distribučnom rade, prezentovaná ako geometrická progresia, keď z = 0. Tento priemer je vhodné použiť, keď sa nevenuje pozornosť absolútnym rozdielom, ale pomerom dvoch čísel.

Vzorce na výpočet sú nasledovné

kde sú varianty spriemerovaného znaku; - súčin opcií; f– frekvencia možností.

Geometrický priemer sa používa pri výpočte priemernej ročnej miery rastu.

Hlavné námestie. Vzorec odmocniny sa používa na meranie stupňa fluktuácie jednotlivých hodnôt vlastnosti okolo aritmetického priemeru v distribučnom rade. Takže pri výpočte ukazovateľov variácie sa priemer vypočíta zo štvorcov odchýlok jednotlivých hodnôt vlastnosti od aritmetického priemeru.

Stredná štvorcová hodnota sa vypočíta podľa vzorca

V ekonomickom výskume je modifikovaná forma stredného štvorca široko používaná pri výpočte ukazovateľov variácie vlastnosti, ako je rozptyl, štandardná odchýlka.

Vládne väčšina. Medzi mocninnými priemermi je nasledujúci vzťah - čím väčší exponent, tým väčšia hodnota priemeru, tabuľka 5.4:

Tabuľka 5.4

Vzťah medzi priemermi

hodnota z

Pomer medzi priemermi

Tento vzťah sa nazýva pravidlo majority.

Štrukturálne priemery. Na charakterizáciu štruktúry obyvateľstva sa používajú špeciálne ukazovatele, ktoré možno nazvať štrukturálnymi priemermi. Tieto miery zahŕňajú režim, medián, kvartily a decily.

Móda. Režim (Mo) je najčastejšie sa vyskytujúca hodnota prvku v populačných jednotkách. Režim je hodnota vlastnosti, ktorá zodpovedá maximálnemu bodu krivky teoretickej distribúcie.

Móda je široko používaná v obchodnej praxi pri štúdiu spotrebiteľského dopytu (pri určovaní veľkostí odevov a obuvi, ktoré sú veľmi žiadané), registrácii cien. Celkovo môže byť niekoľko modov.

Výpočet režimu v diskrétnom rade. V diskrétnej sérii je režim variantom s najvyššou frekvenciou. Zvážte nájdenie režimu v samostatnej sérii.

Výpočet módy v intervalovom rade. V intervalovom variačnom rade sa centrálny variant modálneho intervalu približne považuje za mód, t.j. interval, ktorý má najvyššiu frekvenciu (frekvenciu). V rámci intervalu je potrebné nájsť hodnotu atribútu, ktorým je režim. Pre intervalové série bude režim určený vzorcom

kde je spodná hranica modálneho intervalu; je hodnota modálneho intervalu; je frekvencia zodpovedajúca modálnemu intervalu; je frekvencia predchádzajúca modálnemu intervalu; je frekvencia intervalu nasledujúceho po modál.

Medián. Medián () je hodnota prvku v strednej jednotke hodnotenej série. Hodnotená séria je séria, v ktorej sú charakteristické hodnoty zapísané vo vzostupnom alebo zostupnom poradí. Alebo medián je hodnota, ktorá rozdeľuje počet usporiadaných variačných sérií na dve rovnaké časti: jedna časť má hodnotu premennej vlastnosti, ktorá je menšia ako priemerný variant, a druhá je veľká.

Na nájdenie mediánu sa najprv určí jeho sériové číslo. K tomu sa pri nepárnom počte jednotiek pripočíta jedna k súčtu všetkých frekvencií a všetko sa vydelí dvomi. Pri párnom počte jednotiek sa medián zistí ako hodnota atribútu jednotky, ktorej poradové číslo je určené celkovým súčtom frekvencií deleným dvomi. Keď poznáme poradové číslo mediánu, je ľahké nájsť jeho hodnotu z nahromadených frekvencií.

Výpočet mediánu v diskrétnom rade. Podľa výberového zisťovania boli získané údaje o rozložení rodín podľa počtu detí, tab. 5.5. Ak chcete určiť medián, najprv určte jeho poradové číslo

V týchto rodinách je počet detí 2, teda = 2. V 50% rodín teda počet detí nepresahuje 2.

–akumulovaná frekvencia predchádzajúca strednému intervalu;

Na jednej strane je to veľmi pozitívna vlastnosť. v tomto prípade sa berie do úvahy vplyv všetkých príčin ovplyvňujúcich všetky jednotky skúmanej populácie. Na druhej strane, aj jedno pozorovanie, ktoré bolo náhodne zahrnuté do počiatočných údajov, môže výrazne skresliť predstavu o úrovni rozvoja skúmaného znaku v uvažovanej populácii (najmä v krátkych sériách).

Kvartily a decily. Analogicky s hľadaním mediánu vo variačných sériách je možné nájsť hodnotu prvku v ľubovoľnej jednotke zoradeného radu v poradí. Najmä je možné nájsť hodnotu funkcie pre jednotky rozdeľujúce sériu na 4 rovnaké časti, na 10 atď.

Kvartily. Varianty, ktoré rozdeľujú zoradené série na štyri rovnaké časti, sa nazývajú kvartily.

Zároveň sa rozlišujú: dolný (alebo prvý) kvartil (Q1) - hodnota znaku v jednotke hodnoteného radu, deliaca populáciu v pomere ¼ ku ¾ a horný (alebo tretí) kvartil (Q3) - hodnota znaku v jednotke zoradeného radu, deliaca populáciu v pomere ¾ ku ¼.

– frekvencie kvartilových intervalov (dolný a horný)

Intervaly obsahujúce Q1 a Q3 sú určené z akumulovaných frekvencií (alebo frekvencií).

Deciles. Okrem kvartilov sa počítajú decily – možnosti, ktoré rozdeľujú zoradené série na 10 rovnakých častí.

Označujú sa D, prvý decil D1 delí rad v pomere 1/10 a 9/10, druhý D2 - 2/10 a 8/10 atď. Vypočítavajú sa rovnakým spôsobom ako medián a kvartily.

Medián, kvartily a decily patria do takzvanej ordinálnej štatistiky, ktorá sa chápe ako variant, ktorý zaberá určité ordinálne miesto v zoradenom rade.

Séria variácií – séria, v ktorej sa porovnávajú (vo vzostupnom alebo zostupnom poradí) možnosti a ich príslušné frekvencie

Varianty sú samostatné kvantitatívne vyjadrenia vlastnosti. Označené latinským písmenom V . Klasické chápanie pojmu „variant“ predpokladá, že každá jedinečná hodnota funkcie sa nazýva variant, bez ohľadu na počet opakovaní.

Napríklad vo variačnej sérii indikátorov systolického krvného tlaku meraných u desiatich pacientov:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

iba 6 hodnôt je možností:

110, 120, 130, 140, 160, 170.

Frekvencia je číslo označujúce, koľkokrát sa možnosť opakuje. Označuje sa latinským písmenom P . Súčet všetkých frekvencií (ktorý sa samozrejme rovná počtu všetkých študovaných) sa označuje ako n.

    V našom príklade budú frekvencie nadobúdať nasledujúce hodnoty:
  • pre variant 110 frekvencia P = 1 (hodnota 110 sa vyskytuje u jedného pacienta),
  • pre variant 120 frekvencia P = 2 (hodnota 120 sa vyskytuje u dvoch pacientov),
  • pre variant 130 frekvencia P = 3 (hodnota 130 sa vyskytuje u troch pacientov),
  • pre variant 140 frekvencia P = 2 (hodnota 140 sa vyskytuje u dvoch pacientov),
  • pre variant 160 frekvencia P = 1 (hodnota 160 sa vyskytuje u jedného pacienta),
  • pre variant 170 frekvencia P = 1 (hodnota 170 sa vyskytuje u jedného pacienta),

Typy variačných sérií:

  1. jednoduché- ide o sériu, v ktorej sa každá možnosť vyskytuje iba raz (všetky frekvencie sú rovné 1);
  2. pozastavené- séria, v ktorej sa opakovane vyskytuje jedna alebo viac možností.

Séria variácií sa používa na opis veľkých polí čísel; v tejto forme sú na začiatku prezentované zozbierané údaje väčšiny lekárskych štúdií. Na charakterizáciu variačných radov sa počítajú špeciálne ukazovatele vrátane priemerných hodnôt, ukazovateľov variability (tzv. rozptyl), ukazovateľov reprezentatívnosti výberových údajov.

Indikátory série variácií

1) Aritmetický priemer je zovšeobecňujúci ukazovateľ, ktorý charakterizuje veľkosť študovaného znaku. Aritmetický priemer je označený ako M , je najbežnejším typom priemeru. Aritmetický priemer sa vypočíta ako pomer súčtu hodnôt ukazovateľov všetkých jednotiek pozorovania k počtu všetkých skúmaných. Metóda výpočtu aritmetického priemeru sa líši pre jednoduchý a vážený rad variácií.

Vzorec na výpočet jednoduchý aritmetický priemer:

Vzorec na výpočet vážený aritmetický priemer:

M = Σ(V*P)/n

​ 2) Režim - ďalšia priemerná hodnota variačného radu, zodpovedajúca najčastejšie opakovanému variantu. Alebo inak povedané, toto je možnosť, ktorá zodpovedá najvyššej frekvencii. Označený ako Mo . Režim sa počíta len pre vážené série, keďže v jednoduchých sériách sa žiadna z možností neopakuje a všetky frekvencie sú rovné jednej.

Napríklad v sérii variácií hodnôt srdcovej frekvencie:

80, 84, 84, 86, 86, 86, 90, 94;

hodnota režimu je 86, keďže tento variant sa vyskytuje 3-krát, preto je jeho frekvencia najvyššia.

3) Medián - hodnota opcie, deliaca sériu variácií na polovicu: na jej oboch stranách je rovnaký počet opcií. Medián, ako aj aritmetický priemer a režim sa vzťahujú na priemerné hodnoty. Označený ako ja

4) Smerodajná odchýlka (synonymá: štandardná odchýlka, odchýlka sigma, sigma) - miera variability radu variácií. Ide o integrálny ukazovateľ, ktorý kombinuje všetky prípady odchýlky variantu od priemeru. V skutočnosti odpovedá na otázku: ako ďaleko a ako často sa opcie šíria od aritmetického priemeru. Označené gréckym písmenom σ ("sigma").

Ak je veľkosť populácie väčšia ako 30 jednotiek, štandardná odchýlka sa vypočíta pomocou nasledujúceho vzorca:

Pre malé populácie – 30 jednotiek pozorovania alebo menej – sa štandardná odchýlka vypočíta pomocou iného vzorca:

(definícia variačného radu; zložky variačného radu; tri formy variačného radu; účelnosť zostrojenia intervalového radu; závery, ktoré možno zo zostrojeného radu vyvodiť)

Variačný rad je postupnosť všetkých prvkov vzorky usporiadaných v neklesajúcom poradí. Opakujú sa tie isté prvky

Variačné – ide o série postavené na kvantitatívnom základe.

Variačné distribučné rady pozostávajú z dvoch prvkov: variantov a frekvencií:

Varianty sú číselné hodnoty kvantitatívneho znaku v sérii variácií distribúcie. Môžu byť pozitívne alebo negatívne, absolútne alebo relatívne. Takže pri zoskupovaní podnikov podľa výsledkov hospodárskej činnosti sú možnosti pozitívne - to je zisk a záporné čísla - to je strata.

Frekvencie sú počty jednotlivých variantov alebo každej skupiny variačného radu, t.j. toto sú čísla ukazujúce, ako často sa určité možnosti vyskytujú v distribučnej sérii. Súčet všetkých frekvencií sa nazýva objem populácie a je určený počtom prvkov celej populácie.

Frekvencie sú frekvencie vyjadrené ako relatívne hodnoty (zlomky jednotiek alebo percent). Súčet frekvencií sa rovná jednej alebo 100 %. Nahradenie frekvencií frekvenciami umožňuje porovnávať variačné série s rôznym počtom pozorovaní.

Existujú tri formy variačných sérií: zoradené série, diskrétne série a intervalové série.

Zoradený rad predstavuje rozloženie jednotlivých jednotiek populácie vo vzostupnom alebo zostupnom poradí podľa študovaného znaku. Hodnotenie uľahčuje rozdelenie kvantitatívnych údajov do skupín, okamžité zistenie najmenších a najväčších hodnôt funkcie, zvýraznenie hodnôt, ktoré sa najčastejšie opakujú.

Ďalšími formami variačných sérií sú skupinové tabuľky zostavené podľa povahy variácií v hodnotách študovaného znaku. Podľa povahy variácie sa rozlišujú diskrétne (nespojité) a spojité znaky.

Diskrétny rad je taký variačný rad, ktorého konštrukcia je založená na znakoch s nespojitou zmenou (diskrétne znaky). Tieto zahŕňajú tarifnú kategóriu, počet detí v rodine, počet zamestnancov v podniku atď. Tieto znaky môžu nadobúdať iba konečný počet určitých hodnôt.

Diskrétny variačný rad je tabuľka, ktorá pozostáva z dvoch stĺpcov. Prvý stĺpec označuje konkrétnu hodnotu atribútu a druhý - počet jednotiek populácie s konkrétnou hodnotou atribútu.

Ak sa znamienko neustále mení (výška príjmu, pracovné skúsenosti, náklady na fixné aktíva podniku atď., ktoré môžu nadobudnúť akúkoľvek hodnotu v rámci určitých limitov), ​​musí sa pre toto znamenie zostaviť séria intervalových variácií.



Tabuľka skupín tu má tiež dva stĺpce. Prvý označuje hodnotu funkcie v intervale "od - do" (možnosti), druhý - počet jednotiek zahrnutých v intervale (frekvencia).

Frekvencia (frekvencia opakovania) - počet opakovaní konkrétneho variantu hodnôt atribútu, označovaného fi , a súčet frekvencií rovnajúci sa objemu študovanej populácie, označ.

Kde k je počet možností hodnoty atribútu

Veľmi často je tabuľka doplnená o stĺpec, v ktorom sú vypočítané akumulované frekvencie S, ktoré ukazujú, koľko jednotiek populácie má hodnotu znaku nie väčšiu ako táto hodnota.

Diskrétny variačný distribučný rad je rad, v ktorom sú skupiny zložené podľa znaku, ktorý sa mení diskrétne a má iba celočíselné hodnoty.

Séria distribúcie intervalových variácií je séria, v ktorej atribút zoskupenia, ktorý tvorí základ zoskupenia, môže nadobúdať akékoľvek hodnoty v určitom intervale vrátane zlomkových.

Intervalová variačná séria je usporiadaná množina intervalov variácií hodnôt náhodnej premennej so zodpovedajúcimi frekvenciami alebo frekvenciami hodnôt množstva spadajúcich do každej z nich.

Intervalový distribučný rad je účelné zostaviť predovšetkým s kontinuálnou variáciou znaku a tiež vtedy, ak sa diskrétna variácia prejavuje v širokom rozsahu, t.j. počet možností pre diskrétnu funkciu je pomerne veľký.

Z tejto série už možno vyvodiť niekoľko záverov. Napríklad priemerný prvok série variácií (medián) môže byť odhadom najpravdepodobnejšieho výsledku merania. Prvý a posledný prvok variačného radu (t. j. minimálny a maximálny prvok vzorky) ukazuje rozptyl prvkov vzorky. Niekedy, ak sa prvý alebo posledný prvok veľmi líši od zvyšku vzorky, sú vylúčené z výsledkov merania, pretože tieto hodnoty boli získané v dôsledku nejakého hrubého zlyhania, napríklad technológie.