Každá variačná séria pozostáva z. Séria variácií

Riadky postavené podľa množstva, sa volajú variačný.

Distribučné série pozostávajú z možnosti(charakteristické hodnoty) a frekvencie(počet skupín). Frekvencie vyjadrené ako relatívne hodnoty(akcie, percentá) sú tzv frekvencie. Súčet všetkých frekvencií sa nazýva objem distribučnej série.

Podľa typu sú distribučné série rozdelené na diskrétne(postavená na nespojitých hodnotách funkcie) a interval(postavená na spojité hodnoty znamenie).

Variačné série predstavuje dva stĺpce (alebo riadky); z ktorých jedna poskytuje individuálne hodnoty atribútu premennej, nazývané varianty a označené X; a v druhom - absolútne čísla, ktorá ukazuje, koľkokrát (ako často) sa vyskytuje každá možnosť. Indikátory v druhom stĺpci sa nazývajú frekvencie a bežne sa označujú ako f. Všimnite si opäť, že druhý stĺpec možno použiť relatívny výkon charakterizujúce podiel frekvencie jednotlivých variantov v celková suma frekvencie. Tieto relatívne ukazovatele sa nazývajú frekvencie a bežne sa označujú ako ω Súčet všetkých frekvencií je v tomto prípade rovný jednej. Frekvencie však môžu byť vyjadrené aj v percentách a potom súčet všetkých frekvencií dáva 100 %.

Ak sú varianty variačného radu vyjadrené ako diskrétne hodnoty, potom sa takýto variačný rad nazýva diskrétne.

Pre spojité prvky sú rady variácií konštruované ako interval, to znamená, že hodnoty atribútu v nich sú vyjadrené „od ... do ...“. V tomto prípade sa minimálne hodnoty atribútu v takomto intervale nazývajú spodná hranica intervalu a maximum - horná hranica.

Intervalové variačné série sú tiež vytvorené pre diskrétne funkcie, ktoré sa líšia v širokom rozsahu. Intervalový rad môže byť rovný a nerovný intervaloch.

Zvážte, ako sa určuje hodnota rovnakých intervalov. Predstavme si nasledujúci zápis:

i– hodnota intervalu;

- maximálna hodnota znak v jednotkách obyvateľstva;

- minimálna hodnota atribútu pre jednotky populácie;

n- počet pridelených skupín.

ak je známe n.

Ak je ťažké vopred určiť počet pridelených skupín, na výpočet optimálnej veľkosti intervalu s dostatočnou veľkosťou populácie možno odporučiť vzorec navrhnutý Sturgessom v roku 1926:

n = 1+ 3,322 log N, kde N je počet jednotiek v populácii.

Hodnota nerovnakých intervalov sa určuje v každom jednotlivom prípade, berúc do úvahy charakteristiky predmetu štúdia.

Štatistické rozdelenie vzorky zavolajte zoznam opcií a ich zodpovedajúce frekvencie (alebo relatívne frekvencie).

Štatistické rozdelenie vzorky je možné špecifikovať vo forme tabuľky, v prvom stĺpci ktorej sú možnosti a v druhom - frekvencie zodpovedajúce týmto možnostiam. ni alebo relatívne frekvencie Pi .

Štatistické rozdelenie vzorky

Intervalové rady sa nazývajú variačné série, v ktorých sú hodnoty znakov, ktoré sú základom ich tvorby, vyjadrené v určitých medziach (intervaloch). Frekvencie sa v tomto prípade nevzťahujú na jednotlivé hodnoty atribútu, ale na celý interval.

Intervalové distribučné rady sú konštruované podľa spojitých kvantitatívnych charakteristík, ako aj podľa diskrétnych charakteristík, ktoré sa menia vo významnom rozsahu.

Intervalový rad môže byť reprezentovaný štatistickým rozložením vzorky s uvedením intervalov a ich zodpovedajúcich frekvencií. V tomto prípade sa za frekvenciu intervalu berie súčet frekvencií variantu, ktorý spadal do tohto intervalu.

Pri zoskupovaní podľa kvantitatívnych spojitých znakov je dôležité určiť veľkosť intervalu.

Okrem výberového priemeru a výberového rozptylu sa používajú aj ďalšie charakteristiky variačných sérií.

Móda pomenujte variant, ktorý má najvyššiu frekvenciu.

Názov parametra Význam
Predmet článku: Variačné série
Rubrika (tematická kategória) Výroba

Pozorované hodnoty náhodná premenná X 1 , X 2 , …, x k volal možnosti.

Frekvencia možnosti X volám sa číslo n i (i=1,…,k), ktorý ukazuje, koľkokrát sa tento variant vyskytuje vo vzorke.

Frekvencia(relatívna frekvencia, podiely) opcie x i (i=1,…,k) sa zvyčajne nazýva pomer jeho frekvencie n i na veľkosť vzorky n.

Frekvencie a frekvencie sú tzv váhy.

Akumulovaná frekvencia je zvyčajné nazývať počet opcií, ktorých hodnoty sú menšie ako dané X:

Akumulovaná frekvencia Je obvyklé nazývať pomer akumulovanej frekvencie k veľkosti vzorky:

variačná séria(štatistický rad) - je zvykom nazývať postupnosť opcií zapísaných vo vzostupnom poradí a ich zodpovedajúce váhy.

Séria variácií by mala byť diskrétne(vzorka hodnôt diskrétnej náhodnej premennej) a nepretržitý (interval)(výber hodnôt spojitej náhodnej premennej).

Diskrétny variačný rad má tvar:

Keď je počet možností veľký alebo funkcia je spojitá (náhodná premenná môže mať akúkoľvek hodnotu v určitom intervale), sú interval variačná séria.

Ak chcete zostaviť rad intervalových variácií, vykonajte zoskupenie možnosť - sú rozdelené do samostatných intervalov:

Počet intervalov sa niekedy určuje pomocou Sturgesove vzorce:

Potom sa vypočíta počet variantov, ktoré spadajú do každého intervalu - frekvencie n i(alebo frekvencia n i/n). Ak je variant na hranici intervalu, potom je pripojený k správnemu intervalu.

Intervalový variačný rad má tvar:

možnosti
Frekvencie

Empirická (štatistická) distribučná funkcia je zvykom volať funkciu, ktorej hodnota v bode X rovná sa relatívna frekvencia skutočnosť, že variant bude mať hodnotu menšiu ako X(kumulatívna frekvencia pre X):

Frekvenčný polygón sa nazýva lomená čiara, ktorej segmenty spájajú body so súradnicami ( X 1 ; n 1), (X 2 ; n 2), …, (x k; nk). The frekvenčný polygón, čo je štatistická analógia distribučného polygónu.

Stojí za to povedať, že pre súvislú variačnú sériu je možné vytvoriť polygón, ak sú hodnoty X 1 , X 2 , …, x k vziať stredy intervalov.

Séria intervalových variácií je zvyčajne graficky znázornená pomocou histogramy.

stĺpcový graf- stupňovitý útvar pozostávajúci z obdĺžnikov, ktorých základňami sú čiastočné dĺžkové intervaly h= x i +1 – x i, i= 0,…,k-1 a výšky sa rovnajú frekvenciám (alebo frekvenciám) intervalov n i (w i).

Kumulovať(kumulatívna krivka) - krivka akumulovaných frekvencií (frekvencií). Pre diskrétne série kumulát je prerušovaná čiara spájajúca body alebo , . Pre intervalové série kumulovať začína od bodu, ktorého úsečka sa rovná začiatku prvého intervalu a ordináta je akumulovaná frekvencia (frekvencia), nula. Ostatné body tejto prerušovanej čiary zodpovedajú koncom intervalov.

Variačné série - koncepcia a typy. Klasifikácia a vlastnosti kategórie "Séria variácií" 2017, 2018.

  • - Variačný rad distribúcie

    Rozdelenie maloobchodného obratu Ruská federácia v roku 1995 podľa typu vlastníctva, milióny rubľov Typy distribučných sérií Prednáška VIII. Distribučné rady V dôsledku spracovania a systematizácie primárnych štatistických údajov získavajú ....


  • - Séria variácií

    Najjednoduchšou transformáciou štatistických údajov je ich zoradenie podľa veľkosti. Objem vzorky z populácia, zoradené v neklesajúcom poradí prvkov, t.j. , sa volá variačný rad: . V prípade, že objem pozorovaní ... .


  • - Úloha 2. Intervalový variačný rad

    1. Na základe danej vzorky zodpovedajúcej variantu úlohy zostavte intervalový variačný rad; vytvorte histogram a kumulujte ho (použite dve metódy: vloženie grafu Excel a režim "Histogram" balíka "Analýza údajov"). 2. Analyzujte výsledný histogram. ... .


  • - Zostavte sériu variácií variability znaku semien fazule alebo listov ktorejkoľvek rastliny rovnakého veku. Odhaľ vzorce variability vlastností.

    Populácia - konštrukčná jednotka milý. Počet populácií. Príčiny populačných výkyvov. Vzťah jedincov v populáciách a medzi rôznymi populáciami toho istého a rôznych druhov. 1. Dôležitým znakom druhu je jeho rozšírenie v skupinách, populáciách v ...

  • (definícia variačného radu; zložky variačného radu; tri formy variačného radu; účelnosť zostrojenia intervalového radu; závery, ktoré možno zo zostrojeného radu vyvodiť)

    Variačný rad je postupnosť všetkých prvkov vzorky usporiadaných v neklesajúcom poradí. Identické prvky sa opakujú

    Variačné – ide o série postavené na kvantitatívnom základe.

    Séria variácií distribúcie pozostávajú z dvoch prvkov: variantov a frekvencií:

    Možnosti sú číselné hodnoty kvantitatívna vlastnosť vo variačnom distribučnom rade. Môžu byť pozitívne alebo negatívne, absolútne alebo relatívne. Takže pri zoskupovaní podnikov podľa výsledkov ekonomická aktivita pozitívnymi možnosťami sú zisk a záporné čísla je strata.

    Frekvencie sú počty jednotlivých variantov alebo každej skupiny variačného radu, t.j. toto sú čísla ukazujúce, ako často sa určité možnosti vyskytujú v distribučnej sérii. Súčet všetkých frekvencií sa nazýva objem populácie a je určený počtom prvkov celej populácie.

    Frekvencie sú frekvencie vyjadrené ako relatívne hodnoty (zlomky jednotiek alebo percent). Súčet frekvencií sa rovná jednej alebo 100 %. Nahradenie frekvencií frekvenciami vám umožňuje porovnávať variačné série s iné číslo pozorovania.

    Existujú tri formy variačných sérií: zoradené série, diskrétne série a intervalové série.

    Zoradený rad predstavuje rozloženie jednotlivých jednotiek populácie vo vzostupnom alebo zostupnom poradí podľa študovaného znaku. Ranking umožňuje jednoducho rozdeliť kvantitatívne údaje do skupín, okamžite odhaliť najmenšie a najväčšiu hodnotu zvýraznite hodnoty, ktoré sa najčastejšie opakujú.

    Ďalšími formami variačných sérií sú skupinové tabuľky zostavené podľa povahy variácií v hodnotách študovaného znaku. Podľa povahy variácie sa rozlišujú diskrétne (nespojité) a spojité znaky.

    Diskrétne série- ide o taký variačný rad, ktorého konštrukcia je založená na znakoch s nespojitou zmenou (diskrétne znaky). Tieto zahŕňajú tarifnú kategóriu, počet detí v rodine, počet zamestnancov v podniku atď. Tieto znaky môžu nadobúdať iba konečný počet určitých hodnôt.

    Diskrétny variačný rad je tabuľka, ktorá pozostáva z dvoch stĺpcov. Prvý stĺpec označuje konkrétnu hodnotu atribútu a druhý - počet jednotiek populácie s určitú hodnotu znamenie.

    Ak sa znamienko neustále mení (výška príjmu, pracovné skúsenosti, náklady na fixné aktíva podniku atď., ktoré môžu nadobudnúť akúkoľvek hodnotu v rámci určitých limitov), ​​musí sa pre toto znamenie zostaviť séria intervalových variácií.



    Tabuľka skupín tu má tiež dva stĺpce. Prvý označuje hodnotu funkcie v intervale "od - do" (možnosti), druhý - počet jednotiek zahrnutých v intervale (frekvencia).

    Frekvencia (frekvencia opakovania) - počet opakovaní konkrétneho variantu hodnôt atribútu, označovaného fi , a súčet frekvencií rovnajúci sa objemu študovanej populácie, označ.

    Kde k je počet možností hodnoty atribútu

    Tabuľka je veľmi často doplnená o stĺpec, v ktorom sú vypočítané akumulované frekvencie S, ktoré ukazujú, koľko jednotiek populácie má hodnotu znaku najviac daná hodnota.

    Diskrétny variačný distribučný rad je rad, v ktorom sú skupiny zložené podľa znaku, ktorý sa mení diskrétne a má iba celočíselné hodnoty.

    Séria distribúcie intervalových variácií je séria, v ktorej atribút zoskupenia, ktorý tvorí základ zoskupenia, môže nadobúdať akékoľvek hodnoty v určitom intervale vrátane zlomkových.

    Intervalová variačná séria je usporiadaná množina intervalov variácií hodnôt náhodnej premennej so zodpovedajúcimi frekvenciami alebo frekvenciami hodnôt množstva spadajúcich do každej z nich.

    Intervalový distribučný rad je účelné zostaviť predovšetkým s kontinuálnou variáciou znaku a tiež vtedy, ak sa diskrétna variácia prejavuje v širokom rozsahu, t.j. počet možností pre diskrétnu funkciu je pomerne veľký.

    Z tejto série už možno vyvodiť niekoľko záverov. Napríklad priemerný prvok série variácií (medián) môže byť odhadom najpravdepodobnejšieho výsledku merania. Prvý a posledný prvok variačného radu (t. j. minimálny a maximálny prvok vzorky) ukazuje rozptyl prvkov vzorky. Niekedy, ak je prvý alebo posledný prvok veľmi odlišný od zvyšku vzorky, sú vylúčené z výsledkov merania, pretože tieto hodnoty boli získané v dôsledku nejakého hrubého zlyhania, napríklad technológie.

    Cvičenie 1

    VARIAČNÝ RAD DISTRIBÚCIE

    variačná séria alebo blízko distribúcie nazývané usporiadané rozdelenie populačných jednotiek podľa zvyšujúcich sa (častejšie) alebo klesajúcich (menej často) hodnôt atribútu a počítania počtu jednotiek s jednou alebo druhou hodnotou atribútu.

    Sú tam 3 milý distribučný rozsah:

    1) riadok v poradí- ide o zoznam jednotlivých jednotiek populácie vo vzostupnom poradí podľa študovaného znaku; ak je počet populačných jednotiek dostatočne veľký, zoradený rad sa stáva ťažkopádnym a v takýchto prípadoch sa distribučný rad zostavuje zoskupením populačných jednotiek podľa hodnôt študovaného znaku (ak znak zaberá malý počet hodnôt, potom sa vytvorí diskrétny rad a inak intervalový rad);

    2) diskrétne série- toto je tabuľka pozostávajúca z dvoch stĺpcov (riadkov) - konkrétne hodnoty rôzneho atribútu X i a počet populačných jednotiek s danou hodnotou prvku f i- frekvencie; počet skupín v diskrétnej sérii je určený počtom skutočne existujúcich hodnôt atribútu premennej;

    3) intervalové série- toto je tabuľka pozostávajúca z dvoch stĺpcov (riadkov) - intervalov s rôznym znamienkom X i a počet populačných jednotiek spadajúcich do daného intervalu (frekvencie), alebo podiel tohto počtu na celkovom počte populácií (frekvencie).

    Volajú sa čísla, ktoré ukazujú, koľkokrát sa jednotlivé možnosti vyskytujú v danej populácii frekvencie alebo váhy možnosť a sú označené malými písmenami latinská abeceda f. Celkový súčet frekvencií variačného radu sa rovná objemu tejto populácie, t.j.

    kde k- počet skupín, ncelkový počet pozorovaní alebo veľkosť populácie.

    Frekvencie (váhy) sa vyjadrujú nielen v absolútnych, ale aj v relatívnych číslach – v zlomkoch jednotky alebo v percentách z celkového počtu variantov, ktoré tvoria tento súbor. V takýchto prípadoch sú závažia tzv relatívnych frekvencií alebo frekvencie. Celkový súčet údajov sa rovná jednej

    alebo
    ,

    ak sú frekvencie vyjadrené ako percento z celkového počtu pozorovaní P. Nahradenie frekvencií frekvenciami nie je povinné, ale niekedy sa ukáže ako užitočné a dokonca nevyhnutné v prípadoch, keď je potrebné navzájom porovnávať variačné série, ktoré sa výrazne líšia svojimi objemami.

    V závislosti od toho, ako sa atribút mení – diskrétne alebo nepretržite, v širokom alebo úzkom rozsahu – je štatistická populácia rozdelená v bez intervalu alebo interval variačné línie. V prvom prípade sa frekvencie vzťahujú priamo na hodnotené hodnoty prvku, ktoré získavajú polohu jednotlivé skupiny alebo tried variačných radov, v druhej sú vypočítané frekvencie súvisiace s jednotlivými intervalmi alebo intervalmi (od - do), do ktorých je rozdelená všeobecná variácia znaku v rozsahu od minimálnych po maximálne varianty tejto populácie. . Tieto medzery alebo triedy tried môžu alebo nemusia mať rovnakú šírku. Odtiaľ rozlišujú rovnaké a nerovnaké intervalové variačné rady. V nerovnakých intervalových radoch sa mení povaha frekvenčného rozdelenia so zmenou šírky triednych intervalov. Nerovnomerné intervalové zoskupovanie sa v biológii používa pomerne zriedkavo. Biometrické údaje sú spravidla distribuované v rovnakých intervalových sériách, čo umožňuje nielen identifikovať vzor variácie, ale tiež uľahčuje výpočet súhrnných údajov. číselné charakteristiky variačný rad, porovnanie distribučných radov medzi sebou.

    Na začiatku konštrukcie variačného radu s rovnakým intervalom je dôležité správne načrtnúť šírku intervalu triedy. Faktom je, že hrubé zoskupenie (keď sú nastavené veľmi široké intervaly tried) skresľuje typické znaky variácie a vedie k zníženiu presnosti číselných charakteristík série. Pri výbere príliš úzkych intervalov sa zvyšuje presnosť zovšeobecňujúcich číselných charakteristík, ale séria sa ukazuje ako príliš rozšírená a nedáva jasný obraz o variácii.

    Na získanie dobre definovaného variačného radu a Na zabezpečenie dostatočnej presnosti z nej vypočítaných číselných charakteristík je potrebné rozdeliť variáciu znaku (v rozsahu od minimálnych po maximálne možnosti) do takého počtu skupín alebo tried, ktoré by vyhovovali obom požiadavkám. Tento problém je vyriešený vydelením rozsahu variácie atribútu počtom skupín alebo tried, ktoré sa plánujú pri konštrukcii série variácií:

    ,

    kde h– hodnota intervalu; X m a x i X min je maximum a minimálna hodnota Spolu; k je počet skupín.

    Pri konštrukcii intervalového distribučného radu je potrebné zvoliť optimálny počet skupín (intervalov znakov) a nastaviť dĺžku (rozsah) intervalu. Keďže analýza distribučných radov porovnáva frekvencie v rôzne intervaly, je potrebné, aby dĺžka intervalov bola konštantná. Ak sa musíte vysporiadať s intervalovým radom rozdelenia s nerovnakými intervalmi, potom pre porovnateľnosť musíte frekvenciu alebo frekvenciu priviesť na jednotku intervalu, výsledná hodnota je tzv. hustota ρ , teda
    .

    Optimálny počet skupín sa volí tak, aby sa dostatočne odrážala diverzita hodnôt vlastností v súhrne a zároveň aby ​​pravidelnosť rozloženia, jeho tvar nebol skreslený náhodnými frekvenčnými výkyvmi. Ak je príliš málo skupín, nedôjde k žiadnej variácii; ak je skupín príliš veľa, náhodné frekvenčné skoky skreslia tvar rozloženia.

    Najčastejšie je počet skupín v distribučnej sérii určený Sturgessovým vzorcom:

    kde n- veľkosť populácie.

    Grafické znázornenie poskytuje základnú pomoc pri analýze distribučného radu a jeho vlastností. Intervalový rad je reprezentovaný stĺpcovým grafom, v ktorom sú základne stĺpcov umiestnené pozdĺž osi x intervaly hodnôt meniaceho sa atribútu a výšky stĺpcov sú frekvencie zodpovedajúce stupnici pozdĺž ordinátnej osi. Tento typ diagramu sa nazýva histogram.

    Ak existuje diskrétny distribučný rad alebo sa používajú stredné intervaly, potom sa grafické znázornenie takéhoto radu nazýva mnohouholník, ktorý sa získa spojením priamych bodov so súradnicami X i a f i .

    Ak sú hodnoty triedy vynesené pozdĺž osi x a akumulované frekvencie sú vynesené pozdĺž osi y, po čom nasleduje spojenie bodov s priamkami, získa sa graf tzv. kumulatívne. Naakumulované frekvencie sa nachádzajú postupným sčítavaním, príp kumulácia frekvencie v smere od prvej triedy po koniec variačného radu.

    Príklad. Existujú údaje o produkcii vajec 50 nosníc za 1 rok chovaných na hydinovej farme (tabuľka 1.1).

    T a b l e 1.1

    Vajcia nosnice

    počet nosníc

    Výroba vajec, ks.

    počet nosníc

    Výroba vajec, ks.

    počet nosníc

    Výroba vajec, ks.

    počet nosníc

    Výroba vajec, ks.

    počet nosníc

    Výroba vajec, ks.

    Je potrebné vytvoriť rad intervalového rozdelenia a zobraziť ho graficky vo forme histogramu, polygónu a kumulácie.

    Je vidieť, že znak sa pohybuje od 212 do 245 vajec získaných od nosnice za 1 rok.

    V našom príklade pomocou Sturgessovho vzorca určíme počet skupín:

    k = 1 + 3,322lg 50 = 6,643 ≈ 7.

    Vypočítajte dĺžku (rozsah) intervalu pomocou vzorca:

    .

    Zostavme intervalový rad so 7 skupinami a intervalom 5 kusov. vajcia (tabuľka 1.2). Aby sme vytvorili grafy v tabuľke, vypočítame stred intervalov a akumulovanú frekvenciu.

    T a b l e 1.2

    Intervalový rad rozdelenia produkcie vajec

    Skupina nosníc podľa veľkosti produkcie vajec

    X i

    Počet nosníc

    f i

    Stred intervalu

    X ja

    Akumulovaná frekvencia

    f i

    Zostavme si histogram rozdelenia produkcie vajec (obr. 1.1).

    Ryža. 1.1. Histogram distribúcie produkcie vajec

    Tieto histogramy ukazujú formu distribúcie charakteristickú pre mnohé znaky: bežnejšie sú hodnoty priemerných intervalov znaku, menej často extrémne (malé a veľké) hodnoty znaku. Forma tohto rozdelenia je blízka zákonu normálneho rozdelenia, ktorý vzniká, ak je premenná premenná ovplyvňovaná veľkým množstvom faktorov, z ktorých žiadny nemá prevládajúcu hodnotu.

    Polygón a kumulácia rozloženia produkcie vajec majú tvar (obr. 1.2 a 1.3).

    Ryža. 1.2. Polygón distribúcie vajec

    Ryža. 1.3. Kumulujte rozdelenie produkcie vajec

    Technológia riešenia problémov v tabuľkový procesor Microsoft excel Ďalšie.

    1. Zadajte počiatočné údaje podľa obr. 1.4.

    2. Zoraďte riadok.

    2.1. Vyberte bunky A2:A51.

    2.2. Kliknite ľavým tlačidlom myši na paneli nástrojov na tlačidlo<Сортировка по возрастанию > .

    3. Určte veľkosť intervalu na zostavenie intervalového radu rozdelenia.

    3.1. Skopírujte bunku A2 do bunky E53.

    3.2. Skopírujte bunku A51 do bunky E54.

    3.3. Vypočítajte rozsah variácie. Ak to chcete urobiť, zadajte vzorec do bunky E55 =E54-E53.

    3.4. Vypočítajte počet skupín variácií. Ak to chcete urobiť, zadajte vzorec do bunky E56 =1+3,322*LOG10(50).

    3.5. Do bunky E57 zadajte zaokrúhlený počet skupín.

    3.6. Vypočítajte dĺžku intervalu. Ak to chcete urobiť, zadajte vzorec do bunky E58 =E55/E57.

    3.7. Do bunky E59 zadajte zaokrúhlenú dĺžku intervalu.

    4. Vytvorte intervalový rad.

    4.1. Skopírujte bunku E53 do bunky B64.

    4.2. Zadajte vzorec do bunky B65 = B64 + 59 $ E$.

    4.3. Skopírujte bunku B65 do buniek B66:B70.

    4.4. Zadajte vzorec do bunky C64 =B65.

    4.5. Zadajte vzorec do bunky C65 = C64 + 59 $ E$.

    4.6. Skopírujte bunku C65 do buniek C66:C70.

    Výsledky riešenia sa zobrazia na obrazovke v nasledovnom tvare (obr. 1.5).

    5. Vypočítajte intervalovú frekvenciu.

    5.1. Vykonajte príkaz servis,Analýza dát striedavým kliknutím ľavým tlačidlom myši.

    5.2. V dialógovom okne Analýza dát nastavte ľavým tlačidlom myši: Analysis Tools <Гистограмма>(obr. 1.6).

    5.3. Kliknite ľavým tlačidlom myši na tlačidlo<ОК>.

    5.4. Na karte stĺpcový graf nastavte parametre podľa obr. 1.7.

    5.5. Kliknite ľavým tlačidlom myši na tlačidlo<ОК>.

    Výsledky riešenia sa zobrazia na displeji v nasledovnej podobe (obr. 1.8).

    6. Vyplňte tabuľku „Intervalové série rozdelenia“.

    6.1. Skopírujte bunky B74:B80 do buniek D64:D70.

    6.2. Vypočítajte súčet frekvencií. Ak to chcete urobiť, vyberte bunky D64:D70 a kliknite ľavým tlačidlom myši na tlačidlo na paneli nástrojov<Автосумма > .

    6.3. Vypočítajte stred intervalov. Ak to chcete urobiť, zadajte vzorec do bunky E64 = (B64+C64)/2 a skopírujte do buniek E65:E70.

    6.4. Vypočítajte akumulované frekvencie. Ak to chcete urobiť, skopírujte bunku D64 do bunky F64. Do bunky F65 zadajte vzorec =F64+D65 a skopírujte ho do buniek F66:F70.

    Výsledky riešenia sa zobrazia na displeji v nasledovnej podobe (obr. 1.9).

    7. Upravte histogram.

    7.1. Kliknite pravým tlačidlom myši na diagram na názov „vrecko“ a na zobrazenej karte kliknite na tlačidlo<Очистить>.

    7.2. Kliknite pravým tlačidlom myši na graf a na zobrazenej karte kliknite na tlačidlo<Исходные данные>.

    7.3. V dialógovom okne Počiatočné údaje zmeniť označenie osi x. Na tento účel vyberte bunky B64:C70 (obr. 1.10).

    7.5. Stlačte kláves .

    Výsledky sa zobrazia na obrazovke v nasledujúci formulár(obr. 1.11).

    8. Zostavte polygón distribúcie vajec.

    8.1. Kliknite ľavým tlačidlom myši na paneli nástrojov na tlačidlo<Мастер диаграмм > .

    8.2. V dialógovom okne Sprievodca grafom (krok 1 zo 4)ľavým tlačidlom myši nastavte: Štandardné <График>(obr. 1.12).

    8.3. Kliknite ľavým tlačidlom myši na tlačidlo<Далее>.

    8.4. V dialógovom okne Sprievodca grafom (krok 2 zo 4) nastavte parametre podľa obr. 1.13.

    8.5. Kliknite ľavým tlačidlom myši na tlačidlo<Далее>.

    8.6. V dialógovom okne Sprievodca grafom (3. krok zo 4) zadajte názvy grafu a osi Y (obr. 1.14).

    8.7. Kliknite ľavým tlačidlom myši na tlačidlo<Далее>.

    8.8. V dialógovom okne Sprievodca grafom (krok 4 zo 4) nastavte parametre podľa obr. 1.15.

    8.9. Kliknite ľavým tlačidlom myši na tlačidlo<Готово>.

    Výsledky sa zobrazia na obrazovke v nasledovnom tvare (obr. 1.16).

    9. Vložte štítky údajov do grafu.

    9.1. Kliknite pravým tlačidlom myši na graf a na zobrazenej karte kliknite na tlačidlo<Исходные данные>.

    9.2. V dialógovom okne Počiatočné údaje zmeniť označenie osi x. Na tento účel vyberte bunky E64:E70 (obr. 1.17).

    9.3. Stlačte kláves .

    Výsledky sú zobrazené na displeji v nasledovnej forme (obr. 1.18).

    Kumulácia distribúcie je konštruovaná podobne ako polygón distribúcie na základe akumulovaných frekvencií.

    Sú prezentované vo forme distribučných sérií a sú formátované ako .

    Distribučný rad je jedným typom zoskupenia.

    Rozsah distribúcie- predstavuje usporiadané rozloženie jednotiek skúmanej populácie do skupín podľa určitého premenlivého atribútu.

    V závislosti od znaku, ktorý je základom tvorby distribučnej série, existujú atribútové a variačné distribučné hodnosti:

    • prívlastkový- nazývať distribučné série postavené na kvalitatívnych základoch.
    • Nazývajú sa distribučné série zostavené vo vzostupnom alebo zostupnom poradí hodnôt kvantitatívneho atribútu variačný.
    Séria variácií distribúcie pozostáva z dvoch stĺpcov:

    Prvý stĺpec obsahuje kvantitatívnych hodnôt premenlivým znakom, ktoré sú tzv možnosti a sú označené. Diskrétny variant – vyjadrený ako celé číslo. Možnosť intervalu je v rozsahu od a do. V závislosti od typu variantov je možné zostaviť diskrétny alebo intervalový variačný rad.
    Druhý stĺpec obsahuje číslo konkrétna možnosť vyjadrené ako frekvencie alebo frekvencie:

    Frekvencie- sú to absolútne čísla, ktoré ukazujú, koľkokrát sa v súhrne vyskytuje daná hodnota prvku, ktoré označujú . Súčet všetkých frekvencií by sa mal rovnať počtu jednotiek celej populácie.

    Frekvencie() sú frekvencie vyjadrené ako percento z celku. Súčet všetkých frekvencií vyjadrený v percentách sa musí rovnať 100 % v zlomkoch jednej.

    Grafické znázornenie distribučných radov

    Distribučné série sú vizualizované pomocou grafických obrázkov.

    Distribučné série sú zobrazené ako:
    • Polygón
    • Histogramy
    • Kumuluje sa
    • ogives

    Polygón

    Pri konštrukcii mnohouholníka na vodorovnej osi (abscisová os) sa vykreslia hodnoty premenného atribútu a na vertikálna os(os y) - frekvencie alebo frekvencie.

    Polygón na obr. 6.1 bola postavená podľa mikrosčítania obyvateľov Ruska v roku 1994.

    6.1. Rozdelenie domácností podľa veľkosti

    Podmienka: Uvádzajú sa údaje o rozložení 25 zamestnancov jedného z podnikov podľa tarifných kategórií:
    4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
    Úloha: Zostavte samostatnú variačnú sériu a graficky ju znázornite ako distribučný mnohouholník.
    rozhodnutie:
    AT tento príklad možnosti je mzdová kategória zamestnanca. Na určenie frekvencií je potrebné vypočítať počet zamestnancov s príslušnou mzdovou kategóriou.

    Polygón sa používa pre série diskrétnych variácií.

    Na zostavenie distribučného polygónu (obr. 1) pozdĺž vodorovnej osi (X) vykreslíme kvantitatívne hodnoty rôzneho znaku - varianty a pozdĺž zvislej osi - frekvencie alebo frekvencie.

    Ak sú charakteristické hodnoty vyjadrené ako intervaly, potom sa takáto séria nazýva intervalová séria.
    intervalové série distribúcie sú zobrazené graficky ako histogram, kumulácia alebo ogive.

    Štatistická tabuľka

    Podmienka: Údaje o veľkosti vkladov 20 sú uvedené jednotlivcov v jednej banke (tisíc rubľov) 60; 25; 12; 10; 68; 35; 2; 17; 51; deväť; 3; 130; 24; 85; sto; 152; 6; osemnásť; 7; 42.
    Úloha: Zostavte sériu variácií intervalov s rovnakými intervalmi.
    rozhodnutie:

    1. Počiatočná populácia pozostáva z 20 jednotiek (N = 20).
    2. Pomocou Sturgessovho vzorca definujeme požadované množstvo použité skupiny: n=1+3,322*lg20=5
    3. Vypočítajme hodnotu rovnakého intervalu: i=(152 - 2) /5 = 30 tisíc rubľov
    4. Počiatočnú populáciu rozdeľujeme do 5 skupín s intervalom 30 000 rubľov.
    5. Výsledky zoskupenia sú uvedené v tabuľke:

    Pri takomto zaznamenávaní súvislého znaku, keď sa rovnaká hodnota vyskytne dvakrát (ako horná hranica jedného intervalu a dolná hranica iného intervalu), potom táto hodnota patrí do skupiny, kde táto hodnota pôsobí ako horná hranica.

    stĺpcový graf

    Na zostavenie histogramu pozdĺž vodorovnej osi označte hodnoty hraníc intervalov a na ich základe vytvorte obdĺžniky, ktorých výška je úmerná frekvenciám (alebo frekvenciám).

    Na obr. 6.2. je zobrazený histogram rozloženia obyvateľstva Ruska v roku 1997 podľa vekových skupín.

    Ryža. 6.2. Rozdelenie obyvateľstva Ruska podľa vekových skupín

    Podmienka: Uvedené je rozdelenie 30 zamestnancov firmy podľa veľkosti mesačnej mzdy

    Úloha: Zobrazenie série variácií intervalu graficky ako histogram a sčítanie.
    rozhodnutie:

    1. Neznáma hranica otvoreného (prvého) intervalu je určená hodnotou druhého intervalu: 7000 - 5000 = 2000 rubľov. S rovnakou hodnotou, akú nájdeme nižšia hranica prvý interval: 5 000 - 2 000 = 3 000 rubľov.
    2. Na vytvorenie histogramu v pravouhlom súradnicovom systéme pozdĺž osi x vyčleníme segmenty, ktorých hodnoty zodpovedajú intervalom variantného radu.
      Tieto segmenty slúžia ako spodná základňa a zodpovedajúca frekvencia (frekvencia) slúži ako výška vytvorených obdĺžnikov.
    3. Zostavme si histogram:

    Na zostavenie kumulácie je potrebné vypočítať akumulované frekvencie (frekvencie). Sú určené postupným sčítaním frekvencií (frekvencií) predchádzajúcich intervalov a sú označené S. Akumulované frekvencie ukazujú, koľko jednotiek populácie má hodnotu znaku, ktorá nie je väčšia ako tá, o ktorej sa uvažuje.

    Kumulovať

    Rozdelenie vlastnosti vo variačnom rade podľa akumulovaných frekvencií (frekvencií) je znázornené pomocou kumulácie.

    Kumulovať alebo kumulatívna krivka, na rozdiel od polygónu, je postavená na akumulovaných frekvenciách alebo frekvenciách. Súčasne sú hodnoty znaku umiestnené na vodorovnej osi a nahromadené frekvencie alebo frekvencie sú umiestnené na osi y (obr. 6.3).

    Ryža. 6.3. Kumulatívne rozdelenie domácností podľa veľkosti

    4. Vypočítajte akumulované frekvencie:
    Frekvencia kolena prvého intervalu sa vypočíta takto: 0 + 4 = 4, pre druhý: 4 + 12 = 16; pre tretinu: 4 + 12 + 8 = 24 atď.

    Pri konštrukcii kumulácie sa akumulovaná frekvencia (frekvencia) zodpovedajúceho intervalu priradí k jeho hornej hranici:

    Ogiva

    Ogiva je konštruovaný podobne ako kumulácia s jediným rozdielom, že akumulované frekvencie sú umiestnené na osi x a hodnoty vlastností sú umiestnené na osi y.

    Obmenou kumulácie je krivka koncentrácie alebo Lorenzov graf. Nakresliť krivku koncentrácie na oboch osiach pravouhlý systém súradnice, stupnica stupnice sa použije v percentách od 0 do 100. V tomto prípade súradnica označuje akumulované frekvencie a ordináta označuje akumulované hodnoty podielu (v percentách) podľa objemu prvku.

    Rovnomerné rozloženie znamienka zodpovedá uhlopriečke štvorca na grafe (obr. 6.4). Pri nerovnomernom rozložení je graf konkávna krivka v závislosti od úrovne koncentrácie znaku.

    6.4. koncentračná krivka