Vytvorte sériu intervalového rozdelenia. Súhrn a zoskupovanie štatistík

Laboratórium č. 1

Podľa matematických štatistík

Téma: Primárne spracovanie experimentálnych dát

3. Hodnotenie v bodoch. jeden

5. Bezpečnostné otázky.. 2

6. Metodika vykonávania laboratórnych prác .. 3

Cieľ

Osvojenie si zručností primárneho spracovania empirických údajov metódami matematickej štatistiky.

Na základe súboru experimentálnych údajov vykonajte tieto úlohy:

Cvičenie 1. Zostrojte intervalový variačný rad rozdelenia.

Úloha 2. Zostrojte histogram frekvencií intervalových variačných sérií.

Úloha 3. Zostavte empirickú distribučnú funkciu a vytvorte graf.

a) modus a medián;

b) podmienené počiatočné momenty;

c) priemer vzorky;

d) rozptyl vzorky, korigovaný rozptyl populácie, korigovaná smerodajná odchýlka;

e) variačný koeficient;

e) asymetria;

g) špičatosť;

Úloha 5. Určte hranice skutočných hodnôt numerických charakteristík skúmanej náhodnej premennej s danou spoľahlivosťou.

Úloha 6. Zmysluplná interpretácia výsledkov primárneho spracovania podľa stavu problému.

Skóre v bodoch

Úlohy 1-56 bodov

Úloha 62 body

Laboratórna ochrana(ústny pohovor o kontrolných otázkach a laboratórnej práci) - 2 body

Práca sa odovzdáva písomne ​​na listoch A4 a obsahuje:

1) Titulná strana (príloha 1)

2) Počiatočné údaje.

3) Prezentácia práce podľa zadanej vzorky.

4) Výsledky výpočtu (vykonané ručne a/alebo pomocou MS Excel) v určenom poradí.

5) Závery - zmysluplná interpretácia výsledkov primárneho spracovania podľa stavu problému.

6) Ústny pohovor na pracovné a kontrolné otázky.



5. Bezpečnostné otázky


Metodika vykonávania laboratórnych prác

Úloha 1. Zostrojte intervalový variačný rad rozdelenia

Aby bolo možné prezentovať štatistické údaje vo forme variačných radov s rovnomerne rozloženými variantmi, je potrebné:

1. V pôvodnej tabuľke údajov nájdite najmenšiu a najväčšiu hodnotu.

2. Určiť rozsah variácií :

3. Určte dĺžku intervalu h, ak je vo vzorke do 1000 údajov, použite vzorec: , kde n - veľkosť vzorky - množstvo údajov vo vzorke; Na výpočty sa používa lgn).

Vypočítaný pomer sa zaokrúhľuje nahor vhodná celočíselná hodnota .

4. Na určenie začiatku prvého intervalu pre párny počet intervalov sa odporúča použiť hodnotu ; a pre nepárny počet intervalov .

5. Zaznamenajte intervaly zoskupovania a usporiadajte ich vo vzostupnom poradí hraníc

, ,………., ,

kde je spodná hranica prvého intervalu. Vhodné číslo sa berie nie viac ako , horná hranica posledného intervalu nesmie byť menšia ako . Odporúča sa, aby intervaly obsahovali počiatočné hodnoty náhodnej premennej a boli oddelené od 5 až 20 intervaloch.

6. Zapíšte si počiatočné údaje o intervaloch zoskupení, t.j. vypočítajte z pôvodnej tabuľky počet hodnôt náhodnej premennej, ktoré spadajú do určených intervalov. Ak sa niektoré hodnoty zhodujú s hranicami intervalov, potom sa pripisujú buď len predchádzajúcemu, alebo len nasledujúcemu intervalu.

Poznámka 1. Intervaly nemusia mať rovnakú dĺžku. V oblastiach, kde sú hodnoty hustejšie, je vhodnejšie použiť menšie krátke intervaly a kde menej často - väčšie.

Poznámka 2.Ak sa pre niektoré hodnoty získajú „nula“ alebo malé hodnoty frekvencií, potom je potrebné preskupiť údaje, zväčšiť intervaly (zvýšenie kroku).

Najdôležitejšou etapou pri skúmaní sociálno-ekonomických javov a procesov je systematizácia primárnych údajov a na tomto základe získanie súhrnnej charakteristiky celého objektu pomocou zovšeobecňujúcich ukazovateľov, čo sa dosahuje sumarizáciou a zoskupovaním primárneho štatistického materiálu.

Štatistické zhrnutie - ide o komplex sekvenčných operácií na zovšeobecnenie konkrétnych jednotlivých faktov, ktoré tvoria súbor na identifikáciu typických znakov a vzorov, ktoré sú vlastné skúmanému javu ako celku. Vykonanie štatistického súhrnu zahŕňa nasledujúce kroky :

  • výber funkcie zoskupenia;
  • určenie poradia vytvárania skupín;
  • vývoj systému štatistických ukazovateľov na charakterizáciu skupín a objektu ako celku;
  • vývoj rozložení štatistických tabuliek na prezentáciu súhrnných výsledkov.

Štatistické zoskupenie nazval rozdelenie jednotiek skúmanej populácie do homogénnych skupín podľa určitých charakteristík, ktoré sú pre ne podstatné. Zoskupenia sú najdôležitejšou štatistickou metódou sumarizácie štatistických údajov, základom pre správny výpočet štatistických ukazovateľov.

Existujú tieto typy zoskupení: typologické, štrukturálne, analytické. Všetky tieto zoskupenia spája skutočnosť, že jednotky objektu sú rozdelené do skupín podľa nejakého atribútu.

znak zoskupenia sa nazýva znak, ktorým sa jednotky obyvateľstva delia do samostatných skupín. Závery štatistickej štúdie závisia od správneho výberu atribútu zoskupenia. Ako základ pre zoskupovanie je potrebné použiť významné, teoreticky podložené znaky (kvantitatívne alebo kvalitatívne).

Kvantitatívne znaky zoskupovania majú číselné vyjadrenie (objem obchodov, vek osoby, rodinný príjem a pod.), a kvalitatívne znaky zoskupenia odráža stav jednotky obyvateľstva (pohlavie, rodinný stav, odvetvová príslušnosť podniku, jeho forma vlastníctva a pod.).

Po určení základu zoskupenia by sa malo rozhodnúť o počte skupín, do ktorých by sa mala študovaná populácia rozdeliť. Počet skupín závisí od cieľov štúdie a typu ukazovateľa, ktorý je základom zoskupenia, veľkosti populácie, stupňa variácie vlastnosti.

Napríklad zoskupenie podnikov podľa foriem vlastníctva zohľadňuje mestské, federálne a majetkové pomery subjektov federácie. Ak sa zoskupenie uskutočňuje podľa kvantitatívneho atribútu, potom je potrebné venovať osobitnú pozornosť počtu jednotiek skúmaného objektu a stupňu kolísania atribútu zoskupenia.

Keď sa určí počet skupín, potom by sa mali určiť intervaly zoskupovania. Interval - to sú hodnoty premennej charakteristiky, ktoré ležia v určitých hraniciach. Každý interval má svoju hodnotu, hornú a dolnú hranicu alebo aspoň jednu z nich.

Dolná hranica intervalu sa nazýva najmenšia hodnota atribútu v intervale, a Horná hranica - najväčšia hodnota atribútu v intervale. Hodnota intervalu je rozdiel medzi hornou a dolnou hranicou.

Intervaly zoskupovania v závislosti od ich veľkosti sú: rovnaké a nerovnaké. Ak sa variácia znaku prejavuje v relatívne úzkych hraniciach a distribúcia je rovnomerná, potom sa vytvorí zoskupenie s rovnakými intervalmi. Hodnota rovnakého intervalu je určená nasledujúcim vzorcom :

kde Xmax, Xmin - maximálne a minimálne hodnoty atribútu v súhrne; n je počet skupín.

Najjednoduchším zoskupením, v ktorom je každá vybraná skupina charakterizovaná jedným ukazovateľom, je distribučný rad.

Štatistické distribučné rady - ide o usporiadané rozdelenie jednotiek obyvateľstva do skupín podľa určitého atribútu. V závislosti od znaku, ktorý je základom tvorby distribučného radu, sa rozlišujú atribútové a variačné distribučné série.

prívlastkový nazývajú distribučný rad zostavený podľa kvalitatívnych charakteristík, teda znaky, ktoré nemajú číselné vyjadrenie (rozdelenie podľa druhu práce, podľa pohlavia, podľa profesie a pod.). Atribútové distribučné rady charakterizujú zloženie populácie podľa jedného alebo druhého podstatného znaku. Tieto údaje, prevzaté z niekoľkých období, nám umožňujú študovať zmenu štruktúry.

Variačné riadky distribučné série postavené na kvantitatívnom základe. Každá variačná séria pozostáva z dvoch prvkov: variantov a frekvencií. možnosti nazývajú sa jednotlivé hodnoty atribútu, ktoré má v rade variácií, teda špecifická hodnota premenlivého atribútu.

Frekvencie sa nazýva číslo jednotlivého variantu alebo každej skupiny variačného radu, to znamená, že ide o čísla, ktoré ukazujú, ako často sa určité varianty vyskytujú v distribučnom rade. Súčet všetkých frekvencií určuje veľkosť celej populácie, jej objem. Frekvencie frekvencie sa nazývajú, vyjadrené v zlomkoch jednotky alebo ako percento z celku. V súlade s tým sa súčet frekvencií rovná 1 alebo 100 %.

V závislosti od povahy variácie znaku sa rozlišujú tri formy variačného radu: zoradený rad, diskrétny rad a intervalový rad.

Hodnotené série variácií - ide o rozloženie jednotlivých jednotiek populácie vo vzostupnom alebo zostupnom poradí podľa skúmaného znaku. Hodnotenie uľahčuje rozdelenie kvantitatívnych údajov do skupín, okamžité zistenie najmenšej a najväčšej hodnoty prvku a zvýraznenie hodnôt, ktoré sa najčastejšie opakujú.

Séria diskrétnych variácií charakterizuje rozdelenie jednotiek populácie podľa diskrétneho atribútu, ktorý nadobúda iba celočíselné hodnoty. Napríklad tarifná kategória, počet detí v rodine, počet zamestnancov v podniku atď.

Ak má znamenie nepretržitú zmenu, ktorá v rámci určitých limitov môže nadobudnúť akékoľvek hodnoty („od - do“), potom pre toto znamenie musíte postaviť intervalové variačné série . Napríklad výška príjmu, pracovné skúsenosti, náklady na investičný majetok podniku atď.

Príklady riešenia úloh na tému "Štatistický súhrn a zoskupovanie"

Úloha 1 . Je tu informácia o počte kníh, ktoré študenti dostali predplatným za uplynulý akademický rok.

Zostavte sériu distribúcie s rozsahom a diskrétnu variáciu, ktorá označuje prvky série.

rozhodnutie

Táto sada je súbor možností pre počet kníh, ktoré študenti dostanú. Spočítajme počet takýchto variantov a usporiadame ich do podoby variačného usporiadaného a variačného diskrétneho distribučného radu.

Úloha 2 . Existujú údaje o hodnote fixných aktív pre 50 podnikov, tisíc rubľov.

Vytvorte distribučnú sériu, v ktorej zvýraznite 5 skupín podnikov (v rovnakých intervaloch).

rozhodnutie

Pre riešenie volíme najväčšie a najmenšie hodnoty nákladov na fixné aktíva podnikov. Ide o 30,0 a 10,2 tisíc rubľov.

Nájdite veľkosť intervalu: h \u003d (30,0-10,2): 5 \u003d 3,96 tisíc rubľov.

Potom prvá skupina bude zahŕňať podniky, ktorých výška fixných aktív je od 10,2 tisíc rubľov. až 10,2 + 3,96 = 14,16 tisíc rubľov. Takýchto podnikov bude 9. Druhá skupina bude zahŕňať podniky, ktorých výška fixných aktív bude od 14,16 tisíc rubľov. až 14,16 + 3,96 = 18,12 tisíc rubľov. Takýchto podnikov bude 16. Podobne zistíme počet podnikov zaradených do tretej, štvrtej a piatej skupiny.

Výsledný distribučný rad sa umiestni do tabuľky.

Úloha 3 . Pre množstvo podnikov ľahkého priemyslu sa získali tieto údaje:

Urobte zoskupenie podnikov podľa počtu pracovníkov, pričom vytvorte 6 skupín v rovnakých intervaloch. Počítajte pre každú skupinu:

1. počet podnikov
2. počet robotníkov
3. objem vyrobených produktov za rok
4. priemerný skutočný výkon na pracovníka
5. výška fixných aktív
6. priemerná veľkosť investičného majetku jedného podniku
7. priemerná hodnota vyrobených výrobkov jedným podnikom

Výsledky výpočtu zapíšte do tabuliek. Urobte si vlastné závery.

rozhodnutie

Pre riešenie volíme najväčšie a najmenšie hodnoty priemerného počtu pracovníkov v podniku. Toto sú 43 a 256.

Nájdite veľkosť intervalu: h = (256-43): 6 = 35,5

Potom do prvej skupiny budú zaradené podniky s priemerným počtom pracovníkov od 43 do 43 + 35,5 = 78,5 osôb. Takýchto podnikov bude 5. V druhej skupine budú podniky, ktorých priemerný počet pracovníkov bude od 78,5 do 78,5 + 35,5 = 114 osôb. Takýchto podnikov bude 12. Podobne zistíme počet podnikov zaradených do tretej, štvrtej, piatej a šiestej skupiny.

Výsledné distribučné série vložíme do tabuľky a vypočítame potrebné ukazovatele pre každú skupinu:

Záver : Ako vidno z tabuľky, druhá skupina podnikov je najpočetnejšia. Zahŕňa 12 podnikov. Najmenšia je piata a šiesta skupina (po dva podniky). Ide o najväčšie podniky (z hľadiska počtu pracovníkov).

Keďže druhá skupina je najpočetnejšia, objem produkcie za rok podnikov tejto skupiny a objem fixných aktív sú oveľa vyššie ako ostatné. Zároveň priemerný skutočný výkon jedného pracovníka v podnikoch tejto skupiny nie je najvyšší. Tu vedú podniky štvrtej skupiny. Na túto skupinu pripadá aj pomerne veľké množstvo fixných aktív.

Na záver poznamenávame, že priemerná veľkosť investičného majetku a priemerná hodnota výkonu jedného podniku sú priamo úmerné veľkosti podniku (z hľadiska počtu pracovníkov).

Ak je skúmaná náhodná premenná spojitá, potom klasifikácia a zoskupenie pozorovaných hodnôt nám často neumožňujú zdôrazniť charakteristické črty variácie jej hodnôt. Vysvetľuje to skutočnosť, že jednotlivé hodnoty náhodnej premennej sa môžu od seba líšiť tak málo, ako je potrebné, a preto sa v súhrne pozorovaných údajov zriedkavo môžu vyskytnúť rovnaké hodnoty množstva a frekvencie variantov sa od seba len málo líšia.

Je tiež nepraktické zostrojiť diskrétnu sériu pre diskrétnu náhodnú premennú, ktorej počet možných hodnôt je veľký. V takýchto prípadoch by sa malo stavať intervalové variačné série distribúcia.

Na vytvorenie takejto série je celý interval variácií pozorovaných hodnôt náhodnej premennej rozdelený do série čiastkové intervaly a počítanie frekvencie výskytu hodnôt magnitúdy v každom čiastočnom intervale.

Intervalové variačné série nazývaný usporiadaný súbor intervalov variácií hodnôt náhodnej premennej so zodpovedajúcimi frekvenciami alebo relatívnymi frekvenciami zásahov v každej z hodnôt množstva.

Na zostavenie intervalovej série potrebujete:

  1. definovať hodnotu čiastočné intervaly;
  2. definovať šírka intervaly;
  3. nastavte pre každý interval to top a nižšia hranica ;
  4. zoskupiť výsledky pozorovania.

1 . Otázku výberu počtu a šírky intervalov zoskupovania je potrebné rozhodnúť v každom konkrétnom prípade na základe Ciele výskum, objem odber vzoriek a stupeň variácie funkcia vo vzorke.

Približný počet intervalov k možno len odhadnúť z veľkosti vzorky n jedným z nasledujúcich spôsobov:

  • podľa vzorca Sturges : k = 1 + 3,32 log n ;
  • pomocou tabuľky 1.

stôl 1

2 . Vo všeobecnosti sú preferované intervaly rovnakej šírky. Na určenie šírky intervalov h vypočítať:

  • rozsah variácií R - vzorové hodnoty: R = x max - x min ,

kde xmax a xmin - možnosti maximálnej a minimálnej vzorky;

  • šírka každého intervalu h určuje sa podľa nasledujúceho vzorca: h = R/k .

3 . Spodná čiara prvý interval x h1 sa volí tak, aby minimálny vzorový variant xmin klesol približne v strede tohto intervalu: x h1 = x min - 0,5 h .

Intervaly získaná pripočítaním dĺžky čiastkového intervalu ku koncu predchádzajúceho intervalu h :

xhi = xhi-1 + h.

Konštrukcia stupnice intervalov na základe výpočtu hraníc intervalov pokračuje až do hodnoty x ahoj vyhovuje vzťahu:

x ahoj< x max + 0,5·h .

4 . V súlade so stupnicou intervalov sú hodnoty atribútu zoskupené - pre každý čiastkový interval sa vypočíta súčet frekvencií n i zachytený variant i -tý interval. V tomto prípade interval obsahuje hodnoty náhodnej premennej väčšie alebo rovné dolnej hranici a menšie ako horná hranica intervalu.

Polygón a histogram

Pre prehľadnosť sú zostavené rôzne grafy štatistického rozdelenia.

Na základe údajov diskrétnych variačných radov konštruujeme mnohouholník frekvencie alebo relatívnej frekvencie.

Frekvenčný mnohouholník x 1 ; n 1 ), (x2 ; n 2 ), ..., (x k ; nk ). Na vytvorenie mnohouholníka frekvencií na osi x sú možnosti vyčlenené x i a na osi y - zodpovedajúce frekvencie n i . Body ( x i ; n i ) sú spojené segmentmi priamych čiar a získa sa frekvenčný mnohouholník (obr. 1).

Polygón relatívnej frekvencie sa nazýva lomená čiara, ktorej segmenty spájajú body ( x 1 ; W 1 ), (x2 ; W2 ), ..., (x k ; Wk ). Ak chcete vytvoriť mnohouholník relatívnych frekvencií na úsečke, zrušte možnosti x i a na osi y - im zodpovedajúce relatívne frekvencie Wi . Body ( x i ; Wi ) sú spojené segmentmi priamych čiar a získa sa mnohouholník relatívnych frekvencií.

Kedy súvislá vlastnosť je účelné stavať histogram .

frekvenčný histogram nazývaný stupňovitý útvar pozostávajúci z obdĺžnikov, ktorých základňami sú čiastkové intervaly dĺžky h a výšky sa rovnajú pomeru NIH (hustota frekvencie).

Na vytvorenie histogramu frekvencií sa na os x vynesú čiastočné intervaly a nad nimi sa nakreslia segmenty rovnobežne s osou x vo vzdialenosti NIH .

zoskupenie- ide o rozdelenie obyvateľstva do skupín, ktoré sú istým spôsobom homogénne.

Pridelenie služby. Pomocou online kalkulačky môžete:

  • zostavte sériu variácií, zostavte histogram a mnohouholník;
  • nájsť ukazovatele variácie (priemer, modus (vrátane grafických), medián, rozsah variácie, kvartily, decily, kvartilový koeficient diferenciácie, koeficient variácie a iné ukazovatele);

Poučenie. Ak chcete zoskupiť sériu, musíte vybrať typ výslednej série variácií (diskrétne alebo intervalové) a určiť množstvo údajov (počet riadkov). Výsledné riešenie sa uloží do súboru Word (pozri príklad zoskupenia štatistických údajov).

Počet vstupných údajov
",0);">

Ak už bolo zoskupenie vykonané a série diskrétnych variácií alebo intervalové série, potom musíte použiť online kalkulačku Indikátory variácií. Testovanie hypotézy o type distribúcie vyrobené pomocou služby Štúdium formy distribúcie.

Typy štatistických zoskupení

Variačné série. V prípade pozorovaní diskrétnej náhodnej premennej sa s rovnakou hodnotou možno stretnúť niekoľkokrát. Takéto hodnoty náhodnej premennej x i sa zaznamenávajú a označujú n i, koľkokrát sa objaví v n pozorovaniach, toto je frekvencia tejto hodnoty.
V prípade spojitej náhodnej premennej sa v praxi používa zoskupovanie.
  1. Typologické zoskupenie- ide o rozdelenie skúmanej kvalitatívne heterogénnej populácie na triedy, socioekonomické typy, homogénne skupiny jednotiek. Na vytvorenie tohto zoskupenia použite parameter Diskrétna variačná séria.
  2. Štrukturálne zoskupenie je tzv, v ktorej je homogénna populácia rozdelená do skupín, ktoré charakterizujú jej štruktúru podľa nejakého premenlivého znaku. Na vytvorenie tohto zoskupenia použite parameter série intervalov.
  3. Zoskupenie, ktoré odhaľuje vzťah medzi skúmanými javmi a ich znakmi, sa nazýva tzv analytická skupina(pozri analytické zoskupenie sérií).

Princípy budovania štatistických zoskupení

Séria pozorovaní zoradených vo vzostupnom poradí sa nazýva variačná séria. znak zoskupenia je znak, ktorým sa obyvateľstvo delí na samostatné skupiny. Nazýva sa základom skupiny. Zoskupovanie môže byť založené na kvantitatívnych aj kvalitatívnych charakteristikách.
Po určení základu zoskupenia by sa malo rozhodnúť o počte skupín, do ktorých by sa mala skúmaná populácia rozdeliť.

Pri použití osobných počítačov na spracovanie štatistických údajov sa zoskupovanie jednotiek objektu vykonáva štandardnými postupmi.
Jeden takýto postup je založený na použití Sturgessovho vzorca na určenie optimálneho počtu skupín:

k = 1+3,322*lg(N)

Kde k je počet skupín, N je počet jednotiek populácie.

Dĺžka čiastkových intervalov sa vypočíta ako h=(x max -x min)/k

Potom spočítajte počet zásahov pozorovaní v týchto intervaloch, ktoré sa berú ako frekvencie n i . Málo frekvencií, ktorých hodnoty sú menšie ako 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Stredy intervalov x i = (c i-1 + c i)/2 sa berú ako nové hodnoty.

Čo je zoskupovanie štatistických údajov a ako súvisí s distribučným radom, sme sa zaoberali v tejto prednáške, kde sa dozviete aj o tom, čo je diskrétny a variačný distribučný rad.

Distribučné rady sú jednou z odrôd štatistických radov (okrem nich sa v štatistike používajú dynamické rady), používajú sa na analýzu údajov o javoch spoločenského života. Konštrukcia variačných sérií je celkom uskutočniteľná úloha pre každého. Je však potrebné pamätať na pravidlá.

Ako vytvoriť diskrétny variačný distribučný rad

Príklad 1 Dostupné sú údaje o počte detí v 20 skúmaných rodinách. Zostavte diskrétny variačný rad rozdelenie rodín podľa počtu detí.

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

rozhodnutie:

  1. Začnime rozložením tabuľky, do ktorej následne zadáme údaje. Keďže distribučné riadky majú dva prvky, tabuľka bude pozostávať z dvoch stĺpcov. Prvý stĺpec je vždy variant - čo študujeme - názov preberáme z úlohy (koniec vety s úlohou v podmienkach) - podľa počtu detí- takže naša verzia je počet detí.

Druhý stĺpec je frekvencia - ako často sa náš variant vyskytuje v skúmanom jave - názov stĺpca preberáme aj z úlohy - rozdelenie rodín - teda naša frekvencia je počet rodín s príslušným počtom detí.

  1. Teraz z počiatočných údajov vyberieme tie hodnoty, ktoré sa vyskytnú aspoň raz. V našom prípade toto

A usporiadajme tieto údaje v prvom stĺpci našej tabuľky v logickom poradí, v tomto prípade zvyšovaním od 0 do 4. Získame

A na záver si spočítajme, koľkokrát sa každá hodnota opcií vyskytuje.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

Výsledkom je, že získame kompletnú tabuľku alebo požadovanú sériu rozloženia rodín podľa počtu detí.

Cvičenie . Existujú údaje o tarifných kategóriách 30 pracovníkov podniku. Zostrojte diskrétny variačný rad pre rozdelenie pracovníkov podľa mzdovej kategórie. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

Ako zostaviť intervalový variačný rad distribúcie

Zostavme intervalový distribučný rad a uvidíme, ako sa jeho konštrukcia líši od diskrétneho radu.

Príklad 2 Existujú údaje o výške zisku prijatého 16 podnikmi, milióny rubľov. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Zostavte intervalový variačný rad na rozdelenie podnikov podľa objemu zisku, pričom vyberte 3 skupiny v rovnakých intervaloch.

Všeobecný princíp konštrukcie série samozrejme zostane zachovaný, rovnaké dva stĺpce, rovnaké varianty a frekvencia, ale v tomto prípade budú varianty umiestnené v intervale a frekvencie sa budú počítať inak.

rozhodnutie:

  1. Začnime podobne ako v predchádzajúcej úlohe zostavením rozloženia tabuľky, do ktorej následne zadáme údaje. Keďže distribučné riadky majú dva prvky, tabuľka bude pozostávať z dvoch stĺpcov. Prvý stĺpec je vždy variant - čo študujeme - názov preberáme z úlohy (koniec vety s úlohou v podmienkach) - výškou zisku - čo znamená, že náš variant je výška zisku prijaté.

Druhý stĺpec je frekvencia - ako často sa náš variant vyskytuje v skúmanom jave - názov stĺpca preberáme aj zo zadania - rozdelenie podnikov - to znamená, že naša frekvencia je počet podnikov s príslušným ziskom, v r. tento prípad spadá do intervalu.

V dôsledku toho bude rozloženie našej tabuľky vyzerať takto:

kde i je hodnota alebo dĺžka intervalu,

Xmax a Xmin - maximálna a minimálna hodnota funkcie,

n je požadovaný počet skupín podľa stavu problému.

Vypočítajme intervalovú hodnotu pre náš príklad. Aby sme to urobili, medzi počiatočnými údajmi nájdeme najväčší a najmenší

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 - maximálna hodnota je 118 miliónov rubľov a minimum je 9 miliónov rubľov. Vypočítajme vzorec.

Pri výpočte nám vyšlo číslo 36, (3) tri v perióde, v takýchto situáciách treba hodnotu intervalu zaokrúhliť nahor, aby sa po výpočtoch nestratilo maximum údajov, preto hodnota intervalu vo výpočte je 36,4 milióna rubľov.

  1. Teraz poďme zostaviť intervaly - naše možnosti v tomto probléme. Prvý interval sa spustí od minimálnej hodnoty, k nemu sa pripočíta hodnota intervalu a získa sa horná hranica prvého intervalu. Potom sa horná hranica prvého intervalu stane spodnou hranicou druhého intervalu, hodnota intervalu sa k nej pripočíta a získa sa druhý interval. A tak ďalej toľkokrát, koľkokrát je potrebné vytvoriť intervaly podľa stavu.

Pozor, ak by sme hodnotu intervalu nezaokrúhlili na 36,4, ale nechali by sme 36,3, tak posledná hodnota by bola 117,9. Aby sa predišlo strate dát, je potrebné zaokrúhliť hodnotu intervalu na väčšiu hodnotu.

  1. Spočítajme počet podnikov, ktoré spadajú do každého konkrétneho intervalu. Pri spracovaní údajov je potrebné pamätať na to, že horná hodnota intervalu v tomto intervale sa neberie do úvahy (nie je zahrnutá v tomto intervale), ale je zohľadnená v nasledujúcom intervale (zahŕňa sa spodná hranica intervalu). v tomto intervale a horný nie je zahrnutý), s výnimkou posledného intervalu.

Pri vykonávaní spracovania údajov je najlepšie označiť vybrané údaje konvenčnými ikonami alebo farbou, aby sa spracovanie zjednodušilo.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

Prvý interval označíme žltou farbou - a určíme, koľko údajov spadá do intervalu od 9 do 45,4, pričom tento 45,4 sa bude brať do úvahy v druhom intervale (za predpokladu, že je v údajoch) - výsledkom je, že získať 7 podnikov v prvom intervale. A tak ďalej pre všetky intervaly.

  1. (dodatočná akcia) Vypočítajme celkovú výšku zisku prijatého podnikmi pre každý interval a vo všeobecnosti. Ak to chcete urobiť, pridajte údaje označené rôznymi farbami a získajte celkovú hodnotu zisku.

Na prvý interval 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 miliónov rubľov

Pre druhý interval - 48 + 57 + 48 + 56 + 63 = 272 miliónov rubľov.

Pre tretí interval - 118 + 87 + 98 + 88 = 391 miliónov rubľov.

Cvičenie . Existujú údaje o veľkosti vkladu v banke 30 vkladateľov, tisíc rubľov. 150, 120, 300, 650, 1 500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

Stavať intervalové variačné série rozdelenie vkladateľov podľa veľkosti príspevku, zvýraznenie 4 skupín v rovnakých intervaloch. Pre každú skupinu vypočítajte celkovú výšku príspevkov.