Orice serie variațională constă din. Seria de variații

Rândurile construite dupa cantitate, sunt numite variațională.

Seria de distribuție consta în Opțiuni(valori caracteristice) şi frecvente(numar de grupuri). Frecvențele exprimate ca valori relative(acțiuni, procente) sunt numite frecvente. Suma tuturor frecvențelor se numește volumul seriei de distribuție.

După tip, seriile de distribuție sunt împărțite în discret(construit pe valori discontinue ale caracteristicii) și interval(construit pe valori continue semn).

Seria de variații reprezintă două coloane (sau rânduri); dintre care unul oferă valori individuale ale atributului variabil, numite variante și notate cu X; iar în celălalt - numere absolute, arătând de câte ori (cât de des) apare fiecare opțiune. Indicatorii celei de-a doua coloane se numesc frecvențe și sunt notați în mod convențional cu f. Rețineți din nou că se poate folosi și a doua coloană performanță relativă caracterizarea proporţiei frecvenţei variantelor individuale în valoare totală frecvente. Acești indicatori relativi se numesc frecvențe și se notează convențional cu ω. Suma tuturor frecvențelor în acest caz este egală cu unu. Cu toate acestea, frecvențele pot fi exprimate și ca procent, iar apoi suma tuturor frecvențelor dă 100%.

Dacă variantele seriei variaționale sunt exprimate ca valori discrete, atunci se numește o astfel de serie variațională discret.

Pentru caracteristici continue, serii de variații sunt construite ca interval, adică valorile atributului din ele sunt exprimate „de la ... la ...”. În acest caz, valorile minime ale atributului într-un astfel de interval se numesc limita inferioară a intervalului, iar maxima - limita superioară.

Serii variaționale cu intervale sunt, de asemenea, construite pentru caracteristici discrete care variază într-o gamă largă. Seria de intervale poate fi egalși inegal intervale.

Luați în considerare modul în care este determinată valoarea intervalelor egale. Să introducem următoarea notație:

i– valoarea intervalului;

- valoare maximă un semn în unitățile populației;

- valoarea minimă a atributului pentru unităţi ale populaţiei;

n- numărul de grupuri alocate.

dacă n este cunoscut.

Dacă numărul de grupuri alocate este dificil de determinat în prealabil, atunci formula propusă de Sturgess în 1926 poate fi recomandată pentru a calcula dimensiunea optimă a intervalului cu o dimensiune suficientă a populației:

n = 1+ 3,322 log N, unde N este numărul celor din populație.

Valoarea intervalelor inegale este determinată în fiecare caz individual, ținând cont de caracteristicile obiectului de studiu.

Distribuția statistică a eșantionului apelați lista de opțiuni și frecvențele corespunzătoare (sau frecvențele relative).

Distribuția statistică a eșantionului poate fi specificată sub forma unui tabel, în prima coloană a căruia există opțiuni, iar în a doua - frecvențele corespunzătoare acestor opțiuni. ni, sau frecvențe relative Pi .

Distribuția statistică a eșantionului

Serii de variații se numesc serii de intervale, în care valorile caracteristicilor care stau la baza formării lor sunt exprimate în anumite limite (intervale). Frecvențele în acest caz nu se referă la valori individuale ale atributului, ci la întregul interval.

Seriile de distribuție pe intervale sunt construite în funcție de caracteristici cantitative continue, precum și în funcție de caracteristici discrete, variind într-un interval semnificativ.

Seria de intervale poate fi reprezentată prin distribuția statistică a eșantionului, indicând intervalele și frecvențele corespunzătoare acestora. În acest caz, suma frecvențelor variantei care a căzut în acest interval este luată drept frecvență a intervalului.

La gruparea după caracteristici continue cantitative, este important să se determine dimensiunea intervalului.

Pe lângă media și varianța eșantionului, sunt utilizate și alte caracteristici ale seriei de variații.

Modă numiți varianta care are cea mai mare frecvență.

Nume parametru Sens
Subiect articol: Seria de variații
Rubrica (categoria tematica) Productie

Valori observate variabilă aleatorie X 1 , X 2 , …, x k numit Opțiuni.

Frecvență Opțiuni X i se numeste un numar n i (i=1,…,k) arătând de câte ori apare această variantă în probă.

Frecvență(frecvență relativă, acțiuni) opțiuni x i (i=1,…,k) se numește de obicei raportul frecvenței sale n i la dimensiunea eșantionului n.

Se numesc frecvențele și frecvențele cântare.

Frecvența acumulată este obișnuit să apelați numărul de opțiuni, ale căror valori sunt mai mici decât un dat X:

Frecvența acumulată Se obișnuiește să se numească raportul dintre frecvența acumulată și dimensiunea eșantionului:

serie de variații(seria statistică) - se obișnuiește să se numească o secvență de opțiuni scrise în ordine crescătoare și ponderile lor corespunzătoare.

Seria de variații ar trebui să fie discret(eșantion de valori ale unei variabile aleatoare discrete) și continuu (interval)(selectarea valorilor unei variabile aleatoare continue).

Seria variațională discretă are forma:

Când numărul de opțiuni este mare sau caracteristica este continuă (o variabilă aleatoare poate lua orice valoare într-un anumit interval), acestea sunt interval serie de variații.

Pentru a construi o serie de variații de interval, efectuați gruparea opțiune - sunt împărțite în intervale separate:

Numărul de intervale este uneori determinat folosind Formule Sturges:

Apoi se calculează numărul de variante care se încadrează în fiecare interval - frecvențe n i(sau frecventa n i/n). Dacă varianta se află la limita intervalului, atunci este atașată la intervalul potrivit.

Seria variațională de interval are forma:

Opțiuni
Frecvențele

Funcția de distribuție empirică (statistică). se obişnuieşte să se apeleze o funcţie a cărei valoare la punct X egală frecventa relativa faptul că varianta va lua o valoare mai mică decât X(frecvența cumulativă pentru X):

Poligon de frecvență se numește polilinie ale cărei segmente conectează puncte cu coordonate ( X 1 ; n 1), (X 2 ; n 2), …, (x k; nk). The poligon de frecvență, care este un analog statistic al poligonului de distribuții.

Merită spus că pentru o serie variațională continuă se poate construi un poligon dacă valorile X 1 , X 2 , …, x k luați punctele de mijloc ale intervalelor.

O serie de variații de interval este de obicei reprezentată grafic folosind histogramelor.

grafic de bare- o figură în trepte formată din dreptunghiuri ale căror baze sunt intervale de lungime parțială h= x i +1 – x i, i= 0,…,k-1, iar înălțimile sunt egale cu frecvențele (sau frecvențele) intervalelor n i (w i).

Cumula(curba cumulativă) - curba frecvențelor (frecvențe) acumulate. Pentru serie discretă cumulatul este o linie întreruptă care leagă punctele sau , . Pentru serie de intervale cumulat începe dintr-un punct, a cărui abscisă este egală cu începutul primului interval, iar ordonata este frecvența (frecvența) acumulată; zero. Alte puncte ale acestei linii întrerupte corespund capetelor intervalelor.

Seria de variații - concept și tipuri. Clasificarea și caracteristicile categoriei „Seria de variante” 2017, 2018.

  • - Serii de variații de distribuție

    Distribuția cifrei de afaceri cu amănuntul Federația Rusăîn 1995 după tipul de proprietate, milioane de ruble Tipuri de serii de distribuție Curs VIII. Serii de distribuție În urma prelucrării și sistematizării datelor statistice primare, se obțin ....


  • - Seria de variații

    Cea mai simplă transformare a datelor statistice este ordonarea lor după mărime. Volumul probei de la populatie, ordonate în ordinea nedescrescătoare a elementelor, adică. , se numește serie variațională: . În cazul în care volumul de observații ... .


  • - Sarcina 2. Seria de variație de interval

    1. Pe baza unui eșantion dat corespunzător variantei sarcinii, construiți o serie de variații de interval; construiți o histogramă și cumulați (utilizați două metode: introducerea unei diagrame Excel și modul „Histogramă” al pachetului „Analiza datelor”). 2. Analizați histograma rezultată. ... .


  • - Alcătuiește o serie de variații a variabilității trăsăturii semințelor sau frunzelor de fasole ale oricărei plante de aceeași vârstă. Dezvăluie modele de variabilitate a trăsăturilor.

    Populatie - unitate structurală drăguț. Numărul de populații. Cauzele fluctuațiilor populației. Relația indivizilor din populații și dintre diferitele populații ale aceleiași specii și ale diferitelor specii. 1. O caracteristică importantă a unei specii este distribuția ei în grupuri, populații în ...

  • (definiția unei serii variaționale; componentele unei serii variaționale; trei forme ale unei serii variaționale; oportunitatea construirii unei serii de intervale; concluzii care pot fi trase din seria construită)

    O serie variațională este o succesiune a tuturor elementelor unei probe aranjate în ordine nedescrescătoare. Elemente identice sunt repetate

    Variaționale - acestea sunt serii construite pe o bază cantitativă.

    Seria de variații distribuțiile constau din două elemente: variante și frecvențe:

    Opțiunile sunt valori numerice trăsătură cantitativăîn seria de distribuţie variaţională. Ele pot fi pozitive sau negative, absolute sau relative. Deci, la gruparea întreprinderilor în funcție de rezultate activitate economică opțiunile pozitive sunt profitul și numere negative este o pierdere.

    Frecvențele sunt numerele de variante individuale sau fiecare grup al seriei de variații, adică. acestea sunt numere care arată cât de des apar anumite opțiuni într-o serie de distribuție. Suma tuturor frecvențelor se numește volumul populației și este determinată de numărul de elemente ale întregii populații.

    Frecvențele sunt frecvențe exprimate ca valori relative (fracții de unități sau procente). Suma frecvențelor este egală cu unu sau 100%. Înlocuirea frecvențelor cu frecvențe vă permite să comparați seria variațională cu număr diferit observatii.

    Există trei forme de serie de variații: seriale clasate, seriale discrete și serie de intervale.

    O serie clasificată este distribuția unităților individuale ale populației în ordine crescătoare sau descrescătoare a trăsăturii studiate. Clasificarea facilitează împărțirea datelor cantitative în grupuri, detectarea imediată a celor mai mici și cea mai mare valoare caracteristică, evidențiați valorile care se repetă cel mai des.

    Alte forme ale seriei de variații sunt tabele de grup întocmite în funcție de natura variației valorilor trăsăturii studiate. Prin natura variației, se disting semne discrete (discontinue) și continue.

    Serii discrete- aceasta este o astfel de serie variațională, a cărei construcție se bazează pe semne cu schimbare discontinuă (semne discrete). Acestea din urmă includ categoria tarifară, numărul de copii din familie, numărul de angajați din întreprindere etc. Aceste semne pot lua doar un număr finit de anumite valori.

    O serie variațională discretă este un tabel care constă din două coloane. Prima coloană indică valoarea specifică a atributului, iar a doua - numărul de unități de populație cu o anumită valoare semn.

    Dacă un semn are o schimbare continuă (valoarea venitului, experiența de muncă, costul mijloacelor fixe ale unei întreprinderi etc., care poate lua orice valoare în anumite limite), atunci trebuie construită o serie de variații de interval pentru acest semn.



    Tabelul de grup de aici are și două coloane. Primul indică valoarea caracteristicii în intervalul „de la - la” (opțiuni), al doilea - numărul de unități incluse în interval (frecvență).

    Frecvența (frecvența de repetare) - numărul de repetări ale unei anumite variante a valorilor atributului, notat fi, și suma frecvențelor egală cu volumul populației studiate, notat

    Unde k este numărul de opțiuni de valoare de atribut

    Foarte des, tabelul este completat cu o coloană în care se calculează frecvențele acumulate S, care arată câte unități ale populației au o valoare caracteristică de cel mult valoare dată.

    O serie de distribuție variațională discretă este o serie în care grupurile sunt compuse în funcție de o trăsătură care variază discret și ia doar valori întregi.

    Seria de variație a intervalului de distribuție este o serie în care atributul de grupare, care formează baza grupării, poate lua orice valori într-un anumit interval, inclusiv cele fracționale.

    O serie variațională de interval este un set ordonat de intervale de variație a valorilor unei variabile aleatoare cu frecvențele corespunzătoare sau frecvențele valorilor cantității care se încadrează în fiecare dintre ele.

    Este oportun să se construiască o serie de distribuție de intervale, în primul rând, cu o variație continuă a unei trăsături și, de asemenea, dacă o variație discretă se manifestă pe o gamă largă, de ex. numărul de opțiuni pentru o caracteristică discretă este destul de mare.

    Din această serie se pot trage deja câteva concluzii. De exemplu, elementul mediu al unei serii de variații (mediana) poate fi o estimare a rezultatului cel mai probabil al unei măsurători. Primul și ultimul element al seriei variaționale (adică elementul minim și maxim al eșantionului) arată răspândirea elementelor eșantionului. Uneori, dacă primul sau ultimul element este foarte diferit de restul eșantionului, atunci ele sunt excluse din rezultatele măsurătorilor, având în vedere că aceste valori au fost obținute ca urmare a unui fel de defecțiune gravă, de exemplu, tehnologie.

    Practica 1

    SERIE VARIAȚIONALĂ DE DISTRIBUȚIE

    serie de variații sau aproape de distribuție numită distribuția ordonată a unităților populației în funcție de valorile în creștere (mai des) sau descrescătoare (mai rar) ale atributului și numărarea numărului de unități cu una sau alta valoare a atributului.

    Sunt 3 drăguț domeniul de distribuție:

    1) rând clasat- aceasta este o listă a unităților individuale ale populației în ordinea crescătoare a trăsăturii studiate; dacă numărul de unități de populație este suficient de mare, seria clasată devine greoaie, iar în astfel de cazuri seria de distribuție se construiește prin gruparea unităților populației în funcție de valorile trăsăturii studiate (dacă trăsătura ia un număr mic de valori, atunci se construiește o serie discretă, iar în caz contrar, o serie de intervale);

    2) serie discretă- acesta este un tabel format din două coloane (rânduri) - valori specifice ale unui atribut diferit X iși numărul de unități de populație cu valoarea dată a caracteristicii f i– frecvențe; numărul de grupuri dintr-o serie discretă este determinat de numărul de valori efectiv existente ale atributului variabil;

    3) serie de intervale- acesta este un tabel format din două coloane (rânduri) - intervale de semn variabil X iși numărul de unități de populație care se încadrează într-un interval dat (frecvențe), sau proporția acestui număr în numărul total de populații (frecvențe).

    Sunt numite numere care arată de câte ori apar opțiuni individuale într-o anumită populație frecvente sau cântare opțiune și sunt marcate literă mică alfabet latin f. Suma totală a frecvențelor seriei variaționale este egală cu volumul acestei populații, i.e.

    Unde k– numărul de grupuri, nnumărul total observații sau dimensiunea populației.

    Frecvențele (greutățile) sunt exprimate nu numai în absolut, ci și în numere relative - în fracții de unitate sau ca procent din numărul total de variante care alcătuiesc acest set. În astfel de cazuri, se numesc greutăți frecvențe relative sau frecvente. Suma totală a detaliilor este egală cu unu

    sau
    ,

    dacă frecvenţele sunt exprimate ca procent din numărul total de observaţii P.Înlocuirea frecvențelor cu frecvențe nu este obligatorie, dar uneori se dovedește a fi utilă și chiar necesară în acele cazuri când este necesar să se compare între ele serii variaționale care diferă mult în volumele lor.

    În funcție de modul în care variază atributul - discret sau continuu, într-un interval larg sau îngust - populația statistică este distribuită în fără intervale sau interval linii de variație. În primul caz, frecvențele se referă direct la valorile clasate ale caracteristicii, care dobândesc poziția grupuri individuale sau clase ale seriei variaționale, în a doua se calculează frecvențele aferente intervalelor sau intervalelor individuale (de la - până la), în care variația generală a trăsăturii se împarte în intervalul de la variantele minime la maxime ale acestei populații. . Aceste spații sau spații de clasă pot fi sau nu egale ca lățime. De aici se disting serie variațională cu intervale egale și inegale.În serii de intervale inegale, natura distribuției de frecvență se modifică pe măsură ce lățimea intervalelor de clasă se modifică. Gruparea cu intervale inegale în biologie este folosită relativ rar. De regulă, datele biometrice sunt distribuite în serii de intervale egale, ceea ce permite nu numai identificarea modelului de variație, dar facilitează și calcularea datelor rezumative. caracteristici numerice serie de variații, compararea serii de distribuție între ele.

    Când începeți să construiți o serie variațională cu intervale egale, este important să conturați corect lățimea intervalului de clasă. Faptul este că o grupare brută (când sunt stabilite intervale de clasă foarte largi) denaturează caracteristicile tipice ale variației și duce la o scădere a preciziei caracteristicilor numerice ale seriei. Atunci când se aleg intervale excesiv de înguste, acuratețea caracteristicilor numerice generalizate crește, dar seria se dovedește a fi prea extinsă și nu oferă o imagine clară a variației.

    Pentru a obţine o serie variaţională bine definită şi Pentru a asigura o acuratețe suficientă a caracteristicilor numerice calculate din acesta, este necesar să se împartă variația trăsăturii (în intervalul de la opțiunile minime la maxime) într-un astfel de număr de grupuri sau clase care să satisfacă ambele cerințe. Această problemă este rezolvată prin împărțirea intervalului de variație a unei caracteristici la numărul de grupuri sau clase care sunt planificate la construirea unei serii de variații:

    ,

    Unde h– valoarea intervalului; X m a x i X min este maximul și valoarea minima In total; k este numărul de grupuri.

    Când se construiește o serie de distribuție a intervalelor, este necesar să se aleagă numărul optim de grupuri (intervale de caractere) și să se stabilească lungimea (intervalul) intervalului. Deoarece analiza seriei de distribuție compară frecvențele în intervale diferite, este necesar ca lungimea intervalelor să fie constantă. Dacă trebuie să aveți de-a face cu o serie de intervale de distribuție cu intervale inegale, atunci pentru comparabilitate trebuie să aduceți frecvența sau frecvența la unitatea intervalului, valoarea rezultată se numește densitate ρ , adică
    .

    Numărul optim de grupuri este ales astfel încât diversitatea valorilor trăsăturilor în agregat să fie suficient reflectată și, în același timp, regularitatea distribuției, forma acesteia să nu fie distorsionată de fluctuațiile aleatorii ale frecvenței. Dacă sunt prea puține grupuri, nu va exista nici un model de variație; dacă există prea multe grupuri, salturile aleatorii de frecvență vor distorsiona forma distribuției.

    Cel mai adesea, numărul de grupuri dintr-o serie de distribuție este determinat de formula Sturgess:

    Unde n- mărimea populaţiei.

    O reprezentare grafică oferă asistență esențială în analiza unei serii de distribuție și a proprietăților acesteia. Seria de intervale este reprezentată de o diagramă cu bare, în care bazele barelor, situate de-a lungul axei absciselor, sunt intervalele de valori ale atributului variabil, iar înălțimile barelor sunt frecvențele corespunzătoare scalei de-a lungul axa ordonatelor. Acest tip de diagramă se numește histogramă.

    Dacă există o serie de distribuție discretă sau se folosesc intervalele mijlocii, atunci reprezentarea grafică a unei astfel de serii se numește poligon, care se obține prin conectarea punctelor drepte cu coordonatele X iși f i .

    Dacă valorile clasei sunt reprezentate de-a lungul axei absciselor, iar frecvențele acumulate sunt reprezentate de-a lungul axei ordonatelor, urmate de conectarea punctelor cu linii drepte, se obține un grafic numit cumulativ. Frecvențele acumulate se găsesc prin însumare succesivă, sau cumul frecvențe în direcția de la prima clasă până la sfârșitul seriei de variații.

    Exemplu. Există date despre producția de ouă a 50 de găini ouătoare timp de 1 an ținute într-o fermă de păsări (Tabelul 1.1).

    T a b l e 1.1

    Găinile ouătoare

    Nr de găini ouătoare

    Producția de ouă, buc.

    Nr de găini ouătoare

    Producția de ouă, buc.

    Nr de găini ouătoare

    Producția de ouă, buc.

    Nr de găini ouătoare

    Producția de ouă, buc.

    Nr de găini ouătoare

    Producția de ouă, buc.

    Este necesar să construiți o serie de distribuție a intervalelor și să o afișați grafic sub formă de histogramă, poligon și cumul.

    Se poate observa că trăsătura variază de la 212 la 245 de ouă obținute de la o găină ouătoare într-un an.

    În exemplul nostru, folosind formula Sturgess, determinăm numărul de grupuri:

    k = 1 + 3,322lg 50 = 6,643 ≈ 7.

    Calculați lungimea (intervalul) intervalului folosind formula:

    .

    Să construim o serie de intervale cu 7 grupuri și un interval de 5 bucăți. ouă (Tabelul 1.2). Pentru a construi grafice în tabel, calculăm mijlocul intervalelor și frecvența acumulată.

    T a b l e 1.2

    Seria de intervale de distribuție a producției de ouă

    Grup de găini ouătoare în funcție de mărimea producției de ouă

    X i

    Număr de găini ouătoare

    f i

    Punct de mijloc al intervalului

    X eu

    Frecvența acumulată

    f i

    Să construim o histogramă a distribuției producției de ouă (Fig. 1.1).

    Orez. 1.1. Histograma distribuției producției de ouă

    Aceste histograme arată forma de distribuție caracteristică multor trăsături: valorile intervalelor medii ale trăsăturii sunt mai frecvente, iar valorile extreme (mici și mari) ale trăsăturii sunt mai puțin frecvente. Forma acestei distribuții este apropiată de legea distribuției normale, care se formează dacă o variabilă variabilă este influențată de un număr mare de factori, niciunul dintre care nu are o valoare predominantă.

    Poligonul și cumulul distribuției producției de ouă au forma (Fig. 1.2 și 1.3).

    Orez. 1.2. Poligonul de distribuție a ouălor

    Orez. 1.3. Distribuția cumulată a producției de ouă

    Tehnologia de rezolvare a problemelor în procesor de foi de calcul Microsoft excela Următorul.

    1. Introduceți datele inițiale conform fig. 1.4.

    2. Clasează rândul.

    2.1. Selectați celulele A2:A51.

    2.2. Faceți clic stânga pe bara de instrumente de pe butonul<Сортировка по возрастанию > .

    3. Determinați dimensiunea intervalului pentru construirea seriei de intervale a distribuției.

    3.1. Copiați celula A2 în celula E53.

    3.2. Copiați celula A51 în celula E54.

    3.3. Calculați intervalul de variație. Pentru a face acest lucru, introduceți formula în celula E55 =E54-E53.

    3.4. Calculați numărul de grupuri de variații. Pentru a face acest lucru, introduceți formula în celula E56 =1+3,322*LOG10(50).

    3.5. Introduceți în celula E57 numărul rotunjit de grupuri.

    3.6. Calculați lungimea intervalului. Pentru a face acest lucru, introduceți formula în celula E58 =E55/E57.

    3.7. Introduceți în celula E59 lungimea rotunjită a intervalului.

    4. Construiți o serie de intervale.

    4.1. Copiați celula E53 în celula B64.

    4.2. Introduceți formula în celula B65 =B64+$E$59.

    4.3. Copiați celula B65 în celulele B66:B70.

    4.4. Introduceți formula în celula C64 =B65.

    4.5. Introduceți formula în celula C65 =C64+$E$59.

    4.6. Copiați celula C65 în celulele C66:C70.

    Rezultatele soluției sunt afișate pe ecranul de afișare în următoarea formă (Fig. 1.5).

    5. Calculați frecvența intervalului.

    5.1. Executați comanda Serviciu,Analiza datelor făcând clic alternativ cu butonul stâng al mouse-ului.

    5.2. În caseta de dialog Analiza datelor setați cu butonul stâng al mouse-ului: Instrumente de analiză <Гистограмма>(Fig. 1.6).

    5.3. Faceți clic stânga pe butonul<ОК>.

    5.4. Pe fila grafic de bare setați parametrii conform fig. 1.7.

    5.5. Faceți clic stânga pe butonul<ОК>.

    Rezultatele soluției sunt afișate pe ecranul de afișare în următoarea formă (Fig. 1.8).

    6. Completați tabelul „Seria de intervale de distribuție”.

    6.1. Copiați celulele B74:B80 în celulele D64:D70.

    6.2. Calculați suma frecvențelor. Pentru a face acest lucru, selectați celulele D64:D70 și faceți clic stânga pe butonul din bara de instrumente<Автосумма > .

    6.3. Calculați mijlocul intervalelor. Pentru a face acest lucru, introduceți formula în celula E64 =(B64+C64)/2și copiați în celulele E65:E70.

    6.4. Calculați frecvențele acumulate. Pentru a face acest lucru, copiați celula D64 în celula F64. În celula F65, introduceți formula =F64+D65 și copiați-o în celulele F66:F70.

    Rezultatele soluției sunt afișate pe ecranul de afișare în următoarea formă (Fig. 1.9).

    7. Editați histograma.

    7.1. Faceți clic dreapta pe diagrama de pe numele „buzunar” și în fila care apare, faceți clic pe butonul<Очистить>.

    7.2. Faceți clic dreapta pe diagramă și pe fila care apare, faceți clic pe butonul<Исходные данные>.

    7.3. În caseta de dialog Datele inițiale modificați etichetele axei X. Pentru a face acest lucru, selectați celulele B64:C70 (Fig. 1.10).

    7.5. apasa tasta .

    Rezultatele sunt afișate pe ecran în următoarea formă(Fig. 1.11).

    8. Construiți un poligon de distribuție a ouălor.

    8.1. Faceți clic stânga pe bara de instrumente de pe butonul<Мастер диаграмм > .

    8.2. În caseta de dialog Expert diagramă (pasul 1 din 4) utilizați butonul stâng al mouse-ului pentru a seta: Standard <График>(Fig. 1.12).

    8.3. Faceți clic stânga pe butonul<Далее>.

    8.4. În caseta de dialog Chart Wizard (Pasul 2 din 4) setați parametrii conform fig. 1.13.

    8.5. Faceți clic stânga pe butonul<Далее>.

    8.6. În caseta de dialog Expert grafic (pasul 3 din 4) introduceți numele diagramei și ale axei Y (Fig. 1.14).

    8.7. Faceți clic stânga pe butonul<Далее>.

    8.8. În caseta de dialog Chart Wizard (Pasul 4 din 4) setați parametrii conform fig. 1.15.

    8.9. Faceți clic stânga pe butonul<Готово>.

    Rezultatele sunt afișate pe ecranul de afișare în următoarea formă (Fig. 1.16).

    9. Introduceți etichete de date pe diagramă.

    9.1. Faceți clic dreapta pe diagramă și pe fila care apare, faceți clic pe butonul<Исходные данные>.

    9.2. În caseta de dialog Datele inițiale modificați etichetele axei X. Pentru a face acest lucru, selectați celulele E64:E70 (Fig. 1.17).

    9.3. apasa tasta .

    Rezultatele sunt afișate pe ecranul de afișare în următoarea formă (Fig. 1.18).

    Cumulul de distribuție este construit în mod similar cu poligonul de distribuție pe baza frecvențelor acumulate.

    Acestea sunt prezentate sub formă de serii de distribuție și sunt formatate ca .

    O serie de distribuție este un tip de grupare.

    Domeniul de distribuție- reprezintă o distribuție ordonată a unităților populației studiate în grupuri în funcție de un anumit atribut variabil.

    În funcție de trăsătura care stă la baza formării unei serii de distribuție, există atributiv și variațional grade de distributie:

    • atributiv- apelați seria de distribuție construită pe motive calitative.
    • Se numesc serii de distribuție construite în ordine crescătoare sau descrescătoare a valorilor unui atribut cantitativ variațională.
    Seria de variații a distribuției constă din două coloane:

    Prima coloană conține valori cantitative trăsătură variabilă, care se numesc Opțiuniși sunt marcate. Varianta discretă - exprimată ca număr întreg. Opțiunea de interval este în intervalul de la și până. În funcție de tipul de variante, este posibilă construirea unei serii variaționale discrete sau interval.
    A doua coloană conține Cantitate opțiune specifică , exprimat în termeni de frecvențe sau frecvențe:

    Frecvențele- acestea sunt numere absolute care arată de câte ori în total apare valoarea dată a caracteristicii, care denotă . Suma tuturor frecvențelor ar trebui să fie egală cu numărul de unități ale întregii populații.

    Frecvențele() sunt frecvențele exprimate ca procent din total. Suma tuturor frecvențelor exprimată ca procent trebuie să fie egală cu 100% în fracțiuni de unu.

    Reprezentarea grafică a seriilor de distribuție

    Serii de distribuție sunt vizualizate folosind imagini grafice.

    Seriile de distribuție sunt afișate ca:
    • Poligon
    • Histograme
    • Se cumulează
    • ogive

    Poligon

    Când se construiește un poligon pe axa orizontală (axa absciselor), sunt trasate valorile atributului variabil, iar pe axa verticala(axa y) - frecvențe sau frecvențe.

    Poligonul din fig. 6.1 a fost construit conform micro-recensământului populației Rusiei în 1994.

    6.1. Distribuția gospodăriilor după mărime

    Condiție: Sunt date date privind repartizarea a 25 de salariați ai uneia dintre întreprinderi pe categorii tarifare:
    4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
    Sarcină: Construiți o serie variațională discretă și descrieți-o grafic ca un poligon de distribuție.
    Decizie:
    LA acest exemplu opțiuni este categoria salarială a angajatului. Pentru a determina frecvențele, este necesar să se calculeze numărul de angajați cu categoria salarială corespunzătoare.

    Poligonul este utilizat pentru serii de variații discrete.

    Pentru a construi un poligon de distribuție (Fig. 1), de-a lungul abscisei (X), trasăm valorile cantitative ale trăsăturii diferite - variante și de-a lungul ordonatei - frecvențe sau frecvențe.

    Dacă valorile caracteristice sunt exprimate ca intervale, atunci o astfel de serie se numește serie de intervale.
    serie de intervale distribuțiile sunt afișate grafic ca histogramă, cumulat sau ogivă.

    Tabel statistic

    Condiție: Sunt date date despre mărimea depozitelor 20 indiviziiîntr-o bancă (mii de ruble) 60; 25; 12; zece; 68; 35; 2; 17; 51; nouă; 3; 130; 24; 85; 100; 152; 6; optsprezece; 7; 42.
    Sarcină: Construiți o serie de variații de intervale cu intervale egale.
    Decizie:

    1. Populația inițială este formată din 20 de unități (N = 20).
    2. Folosind formula Sturgess, definim suma necesară grupuri utilizate: n=1+3.322*lg20=5
    3. Să calculăm valoarea intervalului egal: i=(152 - 2) /5 = 30 mii de ruble
    4. Împărțim populația inițială în 5 grupuri cu un interval de 30 de mii de ruble.
    5. Rezultatele grupării sunt prezentate în tabel:

    Cu o astfel de înregistrare a unei caracteristici continue, atunci când aceeași valoare apare de două ori (ca limită superioară a unui interval și limita inferioară a altui interval), atunci această valoare aparține grupului în care această valoare acționează ca limită superioară.

    grafic de bare

    Pentru a construi o histogramă de-a lungul abscisei, indicați valorile limitelor intervalelor și, pe baza acestora, construiți dreptunghiuri a căror înălțime este proporțională cu frecvențele (sau frecvențele).

    Pe fig. 6.2. este prezentată histograma distribuției populației Rusiei în 1997 pe grupe de vârstă.

    Orez. 6.2. Distribuția populației Rusiei pe grupe de vârstă

    Condiție: Se da repartizarea a 30 de angajati ai firmei in functie de marimea salariului lunar

    Sarcină: Afișează grafic seria variației intervalului ca histogramă și cumulează.
    Decizie:

    1. Limita necunoscută a intervalului deschis (primul) este determinată de valoarea celui de-al doilea interval: 7000 - 5000 = 2000 ruble. Cu aceeași valoare găsim limita inferioară primul interval: 5000 - 2000 = 3000 ruble.
    2. Pentru a construi o histogramă într-un sistem de coordonate dreptunghiular, de-a lungul axei absciselor, punem deoparte segmente ale căror valori corespund intervalelor rândului variantă.
      Aceste segmente servesc drept bază inferioară, iar frecvența corespunzătoare (frecvența) servește drept înălțime a dreptunghiurilor formate.
    3. Să construim o histogramă:

    Pentru a construi cumulul, este necesar să se calculeze frecvențele (frecvențele) acumulate. Ele sunt determinate prin însumarea succesivă a frecvenţelor (frecvenţelor) intervalelor anterioare şi se notează cu S. Frecvenţele acumulate arată câte unităţi ale populaţiei au o valoare caracteristică nu mai mare decât cea luată în considerare.

    Cumula

    Distribuția unei trăsături într-o serie variațională în funcție de frecvențele (frecvențele) acumulate este reprezentată folosind cumulat.

    Cumula sau curba cumulativă, spre deosebire de poligon, este construită pe frecvențele sau frecvențele acumulate. În același timp, valorile caracteristicii sunt plasate pe axa absciselor, iar frecvențele sau frecvențele acumulate sunt plasate pe axa ordonatelor (Fig. 6.3).

    Orez. 6.3. Distribuția cumulativă a gospodăriilor după mărime

    4. Calculați frecvențele acumulate:
    Frecvența genunchiului primului interval se calculează astfel: 0 + 4 = 4, pentru al doilea: 4 + 12 = 16; pentru al treilea: 4 + 12 + 8 = 24 etc.

    Când se construiește cumulul, frecvența (frecvența) acumulată a intervalului corespunzător este atribuită limitei sale superioare:

    Ogiva

    Ogiva este construit în mod similar cu cumulul, cu singura diferență că frecvențele acumulate sunt plasate pe axa absciselor, iar valorile caracteristicilor sunt plasate pe axa ordonatelor.

    O variație a cumulului este curba concentrației sau diagrama Lorenz. Pentru a trasa curba concentrației pe ambele axe sistem dreptunghiular coordonate, se aplică o scară de scară în procente de la 0 la 100. În acest caz, abscisele indică frecvențele acumulate, iar ordonatele arată valorile acumulate ale cotei (în procente) în funcție de volumul caracteristicii.

    Distribuția uniformă a semnului corespunde diagonalei pătratului de pe grafic (Fig. 6.4). Cu distribuție neuniformă, graficul este o curbă concavă în funcție de nivelul de concentrație al trăsăturii.

    6.4. curba de concentrare