Luo sarja esimerkkejä. Variaatiosarja

  • johdantotunti on ilmainen;
  • Suuri määrä kokeneita opettajia (syntyperäinen ja venäjänkielinen);
  • Kurssit EIVÄT tietylle ajanjaksolle (kuukausi, kuusi kuukautta, vuosi), vaan tietylle määrälle oppitunteja (5, 10, 20, 50);
  • Yli 10 000 tyytyväistä asiakasta.
  • Yhden oppitunnin hinta venäjänkielisen opettajan kanssa - alkaen 600 ruplaa, äidinkielenään puhuvan alkaen 1500 ruplaa

Variaatiosarjan käsite. Ensimmäinen askel tilastollisen havainnoinnin materiaalien systematisoinnissa on laskea niiden yksiköiden lukumäärä, joilla on jokin ominaisuus. Kun yksiköt on järjestetty niiden määrällisen attribuutin nousevaan tai laskevaan järjestykseen ja laskettu tietyn attribuutin arvon omaavien yksiköiden lukumäärä, saadaan variaatiosarja. Variaatiosarja kuvaa tietyn tilastollisen perusjoukon yksiköiden jakautumista jonkin kvantitatiivisen attribuutin mukaan.

Muunnelmasarja koostuu kahdesta sarakkeesta, vasen sarake sisältää muuttujaattribuutin arvot, joita kutsutaan varianteiksi ja joita merkitään (x), ja oikea sarake sisältää absoluuttiset luvut, jotka osoittavat, kuinka monta kertaa kukin variantti esiintyy. Tämän sarakkeen arvoja kutsutaan taajuuksiksi ja niitä merkitään (f).

Kaavamaisesti variaatiosarja voidaan esittää taulukon 5.1 muodossa:

Taulukko 5.1

Variaatiosarjan tyyppi

Vaihtoehdot (x)

Taajuudet (f)

Oikeassa sarakkeessa voidaan käyttää myös suhteellisia indikaattoreita, jotka kuvaavat yksittäisten muunnelmien esiintymistiheyden osuutta taajuuksien kokonaismäärästä. Näitä suhteellisia indikaattoreita kutsutaan taajuuksiksi ja niitä merkitään tavanomaisesti ts. . Kaikkien taajuuksien summa on yhtä suuri kuin yksi. Taajuudet voidaan ilmaista myös prosentteina, jolloin niiden summa on 100%.

Muuttuvat merkit voivat olla luonteeltaan erilaisia. Joidenkin merkkien muunnelmat ilmaistaan ​​kokonaislukuina, esimerkiksi huoneiden lukumäärä asunnossa, julkaistujen kirjojen määrä jne. Näitä merkkejä kutsutaan epäjatkuviksi tai erillisiksi. Muiden ominaisuuksien muunnelmat voivat saada mitä tahansa arvoja tietyissä rajoissa, kuten suunniteltujen tavoitteiden saavuttaminen, palkat jne. Näitä ominaisuuksia kutsutaan jatkuviksi.

Diskreetti variaatiosarja. Jos variaatiosarjan variantit ilmaistaan ​​diskreeteinä arvoina, niin tällaista vaihtelusarjaa kutsutaan diskreetiksi, sen ulkonäkö on esitetty taulukossa. 5.2:

Taulukko 5.2

Opiskelijoiden jakautuminen kokeessa saatujen arvosanojen mukaan

Arviot (x)

Opiskelijoiden määrä (f)

% kokonaismäärästä ()

Diskreettien sarjojen jakauman luonne on kuvattu graafisesti jakautumapolygonina, kuva 5.1.

Riisi. 5.1. Opiskelijoiden jakautuminen kokeessa saatujen arvosanojen mukaan.

Intervallivaihtelusarja. Jatkuville ominaisuuksille variaatiosarjat muodostetaan intervallisarjoiksi, ts. niissä olevat ominaisuusarvot ilmaistaan ​​aikaväleinä "alkaen ja tohon". Tässä tapauksessa ominaisuuden minimiarvoa sellaisessa välissä kutsutaan välin alarajaksi ja maksimiarvoa intervallin ylärajaksi.

Intervallivaihtelusarjat on rakennettu sekä epäjatkuville ominaisuuksille (diskreeteille) että niille, jotka vaihtelevat laajalla alueella. Intervallirivit voivat olla yhtäläisin ja epätasaisin välein. Talouskäytännössä käytetään enimmäkseen epätasaisia ​​intervalleja, jotka kasvavat tai pienenevät asteittain. Tällainen tarve syntyy erityisesti tapauksissa, joissa merkin vaihtelu tapahtuu epätasaisesti ja suurissa rajoissa.

Harkitse intervallisarjan tyyppiä yhtäläisin välein, Taulukko. 5.3:

Taulukko 5.3

Työntekijöiden jakautuminen tuotannon mukaan

Lähtö, tr. (X)

Työntekijöiden määrä (f)

Kumulatiivinen taajuus (f´)

Intervallijakaumasarja on kuvattu graafisesti histogrammina, kuva 5.2.

Kuva 5.2. Työntekijöiden jakautuminen tuotannon mukaan

Kertynyt (kumulatiivinen) taajuus. Käytännössä on olemassa tarve muuntaa jakelusarjat kumulatiiviset rivit, rakennettu kertyneille taajuuksille. Niiden avulla voidaan määrittää rakenteellisia keskiarvoja, jotka helpottavat jakautumasarjatietojen analysointia.

Kumulatiiviset taajuudet määritetään lisäämällä peräkkäin näiden indikaattoreiden ensimmäisen ryhmän taajuuksiin (tai frekvenssiin) jakaumasarjan myöhempiä ryhmiä. Kumulaatteja ja ogiveja käytetään havainnollistamaan jakelusarjaa. Niiden rakentamiseksi abskissa-akselille on merkitty diskreetin piirteen arvot (tai välien päät) ja ordinaatta-akselille kasvavat taajuuksien summat (kumulaatti), kuva 5.3.

Riisi. 5.3. Työntekijöiden kumulatiivinen jakautuminen kehityksen mukaan

Jos taajuuksien ja varianttien asteikot vaihdetaan keskenään, ts. heijastaa kumuloituneita taajuuksia abskissa-akselilla ja vaihtoehtojen arvoja ordinaatta-akselilla, niin taajuuksien muutosta ryhmästä toiseen kuvaavaa käyrää kutsutaan jakaumaksi, kuva 5.4.

Riisi. 5.4. Ogiva työntekijöiden jakelu tuotantoon

Samanväliset vaihtelusarjat ovat yksi tärkeimmistä tilastollisille jakaumasarjoille tarkoitetuista vaatimuksista, mikä varmistaa niiden vertailukelpoisuuden ajallisesti ja avaruudessa.

Jakauman tiheys. Näiden sarjojen yksittäisten epätasaisten välien taajuudet eivät kuitenkaan ole suoraan vertailukelpoisia. Tällaisissa tapauksissa tarvittavan vertailukelpoisuuden varmistamiseksi lasketaan jakautumistiheys, ts. määrittää, kuinka monta yksikköä kussakin ryhmässä on intervalliarvon yksikköä kohti.

Muodostettaessa kuvaajaa vaihtelevan sarjan jakautumisesta epätasaisin väliajoin, suorakulmioiden korkeus määritetään suhteessa ei taajuuksiin, vaan tutkitun piirteen arvojen jakautumistiheyden indikaattoreihin vastaavilla aikaväleillä. .

Variaatiosarjan laatiminen ja sen graafinen esittäminen on ensimmäinen vaihe lähtötietojen käsittelyssä ja ensimmäinen vaihe tutkittavan perusjoukon analysoinnissa. Seuraava vaihe vaihtelusarjojen analysoinnissa on tärkeimpien yleistävien indikaattoreiden, joita kutsutaan sarjan ominaisuuksiksi, määrittäminen. Näiden ominaisuuksien pitäisi antaa käsitys attribuutin keskiarvosta väestön yksiköissä.

keskiarvo. Keskiarvo on tutkitun ominaisuuden yleistetty ominaisuus tutkitussa populaatiossa, joka heijastaa sen tyypillistä tasoa populaatioyksikköä kohden tietyissä paikan ja ajan olosuhteissa.

Keskiarvo on aina nimetty, sillä on sama ulottuvuus kuin populaation yksittäisten yksiköiden attribuutilla.

Ennen keskiarvojen laskemista on tarpeen ryhmitellä tutkitun populaation yksiköt korostaen laadullisesti homogeeniset ryhmät.

Koko väestölle laskettua keskiarvoa kutsutaan yleiskeskiarvoksi ja kunkin ryhmän keskiarvoksi.

Keskiarvoja on kahdenlaisia: teho (aritmeettinen keskiarvo, harmoninen keskiarvo, geometrinen keskiarvo, neliöllinen keskiarvo); rakenteellinen (moodi, mediaani, kvartiilit, desiilit).

Laskennan keskiarvon valinta riippuu tarkoituksesta.

Tehokeskiarvojen tyypit ja niiden laskentamenetelmät. Kerätyn aineiston tilastollisessa käsittelyssä syntyy erilaisia ​​ongelmia, joiden ratkaisemiseen tarvitaan erilaisia ​​keskiarvoja.

Matemaattiset tilastot saavat erilaisia ​​keinoja potenssikeskikaavoista:

missä on keskiarvo; x - yksittäiset vaihtoehdot (ominaisuusarvot); z - eksponentti (pisteessä z = 1 - aritmeettinen keskiarvo, z = 0 geometrinen keskiarvo, z = - 1 - harmoninen keskiarvo, z = 2 - keskimääräinen neliö).

Kuitenkin kysymys siitä, minkä tyyppistä keskiarvoa tulisi soveltaa kussakin yksittäistapauksessa, ratkaistaan ​​tarkasteltavan populaation erityisellä analyysillä.

Yleisin tilastojen keskiarvo on aritmeettinen keskiarvo. Se lasketaan niissä tapauksissa, joissa keskimääräisen attribuutin tilavuus muodostuu sen arvojen summana tutkitun tilastollisen perusjoukon yksittäisille yksiköille.

Alkutietojen luonteesta riippuen aritmeettinen keskiarvo määritetään useilla tavoilla:

Jos tietoja ei ole ryhmitelty, laskenta suoritetaan yksinkertaisen keskiarvon kaavan mukaan

Diskreetin sarjan aritmeettisen keskiarvon laskenta tapahtuu kaavan 3.4 mukaisesti.

Aritmeettisen keskiarvon laskenta intervallisarjassa. Intervallivaihtelusarjassa, jossa intervallin keskikohta otetaan ehdollisesti kunkin ryhmän ominaisuuden arvoksi, aritmeettinen keskiarvo voi poiketa ryhmittämättömistä tiedoista lasketusta keskiarvosta. Lisäksi mitä suurempi väli ryhmissä, sitä suuremmat ovat ryhmitellyistä tiedoista lasketun keskiarvon mahdolliset poikkeamat ryhmittämättömästä tiedosta lasketusta keskiarvosta.

Intervallivaihtelusarjan keskiarvoa laskettaessa siirrytään intervalleista niiden keskipisteisiin tarvittavien laskelmien suorittamiseksi. Laske sitten keskiarvo aritmeettisen painotetun keskiarvon kaavalla.

Aritmeettisen keskiarvon ominaisuudet. Aritmeettisella keskiarvolla on joitain ominaisuuksia, joiden avulla voimme yksinkertaistaa laskelmia, tarkastellaanpa niitä.

1. Vakiolukujen aritmeettinen keskiarvo on yhtä suuri kuin tämä vakioluku.

Jos x = a. Sitten .

2. Jos kaikkien optioiden painoja muutetaan suhteellisesti, ts. kasvaa tai laskea saman verran, niin uuden sarjan aritmeettinen keskiarvo ei muutu tästä.

Jos kaikki painot f pienennetään k kertaa, niin .

3. Yksittäisten optioiden positiivisten ja negatiivisten poikkeamien summa keskiarvosta kerrottuna painoilla on yhtä suuri kuin nolla, ts.

Jos sitten . Täältä.

Jos kaikkia vaihtoehtoja pienennetään tai lisätään jollakin numerolla, uuden sarjan aritmeettinen keskiarvo pienenee tai kasvaa saman verran.

Vähennä kaikkia vaihtoehtoja x päällä a, eli x´ = xa.

Sitten

Alkusarjan aritmeettinen keskiarvo saadaan lisäämällä vähennettyyn keskiarvoon muunnelmista aiemmin vähennetty luku a, eli .

5. Jos kaikkia vaihtoehtoja vähennetään tai lisätään k kertaa, niin uuden sarjan aritmeettinen keskiarvo pienenee tai kasvaa saman verran, ts. sisään k yhden kerran.

Anna sitten .

Siksi ts. alkuperäisen sarjan keskiarvon saamiseksi uuden sarjan aritmeettista keskiarvoa (pienennetyillä vaihtoehdoilla) on lisättävä k yhden kerran.

Keskimääräinen harmoninen. Harmoninen keskiarvo on aritmeettisen keskiarvon käänteisluku. Sitä käytetään, kun tilastotiedot eivät sisällä yksittäisten populaatiovaihtoehtojen frekvenssiä, vaan ne esitetään niiden tulona (M = xf). Harmoninen keskiarvo lasketaan kaavalla 3.5

Harmonisen keskiarvon käytännön sovellus on laskea joitakin indeksejä, erityisesti hintaindeksiä.

Geometrinen keskiarvo. Geometristä keskiarvoa käytettäessä attribuutin yksittäiset arvot ovat pääsääntöisesti dynamiikan suhteellisia arvoja, jotka on rakennettu ketjuarvojen muodossa suhteessa dynamiikkasarjan kunkin tason edelliseen tasoon. . Keskiarvo siis luonnehtii keskimääräistä kasvunopeutta.

Geometristä keskiarvoa käytetään myös määrittämään yhtä kaukana oleva arvo attribuutin maksimi- ja minimiarvoista. Esimerkiksi vakuutusyhtiö tekee sopimuksia autovakuutuspalvelujen tarjoamisesta. Vakuutusmaksu voi vaihdella 10 000 - 100 000 dollarin välillä vakuutustapahtumasta riippuen. Keskimääräinen vakuutusmaksu on US$.

Geometrinen keskiarvo on suhteiden keskiarvona tai jakaumasarjassa käytetty arvo, joka esitetään geometrisena progressiona, kun z = 0. Tätä keskiarvoa on kätevä käyttää, kun ei kiinnitetä huomiota absoluuttisiin eroihin vaan suhteisiin. kaksi numeroa.

Laskentakaavat ovat seuraavat

missä ovat keskiarvotetun ominaisuuden muunnelmat; - optioiden tuote; f– vaihtoehtojen tiheys.

Geometristä keskiarvoa käytetään keskimääräisten vuosikasvun laskennassa.

Keskimääräinen neliö. Neliön keskiarvokaavaa käytetään mittaamaan piirteen yksittäisten arvojen vaihteluastetta jakaumasarjan aritmeettisen keskiarvon ympärillä. Joten variaatioindikaattoreita laskettaessa keskiarvo lasketaan ominaisuuden yksittäisten arvojen aritmeettisesta keskiarvosta poikkeamien neliöistä.

Neliön keskiarvo lasketaan kaavalla

Taloustutkimuksessa neliön keskiarvon muunneltua muotoa käytetään laajasti ominaisuuden vaihtelun indikaattoreiden, kuten varianssin, keskihajonnan, laskennassa.

Enemmistön sääntö. Potenssilain keskiarvojen välillä on seuraava suhde - mitä suurempi eksponentti, sitä suurempi on keskiarvon arvo, Taulukko 5.4:

Taulukko 5.4

Keskiarvojen välinen suhde

z-arvo

Keskiarvojen välinen suhde

Tätä suhdetta kutsutaan pääjärjestyksen säännöksi.

Rakenteelliset keskiarvot. Väestön rakenteen karakterisoimiseksi käytetään erityisiä indikaattoreita, joita voidaan kutsua rakenteellisiksi keskiarvoiksi. Näitä mittareita ovat tila, mediaani, kvartiilit ja desiilit.

Muoti. Mode (Mo) on ominaisuuden yleisin arvo populaatioyksiköissä. Mode on attribuutin arvo, joka vastaa teoreettisen jakautumiskäyrän maksimipistettä.

Muotia käytetään laajalti kaupallisessa käytännössä kuluttajakysynnän tutkimuksessa (kun määritetään suuren kysynnän vaatteiden ja kenkien kokoa), hintojen rekisteröinnissä. Moditeja voi olla yhteensä useita.

Tilalaskenta diskreetissä sarjassa. Diskreetissä sarjassa tila on vaihtoehto, jolla on korkein taajuus. Harkitse tilan etsimistä erillisestä sarjasta.

Muodin laskenta intervallisarjassa. Intervallivaihtelusarjassa modaalivälin keskeistä varianttia pidetään likimäärin moodina, ts. aikaväli, jolla on korkein taajuus (taajuus). Väliltä on löydettävä attribuutin arvo, joka on tila. Intervallisarjan tila määräytyy kaavan mukaan

missä on modaalivälin alaraja; on modaalivälin arvo; on modaaliväliä vastaava taajuus; on modaaliväliä edeltävä taajuus; on modaalia seuraavan intervallin taajuus.

Mediaani. Mediaani () on ominaisuuden arvo järjestetyn sarjan keskiyksikössä. Ranking-sarja on sarja, jossa ominaisarvot kirjoitetaan nousevassa tai laskevassa järjestyksessä. Tai mediaani on arvo, joka jakaa järjestetyn variaatiosarjan määrän kahteen yhtä suureen osaan: toisessa osassa on muuttujan ominaisuuden arvo, joka on pienempi kuin keskimääräinen muunnelma, ja toinen on suuri.

Mediaanin löytämiseksi sen sarjanumero määritetään ensin. Tätä varten parittomalla määrällä yksiköitä lisätään yksi kaikkien taajuuksien summaan ja kaikki jaetaan kahdella. Parillisella yksikkömäärällä mediaani löytyy yksikön attribuutin arvoksi, jonka sarjanumero määräytyy frekvenssien kokonaissumman jakamalla kahdella. Kun mediaanin järjestysluku tiedetään, sen arvo on helppo löytää kertyneistä taajuuksista.

Mediaanin laskeminen diskreetissä sarjassa. Otostutkimuksen mukaan saatiin tietoa perheiden jakautumisesta lasten lukumäärän mukaan, Taulukko. 5.5. Mediaanin määrittämiseksi määritä ensin sen järjestysluku

=

Sitten rakennetaan sarja kumulatiivisia taajuuksia (, sarjanumeron ja kumulatiivisen taajuuden perusteella löydämme mediaanin. Kumulatiivinen taajuus 33 osoittaa, että 33 perheessä lasten lukumäärä ei ylitä yhtä lasta, mutta koska mediaaniluku on 50 , mediaani on 34–55 perhettä.

Taulukko 5.5

Perheiden lukumäärän jakautuminen lasten lukumäärästä

Lasten määrä perheessä

Perheiden lukumäärä on mediaanivälin arvo;

Kaikilla tarkasteluilla tehokeskiarvon muodoilla on tärkeä ominaisuus (toisin kuin rakenteelliset) – keskiarvon määrityskaava sisältää kaikki sarjan arvot, ts. keskiarvon suuruuteen vaikuttaa kunkin vaihtoehdon arvo.

Toisaalta tämä on erittäin positiivinen ominaisuus. tässä tapauksessa otetaan huomioon kaikkien tutkittavan populaation kaikkiin yksiköihin vaikuttavien syiden vaikutus. Toisaalta yksikin vahingossa lähtötietoihin päässyt havainto voi merkittävästi vääristää käsitystä tutkittavan ominaisuuden kehitystasosta tarkasteltavassa populaatiossa (etenkin lyhyissä sarjoissa).

Kvartiilit ja desiilit. Analogisesti mediaanin löytämisen kanssa variaatiosarjoista, piirteen arvo voidaan löytää missä tahansa järjestetyssä sarjayksikössä. Joten erityisesti voidaan löytää ominaisuuden arvo yksiköille, jotka jakavat sarjan 4 yhtä suureen osaan, 10:een jne.

Quartiles. Variantteja, jotka jakavat paremmuusjärjestyksen sarjan neljään yhtä suureen osaan, kutsutaan kvartiileiksi.

Samanaikaisesti erotetaan seuraavat: alempi (tai ensimmäinen) kvartiili (Q1) - järjestetyn sarjan yksikön ominaisuuden arvo, joka jakaa populaation suhteessa ¼ - ¾ ja ylempi (tai kolmas) ) kvartiili (Q3) - järjestetyn sarjan yksikön ominaisuuden arvo, joka jakaa populaation suhteessa ¾ - ¼.

Toinen kvartiili on mediaani Q2 = Me. Intervallisarjan alempi ja ylempi kvartiili lasketaan kaavalla, joka on samanlainen kuin mediaani.

missä on alemman ja ylemmän kvartiilin sisältävän välin alaraja;

on alemman tai ylemmän kvartiilin sisältävää väliä edeltävän aikavälin kumulatiivinen taajuus;

– kvartiilivälien taajuudet (alempi ja ylempi)

Q1:n ja Q3:n sisältävät intervallit määritetään kertyneistä taajuuksista (tai taajuuksista).

Desiilit. Kvartiilien lisäksi lasketaan desiilejä - vaihtoehtoja, jotka jakavat paremmuusjärjestyksen 10 yhtä suureen osaan.

Ne on merkitty D:llä, ensimmäinen desiili D1 jakaa sarjan suhteessa 1/10 ja 9/10, toinen D2 - 2/10 ja 8/10 jne. Ne lasketaan samalla tavalla kuin mediaani ja kvartiilit.

Sekä mediaani että kvartiilit ja desiilit kuuluvat ns. järjestystilastoihin, joka ymmärretään muunnelmaksi, joka on tietyn järjestyspaikan sijoittuvassa sarjassa.

Ryhmittelymenetelmän avulla voit myös mitata vaihtelua merkkien (vaihtelu, vaihtelu). Suhteellisen pienellä väestöyksiköiden määrällä vaihtelua mitataan perusjoukon muodostavien yksiköiden paremmuusjärjestykseen. Rivi on ns paremmuusjärjestykseen jos yksiköt on järjestetty nousevaan (laskevaan) ominaisuuteen.

Sijoitussarjat ovat kuitenkin melko suuntaa antavia, kun tarvitaan vertailevaa vaihtelua. Lisäksi monissa tapauksissa on käsiteltävä suuresta määrästä yksiköitä koostuvia tilastollisia aggregaatteja, joita on käytännössä vaikea esittää tietyn sarjan muodossa. Tältä osin tilastotietojen alustavaa yleistä tutustumista varten ja erityisesti merkkien vaihtelun tutkimuksen helpottamiseksi tutkitut ilmiöt ja prosessit yhdistetään yleensä ryhmiin ja ryhmittelyn tulokset laaditaan ryhmätaulukoiksi. .

Jos ryhmätaulukossa on vain kaksi saraketta - ryhmät valitun ominaisuuden (vaihtoehdot) ja ryhmien lukumäärän (taajuudet tai taajuudet) mukaan, sitä kutsutaan jakelun lähellä.

Jakelualue - Yksinkertaisin yhden attribuutin mukainen rakenteellinen ryhmittely, joka näytetään ryhmätaulukossa, jossa on kaksi saraketta, jotka sisältävät määritteen muunnelmia ja esiintymistiheyksiä. Monissa tapauksissa tällaisella rakenteellisella ryhmittelyllä, ts. jakaumasarjojen laatimisella aloitetaan tilastollisen lähtömateriaalin tutkiminen.

Jakaumasarjan muodossa oleva rakenteellinen ryhmittely voidaan muuttaa todelliseksi rakenteelliseksi ryhmittelyksi, jos valituille ryhmille on tunnusomaista paitsi frekvenssit myös muut tilastolliset indikaattorit. Jakelusarjan päätarkoituksena on tutkia ominaisuuksien vaihtelua. Jakaumasarjojen teoriaa kehitetään yksityiskohtaisesti matemaattisten tilastojen avulla.

Jakelusarjat on jaettu attribuutio(ryhmittely attribuuttien mukaan, esimerkiksi väestön jakautuminen sukupuolen, kansallisuuden, siviilisäädyn jne. mukaan) ja vaihtelevaa(ryhmittely määrällisten ominaisuuksien mukaan).

Variaatiosarja on ryhmätaulukko, joka sisältää kaksi saraketta: yksiköiden ryhmittelyn yhden kvantitatiivisen attribuutin ja kunkin ryhmän yksiköiden lukumäärän mukaan. Vaihtelusarjan intervallit muodostetaan yleensä tasa-arvoisiksi ja suljetuiksi. Variaatiosarja on seuraava Venäjän väestön ryhmittely asukasta kohden lasketun keskimääräisen kassatulon mukaan (taulukko 3.10).

Taulukko 3.10

Venäjän väestön jakautuminen asukasta kohti lasketun keskitulon mukaan vuosina 2004-2009

Väestöryhmät keskimääräisten käteistulojen mukaan asukasta kohden, ruplaa/kk

Väestö ryhmässä, % kokonaismäärästä

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Yli 25 000,0

Koko väestö

Variaatiosarjat puolestaan ​​jaetaan diskreeteihin ja intervalliin. Diskreetti variaatiosarja yhdistää erillisten ominaisuuksien muunnelmia, jotka vaihtelevat kapeissa rajoissa. Esimerkki diskreetistä variaatiosarjasta on venäläisten perheiden jakautuminen lasten lukumäärän mukaan.

Intervalli variaatiosarjat yhdistävät muunnelmia joko jatkuvista ominaisuuksista tai erillisistä ominaisuuksista, jotka vaihtelevat laajalla alueella. Välisarja on Venäjän väestön jakautumisen vaihtelusarja asukasta kohden lasketun keskimääräisen kassatulon mukaan.

Diskreettejä variaatiosarjoja ei käytännössä käytetä kovin usein. Sitä vastoin niiden kokoaminen ei ole vaikeaa, koska ryhmien koostumuksen määräävät ne tietyt variantit, joita tutkituilla ryhmittelyominaisuuksilla todella on.

Intervallivaihtelusarjat ovat yleisempiä. Niitä koottaessa herää vaikea kysymys ryhmien lukumäärästä sekä määritettävien välien koosta.

Periaatteet tämän ongelman ratkaisemiseksi on esitetty tilastollisten ryhmittelyjen muodostamista koskevassa luvussa (ks. kohta 3.3).

Variaatiosarjat ovat keino tiivistää tai tiivistää erilaista tietoa kompaktiin muotoon, joiden avulla voidaan tehdä varsin selkeä arvio variaation luonteesta, tutkia tutkittavaan joukkoon kuuluvien ilmiöiden merkkien eroja. Mutta variaatiosarjojen tärkein merkitys on, että niiden perusteella lasketaan vaihtelun erityiset yleistävät ominaisuudet (ks. luku 7).

Muunnelmasarjat: määritelmä, tyypit, pääominaisuudet. Laskentamenetelmä
muoti, mediaani, aritmeettinen keskiarvo lääketieteellisissä ja tilastollisissa tutkimuksissa
(Näytä ehdollinen esimerkki).

Variaatiosarja on sarja tutkittavan ominaisuuden numeerisia arvoja, jotka eroavat toisistaan ​​suuruusluokiltaan ja on järjestetty tiettyyn järjestykseen (nousevaan tai laskevaan järjestykseen). Jokaista sarjan numeerista arvoa kutsutaan variantiksi (V), ja numeroita, jotka osoittavat, kuinka usein tämä tai toinen variantti esiintyy tämän sarjan koostumuksessa, kutsutaan taajuudella (p).

Havaintotapausten kokonaismäärä, joista variaatiosarja koostuu, on merkitty kirjaimella n. Eroa tutkittujen ominaisuuksien merkityksessä kutsutaan variaatioksi. Jos muuttujan merkillä ei ole kvantitatiivista mittaa, vaihtelua kutsutaan kvalitatiiviseksi ja jakaumasarjaksi attribuutioksi (esimerkiksi jakauma sairauden lopputuloksen, terveydentilan jne. mukaan).

Jos muuttujan etumerkillä on kvantitatiivinen lauseke, tällaista vaihtelua kutsutaan kvantitatiiviseksi ja jakaumasarjaksi vaihteluksi.

Variaatiosarjat jaetaan epäjatkuviin ja jatkuviin - kvantitatiivisen ominaisuuden luonteen mukaan, yksinkertaisiin ja painotettuihin - variantin esiintymistiheyden mukaan.

Yksinkertaisessa variaatiosarjassa kukin variantti esiintyy vain kerran (p=1), painotetussa sama variantti esiintyy useita kertoja (p>1). Esimerkkejä tällaisista sarjoista käsitellään myöhemmin tekstissä. Jos kvantitatiivinen attribuutti on jatkuva, ts. kokonaislukuarvojen välillä on murto-osien väliarvoja, vaihtelusarjaa kutsutaan jatkuvaksi.

Esimerkiksi: 10.0 - 11.9

14.0-15.9 jne.

Jos kvantitatiivinen merkki on epäjatkuva, ts. sen yksittäiset arvot (optiot) eroavat toisistaan ​​kokonaisluvulla, eikä niillä ole murto-osien väliarvoja, vaihtelusarjaa kutsutaan epäjatkuvaksi tai diskreetiksi.

Käyttämällä edellisen esimerkin tietoja sykkeestä

21 opiskelijalle rakennamme variaatiosarjan (taulukko 1).

pöytä 1

Lääketieteen opiskelijoiden jakauma pulssin mukaan (bpm)

Siten variaatiosarjan rakentaminen tarkoittaa olemassa olevien numeeristen arvojen (optioiden) systematisointia, virtaviivaistamista, ts. järjestää tiettyyn järjestykseen (nousevaan tai laskevaan järjestykseen) vastaavien taajuuksien kanssa. Tarkasteltavassa esimerkissä vaihtoehdot on järjestetty nousevaan järjestykseen ja ilmaistaan ​​epäjatkuvina (diskreetteinä) kokonaislukuina, jokainen vaihtoehto esiintyy useita kertoja, ts. kyseessä on painotettu, epäjatkuva tai diskreetti vaihtelusarja.

Pääsääntöisesti, jos havaintojen määrä tutkimassamme tilastoväestössä ei ylitä 30:tä, niin riittää, että kaikki tutkittavan ominaisuuden arvot järjestetään vaihtelusarjaan kasvavassa järjestyksessä, kuten taulukossa. 1 tai alenevassa järjestyksessä.

Suurella havaintojen määrällä (n>30) esiintyvien varianttien määrä voi olla erittäin suuri, tässä tapauksessa kootaan intervalli tai ryhmitelty variaatiosarja, jossa myöhemmän käsittelyn yksinkertaistamiseksi ja jakauman luonteen selkeyttämiseksi variantit yhdistetään ryhmiin.

Yleensä ryhmävaihtoehtoja on 8-15.

Niitä on oltava vähintään 5, koska. muuten se on liian karkea, liiallinen suurennos, joka vääristää vaihtelun kokonaiskuvaa ja vaikuttaa suuresti keskiarvojen tarkkuuteen. Kun ryhmävaihtoehtojen määrä on yli 20-25, keskiarvojen laskentatarkkuus kasvaa, mutta ominaisuusvaihtelun ominaisuudet vääristyvät merkittävästi ja matemaattinen käsittely monimutkaistuu.

Ryhmitettyä sarjaa laadittaessa on otettava huomioon

− varianttiryhmät on sijoitettava tiettyyn järjestykseen (nouseva tai laskeva);

- variaatioryhmien välien tulee olla samat;

− intervallien rajojen arvot eivät saa olla samat, koska ei ole selvää, mihin ryhmiin yksittäiset vaihtoehdot osoitetaan;

- on tarpeen ottaa huomioon kerätyn materiaalin laadulliset ominaisuudet asettaessa intervalleja (esimerkiksi aikuisten painoa tutkittaessa 3-4 kg:n väli on hyväksyttävä ja lapsille ensimmäisten kuukausien aikana käyttöikä ei saa ylittää 100 g.)

Rakennetaan ryhmitelty (intervalli) sarja, joka luonnehtii 55 lääketieteen opiskelijan pulssitaajuutta (lyöntejä minuutissa) ennen tenttiä: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Ryhmitellyn sarjan rakentamiseen tarvitset:

1. Määritä intervallin arvo;

2. Määritä variaatiosarjan muunnelman ryhmien keskikohta, alku ja loppu.

● Välin (i) arvo määräytyy odotettavissa olevien ryhmien lukumäärällä (r), joiden lukumäärä asetetaan havaintojen lukumäärän (n) mukaan erityisen taulukon mukaan.

Ryhmien lukumäärä havaintojen määrästä riippuen:

Meidän tapauksessamme 55 opiskelijalle on mahdollista muodostaa 8-10 ryhmää.

Välin (i) arvo määritetään seuraavalla kaavalla -

i = Vmax-Vmin/r

Esimerkissämme välin arvo on 82-58/8= 3.

Jos välin arvo on murtoluku, tulos tulee pyöristää ylöspäin kokonaislukuun.

Keskiarvoja on useita tyyppejä:

● aritmeettinen keskiarvo,

● geometrinen keskiarvo,

● harmoninen keskiarvo,

● neliön keskiarvo,

● keskitason progressiivinen,

● mediaani

Lääketieteessä käytetään useimmiten aritmeettisia keskiarvoja.

Aritmeettinen keskiarvo (M) on yleistävä arvo, joka määrittää koko populaatiolle ominaisen tyypillisen arvon. Tärkeimmät menetelmät M:n laskentaan ovat: aritmeettinen keskiarvomenetelmä ja momenttien (ehdollisten poikkeamien) menetelmä.

Aritmeettisen keskiarvon menetelmää käytetään yksinkertaisen aritmeettisen keskiarvon ja painotetun aritmeettisen keskiarvon laskemiseen. Aritmeettisen keskiarvon laskentamenetelmän valinta riippuu variaatiosarjan tyypistä. Jos kyseessä on yksinkertainen variaatiosarja, jossa kukin variantti esiintyy vain kerran, yksinkertainen aritmeettinen keskiarvo määritetään kaavalla:

jossa: М – aritmeettinen keskiarvo;

V on muuttujan ominaisuuden arvo (optiot);

Σ - osoittaa toiminnan - summauksen;

n on havaintojen kokonaismäärä.

Esimerkki aritmeettisen keskiarvon laskemisesta on yksinkertainen. Hengitystiheys (hengitysten määrä minuutissa) 9 35-vuotiaalla miehellä: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Keskimääräisen hengitystaajuuden määrittämiseksi 35-vuotiailla miehillä on tarpeen:

1. Rakenna variaatiosarja asettamalla kaikki vaihtoehdot nousevaan tai laskevaan järjestykseen. Saimme yksinkertaisen muunnelmasarjan, koska varianttiarvot esiintyvät vain kerran.

M = ∑V/n = 171/9 = 19 hengitystä minuutissa

Johtopäätös. 35-vuotiaiden miesten hengitystiheys on keskimäärin 19 hengitystä minuutissa.

Jos variantin yksittäiset arvot toistuvat, kutakin varianttia ei tarvitse kirjoittaa riville, riittää, kun luetellaan esiintyvän muunnelman mitat (V) ja vieressä ilmoitetaan niiden toistojen lukumäärä ( p). Sellaista vaihtelusarjaa, jossa variantit on ikään kuin painotettu niitä vastaavien taajuuksien lukumäärän mukaan, kutsutaan painotetuksi vaihtelusarjaksi ja laskettu keskiarvo on aritmeettinen painotettu keskiarvo.

Aritmeettinen painotettu keskiarvo määritetään kaavalla: M= ∑Vp/n

missä n on havaintojen lukumäärä, joka on yhtä suuri kuin taajuuksien summa - Σr.

Esimerkki aritmeettisen painotetun keskiarvon laskemisesta.

Työkyvyttömyyden kesto (päivinä) paikallislääkärin hoitamilla 35 akuuttia hengitystiesairauksia (ARI) sairastavalla potilaalla kuluvan vuoden ensimmäisen neljänneksen aikana oli: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 päivää.

Menetelmä vamman keskimääräisen keston määrittämiseksi potilailla, joilla on akuutti hengitystieinfektio, on seuraava:

1. Rakennetaan painotettu variaatiosarja, koska yksittäiset varianttiarvot toistetaan useita kertoja. Voit tehdä tämän järjestämällä kaikki vaihtoehdot nousevaan tai laskevaan järjestykseen niitä vastaavien taajuuksien kanssa.

Meidän tapauksessamme vaihtoehdot ovat nousevassa järjestyksessä.

2. Laske aritmeettinen painotettu keskiarvo kaavalla: M = ∑Vp/n = 233/35 = 6,7 päivää

Akuutteja hengitystieinfektioita sairastavien potilaiden jakautuminen vamman keston mukaan:

Työkyvyttömyyden kesto (V) Potilaiden määrä (p) vp
∑p = n = 35 ∑Vp = 233

Johtopäätös. Akuutteja hengitystiesairauksia sairastavien potilaiden työkyvyttömyyden kesto oli keskimäärin 6,7 päivää.

Mode (Mo) on yleisin muunnelma variaatiosarjassa. Taulukossa esitetyssä jakaumassa tila vastaa varianttia, joka on yhtä suuri kuin 10, se esiintyy useammin kuin muut - 6 kertaa.

Potilaiden jakautuminen sairaalavuoteessa oleskelun keston mukaan (päivissä)

V
s

Joskus on vaikea määrittää tilan tarkkaa arvoa, koska tutkittavassa tiedossa voi olla useita havaintoja, joita esiintyy "useimmiten".

Mediaani (Me) on ei-parametrinen indikaattori, joka jakaa variaatiosarjan kahteen yhtä suureen puolikkaaseen: sama määrä vaihtoehtoja on mediaanin molemmilla puolilla.

Esimerkiksi taulukossa esitetyn jakauman mediaani on 10, koska tämän arvon molemmilla puolilla sijaitsee 14. vaihtoehdossa, ts. numero 10 on tässä sarjassa keskeisellä paikalla ja on sen mediaani.

Ottaen huomioon, että havaintojen määrä tässä esimerkissä on parillinen (n=34), mediaani voidaan määrittää seuraavasti:

minä = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Tämä tarkoittaa, että sarjan keskikohta osuu seitsemännelletoista vaihtoehdolle, joka vastaa mediaania 10. Taulukossa esitetyn jakauman aritmeettinen keskiarvo on:

M = Vp/n = 334/34 = 10,1

Joten 34 havainnosta taulukosta. 8, saimme: Mo=10, Me=10, aritmeettinen keskiarvo (M) on 10,1. Esimerkissämme kaikki kolme indikaattoria osoittautuivat yhtäläisiksi tai lähellä toisiaan, vaikka ne ovat täysin erilaisia.

Aritmeettinen keskiarvo on kaikkien vaikutusten summa, jonka muodostumiseen osallistuvat poikkeuksetta kaikki vaihtoehdot, myös äärimmäiset, usein tietylle ilmiölle tai joukolle epätyypilliset.

Tila ja mediaani, toisin kuin aritmeettinen keskiarvo, eivät ole riippuvaisia ​​muuttujan attribuutin kaikkien yksittäisten arvojen arvosta (äärimuunnelmien arvot ja sarjan sirontaaste). Aritmeettinen keskiarvo luonnehtii koko havaintojen massaa, moodi ja mediaani bulkkia

Tilastollinen jakaumasarja- tämä on populaation yksiköiden järjestetty jakautuminen ryhmiin tietyn vaihtelevan ominaisuuden mukaan.
Jakaumasarjan muodostumisen taustalla olevasta ominaisuudesta riippuen niitä on attribuuttien ja muunnelmien jakelusarjat.

Yhteisen piirteen olemassaolo on perusta tilastollisen perusjoukon muodostumiselle, joka on tulos tutkimuskohteiden yhteisten piirteiden kuvauksesta tai mittauksesta.

Tilastojen tutkimuksen kohteena ovat muuttuvat (muuttuvat) piirteet tai tilastolliset ominaisuudet.

Tilastollisten piirteiden tyypit.

Jakelusarjoja kutsutaan ominaisuussarjoiksi. rakennettu laatuperusteilla. Attributiivinen- tämä on kyltti, jolla on nimi (esimerkiksi ammatti: ompelija, opettaja jne.).
Jakelusarjat on tapana järjestää taulukoiden muodossa. Taulukossa. 2.8 näyttää jakauman attribuuttisarjan.
Taulukko 2.8 - Lakimiesten antaman oikeusavun jakautuminen jonkin Venäjän federaation alueen kansalaisille.

Variaatiosarja ovat ominaisuusarvoja (tai arvoalueita) ja niiden taajuuksia.
Variaatiosarjat ovat jakelusarjoja määrälliseltä pohjalta. Mikä tahansa variaatiosarja koostuu kahdesta elementistä: varianteista ja taajuuksista.
Variantit ovat ominaisuuden yksittäisiä arvoja, jotka se ottaa muunnelmasarjassa.
Taajuudet ovat yksittäisten varianttien tai variaatiosarjan kunkin ryhmän lukumäärää, ts. nämä ovat numeroita, jotka osoittavat, kuinka usein tietyt vaihtoehdot esiintyvät jakelusarjassa. Kaikkien taajuuksien summa määrittää koko populaation koon, sen tilavuuden.
Taajuuksia kutsutaan taajuuksiksi, jotka ilmaistaan ​​yksikön murto-osina tai prosentteina kokonaismäärästä. Vastaavasti taajuuksien summa on 1 tai 100 %. Variaatiosarjan avulla voimme arvioida jakautumislain muotoa todellisten tietojen perusteella.

Ominaisuuden vaihtelun luonteesta riippuen niitä on diskreetit ja intervallivaihtelusarjat.
Esimerkki diskreetistä variaatiosarjasta on taulukossa. 2.9.
Taulukko 2.9 - Perheiden jakautuminen yksittäisissä huoneistoissa asuttujen huoneiden lukumäärän mukaan vuonna 1989 Venäjän federaatiossa.

Taulukon ensimmäisessä sarakkeessa on esitetty diskreetin variaatiosarjan variantit, toisessa sarakkeessa variaatiosarjan taajuudet ja kolmannessa sarakkeessa taajuusilmaisimet.

Variaatiosarja

Yleisessä väestössä tutkitaan tiettyä määrällistä ominaisuutta. Siitä otetaan satunnaisesti tilavuusnäyte n, eli näytteen elementtien lukumäärä on n. Tilastollisen käsittelyn ensimmäisessä vaiheessa vaihtelevat näytteitä, ts. numeroiden tilaaminen x 1 , x 2 , …, x n Nouseva. Jokainen havaittu arvo x i nimeltään vaihtoehto. Taajuus m i on arvon havaintojen lukumäärä x i näytteessä. Suhteellinen esiintymistiheys (taajuus) w i on taajuussuhde m i näytteen kokoon n: .
Variaatiosarjoja tutkittaessa käytetään myös kumulatiivisen taajuuden ja kumulatiivisen taajuuden käsitteitä. Päästää x joku numero. Sitten vaihtoehtojen määrä , joiden arvot ovat pienemmät x, kutsutaan kumuloituneeksi taajuudeksi: for x i n kutsutaan kumulatiiviseksi taajuudeksi w i max .
Attribuuttia kutsutaan diskreetiksi muuttujaksi, jos sen yksittäiset arvot (muunnelmat) eroavat toisistaan ​​jonkin verran (yleensä kokonaisluku). Tällaisen ominaisuuden variaatiosarjaa kutsutaan diskreetiksi variaatiosarjaksi.

Taulukko 1. Yleisnäkymä taajuuksien diskreetistä vaihtelusarjasta

Ominaisuuden arvotx i x 1 x2 x n
Taajuudetm i m 1 m2 m n

Attribuuttia kutsutaan jatkuvasti muuttuvaksi, jos sen arvot eroavat toisistaan ​​mielivaltaisen vähän, ts. merkki voi ottaa minkä tahansa arvon tietyllä aikavälillä. Jatkuvaa vaihtelusarjaa sellaiselle piirteelle kutsutaan intervallisarjaksi.

Taulukko 2. Yleisnäkymä taajuuksien intervallivaihtelusarjasta

Taulukko 3. Variaatiosarjan graafiset kuvat

RiviMonikulmio tai histogrammiEmpiirinen jakaumafunktio
Diskreetti
intervalli
Tarkasteltaessa havaintojen tuloksia, määritetään kuinka monta vaihtoehtojen arvoa osui kuhunkin tiettyyn väliin. Oletetaan, että jokainen intervalli kuuluu johonkin päistään: joko kaikissa tapauksissa vasen (useammin) tai kaikissa tapauksissa oikea, ja taajuudet tai taajuudet osoittavat ilmoitettujen rajojen sisältämien vaihtoehtojen lukumäärän. Erot a i – a i +1 kutsutaan osittaisiksi intervalleiksi. Myöhempien laskelmien yksinkertaistamiseksi intervallivaihtelusarja voidaan korvata ehdollisesti diskreetillä. Tässä tapauksessa keskiarvo i-th intervalli otetaan vaihtoehtona x i, ja vastaava intervallitaajuus m i- tämän aikavälin taajuudelle.
Variaatiosarjojen graafiseen esittämiseen käytetään useimmiten monikulmiota, histogrammia, kumulatiivista käyrää ja empiiristä jakaumafunktiota.

Taulukossa. 2.3 (Venäjän väestön ryhmittely keskimääräisen asukastulon koon mukaan huhtikuussa 1994) esitetään intervallivaihtelusarja.
Jakauman sarjoja on kätevä analysoida graafisen esityksen avulla, jonka avulla voidaan myös arvioida jakauman muotoa. Visuaalisen esityksen variaatiosarjojen taajuuksien muutoksen luonteesta antaa monikulmio ja histogrammi.
Monikulmiota käytetään, kun näytetään diskreettejä variaatiosarjoja.
Kuvataanpa esimerkiksi graafisesti asuntokannan jakautuminen asuntotyypeittäin (taulukko 2.10).
Taulukko 2.10 - Kaupunkialueen asuntokannan jakautuminen asuntotyypeittäin (ehdolliset luvut).


Riisi. Asuntojen jakelupolygoni


Y-akselille voidaan piirtää paitsi taajuuksien, myös variaatiosarjojen taajuudet.
Histogrammi otetaan intervallivaihtelusarjan näyttämiseksi. Histogrammia rakennettaessa intervallien arvot piirretään abskissa-akselille ja taajuudet on kuvattu vastaaville intervalleille rakennetuilla suorakulmioilla. Pylväiden korkeuden tulee tasaväleissä olla verrannollinen taajuuksiin. Histogrammi on kaavio, jossa sarja esitetään vierekkäisinä pylväinä.
Kuvataan graafisesti taulukossa esitetty intervallijakaumasarja. 2.11.
Taulukko 2.11 - Perheiden jakautuminen asuintilan koon mukaan henkilöä kohden (ehdolliset luvut).
N p / p Perheryhmät asuintilan koon mukaan henkilöä kohti Niiden perheiden lukumäärä, joilla on tietyn kokoinen asuintila Kertynyt perheiden määrä
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
KAIKKI YHTEENSÄ 115 ----


Riisi. 2.2. Histogrammi perheiden jakautumisesta asuintilan koon mukaan henkilöä kohti


Muodostamme akkumuloitujen sarjojen (taulukko 2.11) tietoja käyttäen jakelu kumulatiivinen.


Riisi. 2.3. Perheiden kumulatiivinen jakautuminen asuintilan koon mukaan henkilöä kohti


Variaatiosarjan esitys kumulaattina on erityisen tehokas variaatiosarjoille, joiden taajuudet ilmaistaan ​​murto-osina tai prosentteina sarjan taajuuksien summasta.
Jos muutamme akseleita variaatiosarjan graafisessa esityksessä kumulaatin muodossa, saamme ogivu. Kuvassa 2.4 esittää taulukon tietojen perusteella rakennettua ovea. 2.11.
Histogrammi voidaan muuntaa jakautumispolygoniksi etsimällä suorakulmioiden sivujen keskipisteet ja yhdistämällä nämä pisteet suorilla viivoilla. Tuloksena oleva jakautumispolygoni on esitetty kuvassa. 2.2 katkoviiva.
Kun rakennetaan histogrammi vaihtelusarjan jakautumisesta, jossa on epätasainen väli, ordinaatta-akselia pitkin, ei piirretä taajuuksia, vaan piirteen jakautumistiheys vastaavissa intervalleissa.
Jakaumatiheys on taajuus, joka on laskettu yksikkövälileveydelle, ts. kuinka monta yksikköä kussakin ryhmässä on yksikköväliarvoa kohden. Esimerkki jakautumistiheyden laskemisesta on esitetty taulukossa. 2.12.
Taulukko 2.12 - Yritysten jakautuminen työntekijöiden lukumäärän mukaan (luvut ovat ehdollisia)
N p / p Yritysryhmät työntekijöiden lukumäärän mukaan, hs. Yritysten lukumäärä Välikoko, hlö. Jakauman tiheys
MUTTA 1 2 3=1/2
1 20 asti 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
KAIKKI YHTEENSÄ 147 ---- ----

Variaatiosarjoja voidaan käyttää myös graafiseen esitykseen kumulatiivinen käyrä. Kumulaatin (summien käyrä) avulla näytetään sarja kumuloituneita taajuuksia. Kumulatiiviset taajuudet määritetään summaamalla taajuudet peräkkäin ryhmittäin ja osoittavat kuinka monella populaation yksiköllä on piirrearvot, jotka eivät ole suurempia kuin tarkasteluarvo.


Riisi. 2.4. Ogiva perhejakauma asuintilan koon mukaan henkilöä kohden

Kun muodostetaan intervallivaihtelusarjan kumulaattia, sarjan muunnelmat piirretään pitkin abskissa-akselia ja kumuloituneet taajuudet ordinaatta-akselille.

Jatkuva variaatiosarja

Jatkuva vaihtelusarja on sarja, joka on rakennettu kvantitatiivisen tilastomerkin perusteella. Esimerkki. Tuomittujen sairauksien keskimääräinen kesto (päiviä per henkilö) kuluvan vuoden syksy-talvikaudella oli:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5

vaihtelevaa niin kutsuttuja kvantitatiivisesti rakennettuja jakelusarjoja. Määrällisten ominaisuuksien arvot populaation yksittäisissä yksiköissä eivät ole vakioita, ne eroavat enemmän tai vähemmän toisistaan.

Variaatio- attribuutin arvon vaihtelu, vaihtelu perusjoukon yksiköissä. Tutkittavassa populaatiossa esiintyvän ominaisuuden erillisiä numeerisia arvoja kutsutaan vaihtoehtoja arvot. Keskiarvon riittämättömyys populaation täydelliseen karakterisointiin edellyttää, että keskiarvoja on täydennettävä indikaattoreilla, joiden avulla voidaan arvioida näiden keskiarvojen tyypillisyyttä mittaamalla tutkittavan ominaisuuden vaihtelua (vaihtelua).

Vaihtelun esiintyminen johtuu useiden tekijöiden vaikutuksesta piirretason muodostumiseen. Nämä tekijät vaikuttavat epätasaisella voimalla ja eri suuntiin. Variaatioindikaattoreita käytetään kuvaamaan piirteen vaihtelevuuden mittaa.

Tilastollisen variaatiotutkimuksen tehtävät:

  • 1) tutkimus merkkien luonteesta ja vaihteluasteesta väestön yksittäisissä yksiköissä;
  • 2) yksittäisten tekijöiden tai niiden ryhmien roolin määrittäminen väestön tiettyjen piirteiden vaihtelussa.

Tilastoissa käytetään erityisiä menetelmiä vaihtelun tutkimiseen, jotka perustuvat indikaattorijärjestelmän käyttöön, Kanssa jolla vaihtelua mitataan.

Variaatioiden tutkiminen on välttämätöntä. Variaatioiden mittaaminen on tarpeen otoshavainnointia, korrelaatio- ja varianssianalyysiä jne. Ermolaev O.Yu. Matemaattiset tilastot psykologeille: Oppikirja [Teksti] / O.Yu. Ermolaev. - M.: Moskovan psykologisen ja sosiaalisen instituutin Flint Publishing House, 2012. - 335s.

Vaihtelun asteen mukaan voidaan arvioida populaation homogeenisuutta, piirteiden yksittäisten arvojen vakautta ja keskiarvon tyypillisyyttä. Niiden pohjalta kehitetään merkkien välisen suhteen läheisyyden indikaattoreita, indikaattoreita valikoivan havainnon tarkkuuden arvioimiseksi.

Avaruudessa ja ajassa on vaihtelua.

Avaruuden vaihtelulla tarkoitetaan ominaisuuden arvojen vaihtelua eri alueita edustavissa väestöyksiköissä. Ajan vaihtelulla tarkoitetaan attribuutin arvojen muutosta eri ajanjaksoina.

Jakaumasarjan vaihtelun tutkimiseksi kaikki attribuuttiarvojen variantit on järjestetty nousevaan tai laskevaan järjestykseen. Tätä prosessia kutsutaan sarjasijoitukseksi.

Yksinkertaisimmat merkit vaihtelusta ovat minimi ja maksimi- attribuutin pienin ja suurin arvo aggregaatissa. Ominaisuusarvojen yksittäisten muunnelmien toistojen määrää kutsutaan toistotiheydeksi (fi). On kätevää korvata taajuudet taajuuksilla - wi. Frequency - suhteellinen taajuuden indikaattori, joka voidaan ilmaista yksikön murto-osina tai prosentteina ja jonka avulla voit verrata vaihtelusarjoja eri havaintojen lukumäärään. Ilmaistaan ​​kaavalla:

missä Xmax, Xmin - attribuutin enimmäis- ja vähimmäisarvot koosteessa; n on ryhmien lukumäärä.

Ominaisuuden vaihtelun mittaamiseen käytetään erilaisia ​​absoluuttisia ja suhteellisia indikaattoreita. Variaatioiden absoluuttisia indikaattoreita ovat vaihteluväli, keskimääräinen lineaarinen poikkeama, varianssi, keskihajonta. Suhteellisia vaihteluindikaattoreita ovat värähtelykerroin, suhteellinen lineaarinen poikkeama, variaatiokerroin.

Esimerkki variaatiosarjan löytämisestä

Harjoittele. Tälle näytteelle:

  • a) Etsi variaatiosarja;
  • b) Muodosta jakaumafunktio;

Nro = 42. Esimerkkituotteet:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Ratkaisu.

  • a) järjestetyn variaatiosarjan muodostaminen:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) diskreetin variaatiosarjan rakentaminen.

Lasketaan ryhmien lukumäärä variaatiosarjassa Sturgessin kaavalla:

Otetaan ryhmien lukumäärä 7.

Kun tiedämme ryhmien lukumäärän, laskemme välin arvon:

Taulukon rakentamisen helpottamiseksi otamme ryhmien lukumäärän 8, väli on 1.

Riisi. yksi Liikkeen myymien tavaroiden määrä tietyn ajanjakson aikana