Variaatiosarjan numeerista arvoa kutsutaan. Variaatiosarja

vaihtelevaa kutsutaan jakelusarjoiksi, jotka on rakennettu kvantitatiivisesti. Määrällisten ominaisuuksien arvot yksittäisissä populaation yksiköissä eivät ole vakioita, ne eroavat enemmän tai vähemmän toisistaan.

Variaatio- vaihtelu, attribuutin arvon vaihtelu perusjoukon yksiköissä. Tutkittavassa populaatiossa esiintyvän ominaisuuden erillisiä numeerisia arvoja kutsutaan vaihtoehtoja arvot. Keskiarvon riittämättömyys populaation täydelliseen karakterisointiin edellyttää, että keskiarvoja on täydennettävä indikaattoreilla, joiden avulla on mahdollista arvioida näiden keskiarvojen tyypillisyyttä mittaamalla tutkittavan ominaisuuden vaihtelua (vaihtelua).

Vaihtelun esiintyminen johtuu useiden tekijöiden vaikutuksesta piirretason muodostumiseen. Nämä tekijät vaikuttavat epätasaisella voimalla ja eri suuntiin. Variaatioindikaattoreita käytetään kuvaamaan piirteen vaihtelun mittaa.

Tilastollisen variaatiotutkimuksen tehtävät:

  • 1) opasteiden luonteen ja vaihtelun asteen tutkimus populaation yksittäisissä yksiköissä;
  • 2) yksittäisten tekijöiden tai niiden ryhmien roolin määrittäminen väestön tiettyjen piirteiden vaihtelussa.

Tilastoissa vaihtelun tutkimiseen käytetään erityisiä menetelmiä, jotka perustuvat indikaattorijärjestelmän käyttöön, Kanssa jolla vaihtelua mitataan.

Variaatioiden tutkiminen on välttämätöntä. Variaatioiden mittaaminen on tarpeellista suoritettaessa näytehavainnointia, korrelaatio- ja varianssianalyysiä jne. Ermolaev O.Yu. Matemaattiset tilastot psykologeille: Oppikirja [Teksti] / O.Yu. Ermolaev. - M.: Moskovan psykologisen ja sosiaalisen instituutin Flint Publishing House, 2012. - 335s.

Vaihtelun asteen mukaan voidaan arvioida populaation homogeenisuutta, piirteiden yksittäisten arvojen vakautta ja keskiarvon tyypillisyyttä. Niiden pohjalta kehitetään merkkien välisen suhteen läheisyyden indikaattoreita, indikaattoreita valikoivan havainnon tarkkuuden arvioimiseksi.

Avaruudessa ja ajassa on vaihtelua.

Avaruuden vaihtelulla tarkoitetaan ominaisuuden arvojen vaihtelua eri alueita edustavissa väestöyksiköissä. Ajan vaihtelulla tarkoitetaan attribuutin arvojen muutosta eri ajanjaksoina.

Jakaumasarjan vaihtelun tutkimiseksi kaikki attribuuttiarvojen variantit on järjestetty nousevaan tai laskevaan järjestykseen. Tätä prosessia kutsutaan sarjasijoitukseksi.

Yksinkertaisimmat merkit vaihtelusta ovat minimi ja maksimi- attribuutin pienin ja suurin arvo aggregaatissa. Ominaisuusarvojen yksittäisten muunnelmien toistojen määrää kutsutaan toistotiheydeksi (fi). On kätevää korvata taajuudet taajuuksilla - wi. Frequency - suhteellinen taajuuden indikaattori, joka voidaan ilmaista yksikön murto-osina tai prosentteina ja jonka avulla voit verrata vaihtelusarjoja eri havaintojen lukumäärään. Ilmaistaan ​​kaavalla:

missä Xmax, Xmin - attribuutin enimmäis- ja vähimmäisarvot koosteessa; n on ryhmien lukumäärä.

Ominaisuuden vaihtelun mittaamiseen käytetään erilaisia ​​absoluuttisia ja suhteellisia indikaattoreita. Variaatioiden absoluuttisia indikaattoreita ovat vaihteluväli, keskimääräinen lineaarinen poikkeama, varianssi, keskihajonta. Suhteellisia vaihteluindikaattoreita ovat oskillaatiokerroin, suhteellinen lineaarinen poikkeama, variaatiokerroin.

Esimerkki variaatiosarjan löytämisestä

Harjoittele. Tälle näytteelle:

  • a) Etsi variaatiosarja;
  • b) Muodosta jakaumafunktio;

Nro = 42. Esimerkkituotteet:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Ratkaisu.

  • a) järjestetyn variaatiosarjan muodostaminen:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) diskreetin variaatiosarjan rakentaminen.

Lasketaan ryhmien lukumäärä variaatiosarjassa Sturgessin kaavalla:

Otetaan ryhmien lukumäärä 7.

Kun tiedämme ryhmien lukumäärän, laskemme välin arvon:

Taulukon rakentamisen helpottamiseksi otamme ryhmien lukumäärän 8, väli on 1.

Riisi. yksi Liikkeen myymien tavaroiden määrä tietyn ajanjakson aikana

Ryhmittelymenetelmällä voit myös mitata vaihtelua merkkien (vaihtelu, vaihtelu). Suhteellisen pienellä populaatioyksiköiden määrällä vaihtelua mitataan perusjoukon muodostavien yksiköiden järjestyssarjan perusteella. Rivi on ns paremmuusjärjestykseen jos yksiköt on järjestetty nousevaan (laskevaan) ominaisuuteen.

Sijoitussarjat ovat kuitenkin melko suuntaa antavia, kun tarvitaan vertailevaa vaihtelua. Lisäksi monissa tapauksissa on käsiteltävä suuresta määrästä yksiköitä koostuvia tilastollisia aggregaatteja, joita on käytännössä vaikea esittää tietyn sarjan muodossa. Tältä osin tilastotietojen alustavaa yleistä tutustumista varten ja erityisesti merkkien vaihtelun tutkimuksen helpottamiseksi tutkitut ilmiöt ja prosessit yhdistetään yleensä ryhmiin ja ryhmittelyn tulokset laaditaan ryhmätaulukoiksi. .

Jos ryhmätaulukossa on vain kaksi saraketta - ryhmät valitun ominaisuuden (optiot) ja ryhmien lukumäärän (taajuudet tai taajuudet) mukaan, sitä kutsutaan lähellä jakelua.

Jakelualue - Yksinkertaisin yhden attribuutin mukainen rakenteellinen ryhmittely, joka näytetään ryhmätaulukossa, jossa on kaksi saraketta, jotka sisältävät määritteen muunnelmia ja esiintymistiheyksiä. Monissa tapauksissa tällaisella rakenteellisella ryhmittelyllä, ts. jakaumasarjojen laatimisella aloitetaan tilastollisen lähtömateriaalin tutkiminen.

Jakaumasarjan muodossa olevasta rakenteellisesta ryhmittelystä voidaan tehdä todellinen rakenneryhmittely, jos valituille ryhmille on tunnusomaista frekvenssien lisäksi myös muut tilastolliset indikaattorit. Jakelusarjan päätarkoituksena on tutkia ominaisuuksien vaihtelua. Jakaumasarjojen teoriaa kehittää yksityiskohtaisesti matemaattinen tilasto.

Jakelusarjat on jaettu attribuutio(ryhmittely attribuuttien mukaan, esimerkiksi väestön jakautuminen sukupuolen, kansallisuuden, siviilisäädyn jne. mukaan) ja vaihtelevaa(ryhmittely määrällisten ominaisuuksien mukaan).

Variaatiosarja on ryhmätaulukko, joka sisältää kaksi saraketta: yksiköiden ryhmittelyn yhden kvantitatiivisen attribuutin ja kunkin ryhmän yksiköiden lukumäärän mukaan. Vaihtelusarjan intervallit muodostetaan yleensä tasa-arvoisiksi ja suljetuiksi. Variaatiosarja on seuraava Venäjän väestön ryhmittely asukasta kohden lasketun keskimääräisen kassatulon perusteella (taulukko 3.10).

Taulukko 3.10

Venäjän väestön jakautuminen asukaskohtaisten keskitulojen mukaan vuosina 2004-2009

Väestöryhmät keskimääräisten käteistulojen mukaan asukasta kohden, rub./kk

Väestö ryhmässä, % kokonaismäärästä

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Yli 25 000,0

Koko väestö

Variaatiosarjat puolestaan ​​jaetaan diskreeteihin ja intervalliin. Diskreetti variaatiosarja yhdistää erillisten ominaisuuksien muunnelmia, jotka vaihtelevat kapeissa rajoissa. Esimerkki diskreetistä variaatiosarjasta on venäläisten perheiden jakauma lasten lukumäärän mukaan.

Intervalli variaatiosarjat yhdistävät muunnelmia joko jatkuvista ominaisuuksista tai erillisistä ominaisuuksista, jotka vaihtelevat laajalla alueella. Intervallisarja on Venäjän väestön jakautumisen vaihtelusarja asukasta kohden lasketun keskimääräisen kassatulon perusteella.

Diskreettejä variaatiosarjoja ei käytännössä käytetä kovin usein. Sitä vastoin niiden kokoaminen ei ole vaikeaa, koska ryhmien koostumuksen määräävät ne tietyt variantit, joita tutkituilla ryhmittelyominaisuuksilla todella on.

Intervallivaihtelusarjat ovat yleisempiä. Niitä koottaessa herää vaikea kysymys ryhmien lukumäärästä sekä määritettävien välien koosta.

Periaatteet tämän ongelman ratkaisemiseksi on esitetty tilastollisten ryhmittelyjen muodostamista koskevassa luvussa (ks. kohta 3.3).

Variaatiosarjat ovat keino tiivistää tai tiivistää erilaista tietoa tiiviiseen muotoon, joiden avulla voidaan tehdä melko selkeä arvio variaation luonteesta, tutkia tutkittavaan joukkoon kuuluvien ilmiöiden merkkien eroja. Mutta variaatiosarjojen tärkein merkitys on, että niiden perusteella lasketaan vaihtelun erityiset yleistävät ominaisuudet (ks. luku 7).

Variaatiosarjan käsite. Ensimmäinen askel tilastollisen havainnoinnin materiaalien systematisoinnissa on niiden yksiköiden lukumäärän laskeminen, joilla on jokin ominaisuus. Kun yksiköt on järjestetty niiden määrällisen attribuutin nousevaan tai laskevaan järjestykseen ja laskettu yksiköiden määrä tietyllä attribuutin arvolla, saadaan variaatiosarja. Variaatiosarja kuvaa tietyn tilastollisen perusjoukon yksiköiden jakautumista jonkin kvantitatiivisen attribuutin mukaan.

Muunnelmasarja koostuu kahdesta sarakkeesta, vasen sarake sisältää muuttujaattribuutin arvot, joita kutsutaan varianteiksi ja merkitään (x), ja oikea sarake sisältää absoluuttiset luvut, jotka osoittavat, kuinka monta kertaa kukin variantti esiintyy. Tämän sarakkeen arvoja kutsutaan taajuuksiksi ja niitä merkitään (f).

Kaavamaisesti variaatiosarja voidaan esittää taulukon 5.1 muodossa:

Taulukko 5.1

Variaatiosarjan tyyppi

Vaihtoehdot (x)

Taajuudet (f)

Oikeassa sarakkeessa voidaan käyttää myös suhteellisia indikaattoreita, jotka kuvaavat yksittäisten muunnelmien esiintymistiheyden osuutta taajuuksien kokonaismäärästä. Näitä suhteellisia indikaattoreita kutsutaan taajuuksiksi ja niitä merkitään perinteisesti ts. . Kaikkien taajuuksien summa on yhtä suuri kuin yksi. Taajuudet voidaan ilmaista myös prosentteina, jolloin niiden summa on 100%.

Muuttuvat merkit voivat olla luonteeltaan erilaisia. Joidenkin merkkien muunnelmat ilmaistaan ​​kokonaislukuina, esimerkiksi huoneiden lukumäärä asunnossa, julkaistujen kirjojen määrä jne. Näitä merkkejä kutsutaan epäjatkuviksi tai erillisiksi. Muiden ominaisuuksien muunnelmat voivat saada mitä tahansa arvoja tietyissä rajoissa, kuten suunniteltujen tavoitteiden saavuttaminen, palkat jne. Näitä ominaisuuksia kutsutaan jatkuviksi.

Diskreetti variaatiosarja. Jos variaatiosarjan variantit ilmaistaan ​​diskreeteinä arvoina, niin tällaista vaihtelusarjaa kutsutaan diskreetiksi, sen ulkonäkö on esitetty taulukossa. 5.2:

Taulukko 5.2

Opiskelijoiden jakautuminen kokeessa saatujen arvosanojen mukaan

Arviot (x)

Opiskelijoiden määrä (f)

% kokonaismäärästä ()

Diskreettien sarjojen jakauman luonne on kuvattu graafisesti jakautumispolygonina, kuva 5.1.

Riisi. 5.1. Opiskelijoiden jakautuminen kokeessa saatujen arvosanojen mukaan.

Intervallivaihtelusarja. Jatkuville ominaisuuksille variaatiosarjat muodostetaan intervallisarjoiksi, ts. niissä olevat ominaisuusarvot ilmaistaan ​​aikaväleinä "alkaen ja kohteeseen". Tässä tapauksessa ominaisuuden minimiarvoa sellaisessa välissä kutsutaan välin alarajaksi ja maksimiarvoa intervallin ylärajaksi.

Intervallivaihtelusarjat on rakennettu sekä epäjatkuville ominaisuuksille (diskreeteille) että niille, jotka vaihtelevat laajalla alueella. Välirivit voivat olla yhtäläisiä ja epätasaisia. Talouskäytännössä käytetään enimmäkseen epätasaisia ​​intervalleja, jotka kasvavat tai pienentyvät asteittain. Tällainen tarve syntyy erityisesti tapauksissa, joissa merkin vaihtelu tapahtuu epätasaisesti ja suurissa rajoissa.

Harkitse intervallisarjan tyyppiä yhtäläisin välein, Taulukko. 5.3:

Taulukko 5.3

Työntekijöiden jakautuminen tuotannon mukaan

Lähtö, tr. (X)

Työntekijöiden määrä (f)

Kumulatiivinen taajuus (f´)

Intervallijakaumasarja on kuvattu graafisesti histogrammina, kuva 5.2.

Kuva 5.2. Työntekijöiden jakautuminen tuotannon mukaan

Kertynyt (kumulatiivinen) taajuus. Käytännössä on olemassa tarve muuntaa jakelusarjat kumulatiiviset rivit, rakennettu kertyneille taajuuksille. Niiden avulla voidaan määritellä rakenteellisia keskiarvoja, jotka helpottavat jakautumasarjatietojen analysointia.

Kumulatiiviset taajuudet määritetään lisäämällä peräkkäin näiden indikaattoreiden ensimmäisen ryhmän frekvensseihin (tai frekvensseihin) jakaumasarjan myöhempiä ryhmiä. Kumulaatteja ja ogiveja käytetään havainnollistamaan jakelusarjaa. Niiden rakentamiseksi abskissa-akselille on merkitty diskreetin piirteen arvot (tai välien päät) ja ordinaatta-akselille taajuuksien kasvavat summat (kumulaatti), kuva 5.3.

Riisi. 5.3. Työntekijöiden kumulatiivinen jakautuminen kehityksen mukaan

Jos taajuuksien ja varianttien asteikot vaihdetaan keskenään, ts. heijastaa kumuloituneita taajuuksia abskissa-akselilla ja vaihtoehtojen arvoja ordinaattisella akselilla, niin taajuuksien muutosta ryhmästä toiseen kuvaavaa käyrää kutsutaan jakaumaksi, kuva 5.4.

Riisi. 5.4. Ogiva työntekijöiden jakelu tuotantoon

Samanväliset variaatiosarjat ovat yksi tärkeimmistä tilastollisille jakaumasarjoille tarkoitetuista vaatimuksista, mikä varmistaa niiden vertailukelpoisuuden ajallisesti ja avaruudessa.

Jakauman tiheys. Näiden sarjojen yksittäisten epätasaisten välien taajuudet eivät kuitenkaan ole suoraan vertailukelpoisia. Tällaisissa tapauksissa tarvittavan vertailukelpoisuuden varmistamiseksi lasketaan jakautumistiheys, ts. määrittää, kuinka monta yksikköä kussakin ryhmässä on intervalliarvon yksikköä kohti.

Kun rakennetaan kuvaaja vaihtelevan sarjan jakaumasta epätasaisin väliajoin, suorakulmioiden korkeus määritetään suhteessa ei taajuuksiin, vaan tutkitun piirteen arvojen jakautumistiheyden indikaattoreihin vastaavilla aikaväleillä. .

Variaatiosarjan laatiminen ja sen graafinen esittäminen on ensimmäinen vaihe lähtötietojen käsittelyssä ja ensimmäinen vaihe tutkittavan perusjoukon analysoinnissa. Seuraava vaihe vaihtelusarjojen analysoinnissa on tärkeimpien yleistävien indikaattoreiden, joita kutsutaan sarjan ominaisuuksiksi, määrittäminen. Näiden ominaisuuksien pitäisi antaa käsitys attribuutin keskiarvosta väestön yksiköissä.

keskiarvo. Keskiarvo on tutkitun ominaisuuden yleistetty ominaisuus tutkittavassa populaatiossa, joka kuvastaa sen tyypillistä tasoa populaatioyksikköä kohden tietyissä paikan ja ajan olosuhteissa.

Keskiarvo on aina nimetty, sillä on sama ulottuvuus kuin populaation yksittäisten yksiköiden attribuutilla.

Ennen keskiarvojen laskemista on tarpeen ryhmitellä tutkitun populaation yksiköt korostaen laadullisesti homogeeniset ryhmät.

Koko väestölle laskettua keskiarvoa kutsutaan yleiskeskiarvoksi ja kunkin ryhmän osalta ryhmän keskiarvoksi.

Keskiarvoja on kahdenlaisia: teho (aritmeettinen keskiarvo, harmoninen keskiarvo, geometrinen keskiarvo, neliöllinen keskiarvo); rakenteellinen (moodi, mediaani, kvartiilit, desiilit).

Laskennan keskiarvon valinta riippuu tarkoituksesta.

Tehokeskiarvojen tyypit ja niiden laskentamenetelmät. Kerätyn aineiston tilastollisessa käsittelyssä syntyy erilaisia ​​ongelmia, joiden ratkaisemiseen tarvitaan erilaisia ​​keskiarvoja.

Matemaattiset tilastot saavat erilaisia ​​keinoja potenssikeskikaavoista:

missä on keskiarvo; x - yksittäiset vaihtoehdot (ominaisuusarvot); z - eksponentti (pisteessä z = 1 - aritmeettinen keskiarvo, z = 0 geometrinen keskiarvo, z = - 1 - harmoninen keskiarvo, z = 2 - keskimääräinen neliö).

Kysymys siitä, minkä tyyppistä keskiarvoa tulisi soveltaa kussakin yksittäistapauksessa, ratkaistaan ​​kuitenkin erityisellä tutkittavana olevan populaation analyysillä.

Yleisin tilastojen keskiarvo on aritmeettinen keskiarvo. Se lasketaan niissä tapauksissa, joissa keskimääräisen attribuutin tilavuus muodostuu sen arvojen summana tutkitun tilastollisen perusjoukon yksittäisille yksiköille.

Alkutietojen luonteesta riippuen aritmeettinen keskiarvo määritetään useilla tavoilla:

Jos tietoja ei ole ryhmitelty, laskenta suoritetaan yksinkertaisen keskiarvon kaavan mukaan

Diskreetin sarjan aritmeettisen keskiarvon laskenta tapahtuu kaavan 3.4 mukaisesti.

Aritmeettisen keskiarvon laskeminen intervallisarjassa. Intervallivaihtelusarjassa, jossa intervallin keskikohta otetaan ehdollisesti kunkin ryhmän ominaisuuden arvoksi, aritmeettinen keskiarvo voi poiketa ryhmittämättömistä tiedoista lasketusta keskiarvosta. Lisäksi mitä suurempi väli ryhmissä, sitä suuremmat ovat ryhmitellyistä tiedoista lasketun keskiarvon mahdolliset poikkeamat ryhmittämättömästä tiedosta lasketusta keskiarvosta.

Intervallivaihtelusarjan keskiarvoa laskettaessa siirrytään intervalleista niiden keskipisteisiin tarvittavien laskelmien suorittamiseksi. Laske sitten keskiarvo aritmeettisen painotetun keskiarvon kaavalla.

Aritmeettisen keskiarvon ominaisuudet. Aritmeettisella keskiarvolla on joitain ominaisuuksia, joiden avulla voimme yksinkertaistaa laskelmia, tarkastellaanpa niitä.

1. Vakiolukujen aritmeettinen keskiarvo on yhtä suuri kuin tämä vakioluku.

Jos x = a. Sitten .

2. Jos kaikkien optioiden painoja muutetaan suhteellisesti, ts. kasvaa tai laskea saman verran, niin uuden sarjan aritmeettinen keskiarvo ei muutu tästä.

Jos kaikki painot f pienennetään k kertaa, niin .

3. Yksittäisten optioiden positiivisten ja negatiivisten poikkeamien summa keskiarvosta kerrottuna painoilla on yhtä suuri kuin nolla, ts.

Jos sitten . Täältä.

Jos kaikkia vaihtoehtoja pienennetään tai lisätään jollakin numerolla, uuden sarjan aritmeettinen keskiarvo pienenee tai kasvaa saman verran.

Vähennä kaikkia vaihtoehtoja x päällä a, eli x´ = xa.

Sitten

Alkusarjan aritmeettinen keskiarvo saadaan lisäämällä vähennettyyn keskiarvoon muunnelmista aiemmin vähennetty luku a, eli .

5. Jos kaikkia vaihtoehtoja vähennetään tai lisätään k kertaa, niin uuden sarjan aritmeettinen keskiarvo pienenee tai kasvaa saman verran, ts. sisään k yhden kerran.

Anna sitten .

Siksi ts. alkuperäisen sarjan keskiarvon saamiseksi uuden sarjan aritmeettista keskiarvoa (alennettujen optioiden kanssa) on lisättävä k yhden kerran.

Keskimääräinen harmoninen. Harmoninen keskiarvo on aritmeettisen keskiarvon käänteisluku. Sitä käytetään, kun tilastotiedot eivät sisällä yksittäisten populaatiovaihtoehtojen frekvenssiä, vaan ne esitetään niiden tulona (M = xf). Harmoninen keskiarvo lasketaan kaavalla 3.5

Harmonisen keskiarvon käytännön sovellus on laskea joitain indeksejä, erityisesti hintaindeksiä.

Geometrinen keskiarvo. Geometristä keskiarvoa käytettäessä attribuutin yksittäiset arvot ovat pääsääntöisesti dynamiikan suhteellisia arvoja, jotka on rakennettu ketjuarvojen muodossa suhteessa dynamiikkasarjan kunkin tason edelliseen tasoon. . Keskiarvo siis luonnehtii keskimääräistä kasvunopeutta.

Geometristä keskiarvoa käytetään myös määrittämään yhtä kaukana oleva arvo attribuutin maksimi- ja minimiarvoista. Esimerkiksi vakuutusyhtiö tekee sopimuksia autovakuutuspalvelujen tarjoamisesta. Vakuutusmaksu voi vaihdella 10 000 - 100 000 dollarin välillä vakuutustapahtumasta riippuen. Keskimääräinen vakuutusmaksu on US$.

Geometrinen keskiarvo on suhteiden keskiarvona tai jakaumasarjassa käytetty arvo, joka esitetään geometrisena progressiona, kun z = 0. Tätä keskiarvoa on kätevä käyttää, kun ei kiinnitetä huomiota absoluuttisiin eroihin, vaan suhteisiin. kaksi numeroa.

Laskentakaavat ovat seuraavat

missä ovat muunnelmat keskiarvoista ominaisuudesta; - optioiden tuote; f– vaihtoehtojen tiheys.

Geometristä keskiarvoa käytetään keskimääräisten vuosikasvun laskennassa.

Keskimääräinen neliö. Neliön keskiarvokaavaa käytetään mittaamaan piirteen yksittäisten arvojen vaihteluastetta jakaumasarjan aritmeettisen keskiarvon ympärillä. Joten variaatioindikaattoreita laskettaessa keskiarvo lasketaan ominaisuuden yksittäisten arvojen aritmeettisesta keskiarvosta poikkeamien neliöistä.

Neliön keskiarvo lasketaan kaavalla

Taloustutkimuksessa neliön keskiarvon muunneltua muotoa käytetään laajasti ominaisuuden vaihtelun indikaattoreiden, kuten varianssin, keskihajonnan, laskennassa.

Enemmistön sääntö. Potenssilain keskiarvojen välillä on seuraava suhde - mitä suurempi eksponentti, sitä suurempi on keskiarvon arvo, Taulukko 5.4:

Taulukko 5.4

Keskiarvojen välinen suhde

z-arvo

Keskiarvojen välinen suhde

Tätä suhdetta kutsutaan pääjärjestyksen säännöksi.

Rakenteelliset keskiarvot. Väestön rakenteen karakterisoimiseksi käytetään erityisiä indikaattoreita, joita voidaan kutsua rakenteellisiksi keskiarvoiksi. Näitä mittareita ovat tila, mediaani, kvartiilit ja desiilit.

Muoti. Tila (Mo) on ominaisuuden yleisin arvo populaatioyksiköissä. Mode on attribuutin arvo, joka vastaa teoreettisen jakautumiskäyrän maksimipistettä.

Muotia käytetään laajasti kaupallisessa käytännössä kuluttajakysynnän tutkimuksessa (kun määritetään suuren kysynnän vaatteiden ja kenkien kokoa), hintojen rekisteröinnissä. Moditeja voi olla yhteensä useita.

Moodin laskenta diskreetissä sarjassa. Diskreetissä sarjassa tila on vaihtoehto, jolla on korkein taajuus. Harkitse tilan etsimistä erillisestä sarjasta.

Muodin laskenta intervallisarjassa. Intervallivaihtelusarjassa modaalivälin keskeistä muunnelmaa pidetään likimäärin moodina, ts. aikaväli, jolla on korkein taajuus (taajuus). Intervallin sisällä on löydettävä attribuutin arvo, joka on tila. Intervallisarjan tila määräytyy kaavan mukaan

missä on modaalivälin alaraja; on modaalivälin arvo; on modaaliväliä vastaava taajuus; on modaaliväliä edeltävä taajuus; on modaalia seuraavan intervallin taajuus.

Mediaani. Mediaani () on ominaisuuden arvo järjestetyn sarjan keskiyksikössä. Ranking-sarja on sarja, jossa ominaisarvot kirjoitetaan nousevassa tai laskevassa järjestyksessä. Tai mediaani on arvo, joka jakaa järjestetyn variaatiosarjan määrän kahteen yhtä suureen osaan: toisessa osassa on muuttujan ominaisuuden arvo, joka on pienempi kuin keskimääräinen muunnelma, ja toinen on suuri.

Mediaanin löytämiseksi sen sarjanumero määritetään ensin. Tätä varten parittomalla määrällä yksiköitä lisätään yksi kaikkien taajuuksien summaan ja kaikki jaetaan kahdella. Parillisella määrällä yksiköitä mediaani löytyy yksikön attribuutin arvoksi, jonka sarjanumero määräytyy frekvenssien kokonaissumman jakamalla kahdella. Kun mediaanin järjestysluku on tiedossa, sen arvo on helppo löytää kertyneistä taajuuksista.

Mediaanin laskeminen diskreetissä sarjassa. Otantatutkimuksen mukaan saatiin tietoa perheiden jakautumisesta lasten lukumäärän mukaan, Taulukko. 5.5. Mediaanin määrittämiseksi määritä ensin sen järjestysluku

Näissä perheissä lapsia on 2, joten = 2. Siten 50 %:ssa perheistä lasten määrä ei ylitä kahta.

– mediaaniväliä edeltävä kertynyt taajuus;

Toisaalta tämä on erittäin positiivinen ominaisuus. tässä tapauksessa otetaan huomioon kaikkien tutkittavan populaation kaikkiin yksiköihin vaikuttavien syiden vaikutus. Toisaalta yksikin vahingossa lähtötietoihin päässyt havainto voi merkittävästi vääristää käsitystä tutkitun piirteen kehitystasosta tarkasteltavana olevassa populaatiossa (etenkin lyhyissä sarjoissa).

Kvartiilit ja desiilit. Analogisesti mediaanin löytämisen kanssa variaatiosarjoista, piirteen arvo voidaan löytää missä tahansa järjestetyssä sarjayksikössä. Joten erityisesti voidaan löytää ominaisuuden arvo yksiköille, jotka jakavat sarjan 4 yhtä suureen osaan, 10:een jne.

Quartiles. Variantteja, jotka jakavat paremmuusjärjestyksen sarjan neljään yhtä suureen osaan, kutsutaan kvartiileiksi.

Samanaikaisesti erotetaan seuraavat: alempi (tai ensimmäinen) kvartiili (Q1) - järjestetyn sarjan yksikön ominaisuuden arvo, joka jakaa populaation suhteessa ¼ - ¾ ja ylempi (tai kolmas) ) kvartiili (Q3) - järjestetyn sarjan yksikön ominaisuuden arvo, joka jakaa populaation suhteessa ¾: ¼.

– kvartiilivälien taajuudet (alempi ja ylempi)

Q1:n ja Q3:n sisältävät intervallit määritetään kertyneistä taajuuksista (tai taajuuksista).

Desiilit. Kvartiilien lisäksi lasketaan desiilejä - vaihtoehtoja, jotka jakavat paremmuusjärjestyksen 10 yhtä suureen osaan.

Ne on merkitty D:llä, ensimmäinen desiili D1 jakaa sarjan suhteessa 1/10 ja 9/10, toinen D2 - 2/10 ja 8/10 jne. Ne lasketaan samalla tavalla kuin mediaani ja kvartiilit.

Sekä mediaani että kvartiilit ja desiilit kuuluvat ns. järjestystilastoihin, joka ymmärretään muunnelmaksi, joka on tietyn järjestyspaikan sijoittuvassa sarjassa.

Rivit rakennettu määrän mukaan, kutsutaan vaihtelevaa.

Jakelusarja koostuu vaihtoehtoja(ominaisarvot) ja taajuuksia(ryhmien lukumäärä). Suhteellisina arvoina ilmaistuja taajuuksia (osuudet, prosentit) kutsutaan taajuuksia. Kaikkien taajuuksien summaa kutsutaan jakaumasarjan tilavuudeksi.

Tyypin mukaan jakelusarjat on jaettu diskreetti(rakennettu ominaisuuden epäjatkuviin arvoihin) ja intervalli(rakennettu jatkuviin ominaisuusarvoihin).

Variaatiosarja edustaa kahta saraketta (tai riviä); joista yksi tarjoaa muuttujan attribuutin yksittäiset arvot, joita kutsutaan varianteiksi ja merkitään X:llä; ja toisessa - absoluuttiset luvut, jotka osoittavat kuinka monta kertaa (kuinka usein) kukin vaihtoehto esiintyy. Toisen sarakkeen indikaattoreita kutsutaan taajuuksiksi ja niitä merkitään tavanomaisesti f:llä. Jälleen kerran todetaan, että toisessa sarakkeessa voidaan käyttää myös suhteellisia indikaattoreita, jotka kuvaavat yksittäisten varianttien esiintymistiheyden osuutta taajuuksien kokonaismäärästä. Näitä suhteellisia indikaattoreita kutsutaan taajuuksiksi ja niitä merkitään perinteisesti ω:llä. Kaikkien taajuuksien summa on tässä tapauksessa yhtä suuri kuin yksi. Kuitenkin taajuudet voidaan ilmaista myös prosentteina, jolloin kaikkien taajuuksien summa antaa 100%.

Jos variaatiosarjan variantit ilmaistaan ​​diskreeteinä arvoina, niin tällaista vaihtelusarjaa kutsutaan diskreetti.

Jatkuville ominaisuuksille variaatiosarjat rakennetaan muodossa intervalli, eli niissä olevien määritteiden arvot ilmaistaan ​​"alkaen ... - ...". Tässä tapauksessa attribuutin vähimmäisarvoja sellaisessa välissä kutsutaan välin alarajaksi ja maksimiarvoksi ylärajaksi.

Intervallivaihtelusarjat on rakennettu myös erillisiin ominaisuuksiin, jotka vaihtelevat laajalla alueella. Intervallisarja voi olla yhtä suuri ja epätasa-arvoinen väliajoin.

Mieti, kuinka yhtäläisten välien arvo määritetään. Otetaan käyttöön seuraava merkintä:

i– intervalliarvo;

- määritteen enimmäisarvo perusjoukon yksiköille;

- määritteen vähimmäisarvo perusjoukon yksiköille;

n- jaettujen ryhmien määrä.

jos n tiedetään.

Jos allokoitujen ryhmien lukumäärää on vaikea määrittää etukäteen, voidaan suositella Sturgessin vuonna 1926 ehdottamaa kaavaa intervallin optimaalisen koon laskemiseksi riittävällä populaatiokoolla:

n = 1+ 3,322 log N, missä N on ykkösten lukumäärä perusjoukossa.

Epätasaisten välien arvo määritetään kussakin yksittäistapauksessa ottaen huomioon tutkimuskohteen ominaisuudet.

Otoksen tilastollinen jakautuminen kutsu optioluettelo ja niitä vastaavat taajuudet (tai suhteelliset taajuudet).

Otoksen tilastollinen jakautuminen voidaan määrittää taulukon muodossa, jonka ensimmäisessä sarakkeessa on valinnat, ja toisessa - näitä vaihtoehtoja vastaavat taajuudet. ni, tai suhteellisia taajuuksia Pi .

Otoksen tilastollinen jakautuminen

Intervallisarjoja kutsutaan variaatiosarjoiksi, joissa niiden muodostumisen taustalla olevien piirteiden arvot ilmaistaan ​​tietyissä rajoissa (intervalleissa). Taajuudet eivät tässä tapauksessa viittaa attribuutin yksittäisiin arvoihin, vaan koko väliin.

Intervallijakaumasarjat muodostetaan jatkuvien kvantitatiivisten ominaisuuksien sekä diskreettien ominaisuuksien mukaan, jotka vaihtelevat merkittävällä alueella.

Intervallisarja voidaan esittää otoksen tilastollisella jakaumalla, joka osoittaa intervallit ja niitä vastaavat taajuudet. Tässä tapauksessa välin taajuudeksi otetaan tähän väliin kuuluneen muunnelman taajuuksien summa.

Ryhmitellessä kvantitatiivisten jatkuvien ominaisuuksien mukaan on tärkeää määrittää intervallin koko.

Otoskeskiarvon ja otosvarianssin lisäksi käytetään myös muita variaatiosarjan ominaisuuksia.

Muoti nimeä muunnelma, jolla on korkein taajuus.

Tämän luvun hallitsemisen tuloksena opiskelijan tulee: tietää

  • vaihteluindikaattorit ja niiden suhde;
  • ominaisuuksien jakautumisen peruslait;
  • suostumuskriteerien ydin; pystyä
  • laskea vaihtelunopeudet ja istuvuuden hyvyys;
  • määrittää jakaumien ominaisuudet;
  • arvioida tilastollisen jakauman sarjan tärkeimmät numeeriset ominaisuudet;

oma

  • jakaumasarjojen tilastollisen analyysin menetelmät;
  • dispersioanalyysin perusteet;
  • menetelmät tilastollisten jakaumasarjojen tarkastamiseksi jakautumisen peruslakien mukaisiksi.

Vaihtelun indikaattorit

Erilaisten tilastopopulaatioiden piirteiden tilastollisessa tutkimuksessa on erittäin mielenkiintoista tutkia perusjoukon yksittäisten tilastoyksiköiden ominaisuuden vaihtelua sekä yksiköiden tämän ominaisuuden mukaisen jakautumisen luonnetta. Muunnelma - nämä ovat erot ominaisuuden yksittäisissä arvoissa tutkitun populaation yksiköiden välillä. Variaatioiden tutkimuksella on suuri käytännön merkitys. Variaatioasteen perusteella voidaan arvioida ominaisuuden vaihtelun rajat, populaation homogeenisuus tälle ominaisuudelle, keskiarvon tyypillisyys, vaihtelun määräävien tekijöiden suhde. Variaatioindikaattoreita käytetään tilastollisten populaatioiden karakterisointiin ja järjestämiseen.

Tilastollisen havaintoaineiston yhteenvedon ja ryhmittelyn tulokset tilastollisten jakaumasarjojen muodossa muodostavat tutkitun populaation yksiköiden järjestyneen jakauman ryhmittelyn (muuttujan) attribuutin mukaan. Jos ryhmittelyn perustaksi otetaan laadullinen ominaisuus, niin tällaista jakaumasarjaa kutsutaan attribuutio(jakauma ammatin, sukupuolen, värin jne. mukaan). Jos jakaumasarja on rakennettu kvantitatiivisesti, niin tällaista sarjaa kutsutaan vaihtelevaa(jakauma pituuden, painon, palkkojen jne. mukaan). Variaatiosarjan rakentaminen tarkoittaa populaatioyksiköiden määrällisen jakautumisen järjestämistä tunnusarvojen mukaan, populaatioyksiköiden lukumäärän laskemista näillä arvoilla (frekvenssi), tulosten järjestämistä taulukkoon.

Muunnelman taajuuden sijasta voidaan käyttää sen suhdetta havaintojen kokonaismäärään, jota kutsutaan frekvenssiksi (suhteelliseksi frekvenssiksi).

Variaatiosarjoja on kahta tyyppiä: diskreetti ja intervalli. Diskreetti sarja- tämä on sellainen variaatiosarja, jonka rakentaminen perustuu merkkeihin, joissa on epäjatkuva muutos (diskreetit merkit). Jälkimmäiset sisältävät yrityksen työntekijöiden lukumäärän, palkkaluokan, lasten määrän perheessä jne. Diskreetti variaatiosarja on taulukko, joka koostuu kahdesta sarakkeesta. Ensimmäinen sarake osoittaa määritteen tietyn arvon ja toinen - niiden populaatioyksiköiden lukumäärän, joilla on tietty attribuutin arvo. Jos kyltissä on jatkuva muutos (tulon määrä, työkokemus, yrityksen käyttöomaisuuden kustannukset jne., jotka tietyissä rajoissa voivat olla mitä tahansa arvoja), niin tälle merkille on mahdollista rakentaa intervallivaihtelusarja. Taulukossa, kun muodostetaan intervallivaihtelusarjaa, on myös kaksi saraketta. Ensimmäinen osoittaa ominaisuuden arvon välissä "alkaen -" (valinnat), toinen - väliin sisältyvien yksiköiden lukumäärän (taajuus). Taajuus (toistotaajuus) - attribuuttiarvojen tietyn muunnelman toistojen määrä. Intervallit voidaan sulkea ja avata. Suljetut välit ovat rajoitettuja molemmin puolin, ts. niillä on sekä alempi ("from") että yläreuna ("to"). Avoimilla aikaväleillä on mikä tahansa raja: joko ylempi tai alempi. Jos vaihtoehdot on järjestetty nousevaan tai laskevaan järjestykseen, rivit kutsutaan paremmuusjärjestykseen.

Variaatiosarjoille on olemassa kahden tyyppisiä taajuusvastevaihtoehtoja: kumulatiivinen taajuus ja kumulatiivinen taajuus. Kumulatiivinen taajuus osoittaa, kuinka monta havaintoa ominaisuuden arvo on saanut määritettyä arvoa pienempiä arvoja. Kumulatiivinen taajuus määritetään summaamalla tietyn ryhmän ominaistaajuuden arvot kaikkiin edellisten ryhmien taajuuksiin. Kertymätaajuus kuvaa niiden havaintoyksiköiden osuutta, joissa ominaisuuden arvot eivät ylitä päiväryhmän ylärajaa. Näin ollen kumuloituva taajuus osoittaa muunnelman ominaispainon aggregaatissa, jonka arvo ei ole annettua suurempi. Taajuus, taajuus, absoluuttiset ja suhteelliset tiheydet, kumulatiivinen taajuus ja taajuus ovat muunnelman suuruuden ominaisuuksia.

Perusjoukon tilastoyksiköiden etumerkin vaihteluita sekä jakauman luonnetta tutkitaan käyttämällä variaatiosarjojen indikaattoreita ja ominaisuuksia, joihin kuuluvat sarjan keskimääräinen taso, keskimääräinen lineaarinen poikkeama, keskihajonta, hajonta. , värähtelykertoimet, variaatio, epäsymmetria, kurtoosi jne.

Jakelukeskuksen kuvaamiseen käytetään keskiarvoja. Keskiarvo on yleistävä tilastollinen ominaisuus, jossa mitataan tutkittavan populaation jäsenten omistaman piirteen tyypillinen taso. Saattaa kuitenkin olla tapauksia, joissa aritmeettiset keskiarvot osuvat yhteen jakauman erilaisen luonteen kanssa, joten vaihtelusarjan tilastollisina ominaisuuksina lasketaan niin sanotut rakenteelliset keskiarvot - moodi, mediaani sekä jakauman jakavat kvantiilit. sarja yhtä suuriin osiin (kvartiilit, desiilit, prosenttipisteet jne.).

Muoti - tämä on sen ominaisuuden arvo, joka esiintyy useammin jakaumasarjassa kuin sen muut arvot. Diskreettien sarjojen kohdalla tämä on korkeimman taajuuden omaava versio. Intervallivaihtelusarjoissa moodin määrittämiseksi on ensin määritettävä intervalli, jossa se sijaitsee, ns. modaaliväli. Samanvälisissä variaatiosarjassa modaaliväli määräytyy suurimman taajuuden mukaan, sarjassa, jossa on eri välit - mutta suurin jakautumistiheys. Käytä sitten kaavaa määrittääksesi tilan riveissä yhtäläisin välein

missä Mo on muodin arvo; x Mo - modaalivälin alaraja; h- modaalinen intervallin leveys; / Mo - modaalinen intervallitaajuus; / Mo j - premodaalisen aikavälin taajuus; / Mo+1 on postmodaalisen intervallin taajuus, ja sarjassa, jossa on eri välit tässä laskentakaavassa, tulee käyttää taajuuksien / Mo, / Mo, / Mo sijasta jakautumistiheyksiä. Mieli 0 _| , Mieli 0> UMO+"

Jos on yksimoodinen, niin satunnaismuuttujan todennäköisyysjakaumaa kutsutaan unimodaaliseksi; jos tilaa on useampi kuin yksi, sitä kutsutaan multimodaaliksi (polymodaaliksi, multimodaaliksi), kahden moodin tapauksessa - bimodaaliksi. Pääsääntöisesti multimodaalisuus osoittaa, että tutkittava jakauma ei noudata normaalijakauman lakia. Homogeenisille populaatioille on pääsääntöisesti tunnusomaista unimodaaliset jakaumat. Multivertex osoittaa myös tutkitun populaation heterogeenisyyden. Kahden tai useamman kärjen ilmaantuminen tekee tarpeelliseksi ryhmitellä tiedot uudelleen homogeenisempien ryhmien eristämiseksi.

Intervallivaihtelusarjassa tila voidaan määrittää graafisesti histogrammin avulla. Tätä varten piirretään kaksi leikkaavaa viivaa histogrammin korkeimman sarakkeen yläpisteistä kahden vierekkäisen sarakkeen yläpisteisiin. Sitten niiden leikkauspisteestä kohtisuora lasketaan abskissa-akselille. Pystysuoraa vastaava abskissan piirteen arvo on moodi. Monissa tapauksissa populaatiota luonnehdittaessa yleisenä indikaattorina etusija annetaan moodille aritmeettisen keskiarvon sijaan.

Mediaani - tämä on ominaisuuden keskeinen arvo; se on järjestetyn jakelusarjan keskeisellä jäsenellä. Diskreetissä sarjassa mediaanin arvon löytämiseksi määritetään ensin sen sarjanumero. Tätä varten parittomalla määrällä yksiköitä lisätään yksi kaikkien taajuuksien summaan, luku jaetaan kahdella. Jos ykkösiä on parillinen määrä, sarjassa on 2 mediaani 1:tä, joten tässä tapauksessa mediaani määritellään 2 mediaanin 1:n arvojen keskiarvona. Siten diskreetin variaatiosarjan mediaani on arvo, joka jakaa sarjan kahteen osaan, jotka sisältävät saman määrän vaihtoehtoja.

Intervallisarjassa mediaanin järjestysluvun määrittämisen jälkeen mediaaniväli löydetään kertyneillä taajuuksilla (taajuudet), ja sitten mediaanin laskentakaavaa käyttäen määritetään itse mediaanin arvo:

missä Me on mediaanin arvo; x minä - mediaanivälin alaraja; h- mediaanivälin leveys; - jakelusarjojen taajuuksien summa; /D - esimediaanivälin kertynyt taajuus; / Me - mediaanivälin taajuus.

Mediaani löytyy graafisesti kumulaatiolla. Tätä varten kumulaation kumuloituneiden taajuuksien (taajuuksien) asteikolla mediaanin järjestyslukua vastaavasta pisteestä vedetään suora viiva, joka on yhdensuuntainen abskissa-akselin kanssa, kunnes se leikkaa kumulaation. Lisäksi osoitetun suoran ja kumulaatin leikkauspisteestä lasketaan kohtisuora abskissa-akseliin nähden. Piirrettyä ordinaattia (pystysuoraa) vastaavan piirteen arvo x-akselilla on mediaani.

Mediaanille on ominaista seuraavat ominaisuudet.

  • 1. Se ei riipu niistä attribuuttiarvoista, jotka sijaitsevat sen molemmilla puolilla.
  • 2. Sillä on minimaalisuuden ominaisuus, mikä tarkoittaa, että attribuuttiarvojen absoluuttisten poikkeamien summa mediaanista on minimiarvo verrattuna ominaisuusarvojen poikkeamaan mistä tahansa muusta arvosta.
  • 3. Kun yhdistetään kaksi jakaumaa tunnetuilla mediaanilla, on mahdotonta ennustaa uuden jakauman mediaaniarvoa etukäteen.

Näitä mediaanin ominaisuuksia käytetään laajasti julkisten palvelupisteiden - koulujen, klinikoiden, huoltoasemien, vesipumppujen jne. - sijoittelun suunnittelussa. Esimerkiksi jos poliklinikka suunnitellaan rakentamaan tietylle kaupunginosalle, se on tarkoituksenmukaisempaa sijoittaa sellaiseen kortteliin, joka ei jaa korttelin pituutta, vaan asukasmäärää.

Moodin, mediaanin ja aritmeettisen keskiarvon suhde ilmaisee piirteen jakauman luonteen aggregaatissa, mahdollistaa jakauman symmetrian arvioinnin. Jos x Me, sarjassa on oikeanpuoleinen epäsymmetria. Normaalijakaumalla X - Muistio.

K. Pearson päätti erityyppisten käyrien kohdistamisen perusteella, että kohtalaisen epäsymmetrisillä jakaumilla seuraavat likimääräiset suhteet aritmeettisen keskiarvon, mediaanin ja moodin välillä ovat voimassa:

missä Me on mediaanin arvo; Mo - muotiarvo; x arithm - aritmeettisen keskiarvon arvo.

Jos variaatiosarjan rakennetta on tarpeen tutkia tarkemmin, lasketaan tunnusarvot mediaanin tapaan. Tällaiset ominaisuusarvot jakavat kaikki jakautumisyksiköt yhtä suureksi luvuksi, niitä kutsutaan kvantiileiksi tai gradienteiksi. Kvantiilit on jaettu kvartiileihin, desiileihin, prosenttipisteisiin jne.

Kvartiilit jakavat väestön neljään yhtä suureen osaan. Ensimmäinen kvartiili lasketaan samalla tavalla kuin mediaani käyttämällä ensimmäisen kvartiilin laskentakaavaa, kun on aiemmin määritetty ensimmäinen neljännesvuosittainen aikaväli:

missä Qi on ensimmäisen kvartiilin arvo; xQ^- ensimmäisen kvartiilivälin alaraja; h- ensimmäisen neljännesvuosittaisen ajanjakson leveys; /, - intervallisarjan taajuudet;

Kertynyt taajuus ensimmäistä kvartiiliväliä edeltävällä aikavälillä; Jq ( - ensimmäisen kvartiilivälin taajuus.

Ensimmäinen kvartiili osoittaa, että 25 % väestöyksiköistä on pienempiä kuin sen arvo ja 75 % on enemmän. Toinen kvartiili on yhtä suuri kuin mediaani, ts. Q2 = minä.

Analogisesti lasketaan kolmas kvartiili, kun on aiemmin löydetty kolmas neljännesvuosittainen aikaväli:

missä on kolmannen kvartiilivälin alaraja; h- kolmannen kvartiilivälin leveys; /, - intervallisarjan taajuudet; /X"- kertynyt taajuus edellisellä aikavälillä

G

kolmas kvartiiliväli; Jq - kolmannen kvartiilivälin taajuus.

Kolmas kvartiili osoittaa, että 75 % väestöyksiköistä on pienempiä kuin sen arvo ja 25 % on enemmän.

Ero kolmannen ja ensimmäisen kvartiilin välillä on kvartiilien välinen intervalli:

missä Aq on kvartiilivälin arvo; Q3 - kolmannen kvartiilin arvo; Q, - ensimmäisen kvartiilin arvo.

Desiilit jakavat väestön 10 yhtä suureen osaan. Desiili on jakaumasarjan piirteen arvo, joka vastaa kymmenesosia perusjoukosta. Analogisesti kvartiilien kanssa ensimmäinen desiili osoittaa, että 10% väestöyksiköistä on pienempiä kuin sen arvo ja 90% on enemmän, ja yhdeksäs desiili paljastaa, että 90% väestöyksiköistä on pienempiä kuin sen arvo ja 10% on pienempiä kuin sen arvo. lisää. Yhdeksännen ja ensimmäisen desiilin suhde, ts. Desiilikerroin, jota käytetään laajalti tulojen eriyttämisen tutkimuksessa mittaamaan 10 % varakkaimman ja 10 % vähiten varakkaiden väestön tulotasojen suhdetta. Persentiilit jakavat järjestetyn populaation 100 yhtä suureen osaan. Prosenttipisteiden laskenta, merkitys ja käyttö ovat samanlaisia ​​kuin desiilejä.

Kvartiilit, desiilit ja muut rakenteelliset ominaisuudet voidaan määrittää graafisesti analogisesti mediaanin kanssa käyttämällä kumulaattia.

Muutoksen koon mittaamiseen käytetään seuraavia indikaattoreita: vaihteluväli, keskimääräinen lineaarinen poikkeama, keskihajonta ja varianssi. Vaihtelualueen suuruus riippuu täysin sarjan äärijäsenten jakauman satunnaisuudesta. Tämä indikaattori on kiinnostava tapauksissa, joissa on tärkeää tietää, mikä on attribuutin arvojen vaihteluiden amplitudi:

missä R- vaihtelualueen arvo; x max - ominaisuuden enimmäisarvo; x tt - attribuutin vähimmäisarvo.

Vaihtelun vaihteluväliä laskettaessa sarjan jäsenten valtaosan arvoa ei oteta huomioon, kun taas vaihtelu liittyy sarjan jäsenen jokaiseen arvoon. Tästä puutteesta puuttuu indikaattoreita, jotka ovat keskiarvoja, jotka saadaan yksittäisten piirteiden arvojen poikkeamista niiden keskiarvosta: keskimääräinen lineaarinen poikkeama ja keskihajonta. Yksittäisten poikkeamien keskiarvosta ja tietyn ominaisuuden vaihtelun välillä on suora yhteys. Mitä suurempi volatiliteetti, sitä suurempi on keskiarvon poikkeamien absoluuttinen koko.

Keskimääräinen lineaarinen poikkeama on yksittäisten optioiden keskiarvosta poikkeamien absoluuttisten arvojen aritmeettinen keskiarvo.

Keskimääräinen lineaarinen poikkeama ryhmittelemättömille tiedoille

missä / pr - keskimääräisen lineaarisen poikkeaman arvo; x, - - piirteen arvo; X - P - väestöyksiköiden lukumäärä.

Ryhmitetty sarjan keskimääräinen lineaarinen poikkeama

missä / vz - keskimääräisen lineaarisen poikkeaman arvo; x, - piirteen arvo; X - ominaisuuden keskiarvo tutkittavalle populaatiolle; / - erillisen ryhmän väestöyksiköiden lukumäärä.

Poikkeamamerkit jätetään tässä tapauksessa huomiotta, muuten kaikkien poikkeamien summa on nolla. Keskimääräinen lineaarinen poikkeama analysoitujen tietojen ryhmittelystä riippuen lasketaan eri kaavoilla: ryhmitellylle ja ryhmittämättömälle tiedolle. Keskimääräistä lineaarista poikkeamaa, sen tavanomaisuudesta johtuen, erillään muista vaihteluindikaattoreista, käytetään käytännössä suhteellisen harvoin (erityisesti luonnehtimaan sopimusvelvoitteiden täyttämistä tarjonnan yhtenäisyyden kannalta; ulkomaankaupan liikevaihdon analysoinnissa, työntekijöiden kokoonpano, tuotannon rytmi, tuotteiden laatu, tuotannon teknologiset ominaisuudet jne.).

Keskihajonta kuvaa kuinka paljon tutkitun ominaisuuden yksittäiset arvot poikkeavat keskimäärin populaation keskiarvosta, ja se ilmaistaan ​​tutkitun ominaisuuden yksiköissä. Keskihajontaa, joka on yksi tärkeimmistä vaihtelun mittareista, käytetään laajalti arvioitaessa ominaisuuden vaihtelun rajoja homogeenisessa populaatiossa, määritettäessä normaalijakaumakäyrän ordinaattien arvoja sekä näytehavainnon järjestämiseen ja näyteominaisuuksien tarkkuuden määrittämiseen liittyvät laskelmat. Ryhmittelemättömän tiedon keskihajonnan lasketaan seuraavalla algoritmilla: jokainen poikkeama keskiarvosta neliötetään, kaikki neliöt lasketaan yhteen, minkä jälkeen neliöiden summa jaetaan sarjan termien lukumäärällä ja neliöjuuri otetaan osamäärä:

missä a Iip - keskihajonnan arvo; Xj- ominaisuuden arvo; X- attribuutin keskiarvo tutkitulle populaatiolle; P - väestöyksiköiden lukumäärä.

Ryhmitetyille analysoiduille tiedoille lasketaan tietojen keskihajonna painotetun kaavan avulla

missä - keskihajonnan arvo; Xj- ominaisuuden arvo; X - ominaisuuden keskiarvo tutkittavalle populaatiolle; fx- tietyn ryhmän väestöyksiköiden lukumäärä.

Molemmissa tapauksissa juuren alla olevaa lauseketta kutsutaan varianssiksi. Siten varianssi lasketaan ominaisuusarvojen poikkeamien keskimääräisestä neliöstä niiden keskiarvosta. Painottamattomien (yksinkertaisten) ominaisuusarvojen varianssi määritellään seuraavasti:

Painotetuille ominaisarvoille

On myös erityinen yksinkertaistettu tapa laskea varianssi: yleisesti

painottamattomille (yksinkertaisille) ominaisuusarvoille painotetuille ominaisarvoille
käyttäen menetelmää laskea ehdollisesta nollasta

jossa a 2 - dispersion arvo; x, - - piirteen arvo; X - ominaisuuden keskiarvo, h- ryhmävälin arvo, t 1 - paino (A =

Dispersiolla on itsenäinen ilmaisu tilastoissa ja se on yksi tärkeimmistä vaihtelun indikaattoreista. Se mitataan yksiköissä, jotka vastaavat tutkittavan ominaisuuden mittayksiköiden neliötä.

Dispersiolla on seuraavat ominaisuudet.

  • 1. Vakioarvon hajonta on nolla.
  • 2. Ominaisuuden kaikkien arvojen pienentäminen samalla A:n arvolla ei muuta varianssin arvoa. Tämä tarkoittaa, että poikkeamien keskineliö voidaan laskea ei määritteen annetuista arvoista, vaan niiden poikkeamista jostain vakioluvusta.
  • 3. Pienennä kaikkia piirteen arvoja k kertaa vähentää hajoamista sisään k 2 kertaa ja keskihajonta - in k kertaa, ts. kaikki ominaisuuden arvot voidaan jakaa jollain vakioluvulla (esimerkiksi sarjan välin arvolla), laskea keskihajonna ja kertoa se sitten vakioluvulla.
  • 4. Jos laskemme poikkeamien keskimääräisen neliön mistä tahansa arvosta Ja klo poikkeaa jossain määrin aritmeettisesta keskiarvosta, niin se on aina suurempi kuin aritmeettisesta keskiarvosta laskettujen poikkeamien keskineliö. Tässä tapauksessa poikkeamien keskineliö on suurempi tarkasti määritellyllä arvolla - keskiarvon ja tämän ehdollisesti otetun arvon välisen eron neliön verran.

Vaihtoehtoisen ominaisuuden variaatio on tutkitun ominaisuuden olemassaolo tai puuttuminen perusjoukon yksiköissä. Kvantitatiivisesti vaihtoehtoisen attribuutin vaihtelua ilmaistaan ​​kahdella arvolla: tutkitun ominaisuuden läsnäolo yksikössä on merkitty ykkösellä (1) ja sen puuttuminen nollalla (0). Niiden yksiköiden osuus, joilla on tutkittava ominaisuus, on merkitty P:llä ja osuus yksiköistä, joilla ei ole tätä ominaisuutta, on merkitty G. Siten vaihtoehtoisen attribuutin varianssi on yhtä suuri kuin niiden yksiköiden osuuden tulo, joilla on tietty ominaisuus (P) niiden yksiköiden osuudella, joilla ei ole tätä ominaisuutta. (G). Suurin väestön vaihtelu saavutetaan tapauksissa, joissa väestön osalla, joka on 50 % väestön kokonaisvolyymista, on piirre ja toisella osalla väestöstä, joka on myös 50 %, ei ole Tämä ominaisuus, kun varianssi saavuttaa maksimiarvon 0,25, m .e. P = 0,5, G= 1 - P \u003d 1 - 0,5 \u003d 0,5 ja o 2 \u003d 0,5 0,5 \u003d 0,25. Tämän indikaattorin alaraja on nolla, mikä vastaa tilannetta, jossa aggregaatissa ei ole vaihtelua. Vaihtoehtoisen ominaisuuden varianssin käytännön sovellus on luottamusvälien rakentaminen otoshavaintoja suoritettaessa.

Mitä pienempi varianssi ja keskihajonta, sitä homogeenisempi populaatio ja sitä tyypillisempi keskiarvo on. Tilastokäytännössä on usein tarpeen vertailla eri ominaisuuksien muunnelmia. On mielenkiintoista verrata esimerkiksi työntekijöiden iän ja pätevyyden, palvelusajan ja palkkojen, kustannusten ja tuottojen, palvelusajan ja työn tuottavuuden vaihteluita jne. Tällaisiin vertailuihin ominaisuuksien absoluuttisen vaihtelun indikaattorit eivät sovellu: työkokemuksen vaihtelua vuosina ilmaistuna on mahdotonta verrata ruplissa ilmaistuun palkkojen vaihteluun. Tällaisten vertailujen sekä saman attribuutin vaihtelujen vertailuun useissa populaatioissa eri aritmeettisilla keskiarvoilla käytetään variaatioindikaattoreita - oskillaatiokerrointa, lineaarista variaatiokerrointa ja variaatiokerrointa, jotka osoittavat ääriarvojen vaihtelut keskiarvon ympärillä.

Värähtelykerroin:

missä V R - värähtelykertoimen arvo; R- vaihtelualueen arvo; X -

Lineaarinen variaatiokerroin".

missä vj- lineaarisen variaatiokertoimen arvo; minä- keskimääräisen lineaarisen poikkeaman arvo; X - piirteen keskiarvo tutkittavalle populaatiolle.

Variaatiokerroin:

missä Va- variaatiokertoimen arvo; a - keskihajonnan arvo; X - piirteen keskiarvo tutkittavalle populaatiolle.

Värähtelykerroin on vaihtelualueen prosenttiosuus tutkittavan ominaisuuden keskiarvosta ja lineaarinen variaatiokerroin on keskimääräisen lineaarisen poikkeaman suhde tutkittavan ominaisuuden keskiarvoon prosentteina ilmaistuna. Variaatiokerroin on keskihajonnan prosenttiosuus tutkittavan ominaisuuden keskiarvosta. Suhteellisena arvona, prosentteina ilmaistuna, variaatiokerrointa käytetään vertaamaan eri ominaisuuksien vaihteluastetta. Variaatiokertoimen avulla arvioidaan tilastollisen perusjoukon homogeenisuus. Jos variaatiokerroin on alle 33 %, tutkittava populaatio on homogeeninen ja variaatio heikko. Jos variaatiokerroin on suurempi kuin 33 %, tutkittava populaatio on heterogeeninen, vaihtelu on voimakasta ja keskiarvo on epätyypillinen, eikä sitä voida käyttää tämän populaation yleistävänä indikaattorina. Lisäksi variaatiokertoimien avulla verrataan yhden ominaisuuden vaihtelua eri populaatioissa. Esimerkiksi kahden yrityksen työntekijöiden palvelusajan vaihtelujen arvioimiseksi. Mitä suurempi kertoimen arvo on, sitä merkittävämpi on ominaisuuden vaihtelu.

Laskettujen kvartiilien perusteella on mahdollista laskea myös neljännesvuosittaisen vaihtelun suhteellinen indikaattori kaavalla

missä Q 2 ja

Interkvartiilialue määritetään kaavalla

Kvartiilipoikkeamaa käytetään vaihtelualueen sijasta ääriarvojen käyttöön liittyvien haittojen välttämiseksi:

Epäyhdenvälisille variaatiosarjoille lasketaan myös jakautumistiheys. Se määritellään vastaavan taajuuden tai taajuuden osamääränä jaettuna intervalliarvolla. Epätasa-arvoisissa sarjoissa käytetään absoluuttisia ja suhteellisia jakautumistiheyksiä. Absoluuttinen jakautumistiheys on taajuus intervallin pituusyksikköä kohti. Suhteellinen jakautumistiheys - taajuus intervallin pituutta kohti.

Kaikki yllä oleva pätee jakaumasarjoihin, joiden jakaumalaki on hyvin kuvattu normaalijakauman lailla tai on lähellä sitä.