Tilastollisen analyysin menetelmät. Tietojen analyysi: tilastolliset tutkimusmenetelmät

Lähetä hyvä työsi tietokanta on yksinkertainen. Käytä alla olevaa lomaketta

Opiskelijat, jatko-opiskelijat, nuoret tutkijat, jotka käyttävät tietopohjaa opinnoissaan ja työssään, ovat sinulle erittäin kiitollisia.

Isännöi osoitteessa http://www.allbest.ru/

  • 3. Dynamiikkasarja
  • Kirjallisuus

1. Absoluuttiset ja suhteelliset arvot

Yhteenvedon ja ryhmittelyn tuloksena tilastollinen materiaali tutkijan käsissä on monipuolisin tieto tutkituista ilmiöistä ja prosesseista. Saavutettuihin tuloksiin jääminen olisi kuitenkin suuri virhe, koska myös annettujen kriteerien mukaan ryhmiteltynä ja taulukko- tai graafisessa muodossa heijastettuina nämä tiedot ovat silti vain eräänlainen esimerkki, välitulos, joka on analysoitava - tässä tapauksessa tilastollinen. Tilastollinenanalyysi - Tämä esitys opiskellut esine sisään laatu paloiteltu järjestelmät, nuo. monimutkainen elementtejä ja liitännät, tuottaa sisään hänen vuorovaikutusta Luomu koko.

Tällaisen analyysin tuloksena tutkittavasta kohteesta tulisi rakentaa malli, ja koska puhumme tilastoista, mallia rakennettaessa tulisi käyttää tilastollisesti merkittäviä elementtejä ja suhteita.

Itse asiassa tilastollisen analyysin tarkoituksena on tunnistaa tällaisia ​​merkittäviä elementtejä ja suhteita.

Ehdotonindikaattoreita(arvot) - kokonaisarvot, jotka on laskettu tai otettu tilastollisista yhteenvetoraporteista ilman muunnoksia. Absoluuttiset indikaattorit ovat aina nimellisiä ja heijastuvat tilastollista havainnointiohjelmaa laadittaessa asetettuihin mittayksiköihin (vireille pantujen rikosasioiden määrä, tehtyjen rikosten määrä, avioerojen määrä jne.).

Absoluuttiset indikaattorit ovat perustavanlaatuisia kaikelle muulle tilastotoiminnalle, mutta itse niistä ei ole juurikaan hyötyä analysoinnissa. Esimerkiksi absoluuttisesti mitattuna rikollisuuden tasoa on vaikea arvioida eri kaupungit tai alueita, ja on käytännössä mahdotonta vastata kysymykseen, missä rikollisuus on korkeampaa ja missä vähemmän, koska kaupungit tai alueet voivat vaihdella merkittävästi väestön, alueen ja muiden tärkeiden parametrien suhteen.

suhteellinenmääriä tilastoissa ne ovat yleistäviä indikaattoreita, jotka paljastavat kahden vertailukelpoisen tilastoarvon suhteen numeerisen muodon. Suhteellisia arvoja laskettaessa verrataan useimmiten kahta absoluuttista arvoa, mutta sekä keskimääräisiä että suhteellisia arvoja voidaan verrata, jolloin saadaan uusia suhteellisia indikaattoreita. Yksinkertaisin esimerkki suhteellisen arvon laskemisesta on vastaus kysymykseen: kuinka monta kertaa yksi luku on suurempi kuin toinen?

Alkaen tarkastella suhteellisia arvoja, on tarpeen ottaa huomioon seuraava. Periaatteessa mitä tahansa voi verrata, jopa A4-paperiarkin lineaarisia mittoja Lomonosovin posliinitehtaan valmistamien tuotteiden määrään. Tällainen vertailu ei kuitenkaan anna meille mitään. Suhteellisten määrien hedelmällisen laskennan tärkein ehto voidaan muotoilla seuraavasti:

1. Vertailusuureiden mittayksiköiden on oltava samat tai melko vertailukelpoisia. Rikosten, rikosasioiden ja tuomittujen määrät ovat korreloivia indikaattoreita, ts. liittyvät, mutta eivät vertailukelpoisia mittayksiköiden suhteen. Yhdessä rikosasiassa voidaan tarkastella useita rikoksia ja tuomita joukko henkilöitä; Useat tuomitut voivat tehdä yhden rikoksen ja päinvastoin yksi tuomittu voi tehdä useita tekoja. Rikosten, tapausten ja tuomioiden määrät ovat vertailukelpoisia saman vuoden väestön, rikosoikeusjärjestelmän henkilöstön, ihmisten elintasoon ja muihin tietoihin. Lisäksi yhden vuoden sisällä tarkasteltavat indikaattorit ovat melko vertailukelpoisia keskenään.

2. Vertailukelpoisten tietojen on välttämättä vastattava toisiaan niiden vastaanottamisajan tai -alueen tai molempien osalta.

Ehdoton arvo, kanssa mikä verrattuna muu sisäänenaamarit, nimeltään perusta tai pohja vertailut, a vertaillajaveistetty indikaattori - suuruus vertailuja. Esimerkiksi laskettaessa Venäjän rikollisuuden dynamiikan suhdetta vuosina 2000-2010. Vuoden 2000 tiedot ovat lähtötasoa. Ne voidaan ottaa yksikkönä (siis suhteellinen arvo ilmaistaan ​​kertoimena), per 100 (prosenttina). Vertailuarvojen ulottuvuudesta riippuen valitaan sopivin, suuntaa-antava ja visuaalinen suhteellisen arvon ilmaisumuoto.

Jos vertailtava arvo on paljon suurempi kuin kanta, tuloksena oleva suhde ilmaistaan ​​parhaiten kertoimilla. Esimerkiksi rikollisuus tietyllä ajanjaksolla (vuosina) lisääntyi 2,6-kertaiseksi. Ilmaisu kertaa tässä tapauksessa on suuntaa-antavampi kuin prosentteina. Prosentteina suhteelliset arvot ilmaistaan, kun vertailuarvo ei juurikaan poikkea perustasta.

Tilastoissa, myös juridisissa, käytetyt suhteelliset arvot ovat eri tyyppejä. Oikeustilastoissa käytetään seuraavan tyyppisiä suhteellisia arvoja:

1. väestörakenteen luonteenomaiset suhteet tai jakautumissuhteet;

2. osan suhde kokonaisuuteen tai intensiteetin suhde;

3. dynamiikkaa kuvaavat suhteet;

4. asteen ja vertailun suhteet.

Suhteellinensuuruusjakelu - Tämä suhteellinen arvo, ilmaistaan sisään prosenttia yksilöllinen osat aggregaatteja opiskellut ilmiöitä(rikokset, rikolliset, siviiliasiat, oikeusjutut, syyt, ehkäisevät toimenpiteet jne.) kohtaan niitä yleistä kaikki yhteensä, hyväksytty takana 100% . Tämä on yleisin (ja yksinkertaisin) tilastoissa käytetty suhteellinen data. Näitä ovat esimerkiksi rikollisuuden rakenne (rikostyypeittäin), tuomioiden rakenne (rikostyypeittäin, tuomittujen iän mukaan) jne.

tilastollisen analyysin itseisarvo

Asenneintensiteetti(osien suhde kokonaisuuteen) - yleistävä suhteellinen arvo, joka heijastaa tietyn ominaisuuden esiintyvyyttä havaitussa aggregaatteja.

Yleisin oikeustilastoissa käytetty intensiteetin mittari on rikollisuuden intensiteetti. . Rikollisuuden intensiteetti heijastuu yleensä rikollisuuden määrään , nuo. rikosten määrä 100 tai 10 tuhatta asukasta kohden.

KP \u003d (P * 100000) / N

missä P - absoluuttinen luku rekisteröityjä rikoksia, H on väestön absoluuttinen lukumäärä.

Kuten edellä mainittiin, tällaisten indikaattoreiden laskentamahdollisuuden määräävä edellytys on, että kaikki käytetyt absoluuttiset indikaattorit otetaan yhdeltä alueelta ja yhdeltä ajanjaksolta.

Suhteet,luonteenomaistadynamiikka, edustaa yleistää suhteellinen määrät, näytetään muuttaa sisään aika nuo tai muu indikaattoreita laillinen tilastot. Aikaväliksi otetaan yleensä vuosi.

Kanta (kanta) 1 tai 100 %:ksi otetaan tieto tietyn vuoden tutkitusta piirteestä, joka oli jotain tutkittavalle ilmiölle ominaista. Perusvuoden tiedot toimivat kiinteänä kantana, johon seuraavien vuosien tunnusluvut on prosenttiostettu.

Tilastolliset analyysitehtävät vaativat usein vuosittaisia ​​(tai muilla ajanjaksoilla) vertailuja pohja hyväksytty tiedot kaikki Edellinen vuoden(kuukausi tai muu ajanjakso). Tällaista pohjaa kutsutaan mobiili. Tätä käytetään yleensä aikasarjojen (dynamiikan sarja) analysoinnissa.

Suhteettutkinnonjavertailuja voit vertailla eri indikaattoreita tunnistaaksesi, mikä arvo on paljon suurempi kuin toinen, missä määrin yksi ilmiö eroaa toisesta tai on sen kanssa samankaltainen, mikä on yhteistä ja erilaista havaituissa tilastollisissa prosesseissa jne.

Indeksi on erityisesti luotu suhteellinen vertailuindikaattori (ajassa, tilassa, verrattuna ennusteeseen jne.), joka näyttää kuinka monta kertaa tutkittavan ilmiön taso joissain olosuhteissa poikkeaa saman ilmiön tasosta muissa olosuhteissa. ehdot. Yleisimmät indeksit ovat taloustilastoissa, vaikka niillä on myös tietty rooli oikeudellisten ilmiöiden analysoinnissa.

Indeksit ovat välttämättömiä tapauksissa, joissa on tarpeen verrata erilaisia ​​indikaattoreita, joiden yksinkertainen summaus on mahdotonta. Siksi indeksit määritellään yleensä nimellä numerot-indikaattoritvartenmitatkeskelläkaiuttimetaggregaattejaheterogeeninenelementtejä.

Tilastoissa indeksit merkitään yleensä kirjaimella I (i). Iso kirjain tai pääoma - riippuu siitä, puhummeko yksittäisestä (yksityisestä) indeksistä vai onko se yleinen.

Yksilöllinenindeksit i) kuvastavat kuluvan jakson indikaattorin suhdetta vertailujakson vastaavaan indikaattoriin.

Konsolidoituindeksit Niitä käytetään monimutkaisten sosioekonomisten ilmiöiden korrelaatioiden analysoinnissa ja ne koostuvat kahdesta osasta: todellisesta indeksoidusta arvosta ja yhteismittauksesta ("paino").

2. Keskiarvot ja niiden soveltaminen oikeustilastossa

Absoluuttisten ja suhteellisten indikaattoreiden käsittelyn tulos on jakaumasarjojen rakentaminen. Rivi jakelu - Tämätilattupäällälaatutaimäärällinenesilläjakeluyksiköitäaggregaatteja. Näiden sarjojen analyysi on kaiken tilastollisen analyysin perusta riippumatta siitä, kuinka monimutkaiseksi se tulevaisuudessa osoittautuu.

Jakelusarja voidaan rakentaa laadullisten tai määrällisten ominaisuuksien perusteella. Ensimmäisessä tapauksessa sitä kutsutaan attribuutio, toisessa - vaihtelevaa. Tässä tapauksessa kvantitatiivisen ominaisuuden eroa kutsutaan vaihtelua ja itse tämä merkki - vaihtoehto. Oikeustilastot joutuvat useimmiten käsittelemään vaihtelusarjoja.

Variaatiosarja koostuu aina kahdesta sarakkeesta (kaavio). Yksi osoittaa kvantitatiivisen attribuutin arvon nousevassa järjestyksessä, joita itse asiassa kutsutaan optioiksi, jotka on ilmoitettu x. Toinen sarake (sarake) ilmoittaa yhdelle tai toiselle muunnelmalle ominaisten yksiköiden lukumäärän. Niitä kutsutaan taajuuksiksi ja ne merkitään latinalaisella kirjaimella f.

Taulukko 2.1

Vaihtoehto x

Taajuus f

Jonkin tai toisen piirteen ilmenemistiheys on erittäin tärkeä laskettaessa muita merkittäviä tilastollisia indikaattoreita, eli keskiarvoja ja vaihteluindikaattoreita.

Variaatiosarja puolestaan ​​voi olla diskreetti tai intervalli. Diskreettisarjat rakennetaan nimensä mukaisesti diskreetisti vaihtelevien ominaisuuksien perusteella ja intervallisarjat jatkuvan muunnelman perusteella. Joten esimerkiksi rikollisten ikäjakauma voi olla joko diskreetti (18, 19,20 vuotta vanha jne.) tai jatkuva (enintään 18-vuotiaille, 18-25-vuotiaille, 25-30-vuotiaille jne.). Lisäksi itse intervallisarjat voidaan rakentaa sekä diskreetin että mukaan jatkuva periaate. Ensimmäisessä tapauksessa vierekkäisten intervallien rajat eivät toistu; esimerkissämme välit näyttävät tältä: 18-vuotiaisiin asti, 18-25, 26-30, 31-35 jne. Sellaista sarjaa kutsutaan jatkuvadiskreettirivi. intervallirivikanssajatkuvavaihtelua olettaa edellisen intervallin ylärajan yhteensopivuuden kanssa alaraja myöhemmin.

Ensimmäinen vaihtelusarjaa kuvaava indikaattori on keskikokoinen määriä. Niillä on tärkeä rooli oikeustilastoissa, koska vain heidän avullaan voidaan luonnehtia populaatioita kvantitatiivisen muuttujan merkin avulla, jolla niitä voidaan verrata. Keskiarvojen avulla voidaan verrata meitä kiinnostavien oikeudellisesti merkittävien ilmiöiden joukkoja tiettyjen määrällisten ominaisuuksien mukaan ja tehdä näistä vertailuista tarvittavat johtopäätökset.

Keskikokoinenmääriä heijastaa suurin osa yleistä trendi (säännöllisyys), joka liittyy koko tutkittujen ilmiöiden joukkoon. Se ilmenee mm tyypillinen määrällinen ominaisuus, ts. kaikkien saatavilla olevien (muuttuvien) indikaattoreiden keskiarvossa.

Tilastot on kehittänyt monenlaisia ​​keskiarvoja: aritmeettisia, geometrisia, kuutioisia, harmonisia jne. Niitä ei kuitenkaan käytännössä käytetä oikeustilastoissa, joten tarkastelemme vain kahdenlaisia ​​keskiarvoja - aritmeettista keskiarvoa ja geometrista keskiarvoa.

Yleisin ja tunnetuin keskiarvo on keskivertoaritmeettinen. Sen laskemiseksi lasketaan indikaattoreiden summa ja jaetaan se kokonaismäärä indikaattoreita. Esimerkiksi 4 hengen perheeseen kuuluu 38- ja 40-vuotiaat vanhemmat sekä kaksi 7- ja 10-vuotiasta lasta. Laskemme yhteen ikä: 38 + 40 + 7 + 10 ja jaamme tuloksena saatu summa 95 4:llä. keskimääräinen ikä perhe - 23,75 vuotta. Tai lasketaanpa tutkijoiden keskimääräinen kuukausittainen työmäärä, jos 8 hengen osasto ratkaisee 25 tapausta kuukaudessa. Jaa 25 kahdeksalla ja saat 3 125 tapausta kuukaudessa per tutkija.

Oikeustilastoissa aritmeettista keskiarvoa käytetään laskettaessa työntekijöiden (tutkijat, syyttäjät, tuomarit jne.) työtaakkaa, laskettaessa absoluuttista rikollisuuden kasvua, laskettaessa otosta jne.

Yllä olevassa esimerkissä keskimääräinen kuukausittainen työmäärä tutkijaa kohti laskettiin kuitenkin väärin. Tosiasia on, että yksinkertainen aritmeettinen keskiarvo ei ota huomioon taajuus tutkittu piirre. Esimerkissämme tutkijan keskimääräinen kuukausittainen työmäärä on yhtä oikea ja informatiivinen kuin tunnetun anekdootin "sairaalan keskilämpötila", joka, kuten tiedätte, on huoneenlämpö. Jotta tutkitun piirteen ilmenemistiheys otettaisiin huomioon laskettaessa aritmeettista keskiarvoa, sitä käytetään seuraavasti keskivertoaritmeettinenpainotettu tai diskreettien variaatiosarjojen keskiarvo. (Diskreetti variaatiosarja - merkin muutossekvenssi diskreettien (epäjatkuvien) indikaattoreiden mukaan).

Aritmeettinen painotettu keskiarvo ( painotettu keskiarvo) ei eroa yksinkertaisesta aritmeettisesta keskiarvosta. Siinä saman arvon summaus korvataan kertomalla tämä arvo sen taajuudella, ts. tässä tapauksessa jokainen arvo (muunnelma) painotetaan esiintymistiheydellä.

Joten laskettaessa tutkijoiden keskimääräistä työmäärää meidän on kerrottava tapausten määrä niiden tutkijoiden lukumäärällä, jotka ovat tutkineet juuri tämän määrän tapauksia. Tällaiset laskelmat on yleensä kätevää esittää taulukoiden muodossa:

Taulukko 2.2

Tapausten määrä

(vaihtoehto X)

Tutkijoiden lukumäärä (taajuus f)

Taideteos vaihtoehto

taajuuksille ( Xf)

2. Laske todellinen painotettu keskiarvo kaavalla:

missä x- rikosasioiden määrä ja f- tutkijoiden määrä.

Painotettu keskiarvo ei siis ole 3,125, vaan 4,375. Jos ajattelee, niin sen kuuluukin olla: jokaisen yksittäisen tutkijan kuormitus kasvaa, koska yksi hypoteettisen osastomme tutkija osoittautui joutilaiseksi - tai päinvastoin, hän tutki erityisen tärkeää ja monimutkainen tapaus. Mutta kysymystä tilastollisen tutkimuksen tulosten tulkinnasta pohditaan seuraava aihe. Joissakin tapauksissa, nimittäin ryhmitettyjen taajuuksien tapauksessa diskreetti jakelu- Keskiarvon laskeminen ei ensi silmäyksellä ole ilmeinen. Oletetaan, että meidän on laskettava aritmeettinen keskiarvo huliganismista tuomittujen henkilöiden jakautumiselle iän mukaan. Jakauma näyttää tältä:

Taulukko 2.3

(vaihtoehto X)

Tuomittujen lukumäärä (taajuus f)

Välin keskipiste

Taideteos vaihtoehto

taajuuksille ( Xf)

(21-18) /2+18=19,5

Lisäksi keskiarvo lasketaan yleissäännön mukaan ja on 23,6 vuotta tälle diskreetille sarjalle. Kun kyseessä on ns. avoimet rivit, toisin sanoen tilanteissa, joissa äärivälit määräytyvät "vähemmän kuin x" tai enemmän x", äärivälien arvo asetetaan samalla tavalla kuin muutkin välit.

3. Dynamiikkasarja

Tilastojen tutkimat yhteiskunnalliset ilmiöt ovat mukana jatkuvaa kehitystä ja muuttaa. Sosiooikeudelliset indikaattorit voidaan esittää paitsi staattisessa muodossa, heijastaen tiettyä ilmiötä, myös ajassa ja tilassa tapahtuvana prosessina sekä tutkittavien ominaisuuksien vuorovaikutuksen muodossa. Toisin sanoen aikasarjat näyttävät piirteen kehittymisen, ts. sen muutos ajassa, tilassa tai ympäristöolosuhteiden mukaan.

Tämä sarja on sarja keskiarvoja tiettyinä ajanjaksoina (jokaiselle kalenterivuodelle).

Yhteiskunnallisten ilmiöiden syvempään tutkimiseen ja niiden analysointiin ei riitä pelkkä dynamiikkasarjan tasojen vertailu, vaan on tarpeen laskea johdetut indikaattorit sarjasta dynamiikkaa: absoluuttinen kasvu, kasvunopeus, kasvunopeus, keskiarvo kasvu ja kasvuvauhti, absoluuttinen sisältö yhden prosentin kasvua.

Dynamiikkasarjan indikaattoreiden laskenta suoritetaan niiden tasojen vertailun perusteella. Tässä tapauksessa on kaksi tapaa verrata dynaamisen sarjan tasoja:

perusindikaattoreita, kun kaikkia myöhempiä tasoja verrataan johonkin perustana otettuun alkutasoon;

ketjuindikaattoreita, kun dynamiikkasarjan jokaista seuraavaa tasoa verrataan edelliseen.

Absoluuttinen kasvu osoittaa, kuinka monta yksikköä nykyisen jakson taso on enemmän tai vähemmän kuin perus- tai edellisen jakson taso tietyltä ajanjaksolta.

Absoluuttinen kasvu (P) lasketaan vertailutasojen välisenä erona.

Perusabsoluuttinen kasvu:

P b = y i - y pohjat . (f.1).

Ketjun absoluuttinen kasvu:

P c = y i - y i -1 (f.2).

Kasvunopeus (Tr) näyttää kuinka monta kertaa (millä prosenteilla) nykyisen jakson taso on enemmän tai vähemmän kuin perus- tai edellisen jakson taso:

Peruskasvu:

(f.3)

Ketjun kasvunopeus:

(f.4)

Kasvuvauhti (Tpr) näyttää kuinka monta prosenttia nykyisen jakson taso on enemmän tai vähemmän kuin vertailun perustana käytetyn perus- tai edellisen kauden taso, ja se lasketaan absoluuttisen kasvun suhteeksi absoluuttiseen tasoon. , otettu pohjana.

Kasvuvauhti voidaan laskea myös vähentämällä kasvuvauhdista 100 %.

Peruskasvu:

tai (f.5)

Ketjun kasvunopeus:

tai (f.6)

Keskimääräinen kasvunopeus lasketaan dynamiikan sarjan kasvunopeuksien geometrisen keskiarvon kaavalla:

(lomake 7)

missä on keskimääräinen kasvuvauhti;

- tiettyjen ajanjaksojen kasvuvauhti;

n- kasvulukujen määrä.

Samanlaiset ongelmat, joiden juurieksponentti on suurempi kuin kolme, ratkaistaan ​​yleensä logaritmilla. Algebrasta tiedetään, että juuren logaritmi on yhtä suuri kuin logaritmi juuriarvo jaettuna juurieksponentilla ja että logaritmi useiden tekijöiden tulosta on yhtä suuri kuin summa näiden tekijöiden logaritmit.

Siten keskimääräinen kasvunopeus lasketaan ottamalla juuri n tutkinnon yksilön teoksista n- ketjun kasvuvauhti. Keskimääräinen kasvunopeus on ero keskimääräisen kasvunopeuden ja yhden (), tai 100 %:n välillä, kun kasvunopeus ilmaistaan ​​prosentteina:

tai

Dynaamisen sarjan puuttuessa keskitasot keskimääräinen kasvu ja kasvunopeus määritetään seuraavalla kaavalla:

(f.8)

missä on dynaamisen sarjan viimeinen taso;

- dynaamisen sarjan alkutaso;

n - tasojen lukumäärä (päivämäärät).

On selvää, että kaavoilla (f.7 ja f.8) lasketuilla keskimääräisten kasvun ja kasvun indikaattoreilla on samat numeeriset arvot.

1 %:n kasvun absoluuttinen sisältö osoittaa, mikä absoluuttinen arvo sisältää 1 %:n kasvun, ja se lasketaan absoluuttisen kasvun suhteeksi kasvuvauhtiin.

1 %:n lisäyksen absoluuttinen pitoisuus:

perus: (f.9)

ketju: (f.10)

Laskenta ja analyysi absoluuttinen arvo jokainen prosentuaalinen korotus edistää syvempää ymmärrystä tutkittavan ilmiön kehityksen luonteesta. Esimerkkimme tiedot osoittavat, että huolimatta kasvuvauhdin vaihteluista ja kasvusta yli yksittäisiä vuosia 1 %:n kasvun absoluuttisen sisällön perusindikaattorit pysyvät ennallaan, kun taas ketjuindikaattorit, jotka kuvaavat yhden prosentin kasvun itseisarvon muutoksia jokaisena seuraavana vuonna edelliseen verrattuna, kasvavat jatkuvasti.

Aikasarjoja laadittaessa, prosessoitaessa ja analysoitaessa on usein tarve määrittää tutkittujen ilmiöiden keskimääräiset tasot tietyiltä ajanjaksoilta. Keskimääräinen kronologinen intervallisarja lasketaan tasavälein aritmeettisen keskiarvon yksinkertaisen kaavalla, epätasaisilla väliajoilla - aritmeettisella painotetulla keskiarvolla:

missä - keskitaso intervalli sarja;

- sarjan alkutasot;

n- tasojen lukumäärä.

Dynaamisten hetkien sarjalle, edellyttäen, että päivämäärien väliset aikavälit ovat yhtä suuret, keskimääräinen taso lasketaan kronologisen keskiarvon kaavalla:

(f.11)

missä on keskimääräinen kronologinen arvo;

y 1 ,., y n- sarjan absoluuttinen taso;

n - dynamiikkasarjan absoluuttisten tasojen lukumäärä.

Dynaamisten momenttisarjan tasojen keskimääräinen kronologinen arvo on yhtä suuri kuin tämän sarjan indikaattoreiden summa jaettuna niiden indikaattoreiden lukumäärällä, joilla ei ole yhtä; tässä tapauksessa alku- ja lopputasot tulisi ottaa puoleen, koska päivämäärien (hetkien) määrä on yleensä yksi enemmän kuin jaksojen lukumäärä.

Riippuen lähtötietojen sisällöstä ja esitysmuodosta (dynamiikan aikaväli tai momenttisarja, yhtä suuret tai ei lainkaan aikavälejä) laskea erilaisia sosiaalisia indikaattoreita Esimerkiksi rikosten ja rikkomusten keskimääräinen vuotuinen lukumäärä (tyypeittäin), käyttöpääoman keskimääräinen koko, rikollisten keskimääräinen määrä jne. käyttävät sopivia analyyttisiä ilmaisuja.

4. Tilastolliset menetelmät keskinäisiä suhteita

Aiemmissa kysymyksissä pohdimme, jos saan sanoa, "yksiulotteisten" jakaumien - variaatiosarjojen - analyysiä. Tämä on erittäin tärkeä, mutta kaukana ainoa tilastollisen analyysin tyyppi. Variaatiosarjojen analyysi on perusta "kehittyneemmille" tilastollisille analyysityypeille, pääasiassa opiskellayhteenliitännät. Sellaisen tutkimuksen tuloksena paljastuvat ilmiöiden väliset syy-seuraussuhteet, joiden avulla voidaan määrittää, mitkä merkkien muutokset vaikuttavat tutkittujen ilmiöiden ja prosessien vaihteluihin. Samaan aikaan merkkejä, jotka aiheuttavat muutoksen muissa, kutsutaan faktoriaalisiksi (tekijöiksi), ja merkkejä, jotka muuttuvat niiden vaikutuksesta, kutsutaan tehokkaiksi.

Tilastotieteen välillä on kahdentyyppisiä suhteita erilaisia ​​merkkejä ja niiden tiedot - toiminnallinen yhteys (jäykästi määritetty) ja tilastollinen (stokastinen).

varten toimivaliitännät tunnusomaista on täysi vastaavuus tekijämääritteen muutoksen ja efektiivisen arvon muutoksen välillä. Tämä suhde ilmenee yhtäläisesti minkä tahansa populaation kaikissa yksiköissä. Yksinkertaisin esimerkki: lämpötilan nousu heijastuu lämpömittarin elohopean tilavuuteen. Tässä tapauksessa ympäristön lämpötila toimii tekijänä ja elohopean tilavuus - tehokkaana ominaisuutena.

Toiminnalliset suhteet ovat tyypillisiä kemian, fysiikan ja mekaniikan tutkimille ilmiöille, joissa on mahdollista tehdä "puhtaita" kokeita, joissa ulkopuolisten tekijöiden vaikutus eliminoidaan. Tosiasia on, että toimiva yhteys näiden kahden välillä on mahdollista vain, jos toinen arvo (tuloksena oleva attribuutti) riippuu vain ja yksinomaan ensimmäisestä. Julkisissa tilaisuuksissa tämä on erittäin harvinaista.

Sosio-oikeudelliset prosessit, jotka ovat seurausta samanaikaisesta vaikutuksesta suuri numero tekijöitä kuvataan tilastollisten suhteiden eli suhteiden avulla stokastisesti (sattumalta) deterministinen kun yhden muuttujan eri arvot vastaavat toisen muuttujan eri arvoja.

Stokastisen riippuvuuden tärkein (ja yleisin) tapaus on korrelaatioriippuvuus. Tällaisella riippuvuudella syy ei määrittele seurausta yksiselitteisesti, vaan vain tietyllä todennäköisyydellä. Tällaisten suhteiden tunnistamiseen on omistettu erillinen tilastollinen analyysi - korrelaatioanalyysi.

Main tehtävä korrelaatioanalyysi - tiukasti matemaattisten menetelmien perusteella kvantitatiivisen ilmaisun luomiseksi tutkittujen ominaisuuksien välisestä suhteesta. On olemassa useita lähestymistapoja siihen, miten korrelaatio lasketaan tarkasti, ja vastaavasti useita korrelaatiokertoimien tyyppejä: ehdollisuuskerroin A.A. Chuprov (laadullisten piirteiden välisen suhteen mittaamiseksi), K. Pearsonin assosiaatiokerroin sekä Spearmanin ja Kendallin rankkorrelaatiokertoimet. Yleensä tällaiset kertoimet osoittavat, millä todennäköisyydellä tutkitut suhteet ilmaantuvat. Vastaavasti mitä suurempi kerroin, sitä selvempi on piirteiden välinen suhde.

Tutkittujen tekijöiden välillä voi olla sekä suoria että käänteisiä korrelaatioita. Suoraankorrelaatioriippuvuus havaitaan tapauksissa, joissa tekijän arvojen muutos vastaa samoja muutoksia tuloksena olevan attribuutin arvossa, eli kun tekijäattribuutin arvo kasvaa, myös tehokkaan attribuutin arvo kasvaa, ja vice päinvastoin. Esimerkiksi kriminogeenisten tekijöiden ja rikollisuuden välillä on suora yhteys ("+"-merkillä). Jos yhden attribuutin arvojen nousu aiheuttaa käänteisiä muutoksia toisen attribuutin arvoissa, niin tällaista suhdetta kutsutaan käänteinen. Esimerkiksi mitä korkeampi sosiaalinen kontrolli yhteiskunnassa, sitä pienempi rikollisuusaste (yhteys "-"-merkkiin).

Sekä suora että palaute voivat olla suoria ja kaarevia.

Suoraviivainen ( lineaariset) suhteet ilmenevät, kun attribuuttitekijän arvojen kasvaessa attribuutti-seurauksen arvo kasvaa (suora) tai vähenee (käänteinen). Matemaattisesti tällainen suhde ilmaistaan ​​regressioyhtälöllä: klo = a + bX, missä klo - merkki-seuraus; a ja b - vastaavat kytkentäkertoimet; X - merkki-tekijä.

Kaareva liitännät ovat erilaisia. Tekijämääritteen arvon kasvulla on epätasainen vaikutus tuloksena olevan attribuutin arvoon. Aluksi tämä suhde voi olla suora ja sitten käänteinen. Tunnettu esimerkki on rikosten suhde rikoksentekijöiden ikään. Ensinnäkin yksilöiden rikollinen toiminta kasvaa suoraan suhteessa rikoksentekijöiden iän nousuun (noin 30 vuoteen asti), ja sitten iän kasvaessa rikollinen toiminta vähenee. Lisäksi rikollisten ikäjakaumakäyrän huippu on siirtynyt keskiarvosta vasemmalle (nuorempaa ikää kohti) ja on epäsymmetrinen.

Korrelaatio suorat linkit voivat olla yksinointekijällinen, kun tutkitaan yhden merkkitekijän ja yhden merkkiseurauksen välistä suhdetta (parikorrelaatio). Ne voivat myös olla monitekijäinen, kun tutkitaan monien vuorovaikutuksessa olevien merkkien-tekijöiden vaikutusta merkki-seuraamukseen (moninkertainen korrelaatio).

Mutta riippumatta siitä, mitä korrelaatiokertoimista käytetään, riippumatta siitä, mitä korrelaatiota tutkitaan, on mahdotonta määrittää merkkien välistä suhdetta pelkästään tilastollisten indikaattoreiden perusteella. Indikaattorien alustava analyysi on aina analyysi laadullinen, jonka aikana ilmiön sosio-oikeudellista luonnetta tutkitaan ja ymmärretään. Tässä tapauksessa käytetään niitä tieteellisiä menetelmiä ja lähestymistapoja, jotka ovat ominaisia ​​tätä ilmiötä tutkivalle tieteenalalle (sosiologia, laki, psykologia jne.). Sitten ryhmittelyjen ja keskiarvojen analysoinnin avulla voit esittää hypoteeseja, rakentaa malleja, määrittää yhteyden tyypin ja riippuvuuden. Vasta tämän jälkeen määritetään riippuvuuden kvantitatiivinen ominaisuus - itse asiassa korrelaatiokerroin.

Kirjallisuus

1. Avanesov G.A. Kriminologisen ennustamisen perusteet. Opetusohjelma. Moskova: Neuvostoliiton sisäministeriön korkeakoulu, 1970.

2. Avrutin K.E., Gilinsky Ya.I. Rikollisuuden kriminologinen analyysi alueella: metodologia, tekniikka, tekniikka. L., 1991.

3. Adamov E. et al. Yritystalous ja tilastot: Oppikirja / Toim. S.D. Ilyenkova. M.: Talous ja tilastot, 2008.

4. Balakina N.N. Tilastot: Proc. -menetelmä. monimutkainen. Habarovsk: IVESEP, sivukonttori Habarovskissa, 2008.

5. Bluvshtein Yu.D., Volkov G.I. Aikasarja Rikollisuus: Opinto-opas. Minsk, 1984.

6. Borovikov V.P., Borovikov I.P. STATISTICA - Tilastollinen analyysi ja tietojenkäsittely Windows-ympäristö. M.: Tiedotus- ja kustantamo "Filin", 1997.

7. Borodin S.V. Rikollisuuden torjunta: teoreettinen malli kattava ohjelma. Moskova: Nauka, 1990.

8. Tilastokysymyksiä // Venäjän federaation valtion tilastokomitean kuukausittainen tieteellinen ja tietolehti M., 2002-2009.

9. Gusarov V.M. Tilastot: Proc. yliopistojen tuki. M.: UNITI-DANA, 2009.

10. Dobrynina N.V., Nimenya I.N. Tilastot: Proc. -menetelmä. korvaus. Pietari: SPbGIEU, 2009.

11. Eliseeva I.I., Yuzbashev M.M. Yleinen teoria tilastot: Oppikirja yliopistoille / Ed.I. I. Eliseeva, 4. painos. M.: Talous ja tilastot, 1999.

12. Eliseeva I.I., Yuzbashev M.M. Yleinen tilastoteoria: Oppikirja. - M.: Talous ja tilastot, 1995.

13. Eremina T., Matyatina V., Plushevskaya Yu. Venäjän talouden sektoreiden kehitysongelmat // Taloustieteen kysymyksiä. 2009. Nro 7.

14. Efimova M.R., Ganchenko O.I., Petrova E.V. Työpaja yleisestä tilastoteoriasta: Proc. 2. painos, tarkistettu. ja ylimääräistä M.: Talous ja tilastot, 2009.

15. Efimova M.R., Petrova E.V., Rumjantsev V.N. Yleinen tilastoteoria: Oppikirja. - M.: INFRA-M, 1998.

16. Kirillov L.A. Kriminologinen tutkimus ja rikosten ehkäisy sisäasioiden elimissä M., 1992.

17. Kosoplechev N.P., Kriminologisen tutkimuksen menetelmät. M., 1984.

18. Lee D.A. Rikollisuus Venäjällä: järjestelmäanalyysi. M., 1997.

19. Lee D.A. Rikostilastollinen kirjanpito: rakenteelliset ja toiminnalliset mallit. M .: Tieto- ja julkaisutoimisto "Russian World", 1998.

20. Makarova N.V., Trofimets V.Ya. Tilastot Excelissä: Proc. korvaus. M.: Talous ja tilastot, 2009.

21. Nesterov L.I. Uusia trendejä kansanvarallisuustilastoissa // Tilastojen kysymyksiä. 2008. Nro 11.

22. Petrova E.V. Liikennetilastojen työpaja: Proc. korvaus. M.: Talous ja tilastot, 2008.

23. Rikollisuus Venäjällä 1990-luvulla ja eräät laillisuuden näkökohdat ja taistelu sitä vastaan. M., 1995.

24. Rikollisuus, tilastot, laki // Toim. prof. A.I. Velka. Moskova: Kriminologinen yhdistys, 1997.

25. Rostov K.T. Rikollisuus Venäjän alueilla (sosiaalinen ja kriminologinen analyysi). Pietari: Venäjän sisäministeriön Pietarin akatemia, 1998.

26. Ohjeet väestönlaskennan tekijälle vuoden 2002 koko Venäjän väestölaskennan ja laskenta-asiakirjojen täyttämisen menettelystä. M.: PIK "Offset", 2003.

27. Savyuk L.K. Oikeustilastot: Oppikirja. M.: Juristi, 1999.

28. Salin V.N., Shpakovskaya E.P. Sosioekonomiset tilastot: Oppikirja yliopistoille. Moskova: Gardanika Lawyer, 2008.

29. Sidenko A.V., Popov G.Yu., Matveeva V.M. Tilastot: Oppikirja. Moskova: Liiketoiminta ja palvelu, 2008.

30. Rikosten sosiaalinen ehkäisy: neuvoja, suosituksia // Toim. JOO. Kerimov. M., 1989.

31. sosiaalitilastot: Oppikirja yliopistoille // Toim. I.I. Eliseeva. 3. painos M.: Talous ja tilastot, 2009.

Isännöi Allbest.ru:ssa

Samanlaisia ​​asiakirjoja

    Tilastollisen analyysin tärkeimpien menetelmien tarkastelu. Tutkimus Kungurskyn kunnallisalueesta. Laskelmien tekeminen vuosikirjan tunnuslukujen mukaan. Alueen väestörakenteen ja sosioekonomisen kehityksen analyysi hakemuksen tulosten perusteella.

    lukukausityö, lisätty 24.6.2015

    Keskiarvo - vapaa ominaisuus prosessin säännöllisyydet olosuhteissa, joissa se tapahtuu. Keskiarvojen laskentamuodot ja menetelmät. Keskiarvojen soveltaminen käytännössä: erottelun laskeminen palkat talouden sektoreiden mukaan.

    lukukausityö, lisätty 12.4.2007

    Avioeroanalyysin tilastolliset menetelmät. Tilastollinen analyysi avioeroista Amurin alueella. Avioerojen dynamiikan ja rakenteen analyysi. Amurin alueen kaupunkien ja piirien ryhmittely avioerojen lukumäärän mukaan vuodessa. Keskiarvojen ja vaihteluindikaattoreiden laskeminen.

    lukukausityö, lisätty 12.4.2014

    Asuntohuollon tilastollisen analyysin näkökohdat. Tilastollisten menetelmien soveltaminen väestön asumisen tarjontaan. Piirien väestön homogeenisuuden analyysi demografisen käyttöasteen suhteen. Korrelaatio-regressioanalyysi.

    lukukausityö, lisätty 18.1.2009

    Organisaatio valtion tilastot Venäjällä. Vaatimukset kerätyille tiedoille. Tilastollisen havainnoinnin muodot, tyypit ja menetelmät. Tilastollisen havainnon valmistelu. Tilastollisen havainnon virheet. Tilastojen seurantamenetelmät.

    tiivistelmä, lisätty 02.12.2007

    Rikosoikeustilastojen seurantaohjelman kehittäminen, sen päävaiheet ja vaatimukset, toteutustavat ja -menettelyt. Tutkimusalueen rikollisuuden tilan määrittäminen. Tilastollisen havainnoinnin tulosten rekisteröintisäännöt.

    testi, lisätty 18.5.2010

    Tilastollisen dokumentaation luokitus. Asiakirjatyypit: kirjalliset, ikonografiset, tilastolliset ja foneettiset. Materiaalien analysointimenetelmät ja -tavat: ei-formalisoitu (perinteinen) ja formalisoitu. Sisältöanalyysin toteuttamismenettely.

    esitys, lisätty 16.2.2014

    konsepti keskikokoinen. Keskiarvojen menetelmä yhteiskunnallisten ilmiöiden tutkimuksessa. Keskiarvojen menetelmän soveltamisen merkityksellisyys sosiaalisten ilmiöiden tutkimuksessa varmistetaan mahdollisuudella siirtyä yksittäisestä yleiseen, satunnaisesta säännölliseen.

    lukukausityö, lisätty 13.1.2009

    Tilastollisen havainnoinnin käsite. Suoraviivaisen ja kaarevan linjan analyysi korrelaatioita. Tutustuminen tilastollisen havainnoinnin kaavoihin ja arvoihin. Indeksien suhteen laskelmien analyysi, histogrammin rakentaminen, jakaumasarjan elementit.

    testi, lisätty 27.3.2012

    Tilastollisen analyysin pääindikaattoreiden ominaisuudet sosiaalinen ehdollisuus kansanterveys sisään Venäjän federaatio. Terveyden arvioinnin tasot sosiaalilääketieteen näkökulmasta. Väestön lapsiosan luokitus terveysryhmittäin.

Riittävän yksityiskohtaisesti kotimaista kirjallisuutta. Sen sijaan venäläisten yritysten käytännössä vain osa niistä on käytössä. Harkitse muutamaa seuraavaksi menetelmiä tilastollinen käsittely.

Yleistä tietoa

Kotimaisten yritysten käytännössä se on pääosin yleistä tilastolliset valvontamenetelmät. Jos puhumme teknologisen prosessin säätelystä, se havaitaan erittäin harvoin. Tilastollisten menetelmien soveltaminen määrätään, että yritykseen muodostetaan ryhmä asiantuntijoita, joilla on asianmukainen pätevyys.

Merkitys

ISO ser. 9000, toimittajan tulee määrittää tarve tilastollisille menetelmille, joita sovelletaan mahdollisuuksien kehittämisen, säätelyn ja testauksen aikana. tuotantoprosessi ja tuotteen ominaisuudet. Käytetyt menetelmät perustuvat todennäköisyysteoriaan ja matemaattisiin laskelmiin. Tilastolliset menetelmät tietojen analysointiin voidaan toteuttaa missä tahansa tuotteen elinkaaren vaiheessa. Ne tarjoavat arvion ja selvityksen tuotteiden heterogeenisyyden asteesta tai niiden ominaisuuksien vaihtelevuudesta suhteessa vahvistettuihin nimellisarvoihin tai vaadittuihin arvoihin sekä sen luomisprosessin vaihteluun. Tilastolliset menetelmät ovat menetelmiä, joilla voit annettua tarkkuutta ja luotettavuus arvioida tutkittavien ilmiöiden tilaa. Niiden avulla voit ennustaa tiettyjä ongelmia, kehittää optimaalisia ratkaisuja tutkittujen faktatietojen, trendien ja mallien perusteella.

Käyttöohjeet

Tärkeimmät alueet, joilla niitä on laajalti tilastolliset menetelmät ovat:


Kehittyneiden maiden käytäntö

Tilastolliset menetelmät ovat perusta, joka varmistaa korkeat kuluttajaominaisuudet omaavien tuotteiden luomisen. Näitä tekniikoita käytetään laajalti teollisuusmaissa. Tilastolliset menetelmät ovat itse asiassa takeita siitä, että kuluttajat saavat tuotteet, jotka täyttävät asetetut vaatimukset. Niiden käytön vaikutus on todistettu käytännössä. teollisuusyritykset Japani. He auttoivat saavuttamaan korkeimman tuotantotason tässä maassa. Pitkäaikainen kokemus ulkomailta osoittaa, kuinka tehokkaita nämä tekniikat ovat. Erityisesti tiedetään, että Hewlelt Packard pystyi tilastollisilla menetelmillä vähentämään avioliittojen määrää kuukaudessa 9 000:sta 45 yksikköön yhdessä tapauksessa.

Toteutuksen vaikeudet

Kotimaisessa käytännössä on useita esteitä, jotka eivät salli käyttöä tilastolliset tutkimusmenetelmät indikaattoreita. Vaikeuksia syntyy seuraavista syistä:


Ohjelman kehittäminen

On sanottava, että tiettyjen tilastomenetelmien tarpeen määrittäminen laadun alalla, tiettyjen tekniikoiden valinta, hallitseminen on melko monimutkaista ja pitkäkestoista työtä mille tahansa kotimaiselle yritykselle. Sen tehokkaaksi toteuttamiseksi on suositeltavaa kehittää erityinen pitkän aikavälin ohjelma. Sen tulisi mahdollistaa sellaisen palvelun muodostaminen, jonka tehtäviin kuuluu organisaation ja metodologinen opas tilastollisten menetelmien soveltaminen. Ohjelman puitteissa on tarpeen varmistaa asianmukaisten teknisten välineiden varustaminen, asiantuntijoiden koulutus ja tuotantotehtävien kokoonpanon määrittäminen, jotka tulisi ratkaista valituilla menetelmillä. Masterointi on suositeltavaa aloittaa käyttämällä yksinkertaisimpia lähestymistapoja. Voit käyttää esimerkiksi hyvin tunnettua perustuotantoa. Tämän jälkeen on suositeltavaa siirtyä muihin menetelmiin. Se voi olla esimerkiksi varianssianalyysiä, tiedon selektiivistä käsittelyä, prosessien säätelyä, tekijätutkimuksen ja kokeiden suunnittelua jne.

Luokitus

Taloudellisen analyysin tilastollisia menetelmiä ovat mm erilaisia ​​temppuja. Tarpeetonta sanoa, että niitä on melko paljon. Japanin johtava laadunhallinnan asiantuntija K. Ishikawa suosittelee kuitenkin seitsemän perusmenetelmän käyttöä:

  1. Pareto-kaaviot.
  2. Tietojen ryhmittely yhteisten ominaisuuksien mukaan.
  3. Ohjauskortit.
  4. Syy-seurauskaaviot.
  5. Histogrammit.
  6. Valvontalevyt.
  7. Scatter kaavioita.

Oman johtamiskokemuksensa perusteella Ishikawa väittää, että 95% kaikista yrityksen ongelmista ja ongelmista voidaan ratkaista käyttämällä näitä seitsemää lähestymistapaa.

Pareto-kaavio

Tämä perustuu tiettyyn suhteeseen. Sitä on kutsuttu "Pareton periaatteeksi". Hänen mukaansa 20 % syistä ilmenee 80 % seurauksista. osoittaa selkeästi ja ymmärrettävästi kunkin seikan suhteellisen vaikutuksen yleinen ongelma laskevassa järjestyksessä. Tätä vaikutusta voidaan tutkia kunkin syyn aiheuttamien menetysten, vikojen lukumäärän perusteella. Suhteellinen vaikutus on havainnollistettu pylväillä, tekijöiden kumulatiivinen vaikutus kumulatiivisella suoralla.

syy-seurauskaavio

Siinä tutkittava ongelma on perinteisesti kuvattu vaakasuoran suoran nuolen muodossa, ja siihen välillisesti tai suoraan vaikuttavat olosuhteet ja tekijät ovat vinojen nuolien muodossa. Rakentaessa tulee ottaa huomioon merkityksettömältäkin vaikuttavat olosuhteet. Tämä johtuu siitä, että käytännössä on melko usein tapauksia, joissa ongelman ratkaisu varmistetaan sulkemalla pois useita merkityksettömältä näyttäviä tekijöitä. Syyt, jotka vaikuttavat pääolosuhteisiin (ensimmäisten ja myöhempien tilausten) on kuvattu kaaviossa vaakasuuntaisilla lyhyillä nuolilla. Yksityiskohtainen kaavio on kalan luurangon muodossa.

Ryhmittelytiedot

Tämä taloustilastollinen menetelmä käytetään järjestämään joukko indikaattoreita, jotka on saatu arvioimalla ja mittaamalla yksi tai useampi objektin parametri. Yleensä tällaiset tiedot esitetään järjestämättömänä arvosarjana. Nämä voivat olla työkappaleen lineaariset mitat, sulamispiste, materiaalin kovuus, vikojen lukumäärä ja niin edelleen. Tällaisen järjestelmän perusteella on vaikea tehdä johtopäätöksiä tuotteen ominaisuuksista tai sen valmistusprosesseista. Tilaus tapahtuu käyttämällä viivakaavioita. Ne osoittavat selvästi havaittujen parametrien muutokset tietyn ajanjakson aikana.

Valvontalehti

Pääsääntöisesti se esitetään taajuusjakaumataulukon muodossa kohteen parametrien mitattujen arvojen esiintymisestä vastaavilla aikaväleillä. Tarkistuslistat laaditaan tutkimuksen tarkoituksen mukaan. Indikaattoriarvojen alue on jaettu yhtä suuriin aikaväleihin. Niiden lukumäärä valitaan yleensä yhtä suureksi kuin tehtyjen mittausten lukumäärän neliöjuuri. Lomakkeen tulee olla yksinkertainen, jotta vältytään täyttö-, lukemis- ja tarkistusongelmat.

pylväsdiagrammi

Se esitetään porrastetun monikulmion muodossa. Se kuvaa selkeästi mittausindikaattoreiden jakautumista. Alue asettaa arvoja on jaettu yhtä suuriin väleihin, jotka asetetaan x-akselia pitkin. Kullekin välille rakennetaan suorakulmio. Sen korkeus on yhtä suuri kuin arvon esiintymistiheys tietyllä aikavälillä.

Sirontakaaviot

Niitä käytetään testaamaan hypoteesia kahden välisestä suhteesta muuttujia. Malli on rakennettu seuraavasti. Yhden parametrin arvo piirretään abskissa-akselille ja toisen indikaattorin arvo piirretään ordinaatalle. Tämän seurauksena kaavioon ilmestyy piste. Nämä toiminnot toistetaan kaikille muuttujien arvoille. Jos suhde on olemassa, korrelaatiokenttä laajenee, eikä suunta ole sama kuin y-akselin suunta. Jos rajoitusta ei ole, se on yhdensuuntainen jonkin akselin kanssa tai on ympyrän muotoinen.

Ohjauskortit

Niitä käytetään arvioitaessa prosessia tietyn ajanjakson aikana. Ohjauskarttojen muodostaminen perustuu seuraaviin säännöksiin:

  1. Kaikki prosessit poikkeavat asetetuista parametreista ajan myötä.
  2. Ilmiön epävakaa kulku ei muutu sattumalta. Poikkeamat, jotka ylittävät odotettujen rajojen rajat, eivät ole satunnaisia.
  3. Yksittäisiä muutoksia voidaan ennakoida.
  4. Vakaa prosessi voi satunnaisesti poiketa odotettavissa olevissa rajoissa.

Käyttö venäläisten yritysten käytännössä

On sanottava, että kotimaiset ja ulkomaiset kokemukset osoittavat, että tehokkain tilastollinen menetelmä laitteiden ja teknisten prosessien vakauden ja tarkkuuden arvioimiseksi on ohjauskorttien laatiminen. Tätä menetelmää käytetään myös tuotantopotentiaalin säätöön. Karttoja laadittaessa on välttämätöntä valita tutkittava parametri oikein. On suositeltavaa suosia sellaisia ​​indikaattoreita, jotka liittyvät suoraan tuotteen käyttötarkoitukseen, jotka ovat helposti mitattavissa ja joihin voidaan vaikuttaa prosessiohjauksella. Jos tällainen valinta on vaikea tai ei perusteltu, on mahdollista arvioida arvot, jotka korreloivat (suhteessa toisiinsa) ohjatun parametrin kanssa.

Vivahteita

Jos tunnuslukujen mittaaminen kartoitukseen vaaditulla tarkkuudella kvantitatiivisen kriteerin mukaan ei ole taloudellisesti tai teknisesti mahdollista, käytetään vaihtoehtoista merkkiä. Siihen liittyvät termit, kuten "avioliitto" ja "vika". Jälkimmäinen ymmärretään jokaisena erillisenä tuotteen vaatimustenvastaisuutena. Avioliitto on tuote, jonka tarjoaminen kuluttajille ei ole sallittua siinä olevien virheiden vuoksi.

Erikoisuudet

Jokaisella korttityypillä on omat erityispiirteensä. Se on otettava huomioon valittaessa niitä tiettyyn tapaukseen. Kortteja kvantitatiivisen kriteerin mukaan pidetään herkempänä prosessin muutoksille kuin vaihtoehtoista ominaisuutta käyttävät kortit. Ensimmäiset ovat kuitenkin työvoimavaltaisempia. Niitä käytetään:

  1. Prosessin virheenkorjaus.
  2. Teknologian käyttöönoton mahdollisuuksien arviointi.
  3. Laitteen tarkkuuden tarkistaminen.
  4. Toleranssin määritelmät.
  5. Useita kartoituksia hyväksyttäviä tapoja tuotteen luominen.

Lisäksi

Jos prosessin häiriölle on ominaista ohjatun parametrin siirtyminen, on tarpeen käyttää X-karttoja. Jos arvojen hajonta kasvaa, tulee valita R- tai S-malli. On kuitenkin tarpeen ottaa huomioon useita ominaisuuksia. Erityisesti S-kaavioiden käyttö mahdollistaa prosessin epäjärjestyksen toteamisen tarkemmin ja nopeammin kuin samoilla R-malleilla, mutta jälkimmäisten rakentaminen ei vaadi monimutkaisia ​​laskelmia.

Johtopäätös

Taloustieteessä on mahdollista tutkia tekijöitä, jotka paljastuvat aikana laadullinen arviointi, avaruudessa ja dynamiikassa. Niitä voidaan käyttää ennustavien laskelmien suorittamiseen. Taloudellisen analyysin tilastolliset menetelmät eivät sisällä menetelmiä taloudellisten prosessien ja tapahtumien syy-seuraus-suhteiden arvioimiseksi, lupaavien ja käyttämättömien suorituskyvyn parantamisreservien tunnistamiseksi. Toisin sanoen tekijätekniikat eivät sisälly tarkasteltaviin lähestymistapoihin.

tilastot"biotilastot".

1. nimellinen;
2. järjestysluku;
3. intervalli;

näytteet

edustaja

näytekehys yksinkertainen satunnainen näyte intervallinäytteenotto

kerrostettu otanta

klusterin ja näytteenottokiintiö

nollahypoteesi

vaihtoehtoinen hypoteesi tehoa

luottamustaso».


Otsikko: Tilastollisen data-analyysin perusteet
Yksityiskohtainen kuvaus:

Perusteellisen tai kokeellisen tieteellisen tutkimuksen valmistumisen jälkeen saaduista tiedoista suoritetaan tilastollinen analyysi. Tilastollisen analyysin onnistuminen ja tehtävien ratkaiseminen edellyttää tutkimusta asianmukaisesti. Siksi ilman tilaston perusteiden ymmärtämistä on mahdotonta suunnitella ja käsitellä tieteellisen kokeen tuloksia. Kuitenkin, lääketieteellinen koulutus ei tarjoa pelkästään tilastotietoa, vaan edes perustietoja korkeampi matematiikka. Siksi hyvin usein voi törmätä siihen näkemykseen, että biolääketieteellisessä tutkimuksessa tilastolliseen käsittelyyn saa puuttua vain tilastotieteilijä ja lääketieteen tutkijan tulisi keskittyä omiin lääketieteellisiin kysymyksiinsä. tieteellistä työtä. Tällainen työnjako, joka edellyttää apua tietojen analysoinnissa, on täysin perusteltua. Tilastojen periaatteiden ymmärtäminen on kuitenkin välttämätöntä ainakin siksi, ettei ongelma asettuisi oikein asiantuntijalle, jonka kanssa yhteydenpito ennen tutkimuksen aloittamista on yhtä tärkeää kuin tietojenkäsittelyvaiheessa.

Ennen kuin puhumme tilastollisen analyysin perusteista, on tarpeen selventää termin " tilastot". Määritelmiä on monia, mutta mielestämme täydellisin ja ytimekkäin on tilaston määritelmä "tiedoksi tiedon keräämisestä, esittämisestä ja analysoinnista". Tilastojen käyttöä elävän maailman sovelluksissa puolestaan ​​kutsutaan "biometriaksi" tai " biotilastot".

On huomattava, että hyvin usein tilastot rajoittuvat vain kokeellisten tietojen käsittelyyn kiinnittämättä huomiota niiden saamisvaiheeseen. Tilastotietoa tarvitaan kuitenkin jo kokeen suunnittelun aikana, jotta sen aikana saadut indikaattorit voivat antaa tutkijalle luotettavaa tietoa. Siksi voidaan sanoa, että kokeen tulosten tilastollinen analyysi alkaa jo ennen tutkimuksen alkamista.

Jo suunnitelman laatimisvaiheessa tutkijan tulee selkeästi ymmärtää, millaisia ​​muuttujia hänen työssään on. Kaikki muuttujat voidaan jakaa kahteen luokkaan: kvalitatiivisiin ja kvantitatiivisiin. Se, minkä alueen muuttuja voi olla, riippuu mittausasteesta. Pääasteikkoja on neljä:

1. nimellinen;
2. järjestysluku;
3. intervalli;
4. rationaalinen (suhteiden mittakaava).

Nimellisasteikossa ("nimien" asteikolla) on vain symboleja, jotka kuvaavat joitain esineluokkia, esimerkiksi "sukupuoli" tai "potilaan ammatti". Nimellinen asteikko tarkoittaa, että muuttuja ottaa arvoja, joiden välisiä kvantitatiivisia suhteita ei voida määrittää. Näin ollen on mahdotonta luoda matemaattista suhdetta mies- ja naissukupuolten välille. Perinteiset numeeriset merkinnät (naiset - 0, miehet - 1 tai päinvastoin) annetaan täysin mielivaltaisesti ja on tarkoitettu vain tietokonekäsittelyyn. Nimellinen asteikko on puhtaimmassa muodossaan kvalitatiivinen, tämän asteikon yksittäiset kategoriat ilmaistaan ​​frekvensseillä (havaintojen lukumäärä tai osuus, prosentit).

Järjestysasteikko (järjestysasteikko) mahdollistaa sen, että yksittäiset luokat voidaan järjestää nousevaan tai laskevaan järjestykseen. Lääketieteessä klassinen esimerkki järjestysasteikosta on sairauden vakavuuden asteikko. Tässä tapauksessa voimme rakentaa vakavuuden nousevassa järjestyksessä, mutta meillä ei silti ole kykyä määrittää kvantitatiivisia suhteita, eli järjestysasteikolla mitattujen arvojen välinen etäisyys on tuntematon tai sillä ei ole merkitystä. "Vakavuus"-muuttujan arvojen järjestys on helppo määrittää, mutta on mahdotonta määrittää, kuinka monta kertaa vakava tila eroaa kohtalaisesta tilasta.

Järjestysasteikko viittaa sukupuoleen määrälliset tyypit dataa ja sen asteikkoja voidaan kuvata sekä taajuuksilla (kuten laadullisella asteikolla) että mitoilla keskeiset arvot joihin keskitymme alla.

Intervalli- ja rationaaliset asteikot ovat puhtaasti kvantitatiivisia tietotyyppejä. Intervalliasteikolla voimme jo määrittää, kuinka paljon muuttujan yksi arvo eroaa toisesta. Näin ollen kehon lämpötilan nousu 1 celsiusasteella tarkoittaa aina kiinteän yksikkömäärän vapautuvan lämmön nousua. Intervalliasteikolla on kuitenkin sekä positiivisia että negatiiviset arvot(ei absoluuttista nollaa). Tässä suhteessa on mahdotonta sanoa, että 20 celsiusastetta on kaksi kertaa lämpimämpää kuin 10. Voimme vain todeta, että 20 astetta on yhtä paljon lämpimämpää kuin 10 kuin 30 on lämpimämpää kuin 20.

Rationaalisella asteikolla (suhdeasteikolla) on yksi vertailupiste ja vain positiivisia arvoja. Lääketieteessä useimmat rationaaliset asteikot ovat pitoisuuksia. Esimerkiksi glukoositaso 10 mmol/L on kaksinkertainen pitoisuuteen verrattuna 5 mmol/l:aan. Lämpötilalle rationaalinen asteikko on Kelvin-asteikko, jossa on absoluuttinen nolla (lämmön puuttuminen).

On lisättävä, että mikä tahansa kvantitatiivinen muuttuja voi olla jatkuva, kuten kehon lämpötilan mittaamisen tapauksessa (tämä on jatkuva intervalliasteikko), tai diskreetti, jos lasketaan verisolujen lukumäärä tai koe-eläinten jälkeläiset (tämä on diskreetti rationaalinen asteikko).

Nämä erot ovat ratkaisevan tärkeitä kokeellisten tulosten tilastollisen analyysin menetelmien valinnassa. Nimellistiedoille on siis sovellettavissa khin neliötestiä, ja tuttu Studentin testi edellyttää, että muuttuja (intervalli tai rationaalinen) on jatkuva.

Kun kysymys muuttujan tyypistä on ratkaistu, on tarpeen aloittaa muodostaminen näytteet. Otos on pieni ryhmä tietyn luokan esineitä (lääketieteessä populaatio). Täysin tarkkojen tietojen saamiseksi on tarpeen tutkia kaikkia tietyn luokan kohteita, mutta käytännön (usein taloudellisista) syistä tutkitaan vain osaa populaatiosta, jota kutsutaan otokseksi. Tulevaisuudessa tilastollisen analyysin avulla tutkija voi laajentaa saatuja kuvioita koko populaatioon tietyllä tarkkuudella. Itse asiassa kaikki biolääketieteen tilastot tähtäävät mahdollisimman tarkkojen tulosten saamiseen mahdollisimman pienestä määrästä havaintoja, koska ihmisiä tutkittaessa myös eettinen kysymys on tärkeä. Meillä ei ole varaa ottaa riskiä Suuri määrä potilaita kuin on tarpeen.

Otoksen luomista säätelevät useat pakolliset vaatimukset, joiden rikkominen voi johtaa virheellisiin johtopäätöksiin tutkimuksen tuloksista. Ensinnäkin näytteen koko on tärkeä. Tutkittujen parametrien arvioinnin tarkkuus riippuu otoksen koosta. Tässä tulee ottaa huomioon sana "tarkkuus". Miten lisää kokoja Tutkituista ryhmistä sitä tarkemmat (mutta ei välttämättä oikeat) tulokset tiedemies saa. Jotta otantatutkimusten tulokset olisivat siirrettävissä koko populaatiolle kokonaisuutena, otoksen tulee olla edustaja. Otoksen edustavuus tarkoittaa, että se heijastaa kaikkia perusjoukon olennaisia ​​ominaisuuksia. Toisin sanoen tutkituissa ryhmissä eri sukupuolta, ikää, ammatteja, sosiaalista asemaa jne. olevia henkilöitä löytyy yhtä usein kuin koko väestöstä.

Ennen tutkimusryhmän valinnan aloittamista on kuitenkin päätettävä tietyn populaation tutkimuksen tarve. Esimerkkinä populaatiosta voivat olla kaikki tietyn nosologian omaavat potilaat tai työikäiset jne. Siten nuorten sotilasikäisten populaatiosta saatuja tuloksia tuskin voi ekstrapoloida postmenopausaalisiin naisiin. Tutkimusryhmän ominaisuuksien joukko määrittää tutkimustietojen "yleistettävyyden".

Näytteitä voidaan luoda eri tavoilla. Helpoin tapa on valita satunnaislukugeneraattorilla. vaadittava määrä esineitä populaatiosta tai näytekehys(näytteenottokehys). Tätä menetelmää kutsutaan yksinkertainen satunnainen näyte". Jos valitsemme satunnaisesti aloituskohdan otantakehyksestä ja otamme sitten joka toinen, viides tai kymmenes kohde (riippuen siitä, mitä ryhmäkokoja tutkimuksessa vaaditaan), saamme intervallinäytteenotto. Intervallinäytteenotto ei ole satunnaista, koska mahdollisuutta datan jaksoittaiseen toistoon näytekehyksessä ei koskaan suljeta pois.

On mahdollista luoda ns. kerrostettu otanta”, joka olettaa, että populaatio koostuu useista eri ryhmistä ja tämä rakenne tulisi toistaa koeryhmässä. Esimerkiksi jos miesten ja naisten suhde populaatiossa on 30:70, niin ositetussa otoksessa heidän suhteen tulee olla sama. klo tätä lähestymistapaa On tärkeää, että otosta ei tasapainoteta liikaa, eli vältetään sen ominaisuuksien homogeenisuutta, muuten tutkija voi menettää mahdollisuuden löytää eroja tai suhteita tiedoista.

Kuvattujen ryhmien muodostamismenetelmien lisäksi on olemassa myös klusterin ja näytteenottokiintiö. Ensimmäistä käytetään, kun täydellisen tiedon saaminen näytekehyksestä on vaikeaa sen koon vuoksi. Sitten otos muodostetaan useista populaatioon kuuluvista ryhmistä. Toinen - kiintiö - on samanlainen kuin kerrostettu otos, mutta tässä kohteiden jakautuminen ei vastaa populaatiota.

Otoskokoon palatakseni on sanottava, että se liittyy läheisesti ensimmäisen ja toisen tyyppisten tilastovirheiden todennäköisyyteen. Tilastovirheet voivat johtua siitä, että tutkimuksessa ei tutkita koko populaatiota, vaan osaa siitä. Tyypin I virhe on virheellinen poikkeama nollahypoteesi. Nollahypoteesi puolestaan ​​on oletus, että kaikki tutkitut ryhmät on otettu samasta perusjoukosta, mikä tarkoittaa, että niiden väliset erot tai suhteet ovat satunnaisia. Jos vedetään analogia diagnostisten testien kanssa, tyypin I virhe on väärä positiivinen tulos.

Tyypin II virhe on virheellinen poikkeama vaihtoehtoinen hypoteesi, jonka merkitys on siinä, että ryhmien väliset erot tai suhteet eivät johdu sattumanvaraisesta sattumasta, vaan tutkittujen tekijöiden vaikutuksesta. Ja taas analogia diagnostiikan kanssa: toisen tyyppinen virhe on väärä negatiivinen tulos. Tähän virheeseen liittyy ajatus tehoa, joka kertoo kuinka tehokas tietty tilastollinen menetelmä on tietyissä olosuhteissa, sen herkkyydestä. Teho lasketaan kaavalla: 1-β, jossa β on tyypin II virheen todennäköisyys. Tämä indikaattori riippuu pääasiassa otoksen koosta. Mitä suurempi ryhmäkoko on, sitä pienempi on tyypin II virheen todennäköisyys ja sitä suurempi on tilastollisten testien teho. Tämä riippuvuus on vähintään neliöllinen, eli otoskoon pienentäminen puoleen johtaa tehon pudotukseen vähintään neljä kertaa. Pienimmän sallitun tehon katsotaan olevan 80 % ja ensimmäisen tyypin suurimmaksi sallituksi virhetasoksi on 5 %. On kuitenkin aina muistettava, että nämä rajat ovat mielivaltaisia ​​ja voivat muuttua tutkimuksen luonteen ja tavoitteiden mukaan. Tiedeyhteisö tunnustaa pääsääntöisesti mielivaltaisen vallanmuutoksen, mutta suurimmassa osassa tapauksia ensimmäisen tyypin virhetaso ei saa ylittää 5 prosenttia.

Kaikki edellä mainittu liittyy suoraan tutkimuksen suunnitteluvaiheeseen. Monet tutkijat kutsuvat kuitenkin virheellisesti tilastollista tietojenkäsittelyä vain jonkinlaiseksi manipulaatioksi, joka suoritetaan työn pääosan valmistumisen jälkeen. Usein suunnittelemattoman kokeen päätyttyä on vastustamaton halu tilata tilastotietojen analyysi sivuun. Mutta tilastotieteilijänkin on hyvin vaikeaa saada tutkijan odottama tulos "roskasaosta". Siksi, kun biotilastoista ei tiedetä riittävästi, on tarpeen hakea apua tilastolliseen analyysiin jo ennen kokeen aloittamista.

Tarkasteltaessa itse analyysimenettelyä, on syytä korostaa kahta päätyyppiä tilastollisia tekniikoita: kuvaileva ja näyttöön perustuva (analyyttinen). Kuvaaviin tekniikoihin kuuluu tekniikoita tietojen esittämiseksi kompaktilla ja helposti ymmärrettävällä tavalla. Näitä ovat taulukot, kaaviot, taajuudet (absoluuttiset ja suhteelliset), keskeiset trendit (keskiarvo, mediaani, moodi) ja tiedon sirontamitat (varianssi, keskihajonta, kvartiiliväli jne.). Toisin sanoen deskriptiiviset menetelmät luonnehtivat tutkittuja näytteitä.

Suosituin (joskin usein harhaanjohtava) tapa kuvata saatavilla olevia määrällisiä tietoja on määritellä seuraavat indikaattorit:

  • havaintojen määrä otoksessa tai sen koko;
  • keskiarvo (aritmeettinen keskiarvo);
  • keskihajonta on mitta siitä, kuinka laajasti muuttujien arvot muuttuvat.

On tärkeää muistaa, että aritmeettinen keskiarvo ja keskihajonta ovat keskeisiä suuntauksia ja sirontaa melko pienessä määrässä näytteitä. Tällaisissa näytteissä useimpien objektien arvot yhtä todennäköisiä poikkeavat keskiarvosta, ja niiden jakautuminen muodostaa symmetrisen "kellon" (Gaussin tai Gauss-Laplacen käyrä). Tällaista jakautumista kutsutaan myös "normaaliksi", mutta lääketieteellisen kokeen käytännössä sitä esiintyy vain 30 prosentissa tapauksista. Jos muuttujan arvot jakautuvat epäsymmetrisesti keskuksen ympärille, niin ryhmät kuvataan parhaiten käyttämällä mediaania ja kvantiileja (prosentiilit, kvartiilit, desiilit).

Kun ryhmien kuvaus on valmis, on tarpeen vastata kysymykseen niiden suhteista ja mahdollisuudesta yleistää tutkimuksen tuloksia koko väestölle. Tätä varten käytetään näyttöön perustuvia biostatistiikan menetelmiä. Juuri heistä tutkijat muistavat ennen kaikkea tilastotietojen käsittelyssä. Yleensä tätä työvaihetta kutsutaan "tilastollisten hypoteesien testaamiseksi".

Hypoteesien testauksen tehtävät voidaan jakaa kahteen osaan suuria ryhmiä. Ensimmäinen ryhmä vastaa kysymykseen, onko ryhmien välillä eroja jonkin indikaattorin tasossa, esimerkiksi erot maksan transaminaasien tasossa hepatiittipotilailla ja terveillä ihmisillä. Toisen ryhmän avulla voit todistaa kahden tai useamman indikaattorin välisen suhteen, esimerkiksi maksan toiminnan ja immuunijärjestelmän.

Käytännössä ensimmäisen ryhmän tehtävät voidaan jakaa kahteen alatyyppiin:

  • indikaattorin vertailu vain kahdessa ryhmässä (terveet ja sairaat, miehet ja naiset);
  • kolmen tai useamman ryhmän vertailu (tutkimus lääkkeen eri annoksista).

On otettava huomioon, että tilastolliset menetelmät eroavat merkittävästi laadullisten ja määrällisten tietojen osalta.

Tilanteessa, jossa tutkittava muuttuja on kvalitatiivinen ja vain kahta ryhmää verrataan, voidaan käyttää khin neliötestiä. Tämä on melko voimakas ja laajalti tunnettu kriteeri, mutta se ei ole riittävän tehokas, jos havaintojen määrä on pieni. Tämän ongelman ratkaisemiseksi on olemassa useita menetelmiä, kuten jatkuvuuden Yates-korjaus ja Fisherin tarkka menetelmä.

Jos tutkittava muuttuja on kvantitatiivinen, voidaan käyttää yhtä kahdesta tilastollisesta testistä. Ensimmäisen tyypin kriteerit perustuvat yleisen populaation tiettyyn jakautumistyyppiin ja toimivat tämän populaation parametrien kanssa. Tällaisia ​​kriteerejä kutsutaan "parametrisiksi", ja ne perustuvat yleensä oletukseen arvojen normaalijakaumasta. Ei-parametriset testit eivät perustu olettamukseen yleisen populaation jakauman tyypistä eivätkä käytä sen parametreja. Joskus tällaisia ​​kriteerejä kutsutaan "jakeluvapaiksi testeiksi". Tietyssä määrin tämä on virheellistä, koska mikä tahansa ei-parametrinen testi olettaa, että jakaumat kaikissa vertailuryhmissä ovat samat, muuten voidaan saada vääriä positiivisia tuloksia.

Normaalisti jakautuneesta populaatiosta saatuihin tietoihin sovelletaan kahta parametrista testiä: Studentin t-testi kahden ryhmän vertaamiseksi ja Fisherin F-testi varianssien tasa-arvon testaamiseksi (alias ANOVA). Ei-parametrisia kriteerejä on paljon enemmän. Eri testit eroavat toisistaan ​​oletuksiltaan, joihin ne perustuvat, laskelmien monimutkaisuuden, tilastollisen tehon jne. suhteen. Kuitenkin Wilcoxonin testi (sukuryhmille) ja Mann-Whitneyn testi, joka tunnetaan myös testinä Wilcoxon varten riippumattomia näytteitä. Nämä testit ovat käteviä siinä mielessä, että ne eivät vaadi oletuksia tiedon jakamisen luonteesta. Mutta jos käy ilmi, että näytteet on otettu normaalijakaumasta yleisestä populaatiosta, niin niiden tilastollinen teho ei poikkea merkittävästi Studentin testin vastaavasta.

Täydellinen kuvaus tilastollisista menetelmistä löytyy osoitteesta erikoiskirjallisuutta Keskeinen asia on kuitenkin se, että jokainen tilastollinen testi vaatii joukon sääntöjä (oletuksia) ja ehtoja sen käytölle, ja useiden menetelmien mekaaninen luettelointi "toivotun" tuloksen löytämiseksi on täysin mahdotonta hyväksyä. tieteellinen näkökohta näkemys. Tässä mielessä tilastolliset testit ovat lähellä lääkkeitä - jokaisella on indikaatiot ja vasta-aiheet, sivuvaikutukset ja epäonnistumisen todennäköisyys. Ja yhtä vaarallista on tilastollisten testien hallitsematon käyttö, koska hypoteesit ja johtopäätökset perustuvat niihin.

Tilastollisen analyysin tarkkuuden ymmärtämiseksi täydellisemmin on tarpeen määritellä ja analysoida käsite " luottamustaso." Luottamustodennäköisyys on todennäköisten ja epätodennäköisten tapahtumien rajana oleva arvo. Perinteisesti se on merkitty kirjaimella "p". Monille tutkijoille tilastollisen analyysin ainoa tarkoitus on laskea haluttu p-arvo, joka näyttää laittavan pilkkuja kuuluisa lause"teloitusta ei voi antaa anteeksi." Suurin sallittu luottamustaso on 0,05. On muistettava, että luottamustaso ei ole jonkin tapahtuman todennäköisyys, vaan luottamuskysymys. Esittämällä luottamustodennäköisyyden ennen analyysin aloittamista määritämme siten tutkimuksemme tulosten luotettavuuden. Ja kuten tiedätte, liiallinen herkkäuskoisuus ja liiallinen epäluulo vaikuttavat yhtä kielteisesti minkä tahansa työn tuloksiin.

Luotettavuustaso ilmaisee tyypin I virheen suurimman todennäköisyyden, jonka tutkija pitää hyväksyttävänä. Luottamustason alentaminen eli hypoteesien testaamisen edellytysten tiukentaminen lisää tyypin II virheiden todennäköisyyttä. Siksi luotettavuustason valinnassa on otettava huomioon mahdolliset vahingot ensimmäisen ja toisen tyyppisten virheiden esiintymisestä. Esimerkiksi biolääketieteen tilastoissa omaksutut tiukat rajat, jotka määräävät väärien positiivisten tulosten osuuden enintään 5 %, ovat erittäin välttämättömiä, koska uusia hoitoja otetaan käyttöön tai hylätään lääketieteellisen tutkimuksen tulosten perusteella, ja tämä on elämän kysymys tuhansille ihmisille.

On pidettävä mielessä, että p-arvo itsessään ei ole lääkärille kovin informatiivinen, koska se kertoo vain nollahypoteesin virheellisen hylkäämisen todennäköisyydestä. Tämä indikaattori ei kerro mitään esimerkiksi terapeuttisen vaikutuksen suuruudesta käytettäessä tutkimuslääkettä väestössä. Siksi ollaan sitä mieltä, että luottamustason sijaan tutkimuksen tuloksia olisi parempi arvioida luottamusvälin koon mukaan. Luottamusväli on arvoalue, jonka sisällä todellinen populaatioarvo (keskiarvo, mediaani tai esiintymistiheys) sisältyy tietyllä todennäköisyydellä. Käytännössä on kätevämpää käyttää molempia arvoja, jolloin voidaan varmemmin arvioida saatujen tulosten soveltuvuutta koko väestöön.

Lopuksi muutama sana on sanottava tilastotieteilijän tai itsenäisesti dataa analysoivan tutkijan käyttämistä työkaluista. Manuaaliset laskelmat ovat menneet kauan sitten. Nykyään olemassa olevat tilastolliset tietokoneohjelmat mahdollistavat tilastollisen analyysin suorittamisen ilman vakavaa matemaattinen koulutus. Sellaiset tehokkaat järjestelmät kuten SPSS, SAS, R jne. antavat tutkijalle mahdollisuuden käyttää monimutkaisia ​​ja tehokkaita tilastollisia menetelmiä. Tämä ei kuitenkaan aina ole hyvä asia. Tietämättä käytettyjen tilastollisten testien soveltuvuutta tiettyyn kokeelliseen dataan, tutkija voi tehdä laskelmia ja jopa saada joitain lukuja ulostulossa, mutta tulos on hyvin kyseenalainen. Niin, edellytys kokeen tulosten tilastollisen käsittelyn suorittamiseksi on oltava hyvä tieto matemaattiset perusteet tilastot.


Tilastolliset menetelmät - menetelmät tilastotietojen analysointiin. Kohdista soveltavan tilaston menetelmät, joita voidaan soveltaa kaikilla aloilla tieteellinen tutkimus ja kaikilla toimialoilla kansallinen talous ja muut tilastolliset menetelmät, joiden sovellettavuus on rajoitettu tietylle alueelle. Tällä tarkoitetaan sellaisia ​​menetelmiä kuin tilastollinen hyväksynnän valvonta, teknisten prosessien tilastollinen valvonta, luotettavuus ja testaus sekä kokeiden suunnittelu.

Tilastollisia tietojen analysointimenetelmiä käytetään lähes kaikilla ihmisen toiminnan aloilla. Niitä käytetään aina, kun on tarpeen saada ja perustella mielipiteitä ryhmästä (objekteista tai subjekteista), joilla on jonkin verran sisäistä heterogeenisuutta. On suositeltavaa erottaa kolme tyyppistä tieteellistä ja sovellettua toimintaa tilastollisten tietojen analysointimenetelmien alalla (erityisiin ongelmiin uppoutumiseen liittyvien menetelmien spesifisyyden asteen mukaan):

a) yleiskäyttöisten menetelmien kehittäminen ja tutkimus, ottamatta huomioon sovellusalan erityispiirteitä;

b) tilastollisten mallien kehittäminen ja tutkimus todellisia ilmiöitä ja prosessit tietyn toiminta-alan tarpeiden mukaisesti;

c) tilastollisten menetelmien ja mallien soveltaminen tiettyjen tietojen tilastolliseen analysointiin.

Dispersioanalyysi. Varianssianalyysiä (latinan sanasta Dispersio - dispersio / englanniksi Analysis Of Variance - ANOVA) käytetään tutkimaan yhden tai useamman kvalitatiivisen muuttujan (tekijän) vaikutusta yhteen riippuvaan kvantitatiiviseen muuttujaan (vaste). Varianssianalyysi perustuu oletus, että joitain muuttujia voidaan pitää syinä (tekijät, riippumattomat muuttujat) ja toisia seurauksina (riippuvaiset muuttujat). Riippumattomia muuttujia kutsutaan joskus säädettävät tekijät juuri siksi, että kokeessa tutkijalla on mahdollisuus varioida niitä ja analysoida tuloksena olevaa tulosta.

päätavoite varianssianalyysi (ANOVA) on keskiarvojen välisten erojen merkittävyyden tutkimus varianssien vertailun (analyysin) avulla. Kokonaisvarianssin jakaminen useisiin lähteisiin mahdollistaa ryhmien välisestä erosta johtuvan varianssin vertaamisen ryhmän sisäisestä vaihtelusta johtuvaan varianssiin. Jos nollahypoteesi pitää paikkansa (keskiarvojen yhtäläisyydestä useissa yleisestä populaatiosta valituissa havaintoryhmissä), ryhmän sisäiseen vaihteluun liittyvän varianssin estimaatin tulisi olla lähellä ryhmien välisen varianssin estimaattia. Jos vertaat vain kahden näytteen keskiarvoja, varianssianalyysi antaa saman tuloksen kuin tavallisen riippumattoman otoksen t-testi (jos vertaat kahta itsenäisiä ryhmiä objektit tai havainnot) tai t-testi riippuville näytteille (jos kahta muuttujaa verrataan samassa objekti- tai havaintojoukossa).


Varianssianalyysin ydin koostuu tutkitun ominaisuuden kokonaisvarianssin jakamisesta erillisiin komponentteihin tiettyjen tekijöiden vaikutuksesta ja hypoteesien testaamisesta näiden tekijöiden vaikutuksen merkityksestä tutkittavalle ominaisuudelle. Vertaamalla varianssin komponentteja keskenään Fisherin F-kriteerin avulla voidaan määrittää, mikä osuus tuloksena olevan ominaisuuden kokonaisvaihtelusta johtuu säädettävien tekijöiden vaikutuksesta.

lähtöaine varianssianalyysiä varten ovat kolmen tai useamman näytteen tutkimuksen tiedot, jotka voivat olla joko yhtä suuria tai erisuuruisia, sekä kytkettyjä että irrotettuja. Tunnistettujen säädettävien tekijöiden lukumäärän mukaan varianssianalyysi voi olla yksitekijäinen (tässä tapauksessa tutkitaan yhden tekijän vaikutusta kokeen tuloksiin), kaksitekijäinen (tutkittaessa kahden tekijän vaikutusta) ja monitekijäinen (voit arvioida paitsi kunkin tekijän vaikutusta erikseen, myös niiden vuorovaikutusta).

Varianssianalyysiä sovelletaan parametristen menetelmien ryhmään, joten sitä tulisi soveltaa vain, kun on todistettu, että jakauma on normaali.

Varianssianalyysiä käytetään, jos riippuva muuttuja mitataan suhde-, intervalli- tai järjestysasteikolla ja vaikuttavat muuttujat ovat luonteeltaan ei-numeerisia (nimiasteikko).

Tehtäväesimerkkejä. Tehtävissä, joita ratkaistaan varianssianalyysi, on luonteeltaan numeerinen vaste, johon vaikuttavat useat nimellisluonteiset muuttujat. Esimerkiksi useat erityyppiset lihotusannokset tai kaksi tapaa pitää niitä jne.

Esimerkki 1: Viikon aikana useita apteekkikioskija työskenteli kolmessa eri paikassa. Tulevaisuudessa voimme jättää vain yhden. On tarpeen selvittää, onko tilastoa olemassa merkittävä eroavaisuus huumeiden myyntimäärien välillä kioskeissa. Jos kyllä, valitsemme kioskin, jolla on suurin keskimääräinen päivämyynti. Jos myyntivolyymien ero osoittautuu tilastollisesti merkityksettömäksi, tulee kioskin valinnan perustana olla muita mittareita.

Esimerkki 2: Ryhmäkeskiarvojen vastakohtien vertailu. Seitsemän poliittista suuntausta on ryhmitelty äärimmäisen liberaaleista äärimmäisen konservatiivisiin, ja lineaarista kontrastia käytetään testaamaan, onko ryhmien keskiarvoissa nollasta poikkeavaa nousevaa trendiä eli onko keski-iässä merkittävää lineaarista nousua, kun tarkastellaan vuonna 2010 järjestettyjä ryhmiä. suunta liberaalista konservatiiviseen.

Esimerkki 3: Kaksisuuntainen varianssianalyysi. Tuotemyynnin määrään vaikuttaa myymälän koon lisäksi usein tuotteen hyllyjen sijainti. Tämä esimerkki sisältää viikoittaiset myyntiluvut, joita kuvaa neljä hyllyasettelua ja kolme myymäläkokoa. Analyysin tulokset osoittavat, että molemmat tekijät - tavarahyllyjen sijainti ja myymälän koko - vaikuttavat myynnin määrään, mutta niiden vuorovaikutus ei ole merkittävää.

Esimerkki 4: Yksimuuttuja ANOVA: Satunnaistettu kahden hoidon täyslohkosuunnittelu. Kaikkien mahdollisten kolmen rasvan ja kolmen taikinarepäisyn yhdistelmien vaikutusta leivän paistamiseen tutkitaan. Lohkotekijöinä toimi neljä neljästä eri lähteestä otettua jauhonäytettä. On välttämätöntä tunnistaa rasva-ripper-vuorovaikutuksen merkitys. Sen jälkeen voit määrittää kontrastien valintavaihtoehdot, jotta voit selvittää, mitkä tekijätasojen yhdistelmät eroavat toisistaan.

Esimerkki 5: Malli hierarkkisesta (sisäkkäisestä) suunnitelmasta, jossa on sekalaisia ​​vaikutuksia. Tutkitaan neljän satunnaisesti valitun työstökoneeseen asennetun pään vaikutusta valmistettujen lasikatodipitimien muodonmuutokseen. (Päät on rakennettu koneeseen, joten samaa päätä ei voi käyttää eri koneissa.) Päävaikutusta käsitellään satunnaistekijänä. ANOVA-tilastot osoittavat, että koneiden välillä ei ole merkittäviä eroja, mutta on viitteitä siitä, että päät voivat poiketa toisistaan. Kaikkien koneiden välinen ero ei ole merkittävä, mutta kahdella niistä ero päätyyppien välillä on merkittävä.

Esimerkki 6: Yksimuuttuja toistuvien mittausten analyysi käyttämällä jaettua kaaviota. Tämä koe suoritettiin yksilön ahdistusluokituksen vaikutuksen määrittämiseksi kokeen suoritukseen neljällä peräkkäisellä yrityksellä. Tiedot on järjestetty siten, että niitä voidaan pitää koko tietojoukon osajoukkojen ryhminä ("koko kaavio"). Ahdistuksen vaikutus ei ollut merkittävä, kun taas yrittämisen vaikutus oli merkittävä.

Kovarianssianalyysi. Kovarianssianalyysi - joukko matemaattisten tilastojen menetelmiä, jotka liittyvät mallien analysointiin jonkin satunnaismuuttujan keskiarvon samanaikaisesta riippuvuudesta (pää)laadullisten tekijöiden ja (liitännäisten) kvantitatiivisten tekijöiden joukosta. Tekijät F asettavat olosuhteiden yhdistelmiä, joissa havainnot X, Y saatiin, ja niitä kuvataan indikaattorimuuttujilla, ja oheisten ja indikaattorimuuttujien joukossa voi olla sekä satunnaisia ​​että ei-satunnaisia ​​(kokeessa kontrolloituja).

Jos satunnaismuuttuja Y on vektori, puhutaan kovarianssin monimuuttujaanalyysistä.

Kovarianssianalyysiä käytetään usein ennen varianssianalyysiä tarkistaa havaintojen X,Y otoksen homogeenisuus (homogeenisuus, edustavuus) kaikkien samanaikaisten tekijöiden osalta.