Näyte on edustava. Edustavuus - mitä se on? Systemaattinen satunnaisotos

Itse asiassa aloitamme ei yhdellä, vaan kolmella kysymyksellä: mikä on näyte? milloin se on edustava? mitä hän edustaa?

Aggregaatti- tämä on mikä tahansa meitä kiinnostava ihmisryhmä, organisaatio, tapahtuma, josta haluamme tehdä johtopäätöksiä, ja tapahtuu, tai esine, - mikä tahansa tällaisen kokoelman elementti.

Näyte- mikä tahansa analyysiin valitun tapausjoukon (objektien) alaryhmä.

Jos haluamme tutkia osavaltioiden lainsäätäjien päätöksentekotoimintaa, voisimme tutkia tällaista toimintaa Virginian, Pohjois-Carolinan ja Etelä-Carolinan osavaltioiden lainsäätäjissä, ei kaikissa viidessäkymmenessä osavaltiossa, ja tämän perusteella jakaa sai tietoa väestöstä, josta nämä kolme osavaltiota valittiin. Jos haluamme tutkia Pennsylvanian äänestäjien etuusjärjestelmää, voisimme tehdä sen haastattelemalla 50 yhdysvaltalaista työntekijää. S. Steele Pittsburghissa ja jakaa kyselyn tulokset kaikille osavaltion äänestäjille.

samoin Jos haluamme mitata opiskelijoiden älykkyyttä, voisimme testata kaikkia Ohion osavaltioon rekisteröityjä puolustavia pelaajia tietyllä jalkapallokaudella ja laajentaa tulokset sitten väestöön, johon he kuuluvat. Kussakin esimerkissä edetään seuraavasti: perustamme populaatioon alaryhmän, tutkimme tätä alaryhmää tai otosta yksityiskohtaisesti ja laajennamme tulokset koko populaatioon. Nämä ovat näytteenoton päävaiheet.

kuitenkin näyttää On aivan ilmeistä, että jokaisella näistä näytteistä on merkittävä haittapuoli. Esimerkiksi, vaikka Virginian, Pohjois-Carolinan ja Etelä-Carolinan lainsäätäjät ovat osa osavaltioiden lainsäädäntöelinten kokoonpanoa, ne toimivat historiallisista, maantieteellisistä ja poliittisista syistä todennäköisesti hyvin samankaltaisilla tavoilla ja hyvin eri tavalla kuin tällaiset erilliset lainsäätäjät. osavaltiot kuten New York, Nebraska ja Alaska. Vaikka viisikymmentä terästyöläistä Pittsburghissa voivat todellakin äänestää Pennsylvaniassa, heillä voi hyvinkin olla sosioekonomisen asemansa, koulutuksensa ja elämänkokemuksensa vuoksi erilaisia ​​näkemyksiä kuin monilla muilla samalla tavalla äänestävillä ihmisillä.

Samoin vaikka Ohion osavaltion jalkapalloilijat ovat korkeakouluopiskelijoita, he voivat hyvinkin olla erilaisia ​​kuin muut opiskelijat useista syistä. Toisin sanoen, vaikka jokainen näistä alaryhmistä on todellakin otos, kunkin alaryhmän jäsenet eroavat systemaattisesti useimmista muista sen perusjoukon jäsenistä, joista ne on valittu. Yksikään niistä ei erillisenä ryhmänä ole tyypillinen mielipidepiirteiden, käyttäytymismotiivien ja ominaisuuksien jakautumisen kannalta yleisväestössä, johon se liittyy. Näin ollen valtiotieteilijät sanoisivat, että mikään näistä näytteistä ei ole edustava.


Edustava näyte- tämä on sellainen otos, jossa kaikki sen yleisen perusjoukon pääpiirteet, josta annettu näyte on otettu, esitetään suunnilleen samassa suhteessa tai samalla tiheydellä kuin tämä ominaisuus esiintyy tässä yleisessä perusjoukossa. Siten, jos 50 % kaikista osavaltioiden lainsäätäjistä kokoontuu vain kerran kahdessa vuodessa, noin puolet edustavasta otoksesta osavaltioiden lainsäätäjiä tulisi olla tämäntyyppisiä. Jos 30 % Pennsylvanian äänestäjistä on sinikaulus, noin 30 % edustavasta äänestäjistä (eellä olevan esimerkin 100 %:n sijaan) pitäisi olla sinikaulus.

Ja jos 2 % kaikista korkeakouluopiskelijoista on urheilijoita, suunnilleen saman osan edustavasta otoksesta opiskelijoista pitäisi olla urheilijoita. Toisin sanoen edustava näyte on mikrokosmos, pienempi mutta tarkka malli populaatiosta, jota sen on tarkoitus edustaa. Siltä osin kuin otos on edustava, tämän otoksen tutkimukseen perustuvia johtopäätöksiä voidaan turvallisesti pitää alkuperäiseen populaatioon soveltuvina. Tätä tulosten jakautumista kutsutaan yleistettävyydeksi.

Ehkä graafinen kuva auttaa selventämään tätä. Oletetaan, että haluamme tutkia poliittisen ryhmän jäsenyyden malleja yhdysvaltalaisten aikuisten keskuudessa. Kuvassa 5.1 on kolme ympyrää jaettuna kuuteen yhtä suureen sektoriin. Kuva 5.1a esittää koko tarkasteltavana olevan populaation. Väestön jäsenet luokitellaan poliittisten ryhmien (kuten puolueiden ja eturyhmien) mukaan, joihin he kuuluvat.

Tässä esimerkissä jokainen aikuinen kuuluu vähintään yhteen ja enintään kuuteen poliittiseen ryhmään; ja nämä kuusi jäsenyystasoa ovat yhtä yleisiä kokonaisuutena (siis yhtäläiset sektorit). Oletetaan, että haluamme tutkia ihmisten motiiveja ryhmään liittymiselle, ryhmävalinnoille ja osallistumismalleille, mutta resurssirajoitusten vuoksi voimme tutkia vain yhtä joka kuudes väestön jäsen. Kuka tulisi valita analysoitavaksi?

Riisi. 5.1. Otoksen muodostaminen yleisestä populaatiosta

Yhtä mahdollisista tietyn kokoisista näytteistä havainnollistaa varjostettu alue kuvassa 1. 5.1b se ei kuitenkaan selvästikään kuvasta väestörakennetta.

Jos tekisimme yleistyksiä tämän näytteen perusteella, päättelemme:

1) että kaikki aikuiset amerikkalaiset kuuluvat viiteen poliittiseen ryhmään ja

2) että amerikkalaisten koko ryhmäkäyttäytyminen osuu yhteen juuri viiteen ryhmään kuuluvien käyttäytymisen kanssa.

Tiedämme kuitenkin, että ensimmäinen johtopäätös ei ole totta, ja tämä voi saada meidät epäilemään toisen pätevyyttä.

Kuvassa 5.1b esitetty otos ei siis ole edustava, koska se ei heijasta tietyn populaation ominaisuuden (jota kutsutaan usein parametriksi) jakautumista sen todellisen jakauman mukaan. Tällainen näyte sanotaan olevan siirtynyt kohti viiden ryhmän jäseniä tai siirtynyt poispäin kaikki muut ryhmäjäsenyysmallit. Tällaisen puolueellisen otannan perusteella teemme yleensä virheellisiä johtopäätöksiä populaatiosta.

Tämän osoittaa selkeimmin esimerkki 1930-luvulla Literary Digest -lehden katastrofista, joka järjesti vaalien tuloksista mielipidekyselyn. " Kirjallinen tiivistelmä” oli aikakauslehti, joka painoi uudelleen sanomalehtien pääkirjoituksia ja muuta yleistä mielipidettä kuvaavaa materiaalia; tämä lehti oli erittäin suosittu vuosisadan alussa.

Vuodesta 1920. Lehti toteutti laajan valtakunnallisen kyselyn, jossa yli miljoonalle ihmiselle lähetettiin postitse äänestysliput, joissa heitä pyydettiin merkitsemään suosikkiehdokkaansa tulevissa presidentinvaaleissa. Lehden kyselyjen tulokset olivat useiden vuosien ajan niin tarkkoja, että syyskuun mielipidemittaukset näyttivät tekevän marraskuun vaaleista merkityksettömiä.

Ja kuinka virhe voi tapahtua näin suurella näytteellä? Vuonna 1936 kuitenkin tapahtui juuri näin: republikaanien ehdokas Alf Landon ennusti voiton suurella enemmistöllä (60:40). Landon hävisi vaaleissa vammaiselle - Franklin D. Roosevelt- käytännössä samalla tuloksella, jolla hänen olisi pitänyt voittaa. Literary Digestin uskottavuus heikkeni niin pahasti, että lehden painos loppui pian sen jälkeen. Mitä tapahtui? Se on hyvin yksinkertaista: Digest-kyselyssä käytettiin puolueellista näytettä. Postikortteja lähetettiin henkilöille, joiden nimet poimittiin kahdesta lähteestä: puhelinluetteloista ja autorekisteriluetteloista.

Vaikka tämä valintamenetelmä ei ollut kovin erilainen kuin muut menetelmät aiemmin, se oli aivan erilainen nyt, vuoden 1936 suuren laman aikana, jolloin vähemmän varakkailla äänestäjillä, Rooseveltin todennäköisimmin tukipilarina, ei ollut varaa puhelimeen, puhumattakaan autosta. Siten itse asiassa Digest-kyselyssä käytetty otos oli puolueellinen niitä kohtaan, jotka todennäköisimmin asettuivat republikaanien ehdolle, ja on edelleen yllättävää, että Rooseveltillä oli niin hyvä tulos.

Kuinka ratkaista tämä ongelma? Palataksemme esimerkkiimme, verrataan näytettä kuvassa. 5.1b valinnalla kuvassa. 5.1c. Jälkimmäisessä tapauksessa myös kuudesosa populaatiosta valittiin analysoitavaksi, mutta jokainen perusjoukon päätyyppi on edustettuna otoksessa siinä suhteessa, jossa se on edustettuna koko populaatiossa. Tällainen otos osoittaa, että joka kuudes amerikkalainen aikuinen kuuluu johonkin poliittiseen ryhmään, joka kuudes tai kaksi ja niin edelleen. Tällainen otos paljastaisi myös muita eroja jäsentensä välillä, jotka voisivat liittyä eri ryhmiin osallistumiseen. Kuvassa 5.1c esitetty otos on siis edustava otos tarkasteltavalle populaatiolle.

Tietenkin tämä esimerkki on yksinkertaistettuna ainakin kahdesta erittäin tärkeästä näkökulmasta. Ensinnäkin useimmat valtiotieteilijöitä kiinnostavista populaatioista ovat esimerkissä olevaa monimuotoisempia. Ihmiset, asiakirjat, hallitukset, järjestöt, päätökset jne. eroavat toisistaan ​​ei yhdellä, vaan paljon suuremmalla määrällä ominaisuuksia. Siksi edustavan otoksen tulisi olla sellainen jokainen ytimestä erottuva alue oli edustettuna suhteessa sen osuuteen väestöstä.

Toiseksi tilanne, jossa muuttujien todellista jakautumista tai mitattavia ominaisuuksia ei tiedetä etukäteen, on paljon yleisempi kuin päinvastoin - ehkä sitä ei mitattu edellisessä väestölaskennassa. Siten edustava näyte on suunniteltava siten, että se heijastaa tarkasti olemassa olevaa jakaumaa, vaikka emme voi suoraan arvioida sen pätevyyttä. Otantamenettelyllä on oltava sisäinen logiikka, joka pystyy vakuuttamaan meidät siitä, että jos voisimme verrata näytettä väestönlaskentaan, se olisi todellakin edustava.

Tarjotakseen mahdollisuuden Tarkka heijastus tietyn väestön monimutkaisesta organisaatiosta ja tietty luottamus siihen, että ehdotetut menettelyt pystyvät tähän, tutkijat kääntyvät tilastollisiin menetelmiin. Näin tehdessään ne toimivat kahteen suuntaan. Ensinnäkin tutkijat päättävät tiettyjen sääntöjen (sisäinen logiikka) avulla, mitä objekteja tutkitaan, mitä tarkalleen sisällytetään tiettyyn otokseen. Toiseksi, he päättävät hyvin erilaisilla säännöillä, kuinka monta objektia valitaan. Emme tutki näitä lukuisia sääntöjä yksityiskohtaisesti, tarkastelemme vain niiden roolia valtiotieteen tutkimuksessa. Aloitetaan edustavan otoksen muodostavien objektien valintastrategioista.

Otospopulaation tutkimuksen perimmäinen tavoite on aina saada tietoa populaatiosta. Tätä varten näytetutkimuksen on täytettävä tietyt ehdot. Yksi tärkeimmistä ehdoista otoksen edustavuus (representatiivisuus).. Kuten aiemmin todettiin, erotetaan laadullinen ja määrällinen edustavuus.

Satunnaisuus, joka takaa tilastollisten tutkimusten laadullisen (rakenteellisen) edustavuuden, saavutetaan täyttämällä useita otosryhmien (joukkojen) muodostamisen ehtoja:

1. Jokaisella perusjoukon jäsenellä on oltava yhtä suuri todennäköisyys tulla mukaan otokseen.

2. Havaintoyksiköiden valinta yleisestä populaatiosta on suoritettava tutkittavasta piirteestä riippumatta. Jos valinta tehdään määrätietoisesti, on myös noudatettava tutkittavan piirteen jakauman riippumattomuuden ehtoja.

3. Valinta tulisi tehdä homogeenisista ryhmistä.

Otoksen ja yleisen perusjoukon mahdollisimman läheisyyden takaavien ehtojen noudattaminen varmistetaan erityisillä valintamenetelmillä. Muodostusmenetelmästä riippuen erotetaan seuraavat näytteet:

1. Näytteet, jotka eivät vaadi yleisen perusjoukon jakamista osiin (itse asiassa satunnainen toistuva tai ei-toistuva näytteenotto).

2. Näytteet, jotka edellyttävät yleisen populaation jakamista osiin (mekaaniset, tyypilliset tai typologiset näytteet, kohortti, parikonjugaattinäytteet).

Itse asiassa satunnaisotos muodostetaan satunnaisella valinnalla - satunnaisesti. Satunnainen valinta perustuu sekoitukseen. Esimerkiksi: pallon valitseminen urheilulotossa kaikkien pallojen sekoittamisen jälkeen, lottovoittonumeroiden valinta, potilaskorttien satunnainen valinta tutkimukseen jne. Joskus käytetään satunnaislukuja, jotka on saatu satunnaislukutaulukoista tai käyttämällä satunnaislukugeneraattoreita. Näiden lukujen mukaan yleisen perusjoukon ennalta numeroidusta taulukosta valitaan havaintoyksiköt, joiden numerot vastaavat pudonneita satunnaislukuja.

Kun teet satunnaisotosta, sen jälkeen kun objekti on valittu ja kaikki tarvittavat tiedot siitä rekisteröity, voit tehdä kaksi asiaa: objekti voidaan palauttaa tai sitä ei palauteta yleiseen perusjoukkoon. tämän perusteella näytettä kutsutaan toistuvaksi(esine palautetaan väestölle) tai ei-toistuva(esinettä ei palauteta väestölle). Koska useimmissa tilastotutkimuksissa toistuvien ja ei-toistuvien näytteiden välillä ei ole käytännössä mitään eroa, ehto on a priori hyväksytty, että näyte toistetaan.

Arvioi tarvittava näytekoko

Jotta otos edustaisi kvantitatiivisesti yleistä perusjoukkoa, on ensin arvioitava otokseen sisällytettävän tiedon määrä.

Yleisväestön koko on tuntematon uudelleennäytteenoton määrä, joka takaa edustavat tulokset, jos tulos näkyy indikaattorissa as suhteellinen arvo (osake), määritetään kaavalla:

jossa p on tutkittavan piirteen indikaattorin arvo prosentteina; q = (100- s) ;

t on luottamuskerroin, joka osoittaa, millä todennäköisyydellä indikaattorin koko ei ylitä rajavirheen rajoja (yleensä otetaan t = 2, mikä antaa 95 %:n todennäköisyyden virheettömälle ennusteelle);

 - indikaattorin rajavirhe.

Esimerkiksi: Yksi teollisuusyritysten työntekijöiden terveyttä kuvaavista indikaattoreista on niiden työntekijöiden prosenttiosuus, jotka eivät olleet sairaita vuoden aikana. Oletetaan, että teollisuussektorilla, johon tutkittu yritys kuuluu, tämä indikaattori on 25 %. Rajavirhe, joka voidaan sallia, jotta indikaattoriarvojen hajautus ei ylitä kohtuullisia rajoja, on 5 %. Tässä tapauksessa indikaattori voi ottaa arvoja 25 % ± 5 %, ts. 20 prosentista 30 prosenttiin. Oletetaan, että t = 2, saamme

Siinä tapauksessa, jos indikaattori on keskiarvo, niin havaintojen määrä voidaan määrittää kaavalla:

missä σ on standardipoikkeama, joka voidaan saada aikaisemmista tutkimuksista tai koe- (pilotti)tutkimusten perusteella.

Toistuvalla valinnalla ja tunnetun yleisen väestön ehdolla tarvittavan satunnaisotoskoon määrittämiseksi käytön yhteydessä suhteelliset arvot (osuudet) kaavaa sovelletaan:

keskiarvoille kaavaa käytetään:

missä N on yleisen populaation koko.

Perustuu yllä olevan esimerkin ehtoihin ja olettaen yleisen populaation koon N=500 työntekijöitä, saamme:

On helppo havaita, että ei-toistuvan näytteenoton vaadittu otoskoko on pienempi kuin toistuvan näytteenoton (vastaavasti 188 ja 300 työntekijää).

Yleensä edustavien tietojen saamiseksi vaadittavien havaintojen määrä vaihtelee käänteisesti sallitun virheen neliön kanssa.

Mekaaninen näytteenotto- otanta, kun havaintoyksiköt valitaan mekaanisesti tutkitusta populaatiosta. Esimerkiksi: joka viidennen tai joka kymmenennen työntekijän valinta yrityksen henkilöstöosaston korttien tai lääketieteellisen yksikön poliklinikan avohoitokorttien mukaan.

tyypillinen, typologinen tai kaavoitettu otanta sisältää yleisen väestön jakamisen useisiin laadullisesti homogeenisiin ryhmiin. Esimerkiksi: Kun tutkitaan korkeakouluopiskelijoiden ilmaantuvuutta syvälliseen tutkimiseen jokaisella kurssilla, valitaan kokoonpanoltaan tyypilliset opiskelijaryhmät. Usein tämä valintamenetelmä yhdistetään muihin menetelmiin. Esimerkiksi: kaupungin alue on jaettu tyypillisiin alueisiin pilaantumisasteesta riippuen, näillä alueilla havaintoryhmät muodostetaan satunnaisella valinnalla.

kohortin valinta viittaa kohdistettuun valintaan. Tällä menetelmällä yksilöt valitaan yleisestä populaatiosta (jakauma alaryhmiin ei-satunnainen), joita yhdistää minkä tahansa tutkimuksessa merkittävän merkin ilmaantumisen hetki tai tutkittu vaikutus (syntymävuosi, alkamisvuosi). sairaudesta, lääkkeen ottamisesta jne.).

Tapaus-kontrollitutkimus(SC) on eräänlainen epidemiologinen tutkimus, jossa riskitekijän jakautumista verrataan sairauspotilasryhmän ja kontrolliryhmän välillä. Tutkimus (SC) viittaa retrospektiiviseen, sillä tutkija jakaa potilaita ryhmiin sen mukaan, onko heillä sairaus vai ei, saa heiltä tietoa menneisyydestä.

Otantamenetelmän käyttöä saniteettitilastoissa on syytä tarkastella erikseen väestön yleistä sairastuvuutta tutkittaessa. Näytteenottomenetelmän teoreettiset lähtökohdat on testattu erityistutkimuksissa. Joten, V.S. Bykhovsky et ai. Vuonna 1928 he käsittelivät rinnakkain 132,8 tuhatta tautitietoa sisältävää korttia jatkuvalla menetelmällä ja joka viidennen kortin mekaanisella valinnalla. Tämän käsittelyn tulosten analyysi osoitti, että sairastuvuustutkimuksesta saadut tiedot olivat erittäin edustavia. Tähän päivään mennessä ei kuitenkaan ole olemassa yhtenäisiä metodologisia lähestymistapoja valikoivien saniteettitilastollisten tutkimusten suorittamiseen laajassa käytännössä.

Näytteen edustavuus

Parametrin nimi Merkitys
Artikkelin aihe: Näytteen edustavuus
Otsikko (teemaattinen luokka) Psykologia

Esimerkkivaatimukset

Otokseen sovelletaan useita pakollisia vaatimuksia, jotka määräytyvät ennen kaikkea tutkimuksen päämäärien ja tavoitteiden perusteella. Kokeen suunnitteluun tulee sisältyä sekä otoskoon että useiden sen ominaisuuksien huomioon ottaminen. Siten psykologisessa tutkimuksessa vaatimus homogeenisuus näytteet. Se tarkoittaa, että psykologi, joka tutkii esimerkiksi nuoria, ei voi ottaa aikuisia samaan otokseen. Päinvastoin, ikärajausmenetelmällä tehdyssä tutkimuksessa oletetaan periaatteessa eri-ikäisten koehenkilöiden läsnäoloa. Samalla tässä tapauksessa tulee huomioida otoksen homogeenisuus, mutta muiden kriteerien mukaan, ensisijaisesti kuten ikä ja sukupuoli. Homogeenisen otoksen muodostumisen perustana voivat olla erilaiset ominaisuudet, kuten älykkyystaso, kansallisuus, tiettyjen sairauksien puuttuminen jne. tutkimuksen tavoitteiden perusteella.

Yleisissä tilastoissa on käsite toistettu ja ei-toistuva valinnat, tai toisin sanoen valinnat, joilla on palautus ja ilman palautusta. Esimerkkinä yleensä annetaan säiliöstä otetun pallon valinta. Tasapelissä, jossa on palautus, jokainen valittu pallo palautetaan jälleen säiliöön, ja siksi se on valittava uudelleen. Ei-toistuvassa valinnassa kerran valittu pallo jätetään sivuun, eikä se voi enää osallistua valintaan. Psykologisesta tutkimuksesta löytyy analogeja tällaisille valikoivan tutkimuksen organisointimenetelmille, sillä psykologi joutuu usein testaamaan samoja koehenkilöitä useita kertoja samalla metodiikalla. Samanaikaisesti tarkalleen ottaen testausmenettely toistetaan tässä tapauksessa. Otos koehenkilöistä, joiden koostumus on täysin identtinen, toistuvissa tutkimuksissa on aina eroja kaikille ihmisille ominaisen toiminnallisen ja iän vaihtelun vuoksi. Tällainen menettelyn luonteen mukainen valinta toistetaan, vaikka termin merkitys on tässä selvästi erilainen kuin pallojen tapauksessa.

On tärkeää korostaa, että kaikki minkä tahansa näytteen vaatimukset kiteytyvät siihen tosiasiaan, että sen perusteella psykologin on saatava täydellisin, vääristymätön tieto sen yleisen populaation ominaisuuksista, josta tämä näyte on otettu. Toisin sanoen otoksen tulee kuvastaa mahdollisimman täydellisesti tutkittavan yleisen perusjoukon ominaisuuksia.

Kokeellisen otoksen koostumuksen tulee edustaa (simuloida) yleispopulaatiota, koska kokeessa saadut johtopäätökset oletetaan siirrettävän jatkossa koko yleiseen populaatioon. Tästä syystä näytteellä on oltava erityinen laatu - edustavuus, mahdollistaen siitä saatujen päätelmien laajentamisen koskemaan koko väestöä.

Otoksen edustavuus on erittäin tärkeää, mutta sen säilyttäminen on objektiivisista syistä erittäin vaikeaa. Näin ollen on hyvin tunnettu tosiasia, että 70–90 prosenttia kaikista ihmisen käyttäytymisen psykologisista tutkimuksista tehtiin Yhdysvalloissa 1960-luvun 60-luvulla korkeakouluopiskelijoiden kanssa, joista suurin osa oli psykologian opiskelijoita. Eläimillä tehdyissä laboratoriotutkimuksissa yleisin tutkimuskohde ovat rotat. Tästä syystä ei ole sattumaa, että psykologiaa kutsuttiin aiemmin "toisen opiskelijoiden ja valkoisten rottien tieteeksi". Yliopistopsykologian opiskelijat muodostavat vain 3% Yhdysvaltojen koko väestöstä. Ilmeisesti opiskelijaotos ei ole edustava mallina, joka väittää edustavansa koko maan väestöä.

Edustaja näyte tai, kuten sanotaan, edustaja otos on sellainen otos, jossa kaikki yleisen perusjoukon pääpiirteet ovat edustettuina suunnilleen samassa suhteessa ja samalla tiheydellä kuin tämä ominaisuus esiintyy tässä yleisessä populaatiossa. Toisin sanoen edustava otos on pienempi mutta tarkka malli populaatiosta, jota se on tarkoitettu edustamaan. Siltä osin kuin otos on edustava, tämän otoksen tutkimukseen perustuvia johtopäätöksiä voidaan tarkastella suurella varmuudella koko populaation osalta. Tätä tulosten levittämistä kutsutaan yleistettävyys.

Ihannetapauksessa edustavan otoksen tulisi olla sellainen, että jokainen psykologin tutkima perusominaisuus, piirteet, persoonallisuuden piirteet jne. olisi edustettuna siinä suhteessa samoihin piirteisiin yleisessä väestössä. Näiden vaatimusten mukaan näytteenottomenettelyllä tulee olla sisäinen logiikka, joka voi vakuuttaa tutkijan siitä, että yleiseen populaatioon verrattuna se todellakin osoittautuu edustavaksi, edustavaksi.

Erityistoiminnassaan psykologi toimii seuraavasti: hän perustaa alaryhmän (otoksen) yleiseen väestöön, tutkii tätä otosta yksityiskohtaisesti (suorittaa kokeellisen työn sen kanssa) ja sitten, jos tilastollisen analyysin tulokset sallivat, laajentaa löydöksiä koko väestölle. Nämä ovat psykologin työn päävaiheet näytteen kanssa.

Aloittelevan psykologin tulee muistaa usein toistuva virhe: joka kerta kun hän kerää tietoja millä tahansa menetelmällä ja mistä tahansa lähteestä, hänellä on aina houkutus laajentaa johtopäätöksensä koko väestöön. Tällaisen virheen välttämiseksi ei tarvitse olla vain maalaisjärkeä, vaan ennen kaikkea matemaattisten tilastojen peruskäsitteiden hallinta.

Otoksen edustavuus - käsite ja tyypit. Luokan "Otoksen edustavuus" luokittelu ja ominaisuudet 2017, 2018.

Edustavuuden käsite löytyy usein tilastoraportoinnista sekä puheiden ja raporttien valmistelusta. Ehkä ilman sitä on vaikea kuvitella minkäänlaista tietojen esittämistä tarkastettavaksi.

Edustavuus - mitä se on?

Edustavuus heijastaa sitä, kuinka valitut objektit tai osat vastaavat sen tietojoukon sisältöä ja merkitystä, josta ne on valittu.

Muut määritelmät

Edustavuuden käsitettä voidaan kehittää eri yhteyksissä. Mutta sen merkityksessä edustavuus on yleisestä populaatiosta valittujen yksiköiden ominaisuuksien ja ominaisuuksien vastaavuutta, jotka heijastavat tarkasti koko yleisen tietokannan ominaisuuksia kokonaisuutena.

Tiedon edustavuudella määritellään myös otosaineiston kyky edustaa populaation parametrejä ja ominaisuuksia, jotka ovat tärkeitä meneillään olevan tutkimuksen kannalta.

Edustava näyte

Otannan periaate on valita tärkeimmät ja heijastaa tarkasti koko tietojoukon ominaisuuksia. Tätä varten käytetään erilaisia ​​​​menetelmiä, joiden avulla saadaan tarkkoja tuloksia ja yleinen käsitys vain valikoivien materiaalien käytöstä, jotka kuvaavat kaikkien tietojen laatua.

Koko aineistoa ei siis tarvitse tutkia, vaan otoksen edustavuuden huomioiminen riittää. Mikä tämä on? Tämä on valikoima yksittäisiä tietoja, jotta saadaan käsitys tiedon kokonaismassasta.

Menetelmästä riippuen ne erotetaan todennäköisiksi ja epätodennäköisiksi. Probabilistinen on otos, joka tehdään laskemalla tärkeimmät ja kiinnostavimmat tiedot, jotka edustavat edelleen yleistä populaatiota. Tämä on tietoinen valinta tai satunnainen valinta, joka on kuitenkin perusteltu sisällöllään.

Uskomatonta - tämä on yksi satunnaisotannan lajeista, joka on koottu tavallisen arpajaisten periaatteen mukaisesti. Tässä tapauksessa tällaisen otoksen muodostajan mielipidettä ei oteta huomioon. Käytössä on vain sokkotontti.

Todennäköisyysotanta

Todennäköisyysnäytteet voidaan myös jakaa useisiin tyyppeihin:

  • Yksi yksinkertaisimmista ja ymmärrettävimmistä periaatteista on ei-edustava otanta. Tätä menetelmää käytetään usein esimerkiksi sosiaalisissa tutkimuksissa. Samanaikaisesti kyselyyn osallistujia ei valita joukosta millään erityisellä perusteella, vaan tiedot saadaan 50 ensimmäiseltä kyselyyn osallistuneelta.
  • Tarkoituksenmukaiset otokset eroavat toisistaan ​​siinä, että niillä on valinnassa useita vaatimuksia ja ehtoja, mutta ne perustuvat silti satunnaiseen sattumaan, eivätkä pyri saavuttamaan hyviä tilastoja.
  • Kiintiöpohjainen otanta on toinen muunnelma ei-todennäköisyyspohjaisesta otannasta, jota käytetään usein suurten tietojoukkojen tutkimiseen. Se käyttää paljon ehtoja. Objektit valitaan, joiden tulee vastata niitä. Eli yhteiskuntatutkimuksen esimerkin avulla voidaan olettaa, että haastatellaan 100 henkilöä, mutta tilastoraporttia laadittaessa otetaan huomioon vain tietyn määrän asetetut vaatimukset täyttävien ihmisten mielipide.

Todennäköisyysnäytteet

Todennäköisyyspohjaisille otoksille lasketaan joukko parametreja, joita otoksessa olevat kohteet vastaavat, ja niiden joukosta voidaan eri tavoin valita juuri ne tosiasiat ja tiedot, jotka esitetään otosdatan edustajina. Tällaisia ​​tapoja laskea tarvittavat tiedot voivat olla:

  • Yksinkertainen satunnainen näyte. Se koostuu siitä, että valitun segmentin joukosta täysin satunnainen arpajaismenetelmä valitsee vaaditun määrän tietoa, joka on edustava näyte.
  • Systemaattinen ja satunnainen otanta mahdollistaa järjestelmän laatimisen tarvittavien tietojen laskemiseksi satunnaisesti valitun segmentin perusteella. Jos siis ensimmäinen satunnaisluku, joka ilmaisee kokonaisjoukosta valitun datan järjestysnumeron, on 5, niin seuraava valittava data voi olla esimerkiksi 15, 25, 35 ja niin edelleen. Tämä esimerkki selittää selvästi, että jopa satunnainen valinta voi perustua tarvittavien syöttötietojen systemaattisiin laskelmiin.

Näyte kuluttajista

Tahallinen otanta on menetelmä, jossa otetaan huomioon jokainen yksittäinen segmentti ja sen arvioinnin perusteella muodostetaan populaatio, joka kuvastaa koko tietokannan ominaisuuksia ja ominaisuuksia. Tällä tavalla kerätään enemmän tietoa, joka täyttää edustavan otoksen vaatimukset. On helppo valita useita vaihtoehtoja, joita ei sisällytetä kokonaismäärään menettämättä koko väestöä edustavien valittujen tietojen laatua. Tällä tavalla selvitetään tutkimuksen tulosten edustavuus.

Otoskoko

Viimeinen käsiteltävänä oleva asia ei ole otoskoko edustavaa väestöä varten. Otoskoko ei aina riipu lähteiden määrästä yleisessä populaatiossa. Otospopulaation edustavuus riippuu kuitenkin suoraan siitä, kuinka moneen segmenttiin tulos tulee jakaa. Mitä enemmän tällaisia ​​segmenttejä, sitä enemmän dataa pääsee tuloksena olevaan otokseen. Jos tulokset vaativat yleistä merkintää eivätkä vaadi tarkkoja, niin vastaavasti otos pienenee, koska yksityiskohtiin menemättä tiedot esitetään pinnallisemmin, mikä tarkoittaa, että sen lukeminen on yleistä.

Edustavuusvirheen käsite

Edustavuusvirhe on erityinen ero perusjoukon ominaisuuksien ja otantatietojen välillä. Otostutkimusta suoritettaessa on mahdotonta saada ehdottoman tarkkoja tietoja, kuten yleisten populaatioiden täydellisessä tutkimuksessa ja otoksessa, joka sisältää vain osan tiedoista ja parametreista, kun taas yksityiskohtaisempi tutkimus on mahdollista vain koko populaatiota tutkiessa. Siksi jotkut virheet ja virheet ovat väistämättömiä.

Virhetyypit

Edustavaa otosta koottaessa tapahtuu joitain virheitä:

  • Systemaattinen.
  • Satunnainen.
  • Tahallista.
  • Tahaton.
  • Vakio.
  • Raja.

Syynä satunnaisten virheiden esiintymiseen voi olla yleisen populaation tutkimuksen epäjatkuvuus. Tyypillisesti edustavuuden satunnainen virhe on kooltaan ja luonteeltaan mitätön.

Systemaattisia virheitä puolestaan ​​syntyy, kun sääntöjä, jotka koskevat tietojen valitsemista kokonaisväestöstä, rikotaan.

Keskimääräinen virhe on ero otoksen keskiarvon ja taustajoukon välillä. Se ei riipu näytteen yksiköiden lukumäärästä. Se on kääntäen verrannollinen eli mitä suurempi tilavuus, sitä pienempi on keskivirheen arvo.

Rajavirhe on suurin mahdollinen ero otoksen keskiarvojen ja koko perusjoukon välillä. Tällaista virhettä luonnehditaan todennäköisten virheiden enimmäismääräksi niiden esiintymisolosuhteissa.

Tarkoitukselliset ja tahattomat edustavuusvirheet

Tietojen siirtymävirheet voivat olla tahallisia tai tahattomia.

Sitten tahallisten virheiden ilmaantumisen syynä on lähestymistapa tietojen valintaan trendien määritysmenetelmällä. Tahattomia virheitä tapahtuu jopa näytehavainnon valmisteluvaiheessa, jolloin muodostuu edustava otos. Tällaisten virheiden välttämiseksi on tarpeen luoda hyvä näytteenottokehys näytteenottoyksiköiden luetteloimiseksi. Sen on täytettävä täysin näytteenoton tavoitteet, oltava luotettava ja katettava kaikki tutkimuksen osa-alueet.

Validiteetti, luotettavuus, edustavuus. Virhelaskenta

Aritmeettisen keskiarvon (M) edustavuusvirheen (Mm) laskeminen.

Keskihajonta: otoskoko (>30).

Edustava virhe (Mr) ja (R): otoskoko (n>30).

Siinä tapauksessa, että joudut tutkimaan populaatiota, jossa näytteiden määrä on pieni ja alle 30 yksikköä, havaintojen määrä pienenee yhdellä yksiköllä.

Virheen suuruus on suoraan verrannollinen otoksen kokoon. Tiedon edustavuus ja tarkan ennusteen tekemisen mahdollisuuden asteen laskeminen heijastelee tiettyä määrää rajavirhettä.

Edustusjärjestelmät

Tiedon esittämisen arvioinnissa ei käytetä ainoastaan ​​edustavaa otosta, vaan tiedon vastaanottaja itse käyttää edustavia järjestelmiä. Siten aivot käsittelevät joitain luomalla edustavan otoksen koko tietovirrasta voidakseen arvioida lähetetyt tiedot laadullisesti ja nopeasti ja ymmärtää asian ydin. Vastaa kysymykseen: "Edustavuus - mitä se on?" - ihmistietoisuuden mittakaavassa on melko yksinkertaista. Tätä varten aivot käyttävät kaikkia aiheita riippuen siitä, millaista tietoa on eristettävä yleisestä virtauksesta. Siten he erottavat:

  • Visuaalinen esitysjärjestelmä, jossa silmän visuaalisen havainnoinnin elimet ovat mukana. Ihmisiä, jotka käyttävät usein tällaista järjestelmää, kutsutaan visuaaleiksi. Tämän järjestelmän avulla ihminen käsittelee kuvien muodossa tulevaa tietoa.
  • auditiivinen edustava järjestelmä. Pääasiallinen käytetty elin on kuulo. Tämä järjestelmä käsittelee äänitiedostojen tai puheen muodossa toimitettavaa tietoa. Ihmisiä, jotka havaitsevat tiedon paremmin korvalla, kutsutaan kuuloiksi.
  • Kinesteetiline esitysjärjestelmä on informaatiovirran käsittelyä havaitsemalla se haju- ja tuntokanavien kautta.
  • Digitaalista esitysjärjestelmää käytetään yhdessä muiden kanssa keinona saada tietoa ulkopuolelta. vastaanotetun tiedon havaitseminen ja ymmärtäminen.

Joten edustavuus - mitä se on? Yksinkertainen valinta joukosta vai yhtenäinen prosessi tietojenkäsittelyssä? Voimme ehdottomasti sanoa, että edustavuus määrää suurelta osin käsityksemme tietovirroista, mikä auttaa erottamaan merkittävimmän ja merkittävimmän siitä.

Väestö- joukko yksiköitä, joilla on massaluonne, tyypillisyys, laadullinen yhtenäisyys ja vaihtelu.

Tilastojoukko koostuu aineellisesti olemassa olevista objekteista (Työntekijät, yritykset, maat, alueet), on objekti.

Väestöyksikkö- tilastollisen perusjoukon kukin tietty yksikkö.

Yksi ja sama tilastollinen populaatio voi olla homogeeninen yhdeltä piirteeltä ja heterogeeninen toiselta.

Laadullinen yhtenäisyys- perusjoukon kaikkien yksiköiden samankaltaisuus minkä tahansa ominaisuuden osalta ja erilaisuus kaikkien muiden osalta.

Tilastojoukossa erot perusjoukon yksikön ja toisen välillä ovat useammin määrällisiä. Kvantitatiivisia muutoksia populaation eri yksiköiden attribuuttien arvoissa kutsutaan vaihteluksi.

Ominaisuuden vaihtelu- merkin määrällinen muutos (kvantitatiiviselle merkille) siirtymisen aikana väestöyksiköstä toiseen.

merkki- tämä on yksiköiden, esineiden ja ilmiöiden ominaisuus, ominaisuus tai muu ominaisuus, joka voidaan havaita tai mitata. Merkit jaetaan kvantitatiivisiin ja laadullisiin. Ominaisuuden arvon monimuotoisuutta ja vaihtelevuutta populaation yksittäisissä yksiköissä kutsutaan vaihtelua.

Attributiiviset (laadulliset) piirteet eivät ole mitattavissa (väestön kokoonpano sukupuolen mukaan). Kvantitatiivisilla ominaisuuksilla on numeerinen ilmaisu (väestön kokoonpano iän mukaan).

Indeksi- Tämä on yksiköiden tai aggregaattien minkä tahansa ominaisuuden yleistävä määrällinen ja laadullinen ominaisuus tiettyyn tarkoitukseen tietyissä aika- ja paikkaolosuhteissa.

Tuloskortti on joukko indikaattoreita, jotka kuvaavat kattavasti tutkittavaa ilmiötä.

Harkitse esimerkiksi palkkaa:
  • Merkki - palkat
  • Tilastollinen väestö - kaikki työntekijät
  • Väestön yksikkö on jokainen työntekijä
  • Laadullinen homogeenisuus - kertynyt palkka
  • Ominaisuuden variaatio - numerosarja

Yleinen populaatio ja näyte siitä

Perusta on joukko tietoja, jotka on saatu yhden tai useamman ominaisuuden mittaamisen tuloksena. Tosiasiallisesti havaittu objektijoukko, jota tilastollisesti edustaa satunnaismuuttujan havaintojen sarja, on näytteenotto, ja hypoteettisesti olemassa oleva (ajatteltu) - yleinen väestö. Yleinen populaatio voi olla äärellinen (havaintojen määrä N = vakio) tai ääretön ( N = ∞), ja otos yleisestä populaatiosta on aina tulosta rajoitetusta määrästä havaintoja. Otoksen muodostavien havaintojen lukumäärää kutsutaan otoskoko. Jos näytekoko on riittävän suuri n→∞) näyte otetaan huomioon iso, muuten sitä kutsutaan näytteeksi rajoitettu määrä. Näyte otetaan huomioon pieni, jos yksiulotteista satunnaismuuttujaa mitattaessa otoskoko ei ylitä 30 ( n<= 30 ), ja kun mitataan samanaikaisesti useita ( k) ominaisuuksia moniulotteisessa avaruussuhteessa n to k vähemmän kuin 10 (n/k< 10) . Mallilomakkeet variaatiosarja jos sen jäseniä ovat tilaustilastot eli satunnaismuuttujan näytearvot X lajitellaan nousevaan järjestykseen (sijoitetaan), määritteen arvot kutsutaan vaihtoehtoja.

Esimerkki. Melkein samaa satunnaisesti valittua objektijoukkoa - Moskovan yhden hallintoalueen liikepankkeja - voidaan pitää otoksena kaikkien tämän alueen liikepankkien väestöstä ja otoksena kaikkien Moskovan liikepankkien yleisestä populaatiosta. , sekä näyte maan liikepankeista jne.

Perusnäytteenottomenetelmät

Tilastollisten johtopäätösten luotettavuus ja tulosten mielekäs tulkinta riippuu mm edustavuus näytteitä, ts. yleisen perusjoukon ominaisuuksien esittämisen täydellisyys ja riittävyys, joihin nähden tätä otosta voidaan pitää edustavana. Väestön tilastollisten ominaisuuksien tutkimus voidaan järjestää kahdella tavalla: käyttämällä jatkuva ja epäjatkuva. Jatkuva havainto sisältää kaiken tutkimisen yksiköitä opiskellut aggregaatteja, a epäjatkuva (valikoiva) havainto- vain osia siitä.

Näytteenoton järjestämiseen on viisi päätapaa:

1. yksinkertainen satunnainen valinta, jossa objektit poimitaan satunnaisesti yleisestä objektijoukosta (esimerkiksi taulukon tai satunnaislukugeneraattorin avulla), ja jokaisella mahdollisella näytteellä on yhtä suuri todennäköisyys. Tällaisia ​​näytteitä kutsutaan itse asiassa satunnainen;

2. yksinkertainen valinta tavanomaisella menettelyllä suoritetaan mekaanisella komponentilla (esim. päivämäärät, viikonpäivät, asuntojen numerot, aakkosten kirjaimet jne.) ja näin saadut näytteet ovat ns. mekaaninen;

3. kerrostunut valinta koostuu siitä, että yleinen tilavuusjoukko on jaettu tilavuuden osajoukkoihin tai kerroksiin (ositteisiin) siten, että . Ositteet ovat tilastollisilta ominaisuuksiltaan homogeenisia objekteja (esim. väestö on jaettu ositteisiin ikä- tai yhteiskuntaluokkien mukaan; yritykset toimialoittain). Tässä tapauksessa näytteet kutsutaan kerrostunut(muuten, kerrostunut, tyypillinen, kaavoitettu);

4. menetelmät sarja valintaa käytetään muodostamiseen sarja tai sisäkkäisiä näytteitä. Ne ovat käteviä, jos on tarpeen tutkia "lohko" tai sarja esineitä kerralla (esimerkiksi tavaraerä, tietyn sarjan tuotteet tai maan aluehallinnollisen jaon väestö). Sarjojen valinta voidaan tehdä satunnaisesti tai mekaanisesti. Samalla suoritetaan jatkuva tutkimus tietylle tavaraerälle tai koko alueelliselle yksikölle (asuinrakennus tai kortteli);

5. yhdistetty(porrastettu) valinta voi yhdistää useita valintamenetelmiä kerralla (esimerkiksi kerrostettu ja satunnainen tai satunnainen ja mekaaninen); tällaista näytettä kutsutaan yhdistetty.

Valintatyypit

Tekijä: mieleen on yksilö-, ryhmä- ja yhdistetty valinta. klo yksilöllinen valinta yksittäiset yksiköt yleisestä populaatiosta valitaan otosjoukosta, jossa ryhmän valinta ovat laadullisesti homogeenisia yksikköryhmiä (sarjoja) ja yhdistetty valikoima sisältää ensimmäisen ja toisen tyypin yhdistelmän.

Tekijä: menetelmä valinta erottaa toistuva ja ei-toistuva näyte.

Toistamaton kutsutaan valinnaksi, jossa otokseen pudonnut yksikkö ei palaa alkuperäiseen perusjoukkoon eikä osallistu jatkovalintaan; kun taas yleisen väestön yksiköiden lukumäärä N vähennetään valintaprosessin aikana. klo toistettu valinta sai kiinni otoksessa yksikkö rekisteröinnin jälkeen palautetaan yleiseen perusjoukkoon ja näin ollen säilyy yhtäläinen mahdollisuus muiden yksiköiden kanssa käytettäväksi jatkovalintamenettelyssä; kun taas yleisen väestön yksiköiden lukumäärä N säilyy ennallaan (menetelmää käytetään harvoin sosioekonomisissa tutkimuksissa). Kuitenkin suurella N (N → ∞) kaavat toistamaton valikoima on lähellä niitä toistettu valinta ja jälkimmäisiä käytetään melkein useammin ( N = vakio).

Yleisen ja otosjoukon parametrien tärkeimmät ominaisuudet

Tutkimuksen tilastollisten päätelmien perustana on satunnaismuuttujan jakauma, kun taas havaitut arvot (x 1, x 2, ..., x n) kutsutaan satunnaismuuttujan realisaatioiksi X(n on otoksen koko). Satunnaismuuttujan jakauma yleisväestössä on teoreettinen, luonteeltaan ihanteellinen ja sen otosanalogi on empiirinen jakelu. Jotkut teoreettiset jakaumat on annettu analyyttisesti, ts. niitä vaihtoehtoja määritä jakaumafunktion arvo kussakin pisteessä satunnaismuuttujan mahdollisten arvojen avaruudessa. Tästä syystä näytteen jakautumisfunktion määrittäminen on vaikeaa ja joskus mahdotonta vaihtoehtoja estimoidaan empiirisestä tiedosta ja sitten ne korvataan teoreettista jakaumaa kuvaavaksi analyyttiseksi lausekkeeksi. Tässä tapauksessa oletus (tai hypoteesi) jakauman tyypistä voi olla sekä tilastollisesti oikea että virheellinen. Mutta joka tapauksessa otoksesta rekonstruoitu empiirinen jakauma luonnehtii vain karkeasti todellista. Tärkeimmät jakeluparametrit ovat odotettu arvo ja dispersio.

Jakaumat ovat luonteeltaan sellaisia jatkuva ja diskreetti. Tunnetuin jatkuva jakelu on normaali. Parametrien ja sen selektiivisiä analogeja ovat: keskiarvo ja empiirinen varianssi. Yksittäisistä sosioekonomisissa tutkimuksissa yleisimmin käytetty vaihtoehto (dikotominen) jakelu. Tämän jakauman odotusparametri ilmaisee suhteellisen arvon (tai Jaa) populaation yksiköt, joilla on tutkittava ominaisuus (se on merkitty kirjaimella ); se osuus väestöstä, jolla ei ole tätä ominaisuutta, on merkitty kirjaimella q (q = 1 - p). Vaihtoehtoisen jakauman varianssilla on myös empiirinen analogi.

Jakauman tyypistä ja populaatioyksiköiden valintatavasta riippuen jakautumisparametrien ominaisuudet lasketaan eri tavalla. Tärkeimmät teoreettisille ja empiirisille jakaumille on esitetty taulukossa. 9.1.

Näyteosuus k n on otosjoukon yksiköiden lukumäärän suhde yleisen perusjoukon yksiköiden lukumäärään:

k n = n/N.

Näyteosuus w on niiden yksiköiden suhde, joilla on tutkittava ominaisuus x näytteen kokoon n:

w = n n/n.

Esimerkki. 1000 yksikköä sisältävässä tavaraerässä, 5 % näytteellä näytefraktio k n absoluuttisena arvona on 50 yksikköä. (n = N*0,05); jos tästä näytteestä löytyy 2 viallista tuotetta, niin näytefraktio w on 0,04 (w = 2/50 = 0,04 tai 4 %).

Koska otospopulaatio eroaa yleisestä populaatiosta, niitä on näytteenottovirheet.

Taulukko 9.1 Yleisten ja otospopulaatioiden pääparametrit

Näytteenottovirheet

Missä tahansa (kiinteässä ja valikoivassa) voi tapahtua kahdenlaisia ​​virheitä: rekisteröinti ja edustavuus. Virheitä rekisteröinti voi olla satunnainen ja järjestelmällinen merkki. Satunnainen virheet johtuvat monista erilaisista hallitsemattomista syistä, ovat luonteeltaan tahattomia ja yleensä tasapainottavat toisiaan yhdistelmänä (esimerkiksi huoneen lämpötilan vaihteluiden aiheuttamat muutokset instrumentin lukemissa).

Systemaattinen virheet ovat puolueellisia, koska ne rikkovat näytteen kohteiden valinnan sääntöjä (esimerkiksi mittauspoikkeamat mittalaitteen asetuksia muuttaessa).

Esimerkki. Kaupungin väestön sosiaalisen aseman arvioimiseksi on tarkoitus tutkia 25 % perheistä. Jos kuitenkin joka neljännen asunnon valinta perustuu sen lukumäärään, on olemassa vaara, että valitaan kaikki vain yhden tyyppiset asunnot (esim. yksiö), mikä aiheuttaa systemaattisen virheen ja vääristää tuloksia; asunnon numeron valinta arvalla on parempi, koska virhe on satunnainen.

Edustusvirheet vain valikoivalle havainnoinnille ominaisia, niitä ei voida välttää ja ne syntyvät siitä, että näyte ei täysin toista yleistä. Otuksesta saatujen indikaattoreiden arvot eroavat samojen arvojen indikaattoreista yleisessä populaatiossa (tai jatkuvan havainnoinnin aikana saaduista).

Näytteenottovirhe on yleisen perusjoukon parametrin arvon ja sen otosarvon välinen ero. Kvantitatiivisen attribuutin keskiarvo on yhtä suuri kuin: , ja osuus (vaihtoehtoinen attribuutti) - .

Otantavirheet ovat luontaisia ​​vain näytehavainnoissa. Mitä suurempia nämä virheet ovat, sitä enemmän empiirinen jakauma eroaa teoreettisesta. Empiirisen jakauman parametrit ja ovat satunnaismuuttujia, joten näytteenottovirheet ovat myös satunnaismuuttujia, ne voivat saada eri arvoja eri näytteille, ja siksi on tapana laskea keskimääräinen virhe.

Keskimääräinen näytteenottovirhe on arvo, joka ilmaisee otoksen keskiarvon keskihajonnan matemaattisesta odotuksesta. Tämä arvo satunnaisvalinnan periaatteen mukaisesti riippuu ensisijaisesti otoksen koosta ja ominaisuuden vaihteluasteesta: mitä suurempi ja pienempi piirteen vaihtelu (siis arvo ), sitä pienempi on ominaisuuden arvo. keskimääräinen näytteenottovirhe. Yleisen ja otospopulaation varianssien välinen suhde ilmaistaan ​​kaavalla:

nuo. riittävän suurille, voimme olettaa, että . Keskimääräinen otantavirhe osoittaa näytejoukon parametrin mahdolliset poikkeamat yleisen perusjoukon parametrista. Taulukossa. 9.2 näyttää lausekkeet keskimääräisen näytteenottovirheen laskemiseksi eri havainnoinnin organisointimenetelmille.

Taulukko 9.2 Näytteen keskiarvon ja osuuden keskivirhe (m) eri näytetyypeille

Missä on jatkuvan ominaisuuden ryhmän sisäisten näytteiden varianssien keskiarvo;

Osuuden ryhmän sisäisten hajautusten keskiarvo;

— valittujen sarjojen lukumäärä, — sarjojen kokonaismäärä;

,

missä on th-sarjan keskiarvo;

- jatkuvan ominaisuuden koko otoksen yleinen keskiarvo;

,

missä on piirteen osuus th-sarjassa;

— ominaisuuden kokonaisosuus koko otoksesta.

Keskimääräisen virheen suuruus voidaan kuitenkin arvioida vain tietyllä todennäköisyydellä Р (Р ≤ 1). Ljapunov A.M. osoitti, että otoskeskiarvojen jakauma ja siten niiden poikkeamat yleisestä keskiarvosta riittävän suurella luvulla noudattavat suunnilleen normaalijakauman lakia edellyttäen, että yleisellä populaatiolla on äärellinen keskiarvo ja rajoitettu varianssi.

Matemaattisesti tämä keskiarvon väite ilmaistaan ​​seuraavasti:

ja murtoluvulle lauseke (1) on muodossa:

missä - on marginaalinen otantavirhe, joka on keskimääräisen näytteenottovirheen kerrannainen , ja kerrannaistekijä on Studentin kriteeri ("luottamustekijä"), jonka on ehdottanut W.S. Gosset (salanimi "Opiskelija"); eri näytekokojen arvot tallennetaan erityiseen taulukkoon.

Funktion Ф(t) arvot joillekin t:n arvoille ovat:

Siksi lauseke (3) voidaan lukea seuraavasti: todennäköisyydellä P = 0,683 (68,3 %) voidaan väittää, että ero otoksen ja yleisen keskiarvon välillä ei ylitä yhtä keskivirheen arvoa m(t=1), todennäköisyydellä P = 0,954 (95,4 %)— se ei ylitä kahden keskivirheen arvoa m (t = 2) , todennäköisyydellä P = 0,997 (99,7 %)- ei ylitä kolmea arvoa m (t = 3). Näin ollen todennäköisyys, että tämä ero ylittää kolme kertaa keskivirheen arvon, määrää virhetaso eikä ole enempää kuin 0,3% .

Taulukossa. 9.3 Kaavat otosmarginaalivirheen laskemiseksi on annettu.

Taulukko 9.3 Marginaalinen otantavirhe (D) keskiarvolle ja suhteelle (p) eri otostyypeille

Otostulosten laajentaminen väestöön

Otoshavainnoinnin perimmäinen tavoite on karakterisoida yleinen populaatio. Pienillä otoskooilla parametrien ( ja ) empiiriset arviot voivat poiketa merkittävästi niiden todellisista arvoista ( ja ). Siksi on tarpeen määrittää rajat, joiden sisällä parametrien ( ja ) näytearvojen todelliset arvot ( ja ) ovat.

Luottamusväli minkä tahansa yleisen perusjoukon parametrin θ arvoa kutsutaan tämän parametrin satunnaiseksi arvoalueeksi, joka todennäköisyydellä on lähellä 1 ( luotettavuus) sisältää tämän parametrin todellisen arvon.

marginaalinen virhe näytteet Δ voit määrittää väestön ja niiden ominaisuuksien raja-arvot luottamusvälit, jotka ovat yhtä suuria kuin:

Bottom line luottamusväli saatu vähentämällä marginaalinen virhe näytteen keskiarvosta (osuus) ja ylin lisäämällä se.

Luottamusväli keskiarvoa varten se käyttää marginaalista otantavirhettä ja tietylle luottamustasolle määritetään kaavalla:

Tämä tarkoittaa, että tietyllä todennäköisyydellä R, jota kutsutaan luottamustasoksi ja jonka arvo määrittää yksiselitteisesti t, voidaan väittää, että keskiarvon todellinen arvo on alueella alkaen , ja osakkeen todellinen arvo on välillä

Kun lasketaan kolmen vakioluottamustason luottamusväliä P = 95 %, P = 99 % ja P = 99,9 % arvon valitsee . Sovellukset vapausasteiden lukumäärästä riippuen. Jos otoskoko on riittävän suuri, arvot vastaavat näitä todennäköisyyksiä t ovat tasavertaisia: 1,96, 2,58 ja 3,29 . Näin ollen marginaalinen otantavirhe antaa meille mahdollisuuden määrittää yleisen populaation ominaisuuksien marginaaliarvot ja niiden luottamusvälit:

Sosioekonomisissa tutkimuksissa valikoivan havainnoinnin tulosten jakautumisella suurelle väestölle on omat ominaisuutensa, koska se edellyttää kaikkien sen tyyppien ja ryhmien edustavuuden täydellisyyttä. Tällaisen jakauman mahdollisuuden perustana on laskelma suhteellinen virhe:

missä Δ % - suhteellinen marginaalinen otantavirhe; , .

Otoshavainnon laajentamiseksi populaatioon on kaksi päämenetelmää: suora muunnos ja kertoimien menetelmä.

Essence suora muuntaminen on kertoa otoksen keskiarvo!!\overline(x) populaation koolla .

Esimerkki. Arvioidaan otosmenetelmällä kaupungin taaperoiden keskimääräinen määrä ja määrä on henkilöä. Jos kaupungissa on 1000 nuorta perhettä, saadaan kunnallisessa päiväkodissa tarvittava paikkamäärä kertomalla tämä keskiarvo väestön koolla N = 1000, ts. tulee olemaan 1200 paikkaa.

Kertoimien menetelmä on suositeltavaa käyttää siinä tapauksessa, kun suoritetaan valikoivaa havainnointia jatkuvan havainnoinnin tietojen selkeyttämiseksi.

Tällöin käytetään kaavaa:

jossa kaikki muuttujat ovat populaation kokoa:

Vaadittu näytekoko

Taulukko 9.4 Vaadittu otoskoko (n) erityyppisille otantaorganisaatioille

Suunniteltaessa otantatutkimusta ennalta määrätyllä sallitun otantavirheen arvolla, on välttämätöntä arvioida oikein vaadittu otoskoko. Tämä määrä voidaan määrittää valikoivan havainnon aikana sallitun virheen perusteella tietyllä todennäköisyydellä, joka takaa hyväksyttävän virhetason (ottaen huomioon havainnon järjestämisen). Kaavat vaaditun otoskoon n määrittämiseksi saadaan helposti suoraan otosmarginaalivirheen kaavoista. Joten marginaalivirheen lausekkeesta:

otoskoko määritetään suoraan n:

Tämä kaava osoittaa, että näytteenoton marginaalivirheen pieneneminen Δ lisää merkittävästi vaadittua otoskokoa, joka on verrannollinen Studentin t-testin varianssiin ja neliöön.

Tiettyä havainnointimenetelmää varten tarvittava otoskoko lasketaan taulukossa annettujen kaavojen mukaisesti. 9.4

Käytännön laskentaesimerkkejä

Esimerkki 1. Jatkuvan kvantitatiivisen ominaisuuden keskiarvon ja luottamusvälin laskeminen.

Selvityksen nopeuden arvioimiseksi pankissa velkojien kanssa otettiin satunnaisotannalla 10 maksuasiakirjaa. Niiden arvot osoittautuivat yhtä suureksi (päivinä): 10; 3; viisitoista; viisitoista; 22; 7; kahdeksan; yksi; 19; kaksikymmentä.

Vaaditaan todennäköisyydellä P = 0,954 määrittää rajavirhe Δ otoskeskiarvot ja keskimääräisen laskenta-ajan luottamusrajat.

Ratkaisu. Keskiarvo lasketaan taulukon kaavalla. 9.1 otospopulaatiolle

Dispersio lasketaan taulukon kaavan mukaan. 9.1.

Päivän keskimääräinen neliövirhe.

Keskiarvon virhe lasketaan kaavalla:

nuo. keskiarvo on x ± m = 12,0 ± 2,3 päivää.

Keskiarvon luotettavuus oli

Rajavirhe lasketaan taulukon kaavalla. 9.3 uudelleenvalintaa varten, koska populaation kokoa ei tiedetä, ja varten P = 0,954 luottamustaso.

Siten keskiarvo on `x ± D = `x ± 2m = 12,0 ± 4,6, ts. sen todellinen arvo on välillä 7,4-16,6 päivää.

Opiskelijapöydän käyttö. Sovelluksen avulla voimme päätellä, että n = 10 - 1 = 9 vapausasteella saatu arvo on luotettava merkitsevyystasolla a £ 0,001, ts. tuloksena saatu keskiarvo eroaa merkittävästi 0:sta.

Esimerkki 2. Todennäköisyyden arvio (yleinen osuus) r.

Mekaanisella otantamenetelmällä, jossa selvitettiin 1000 perheen sosiaalista asemaa, paljastui, että pienituloisten perheiden osuus oli w = 0,3 (30 %)(näyte oli 2% , eli n/N = 0,02). Vaaditaan luottamustasolla p = 0,997 määritä indikaattori R pienituloisille perheille koko alueella.

Ratkaisu. Esitettyjen funktioarvojen mukaan Ф(t) löytää tietylle luottamustasolle P = 0,997 merkitys t = 3(katso kaava 3). Marginaaliosuuden virhe w määrittää taulukon kaavalla. 9.3 ei-toistuva näytteenotto (mekaaninen näytteenotto on aina ei-toistuvaa):

Suhteellisen näytteenottovirheen rajoittaminen % tulee olemaan:

Pienituloisten perheiden todennäköisyys (yleinen osuus) alueella tulee olemaan p=w±Δw, ja luottamusrajat p lasketaan kaksois-epäyhtälön perusteella:

w — Δw ≤ p ≤ w — Δw, eli p:n todellinen arvo on:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Näin ollen todennäköisyydellä 0,997 voidaan väittää, että pienituloisten perheiden osuus alueen kaikista perheistä vaihtelee 28,6 prosentista 31,4 prosenttiin.

Esimerkki 3 Keskiarvon ja luottamusvälin laskeminen intervallisarjan määrittämälle diskreetille ominaisuudelle.

Taulukossa. 9.5 asetetaan tilausten tuotantoa koskevien sovellusten jakelu sen mukaan, milloin yritys toteuttaa ne.

Taulukko 9.5 Havaintojen jakautuminen esiintymisajan mukaan

Ratkaisu. Keskimääräinen tilauksen valmistumisaika lasketaan kaavalla:

Keskimääräinen aika on:

= (3 * 20 + 9 * 80 + 24 * 60 + 48 * 20 + 72 * 20) / 200 = 23,1 kuukautta

Saamme saman vastauksen, jos käytämme p i:n tietoja taulukon toiseksi viimeisestä sarakkeesta. 9.5 kaavalla:

Huomaa, että viimeisen asteikon välin keskikohta löydetään täydentämällä sitä keinotekoisesti edellisen asteikon välin leveydellä, joka on 60 - 36 = 24 kuukautta.

Dispersio lasketaan kaavalla

missä x i- intervallisarjan keskikohta.

Siksi!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) ja vakiovirhe on .

Keskiarvon virhe lasketaan kaavalla kuukausille, ts. keskiarvo on!!\overline(x) ± m = 23,1 ± 13,4.

Rajavirhe lasketaan taulukon kaavalla. 9.3 uudelleenvalintaa varten, koska populaation kokoa ei tiedetä, luottamustasolle 0,954:

Eli keskiarvo on:

nuo. sen todellinen arvo on välillä 0-50 kuukautta.

Esimerkki 4 Yrityksen N = 500 yrityksen velkojien kanssa tapahtuvien selvitysten nopeuden määrittämiseksi liikepankissa on tarpeen suorittaa valikoiva tutkimus satunnaisen ei-toistuvan valinnan menetelmällä. Määritä vaadittu otoskoko n siten, että todennäköisyydellä P = 0,954 otoskeskiarvon virhe ei ylitä 3 päivää, jos koeestimaatit osoittivat, että keskihajonna s oli 10 päivää.

Ratkaisu. Tarvittavien tutkimusten lukumäärän n määrittämiseksi käytämme ei-toistuvan valinnan kaavaa taulukosta. 9.4:

Siinä t:n arvo määritetään luotettavuustasolle Р = 0,954. Se on yhtä kuin 2. Neliön keskiarvo s = 10, populaation koko N = 500 ja keskiarvon rajavirhe Δ x = 3. Korvaamalla nämä arvot kaavaan, saamme:

nuo. riittää, että tehdään 41 yrityksen otos, jotta voidaan arvioida vaadittu parametri - selvitysten nopeus velkojien kanssa.