Näytekoko kuinka kaava löytyy. Otoskoko - sosiologisen tutkimuksen valikoiva menetelmä

Tilastot tietävät kaiken. Ja Ilf ja E. Petrov, "12 tuolia"

Kuvittele, että rakennat suurta kauppakeskusta ja haluat arvioida pysäköintialueen sisäänkäynnin liikennevirtoja. Ei, annetaan toinen esimerkki… he eivät koskaan tee sitä joka tapauksessa. Sinun on arvioitava portaalisi vierailijoiden makumieltymykset, jota varten sinun on suoritettava heidän keskuudessaan kysely. Kuinka yhdistää datamäärä ja mahdollinen virhe? Ei mitään monimutkaista – mitä suurempi otos, sitä pienempi virhe. Tässä on kuitenkin myös vivahteita.

Teoreettinen minimi

Ei ole tarpeetonta virkistää muistiamme, nämä termit ovat hyödyllisiä meille myöhemmin.

  • väestö- Joukko kaikkia kohteita, joista tutkimusta tehdään.
  • Näyte– Osajoukko, osa koko väestön esineitä, joka on suoraan mukana tutkimuksessa.
  • Tyypin I virhe- (α) Nollahypoteesin hylkäämisen todennäköisyys, vaikka se on totta.
  • Tyypin II virhe- (β) Todennäköisyys ei hylkää nollahypoteesi, kun se on väärä.
  • 1-β- Kriteerin tilastollinen teho.
  • μ 0 ja μ 1- Keskiarvot nolla- ja vaihtoehtoisten hypoteesien alla.


Jo ensimmäisen ja toisen tyyppisten virheiden määritelmissä on tilaa keskustelulle ja tulkinnalle. Kuinka päättää niistä ja kumpi valita nollaksi? Jos tutkit maaperän tai veden saastumisen tasoa, miten muotoilet nollahypoteesin: onko saastumista vai eikö ole saastumista? Mutta tästä näytteen koko riippuu esineiden yleisestä populaatiosta.



Alkukirjain väestö, yhtä hyvin kuin näyte voi olla mikä tahansa jakauma, mutta keskiarvolla on normaali tai Gaussin jakauma Keskirajalauseen ansiosta.


Mitä tulee jakautumisparametreihin ja erityisesti keskiarvoon, useat johtopäätökset ovat mahdollisia. Ensimmäinen jota kutsutaan luottamusväli. Se osoittaa parametrin mahdollisten arvojen alueen määritetyillä arvoilla luottamustekijä. Joten esimerkiksi 100(1-α)% luottamusväli varten μ tulee olemaan näin (Lv. 1).




Toinen johtopäätöksestä hypoteesin testaus. Se voi olla jotain tällaista.

  • H 0: μ = h
  • H 1: µ > h
  • H2: μ< h

FROM luottamusväli 100 (1-α) varten μ voit tehdä valinnan H 1:n ja H 2:n hyväksi:

  • Jos alaraja luottamusväli 100 (1-α)< h , то тогда hylkää H 0 H2:n hyväksi.
  • Jos yläraja luottamusväli 100(1-a) > h, sitten hylkää H 0 H1:n hyväksi.
  • Jos luottamusväli 100(1-α) sisältää h, silloin emme voi hylätä H 0 ja tällaista tulosta pidetään määrittelemättömänä.

Jos meidän on tarkistettava arvo μ yhdelle näytteet koko väestöstä, kriteeri saa muodon



Luottamusväli, virhe ja otoskoko

Ota ensimmäinen yhtälö ja ilmaise leveys sieltä luottamusväli(Lv. 2).



Joissakin tapauksissa voimme korvata Studentin t-tilaston z-standardin normaalijakaumalla. Toinen yksinkertaistus korvaa puolet w mittausvirheeseen E. Tällöin yhtälömme saa muodon (yhtälö 3).



Kuten näemme virhe todella pienenee syötetietojen määrän kasvaessa. Mistä on helppo saada etsimäsi (yhtälö 4).


Harjoittele - laske R:n kanssa

Testataan hypoteesia, että ansassa olevien hyönteisten lukumäärästä annetun näytteen keskiarvo on 1.

  • H 0: μ = 1
  • H1: μ > 1
Ötökät 0 1 2 3 4 5 6
Ansoja 10 9 5 5 1 2 1

> x<- read.table("/tmp/tcounts.txt") >y = unlist(x, use.names="false") > keskiarvo(z);sd(z) 1,636364 1,654883

Huomaa, että keskiarvo ja keskihajonta ovat lähes yhtä suuret, mikä on luonnollista Poisson-jakauman kohdalla. 95 %:n luottamusväli Studentin t-tilastolle ja df=32 .


> qt(.975, 32) 2.036933

ja lopuksi saamme keskiarvon kriittisen välin: 1.05 - 2.22 .


> μ=keskiarvo(z) > st = qt(.975, 32) > μ + st * sd(z)/sqrt(33) 2,223159 > μ - st * sd(z)/sqrt(33) 1,049568

Tämän seurauksena H 0 tulisi hylätä ja H 1 hyväksyä, koska todennäköisyydellä 95 %. μ > 1.


Samassa esimerkissä olettaen, että tiedämme todellisen keskihajonnan - σ , etkä sen satunnaisotoksella saatua estimaattia, voit laskea vaaditun n:n tietylle virheelle. Lasketaan E=0,5 .


> za2 = qnorm(.975) > (za2*sd(z)/.5)^2 42.08144

tuulen korjaus

Itse asiassa ei ole mitään syytä uskoa, että saamme tietää σ (varianssi), kun μ (tarkoittaa) meidän on vielä arvioitava. Tämän vuoksi yhtälöstä 4 on vain vähän käytännön hyötyä, lukuun ottamatta erityisen hienostuneita esimerkkejä kombinatoriikan alalta, ja realistinen yhtälö n:lle on hieman monimutkaisempi tuntemattomille σ (Lv. 5).



ota huomioon, että σ viimeisessä yhtälössä, ei korkilla (^), vaan tildellä (~). Tämä on seurausta siitä, että meillä ei heti alussa ole edes arvioitua satunnaisotoksen keskihajontaa - ja sen sijaan käytämme suunniteltu- . Mistä saamme uusimmat? Voimme sanoa, että katosta: asiantuntija-arvio, karkeat arviot, aikaisempi kokemus jne.


Entä 5. yhtälön oikealla puolella oleva toinen termi, mistä se tuli? Koska , Güntherin korjaus tarvitaan.


Yhtälöiden 4 ja 5 lisäksi on useita muitakin likimääräisiä arvioivia kaavoja, mutta tämä ansaitsee jo erillisen postauksen.

Alla oleva kaava laskemiseen otoskoko käytetään tapauksissa, joissa vastaajilta (vastaajilta) kysytään vain yksi kysymys, johon on vain kaksi vastausvaihtoehtoa. Esimerkiksi "Kyllä" ja "Ei"; "Käytän" ja "En käytä". Tietenkin tätä kaavaa voidaan soveltaa vain suoritettaessa yksinkertaisimpia tutkimuksia. Jos joudut määrittämään otoksen kokoa suoritettaessa suurempia tutkimuksia, kuten kyselylomakkeita, tulee käyttää muita kaavoja.

Yksinkertainen kaava näytteen koon laskemiseen

missä: n- otoskoko;

z on normalisoitu poikkeama, joka on määritetty valitun luottamustason perusteella. Tämä indikaattori kuvaa mahdollisuutta, todennäköisyyttä saada vastauksia erityisellä - luottamusvälillä. Käytännössä luottamustasoksi pidetään usein 95 % tai 99 %. Sitten z-arvot ovat 1,96 ja 2,58;

p– vaihtelu otoksen osalta osakkeina. Pohjimmiltaan p on todennäköisyys, että vastaajat valitsevat yhden tai toisen vastausvaihtoehdon. Oletetaan, että jos uskomme, että neljäsosa vastaajista valitsee vastauksen "Kyllä", niin p on 25 %, eli p = 0,25;

q= (1 – p);

e– sallittu virhe murto-osina.

Esimerkki näytteen koon laskemisesta

Yhtiö suunnittelee tekevänsä sosiologisen tutkimuksen selvittääkseen tupakoitsijoiden osuuden kaupungin väestöstä. Tätä varten yrityksen työntekijät kysyvät ohikulkijoilta yhden kysymyksen: "Tupakoitko?". Siten on vain kaksi mahdollista vastausta: "Kyllä" ja "Ei".

Otoskoko lasketaan tässä tapauksessa seuraavasti. Luottamustasoksi otetaan 95 %, sitten normalisoitu poikkeama z = 1,96. Hyväksymme vaihtelun 50 %:ksi eli ehdollisesti uskomme, että puolet vastaajista voi vastata kysymykseen tupakoivatko - "Kyllä". Sitten p = 0,5. Täältä löydämme q = 1 – p = 1 – 0,5 = 0,5 . Hyväksyttävä näytteenottovirhe on 10 % e = 0,1.

Korvaamme nämä tiedot kaavaan ja laskemme:

Otoskoon saaminen n = 96 henkilöä.

Tämän kaavan soveltamisala

Kun suoritat yksinkertaista tutkimusta, kun haluat saada vastauksen vain yhteen yksinkertaiseen kysymykseen. Tässä tapauksessa vastausten asteikko on yleensä kaksijakoinen. Toisin sanoen vastaukset tarjotaan (tai implisiittisiä) tyypiltään "Kyllä" - "Ei", "Musta" - "Valkoinen" jne.

Tämän kaavan ominaisuudet otoskoon laskemiseen

Galyautdinov R.R.


© Materiaalin kopioiminen on sallittua vain, jos määrität suoran hyperlinkin

Populaatiot sijoittuvat usein suuriin ihmisryhmiin. Usein on virheellistä ajatella, että tulosten luotettavuus on korkeampi, jos kaikki yhteiskunnan jäsenet vastaavat kysymyksiin. Valtavien ajan, rahan ja työvoimakustannusten vuoksi tällaista tutkimusta ei voida hyväksyä. Vastaajien määrän kasvaessa kustannukset eivät vain nouse, vaan myös riski saada virheellisiä tietoja kasvaa. Käytännön näkökulmasta monet kyselylomakkeet ja koodaajat vähentävät toimintansa luotettavan valvonnan todennäköisyyttä. Tällaista kyselyä kutsutaan jatkuvaksi.

Sosiologiassa käytetään useimmiten epäjatkuvaa tutkimusta tai valikoivaa menetelmää. Sen tulokset voidaan laajentaa suureen joukkoon ihmisiä, joita kutsutaan yleisiksi.

Otantamenetelmän määritelmä ja merkitys

Otantamenetelmä on kvantitatiivinen menetelmä, jossa kokonaismassasta valitaan osa tutkituista yksiköistä, kun taas kyselyn tulokset koskevat jokaista henkilöä, joka ei osallistunut tähän.

Otantamenetelmä on sekä tieteellisen tutkimuksen että akateemisen tieteenala. Se toimii keinona saada luotettavaa tietoa väestöstä ja auttaa arvioimaan kaikkia sen parametreja. Yksiköiden valintaehdot vaikuttavat myöhemmin tulosten tilastolliseen analyysiin. Jos näytteenottomenettelyt on toteutettu huonosti, on luotettavimpienkin menetelmien käyttö kerätyn tiedon käsittelyyn hyödytöntä.

Valintateorian keskeiset käsitteet

He kutsuvat yksikköjen suhdetta, jonka suhteen mallitutkimuksen johtopäätökset muotoillaan. Se voi olla yhden maan, tietyn paikkakunnan asukkaita, yrityksen työryhmää jne.

Otos (tai näyte) on osa yleistä, joka on valittu erityismenetelmin ja -kriteerein. Muodosteluprosessissa huomioidaan esimerkiksi tilastolliset kriteerit.

Tiettyyn joukkoon sisältyvien yksilöiden määrää kutsutaan sen tilavuudeksi. Mutta se voidaan ilmaista paitsi ihmisten lukumäärällä, myös äänestyspaikoilla, asuinpaikoilla, eli ehdottomasti suurilla yksiköillä, jotka sisältävät havaintoyksiköitä. Mutta tämä on jo monivaiheinen näyte.

Valintayksikkönä ovat yleisen populaation muodostavat osat, ne voivat olla joko suoraan havainnointiyksiköitä (yksivaiheinen otanta) tai suurempia muodostumia.

Tärkeä rooli luotettavien tutkimustulosten saamisessa otantamenetelmällä on sellainen ominaisuus kuin valinnan edustavuus. Toisin sanoen sen osan väestöstä, josta tuli vastaajia, on toistettava täysin kaikki sen ominaispiirteet. Kaikki poikkeamat katsotaan virheeksi.

Näytteenottomenetelmän soveltamisen vaiheet

Jokainen empiirinen tutkimus koostuu vaiheista. Jos käytetään otantamenetelmää, niiden järjestys järjestetään seuraavasti:

  1. Otosluonnoksen luominen: perusjoukko muodostetaan, valintamenettelyt, määrät karakterisoidaan.
  2. Hankkeen toteutus: Sosiologisen tiedon keruun aikana kyselylomakkeilla suoritetaan tehtäviä, joissa ilmoitetaan vastaajien valintatapa.
  3. Edustavuusvirheiden tunnistaminen ja korjaaminen.

Näytteiden tyypit sosiologiassa

Yleisen populaation määrittämisen jälkeen tutkija siirtyy valikoiviin toimenpiteisiin. Ne voidaan jakaa kahteen tyyppiin (kriteerit):

  1. Todennäköisyyslakien rooli otannan aikana.
  2. Valintavaiheiden lukumäärä.

Jos sovelletaan ensimmäistä kriteeriä, erotetaan satunnaisotosmenetelmä ja ei-satunnainen valinta. Jälkimmäisen perusteella voidaan väittää, että näyte voi olla yksivaiheinen ja monivaiheinen.

Näytteiden tyypit eivät heijastu suoraan tutkimuksen valmistelun ja suorittamisen vaiheisiin, vaan myös sen tuloksiin. Ennen kuin annat etusijalle jommankumman niistä, sinun tulee ymmärtää käsitteiden sisältö.

"Satunnaisen" määritelmä jokapäiväisessä käytössä on saanut täysin päinvastaisen merkityksen kuin matematiikassa. Sellainen valinta tehdään tiukkojen sääntöjen mukaan, niistä ei saa poiketa, koska on tärkeää varmistaa, että jokaisella yleisväestön yksiköllä on samat mahdollisuudet päästä otokseen. Jos nämä ehdot eivät täyty, tämä todennäköisyys on erilainen.

Satunnaisotos puolestaan ​​jaetaan:

  • yksinkertainen;
  • mekaaninen (systeeminen);
  • sisäkkäin (sarja, klusteri);
  • kerrostunut (tyypillinen tai kaavoitettu).

Yksinkertainen näytteenottomenetelmä suoritetaan käyttämällä satunnaislukutaulukkoa. Aluksi määritetään näytteen koko; luodaan täydellinen luettelo yleiseen väestöön kuuluvista numeroiduista vastaajista. Valintana käytetään matemaattisten ja tilastollisten julkaisujen sisältämiä erikoistaulukoita. Kaikki muut kuin ne ovat kiellettyjä. Jos otoskoko on kolminumeroinen luku, tulee kunkin näytteenottoyksikön numeron olla kolminumeroinen, eli välillä 001 - 790. Viimeinen numero ilmaisee henkilöiden kokonaismäärän. Tutkimukseen osallistuvat ihmiset, joille on annettu numero määritetyllä alueella, joka löytyy taulukosta.

Systemaattinen valinta perustuu laskelmiin. Aakkosellinen luettelo kaikista yleisen populaation elementeistä laaditaan alustavasti, asetetaan askel ja vasta sitten - otoskoko. Vaiheen kaava on seuraava:

N: n, missä N on populaatio ja n on näyte.

Esimerkiksi 150 000: 5 000 = 30. Näin joka kolmaskymmenes valitaan kyselyyn.

Nest-tyyppinen kokonaisuus

Klusteriotosta käytetään, kun tutkittava väestö koostuu pienistä luonnollisista ryhmistä. Tässä tapauksessa on huomattava, että tällaisten pesien luettelomäärä määritetään ensimmäisessä vaiheessa. Satunnaislukutaulukon avulla tehdään valinta ja tehdään jatkuva kysely kaikista vastaajista kussakin valitussa pesässä. Lisäksi mitä enemmän heistä osallistui tutkimukseen, sitä pienempi oli keskimääräinen otantavirhe. Tällaista tekniikkaa on kuitenkin mahdollista käyttää edellyttäen, että tutkituilla pesillä on samanlainen ominaisuus.

Kerrostetun valinnan ydin

Ositettu otos eroaa aikaisemmista siinä, että valinnan aattona yleinen populaatio jaetaan ositteiksi, eli homogeenisiin osiin, joilla on yhteinen piirre. Esimerkiksi koulutustaso, vaalimieltymykset, tyytyväisyys elämän eri osa-alueisiin. Yksinkertaisin vaihtoehto on erottaa aiheet sukupuolen ja iän mukaan. Periaatteessa valinta on tehtävä siten, että jokaisesta ositteesta erotetaan kokonaismäärään verrannollinen henkilömäärä.

Otoskoko voi tässä tapauksessa olla pienempi kuin satunnaisvalintatilanteessa, mutta edustavuus on suurempi. On huomattava, että ositettu otanta on taloudellisesti ja tiedollisesti kallein, ja sisäkkäinen otanta on tässä suhteessa hyödyllisin.

Ei-satunnainen kiintiöotos

Siellä on myös kiintiönäyte. Se on ainoa ei-satunnaisen valinnan tyyppi, jolla on matemaattinen perustelu. Kiintiöotos muodostetaan yksiköistä, jotka on esitettävä suhteellisesti ja vastattava yleistä perusjoukkoa. Tässä muodossa toteutetaan tarkoituksenmukainen ominaisuuksien jakelu. Jos tutkittavien piirteiden joukossa ovat ihmisten mielipiteet ja arviot, niin vastaajien sukupuoli, ikä ja koulutus ovat usein kiintiöitä.

Sosiologisessa tutkimuksessa erotetaan myös kaksi valintamenetelmää: toistuva ja ei-toistuva. Ensimmäisessä tapauksessa valittu yksikkö palautetaan kyselyn jälkeen suurelle yleisölle, jotta se voi jatkaa valintaan osallistumista. Toisessa vaihtoehdossa vastaajat lajitellaan, mikä lisää väestön jäljellä olevien jäsenten mahdollisuuksia tulla valituksi.

Sosiologi G. A. Churchill kehitti seuraavan säännön: otoskoon tulee pyrkiä tarjoamaan vähintään 100 havaintoa ensisijaiselle ja 20-50 toissijaiselle luokittelukomponentille. On syytä muistaa, että osa otokseen kuuluvista vastaajista ei eri syistä välttämättä osallistu kyselyyn tai kieltäytyy siitä kokonaan.

Otoskoon määritysmenetelmät

Sosiologisessa tutkimuksessa voidaan soveltaa seuraavia menetelmiä:

1. Mielivaltainen, eli otoskoko määräytyy 5-10 %:n sisällä yleisen populaation koostumuksesta.

2. Perinteinen laskentatapa perustuu säännöllisiin kyselyihin, esimerkiksi kerran vuodessa, kattaen 600, 2 000 tai 2 500 vastaajaa.

3. Tilastollinen - on luoda tiedon luotettavuus. Tilastot tieteenä ei kehity eristyksissä. Hänen tutkimuksensa aiheet ja alueet ovat aktiivisesti mukana muilla läheisillä aloilla: tekninen, taloudellinen ja humanitaarinen. Sen menetelmiä käytetään siis sosiologiassa, kyselyihin valmistautumisessa ja erityisesti otoskokojen määrittämisessä. Tilastoilla tieteenä on laaja metodologinen perusta.

4. Kallis, jossa tutkimuskustannusten sallittu määrä on vahvistettu.

5. Otoskoko voi olla yhtä suuri kuin yleisen perusjoukon yksiköiden lukumäärä, jolloin tutkimus on jatkuvaa. Tämä lähestymistapa on sovellettavissa pienissä ryhmissä. Esimerkiksi työvoima, opiskelijat jne.

Aikaisemmin oli mahdollista todeta, että otosta pidetään edustavana, kun sen ominaisuudet kuvaavat yleisen perusjoukon ominaisuuksia minimivirheellä.

Otoskoon arvioiminen edeltää lopullisia laskelmia yleisestä perusjoukosta valittavien yksiköiden lukumäärästä:

n = Npqt 2: N∆ 2 p + pqt 2, jossa N on yleisen populaation yksiköiden lukumäärä, p on tutkittavan ominaisuuden osuus (q = 1 - p), t on luottamustodennäköisyys P (määritetty erityisestä taulukosta), ∆ p - sallittu virhe.

Tämä on vain yksi muunnelma siitä, miten otoskoko lasketaan. Kaava voi muuttua riippuen olosuhteista ja valituista tutkimuskriteereistä (esimerkiksi uudelleennäytteenotto tai ei-toistuva näytteenotto).

Näytteenottovirheet

Väestön sosiologiset tutkimukset perustuvat jonkin edellä tarkastelemamme otannan käyttöön. Jokaisen tutkijan tehtävänä tulisi kuitenkin joka tapauksessa olla arvioida saatujen indikaattoreiden tarkkuusaste, eli on tarpeen määrittää, kuinka paljon ne heijastavat yleisen väestön ominaisuuksia.

Otantavirheet voidaan jakaa satunnaisiin ja ei-satunnaisiin. Ensimmäinen tyyppi tarkoittaa otosindikaattorin poikkeamaa yleisestä, joka voidaan ilmaista niiden osuuksien erolla (keskiarvo) ja joka johtuu vain epäjatkuvan tyyppisestä kyselystä. Ja on aivan luonnollista, jos tämä indikaattori laskee vastaajien määrän kasvun taustalla.

Systemaattinen virhe on poikkeama yleisindikaattorista, joka havaitaan myös otoksen ja yleisten osuuksien vähentämisen seurauksena ja joka johtuu otantamenetelmän epäjohdonmukaisuudesta vahvistettujen sääntöjen kanssa.

Tämäntyyppiset virheet sisältyvät kokonaisnäytteenottovirheeseen. Tutkimuksessa populaatiosta voidaan ottaa vain yksi näyte. Näytteen indikaattorin suurimman mahdollisen poikkeaman laskeminen voidaan suorittaa käyttämällä erityistä kaavaa. Sitä kutsutaan marginaalinäytteenottovirheeksi. On myös sellainen asia kuin keskimääräinen otantavirhe. Tämä on otoksen keskihajonta yleisestä osuudesta.

On myös jälkikäteen (kokeen jälkeinen) virhetyyppi. Se tarkoittaa otoksen tunnuslukujen poikkeamaa yleisestä osuudesta (keskiarvosta). Se lasketaan vertaamalla yleisindikaattoria, jonka tiedot ovat peräisin luotettavista lähteistä, ja otosta, joka muodostettiin tutkimuksen aikana. Yritysten henkilöstöosastot, valtion tilastolaitokset toimivat usein luotettavina tietolähteinä.

On myös a priori virhe, joka on myös poikkeama otos- ja yleisindikaattoreista, joka voidaan ilmaista niiden osuuksien erona ja joka voidaan laskea erityisellä kaavalla.

Koulutustutkimuksessa kyselyyn vastaajia valittaessa tehdään useimmiten seuraavat virheet:

1. Otosjoukot eri yleisiin populaatioihin kuuluvista ryhmistä. Niitä käytettäessä kehitetään tilastollisia päätelmiä, jotka koskevat koko otosta. On aivan selvää, että tätä ei voida hyväksyä.

2. Tutkijan organisatorisia ja taloudellisia mahdollisuuksia ei oteta huomioon näytteitä tarkasteltaessa, vaan yksi niistä on etusijalla.

3. Yleisen perusjoukon rakennetta koskevia tilastollisia kriteerejä ei käytetä täysimääräisesti otantavirheiden estämiseksi.

4. Vertailevien tutkimusten aikana vastaajavalinnan edustavuusvaatimuksia ei oteta huomioon.

5. Haastattelijan ohjeet tulee mukauttaa valitun valintatyypin mukaan.

Vastaajien osallistuminen tutkimukseen voi olla avointa tai nimetöntä. Tämä tulee ottaa huomioon otosta muodostettaessa, sillä ehdoista eri mieltä osallistujat voivat lähteä.

Otoshavaintoa suunniteltaessa herää kysymys vaadittavasta otoskokosta. Tämä luku voidaan määrittää näytteenoton sallitun virheen perusteella, sen todennäköisyyden perusteella, jonka perusteella asetettavan virheen suuruus voidaan taata, ja lopuksi valintamenetelmän perusteella.

Eri otantamenetelmien vaaditun otoskoon kaavat voidaan johtaa vastaavista otosvirheiden laskennassa käytetyistä suhteista. Tässä ovat yleisimmin käytetyt lausekkeet vaaditulle otoskoolle:

oikea satunnainen ja mekaaninen näytteenotto:

(uudelleenvalinta)

(ei toistuva valinta)

tyypillinen näyte:

(uudelleenvalinta)

(ei toistuva valinta)

sarjanäytteenotto:

(uudelleenvalinta)

(ei toistuva valinta)

Tällöin varianssit ja otantavirheet voidaan laskea tutkimuksen tavoitteista riippuen ominaisuuden keskiarvolle tai osuudelle.

Tarkastellaan esimerkkejä vaaditun otoskoon määrittämisestä erilaisille otosjoukon muodostamismenetelmille.

Esimerkki 5 Kaupungin 100 matkatoimistossa on tarkoitus tehdä mekaanisella valinnalla kysely keskimääräisestä kuukausittaisesta myytyjen seteleiden määrästä. Mikä pitäisi olla otoskoko, jotta virhe ei todennäköisyydellä 0,683 ylitä 3 seteliä, jos pilottitutkimuksen mukaan varianssi on 225.

Ratkaisu. Laske tarvittava näytekoko:

Toimistot.

Esimerkki 6 Liikepankkien yli 40-vuotiaiden työntekijöiden osuuden määrittämiseksi alueella suunnitellaan tyypillisen mies- ja naispuolisten työntekijöiden lukumäärään suhteutetun otoksen järjestämistä mekaanisella valinnalla ryhmien sisällä. Pankin työntekijöiden kokonaismäärä on 12 tuhatta henkilöä, joista 7 tuhatta miestä ja 5 tuhatta naista.

Aikaisempien tutkimusten perusteella ryhmän sisäisten varianssien keskiarvon tiedetään olevan 1600. Määritä vaadittu otoskoko todennäköisyydellä 0,997 ja virheellä 5 %.

Ratkaisu. Laske tyypillisen näytteen kokonaiskoko:

ihmiset

Lasketaan nyt yksittäisten tyypillisten ryhmien tilavuus:

ihmiset

ihmiset

Näin ollen vaadittu otoskoko pankin työntekijöistä on 550 henkilöä, sis. 319 miestä ja 231 naista.

Esimerkki 7 Osakeyhtiössä on 200 työntekijäryhmää. Ammattitauteja sairastavien työntekijöiden osuuden selvittämiseksi on tarkoitus tehdä otantatutkimus. Tiedetään, että osuuden sarjojen välinen varianssi on 225. Laske todennäköisyydellä 0,954 tarvittava määrä ryhmiä työntekijöiden kyselyyn, jos otantavirhe ei saisi ylittää 5 %.

Ratkaisu. Tarvittava joukko prikaatia lasketaan sarjan ei-toistuvan näytteenoton määrän kaavan perusteella:

prikaatit.

3. Vaaditun otoskoon määrittäminen

On erittäin tärkeää määrittää näytteen optimaalinen koko, joka tietyllä todennäköisyydellä antaa havaintotulosten määritellyn tarkkuuden. Kun otoskoko kasvaa, otantavirhe pienenee. Mutta koska tutkimuksen otokseen valitut yksiköt usein tuhoutuvat, otokseen kuuluvien yksiköiden näytteenottotiheyden on oltava optimaalinen. Optimaalinen otoskoko saadaan otosvirhekaavoista.

Taulukko 8.4

Kaavat optimaalisen näytekoon määrittämiseksi

Valintamenetelmä

Keskimäärin

Itsesatunnaisesti toistettu

Satunnainen ja mekaaninen ei-toistuva

Typologinen ei-toistuva

Sarja, joka ei toistu samassa sarjassa

Kaavat osoittavat, että kun arvioitu otantavirhe kasvaa, vaadittu otoskoko pienenee merkittävästi.

Otoskoon laskemiseksi sinun on tiedettävä varianssi. Se voidaan lainata aikaisemmista saman tai samanlaisen väestön tutkimuksista tai voidaan tehdä pienikokoinen tilapäinen otantatutkimus.

Esimerkki 2 : Yrityksessä haastateltiin satunnaisen ei-toistuvan otoksen järjestyksessä 100 työntekijää 1000:sta ja heidän lokakuun tuloistaan ​​saatiin seuraavat tiedot (taulukko 8.5).

Taulukko 8.5

Työntekijöiden jakautuminen keskimääräisten kuukausitulojen mukaan

Määritellä:

1) tämän yrityksen työntekijöiden keskimääräinen kuukausitulo, joka takaa tuloksen todennäköisyydellä 0,997;

2) yrityksen työntekijöiden osuus, joiden kuukausitulot ovat 19 tuhatta ruplaa. ja korkeampi, mikä takaa tuloksen todennäköisyydellä 0,954;

3) vaadittava otoskoko yrityksen työntekijöiden keskimääräisiä kuukausituloja määritettäessä siten, että 0,954:n todennäköisyydellä otosvirhe ei ylitä 200 ruplaa.

Ratkaisu:

1) Määritetään tämän yrityksen työntekijöiden keskimääräiset kuukausitulot takaamalla tuloksen todennäköisyydellä 0,997.

n= 100 ihmistä

N= 1000 ihmistä

Ratkaisu: tietyn yrityksen työntekijöiden keskimääräisten kuukausitulojen välin määrittämiseksi perusjoukossa on tarpeen tietää otosvirheen arvo ja työntekijöiden keskimääräisen kuukausitulon suuruus otantatutkimuksen mukaan .


t ja tarkoittaa näytteenottovirhettä .

Koska P \u003d 0,997, niin (taulukon 8.2 mukaan) t= 3.

Satunnainen ei-toistuva valinta tehtiin taulukon mukaan. 8.3 valitsemme kaavan keskimääräisen näytteenottovirheen laskemiseksi keskiarvolle:

, missä
on otosvarianssi.

Työntekijöiden keskimääräisen kuukausitulon suuruus otantatutkimuksen mukaan määräytyy aritmeettisen painotetun keskiarvon kaavalla:
.

Lisälaskelmat suoritetaan seuraavassa taulukossa:

kuukausitulot,

Työntekijöiden määrä, hlö.

Välin keskipiste

tuhatta ruplaa.

tuhatta ruplaa.

Tietäen t ja
Määritetään otosmarginaalivirheen arvo:

tuhat hieroa.

Sitten tämän yrityksen työntekijöiden keskimääräisten kuukausitulojen väli on seuraava:

;

.

Vastaus: tämän yrityksen työntekijöiden keskimääräiset kuukausitulot todennäköisyydellä 0,997 ovat 18,08 tuhatta ruplaa. jopa 18,92 tuhatta ruplaa.

2) Määritetään yrityksen työntekijöiden osuus, joiden kuukausitulot ovat 19 tuhatta ruplaa. ja korkeampi, mikä takaa tuloksen todennäköisyydellä 0,954.

n= 100 ihmistä

N= 1000 ihmistä

Ratkaisu: määrittää niiden työntekijöiden osuuden väli, joiden kuukausitulot ovat 19 tuhatta ruplaa. ja edellä, on tarpeen tietää osuuden marginaalinäytteenottovirheen arvo
ja niiden työntekijöiden osuus, joilla on tämä keskimääräinen kuukausitulo otoksen mukaan W.

Näytteenoton rajavirhe määräytyy kaavan mukaan
. Se riippuu luottamustekijän arvosta t ja tarkoittaa näytteenottovirhettä.

Koska P \u003d 0,954, niin (taulukon 8.2 mukaan) t= 2.

Satunnainen ei-toistuva valinta tehtiin taulukon mukaan. 8.3 valitse kaava osuuden keskimääräisen otantavirheen laskemiseksi:

, missä W- yrityksen työntekijöiden osuus, joiden keskimääräinen kuukausitulo on 19 tuhatta ruplaa. ja korkeampi otoksessa.

Otososuus määräytyy niiden yksiköiden lukumäärän suhteen, joilla on tutkittava ominaisuus m näytteenottoyksiköiden kokonaismäärään n, tai
.

Silloin osakkeen keskimääräinen virhe on

Tietäen t ja määritä osuuden marginaalinäytteenottovirheen arvo:

Sitten niiden työntekijöiden osuuden väli, joiden kuukausitulot ovat 19 tuhatta ruplaa. ja yläpuolella yleisessä väestössä ovat seuraavat:

.

Vastaus: yritysten työntekijöiden osuus, joiden kuukausitulot ovat 19 tuhatta ruplaa. ja korkeampi, todennäköisyydellä 0,954, on välillä 19,4 % - 36,6 %.

    Määritetään tarvittava otoskoko määritettäessä yrityksen työntekijöiden keskimääräisiä kuukausituloja niin, että 0,954:n todennäköisyydellä otosvirhe ei ylitä 200 ruplaa.

N= 1000 ihmistä

Ratkaisu: keskimääräisen kuukausitulon määrittämiseen tarvittava otoskoko määritetään kaavalla (taulukon 8.4 mukaan):

Tehtävän ehdon mukaan tiedetään: todennäköisyydellä P = 0,954 t\u003d 2 (katso taulukko 8.2);

0,2 tuhatta ruplaa;
(edellisen näytteen mukaan).

ihmiset

Vastaus: jotta todennäköisyydellä 0,954 näytteenoton marginaalivirhe ei ylitä 200 ruplaa, on tutkittava 189 henkilöä.

4.5 Otoskoon määrittäminen

Mallisuunnittelumenettely sisältää seuraavien kolmen tehtävän peräkkäinen ratkaisu:

Tutkimuskohteen määrittely;

Näytteen rakenteen määrittäminen;

Otoskoon määrittäminen.

Yleensä, markkinointitutkimuksen kohde on joukko havainnointikohteita, jotka voivat olla kuluttajia, yrityksen työntekijöitä, välittäjiä jne. Jos tämä populaatio on niin pieni, että tutkimusryhmällä on tarvittavat työvoima-, taloudelliset ja aikaresurssit muodostaa yhteys jokaiseen sen elementtiin, on melko realistista suorittaa jatkuva tutkimus koko väestöstä. Tässä tapauksessa, kun olet määrittänyt tutkimuskohteen, voit siirtyä seuraavaan menettelyyn (tiedonkeruumenetelmän, tutkimustyökalun ja yleisön kanssa kommunikointitavan valinta).

Käytännössä koko väestön jatkuvan tutkimuksen tekeminen ei kuitenkaan usein ole mahdollista tai tarkoituksenmukaista. Tähän voi olla seuraavat syyt:

mahdottomuus saada yhteyttä joihinkin väestöryhmiin;

Kohtuuttoman korkeat kustannukset täydellisen tutkimuksen suorittamisesta tai taloudelliset rajoitukset, jotka eivät salli täydellisen tutkimuksen suorittamista;

Tutkimukseen varattu aika lyhyt, joka johtuu tiedon relevanssin menetyksestä ajan mittaan tai muista syistä, jotka eivät mahdollista laajan tiedon keräämistä, systematisointia ja analysointia koko väestöstä.

Siksi suuria ja hajapopulaatioita tutkitaan usein otoksen avulla, joka, kuten tiedät, ymmärretään osana populaatiota, joka on suunniteltu edustamaan populaatiota kokonaisuutena.

Tarkkuus, jolla otos heijastaa populaatiota kokonaisuutena, riippuu rakenne ja näytteen koko.

Otosrakenteeseen on olemassa kaksi lähestymistapaa- probabilistinen ja deterministinen.

Todennäköisyyspohjainen lähestymistapa otosrakenteeseen oletetaan, että mikä tahansa perusjoukon elementti voidaan valita tietyllä (ei nolla) todennäköisyydellä. Todennäköisyysteoriaan perustuvia näytteitä on erilaisia ​​(tyypillisiä, sisäkkäisiä jne.). Yksinkertaisin ja käytännössä yleisin on yksinkertainen satunnaisotos, jossa jokaisella perusjoukon elementillä on yhtä suuri todennäköisyys tulla valituksi tutkimukseen.

Todennäköisyyspohjainen otanta on tarkempaa, sen avulla tutkija voi arvioida keräämänsä tiedon luotettavuusastetta, vaikka se onkin monimutkaisempaa ja kalliimpaa kuin deterministinen otanta.

Deterministinen lähestymistapa mallirakenteeseen olettaa, että populaatioelementtien valinta tehdään menetelmillä, jotka perustuvat joko mukavuusnäkökohtiin tai tutkijan päätökseen tai satunnaisiin ryhmiin.

mukavuussyistä, koostuu minkä tahansa väestön elementtien valitsemisesta sen perusteella, kuinka helppoa on muodostaa yhteys heihin. Tämän menetelmän epätäydellisyys johtuu ehkä saadun näytteen alhaisesta edustavuudesta, koska Tutkijalle sopivat populaation elementit eivät välttämättä ole riittävän tunnusomaisia ​​populaation edustajia epäsatunnaisen ja järjettömän valinnan vuoksi.

Kuitenkin toisaalta tällä menetelmällä tehdyn tutkimuksen yksinkertaisuus, taloudellisuus ja tehokkuus ovat ansainneet sille varsin laajan levinneisyyden käytännössä ja ennen kaikkea pääongelmien selvittämiseen tähtäävien esiselvitysten tekemisessä.

Otantamenetelmään perustuva tutkijan päätöksellä, koostuu populaation elementtien valitsemisesta, jotka hänen mielestään ovat sen tunnusomaisia ​​edustajia. Tämä menetelmä on täydellisempi kuin edellinen, koska se perustuu suuntautumiseen tutkittavan populaation tunnusomaisiin edustajiin, vaikka heidät valitaankin tutkijoiden subjektiivisen näkemyksen perusteella.

Näytteenottomenetelmä perustuu ehdolliset normit, koostuu populaation tunnusomaisten elementtien valitsemisesta koko populaation aiemmin saatujen ominaisuuksien mukaisesti. Nämä ominaisuudet voidaan saada tekemällä esitutkimuksia, eivätkä ne, toisin kuin edellinen menetelmä, ole subjektiivisia. Siksi tämä menetelmä on edistyneempi, sen avulla voidaan saada näytepopulaatioita, jotka eivät ole vähemmän edustavia kuin todennäköisyysnäytteet, huomattavasti pienemmillä kustannuksilla tutkimuksen suorittamiseksi.

Valittuaan otosrakenteen (lähestymistapa sen muodostukseen, deterministisen näytteen todennäköisyys- tai heittomuodostelman tyyppi), tutkijan on määritettävä tilavuus, ts. näytteen elementtien lukumäärä.

Otoskoko määrittää tiedon luotettavuuden tutkimuksen tuloksena saatuja kustannuksia sekä tutkimuksen edellyttämiä kustannuksia. Näytteen koko riippuu tutkittavien kohteiden homogeenisuuden tai monipuolisuuden tasolla.

Mitä suurempi otoskoko on, sitä suurempi on sen tarkkuus ja sitä suuremmat kustannukset sen suorittamisesta. Otosrakenteen todennäköisyyspohjaisella lähestymistavalla sen tilavuus voidaan määrittää tunnetuilla tilastollisilla kaavoilla sen tarkkuusvaatimusten perusteella.

Käytännössä otoskoon määrittämiseen käytetään useita lähestymistapoja:

1. Mielivaltainen lähestymistapa peukalosäännön soveltamisen perusteella. Esimerkiksi ilman näyttöä oletetaan, että tarkkojen tulosten saamiseksi otoksen on oltava 5 % populaatiosta. Tämä lähestymistapa on yksinkertainen ja helppo toteuttaa, mutta saatujen tulosten tarkkuutta ei ole mahdollista määrittää. Riittävän suurella väestöllä se voi olla myös melko kallista.

Otoskoko voidaan asettaa tiettyjen ennalta määrättyjen ehtojen perusteella. Esimerkiksi markkinatutkimuksen asiakas tietää, että yleistä mielipidettä tutkiessaan otos on yleensä 1000-1200 henkilöä, joten hän suosittelee, että tutkija pysyy tässä luvussa. Jos tietyillä markkinoilla tehdään vuosittaisia ​​tutkimuksia, käytetään joka vuosi samankokoista otosta. Toisin kuin ensimmäisessä lähestymistavassa, tässä otoskokoa määritettäessä käytetään tunnettua logiikkaa, joka on kuitenkin erittäin haavoittuvainen.

Esimerkiksi tiettyjä tutkimuksia suoritettaessa tarkkuus voi olla pienempi kuin yleisen mielipiteen tutkimuksessa ja väestön koko voi olla monta kertaa pienempi kuin yleisen mielipiteen tutkimuksessa. Näin ollen tämä lähestymistapa ei ota huomioon nykyisiä olosuhteita ja voi olla melko kallista.

Joissakin tapauksissa tutkimuksen suorittamisen kustannuksia käytetään pääasiallisena argumenttina otoskokoa määritettäessä. Markkinointitutkimuksen budjetissa on siis varattu tiettyjen tutkimusten suorittamisesta aiheutuvat kustannukset, joita ei voida ylittää. Ilmeisesti vastaanotetun tiedon arvoa ei oteta huomioon. Joissakin tapauksissa pienikin näyte voi kuitenkin antaa melko tarkkoja tuloksia.

Vaikuttaa järkevältä tarkastella kustannuksia ei absoluuttisesti, vaan suhteessa kyselyjen tuloksena saadun tiedon hyödyllisyyteen. Tilaajan ja tutkijan tulee ottaa huomioon erilaiset otoskoot ja tiedonkeruumenetelmät, kustannukset ja muut tekijät

2. Otoskoko sallitun virheen luottamusvälin tasolta, jonka, kuten jo mainittiin, antaa lopullisten yleistysten tarkoituksenmukainen tarkkuus: korotetusta likimääräiseksi. Tässä on kuitenkin mielessä niin sanotut satunnaiset virheet, jotka liittyvät tilastovirheiden luonteeseen. Juuri ne lasketaan todennäköisyysotosten edustavuuden virheinä.

V. I. Paniotto antaa seuraavat laskelmat edustavasta otoksesta 5 prosentin virheen oletuksena (taulukko 4.2).

Taulukko 4.2

Arvioitu näytetaulukko

Yli 100 000 asukkaan otos on 400 yksikköä. Jos kuitenkin ajatellaan 5 tuhannen tai enemmän yleisiä populaatioita, niin saman kirjoittajan laskelmien mukaan on mahdollista osoittaa todellisen näytteenottovirheen suuruus sen tilavuudesta riippuen, mikä on meille erittäin tärkeää. , pitäen mielessä, että sallitun virheen suuruus riippuu tutkimuksen tarkoituksesta eikä sen tarvitse välttämättä lähestyä 5 prosentin tasoa.

Taulukko 4.3

Laskentataulukko

Satunnaisten virheiden ohella systemaattiset virheet ovat mahdollisia. Ne riippuvat otantatutkimuksen järjestämisestä. Nämä ovat erilaisia ​​näytepoikkeamia kohti yhtä näyteparametrin napoista.

3. Otoskoko tilastollisen analyysin perusteella . Tämä lähestymistapa perustuu vähimmäisotoskoon määrittämiseen tulosten luotettavuutta ja luotettavuutta koskevien tiettyjen vaatimusten perusteella. Sitä käytetään myös otokseen kuuluvien yksittäisten alaryhmien tulosten analysoinnissa sukupuolen, iän, koulutustason jne. mukaan. Yksittäisten alaryhmien tulosten luotettavuutta ja tarkkuutta koskevat vaatimukset sanelevat tietyt vaatimukset koko otoskoolle.

Teoreettisesti perusteltu ja oikea tapa määrittää otoskoko perustuu luotettavien intervallien laskemiseen. Variaatiokäsite kuvaa vastaajien vastausten erilaisuuden (samankaltaisuuden) määrää tiettyyn kysymykseen. Tarkemmin sanottuna aggregaatissa olevan ominaisuuden arvojen vaihtelu on sen arvojen eroa tietyn aggregaatin eri yksiköiden välillä samalla ajanjaksolla tai ajankohtana. Kyselykysymysten vastausten tulokset esitetään yleensä jakautumiskäyrän muodossa (kuva 4.1). Kun vastausten samankaltaisuus on suuri, he puhuvat pienestä vaihtelusta (kapea jakautumiskäyrä) ja alhaisen vastausten samankaltaisuuden kanssa suuresta vaihtelusta (laaja jakautumiskäyrä).

Vaihtelun mittana käytetään yleensä keskihajontaa, joka kuvaa keskimääräistä etäisyyttä kunkin vastaajan tiettyyn kysymykseen saatujen vastausten keskiarvosta.

Pieni vaihtelu

suuri vaihtelu

Riisi. 4.1. Variaatio- ja jakautumiskäyrät

Koska kaikki markkinointipäätökset tehdään epävarmuuden olosuhteissa, tämä seikka kannattaa ottaa huomioon otoskokoa määritettäessä. Koska tutkittujen arvojen määrittely kapeassa populaatiossa tapahtuu otantatilastojen perusteella, on tarpeen määrittää se alue (luottamusväli), jolla koko perusjoukon arvioiden odotetaan olevan syksy ja virhe heidän määrittelyssään.

Luottamusväli on alue, jonka ääripisteet vastaavat tiettyä prosenttiosuutta tietyistä kysymyksen vastauksista. Luottamusväli liittyy läheisesti tutkitun piirteen keskihajontaan yleisväestössä: mitä suurempi se on, sitä leveämpi luottamusvälin tulee olla, jotta se sisältää tietyn prosenttiosuuden vasteista.

Joko 95 % tai 99 % luottamusväli on vakiona markkinointitutkimuksessa. Yksikään yritys ei tee markkinatutkimusta useilla näytteillä. Ja matemaattiset tilastot mahdollistavat jonkin tiedon saamisen otosjakaumasta, koska sillä on tietoa vain yhden otoksen vaihtelusta.

Keskivirhe on osoitus siitä, missä määrin koko perusjoukon osalta todenmukainen arvio poikkeaa tyypilliselle otokselle odotetusta arviosta. Lisäksi mitä suurempi otoskoko, sitä pienempi virhe. Suuri vaihteluarvo aiheuttaa suuren virhearvon ja päinvastoin.

Kun kysymyksessä on vain kaksi vastausta prosentteina ilmaistuna (käytetään prosenttimitta), otoskoko määritetään seuraavalla kaavalla:

missä n on näytteen koko; z on normalisoitu poikkeama, joka on määritetty valitun luottamustason perusteella; p on näytteen löydetty variaatio; g - (100-p); e on hyväksyttävä virhe.

Tietyn populaation vaihteluindikaattoria määritettäessä on ensinnäkin suositeltavaa tehdä alustava laadullinen analyysi tutkittavasta väestöstä, ennen kaikkea selvittää väestön yksiköiden samankaltaisuus demografisista, sosiaalisista ja muista suhteista. kiinnostaa tutkijaa. Pilottitutkimus on mahdollista tehdä käyttämällä aiemmin tehtyjen vastaavien tutkimusten tuloksia. Vaihtelevuuden prosentuaalista mittaa käytettäessä otetaan huomioon se seikka, että suurin vaihtelu saavutetaan p = 50 %:lla, mikä on pahin tapaus. Lisäksi tämä indikaattori ei vaikuta radikaalisti otoskokoon. Myös tutkimuksen tilaajan mielipide otoskoosta otetaan huomioon.

Otoskoko on mahdollista määrittää käyttämällä keskiarvoja prosenttiosuuksien sijaan.

missä s on keskihajonta.

Käytännössä s ei ole tiedossa, jos otos muodostetaan uudelleen eikä vastaavia tutkimuksia ole tehty. Tässä tapauksessa on suositeltavaa määrittää virhe e keskihajonnan murto-osina. Laskentakaava muunnetaan ja saa seuraavan muodon:

missä .

Yllä puhuimme erittäin suurikokoisista aggregaateista. Joissakin tapauksissa populaatiot eivät kuitenkaan ole suuria. Yleensä, jos otos on alle viisi prosenttia perusjoukosta, populaatiota pidetään suurena ja laskelmat suoritetaan yllä olevien sääntöjen mukaisesti. Jos otoskoko ylittää 5 % perusjoukosta, jälkimmäistä pidetään pienenä ja korjauskerroin lisätään yllä oleviin kaavoihin.

Otoskoko määritetään tässä tapauksessa seuraavasti:

,

Käytännön työ nro 8. "Tarvittavan otoskoon määrittäminen"

"Tarvittavan näytekoon määrittäminen"

Yleisin epäjatkuva havaintotyyppi on valikoiva havainto, jossa ei tarkastella kaikkia tutkittavan populaation yksiköitä, vaan niistä valitaan vain tietty osa.

Koko joukko tutkittavia kohteita (havaintoja) kutsutaan yleinen väestö. Otospopulaatio tai näyte kutsutaan yleisen väestön osaksi, joka valitaan edustavuuden tarjoavien ominaisuuksien tutkimukseen.

Valinta yleisjoukosta tehdään siten, että otoksen perusteella saadaan melko tarkka käsitys koko populaation pääparametreista. Tässä tapauksessa puhutaan sekä pisteestimaatista, joka otetaan otoksen tuloksena saadun keskiarvon, osuuden jne. vastaavaksi arvoksi, että intervalliarviosta, ts. rajoista, joissa tietyllä todennäköisyydellä halutun parametrin arvo voi olla yleisessä populaatiossa. Päävaatimus, jonka otoksen on täytettävä, on sen edustavuuden vaatimus, eli edustavuus.

Tilastoissa jatkuvan havainnoinnin tuloksia arvioidaan joskus valikoiviksi ominaisuuksiksi. Tällainen saatujen tietojen tulkinta tapahtuu tapauksissa, joissa tutkittujen yksiköiden määrä on pieni eikä ole vakaata uskoa, että tutkittavat ominaisuudet eivät voi saada muita arvoja kuin havainnoinnin tuloksena tunnistetut. Kokeita suoritettaessa arvojen määrä voi olla äärettömän suuri, joten niiden rajalliseen määrään perustuvia johtopäätöksiä tehtäessä on tarpeen tarkastella saatuja tietoja valikoivina ominaisuuksina.

Laajennettaessa otantatutkimuksen tuloksia yleiseen perusjoukkoon tulee ottaa huomioon, että yleisen ja otosjoukon ominaisuuksissa voi olla poikkeavuuksia, koska kyselyyn ei tehdä koko populaatiota, vaan vain osa. siitä.

Tilastollinen havaintovirhe otetaan huomioon tutkittavien kohteiden ominaisuuksien laskettujen ja todellisten arvojen välisen poikkeaman arvo.

Otantamenetelmällä saavutetaan merkittäviä aineellisia ja taloudellisia säästöjä tilastollisen havainnoinnin yhteydessä, mikä mahdollistaa tutkimusohjelman laajentamisen ja sen tehokkuuden lisäämisen. Toinen etu on saatujen tietojen korkea luotettavuus, koska suhteellisen pienellä otoskoolla on mahdollista järjestää kerätyn tiedon laadun tehokas valvonta. Näin ollen rekisteröintivirheiden esiintymisen ja niiden havaitsematta jättämisen todennäköisyys ensisijaisten tietojen varmennusvaiheessa pienenee. Ja lopuksi, useissa tapauksissa, kun täydellinen havainnointi liittyy tutkittujen yksiköiden tuhoutumiseen tai pilaantumiseen (esimerkiksi markkinoille tulevien elintarvikkeiden laatua tarkistettaessa), vain valikoiva tutkimus on mahdollista.

Otantamenetelmällä saatujen arvioiden tarkkuus ei riipu tutkittujen yksiköiden osuudesta, vaan niiden lukumäärästä.

Valikoivan havainnoinnin päävaiheet;

1) tavoitteen, tehtävien määrittely ja havainnointiohjelman laatiminen;

2) näytteenotto;

3) tiedonkeruu kehitetyn ohjelman perusteella;

4) saatujen tulosten analysointi ja näytteen pääominaisuuksien laskeminen;

5) otantavirheen laskeminen ja sen tulosten jakautuminen yleiseen perusjoukkoon.

Erottaa näytetyypit:

1) satunnainen(itse asiassa satunnainen);

2) mekaaninen(esimerkiksi joka 10., 20. jne.);

3) tyypillinen (kerrostunut), kun yleinen populaatio jaetaan ryhmiin ja kussakin ryhmässä tutkitaan useita esineitä));

4) sarja (pesiviä), kun kokonaiset sarjat valitaan satunnaisesti.

Yksinkertaisin tapa muodostaa otantapopulaatio on oikea satunnainen valinta. Näytteenottomenetelmän teoreettisia perusteita, jotka on alun perin kehitetty suhteessa varsinaiseen satunnaisvalintaan, käytetään myös muiden havaintomenetelmien otantavirheiden määrittämiseen.

Itse asiassa satunnainen valinta voidaan toistaa ja toistaa. klo toistettu Valinnassa jokainen yleisestä populaatiosta satunnaisesti valittu yksikkö voidaan tarkastella uudelleen sen jälkeen, kun havainto on palautettu tähän populaatioon. Käytännössä tämä valintatapa on harvinainen. Paljon yleisempää on itse asiassa satunnainen ei-toistuva valinta, jossa tutkittuja yksiköitä ei palauteta väestölle, eikä niitä voida mitata uudelleen. Toistuvalla valinnalla todennäköisyys tulla mukaan otokseen yleisen perusjoukon jokaisen yksikön osalta pysyy ennallaan. Ei-toistuvalla valinnalla se muuttuu, mutta kaikille yksiköille, jotka jäävät yleiseen perusjoukkoon sen jälkeen, kun siitä on valittu useita yksiköitä, todennäköisyys joutua otokseen on sama.

Tarkkuus - tutkimuksen tulosten virheaste tai luottamusvälin koko.

Absoluuttinen tarkkuus saadaan tietyllä aikavälillä, jossa arvioitu arvo tulee olla.

Suhteellinen tarkkuus määritellään suhteessa parametrin estimointitasoon.

Luottamus on luottamustaso siihen, että arvio on lähellä todellista arvoa.

Otoskokoa määritettäessä tulee ottaa huomioon useita laadullisia tekijöitä: tehtävän päätöksen tärkeys, tutkimuksen luonne, muuttujien määrä, analyysin luonne, tällaisissa tutkimuksissa käytetyt otoskoot, kattavuus määrä, valmistumisaste ja resurssirajoitukset. Tilastollisesti määritetty otoskoko on netto- eli lopullinen otoskoko, ts. jäljelle jääneet väestöyksiköt, kun on jätetty pois mahdolliset vastaajat, jotka eivät täytä annettuja kriteerejä tai eivät ole suorittaneet haastattelua. Kattavuuden ja kattavuuden mukaan voidaan tarvita paljon suurempi alkuperäinen otoskoko. Kaupallisessa markkinointitutkimuksessa ajan, rahan ja hyvien ihmisten puute voi olla kriittistä otoskoon määrittämisessä. Tavarataotoskoko määritettiin juuri näistä syistä.

Luottamusvälimenetelmä:

Otoskoon määritys luottamusvälien menetelmällä perustuu niiden luomiseen otoskeskiarvon tai näyteosuuden ympärille käyttäen standardivirhekaavaa. Oletetaan esimerkiksi, että tutkija käyttää yksinkertaista satunnaisotantaa valitakseen 300 kotitalouden otoksen arvioidakseen kotitalouden kuukausittaiset kulutuskulut tavarataloostoksille ja määrittääkseen, että otoksessa kotitalouden keskimääräinen kuukausikulutus on 182 dollaria. Aiemmat tutkimukset ovat osoittaneet, että RMS:n menojen poikkeama tutkimuspopulaatiossa on 55 dollaria.

Haluamme löytää välin, johon tietty prosenttiosuus otoskeskiarvoista putoaisi. Oletetaan, että haluamme määrittää populaation keskiarvon ympärille intervallin, joka sisältäisi 95 % otoskeskiarvosta 300 perheen otokseen perustuen; 95 % näytekeskiarvosta voidaan jakaa kahteen yhtä suureen osaan, puolet vähemmän ja puolet enemmän kuin keskiarvo, kuten kuvassa 10 näkyy. 1. Luottamusvälin laskennassa määritetään ala, joka on pienempi kuin (XL) ja suurempi kuin (XU) menojen keskiarvo (X).

XL:ää ja XU:ta vastaavat z-tekijäarvot voidaan laskea seuraavasti:

Siksi X:n minimiarvo määritellään seuraavasti

ja maksimiarvo

Asetetaan nyt 95 %:n luottamusväli 182 dollarin otoskeskiarvon ympärille. Laskemme ensin keskiarvon keskivirheen:

Keskimmäinen 95 % normaalijakaumasta on -1,96 z-arvojen sisällä; 95 %:n luottamusväli määritellään seuraavasti

Siten 95 %:n luottamusväli ulottuu 175,77 $:sta 188,23 $:iin On 95 %:n todennäköisyys, että havaitun populaation todellinen keskiarvo on 175,77 ja 188,23 $ välillä.

Keskimääräinen menetelmä:

Luottamusvälin luomiseen käytettyä menetelmää voidaan muokata otoskoon määrittämiseksi halutulla luottamusvälillä. Oletetaan, että haluat laskea perheen kuukausittaiset tavaratalokulut tarkemmin niin, että tulos on 5,0 dollarin sisällä tutkittavan väestön todellisesta keskiarvosta. Mikä pitäisi olla näytteen koko? Taulukko sisältää tarvittavan luettelon toiminnoista, jotka sinun on suoritettava.


  • 1. Määritä tarkkuusaste. Tämä on suurin sallittu ero (D) otoskeskiarvon ja populaation keskiarvon välillä. Esimerkissämme D = +5,0 $
  • 2. Määritä luottamustaso. Oletetaan, että haluttu luottamustaso on 95 %.
  • 3. Määritä annettuun luottamustasoon liittyvän normalisoidun poikkeaman z arvo. 95 %:n luottamustasolla todennäköisyys, että perusjoukon keskiarvo putoaa yksipuolisen alueen ulkopuolelle, on 0,025 (0,05/2). Vastaava z-arvo on 1,96.
  • 4. Määritä perusjoukon keskiarvon keskihajonta. Se voidaan saada toissijaisista lähteistä tai laskea pilottitutkimuksesta. Lisäksi keskihajonta voidaan asettaa tutkijan mielipiteen perusteella. Esimerkiksi normaalijakautuneen muuttujan alue on noin kuusi keskihajontaa (kolme keskiarvon vasemmalle ja kolme oikealle).

5. Määritä otoksen koko käyttämällä keskiarvon keskivirheen kaavaa

Meidän esimerkissämme

(pyöristetty ylöspäin lähimpään kokonaislukuun).

Otoskokokaavasta voidaan nähdä, että se kasvaa yleisen perusjoukon vaihtelun (hajonnan) kasvaessa sekä luotettavuuden ja laskelmien suorittamisen tarkkuusasteen kasvaessa. . Otoskoko on suoraan verrannollinen Q2:een, joten mitä suurempi populaatiovarianssi on, sitä suurempi on otoskoko. Vastaavasti korkeampi luottamustaso merkitsee suurempaa z-arvoa ja siten suurempaa otoskokoa. Muuttujat Q2 ja z ovat osoittajassa. Tarkkuusastetta nostetaan pienentämällä D:n arvoa ja siksi otoskoko kasvaa, koska D on nimittäjässä.

6. Jos otoskoko on 10 % tai enemmän populaation koosta, käytetään lopullista populaation korjausta (fpc). Sitten vaadittu otoskoko lasketaan kaavalla

7. Jos perusjoukon keskihajontaa o ei tunneta ja käytetään sen arvioitua arvoa, se tulee laskea uudelleen otoksen saamisen jälkeen. Otoksen keskihajontaa s käytetään arvauksena Q:lle. Korjattu luottamusväli tulee sitten laskea tosiasiallisesti saadun tarkkuusasteen määrittämiseksi.

Oletetaan, että arvoa 55,00 käytettiin arvauksena a:lle, koska todellinen arvo oli tuntematon. Saatiin näyte, jossa n = 465. Tutkimuksen tietojen perusteella lasketaan keskiarvo X, joka on 180,00, ja näytteen s keskihajonna on 50,00. Sitten korjattu luottamusväli on:

Huomaa, että tuloksena oleva luottamusväli on jo arvioitu. Tämä johtuu siitä, että perusjoukon keskihajonna on yliarvioitu otoksen ominaisuuksien perusteella.

8. Joskus tarkkuus määritellään suhteellisella eikä absoluuttisella termillä. Toisin sanoen voi olla tiedossa, että laskennan tuloksen tulee olla plus tai miinus R% keskiarvosta. Tässä tapauksessa otoksen koko voidaan määrittää seuraavasti

Populaation koko N ei vaikuta suoraan otoskokoon, paitsi jos käytetään lopullista populaation korjauskerrointa. Se voi tuntua uskomattomalta, mutta jos ajattelet sitä, tämä lausunto on järkevä. Esimerkiksi, jos populaation kaikkien elementtien tutkitut ominaisuudet ovat identtisiä, niin yhdestä elementistä koostuva näyte riittää keskiarvon laskemiseen. Tämä on myös oikein, jos perusjoukko koostuu 50, 500, 5000 tai 50 000 alkiosta. Samalla populaation ominaisuuksien vaihtelevuus vaikuttaa suoraan otoskokoon. Tämä vaihtelu otetaan huomioon laskettaessa otoskokoa yleisvarianssilla Q2 tai otosvarianssilla s2.

Jaa menetelmä:

Jos tutkittavaa tilastoa ei edusta keskiarvo, vaan osuus, niin markkinoija määrittää otoskoon samalla tavalla. Oletetaan, että tutkija on kiinnostunut määrittämään tavaratalon luottokortin omistavien kotitalouksien osuuden. Menettely on seuraava.

1. Määritä tarkkuusaste. Oletetaan, että haluttu tarkkuusaste on sellainen, että toleranssiväli on asetettu arvoon

D \u003d p - l \u003d ± 0,05.

  • 2. Määritä luottamustaso. Oletetaan, että 95 %:n luottamustaso on toivottu.
  • 3. Määritä annettuun luottamustasoon liittyvä z-arvo. Kuten keskiarvoa laskettaessa selitettiin, se on 1,96.
  • 4. Määritä n:n kokonaisosuus. Kuten aiemmin totesimme, se voidaan saada toissijaisista lähteistä, kokeellisen tutkimuksen aikana tai tutkijan mielipiteen perusteella. Oletetaan, että tutkija olettaa toissijaisten tietojen perusteella, että 64 %:lla tutkittavan väestön perheistä on tavaratalon luottokortti. Siksi l = 0,64.
  • 5. Määritä otoksen koko käyttämällä suhteellista standardivirhekaavaa:

Meidän esimerkissämme

  • (pyöristetty ylöspäin lähimpään kokonaislukuun).
  • 6. Jos lopullinen otoskoko on 10 % tai enemmän populaation koosta, käytetään lopullista populaation korjausta (fpc). Sitten vaadittu otoskoko lasketaan kaavalla

missä n on otoksen koko ennen lopullisen korjauksen soveltamista; nc on otoskoko lopullisen korjauksen jälkeen.

7. Jos TC-laskenta oli väärä, luottamusväli on enemmän tai vähemmän tarkka kuin on tarpeen. Oletetaan, että otoksen lopussa osuuden p arvoksi lasketaan 0,55. Luottamusväli lasketaan sitten uudelleen ja sp:ä käytetään tuntemattoman Qp:n laskemiseen seuraavasti:

Meidän esimerkissämme

Luottamusväli on tällöin 0,55 ± 1,96 (0,0264) = 0,55 + 0,052, mikä tarkoittaa, että se on määritettyä leveämpi. Tämä selittyy sillä, että otoksen keskihajonta p = 0,55 osoittautui suuremmiksi kuin yleisen perusjoukon keskihajonnan arvioitu arvo, kun n = 0,64.

Jos määritettyä väliä suurempi aikaväli ei ole hyväksyttävä, otoskokoa voidaan säätää vastaamaan populaation suurinta mahdollista poikkeamaa. Tällainen poikkeama syntyy, kun tulo l (1 - l) saavuttaa maksimiarvonsa, jolle l:n tulee olla 0,5. Tämä johtopäätös voidaan tehdä ilman laskelmia. Koska toisella puolella populaatiosta on yksi tunnusarvo ja toisella puolella toinen, oikean johtopäätöksen tekemiseen tarvitaan enemmän tietoa kuin silloin, kun tilanne on selkeämpi ja useimmilla elementeillä on sama tunnusarvo. Esimerkissämme tämä johtaa otoskoon

  • (pyöristetty ylöspäin lähimpään kokonaislukuun).
  • 8. Joskus tarkkuus määritellään suhteellisella eikä absoluuttisella termillä. Toisin sanoen saattaa olla tiedossa, että laskennan tuloksena tulee olla plus tai miinus R% väestön osuudesta. Tämä tarkoittaa, että D = Rl. Tässä tapauksessa otoksen koko voidaan määrittää seuraavasti