Edustava näyte. Esimerkkivaatimukset

Otospopulaation tutkimuksen perimmäinen tavoite on aina saada tietoa populaatiosta. Tätä varten näytetutkimuksen on täytettävä tietyt ehdot. Yksi tärkeimmistä ehdoista otoksen edustavuus (representatiivisuus).. Kuten aiemmin todettiin, erotetaan laadullinen ja määrällinen edustavuus.

Satunnaisuus, joka takaa tilastollisten tutkimusten laadullisen (rakenteellisen) edustavuuden, saavutetaan täyttämällä useita otosryhmien (joukkojen) muodostamisen ehtoja:

1. Jokaisella perusjoukon jäsenellä on oltava yhtä suuri todennäköisyys tulla mukaan otokseen.

2. Havaintoyksiköiden valinta yleisestä populaatiosta on suoritettava tutkittavasta piirteestä riippumatta. Jos valinta tehdään määrätietoisesti, on myös noudatettava tutkittavan piirteen jakauman riippumattomuuden ehtoja.

3. Valinta tulisi tehdä homogeenisista ryhmistä.

Otoksen ja yleisen perusjoukon mahdollisimman läheisyyden takaavien ehtojen noudattaminen varmistetaan erityisillä valintamenetelmillä. Muodostusmenetelmästä riippuen erotetaan seuraavat näytteet:

1. Näytteet, jotka eivät vaadi yleisen perusjoukon jakamista osiin (itse asiassa satunnainen toistuva tai ei-toistuva näytteenotto).

2. Näytteet, jotka edellyttävät yleisen populaation jakamista osiin (mekaaniset, tyypilliset tai typologiset näytteet, kohortti, parikonjugaattinäytteet).

Itse asiassa satunnaisotos muodostetaan satunnaisella valinnalla - satunnaisesti. Satunnainen valinta perustuu sekoitukseen. Esimerkiksi: pallon valitseminen urheilulotossa kaikkien pallojen sekoittamisen jälkeen, lottovoittonumeroiden valinta, potilaskorttien satunnainen valinta tutkimukseen jne. Joskus käytetään satunnaislukuja, jotka on saatu satunnaislukutaulukoista tai käyttämällä satunnaislukugeneraattoreita. Näiden lukujen mukaan yleisen perusjoukon ennalta numeroidusta taulukosta valitaan havaintoyksiköt, joiden numerot vastaavat pois pudonneita satunnaislukuja.

Satunnaisotosta koottaessa, kun objekti on valittu ja kaikki tarvittavat tiedot siitä rekisteröity, voit tehdä kaksi asiaa: objekti voidaan palauttaa tai sitä ei palauteta yleiseen perusjoukkoon. tämän perusteella näytettä kutsutaan toistuvaksi(esine palautetaan väestölle) tai ei-toistuva(esinettä ei palauteta väestölle). Koska useimmissa tilastollisissa tutkimuksissa toistuvien ja ei-toistuvien näytteiden välillä ei käytännössä ole eroa, ehto on a priori hyväksytty, että näyte toistetaan.

Arvioi tarvittava näytekoko

Jotta otos edustaisi kvantitatiivisesti yleistä perusjoukkoa, on ensin arvioitava otokseen sisällytettävän tiedon määrä.

Yleisen väestön koko on tuntematon uudelleennäytteenoton määrä, joka takaa edustavat tulokset, jos tulos näkyy indikaattorissa as suhteellinen arvo (osake), määritetään kaavalla:

missä p on tutkittavan piirteen indikaattorin arvo prosentteina; q = (100- p) ;

t on luottamuskerroin, joka osoittaa, millä todennäköisyydellä indikaattorin koko ei ylitä rajavirheen rajoja (yleensä otetaan t = 2, mikä antaa 95 %:n todennäköisyyden virheettömälle ennusteelle);

 - indikaattorin rajavirhe.

Esimerkiksi: Yksi teollisuusyritysten työntekijöiden terveyttä kuvaavista indikaattoreista on niiden työntekijöiden prosenttiosuus, jotka eivät olleet sairaita vuoden aikana. Oletetaan, että teollisuussektorilla, johon tutkittu yritys kuuluu, tämä indikaattori on 25 %. Rajavirhe, joka voidaan sallia, jotta indikaattoriarvojen hajautus ei ylitä kohtuullisia rajoja, on 5 %. Tässä tapauksessa indikaattori voi ottaa arvoja 25 % ± 5 %, ts. 20 prosentista 30 prosenttiin. Oletetaan, että t = 2, saamme

Siinä tapauksessa, jos indikaattori on keskiarvo, niin havaintojen määrä voidaan määrittää kaavalla:

jossa σ on standardipoikkeama, joka voidaan saada aikaisemmista tutkimuksista tai koe- (pilotti)tutkimusten perusteella.

Toistuvalla valinnalla ja tunnetun yleisen väestön ehdolla määrittääksesi tarvittavan satunnaisotoksen koon käytön yhteydessä suhteelliset arvot (osuudet) kaavaa sovelletaan:

keskiarvoille kaavaa käytetään:

missä N on yleisen populaation koko.

Perustuu yllä olevan esimerkin ehtoihin ja olettaen yleisen populaation koon N=500 työntekijöitä, saamme:

On helppo nähdä, että ei-toistuvan näytteenoton vaadittu otoskoko on pienempi kuin toistuvan näytteenoton (vastaavasti 188 ja 300 työntekijää).

Yleensä edustavan tiedon saamiseksi vaadittavien havaintojen määrä vaihtelee käänteisesti sallitun virheen neliön kanssa.

Mekaaninen näytteenotto- otanta, kun havaintoyksiköt valitaan mekaanisesti tutkitusta populaatiosta. Esimerkiksi: joka viidennen tai joka kymmenennen työntekijän valinta yrityksen henkilöstöosaston korttien tai lääketieteellisen yksikön poliklinikan avohoitokorttien mukaan.

tyypillinen, typologinen tai kaavoitettu otanta sisältää yleisen väestön jakamisen useisiin laadullisesti homogeenisiin ryhmiin. Esimerkiksi: Kun tutkitaan korkeakouluopiskelijoiden ilmaantuvuutta syvälliseen tutkimukseen kullakin kurssilla, valitaan kokoonpanoltaan tyypilliset opiskelijaryhmät. Usein tämä valintamenetelmä yhdistetään muihin menetelmiin. Esimerkiksi: kaupungin alue on jaettu tyypillisiin alueisiin saasteasteen mukaan, näille alueille muodostetaan havaintoryhmät satunnaisella valinnalla.

kohortin valinta viittaa kohdistettuun valintaan. Tällä menetelmällä yksilöt valitaan yleisestä populaatiosta (jakauma alaryhmiin ei-satunnainen), joita yhdistää minkä tahansa tutkimuksessa merkittävän merkin ilmaantumisen hetki tai tutkittu vaikutus (syntymävuosi, alkamisvuosi). sairaudesta, lääkkeen ottamisesta jne.).

Tapaus-kontrollitutkimus(SC) on eräänlainen epidemiologinen tutkimus, jossa riskitekijän jakautumista verrataan sairauspotilasryhmän ja kontrolliryhmän välillä. Tutkimus (SC) viittaa retrospektiiviseen, sillä tutkija jakaa potilaita ryhmiin sen mukaan, onko heillä jokin sairaus vai ei, saa heiltä tietoa menneisyydestä.

Otantamenetelmän käyttöä saniteettitilastoissa on syytä tarkastella erikseen väestön yleistä sairastuvuutta tutkittaessa. Näytteenottomenetelmän teoreettisia lähtökohtia on testattu erityistutkimuksissa. Joten, V.S. Bykhovsky et ai. Vuonna 1928 he käsittelivät rinnakkain 132,8 tuhatta tautitietoa sisältävää korttia jatkuvalla menetelmällä ja joka viidennen kortin mekaanisella valinnalla. Tämän käsittelyn tulosten analyysi osoitti, että sairastuvuustutkimuksesta saadut tiedot olivat erittäin edustavia. Kuitenkaan tähän päivään mennessä laajassa käytännössä ei ole olemassa yhtenäisiä metodologisia lähestymistapoja valikoivien saniteettitilastollisten tutkimusten suorittamiseen.

Väestö- joukko yksiköitä, joilla on massaluonne, tyypillisyys, laadullinen yhtenäisyys ja vaihtelu.

Tilastojoukko koostuu aineellisesti olemassa olevista objekteista (Työntekijät, yritykset, maat, alueet), on objekti.

Väestöyksikkö- tilastollisen perusjoukon kukin tietty yksikkö.

Yksi ja sama tilastollinen populaatio voi olla homogeeninen yhdeltä piirteeltä ja heterogeeninen toiselta.

Laadullinen yhtenäisyys- perusjoukon kaikkien yksiköiden samankaltaisuus minkä tahansa ominaisuuden osalta ja erilaisuus kaikkien muiden osalta.

Tilastojoukossa erot perusjoukon yksikön ja toisen välillä ovat useammin määrällisiä. Kvantitatiivisia muutoksia populaation eri yksiköiden attribuuttien arvoissa kutsutaan vaihteluksi.

Ominaisuuden vaihtelu- merkin määrällinen muutos (kvantitatiiviselle merkille) siirtymisen aikana väestöyksiköstä toiseen.

merkki- tämä on yksiköiden, esineiden ja ilmiöiden ominaisuus, ominaisuus tai muu ominaisuus, joka voidaan havaita tai mitata. Merkit jaetaan kvantitatiivisiin ja laadullisiin. Ominaisuuden arvon monimuotoisuutta ja vaihtelevuutta populaation yksittäisissä yksiköissä kutsutaan vaihtelua.

Attributiiviset (laadulliset) piirteet eivät ole mitattavissa (väestön kokoonpano sukupuolen mukaan). Kvantitatiivisilla ominaisuuksilla on numeerinen ilmaisu (väestön kokoonpano iän mukaan).

Indeksi- Tämä on yksiköiden tai aggregaattien minkä tahansa ominaisuuden yleistävä määrällinen ja laadullinen ominaisuus tiettyyn tarkoitukseen tietyissä aika- ja paikkaolosuhteissa.

Tuloskortti on joukko indikaattoreita, jotka kuvaavat kattavasti tutkittavaa ilmiötä.

Harkitse esimerkiksi palkkaa:

Merkki - palkat
Tilastollinen väestö - kaikki työntekijät
Väestön yksikkö on jokainen työntekijä
Laadullinen homogeenisuus - kertynyt palkka
Ominaisuuden variaatio - numerosarja

Yleinen populaatio ja näyte siitä

Perus on joukko tietoja, jotka on saatu yhden tai useamman ominaisuuden mittaamisen tuloksena. Tosiasiallisesti havaittu objektijoukko, jota tilastollisesti edustaa satunnaismuuttujan havaintojen sarja, on näytteenotto, ja hypoteettisesti olemassa oleva (ajatteltu) - yleinen väestö. Yleinen populaatio voi olla äärellinen (havaintojen määrä N = vakio) tai ääretön ( N = ∞), ja otos yleisestä populaatiosta on aina tulosta rajoitetusta määrästä havaintoja. Otoksen muodostavien havaintojen lukumäärää kutsutaan otoskoko. Jos näytekoko on riittävän suuri n→∞) näyte otetaan huomioon iso, muuten sitä kutsutaan näytteeksi rajoitettu määrä. Näyte otetaan huomioon pieni, jos yksiulotteista satunnaismuuttujaa mitattaessa otoskoko ei ylitä 30 ( n<= 30 ), ja kun mitataan samanaikaisesti useita ( k) ominaisuuksia moniulotteisessa avaruussuhteessa n kohtaan k vähemmän kuin 10 (n/k< 10) . Mallilomakkeet variaatiosarja jos sen jäseniä ovat tilaustilastot eli satunnaismuuttujan näytearvot X lajitellaan nousevaan järjestykseen (rankattu), attribuutin arvot kutsutaan vaihtoehtoja.

Esimerkki. Melkein samaa satunnaisesti valittua objektijoukkoa - Moskovan yhden hallintoalueen liikepankkeja - voidaan pitää otoksena kaikkien tämän alueen liikepankkien väestöstä ja otoksena kaikkien Moskovan liikepankkien yleisestä populaatiosta. , sekä näyte maan liikepankeista jne.

Perusnäytteenottomenetelmät

Tilastollisten johtopäätösten luotettavuus ja tulosten mielekäs tulkinta riippuu mm edustavuus näytteitä, ts. yleisen perusjoukon ominaisuuksien esittämisen täydellisyys ja riittävyys, joihin nähden tätä otosta voidaan pitää edustavana. Väestön tilastollisten ominaisuuksien tutkimus voidaan järjestää kahdella tavalla: käyttämällä jatkuva ja epäjatkuva. Jatkuva havainto sisältää kaiken tutkimisen yksiköitä opiskellut aggregaatteja, a epäjatkuva (valikoiva) havainto- vain osia siitä.

Näytteenoton järjestämiseen on viisi päätapaa:

1. yksinkertainen satunnainen valinta, jossa objektit poimitaan satunnaisesti yleisestä objektijoukosta (esimerkiksi taulukon tai satunnaislukugeneraattorin avulla), ja jokaisella mahdollisella näytteellä on yhtä suuri todennäköisyys. Tällaisia näytteitä kutsutaan itse asiassa satunnainen;

2. yksinkertainen valinta tavanomaisella menettelyllä suoritetaan mekaanisella komponentilla (esim. päivämäärät, viikonpäivät, asuntojen numerot, aakkosten kirjaimet jne.) ja näin saadut näytteet ovat ns. mekaaninen;

3. kerrostunut valinta koostuu siitä, että yleinen tilavuusjoukko on jaettu tilavuuden osajoukkoihin tai kerroksiin (ositteisiin) siten, että . Ositteet ovat tilastollisilta ominaisuuksiltaan homogeenisia objekteja (esim. väestö on jaettu ositteisiin ikä- tai yhteiskuntaluokkien mukaan; yritykset toimialoittain). Tässä tapauksessa näytteet kutsutaan kerrostunut(muuten, kerrostunut, tyypillinen, kaavoitettu);

4. menetelmät sarja valintaa käytetään muodostamiseen sarja tai sisäkkäisiä näytteitä. Ne ovat käteviä, jos on tarpeen tutkia "lohko" tai sarja esineitä kerralla (esimerkiksi tavaraerä, tietyn sarjan tuotteet tai maan aluehallinnollisen jaon väestö). Sarjojen valinta voidaan tehdä satunnaisesti tai mekaanisesti. Samalla suoritetaan jatkuva tutkimus tietylle tavaraerälle tai koko alueelliselle yksikölle (asuinrakennus tai kortteli);

5. yhdistetty(porrastettu) valinta voi yhdistää useita valintamenetelmiä kerralla (esimerkiksi kerrostettu ja satunnainen tai satunnainen ja mekaaninen); tällaista näytettä kutsutaan yhdistetty.

Valintatyypit

Tekijä: mieleen on yksilö-, ryhmä- ja yhdistetty valinta. klo yksilöllinen valinta otosjoukosta valitaan yksittäiset yksiköt yleisestä populaatiosta ryhmän valinta ovat laadullisesti homogeenisia yksikköryhmiä (sarjoja) ja yhdistetty valikoima sisältää ensimmäisen ja toisen tyypin yhdistelmän.

Tekijä: menetelmä valinta erottaa toistuva ja ei-toistuva näyte.

Toistamaton kutsutaan valinnaksi, jossa otokseen pudonnut yksikkö ei palaa alkuperäiseen perusjoukkoon eikä osallistu jatkovalintaan; kun taas yleisen väestön yksiköiden lukumäärä N vähennetään valintaprosessin aikana. klo toistettu valinta sai kiinni otoksessa yksikkö rekisteröinnin jälkeen palautetaan yleiseen perusjoukkoon ja näin ollen säilyy yhtäläinen mahdollisuus muiden yksiköiden kanssa käytettäväksi jatkovalintamenettelyssä; kun taas yleisen väestön yksiköiden lukumäärä N säilyy ennallaan (menetelmää käytetään harvoin sosioekonomisissa tutkimuksissa). Kuitenkin suurella N (N → ∞) kaavat toistamaton valikoima on lähellä niitä toistettu valinta ja jälkimmäisiä käytetään melkein useammin ( N = vakio).

Yleisen ja otosjoukon parametrien tärkeimmät ominaisuudet

Tutkimuksen tilastollisten päätelmien perustana on satunnaismuuttujan jakauma, kun taas havaitut arvot (x 1, x 2, ..., x n) kutsutaan satunnaismuuttujan realisaatioiksi X(n on otoksen koko). Satunnaismuuttujan jakauma yleisessä populaatiossa on teoreettinen, luonteeltaan ihanteellinen ja sen otosanalogi on empiirinen jakelu. Jotkut teoreettiset jakaumat on annettu analyyttisesti, ts. niitä vaihtoehtoja määritä jakaumafunktion arvo kussakin pisteessä satunnaismuuttujan mahdollisten arvojen avaruudessa. Tästä syystä näytteen jakautumisfunktion määrittäminen on vaikeaa ja joskus mahdotonta vaihtoehtoja estimoidaan empiirisestä tiedosta ja sitten ne korvataan teoreettista jakaumaa kuvaavaksi analyyttiseksi lausekkeeksi. Tässä tapauksessa oletus (tai hypoteesi) jakauman tyypistä voi olla sekä tilastollisesti oikea että virheellinen. Mutta joka tapauksessa otoksesta rekonstruoitu empiirinen jakauma luonnehtii vain karkeasti todellista. Tärkeimmät jakeluparametrit ovat odotettu arvo ja dispersio.

Jakaumat ovat luonteeltaan sellaisia jatkuva ja diskreetti. Tunnetuin jatkuva jakelu on normaali. Parametrien ja sen selektiivisiä analogeja ovat: keskiarvo ja empiirinen varianssi. Yksittäisistä sosioekonomisissa tutkimuksissa yleisimmin käytetty vaihtoehto (dikotominen) jakelu. Tämän jakauman odotusparametri ilmaisee suhteellisen arvon (tai Jaa) populaation yksiköt, joilla on tutkittava ominaisuus (se on merkitty kirjaimella ); se osuus väestöstä, jolla ei ole tätä ominaisuutta, on merkitty kirjaimella q (q = 1 - p). Vaihtoehtoisen jakauman varianssilla on myös empiirinen analogi.

Jakauman tyypistä ja populaatioyksiköiden valintatavasta riippuen jakautumisparametrien ominaisuudet lasketaan eri tavalla. Tärkeimmät teoreettisille ja empiirisille jakaumille on esitetty taulukossa. 9.1.

Näyteosuus k n on otosjoukon yksiköiden lukumäärän suhde yleisen perusjoukon yksiköiden lukumäärään:

k n = n/N.

Näyteosuus w on niiden yksiköiden suhde, joilla on tutkittava ominaisuus x näytteen kokoon n:

w = n n/n.

Esimerkki. 1000 yksikköä sisältävässä tavaraerässä, 5 % näytteellä näytefraktio k n absoluuttisena arvona on 50 yksikköä. (n = N*0,05); jos tästä näytteestä löytyy 2 viallista tuotetta, niin näytefraktio w on 0,04 (w = 2/50 = 0,04 tai 4 %).

Koska otospopulaatio eroaa yleisestä populaatiosta, niitä on näytteenottovirheet.

Taulukko 9.1 Yleisten ja otospopulaatioiden pääparametrit

Näytteenottovirheet

Missä tahansa (kiinteässä ja valikoivassa) voi tapahtua kahdenlaisia virheitä: rekisteröinti ja edustavuus. Virheitä rekisteröinti voi olla satunnainen ja järjestelmällinen merkki. Satunnainen virheet johtuvat monista erilaisista hallitsemattomista syistä, ovat luonteeltaan tahattomia ja yleensä tasapainottavat toisiaan yhdistelmänä (esimerkiksi huoneen lämpötilan vaihteluiden aiheuttamat muutokset instrumentin lukemissa).

Systemaattinen virheet ovat puolueellisia, koska ne rikkovat näytteen kohteiden valinnan sääntöjä (esimerkiksi mittauspoikkeamat mittalaitteen asetuksia muuttaessa).

Esimerkki. Kaupungin väestön sosiaalisen aseman arvioimiseksi on tarkoitus tutkia 25 % perheistä. Jos kuitenkin joka neljännen asunnon valinta perustuu sen lukumäärään, on olemassa vaara, että valitaan kaikki vain yhden tyyppiset asunnot (esim. yksiö), mikä aiheuttaa systemaattisen virheen ja vääristää tuloksia; asunnon numeron valinta arvalla on parempi, koska virhe on satunnainen.

Edustusvirheet vain valikoivalle havainnoinnille ominaisia, niitä ei voida välttää ja ne syntyvät siitä syystä, että näyte ei täysin toista yleistä. Otuksesta saatujen indikaattoreiden arvot eroavat samojen arvojen indikaattoreista yleisessä populaatiossa (tai jatkuvan havainnoinnin aikana saaduista).

Näytteenottovirhe on yleisen perusjoukon parametrin arvon ja sen otosarvon välinen ero. Kvantitatiivisen attribuutin keskiarvo on yhtä suuri kuin: , ja osuus (vaihtoehtoinen attribuutti) - .

Otantavirheet ovat luontaisia vain näytehavainnoissa. Mitä suurempia nämä virheet ovat, sitä enemmän empiirinen jakauma eroaa teoreettisesta. Empiirisen jakauman parametrit ja ovat satunnaismuuttujia, joten näytteenottovirheet ovat myös satunnaismuuttujia, ne voivat saada eri arvoja eri näytteille, ja siksi on tapana laskea keskimääräinen virhe.

Keskimääräinen näytteenottovirhe on arvo, joka ilmaisee otoksen keskiarvon keskihajonnan matemaattisesta odotuksesta. Tämä arvo riippuu satunnaisvalinnan periaatteesta ensisijaisesti otoksen koosta ja ominaisuuden vaihteluasteesta: mitä suurempi ja pienempi piirteen vaihtelu (siis arvo ), sitä pienempi on ominaisuuden arvo. keskimääräinen näytteenottovirhe. Yleisen ja otospopulaation varianssien välinen suhde ilmaistaan kaavalla:

nuo. riittävän suurille, voimme olettaa, että . Keskimääräinen otantavirhe näyttää näytejoukon parametrin mahdolliset poikkeamat yleisen perusjoukon parametrista. Taulukossa. 9.2 näyttää lausekkeet keskimääräisen näytteenottovirheen laskemiseksi eri havainnoinnin organisointimenetelmille.

Taulukko 9.2 Näytteen keskiarvon ja osuuden keskivirhe (m) eri näytetyypeille

Missä on jatkuvan ominaisuuden ryhmän sisäisten näytteiden varianssien keskiarvo;

Osuuden ryhmän sisäisten hajautusten keskiarvo;

— valittujen sarjojen lukumäärä, — sarjojen kokonaismäärä;

missä on th-sarjan keskiarvo;

- jatkuvan ominaisuuden koko otoksen yleinen keskiarvo;

missä on piirteen osuus th-sarjassa;

— ominaisuuden kokonaisosuus koko otoksesta.

Keskimääräisen virheen suuruus voidaan kuitenkin arvioida vain tietyllä todennäköisyydellä Р (Р ≤ 1). Ljapunov A.M. osoitti, että otoskeskiarvojen jakauma ja siten niiden poikkeamat yleisestä keskiarvosta riittävän suurella luvulla noudattavat suunnilleen normaalijakauman lakia edellyttäen, että yleisellä populaatiolla on äärellinen keskiarvo ja rajoitettu varianssi.

Matemaattisesti tämä keskiarvon väite ilmaistaan seuraavasti:

ja murtoluvulle lauseke (1) on muodossa:

missä - on marginaalinen otantavirhe, joka on keskimääräisen näytteenottovirheen kerrannainen , ja kerrannaistekijä on Studentin kriteeri ("luottamustekijä"), jonka on ehdottanut W.S. Gosset (salanimi "Opiskelija"); eri näytekokojen arvot tallennetaan erityiseen taulukkoon.

Funktion Ф(t) arvot joillekin t:n arvoille ovat:

Siksi lauseke (3) voidaan lukea seuraavasti: todennäköisyydellä P = 0,683 (68,3 %) voidaan väittää, että ero otoksen ja yleisen keskiarvon välillä ei ylitä yhtä keskivirheen arvoa m(t=1), todennäköisyydellä P = 0,954 (95,4 %)— se ei ylitä kahden keskivirheen arvoa m (t = 2) , todennäköisyydellä P = 0,997 (99,7 %)- ei ylitä kolmea arvoa m (t = 3). Siten todennäköisyys, että tämä ero ylittää kolme kertaa keskivirheen arvon, määrää virhetaso eikä ole enempää kuin 0,3% .

Taulukossa. 9.3 Kaavat otosmarginaalivirheen laskemiseksi on annettu.

Taulukko 9.3 Marginaalinen otantavirhe (D) keskiarvolle ja suhteelle (p) eri otostyypeille

Otostulosten laajentaminen väestöön

Otoshavainnoinnin perimmäinen tavoite on karakterisoida yleinen populaatio. Pienillä otoskooilla parametrien ( ja ) empiiriset arviot voivat poiketa merkittävästi niiden todellisista arvoista ( ja ). Siksi on tarpeen määrittää rajat, joiden sisällä parametrien ( ja ) näytearvojen todelliset arvot ( ja ) ovat.

Luottamusväli minkä tahansa yleisen perusjoukon parametrin θ arvoa kutsutaan tämän parametrin satunnaiseksi arvoalueeksi, joka todennäköisyydellä on lähellä 1 ( luotettavuus) sisältää tämän parametrin todellisen arvon.

marginaalinen virhe näytteet Δ voit määrittää väestön ja niiden ominaisuuksien raja-arvot luottamusvälit, jotka ovat yhtä suuria kuin:

Bottom line luottamusväli saatu vähentämällä marginaalinen virhe näytteen keskiarvosta (osuus) ja ylin lisäämällä se.

Luottamusväli keskiarvoa varten se käyttää marginaalista otantavirhettä ja tietylle luottamustasolle määritetään kaavalla:

Tämä tarkoittaa, että tietyllä todennäköisyydellä R, jota kutsutaan luottamustasoksi ja jonka arvo määrittää yksiselitteisesti t, voidaan väittää, että keskiarvon todellinen arvo on alueella alkaen , ja osakkeen todellinen arvo on välillä

Kun lasketaan kolmen vakioluottamustason luottamusväliä P = 95 %, P = 99 % ja P = 99,9 % arvon valitsee . Sovellukset vapausasteiden lukumäärästä riippuen. Jos otoskoko on riittävän suuri, arvot vastaavat näitä todennäköisyyksiä t ovat tasavertaisia: 1,96, 2,58 ja 3,29 . Näin ollen marginaalinen otantavirhe antaa meille mahdollisuuden määrittää yleisen populaation ominaisuuksien marginaaliarvot ja niiden luottamusvälit:

Sosioekonomisissa tutkimuksissa valikoivan havainnoinnin tulosten jakautumisella suurelle väestölle on omat ominaisuutensa, koska se edellyttää kaikkien sen tyyppien ja ryhmien edustavuuden täydellisyyttä. Laskelma perustuu tällaisen jakauman mahdollisuuteen suhteellinen virhe:

missä Δ % - suhteellinen marginaalinen otantavirhe; , .

Otoshavainnon laajentamiseksi populaatioon on kaksi päämenetelmää: suora muunnos ja kertoimien menetelmä.

Essence suora muuntaminen on kertoa otoksen keskiarvo!!\overline(x) populaation koolla .

Esimerkki. Arvioidaan otosmenetelmällä kaupungin taaperoiden keskimääräinen lukumäärä ja ollaan henkilö. Jos kaupungissa on 1000 nuorta perhettä, saadaan kunnallisen päiväkodin paikkojen määrä kertomalla tämä keskiarvo väestön koolla N = 1000, ts. tulee olemaan 1200 paikkaa.

Kertoimien menetelmä on suositeltavaa käyttää silloin, kun suoritetaan valikoivaa havainnointia jatkuvan havainnoinnin tietojen selkeyttämiseksi.

Tällöin käytetään kaavaa:

jossa kaikki muuttujat ovat populaation kokoa:

Vaadittu näytekoko

Taulukko 9.4 Vaadittu otoskoko (n) erityyppisille otantaorganisaatioille

Suunniteltaessa otantatutkimusta ennalta määrätyllä sallitun otantavirheen arvolla, on välttämätöntä arvioida oikein vaadittu otoskoko. Tämä määrä voidaan määrittää valikoivan havainnon aikana sallitun virheen perusteella tietyllä todennäköisyydellä, joka takaa hyväksyttävän virhetason (ottaen huomioon havainnon organisointitavan). Vaaditun otoskoon n määrittämiseen tarvittavat kaavat saadaan helposti suoraan otosmarginaalivirheen kaavoista. Joten marginaalivirheen lausekkeesta:

näytteen koko määräytyy suoraan n:

Tämä kaava osoittaa, että näytteenoton marginaalivirheen pieneneminen Δ lisää merkittävästi vaadittua otoskokoa, joka on verrannollinen Studentin t-testin varianssiin ja neliöön.

Tiettyä havainnointimenetelmää varten vaadittu otoskoko lasketaan taulukossa annettujen kaavojen mukaisesti. 9.4

Käytännön laskentaesimerkkejä

Esimerkki 1. Jatkuvan kvantitatiivisen ominaisuuden keskiarvon ja luottamusvälin laskeminen.

Selvityksen nopeuden arvioimiseksi pankissa velkojien kanssa otettiin satunnaisotannalla 10 maksuasiakirjaa. Niiden arvot osoittautuivat yhtä suureksi (päivinä): 10; 3; viisitoista; viisitoista; 22; 7; kahdeksan; yksi; 19; kaksikymmentä.

Vaaditaan todennäköisyydellä P = 0,954 määrittää marginaalivirheen Δ otoskeskiarvot ja keskimääräisen laskenta-ajan luottamusrajat.

Ratkaisu. Keskiarvo lasketaan taulukon kaavalla. 9.1 otospopulaatiolle

Dispersio lasketaan taulukon kaavan mukaan. 9.1.

Päivän keskimääräinen neliövirhe.

Keskiarvon virhe lasketaan kaavalla:

nuo. keskiarvo on x ± m = 12,0 ± 2,3 päivää.

Keskiarvon luotettavuus oli

Rajavirhe lasketaan taulukon kaavalla. 9.3 uudelleenvalintaa varten, koska populaation kokoa ei tiedetä, ja varten P = 0,954 luottamustaso.

Siten keskiarvo on `x ± D = `x ± 2m = 12,0 ± 4,6, ts. sen todellinen arvo on välillä 7,4-16,6 päivää.

Opiskelijapöydän käyttö. Sovelluksen avulla voimme päätellä, että n = 10 - 1 = 9 vapausasteella saatu arvo on luotettava merkitsevyystasolla a £ 0,001, ts. tuloksena saatu keskiarvo eroaa merkittävästi 0:sta.

Esimerkki 2. Todennäköisyyden arvio (yleinen osuus) r.

Mekaanisella otantamenetelmällä, jossa selvitettiin 1000 perheen sosiaalista asemaa, paljastui, että pienituloisten perheiden osuus oli w = 0,3 (30 %)(näyte oli 2% , eli n/N = 0,02). Vaaditaan luottamustasolla p = 0,997 määritä indikaattori R pienituloisille perheille koko alueella.

Ratkaisu. Esitettyjen funktioarvojen mukaan Ф(t) löytää tietylle luottamustasolle P = 0,997 merkitys t = 3(katso kaava 3). Marginaaliosuuden virhe w määrittää taulukon kaavalla. 9.3 ei-toistuva näytteenotto (mekaaninen näytteenotto on aina ei-toistuvaa):

Suhteellisen näytteenottovirheen rajoittaminen % tulee olemaan:

Pienituloisten perheiden todennäköisyys (yleinen osuus) alueella tulee olemaan p=w±Δw, ja luottamusrajat p lasketaan kaksois-epäyhtälön perusteella:

w — Δw ≤ p ≤ w — Δw, eli p:n todellinen arvo on:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Näin ollen todennäköisyydellä 0,997 voidaan väittää, että pienituloisten perheiden osuus alueen kaikista perheistä vaihtelee 28,6 prosentista 31,4 prosenttiin.

Esimerkki 3 Keskiarvon ja luottamusvälin laskeminen intervallisarjan määrittämälle diskreetille ominaisuudelle.

Taulukossa. 9.5 asetetaan tilausten tuotantoa koskevien sovellusten jakelu sen mukaan, milloin yritys toteuttaa ne.

Taulukko 9.5 Havaintojen jakautuminen esiintymisajan mukaan

Ratkaisu. Keskimääräinen tilauksen valmistumisaika lasketaan kaavalla:

Keskimääräinen aika on:

= (3 * 20 + 9 * 80 + 24 * 60 + 48 * 20 + 72 * 20) / 200 = 23,1 kuukautta

Saamme saman vastauksen, jos käytämme p i:n tietoja taulukon toiseksi viimeisestä sarakkeesta. 9.5 kaavalla:

Huomaa, että viimeisen asteikon välin keskikohta löydetään täydentämällä sitä keinotekoisesti edellisen asteikon välin leveydellä, joka on 60 - 36 = 24 kuukautta.

Dispersio lasketaan kaavalla

missä x i- intervallisarjan keskikohta.

Siksi!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) ja vakiovirhe on .

Keskiarvon virhe lasketaan kaavalla kuukausille, ts. keskiarvo on!!\overline(x) ± m = 23,1 ± 13,4.

Rajavirhe lasketaan taulukon kaavalla. 9.3 uudelleenvalintaa varten, koska populaation kokoa ei tiedetä, luottamustasolle 0,954:

Eli keskiarvo on:

nuo. sen todellinen arvo on välillä 0-50 kuukautta.

Esimerkki 4 Yrityksen N = 500 yrityksen velkojien kanssa tapahtuvien selvitysten nopeuden määrittämiseksi liikepankissa on tarpeen suorittaa valikoiva tutkimus satunnaisen ei-toistuvan valinnan menetelmällä. Määritä vaadittu otoskoko n siten, että todennäköisyydellä P = 0,954 otoksen keskiarvon virhe ei ylitä 3 päivää, jos koeestimaatit osoittivat, että keskihajonnan s oli 10 päivää.

Ratkaisu. Tarvittavien tutkimusten lukumäärän n määrittämiseksi käytämme ei-toistuvan valinnan kaavaa taulukosta. 9.4:

Siinä t:n arvo määritetään luotettavuustasolle P = 0,954. Se on yhtä kuin 2. Neliön keskiarvo s = 10, populaation koko N = 500 ja keskiarvon rajavirhe Δ x = 3. Korvaamalla nämä arvot kaavaan, saamme:

nuo. riittää, että tehdään 41 yrityksen otos, jotta voidaan arvioida vaadittu parametri - selvitysten nopeus velkojien kanssa.

Otos on joukko tietoja, jotka on otettu tietyillä menetelmillä yleisestä populaatiosta tutkivaa analyysiä varten. Edustavuus on ominaisuus toistaa kokonaisuuden esitys osittain. Toisin sanoen se on mahdollisuus laajentaa osan ideaa kokonaisuuteen, joka sisältää tämän osan.

Otoksen edustavuus on osoitus siitä, että otoksen tulee heijastaa täysin ja luotettavasti sen perusjoukon ominaisuuksia, johon se kuuluu. Se voidaan määritellä myös otoksen ominaisuudeksi edustaa täydellisimmin niitä yleisen populaation ominaisuuksia, jotka ovat merkittäviä tutkimuksen tarkoituksen kannalta.

Oletetaan, että koko väestö on kaikki koulun oppilaat (900 henkilöä 30 luokasta, 30 henkilöä jokaisessa luokassa). Tutkimuksen kohteena on koululaisten suhtautuminen tupakointiin. 90 opiskelijan otos edustaa vain koko väestöä paljon huonommin kuin samojen 90 opiskelijan otos, johon kuuluisi 3 opiskelijaa jokaiselta luokalta. Suurin syy on epätasainen jakautuminen iän mukaan. Näin ollen ensimmäisessä tapauksessa otoksen edustavuus on alhainen. Toisessa tapauksessa - korkea.

Sosiologiassa he sanovat, että otoksessa on edustavuus ja sen epäedustavuus.

Esimerkki epäedustavasta otoksesta on klassinen tapaus, joka tapahtui vuonna 1936 Yhdysvalloissa presidentinvaalien aikana.

Edellisten vaalien tulosten ennustamisessa tähän asti hyvin onnistunut Literary Digest oli tällä kertaa väärässä, vaikka se lähetti useita miljoonia kirjallisia kysymyksiä tilaajille sekä puhelinluetteloista ja autorekisteriluetteloista valitsemilleen vastaajille. Kun 1/4 äänestyslipuista täyttyi, äänet jakautuivat seuraavasti: 57% äänesti republikaanien ehdokasta nimeltä Alf Landon ja 41% piti parempana vakiintunutta demokraattia Franklin Rooseveltia.

Itse asiassa F. Roosevelt voitti vaalit lähes 60 prosentilla äänistä. "Literary Digest" -virhe oli seuraava. He halusivat lisätä otoksen edustavuutta . Ja koska he tiesivät, että suurin osa heidän tilaajistaan tunnisti itsensä republikaaneiksi, he päättivät laajentaa otosta vastaajilla, jotka he valitsivat puhelinluetteloista ja autojen rekisteröintiluetteloista. Mutta he eivät ottaneet huomioon olemassa olevia todellisuutta ja itse asiassa valitsivat vielä enemmän republikaanien kannattajia, koska siihen aikaan keski- ja yläluokilla oli varaa autoihin ja puhelimiin. Ja he olivat enimmäkseen republikaaneja, eivät demokraatteja.

Näytteenottoa on erilaisia: yksinkertainen satunnainen, sarja, tyypillinen, mekaaninen ja yhdistetty.

Yksinkertainen satunnaisotanta koostuu tutkittujen yksiköiden koko populaatiosta valitsemisesta satunnaisesti ilman järjestelmää.

Mekaanista otantaa käytetään silloin, kun yleisessä väestössä on järjestys, esimerkiksi on olemassa tietty järjestys työntekijöiden yksiköitä, vaaliluetteloita, vastaajien puhelinnumeroita, asuntojen ja talojen lukumäärää jne.).

Tyypillistä valintaa käytetään, kun koko populaatio voidaan jakaa ryhmiin tyyppien mukaan. Väestön kanssa työskennellessä nämä voivat olla esimerkiksi koulutus-, ikä-, yhteiskuntaryhmät, yrityksiä tutkittaessa ne voivat olla toimiala tai erillinen organisaatio jne.

Sarjavalinta on hyödyllinen, kun yksiköt ryhmitellään pieniin sarjoihin tai ryhmiin. Tällainen sarja voi olla valmiiden tuotteiden eriä, koululuokkia ja muita ryhmiä.

Yhdistetty näytteenotto sisältää kaikkien aikaisempien näytteenottotyyppien käytön yhdessä tai toisessa yhdistelmässä.

Näytteitä on kahta päätyyppiä: edustavat ja ei-edustavat. Mitä tämä tarkoittaa ja miksi on tärkeää erottaa ne toisistaan?

Edustava näyte(englanniksi edustaa - edustaa) on sellainen, että se antaa meille mahdollisuuden jakaa sekä laadukkaita että määrällinen hänen tutkimuksensa tulokset tietyllä suurella populaatiolla. Mielipidemittausten yhteydessä edustava otos on sellainen, jonka avulla voimme laajentua määrällinen haastattelun tulokset eivät vain tutkimukseen osallistuneille, vaan myös monille muille ihmisille.

Esimerkiksi selvityksen perusteella selvisimme, että Ukrainan aikuisväestöä edustavaan otokseen kuuluneista vastaajista 18 prosentilla on mielipide X. Voidaan siis sanoa, että noin 18 %:lla Ukrainan aikuisväestöstä on mielipide X. Jos otos ei olisi edustava, voisimme vain olettaa:"vähemmistöllä Ukrainan aikuisväestöstä on mielipide X", "alle kolmanneksella mielipide X", "alle neljänneksellä mielipide X". Mutta nämä oletukset voisivat olla vahvistaa vain kiitos edustaja kysely. Ihmisten näkemyksiä tutkittaessa epäedustava otos on siis myös näyte määrällinen tutkimuksen tulokset, jotka EI voidaan laajentaa koskemaan muita kuin tutkimukseen osallistuneita. Tai yleisemmin: epäedustamaton otos - se tekee mahdottomaksi laajentaa hänen tutkimuksensa kvantitatiivisia tuloksia tiettyyn suureen joukkoon.

Kuvitellaanpa, että lämpimänä kesäpäivänä menemme ulos ja kysymme 10 ohikulkijalta talossamme tai toimistollamme, pitävätkö he nykyisestä säästä. Anna 7 sanoa mitä he pitävät; 1 epäröi vastata, 2 ilmoittaa, että he eivät pidä sellaisesta säästä ja tuntevat olonsa mukavammaksi alhaisemmassa lämpötilassa. Tämän kyselyn perusteella me EI voimme sanoa, että 70 % ihmisistä pitää nykyisestä säästä. Ja jopa EI me voimme olla varma että suurin osa ihmiset pitävät nykyisestä säästä. Voimme ilmaista oletus, että useimmat ihmiset pitävät siitä, mutta emme voi tietää varmasti. Se oli epäedustava näyte.

Eräs väärinkäsitys otannasta on, että mikä tahansa suuri näyte on edustava; Mitä enemmän teemme kyselyjä, sitä edustavampi se on. Tämä ei ole totta. Jos jatkamme kadusäätutkimusta, kunnes olemme haastatelleet 100 tai jopa 1000 ihmistä, emme voi silti sanoa varmuudella mitään niistä, joita ei kysytty. Miksi niin? Eikö 100, saati 1000 ihmistä riitä tekemään varmoja johtopäätöksiä muiden mieltymyksistä?

Tosiasia on, että edustavuuden takaamiseksi on tärkeää paitsi vastaajien lukumäärä, myös kuinka ja "x oli valittu. Yllä olevassa esimerkissä emme ajatellut kuka, missä ja miten valittu, mutta alkoi yksinkertaisesti kommunikoida ohikulkijoiden kanssa. Katsotaanpa ympärillesi. Ehkä olemme lähellä yliopistoa koulupäivänä? Sitten ohikulkijoiden joukossa on enimmäkseen nuoria, jotka yleensä sietävät lämpöä paremmin kuin vanhemmat ihmiset, ja siksi säähän tyytyväisten osuus voi osoittautua keinotekoisen suureksi. Tai ehkä olemme päätyneet paikkaan, jossa ohikulkijoiden joukossa on enemmän vanhuksia, joiden on luultavasti vaikea sietää kuumien kesäpäivien tukkoisuutta? Silloin säähän tyytyväisten prosenttiosuutta voidaan aliarvioida kaikkiin paikkakunnan asukkaisiin verrattuna.

Edustava näyte

Edustava otos on otos, jolla on sama suhteellisten ominaisuuksien jakauma kuin yleisellä populaatiolla.

Englanniksi: edustava näyte

Katso myös: Näytepopulaatiot

Finam Financial Dictionary.

Katso, mitä "edustava näyte" on muissa sanakirjoissa:

Edustava näyte- Osallistujaryhmä, joka edustaa enemmän tai vähemmän tarkasti tutkittavan väestön kokoonpanoa. Otos voi heijastaa jakautumista ikä- ja sukupuoliominaisuuksien mukaan sekä muita ominaisuuksia, jotka vaikuttavat kokeen tulokseen ... ...

edustava näyte- - [Englannin-venäläinen sanasto rokotteiden ja immunisoinnin perustermeistä. Maailman terveysjärjestö, 2009] Aiheet Rokotukset, Immunisaatio EN edustaja näytteenotto … Teknisen kääntäjän käsikirja

EDUSTAVA NÄYTTE- (edustava otos) otos, joka on (tai jota pidetään) todellisena vanhempainväestön heijastuksena, eli sillä on sama piirreprofiili, esimerkiksi ikärakenne, luokkarakenne, koulutustaso. Edustaja...... Suuri selittävä sosiologinen sanakirja

EDUSTAVA NÄYTTE- Katso malliesimerkki... Psykologian selittävä sanakirja

EDUSTAVA NÄYTTE- Sellainen otos, jossa kaikki sen yleisen perusjoukon pääpiirteet, josta tämä näyte on otettu, ovat edustettuina suunnilleen samassa suhteessa tai samalla tiheydellä kuin tämä ominaisuus esiintyy tässä yleisessä populaatiossa ... Ensyklopedinen psykologian ja pedagogiikan sanakirja

Edustava näyte- tämä on sellainen näyte, jossa kaikki yleisen populaation pääpiirteet, josta tämä näyte on poimittu, ovat edustettuina suunnilleen samassa suhteessa tai samalla tiheydellä kuin tämä ominaisuus esiintyy tässä yleisessä ... ... Sosiologinen sanakirja Socium

Edustava näyte- (edustava näyte). Otos, joka kuvastaa tarkasti koko väestön tilaa ja ominaisuuksia ... Kehityksen psykologia. Sanakirja kirjan mukaan

edustava näyte- (edustava näyte) näyte, joka on tehty sääntöjen mukaan eli siten, että se kuvastaa yleisen populaation erityispiirteitä sekä koostumuksen että mukana olevien koehenkilöiden yksilöllisten ominaisuuksien osalta. Käytännön psykologin sanakirja. M .: AST, ...... Suuri psykologinen tietosanakirja

Englanti näytteenotto, edustaja; Saksan kieli Stichprobe, edustava. Otos, jolla on olennaisesti sama suhteellisten ominaisuuksien jakauma kuin populaatiolla. Antinazi. Sosiologian tietosanakirja, 2009... Sosiologian tietosanakirja

Edustava otos Otos, jolla on sama suhteellisten ominaisuuksien jakauma kuin yleisellä populaatiolla Liiketoiminnan termien sanasto. Akademik.ru. 2001... Liiketoiminnan termien sanasto

Portaali opiskelijalle. Itseharjoittelu