Valikoiva havainto: käsite, tyypit, otantavirheet, tulosten arviointi. Esimerkkejä ongelmanratkaisusta

Valikoivan havainnoinnin aikana on varmistettava onnettomuus yksikön valinta. Jokaisella yksiköllä tulee olla yhtäläinen mahdollisuus tulla valituksi muiden kanssa. Tähän satunnainen otanta perustuu.

TO oikea satunnainen näyte tarkoittaa yksiköiden valintaa koko perusjoukosta (jakamatta sitä etukäteen mihinkään ryhmiin) arvalla (pääasiassa) tai jollain muulla vastaavalla menetelmällä, esimerkiksi käyttämällä satunnaislukutaulukkoa. Satunnainen valinta Tämä valinta ei ole satunnainen. Satunnaisuusperiaate viittaa siihen, että esineen sisällyttämiseen tai pois jättämiseen otoksesta ei voi vaikuttaa mikään muu tekijä kuin sattuma. Esimerkki itse asiassa satunnainen valinta voi toimia voittojen kiertoina: liitettyjen lippujen kokonaismäärästä valitaan satunnaisesti tietty osa voittoja laskevista numeroista. Lisäksi kaikilla numeroilla on yhtäläinen mahdollisuus päästä otokseen. Tässä tapauksessa otosjoukkoon valittujen yksiköiden lukumäärä määräytyy yleensä otoksen hyväksytyn osuuden perusteella.

Esimerkkiosuus on otosjoukon yksiköiden lukumäärän suhde yleisen perusjoukon yksiköiden lukumäärään:

Siis 5 % näytteellä osaerästä 1000 yksikössä. otoskoko P on 50 yksikköä ja 10 % näytteellä - 100 yksikköä. jne. Näytteenoton oikealla tieteellisellä organisoinnilla edustavuusvirheet voidaan vähentää minimiarvoihin, jolloin valikoiva havainnointi tulee riittävän tarkkaa.

Oikeaa satunnaista valintaa "puhtaassa muodossaan" käytetään harvoin valikoivan havainnoinnin käytännössä, mutta se on lähtökohtana kaikkien muiden valinnan tyyppien joukossa, se sisältää ja toteuttaa valikoivan havainnoinnin perusperiaatteet.

Tarkastellaanpa joitain kysymyksiä otantamenetelmän teoriasta ja yksinkertaisen satunnaisotoksen virhekaavasta.

Otantamenetelmää sovellettaessa tilastoissa käytetään yleensä kahta päätyyppiä yleistäviä indikaattoreita: määrällisen ominaisuuden keskiarvo Ja vaihtoehtoisen ominaisuuden suhteellinen arvo(tilastojoukon yksiköiden osuus tai osuus, jotka eroavat kaikista muista tämän populaation yksiköistä vain tutkittavan ominaisuuden vuoksi).

Esimerkkiosuus (w), tai taajuus, määräytyy niiden yksiköiden lukumäärän suhteen, joilla on tutkittava ominaisuus T, näytteenottoyksiköiden kokonaismäärään P:

Jos esimerkiksi 100 näytetiedosta ( n=100), 95 osaa osoittautui vakioksi (T=95), sitten näytefraktio

w=95/100=0,95 .

Otosindikaattoreiden luotettavuuden kuvaamiseksi on olemassa keskellä Ja marginaalinen otantavirhe.

Näytteenottovirhe ? tai toisin sanoen edustavuusvirhe on vastaavan otoksen ja yleisten ominaisuuksien välinen ero:

*

*

Otantavirhe on ominaista vain valikoiville havainnoille. Mitä suurempi tämän virheen arvo on, sitä enemmän otosindikaattorit eroavat vastaavista yleisindikaattoreista.

Otoskeskiarvo ja otososuus ovat luonnostaan satunnaismuuttujat, jotka voivat saada erilaisia ​​arvoja riippuen siitä, mitkä populaation yksiköt otokseen sisällytettiin. Siksi näytteenottovirheet ovat myös satunnaismuuttujia ja voivat saada erilaisia ​​arvoja. Siksi määritä mahdollisten virheiden keskiarvo - keskimääräinen näytevirhe.

Mistä se riippuu tarkoitatko näytteenottovirhettä? Satunnaisvalinnan periaatteen mukaisesti keskimääräinen näytteenottovirhe määritetään ensisijaisesti otoskoko: mitä suurempi populaatio, ceteris paribus, sitä pienempi on keskimääräinen otantavirhe. Kattaamalla otantatutkimuksen yleisen perusjoukon yksiköiden lukumäärän lisääntyessä luonnehdimme koko väestöä entistä tarkemmin.

Keskimääräinen näytteenottovirhe riippuu myös vaihteluaste tutkittu piirre. Kuten tiedät, vaihteluasteelle on ominaista hajonta? 2 tai w(1-w)-- vaihtoehtoista ominaisuutta varten. Mitä pienempi ominaisuuden vaihtelu ja siten varianssi on, sitä pienempi on keskimääräinen näytteenottovirhe ja päinvastoin. Nolladispersiolla (attribuutti ei vaihtele) keskimääräinen näytteenottovirhe on nolla, eli mikä tahansa yleisen perusjoukon yksikkö karakterisoi tarkasti koko populaation tämän attribuutin mukaan.

Keskimääräisen näytteenottovirheen riippuvuus sen tilavuudesta ja attribuutin vaihteluasteesta näkyy kaavoissa, joilla voidaan laskea keskimääräinen näytteenottovirhe otoshavaintoolosuhteissa, kun yleiset ominaisuudet ( x,p) ovat tuntemattomia, ja siksi todellista näytteenottovirhettä ei ole mahdollista löytää suoraan kaavoista (lomake 1), (lomake 2).

W Satunnaisella valinnalla keskimääräiset virheet lasketaan teoreettisesti seuraavilla kaavoilla:

* keskimääräiselle määrälliselle ominaisuudelle

* osakkeelle (vaihtoehtoinen ominaisuus)

Koska käytännössä attribuutin varianssi yleisessä populaatiossa? 2 ei ole tarkkaan tiedossa, käytännössä he käyttävät otosjoukolle suurten lukujen lain perusteella laskettua varianssin S 2 arvoa, jonka mukaan riittävän suuren otoskoon omaava otospopulaatio toistaa tarkasti otosjoukon ominaisuudet. yleinen väestö.

Täten, laskentakaavat keskellä näytteenottovirheet satunnainen uudelleennäytteenotto on seuraava:

* keskimääräiselle määrälliselle ominaisuudelle

* osakkeelle (vaihtoehtoinen ominaisuus)

Otosjoukon varianssi ei kuitenkaan ole yhtä suuri kuin yleisen perusjoukon varianssi, ja siksi kaavoilla (lomake 5) ja (lomake 6) lasketut keskimääräiset otantavirheet ovat likimääräisiä. Mutta todennäköisyysteoriassa on todistettu, että yleinen varianssi ilmaistaan ​​elektiivin kautta seuraavalla suhteella:

Koska P/(n-1) riittävän suurille P -- arvo lähellä yksikköä, voidaan olettaa, että ja siksi keskimääräisten näytteenottovirheiden käytännön laskelmissa voidaan käyttää kaavoja (lomake 5) ja (lomake 6). Ja vain pienen näytteen tapauksessa (kun otoskoko ei ylitä 30) on tarpeen ottaa huomioon kerroin P/(n-1) ja laske pienen näytteen keskivirhe kaavan mukaan:

L X Satunnaisella ei-toistuvalla valinnalla yllä olevissa kaavoissa keskimääräisten näytteenottovirheiden laskemiseksi on välttämätöntä kertoa juurilauseke luvulla 1-(n / N), koska yksiköiden lukumäärä yleisessä populaatiossa vähenee ei-toistuvan näytteenoton prosessissa. Siksi ei-toistuvaan valintaan laskentakaavat tarkoittaa näytteenottovirhettä tulee seuraavassa muodossa:

* keskimääräiselle määrälliselle ominaisuudelle

* osakkeelle (vaihtoehtoinen ominaisuus)

. (lomake 10)

Koska P aina vähemmän N, sitten lisäkerroin 1-( n/n) tulee aina olemaan vähemmän kuin yksi. Tästä seuraa, että keskimääräinen virhe ei-toistuvalla valinnalla on aina pienempi kuin toistuvalla valinnalla. Samaan aikaan suhteellisen pienellä prosenttiosuudella otosta tämä kerroin on lähellä yhtä (esimerkiksi 5 %:n näytteellä se on 0,95; 2 %:n näytteellä se on 0,98 jne.). Siksi joskus käytännössä käytetään kaavoja (lomakkeet 5) ja (lomakkeet 6) määrittämään keskimääräinen näytteenottovirhe ilman määritettyä kertojaa, vaikka otos on järjestetty ei-toistuvaksi. Tämä tapahtuu, kun yleisen populaation N yksiköiden lukumäärä on tuntematon tai rajoittamaton, tai kun P hyvin vähän verrattuna N, ja pohjimmiltaan lisätekijän, jonka arvo on lähellä yhtä, käyttöönotto ei käytännössä vaikuta keskimääräisen näytteenottovirheen arvoon.

Mekaaninen näytteenotto koostuu siitä, että otoksen yksiköiden valinta yleisestä, neutraalilla kriteerillä jaettuna yhtäläisiksi aikaväleiksi (ryhmiksi), suoritetaan siten, että jokaisesta tällaisesta näytteen ryhmästä valitaan vain yksi yksikkö. Systemaattisten virheiden välttämiseksi tulee valita se yksikkö, joka on kunkin ryhmän keskellä.

Mekaanista valintaa järjestettäessä populaation yksiköt järjestetään ennalta (yleensä luetteloon) tiettyyn järjestykseen (esimerkiksi aakkosjärjestyksessä, sijainnin mukaan, nousevassa tai laskevassa järjestyksessä minkä tahansa indikaattorin arvojen mukaan, joka ei liity tutkittavan ominaisuuden kanssa jne.). jne.), jonka jälkeen tietty määrä yksiköitä valitaan mekaanisesti tietyn väliajoin. Tässä tapauksessa välin koko yleisessä perusjoukossa on yhtä suuri kuin otososuuden käänteisluku. Joten 2 % näytteellä joka 50. yksikkö (1: 0,02) valitaan ja tarkistetaan, 5 % näytteellä joka 20. yksikkö (1: 0,05), esimerkiksi koneesta laskeva yksityiskohta.

Riittävän suurella populaatiolla mekaaninen valinta tulosten tarkkuuden suhteen on lähellä oikeaa satunnaista. Siksi mekaanisen näytteen keskimääräisen virheen määrittämiseen käytetään itsesatunnaisen ei-toistuvan näytteenoton kaavoja (lomake 9), (lomake 10).

Yksiköiden valitsemiseksi heterogeenisestä populaatiosta ns tyypillinen näyte , jota käytetään tapauksissa, joissa kaikki yleisen perusjoukon yksiköt voidaan jakaa useisiin laadullisesti homogeenisiin, samankaltaisiin ryhmiin tutkittuihin indikaattoreihin vaikuttavien ominaisuuksien mukaan.

Yrityksiä kartoittaessa tällaisia ​​ryhmiä voivat olla esimerkiksi toimiala ja alasektori, omistusmuodot. Sitten kustakin tyypillisestä ryhmästä valitaan yksittäiset yksiköt näytteeseen satunnais- tai mekaanisella näytteellä.

Tyypillistä otosta käytetään yleensä monimutkaisten tilastopopulaatioiden tutkimuksessa. Esimerkiksi otantatutkimuksessa työntekijöiden perhebudjeteista ja tietyillä talouden sektoreilla palkattujen työntekijöiden työn tuottavuus eri osaamisryhminä edustavassa yrityksessä.

Tyypillinen näyte antaa tarkempia tuloksia verrattuna muihin näytejoukon yksiköiden valintamenetelmiin. Yleisen perusjoukon tyypistäminen varmistaa tällaisen otoksen edustavuuden, kunkin typologisen ryhmän edustuksen siinä, mikä mahdollistaa ryhmien välisen hajonnan vaikutuksen poissulkemisen keskimääräiseen otosvirheeseen.

Kun määritetään tyypillisen näytteen keskimääräinen virhe vaihtelun indikaattorina ryhmän sisäisten varianssien keskiarvo.

Keskimääräinen näytteenottovirhe löytyy kaavoilla:

* keskimääräiselle määrälliselle ominaisuudelle

(uudelleenvalinta); (lomake 11)

(peruuttamaton valinta); (lomake 12)

* osakkeelle (vaihtoehtoinen ominaisuus)

(uudelleenvalinta); (lomake.13)

(ei toistuva valinta), (lomake 14)

missä on otospopulaation ryhmän sisäisten varianssien keskiarvo;

Otospopulaation osuuden (vaihtoehtoisen piirteen) ryhmän sisäisten varianssien keskiarvo.

sarjanäytteenotto Se sisältää satunnaisen valinnan yleisestä populaatiosta ei yksittäisten yksiköiden, vaan niiden samanarvoisten ryhmien (pesät, sarjat), jotta kaikki yksiköt poikkeuksetta voidaan tarkkailla tällaisissa ryhmissä.

Sarjanäytteenoton käyttö johtuu siitä, että monet tavarat kuljetukseen, varastointiin ja myyntiin pakataan pakkauksiin, laatikoihin jne. Siksi pakattujen tavaroiden laatua valvottaessa on järkevämpää tarkistaa useita pakkauksia (sarjoja) kuin valita tarvittava määrä tavaraa kaikista pakkauksista.

Koska ryhmien (sarjojen) sisällä tarkastellaan kaikkia yksiköitä poikkeuksetta, keskimääräinen otantavirhe (valittaessa yhtäläisiä sarjoja) riippuu vain ryhmien välisestä (sarjojen välisestä) varianssista.

W Keskimääräisen pistemäärän otosvirhe sarjavalinnan aikana ne löydetään kaavoilla:

(uudelleenvalinta); (lomake.15)

(ei toistuva valinta), (lomake 16)

Missä r- valittujen sarjojen lukumäärä; R- jaksojen kokonaismäärä.

Sarjanäytteen ryhmien välinen varianssi lasketaan seuraavasti:

missä on keskiarvo i- sarja; - koko otosjoukon yleinen keskiarvo.

W Jaon keskimääräinen otantavirhe (vaihtoehtoinen ominaisuus) sarjavalinnassa:

(uudelleenvalinta); (lomake 17)

(ei toistuva valinta). (lomake 18)

Ryhmänvälinen(sarjojen välinen) sarjanäytteen osuuden varianssi määräytyy kaavalla:

, (lomake 19)

missä on ominaisuuden osuus i th-sarja; - ominaisuuden kokonaisosuus koko otoksesta.

Tilastotutkimuksissa käytetään aiemmin käsiteltyjen valintamenetelmien lisäksi niiden yhdistelmää (yhdistetty valinta).

Näytteenottovirheen käsite ja laskenta.

Valikoivan havainnoinnin tehtävänä on antaa oikeita käsityksiä koko väestön yhteenvetoindikaattoreista jonkin havainnoitavan osan perusteella. Otososuuden ja otoskeskiarvon mahdollista poikkeamaa yleisjoukon osuudesta ja keskiarvosta kutsutaan näytteenottovirhe tai edustavuusvirhe. Mitä suurempi tämän virheen arvo on, sitä enemmän otoshavainnon indikaattorit eroavat yleisen perusjoukon indikaattoreista.

Ero:

näytteenottovirheet;

Rekisteröintivirheet.

Rekisteröintivirheet tapahtuu, kun havaintoprosessissa todetaan virheellinen tosiasia. Ne ovat ominaisia ​​sekä jatkuvalle havainnolle että valikoivalle havainnolle, mutta ne ovat vähemmän valikoivassa havainnointissa.

Virheen luonne on:

Tendentiivinen - tahallinen, ts. valittiin joko populaation parhaat tai huonoimmat yksiköt. Tässä tapauksessa havainnot menettävät merkityksensä;

Satunnainen - valikoivan havainnoinnin tärkein organisatorinen periaate on estää tahallinen valinta, ts. varmistaa satunnaisvalinnan periaatteen tiukka noudattaminen.

Satunnaisvalinnan yleinen sääntö on: yleisen perusjoukon yksittäisillä yksiköillä on oltava täsmälleen samat ehdot ja mahdollisuudet kuulua otokseen kuuluvien yksiköiden määrään. Tämä luonnehtii näytetuloksen riippumattomuutta tarkkailijan tahdosta. Tarkkailijan tahto synnyttää tendentiivisia virheitä. Otantavirhe satunnaisvalinnassa on satunnainen. Se luonnehtii yleisten ominaisuuksien poikkeamien suuruutta otosominaisuuksista.

Koska tutkitun perusjoukon ominaisuudet vaihtelevat, otoksen yksiköiden koostumus ei välttämättä ole sama kuin koko populaation yksikköjen koostumus. Se tarkoittaa sitä R eivätkä sovi yhteen W Ja . Näiden ominaisuuksien mahdollinen ero määräytyy näytteenottovirheen perusteella, joka määritetään kaavalla:

missä on yleinen varianssi.

missä on otoksen varianssi.

Tämä osoittaa, missä yleinen varianssi eroaa otosvarianssista kertaa.

On toistuvaa ja ei-toistuvaa valintaa. Uudelleenvalinnan ydin on, että jokainen otoksen yksikkö palaa havainnon jälkeen yleiseen perusjoukkoon ja sitä voidaan tarkastella uudelleen. Uudelleennäytteenotossa lasketaan keskimääräinen otantavirhe:

Vaihtoehtoisen attribuutin osuuden indikaattorille otosvarianssi määritetään kaavalla:

Käytännössä uudelleenvalintaa käytetään harvoin. Ei-toistuvalla valinnalla koko väestön koko N pienenee näytteenoton aikana, kaava keskimääräiselle otantavirheelle kvantitatiiviselle attribuutille on:



Yksi mahdollisista arvoista, joissa tutkittavan ominaisuuden osuus voi olla, on yhtä suuri kuin:

missä on vaihtoehtoisen ominaisuuden näytteenottovirhe.

Esimerkki.

Valmiiden tuotteiden erän tuotteista 10 %:n otantatutkimuksessa menetelmällä ilman uudelleenvalintaa saatiin seuraavat tiedot näytteiden kosteuspitoisuudesta.

Määritä keskimääräinen kosteus %, varianssi, keskihajonta, todennäköisyydellä 0,954, mahdolliset rajat, joissa keskiarvoa odotetaan. % kosteus kaikista valmiista tuotteista, todennäköisyydellä 0,987, standardituotteiden ominaispainon mahdolliset rajat edellyttäen, että tuotteet, joiden kosteuspitoisuus on enintään 13 ja yli 19 %, kuuluvat ei-standardierään.

Vain tietyllä todennäköisyydellä voidaan väittää, että otososuuden yleinen osuus ja otoskeskiarvon yleinen keskiarvo poikkeavat t kerran.

Tilastoissa näitä poikkeamia kutsutaan marginaaliset otantavirheet ja ne on merkitty.

Tuomioiden todennäköisyyttä voidaan lisätä tai vähentää t kerran. Todennäköisyydellä 0,683, 0,954, 0,987, määritetään yleisen populaation indikaattorit otoksen indikaattoreiden mukaan:

Keskimääräinen näytteenottovirhe on aina läsnä otantatutkimuksissa ja näkyy johtuen siitä, että tilastollisen perusjoukon kaikkia yksiköitä ei tutkita, vaan vain osaa siitä.

Keskimääräinen näytteenottovirhe tulee marginaalinen virhe Δ kerrottuna luottamuskertoimella t , joka on esiasetettu vaaditun havaintotarkkuuden perusteella. Rajavirheen avulla voit arvioida parametrin "todellisen" koon yleisessä populaatiossa tietyllä todennäköisyydellä

Tyypilliseen ja sarjavalintaan, kun lasketaan näytteenottovirhe kokonaisvarianssin sijaan 2 ) Käytä ryhmän sisäisten ja ryhmien välisten varianssien keskiarvoa
, Missä
- ryhmän i yksityinen varianssi, volyymi i ryhmä

Kaavat satunnaisotoksen marginaalivirheelle keskiarvon määrittämisessä

Uudelleenvalintaa varten

Kaavat satunnaisotoksen marginaalivirheelle osuuden määrittämisessä

Uudelleenvalintaa varten

Kertaluonteiseen valintaan

Satunnaisotoksen koon kaavat keskiarvon määrittämisessä

Kaavat satunnaisnäytteiden lukumäärälle tutkittavan ominaisuuden osuuden määrittämisessä

Rajaero yleisen ja otoskeskiarvon välillä vastaa rajavirhettä

Todennäköisyysarvot ja vastaavasti t ovat jakelutaulukoissa:

  • Opiskelija (jos kyseessä on pieni näyte)

Satunnaisnäytteenottokaavat soveltuvat myös mekaaniseen näytteenottoon.

Jos pyöristys on tarpeen, satunnaisotannalla - pyöristys ylöspäin, mekaanisella näytteenotolla - pyöristys alaspäin.

Pieni näyte

Jos otoskoko on enintään 30 yksikköä, pienen näytteen keskimääräinen virhe keskiarvon määrittämisessä lasketaan kaavalla:

Pienen otoksen virheen laskemiseen käytetään tarkennettua varianssikaavaa

Näytteenottotehtävien tyypit

    otantavirheen määritelmä,

    otoskoon määrittäminen n ,

    sen todennäköisyyden määrittäminen, että otoskeskiarvo (tai osuus) poikkeaa yleisestä enintään tietyn määrän t = Δ/μ,

    otantahavaintojen indikaattoreiden erojen satunnaisuuden arviointi,

    otosominaisuuksien siirtäminen yleiseen perusjoukkoon.

Keskiarvo- ja suhteellisuushypoteesin testaus

Otoshavaintojen indikaattoreiden erojen satunnaisuuden arviointi


Menetelmät otostietojen siirtämiseksi yleiseen populaatioon

    punnitusmenetelmä;

    uudelleenpunnitusmenetelmä;

    täyttömenetelmä satunnaisella valinnalla korvausluokissa.

marginaalinen virhe- suurin mahdollinen ero välineiden välillä tai suurin virhe sen esiintymisen tietyllä todennäköisyydellä.

1. Keskiarvon marginaalinen näytteenottovirhe toistuvan valinnan aikana lasketaan kaavalla:

missä t - normalisoitu poikkeama - "luottamustekijä", joka riippuu todennäköisyydestä, joka takaa marginaalisen näytteenottovirheen;

mu x on keskimääräinen näytteenottovirhe.

2. Suhteen marginaalinen otosvirhe kun uudelleenvalinta määritetään kaavalla:

3. Keskiarvon marginaalinen näytteenottovirhe ei-toistuvalla valinnalla:

Rajoita suhteellista virhettä otanta määritellään näytteenoton rajavirheen prosentuaalisena suhteena otantapopulaation vastaavaan ominaisuuteen. Se määritellään näin:

Pieni näyte

Pienten näytteiden teoriaa kehitettiin Englantilainen tilastotieteilijä opiskelija 1900-luvun alussa. Vuonna 1908 hän löysi erityisen jakauman, joka mahdollistaa jopa pienillä näytteillä t:n ja luottamustodennäköisyyden F(t) korreloinnin. Jos n on suurempi kuin 100, ne antavat samat tulokset kuin Laplacen todennäköisyysintegraalin taulukot 30:lle< n < 100 различия получаются незначительные. Поэтому на практике к малым выборкам относятся выборки объемом менее 30 единиц.

Kuten tiedetään, tilastoissa on kaksi tapaa tarkkailla massailmiöitä kohteen peiton täydellisyydestä riippuen: jatkuva ja epäjatkuva. Epäjatkuvan havainnoinnin muunnelma on valikoiva havainto.

Alla valikoiva havainto Termillä tarkoitetaan ei-jatkuvaa havainnointia, jossa satunnaisesti valitut tutkitun populaation yksiköt joutuvat tilastolliseen tarkasteluun (havaintoon).

Valikoiva havainto asettaa itselleen tehtävän karakterisoida koko yksikköpopulaatio tutkittavalle osalle ottaen huomioon kaikki tilastollisen havainnoinnin ja tieteellisesti organisoidun yksiköiden valintatyön säännöt ja periaatteet.

Tilastossa kyselyyn valittua yksikköjoukkoa kutsutaan yleensä ns näytepopulaatio , ja yksikköjoukkoa, josta valinta tehdään, kutsutaan yleinen väestö . Yleisen ja otosjoukon tärkeimmät ominaisuudet on esitetty taulukossa 1.

Pöytä 1 - Yleisen ja otosjoukon tärkeimmät ominaisuudet
IndeksiNimitys tai kaava
Väestö Otospopulaatio
Yksiköiden lukumäärä N n
Niiden yksiköiden määrä, joissa on ominaisuus M m
Tämän ominaisuuden sisältävien yksiköiden osuus p = M/N ω = m/n
Niiden yksiköiden osuus, joilla ei ole tätä ominaisuutta q = 1 - s 1 - w
Keskiarvo merkki
Dispersio merkki
Vaihtoehtoisen ominaisuuden hajonta (osuuden hajonta) pq ω (1 - ω)

Valikoivaa havainnointia suoritettaessa tapahtuu systemaattisia ja satunnaisia ​​virheitä. Systemaattisia virheitä syntyy, jos näytteen yksiköiden valintaa koskevia sääntöjä rikotaan. Valintasääntöjä muuttamalla tällaiset virheet voidaan poistaa.

Satunnaisia ​​virheitä syntyy kyselyn epäjatkuvuuden vuoksi. Muuten niitä kutsutaan edustavuusvirheiksi (representatiivisuusvirheiksi). Satunnaisvirheet jaetaan keskimääräisiin ja marginaalisiin otantavirheisiin, jotka määritetään sekä ominaisuutta että osuutta laskettaessa.

Keskimääräiset ja rajavirheet liittyvät seuraavaan suhteeseen :Δ = tμ, jossa Δ on marginaalinen näytteenottovirhe, μ on keskimääräinen näytteenottovirhe, t on todennäköisyystason mukaan määritetty luottamustekijä. Taulukossa 2 on esitetty joitakin t:n arvoja, jotka on otettu todennäköisyysteoriasta.

Keskimääräisen näytteenottovirheen arvo lasketaan vaihtelevasti valintamenetelmästä ja näytteenottomenettelystä riippuen. Tärkeimmät näytteenottovirheiden laskentakaavat on esitetty taulukossa 3.

Taulukko 3 - Peruskaavat näytteenottovirheiden laskemiseen toistuvassa ja ei-toistuvassa valinnassa
IndeksiNimitys ja kaava
Väestö Otospopulaatio
Keskimääräinen ominaisuusvirhe satunnaisessa uudelleennäytteenotossa
Keskimääräinen jakovirhe satunnaisessa uudelleennäytteenotossa
Ominaisuuden rajavirhe satunnaisessa uudelleenvalinnassa
Marginaaliosuuden virhe satunnaisessa uudelleenvalinnassa
Ominaisuuden keskimääräinen virhe satunnaisessa ei-toistuvassa valinnassa
Keskimääräinen osuusvirhe satunnaisessa ei-toistuvassa otannassa
Ominaisuuden rajavirhe satunnaisella ei-toistuvalla valinnalla
Rajaosuuden virhe satunnaisessa ei-toistuvassa valinnassa

Keskimääräisen ja marginaalisen otosvirheen laskeminen mahdollistaa sen, että voit määrittää mahdolliset rajat, joissa yleisen perusjoukon ominaisuudet ovat .

Esimerkiksi otoskeskiarvolle tällaiset rajat asetetaan seuraavien suhteiden perusteella:

Ominaisuuden osuuden rajat väestössä s.

Esimerkkejä ongelmien ratkaisemisesta aiheesta "Otantohavainto tilastoissa"

Tehtävä 1 . Alueen yrityksistä 10 %:n otoshavainnon perusteella on saatu tietoa tuotteiden (työt, palvelut) tuotannosta:

Määritä: 1) otokseen kuuluville yrityksille: a) keskimääräinen tuotannon koko yritystä kohden; b) tuotantomäärän hajaantuminen; c) sellaisten yritysten osuus, joiden tuotantomäärä on yli 400 tuhatta ruplaa; 2) koko alueen osalta todennäköisyydellä 0,954 rajat, joissa voidaan odottaa: a) keskimääräinen tuotantomäärä yritystä kohden; b) sellaisten yritysten osuus, joiden tuotantomäärä on yli 400 tuhatta ruplaa; 3) alueen kokonaistuotannon määrä.

Ratkaisu

Ongelman ratkaisemiseksi laajennamme ehdotettua taulukkoa.

1) Otokseen kuuluvien yritysten osalta keskimääräinen tuotannon koko yritystä kohti

110800/400 = 277 tuhatta ruplaa

Laskemme tuotannon volyymin hajonta yksinkertaistetulla tavalla σ 2 = 35640000/400 - 277 2 = 89100 - 76229 = 12371.

Niiden yritysten määrä, joiden tuotantomäärä on yli 400 tuhatta ruplaa. on 36+12 = 48, ja niiden osuus on ω = 48:400 = 0,12 = 12 %.

2) Todennäköisyysteoriasta tiedetään, että todennäköisyydellä P=0,954 luottamustekijä t=2. Marginaalinen otantavirhe

2√12371:400 = 11,12 tuhatta ruplaa

Asetetaan yleisen keskiarvon rajat: 277-11,12 ≤Xav ≤ 277+11,12; 265,88 ≤ Xav ≤ 288,12

Yritysosuuden marginaalinen otantavirhe

2√0,12*0,88/400 = 0,03

Määritetään yleisosuuden rajat: 0,12-0,03≤ p ≤0,12+0,03; 0,09 ≤ p ≤ 0,15

3) Koska kyseessä oleva yritysryhmä on 10 % alueen yritysten kokonaismäärästä, on alueella yhteensä 4 000 yritystä. Tällöin tuotannon kokonaismäärä alueella on 265,88 × 4000≤Q≤288,12 × 4000; 1063520 ≤ Q ≤ 1152480

Tehtävä 2 . Verohallinnon 400 yritysrakenteen tarkastusten tulosten mukaan niistä 140 ei ilmoita veroilmoituksessaan verotettavaa tuloa kokonaisuudessaan. Määritä väestöstä (koko alueen osalta) niiden yritysrakenteiden osuus, jotka piilottivat osan verotuloistaan ​​todennäköisyydellä 0,954.

Ratkaisu

Ongelman ehdon mukaan yksikkömäärä otospopulaatiossa on n=400, tarkasteltavan ominaisuuden omaavien yksiköiden määrä m=140, todennäköisyys P=0,954.

Todennäköisyysteoriasta tiedetään, että todennäköisyydellä P=0,954 luottamustekijä t=2.

Osoitetun attribuutin omaavien yksiköiden osuus määritetään kaavalla: p=w+∆p, missä w = m/n=140/400=0,35=35 %.
ja piirteen ∆p rajavirhe saadaan kaavasta: ∆p= t √w(1-w)/n = 2√0,35×0,65/400 ≈ 0,5 = 5 %

Sitten p = 35±5 %.

Vastaus : Niiden yritysrakenteiden osuus, jotka piilottivat osan verotuloistaan ​​todennäköisyydellä 0,954, on 35±5 %.