Selektiiviset väestöindikaattorit. Käytännön laskentaesimerkkejä

Usein käy niin, että on tarpeen analysoida tietty sosiaalinen ilmiö ja saada siitä tietoa. Tällaisia ​​tehtäviä syntyy usein tilastoissa ja tilastotutkimuksessa. Täysin määritellyn sosiaalisen ilmiön todentaminen on usein mahdotonta. Miten esimerkiksi saada selville tietyn kaupungin väestön tai kaikkien asukkaiden mielipide mistä tahansa asiasta? Kaikilta kysyminen on lähes mahdotonta ja erittäin työlästä. Tällaisissa tapauksissa tarvitsemme näytteen. Tämä on juuri se käsite, johon lähes kaikki tutkimus ja analyysi perustuvat.

Mikä on näyte

Analysoitaessa tiettyä sosiaalista ilmiötä on välttämätöntä saada tietoa siitä. Jos otamme jonkin tutkimuksen, voimme nähdä, että tutkimuskohteen kokonaisuuden jokainen yksikkö ei ole tutkimuksen ja analyysin kohteena. Vain tietty osa tästä kokonaisuudesta otetaan huomioon. Tämä prosessi on otanta: kun vain tietyt yksiköt joukosta tutkitaan.

Tietysti paljon riippuu näytteen tyypistä. Mutta on myös perussääntöjä. Pääasiallinen sanoo, että populaatiosta valinnan on oltava täysin satunnaista. Käytettäviä populaatioyksiköitä ei pitäisi valita minkään kriteerin vuoksi. Karkeasti sanottuna, jos on tarpeen kerätä väestö tietyn kaupungin väestöstä ja valita vain miehiä, niin tutkimuksessa tapahtuu virhe, koska valintaa ei tehty satunnaisesti, vaan se valittiin sukupuolen mukaan. Lähes kaikki näytteenottomenetelmät perustuvat tähän sääntöön.

Näytteenottosäännöt

Jotta valittu sarja heijastaisi koko ilmiön pääpiirteitä, se on rakennettava tiettyjen lakien mukaan, jolloin päähuomio tulisi kiinnittää seuraaviin luokkiin:

  • näyte (otospopulaatio);
  • yleinen väestö;
  • edustavuus;
  • edustavuusvirhe;
  • väestöyksikkö;
  • näytteenottomenetelmiä.

Valikoivan havainnoinnin ja näytteenoton ominaisuudet ovat seuraavat:

  1. Kaikki saadut tulokset perustuvat matemaattisiin lakeihin ja sääntöihin, eli tutkimuksen oikealla suorittamisella ja oikeilla laskelmilla tulokset eivät vääristy subjektiivisesti
  2. Se mahdollistaa tuloksen saamisen paljon nopeammin ja pienemmällä ajalla ja resursseilla tutkimalla ei koko tapahtumasarjaa, vaan vain osaa niistä.
  3. Sen avulla voidaan tutkia erilaisia ​​kohteita: erityiskysymyksistä, esimerkiksi meitä kiinnostavan ryhmän iästä, sukupuolesta, yleisen mielipiteen tai väestön aineellisen tuen tutkimukseen.

Valikoiva havainto

Valikoiva - tämä on sellainen tilastollinen havainto, jossa tutkimukseen ei tehdä koko tutkitun väestöä, vaan vain osa siitä, joka on valittu tietyllä tavalla, ja tämän osan tutkimuksen tulokset koskevat koko väestöä. Tätä osaa kutsutaan näytteenottokehykseksi. Tämä on ainoa tapa tutkia suurta joukkoa tutkimuskohdetta.

Mutta valikoivaa havainnointia voidaan käyttää vain tapauksissa, joissa on tarpeen tutkia vain pientä ryhmää yksiköitä. Esimerkiksi tutkittaessa miesten ja naisten suhdetta maailmassa käytetään valikoivaa havainnointia. Ilmeisistä syistä on mahdotonta ottaa huomioon jokaista planeettamme asukasta.

Mutta samalla tutkimuksella, mutta ei kaikkien maan asukkaiden, vaan tietyn 2 "A"-luokan tietyssä koulussa, tietyssä kaupungissa, tietyssä maassa, valikoiva havainto voidaan jättää tekemättä. Loppujen lopuksi on täysin mahdollista analysoida koko tutkimuskohteen joukko. On tarpeen laskea tämän luokan pojat ja tytöt - se on suhde.


Otos ja populaatio

Se ei itse asiassa ole niin vaikeaa kuin miltä se kuulostaa. Missä tahansa tutkimuskohteessa on kaksi järjestelmää: yleinen ja otantapopulaatio. Mikä se on? Kaikki yksiköt kuuluvat kenraalille. Ja otokseen - ne yksiköt kokonaisväestöstä, jotka otettiin otokseen. Jos kaikki tehdään oikein, valittu osa on koko (yleisen) populaation supistettu asettelu.

Jos puhumme yleisestä väestöstä, voimme erottaa vain kaksi sen lajiketta: määrätty ja määrittelemätön yleinen väestö. Riippuu siitä, tiedetäänkö tietyn järjestelmän yksiköiden kokonaismäärä vai ei. Jos kyseessä on tietty populaatio, näytteenotto on helpompaa, koska tiedetään, kuinka suuri prosenttiosuus yksiköiden kokonaismäärästä otetaan näytteitä.

Tämä hetki on erittäin tarpeellinen tutkimuksessa. Esimerkiksi, jos on tarpeen tutkia huonolaatuisten makeistuotteiden prosenttiosuutta tietyssä tehtaassa. Oletetaan, että populaatio on jo määritetty. Tiedetään varmasti, että tämä yritys tuottaa 1000 makeistuotteita vuodessa. Jos teemme tästä tuhannesta 100 satunnaisen makeistuotteen näytteen ja lähetämme ne tutkittavaksi, niin virhe on minimaalinen. Karkeasti ottaen 10 % kaikista tuotteista oli tutkimuksen kohteena ja tulosten perusteella edustavuusvirhe huomioiden voidaan puhua kaikkien tuotteiden huonosta laadusta.

Ja jos teet 100 makeistuotteen näytteen määrittelemättömästä yleisestä populaatiosta, jossa todellisuudessa oli esimerkiksi miljoona yksikköä, otoksen ja itse tutkimuksen tulos on kriittisesti epäuskottava ja epätarkka. Tunne erilaisuus? Siksi yleisen väestön varmuus on useimmissa tapauksissa erittäin tärkeä ja vaikuttaa suuresti tutkimuksen tulokseen.


Väestön edustavuus

Joten nyt yksi tärkeimmistä kysymyksistä - minkä näytteen pitäisi olla? Tämä on tutkimuksen tärkein kohta. Tässä vaiheessa on tarpeen laskea näyte ja valita yksiköt kokonaismäärästä siihen. Populaatio valittiin oikein, jos tietyt yleisen perusjoukon piirteet ja ominaisuudet säilyvät otoksessa. Tätä kutsutaan edustavuudelle.

Toisin sanoen, jos osa säilyttää valinnan jälkeen samat taipumukset ja ominaisuudet kuin koko tutkittava määrä, niin tällaista populaatiota kutsutaan edustavaksi. Mutta jokaista tiettyä otosta ei voida valita edustavasta populaatiosta. On myös sellaisia ​​tutkimuskohteita, joiden otos ei yksinkertaisesti voi olla edustava. Tästä tulee edustavuusvirheen käsite. Mutta puhutaanpa tästä vähän enemmän.

Kuinka tehdä näyte

Edustavuuden maksimoimiseksi on siis kolme otossääntöä:

  1. Ainutlaatuisimmaksi näytemäärän indikaattoriksi katsotaan 20 %. Tilastollinen 20 %:n otos antaa lähes aina tuloksen, joka on mahdollisimman lähellä todellisuutta. Samalla ei ole tarvetta siirtää kerätylle suurelle osalle väestöstä. 20 % otoksesta on luku, joka on kehitetty monissa tutkimuksissa. Katsotaanpa lisää teoriaa. Mitä suurempi otos, sitä pienempi edustavuusvirhe ja sitä tarkempi tutkimustulos. Mitä lähempänä otospopulaatiota on yksiköiden lukumäärän suhteen, sitä tarkempia ja oikeampia ovat tulokset. Loppujen lopuksi, jos tutkit koko järjestelmää, tulos on 100%. Mutta tässä ei ole valintaa. Nämä ovat niitä tutkimuksia, joissa tutkitaan koko matriisi, kaikki yksiköt, joten tämä ei kiinnosta meitä.
  2. Jos 20 % väestöstä ei ole tarkoituksenmukaista käsitellä, on mahdollista tutkia populaation yksiköitä vähintään 1001. Tämä on myös yksi tutkimuskohteen joukon tutkimuksen indikaattoreista. , joka on kehittynyt ajan myötä. Se ei tietenkään anna tarkkoja tuloksia suurilla tutkimussarjoilla, mutta se tuo sen mahdollisimman lähelle näytteen mahdollista tarkkuutta.
  3. Tilastoissa on monia kaavoja ja taulukoita. Tutkimuskohteesta ja otantakriteeristä riippuen on tarkoituksenmukaista valita yksi tai toinen kaava. Mutta tätä kohdetta käytetään monimutkaisissa ja monivaiheisissa tutkimuksissa.

Edustavuuden virhe (virhe).

Valitun näytteen laadun pääominaisuus on "edustavuusvirheen" käsite. Mikä se on? Nämä ovat tiettyjä eroja valikoivan ja jatkuvan havainnoinnin indikaattoreiden välillä. Virheindikaattoreiden mukaan edustavuus jaetaan luotettavaan, tavalliseen ja likimääräiseen. Toisin sanoen poikkeamat 3 %:sta 3 %:sta 10 %:iin ja 10 %:sta 20 %:iin ovat hyväksyttäviä. Vaikka tilastoissa on toivottavaa, että virhe ei ylitä 5-6%. Muuten on syytä puhua otoksen riittämättömästä edustavuudesta. Edustavuusvirheen ja sen vaikutuksen otokseen tai populaatioon laskemiseksi otetaan huomioon monet tekijät:

  1. Todennäköisyys, jolla saadaan tarkka tulos.
  2. Näytteenottoyksiköiden lukumäärä. Kuten aiemmin mainittiin, mitä pienempi yksiköiden määrä otoksessa on, sitä suurempi edustavuusvirhe on ja päinvastoin.
  3. Tutkimuspopulaation homogeenisuus. Mitä heterogeenisempi populaatio on, sitä suurempi edustavuusvirhe on. Populaation kyky olla edustava riippuu kaikkien sen muodostavien yksiköiden homogeenisuudesta.
  4. Menetelmä yksiköiden valitsemiseksi otantapopulaatiosta.

Tietyissä tutkimuksissa keskiarvon prosenttivirheen määrittää yleensä tutkija itse havaintoohjelman ja aikaisempien tutkimusten tietojen perusteella. Pääsääntöisesti näytteenottovirhe (edustavuusvirhe) 3-5 %:n sisällä katsotaan hyväksyttäväksi.


Enemmän ei aina ole parempi

On myös syytä muistaa, että valikoivan havainnoinnin järjestämisessä tärkeintä on saada sen tilavuus hyväksyttävään minimiin. Samalla ei pidä pyrkiä liialliseen näytteenottovirherajojen alentamiseen, koska tämä voi johtaa näytetietojen määrän perusteettomaan kasvuun ja sitä kautta näytteenoton kustannusten nousuun.

Samalla edustavuusvirheen suuruutta ei pidä suurentaa liikaa. Loppujen lopuksi tässä tapauksessa, vaikka otoskoko pienenee, tämä johtaa saatujen tulosten luotettavuuden heikkenemiseen.

Mitä kysymyksiä tutkija yleensä kysyy?

Kaikki tutkimukset, jos niitä tehdään, ovat jotakin tarkoitusta varten ja joidenkin tulosten saamiseksi. Otoskyselyä suoritettaessa alkukysymykset ovat yleensä:

  1. Tarvittavan näytteenottoyksiköiden määrän määrittäminen eli kuinka monta yksikköä tutkitaan. Lisäksi tarkkaa tutkimusta varten väestön on oltava edustava.
  2. Edustavuusvirheen laskeminen vahvistetulla todennäköisyystasolla. On heti huomattava, että selektiivisiä tutkimuksia ei tapahdu 100 %:n todennäköisyydellä. Jos tietyn segmentin tutkimuksen suorittanut viranomainen väittää, että heidän tulokset ovat tarkkoja 100 prosentin todennäköisyydellä, tämä on valhe. Useiden vuosien käytäntö on jo vahvistanut oikein suoritetun näytetutkimuksen todennäköisyysprosentin. Tämä luku on 95,4 prosenttia.

Otoksen tutkimusyksiköiden valintamenetelmät

Jokainen näyte ei ole edustava. Joskus yksi ja sama merkki ilmaistaan ​​eri tavalla kokonaisuudessa ja sen osassa. Edustavuusvaatimusten saavuttamiseksi on suositeltavaa käyttää erilaisia ​​näytteenottotekniikoita. Lisäksi yhden tai toisen menetelmän käyttö riippuu erityisolosuhteista. Jotkut näistä näytteenottomenetelmistä sisältävät:

  • satunnainen valinta;
  • mekaaninen valinta;
  • tyypillinen valinta;
  • sarja (sisäkkäinen) valinta.

Satunnaisvalinta on toimintojen järjestelmä, joka tähtää perusjoukon yksiköiden satunnaiseen valintaan, kun todennäköisyys joutua otokseen on yhtä suuri kaikille perusjoukon yksiköille. Tätä tekniikkaa suositellaan käytettäväksi vain, jos kyseessä on homogeenisuus ja pieni määrä sen luontaisia ​​ominaisuuksia. Muutoin jotkin ominaispiirteet ovat vaarassa jäädä otokseen. Satunnaisvalinnan piirteet ovat kaikkien muiden otantamenetelmien taustalla.

Mekaanisella yksiköiden valinta suoritetaan tietyin väliajoin. Jos on tarpeen muodostaa otos tietystä rikoksesta, on mahdollista poistaa joka 5., 10. tai 15. kortti kaikista kirjattujen rikosten tilastotiedoista riippuen niiden kokonaismäärästä ja käytettävissä olevista otoskooista. Tämän menetelmän haittana on, että ennen valintaa on oltava täydellinen selvitys perusjoukon yksiköistä, sitten on suoritettava ranking ja vasta sen jälkeen on mahdollista ottaa näyte tietyllä aikavälillä. Tämä menetelmä vie paljon aikaa, joten sitä ei käytetä usein.


Tyypillinen (alueellinen) valinta on otostyyppi, jossa yleinen populaatio jaetaan homogeenisiin ryhmiin tietyn ominaisuuden mukaan. Joskus tutkijat käyttävät muita termejä "ryhmien" sijasta: "piirit" ja "vyöhykkeet". Sitten kustakin ryhmästä valitaan satunnaisesti tietty määrä yksiköitä suhteessa ryhmän osuuteen koko väestöstä. Tyypillinen valinta tehdään usein useassa vaiheessa.

Sarjanäytteenotto on menetelmä, jossa yksiköiden valinta suoritetaan ryhmissä (sarjoissa) ja kaikki valitun ryhmän (sarjan) yksiköt tutkitaan. Tämän menetelmän etuna on, että joskus yksittäisten yksiköiden valitseminen on vaikeampaa kuin sarjoja, esimerkiksi tutkittaessa rangaistusta suorittavaa henkilöä. Valituilla alueilla, vyöhykkeillä sovelletaan poikkeuksetta kaikkien yksiköiden tutkimusta, esimerkiksi kaikkien tietyssä laitoksessa rangaistusta suorittavien henkilöiden tutkimusta.

Aihe: Otanta tilastoissa

1. Valikoivan havainnoinnin käsite, sen tehtävät

Tilastollinen havainto voidaan järjestää jatkuvaksi ja epäjatkuvaksi. Jatkuva havainto Se sisältää tutkimuksen kaikista tutkitun perusjoukon yksiköistä ja liittyy suuriin työ- ja materiaalikustannuksiin. Ei voida tutkia kaikkia populaation yksiköitä, vaan vain osaa, jonka perusteella pitäisi arvioida koko väestön ominaisuuksia. epäjatkuva havainto. Tilastokäytännössä yleisin on valikoiva havainto.

Valikoiva havainto - tämä on epäjatkuva havainto, jossa kartoitettavat yksiköt valitaan satunnaisessa järjestyksessä, valittua osaa tutkitaan ja tulokset jaetaan koko alkuperäiselle perusjoukolle. Havainnointi on järjestetty siten, että tämä osa valituista yksiköistä pienemmässä mittakaavassa edustaa(edustaa) koko väestöä.

Populaatio, josta valinta tehdään, kutsutaan kenraali, yleistä.

Valittujen yksiköiden joukkoa kutsutaan näytteenottosarja, ja kaikki sen yleiset indikaattorit - valikoiva.

On monia syitä, miksi monissa tapauksissa valikoivaa havainnointia suositellaan jatkuvan havainnoinnin sijaan. Merkittävimmät niistä ovat seuraavat:

Säästää aikaa ja rahaa työn määrän vähentämisen seurauksena;

Tutkittavien esineiden vahingoittumisen tai tuhoutumisen minimoiminen (langan kestävyyden määrittäminen, sähkölamppujen testaus palamisen keston ajan, säilykkeiden laadun tarkistaminen);

Tarve tutkia tarkasti jokainen havaintoyksikkö, kun kaikkia yksiköitä ei voida kattaa (perheiden budjettia tutkittaessa);

Saavuta kyselytulosten suurempi tarkkuus vähentämällä rekisteröintivirheitä.

Selektiivisen havainnoinnin etu jatkuvaan havainnointiin verrattuna voidaan toteuttaa, jos se järjestetään ja toteutetaan tiukasti tieteellisten periaatteiden mukaisesti. näytteenottomenetelmän teoria. Nämä periaatteet ovat: varmistaminen mahdollisuus(yhdenvertainen mahdollisuus tulla mukaan otokseen) yksiköiden valinta ja riittävä määrä niitä. Näiden periaatteiden noudattaminen mahdollistaa objektiivisen takuun tuloksena olevan näytteen edustavuudesta. konsepti edustavuus Valittua populaatiota ei tule ymmärtää sen edustuksena tutkittavan populaation kaikkien ominaisuuksien kannalta, vaan vain suhteessa niihin ominaisuuksiin, joita tutkitaan tai joilla on merkittävä vaikutus yhteenveto-yleistävän luonteen muodostumiseen.

Taloustieteen otoshavainnoinnin päätehtävänä on saada luotettavia arvioita otosjoukon ominaisuuksien (keskiarvo ja osuus) perusjoukon keskiarvon ja osuuden indikaattoreista. Samalla on pidettävä mielessä, että kaikissa tilastotutkimuksissa (kiinteissä ja valikoivissa) ilmenee kahdenlaisia ​​virheitä: rekisteröinti ja edustavuus.

Rekisteröintivirheet voi olla satunnainen(tahaton) ja järjestelmällinen(poikkeuksellinen) luonne. Satunnaisia ​​bugeja yleensä tasapainottavat toisiaan, koska niillä ei ole hallitsevaa suuntaa tutkittavan indikaattorin arvon liioittamisen tai aliarvioinnin suuntaan. Systemaattiset virheet suunnattu yhteen suuntaan valintasääntöjen tahallisen rikkomisen vuoksi (puolueet kohteet). Ne voidaan välttää asianmukaisella organisoinnilla ja seurannalla.

Edustusvirheet ovat luontaisia ​​vain valikoivalle havainnolle ja syntyvät siitä tosiasiasta, että näyte ei täysin toista yleistä. Ne edustavat eroa otoksesta saatujen indikaattoreiden arvojen ja samojen arvojen indikaattoreiden arvojen välillä, jotka olisi saatu samalla tarkkuudella suoritetulla jatkuvalla havainnolla, ts. valittujen ja vastaavien yleisindikaattoreiden arvot.

Kullekin tietylle näytehavainnolle edustavuusvirheen arvo voidaan määrittää vastaavilla kaavoilla, jotka riippuvat tyyppi, menetelmä ja tapa näytteen muodostus.

Tyypin mukaan Valikoimasta löytyy yksilö-, ryhmä- ja yhdistetty valikoima. klo yksilöllinen valinta otokseen valitaan yksittäiset yksiköt yleisestä perusjoukosta; klo ryhmän valinta- laadullisesti homogeeniset tutkittavat ryhmät tai yksiköiden sarjat; yhdistetty valikoima sisältää ensimmäisen ja toisen tyypin yhdistelmän.

Valintamenetelmällä erottaa toistettu ja ei-toistuva näytteenotto.

klo uudelleennäytteenotto otosprosessissa olevien populaatioyksiköiden kokonaismäärä pysyy ennallaan. Tämä tai se otokseen päässyt yksikkö palautetaan rekisteröinnin jälkeen uudelleen yleiseen perusjoukkoon, ja se säilyttää yhtäläisen mahdollisuuden kaikkien muiden yksiköiden kanssa, kun yksiköt valitaan uudelleen otokseen ("valinta palautettu pallosuunnitelma”). Uudelleenotantaminen sosioekonomisessa elämässä on harvinaista. Tyypillisesti näytteenotto järjestetään ei-toistuvan näytteenottojärjestelmän mukaisesti.

klo ei uudelleennäytteenottoa otokseen kuulunutta populaatioyksikköä ei palauteta yleiseen perusjoukkoon eikä se osallistu otokseen tulevaisuudessa; eli seuraava näyte otetaan yleisestä populaatiosta ilman aiemmin valittuja yksiköitä ("valinta palauttamattoman pallon kaavion mukaan"). Näin ollen ei-toistuvalla otannalla yksiköiden lukumäärä yleisessä populaatiossa vähenee tutkimusprosessissa.

Valintamenetelmä määrittelee erityisen mekanismin tai menettelyn yksiköiden valitsemiseksi populaatiosta.

Väestöyksiköiden peittoasteen mukaan niitä on suuri ja pieni (n <30) выборки.

Otantatutkimusten käytännössä seuraavat näytteenottotyypit ovat yleisimmin käytössä: oikea satunnainen, mekaaninen, tyypillinen, sarja, yhdistetty.

Yleisten ja näytepopulaatioiden parametrien pääominaisuudet on merkitty symboleilla:

yleisen perusjoukon N-tilavuus (siihen sisältyvien yksiköiden lukumäärä);

P - otoksen koko (tutkittujen yksiköiden lukumäärä);

- yleinen keskiarvo (määritteen keskiarvo yleisessä populaatiossa);

- näytekeskiarvo;

P- yleinen osuus (määritteen tietyn arvon omaavien yksiköiden osuus yleisen perusjoukon yksiköiden kokonaismäärästä);

w - näyte osuus;

- yleinen varianssi (piirteen varianssi yleisessä populaatiossa);

S 2 - saman ominaisuuden näytevarianssi;

- keskihajonta väestössä;

S- näytteen keskihajonta.

2. Näytteenottovirheet

Valikoivan havainnoinnin aikana on varmistettava mahdollisuus yksikön valinta. Jokaisella yksiköllä tulee olla yhtäläinen mahdollisuus tulla valituksi muiden kanssa. Tähän satunnainen otanta perustuu.

Vastaanottaja oikea satunnainen näyte tarkoittaa yksiköiden valitsemista koko väestöstä (jakamatta sitä etukäteen mihinkään ryhmiin) arpajaisella (pääasiassa) tai jollain muulla vastaavalla menetelmällä, esimerkiksi käyttämällä satunnaislukutaulukkoa. Satunnainen valinta - tämä valinta ei ole satunnainen. Satunnaisuusperiaate olettaa, että esineen sisällyttämiseen tai pois jättämiseen otoksesta ei voi vaikuttaa millään muulla tekijällä kuin sattumalla. Esimerkki itse asiassa satunnainen Voittojen arvonnat voivat toimia valintana: liitettyjen lippujen kokonaismäärästä valitaan satunnaisesti tietty osa voitot muodostavista numeroista. Lisäksi kaikilla numeroilla on yhtäläinen mahdollisuus päästä otokseen. Tässä tapauksessa otosjoukkoon valittujen yksiköiden lukumäärä määräytyy yleensä otoksen hyväksytyn osuuden perusteella.

Jaa, näytteitä on otoksessa olevien yksiköiden lukumäärän suhde yleisen perusjoukon yksiköiden lukumäärään:

Siis 5 % näytteellä osaerästä 1000 yksikössä. otoskoko P on 50 yksikköä ja 10 % näytteellä -100 yksikköä. jne. Näytteenoton asianmukaisella tieteellisellä organisoinnilla edustavuusvirheet voidaan vähentää minimiarvoihin, minkä seurauksena valikoiva havainto muuttuu melko tarkkaksi.

Itsesatunnaista valintaa "puhtaassa muodossaan" käytetään harvoin valikoivan havainnoinnin harjoittamisessa, mutta se on ensimmäinen kaikkien muiden valintatyyppien joukossa, se sisältää ja toteuttaa valikoivan havainnoinnin perusperiaatteet.

Tarkastellaanpa joitain kysymyksiä otantamenetelmän teoriasta ja yksinkertaisen satunnaisotoksen virhekaavasta.

Otantamenetelmää sovellettaessa tilastoissa käytetään yleensä kahta päätyyppiä yleistäviä indikaattoreita: määrällisen ominaisuuden keskiarvo ja vaihtoehtoisen ominaisuuden suhteellinen arvo(tilastollisen perusjoukon yksiköiden osuus tai osuus, jotka eroavat kaikista muista tämän populaation yksiköistä vain tutkittavan ominaisuuden vuoksi).

Esimerkkiosuus ( w ), tai taajuus, määräytyy niiden yksiköiden lukumäärän suhteen, joilla on tutkittava ominaisuus t, näytteenottoyksiköiden kokonaismäärään P:

Tapahtuman todennäköisyyden intervalliarvio. Kaavat näytteiden lukumäärän laskemiseksi satunnaisvalintamenetelmän tapauksessa.

Meitä kiinnostavien tapahtumien todennäköisyyksien määrittämiseksi käytämme otantamenetelmää: suoritamme n riippumattomat kokeet, joissa jokaisessa tapahtumassa A voi tapahtua (tai ei tapahdu) (todennäköisyys R tapahtuman A esiintyminen kussakin kokeessa on vakio). Sitten tapahtumien suhteellinen esiintymistiheys p* MUTTA sarjassa n testit otetaan pisteestimaattina todennäköisyydelle s tapahtuman esiintyminen MUTTA erillisessä testissä. Tässä tapauksessa kutsutaan arvoa p* näyteosuus tapahtumatapahtumia MUTTA, ja r - yleinen osake .

Keskirajalauseen (Moivre-Laplace-lauseen) johdosta suuren otoskoon omaavan tapahtuman suhteellista frekvenssiä voidaan pitää normaalijakautuneena parametreilla M(p*)=p ja

Siksi, jos n>30, yleisen murtoluvun luottamusväli voidaan rakentaa kaavoilla:


jossa u cr löytyy Laplacen funktion taulukoiden mukaan ottaen huomioon annettu luottamustodennäköisyys γ: 2Ф(u cr)=γ.

Pienellä otoskoolla n≤30 rajavirhe ε määritetään Studentin jakaumataulukosta:
missä t cr =t(k; α) ja vapausasteiden lukumäärä k=n-1 todennäköisyys α=1-γ (kaksipuolinen alue).

Kaavat ovat päteviä, jos valinta tehtiin satunnaisesti toistuvasti (yleispopulaatio on ääretön), muuten on tarpeen tehdä korjaus ei-toistuvaan valintaan (taulukko).

Yleisen osuuden keskimääräinen otantavirhe

VäestöLoputonlopullinen volyymi N
ValintatyyppiToistettuei-toistuva
Keskimääräinen näytteenottovirhe

Kaavat otoskoon laskemiseen oikealla satunnaisvalintamenetelmällä

ValintamenetelmäNäytteen kokokaavat
keskimmäisellejakaa varten
Toistettu
ei-toistuva
Osuus yksiköistä w = . Tarkkuus ε = . Todennäköisyys γ =

Yleisosakkeisiin liittyviä ongelmia

Kysymykseen "Kattaako annettu arvo p 0 luottamusvälin?" - voidaan vastata testaamalla tilastollista hypoteesia H 0:p=p 0 . Oletetaan, että kokeet suoritetaan Bernoullin testikaavion mukaisesti (riippumaton, todennäköisyys s tapahtuman esiintyminen MUTTA vakio). Tilavuusnäytteen mukaan n määritä tapahtuman A esiintymistiheys p *: missä m- tapahtuman esiintymisten määrä MUTTA sarjassa n testejä. Hypoteesin H 0 testaamiseen käytetään tilastoja, joilla on riittävän suurella otoskoolla standardi normaalijakauma (taulukko 1).
Taulukko 1 - Hypoteesit yleisosuudesta

Hypoteesi

H0:p=p0H 0:p 1 \u003d p 2
OletuksetBernoullin testikaavioBernoullin testikaavio
Esimerkkiarviot
Tilastot K
Tilastojen jakelu K Normaali normaali N(0,1)

Esimerkki #1. Satunnaisotannalla yhtiön johto suoritti satunnaiskyselyn 900 työntekijälle. Naisia ​​vastaajista oli 270. Piirrä luottamusväli, joka kattaa todennäköisyydellä 0,95 naisten todellisen osuuden yrityksen koko tiimissä.
Ratkaisu. Ehdollisesti naisten otososuus on (naisten suhteellinen esiintyvyys kaikista vastaajista). Koska valinta toistuu ja otoskoko on suuri (n=900), otosmarginaalivirhe määritetään kaavalla

u cr:n arvo saadaan Laplacen funktion taulukosta suhteesta 2Ф(u cr)=γ, ts. Laplace-funktio (Liite 1) saa arvon 0,475 kohdassa u cr =1,96. Siksi marginaalivirhe ja haluttu luottamusväli
(p – ε, p + ε) = (0,3 – 0,18; 0,3 + 0,18) = (0,12; 0,48)
Eli todennäköisyydellä 0,95 voidaan taata, että naisten osuus yrityksen koko tiimissä on välillä 0,12-0,48.

Esimerkki #2. Pysäköintialueen omistaja pitää päivää "onnekkaana", jos pysäköintialue on täynnä yli 80 %. Pysäköintialuekatsastuksia tehtiin vuoden aikana 40, joista 24 oli ”onnistuneita”. Etsi todennäköisyydellä 0,98 luottamusväli vuoden "onnenpäivien" todellisen prosenttiosuuden arvioimiseksi.
Ratkaisu. ”hyvien” päivien näyteosuus on
Laplace-funktion taulukon mukaan löydämme u cr:n arvon tietylle
luottamustaso
Ф(2,23) = 0,49, u cr = 2,33.
Koska valinta ei ole toistuva (eli kahta tarkistusta ei tehty samana päivänä), löydämme marginaalivirheen:
jossa n = 40, N = 365 (päivää). Täältä
ja yleisen murtoluvun luottamusväli: (p – ε, p + ε) = (0,6 – 0,17; 0,6 + 0,17) = (0,43; 0,77)
Todennäköisyydellä 0,98 voidaan olettaa, että "hyvien" päivien osuus vuoden aikana on välillä 0,43-0,77.

Esimerkki #3. Tarkastettuaan erän 2500 tuotetta, he havaitsivat, että 400 tuotetta oli korkeinta laatua, mutta n–m ei. Kuinka monta tuotetta sinun on tarkistettava, jotta voit määrittää premium-luokan osuuden tarkkuudella 0,01 95 %:n varmuudella?
Etsimme kaavan mukaista ratkaisua näytteen koon määrittämiseksi uudelleenvalintaa varten.

Ф(t) = γ/2 = 0,95/2 = 0,475 ja Laplacen taulukon mukaan tämä arvo vastaa t=1,96
Näytefraktio w = 0,16; näytteenottovirhe ε = 0,01

Esimerkki #4. Tuote-erä hyväksytään, jos todennäköisyys, että tuote täyttää standardin, on vähintään 0,97. Testatun erän satunnaisesti valituista 200 tuotteesta 193 tuotteen todettiin täyttävän standardin. Onko mahdollista hyväksyä erä merkitsevyystasolla α=0,02?
Ratkaisu. Laadimme päähypoteesit ja vaihtoehtoiset hypoteesit.
H 0: p \u003d p 0 \u003d 0,97 - tuntematon yleinen osake s yhtä suuri kuin määritetty arvo p 0 =0,97. Suhteessa kuntoon - todennäköisyys, että osa testatusta erästä on standardin mukainen, on 0,97; nuo. tuote-erä voidaan hyväksyä.
H1:p<0,97 - вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0.97; т.е. партию изделий нельзя принять. При такой альтернативной гипотезе критическая область будет левосторонней.
Havaittu tilastollinen arvo K(taulukko) laske annetuille arvoille p 0 = 0,97, n = 200, m = 193


Kriittinen arvo saadaan Laplacen funktion taulukosta yhtälöstä


Ehdon mukaan α=0,02, joten F(Kcr)=0,48 ja Kcr=2,05. Kriittinen alue on vasenkätinen, ts. on väli (-∞;-K kp)= (-∞;-2,05). Havaittu arvo Kobs = -0,415 ei kuulu kriittiseen alueeseen, joten tällä merkitsevyystasolla ei ole syytä hylätä päähypoteesia. Tuotteita voidaan ottaa vastaan.

Esimerkki numero 5. Kaksi tehdasta valmistaa samantyyppisiä osia. Niiden laadun arvioimiseksi näiden tehtaiden tuotteista otettiin näytteitä ja saatiin seuraavat tulokset. Ensimmäisen tehtaan 200 valitusta tuotteesta 20 oli viallisia ja toisen tehtaan 300 tuotteesta 15 viallisia.
Selvitä merkitsevyystasolla 0,025, onko näiden tehtaiden valmistamien osien laadussa merkittävää eroa.

Ehdon mukaan α=0,025, joten F(Kcr)=0,4875 ja Kcr=2,24. Kaksipuolisessa vaihtoehdossa sallittujen arvojen alue on muotoa (-2,24; 2,24). Havaittu arvo Kobs =2,15 osuu tähän väliin, ts. Tällä merkitystasolla ei ole mitään syytä hylätä päähypoteesia. Tehtaat valmistavat samanlaatuisia tuotteita.

Valikoiva tutkimus.

Otantamenetelmän käsite.

Valikoiva havainto- tämä on sellainen epäjatkuva havainto, jossa tutkittavan perusjoukon yksiköiden valinta tehdään satunnaisesti, valitulle osalle tehdään tutkimus, jonka jälkeen tulokset jaetaan koko populaatiolle.

Otantamenetelmää käytetään, kun

1 kun itse havainto liittyy havaittujen yksiköiden vaurioitumiseen tai tuhoutumiseen (lanka mausteeksi, sähkölamppu palamistuotteeksi)

2 iso kokonaismäärä

3 korkeat kustannukset (taloudellinen ja työvoima).

Yleensä otantatutkimuksen kohteena on 5-10 % koko väestöstä, harvemmin 15-25 %.

Otannan tarkoituksena on määrittää kokonaiskeskiarvon ja kokonaisosuuden (P) ominaisuudet. Otospopulaation ominaisuudet - otoskeskiarvo ja näyteosuus (w) eroaa yleisistä ominaisuuksista näytteenottovirheen määrällä ( ). Siksi on tarpeen laskea otosvirhe tai edustavuusvirhe, joka määritetään todennäköisyysteoriassa kehitetyillä kaavoilla kullekin otostyypille ja valintamenetelmälle.

Voit valita yksiköt seuraavilla tavoilla:

1 paluupallon valinta, jota kutsutaan yleisesti nimellä uudelleennäytteenotto.

Toistuvalla valinnalla todennäköisyys saada jokainen yksittäinen yksikkö otokseen pysyy vakiona, koska yksikön valinnan jälkeen se palautetaan uudelleen perusjoukkoon ja voidaan valita uudelleen.

2 valinta palauttamattomien pallojen kaavion mukaisesti, ns satunnainen otanta. Tässä tapauksessa kutakin valittua yksikköä ei palauteta takaisin, ja todennäköisyys saada yksittäisiä yksiköitä otokseen muuttuu koko ajan (muilla yksiköillä se kasvaa) (erä), satunnaislukutaulukot, esim. 75 joukosta 780.

Näytetyypit.

1 Itse asiassa - satunnainen.

Tämä on sellainen, jossa yksiköiden valinta otokseen tehdään suoraan yleisen perusjoukon yksiköiden kokonaismassasta.

Tässä tapauksessa valittujen yksiköiden lukumäärä määritetään yleensä otoksen hyväksytyn osuuden perusteella.

Otoksen osalta on otosjoukon yksiköiden lukumäärän ja yleisen populaation N yksiköiden lukumäärän suhde.

Joten 5 % näytteellä 2000 yksikön tavaraerästä otoskoko n on 100 yksikköä. (
), ja 20 prosentin näytteellä se on 400 yksikköä.

(
)

Tärkeä edellytys asianmukaiselle satunnaisotokselle että jokaiselle perusjoukon yksikölle annetaan yhtäläinen mahdollisuus tulla mukaan otokseen.

Satunnaisvalinnalla keskiarvon marginaalinen otantavirhe on yhtä suuri kuin

- otannan varianssi

n - otoskoko

t on luottamustekijä, joka määritetään Laplacen integraalifunktion arvotaulukosta tietylle todennäköisyydelle P.

Ei-toistuvassa näytteenotossa marginaalinen otantavirhe määräytyy keskiarvon kaavan mukaan

missä N on osuuden perusjoukon koko

Hiilen tuhkapitoisuuden määrittämiseksi tutkittiin satunnaisesti 100 kivihiilenäytettä. Tutkimuksen tuloksena todettiin, että kivihiilen keskimääräinen tuhkapitoisuus otoksessa on 16 %. = 5 %. 10 näytteessä kivihiilen tuhkapitoisuus oli > 20 % todennäköisyydellä 0,954, jotta voidaan määrittää rajat, joissa esiintymän kivihiilen keskimääräinen tuhkapitoisuus ja yli 20 % tuhkapitoisen hiilen osuus ovat

Keskimääräinen tuhkapitoisuus

määrittää marginaalinen otantavirhe


2*0.5=1%

p = 0,954 t = 2

tuhkapitoisen hiilen osuus >20 %

otososuus määritetään

missä m on niiden yksiköiden osuus, joilla on ominaisuus

jaon näytteenottovirhe

Todennäköisyydellä 0,954 voidaan väittää, että yli 20 % tuhkapitoisen kivihiilen osuus esiintymästä jää

P = 10 % + (-) 6 % tai

mekaaninen näytteenotto.

Tämä on eräänlainen itse asiassa - satunnainen. Tässä tapauksessa koko populaatio jaetaan n yhtä suureen osaan ja jokaisesta osasta valitaan yksi yksikkö.

Kaikki populaation yksiköt on järjestettävä tiettyyn järjestykseen. Samanaikaisesti suhteessa tutkittavaan indikaattoriin yleisen perusjoukon yksiköt voidaan järjestää merkittävän, toissijaisen tai neutraalin ominaisuuden mukaan. Tässä tapauksessa kustakin ryhmästä tulee valita se yksikkö, joka on kunkin ryhmän keskellä. Tällä vältetään näytteenottoharha.

Hae: tutkittaessa ostajia kaupoissa, kävijöitä klinikoilla, joka 5,4,3 jne.

Esimerkki mekaanisesta näytteenotosta

Lyhytaikaisen lainan keskimääräisen käyttöajan määrittämiseksi pankissa tehdään 5 %:n mekaaninen näyte, joka sisältää 100 tiliä. Kyselyn tuloksena selvisi, että lyhytaikaisen lainan keskimääräinen käyttöaika on 30 päivää.
9 päivää 5 tilillä Laina-aika > 60 päivää.

Näytteenottovirhe

nuo. todennäköisyydellä 0,954 voidaan väittää, että lainan käyttöaika vaihtelee

1 30 päivän sisällä+(-)2 päivän sisällä, ts.

2 osaketta lainoista, joiden laina-aika on > 60 päivää.

näyteosuus tulee olemaan

määrittää jakovirheen

todennäköisyydellä 0,954 voidaan väittää, että pankkilainojen osuus, joiden maturiteetti on >60 päivää, jää

Tyypillinen näyte.

Yleisväestö on jaettu homogeenisiin tyypillisiin ryhmiin. Sitten kustakin tyypillisestä ryhmästä valitaan yksittäiset yksiköt näytteeseen satunnaisella tai mekaanisella näytteellä.

Esimerkiksi: pr. tr. työntekijöitä, jotka koostuvat pätevyyden mukaan erillisistä ryhmistä.

Tärkeä ominaisuus- antaa tarkempia tuloksia verrattuna muihin, tk. otos sisältää typologisen yksikön.

Havaintoyksiköiden valinta otosjoukossa tapahtuu eri menetelmin. Harkitse tyypillistä otosta suhteellisella valinnalla tyypillisten ryhmien sisällä.

Otoskoko tyypillisestä ryhmästä valinnassa suhteessa tyypillisten ryhmien määrään määritetään kaavalla

missä =V näytettä tyypillisestä ryhmästä

= tyypillisen ryhmän V.

Otoskeskiarvon ja osuuden marginaalivirhe ei-toistuvalle satunnaiselle ja mekaaniselle valintamenetelmälle tyypillisten ryhmien sisällä lasketaan kaavoilla


missä = otosvarianssi

Esimerkki: tyypillinen näyte

Avioliittoon menevien miesten keski-iän määrittämiseksi piirissä tehtiin 5 % otos yksiköiden valinnalla suhteessa tyypillisten ryhmien määrään.

Ryhmien sisällä käytettiin mekaanista valintaa

Määritä todennäköisyydellä 0,954 rajat, joissa naimisiin menneiden miesten keski-ikä ja uudelleen naimisiin menneiden miesten osuus on.

otokseen kuuluneiden miesten keskimääräinen avioliitto-ikä

marginaalinen otantavirhe

todennäköisyydellä 0,954 voidaan väittää, että avioliittoon solmivien miesten keski-ikä on

miehille, jotka solmivat toisen avioliiton

otososuus määritetään

vaihtoehtoisen ominaisuuden otosvarianssi on

todennäköisyydellä 0,954 voidaan väittää, että toisen kerran naimisiin menneiden osuus on sisällä

sarjanäytteenotto.

Sarjaotannalla populaatio jaetaan samankokoisiin ryhmiin - sarjoihin. Otospopulaatio on valittu sarja. Sarjan sisällä tehdään jatkuvaa sarjaan joutuneiden yksiköiden havainnointia.

Toistuvalla valinnalla ja määräytyy kaavan mukaan

missä
- sarjojen välinen varianssi

missä
sarjan näytekeskiarvo

sarjanäytteen näytekeskiarvo

R- perusjoukon sarjanumero

r - valittujen sarjojen lukumäärä

Esimerkki: 10 prikaatin työpajassa heidän työn tuottavuuden tutkimiseksi tehdään 20 % sarjanäyte, joka sisälsi 2 prikaatia. Kyselyn tuloksena todettiin, että

todennäköisyydellä 0,997 määrittääksesi rajat, joissa myymälän työntekijöiden keskimääräinen tuotanto on.

sarjanäytteen näytteen keskiarvo määritetään kaavalla

todennäköisyydellä 0,997 voidaan väittää, että myymälän työntekijöiden keskimääräinen tuotanto on

Pajan valmiissa tuotevarastossa on 200 laatikkoa osia, kussakin laatikossa 40 kappaletta. 10 % sarjanäytteenotto tehdään valmiiden tuotteiden laadun tarkistamiseksi. Näytteenoton tuloksena havaittiin, että viallisille osille on 15%. Sarjanäytteen varianssi on 0,0049.

Määritä todennäköisyydellä 0,997 rajat, joissa viallisten tuotteiden osuus laatikkoerästä on

Viallisten osien osuus pysyy sisällä

määritä osuuden marginaalinen otantavirhe kaavalla

todennäköisyydellä 0,997 voidaan väittää, että viallisten osien osuus

puolueessa on sisällä

Otoshavainnoinnin suunnittelukäytännössä on tarpeen löytää otoksen koko, joka on tarpeen yleisten ominaisuuksien - keskiarvon ja osuuden - laskennan tietyn tarkkuuden varmistamiseksi.

Näytteenottovirhe, sen esiintymistodennäköisyys ja ominaisuuden vaihtelu tunnetaan etukäteen.

Satunnaisesti uudelleenvalinta näytteen koko määräytyy kaavan mukaan

satunnaisella ei-toistuvalla ja mekaanisella valinnalla otoskoko

tyypilliselle näytteelle

sarjanäytteenottoa varten

Esimerkiksi alueella asuu 2000 perhettä.

Heistä on tarkoitus tehdä otantatutkimus satunnaisen ei-toistuvan valinnan menetelmällä perheen keskimääräisen koon selvittämiseksi.

Määritä vaadittu otoskoko edellyttäen, että näytteenottovirhe todennäköisyydellä 0,954 ei ylitä 1 henkilöä keskihajonnan ollessa 3 henkilöä.

Kaupungissa asuu 10 tuhatta ihmistä. perheitä. Mekaanisella otannalla ehdotetaan selvitettäväksi kolmen tai useamman lapsen perheiden osuus. Mikä pitäisi olla otoskoko, jotta otantavirhe olisi pienempi kuin 0,02 todennäköisyydellä P=0,954, jos varianssin tiedetään olevan 0,02 aiemmista tutkimuksista?

Suunnitelma:

1. Matemaattisten tilastojen ongelmat.

2. Näytetyypit.

3. Valintamenetelmät.

4. Otoksen tilastollinen jakautuminen.

5. Empiirinen jakaumafunktio.

6. Monikulmio ja histogrammi.

7. Variaatiosarjan numeeriset ominaisuudet.

8. Jakaumaparametrien tilastolliset estimaatit.

9. Jakaumaparametrien intervalliarviot.

1. Matemaattisen tilastotieteen tehtävät ja menetelmät

Matemaattiset tilastot on matematiikan ala, joka on omistettu menetelmille kerätä, analysoida ja käsitellä tilastollisen havaintodatan tuloksia tieteellisiin ja käytännön tarkoituksiin.

Vaaditaan homogeenisten objektien joukon tutkimista jonkin näitä objekteja kuvaavan laadullisen tai määrällisen ominaisuuden suhteen. Esimerkiksi jos osia on erä, osan standardi voi toimia laadullisena merkkinä ja osan kontrolloitu koko määrällisenä merkkinä.

Joskus tehdään jatkuvaa tutkimusta, ts. tutkia jokaista kohdetta halutun ominaisuuden suhteen. Käytännössä kattavaa kyselyä käytetään harvoin. Esimerkiksi, jos populaatiossa on erittäin suuri määrä esineitä, on fyysisesti mahdotonta suorittaa täydellistä tutkimusta. Jos kohteen tutkimus liittyy sen tuhoamiseen tai vaatii suuria materiaalikustannuksia, ei ole järkevää suorittaa täydellistä tutkimusta. Tällaisissa tapauksissa rajoitettu määrä esineitä (otosjoukko) valitaan satunnaisesti koko populaatiosta ja tutkitaan.

Matemaattisen tilaston päätehtävänä on tutkia otosaineiston pohjalta koko populaatiota tavoitteesta riippuen, ts. populaation todennäköisyysominaisuuksien tutkimus: jakautumislaki, numeeriset ominaisuudet jne. johtamispäätösten tekemiseen epävarmuuden olosuhteissa.

2. Näytetyypit

Väestö on joukko esineitä, joista näyte tehdään.

Otospopulaatio (otos) on kokoelma satunnaisesti valittuja objekteja.

Populaation koko on tämän kokoelman objektien lukumäärä. Yleisväestön määrä on merkitty N, valikoiva - n.

Esimerkki:

Jos 1000 osasta valitaan tutkittavaksi 100 osaa, niin yleisen populaation volyymi N = 1000 ja otoskoko n = 100.

Otanta voidaan tehdä kahdella tavalla: kun kohde on valittu ja sen yli tarkkailtu, se voidaan palauttaa tai jättää palauttamatta yleiseen perusjoukkoon. Että. Näytteet jaetaan toistuviin ja ei-toistuviin.

Toistettunimeltään näytteenotto, jossa valittu objekti (ennen seuraavan valitsemista) palautetaan yleiseen joukkoon.

Ei-toistuvanimeltään näytteenotto, jossa valittua objektia ei palauteta yleiseen populaatioon.

Käytännössä käytetään yleensä ei-toistuvaa satunnaisvalintaa.

Jotta otoksen tiedot pystyisivät arvioimaan riittävällä varmuudella yleisen populaation kiinnostavasta piirteestä, on välttämätöntä, että otoksen kohteet edustavat sitä oikein. Otoksen tulee edustaa oikein perusjoukon osuuksia. Näytteen tulee olla edustaja (edustaja).

Suurten lukujen lain perusteella voidaan väittää, että otos on edustava, jos se suoritetaan satunnaisesti.

Jos yleisen perusjoukon koko on riittävän suuri ja otos on vain merkityksetön osa tästä populaatiosta, ero toistuvien ja ei-toistuvien näytteiden välillä poistetaan; rajoittavassa tapauksessa, kun tarkastellaan ääretöntä yleistä populaatiota ja otoksen koko on äärellinen, tämä ero häviää.

Esimerkki:

Amerikkalaisessa Literary Review -lehdessä tehtiin tilastollisilla menetelmillä tutkimus ennusteista, jotka koskivat vuoden 1936 Yhdysvaltain presidentinvaalien lopputulosta. Tähän virkaan hakivat F.D. Roosevelt ja A. M. Landon. Puhelintilaajien hakuteoksia otettiin lähteeksi tutkittujen amerikkalaisten väestölle. Näistä valittiin sattumanvaraisesti 4 miljoonaa osoitetta, joihin lehden toimittajat lähettivät postikortteja, joissa pyydettiin ilmaisemaan suhtautumistaan ​​presidenttiehdokkaisiin. Käsiteltyään kyselyn tulokset, lehti julkaisi sosiologisen ennusteen, jonka mukaan Landon voittaisi tulevat vaalit suurella erolla. Ja... Olin väärässä: Roosevelt voitti.
Tätä esimerkkiä voidaan pitää esimerkkinä ei-edustavasta otoksesta. Tosiasia on, että Yhdysvalloissa 1900-luvun ensimmäisellä puoliskolla vain varakkaalla osalla väestöstä, joka tuki Landonin näkemyksiä, oli puhelin.

3. Valintamenetelmät

Käytännössä käytetään erilaisia ​​valintamenetelmiä, jotka voidaan jakaa kahteen tyyppiin:

1. Valinta ei edellytä populaation jakamista osiin (a) yksinkertainen satunnainen ei toistoa; b) yksinkertainen satunnainen toisto).

2. Valinta, jossa yleinen väestö jaetaan osiin. (a) tyypillinen valinta; b) mekaaninen valinta; sisään) sarja valinta).

Yksinkertainen satunnainen kutsu tätä valinta, jossa objektit poimitaan yksitellen koko väestöstä (satunnaisesti).

Tyypillinennimeltään valinta, jossa esineitä ei valita koko väestöstä, vaan jokaisesta sen "tyypillisestä" osasta. Esimerkiksi, jos osa valmistetaan useilla koneilla, valintaa ei tehdä kaikkien koneiden valmistamien osien koko sarjasta, vaan kunkin koneen tuotteista erikseen. Tällaista valintaa käytetään, kun tutkittava ominaisuus vaihtelee huomattavasti yleisen väestön eri "tyypillisissä" osissa.

Mekaaninennimeltään valinta, jossa yleinen populaatio jaetaan "mekaanisesti" niin moneen ryhmään kuin otokseen sisällytettäviä objekteja on, ja jokaisesta ryhmästä valitaan yksi kohde. Jos esimerkiksi haluat valita 20 % koneen valmistamista osista, valitaan joka viides osa; jos on valittava 5% osista - joka 20. jne. Joskus tällainen valinta ei välttämättä takaa edustavaa otosta (jos valitaan joka 20. kääntötela ja leikkuri vaihdetaan välittömästi valinnan jälkeen, valitaan kaikki tylpillä jyrsimellä käännetyt telat).

Sarjanimeltään valinta, jossa esineitä valitaan yleisestä populaatiosta ei yksi kerrallaan, vaan ”sarjoina”, joita tutkitaan jatkuvasti. Esimerkiksi, jos tuotteita valmistaa suuri joukko automaattisia koneita, vain muutaman koneen tuotteille tehdään jatkuva tarkastus.

Käytännössä käytetään usein yhdistettyä valintaa, jossa yllä olevat menetelmät yhdistetään.

4. Otoksen tilastollinen jakautuminen

Otetaan näyte yleisestä perusjoukosta ja arvo x 1-havaittu kerran, x 2 -n 2 kertaa, ... x k - n k kertaa. n= n 1 +n 2 +...+n k on otoskoko. Havaitut arvotnimeltään vaihtoehtoja, ja sekvenssi on muunnos, joka on kirjoitettu nousevassa järjestyksessä - variaatiosarja. Havaintojen määränimeltään taajuudet (absoluuttiset taajuudet) ja niiden suhde otoskokoon- suhteelliset taajuudet tai tilastolliset todennäköisyydet.

Jos vaihtoehtojen määrä on suuri tai otos on tehty jatkuvasta yleisjoukosta, niin variaatiosarjaa ei laadita yksittäisten pistearvojen, vaan yleisen perusjoukon arvojen intervallein. Sellaista sarjaa kutsutaan intervalli. Välien pituuden tulee olla yhtä suuri.

Otoksen tilastollinen jakautuminen kutsutaan luetteloksi optioista ja niitä vastaavista taajuuksista tai suhteellisista taajuuksista.

Tilastollinen jakauma voidaan määrittää myös intervallien ja niitä vastaavien taajuuksien sarjana (tälle arvovälille osuvien taajuuksien summa)

Taajuuksien pistevaihtelusarja voidaan esittää taulukolla:

x i
x 1
x2

x k
n i
n 1
n 2

nk

Vastaavasti voidaan esittää suhteellisten taajuuksien pistevariaatiosarja.

Ja:

Esimerkki:

Kirjainten lukumäärä jossain tekstissä X osoittautui 1000:ksi. Ensimmäinen kirjain oli "i", toinen - kirjain "i", kolmas - kirjain "a", neljäs - "u". Sitten tuli kirjaimet "o", "e", "y", "e", "s".

Kirjataan ylös paikat, jotka he vievät aakkosissa, meillä on vastaavasti: 33, 10, 1, 32, 16, 6, 21, 31, 29.

Kun nämä numerot on järjestetty nousevaan järjestykseen, saadaan muunnelmasarja: 1, 6, 10, 16, 21, 29, 31, 32, 33.

Kirjainten esiintymistiheydet tekstissä: "a" - 75, "e" -87, "i" - 75, "o" - 110, "y" - 25, "s" - 8, "e" - 3, "ju" - 7", minä "- 22.

Muodostamme taajuuksien pistevariaatiosarjan:

Esimerkki:

Näytteenottotaajuusjakauma määritetty n = 20.

Tee pistevariaatiosarja suhteellisista taajuuksista.

x i

2

6

12

n i

3

10

7

Ratkaisu:

Etsi suhteelliset taajuudet:


x i

2

6

12

w i

0,15

0,5

0,35

Intervallijakaumaa rakennettaessa on olemassa sääntöjä intervallien lukumäärän tai kunkin intervallin koon valinnasta. Kriteerinä tässä on optimaalinen suhde: intervallien lukumäärän kasvaessa edustavuus paranee, mutta datamäärä ja niiden käsittelyaika kasvavat. Ero x max - x min suurimman ja pienimmän arvon välillä kutsutaan muunnelmaa suuressa mittakaavassa näytteet.

Intervallien lukumäärän laskeminen k Käytä yleensä Sturgessin empiiristä kaavaa (jolloin pyöristetään lähimpään sopivaan kokonaislukuun): k = 1 + 3,322 log n .

Vastaavasti kunkin intervallin arvo h voidaan laskea kaavalla:

5. Empiirinen jakaumafunktio

Harkitse otosta yleisestä populaatiosta. Olkoon kvantitatiivisen attribuutin X frekvenssien tilastollinen jakauma tiedossa. Otetaan käyttöön merkintä: n xon niiden havaintojen määrä, joissa havaittiin x:tä pienempi ominaisarvo; n on havaintojen kokonaismäärä (otoskoko). Suhteellinen tapahtumataajuus X<х равна n x/n . Jos x muuttuu, muuttuu myös suhteellinen taajuus, ts. suhteellinen taajuusn x/non x:n funktio. Koska se löydetään empiirisesti, sitä kutsutaan empiiriseksi.

Empiirinen jakaumafunktio (otosjakaumafunktio) kutsua funktiota, joka määrittää kullekin x:lle tapahtuman X suhteellisen tiheyden<х.


missä vaihtoehtojen määrä on pienempi kuin x,

n - otoskoko.

Toisin kuin otoksen empiirinen jakaumafunktio, kutsutaan perusjoukon jakaumafunktiota F(x). teoreettinen jakelufunktio.

Empiirisen ja teoreettisen jakaumafunktion ero on siinä, että teoreettinen funktio F (x) määrittää tapahtuman X todennäköisyyden F*(x) pyrkii todennäköisyydessään tämän tapahtuman todennäköisyyteen F (x). Eli suurille n F*(x) ja F(x) eroavat vähän toisistaan.

Että. on suositeltavaa käyttää otoksen empiiristä jakaumafunktiota yleisen perusjoukon teoreettisen (integraalin) jakaumafunktion likimääräiseen esitykseen.

F*(x) on kaikki ominaisuudet F(x).

1. Arvot F*(x) kuuluvat väliin.

2. F*(x) on ei-pienenevä funktio.

3. Jos on pienin variantti, niin F*(x) = 0, kohdassa x < x1; jos x k on suurin variantti, niin F*(x) = 1, kun x > x k .

Nuo. F*(x) käytetään estimoimaan F(x).

Jos näyte on annettu variaatiosarjalla, niin empiirisellä funktiolla on muoto:

Empiirisen funktion kuvaajaa kutsutaan kumulatiiviseksi.

Esimerkki:

Piirrä empiirinen funktio annetun näytejakauman päälle.


Ratkaisu:

Otoskoko n = 12 + 18 +30 = 60. Pienin vaihtoehto on 2, ts. klo x < 2. Tapahtuma X<6, (x 1 = 2) наблюдалось 12 раз, т.е. F*(x) = 12/60 = 0,2 klo 2 < x < 6. Tapahtuma X<10, (x 1 =2, x 2 = 6) наблюдалось 12 + 18 = 30 раз, т.е.F*(x)=30/60=0,5 при 6 < x < 10. Koska x=10 on siis suurin vaihtoehto F*(x) = 1 kohdassa x>10. Halutulla empiirisellä funktiolla on muoto:

Kumulaatio:


Kumulaatin avulla on mahdollista ymmärtää graafisesti esitettyä tietoa, esimerkiksi vastata kysymyksiin: ”Määritä havaintojen määrä, joissa ominaisuuden arvo oli alle 6 tai vähintään 6. F*(6) = 0,2 » Silloin niiden havaintojen määrä, joissa havaitun ominaisuuden arvo oli alle 6, on 0,2* n \u003d 0,2 * 60 \u003d 12. Niiden havaintojen määrä, joissa havaitun ominaisuuden arvo oli vähintään 6, on (1-0,2) * n \u003d 0,8 * 60 \u003d 48.

Jos annetaan intervallivaihtelusarja, niin empiirisen jakaumafunktion laatimiseksi etsitään välien keskipisteet ja niistä saadaan empiirinen jakaumafunktio samalla tavalla kuin pistevariaatiosarjasta.

6. Monikulmio ja histogrammi

Selvyyden vuoksi tilastollisesta jakautumisesta rakennetaan erilaisia ​​kaavioita: polynomia ja histogrammeja

Taajuus monikulmio- tämä on katkoviiva, jonka janat yhdistävät pisteitä ( x 1 ;n 1 ), ( x 2 ;n 2 ),…, ( x k ; n k ), missä ovat vaihtoehdot, ovat niitä vastaavat taajuudet.

Suhteellisten taajuuksien monikulmio - tämä on katkoviiva, jonka janat yhdistävät pisteet ( x 1 ;w 1 ), (x 2 ;w 2 ),…, ( x k ;w k ), missä x i ovat valinnat, w i ovat niitä vastaavia suhteellisia taajuuksia.

Esimerkki:

Piirrä suhteellinen taajuuspolynomi annetun näytejakauman päälle:

Ratkaisu:

Jatkuvan ominaisuuden tapauksessa kannattaa rakentaa histogrammi, jolle väli, joka sisältää kaikki piirteen havaitut arvot, jaetaan useisiin h pituisiin osaväleihin ja jokaiselle osavälille löytyy n i. - i. väliin kuuluvien varianttitaajuuksien summa. (Esimerkiksi henkilön pituutta tai painoa mitattaessa kyseessä on jatkuva merkki).

Taajuushistogrammi- tämä on porrastettu kuvio, joka koostuu suorakulmioista, joiden kantat ovat pituudeltaan h osittaisia ​​välejä ja korkeudet ovat yhtä suuret kuin suhde (taajuustiheys).

Neliö i. osittainen suorakulmio on yhtä suuri kuin i:nnen välin muunnelman taajuuksien summa, ts. taajuushistogrammialue on yhtä suuri kuin kaikkien taajuuksien summa, ts. otoskoko.

Esimerkki:

Sähköverkon jännitteen muutoksen tulokset (volteina) esitetään. Laadi variaatiosarja, rakenna monikulmio ja taajuushistogrammi, jos jännitearvot ovat seuraavat: 227, 215, 230, 232, 223, 220, 228, 222, 221, 226, 226, 215, 218, 222 216, 220, 225, 212, 217, 220.

Ratkaisu:

Luodaan sarja muunnelmia. Meillä on n = 20, x min = 212, x max = 232.

Lasketaan intervallien lukumäärä Sturgessin kaavalla.

Taajuuksien intervallivaihtelusarjalla on muoto:


Taajuus Tiheys

212-21 6

0,75

21 6-22 0

0,75

220-224

1,75

224-228

228-232

0,75

Rakennetaan histogrammi taajuuksista:

Muodostetaan monikulmio taajuuksista etsimällä ensin välien keskipisteet:


Suhteellisten taajuuksien histogrammi kutsutaan porrastettua hahmoa, joka koostuu suorakulmioista, joiden kantat ovat pituudeltaan h osittaisia ​​välejä ja korkeudet ovat yhtä suuria kuin suhde w i/h (suhteellinen taajuustiheys).

Neliö i. osittainen suorakulmio on yhtä suuri kuin i:nnelle välille osuneen muunnelman suhteellinen tiheys. Nuo. suhteellisten taajuuksien histogrammin pinta-ala on yhtä suuri kuin kaikkien suhteellisten taajuuksien summa, ts. yksikkö.

7. Variaatiosarjan numeeriset ominaisuudet

Harkitse yleisten ja otospopulaatioiden pääpiirteitä.

Yleinen toissijainen kutsutaan yleisen väestön ominaisuuden arvojen aritmeettiseksi keskiarvoksi.

Eri arvoille x 1 , x 2 , x 3 , …, x n . tilavuuden N yleisen populaation merkki meillä on:

Jos attribuuttiarvoilla on vastaavat taajuudet N 1 +N 2 +…+N k =N , niin


näytteen keskiarvo kutsutaan näytejoukon ominaisuuden arvojen aritmeettiseksi keskiarvoksi.

Jos attribuuttiarvoilla on vastaavat taajuudet n 1 +n 2 +…+n k = n, niin


Esimerkki:

Laske näytteen otoskeskiarvo: x 1 = 51,12; x 2 \u003d 51,07 x 3 = 52,95; x 4 \u003d 52,93, x 5 = 51,1, x 6 = 52,98; x 7 \u003d 52,29; x 8 \u003d 51,23; x 9 \u003d 51,07; x10 = 51,04.

Ratkaisu:

Yleinen varianssi kutsutaan aritmeettiseksi keskiarvoksi yleisen populaation tunnusomaisen X:n arvojen poikkeamien neliöistä yleisestä keskiarvosta.

Tilavuuden N populaation etumerkin eri arvoille x 1 , x 2 , x 3 , …, x N meillä on:

Jos attribuuttiarvoilla on vastaavat taajuudet N 1 +N 2 +…+N k =N , niin

Yleinen keskihajonta (standardi) kutsutaan yleisvarianssin neliöjuureksi

Otosvarianssi kutsutaan aritmeettiseksi keskiarvoksi ominaisuuden havaittujen arvojen poikkeamien neliöistä keskiarvosta.

Tilavuuden n näytepopulaation etumerkin eri arvoille x 1 , x 2 , x 3 , ..., x n meillä on:


Jos attribuuttiarvoilla on vastaavat taajuudet n 1 +n 2 +…+n k = n, niin


Esimerkki keskihajonnasta (vakio) kutsutaan otosvarianssin neliöjuureksi.


Esimerkki:

Näytteenottojoukko on annettu jakelutaulukosta. Etsi otoksen varianssi.


Ratkaisu:

Lause: Varianssi on yhtä suuri kuin piirrearvojen neliöiden keskiarvon ja kokonaiskeskiarvon neliön välinen ero.

Esimerkki:

Etsi tämän jakauman varianssi.



Ratkaisu:

8. Jakaumaparametrien tilastolliset estimaatit

Tutkittakoon yleistä populaatiota jollain otoksella. Tässä tapauksessa on mahdollista saada vain likimääräinen tuntemattoman parametrin Q arvo, joka toimii sen estimaatina. On selvää, että arviot voivat vaihdella otoksesta toiseen.

Tilastollinen arviointiQ* teoreettisen jakauman tuntematonta parametria kutsutaan funktioksi f, joka riippuu näytteen havaituista arvoista. Otoksen tuntemattomien parametrien tilastollisen arvioinnin tehtävänä on rakentaa käytettävissä olevista tilastohavaintojen tiedoista sellainen funktio, joka antaisi näiden parametrien todellisten, tutkijalle tuntemattomien arvojen tarkimmat likimääräiset arvot.

Tilastolliset estimaatit jaetaan pisteisiin ja väliin sen mukaan, miten ne esitetään (luku tai väli).

Pisteestimaatia kutsutaan tilastolliseksi estimaatiksi. yhden parametrin Q *=f (x 1 , x 2 , ..., x n) arvolla määritetyn teoreettisen jakauman parametri Q, jossax 1, x 2, ...,xn- empiiristen havaintojen tulokset tietyn otoksen kvantitatiivisesta attribuutista X.

Tällaiset eri näytteistä saadut parametriestimaatit eroavat useimmiten toisistaan. Absoluuttista eroa /Q *-Q / kutsutaan näytteenottovirhe (estimointi).

Jotta tilastolliset estimaatit antaisivat luotettavia tuloksia arvioiduista parametreista, niiden on oltava puolueettomia, tehokkaita ja johdonmukaisia.

Piste-arvio, jonka matemaattinen odotus on yhtä suuri (ei yhtä suuri) kuin arvioitu parametri, kutsutaan siirtämätön (siirretty). M(Q*)=Q.

Ero M( Q *)-Q kutsutaan harha tai systemaattinen virhe. Puoluettomien arvioiden järjestelmällinen virhe on 0.

tehokas arviointi Q *, jolla tietyllä otoskoolla n on pienin mahdollinen varianssi: D min(n = vakio). Tehokkaalla estimaattorilla on pienin ero verrattuna muihin puolueettomiin ja johdonmukaisiin estimaatteihin.

Varakaskutsutaan sellaiseksi tilastoksi arviointi Q *, joka n:lletaipumus todennäköisyydellä arvioituun parametriin K , eli otoskoon kasvaessa n estimaatti pyrkii todennäköisyydellä parametrin todelliseen arvoon K.

Johdonmukaisuusvaatimus on yhdenmukainen suurten lukujen lain kanssa: mitä enemmän alkutietoa tutkittavasta kohteesta, sitä tarkempi tulos. Jos otoskoko on pieni, parametrin pisteestimaatti voi johtaa vakaviin virheisiin.

Minkä tahansa näyte (tilavuusn) voidaan ajatella tilatuksi setiksix 1, x 2, ...,xn riippumattomia identtisesti jakautuneita satunnaismuuttujia.

Näytteenottovälineet eri tilavuusnäytteille n samasta populaatiosta on erilainen. Otoskeskiarvoa voidaan siis pitää satunnaismuuttujana, jolloin voidaan puhua otoskeskiarvon jakaumasta ja sen numeerisista ominaisuuksista.

Otoskeskiarvo täyttää kaikki tilastollisille arvioille asetetut vaatimukset, ts. antaa puolueettoman, tehokkaan ja johdonmukaisen arvion väestön keskiarvosta.

Se voidaan todistaa. Näin ollen otosvarianssi on yleisen varianssin puolueellinen arvio, joka antaa sille aliarvioidyn arvon. Eli pienellä otoskoolla se antaa systemaattisen virheen. Puolueettoman ja johdonmukaisen arvion saamiseksi riittää, että otetaan määrä, jota kutsutaan korjatuksi varianssiksi. eli

Käytännössä yleisvarianssin arvioimiseen käytetään korjattua varianssia, kun n < 30. Muissa tapauksissa ( n >30) poikkeama tuskin havaittavissa. Siksi suurille arvoille n bias virhe voidaan jättää huomiotta.

Voidaan myös todistaa, että suhteellinen taajuusn i / n on puolueeton ja johdonmukainen todennäköisyysestimaatti P(X=x i ). Empiirinen jakaumafunktio F*(x ) on puolueeton ja johdonmukainen estimaatti teoreettisesta jakaumafunktiosta F(x)=P(X< x ).

Esimerkki:

Etsi otostaulukosta keskiarvon ja varianssin puolueettomat arviot.

x i
n i

Ratkaisu:

Näytteen koko n=20.

Matemaattisen odotuksen puolueeton arvio on otoksen keskiarvo.


Varianssin puolueettoman arvion laskemiseksi etsitään ensin otosvarianssi:

Etsitään nyt puolueeton arvio:

9. Jakaumaparametrien intervalliarviot

Intervalli on tilastollinen arvio, joka määräytyy kahdella numeerisella arvolla - tutkittavan välin päillä.

Määrä> 0, missä | Q - Q*|< , kuvaa intervalliestimaatin tarkkuutta.

Luotettunimeltään intervalli , joka tietyllä todennäköisyydelläkattaa tuntemattoman parametrin arvon K . Luottamusvälin täydentäminen kaikkien mahdollisten parametriarvojen joukkoon K nimeltään kriittinen alue. Jos kriittinen alue sijaitsee vain toisella puolella luottamusväliä, niin luottamusväliä kutsutaan yksipuolinen: vasen puoli, jos kriittinen alue on vain vasemmalla, ja oikeakätinen ellei oikealla. Muussa tapauksessa luottamusväliä kutsutaan kahdenvälinen.

Luotettavuus tai luottamustaso, Q-arviot (käyttäen Q *) nimeä todennäköisyys, jolla seuraava epäyhtälö toteutuu: | Q - Q*|< .

Useimmiten luottamustodennäköisyys asetetaan etukäteen (0,95; 0,99; 0,999) ja sille asetetaan vaatimus olla lähellä yhtä.

Todennäköisyysnimeltään virheen todennäköisyys tai merkitystaso.

Anna | Q - Q*|< , sitten. Tämä tarkoittaa, että todennäköisyydellävoidaan väittää, että parametrin todellinen arvo K kuuluu väliin. Mitä pienempi poikkeama, sitä tarkempi arvio.

Luottamusvälin rajoja (päät) kutsutaan luottamusrajoja tai kriittisiä rajoja.

Luottamusvälin rajojen arvot riippuvat parametrin jakautumislaista Q*.

Poikkeaman arvopuolet luottamusvälin leveydestä kutsutaan arvioinnin tarkkuus.

Menetelmät luottamusvälien muodostamiseksi kehitti ensimmäisenä amerikkalainen tilastotieteilijä Y. Neumann. Arvioinnin tarkkuus, luottamustodennäköisyys ja näytteen koko n toisiinsa. Siksi, kun tiedät kahden määrän erityiset arvot, voit aina laskea kolmannen.

Luottamusvälin löytäminen normaalijakauman matemaattisen odotuksen arvioimiseksi, jos keskihajonta tunnetaan.

Otetaan näyte yleisestä perusjoukosta normaalijakauman lain alaisena. Olkoon yleinen keskihajonta tiedossa, mutta teoreettisen jakauman matemaattista odotusta ei tunneta a ().

Seuraava kaava on voimassa:

Nuo. määritellyn poikkeamaarvon mukaanvoidaan selvittää, millä todennäköisyydellä tuntematon yleinen keskiarvo kuuluu väliin. Ja päinvastoin. Kaavasta voidaan nähdä, että otoskoon kasvaessa ja luottamustodennäköisyyden kiinteällä arvolla arvo- pienenee, ts. arvion tarkkuus kasvaa. Kun luotettavuus (luottamuksen todennäköisyys) kasvaa, arvo- kasvaa, ts. arvion tarkkuus heikkenee.

Esimerkki:

Testien tuloksena saatiin seuraavat arvot -25, 34, -20, 10, 21. Niiden tiedetään noudattavan normaalijakauman lakia keskihajonnan ollessa 2. Etsi arvio a * matemaattinen odotus a. Piirrä sille 90 %:n luottamusväli.

Ratkaisu:

Etsitään puolueeton arvio

Sitten


A:n luottamusväli on muotoa: 4 - 1,47< a< 4+ 1,47 или 2,53 < a < 5, 47

Luottamusvälin löytäminen normaalijakauman matemaattisen odotuksen arvioimiseksi, jos keskihajontaa ei tunneta.

Tiedoksi, että yleinen populaatio on normaalijakauman lain alainen, jossa a ja. Luottamusvälin kattamisen tarkkuus ja luotettavuusparametrin a todellinen arvo lasketaan tässä tapauksessa kaavalla:

, missä n on näytteen koko, , - Studentin kerroin (se tulee löytää annetuista arvoista n ja taulukosta "Studion jakauman kriittiset kohdat").

Esimerkki:

Testien tuloksena saatiin seuraavat arvot -35, -32, -26, -35, -30, -17. Tiedetään, että ne noudattavat normaalijakauman lakia. Etsi perusjoukon keskiarvon a luottamusväli luottamustasolla 0,9.

Ratkaisu:

Etsitään puolueeton arvio.

Etsitään.

Sitten

Luottamusväli saa muodon(-29,2 - 5,62; -29,2 + 5,62) tai (-34,82; -23,58).

Normaalijakauman varianssin ja keskihajonnan luottamusvälin löytäminen

Otetaan tilavuuden satunnainen näyte jostakin yleisestä arvojoukosta, joka on jaettu normaalin lain mukaann < 30, jolle otosvarianssit lasketaan: puolueellinenja korjattu s 2. Sitten löytää intervalliarviot tietyllä luotettavuudellayleistä hajoamista vartenDyleinen standardipoikkeamakäytetään seuraavia kaavoja.


tai,

Arvot- löytää kriittisten pisteiden arvotaulukon avullaPearson-jakelut.

Varianssin luottamusväli saadaan näistä epäyhtälöistä neliöimällä kaikki epäyhtälön osat.

Esimerkki:

15 pultin laatu tarkastettiin. Olettaen, että niiden valmistuksen virhe on normaalijakauman lain ja näytteen keskihajonnan alainenyhtä suuri kuin 5 mm, määritä luotettavastituntemattoman parametrin luottamusväli

Esitämme intervallin rajat kaksois-epäyhtälönä:

Varianssin kaksipuolisen luottamusvälin päät voidaan määrittää suorittamatta aritmeettisia operaatioita tietylle luottamustasolle ja otoskoon vastaavan taulukon avulla (Varianssin luottamusvälien rajat vapausasteiden ja luotettavuuden mukaan ). Tätä varten taulukosta saadun intervallin päät kerrotaan korjatulla varianssilla s 2.

Esimerkki:

Ratkaistaan ​​edellinen ongelma eri tavalla.

Ratkaisu:

Etsitään korjattu varianssi:

Taulukon "Varianssin luottamusvälien rajat vapaus- ja luotettavuusasteiden lukumäärästä riippuen" mukaan saadaan varianssin luottamusvälin rajat klo.k= 14 ja: alaraja 0,513 ja yläraja 2,354.

Kerro saadut rajat luvullas 2 ja poimi juuri (koska emme tarvitse luottamusväliä varianssille, vaan keskihajonnalle).

Kuten esimerkeistä voidaan nähdä, luottamusvälin arvo riippuu sen konstruointimenetelmästä ja antaa läheisiä, mutta erilaisia ​​tuloksia.

Riittävän suurikokoisille näytteille (n>30) yleisen keskihajonnan luottamusvälin rajat voidaan määrittää kaavalla: - jokin numero, joka on taulukoitu ja annettu vastaavassa viitetaulukossa.

Jos 1- q<1, то формула имеет вид:

Esimerkki:

Ratkaistaan ​​edellinen ongelma kolmannella tavalla.

Ratkaisu:

Aiemmin löydettys= 5,17. q(0,95; 15) = 0,46 - löydämme taulukon mukaan.

Sitten: