Arviot matemaattiselle odotukselle ja varianssille. Otoksen matemaattisen odotuksen ja varianssin estimointi

Olkoon satunnaismuuttuja X matemaattisilla odotuksilla m ja dispersio D, kun taas molemmat parametrit ovat tuntemattomia. Yli suuruusluokkaa X tuotettu N riippumattomia kokeita, jotka johtivat joukkoon N numeerisia tuloksia x 1 , x 2 , …, x N. Matemaattisen odotuksen estimaattina on luonnollista ehdottaa havaittujen arvojen aritmeettista keskiarvoa

(1)

Täällä kuin x i tuloksena saadut tietyt arvot (luvut). N kokeiluja. Jos otamme muut (riippumatta edellisistä) N kokeita, niin tietysti saamme erilaisen arvon. Jos otat enemmän N kokeiluja, saamme vielä yhden uuden arvon . Merkitse X i tuloksena oleva satunnaismuuttuja i kokeilu, sitten oivallukset X i ovat näiden kokeiden tuloksena saadut numerot. On selvää, että satunnaismuuttuja X i on sama todennäköisyysjakauman tiheys kuin alkuperäisellä satunnaismuuttujalla X. Oletetaan myös, että satunnaismuuttujat X i ja Xj ovat itsenäisiä klo i, ei tasavertainen j(eri riippumattomia kokeita toisiinsa nähden). Siksi kirjoitamme kaavan (1) uudelleen eri (tilastolliseen) muotoon:

(2)

Osoitetaan, että arvio on puolueeton:

Näin ollen otoksen keskiarvon matemaattinen odotus on yhtä suuri kuin satunnaismuuttujan todellinen matemaattinen odotus m. Tämä on melko ennustettava ja ymmärrettävä tosiasia. Siksi otoskeskiarvoa (2) voidaan pitää estimaattina satunnaismuuttujan matemaattisesta odotuksesta. Nyt herää kysymys: mitä tapahtuu odotusestimaatin varianssille kokeiden määrän kasvaessa? Analyyttiset laskelmat osoittavat sen

missä on matemaattisen odotuksen estimaatin varianssi (2), ja D- satunnaismuuttujan todellinen varianssi X.

Yllä olevasta seuraa, että kasvaessa N(kokeiden määrä) estimaatin varianssi pienenee, ts. mitä enemmän teemme yhteenvedon itsenäisistä toteutuksista, sitä lähemmäksi odotettua arvoa saamme arvion.


Matemaattiset varianssiarviot

Ensi silmäyksellä näyttää luonnollisimmalta arviolta

(3)

jossa lasketaan kaavalla (2). Tarkastetaan, onko arvio puolueeton. Kaava (3) voidaan kirjoittaa seuraavasti:

Korvaamme lausekkeen (2) tähän kaavaan:

Etsitään varianssiestimaatin matemaattinen odotus:

(4)

Koska satunnaismuuttujan varianssi ei riipu siitä, mikä on satunnaismuuttujan matemaattinen odotus, otetaan matemaattinen odotus yhtä suureksi kuin 0, ts. m = 0.

(5)
osoitteessa .(6)

Tarve arvioida matemaattinen odotus koetulosten perusteella ilmenee ongelmissa, joissa kokeen tulosta kuvataan satunnaismuuttujan avulla ja tutkittavan kohteen laatuindikaattoriksi oletetaan olevan tämän satunnaismuuttujan matemaattinen odotus. Luotettavuuden indikaattorina voidaan ottaa esimerkiksi matemaattinen odotus järjestelmän käyttöajasta ja tuotannon tehokkuutta arvioitaessa matemaattinen odotus hyvien tuotteiden määrästä jne.

Matemaattisen odotuksen arvioinnin ongelma on muotoiltu seuraavasti. Oletetaan, että satunnaismuuttujan X tuntemattoman arvon määrittämiseksi sen oletetaan suorittavan n itsenäistä ja järjestelmällisistä virheistä vapaita mittauksia X v X 2 ,..., X s. On valittava paras arvio matemaattisesta odotuksesta.

Käytännössä paras ja yleisin arvio matemaattisesta odotuksesta on testitulosten aritmeettinen keskiarvo

kutsutaan myös tilastollinen tai näytteen keskiarvo.

Osoittakaamme, että arvio t x täyttää kaikki vaatimukset minkä tahansa parametrin arvioimiseksi.

1. Lausekkeesta (5.10) seuraa, että

eli pisteet t "x- puolueeton arvio.

2. Tšebyševin lauseen mukaan testitulosten aritmeettinen keskiarvo konvergoi todennäköisyydessään matemaattiseen odotukseen, ts.

Näin ollen arvio (5.10) on johdonmukainen arvio odotuksesta.

3. Arvioinnin varianssi t x, yhtä suuri

Kun otoskoko kasvaa, n pienenee loputtomasti. On todistettu, että jos satunnaismuuttuja X on normaalijakauman lain alainen, niin millä tahansa P varianssi (5.11) on pienin mahdollinen ja estimaatti t x- tehokas matemaattisen odotuksen estimointi. Arvion varianssin tunteminen mahdollistaa arvion matemaattisen odotuksen tuntemattoman arvon määrittämisen tarkkuudesta tätä estimaatia käyttämällä.

Matemaattisen odotuksen estimaattina käytetään aritmeettista keskiarvoa, jos mittaustulokset ovat yhtä tarkkoja (varianssit D, i = 1, 2, ..., P ovat samat kaikissa ulottuvuuksissa). Käytännössä joutuu kuitenkin käsittelemään tehtäviä, joissa mittaustulokset eivät ole samanarvoisia (esimerkiksi testauksen aikana mittaukset tehdään eri laitteilla). Tässä tapauksessa matemaattisen odotuksen arviolla on muoto

missä on i:nnen mittauksen paino.

Kaavassa (5.12) jokaisen mittauksen tulos on mukana omalla painollaan FROM.. Siksi mittaustulosten arviointi t x nimeltään painotettu keskiarvo.

Voidaan osoittaa, että estimaatti (5.12) on puolueeton, johdonmukainen ja tehokas arvio odotuksesta. Arvion pienin varianssi saadaan kaavalla


Tietokonemalleilla suoritettaessa kokeita syntyy samanlaisia ​​ongelmia, kun useiden testisarjojen tuloksista löydetään estimaatteja ja testien lukumäärä kussakin sarjassa on erilainen. Esimerkiksi tilavuudella suoritettiin kaksi testisarjaa p 1 ja n 2 , joiden tulosten mukaan estimaatit t xi ja t x _. Matemaattisen odotuksen määrittämisen tarkkuuden ja luotettavuuden parantamiseksi näiden testisarjojen tulokset yhdistetään. Käytä tätä varten lauseketta (5.12)

Laskettaessa kertoimia C varianssien D sijasta niiden kunkin sarjan testituloksista saadut estimaatit korvataan.

Samanlaista lähestymistapaa käytetään myös satunnaisen tapahtuman todennäköisyyden määrittämisessä testisarjan tulosten perusteella.

Satunnaismuuttujan X matemaattisen odotuksen arvioimiseen voidaan käyttää otoskeskiarvon lisäksi muita tilastoja. Useimmiten näihin tarkoituksiin käytetään variaatiosarjan jäseniä eli tilaustilastoja, joiden perusteella estimaatit rakennetaan,

jotka täyttävät tärkeimmät vaatimukset, nimittäin johdonmukaisuuden ja puolueettomuuden.

Oletetaan, että muunnelmasarja sisältää n = 2k jäsenet. Sitten mitä tahansa keskiarvoista voidaan pitää arviona matemaattisesta odotuksesta:

Jossa to-e keskiverto

ei ole muuta kuin satunnaismuuttujan X jakauman tilastollinen mediaani, koska ilmeinen yhtäläisyys tapahtuu

Tilastollisen mediaanin etuna on, että se on vapaa poikkeavien havaintotulosten vaikutuksesta, mikä on väistämätöntä käytettäessä ensimmäistä keskiarvoa eli pienimmän ja suurimman variaatiosarjojen keskiarvoa.

Pariton näytekoko P = 2k- 1 tilastollinen mediaani on sen keskielementti, ts. to-variaatiosarjan jäsen Minä = x k.

On jakaumia, joiden aritmeettinen keskiarvo ei ole tehokas estimaatti matemaattiselle odotukselle, esimerkiksi Laplacen jakauma. Voidaan osoittaa, että Laplacen jakauman tehollinen estimaatti keskiarvosta on otosmediaani.

On todistettu, että jos satunnaismuuttujalla X on normaalijakauma, niin riittävän suurella otoskoolla tilastollisen mediaanin jakautumislaki on lähellä normaalia numeerisilla ominaisuuksilla

Kaavojen (5.11) ja (5.14) vertailusta seuraa, että tilastollisen mediaanin hajonta on 1,57 kertaa suurempi kuin aritmeettisen keskiarvon dispersio. Siksi aritmeettinen keskiarvo matemaattisen odotuksen arviona on yhtä paljon tehokkaampi kuin tilastollinen mediaani. Kuitenkin johtuen laskennan yksinkertaisuudesta, epäherkkyydestä poikkeaville mittaustuloksille (näytteen "kontaminaatio"), käytännössä tilastollista mediaania käytetään kuitenkin matemaattisen odotuksen estimaatina.

On huomattava, että jatkuvilla symmetrisillä jakaumilla keskiarvo ja mediaani ovat samat. Siksi tilastollinen mediaani voi toimia hyvänä estimaatina matemaattiselle odotukselle vain satunnaismuuttujan symmetriselle jakautumiselle.

Vinoille jakaumille tilastollinen mediaani Minä sillä on merkittävä harha suhteessa matemaattiseen odotukseen, joten se ei sovellu sen estimointiin.

Olkoon satunnaismuuttuja X matemaattisilla odotuksilla m ja dispersio D, kun taas molemmat parametrit ovat tuntemattomia. Yli suuruusluokkaa X tuotettu N riippumattomia kokeita, jotka johtivat joukkoon N numeerisia tuloksia x 1 , x 2 , …, x N. Matemaattisen odotuksen estimaattina on luonnollista ehdottaa havaittujen arvojen aritmeettista keskiarvoa

(1)

Täällä kuin x i tuloksena saadut tietyt arvot (luvut). N kokeiluja. Jos otamme muut (riippumatta edellisistä) N kokeita, niin tietysti saamme erilaisen arvon. Jos otat enemmän N kokeiluja, saamme vielä yhden uuden arvon . Merkitse X i tuloksena oleva satunnaismuuttuja i kokeilu, sitten oivallukset X i ovat näiden kokeiden tuloksena saadut numerot. On selvää, että satunnaismuuttuja X i on sama todennäköisyysjakauman tiheys kuin alkuperäisellä satunnaismuuttujalla X. Oletetaan myös, että satunnaismuuttujat X i ja Xj ovat itsenäisiä klo i, ei tasavertainen j(eri riippumattomia kokeita toisiinsa nähden). Siksi kirjoitamme kaavan (1) uudelleen eri (tilastolliseen) muotoon:

(2)

Osoitetaan, että arvio on puolueeton:

Näin ollen otoksen keskiarvon matemaattinen odotus on yhtä suuri kuin satunnaismuuttujan todellinen matemaattinen odotus m. Tämä on melko ennustettava ja ymmärrettävä tosiasia. Siksi otoskeskiarvoa (2) voidaan pitää estimaattina satunnaismuuttujan matemaattisesta odotuksesta. Nyt herää kysymys: mitä tapahtuu odotusestimaatin varianssille kokeiden määrän kasvaessa? Analyyttiset laskelmat osoittavat sen

missä on matemaattisen odotuksen estimaatin varianssi (2), ja D- satunnaismuuttujan todellinen varianssi X.

Yllä olevasta seuraa, että kasvaessa N(kokeiden määrä) estimaatin varianssi pienenee, ts. mitä enemmän teemme yhteenvedon itsenäisistä toteutuksista, sitä lähemmäksi odotettua arvoa saamme arvion.


Matemaattiset varianssiarviot

Ensi silmäyksellä näyttää luonnollisimmalta arviolta

(3)

jossa lasketaan kaavalla (2). Tarkastetaan, onko arvio puolueeton. Kaava (3) voidaan kirjoittaa seuraavasti:

Korvaamme lausekkeen (2) tähän kaavaan:

Etsitään varianssiestimaatin matemaattinen odotus:

(4)

Koska satunnaismuuttujan varianssi ei riipu siitä, mikä on satunnaismuuttujan matemaattinen odotus, otetaan matemaattinen odotus yhtä suureksi kuin 0, ts. m = 0.

(5)
osoitteessa .(6)

Altistetaan satunnaismuuttuja, jolla on tuntematon matemaattinen odotus ja varianssi, riippumattomia kokeita, jotka tuottivat tuloksia - . Lasketaan johdonmukaiset ja puolueettomat arviot parametreille ja .

Matemaattisen odotuksen arvioksi otamme kokeellisten arvojen aritmeettisen keskiarvon

. (2.9.1)

Suurten lukujen lain mukaan tämä arvio on varakas , jonka suuruus on todennäköisyys. Sama arvio on puolueeton , koska

. (2.9.2)

Tämän arvion varianssi on

. (2.9.3)

Voidaan osoittaa, että normaalijakaumassa tämä arvio on tehokas . Muiden lakien kohdalla näin ei ehkä ole.

Arvioidaan nyt varianssi. Valitaan ensin estimointikaava tilastollinen hajonta

. (2.9.4)

Tarkastetaan varianssiestimaatin johdonmukaisuus. Avataan kaavan (2.9.4) sulut.

.

Sillä ensimmäinen termi konvergoi todennäköisyydessään määrään , toisessa - . Siten arviomme konvergoi todennäköisyydessään varianssiin

,

siksi hän on varakas .

Tarkistetaan puolueettomuus arviot määrästä. Tätä varten korvaamme lausekkeen (2.9.1) kaavalla (2.9.4) ja otamme huomioon, että satunnaismuuttujat riippumaton

,

. (2.9.5)

Siirrytään kaavassa (2.9.5) satunnaismuuttujien vaihteluihin

Laajentamalla sulkuja saamme

,

. (2.9.6)

Lasketaan arvon (2.9.6) matemaattinen odotus ottamalla se huomioon

. (2.9.7)

Relaatio (2.9.7) osoittaa, että kaavalla (2.9.4) laskettu arvo ei ole puolueeton estimaattori dispersiota varten. Sen matemaattinen odotus ei ole sama, mutta hieman pienempi. Tällainen arvio johtaa alaspäin suuntautuvaan systemaattiseen virheeseen. Tällaisen harhan poistamiseksi on tarpeen ottaa käyttöön korjaus kertomalla arvoa ei. Tällöin tällainen korjattu tilastollinen varianssi voi toimia varianssin puolueettomana estimaatina

. (2.9.8)

Tämä arvio on yhtä johdonmukainen kuin arvio, koska .

Käytännössä estimaatin (2.9.8) sijasta on joskus kätevämpää käyttää vastaavaa estimaattia, joka liittyy toiseen alkutilastolliseen hetkeen

. (2.9.9)

Arviot (2.9.8), (2.9.9) eivät ole tehokkaita. Voidaan osoittaa, että normaalijakauman tapauksessa ne ovat asymptoottisesti tehokas (kun pyrkii pienimpään mahdolliseen arvoon).

Siten on mahdollista muotoilla seuraavat säännöt rajoitetun tilastoaineiston käsittelyyn. Jos riippumattomissa kokeissa satunnaismuuttuja ottaa arvot tuntemattomilla matemaattisilla odotuksilla ja varianssilla , näiden parametrien määrittämiseen tulee käyttää likimääräisiä arvioita

(2.9.10)

Työ loppu -

Tämä aihe kuuluu:

Luentomuistiinpanot matematiikan todennäköisyysteoria matemaattisista tilastoista

Korkeamman matematiikan ja informatiikan laitos.. luentomuistiinpanot.. matematiikassa..

Jos tarvitset lisämateriaalia tästä aiheesta tai et löytänyt etsimääsi, suosittelemme käyttämään hakua teostietokannassamme:

Mitä teemme saadulla materiaalilla:

Jos tämä materiaali osoittautui hyödylliseksi sinulle, voit tallentaa sen sivullesi sosiaalisissa verkostoissa:

Kaikki tämän osion aiheet:

Todennäköisyysteoria
Todennäköisyysteoria on matematiikan haara, joka tutkii satunnaisten massailmiöiden kuvioita. Satunnainen on ilmiö, joka

Todennäköisyyden tilastollinen määritelmä
Tapahtuma on satunnainen ilmiö, joka kokemuksen seurauksena voi ilmaantua tai ei (kaksiarvoinen ilmiö). Merkitse tapahtumat isoilla latinalaisilla kirjaimilla

Perustapahtumien tila
Asioitakoon joukko tapahtumia johonkin kokemukseen ja: 1) kokemuksen seurauksena yksi ja ainoa

Toimenpiteet tapahtumissa
Kahden tapahtuman summa ja

Permutaatiot
Elementtien eri permutaatioiden lukumäärä on merkitty

Majoitukset
Elementtien sijoittaminen mukaan

Yhdistelmät
Elementtien yhdistelmä

Kaava yhteensopimattomien tapahtumien todennäköisyyksien lisäämiseksi
Lause. Kahden yhteensopimattoman tapahtuman summan todennäköisyys on yhtä suuri kuin näiden tapahtumien todennäköisyyksien summa. (yksi

Todennäköisyyslisäyskaava mielivaltaisille tapahtumille
Lause. Kahden tapahtuman summan todennäköisyys on yhtä suuri kuin näiden tapahtumien todennäköisyyksien summa ilman niiden tulon todennäköisyyttä.

Todennäköisyyden kertolaskukaava
Annetaan kaksi tapahtumaa. Harkitse tapahtumaa

Kokonaistodennäköisyyskaava
Antaa olla täydellinen ryhmä yhteensopimattomia tapahtumia, niitä kutsutaan hypoteesiksi. Harkitse jotain tapahtumaa

Hypoteesien todennäköisyyksien kaava (Bayes)
Harkitse uudelleen - yhteensopimattomien hypoteesien ja tapahtuman täydellinen ryhmä

Asymptoottinen Poisson-kaava
Tapauksissa, joissa kokeiden määrä on suuri ja tapahtuman todennäköisyys

Satunnaiset diskreetit muuttujat
Satunnainen arvo on suure, joka voi koetta toistettaessa saada eriarvoisia numeerisia arvoja. Satunnaismuuttujaa kutsutaan diskreetiksi,

Satunnaiset jatkuvat muuttujat
Jos satunnaismuuttuja voi kokeen tuloksena saada minkä tahansa arvon tietystä segmentistä tai koko reaaliakselilta, sitä kutsutaan jatkuvaksi. laki

Jatkuvan satunnaismuuttujan todennäköisyystiheysfunktio
Päästää. Harkitse pistettä ja lisää sitä

Satunnaismuuttujien numeeriset ominaisuudet
Satunnaiset diskreetit tai jatkuvat muuttujat katsotaan täysin määritellyiksi, jos niiden jakautumislait tunnetaan. Jakautumislait tuntemalla voi aina laskea osumisen todennäköisyyden

Satunnaismuuttujien kvantiilit
Jatkuvan satunnaismuuttujan kertaluvun kvantiili

Satunnaismuuttujien matemaattinen odotus
Satunnaismuuttujan matemaattinen odotus luonnehtii sen keskiarvoa. Kaikki satunnaismuuttujan arvot on ryhmitelty tämän arvon ympärille. Tarkastellaan ensin satunnaista diskreettimuuttujaa

Satunnaismuuttujien keskihajonta ja varianssi
Tarkastellaan ensin satunnaista diskreettimuuttujaa. Moodin numeeriset ominaisuudet, mediaani, kvantiilit ja matemaattinen odotus

Satunnaismuuttujien hetket
Matemaattisen odotuksen ja varianssin lisäksi todennäköisyysteoriassa käytetään korkeampien kertalukujen numeerisia ominaisuuksia, joita kutsutaan satunnaismuuttujien momenteiksi.

Lauseet satunnaismuuttujien numeerisista ominaisuuksista
Lause 1. Ei-satunnaisen muuttujan matemaattinen odotus on yhtä suuri kuin tämä arvo itse. Todiste: Anna

Binomijakauman laki

Poissonin leviämislaki
Olkoon arvot saava satunnaisdiskreetti muuttuja

Yhtenäinen jakelulaki
Jatkuvan satunnaismuuttujan yhtenäinen jakautumislaki on todennäköisyystiheysfunktion laki, joka

Normaali jakelulaki
Jatkuvan satunnaismuuttujan normaalijakauman laki on tiheysfunktion laki

Eksponenttijakauman laki
Satunnaismuuttujan eksponentiaalista tai eksponentiaalista jakaumaa käytetään sellaisissa todennäköisyysteorian sovelluksissa kuin jonoteoria, luotettavuusteoria

Satunnaismuuttujien järjestelmät
Käytännössä todennäköisyysteorian sovelluksissa joutuu usein käsittelemään ongelmia, joissa kokeen tuloksia kuvataan ei yhdellä satunnaismuuttujalla, vaan usealla satunnaismuuttujalla kerralla.

Kahden satunnaisdiskreetin muuttujan järjestelmä
Muodostakoon kaksi satunnaisdiskreettimuuttujaa järjestelmä. Satunnainen arvo

Kahden jatkuvan satunnaismuuttujan järjestelmä
Muodostetaan nyt järjestelmä kahdesta jatkuvasta satunnaismuuttujasta. Tämän järjestelmän jakautumislakia kutsutaan luultavasti

Jakauman ehdolliset lait
Olkoon ja riippuvaiset satunnaiset jatkuvat muuttujat

Kahden satunnaismuuttujan järjestelmän numeeriset ominaisuudet
Satunnaismuuttujien järjestyksen alkuhetki

Useiden satunnaismuuttujien järjestelmä
Kahden satunnaismuuttujan järjestelmälle saadut tulokset voidaan yleistää järjestelmiin, jotka koostuvat mielivaltaisesta määrästä satunnaismuuttujia. Muodostakoon järjestelmä joukon avulla

Kahden satunnaismuuttujan järjestelmän normaalijakauma
Tarkastellaan kahden satunnaisen jatkuvan muuttujan järjestelmää. Tämän järjestelmän jakautumislaki on normaalijakauman laki

Todennäköisyysteorian rajalauseet
Todennäköisyysteorian tieteenalan päätavoitteena on tutkia satunnaisten massailmiöiden kuvioita. Käytäntö osoittaa, että homogeenisten satunnaisten ilmiöiden massan havainnointi paljastaa

Chebyshevin epätasa-arvo
Harkitse satunnaismuuttujaa matemaattisella odotuksella

Tšebyshevin lause
Jos satunnaismuuttujat ovat pareittain riippumattomia ja niillä on rajalliset varianssit populaatioon

Bernoullin lause
Kun kokeiden lukumäärä kasvaa rajattomasti, tapahtuman esiintymistiheys konvergoi todennäköisyydessään tapahtuman todennäköisyyteen

Keskirajalause
Kun lisätään satunnaismuuttujia millä tahansa jakautumislailla, mutta joiden varianssit ovat rajoitettuja aggregaatissa, jakautumislaki

Matemaattisen tilastotieteen päätehtävät
Edellä käsitellyt todennäköisyysteorian lait ovat matemaattinen ilmaus todellisista kuvioista, jotka todella ovat olemassa erilaisissa satunnaisissa massailmiöissä. opiskelu

Yksinkertainen tilasto. Tilastollinen jakautumisfunktio
Tarkastellaan satunnaismuuttujaa, jonka jakautumislakia ei tunneta. Vaaditaan kokemuksen perusteella

Tilastollinen rivi. pylväsdiagrammi
Suuren havainnointimäärän (satojen luokkaa) ansiosta väestön tilastoaineiston tallentaminen on hankalaa ja hankalaa. Selkeyden ja tiiviyden vuoksi tilastollinen materiaali

Tilastollisen jakauman numeeriset ominaisuudet
Todennäköisyysteoriassa tarkasteltiin satunnaismuuttujien erilaisia ​​numeerisia ominaisuuksia: matemaattista odotusta, dispersiota, eri kertaluvun alku- ja keskusmomentteja. Samanlaisia ​​lukuja

Teoreettisen jakauman valinta momenttimenetelmällä
Kaikissa tilastollisissa jakaumissa havaintojen rajalliseen määrään liittyy väistämättä satunnaisuuden elementtejä. Suurella määrällä havaintoja nämä satunnaisuuden elementit tasoittuvat,

Jakaumalain muotoa koskevan hypoteesin uskottavuuden testaus
Olkoon annettu tilastollinen jakauma approksimoitu jollain teoreettisella käyrällä tai

Suostumuskriteerit
Harkitse yhtä yleisimmin käytetyistä sopivuustesteistä, niin kutsuttua Pearson-testiä. Olettaa

Piste-estimaatit tuntemattomille jakaumaparametreille
Vuonna p.p. 2.1. - 2.7 olemme tarkastelleet yksityiskohtaisesti tapoja ratkaista matemaattisten tilastojen ensimmäinen ja toinen pääongelma. Nämä ovat tehtäviä määrittää satunnaismuuttujien jakautumislakeja kokeellisten tietojen perusteella

Luottamusväli. Luottamuksen todennäköisyys
Käytännössä pienellä määrällä satunnaismuuttujakokeita, tuntemattoman parametrin likimääräinen korvaaminen

Olkoon satunnaismuuttuja X, ja sen parametrit ovat matemaattinen odotus a ja varianssi ovat tuntemattomia. X:n arvon yli suoritettiin riippumattomia kokeita, jotka antoivat tulokset x 1, x 2, x n.

Väittämättä päättelyn yleisyyttä, pidämme näitä satunnaismuuttujan arvoja erilaisina. Käsittelemme arvoja x 1, x 2, x n itsenäisinä, identtisesti jakautuneina satunnaismuuttujina X 1, X 2, X n .

Yksinkertaisin tilastollinen estimointimenetelmä - substituutio- ja analogiamenetelmä - koostuu siitä, että ne ottavat estimaattina jonkin yleisen perusjoukon numeerisen ominaisuuden (keskiarvon, varianssin jne.) vastaavan otosjakauman ominaisuuden. - näytteen ominaisuus.

Korvausmenetelmällä matemaattisen odotuksen estimaatin a on tarpeen ottaa otoksen jakauman matemaattinen odotus - otoksen keskiarvo. Siten saamme

Otoskeskiarvojen puolueettomuuden ja johdonmukaisuuden testaamiseksi estimaateina a, harkitse tätä tilastoa valitun vektorin (X 1, X 2, X n) funktiona. Ottaen huomioon, että jokaisella suurella X 1, X 2, X n on sama jakautumislaki kuin suurella X, päätämme, että näiden suureiden ja suuren X numeeriset ominaisuudet ovat samat: M(X i) = M(X) = a, D(X i) = D(X) = , i = 1, 2, n , jossa X i ovat kollektiivisesti riippumattomia satunnaismuuttujia.

Näin ollen

Siten määritelmän mukaan saamme, että se on puolueeton arvio a, ja koska D()®0 on n®¥, niin edellisen kappaleen lauseen perusteella on johdonmukainen arvio odotuksista a yleinen väestö.

Arvion tehokkuus tai tehottomuus riippuu satunnaismuuttujan X jakautumislain muodosta. Voidaan osoittaa, että jos arvo X jakautuu normaalin lain mukaan, niin estimaatti on tehokas. Muiden jakelulakien kohdalla näin ei ehkä ole.

Yleisvarianssin puolueeton arvio on korjattu otosvarianssi

,

Koska , missä on yleinen varianssi. Todella,

Yleisen varianssin arvio s -- 2 on myös johdonmukainen, mutta ei tehokas. Normaalijakauman tapauksessa se on kuitenkin "asymptoottisesti tehokas", eli n:n kasvaessa sen varianssin suhde pienimpään mahdolliseen lähestyy loputtomasti.

Joten annetaan näyte jakaumasta F( x) satunnaismuuttuja X tuntemattomalla matemaattisella odotuksella a ja dispersio , sitten näiden parametrien arvojen laskemiseen meillä on oikeus käyttää seuraavia likimääräisiä kaavoja:

a ,

.

Tässä x-i- - näytteenottovaihtoehdot, n-i - - taajuusvaihtoehdot x i, - - otoskoko.
Korjatun otosvarianssin laskemiseksi kaava on kätevämpi


.

Laskennan yksinkertaistamiseksi on suositeltavaa vaihtaa ehdollisiin vaihtoehtoihin (intervallivaihtelusarjan keskellä oleva alkuvariantti on edullista ottaa c:ksi). Sitten

, .

intervalliarvio

Yllä tarkastelimme kysymystä tuntemattoman parametrin arvioimisesta a yksi numero. Kutsuimme tällaisia ​​arvioita pisteestimaateiksi. Niiden haittana on, että pienellä otoskoolla ne voivat poiketa merkittävästi arvioiduista parametreista. Siksi, jotta saadaan käsitys parametrin ja sen arvion läheisyydestä, matemaattisessa tilastossa otetaan käyttöön ns. intervalliestimaatteja.

Olkoon pisteestimaatti q * löydettävä parametrin q otoksesta. Yleensä tutkijoille annetaan etukäteen jokin riittävän suuri todennäköisyys g (esim. 0,95; 0,99 tai 0,999), jotta tapahtumaa todennäköisyydellä g voidaan pitää käytännössä varmana, ja he herättävät kysymyksen tällaisen arvon e > 0 löytämisestä mikä

.

Muokkaamalla tätä yhtäläisyyttä saamme:

ja tässä tapauksessa sanotaan, että väli ]q * - e; q * + e[ kattaa arvioidun parametrin q todennäköisyydellä g.

Väli ]q * -e; q * +e [ kutsutaan luottamusväli .

Todennäköisyyttä g kutsutaan luotettavuus (luottamustodennäköisyys) -väliarvio.

Luottamusvälin päät, ts. Pisteitä q * -e ja q * +e kutsutaan luottamuksen rajoja .

Numeroa e kutsutaan arvioinnin tarkkuus .

Esimerkkinä luottamusrajojen määrittämisongelmasta tarkastellaan satunnaismuuttujan X matemaattisen odotuksen estimoimista, jolla on normaalijakauman laki parametreineen a ja s, ts. X = N( a, s). Matemaattinen odotus tässä tapauksessa on yhtä suuri kuin a. Havaintojen mukaan X 1 , X 2 , X n laskevat keskiarvon ja arviointi dispersio s 2 .

Osoittautuu, että näytetietojen mukaan on mahdollista rakentaa satunnaismuuttuja

jolla on Studentin jakauma (tai t-jakauma) n = n -1 vapausastetta.

Käytetään taulukkoa A.1.3 ja etsitään annetulle todennäköisyydelle g ja luvulle n luku t g siten, että todennäköisyys

P(|t(n)|< t g) = g,

.

Ilmeisten muutosten jälkeen saamme

F-kriteerin soveltamismenettely on seuraava:

1. Tehdään oletus populaatioiden normaalista jakautumisesta. Tietyllä merkitsevyystasolla a muotoillaan nollahypoteesi H 0: s x 2 = s y 2 normaalipopulaatioiden yleisten varianssien yhtäläisyydestä kilpailevan hypoteesin H 1 alaisuudessa: s x 2 > s y 2 .

2. Kaksi riippumatonta näytettä saadaan n x:n ja n y:n X- ja Y-populaatioista.

3. Laske korjattujen näytevarianssien s x 2 ja s y 2 arvot (laskentamenetelmiä käsitellään kohdassa §13.4). Suurempi dispersioista (s x 2 tai s y 2) on merkitty s 1 2:ksi, pienempi - s 2 2.

4. F-kriteerin arvo lasketaan kaavan F obs = s 1 2 / s 2 2 mukaan.

5. Fisher - Snedecor -jakauman kriittisten pisteiden taulukon mukaan tietylle merkitsevyystasolle a ja vapausasteiden lukumäärälle n 1 \u003d n 1 - 1, n 2 \u003d n 2 - 1 (n 1 on suuremman korjatun varianssin vapausasteiden lukumäärä), kriittinen piste löytyy F cr (a, n 1, n 2).

Huomaa, että taulukko A.1.7 näyttää yksisuuntaisen F-kriteerin kriittiset arvot. Jos siis käytetään kaksipuolista kriteeriä (H 1: s x 2 ¹ s y 2), niin oikeanpuoleista kriittistä pistettä F cr (a / 2, n 1, n 2) etsitään merkitsevyystasolla a / 2 (puolet määritellystä) ja vapausasteiden lukumäärä n 1 ja n 2 (n 1 - suuremman dispersion vapausasteiden lukumäärä). Vasenkätistä kriittistä pistettä ei ehkä löydy.

6. Päätetään, että jos F-kriteerin laskettu arvo on suurempi tai yhtä suuri kuin kriittinen (F obs ³ F cr), niin varianssit eroavat merkittävästi tietyllä merkitsevyystasolla. Muuten (F obs< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Tehtävä 15.1. Raaka-aineiden kulutus tuotantoyksikköä kohti vanhan tekniikan mukaan oli:

Uusi teknologia:

Olettaen, että vastaavilla yleispopulaatioilla X ja Y on normaalijakaumat, tarkista, että uusien ja vanhojen teknologioiden raaka-aineiden kulutus ei eroa vaihtelultaan, jos merkitsevyystasoksi a = 0,1.

Ratkaisu. Toimimme yllä mainitussa järjestyksessä.

1. Arvioimme uusien ja vanhojen teknologioiden raaka-aineiden kulutuksen vaihtelua dispersioarvojen perusteella. Siten nollahypoteesi on muotoa H 0: s x 2 = s y 2 . Kilpailevaksi hypoteesiksi hyväksymme hypoteesin H 1: s x 2 ¹ s y 2, koska emme ole etukäteen varmoja siitä, että jokin yleisvariansseista on suurempi kuin toinen.

2-3. Etsi otosvarianssit. Laskelmien yksinkertaistamiseksi siirrytään ehdollisiin vaihtoehtoihin:

u i = x i - 307, v i = y i - 304.

Järjestämme kaikki laskelmat seuraavien taulukoiden muodossa:

sinä minä m i olenko minä olenko minä u i 2 m i (u i +1) 2 v i n i n i v i n i v i 2 n i (v i +1) 2
-3 -3 -1 -2
å -
å -

Ohjaus: å m i u i 2 + 2å m i u i + m i = Ohjaus: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Etsi korjatut otosvarianssit:

4. Vertaa varianssia. Etsi suuremman korjatun varianssin suhde pienempään:

.

5. Kilpaileva hypoteesi on ehdon mukaan muotoa s x 2 ¹ s y 2 , joten kriittinen alue on kaksipuolinen ja kriittistä pistettä löydettäessä tulee ottaa merkitsevyystasot, jotka ovat puolet annetusta.

Taulukon A.1.7 mukaan merkitsevyystasolla a/2 = 0,1/2 = 0,05 ja vapausasteiden lukumäärällä n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8 saadaan kriittinen piste F cr ( 0,05; 12; 8) = 3,28.

6. Koska F obl.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

Yllä hypoteeseja testattaessa oletettiin, että tutkittavien satunnaismuuttujien jakauma oli normaali. Erityistutkimukset ovat kuitenkin osoittaneet, että ehdotetut algoritmit ovat erittäin vakaita (etenkin suurilla otoskooilla) normaalijakauman poikkeaman suhteen.