Muodosta luottamusväli matemaattiselle odotukselle. Luottamusvälit matemaattisen odotuksen arvioimiseksi

Ja muut. Ne kaikki ovat arvioita teoreettisista vastineistaan, jotka voitaisiin saada, jos ei olisi otosta, vaan yleinen populaatio. Mutta valitettavasti yleinen väestö on erittäin kallista ja usein poissa.

Intervalliarvioinnin käsite

Kaikissa näytearvioissa on hajontaa, koska on satunnaismuuttuja, joka riippuu tietyn näytteen arvoista. Siksi luotettavampia tilastollisia päätelmiä varten ei pitäisi tietää vain pisteestimaatti, vaan myös intervalli, mikä suurella todennäköisyydellä γ (gamma) kattaa arvioidun indikaattorin θ (theta).

Muodollisesti nämä ovat kaksi tällaista arvoa (tilastot) T1(X) ja T2(X), mitä T1< T 2 , joille tietyllä todennäköisyystasolla γ ehto täyttyy:

Lyhyesti sanottuna se on todennäköistä γ tai enemmän todellinen arvo on pisteiden välissä T1(X) ja T2(X), joita kutsutaan ala- ja ylärajoiksi luottamusväli.

Yksi luottamusvälien muodostamisen edellytyksistä on sen maksimikapea, ts. sen tulee olla mahdollisimman lyhyt. Halu on melko luonnollista, koska. tutkija yrittää paikantaa halutun parametrin löydön tarkemmin.

Tästä seuraa, että luottamusvälin tulee kattaa jakauman enimmäistodennäköisyydet. ja itse pisteet ovat keskellä.

Toisin sanoen todennäköisyys poikkeaa (todellisen indikaattorin estimaatista) ylöspäin on yhtä suuri kuin poikkeaman todennäköisyys alaspäin. On myös huomattava, että vinossa jakaumassa oikeanpuoleinen intervalli ei ole sama kuin vasemmanpuoleinen intervalli.

Yllä oleva kuva osoittaa selvästi, että mitä suurempi luottamustaso, sitä laajempi väli - suora suhde.

Tämä oli pieni johdatus tuntemattomien parametrien intervalliarvioinnin teoriaan. Jatketaan matemaattisten odotusten luottamusrajojen löytämistä.

Matemaattisen odotuksen luottamusväli

Jos alkuperäiset tiedot jaetaan, keskiarvo on normaaliarvo. Tämä seuraa säännöstä, että normaaliarvojen lineaarisella yhdistelmällä on myös normaalijakauma. Siksi todennäköisyyksien laskemiseen voisimme käyttää normaalijakauman lain matemaattista laitteistoa.

Tämä edellyttää kuitenkin kahden parametrin – odotusarvon ja varianssin – tuntemista, joita ei yleensä tunneta. Voit toki käyttää arvioita parametrien sijasta (aritmeettinen keskiarvo ja ), mutta silloin keskiarvon jakauma ei ole aivan normaali, vaan se litistyy hieman. Irlannin kansalainen William Gosset pani taitavasti merkille tämän tosiasian, kun hän julkaisi löytönsä Biometrica-lehden maaliskuussa 1908. Salassapitosyistä Gosset allekirjoitti Studentin kanssa. Näin syntyi Studentin t-jakauma.

Normaali datajakauma, jota K. Gauss käytti tähtitieteellisten havaintojen virheiden analysoinnissa, on kuitenkin erittäin harvinainen maanpäällisessä elämässä, ja sen toteaminen on melko vaikeaa (suureen tarkkuuteen tarvitaan noin 2 tuhatta havaintoa). Siksi on parasta luopua normaalisuusoletuksesta ja käyttää menetelmiä, jotka eivät riipu alkuperäisen datan jakautumisesta.

Herää kysymys: mikä on aritmeettisen keskiarvon jakauma, jos se lasketaan tuntemattoman jakauman tiedoista? Vastauksen antaa todennäköisyysteoriassa hyvin tunnettu Keskirajalause(CPT). Matematiikassa siitä on useita versioita (formulaatioita on jalostettu vuosien varrella), mutta ne kaikki karkeasti sanottuna päätyvät väitteeseen, että suuren määrän riippumattomien satunnaismuuttujien summa noudattaa normaalijakauman lakia.

Aritmeettista keskiarvoa laskettaessa käytetään satunnaismuuttujien summaa. Tästä käy ilmi, että aritmeettisella keskiarvolla on normaalijakauma, jossa odotusarvo on alkuperäisen datan odotusarvo ja varianssi on .

Älykkäät ihmiset osaavat todistaa CLT:n, mutta me varmistamme tämän Excelissä tehdyn kokeen avulla. Simuloitetaan 50 tasaisesti jakautuneen satunnaismuuttujan otos (Excelin RANDOMBETWEEN-funktiolla). Sitten tehdään 1000 tällaista näytettä ja lasketaan jokaiselle aritmeettinen keskiarvo. Katsotaanpa niiden jakautumista.

Voidaan nähdä, että keskiarvon jakauma on lähellä normaalilakia. Jos näytteiden tilavuudesta ja niiden määrästä tehdään vielä suurempi, samankaltaisuus on vielä parempi.

Nyt kun olemme itse todenneet CLT:n validiteetin, voimme :n avulla laskea aritmeettisen keskiarvon luottamusvälit, jotka kattavat todellisen keskiarvon tai matemaattisen odotuksen tietyllä todennäköisyydellä.

Ylä- ja alarajan määrittäminen edellyttää normaalijakauman parametrien tuntemista. Yleensä niitä ei käytetä, joten arvioita käytetään: aritmeettinen keskiarvo ja näytteen varianssi. Tämä menetelmä antaa jälleen hyvän likiarvon vain suurille näytteille. Kun näytteet ovat pieniä, on usein suositeltavaa käyttää Studentin jakaumaa. Älä usko! Studentin jakauma keskiarvolle tapahtuu vain silloin, kun alkuperäisellä tiedolla on normaalijakauma, eli melkein ei koskaan. Siksi on parempi asettaa välittömästi vähimmäispalkki vaaditun tiedon määrälle ja käyttää asymptoottisesti oikeita menetelmiä. He sanovat, että 30 havaintoa riittää. Ota 50 - et voi mennä pieleen.

T 1.2 ovat luottamusvälin ala- ja ylärajat

– näyte aritmeettinen keskiarvo

s0– näytteen keskihajonta (harhaanjohtava)

n - otoskoko

γ – luottamustaso (yleensä 0,9, 0,95 tai 0,99)

c γ = Φ -1 ((1+γ)/2) on normaalin normaalijakaumafunktion käänteisluku. Yksinkertaisesti sanottuna tämä on standardivirheiden lukumäärä aritmeettisesta keskiarvosta ala- tai ylärajaan (ilmoitetut kolme todennäköisyyttä vastaavat arvoja 1,64, 1,96 ja 2,58).

Kaavan ydin on, että aritmeettinen keskiarvo otetaan ja siitä jätetään tietty määrä ( γ:n kanssa) vakiovirheet ( s 0 /√n). Kaikki tiedetään, ota ja laske.

Ennen PC-tietokoneiden massakäyttöä normaalijakaumafunktion ja sen käänteisfunktion arvojen saamiseksi he käyttivät . Niitä käytetään edelleen, mutta tehokkaampaa on kääntyä valmiiden Excel-kaavojen puoleen. Kaikki yllä olevan kaavan elementit ( , ja ) voidaan laskea helposti Excelissä. Mutta on myös valmis kaava luottamusvälin laskemiseen - LUOTTAMINEN NORMI. Sen syntaksi on seuraava.

CONFIDENCE NORM(alfa, standardi_dev, koko)

alfa– merkitsevyystaso tai luottamustaso, joka yllä olevassa merkinnässä on 1-γ, ts. todennäköisyys, että matemaattinenodotus on luottamusvälin ulkopuolella. Kun luottamustaso on 0,95, alfa on 0,05 ja niin edelleen.

standardi_pois on näytetietojen keskihajonta. Sinun ei tarvitse laskea keskivirhettä, Excel jakaa n:n juurella.

koko– näytteen koko (n).

CONFIDENCE.NORM-funktion tulos on toinen termi luottamusvälin laskentakaavasta, ts. puoliväli. Vastaavasti alempi ja ylempi piste ovat keskiarvo ± saatu arvo.

Näin ollen on mahdollista rakentaa universaali algoritmi aritmeettisen keskiarvon luottamusvälien laskemiseen, joka ei riipu lähtötietojen jakaumasta. Universaalisuuden hinta on sen asymptoottisuus, ts. tarve käyttää suhteellisen suuria näytteitä. Nykytekniikan aikakaudella oikean datamäärän kerääminen ei kuitenkaan yleensä ole vaikeaa.

Tilastollisten hypoteesien testaus luottamusvälillä

(moduuli 111)

Yksi tärkeimmistä tilastoissa ratkaistavista ongelmista on. Lyhyesti sanottuna sen olemus on tämä. Oletetaan esimerkiksi, että yleisen väestön odotus on yhtä suuri kuin jokin arvo. Sitten muodostetaan näytekeskiarvojakauma, jota voidaan tarkkailla tietyllä odotuksella. Seuraavaksi tarkastellaan missä tässä ehdollisessa jakaumassa todellinen keskiarvo sijaitsee. Jos se ylittää sallitut rajat, tällaisen keskiarvon ilmestyminen on erittäin epätodennäköistä, ja yhdellä kokeen toistolla se on melkein mahdotonta, mikä on ristiriidassa esitetyn hypoteesin kanssa, joka hylätään onnistuneesti. Jos keskiarvo ei ylitä kriittistä tasoa, hypoteesia ei hylätä (mutta sitä ei myöskään todisteta!).

Joten luottamusvälien avulla, meidän tapauksessamme odotukselle, voit myös testata joitain hypoteeseja. Se on erittäin helppo tehdä. Oletetaan, että jonkin otoksen aritmeettinen keskiarvo on 100. Testataan hypoteesia, jonka mukaan odotusarvo on esimerkiksi 90. Eli jos esitämme kysymyksen primitiivisesti, se kuulostaa tältä: voiko olla niin, että otoksen todellisella arvolla. keskiarvo on 90, havaittu keskiarvo oli 100?

Tähän kysymykseen vastaamiseksi tarvitaan lisätietoja keskihajonnasta ja otoksen koosta. Oletetaan, että keskihajonta on 30 ja havaintojen määrä on 64 (juuren erottamiseksi helposti). Tällöin keskiarvon standardivirhe on 30/8 tai 3,75. 95 %:n luottamusvälin laskemiseksi sinun on jätettävä sivuun kaksi standardivirhettä keskiarvon (tarkemmin 1,96) molemmille puolille. Luottamusväli on noin 100 ± 7,5 tai 92,5 - 107,5.

Lisäperustelut ovat seuraavat. Jos testattu arvo osuu luottamusväliin, se ei ole ristiriidassa hypoteesin kanssa, koska mahtuu satunnaisten vaihteluiden rajoihin (todennäköisyydellä 95 %). Jos testattava piste on luottamusvälin ulkopuolella, niin tällaisen tapahtuman todennäköisyys on hyvin pieni, joka tapauksessa alle hyväksyttävän tason. Tästä syystä hypoteesi hylätään, koska se on ristiriidassa havaitun tiedon kanssa. Meidän tapauksessamme odotushypoteesi on luottamusvälin ulkopuolella (testattu arvo 90 ei sisälly väliin 100±7,5), joten se tulee hylätä. Vastaamalla yllä olevaan primitiiviseen kysymykseen, pitäisi sanoa: ei, se ei voi, joka tapauksessa, tämä tapahtuu erittäin harvoin. Usein tämä viittaa tiettyyn hypoteesin virheellisen hylkäämisen todennäköisyyteen (p-taso), eikä tiettyä tasoa, jonka mukaan luottamusväli rakennettiin, vaan siitä lisää toisella kerralla.

Kuten näet, keskiarvon (tai matemaattisen odotuksen) luottamusvälin rakentaminen ei ole vaikeaa. Tärkeintä on saada kiinni olemuksesta, ja sitten asiat etenevät. Käytännössä useimmat käyttävät 95 %:n luottamusväliä, joka on noin kahden standardivirheen levyinen keskiarvon molemmin puolin.

Tässä kaikki tältä erää. Kaikki parhaat!

Otetaan näyte yleisestä lain alaisesta perusjoukosta normaali jakelu XN( m; ). Tämä matemaattisten tilastojen perusoletus perustuu keskeiseen rajalauseeseen. Olkoon yleinen keskihajonta tiedossa , mutta teoreettisen jakauman matemaattista odotusta ei tunneta m(tarkoittaa ).

Tässä tapauksessa näyte tarkoittaa , joka saadaan kokeen aikana (kohta 3.4.2), on myös satunnaismuuttuja m;
). Sitten "normalisoitu" poikkeama
N(0;1) on tavallinen normaali satunnaismuuttuja.

Ongelmana on löytää aikaväliarvio m. Muodostetaan kaksipuolinen luottamusväli kohteelle m niin, että todellinen matemaattinen odotus kuuluu hänelle tietyllä todennäköisyydellä (luotettavuus) .

Aseta arvolle tällainen aikaväli
tarkoittaa tämän määrän maksimiarvon löytämistä
ja minimi
, jotka ovat kriittisen alueen rajat:
.

Koska tämä todennäköisyys on
, sitten tämän yhtälön juuri
löytyy Laplace-funktion taulukoista (taulukko 3, liite 1).

Siis todennäköisyydellä voidaan väittää, että satunnaismuuttuja
, eli haluttu yleinen keskiarvo kuuluu väliin
. (3.13)

arvo
(3.14)

nimeltään tarkkuus arvioita.

Määrä
kvantiili normaalijakauma - löytyy Laplacen funktion argumenttina (taulukko 3, liite 1), kun suhde 2Ф( u)=, eli F( u)=
.

Päinvastoin määritellyn poikkeamaarvon mukaan voidaan selvittää, millä todennäköisyydellä tuntematon yleinen keskiarvo kuuluu väliin
. Tätä varten sinun on laskettava

. (3.15)

Otetaan satunnaisotos yleisjoukosta uudelleenvalintamenetelmällä. Yhtälöstä
voidaan löytää minimi uudelleennäytteenottotilavuus n tarvitaan varmistamaan, että luottamusväli tietyllä luotettavuudella ei ylittänyt esiasetettua arvoa . Tarvittava otoskoko arvioidaan kaavalla:

. (3.16)

Tutkiminen arvion tarkkuus
:

1) Otoskoon kasvaessa n suuruus vähenee, ja näin ollen arvion tarkkuus lisääntyy.

2) C lisääntyä arvioiden luotettavuus argumentin arvoa kasvatetaan u(koska F(u) kasvaa monotonisesti) ja siten lisääntyy . Tässä tapauksessa luotettavuuden kasvu vähentää arvioinnin tarkkuutta .

Arvio
(3.17)

nimeltään klassista(missä t on parametri, joka riippuu ja n), koska se luonnehtii yleisimmin esiintyviä jakelulakeja.

3.5.3 Luottamusvälit tuntemattoman keskihajonnan  normaalijakauman odotuksen arvioimiseksi

Tehdään tiedoksi, että yleinen populaatio on normaalijakauman lain alainen XN( m;), jossa arvo juuri tarkoittaa neliötä poikkeamat tuntematon.

Luottamusvälin rakentamiseksi yleisen keskiarvon estimointia varten käytetään tässä tapauksessa tilastoja
, jolla on opiskelijan jakelu k= n-1 vapausaste. Tämä seuraa siitä tosiasiasta, että N(0;1) (katso kohta 3.5.2) ja
(ks. kohta 3.5.3) ja Studentin jakauman määritelmästä (osa 1. kohta 2.11.2).

Selvitetään Studentin jakauman klassisen estimaatin tarkkuus: ts. löytö t kaavasta (3.17). Olkoon epätasa-arvon täyttymisen todennäköisyys
luotettavuuden antama :

. (3.18)

Koska TSt( n-1), se on selvää t riippuu ja n, joten kirjoitamme yleensä
.

(3.19)

missä
on Studentin jakelufunktio n-1 vapausaste.

Tämän yhtälön ratkaiseminen m, saamme välin
joka luotettavuudella  peittää tuntemattoman parametrin m.

Arvo t , n-1, käytetään määrittämään satunnaismuuttujan luottamusväli T(n-1), jakaa Student with n-1 vapausastetta kutsutaan Opiskelijan kerroin. Se pitäisi löytää annettujen arvojen perusteella n ja  taulukoista "Studion jakauman kriittiset kohdat". (Taulukko 6, Liite 1), jotka ovat yhtälön (3.19) ratkaisuja.

Tuloksena saamme seuraavan lausekkeen tarkkuus luottamusväli matemaattisen odotuksen arvioimiseksi (yleinen keskiarvo), jos varianssia ei tunneta:

(3.20)

Siten on olemassa yleinen kaava luottamusvälien muodostamiseksi yleisen väestön matemaattisille odotuksille:

missä on luottamusvälin tarkkuus riippuen tunnetusta tai tuntemattomasta varianssista löytyy kaavojen mukaan vastaavasti 3.16. ja 3.20.

Tehtävä 10. Suoritettiin joitain testejä, joiden tulokset on lueteltu taulukossa:

x i

Tiedetään, että ne noudattavat normaalijakauman lakia
. Etsi arvio m* matemaattisia odotuksia varten m, rakentaa sille 90 %:n luottamusväli.

Ratkaisu:

Niin, m(2.53;5.47).

Tehtävä 11. Meren syvyys mitataan laitteella, jonka systemaattinen virhe on 0 ja satunnaiset virheet jakautuvat normaalin lain mukaan keskihajonnan kanssa = 15 m. Kuinka monta riippumatonta mittausta tulisi tehdä syvyyden määrittämiseksi enintään 5 metrin virheillä 90 %:n luottamustasolla?

Ratkaisu:

Ongelman ehdon mukaan meillä on XN( m; ), missä = 15 m, = 5 m, =0,9. Etsitään äänenvoimakkuus n.

1) Annetulla luotettavuudella = 0,9 löydämme taulukosta 3 (Liite 1) Laplace-funktion argumentin u = 1.65.

2) Tietäen annettu estimoinnin tarkkuus =u=5, löydä
. Meillä on

. Siksi kokeiden määrä n 25.

Tehtävä 12. Lämpötilanäytteenotto t tammikuun ensimmäiset 6 päivää on esitetty taulukossa:

Etsi odotusten luottamusväli m yleinen väestö luottamustodennäköisyydellä
ja arvioimaan yleisen keskihajonnan s.

Ratkaisu:


ja
.

2) Puolueeton arvio löytää kaavan mukaan
:

=-175

=234.84

;
;

=-192

=116


.

3) Koska yleisvarianssia ei tunneta, mutta sen arvio tunnetaan, niin lasketaan matemaattinen odotus m käytämme Studentin jakaumaa (taulukko 6, liite 1) ja kaavaa (3.20).

Koska n 1 =n 2 = 6, sitten ,
, s 1 = 6,85 meillä on:
, joten -29,2-4,1<m 1 < -29.2+4.1.

Siksi -33.3<m 1 <-25.1.

Samoin meillä
, s 2 = 4,8, joten

–34.9< m 2 < -29.1. Тогда доверительные интервалы примут вид: m 1 (-33,3;-25,1) ja m 2 (-34.9;-29.1).

Sovelletuissa tieteissä, esimerkiksi rakentamisen aloilla, kohteiden tarkkuuden arvioimiseen käytetään luottamusvälitaulukoita, jotka on annettu asiaankuuluvassa viitekirjallisuudessa.

Usein arvioijan on analysoitava sen segmentin kiinteistömarkkinoita, jossa arviointikohde sijaitsee. Jos markkinat ovat kehittyneet, voi olla vaikeaa analysoida koko esitettävien objektien joukkoa, joten analysointiin käytetään otosta objekteista. Tämä näyte ei ole aina homogeeninen, joskus se on puhdistettava äärimmäisistä - liian korkeista tai liian alhaisista markkinatarjouksista. Tätä tarkoitusta varten sitä sovelletaan luottamusväli. Tämän tutkimuksen tarkoituksena on tehdä vertaileva analyysi kahdesta menetelmästä luottamusvälin laskentaan ja valita paras laskentavaihtoehto työskennellessäsi eri näytteiden kanssa estimatica.pro-järjestelmässä.

Luottamusväli - lasketaan otoksen perusteella attribuutin arvojen väli, joka tunnetulla todennäköisyydellä sisältää yleisen populaation arvioidun parametrin.

Luottamusvälin laskemisen tarkoitus on rakentaa sellainen intervalli näytetietojen perusteella, jotta voidaan tietyllä todennäköisyydellä väittää, että estimoidun parametrin arvo on tällä välillä. Toisin sanoen luottamusväli tietyllä todennäköisyydellä sisältää arvioidun suuren tuntemattoman arvon. Mitä leveämpi väli, sitä suurempi on epätarkkuus.

Luottamusvälin määrittämiseen on erilaisia ​​menetelmiä. Tässä artikkelissa tarkastelemme kahta tapaa:

  • mediaanin ja keskihajonnan kautta;
  • t-tilaston kriittisen arvon (Student's-kerroin) kautta.

Erilaisten CI:n laskentamenetelmien vertailevan analyysin vaiheet:

1. muodostaa tietonäyte;

2. käsittelemme sen tilastollisilla menetelmillä: laskemme keskiarvon, mediaanin, varianssin jne.;

3. laskemme luottamusvälin kahdella tavalla;

4. Analysoi puhdistetut näytteet ja saadut luottamusvälit.

Vaihe 1. Datan otanta

Otos muodostettiin käyttämällä estimatica.pro-järjestelmää. Otokseen sisältyi 91 tarjousta 1-huoneen asuntojen myyntiin 3. hintavyöhykkeellä suunnittelutyypillä "Hruštšov".

Taulukko 1. Ensimmäinen näyte

Hinta 1 neliömetri, c.u.

Kuva 1. Alkuperäinen näyte



Vaihe 2. Ensimmäisen näytteen käsittely

Näytteen käsittely tilastollisilla menetelmillä edellyttää seuraavien arvojen laskemista:

1. Aritmeettinen keskiarvo

2. Mediaani - näytettä kuvaava luku: tasan puolet otoselementeistä on suurempia kuin mediaani, toinen puoli on pienempi kuin mediaani

(näytteelle, jossa on pariton määrä arvoja)

3. Alue - ero näytteen enimmäis- ja vähimmäisarvojen välillä

4. Varianssi - käytetään tietojen vaihtelun tarkempaan arvioimiseen

5. Otoksen keskihajonta (jäljempänä RMS) on yleisin säätöarvojen hajaantumisen osoitin aritmeettisen keskiarvon ympärillä.

6. Variaatiokerroin - heijastaa säätöarvojen hajonta-astetta

7. värähtelykerroin - heijastaa otoksessa olevien hintojen ääriarvojen suhteellista vaihtelua keskiarvon ympärillä

Taulukko 2. Alkuperäisen otoksen tilastolliset indikaattorit

Aineiston homogeenisuutta kuvaava variaatiokerroin on 12,29 %, mutta värähtelykerroin on liian suuri. Näin ollen voidaan todeta, että alkuperäinen näyte ei ole homogeeninen, joten siirrytään luottamusvälin laskemiseen.

Vaihe 3. Luottamusvälin laskenta

Menetelmä 1. Laskenta mediaanin ja keskihajonnan avulla.

Luottamusväli määritetään seuraavasti: minimiarvo - keskihajonta vähennetään mediaanista; maksimiarvo - keskihajonta lisätään mediaaniin.

Siten luottamusväli (47179 CU; 60689 CU)

Riisi. 2. Arvot luottamusvälillä 1.



Menetelmä 2. Luottamusvälin rakentaminen t-tilaston kriittisen arvon (opiskelijakerroin) avulla

S.V. Gribovsky kirjassa "Matemaattiset menetelmät omaisuuden arvon arvioimiseksi" kuvaa menetelmän luottamusvälin laskemiseksi Studentin kertoimen avulla. Tällä menetelmällä laskettaessa estimaattorin on itse asetettava merkitsevyystaso ∝, joka määrittää todennäköisyyden, jolla luottamusväli rakennetaan. Yleisesti käytetään merkitsevyystasoja 0,1; 0,05 ja 0,01. Ne vastaavat luottamustodennäköisyyksiä 0,9; 0,95 ja 0,99. Tällä menetelmällä matemaattisen odotuksen ja varianssin todellisia arvoja pidetään käytännössä tuntemattomina (mikä on lähes aina totta käytännön arviointiongelmia ratkaistaessa).

Luottamusvälin kaava:

n - näytteen koko;

t-tilaston (opiskelijajakaumien) kriittinen arvo merkitsevyystasolla ∝, vapausasteiden lukumäärä n-1, joka määritetään erityisillä tilastotaulukoilla tai MS Excelillä (→"Tilasto"→ STUDRASPOBR);

∝ - merkitsevyystaso, otamme ∝=0,01.

Riisi. 2. Arvot luottamusvälillä 2.

Vaihe 4. Luottamusvälin laskemistapojen analyysi

Kaksi luottamusvälin laskentamenetelmää - mediaanin ja Studentin kertoimen kautta - johtivat intervallien erilaisiin arvoihin. Vastaavasti saatiin kaksi erilaista puhdistettua näytettä.

Taulukko 3. Kolmen otoksen tilastolliset indikaattorit.

Indeksi

Alkuperäinen näyte

1 vaihtoehto

Vaihtoehto 2

Tarkoittaa

Dispersio

Coef. muunnelmat

Coef. värähtelyjä

Vanhojen kohteiden lukumäärä, kpl.

Tehtyjen laskelmien perusteella voidaan sanoa, että eri menetelmillä saatujen luottamusvälien arvot leikkaavat toisiaan, joten voit käyttää mitä tahansa laskentamenetelmiä arvioijan harkinnan mukaan.

Uskomme kuitenkin, että estimatica.pro-järjestelmässä työskennellessä on suositeltavaa valita menetelmä luottamusvälin laskentaan markkinoiden kehitysasteesta riippuen:

  • jos markkinat eivät ole kehittyneet, käytä laskentamenetelmää mediaanin ja keskihajonnan kautta, koska käytöstä poistettujen kohteiden määrä on tässä tapauksessa pieni;
  • jos markkinat kehittyvät, käytä laskentaa t-tilaston kriittisen arvon (Student's-kertoimen) kautta, koska on mahdollista muodostaa suuri alkuotos.

Artikkelin valmistelussa käytettiin:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matemaattiset menetelmät omaisuuden arvon määrittämiseen. Moskova, 2014

2. Tiedot estimatica.pro-järjestelmästä

Jakautukoon normaalin lain mukaan satunnaismuuttuja (voidaan puhua yleisestä populaatiosta), jonka varianssi D = 2 (> 0) tunnetaan. Yleisestä populaatiosta (josta objektijoukosta määritetään satunnaismuuttuja) tehdään n-kokoinen näyte. Otos x 1 , x 2 ,..., x n katsotaan kokoelmaksi n riippumatonta satunnaismuuttujaa, jotka jakautuvat samalla tavalla kuin (tekstissä edellä selostettu lähestymistapa).

Aiemmin keskusteltiin ja todistettiin myös seuraavat yhtäläisyydet:

Mx1 = Mx2 = ... = Mx n = M;

Dx1 = Dx2 = ... = Dx n = D;

Riittää, kun yksinkertaisesti todistamme (jätämme todistuksen pois), että satunnaismuuttuja on myös tässä tapauksessa jakautunut normaalin lain mukaan.

Merkitään tuntematon arvo M a:lla ja valitaan luku d > 0 annetun luotettavuuden mukaan siten, että seuraava ehto täyttyy:

P(- a< d) = (1)

Koska satunnaismuuttuja jakautuu normaalin lain mukaan matemaattisella odotuksella M = M = a ja varianssilla D = D /n = 2 /n, saadaan:

P(- a< d) =P(a - d < < a + d) =

Jäljelle jää valita d siten, että tasa-arvo

Jokaiselle taulukosta voidaan löytää sellainen luku t, että (t) = / 2. Tätä lukua t kutsutaan joskus ns. kvantiili.

Nyt tasa-arvosta

määritä d:n arvo:

Lopputuloksen saamme esittämällä kaavan (1) muodossa:

Viimeisen kaavan merkitys on seuraava: luotettavuudella, luottamusväli

kattaa populaation tuntemattoman parametrin a = M. Voidaan sanoa toisin: pisteestimaatti määrittää parametrin M arvon tarkkuudella d= t / ja luotettavuudella.

Tehtävä. Olkoon yleispopulaatio, jolla on jokin ominaispiirre, joka jakautuu normaalin lain mukaan ja jonka dispersio on 6,25. Tehtiin otos, jonka koko oli n = 27, ja saatiin ominaisuuden keskimääräinen otosarvo = 12. Etsi luottamusväli, joka kattaa yleisen populaation tutkitun ominaisuuden tuntemattoman matemaattisen odotuksen luotettavuudella = 0,99.

Ratkaisu. Ensinnäkin Laplace-funktion taulukkoa käyttämällä löydämme t:n arvon yhtälöstä (t) \u003d / 2 \u003d 0,495. Saadun arvon t = 2,58 perusteella määritetään estimaatin tarkkuus (tai puolet luottamusvälin pituudesta) d: d = 2,52,58 / 1,24. Tästä saadaan haluttu luottamusväli: (10,76; 13,24).

tilastollinen hypoteesi yleinen vaihtelu

Luottamusväli normaalijakauman odotukselle, jonka varianssi on tuntematon

Olkoon normaalin lain mukaan jakautunut satunnaismuuttuja, jolla on tuntematon matemaattinen odotus M, jota merkitään kirjaimella a . Tehdään näyte, jonka koko on n. Määritetään keskimääräinen näyte ja korjattu otosvarianssi s 2 tunnetuilla kaavoilla.

Satunnainen arvo

jaettu Studentin lain mukaan n - 1 vapausasteilla.

Tehtävänä on löytää sellainen luku t annetun luotettavuuden ja vapausasteiden lukumäärän n - 1 mukaan niin, että yhtälö

tai vastaavaa tasa-arvoa

Täällä suluissa kirjoitetaan ehto, että tuntemattoman parametrin a arvo kuuluu tiettyyn väliin, joka on luottamusväli. Sen rajat riippuvat luotettavuudesta sekä näytteenottoparametreista ja s:stä.

Määrittääksemme t:n arvon suuruuden mukaan muunnamme yhtälön (2) muotoon:

Nyt Studentin lain mukaan jakautuneen satunnaismuuttujan t taulukon mukaan todennäköisyydellä 1 - ja vapausasteiden lukumäärällä n - 1 saadaan t. Kaava (3) antaa vastauksen ongelmaan.

Tehtävä. 20 sähkölampun kontrollitesteissä niiden keskimääräinen työskentelyaika oli 2000 tuntia ja standardipoikkeama (laskettuna korjatun näytevarianssin neliöjuurena) oli 11 tuntia. On tunnettua, että lampun toiminnan kesto on normaalisti jakautunut satunnaismuuttuja. Määritä tämän satunnaismuuttujan matemaattisen odotuksen luottamusväli 0,95:n luotettavuudella.

Ratkaisu. Arvo 1 - tässä tapauksessa on 0,05. Studentin jakaumataulukon mukaan vapausasteiden lukumäärällä 19 saadaan: t = 2,093. Lasketaan nyt arvion tarkkuus: 2,093121/ = 56,6. Tästä saadaan haluttu luottamusväli: (1943.4; 2056.6).

Muodostetaan MS EXCEL:ssä luottamusväli jakauman keskiarvon estimoimiseksi, jos varianssin arvo on tunnettu.

Tietysti valinta luottamuksen taso riippuu täysin käsillä olevasta tehtävästä. Siten lentomatkustajan luottamuksen asteen lentokoneen luotettavuuteen tulee tietysti olla korkeampi kuin ostajan luottamus hehkulampun luotettavuuteen.

Tehtävän muotoilu

Oletetaan, että alkaen väestö otettuaan näyte koko n. Oletetaan, että keskihajonta tämä jakauma tunnetaan. Tämän perusteella tarpeellista näytteet arvioi tuntematonta jakelun keskiarvo(μ, ) ja muodosta vastaava kahdenvälinen luottamusväli.

Piste-arvio

Kuten tiedetään tilastot(kutsutaanko sitä X vrt) On puolueeton arvio keskiarvosta Tämä väestö ja sen jakauma on N(μ;σ 2/n).

Merkintä: Mitä jos pitää rakentaa luottamusväli jakelun tapauksessa mikä ei ole normaalia? Tässä tapauksessa tulee apuun, joka sanoo, että riittävän suurella koolla näytteet n jakelusta ei- normaali, tilastojen otantajakauma Х av tulee olemaan suunnilleen vastaa normaalijakauma parametreillä N(μ;σ 2/n).

Niin, pistearvio keskellä jakeluarvot meillä on näytteen keskiarvo, eli X vrt. Nyt ollaan kiireisiä luottamusväli.

Luottamusvälin rakentaminen

Yleensä jakauman ja sen parametrien tuntemalla voimme laskea todennäköisyyden, että satunnaismuuttuja saa arvon määrittämältämme väliltä. Tehdään nyt päinvastoin: etsitään väli, johon satunnaismuuttuja osuu annetulla todennäköisyydellä. Esimerkiksi kiinteistöistä normaalijakauma tiedetään, että 95 %:n todennäköisyydellä satunnaismuuttuja jakautuu normaali laki, putoaa väliin noin +/- 2 alkaen keskiarvo(katso artikkeli aiheesta). Tämä aikaväli toimii prototyyppinä luottamusväli.

Katsotaan nyt tiedämmekö jakelun , laskea tämä intervalli? Vastataksemme kysymykseen meidän on määritettävä jakelumuoto ja sen parametrit.

Tiedämme jakelumuodon normaalijakauma(muista, että puhumme näytteiden jakelu tilastot X vrt).

Parametri μ on meille tuntematon (se täytyy vain arvioida käyttämällä luottamusväli), mutta meillä on sen arvio X vrt., perusteella laskettu näytteenotto, joita voidaan käyttää.

Toinen parametri on näytteen keskimääräinen standardipoikkeama tullaan tunnetuksi, se on yhtä suuri kuin σ/√n.

Koska emme tiedä μ, niin rakennamme välin +/- 2 standardipoikkeamat ei alkaen keskiarvo, mutta sen tunnetun arvion perusteella X vrt. Nuo. laskettaessa luottamusväli emme oleta sitä X vrt putoaa väliin +/- 2 standardipoikkeamatμ:stä 95 %:n todennäköisyydellä ja oletetaan, että väli on +/- 2 standardipoikkeamat alkaen X vrt 95 %:n todennäköisyydellä kattaa μ - väestön keskiarvo, josta näyte. Nämä kaksi lausetta ovat samanarvoisia, mutta toinen lause antaa meille mahdollisuuden rakentaa luottamusväli.

Lisäksi tarkennamme väliä: satunnaismuuttuja, joka on jakautunut normaali laki, osuu 95 %:n todennäköisyydellä väliin +/- 1,960 standardipoikkeamat, ei +/- 2 standardipoikkeamat. Tämä voidaan laskea kaavalla \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. esimerkkitiedosto Sheet Spacing.

Nyt voimme muotoilla todennäköisyyslaskennan, joka auttaa meitä muodostamaan luottamusväli:
"Todennäköisyys, että väestön keskiarvo sijaitsee alkaen näytteen keskiarvo 1,960" sisällä näytteen keskiarvon keskihajonnat", on yhtä suuri kuin 95 %.

Lausunnossa mainitulla todennäköisyysarvolla on erityinen nimi , joka liittyy merkitsevyystaso α (alfa) yksinkertaisella lausekkeella luottamustaso =1 . Meidän tapauksessamme merkitsevyystaso α =1-0,95=0,05 .

Nyt tämän todennäköisyyslausekkeen perusteella kirjoitamme lausekkeen laskemista varten luottamusväli:

missä Zα/2 standardi normaalijakauma(sellainen satunnaismuuttujan arvo z, mitä P(z>=Zα/2 )=α/2).

Merkintä: Ylempi α/2-kvantiili määrittää leveyden luottamusväli sisään standardipoikkeamat näytteen keskiarvo. Ylempi α/2-kvantiili standardi normaalijakauma on aina suurempi kuin 0, mikä on erittäin kätevää.

Meidän tapauksessamme, kun α = 0,05, ylempi α/2-kvantiili on 1,960. Muille merkitsevyystasoille α (10 %; 1 %) ylempi α/2-kvantiili Zα/2 voidaan laskea kaavalla \u003d NORM.ST.OBR (1-α / 2) tai, jos tiedossa luottamustaso, =NORM.ST.OBR((1+luottamustaso)/2).

Yleensä rakentamisen yhteydessä luottamusvälit keskiarvon arvioimiseksi vain käyttöön ylempi α/2-kvantiili ja älä käytä pienempi α/2-kvantiili. Tämä on mahdollista, koska standardi normaalijakauma symmetrinen x-akselin suhteen ( sen jakautumisen tiheys symmetrinen noin keskimääräinen, ts. 0). Siksi laskelmia ei tarvitse tehdä alempi α/2-kvantiili(Sitä kutsutaan yksinkertaisesti α:ksi /2-kvantiili), koska se on tasa-arvoinen ylempi α/2-kvantiili miinusmerkillä.

Muista, että x:n jakauman muodosta riippumatta vastaava satunnaismuuttuja X vrt hajautettu suunnilleen hieno N(μ;σ 2 /n) (katso artikkeli aiheesta). Siksi yleensä yllä oleva lauseke for luottamusväli on vain likimääräinen. Jos x on jaettu normaali laki N(μ;σ 2 /n), sitten lauseke for luottamusväli on tarkka.

Luottamusvälin laskenta MS EXCELissä

Ratkaistaan ​​ongelma.
Elektronisen komponentin vasteaika tulosignaaliin on tärkeä laitteen ominaisuus. Insinööri haluaa piirtää keskimääräisen vasteajan luottamusvälin 95 %:n luottamustasolla. Aikaisemmasta kokemuksesta insinööri tietää, että vasteajan keskihajonna on 8 ms. Tiedetään, että insinööri teki 25 mittausta arvioidakseen vasteaikaa, keskiarvo oli 78 ms.

Ratkaisu: Insinööri haluaa tietää elektronisen laitteen vasteajan, mutta hän ymmärtää, että vasteaika ei ole kiinteä, vaan satunnaismuuttuja, jolla on oma jakaumansa. Joten parasta, mitä hän voi toivoa, on määrittää tämän jakauman parametrit ja muoto.

Valitettavasti ongelman tilasta emme tiedä vastausajan jakautumisen muotoa (sen ei tarvitse olla normaali). , tämä jakauma on myös tuntematon. Vain hänet tunnetaan keskihajontaσ = 8. Siksi, vaikka emme voi laskea todennäköisyyksiä ja rakentaa luottamusväli.

Emme kuitenkaan tiedä jakelua aika erillinen vastaus, tiedämme sen mukaan CPT, näytteiden jakelu keskimääräinen vasteaika on suunnilleen normaali(oletamme, että ehdot CPT suoritetaan, koska koko näytteet tarpeeksi suuri (n=25)) .

Lisäksi, keskiverto tämä jakauma on yhtä suuri kuin keskiarvo yksikkövastejakaumat, ts. μ. MUTTA keskihajonta tämän jakauman (σ/√n) voidaan laskea käyttämällä kaavaa =8/ROOT(25) .

Tiedetään myös, että insinööri sai pistearvio parametri μ on 78 ms (X cf). Siksi voimme nyt laskea todennäköisyydet, koska tiedämme jakelumuodon ( normaali) ja sen parametrit (Х ср ja σ/√n).

Insinööri haluaa tietää odotettu arvoμ vasteaikajakaumasta. Kuten edellä mainittiin, tämä μ on yhtä suuri kuin keskimääräisen vasteajan otosjakauman odotus. Jos käytämme normaalijakauma N(X cf; σ/√n), silloin haluttu μ on alueella +/-2*σ/√n noin 95 %:n todennäköisyydellä.

Merkitsevyystaso on 1-0,95 = 0,05.

Etsi lopuksi vasen ja oikea reuna luottamusväli.
Vasen reuna: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / JUURI (25) = 74,864
Oikea reuna: \u003d 78 + NORM. ST. OBR (1-0,05 / 2) * 8 / JUURI (25) \u003d 81,136

Vasen reuna: =NORM.INV(0,05/2, 78, 8/SQRT(25))
Oikea reuna: =NORM.INV(1-0,05/2, 78, 8/SQRT(25))

Vastaus: luottamusväli klo 95 % luottamustaso ja σ=8ms on yhtä suuri 78+/-3,136 ms

AT esimerkkitiedosto arkilla Sigma tunnettu loi lomakkeen laskentaa ja rakentamista varten kahdenvälinen luottamusväli mielivaltaiselle näytteet tietyllä σ ja merkitsevyystaso.

CONFIDENCE.NORM()-funktio

Jos arvot näytteet ovat alueella B20:B79 , a merkitsevyystaso yhtä suuri kuin 0,05; sitten MS EXCEL -kaava:
=KESKIARVO(B20:B79)-LUOTTAMINEN(0,05,σ, LASKE(B20:B79))
palauttaa vasemman reunan luottamusväli.

Sama raja voidaan laskea kaavalla:
=KESKIARVO(B20:B79)-NORM..ST.INV(1-0.05/2)*σ/SQRT(LASKE(B20:B79))

Merkintä: Funktio TRUST.NORM() ilmestyi MS EXCEL 2010:een. MS EXCELIN aiemmissa versioissa käytettiin TRUST()-funktiota.