Normaali luottamusväli. Luottamusväli

Kohde– opettaa opiskelijoille algoritmeja tilastollisten parametrien luottamusvälien laskemiseen.

Tietojen tilastollisen käsittelyn aikana lasketun aritmeettisen keskiarvon, variaatiokertoimen, korrelaatiokertoimen, erokriteerien ja muiden pistetilastojen tulisi saada kvantitatiiviset luottamusrajat, jotka osoittavat indikaattorin mahdollisia vaihteluja ylös ja alas luottamusvälin sisällä.

Esimerkki 3.1 . Kalsiumin jakautuminen apinoiden veren seerumissa, kuten aiemmin on todettu, on tunnusomaista seuraavilla selektiivisillä indikaattoreilla: = 11,94 mg%; = 0,127 mg %; n= 100. On määritettävä yleisen keskiarvon luottamusväli ( ) todennäköisyydellä P = 0,95.

Yleinen keskiarvo on tietyllä todennäköisyydellä välissä:

, missä – otoksen aritmeettinen keskiarvo; t- Opiskelijan kriteeri; on aritmeettisen keskiarvon virhe.

Taulukon "Opiskelijan kriteerin arvot" mukaan löydämme arvon luotettavuustasolla 0,95 ja vapausasteiden lukumäärällä k\u003d 100-1 \u003d 99. Se on 1,982. Yhdessä aritmeettisen keskiarvon ja tilastovirheen arvojen kanssa korvaamme sen kaavaan:

tai 11.69
12,19

Siten 95 %:n todennäköisyydellä voidaan väittää, että tämän normaalijakauman yleinen keskiarvo on välillä 11,69-12,19 mg %.

Esimerkki 3.2 . Määritä yleisen varianssin 95 %:n luottamusvälin rajat ( ) kalsiumin jakautuminen apinoiden veressä, jos sen tiedetään
= 1,60, kanssa n = 100.

Voit ratkaista ongelman käyttämällä seuraavaa kaavaa:

Missä on varianssin tilastollinen virhe.

Etsi otoksen varianssivirhe kaavalla:
. Se on yhtä suuri kuin 0,11. Merkitys t- kriteeri, jonka luottamustodennäköisyys on 0,95 ja vapausasteiden lukumäärä k= 100–1 = 99 tunnetaan edellisestä esimerkistä.

Käytetään kaavaa ja saadaan:

tai 1.38
1,82

Tarkempi luottamusväli yleiselle varianssille voidaan muodostaa käyttämällä (chi-neliö) - Pearsonin testi. Tämän kriteerin kriittiset pisteet on annettu erityisessä taulukossa. Käytettäessä kriteeriä kaksipuolista merkitsevyystasoa käytetään luottamusvälin muodostamiseen. Alarajalle merkitsevyystaso lasketaan kaavalla
, ylemmälle
. Esimerkiksi luottamustasolle = 0,99= 0,010,= 0,990. Näin ollen kriittisten arvojen jakautumistaulukon mukaan , jossa on lasketut luottamustasot ja vapausasteiden lukumäärä k= 100 – 1= 99, etsi arvot
ja
. Saamme
on 135,80 ja
on 70,06.

Voit löytää yleisen varianssin luottamusrajat käyttämällä käytämme kaavoja: alarajalle
, ylärajalle
. Korvaa löydetyt arvot tehtävätiedoilla kaavoihin:
= 1,17;
= 2,26. Näin ollen luottamustasolla P= 0,99 tai 99 %, yleinen varianssi on alueella 1,17 - 2,26 mg% mukaan lukien.

Esimerkki 3.3 . Hissiin saapuneen erän 1000 vehnän siemenestä löytyi 120 torajyvätartuntaa. On tarpeen määrittää tartunnan saaneiden siementen kokonaisosuuden todennäköiset rajat tietyssä vehnäerässä.

Yleisosakkeen luottamusrajat sen kaikille mahdollisille arvoille tulee määrittää kaavalla:

,

Missä n on havaintojen lukumäärä; m on yhden ryhmän absoluuttinen luku; t on normalisoitu poikkeama.

Tartunnan saaneiden siementen näyteosuus on yhtä suuri kuin
tai 12 %. Luottamustasolla R= 95 % normalisoitu poikkeama ( t-Opiskelijan kriteeri k =
)t = 1,960.

Korvaamme saatavilla olevat tiedot kaavaan:

Näin ollen luottamusvälin rajat ovat = 0,122–0,041 = 0,081 eli 8,1 %; = 0,122 + 0,041 = 0,163 eli 16,3 %.

Näin ollen 95 %:n luottamustasolla voidaan todeta, että saastuneiden siementen kokonaisosuus on 8,1-16,3 %.

Esimerkki 3.4 . Variaatiokerroin, joka kuvaa kalsiumin vaihtelua (mg%) apinoiden veren seerumissa, oli 10,6 %. Otoskoko n= 100. On tarpeen määrittää yleisen parametrin 95 %:n luottamusvälin rajat CV.

Yleisen variaatiokertoimen luottamusrajat CV määritetään seuraavilla kaavoilla:

ja
, missä K kaavan mukaan laskettu väliarvo
.

Tietäen sen luottavaisella tasolla R= 95 % normalisoitu poikkeama (opiskelijan t-testi for k =
)t = 1,960, laske arvo etukäteen TO:

.

tai 9,3 %

tai 12,3 %

Siten yleinen variaatiokerroin 95 %:n luottamustodennäköisyydellä on välillä 9,3-12,3 %. Toistuvilla näytteillä variaatiokerroin ei ylitä 12,3 % eikä laske alle 9,3 % 95 tapauksessa 100:sta.

Kysymyksiä itsehillintää varten:

Tehtävät itsenäiseen ratkaisuun.

1. Kholmogory-risteytysten lehmien maidon keskimääräinen rasvaprosentti oli seuraava: 3,4; 3,6; 3,2; 3,1; 2,9; 3,7; 3,2; 3,6; 4,0; 3,4; 4,1; 3,8; 3,4; 4,0; 3,3; 3,7; 3,5; 3,6; 3,4; 3.8. Aseta yleisen keskiarvon luottamusvälit 95 %:n luottamustasolle (20 pistettä).

2. 400 hybridirukikasvin ensimmäiset kukat ilmestyivät keskimäärin 70,5 päivää kylvöstä. Keskihajonta oli 6,9 päivää. Määritä perusjoukon keskiarvon ja varianssin keskiarvon ja luottamusvälin virhe merkitsevyystasolla W= 0,05 ja W= 0,01 (25 pistettä).

3. Puutarhamansikoiden 502 yksilön lehtien pituutta tutkittaessa saatiin seuraavat tiedot: = 7,86 cm; σ = 1,32 cm, \u003d ± 0,06 cm. Määritä populaation aritmeettisen keskiarvon luottamusvälit merkitsevyystasoilla 0,01; 0,02; 0,05. (25 pistettä).

4. Tutkittaessa 150 aikuista miestä keskipituus oli 167 cm ja σ \u003d 6 cm Mitkä ovat yleisen keskiarvon ja yleisen varianssin rajat luottamustodennäköisyyksillä 0,99 ja 0,95? (25 pistettä).

5. Kalsiumin jakautumista apinoiden veren seerumissa kuvaavat seuraavat selektiiviset indikaattorit: = 11,94 mg %, σ = 1,27, n = 100. Piirrä 95 %:n luottamusväli tämän jakauman perusjoukon keskiarvolle. Laske variaatiokerroin (25 pistettä).

6. Tutkittiin albiinorottien veriplasman kokonaistyppipitoisuutta 37 ja 180 päivän iässä. Tulokset ilmaistaan ​​grammoina 100 cm3 plasmaa kohti. 37 päivän iässä 9 rotalla oli: 0,98; 0,83; 0,99; 0,86; 0,90; 0,81; 0,94; 0,92; 0,87. 180 päivän iässä 8 rotalla oli: 1,20; 1,18; 1,33; 1,21; 1,20; 1,07; 1,13; 1.12. Aseta eron luottamusvälit luotettavuustasolla 0,95 (50 pistettä).

7. Määritä 95 %:n luottamusvälin rajat kalsiumin jakautumisen yleiselle varianssille (mg %) apinoiden veren seerumissa, jos tällä jakaumalla näytekoko on n = 100, näytevarianssin tilastollinen virhe s σ 2 = 1,60 (40 pistettä).

8. Määritä 95 %:n luottamusvälin rajat vehnän 40 piikin jakauman yleiselle varianssille pituussuunnassa (σ 2 = 40,87 mm 2). (25 pistettä).

9. Tupakointia pidetään pääasiallisena obstruktiiviselle keuhkosairaudelle altistavana tekijänä. Passiivista tupakointia ei pidetä tällaisena tekijänä. Tutkijat kyseenalaistivat passiivisen tupakoinnin turvallisuuden ja tutkivat tupakoimattomien, passiivisten ja aktiivisten tupakoijien hengitysteitä. Hengitysteiden tilan karakterisoimiseksi otimme yhden ulkoisen hengityksen toiminnan indikaattoreista - uloshengityksen puolivälin suurimman tilavuusnopeuden. Tämän indikaattorin lasku on merkki hengitysteiden heikentyneestä läpikulkusta. Kyselyn tiedot näkyvät taulukossa.

Tutkittujen lukumäärä

Maksimi keskivirtausnopeus, l/s

Vakiopoikkeama

Tupakoimattomat

työskennellä savuttomalla alueella

työskentelemään savuisessa huoneessa

tupakoitsijat

polttaa vähän savukkeita

tupakoitsijoiden keskimääräinen määrä

polttaa suuren määrän savukkeita

Etsi taulukosta kunkin ryhmän yleisen keskiarvon ja yleisen varianssin 95 %:n luottamusvälit. Mitä eroja ryhmien välillä on? Esitä tulokset graafisesti (25 pistettä).

10. Määritä porsaiden lukumäärän yleisen varianssin 95 % ja 99 % luottamusvälien rajat 64 porsituksessa, jos otosvarianssin tilastollinen virhe s σ 2 = 8,25 (30 pistettä).

11. Kanien keskimääräisen painon tiedetään olevan 2,1 kg. Määritä yleisen keskiarvon ja varianssin 95 % ja 99 % luottamusvälien rajat, kun n= 30, σ = 0,56 kg (25 pistettä).

12. 100 tähkästä mitattiin tähkän jyväpitoisuus ( X), piikin pituus ( Y) ja jyvän massa korvassa ( Z). Etsi luottamusvälit yleisen keskiarvon ja varianssin osalta P 1 = 0,95, P 2 = 0,99, P 3 = 0,999 jos = 19 = 6,766 cm = 0,554 g; σ x 2 = 29,153, σ y 2 = 2,111, σ z 2 = 0,064 (25 pistettä).

13. Syysvehnän satunnaisesti valitussa 100 tähkäpäässä laskettiin piikin määrä. Otosjoukkoa luonnehtivat seuraavat indikaattorit: = 15 piikkiä ja σ = 2,28 kpl. Määritä tarkkuus, jolla keskimääräinen tulos saadaan ( ) ja piirrä yleisen keskiarvon ja varianssin luottamusväli 95 % ja 99 % merkitsevyystasoilla (30 pistettä).

14. Fossiilisen nilviäisen kuorissa olevien kylkiluiden lukumäärä Orthamboniitit kalligrammi:

On tiedossa, että n = 19, σ = 4,25. Määritä yleisen keskiarvon ja yleisen varianssin luottamusvälin rajat merkitsevyystasolla W = 0,01 (25 pistettä).

15. Maitotuotosten määrittämiseksi kaupallisella maitotilalla määritettiin 15 lehmän tuottavuus päivittäin. Vuoden tietojen mukaan kukin lehmä antoi keskimäärin seuraavan maitomäärän päivässä (l): 22; yhdeksäntoista; 25; 20; 27; 17; kolmekymmentä; 21; kahdeksantoista; 24; 26; 23; 25; 20; 24. Piirrä yleisen varianssin ja aritmeettisen keskiarvon luottamusvälit. Voidaanko odottaa, että vuotuinen keskimääräinen maitotuotos lehmää kohden on 10 000 litraa? (50 pistettä).

16. Tilan keskimääräisen vehnäsadon määrittämiseksi niitto tehtiin 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 ja 2 ha näytepaloilla. Sato (c/ha) lohkoista oli 39,4; 38; 35,8; 40; 35; 42,7; 39,3; 41,6; 33; 42; 29 vastaavasti. Piirrä yleisen varianssin ja aritmeettisen keskiarvon luottamusvälit. Onko mahdollista odottaa, että maatalousyrityksen keskisato on 42 snt/ha? (50 pistettä).

Tilastoissa on kahdenlaisia ​​arvioita: piste- ja intervalli. Piste-arvio on yksiotostilasto, jota käytetään populaatioparametrin arvioimiseen. Esimerkiksi otoskeskiarvo on pisteestimaatti perusjoukon keskiarvosta ja otosvarianssista S2- pisteestimaatti väestön varianssista σ2. osoitettiin, että otoksen keskiarvo on puolueeton arvio väestöodotuksesta. Otoskeskiarvoa kutsutaan puolueettomaksi, koska kaikkien otoskeskiarvojen keskiarvo (samalla otoskoolla n) on yhtä suuri kuin yleisen väestön matemaattinen odotus.

Otosvarianssin vuoksi S2 tuli populaation varianssin puolueeton estimaattori σ2, otosvarianssin nimittäjä tulee asettaa yhtä suureksi kuin n – 1 , mutta ei n. Toisin sanoen populaation varianssi on kaikkien mahdollisten otosvarianssien keskiarvo.

Populaatioparametreja arvioitaessa tulee pitää mielessä, että otantatilastot, kuten , riippuu tietyistä näytteistä. Ottaakseen tämän tosiasian huomioon, saadakseen intervalliarvio yleisen populaation matemaattinen odotus analysoi otoskeskiarvojen jakautumista (katso lisätietoja). Konstruoitua intervallia luonnehtii tietty luottamustaso, joka on todennäköisyys, että yleisen perusjoukon todellinen parametri on estimoinut oikein. Samanlaisia ​​luottamusväliä voidaan käyttää ominaisuuden osuuden arvioimiseen R ja yleisen väestön pääasiallinen jakautunut massa.

Lataa muistiinpano muodossa tai muodossa, esimerkkejä muodossa

Luottamusvälin muodostaminen tunnetun keskihajonnan omaavan yleisen populaation matemaattiselle odotukselle

Luottamusvälin luominen ominaisuuden osuudelle yleisessä populaatiossa

Tässä osiossa luottamusvälin käsite on laajennettu kategorisille tiedoille. Näin voit arvioida ominaisuuden osuuden yleisestä väestöstä R näyteosuudella RS= X/n. Kuten mainittiin, jos arvot nR ja n(1 - p) ylittää luvun 5, binomijakauma voidaan approksimoida normaalilla. Siksi arvioida piirteen osuus väestöstä R on mahdollista rakentaa intervalli, jonka luottamustaso on yhtä suuri (1 - α) x 100 %.


missä pS- ominaisuuden näyteosuus, yhtä suuri kuin X/n, eli onnistumisten määrä jaettuna otoskoolla, R- ominaisuuden osuus väestöstä, Z on standardoidun normaalijakauman kriittinen arvo, n- otoskoko.

Esimerkki 3 Oletetaan, että tietojärjestelmästä poimitaan näyte, joka koostuu 100 viimeisen kuukauden aikana valmistuneesta laskusta. Oletetaan, että 10 näistä laskuista on virheellisiä. Täten, R= 10/100 = 0,1. 95 %:n luottamustaso vastaa kriittistä arvoa Z = 1,96.

Näin ollen on 95 %:n todennäköisyys, että 4,12-15,88 % laskuista sisältää virheitä.

Tietylle otoskoolle ominaisen osuuden sisältävä luottamusväli näyttää olevan laajempi kuin jatkuvan satunnaismuuttujan kohdalla. Tämä johtuu siitä, että jatkuvan satunnaismuuttujan mittaukset sisältävät enemmän tietoa kuin kategorisen datan mittaukset. Toisin sanoen kategorisissa tiedoissa, joissa on vain kaksi arvoa, ei ole riittävästi tietoa niiden jakautumisen parametrien arvioimiseksi.

ATrajallisesta populaatiosta saatujen arvioiden laskeminen

Matemaattisen odotuksen estimointi. Lopullisen populaation korjauskerroin ( fpc) käytettiin vähentämään keskivirhettä kertoimella . Populaatioparametrien arvioiden luottamusväliä laskettaessa käytetään korjauskerrointa tilanteissa, joissa otoksia otetaan ilman korvaamista. Siten matemaattisen odotuksen luottamusväli, jonka luottamustaso on yhtä suuri kuin (1 - α) x 100 %, lasketaan kaavalla:

Esimerkki 4 Korjauskertoimen soveltamisen havainnollistamiseksi rajallisella perusjoukolla palataan yllä olevassa esimerkissä 3 käsiteltyyn laskujen keskimääräisen määrän luottamusvälin laskemiseen. Oletetaan, että yritys laatii 5 000 laskua kuukaudessa, ja =110,27 USD, S= 28,95 dollaria N = 5000, n = 100, α = 0,05, t99 = 1,9842. Kaavan (6) mukaan saamme:

Arvio ominaisuuden osuudesta. Kun valitset ei palautusta, sen ominaisuuden osuuden luottamusväli, jonka luottamustaso on yhtä suuri (1 - α) x 100 %, lasketaan kaavalla:

Luottamusvälit ja eettiset ongelmat

Populaatiota otettaessa ja tilastollisia päätelmiä laadittaessa syntyy usein eettisiä ongelmia. Pääasia on, miten otantatilastojen luottamusvälit ja pisteestimaatit sopivat yhteen. Pisteestimaattien julkaiseminen ilman asianmukaisten luottamusvälien (yleensä 95 %:n luottamustasoilla) ja otoskoon, josta ne on johdettu, määrittelyä voi olla harhaanjohtavaa. Tämä voi antaa käyttäjälle vaikutelman, että pistearvio on juuri se, mitä hän tarvitsee ennustaakseen koko populaation ominaisuuksia. On siis ymmärrettävä, että kaikissa tutkimuksissa etusijalle tulee asettaa ei piste-, vaan intervalliestimaatit. Lisäksi on kiinnitettävä erityistä huomiota otoskokojen oikeaan valintaan.

Useimmiten tilastollisen manipuloinnin kohteena ovat erilaisia ​​poliittisia kysymyksiä koskevien väestön sosiologisten tutkimusten tulokset. Samanaikaisesti kyselyn tulokset sijoitetaan sanomalehtien etusivuille ja otosvirhe ja tilastollisen analyysin metodologia painetaan jonnekin keskelle. Saatujen pisteestimaattien paikkansapitävyyden todistamiseksi on tarpeen ilmoittaa otoskoko, jonka perusteella ne on saatu, luottamusvälin rajat ja sen merkitsevyystaso.

Seuraava huomautus

Materiaalina on käytetty kirjaa Levin et al. Statistics for managers. - M.: Williams, 2004. - s. 448–462

Keskirajalause toteaa, että riittävän suurella otoskoolla keskiarvojen otosjakauma voidaan approksimoida normaalijakaumalla. Tämä ominaisuus ei riipu väestöjakauman tyypistä.

Edellisissä alaosissa pohdimme tuntemattoman parametrin estimointia a yksi numero. Tällaista arviointia kutsutaan "pisteeksi". Useissa tehtävissä ei vaadita vain parametrin etsimistä a sopiva numeerinen arvo, mutta myös arvioida sen tarkkuus ja luotettavuus. On tiedettävä, mihin virheisiin parametrien korvaaminen voi johtaa a sen pistearvio a ja millä varmuudella voimme odottaa, että nämä virheet eivät ylitä tunnettuja rajoja?

Tämän tyyppiset ongelmat ovat erityisen tärkeitä pienelle määrälle havaintoja, kun pisteestimaatti ja sisään on suurelta osin satunnainen ja a:n likimääräinen korvaaminen a:lla voi johtaa vakaviin virheisiin.

Antaa käsityksen arvion tarkkuudesta ja luotettavuudesta a,

matemaattisissa tilastoissa käytetään ns. luottamusväliä ja luottamustodennäköisyyksiä.

Anna parametrille a johdettu kokemuksesta puolueeton arvio a. Haluamme arvioida mahdollisen virheen tässä tapauksessa. Määritetään jokin riittävän suuri todennäköisyys p (esim. p = 0,9, 0,95 tai 0,99), jotta tapahtumaa, jonka todennäköisyys on p, voidaan pitää käytännössä varmana, ja löydetään s:n arvo, jolle

Sitten vaihdettaessa esiintyvän virheen käytännössä mahdollisten arvojen alue a päällä a, on ± s; suuret absoluuttiset virheet ilmestyvät vain pienellä todennäköisyydellä a = 1 - p. Kirjoitetaan (14.3.1) uudelleen muotoon:

Yhtälö (14.3.2) tarkoittaa, että todennäköisyydellä p parametrin tuntematon arvo a kuuluu väliin

Tässä tapauksessa on huomioitava yksi seikka. Aiemmin pohdimme toistuvasti todennäköisyyttä, että satunnaismuuttuja putoaa tiettyyn ei-satunnaisväliin. Tässä tilanne on toinen: a ei satunnainen, vaan satunnainen intervalli / r. Satunnaisesti sen sijainti x-akselilla, sen keskusta määrittää a; yleensä välin 2s pituus on myös satunnainen, koska s:n arvo lasketaan pääsääntöisesti kokeellisista tiedoista. Siksi tässä tapauksessa olisi parempi tulkita p:n arvoa ei todennäköisyydeksi "lyödä" pisteeseen a väliin / p, vaan todennäköisyydellä, että satunnainen intervalli / p kattaa pisteen a(Kuva 14.3.1).

Riisi. 14.3.1

Todennäköisyyttä p kutsutaan luottamustaso, ja väli / p - luottamusväli. Intervallirajat jos. a x \u003d a- s ja a 2 = a + ja niitä kutsutaan luottamuksen rajoja.

Annetaan vielä yksi tulkinta luottamusvälin käsitteelle: sitä voidaan pitää parametriarvojen intervallina a, yhteensopivia kokeellisten tietojen kanssa eivätkä ole ristiriidassa niiden kanssa. Itse asiassa, jos suostumme pitämään tapahtumaa, jonka todennäköisyys a = 1-p on käytännössä mahdotonta, niin ne parametrin a arvot, joille a - a> s on tunnustettava ristiriitaiseksi kokeellisten tietojen kanssa, ja ne, joiden |a - a a t na 2.

Anna parametrille a on puolueeton arvio a. Jos tietäisimme määrän jakautumisen lain a, luottamusvälin löytämisen ongelma olisi melko yksinkertainen: riittäisi löytää s:n arvo, jolle

Vaikeus piilee siinä, että arvion jakautumislaki a riippuu määrän jakautumisen laista X ja näin ollen sen tuntemattomilla parametreilla (erityisesti itse parametrilla a).

Tämän vaikeuden kiertämiseksi voidaan käyttää seuraavaa karkeasti likimääräistä temppua: korvaa s:n lausekkeen tuntemattomat parametrit niiden pisteestimaateilla. Suhteellisen suurella määrällä kokeita P(noin 20 ... 30) tämä tekniikka antaa yleensä tyydyttäviä tuloksia tarkkuuden suhteen.

Harkitse esimerkkinä matemaattisen odotuksen luottamusvälin ongelmaa.

Anna tuotettu P x, jonka ominaisuudet ovat matemaattinen odotus t ja varianssi D- tuntematon. Näille parametreille saatiin seuraavat arviot:

Matemaattiselle odotukselle on rakennettava luottamusväli / р, joka vastaa luottamustodennäköisyyttä р t määriä x.

Tämän ongelman ratkaisemisessa käytämme sitä tosiasiaa, että määrä t on summa P riippumattomat identtisesti jakautuneet satunnaismuuttujat X h ja keskirajalauseen mukaan riittävän suurille P sen jakautumislaki on lähellä normaalia. Käytännössä jopa suhteellisen pienellä termien määrällä (luokkaa 10 ... 20) summan jakautumislakia voidaan pitää suunnilleen normaalina. Oletetaan, että arvo t jaetaan normaalin lain mukaan. Tämän lain ominaisuudet - matemaattinen odotus ja varianssi - ovat vastaavasti samat t ja

(ks. luku 13 alakohta 13.3). Oletetaan, että arvo D tiedämme ja löydämme sellaisen arvon Ep, jolle

Luvun 6 kaavaa (6.3.5) soveltaen ilmaistamme todennäköisyyden (14.3.5) vasemmalla puolella normaalijakauman funktiona

missä on estimaatin keskihajonta t.

Yhtälöstä

etsi Sp-arvo:

missä arg Ф* (x) on funktion Ф* käänteisfunktio (X), nuo. argumentin sellainen arvo, jonka normaalijakaumafunktio on yhtä suuri X.

Dispersio D, jonka kautta arvo ilmaistaan a 1P, emme tiedä tarkasti; sen likimääräisenä arvona voit käyttää arviota D(14.3.4) ja laita noin:

Siten luottamusvälin muodostamisen ongelma on likimäärin ratkaistu, mikä on yhtä suuri kuin:

jossa gp määritellään kaavalla (14.3.7).

Käänteisen interpoloinnin välttämiseksi funktion Ф * (l) taulukoissa s p:tä laskettaessa on kätevää laatia erityinen taulukko (taulukko 14.3.1), jossa luetellaan suuren arvot

r:stä riippuen. Arvo (p määrittää normaalille laille keskihajonnan määrän, joka on jätettävä sivuun dispersiokeskuksen oikealle ja vasemmalle puolelle, jotta todennäköisyys putoaa tuloksena olevalle alueelle on yhtä suuri kuin p.

Arvon 7 p kautta luottamusväli ilmaistaan ​​seuraavasti:

Taulukko 14.3.1

Esimerkki 1 Arvolla suoritettiin 20 koetta x; tulokset näkyvät taulukossa. 14.3.2.

Taulukko 14.3.2

On löydettävä arvio määrän matemaattiselle odotukselle X ja muodostaa luottamusväli, joka vastaa luottamustasoa p = 0,8.

Päätös. Meillä on:

Valitsemalla origoksi n: = 10, kolmannen kaavan (14.2.14) mukaan saadaan puolueeton estimaatti D :

Taulukon mukaan 14.3.1 löydämme

Luottamusrajat:

Luottamusväli:

Parametrien arvot t, tällä välillä olevat ovat yhteensopivia taulukossa annettujen kokeellisten tietojen kanssa. 14.3.2.

Samalla tavalla varianssille voidaan muodostaa luottamusväli.

Anna tuotettu P riippumattomia kokeita satunnaismuuttujalla X tuntemattomilla parametreilla ja A:sta sekä varianssille D puolueeton arvio saadaan:

Varianssille on rakennettava likimäärin luottamusväli.

Kaavasta (14.3.11) voidaan nähdä, että arvo D edustaa

määrä P muodon satunnaismuuttujat . Nämä arvot eivät ole

riippumaton, koska mikä tahansa niistä sisältää määrän t, riippuvainen kaikista muista. Voidaan kuitenkin osoittaa, että kuten P myös niiden summan jakautumislaki on lähellä normaalia. Melkein klo P= 20...30 sitä voidaan jo pitää normaalina.

Oletetaan, että näin on, ja etsitään tämän lain ominaisuudet: matemaattinen odotus ja varianssi. Pisteiden jälkeen D- puolueeton siis M[D] = D.

Varianssilaskenta D D liittyy suhteellisen monimutkaisiin laskelmiin, joten annamme sen lausekkeen ilman johtamista:

missä c 4 - suuren neljäs keskusmomentti x.

Jos haluat käyttää tätä lauseketta, sinun on korvattava siinä arvot 4 ja D(ainakin likimääräinen). Sijasta D voit käyttää arviointia D. Periaatteessa neljäs keskeinen momentti voidaan korvata myös sen arviolla, esimerkiksi muodon arvolla:

mutta tällainen korvaaminen antaa erittäin alhaisen tarkkuuden, koska yleensä rajoitetulla määrällä kokeita korkealuokkaiset momentit määritetään suurilla virheillä. Käytännössä kuitenkin usein käy niin, että suuren jakautumislain muoto X tiedetään etukäteen: vain sen parametrit ovat tuntemattomia. Sitten voimme yrittää ilmaista u4:n termeillä D.

Otetaan yleisin tapaus, kun arvo X jaetaan normaalin lain mukaan. Sitten sen neljäs keskusmomentti ilmaistaan ​​varianssina (katso luvun 6 alakohta 6.2);

ja kaava (14.3.12) antaa tai

Korvaa (14.3.14) tuntematon D hänen arvionsa D, saamme: mistä

Hetki u 4 voidaan ilmaista termeillä D myös joissakin muissa tapauksissa, kun määrän jakautuminen X ei ole normaalia, mutta sen ulkonäkö tunnetaan. Esimerkiksi tasaisen tiheyden laille (katso luku 5) meillä on:

missä (a, P) on väli, jolle laki annetaan.

Siten,

Kaavan (14.3.12) mukaan saamme: mistä löydämme suunnilleen

Tapauksissa, joissa arvon 26 jakauman lain muotoa ei tunneta, on a /):n arvoa arvioitaessa silti suositeltavaa käyttää kaavaa (14.3.16), jos ei ole erityistä syytä uskoa, että tämä laki on hyvin erilainen kuin normaali (sillä on havaittava positiivinen tai negatiivinen kurtoosi) .

Jos a /):n likimääräinen arvo saadaan tavalla tai toisella, niin varianssille on mahdollista muodostaa luottamusväli samalla tavalla kuin rakensimme sen matemaattiselle odotukselle:

jossa annetusta todennäköisyydestä p riippuva arvo löytyy taulukosta. 14.3.1.

Esimerkki 2. Etsi noin 80 %:n luottamusväli satunnaismuuttujan varianssille X esimerkin 1 olosuhteissa, jos tiedetään, että arvo X jaetaan lähellä normaalia lain mukaan.

Päätös. Arvo pysyy samana kuin taulukossa. 14.3.1:

Kaavan (14.3.16) mukaan

Kaavan (14.3.18) mukaan saadaan luottamusväli:

Keskihajonnan vastaava arvoalue: (0,21; 0,29).

14.4. Tarkat menetelmät normaalilain mukaan jakautuneen satunnaismuuttujan parametrien luottamusvälien muodostamiseen

Edellisessä alaosassa tarkastelimme karkeasti likimääräisiä menetelmiä keskiarvon ja varianssin luottamusvälien muodostamiseksi. Tässä annamme käsityksen täsmällisistä menetelmistä saman ongelman ratkaisemiseksi. Korostamme, että luottamusvälien tarkan löytämiseksi on ehdottomasti tiedettävä etukäteen suuren jakautumislain muoto x, tämä ei ole tarpeen likimääräisten menetelmien soveltamiseksi.

Ajatus tarkoista menetelmistä luottamusvälien muodostamiseksi on seuraava. Mikä tahansa luottamusväli löytyy ehdosta, joka ilmaisee joidenkin epäyhtälöiden täyttymisen todennäköisyyden, joka sisältää meitä kiinnostavan arvion a. Arvosanajaon laki a yleensä riippuu suuren tuntemattomista parametreista x. Joskus on kuitenkin mahdollista siirtää epäyhtälöitä satunnaismuuttujasta a johonkin muuhun havaittujen arvojen funktioon X p X 2, ..., X s. jonka jakautumislaki ei riipu tuntemattomista parametreista, vaan riippuu vain kokeiden määrästä ja suuren jakautumislain muodosta x. Tällaisilla satunnaismuuttujilla on suuri rooli matemaattisissa tilastoissa; niitä on tutkittu yksityiskohtaisimmin suuren normaalijakauman tapauksessa x.

On esimerkiksi todistettu, että suuren normaalijakaumassa X satunnainen arvo

sovelletaan ns Opiskelijoiden jakelulaki kanssa P- 1 vapausaste; tämän lain tiheydellä on muoto

jossa G(x) on tunnettu gammafunktio:

On myös todistettu, että satunnaismuuttuja

on "jakelu % 2 " kanssa P- 1 vapausaste (katso luku 7), jonka tiheys ilmaistaan ​​kaavalla

Käsittelemättä jakaumien (14.4.2) ja (14.4.4) johdannaisia, näytämme, kuinka niitä voidaan soveltaa luotaessa parametrien luottamusväliä Ty D.

Anna tuotettu P riippumattomia kokeita satunnaismuuttujalla x, jaetaan normaalin lain mukaan tuntemattomilla parametreilla TIO. Näille parametreille arviot

Molemmille parametreille on muodostettava luottamusvälit, jotka vastaavat luottamustodennäköisyyttä p.

Muodostetaan ensin luottamusväli matemaattiselle odotukselle. On luonnollista ottaa tämä väli symmetriseksi suhteessa t; merkitsee s p:llä puolta välin pituudesta. Sp:n arvo on valittava siten, että ehto

Yritetään välittää yhtälön (14.4.5) vasen puoli satunnaismuuttujasta t satunnaismuuttujaan T, jaetaan opiskelijalain mukaisesti. Tätä varten kerromme epäyhtälön |m-w?| molemmat osat

positiiviseen arvoon: tai käyttämällä merkintää (14.4.1),

Etsitään sellainen luku / p, että arvo / p voidaan löytää ehdosta

Kaavasta (14.4.2) voidaan nähdä, että (1) on parillinen funktio, joten (14.4.8) antaa

Tasa-arvo (14.4.9) määrittää arvon / p riippuen p:stä. Jos sinulla on käytettävissäsi integraaliarvojen taulukko

silloin arvo / p löytyy käänteisellä interpoloinnilla taulukosta. On kuitenkin kätevämpää laatia arvotaulukko / p etukäteen. Tällainen taulukko on liitteessä (Taulukko 5). Tämä taulukko näyttää arvot, jotka riippuvat luottamustodennäköisyydestä p ja vapausasteiden lukumäärästä P- 1. Määritettyään / p taulukon mukaan. 5 ja olettaen

löydämme puolet luottamusvälin / p leveydestä ja itse intervallin

Esimerkki 1. 5 riippumatonta koetta suoritettiin satunnaismuuttujalla x, normaalisti jakautunut tuntemattomilla parametreilla t ja noin. Kokeiden tulokset on esitetty taulukossa. 14.4.1.

Taulukko 14.4.1

Etsi arvio t matemaattiselle odotukselle ja muodosta sille 90 %:n luottamusväli / p (eli väli, joka vastaa luottamustodennäköisyyttä p \u003d 0,9).

Päätös. Meillä on:

Hakemuksen taulukon 5 mukaan P - 1 = 4 ja p = 0,9 löydämme missä

Luottamusväli on

Esimerkki 2. Kohdan 14.3 esimerkin 1 ehdoille, olettaen arvon X normaalijakaumassa, etsi tarkka luottamusväli.

Päätös. Hakemuksen taulukon 5 mukaan löydämme klo P - 1 = 19ir =

0,8/p = 1,328; täältä

Verrattuna luvun 14.3 esimerkin 1 ratkaisuun (e p = 0,072), huomaamme, että ero on hyvin pieni. Jos pidämme tarkkuuden toisen desimaalin tarkkuudella, niin tarkalla ja likimääräisellä menetelmällä löydetyt luottamusvälit ovat samat:

Jatketaan varianssin luottamusvälin muodostamista. Harkitse puolueetonta varianssiarviota

ja ilmaisee satunnaismuuttujan D arvon kautta V(14.4.3), jonka jakauma x 2 (14.4.4):

Suuren jakautumislain tunteminen V, on mahdollista löytää väli / (1 ), johon se osuu annetulla todennäköisyydellä p.

jakelulaki k n _ x (v) I 7:n arvo on kuvan 1 mukaisessa muodossa. 14.4.1.

Riisi. 14.4.1

Herää kysymys: kuinka valita intervalli / p? Jos määrän jakautumislaki V oli symmetrinen (kuten normaalilaki tai Studentin jakauma), olisi luonnollista ottaa väli /p symmetriseksi matemaattisen odotuksen suhteen. Tässä tapauksessa laki k n _ x (v) epäsymmetrinen. Sovitaan, että valitaan väli /p niin, että suuren tulostodennäköisyydet V välin ulkopuolella oikealla ja vasemmalla (varjostetut alueet kuvassa 14.4.1) olivat samat ja yhtä suuret

Luodaksemme intervallin / p tällä ominaisuudella, käytämme taulukkoa. 4 sovellusta: se sisältää numeroita y) sellasta

määrän vuoksi V, jolla on x 2 -jakauma r vapausasteella. Meidän tapauksessamme r = n- 1. Korjaa r = n- 1 ja etsi taulukon vastaavalta riviltä. 4 kaksi arvoa x 2 - toinen vastaa todennäköisyyttä toinen - todennäköisyydet Nimetään nämä

arvot klo 2 ja xl? Välillä on v 2 , vasemmalla ja y~ oikea pää.

Nyt löydämme vaaditun luottamusvälin /| varianssille rajojen D, ja kanssa D2, joka kattaa asian D todennäköisyydellä p:

Muodostetaan sellainen intervalli / (, = (?> b A), joka kattaa pisteen D jos ja vain jos arvo V putoaa väliin / r. Osoittakaamme, että väli

täyttää tämän ehdon. Todellakin, eriarvoisuudet vastaavat eriarvoisuutta

ja nämä epäyhtälöt pätevät todennäköisyydellä p. Siten dispersion luottamusväli löydetään ja ilmaistaan ​​kaavalla (14.4.13).

Esimerkki 3. Etsi varianssin luottamusväli luvun 14.3 esimerkin 2 olosuhteissa, jos tiedetään, että arvo X jaettu normaalisti.

Päätös. Meillä on . Hakemuksen taulukon 4 mukaan

löydämme klo r = n - 1 = 19

Kaavan (14.4.13) mukaan saadaan dispersion luottamusväli

Keskihajonnan vastaava väli: (0,21; 0,32). Tämä intervalli ylittää vain vähän välin (0,21; 0,29) alakohdan 14.3 esimerkissä 2 likimääräisellä menetelmällä.

  • Kuvassa 14.3.1 tarkastellaan luottamusväliä, joka on symmetrinen a:n suhteen. Yleensä, kuten näemme myöhemmin, tämä ei ole välttämätöntä.

Luottamusvälien estimointi

Oppimistavoitteet

Tilastot huomioivat seuraavaa kaksi päätehtävää:

    Meillä on näytetietoihin perustuva arvio, ja haluamme tehdä jonkinlaisen todennäköisyyslausunnon siitä, missä arvioitavan parametrin todellinen arvo on.

    Meillä on erityinen hypoteesi, joka on testattava näytetietojen perusteella.

Tässä aiheessa tarkastelemme ensimmäistä ongelmaa. Esittelemme myös luottamusvälin määritelmän.

Luottamusväli on intervalli, joka on rakennettu parametrin estimoidun arvon ympärille ja osoittaa, missä arvioidun parametrin todellinen arvo on ennalta annetulla todennäköisyydellä.

Tutkittuasi tätä aihetta käsittelevän materiaalin:

    oppia mikä on estimaatin luottamusväli;

    oppia luokittelemaan tilastollisia ongelmia;

    hallitsee luottamusvälien muodostamistekniikan sekä tilastokaavojen että ohjelmistotyökalujen avulla;

    oppia määrittämään vaaditut otoskoot tiettyjen tilastollisten arvioiden tarkkuuden parametrien saavuttamiseksi.

Näytteen ominaisuuksien jakaumat

T-jakelu

Kuten edellä on todettu, satunnaismuuttujan jakauma on lähellä standardoitua normaalijakaumaa parametreilla 0 ja 1. Koska emme tiedä σ:n arvoa, korvaamme sen jollain estimaatilla s . Määrällä on jo erilainen jakautuminen, nimittäin tai Opiskelijoiden jakelu, joka määritetään parametrilla n -1 (vapausasteiden lukumäärä). Tämä jakauma on lähellä normaalijakaumaa (mitä suurempi n, sitä läheisempiä jakaumia).

Kuvassa 95
Esitetään opiskelijan jakauma 30 vapausasteella. Kuten näet, se on hyvin lähellä normaalijakaumaa.

Normaalijakauman NORMDIST ja NORMINV kanssa työskentelyyn tarkoitettujen toimintojen tapaan on olemassa toimintoja t-jakauman kanssa työskentelyyn - STUDIST (TDIST) ja STUDRASPBR (TINV). Esimerkki näiden toimintojen käytöstä löytyy STUDRIST.XLS-tiedostosta (malli ja ratkaisu) ja kuvasta 96
.

Muiden ominaisuuksien jakaumat

Kuten jo tiedämme, odotusestimaatin tarkkuuden määrittämiseksi tarvitsemme t-jakauman. Muiden parametrien, kuten varianssin, arvioimiseksi tarvitaan muita jakaumia. Kaksi niistä on F-jakauma ja x 2 -jakauma.

Keskiarvon luottamusväli

Luottamusväli on intervalli, joka on rakennettu parametrin arvioidun arvon ympärille ja osoittaa, missä arvioidun parametrin todellinen arvo on ennalta annetulla todennäköisyydellä.

Keskiarvolle muodostuu luottamusväli seuraavalla tavalla:

Esimerkki

Pikaruokaravintola aikoo laajentaa valikoimaansa uudenlaisella voileivällä. Sen kysynnän arvioimiseksi johtaja aikoo valita satunnaisesti 40 vierailijaa sitä jo kokeilijoiden joukosta ja pyytää heitä arvioimaan suhtautumistaan ​​uuteen tuotteeseen asteikolla 1-10. Johtaja haluaa arvioida odotettu pistemäärä, jonka uusi tuote saa, ja muodosta 95 %:n luottamusväli tälle arviolle. Kuinka tehdä se? (katso tiedosto SANDWICH1.XLS (malli ja ratkaisu).

Päätös

Voit ratkaista tämän ongelman käyttämällä . Tulokset on esitetty kuvassa. 97
.

Kokonaisarvon luottamusväli

Joskus näytetietojen mukaan joudutaan arvioimaan ei matemaattista odotusta, vaan arvojen kokonaissummaa. Esimerkiksi tilanteessa, jossa on tilintarkastaja, voi olla kiinnostavaa arvioida laskun keskiarvon sijasta kaikkien laskujen summa.

Olkoon N alkioiden kokonaismäärä, n otoksen koko, T 3 otoksen arvojen summa, T" summan estimaatti koko populaatiolle, , ja luottamusväli lasketaan kaavalla , jossa s on otoksen keskihajonnan estimaatti, on otoksen keskiarvon estimaatti.

Esimerkki

Oletetaan, että verovirasto haluaa arvioida 10 000 veronmaksajan veronpalautuksen kokonaismäärän. Veronmaksaja joko saa palautuksen tai maksaa lisäveroa. Etsi 95 %:n luottamusväli hyvityssummalle olettaen, että otoskoko on 500 henkilöä (katso tiedosto REFUND AMOUNT.XLS (malli ja ratkaisu).

Päätös

StatProssa ei ole erityistä menettelyä tähän tapaukseen, mutta voit nähdä, että rajat voidaan saada keskiarvon rajoista yllä olevilla kaavoilla (kuva 98).
).

Suhteen luottamusväli

Olkoon p odotus asiakkaista ja pv tämän osuuden estimaatti, joka on saatu koon n otoksesta. Voidaan osoittaa, että riittävän suurille estimaattijakauma on lähellä normaalia keskiarvolla p ja keskihajonnan kanssa . Arvioinnin keskivirhe tässä tapauksessa ilmaistaan ​​muodossa , ja luottamusväli as .

Esimerkki

Pikaruokaravintola aikoo laajentaa valikoimaansa uudenlaisella voileivällä. Sen kysynnän arvioimiseksi johtaja valitsi satunnaisesti 40 vierailijaa sitä jo kokeilleiden joukosta ja pyysi heitä arvioimaan suhtautumisensa uuteen tuotteeseen asteikolla 1-10. Johtaja haluaa arvioida odotetun osuuden. asiakkaista, jotka arvioivat uutta tuotetta vähintään 6 pistettä (hän ​​odottaa näiden asiakkaiden olevan uuden tuotteen kuluttajia).

Päätös

Aluksi luodaan uusi sarake 1:n perusteella, jos asiakkaan pisteet olivat yli 6 pistettä ja muuten 0 (katso SANDWICH2.XLS-tiedosto (malli ja ratkaisu).

Menetelmä 1

Laskemalla luvun 1, arvioimme osuuden ja käytämme sitten kaavoja.

Z cr:n arvo on otettu erityisistä normaalijakaumataulukoista (esimerkiksi 1,96 95 %:n luottamusvälille).

Käyttämällä tätä lähestymistapaa ja erityisiä tietoja 95 %:n intervallin muodostamiseksi saamme seuraavat tulokset (kuva 99
). Parametrin z cr kriittinen arvo on 1,96. Arvion keskivirhe on 0,077. Luottamusvälin alaraja on 0,475. Luottamusvälin yläraja on 0,775. Johtaja voi siis olettaa 95 %:n varmuudella, että niiden asiakkaiden prosenttiosuus, jotka arvioivat uudelle tuotteelle vähintään 6 pistettä, on 47,5–77,5.

Menetelmä 2

Tämä ongelma voidaan ratkaista tavallisilla StatPro-työkaluilla. Tätä varten riittää, kun huomataan, että osuus on tässä tapauksessa sama kuin Tyyppi-sarakkeen keskiarvo. Hae seuraavaksi StatPro / Tilastollinen päätelmä / Yhden näytteen analyysi luodaksesi luottamusvälin Tyyppi-sarakkeen keskiarvolle (odotusarvio). Tässä tapauksessa saadut tulokset ovat hyvin lähellä 1. menetelmän tulosta (kuva 99).

Keskihajonnan luottamusväli

s käytetään keskihajonnan estimaattina (kaava on luvussa 1). Pisteen s tiheysfunktio on khin neliöfunktio, jolla, kuten t-jakaumalla, on n-1 vapausastetta. Tämän jakelun kanssa työskentelemiseen on erikoistoimintoja CHI2DIST (CHIDIST) ja CHI2OBR (CHIINV) .

Luottamusväli ei tässä tapauksessa ole enää symmetrinen. Rajojen ehdollinen kaavio on esitetty kuvassa. 100 .

Esimerkki

Koneen tulee tuottaa osia, joiden halkaisija on 10 cm, mutta eri olosuhteista johtuen tapahtuu virheitä. Laadunvalvoja on huolissaan kahdesta asiasta: ensinnäkin keskiarvon tulee olla 10 cm; toiseksi, jopa tässä tapauksessa, jos poikkeamat ovat suuria, monet yksityiskohdat hylätään. Hän tekee joka päivä 50 osan näytteen (katso tiedosto QUALITY CONTROL.XLS (malli ja ratkaisu). Mitä johtopäätöksiä tällainen näyte voi tehdä?

Päätös

Rakennamme 95 %:n luottamusvälit keskiarvolle ja keskihajonnalle käyttämällä StatPro / Tilastollinen päätelmä / Yhden näytteen analyysi(Kuva 101
).

Lisäksi, käyttämällä oletusta läpimittojen normaalijakaumasta, laskemme viallisten tuotteiden osuuden asettamalla maksimipoikkeamaksi 0,065. Hakutaulukon (kahden parametrin tapaus) avulla rakennetaan hylättyjen prosenttiosuuden riippuvuus keskiarvosta ja keskihajonnasta (kuva 102).
).

Kahden keskiarvon eron luottamusväli

Tämä on yksi tilastomenetelmien tärkeimmistä sovelluksista. Esimerkkejä tilanteesta.

    Vaatekaupan johtaja haluaisi tietää, kuinka paljon enemmän tai vähemmän keskimääräinen naisasiakas viettää kaupassa kuin mies.

    Molemmat lentoyhtiöt lentävät samanlaisilla reiteillä. Kuluttajajärjestö haluaisi verrata molempien lentoyhtiöiden keskimääräisten odotettujen lentojen viivästymisaikojen välistä eroa.

    Yritys lähettää kuponkeja tietyntyyppisille tavaroille yhdessä kaupungissa, mutta ei lähetä toisessa. Johtajat haluavat verrata näiden tuotteiden keskimääräisiä ostoja kahden seuraavan kuukauden aikana.

    Autokauppias on usein tekemisissä avioparien kanssa. Ymmärtääkseen heidän henkilökohtaisia ​​reaktioitaan esitykseen pariskunnat haastatellaan usein erikseen. Johtaja haluaa arvioida eroa miesten ja naisten antamissa arvioissa.

Riippumattomien näytteiden tapaus

Keskimääräisellä erolla on t-jakauma n 1 + n 2 - 2 vapausasteen kanssa. Luottamusväli μ 1 - μ 2 ilmaistaan ​​suhteella:

Tämä ongelma voidaan ratkaista ei vain yllä olevilla kaavoilla, vaan myös tavallisilla StatPro-työkaluilla. Tätä varten riittää hakeminen

Suhteiden välisen eron luottamusväli

Antaa olla osakkeiden matemaattinen odotus. Olkoon niiden otosestimaatit rakennettu n 1 ja n 2 kokoisille näytteille. Sitten on arvio erolle. Siksi tämän eron luottamusväli ilmaistaan ​​seuraavasti:

Tässä z cr on erikoistaulukoiden normaalijakaumasta saatu arvo (esimerkiksi 1,96 95 %:n luottamusvälille).

Arvioinnin keskivirhe ilmaistaan ​​tässä tapauksessa suhteella:

.

Esimerkki

Suurmyyntiä valmistautuessaan myymälä teki seuraavan markkinointitutkimuksen. 300 parasta ostajaa valittiin ja jaettiin satunnaisesti kahteen 150 jäsenen ryhmään. Kaikille valituille ostajille lähetettiin kutsut osallistua myyntiin, mutta vain ensimmäisen ryhmän jäsenille liitettiin kuponki, joka oikeuttaa 5 % alennukseen. Myynnin yhteydessä kirjattiin kaikkien 300 valitun ostajan ostot. Miten johtaja voi tulkita tuloksia ja tehdä arvion kuponkien tehokkuudesta? (Katso COUPONS.XLS-tiedosto (malli ja ratkaisu)).

Päätös

Meidän tapauksessamme 150 alennuskupongin saaneesta asiakkaasta 55 teki ostoksen alennusmyynnissä ja 150:stä, jotka eivät saaneet kuponkia, vain 35 teki ostoksen (kuva 103).
). Tällöin näyteosuuksien arvot ovat 0,3667 ja 0,2333. Ja niiden välinen näyteero on vastaavasti 0,1333. Olettaen, että luottamusväli on 95 %, saadaan normaalijakaumataulukosta z cr = 1,96. Näyteeron keskivirheen laskenta on 0,0524. Lopuksi saamme, että 95 %:n luottamusvälin alaraja on 0,0307 ja yläraja 0,2359. Saatuja tuloksia voidaan tulkita siten, että jokaista 100 alennuskupongin saanutta asiakasta kohden voimme odottaa 3-23 uutta asiakasta. On kuitenkin syytä muistaa, että tämä johtopäätös ei sinänsä tarkoita kuponkien käytön tehokkuutta (koska alennuksella menetämme voittoa!). Osoitetaan tämä tietyillä tiedoilla. Oletetaan, että keskimääräinen ostosumma on 400 ruplaa, josta 50 ruplaa. on kaupasta voittoa. Sitten odotettu voitto 100:ta asiakasta, jotka eivät saaneet kuponkia, on yhtä suuri:

50 0,2333 100 \u003d 1166,50 ruplaa.

Samanlaiset laskelmat 100 kupongin saaneelle ostajalle antavat:

30 0,3667 100 \u003d 1100,10 ruplaa.

Keskimääräisen voiton lasku 30:een selittyy sillä, että alennusta käyttämällä kupongin saaneet ostajat tekevät ostoksen keskimäärin 380 ruplalla.

Siten lopullinen johtopäätös osoittaa tällaisten kuponkien käytön tehottomuuden tässä erityistilanteessa.

Kommentti. Tämä ongelma voidaan ratkaista tavallisilla StatPro-työkaluilla. Tätä varten riittää pelkistää tämä ongelma kahden keskiarvon eron estimoimiseen menetelmällä ja sitten soveltaa StatPro/Tilastollinen päätelmä/Kahden otoksen analyysi luoda luottamusväli kahden keskiarvon väliselle erolle.

Luottamusvälin hallinta

Luottamusvälin pituus riippuu seuraavat ehdot:

    suoraan data (keskihajonta);

    merkitsevyystaso;

    otoskoko.

Otoskoko keskiarvon arvioimiseksi

Tarkastellaanpa ensin ongelmaa yleisessä tapauksessa. Merkitään meille annetun luottamusvälin puolen pituuden arvo B:ksi (kuva 104).
). Tiedämme, että jonkin satunnaismuuttujan X keskiarvon luottamusväli ilmaistaan ​​muodossa , missä . Olettaen:

ja ilmaisemalla n , saamme .

Valitettavasti emme tiedä satunnaismuuttujan X varianssin tarkkaa arvoa. Lisäksi emme tiedä t cr:n arvoa, koska se riippuu n:stä vapausasteiden lukumäärän kautta. Tässä tilanteessa voimme tehdä seuraavaa. Varianssin s sijasta käytämme jonkin verran varianssin estimaattia tutkittavan satunnaismuuttujan joidenkin käytettävissä olevien realisaatioiden kohdalla. Normaalijakaumaan käytetään t cr -arvon sijaan z cr -arvoa. Tämä on täysin hyväksyttävää, koska normaali- ja t-jakauman tiheysfunktiot ovat hyvin lähellä (paitsi pienten n:n tapauksessa). Siten haluttu kaava saa muodon:

.

Koska kaava antaa yleisesti ottaen ei-kokonaislukuja, pyöristys tuloksen ylijäämällä otetaan halutuksi otoskooksi.

Esimerkki

Pikaruokaravintola aikoo laajentaa valikoimaansa uudenlaisella voileivällä. Arvioidakseen sen kysyntää johtaja suunnittelee satunnaisesti valitsevansa kävijöitä jo kokeilleiden joukosta ja pyytää heitä arvioimaan suhtautumisensa uuteen tuotteeseen asteikolla 1-10. Johtaja haluaa arvioidaksesi uuden tuotteen odotetun pistemäärän, tuotteen ja piirrä tämän arvion 95 %:n luottamusväli. Hän haluaa kuitenkin, että puolet luottamusvälin leveydestä ei ylitä 0,3:a. Kuinka monta kävijää hän tarvitsee kyselyyn?

seuraavasti:

Tässä r ots on arvio murto-osasta p ja B on annettu puolet luottamusvälin pituudesta. Paisutettu arvo n:lle voidaan saada käyttämällä arvoa r ots= 0,5. Tässä tapauksessa luottamusvälin pituus ei ylitä annettua arvoa B millekään p:n todelliselle arvolle.

Esimerkki

Anna edellisen esimerkin johtajan suunnitella, kuinka paljon asiakkaita suosii uudenlaista tuotetta. Hän haluaa rakentaa 90 %:n luottamusvälin, jonka puolipituus on pienempi tai yhtä suuri kuin 0,05. Kuinka monta asiakasta pitäisi ottaa satunnaisesti?

Päätös

Meidän tapauksessamme z cr:n arvo = 1,645. Siksi tarvittava määrä lasketaan seuraavasti .

Jos esimiehellä olisi syytä uskoa, että haluttu p:n arvo on esimerkiksi noin 0,3, niin korvaamalla tämä arvo yllä olevassa kaavassa, saisimme pienemmän satunnaisotoksen arvon, nimittäin 228.

Määritettävä kaava satunnaisotoskoot, jos kahden keskiarvon välillä on ero kirjoitettuna:

.

Esimerkki

Jollakin tietokoneyrityksellä on asiakaspalvelukeskus. Viime aikoina asiakkaiden valitukset huonosta palvelun laadusta ovat lisääntyneet. Palvelukeskuksessa työskentelee pääosin kahdenlaisia ​​työntekijöitä: vähän kokemusta omaavia, mutta erityiskoulutuksen suorittaneita ja laajan käytännön kokemuksen omaavia, jotka eivät ole suorittaneet erityiskursseja. Yhtiö haluaa analysoida asiakkaiden valituksia viimeisen kuuden kuukauden ajalta ja verrata niiden keskimääräisiä lukuja molempia työntekijöitä kohden. Oletetaan, että molempien ryhmien näytteiden numerot ovat samat. Kuinka monta työntekijää on otettava otokseen, jotta saadaan 95 %:n väli, jonka puolikaspituus on enintään 2?

Päätös

Tässä σ ots on arvio molempien satunnaismuuttujien keskihajonnasta olettaen, että ne ovat lähellä. Siten meidän on tehtävässämme jotenkin saatava tämä arvio. Tämä voidaan tehdä esimerkiksi seuraavasti. Kun tarkastellaan asiakasvalitustietoja viimeisen kuuden kuukauden ajalta, johtaja saattaa huomata, että työntekijää kohden on yleensä 6–36 valitusta. Tietäen, että normaalijakaumassa käytännössä kaikki arvot ovat korkeintaan kolme standardipoikkeamaa keskiarvosta, hän voi kohtuudella uskoa, että:

, josta σ ots = 5.

Korvaamalla tämän arvon kaavaan, saamme .

Määritettävä kaava satunnaisotoksen koko, kun estimoidaan osuuksien välistä eroa näyttää:

Esimerkki

Joillakin yrityksillä on kaksi tehdasta vastaavien tuotteiden tuotantoa varten. Yrityksen johtaja haluaa vertailla molempien tehtaiden vikoja. Saatavilla olevien tietojen mukaan hylkäysaste molemmilla tehtailla on 3-5 %. Sen oletetaan rakentavan 99 %:n luottamusväli, jonka puolikkaan pituus on enintään 0,005 (tai 0,5 %). Kuinka monta tuotetta jokaiselta tehtaalta tulisi valita?

Päätös

Tässä p 1ot ja p 2ot ovat arvioita kahdesta tuntemattomasta hylkyjen fraktiosta 1. ja 2. tehtaalla. Jos laitamme p 1ots \u003d p 2ots \u003d 0,5, niin saamme n:lle yliarvioidun arvon. Mutta koska meidän tapauksessamme on jonkin verran ennakkotietoa näistä osakkeista, otamme näiden osakkeiden yläarvion, nimittäin 0,05. Saamme

Kun estimoidaan joitain populaatioparametreja otostiedoista, on hyödyllistä antaa parametrin pisteestimaattien lisäksi myös luottamusväli, joka osoittaa, missä arvioitavan parametrin tarkka arvo voi olla.

Tässä luvussa tutustuimme myös kvantitatiivisiin suhteisiin, joiden avulla voimme rakentaa tällaisia ​​intervalleja eri parametreille; oppinut tapoja hallita luottamusvälin pituutta.

Huomaa myös, että otoskoon estimointiongelma (kokeilusuunnitteluongelma) voidaan ratkaista käyttämällä StatPron vakiotyökaluja, nimittäin StatPro/tilastollinen päätelmä/näytteen koon valinta.

Mieli ei ole vain tiedossa, vaan myös kyvyssä soveltaa tietoa käytännössä. (Aristoteles)

Luottamusvälit

yleinen arvostelu

Ottamalla otoksen perusjoukosta saamme pisteestimaatin meitä kiinnostavasta parametrista ja laskemme keskivirheen estimaatin tarkkuuden osoittamiseksi.

Useimmissa tapauksissa standardivirhe sinänsä ei kuitenkaan ole hyväksyttävää. On paljon hyödyllisempää yhdistää tämä tarkkuusmitta populaatioparametrin intervalliarvioon.

Tämä voidaan tehdä käyttämällä tietoa otostilaston (parametrin) teoreettisesta todennäköisyysjakaumasta, jotta parametrille voidaan laskea luottamusväli (CI - luottamusväli, CI - luottamusväli).

Yleensä luottamusväli laajentaa arvioita molempiin suuntiin jollain (tietyn parametrin) standardivirheen kerrannaisella; kaksi arvoa (luottamusrajat), jotka määrittävät intervallin, erotetaan yleensä pilkulla ja on suljettu suluissa.

Keskiarvon luottamusväli

Normaalijakaumaa käyttämällä

Otoskeskiarvolla on normaalijakauma, jos otoskoko on suuri, joten tietoa normaalijakaumasta voidaan soveltaa otoskeskiarvoa tarkasteltaessa.

Erityisesti 95 % otoskeskiarvojen jakaumasta on 1,96 keskihajonnan (SD) sisällä populaation keskiarvosta.

Kun meillä on vain yksi näyte, kutsumme tätä keskiarvon standardivirheeksi (SEM) ja laskemme keskiarvon 95 %:n luottamusvälin seuraavasti:

Jos tämä koe toistetaan useita kertoja, väli sisältää todellisen populaation keskiarvon 95 % ajasta.

Tämä on yleensä luottamusväli, kuten arvoalue, jonka sisällä todellinen väestökeskiarvo (yleinen keskiarvo) on 95 %:n luottamustasolla.

Vaikka ei olekaan aivan tiukkaa (populaatiokeskiarvo on kiinteä arvo, eikä sillä siksi voi olla siihen liittyvää todennäköisyyttä) tulkita luottamusväliä tällä tavalla, on se käsitteellisesti helpompi ymmärtää.

Käyttö t- jakelu

Voit käyttää normaalijakaumaa, jos tiedät populaation varianssin arvon. Myös, kun otoskoko on pieni, otoksen keskiarvo noudattaa normaalijakaumaa, jos perusjoukon taustalla olevat tiedot ovat normaalijakaumia.

Jos populaation taustalla olevat tiedot eivät ole normaalijakautuneita ja/tai yleisvarianssia (populaatiovarianssia) ei tunneta, otoksen keskiarvo noudattaa Opiskelijan t-jakauma.

Laske populaation keskiarvon 95 %:n luottamusväli seuraavasti:

Missä - prosenttiyksikkö (prosenttipiste) t- Opiskelijajakauma (n-1) vapausasteilla, mikä antaa kaksisuuntaiseksi todennäköisyydeksi 0,05.

Yleensä se tarjoaa laajemman intervallin kuin normaalijakaumaa käytettäessä, koska se ottaa huomioon populaation keskihajonnan estimoimisen ja/tai pienestä otoskoon aiheuttaman lisäepävarmuuden.

Kun otoskoko on suuri (luokkaa 100 tai enemmän), näiden kahden jakauman välinen ero ( t-opiskelija ja normaali) on mitätön. Käytä kuitenkin aina t- jakauma luottamusväliä laskettaessa, vaikka otoskoko olisi suuri.

Yleensä annetaan 95 % CI. Muita luottamusväliä voidaan laskea, kuten 99 % CI keskiarvolle.

Vakiovirheen ja taulukon arvon tulon sijaan t- jakauma, joka vastaa kaksisuuntaista todennäköisyyttä 0,05, kerro se (keskivirhe) arvolla, joka vastaa kaksisuuntaista todennäköisyyttä 0,01. Tämä on laajempi luottamusväli kuin 95 %:n tapauksessa, koska se heijastaa lisääntynyttä luottamusta siihen, että väli todellakin sisältää perusjoukon keskiarvon.

Suhteen luottamusväli

Suhteiden otantajakaumalla on binomijakauma. Kuitenkin, jos otoskoko n kohtuullisen suuri, silloin otosjakauma on suunnilleen normaali keskiarvon kanssa.

Arvio otossuhteella p=r/n(missä r- otokseen kuuluvien henkilöiden lukumäärä, joilla on meitä kiinnostavat ominaisuudet), ja keskivirhe on arvioitu:

Osuuden 95 %:n luottamusväli on arvioitu:

Jos otoskoko on pieni (yleensä kun np tai n(1-p) pienempi 5 ), silloin on käytettävä binomijakaumaa tarkan luottamusvälin laskemiseksi.

Huomaa, että jos p prosentteina ilmaistuna (1-p) korvattu (100p).

Luottamusvälien tulkinta

Luottamusväliä tulkittaessa olemme kiinnostuneita seuraavista kysymyksistä:

Kuinka leveä luottamusväli on?

Leveä luottamusväli osoittaa, että estimaatti on epätarkka; kapea tarkoittaa hienoa arviota.

Luottamusvälin leveys riippuu keskivirheen koosta, joka puolestaan ​​riippuu otoksen koosta, ja kun otetaan huomioon numeerinen muuttuja tietojen vaihtelusta, antaa laajemmat luottamusvälit kuin tutkimukset suuresta muutaman tietojoukosta. muuttujia.

Sisältääkö CI mitään erityisen kiinnostavia arvoja?

Voit tarkistaa, onko populaatioparametrin todennäköinen arvo luottamusvälin sisällä. Jos kyllä, tulokset ovat tämän todennäköisen arvon mukaisia. Jos ei, niin on epätodennäköistä (95 %:n luottamusvälillä todennäköisyys on lähes 5 %), että parametrilla on tämä arvo.