Kalkulahin ang agwat ng kumpiyansa. Pagkalkula ng Confidence Interval sa Microsoft Excel

Ang "Katren-Style" ay patuloy na naglalathala ng isang cycle ng Konstantin Kravchik sa mga medikal na istatistika. Sa dalawang nakaraang artikulo, hinawakan ng may-akda ang paliwanag ng mga konseptong gaya ng at.

Konstantin Kravchik

Mathematician-analyst. Espesyalista sa larangan ng istatistikal na pananaliksik sa medisina at humanities

lungsod ng Moscow

Kadalasan sa mga artikulo sa mga klinikal na pagsubok ay makakahanap ka ng mahiwagang parirala: "interval ng kumpiyansa" (95% CI o 95% CI - agwat ng kumpiyansa). Halimbawa, maaaring sabihin ng isang artikulo: "Ginamit ang t-test ng mag-aaral upang masuri ang kahalagahan ng mga pagkakaiba, na may 95% na agwat ng kumpiyansa na kinakalkula."

Ano ang halaga ng "95% confidence interval" at bakit ito kinakalkula?

Ano ang confidence interval? - Ito ang hanay kung saan bumagsak ang totoong mean na mga halaga sa populasyon. At ano, may mga "hindi totoo" na average? Sa isang kahulugan, oo, ginagawa nila. Sa aming ipinaliwanag na imposibleng sukatin ang parameter ng interes sa buong populasyon, kaya ang mga mananaliksik ay kontento sa isang limitadong sample. Sa sample na ito (halimbawa, ayon sa timbang ng katawan) mayroong isang average na halaga (isang tiyak na timbang), kung saan hinuhusgahan namin ang average na halaga sa buong pangkalahatang populasyon. Gayunpaman, hindi malamang na ang average na timbang sa sample (lalo na ang isang maliit) ay magkakasabay sa average na timbang sa pangkalahatang populasyon. Samakatuwid, mas tama na kalkulahin at gamitin ang hanay ng mga average na halaga ng pangkalahatang populasyon.

Halimbawa, ipagpalagay na ang 95% confidence interval (95% CI) para sa hemoglobin ay nasa pagitan ng 110 at 122 g/L. Nangangahulugan ito na may 95 % na posibilidad, ang totoong mean na halaga para sa hemoglobin sa pangkalahatang populasyon ay nasa hanay mula 110 hanggang 122 g/l. Sa madaling salita, hindi namin alam ang average na hemoglobin sa pangkalahatang populasyon, ngunit maaari naming ipahiwatig ang hanay ng mga halaga para sa tampok na ito na may 95% na posibilidad.

Ang mga agwat ng kumpiyansa ay partikular na nauugnay sa pagkakaiba sa mga paraan sa pagitan ng mga grupo, o kung ano ang tinatawag na laki ng epekto.

Ipagpalagay na inihambing natin ang pagiging epektibo ng dalawang paghahanda ng bakal: ang isa na matagal nang nasa merkado at ang isa na kakarehistro pa lang. Matapos ang kurso ng therapy, ang konsentrasyon ng hemoglobin sa mga pinag-aralan na grupo ng mga pasyente ay nasuri, at ang programa ng istatistika ay kinakalkula para sa amin na ang pagkakaiba sa pagitan ng mga average na halaga ng dalawang grupo na may posibilidad na 95% ay nasa saklaw mula sa 1.72 hanggang 14.36 g/l (Talahanayan 1).

Tab. 1. Pamantayan para sa mga independiyenteng sample
(ang mga pangkat ay inihambing sa antas ng hemoglobin)

Dapat itong bigyang-kahulugan bilang mga sumusunod: sa isang bahagi ng mga pasyente sa pangkalahatang populasyon na umiinom ng bagong gamot, ang hemoglobin ay magiging mas mataas sa average ng 1.72–14.36 g/l kaysa sa mga umiinom na ng kilalang gamot.

Sa madaling salita, sa pangkalahatang populasyon, ang pagkakaiba sa average na mga halaga para sa hemoglobin sa mga pangkat na may 95% na posibilidad ay nasa loob ng mga limitasyong ito. Bahala na ang mananaliksik kung ito ay marami o kaunti. Ang punto ng lahat ng ito ay hindi kami nagtatrabaho sa isang average na halaga, ngunit sa isang hanay ng mga halaga, samakatuwid, mas mapagkakatiwalaan naming tinatantya ang pagkakaiba sa isang parameter sa pagitan ng mga pangkat.

Sa mga pakete ng istatistika, sa pagpapasya ng mananaliksik, ang isang tao ay maaaring nakapag-iisa na paliitin o palawakin ang mga hangganan ng agwat ng kumpiyansa. Sa pamamagitan ng pagpapababa ng mga probabilidad ng agwat ng kumpiyansa, pinaliit namin ang hanay ng mga paraan. Halimbawa, sa 90% CI, ang hanay ng mga paraan (o mga pagkakaiba sa ibig sabihin) ay magiging mas makitid kaysa sa 95% CI.

Sa kabaligtaran, ang pagtaas ng posibilidad sa 99% ay nagpapalawak sa hanay ng mga halaga. Kapag naghahambing ng mga grupo, ang mas mababang limitasyon ng CI ay maaaring tumawid sa zero mark. Halimbawa, kung pinahaba namin ang mga hangganan ng agwat ng kumpiyansa sa 99 %, ang mga hangganan ng agwat ay mula sa -1 hanggang 16 g/L. Nangangahulugan ito na sa pangkalahatang populasyon ay may mga pangkat, ang pagkakaiba sa pagitan ng mga average na kung saan para sa pinag-aralan na katangian ay 0 (M=0).

Maaaring gamitin ang mga pagitan ng kumpiyansa upang subukan ang mga istatistikal na hypotheses. Kung ang pagitan ng kumpiyansa ay tumawid sa zero na halaga, kung gayon ang null hypothesis, na ipinapalagay na ang mga pangkat ay hindi naiiba sa pinag-aralan na parameter, ay totoo. Ang isang halimbawa ay inilarawan sa itaas, noong pinalawak namin ang mga hangganan sa 99%. Sa isang lugar sa pangkalahatang populasyon, nakakita kami ng mga grupo na hindi naiiba sa anumang paraan.

95% confidence interval ng pagkakaiba sa hemoglobin, (g/l)


Ipinapakita ng figure ang 95% confidence interval ng mean hemoglobin difference sa pagitan ng dalawang grupo bilang isang linya. Ang linya ay pumasa sa zero mark, samakatuwid, mayroong pagkakaiba sa pagitan ng mga ibig sabihin na katumbas ng zero, na nagpapatunay sa null hypothesis na ang mga grupo ay hindi naiiba. Ang pagkakaiba sa pagitan ng mga pangkat ay mula -2 hanggang 5 g/l, na nangangahulugan na ang hemoglobin ay maaaring bumaba ng 2 g/l o tumaas ng 5 g/l.

Ang agwat ng kumpiyansa ay isang napakahalagang tagapagpahiwatig. Dahil dito, makikita mo kung ang mga pagkakaiba sa mga grupo ay talagang dahil sa pagkakaiba sa mga paraan o dahil sa isang malaking sample, dahil sa isang malaking sample, ang mga pagkakataon na makahanap ng mga pagkakaiba ay mas malaki kaysa sa isang maliit na sample.

Sa pagsasagawa, maaaring ganito ang hitsura nito. Kumuha kami ng sample ng 1000 katao, sinukat ang antas ng hemoglobin at nalaman na ang pagitan ng kumpiyansa para sa pagkakaiba sa mga ibig sabihin ay mula 1.2 hanggang 1.5 g/L. Ang antas ng istatistikal na kahalagahan sa kasong ito p

Nakikita namin na ang konsentrasyon ng hemoglobin ay tumaas, ngunit halos hindi mahahalata, samakatuwid, ang istatistikal na kahalagahan ay lumitaw nang tumpak dahil sa laki ng sample.

Ang mga agwat ng kumpiyansa ay maaaring kalkulahin hindi lamang para sa mga average, kundi pati na rin para sa mga proporsyon (at mga ratio ng panganib). Halimbawa, interesado kami sa agwat ng kumpiyansa ng mga proporsyon ng mga pasyente na nakamit ang pagpapatawad habang umiinom ng binuong gamot. Ipagpalagay na ang 95% CI para sa mga proporsyon, ibig sabihin, para sa proporsyon ng mga naturang pasyente, ay nasa hanay na 0.60–0.80. Kaya, maaari nating sabihin na ang ating gamot ay may therapeutic effect sa 60 hanggang 80% ng mga kaso.

Ang isip ay hindi lamang sa kaalaman, kundi pati na rin sa kakayahang ilapat ang kaalaman sa pagsasanay. (Aristotle)

Mga pagitan ng kumpiyansa

pangkalahatang pagsusuri

Pagkuha ng sample mula sa populasyon, kukuha kami ng puntong pagtatantya ng parameter ng interes sa amin at kalkulahin ang karaniwang error upang maipahiwatig ang katumpakan ng pagtatantya.

Gayunpaman, para sa karamihan ng mga kaso, ang karaniwang error na tulad nito ay hindi katanggap-tanggap. Mas kapaki-pakinabang na pagsamahin ang sukat na ito ng katumpakan sa isang pagtatantya ng pagitan para sa parameter ng populasyon.

Magagawa ito sa pamamagitan ng paggamit ng kaalaman sa pamamahagi ng teoretikal na probabilidad ng sample statistic (parameter) upang makalkula ang pagitan ng kumpiyansa (CI - Confidence Interval, CI - Confidence Interval) para sa parameter.

Sa pangkalahatan, pinalawak ng agwat ng kumpiyansa ang mga pagtatantya sa parehong direksyon sa pamamagitan ng ilang multiple ng karaniwang error (ng isang ibinigay na parameter); ang dalawang halaga (mga limitasyon ng kumpiyansa) na tumutukoy sa pagitan ay karaniwang pinaghihiwalay ng kuwit at nakapaloob sa mga panaklong.

Ang pagitan ng kumpiyansa para sa mean

Gamit ang normal na distribusyon

Ang sample mean ay may normal na distribusyon kung ang sample size ay malaki, kaya ang kaalaman sa normal na distribution ay maaaring magamit kapag isinasaalang-alang ang sample mean.

Sa partikular, 95% ng distribusyon ng sample na paraan ay nasa loob ng 1.96 standard deviations (SD) ng average ng populasyon.

Kapag mayroon lang kaming isang sample, tinatawag namin itong standard error of the mean (SEM) at kalkulahin ang 95% confidence interval para sa mean gaya ng sumusunod:

Kung ang eksperimentong ito ay paulit-ulit nang maraming beses, ang pagitan ay maglalaman ng totoong populasyon na ibig sabihin ay 95% ng oras.

Ito ay karaniwang isang agwat ng kumpiyansa, tulad ng hanay ng mga halaga kung saan ang ibig sabihin ng tunay na populasyon (pangkalahatang ibig sabihin) ay may 95% na antas ng kumpiyansa.

Bagama't hindi masyadong mahigpit (ang ibig sabihin ng populasyon ay isang nakapirming halaga at samakatuwid ay hindi maaaring magkaroon ng probabilidad na nauugnay dito) upang bigyang-kahulugan ang agwat ng kumpiyansa sa ganitong paraan, mas madaling maunawaan sa konsepto.

Paggamit t- pamamahagi

Maaari mong gamitin ang normal na distribusyon kung alam mo ang halaga ng pagkakaiba sa populasyon. Gayundin, kapag ang laki ng sample ay maliit, ang sample mean ay sumusunod sa isang normal na distribusyon kung ang data na pinagbabatayan ng populasyon ay normal na ipinamamahagi.

Kung ang data na pinagbabatayan ng populasyon ay hindi normal na ipinamamahagi at/o ang pangkalahatang pagkakaiba-iba (populasyon pagkakaiba) ay hindi alam, ang sample mean ay sumusunod T-distribution ng mag-aaral.

Kalkulahin ang 95% na agwat ng kumpiyansa para sa ibig sabihin ng populasyon tulad ng sumusunod:

Saan - porsyento ng punto (percentile) t- Pamamahagi ng mag-aaral na may (n-1) na antas ng kalayaan, na nagbibigay ng dalawang-tailed na posibilidad na 0.05.

Sa pangkalahatan, nagbibigay ito ng mas malawak na agwat kaysa kapag gumagamit ng normal na distribusyon, dahil isinasaalang-alang nito ang karagdagang kawalan ng katiyakan na ipinakilala sa pamamagitan ng pagtantya sa pamantayan ng paglihis ng populasyon at/o dahil sa maliit na laki ng sample.

Kapag malaki ang sample size (sa pagkakasunud-sunod na 100 o higit pa), ang pagkakaiba sa pagitan ng dalawang distribusyon ( t-estudyante at normal) ay bale-wala. Gayunpaman, palaging gamitin t- pamamahagi kapag kinakalkula ang mga pagitan ng kumpiyansa, kahit na ang laki ng sample ay malaki.

Karaniwang 95% CI ang ipinahiwatig. Maaaring kalkulahin ang iba pang mga agwat ng kumpiyansa, tulad ng 99% CI para sa mean.

Sa halip na produkto ng karaniwang error at halaga ng talahanayan t- pamamahagi na tumutugma sa isang dalawang-tailed na posibilidad na 0.05 i-multiply ito (karaniwang error) sa isang halaga na tumutugma sa isang dalawang-tailed na posibilidad na 0.01. Ito ay isang mas malawak na agwat ng kumpiyansa kaysa sa 95% na kaso dahil ito ay nagpapakita ng mas mataas na kumpiyansa na ang pagitan ay talagang kasama ang ibig sabihin ng populasyon.

Agwat ng kumpiyansa para sa proporsyon

Ang sampling distribution ng mga proporsyon ay may binomial distribution. Gayunpaman, kung ang laki ng sample n makatwirang malaki, kung gayon ang proporsyon ng sample distribution ay humigit-kumulang normal na may mean .

Tantyahin ayon sa sampling ratio p=r/n(saan r- ang bilang ng mga indibidwal sa sample na may mga katangian ng interes sa amin), at ang karaniwang error ay tinatantya:

Ang 95% na agwat ng kumpiyansa para sa proporsyon ay tinatantya:

Kung maliit ang sample size (karaniwan ay kapag np o n(1-p) mas mababa 5 ), pagkatapos ay dapat gamitin ang binomial distribution upang makalkula ang eksaktong mga pagitan ng kumpiyansa.

Tandaan na kung p ipinahayag bilang isang porsyento, kung gayon (1-p) pinalitan ng (100p).

Interpretasyon ng mga agwat ng kumpiyansa

Kapag binibigyang-kahulugan ang agwat ng kumpiyansa, interesado kami sa mga sumusunod na tanong:

Gaano kalawak ang agwat ng kumpiyansa?

Ang isang malawak na agwat ng kumpiyansa ay nagpapahiwatig na ang pagtatantya ay hindi tumpak; Ang makitid ay nagpapahiwatig ng isang mainam na pagtatantya.

Ang lapad ng agwat ng kumpiyansa ay nakasalalay sa laki ng karaniwang error, na, naman, ay nakasalalay sa laki ng sample at, kapag isinasaalang-alang ang isang numeric na variable mula sa pagkakaiba-iba ng data, nagbibigay ng mas malawak na agwat ng kumpiyansa kaysa sa mga pag-aaral ng isang malaking set ng data. ng ilang mga variable.

Kasama ba sa CI ang anumang mga halaga ng partikular na interes?

Maaari mong suriin kung ang malamang na halaga para sa isang parameter ng populasyon ay nasa loob ng agwat ng kumpiyansa. Kung oo, ang mga resulta ay pare-pareho sa malamang na halagang ito. Kung hindi, hindi malamang (para sa isang 95% na agwat ng kumpiyansa, ang pagkakataon ay halos 5%) na ang parameter ay may ganitong halaga.

Ipagpalagay na mayroon kaming isang malaking bilang ng mga item na may normal na pamamahagi ng ilang mga katangian (halimbawa, isang buong bodega ng mga gulay na may parehong uri, ang laki at bigat nito ay nag-iiba). Gusto mong malaman ang karaniwang mga katangian ng buong batch ng mga kalakal, ngunit wala kang oras o hilig na sukatin at timbangin ang bawat gulay. Naiintindihan mo na hindi ito kailangan. Ngunit ilang piraso ang kailangan mong kunin para sa random na inspeksyon?

Bago magbigay ng ilang mga formula na kapaki-pakinabang para sa sitwasyong ito, naaalala namin ang ilang notasyon.

Una, kung susukatin natin ang buong bodega ng mga gulay (ang hanay ng mga elementong ito ay tinatawag na pangkalahatang populasyon), malalaman natin sa lahat ng katumpakan na magagamit sa atin ang average na halaga ng bigat ng buong batch. Tawagin natin itong average X cf .g en . - pangkalahatang average. Alam na natin kung ano ang ganap na natutukoy kung ang ibig sabihin ng halaga at paglihis nito ay kilala . Totoo, sa ngayon hindi kami X avg. o s hindi natin alam ang pangkalahatang populasyon. Maaari lamang kaming kumuha ng ilang sample, sukatin ang mga halagang kailangan namin at kalkulahin para sa sample na ito pareho ang mean value na X sr. sa sample at ang standard deviation S sb.

Alam na kung ang aming pasadyang pagsusuri ay naglalaman ng isang malaking bilang ng mga elemento (karaniwang n ay mas malaki kaysa sa 30), at ang mga ito ay kinuha random talaga, pagkatapos ay s ang pangkalahatang populasyon ay halos hindi mag-iiba mula sa S ..

Bilang karagdagan, para sa kaso ng isang normal na distribusyon, maaari naming gamitin ang mga sumusunod na formula:

May posibilidad na 95%


May posibilidad na 99%



Sa pangkalahatan, may posibilidad na Р (t)


Ang kaugnayan sa pagitan ng halaga ng t at ng halaga ng probabilidad na P (t), kung saan nais nating malaman ang pagitan ng kumpiyansa, ay maaaring kunin mula sa sumusunod na talahanayan:


Kaya, natukoy namin kung anong hanay ang average na halaga para sa pangkalahatang populasyon (na may ibinigay na posibilidad).

Maliban kung mayroon kaming sapat na malaking sample, hindi namin masasabi na ang populasyon ay may s = S sel. Bilang karagdagan, sa kasong ito, ang pagiging malapit ng sample sa normal na pamamahagi ay may problema. Sa kasong ito, gamitin din ang S sb sa halip s sa formula:




ngunit ang halaga ng t para sa isang nakapirming probabilidad na P(t) ay depende sa bilang ng mga elemento sa sample n. Kung mas malaki ang n, mas malapit ang magreresultang agwat ng kumpiyansa sa halagang ibinigay ng formula (1). Ang mga halaga ng t sa kasong ito ay kinuha mula sa isa pang talahanayan (T-test ng mag-aaral), na ibinibigay namin sa ibaba:

Ang mga halaga ng t-test ng mag-aaral para sa posibilidad na 0.95 at 0.99


Halimbawa 3 30 katao ang random na pinili mula sa mga empleyado ng kumpanya. Ayon sa sample, lumabas na ang average na suweldo (bawat buwan) ay 30 libong rubles na may average na square deviation na 5 libong rubles. Sa probabilidad na 0.99 matukoy ang average na suweldo sa kompanya.

Solusyon: Sa kondisyon, mayroon tayong n = 30, X cf. =30000, S=5000, P=0.99. Upang mahanap ang agwat ng kumpiyansa, ginagamit namin ang formula na tumutugma sa pamantayan ng Estudyante. Ayon sa talahanayan para sa n \u003d 30 at P \u003d 0.99 nakita namin ang t \u003d 2.756, samakatuwid,


mga. ninanais na pagtitiwala pagitan 27484< Х ср.ген < 32516.

Kaya, na may posibilidad na 0.99, maaari itong maitalo na ang pagitan (27484; 32516) ay naglalaman ng average na suweldo sa kumpanya.

Umaasa kami na gagamitin mo ang paraang ito nang hindi kinakailangang may kasama kang spreadsheet sa bawat oras. Ang mga kalkulasyon ay maaaring awtomatikong isagawa sa Excel. Habang nasa isang Excel file, i-click ang fx button sa tuktok na menu. Pagkatapos, piliin sa mga function ang uri ng "statistical", at mula sa iminungkahing listahan sa kahon - STEUDRASP. Pagkatapos, sa prompt, paglalagay ng cursor sa field na "probability", i-type ang halaga ng reciprocal probability (iyon ay, sa aming kaso, sa halip na probabilidad na 0.95, kailangan mong i-type ang probabilidad na 0.05). Tila, ang spreadsheet ay idinisenyo upang masagot ng resulta ang tanong kung gaano tayo maaaring magkamali. Katulad nito, sa field na "degree of freedom," ilagay ang value (n-1) para sa iyong sample.

Ang isa sa mga pamamaraan para sa paglutas ng mga problema sa istatistika ay ang pagkalkula ng agwat ng kumpiyansa. Ito ay ginagamit bilang isang ginustong alternatibo sa point estimation kapag ang sample size ay maliit. Dapat tandaan na ang proseso ng pagkalkula ng agwat ng kumpiyansa ay medyo kumplikado. Ngunit ang mga tool ng Excel program ay nagbibigay-daan sa iyo na medyo pasimplehin ito. Alamin natin kung paano ito ginagawa sa pagsasanay.

Ang pamamaraang ito ay ginagamit sa pagtatantya ng pagitan ng iba't ibang istatistikal na dami. Ang pangunahing gawain ng pagkalkula na ito ay upang mapupuksa ang mga kawalan ng katiyakan ng pagtatantya ng punto.

Sa Excel, mayroong dalawang pangunahing pagpipilian upang makalkula gamit ang pamamaraang ito: kapag ang pagkakaiba ay kilala, at kapag ito ay hindi kilala. Sa unang kaso, ang function ay ginagamit para sa mga kalkulasyon NORM NG tiwala sa sarili, at sa pangalawa MAGTIWALA.ESTUDYANTE.

Paraan 1: function ng CONFIDENCE NORM

Operator NORM NG tiwala sa sarili, na tumutukoy sa pangkat ng istatistika ng mga pag-andar, unang lumitaw sa Excel 2010. Ginagamit ng mga naunang bersyon ng program na ito ang katapat nito TIWALA. Ang gawain ng operator na ito ay kalkulahin ang isang agwat ng kumpiyansa na may normal na distribusyon para sa average ng populasyon.

Ang syntax nito ay ang mga sumusunod:

CONFIDENCE NORM(alpha, standard_dev, size)

"Alpha" ay isang argumentong nagsasaad ng antas ng kahalagahan na ginagamit upang kalkulahin ang antas ng kumpiyansa. Ang antas ng kumpiyansa ay katumbas ng sumusunod na expression:

(1-"Alpha")*100

"Karaniwang lihis" ay isang argumento, ang kakanyahan nito ay malinaw sa pangalan. Ito ang karaniwang paglihis ng iminungkahing sample.

"Ang sukat" ay isang argumento na tumutukoy sa laki ng sample.

Ang lahat ng mga argumento sa operator na ito ay kinakailangan.

Function TIWALA ay may eksaktong parehong mga argumento at posibilidad tulad ng nauna. Ang syntax nito ay:

TRUST(alpha, standard_dev, laki)

Tulad ng nakikita mo, ang mga pagkakaiba ay nasa pangalan lamang ng operator. Ang tampok na ito ay pinanatili sa Excel 2010 at mga mas bagong bersyon sa isang espesyal na kategorya para sa mga dahilan ng pagiging tugma. "Pagkatugma". Sa mga bersyon ng Excel 2007 at mas maaga, ito ay naroroon sa pangunahing pangkat ng mga istatistikal na operator.

Ang hangganan ng agwat ng kumpiyansa ay tinutukoy gamit ang formula ng sumusunod na anyo:

X+(-)NORMA NG PAGTITIWALA

saan X ay ang sample mean, na matatagpuan sa gitna ng napiling hanay.

Ngayon tingnan natin kung paano kalkulahin ang agwat ng kumpiyansa gamit ang isang partikular na halimbawa. 12 mga pagsubok ang isinagawa, na nagresulta sa iba't ibang mga resulta, na nakalista sa talahanayan. Ito ang ating kabuuan. Ang standard deviation ay 8. Kailangan nating kalkulahin ang confidence interval sa 97% confidence level.

  1. Piliin ang cell kung saan ipapakita ang resulta ng pagproseso ng data. Ang pag-click sa pindutan "Insert Function".
  2. Lumilitaw Function Wizard. Pumunta sa kategorya "Istatistika" at i-highlight ang pangalan "CONFIDENCE.NORM". Pagkatapos ay mag-click sa pindutan OK.
  3. Bubukas ang window ng mga argumento. Ang mga patlang nito ay natural na tumutugma sa mga pangalan ng mga argumento.
    Itakda ang cursor sa unang field - "Alpha". Dito dapat nating tukuyin ang antas ng kahalagahan. Sa ating natatandaan, ang ating antas ng pagtitiwala ay 97%. Kasabay nito, sinabi namin na ito ay kinakalkula sa ganitong paraan:

    (1-level ng tiwala)/100

    Iyon ay, sa pamamagitan ng pagpapalit ng halaga, makakakuha tayo ng:

    Sa pamamagitan ng mga simpleng kalkulasyon, nalaman namin na ang argumento "Alpha" katumbas 0,03 . Ilagay ang value na ito sa field.

    Tulad ng alam mo, ang standard deviation ay katumbas ng 8 . Samakatuwid, sa larangan "Karaniwang lihis" isulat lang ang numerong iyan.

    Sa field "Ang sukat" kailangan mong ipasok ang bilang ng mga elemento ng mga pagsubok na isinagawa. As we remember, sila 12 . Ngunit para ma-automate ang formula at hindi ito i-edit sa tuwing may gagawing bagong pagsubok, itakda natin ang value na ito hindi sa ordinaryong numero, ngunit gamit ang operator. SURIIN. Kaya, itinakda namin ang cursor sa field "Ang sukat", at pagkatapos ay mag-click sa tatsulok, na matatagpuan sa kaliwa ng formula bar.

    Lumilitaw ang isang listahan ng mga kamakailang ginamit na function. Kung ang operator SURIIN ginamit mo kamakailan, dapat itong nasa listahang ito. Sa kasong ito, kailangan mo lamang i-click ang pangalan nito. Kung hindi, kung hindi mo mahanap ito, pagkatapos ay pumunta sa punto "Higit pang mga tampok...".

  4. Parang pamilyar na sa amin Function Wizard. Lumipat pabalik sa grupo "Istatistika". Pipili kami ng pangalan doon "SURIIN". Mag-click sa pindutan OK.
  5. Lumilitaw ang window ng argumento para sa operator sa itaas. Ang function na ito ay idinisenyo upang kalkulahin ang bilang ng mga cell sa tinukoy na hanay na naglalaman ng mga numerong halaga. Ang syntax nito ay ang sumusunod:

    COUNT(value1, value2,…)

    Grupo ng argumento "Mga halaga" ay isang reference sa hanay kung saan mo gustong kalkulahin ang bilang ng mga cell na puno ng numeric data. Sa kabuuan, maaaring magkaroon ng hanggang 255 ganoong mga argumento, ngunit sa aming kaso kailangan lang namin ng isa.

    Itakda ang cursor sa field "Halaga1" at, pagpindot sa kaliwang pindutan ng mouse, piliin ang hanay sa sheet na naglalaman ng aming populasyon. Pagkatapos ang address nito ay ipapakita sa field. Mag-click sa pindutan OK.

  6. Pagkatapos nito, gagawin ng application ang pagkalkula at ipapakita ang resulta sa cell kung saan ito mismo. Sa aming partikular na kaso, ang formula ay naging ganito:

    CONFIDENCE NORM(0.03,8,COUNT(B2:B13))

    Ang kabuuang resulta ng mga kalkulasyon ay 5,011609 .

  7. Ngunit hindi lang iyon. Tulad ng naaalala namin, ang hangganan ng agwat ng kumpiyansa ay kinakalkula sa pamamagitan ng pagdaragdag at pagbabawas mula sa average na sample na halaga ng resulta ng pagkalkula. NORM NG tiwala sa sarili. Sa ganitong paraan, kinakalkula ang kanan at kaliwang mga hangganan ng agwat ng kumpiyansa, ayon sa pagkakabanggit. Ang sample mean mismo ay maaaring kalkulahin gamit ang operator AVERAGE.

    Ang operator na ito ay idinisenyo upang kalkulahin ang arithmetic mean ng napiling hanay ng mga numero. Mayroon itong sumusunod na medyo simpleng syntax:

    AVERAGE(number1, number2,…)

    Pangangatwiran "Numero" maaaring maging isang solong numeric na halaga o isang reference sa mga cell o kahit na buong hanay na naglalaman ng mga ito.

    Kaya, piliin ang cell kung saan ipapakita ang pagkalkula ng average na halaga, at mag-click sa pindutan "Insert Function".

  8. nagbubukas Function Wizard. Bumalik sa kategorya "Istatistika" at pumili ng pangalan mula sa listahan "AVERAGE". Gaya ng nakasanayan, mag-click sa pindutan OK.
  9. Inilunsad ang window ng mga argumento. Itakda ang cursor sa field "Number1" at kapag pinindot ang kaliwang pindutan ng mouse, piliin ang buong hanay ng mga halaga. Matapos ipakita ang mga coordinate sa field, mag-click sa pindutan OK.
  10. Pagkatapos noon AVERAGE output ang resulta ng pagkalkula sa isang elemento ng sheet.
  11. Kinakalkula namin ang tamang hangganan ng agwat ng kumpiyansa. Upang gawin ito, pumili ng isang hiwalay na cell, ilagay ang sign «=» at idagdag ang mga nilalaman ng mga elemento ng sheet kung saan matatagpuan ang mga resulta ng pagkalkula ng mga function AVERAGE at NORM NG tiwala sa sarili. Upang maisagawa ang pagkalkula, pindutin ang pindutan Pumasok. Sa aming kaso, nakuha namin ang sumusunod na formula:

    Resulta ng pagkalkula: 6,953276

  12. Sa parehong paraan, kinakalkula namin ang kaliwang hangganan ng agwat ng kumpiyansa, sa pagkakataong ito lamang mula sa resulta ng pagkalkula AVERAGE ibawas ang resulta ng pagkalkula ng operator NORM NG tiwala sa sarili. Lumalabas ang formula para sa aming halimbawa ng sumusunod na uri:

    Resulta ng pagkalkula: -3,06994

  13. Sinubukan naming ilarawan nang detalyado ang lahat ng mga hakbang para sa pagkalkula ng agwat ng kumpiyansa, kaya inilarawan namin nang detalyado ang bawat formula. Ngunit maaari mong pagsamahin ang lahat ng mga aksyon sa isang formula. Ang pagkalkula ng tamang hangganan ng pagitan ng kumpiyansa ay maaaring isulat tulad ng sumusunod:

    AVERAGE(B2:B13)+CONFIDENCE(0.03,8,COUNT(B2:B13))

  14. Ang isang katulad na pagkalkula ng kaliwang hangganan ay magiging ganito:

    AVERAGE(B2:B13)-CONFIDENCE.NORM(0.03,8,COUNT(B2:B13))

Paraan 2: TRUST.STUDENT function

Bilang karagdagan, mayroong isa pang function sa Excel na nauugnay sa pagkalkula ng agwat ng kumpiyansa - MAGTIWALA.ESTUDYANTE. Ito ay lumitaw lamang mula noong Excel 2010. Ginagawa ng operator na ito ang pagkalkula ng pagitan ng kumpiyansa ng populasyon gamit ang t-distribution ng Mag-aaral. Ito ay napaka-maginhawang gamitin ito sa kaso kapag ang pagkakaiba at, nang naaayon, ang karaniwang paglihis ay hindi alam. Ang operator syntax ay:

TRUST.STUDENT(alpha,standard_dev,size)

Tulad ng nakikita mo, ang mga pangalan ng mga operator sa kasong ito ay nanatiling hindi nagbabago.

Tingnan natin kung paano kalkulahin ang mga hangganan ng agwat ng kumpiyansa na may hindi kilalang standard deviation gamit ang halimbawa ng parehong populasyon na isinasaalang-alang namin sa nakaraang pamamaraan. Yung level of confidence, like last time, kukuha tayo ng 97%.

  1. Piliin ang cell kung saan gagawin ang pagkalkula. Mag-click sa pindutan "Insert Function".
  2. Sa binuksan Function Wizard pumunta sa kategorya "Istatistika". Pumili ng pangalan "TIWALA. MAG-AARAL". Mag-click sa pindutan OK.
  3. Ang window ng argumento para sa tinukoy na operator ay inilunsad.

    Sa field "Alpha", dahil ang antas ng kumpiyansa ay 97%, isinusulat namin ang numero 0,03 . Sa pangalawang pagkakataon ay hindi tayo magtatagal sa mga prinsipyo ng pagkalkula ng parameter na ito.

    Pagkatapos nito, itakda ang cursor sa field "Karaniwang lihis". Sa pagkakataong ito, ang tagapagpahiwatig na ito ay hindi alam sa amin at kailangan itong kalkulahin. Ginagawa ito gamit ang isang espesyal na function - STDEV.V. Upang tawagan ang window ng operator na ito, mag-click sa tatsulok sa kaliwa ng formula bar. Kung hindi namin mahanap ang nais na pangalan sa listahan na bubukas, pagkatapos ay pumunta sa item "Higit pang mga tampok...".

  4. ay tumatakbo Function Wizard. Lumipat sa kategorya "Istatistika" at markahan ang pangalan "STDEV.B". Pagkatapos ay mag-click sa pindutan OK.
  5. Bubukas ang window ng mga argumento. gawain ng operator STDEV.V ay ang kahulugan ng standard deviation sa sampling. Mukhang ganito ang syntax nito:

    STDEV.V(number1,number2,…)

    Ito ay madaling hulaan na ang argumento "Numero" ay ang address ng elemento ng pagpili. Kung ang pagpili ay inilagay sa isang array, pagkatapos ay gumagamit lamang ng isang argumento, maaari kang magbigay ng isang link sa hanay na ito.

    Itakda ang cursor sa field "Number1" at, gaya ng nakasanayan, pagpindot sa kaliwang pindutan ng mouse, piliin ang set. Matapos ang mga coordinate ay nasa field, huwag magmadali upang pindutin ang pindutan OK dahil mali ang magiging resulta. Una kailangan nating bumalik sa window ng mga argumento ng operator MAGTIWALA.ESTUDYANTE upang gawin ang pangwakas na argumento. Upang gawin ito, mag-click sa naaangkop na pangalan sa formula bar.

  6. Ang window ng argumento ng pamilyar na function ay bubukas muli. Itakda ang cursor sa field "Ang sukat". Muli, mag-click sa tatsulok na pamilyar sa amin upang pumunta sa pagpili ng mga operator. Tulad ng naiintindihan mo, kailangan namin ng isang pangalan "SURIIN". Dahil ginamit namin ang function na ito sa mga kalkulasyon sa nakaraang pamamaraan, naroroon ito sa listahang ito, kaya i-click lamang ito. Kung hindi mo ito mahanap, pagkatapos ay sundin ang algorithm na inilarawan sa unang paraan.
  7. Pagpasok sa window ng mga argumento SURIIN, ilagay ang cursor sa field "Number1" at habang pinipigilan ang pindutan ng mouse, piliin ang koleksyon. Pagkatapos ay mag-click sa pindutan OK.
  8. Pagkatapos nito, kinakalkula at ipinapakita ng programa ang halaga ng agwat ng kumpiyansa.
  9. Upang matukoy ang mga hangganan, kakailanganin nating kalkulahin muli ang sample mean. Ngunit, ibinigay na ang pagkalkula algorithm gamit ang formula AVERAGE katulad ng sa nakaraang pamamaraan, at kahit na ang resulta ay hindi nagbago, hindi namin ito tatalakayin nang detalyado sa pangalawang pagkakataon.
  10. Pagdaragdag ng mga resulta ng pagkalkula AVERAGE at MAGTIWALA.ESTUDYANTE, nakuha namin ang tamang hangganan ng agwat ng kumpiyansa.
  11. Pagbabawas mula sa mga resulta ng pagkalkula ng operator AVERAGE resulta ng pagkalkula MAGTIWALA.ESTUDYANTE, mayroon kaming left bound ng confidence interval.
  12. Kung ang pagkalkula ay nakasulat sa isang formula, kung gayon ang pagkalkula ng tamang hangganan sa aming kaso ay magiging ganito:

    AVERAGE(B2:B13)+TIWALA NG MAG-AARAL(0.03,STDV(B2:B13),COUNT(B2:B13))

  13. Alinsunod dito, ang formula para sa pagkalkula ng kaliwang hangganan ay magiging ganito:

    AVERAGE(B2:B13)-TIWALA NG MAG-AARAL(0.03,STDV(B2:B13),COUNT(B2:B13))

Tulad ng nakikita mo, ginagawang posible ng mga tool ng Excel program na makabuluhang mapadali ang pagkalkula ng agwat ng kumpiyansa at mga hangganan nito. Para sa mga layuning ito, ang mga hiwalay na operator ay ginagamit para sa mga sample na ang pagkakaiba ay kilala at hindi alam.

At iba pa. Lahat ng mga ito ay mga pagtatantya ng kanilang mga teoretikal na katapat, na maaaring makuha kung walang sample, ngunit ang pangkalahatang populasyon. Ngunit sayang, ang pangkalahatang populasyon ay napakamahal at kadalasan ay hindi magagamit.

Ang konsepto ng pagtatantya ng pagitan

Ang anumang sample na pagtatantya ay may ilang scatter, dahil ay isang random na variable depende sa mga halaga sa isang partikular na sample. Samakatuwid, para sa mas maaasahang istatistikal na inferences, dapat malaman hindi lamang ang point estimate, kundi pati na rin ang interval, na may mataas na posibilidad. γ Sinasaklaw ng (gamma) ang tinantyang tagapagpahiwatig θ (theta).

Pormal, ito ay dalawang ganoong halaga (mga istatistika) T1(X) at T2(X), Ano T1< T 2 , kung saan sa isang naibigay na antas ng posibilidad γ natugunan ang kondisyon:

Sa madaling salita, malamang γ o higit pa ang tunay na halaga ay nasa pagitan ng mga puntos T1(X) at T2(X), na tinatawag na lower at upper bounds agwat ng kumpiyansa.

Ang isa sa mga kondisyon para sa pagbuo ng mga agwat ng kumpiyansa ay ang pinakamataas na makitid nito, i.e. ito ay dapat na maikli hangga't maaari. Ang pagnanais ay medyo natural, dahil. sinusubukan ng mananaliksik na mas tumpak na i-localize ang paghahanap ng nais na parameter.

Ito ay sumusunod na ang agwat ng kumpiyansa ay dapat sumaklaw sa pinakamataas na posibilidad ng pamamahagi. at ang score mismo ay nasa gitna.

Iyon ay, ang posibilidad ng paglihis (ng tunay na tagapagpahiwatig mula sa pagtatantya) pataas ay katumbas ng posibilidad ng paglihis pababa. Dapat ding tandaan na para sa mga skewed distribution, ang interval sa kanan ay hindi katumbas ng interval sa kaliwa.

Ang figure sa itaas ay malinaw na nagpapakita na mas malaki ang antas ng kumpiyansa, mas malawak ang pagitan - isang direktang relasyon.

Ito ay isang maliit na panimula sa teorya ng pagtatantya ng pagitan ng hindi kilalang mga parameter. Lumipat tayo sa paghahanap ng mga limitasyon ng kumpiyansa para sa inaasahan sa matematika.

Agwat ng kumpiyansa para sa inaasahan sa matematika

Kung ang orihinal na data ay ibinahagi sa , ang average ay magiging isang normal na halaga. Ito ay sumusunod mula sa panuntunan na ang isang linear na kumbinasyon ng mga normal na halaga ay mayroon ding isang normal na distribusyon. Samakatuwid, upang kalkulahin ang mga probabilidad, maaari naming gamitin ang mathematical apparatus ng normal na batas sa pamamahagi.

Gayunpaman, mangangailangan ito ng kaalaman sa dalawang parameter - ang inaasahang halaga at ang pagkakaiba, na karaniwang hindi alam. Maaari mong, siyempre, gumamit ng mga pagtatantya sa halip na mga parameter (arithmetic mean at ), ngunit pagkatapos ay ang pamamahagi ng ibig sabihin ay hindi magiging normal, ito ay bahagyang pipi. Mahusay na napansin ng mamamayang si William Gosset ng Ireland ang katotohanang ito nang ilathala niya ang kanyang natuklasan sa Marso 1908 na isyu ng Biometrica. Para sa mga layuning lihim, lumagda si Gosset kasama ang Mag-aaral. Ganito lumabas ang t-distribution ng Student.

Gayunpaman, ang normal na pamamahagi ng data, na ginamit ni K. Gauss sa pagsusuri ng mga pagkakamali sa mga obserbasyon sa astronomiya, ay napakabihirang sa buhay sa lupa at medyo mahirap itatag ito (mga 2 libong obserbasyon ang kailangan para sa mataas na katumpakan). Samakatuwid, pinakamahusay na i-drop ang normality assumption at gumamit ng mga pamamaraan na hindi nakadepende sa pamamahagi ng orihinal na data.

Ang tanong ay lumitaw: ano ang pamamahagi ng arithmetic mean kung ito ay kinakalkula mula sa data ng isang hindi kilalang pamamahagi? Ang sagot ay ibinigay ng kilalang in probability theory Central limit theorem(CPT). Sa matematika, mayroong ilang mga bersyon nito (ang mga pormulasyon ay pino sa paglipas ng mga taon), ngunit lahat ng mga ito, sa halos pagsasalita, ay bumaba sa pahayag na ang kabuuan ng isang malaking bilang ng mga independiyenteng random na mga variable ay sumusunod sa normal na batas sa pamamahagi.

Kapag kinakalkula ang arithmetic mean, ang kabuuan ng mga random na variable ay ginagamit. Mula dito lumalabas na ang arithmetic mean ay may normal na distribusyon, kung saan ang inaasahang halaga ay ang inaasahang halaga ng paunang data, at ang pagkakaiba ay .

Alam ng mga matalinong tao kung paano patunayan ang CLT, ngunit ibe-verify namin ito sa tulong ng isang eksperimento na isinagawa sa Excel. Gayahin natin ang isang sample ng 50 pare-parehong ipinamahagi na random variable (gamit ang Excel function na RANDOMBETWEEN). Pagkatapos ay gagawa kami ng 1000 tulad ng mga sample at kalkulahin ang arithmetic mean para sa bawat isa. Tingnan natin ang kanilang pamamahagi.

Makikita na ang distribusyon ng average ay malapit sa normal na batas. Kung ang dami ng mga sample at ang kanilang bilang ay gagawing mas malaki, kung gayon ang pagkakatulad ay magiging mas mahusay.

Ngayon na nakita natin sa ating sarili ang bisa ng CLT, maaari nating, gamit ang , kalkulahin ang mga pagitan ng kumpiyansa para sa arithmetic mean, na sumasaklaw sa tunay na mean o mathematical na inaasahan na may ibinigay na posibilidad.

Upang maitatag ang itaas at mas mababang mga hangganan, kinakailangan na malaman ang mga parameter ng normal na pamamahagi. Bilang isang patakaran, hindi sila, samakatuwid, ang mga pagtatantya ay ginagamit: ibig sabihin ng aritmetika at sample na pagkakaiba-iba. Muli, ang pamamaraang ito ay nagbibigay ng isang mahusay na approximation para lamang sa malalaking sample. Kapag ang mga sample ay maliit, madalas na inirerekomenda na gamitin ang pamamahagi ng Mag-aaral. Huwag maniwala! Ang distribusyon ng mag-aaral para sa mean ay nangyayari lamang kapag ang orihinal na data ay may normal na distribusyon, iyon ay, halos hindi kailanman. Samakatuwid, mas mahusay na agad na itakda ang minimum na bar para sa dami ng kinakailangang data at gumamit ng mga asymptotically correct na pamamaraan. Sabi nila, sapat na ang 30 obserbasyon. Kumuha ng 50 - hindi ka maaaring magkamali.

T 1.2 ay ang lower at upper bounds ng confidence interval

– sample na arithmetic mean

s0– sample na standard deviation (walang pinapanigan)

n – laki ng sample

γ – antas ng kumpiyansa (karaniwang katumbas ng 0.9, 0.95 o 0.99)

c γ =Φ -1 ((1+γ)/2) ay ang kapalit ng karaniwang normal na distribution function. Sa simpleng mga termino, ito ang bilang ng mga karaniwang error mula sa arithmetic mean hanggang sa lower o upper bound (ang ipinahiwatig na tatlong probabilidad ay tumutugma sa mga halaga ng 1.64, 1.96 at 2.58).

Ang kakanyahan ng formula ay ang arithmetic mean ay kinuha at pagkatapos ay isang tiyak na halaga ay itabi mula dito ( kasama ang γ) mga karaniwang error ( s 0 /√n). Lahat ay alam, kunin at bilangin.

Bago ang malawakang paggamit ng mga PC, upang makuha ang mga halaga ng normal na function ng pamamahagi at ang kabaligtaran nito, ginamit nila . Ginagamit pa rin ang mga ito, ngunit mas mahusay na bumaling sa mga yari na formula ng Excel. Ang lahat ng elemento mula sa formula sa itaas ( , at ) ay madaling kalkulahin sa Excel. Ngunit mayroon ding isang handa na formula para sa pagkalkula ng agwat ng kumpiyansa - NORM NG tiwala sa sarili. Ang syntax nito ay ang mga sumusunod.

CONFIDENCE NORM(alpha, standard_dev, size)

alpha– antas ng kabuluhan o antas ng kumpiyansa, na sa notasyon sa itaas ay katumbas ng 1-γ, i.e. ang posibilidad na ang mathematicalang inaasahan ay nasa labas ng confidence interval. Sa antas ng kumpiyansa na 0.95, ang alpha ay 0.05, at iba pa.

standard_off ay ang standard deviation ng sample data. Hindi mo kailangang kalkulahin ang karaniwang error, hahatiin ng Excel sa ugat ng n.

ang sukat– laki ng sample (n).

Ang resulta ng function na CONFIDENCE.NORM ay ang pangalawang termino mula sa formula para sa pagkalkula ng agwat ng kumpiyansa, i.e. kalahating pagitan. Alinsunod dito, ang mas mababa at itaas na mga puntos ay ang average ± ang nakuhang halaga.

Kaya, posible na bumuo ng isang unibersal na algorithm para sa pagkalkula ng mga agwat ng kumpiyansa para sa arithmetic mean, na hindi nakasalalay sa pamamahagi ng paunang data. Ang presyo para sa pagiging pangkalahatan ay ang asymptotic na kalikasan nito, i.e. ang pangangailangang gumamit ng medyo malalaking sample. Gayunpaman, sa panahon ng modernong teknolohiya, ang pagkolekta ng tamang dami ng data ay karaniwang hindi mahirap.

Pagsubok sa Statistical Hypotheses Gamit ang Confidence Interval

(module 111)

Ang isa sa mga pangunahing problema na nalutas sa istatistika ay. Sa maikling salita, ang kakanyahan nito ay ito. Ang isang pagpapalagay ay ginawa, halimbawa, na ang inaasahan ng pangkalahatang populasyon ay katumbas ng ilang halaga. Pagkatapos ay itinayo ang pamamahagi ng mga sample na paraan, na maaaring maobserbahan sa isang naibigay na inaasahan. Susunod, titingnan natin kung saan sa kondisyonal na pamamahagi na ito ang tunay na average ay matatagpuan. Kung ito ay lumampas sa pinahihintulutang mga limitasyon, kung gayon ang hitsura ng naturang average ay napaka-malamang, at sa isang solong pag-uulit ng eksperimento ito ay halos imposible, na sumasalungat sa hypothesis na iniharap, na matagumpay na tinanggihan. Kung ang average ay hindi lalampas sa kritikal na antas, kung gayon ang hypothesis ay hindi tinatanggihan (ngunit hindi rin ito napatunayan!).

Kaya, sa tulong ng mga agwat ng kumpiyansa, sa aming kaso para sa inaasahan, maaari mo ring subukan ang ilang mga hypotheses. Napakadaling gawin. Ipagpalagay na ang arithmetic mean para sa ilang sample ay 100. Ang hypothesis ay sinusubok na ang inaasahan ay, sabihin nating, 90. Ibig sabihin, kung ilalagay natin ang tanong sa primitively, ito ay parang ganito: maaari ba na, na may tunay na halaga ng ibig sabihin katumbas ng 90, ang naobserbahang average ay 100?

Upang masagot ang tanong na ito, kakailanganin ang karagdagang impormasyon sa karaniwang paglihis at laki ng sample. Sabihin nating ang karaniwang paglihis ay 30, at ang bilang ng mga obserbasyon ay 64 (upang madaling makuha ang ugat). Kung gayon ang karaniwang error ng mean ay 30/8 o 3.75. Upang kalkulahin ang 95% na agwat ng kumpiyansa, kakailanganin mong magtabi ng dalawang karaniwang error sa magkabilang panig ng mean (mas tiyak, 1.96). Ang confidence interval ay magiging humigit-kumulang 100 ± 7.5, o mula 92.5 hanggang 107.5.

Ang karagdagang pangangatwiran ay ang mga sumusunod. Kung ang nasubok na halaga ay nasa loob ng agwat ng kumpiyansa, kung gayon hindi ito sumasalungat sa hypothesis, dahil umaangkop sa loob ng mga limitasyon ng mga random na pagbabagu-bago (na may posibilidad na 95%). Kung ang nasubok na punto ay nasa labas ng agwat ng kumpiyansa, kung gayon ang posibilidad ng naturang kaganapan ay napakaliit, sa anumang kaso sa ibaba ng katanggap-tanggap na antas. Samakatuwid, ang hypothesis ay tinanggihan bilang sumasalungat sa naobserbahang data. Sa aming kaso, ang expectation hypothesis ay nasa labas ng confidence interval (ang nasubok na value na 90 ay hindi kasama sa interval na 100±7.5), kaya dapat itong tanggihan. Ang pagsagot sa primitive na tanong sa itaas, dapat sabihin ng isa: hindi, hindi ito maaaring, sa anumang kaso, ito ay napakabihirang mangyari. Kadalasan, ito ay nagpapahiwatig ng isang tiyak na posibilidad ng maling pagtanggi sa hypothesis (p-level), at hindi isang naibigay na antas, ayon sa kung saan ang agwat ng kumpiyansa ay binuo, ngunit higit pa sa ibang pagkakataon.

Tulad ng nakikita mo, hindi mahirap bumuo ng isang agwat ng kumpiyansa para sa mean (o inaasahan sa matematika). Ang pangunahing bagay ay upang mahuli ang kakanyahan, at pagkatapos ay pupunta ang mga bagay. Sa pagsasagawa, karamihan ay gumagamit ng 95% na agwat ng kumpiyansa, na humigit-kumulang sa dalawang karaniwang error sa magkabilang panig ng mean.

Yun lang muna. Lahat ng pinakamahusay!