Karaniwang agwat ng kumpiyansa. Agwat ng kumpiyansa

Target– upang turuan ang mga mag-aaral ng mga algorithm para sa pagkalkula ng mga pagitan ng kumpiyansa ng mga istatistikal na parameter.

Sa panahon ng pagpoproseso ng istatistika ng data, ang kinakalkulang arithmetic mean, coefficient of variation, correlation coefficient, difference criteria at iba pang point statistics ay dapat makatanggap ng quantitative confidence limits, na nagpapahiwatig ng posibleng pagbabagu-bago ng indicator pataas at pababa sa loob ng confidence interval.

Halimbawa 3.1 . Ang pamamahagi ng calcium sa serum ng dugo ng mga unggoy, tulad ng dati nang itinatag, ay nailalarawan sa pamamagitan ng mga sumusunod na selektibong tagapagpahiwatig: = 11.94 mg%; = 0.127 mg%; n= 100. Kinakailangang matukoy ang agwat ng kumpiyansa para sa pangkalahatang average ( ) na may posibilidad na may kumpiyansa P = 0,95.

Ang pangkalahatang average ay may tiyak na posibilidad sa pagitan:

, saan – sample na arithmetic mean; t- Pamantayan ng mag-aaral; ay ang error ng arithmetic mean.

Ayon sa talahanayan na "Mga Halaga ng pamantayan ng Mag-aaral" nakita namin ang halaga na may antas ng kumpiyansa na 0.95 at ang bilang ng mga antas ng kalayaan k\u003d 100-1 \u003d 99. Ito ay katumbas ng 1.982. Kasama ang mga halaga ng arithmetic mean at statistical error, pinapalitan namin ito sa formula:

o 11.69
12,19

Kaya, na may probabilidad na 95%, maaaring pagtalunan na ang pangkalahatang average ng normal na distribusyon na ito ay nasa pagitan ng 11.69 at 12.19 mg%.

Halimbawa 3.2 . Tukuyin ang mga hangganan ng 95% na agwat ng kumpiyansa para sa pangkalahatang pagkakaiba ( ) pamamahagi ng calcium sa dugo ng mga unggoy, kung ito ay kilala na
= 1.60, na may n = 100.

Upang malutas ang problema, maaari mong gamitin ang sumusunod na formula:

saan ay ang statistical error ng variance.

Hanapin ang sample na variance error gamit ang formula:
. Ito ay katumbas ng 0.11. Ibig sabihin t- criterion na may posibilidad na kumpiyansa na 0.95 at ang bilang ng mga antas ng kalayaan k= 100–1 = 99 ay kilala mula sa nakaraang halimbawa.

Gamitin natin ang formula at makuha ang:

o 1.38
1,82

Ang isang mas tumpak na agwat ng kumpiyansa para sa pangkalahatang pagkakaiba ay maaaring mabuo gamit (chi-square) - Pagsubok ni Pearson. Ang mga kritikal na puntos para sa pamantayang ito ay ibinibigay sa isang espesyal na talahanayan. Kapag ginagamit ang pamantayan isang dalawang-panig na antas ng kahalagahan ay ginagamit upang bumuo ng isang pagitan ng kumpiyansa. Para sa lower bound, ang antas ng kahalagahan ay kinakalkula ng formula
, para sa itaas
. Halimbawa, para sa antas ng kumpiyansa = 0,99= 0,010,= 0.990. Alinsunod dito, ayon sa talahanayan ng pamamahagi ng mga kritikal na halaga , na may mga kinakalkula na antas ng kumpiyansa at bilang ng mga antas ng kalayaan k= 100 – 1= 99, hanapin ang mga halaga
at
. Nakukuha namin
katumbas ng 135.80, at
katumbas ng 70.06.

Upang mahanap ang mga limitasyon ng kumpiyansa ng pangkalahatang pagkakaiba gamit ginagamit namin ang mga formula: para sa lower bound
, para sa upper bound
. Palitan ang data ng gawain para sa mga nahanap na halaga sa mga formula:
= 1,17;
= 2.26. Kaya, na may antas ng kumpiyansa P= 0.99 o 99% ang pangkalahatang pagkakaiba ay nasa hanay mula 1.17 hanggang 2.26 mg% kasama.

Halimbawa 3.3 . Sa 1000 buto ng trigo mula sa lote na dumating sa elevator, natagpuan ang 120 buto na nahawaan ng ergot. Ito ay kinakailangan upang matukoy ang posibleng mga hangganan ng kabuuang proporsyon ng mga nahawaang buto sa isang naibigay na batch ng trigo.

Ang mga limitasyon ng kumpiyansa para sa pangkalahatang bahagi para sa lahat ng posibleng halaga nito ay dapat matukoy ng formula:

,

saan n ay ang bilang ng mga obserbasyon; m ay ang ganap na bilang ng isa sa mga pangkat; t ay ang normalized deviation.

Ang sample na bahagi ng mga nahawaang buto ay katumbas ng
o 12%. Na may antas ng kumpiyansa R= 95% normalized deviation ( t-Ang pamantayan ng mag-aaral para sa k =
)t = 1,960.

Pinapalitan namin ang magagamit na data sa formula:

Samakatuwid, ang mga hangganan ng agwat ng kumpiyansa ay = 0.122–0.041 = 0.081, o 8.1%; = 0.122 + 0.041 = 0.163, o 16.3%.

Kaya, sa antas ng kumpiyansa na 95%, masasabi na ang kabuuang proporsyon ng mga nahawaang binhi ay nasa pagitan ng 8.1 at 16.3%.

Halimbawa 3.4 . Ang koepisyent ng pagkakaiba-iba, na nagpapakilala sa pagkakaiba-iba ng calcium (mg%) sa serum ng dugo ng mga unggoy, ay katumbas ng 10.6%. Laki ng sample n= 100. Kinakailangang matukoy ang mga hangganan ng 95% na agwat ng kumpiyansa para sa pangkalahatang parameter CV.

Mga limitasyon ng kumpiyansa para sa pangkalahatang koepisyent ng pagkakaiba-iba CV ay tinutukoy ng mga sumusunod na formula:

at
, saan K intermediate value na kinakalkula ng formula
.

Alam na may antas ng kumpiyansa R= 95% normalized deviation (T-test ng mag-aaral para sa k =
)t = 1.960, paunang kalkulahin ang halaga SA:

.

o 9.3%

o 12.3%

Kaya, ang pangkalahatang koepisyent ng pagkakaiba-iba na may posibilidad ng kumpiyansa na 95% ay nasa saklaw mula 9.3 hanggang 12.3%. Sa paulit-ulit na mga sample, ang koepisyent ng variation ay hindi lalampas sa 12.3% at hindi bababa sa 9.3% sa 95 na mga kaso sa 100.

Mga tanong para sa pagpipigil sa sarili:

Mga gawain para sa malayang solusyon.

1. Ang average na porsyento ng taba sa gatas para sa paggagatas ng mga baka ng Kholmogory crosses ay ang mga sumusunod: 3.4; 3.6; 3.2; 3.1; 2.9; 3.7; 3.2; 3.6; 4.0; 3.4; 4.1; 3.8; 3.4; 4.0; 3.3; 3.7; 3.5; 3.6; 3.4; 3.8. Magtakda ng mga pagitan ng kumpiyansa para sa pangkalahatang mean sa 95% na antas ng kumpiyansa (20 puntos).

2. Sa 400 halaman ng hybrid rye, ang mga unang bulaklak ay lumitaw sa average na 70.5 araw pagkatapos ng paghahasik. Ang karaniwang paglihis ay 6.9 araw. Tukuyin ang error ng mean at confidence interval para sa populasyong mean at variance sa isang significance level W= 0.05 at W= 0.01 (25 puntos).

3. Kapag pinag-aaralan ang haba ng mga dahon ng 502 specimens ng mga strawberry sa hardin, nakuha ang sumusunod na data: = 7.86 cm; σ = 1.32 cm, \u003d ± 0.06 cm Tukuyin ang mga pagitan ng kumpiyansa para sa arithmetic mean ng populasyon na may mga antas ng kabuluhan na 0.01; 0.02; 0.05. (25 puntos).

4. Kapag sinusuri ang 150 adultong lalaki, ang average na taas ay 167 cm, at σ \u003d 6 cm Ano ang mga limitasyon ng pangkalahatang average at pangkalahatang pagkakaiba na may posibilidad ng kumpiyansa na 0.99 at 0.95? (25 puntos).

5. Ang pamamahagi ng calcium sa serum ng dugo ng mga unggoy ay nailalarawan sa pamamagitan ng mga sumusunod na selektibong tagapagpahiwatig: = 11.94 mg%, σ = 1,27, n = 100. Mag-plot ng 95% na agwat ng kumpiyansa para sa ibig sabihin ng populasyon ng distribusyon na ito. Kalkulahin ang koepisyent ng pagkakaiba-iba (25 puntos).

6. Ang kabuuang nilalaman ng nitrogen sa plasma ng dugo ng mga albino rats sa edad na 37 at 180 araw ay pinag-aralan. Ang mga resulta ay ipinahayag sa gramo bawat 100 cm 3 ng plasma. Sa edad na 37 araw, 9 na daga ang may: 0.98; 0.83; 0.99; 0.86; 0.90; 0.81; 0.94; 0.92; 0.87. Sa edad na 180 araw, 8 daga ang may: 1.20; 1.18; 1.33; 1.21; 1.20; 1.07; 1.13; 1.12. Magtakda ng mga pagitan ng kumpiyansa para sa pagkakaiba na may antas ng kumpiyansa na 0.95 (50 puntos).

7. Tukuyin ang mga hangganan ng 95% na agwat ng kumpiyansa para sa pangkalahatang pagkakaiba-iba ng pamamahagi ng calcium (mg%) sa serum ng dugo ng mga unggoy, kung para sa pamamahagi na ito ang laki ng sample n = 100, ang statistical error ng sample na pagkakaiba s σ 2 = 1.60 (40 puntos).

8. Tukuyin ang mga hangganan ng 95% na pagitan ng kumpiyansa para sa pangkalahatang pagkakaiba-iba ng distribusyon ng 40 spikelet ng trigo kasama ang haba (σ 2 = 40.87 mm 2). (25 puntos).

9. Ang paninigarilyo ay itinuturing na pangunahing salik na nagdudulot ng obstructive pulmonary disease. Ang passive smoking ay hindi itinuturing na isang kadahilanan. Kinuwestiyon ng mga siyentipiko ang kaligtasan ng passive smoking at sinuri ang daanan ng hangin sa mga non-smokers, passive at active smokers. Upang makilala ang estado ng respiratory tract, kinuha namin ang isa sa mga tagapagpahiwatig ng pag-andar ng panlabas na paghinga - ang maximum na volumetric velocity ng gitna ng pagbuga. Ang pagbaba sa tagapagpahiwatig na ito ay isang tanda ng kapansanan sa patency ng daanan ng hangin. Ang data ng survey ay ipinapakita sa talahanayan.

Bilang ng napagmasdan

Maximum na mid-expiratory flow rate, l/s

Karaniwang lihis

Mga hindi naninigarilyo

magtrabaho sa isang lugar na hindi naninigarilyo

magtrabaho sa isang silid na puno ng usok

mga naninigarilyo

paninigarilyo ng isang maliit na bilang ng mga sigarilyo

average na bilang ng mga naninigarilyo

paninigarilyo ng malaking bilang ng sigarilyo

Mula sa talahanayan, hanapin ang 95% na agwat ng kumpiyansa para sa pangkalahatang mean at pangkalahatang pagkakaiba para sa bawat isa sa mga pangkat. Ano ang mga pagkakaiba sa pagitan ng mga pangkat? Ipakita ang mga resulta nang grapiko (25 puntos).

10. Tukuyin ang mga hangganan ng 95% at 99% na agwat ng kumpiyansa para sa pangkalahatang pagkakaiba-iba ng bilang ng mga biik sa 64 na farrowing, kung ang statistical error ng sample na pagkakaiba s σ 2 = 8.25 (30 puntos).

11. Ito ay kilala na ang average na timbang ng mga kuneho ay 2.1 kg. Tukuyin ang mga hangganan ng 95% at 99% na agwat ng kumpiyansa para sa pangkalahatang mean at pagkakaiba kapag n= 30, σ = 0.56 kg (25 puntos).

12. Sa 100 tainga, sinukat ang nilalaman ng butil ng tainga ( X), haba ng spike ( Y) at ang masa ng butil sa tainga ( Z). Maghanap ng mga agwat ng kumpiyansa para sa pangkalahatang mean at pagkakaiba para sa P 1 = 0,95, P 2 = 0,99, P 3 = 0.999 kung = 19, = 6.766 cm, = 0.554 g; σ x 2 = 29.153, σ y 2 = 2.111, σ z 2 = 0.064. (25 puntos).

13. Sa random na piniling 100 tainga ng winter wheat, ang bilang ng mga spikelet ay binilang. Ang sample set ay nailalarawan sa pamamagitan ng mga sumusunod na tagapagpahiwatig: = 15 spikelet at σ = 2.28 pcs. Tukuyin ang katumpakan kung saan nakuha ang average na resulta ( ) at i-plot ang confidence interval para sa kabuuang mean at variance sa 95% at 99% na antas ng kabuluhan (30 puntos).

14. Ang bilang ng mga tadyang sa mga shell ng isang fossil mollusk Mga Orthambonite calligramma:

Ito ay kilala na n = 19, σ = 4.25. Tukuyin ang mga hangganan ng agwat ng kumpiyansa para sa pangkalahatang mean at pangkalahatang pagkakaiba sa antas ng kahalagahan W = 0.01 (25 puntos).

15. Upang matukoy ang mga ani ng gatas sa isang komersyal na dairy farm, ang produktibidad ng 15 baka ay tinutukoy araw-araw. Ayon sa datos para sa taon, ang bawat baka ay nagbibigay sa karaniwan ng sumusunod na dami ng gatas bawat araw (l): 22; labinsiyam; 25; 20; 27; 17; tatlumpu; 21; labing-walo; 24; 26; 23; 25; 20; 24. I-plot ang mga pagitan ng kumpiyansa para sa pangkalahatang pagkakaiba at ang ibig sabihin ng arithmetic. Maaari ba nating asahan na ang average na taunang ani ng gatas bawat baka ay 10,000 litro? (50 puntos).

16. Upang matukoy ang average na ani ng trigo para sa sakahan, ang paggapas ay isinasagawa sa mga sample plot na 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 at 2 ha. Ang ani (c/ha) mula sa mga plot ay 39.4; 38; 35.8; 40; 35; 42.7; 39.3; 41.6; 33; 42; 29 ayon sa pagkakabanggit. I-plot ang mga pagitan ng kumpiyansa para sa pangkalahatang pagkakaiba at ang ibig sabihin ng arithmetic. Posible bang asahan na ang average na ani para sa negosyong pang-agrikultura ay magiging 42 c/ha? (50 puntos).

Sa mga istatistika, mayroong dalawang uri ng mga pagtatantya: punto at pagitan. Pagtataya ng Punto ay isang solong sample na istatistika na ginagamit upang tantyahin ang isang parameter ng populasyon. Halimbawa, ang ibig sabihin ng sample ay isang puntong pagtatantya ng ibig sabihin ng populasyon, at ang sample na pagkakaiba-iba S2- punto ng pagtatantya ng pagkakaiba-iba ng populasyon σ2. ipinakita na ang sample mean ay isang walang pinapanigan na pagtatantya ng inaasahan ng populasyon. Ang sample mean ay tinatawag na walang pinapanigan dahil ang ibig sabihin ng lahat ng sample ay (na may parehong laki ng sample n) ay katumbas ng mathematical na inaasahan ng pangkalahatang populasyon.

Upang ang sample na pagkakaiba-iba S2 naging walang pinapanigan na estimator ng pagkakaiba-iba ng populasyon σ2, ang denominator ng sample na variance ay dapat itakda na katumbas ng n – 1 , ngunit hindi n. Sa madaling salita, ang pagkakaiba-iba ng populasyon ay ang average ng lahat ng posibleng pagkakaiba-iba ng sample.

Kapag tinatantya ang mga parameter ng populasyon, dapat tandaan na ang mga sample na istatistika tulad ng , depende sa mga partikular na sample. Upang isaalang-alang ang katotohanang ito, upang makuha pagtatantya ng pagitan ang matematikal na inaasahan ng pangkalahatang populasyon ay sinusuri ang pamamahagi ng sample na paraan (para sa higit pang mga detalye, tingnan). Ang itinayong agwat ay nailalarawan sa pamamagitan ng isang tiyak na antas ng kumpiyansa, na kung saan ay ang posibilidad na ang tunay na parameter ng pangkalahatang populasyon ay natantiya nang tama. Maaaring gamitin ang mga katulad na agwat ng kumpiyansa upang tantiyahin ang proporsyon ng isang feature R at ang pangunahing ibinahagi na masa ng pangkalahatang populasyon.

Mag-download ng tala sa o format, mga halimbawa sa format

Pagbuo ng isang agwat ng kumpiyansa para sa mathematical na inaasahan ng pangkalahatang populasyon na may kilalang standard deviation

Pagbuo ng isang agwat ng kumpiyansa para sa proporsyon ng isang katangian sa pangkalahatang populasyon

Sa seksyong ito, ang konsepto ng isang agwat ng kumpiyansa ay pinalawak sa kategoryang data. Ito ay nagpapahintulot sa iyo na tantyahin ang bahagi ng katangian sa pangkalahatang populasyon R na may sample share RS= X/n. Tulad ng nabanggit, kung ang mga halaga nR at n(1 - p) lumampas sa numero 5, ang binomial distribution ay maaaring tantiyahin ng normal. Samakatuwid, upang tantyahin ang bahagi ng isang katangian sa pangkalahatang populasyon R posible na bumuo ng isang pagitan na ang antas ng kumpiyansa ay katumbas ng (1 - α)x100%.


saan pS- sample na bahagi ng tampok, katumbas ng X/n, ibig sabihin. ang bilang ng mga tagumpay na hinati sa laki ng sample, R- ang bahagi ng katangian sa pangkalahatang populasyon, Z ay ang kritikal na halaga ng standardized normal distribution, n- laki ng sample.

Halimbawa 3 Ipagpalagay natin na ang isang sample ay kinuha mula sa sistema ng impormasyon, na binubuo ng 100 mga invoice na nakumpleto noong nakaraang buwan. Sabihin nating mali ang 10 sa mga invoice na ito. kaya, R= 10/100 = 0.1. Ang 95% na antas ng kumpiyansa ay tumutugma sa kritikal na halaga Z = 1.96.

Kaya, mayroong 95% na pagkakataon na sa pagitan ng 4.12% at 15.88% ng mga invoice ay naglalaman ng mga error.

Para sa isang ibinigay na laki ng sample, ang agwat ng kumpiyansa na naglalaman ng proporsyon ng katangian sa pangkalahatang populasyon ay tila mas malawak kaysa sa isang tuluy-tuloy na random na variable. Ito ay dahil ang mga sukat ng isang tuluy-tuloy na random na variable ay naglalaman ng mas maraming impormasyon kaysa sa mga sukat ng pang-kategoryang data. Sa madaling salita, ang mga kategoryang data na kumukuha lamang ng dalawang halaga ay naglalaman ng hindi sapat na impormasyon upang matantya ang mga parameter ng kanilang pamamahagi.

ATpagkalkula ng mga pagtatantya na nakuha mula sa isang may hangganang populasyon

Pagtataya ng inaasahan sa matematika. Salik ng pagwawasto para sa huling populasyon ( fpc) ay ginamit upang bawasan ang karaniwang error sa pamamagitan ng isang kadahilanan ng . Kapag kinakalkula ang mga agwat ng kumpiyansa para sa mga pagtatantya ng mga parameter ng populasyon, inilalapat ang isang salik ng pagwawasto sa mga sitwasyon kung saan ang mga sample ay iginuhit nang walang kapalit. Kaya, ang pagitan ng kumpiyansa para sa inaasahan sa matematika, pagkakaroon ng antas ng kumpiyansa na katumbas ng (1 - α)x100%, ay kinakalkula ng formula:

Halimbawa 4 Upang ilarawan ang aplikasyon ng correction factor para sa isang may hangganang populasyon, bumalik tayo sa problema sa pagkalkula ng confidence interval para sa average na halaga ng mga invoice na tinalakay sa Halimbawa 3 sa itaas. Ipagpalagay na ang isang kumpanya ay nag-isyu ng 5,000 invoice bawat buwan, at Xᅳ=110.27 USD, S= $28.95 N = 5000, n = 100, α = 0.05, t99 = 1.9842. Ayon sa formula (6) nakukuha natin:

Pagtatantya ng bahagi ng tampok. Kapag pumipili ng walang pagbabalik, ang agwat ng kumpiyansa para sa proporsyon ng tampok na may antas ng kumpiyansa na katumbas ng (1 - α)x100%, ay kinakalkula ng formula:

Mga agwat ng kumpiyansa at mga isyu sa etika

Kapag nagsa-sample ng isang populasyon at bumubuo ng mga istatistikal na hinuha, madalas na lumitaw ang mga problema sa etika. Ang pangunahing isa ay kung paano nagkakasundo ang mga agwat ng kumpiyansa at mga pagtatantya ng punto ng mga sample na istatistika. Ang mga pagtatantya ng punto ng pag-publish nang hindi tinutukoy ang mga naaangkop na agwat ng kumpiyansa (karaniwan ay nasa 95% na antas ng kumpiyansa) at ang laki ng sample kung saan nagmula ang mga ito ay maaaring mapanlinlang. Ito ay maaaring magbigay sa user ng impresyon na ang pagtatantya ng punto ay eksaktong kailangan niya upang mahulaan ang mga katangian ng buong populasyon. Kaya, kinakailangang maunawaan na sa anumang pananaliksik, hindi punto, ngunit ang mga pagtatantya ng pagitan ay dapat ilagay sa unahan. Bilang karagdagan, ang espesyal na pansin ay dapat bayaran sa tamang pagpili ng mga laki ng sample.

Kadalasan, ang mga bagay ng istatistikal na pagmamanipula ay ang mga resulta ng mga sociological survey ng populasyon sa iba't ibang mga isyu sa politika. Kasabay nito, ang mga resulta ng survey ay inilalagay sa mga front page ng mga pahayagan, at ang sampling error at ang pamamaraan ng statistical analysis ay naka-print sa isang lugar sa gitna. Upang patunayan ang bisa ng nakuha na mga pagtatantya ng punto, kinakailangang ipahiwatig ang laki ng sample batay sa kung saan nakuha ang mga ito, ang mga hangganan ng agwat ng kumpiyansa at antas ng kahalagahan nito.

Susunod na tala

Mga materyales mula sa aklat na Levin et al. Ginagamit ang mga istatistika para sa mga tagapamahala. - M.: Williams, 2004. - p. 448–462

Central limit theorem nagsasaad na, dahil sa isang sapat na malaking sukat ng sample, ang sample na pamamahagi ng mga paraan ay maaaring tantiyahin sa pamamagitan ng isang normal na distribusyon. Ang ari-arian na ito ay hindi nakadepende sa uri ng pamamahagi ng populasyon.

Sa mga nakaraang subsection, isinasaalang-alang namin ang tanong ng pagtantya ng hindi kilalang parameter a isang numero. Ang ganitong pagtatasa ay tinatawag na "punto". Sa isang bilang ng mga gawain, ito ay kinakailangan hindi lamang upang mahanap para sa parameter a angkop na halaga ng numero, ngunit suriin din ang katumpakan at pagiging maaasahan nito. Kinakailangang malaman kung anong mga error ang maaaring humantong sa pagpapalit ng parameter a pagtatantya ng punto nito a at sa anong antas ng kumpiyansa ang maaari nating asahan na ang mga pagkakamaling ito ay hindi lalampas sa mga kilalang limitasyon?

Ang mga problema ng ganitong uri ay partikular na may kaugnayan para sa isang maliit na bilang ng mga obserbasyon, kapag ang pagtatantya ng punto at sa ay higit sa lahat ay random at ang tinatayang pagpapalit ng a sa pamamagitan ng a ay maaaring humantong sa mga seryosong pagkakamali.

Upang magbigay ng ideya ng katumpakan at pagiging maaasahan ng pagtatantya a,

sa mathematical statistics, ginagamit ang tinatawag na confidence interval at confidence probabilities.

Hayaan para sa parameter a nagmula sa karanasang walang pinapanigan na pagtatantya a. Gusto naming tantyahin ang posibleng error sa kasong ito. Magtalaga tayo ng ilang sapat na malaking probabilidad p (halimbawa, p = 0.9, 0.95, o 0.99) upang ang isang kaganapan na may probabilidad p ay maituturing na halos tiyak, at makahanap ng halaga ng s kung saan

Pagkatapos ang saklaw ng halos posibleng mga halaga ng error na nangyayari kapag pinapalitan a sa a, ay magiging ± s; ang malalaking ganap na error ay lilitaw lamang na may maliit na posibilidad a = 1 - p. Isulat muli natin ang (14.3.1) bilang:

Ang pagkakapantay-pantay (14.3.2) ay nangangahulugan na may probabilidad p ang hindi alam na halaga ng parameter a nahuhulog sa loob ng pagitan

Sa kasong ito, dapat tandaan ang isang pangyayari. Noong nakaraan, paulit-ulit naming isinasaalang-alang ang posibilidad ng isang random na variable na nahuhulog sa isang ibinigay na hindi random na pagitan. Dito iba ang sitwasyon: a hindi random, ngunit random interval / r. Random ang posisyon nito sa x-axis, na tinutukoy ng sentro nito a; sa pangkalahatan, ang haba ng interval 2s ay random din, dahil ang halaga ng s ay kinakalkula, bilang panuntunan, mula sa pang-eksperimentong data. Samakatuwid, sa kasong ito, mas mahusay na bigyang-kahulugan ang halaga ng p hindi bilang posibilidad ng "pagtama" sa punto. a sa pagitan / p, ngunit bilang ang posibilidad na ang isang random na pagitan / p ay sumasakop sa punto a(Larawan 14.3.1).

kanin. 14.3.1

Ang probabilidad p ay tinatawag antas ng kumpiyansa, at ang pagitan / p - agwat ng kumpiyansa. Mga hangganan ng pagitan kung. isang x \u003d a- s at a 2 = a + at tinatawag mga hangganan ng tiwala.

Bigyan natin ng isa pang interpretasyon ang konsepto ng isang agwat ng kumpiyansa: maaari itong ituring bilang isang pagitan ng mga halaga ng parameter a, tugma sa pang-eksperimentong data at hindi sumasalungat sa mga ito. Sa katunayan, kung sumasang-ayon kaming isaalang-alang ang isang kaganapan na may posibilidad na a = 1-p na halos imposible, kung gayon ang mga halaga ng parameter a kung saan a - a> s ay dapat kilalanin bilang sumasalungat sa pang-eksperimentong data, at ang mga kung saan |a - a a t na 2 .

Hayaan para sa parameter a mayroong walang kinikilingan na pagtatantya a. Kung alam natin ang batas ng distribusyon ng dami a, ang problema sa paghahanap ng agwat ng kumpiyansa ay magiging simple: sapat na upang makahanap ng halaga ng s kung saan

Ang kahirapan ay nakasalalay sa katotohanan na ang batas ng pamamahagi ng pagtatantya a depende sa batas ng distribusyon ng dami X at, dahil dito, sa hindi kilalang mga parameter nito (sa partikular, sa parameter mismo a).

Upang malampasan ang kahirapan na ito, maaaring ilapat ng isa ang sumusunod na humigit-kumulang na tinatayang trick: palitan ang hindi kilalang mga parameter sa expression para sa s ng kanilang mga pagtatantya ng punto. Sa medyo malaking bilang ng mga eksperimento P(mga 20 ... 30) ang pamamaraang ito ay karaniwang nagbibigay ng kasiya-siyang resulta sa mga tuntunin ng katumpakan.

Bilang halimbawa, isaalang-alang ang problema ng agwat ng kumpiyansa para sa inaasahan sa matematika.

Hayaang gumawa P x, na ang mga katangian ay ang matematikal na inaasahan t at pagkakaiba-iba D- hindi kilala. Para sa mga parameter na ito, nakuha ang mga sumusunod na pagtatantya:

Kinakailangang bumuo ng agwat ng kumpiyansa / р, na tumutugma sa probabilidad ng kumpiyansa р, para sa inaasahan sa matematika t dami x.

Sa paglutas ng problemang ito, ginagamit namin ang katotohanan na ang dami t ay ang kabuuan P independiyenteng magkaparehong ipinamahagi na mga random na variable X h at ayon sa central limit theorem para sa sapat na malaki P ang batas ng pamamahagi nito ay malapit sa normal. Sa pagsasagawa, kahit na may medyo maliit na bilang ng mga termino (ng pagkakasunud-sunod ng 10 ... 20), ang batas sa pamamahagi ng kabuuan ay maaaring ituring na normal. Ipagpalagay natin na ang halaga t ipinamahagi ayon sa normal na batas. Ang mga katangian ng batas na ito - ang mathematical na inaasahan at pagkakaiba - ay pantay, ayon sa pagkakabanggit t at

(tingnan ang kabanata 13 subsection 13.3). Ipagpalagay natin na ang halaga D ay kilala sa amin at makakahanap kami ng ganoong halaga Ep kung saan

Ang paglalapat ng formula (6.3.5) ng Kabanata 6, ipinapahayag namin ang probabilidad sa kaliwang bahagi ng (14.3.5) sa mga tuntunin ng normal na distribution function

nasaan ang standard deviation ng estimate t.

Mula sa equation

hanapin ang halaga ng Sp:

kung saan ang arg Ф* (x) ay ang inverse function ng Ф* (X), mga. tulad ng isang halaga ng argumento kung saan ang normal na distribution function ay katumbas ng X.

Pagpapakalat D, kung saan ipinahayag ang halaga a 1P, hindi natin alam nang eksakto; bilang tinatayang halaga nito, maaari mong gamitin ang pagtatantya D(14.3.4) at maglagay ng humigit-kumulang:

Kaya, ang problema sa pagbuo ng isang agwat ng kumpiyansa ay tinatayang nalutas, na katumbas ng:

kung saan ang gp ay tinukoy ng formula (14.3.7).

Upang maiwasan ang reverse interpolation sa mga talahanayan ng function na Ф * (l) kapag kinakalkula ang s p, maginhawang mag-compile ng isang espesyal na talahanayan (Talahanayan 14.3.1), na naglilista ng mga halaga ng dami

depende sa r. Ang halaga (p ay tumutukoy para sa normal na batas ang bilang ng mga karaniwang paglihis na dapat itabi sa kanan at kaliwa ng dispersion center upang ang posibilidad na mahulog sa resultang lugar ay katumbas ng p.

Sa pamamagitan ng halaga ng 7 p, ang agwat ng kumpiyansa ay ipinahayag bilang:

Talahanayan 14.3.1

Halimbawa 1. 20 eksperimento ang isinagawa sa halaga x; ang mga resulta ay ipinapakita sa talahanayan. 14.3.2.

Talahanayan 14.3.2

Kinakailangang maghanap ng pagtatantya ng para sa mathematical na inaasahan ng dami X at bumuo ng agwat ng kumpiyansa na tumutugma sa antas ng kumpiyansa p = 0.8.

Desisyon. Meron kami:

Ang pagpili para sa pinanggalingan n: = 10, ayon sa ikatlong formula (14.2.14) makikita natin ang walang pinapanigan na pagtatantya D :

Ayon sa talahanayan 14.3.1 nahanap namin

Mga limitasyon ng kumpiyansa:

Agwat ng kumpiyansa:

Mga halaga ng parameter t, ang nakahiga sa pagitan na ito ay tugma sa pang-eksperimentong data na ibinigay sa talahanayan. 14.3.2.

Sa katulad na paraan, maaaring makabuo ng agwat ng kumpiyansa para sa pagkakaiba.

Hayaang gumawa P mga independyenteng eksperimento sa isang random na variable X na may hindi kilalang mga parameter mula sa at A, at para sa pagkakaiba D ang walang pinapanigan na pagtatantya ay nakuha:

Kinakailangan na humigit-kumulang na bumuo ng agwat ng kumpiyansa para sa pagkakaiba.

Mula sa formula (14.3.11) makikita na ang halaga D kumakatawan

halaga P mga random na variable ng form. Ang mga halagang ito ay hindi

independyente, dahil ang alinman sa mga ito ay kasama ang dami t, nakadepende sa iba. Gayunpaman, maaari itong ipakita na bilang P malapit din sa normal ang distribution law ng kanilang sum. Halos sa P= 20...30 maaari na itong ituring na normal.

Ipagpalagay natin na ito ay totoo, at hanapin ang mga katangian ng batas na ito: ang mathematical na inaasahan at pagkakaiba. Simula nung score D- walang kinikilingan, kung gayon M[D] = D.

Pagkalkula ng Variance DD ay nauugnay sa medyo kumplikadong mga kalkulasyon, kaya binibigyan namin ang expression nito nang walang derivation:

kung saan c 4 - ang pang-apat na sentral na sandali ng dami x.

Upang magamit ang expression na ito, kailangan mong palitan dito ang mga halaga ng 4 at D(hindi bababa sa tinatayang). sa halip na D maaari mong gamitin ang pagsusuri D. Sa prinsipyo, ang ikaapat na sentral na sandali ay maaari ding mapalitan ng pagtatantya nito, halimbawa, ng isang halaga ng form:

ngunit ang ganitong kapalit ay magbibigay ng napakababang katumpakan, dahil sa pangkalahatan, na may limitadong bilang ng mga eksperimento, ang mga high-order na sandali ay tinutukoy na may malalaking error. Gayunpaman, sa pagsasanay madalas na nangyayari na ang anyo ng batas ng pamamahagi ng dami X kilala nang maaga: ang mga parameter lamang nito ay hindi alam. Pagkatapos ay maaari naming subukang ipahayag ang u4 sa mga tuntunin ng D.

Kunin natin ang pinakakaraniwang kaso, kapag ang halaga X ipinamahagi ayon sa normal na batas. Pagkatapos ang ikaapat na sentral na sandali nito ay ipinahayag sa mga tuntunin ng pagkakaiba (tingnan ang Kabanata 6 Subsection 6.2);

at formula (14.3.12) ay nagbibigay o

Pinapalitan sa (14.3.14) ang hindi alam D kanyang pagtatasa D, nakukuha natin: saan

Ang sandali u 4 ay maaaring ipahayag sa mga tuntunin ng D din sa ilang iba pang mga kaso, kapag ang pamamahagi ng dami X ay hindi normal, ngunit ang hitsura nito ay kilala. Halimbawa, para sa batas ng pare-parehong density (tingnan ang Kabanata 5) mayroon tayong:

kung saan ang (a, P) ay ang pagitan kung saan ibinigay ang batas.

Kaya naman,

Ayon sa formula (14.3.12) nakukuha natin: mula sa kung saan namin matatagpuan ang humigit-kumulang

Sa mga kaso kung saan ang anyo ng batas ng pamamahagi ng halaga 26 ay hindi alam, kapag tinatantya ang halaga ng a /) inirerekomenda pa rin na gamitin ang formula (14.3.16), kung walang mga espesyal na batayan para maniwala na ang batas na ito ay ibang-iba sa normal (may kapansin-pansing positibo o negatibong kurtosis) .

Kung ang tinatayang halaga a /) ay nakuha sa isang paraan o iba pa, posible na bumuo ng agwat ng kumpiyansa para sa pagkakaiba sa parehong paraan tulad ng ginawa namin para sa inaasahan sa matematika:

kung saan ang halaga depende sa ibinigay na probabilidad p ay matatagpuan sa Talahanayan. 14.3.1.

Halimbawa 2. Maghanap ng Humigit-kumulang 80% Confidence Interval para sa Pagkakaiba ng Random Variable X sa ilalim ng mga kondisyon ng halimbawa 1, kung ito ay kilala na ang halaga X ipinamahagi ayon sa isang batas na malapit sa normal.

Desisyon. Ang halaga ay nananatiling pareho sa Talahanayan. 14.3.1:

Ayon sa formula (14.3.16)

Ayon sa formula (14.3.18) nakita namin ang agwat ng kumpiyansa:

Ang kaukulang hanay ng mga halaga ng karaniwang paglihis: (0.21; 0.29).

14.4. Mga eksaktong pamamaraan para sa pagbuo ng mga pagitan ng kumpiyansa para sa mga parameter ng isang random na variable na ibinahagi ayon sa normal na batas

Sa nakaraang subsection, isinaalang-alang namin ang halos tinatayang mga pamamaraan para sa pagbuo ng mga pagitan ng kumpiyansa para sa mean at pagkakaiba. Dito nagbibigay kami ng ideya ng eksaktong mga pamamaraan para sa paglutas ng parehong problema. Binibigyang-diin namin na upang tumpak na mahanap ang mga agwat ng kumpiyansa, ganap na kinakailangang malaman nang maaga ang anyo ng batas ng pamamahagi ng dami x, samantalang ito ay hindi kinakailangan para sa aplikasyon ng mga tinatayang pamamaraan.

Ang ideya ng mga eksaktong pamamaraan para sa pagbuo ng mga agwat ng kumpiyansa ay ang mga sumusunod. Ang anumang agwat ng kumpiyansa ay matatagpuan mula sa kundisyong nagpapahayag ng posibilidad ng katuparan ng ilang mga hindi pagkakapantay-pantay, na kinabibilangan ng pagtatantya ng interes sa amin a. Batas sa pamamahagi ng grado a sa pangkalahatang kaso ay nakasalalay sa hindi kilalang mga parameter ng dami x. Gayunpaman, kung minsan posible na ipasa ang mga hindi pagkakapantay-pantay mula sa isang random na variable a sa ilang iba pang function ng mga naobserbahang halaga X p X 2, ..., X p. ang batas ng pamamahagi kung saan ay hindi nakasalalay sa hindi kilalang mga parameter, ngunit nakasalalay lamang sa bilang ng mga eksperimento at sa anyo ng batas ng pamamahagi ng dami x. Ang mga random na variable ng ganitong uri ay gumaganap ng malaking papel sa mga istatistika ng matematika; ang mga ito ay pinag-aralan nang mas detalyado para sa kaso ng isang normal na distribusyon ng dami x.

Halimbawa, napatunayan na sa ilalim ng normal na distribusyon ng dami X random na halaga

napapailalim sa tinatawag na Batas sa pamamahagi ng mag-aaral kasama P- 1 antas ng kalayaan; ang kapal ng batas na ito ay may anyo

kung saan ang G(x) ay ang kilalang gamma function:

Pinatunayan din na ang random variable

ay may "distribution % 2 " na may P- 1 degree ng kalayaan (tingnan ang kabanata 7), ang density nito ay ipinahayag ng formula

Nang hindi isinasaalang-alang ang mga derivasyon ng mga distribusyon (14.4.2) at (14.4.4), ipapakita namin kung paano mailalapat ang mga ito kapag gumagawa ng mga pagitan ng kumpiyansa para sa mga parameter Ty D .

Hayaang gumawa P mga independyenteng eksperimento sa isang random na variable x, ibinahagi ayon sa normal na batas na may hindi kilalang mga parameter TIO. Para sa mga parameter na ito, mga pagtatantya

Kinakailangang bumuo ng mga pagitan ng kumpiyansa para sa parehong mga parameter na tumutugma sa probabilidad ng kumpiyansa p.

Bumuo muna tayo ng confidence interval para sa mathematical expectation. Natural lang na gawing simetriko ang pagitan na ito patungkol sa t; tukuyin ng s p kalahati ng haba ng pagitan. Ang halaga ng sp ay dapat piliin upang ang kondisyon

Subukan nating ipasa sa kaliwang bahagi ng pagkakapantay-pantay (14.4.5) mula sa isang random na variable t sa isang random variable T, ipinamahagi ayon sa batas ng Mag-aaral. Upang gawin ito, pinarami namin ang parehong bahagi ng hindi pagkakapantay-pantay |m-w?|

sa isang positibong halaga: o, gamit ang notasyon (14.4.1),

Maghanap tayo ng isang numero / p upang ang halaga / p ay matatagpuan mula sa kundisyon

Makikita mula sa formula (14.4.2) na ang (1) ay isang even function, kaya ang (14.4.8) ay nagbibigay

Ang pagkakapantay-pantay (14.4.9) ay tumutukoy sa halaga / p depende sa p. Kung mayroon kang isang talahanayan ng mga mahalagang halaga

pagkatapos ay ang halaga / p ay matatagpuan sa pamamagitan ng reverse interpolation sa talahanayan. Gayunpaman, mas maginhawang mag-compile ng isang talahanayan ng mga halaga / p nang maaga. Ang nasabing talahanayan ay ibinigay sa Appendix (Talahanayan 5). Ipinapakita ng talahanayang ito ang mga halaga depende sa probabilidad ng kumpiyansa p at ang bilang ng mga antas ng kalayaan P- 1. Ang pagkakaroon ng natukoy / p ayon sa talahanayan. 5 at ipagpalagay

nakita namin ang kalahati ng lapad ng agwat ng kumpiyansa / p at ang agwat mismo

Halimbawa 1. 5 independyenteng mga eksperimento ang isinagawa sa isang random na variable x, karaniwang ipinamamahagi na may hindi kilalang mga parameter t at tungkol sa. Ang mga resulta ng mga eksperimento ay ibinigay sa talahanayan. 14.4.1.

Talahanayan 14.4.1

Maghanap ng pagtatantya t para sa pag-asa sa matematika at bumuo ng isang 90% na agwat ng kumpiyansa / p para dito (i.e., ang agwat na tumutugma sa posibilidad ng kumpiyansa p \u003d 0.9).

Desisyon. Meron kami:

Ayon sa talahanayan 5 ng aplikasyon para sa P - 1 = 4 at p = 0.9 nakita namin saan

Ang agwat ng kumpiyansa ay magiging

Halimbawa 2. Para sa mga kundisyon ng halimbawa 1 ng subsection 14.3, ipagpalagay ang halaga X karaniwang ipinamamahagi, hanapin ang eksaktong agwat ng kumpiyansa.

Desisyon. Ayon sa talahanayan 5 ng aplikasyon, makikita namin sa P - 1 = 19ir =

0.8 / p = 1.328; mula rito

Kung ikukumpara sa solusyon ng halimbawa 1 ng subsection 14.3 (e p = 0.072), nakikita natin na napakaliit ng pagkakaiba. Kung pananatilihin natin ang katumpakan sa pangalawang lugar ng decimal, ang mga pagitan ng kumpiyansa na makikita ng eksakto at tinatayang mga pamamaraan ay pareho:

Magpatuloy tayo sa pagbuo ng agwat ng kumpiyansa para sa pagkakaiba. Isaalang-alang ang walang pinapanigan na pagtatantya ng pagkakaiba

at ipahayag ang random variable D sa pamamagitan ng halaga V(14.4.3) may distribusyon x 2 (14.4.4):

Pag-alam sa batas ng pamamahagi ng dami V, posibleng mahanap ang pagitan / (1 ) kung saan ito nahuhulog na may ibinigay na probabilidad p.

batas sa pamamahagi k n _ x (v) ang halaga ng I 7 ay may anyo na ipinapakita sa fig. 14.4.1.

kanin. 14.4.1

Ang tanong ay arises: kung paano piliin ang pagitan / p? Kung ang batas ng pamamahagi ng dami V ay simetriko (tulad ng isang normal na batas o distribusyon ng Mag-aaral), natural na kunin ang pagitan /p simetriko na may paggalang sa inaasahan sa matematika. Sa kasong ito, ang batas k n _ x (v) walang simetriko. Sumang-ayon tayo na piliin ang pagitan /p upang ang mga probabilidad ng output ng dami V sa labas ng pagitan sa kanan at kaliwa (mga lugar na may kulay sa Fig. 14.4.1) ay pareho at pantay

Upang makabuo ng pagitan / p gamit ang property na ito, ginagamit namin ang Table. 4 na aplikasyon: naglalaman ito ng mga numero y) ganyan

para sa dami V, pagkakaroon ng x 2 -pamamahagi na may r antas ng kalayaan. Sa kaso natin r = n- 1. Ayusin r = n- 1 at hanapin sa kaukulang linya ng talahanayan. 4 dalawang halaga x 2 - ang isa ay tumutugma sa isang probabilidad ang isa pa - probabilities Italaga natin ang mga ito

mga halaga sa 2 at xl? Ang pagitan ay may y 2 , sa kanyang kaliwa, at y~ kanang dulo.

Ngayon nakita namin ang kinakailangang agwat ng kumpiyansa /| para sa pagkakaiba-iba na may mga hangganan D, at D2, na sumasaklaw sa punto D may posibilidad p:

Bumuo tayo ng ganoong pagitan / (, = (?> b A), na sumasaklaw sa punto D kung at kung lamang ang halaga V nahuhulog sa pagitan / r. Ipakita natin na ang pagitan

natutugunan ang kundisyong ito. Sa katunayan, ang hindi pagkakapantay-pantay ay katumbas ng mga hindi pagkakapantay-pantay

at ang mga hindi pagkakapantay-pantay na ito ay may posibilidad na p. Kaya, ang pagitan ng kumpiyansa para sa pagpapakalat ay matatagpuan at ipinahayag ng formula (14.4.13).

Halimbawa 3. Hanapin ang agwat ng kumpiyansa para sa pagkakaiba sa ilalim ng mga kondisyon ng halimbawa 2 ng subsection 14.3, kung alam na ang halaga X ipinamahagi nang normal.

Desisyon. Meron kami . Ayon sa talahanayan 4 ng aplikasyon

mahanap namin sa r = n - 1 = 19

Ayon sa formula (14.4.13) makikita natin ang confidence interval para sa dispersion

Katugmang agwat para sa karaniwang paglihis: (0.21; 0.32). Ang agwat na ito ay bahagyang lumampas sa pagitan (0.21; 0.29) na nakuha sa Halimbawa 2 ng Subsection 14.3 sa pamamagitan ng tinatayang pamamaraan.

  • Isinasaalang-alang ng Figure 14.3.1 ang isang confidence interval na simetriko tungkol sa a. Sa pangkalahatan, tulad ng makikita natin sa ibang pagkakataon, hindi ito kinakailangan.

Pagtataya ng mga pagitan ng kumpiyansa

Mga Layunin sa pag-aaral

Isinasaalang-alang ng mga istatistika ang mga sumusunod dalawang pangunahing gawain:

    Mayroon kaming ilang pagtatantya batay sa sample na data at gusto naming gumawa ng ilang probabilistic na pahayag tungkol sa kung nasaan ang totoong halaga ng parameter na tinatantya.

    Mayroon kaming partikular na hypothesis na kailangang masuri batay sa sample na data.

Sa paksang ito, isinasaalang-alang namin ang unang problema. Ipinakilala rin namin ang kahulugan ng agwat ng kumpiyansa.

Ang agwat ng kumpiyansa ay isang agwat na binuo sa paligid ng tinantyang halaga ng isang parameter at nagpapakita kung saan ang tunay na halaga ng tinantyang parameter ay nasa isang priori na ibinigay na posibilidad.

Pagkatapos pag-aralan ang materyal sa paksang ito, ikaw ay:

    alamin kung ano ang agwat ng kumpiyansa ng pagtatantya;

    matutong pag-uri-uriin ang mga problema sa istatistika;

    master ang pamamaraan ng pagbuo ng mga agwat ng kumpiyansa, parehong gamit ang mga istatistikal na formula at paggamit ng mga tool sa software;

    matutong tukuyin ang mga kinakailangang laki ng sample upang makamit ang ilang partikular na parameter ng katumpakan ng mga istatistikal na pagtatantya.

Pamamahagi ng mga katangian ng sample

T-pamamahagi

Tulad ng tinalakay sa itaas, ang distribusyon ng random variable ay malapit sa isang standardized normal distribution na may mga parameter na 0 at 1. Dahil hindi natin alam ang halaga ng σ, pinapalitan natin ito ng ilang pagtatantya s . Ang dami ay mayroon nang ibang distribusyon, ibig sabihin, o Pamamahagi ng mag-aaral, na tinutukoy ng parameter n -1 (bilang ng mga antas ng kalayaan). Ang distribusyon na ito ay malapit sa normal na distribusyon (mas malaki n, mas malapit ang mga distribusyon).

Sa fig. 95
Ang pamamahagi ng mag-aaral na may 30 degrees ng kalayaan ay ipinakita. Tulad ng nakikita mo, ito ay napakalapit sa normal na pamamahagi.

Katulad ng mga function para sa pagtatrabaho sa normal na distribution NORMDIST at NORMINV, may mga function para sa pagtatrabaho sa t-distribution - STUDIST (TDIST) at STUDRASPBR (TINV). Ang isang halimbawa ng paggamit ng mga function na ito ay matatagpuan sa STUDRIST.XLS file (template at solusyon) at sa fig. 96
.

Pamamahagi ng iba pang mga katangian

Tulad ng alam na natin, upang matukoy ang katumpakan ng pagtatantya ng inaasahan, kailangan natin ng t-distribution. Upang matantya ang iba pang mga parameter, tulad ng pagkakaiba-iba, ang iba pang mga distribusyon ay kinakailangan. Dalawa sa kanila ay ang F-distribution at x 2 -pamamahagi.

Agwat ng kumpiyansa para sa mean

Agwat ng kumpiyansa ay isang agwat na binuo sa paligid ng tinantyang halaga ng parameter at nagpapakita kung saan ang tunay na halaga ng tinantyang parameter ay nasa isang priori na ibinigay na posibilidad.

Ang pagbuo ng isang agwat ng kumpiyansa para sa average na halaga ay nangyayari sa sumusunod na paraan:

Halimbawa

Plano ng fast food restaurant na palawakin ang assortment nito gamit ang isang bagong uri ng sandwich. Upang matantya ang pangangailangan para dito, plano ng manager na random na pumili ng 40 bisita mula sa mga nakasubok na nito at hilingin sa kanila na i-rate ang kanilang saloobin sa bagong produkto sa isang sukat mula 1 hanggang 10. Nais tantyahin ng manager ang inaasahang bilang ng mga puntos na matatanggap ng bagong produkto at bubuo ng 95% confidence interval para sa pagtatantyang ito. Paano ito gagawin? (tingnan ang file na SANDWICH1.XLS (template at solusyon).

Desisyon

Upang malutas ang problemang ito, maaari mong gamitin ang . Ang mga resulta ay ipinakita sa fig. 97
.

Agwat ng kumpiyansa para sa kabuuang halaga

Minsan, ayon sa sample na data, kinakailangan na tantyahin hindi ang mathematical na inaasahan, ngunit ang kabuuang kabuuan ng mga halaga. Halimbawa, sa isang sitwasyon sa isang auditor, maaaring maging interesado na tantiyahin hindi ang average na halaga ng isang invoice, ngunit ang kabuuan ng lahat ng mga invoice.

Hayaang N ang kabuuang bilang ng mga elemento, n ang laki ng sample, ang T 3 ang kabuuan ng mga halaga sa sample, ang T" ay ang pagtatantya para sa kabuuan sa buong populasyon, pagkatapos , at ang agwat ng kumpiyansa ay kinakalkula ng formula , kung saan ang s ay ang pagtatantya ng standard deviation para sa sample, ay ang pagtatantya ng mean para sa sample.

Halimbawa

Sabihin nating gusto ng isang tanggapan ng buwis na tantyahin ang halaga ng kabuuang mga refund ng buwis para sa 10,000 nagbabayad ng buwis. Ang nagbabayad ng buwis ay maaaring makatanggap ng refund o magbabayad ng karagdagang mga buwis. Hanapin ang 95% na agwat ng kumpiyansa para sa halaga ng refund, kung ipagpalagay na ang laki ng sample na 500 tao (tingnan ang file REFUND AMOUNT.XLS (template at solusyon).

Desisyon

Walang espesyal na pamamaraan sa StatPro para sa kasong ito, gayunpaman, makikita mo na ang mga hangganan ay maaaring makuha mula sa mga hangganan para sa mean gamit ang mga formula sa itaas (Fig. 98
).

Agwat ng kumpiyansa para sa proporsyon

Hayaang ang p ay ang inaasahan ng bahagi ng mga customer, at ang pv ay isang pagtatantya ng bahaging ito, na nakuha mula sa isang sample ng laki n. Maaari itong ipakita na para sa sapat na malaki ang distribusyon ng pagtatantya ay magiging malapit sa normal na may mean p at standard deviation . Ang karaniwang error ng pagtatantya sa kasong ito ay ipinahayag bilang , at ang pagitan ng kumpiyansa bilang .

Halimbawa

Plano ng fast food restaurant na palawakin ang assortment nito gamit ang isang bagong uri ng sandwich. Upang matantya ang pangangailangan para dito, random na pinili ng manager ang 40 bisita mula sa mga nakasubok na nito at hiniling sa kanila na i-rate ang kanilang saloobin sa bagong produkto sa isang sukat mula 1 hanggang 10. Gusto ng manager na tantyahin ang inaasahang proporsyon ng mga customer na nagre-rate ng bagong produkto ng hindi bababa sa 6 na puntos (inaasahan niya na ang mga customer na ito ay ang mga mamimili ng bagong produkto).

Desisyon

Sa una, gumawa kami ng bagong column batay sa 1 kung ang marka ng kliyente ay higit sa 6 na puntos at 0 kung hindi man (tingnan ang SANDWICH2.XLS file (template at solusyon).

Paraan 1

Bilangin ang halaga ng 1, tinatantya namin ang bahagi, at pagkatapos ay ginagamit namin ang mga formula.

Ang halaga ng z cr ay kinuha mula sa mga espesyal na talahanayan ng normal na pamamahagi (halimbawa, 1.96 para sa isang 95% na agwat ng kumpiyansa).

Gamit ang diskarteng ito at tiyak na data upang makabuo ng 95% na pagitan, nakuha namin ang mga sumusunod na resulta (Larawan 99
). Ang kritikal na halaga ng parameter na z cr ay 1.96. Ang karaniwang error ng pagtatantya ay 0.077. Ang mas mababang limitasyon ng agwat ng kumpiyansa ay 0.475. Ang pinakamataas na limitasyon ng agwat ng kumpiyansa ay 0.775. Kaya, maaaring ipagpalagay ng isang manager na may 95% na katiyakan na ang porsyento ng mga customer na nagre-rate ng isang bagong produkto ng 6 na puntos o higit pa ay nasa pagitan ng 47.5 at 77.5.

Paraan 2

Maaaring malutas ang problemang ito gamit ang mga karaniwang tool ng StatPro. Upang gawin ito, sapat na tandaan na ang bahagi sa kasong ito ay tumutugma sa average na halaga ng hanay ng Uri. Susunod na mag-apply StatPro/Statistical Inference/One-Sample na Pagsusuri para bumuo ng confidence interval para sa mean value (expectation estimate) para sa Type column. Ang mga resulta na nakuha sa kasong ito ay magiging napakalapit sa resulta ng 1st method (Fig. 99).

Agwat ng kumpiyansa para sa karaniwang paglihis

s ay ginagamit bilang isang pagtatantya ng karaniwang paglihis (ang formula ay ibinigay sa seksyon 1). Ang densidad function ng pagtatantya s ay ang chi-squared function, na, tulad ng t-distribution, ay may n-1 degrees ng kalayaan. May mga espesyal na function para sa pagtatrabaho sa pamamahaging ito CHI2DIST (CHIDIST) at CHI2OBR (CHIINV) .

Ang agwat ng kumpiyansa sa kasong ito ay hindi na magiging simetriko. Ang conditional scheme ng mga hangganan ay ipinapakita sa fig. 100 .

Halimbawa

Ang makina ay dapat gumawa ng mga bahagi na may diameter na 10 cm. Gayunpaman, dahil sa iba't ibang mga pangyayari, ang mga pagkakamali ay nangyayari. Ang controller ng kalidad ay nag-aalala tungkol sa dalawang bagay: una, ang average na halaga ay dapat na 10 cm; pangalawa, kahit na sa kasong ito, kung ang mga paglihis ay malaki, kung gayon maraming mga detalye ang tatanggihan. Araw-araw ay gumagawa siya ng sample ng 50 bahagi (tingnan ang file QUALITY CONTROL.XLS (template at solusyon). Anong mga konklusyon ang maibibigay ng naturang sample?

Desisyon

Bumubuo kami ng 95% na agwat ng kumpiyansa para sa mean at para sa karaniwang paglihis gamit StatPro/Statistical Inference/ One-Sample Analysis(Larawan 101
).

Dagdag pa, gamit ang pagpapalagay ng isang normal na pamamahagi ng mga diameters, kinakalkula namin ang proporsyon ng mga may sira na produkto, na nagtatakda ng maximum na paglihis ng 0.065. Gamit ang mga kakayahan ng lookup table (ang kaso ng dalawang parameter), binubuo namin ang dependence ng porsyento ng mga pagtanggi sa mean value at standard deviation (Fig. 102
).

Ang pagitan ng kumpiyansa para sa pagkakaiba ng dalawang paraan

Ito ay isa sa pinakamahalagang aplikasyon ng mga pamamaraang istatistika. Mga halimbawa ng sitwasyon.

    Gustong malaman ng isang manager ng tindahan ng damit kung magkano o mas kaunti ang ginagastos ng karaniwang babaeng mamimili sa tindahan kaysa sa isang lalaki.

    Ang dalawang airline ay lumilipad ng magkatulad na ruta. Gusto ng isang organisasyon ng consumer na ihambing ang pagkakaiba sa pagitan ng average na inaasahang oras ng pagkaantala ng flight para sa parehong airline.

    Ang kumpanya ay nagpapadala ng mga kupon para sa ilang mga uri ng mga kalakal sa isang lungsod at hindi nagpapadala sa isa pa. Gusto ng mga manager na paghambingin ang average na mga pagbili ng mga item na ito sa susunod na dalawang buwan.

    Ang isang dealer ng kotse ay madalas na nakikipag-ugnayan sa mga mag-asawa sa mga presentasyon. Upang maunawaan ang kanilang mga personal na reaksyon sa pagtatanghal, ang mga mag-asawa ay madalas na hiwalay na kapanayamin. Gustong suriin ng manager ang pagkakaiba sa mga rating na ibinibigay ng mga lalaki at babae.

Kaso ng mga independiyenteng sample

Ang ibig sabihin ng pagkakaiba ay magkakaroon ng t-distribution na may n 1 + n 2 - 2 degrees ng kalayaan. Ang agwat ng kumpiyansa para sa μ 1 - μ 2 ay ipinahayag ng ratio:

Ang problemang ito ay maaaring malutas hindi lamang sa pamamagitan ng mga formula sa itaas, kundi pati na rin ng mga karaniwang tool ng StatPro. Upang gawin ito, ito ay sapat na upang mag-aplay

Agwat ng kumpiyansa para sa pagkakaiba sa pagitan ng mga sukat

Hayaan ang mathematical na inaasahan ng mga pagbabahagi. Hayaan ang kanilang mga sample na pagtatantya na binuo sa mga sample ng laki n 1 at n 2, ayon sa pagkakabanggit. Pagkatapos ay isang pagtatantya para sa pagkakaiba. Samakatuwid, ang agwat ng kumpiyansa para sa pagkakaibang ito ay ipinahayag bilang:

Narito ang z cr ay ang value na nakuha mula sa normal na distribution ng mga espesyal na talahanayan (halimbawa, 1.96 para sa 95% confidence interval).

Ang karaniwang error ng pagtatantya ay ipinahayag sa kasong ito ng kaugnayan:

.

Halimbawa

Ang tindahan, bilang paghahanda para sa malaking sale, ay nagsagawa ng sumusunod na pananaliksik sa marketing. Ang nangungunang 300 na mamimili ay pinili at random na hinati sa dalawang grupo ng 150 miyembro bawat isa. Ang lahat ng napiling mamimili ay pinadalhan ng mga imbitasyon upang lumahok sa pagbebenta, ngunit para lamang sa mga miyembro ng unang pangkat ay may nakalakip na kupon na nagbibigay ng karapatan sa 5% na diskwento. Sa panahon ng pagbebenta, ang mga pagbili ng lahat ng 300 napiling mamimili ay naitala. Paano mabibigyang-kahulugan ng isang tagapamahala ang mga resulta at gumawa ng paghatol tungkol sa pagiging epektibo ng kuponing? (Tingnan ang COUPONS.XLS file (template at solusyon)).

Desisyon

Para sa aming partikular na kaso, sa 150 customer na nakatanggap ng discount coupon, 55 ang bumili sa pagbebenta, at sa 150 na hindi nakatanggap ng coupon, 35 lang ang bumili (Fig. 103
). Pagkatapos ang mga halaga ng mga proporsyon ng sample ay 0.3667 at 0.2333, ayon sa pagkakabanggit. At ang sample na pagkakaiba sa pagitan ng mga ito ay katumbas ng 0.1333, ayon sa pagkakabanggit. Ipagpalagay na ang pagitan ng kumpiyansa na 95%, makikita natin mula sa normal na talahanayan ng pamamahagi z cr = 1.96. Ang pagkalkula ng karaniwang error ng sample na pagkakaiba ay 0.0524. Sa wakas, nakuha namin na ang mas mababang limitasyon ng 95% na agwat ng kumpiyansa ay 0.0307, ​​​​at ang pinakamataas na limitasyon ay 0.2359, ayon sa pagkakabanggit. Ang mga resultang nakuha ay maaaring bigyang-kahulugan sa paraang para sa bawat 100 customer na nakatanggap ng discount coupon, maaari naming asahan mula 3 hanggang 23 bagong customer. Gayunpaman, dapat tandaan na ang konklusyon na ito mismo ay hindi nangangahulugan ng kahusayan ng paggamit ng mga kupon (dahil sa pagbibigay ng diskwento, natalo tayo sa kita!). Ipakita natin ito sa konkretong datos. Ipagpalagay na ang average na halaga ng pagbili ay 400 rubles, kung saan 50 rubles. may tubo sa tindahan. Kung gayon ang inaasahang tubo sa bawat 100 customer na hindi nakatanggap ng kupon ay katumbas ng:

50 0.2333 100 \u003d 1166.50 rubles.

Mga katulad na kalkulasyon para sa 100 mamimili na nakatanggap ng coupon give:

30 0.3667 100 \u003d 1100.10 rubles.

Ang pagbaba sa average na kita sa 30 ay ipinaliwanag sa pamamagitan ng katotohanan na, gamit ang diskwento, ang mga mamimili na nakatanggap ng isang kupon ay, sa karaniwan, ay bibili para sa 380 rubles.

Kaya, ang pangwakas na konklusyon ay nagpapahiwatig ng inefficiency ng paggamit ng naturang mga kupon sa partikular na sitwasyong ito.

Magkomento. Maaaring malutas ang problemang ito gamit ang mga karaniwang tool ng StatPro. Upang gawin ito, sapat na upang bawasan ang problemang ito sa problema ng pagtantya ng pagkakaiba ng dalawang average sa pamamagitan ng pamamaraan, at pagkatapos ay ilapat StatPro/Statistical Inference/Two-Sample Analysis upang bumuo ng agwat ng kumpiyansa para sa pagkakaiba sa pagitan ng dalawang mean na halaga.

Kontrol ng agwat ng kumpiyansa

Ang haba ng agwat ng kumpiyansa ay nakasalalay sa sumusunod na mga kondisyon:

    direktang data (standard deviation);

    lebel ng kahalagahan;

    laki ng sample.

Laki ng sample para sa pagtatantya ng mean

Isaalang-alang muna natin ang problema sa pangkalahatang kaso. Tukuyin natin ang halaga ng kalahati ng haba ng agwat ng kumpiyansa na ibinigay sa atin bilang B (Larawan 104
). Alam namin na ang pagitan ng kumpiyansa para sa mean na halaga ng ilang random na variable X ay ipinahayag bilang , saan . Ipagpalagay na:

at pagpapahayag n , nakukuha natin .

Sa kasamaang palad, hindi namin alam ang eksaktong halaga ng pagkakaiba ng random variable X. Bilang karagdagan, hindi natin alam ang halaga ng t cr dahil ito ay nakasalalay sa n sa pamamagitan ng bilang ng mga antas ng kalayaan. Sa sitwasyong ito, magagawa natin ang mga sumusunod. Sa halip na ang variance s, gumagamit kami ng ilang pagtatantya ng variance para sa ilang available na realizations ng random variable na pinag-aaralan. Sa halip na ang halaga ng t cr, ginagamit namin ang halaga ng z cr para sa normal na distribusyon. Ito ay lubos na katanggap-tanggap, dahil ang mga function ng density para sa normal at t-distribusyon ay napakalapit (maliban sa kaso ng maliit na n ). Kaya, ang nais na pormula ay nasa anyo:

.

Dahil ang formula ay nagbibigay, sa pangkalahatan, ng mga hindi integer na resulta, ang pag-round na may labis na resulta ay kinukuha bilang ang nais na laki ng sample.

Halimbawa

Plano ng fast food restaurant na palawakin ang assortment nito gamit ang isang bagong uri ng sandwich. Upang matantya ang pangangailangan para dito, random na pinaplano ng manager na pumili ng ilang bisita mula sa mga nakasubok na nito, at hilingin sa kanila na i-rate ang kanilang saloobin sa bagong produkto sa sukat mula 1 hanggang 10. Gusto ng manager upang tantyahin ang inaasahang bilang ng mga puntos na matatanggap ng bagong produkto. produkto at i-plot ang 95% confidence interval ng pagtatantiyang iyon. Gayunpaman, gusto niyang hindi lalampas sa 0.3 ang kalahati ng lapad ng confidence interval. Ilang bisita ang kailangan niyang i-poll?

tulad ng sumusunod:

Dito r ots ay isang pagtatantya ng fraction p, at ang B ay isang ibinigay na kalahati ng haba ng agwat ng kumpiyansa. Ang isang napalaki na halaga para sa n ay maaaring makuha gamit ang halaga r ots= 0.5. Sa kasong ito, ang haba ng agwat ng kumpiyansa ay hindi lalampas sa ibinigay na halaga B para sa anumang tunay na halaga ng p.

Halimbawa

Hayaang magplano ang manager mula sa nakaraang halimbawa na tantyahin ang proporsyon ng mga customer na mas gusto ang isang bagong uri ng produkto. Gusto niyang bumuo ng 90% confidence interval na ang kalahating haba ay mas mababa sa o katumbas ng 0.05. Ilang kliyente ang dapat random na ma-sample?

Desisyon

Sa aming kaso, ang halaga ng z cr = 1.645. Samakatuwid, ang kinakailangang dami ay kinakalkula bilang .

Kung ang tagapamahala ay may dahilan upang maniwala na ang nais na halaga ng p ay, halimbawa, mga 0.3, kung gayon sa pamamagitan ng pagpapalit ng halagang ito sa formula sa itaas, makakakuha tayo ng mas maliit na halaga ng random na sample, katulad ng 228.

Formula upang matukoy random na laki ng sample sa kaso ng pagkakaiba sa pagitan ng dalawang paraan nakasulat bilang:

.

Halimbawa

May customer service center ang ilang kumpanya ng kompyuter. Kamakailan, tumaas ang bilang ng mga reklamo ng customer tungkol sa mahinang kalidad ng serbisyo. Ang service center ay pangunahing gumagamit ng dalawang uri ng mga empleyado: yaong may kaunting karanasan, ngunit nakatapos ng mga espesyal na kurso sa pagsasanay, at yaong may malawak na praktikal na karanasan, ngunit hindi nakatapos ng mga espesyal na kurso. Nais ng kumpanya na suriin ang mga reklamo ng customer sa nakalipas na anim na buwan at ihambing ang kanilang mga average na numero sa bawat isa sa dalawang grupo ng mga empleyado. Ipinapalagay na ang mga numero sa mga sample para sa parehong grupo ay magiging pareho. Ilang empleyado ang dapat isama sa sample para makakuha ng 95% interval na may kalahating haba na hindi hihigit sa 2?

Desisyon

Narito ang σ ots ay isang pagtatantya ng karaniwang paglihis ng parehong mga random na variable sa ilalim ng pagpapalagay na sila ay malapit. Kaya, sa aming gawain, kailangan naming makuha ang pagtatantya na ito. Magagawa ito, halimbawa, tulad ng sumusunod. Sa pagtingin sa data ng reklamo ng customer sa nakalipas na anim na buwan, maaaring mapansin ng isang manager na sa pangkalahatan ay nasa pagitan ng 6 at 36 na reklamo bawat empleyado. Alam na para sa isang normal na pamamahagi, halos lahat ng mga halaga ay hindi hihigit sa tatlong karaniwang paglihis mula sa mean, makatwirang maniniwala siya na:

, kung saan σ ots = 5.

Ang pagpapalit ng halagang ito sa formula, nakukuha namin .

Formula upang matukoy ang laki ng isang random na sample sa kaso ng pagtantya ng pagkakaiba sa pagitan ng mga pagbabahagi mukhang:

Halimbawa

Ang ilang kumpanya ay may dalawang pabrika para sa paggawa ng mga katulad na produkto. Nais ng tagapamahala ng isang kumpanya na ihambing ang mga rate ng depekto ng parehong mga pabrika. Ayon sa magagamit na impormasyon, ang rate ng pagtanggi sa parehong mga pabrika ay mula 3 hanggang 5%. Ito ay dapat na bumuo ng isang 99% na agwat ng kumpiyansa na may kalahating haba na hindi hihigit sa 0.005 (o 0.5%). Ilang produkto ang dapat piliin mula sa bawat pabrika?

Desisyon

Dito ang p 1ot at p 2ot ay mga pagtatantya ng dalawang hindi kilalang fraction ng mga pagtanggi sa 1st at 2nd factory. Kung maglalagay kami ng p 1ots \u003d p 2ots \u003d 0.5, pagkatapos ay makakakuha kami ng isang overestimated na halaga para sa n. Ngunit dahil sa aming kaso mayroon kaming ilang priori na impormasyon tungkol sa mga pagbabahaging ito, kinukuha namin ang itaas na pagtatantya ng mga pagbabahagi na ito, katulad ng 0.05. Nakukuha namin

Kapag tinatantya ang ilang parameter ng populasyon mula sa sample na data, kapaki-pakinabang na magbigay hindi lamang ng point estimate ng parameter, kundi pati na rin ng confidence interval na nagsasaad kung saan ang eksaktong halaga ng parameter na tinatantya ay maaaring nasa.

Sa kabanatang ito, nakilala rin namin ang mga quantitative na relasyon na nagpapahintulot sa amin na bumuo ng mga ganoong agwat para sa iba't ibang mga parameter; natutunan ang mga paraan upang makontrol ang haba ng agwat ng kumpiyansa.

Napansin din namin na ang problema sa pagtantya sa laki ng sample (problema sa pagpaplano ng eksperimento) ay maaaring malutas gamit ang mga karaniwang tool ng StatPro, lalo na. StatPro/Statistical Inference/Sample Size Selection.

Ang isip ay hindi lamang sa kaalaman, kundi pati na rin sa kakayahang ilapat ang kaalaman sa pagsasanay. (Aristotle)

Mga pagitan ng kumpiyansa

pangkalahatang pagsusuri

Pagkuha ng sample mula sa populasyon, kukuha kami ng puntong pagtatantya ng parameter ng interes sa amin at kalkulahin ang karaniwang error upang maipahiwatig ang katumpakan ng pagtatantya.

Gayunpaman, para sa karamihan ng mga kaso, ang karaniwang error na tulad nito ay hindi katanggap-tanggap. Mas kapaki-pakinabang na pagsamahin ang sukat na ito ng katumpakan sa isang pagtatantya ng pagitan para sa parameter ng populasyon.

Magagawa ito sa pamamagitan ng paggamit ng kaalaman sa theoretical probability distribution ng sample statistic (parameter) upang makalkula ang isang confidence interval (CI - Confidence Interval, CI - Confidence Interval) para sa parameter.

Sa pangkalahatan, pinalawak ng agwat ng kumpiyansa ang mga pagtatantya sa parehong direksyon sa pamamagitan ng ilang multiple ng karaniwang error (ng isang ibinigay na parameter); ang dalawang halaga (mga limitasyon ng kumpiyansa) na tumutukoy sa pagitan ay karaniwang pinaghihiwalay ng kuwit at nakapaloob sa mga panaklong.

Ang pagitan ng kumpiyansa para sa mean

Gamit ang normal na distribusyon

Ang sample mean ay may normal na distribusyon kung ang sample size ay malaki, kaya ang kaalaman sa normal na distribution ay maaaring magamit kapag isinasaalang-alang ang sample mean.

Sa partikular, 95% ng distribusyon ng sample na paraan ay nasa loob ng 1.96 standard deviations (SD) ng average ng populasyon.

Kapag mayroon lang kaming isang sample, tinatawag namin itong standard error of the mean (SEM) at kalkulahin ang 95% confidence interval para sa mean gaya ng sumusunod:

Kung ang eksperimentong ito ay paulit-ulit nang maraming beses, ang pagitan ay maglalaman ng totoong populasyon na ibig sabihin ay 95% ng oras.

Ito ay karaniwang isang agwat ng kumpiyansa, tulad ng hanay ng mga halaga kung saan ang ibig sabihin ng totoong populasyon (pangkalahatang ibig sabihin) ay may 95% na antas ng kumpiyansa.

Bagama't hindi ito masyadong mahigpit (ang ibig sabihin ng populasyon ay isang nakapirming halaga at samakatuwid ay hindi maaaring magkaroon ng probabilidad na nauugnay dito) upang bigyang-kahulugan ang agwat ng kumpiyansa sa ganitong paraan, ito ay mas madaling maunawaan sa konsepto.

Paggamit t- pamamahagi

Maaari mong gamitin ang normal na distribusyon kung alam mo ang halaga ng pagkakaiba sa populasyon. Gayundin, kapag ang laki ng sample ay maliit, ang sample mean ay sumusunod sa isang normal na distribusyon kung ang data na pinagbabatayan ng populasyon ay normal na ipinamamahagi.

Kung ang data na pinagbabatayan ng populasyon ay hindi normal na ipinamamahagi at/o ang pangkalahatang pagkakaiba-iba (populasyon pagkakaiba) ay hindi alam, ang sample mean ay sumusunod T-distribution ng mag-aaral.

Kalkulahin ang 95% na agwat ng kumpiyansa para sa ibig sabihin ng populasyon tulad ng sumusunod:

Saan - porsyento ng punto (percentile) t- Pamamahagi ng mag-aaral na may (n-1) na antas ng kalayaan, na nagbibigay ng dalawang-tailed na posibilidad na 0.05.

Sa pangkalahatan, nagbibigay ito ng mas malawak na agwat kaysa kapag gumagamit ng normal na distribusyon, dahil isinasaalang-alang nito ang karagdagang kawalan ng katiyakan na ipinakilala sa pamamagitan ng pagtantya sa pamantayan ng paglihis ng populasyon at/o dahil sa maliit na laki ng sample.

Kapag malaki ang sample size (sa pagkakasunud-sunod na 100 o higit pa), ang pagkakaiba sa pagitan ng dalawang distribusyon ( t-estudyante at normal) ay bale-wala. Gayunpaman, palaging gamitin t- pamamahagi kapag kinakalkula ang mga pagitan ng kumpiyansa, kahit na ang laki ng sample ay malaki.

Karaniwang 95% CI ang ipinahiwatig. Maaaring kalkulahin ang iba pang mga agwat ng kumpiyansa, tulad ng 99% CI para sa mean.

Sa halip na produkto ng karaniwang error at halaga ng talahanayan t- distribusyon na tumutugma sa isang dalawang-tailed na posibilidad na 0.05 i-multiply ito (karaniwang error) sa isang halaga na tumutugma sa isang dalawang-tailed na posibilidad na 0.01. Ito ay isang mas malawak na agwat ng kumpiyansa kaysa sa 95% na kaso dahil ito ay nagpapakita ng mas mataas na kumpiyansa na ang agwat ay talagang kasama ang ibig sabihin ng populasyon.

Agwat ng kumpiyansa para sa proporsyon

Ang sampling distribution ng mga proporsyon ay may binomial distribution. Gayunpaman, kung ang laki ng sample n makatwirang malaki, kung gayon ang pamamahagi ng proporsyon ng sample ay humigit-kumulang normal na may mean .

Tantyahin ayon sa sampling ratio p=r/n(saan r- ang bilang ng mga indibidwal sa sample na may mga katangian ng interes sa amin), at ang karaniwang error ay tinatantya:

Ang 95% confidence interval para sa proporsyon ay tinatantya:

Kung maliit ang sample size (kadalasan kapag np o n(1-p) mas maliit 5 ), pagkatapos ay dapat gamitin ang binomial distribution upang makalkula ang eksaktong mga pagitan ng kumpiyansa.

Tandaan na kung p ipinahayag bilang isang porsyento, kung gayon (1-p) pinalitan ng (100p).

Interpretasyon ng mga agwat ng kumpiyansa

Kapag binibigyang-kahulugan ang agwat ng kumpiyansa, interesado kami sa mga sumusunod na tanong:

Gaano kalawak ang agwat ng kumpiyansa?

Ang isang malawak na agwat ng kumpiyansa ay nagpapahiwatig na ang pagtatantya ay hindi tumpak; ang makitid ay nagpapahiwatig ng isang mainam na pagtatantya.

Ang lapad ng agwat ng kumpiyansa ay nakasalalay sa laki ng karaniwang error, na depende naman sa laki ng sample, at kapag isinasaalang-alang ang isang numeric na variable mula sa pagkakaiba-iba ng data, nagbibigay ng mas malawak na agwat ng kumpiyansa kaysa sa pag-aaral ng isang malaking set ng data na kakaunti. mga variable.

Kasama ba sa CI ang anumang mga halaga ng partikular na interes?

Maaari mong suriin kung ang malamang na halaga para sa isang parameter ng populasyon ay nasa loob ng agwat ng kumpiyansa. Kung oo, ang mga resulta ay pare-pareho sa malamang na halagang ito. Kung hindi, hindi malamang (para sa isang 95% na agwat ng kumpiyansa, ang pagkakataon ay halos 5%) na ang parameter ay may ganitong halaga.