Kalkulahin ang agwat ng kumpiyansa. Mga Paraan ng Pagsusuri ng Dami: Pagtantya ng Mga Pagitan ng Kumpiyansa

Ang agwat ng kumpiyansa ay dumating sa amin mula sa larangan ng mga istatistika. ito tiyak na saklaw, na nagsisilbing tantyahin ang hindi kilalang parameter na may isang mataas na antas pagiging maaasahan. Ang pinakamadaling paraan upang ipaliwanag ito ay sa pamamagitan ng isang halimbawa.

Ipagpalagay na kailangan mong mag-imbestiga ng ilang random na variable, halimbawa, ang bilis ng tugon ng server sa isang kahilingan ng kliyente. Sa bawat oras na mag-type ang isang user sa address ng isang partikular na site, tumutugon ang server sa ibang rate. Kaya, ang inimbestigahang oras ng pagtugon ay may random na karakter. Kaya eto na agwat ng kumpiyansa ay nagbibigay-daan sa iyo upang matukoy ang mga hangganan ng parameter na ito, at pagkatapos ay posible na igiit na may posibilidad na 95% ang server ay nasa saklaw na kinakalkula namin.

O kailangan mong malaman kung gaano karaming mga tao ang nakakaalam trademark mga kumpanya. Kapag kinakalkula ang agwat ng kumpiyansa, posible, halimbawa, na sabihin na may 95% na posibilidad ang bahagi ng mga mamimili na nakakaalam tungkol dito ay nasa saklaw mula 27% hanggang 34%.

Malapit na nauugnay sa terminong ito ay antas ng kumpiyansa. Kinakatawan nito ang posibilidad na ang nais na parameter ay kasama sa pagitan ng kumpiyansa. Tinutukoy ng value na ito kung gaano kalaki ang ating gustong hanay. Paano mas malaking halaga tinatanggap nito, mas makitid ang pagitan ng kumpiyansa, at kabaliktaran. Kadalasan ito ay nakatakda sa 90%, 95% o 99%. Ang halaga ng 95% ay ang pinakasikat.

Ang tagapagpahiwatig na ito ay naiimpluwensyahan din ng pagkakaiba-iba ng mga obserbasyon at ang kahulugan nito ay batay sa pagpapalagay na ang tampok na pinag-aaralan ay sumusunod. Ang pahayag na ito ay kilala rin bilang Gauss' Law. Ayon sa kanya, tulad ng isang pamamahagi ng lahat ng mga probabilidad ng isang tuloy-tuloy random variable, na maaaring ilarawan ng probability density. Kung ang palagay tungkol sa normal na pamamahagi naging mali, kung gayon ang pagtatantya ay maaaring hindi tama.

Una, alamin natin kung paano kalkulahin ang agwat ng kumpiyansa para Dito, dalawang kaso ang posible. Ang dispersion (ang antas ng pagkalat ng isang random na variable) ay maaaring malaman o hindi. Kung ito ay kilala, kung gayon ang aming agwat ng kumpiyansa ay kinakalkula gamit ang sumusunod na formula:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - tanda,

t ay isang parameter mula sa talahanayan ng pamamahagi ng Laplace,

σ ay ang square root ng dispersion.

Kung hindi alam ang pagkakaiba, maaari itong kalkulahin kung alam natin ang lahat ng mga halaga ng nais na tampok. Para dito, ginagamit ang sumusunod na formula:

σ2 = х2ср - (хр)2, kung saan

х2ср - ang average na halaga ng mga parisukat ng katangian na pinag-aaralan,

Ang (xsr)2 ay ang parisukat ng tampok na ito.

Ang formula kung saan kinakalkula ang agwat ng kumpiyansa sa kasong ito ay bahagyang nagbabago:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - sample ibig sabihin,

α - tanda,

t ay isang parameter na matatagpuan gamit ang talahanayan ng pamamahagi ng Estudyante t \u003d t (ɣ; n-1),

Ang sqrt(n) ay ang square root ng kabuuang sample size,

s ay ang square root ng variance.

Isaalang-alang ang halimbawang ito. Ipagpalagay na, batay sa mga resulta ng 7 mga pagsukat, ang katangiang pinag-aaralan ay natukoy na 30 at ang sample na pagkakaiba ay katumbas ng 36. Kinakailangang makahanap, na may posibilidad na 99%, ng confidence interval na naglalaman ng tunay na halaga ng ang sinusukat na parameter.

Una, tukuyin natin kung ano ang katumbas ng t: t \u003d t (0.99; 7-1) \u003d 3.71. Gamit ang formula sa itaas, nakukuha namin:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3.71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Ang agwat ng kumpiyansa para sa variance ay kinakalkula kapwa sa kaso ng isang kilalang mean at kapag walang data sa mathematical na inaasahan, at tanging ang halaga ng walang pinapanigan na pagtatantya ng punto ng pagkakaiba ang nalalaman. Hindi namin ibibigay dito ang mga formula para sa pagkalkula nito, dahil ang mga ito ay medyo kumplikado at, kung ninanais, palagi silang matatagpuan sa net.

Tandaan lamang namin na maginhawa upang matukoy ang agwat ng kumpiyansa gamit ang Excel program o isang serbisyo sa network, na tinatawag na gayon.

Ang isa sa mga pamamaraan para sa paglutas ng mga problema sa istatistika ay ang pagkalkula ng agwat ng kumpiyansa. Ito ay ginagamit bilang isang ginustong alternatibo sa point estimation kapag ang sample size ay maliit. Dapat tandaan na ang proseso ng pagkalkula ng agwat ng kumpiyansa ay medyo kumplikado. Ngunit pinapayagan ka ng mga tool ng Excel program na medyo pasimplehin ito. Alamin natin kung paano ito ginagawa sa pagsasanay.

Ang pamamaraang ito ay ginagamit sa pagtatantya ng pagitan ng iba't ibang istatistikal na dami. Ang pangunahing gawain ng pagkalkula na ito ay upang mapupuksa ang mga kawalan ng katiyakan ng pagtatantya ng punto.

Sa Excel, mayroong dalawang pangunahing opsyon upang makalkula gamit ang paraang ito: kapag alam ang pagkakaiba, at kapag hindi ito kilala. Sa unang kaso, ang function ay ginagamit para sa mga kalkulasyon NORM NG tiwala sa sarili, at sa pangalawa MAGTIWALA.ESTUDYANTE.

Paraan 1: function na CONFIDENCE NORM

Operator NORM NG tiwala sa sarili, na tumutukoy sa pangkat ng istatistika ng mga pag-andar, unang lumitaw sa Excel 2010. Ginagamit ng mga naunang bersyon ng program na ito ang katapat nito TIWALA. Ang gawain ng operator na ito ay kalkulahin ang agwat ng kumpiyansa na may normal na distribusyon para sa average ng populasyon.

Ang syntax nito ay ang mga sumusunod:

CONFIDENCE NORM(alpha, standard_dev, size)

"Alpha" ay isang argumento na nagsasaad ng antas ng kahalagahan na ginagamit upang kalkulahin ang antas ng kumpiyansa. Ang antas ng kumpiyansa ay katumbas ng sumusunod na expression:

(1-"Alpha")*100

"Karaniwang lihis" ay isang argumento, ang kakanyahan nito ay malinaw sa pangalan. Ito ang karaniwang paglihis ng iminungkahing sample.

"Ang sukat" ay isang argumento na tumutukoy sa laki ng sample.

Ang lahat ng mga argumento sa operator na ito ay kinakailangan.

Function TIWALA ay may eksaktong parehong mga argumento at posibilidad tulad ng nauna. Ang syntax nito ay:

TRUST(alpha, standard_dev, laki)

Tulad ng nakikita mo, ang mga pagkakaiba ay nasa pangalan lamang ng operator. Ang tampok na ito ay pinanatili sa Excel 2010 at mga mas bagong bersyon sa isang espesyal na kategorya para sa mga dahilan ng pagiging tugma. "Pagkatugma". Sa mga bersyon ng Excel 2007 at mas maaga, ito ay naroroon sa pangunahing pangkat ng mga istatistikal na operator.

Ang hangganan ng agwat ng kumpiyansa ay tinutukoy gamit ang formula ng sumusunod na anyo:

X+(-)NORMA NG PAGTITIWALA

saan X ay ang sample mean, na matatagpuan sa gitna ng napiling hanay.

Ngayon tingnan natin kung paano kalkulahin ang agwat ng kumpiyansa gamit ang isang partikular na halimbawa. 12 mga pagsubok ang isinagawa, na nagresulta sa iba't ibang mga resulta, na nakalista sa talahanayan. Ito ang ating kabuuan. Ang standard deviation ay 8. Kailangan nating kalkulahin ang confidence interval sa 97% confidence level.

  1. Piliin ang cell kung saan ipapakita ang resulta ng pagproseso ng data. Ang pag-click sa pindutan "Insert Function".
  2. Lumilitaw Function Wizard. Pumunta sa kategorya "Istatistika" at i-highlight ang pangalan "CONFIDENCE.NORM". Pagkatapos ay mag-click sa pindutan OK.
  3. Bubukas ang window ng mga argumento. Ang mga patlang nito ay natural na tumutugma sa mga pangalan ng mga argumento.
    Itakda ang cursor sa unang field - "Alpha". Dito dapat nating tukuyin ang antas ng kahalagahan. Sa ating natatandaan, ang ating antas ng pagtitiwala ay 97%. Kasabay nito, sinabi namin na ito ay kinakalkula sa ganitong paraan:

    (1-level ng tiwala)/100

    Iyon ay, sa pamamagitan ng pagpapalit ng halaga, makakakuha tayo ng:

    Sa pamamagitan ng mga simpleng kalkulasyon, nalaman namin na ang argumento "Alpha" katumbas 0,03 . Ilagay ang value na ito sa field.

    Tulad ng alam mo, ang standard deviation ay katumbas ng 8 . Samakatuwid, sa larangan "Karaniwang lihis" isulat mo lang ang numerong iyan.

    Sa field "Ang sukat" kailangan mong ipasok ang bilang ng mga elemento ng mga pagsubok na isinagawa. Sa pagkakaalala natin, sila 12 . Ngunit para ma-automate ang formula at hindi ito i-edit sa tuwing may gagawing bagong pagsubok, itakda natin ang value na ito hindi sa ordinaryong numero, ngunit gamit ang operator. SURIIN. Kaya, itinakda namin ang cursor sa field "Ang sukat", at pagkatapos ay mag-click sa tatsulok, na matatagpuan sa kaliwa ng formula bar.

    Lilitaw ang isang listahan ng mga kamakailang ginamit na function. Kung ang operator SURIIN ginamit mo kamakailan, dapat itong nasa listahang ito. Sa kasong ito, kailangan mo lamang i-click ang pangalan nito. Kung hindi, kung hindi mo mahanap ito, pagkatapos ay pumunta sa punto "Higit pang mga tampok...".

  4. Parang pamilyar na sa amin Function Wizard. Lumipat pabalik sa grupo "Istatistika". Pipili kami ng pangalan doon "SURIIN". Mag-click sa pindutan OK.
  5. Lumilitaw ang window ng argumento para sa operator sa itaas. Ang function na ito ay idinisenyo upang kalkulahin ang bilang ng mga cell sa tinukoy na hanay na naglalaman ng mga numerong halaga. Ang syntax nito ay ang sumusunod:

    COUNT(value1, value2,…)

    Grupo ng argumento "Mga halaga" ay isang reference sa hanay kung saan mo gustong kalkulahin ang bilang ng mga cell na puno ng numeric data. Sa kabuuan, maaaring magkaroon ng hanggang 255 ganoong mga argumento, ngunit sa aming kaso kailangan lang namin ng isa.

    Itakda ang cursor sa field "Halaga1" at, pagpindot sa kaliwang pindutan ng mouse, piliin ang hanay sa sheet na naglalaman ng aming populasyon. Pagkatapos ang address nito ay ipapakita sa field. Mag-click sa pindutan OK.

  6. Pagkatapos nito, isasagawa ng application ang pagkalkula at ipapakita ang resulta sa cell kung saan ito mismo. Sa aming partikular na kaso, ang formula ay naging ganito:

    CONFIDENCE NORM(0.03,8,COUNT(B2:B13))

    Ang kabuuang resulta ng mga kalkulasyon ay 5,011609 .

  7. Ngunit hindi lang iyon. Tulad ng naaalala namin, ang hangganan ng agwat ng kumpiyansa ay kinakalkula sa pamamagitan ng pagdaragdag at pagbabawas mula sa average na sample na halaga ng resulta ng pagkalkula. NORM NG tiwala sa sarili. Sa ganitong paraan, kinakalkula ang kanan at kaliwang mga hangganan ng agwat ng kumpiyansa, ayon sa pagkakabanggit. Ang sample mean mismo ay maaaring kalkulahin gamit ang operator AVERAGE.

    Ang operator na ito ay idinisenyo upang kalkulahin ang arithmetic mean ng napiling hanay ng mga numero. Mayroon itong sumusunod na medyo simpleng syntax:

    AVERAGE(number1, number2,…)

    Pangangatwiran "Numero" maaaring maging isang solong numeric na halaga o isang reference sa mga cell o kahit na buong hanay na naglalaman ng mga ito.

    Kaya, piliin ang cell kung saan ipapakita ang pagkalkula ng average na halaga, at mag-click sa pindutan "Insert Function".

  8. nagbubukas Function Wizard. Bumalik sa kategorya "Istatistika" at pumili ng pangalan mula sa listahan "AVERAGE". Gaya ng nakasanayan, mag-click sa pindutan OK.
  9. Inilunsad ang window ng mga argumento. Itakda ang cursor sa field "Number1" at kapag pinindot ang kaliwang pindutan ng mouse, piliin ang buong hanay ng mga halaga. Matapos ipakita ang mga coordinate sa field, mag-click sa pindutan OK.
  10. Pagkatapos noon AVERAGE output ang resulta ng pagkalkula sa isang elemento ng sheet.
  11. Kinakalkula namin ang tamang hangganan ng agwat ng kumpiyansa. Upang gawin ito, pumili ng isang hiwalay na cell, ilagay ang sign «=» at idagdag ang mga nilalaman ng mga elemento ng sheet kung saan matatagpuan ang mga resulta ng pagkalkula ng mga function AVERAGE at NORM NG tiwala sa sarili. Upang maisagawa ang pagkalkula, pindutin ang pindutan Pumasok. Sa aming kaso, nakuha namin ang sumusunod na formula:

    Resulta ng pagkalkula: 6,953276

  12. Sa parehong paraan, kinakalkula namin ang kaliwang hangganan ng agwat ng kumpiyansa, sa pagkakataong ito lamang mula sa resulta ng pagkalkula AVERAGE ibawas ang resulta ng pagkalkula ng operator NORM NG tiwala sa sarili. Lumalabas ang formula para sa aming halimbawa ng sumusunod na uri:

    Resulta ng pagkalkula: -3,06994

  13. Sinubukan naming ilarawan nang detalyado ang lahat ng mga hakbang para sa pagkalkula ng agwat ng kumpiyansa, kaya inilarawan namin nang detalyado ang bawat formula. Ngunit maaari mong pagsamahin ang lahat ng mga aksyon sa isang formula. Ang pagkalkula ng tamang hangganan ng agwat ng kumpiyansa ay maaaring isulat tulad ng sumusunod:

    AVERAGE(B2:B13)+CONFIDENCE(0.03,8,COUNT(B2:B13))

  14. Ang isang katulad na pagkalkula ng kaliwang hangganan ay magiging ganito:

    AVERAGE(B2:B13)-CONFIDENCE.NORM(0.03,8,COUNT(B2:B13))

Paraan 2: TRUST.STUDENT function

Bilang karagdagan, mayroong isa pang function sa Excel na nauugnay sa pagkalkula ng agwat ng kumpiyansa - MAGTIWALA.ESTUDYANTE. Ito ay lumitaw lamang mula noong Excel 2010. Ginagawa ng operator na ito ang pagkalkula ng pagitan ng kumpiyansa ng populasyon gamit ang distribusyon ng Mag-aaral. Ito ay napaka-maginhawang gamitin ito sa kaso kapag ang pagkakaiba at, nang naaayon, ang karaniwang paglihis ay hindi alam. Ang operator syntax ay:

TRUST.STUDENT(alpha,standard_dev,size)

Tulad ng nakikita mo, ang mga pangalan ng mga operator sa kasong ito ay nanatiling hindi nabago.

Tingnan natin kung paano kalkulahin ang mga hangganan ng agwat ng kumpiyansa na may hindi kilalang standard deviation gamit ang halimbawa ng parehong populasyon na isinasaalang-alang namin sa nakaraang pamamaraan. Yung level of confidence, like last time, we will take 97%.

  1. Piliin ang cell kung saan gagawin ang pagkalkula. Mag-click sa pindutan "Insert Function".
  2. Sa binuksan Function Wizard pumunta sa kategorya "Istatistika". Pumili ng pangalan "TIWALA. ESTUDYANTE". Mag-click sa pindutan OK.
  3. Ang window ng argumento para sa tinukoy na operator ay inilunsad.

    Sa field "Alpha", dahil ang antas ng kumpiyansa ay 97%, isinusulat namin ang numero 0,03 . Sa pangalawang pagkakataon ay hindi tayo magtatagal sa mga prinsipyo ng pagkalkula ng parameter na ito.

    Pagkatapos nito, itakda ang cursor sa field "Karaniwang lihis". Sa pagkakataong ito, ang tagapagpahiwatig na ito ay hindi alam sa amin at kailangan itong kalkulahin. Ginagawa ito gamit ang isang espesyal na function - STDEV.V. Upang tawagan ang window ng operator na ito, mag-click sa tatsulok sa kaliwa ng formula bar. Kung hindi namin mahanap ang nais na pangalan sa listahan na bubukas, pagkatapos ay pumunta sa item "Higit pang mga tampok...".

  4. ay tumatakbo Function Wizard. Lumipat sa kategorya "Istatistika" at markahan ang pangalan "STDEV.B". Pagkatapos ay mag-click sa pindutan OK.
  5. Bubukas ang window ng mga argumento. gawain ng operator STDEV.V ay ang kahulugan ng standard deviation sa sampling. Mukhang ganito ang syntax nito:

    STDEV.V(number1,number2,…)

    Ito ay madaling hulaan na ang argumento "Numero" ay ang address ng elemento ng pagpili. Kung ang pagpili ay inilagay sa isang array, pagkatapos ay gumagamit lamang ng isang argumento, maaari kang magbigay ng isang link sa hanay na ito.

    Itakda ang cursor sa field "Number1" at, gaya ng nakasanayan, pagpindot sa kaliwang pindutan ng mouse, piliin ang set. Matapos ang mga coordinate ay nasa field, huwag magmadali upang pindutin ang pindutan OK dahil mali ang magiging resulta. Una kailangan nating bumalik sa window ng mga argumento ng operator MAGTIWALA.ESTUDYANTE upang gawin ang pangwakas na argumento. Upang gawin ito, mag-click sa naaangkop na pangalan sa formula bar.

  6. Ang window ng argumento ng pamilyar na function ay bubukas muli. Itakda ang cursor sa field "Ang sukat". Muli, mag-click sa tatsulok na pamilyar sa amin upang pumunta sa pagpili ng mga operator. Tulad ng naiintindihan mo, kailangan namin ng isang pangalan "SURIIN". Dahil ginamit namin ang function na ito sa mga kalkulasyon sa nakaraang pamamaraan, naroroon ito sa listahang ito, kaya i-click lamang ito. Kung hindi mo ito mahanap, pagkatapos ay sundin ang algorithm na inilarawan sa unang paraan.
  7. Pagpasok sa window ng mga argumento SURIIN, ilagay ang cursor sa field "Number1" at habang pinipigilan ang pindutan ng mouse, piliin ang koleksyon. Pagkatapos ay mag-click sa pindutan OK.
  8. Pagkatapos nito, kinakalkula at ipinapakita ng programa ang halaga ng agwat ng kumpiyansa.
  9. Upang matukoy ang mga hangganan, kakailanganin nating kalkulahin muli ang sample mean. Ngunit, ibinigay na ang pagkalkula algorithm gamit ang formula AVERAGE katulad ng sa nakaraang pamamaraan, at kahit na ang resulta ay hindi nagbago, hindi namin ito tatalakayin nang detalyado sa pangalawang pagkakataon.
  10. Pagdaragdag ng mga resulta ng pagkalkula AVERAGE at MAGTIWALA.ESTUDYANTE, nakuha namin ang tamang hangganan ng agwat ng kumpiyansa.
  11. Ang pagbabawas mula sa mga resulta ng pagkalkula ng operator AVERAGE resulta ng pagkalkula MAGTIWALA.ESTUDYANTE, mayroon kaming left bound ng confidence interval.
  12. Kung ang pagkalkula ay nakasulat sa isang formula, kung gayon ang pagkalkula ng tamang hangganan sa aming kaso ay magiging ganito:

    AVERAGE(B2:B13)+TIWALA NG MAG-AARAL(0.03,STDV(B2:B13),COUNT(B2:B13))

  13. Alinsunod dito, ang formula para sa pagkalkula ng kaliwang hangganan ay magiging ganito:

    AVERAGE(B2:B13)-TIWALA NG MAG-AARAL(0.03,STDV(B2:B13),COUNT(B2:B13))

Tulad ng nakikita mo, ginagawang posible ng mga tool ng Excel program na makabuluhang mapadali ang pagkalkula ng agwat ng kumpiyansa at mga hangganan nito. Para sa mga layuning ito, ang mga hiwalay na operator ay ginagamit para sa mga sample na ang pagkakaiba ay kilala at hindi alam.

At iba pa. Lahat ng mga ito ay mga pagtatantya ng kanilang mga teoretikal na katapat, na maaaring makuha kung walang sample, ngunit ang pangkalahatang populasyon. Ngunit sayang, ang pangkalahatang populasyon ay napakamahal at kadalasan ay hindi magagamit.

Ang konsepto ng pagtatantya ng pagitan

Ang anumang sample na pagtatantya ay may ilang scatter, dahil ay isang random na variable depende sa mga halaga sa isang partikular na sample. Samakatuwid, para sa mas maaasahang istatistikal na inferences, dapat malaman hindi lamang ang point estimate, kundi pati na rin ang interval, na may mataas na posibilidad. γ Sinasaklaw ng (gamma) ang tinantyang tagapagpahiwatig θ (theta).

Pormal, ito ay dalawang ganoong halaga (mga istatistika) T1(X) at T2(X), Ano T1< T 2 , kung saan sa isang naibigay na antas ng posibilidad γ natugunan ang kondisyon:

Sa madaling salita, malamang γ o higit pa ang tunay na halaga ay nasa pagitan ng mga puntos T1(X) at T2(X), na tinatawag na lower at upper bounds agwat ng kumpiyansa.

Ang isa sa mga kondisyon para sa pagbuo ng mga agwat ng kumpiyansa ay ang maximum na makitid nito, i.e. ito ay dapat na kasing-ikli hangga't maaari. Ang pagnanais ay medyo natural, dahil. sinusubukan ng mananaliksik na mas tumpak na i-localize ang paghahanap ng nais na parameter.

Ito ay sumusunod na ang agwat ng kumpiyansa ay dapat sumaklaw sa pinakamataas na posibilidad ng pamamahagi. at ang score mismo ay nasa gitna.

Iyon ay, ang posibilidad ng paglihis (ng tunay na tagapagpahiwatig mula sa pagtatantya) pataas ay katumbas ng posibilidad ng paglihis pababa. Dapat ding tandaan na para sa mga skewed distribution, ang interval sa kanan ay hindi katumbas ng interval sa kaliwa.

Ang figure sa itaas ay malinaw na nagpapakita na mas malaki ang antas ng kumpiyansa, mas malawak ang pagitan - isang direktang relasyon.

Ito ay isang maliit na panimula sa teorya ng pagtatantya ng pagitan ng hindi kilalang mga parameter. Lumipat tayo sa paghahanap ng mga limitasyon ng kumpiyansa para sa inaasahan sa matematika.

Agwat ng kumpiyansa para sa inaasahan sa matematika

Kung ang orihinal na data ay ibinahagi sa , ang average ay magiging isang normal na halaga. Ito ay sumusunod mula sa panuntunan na ang isang linear na kumbinasyon ng mga normal na halaga ay mayroon ding normal na distribusyon. Samakatuwid, upang kalkulahin ang mga probabilidad, maaari naming gamitin ang mathematical apparatus ng normal na batas sa pamamahagi.

Gayunpaman, mangangailangan ito ng kaalaman sa dalawang parameter - ang inaasahang halaga at ang pagkakaiba, na karaniwang hindi alam. Maaari mong, siyempre, gumamit ng mga pagtatantya sa halip na mga parameter (arithmetic mean at ), ngunit pagkatapos ay ang distribusyon ng mean ay hindi magiging normal, ito ay bahagyang pipi. Mahusay na napansin ng mamamayang si William Gosset ng Ireland ang katotohanang ito nang ilathala niya ang kanyang natuklasan sa Marso 1908 na isyu ng Biometrica. Para sa mga layuning lihim, lumagda si Gosset kasama ang Mag-aaral. Ganito lumabas ang t-distribution ng Student.

Gayunpaman, ang normal na pamamahagi ng data, na ginamit ni K. Gauss sa pagsusuri ng mga pagkakamali sa mga obserbasyon sa astronomiya, ay napakabihirang sa buhay sa lupa at medyo mahirap itatag ito (para sa mataas na katumpakan, mga 2 libong obserbasyon ang kailangan). Samakatuwid, pinakamahusay na i-drop ang normality assumption at gumamit ng mga pamamaraan na hindi nakadepende sa pamamahagi ng orihinal na data.

Ang tanong ay lumitaw: ano ang pamamahagi ng ibig sabihin ng aritmetika kung ito ay kinakalkula mula sa data ng isang hindi kilalang pamamahagi? Ang sagot ay ibinigay ng kilalang in probability theory Central limit theorem(CPT). Sa matematika, mayroong ilang mga bersyon nito (ang mga pormulasyon ay pino sa paglipas ng mga taon), ngunit lahat ng mga ito, sa halos pagsasalita, ay bumaba sa pahayag na ang kabuuan ng isang malaking bilang ng mga independiyenteng random na mga variable ay sumusunod sa normal na batas sa pamamahagi.

Kapag kinakalkula ang arithmetic mean, ang kabuuan ng mga random na variable ay ginagamit. Mula dito lumalabas na ang arithmetic mean ay may normal na distribusyon, kung saan ang inaasahang halaga ay ang inaasahang halaga ng orihinal na data, at ang pagkakaiba ay .

Alam ng mga matalinong tao kung paano patunayan ang CLT, ngunit ibe-verify namin ito sa tulong ng isang eksperimento na isinagawa sa Excel. Gayahin natin ang isang sample ng 50 pare-parehong ipinamahagi na random variable (gamit ang Excel function na RANDOMBETWEEN). Pagkatapos ay gagawa kami ng 1000 tulad ng mga sample at kalkulahin ang arithmetic mean para sa bawat isa. Tingnan natin ang kanilang pamamahagi.

Makikita na ang distribusyon ng average ay malapit sa normal na batas. Kung ang dami ng mga sample at ang kanilang bilang ay gagawing mas malaki, kung gayon ang pagkakatulad ay magiging mas mahusay.

Ngayon na nakita natin para sa ating sarili ang bisa ng CLT, maaari nating, gamit ang , kalkulahin ang mga pagitan ng kumpiyansa para sa arithmetic mean, na sumasaklaw sa tunay na mean o mathematical na inaasahan na may ibinigay na posibilidad.

Upang maitatag ang upper at lower bounds, kinakailangang malaman ang mga parameter ng normal na distribution. Bilang isang patakaran, hindi sila, samakatuwid, ang mga pagtatantya ay ginagamit: ibig sabihin ng aritmetika at sample na pagkakaiba-iba. Muli, ang pamamaraang ito ay nagbibigay ng isang mahusay na approximation para lamang sa malalaking sample. Kapag ang mga sample ay maliit, madalas na inirerekomenda na gamitin ang pamamahagi ng Mag-aaral. wag kang maniwala! Ang distribusyon ng mag-aaral para sa mean ay nangyayari lamang kapag ang orihinal na data ay may normal na distribusyon, iyon ay, halos hindi kailanman. Samakatuwid, mas mahusay na agad na itakda ang minimum na bar para sa dami ng kinakailangang data at gumamit ng mga asymptotically correct na pamamaraan. Sabi nila, sapat na ang 30 obserbasyon. Kumuha ng 50 - hindi ka maaaring magkamali.

T 1.2 ay ang lower at upper bounds ng confidence interval

– sample na arithmetic mean

s0– sample na standard deviation (walang pinapanigan)

n – laki ng sample

γ – antas ng kumpiyansa (karaniwang katumbas ng 0.9, 0.95 o 0.99)

c γ =Φ -1 ((1+γ)/2) ay ang kapalit ng karaniwang normal na distribution function. Sa simpleng mga termino, ito ang bilang ng mga karaniwang error mula sa arithmetic mean hanggang sa lower o upper bound (ang ipinahiwatig na tatlong probabilities ay tumutugma sa mga value ng 1.64, 1.96 at 2.58).

Ang kakanyahan ng formula ay ang arithmetic mean ay kinuha at pagkatapos ay isang tiyak na halaga ay itabi mula dito ( kasama si γ) karaniwang mga error ( s 0 /√n). Ang lahat ay alam, kunin at bilangin.

Bago ang malawakang paggamit ng mga PC, upang makuha ang mga halaga ng normal na function ng pamamahagi at ang kabaligtaran nito, ginamit nila . Ginagamit pa rin ang mga ito, ngunit mas mahusay na bumaling sa mga yari na formula ng Excel. Ang lahat ng elemento mula sa formula sa itaas ( , at ) ay madaling kalkulahin sa Excel. Ngunit mayroon ding isang handa na formula para sa pagkalkula ng agwat ng kumpiyansa - NORM NG tiwala sa sarili. Ang syntax nito ay ang mga sumusunod.

CONFIDENCE NORM(alpha, standard_dev, size)

alpha– antas ng kahalagahan o antas ng kumpiyansa, na sa notasyon sa itaas ay katumbas ng 1-γ, i.e. ang posibilidad na ang mathematicalang inaasahan ay nasa labas ng confidence interval. Sa antas ng kumpiyansa na 0.95, ang alpha ay 0.05, at iba pa.

standard_off ay ang standard deviation ng sample data. Hindi mo kailangang kalkulahin ang karaniwang error, hahatiin ng Excel sa ugat ng n.

ang sukat– laki ng sample (n).

Ang resulta ng function na CONFIDENCE.NORM ay ang pangalawang termino mula sa formula para sa pagkalkula ng agwat ng kumpiyansa, i.e. kalahating pagitan. Alinsunod dito, ang mas mababa at itaas na mga punto ay ang average ± ang nakuhang halaga.

Kaya, posible na bumuo ng isang unibersal na algorithm para sa pagkalkula ng mga agwat ng kumpiyansa para sa arithmetic mean, na hindi nakasalalay sa pamamahagi ng paunang data. Ang presyo para sa pagiging pangkalahatan ay ang asymptotic na kalikasan nito, i.e. ang pangangailangang gumamit ng medyo malalaking sample. Gayunpaman, sa panahon ng modernong teknolohiya, ang pagkolekta ng tamang dami ng data ay karaniwang hindi mahirap.

Pagsubok sa Statistical Hypotheses Gamit ang Confidence Interval

(module 111)

Ang isa sa mga pangunahing problema na nalutas sa istatistika ay. Sa madaling salita, ang kakanyahan nito ay ito. Ang isang pagpapalagay ay ginawa, halimbawa, na ang inaasahan ng pangkalahatang populasyon ay katumbas ng ilang halaga. Pagkatapos ay ang pamamahagi ng sample na paraan ay itinayo, na maaaring maobserbahan sa isang naibigay na inaasahan. Susunod, titingnan natin kung saan sa kondisyonal na pamamahagi na ito ang tunay na average ay matatagpuan. Kung ito ay lumampas sa pinahihintulutang mga limitasyon, kung gayon ang hitsura ng naturang average ay napaka hindi malamang, at sa isang solong pag-uulit ng eksperimento ito ay halos imposible, na sumasalungat sa hypothesis na iniharap, na matagumpay na tinanggihan. Kung ang average ay hindi lalampas sa kritikal na antas, kung gayon ang hypothesis ay hindi tinatanggihan (ngunit hindi rin ito napatunayan!).

Kaya, sa tulong ng mga agwat ng kumpiyansa, sa aming kaso para sa inaasahan, maaari mo ring subukan ang ilang mga hypotheses. Napakadaling gawin. Ipagpalagay na ang arithmetic mean para sa ilang sample ay 100. Ang hypothesis ay sinusubok na ang inaasahang halaga ay, sabihin nating, 90. Ibig sabihin, kung ilalagay natin ang tanong sa primitively, ito ay ganito ang tunog: maaari bang sa totoong halaga ng average na katumbas ng 90, ang naobserbahang average ay 100?

Para masagot ang tanong na ito, kakailanganin ang karagdagang impormasyon sa standard deviation at sample size. Sabihin nating ang standard deviation ay 30, at ang bilang ng mga obserbasyon ay 64 (upang madaling makuha ang ugat). Pagkatapos ang karaniwang error ng mean ay 30/8 o 3.75. Upang kalkulahin ang 95% na agwat ng kumpiyansa, kakailanganin mong magtabi ng dalawang karaniwang error sa magkabilang panig ng mean (mas tiyak, 1.96). Ang confidence interval ay magiging humigit-kumulang 100 ± 7.5, o mula 92.5 hanggang 107.5.

Ang karagdagang pangangatwiran ay ang mga sumusunod. Kung ang nasubok na halaga ay nasa loob ng agwat ng kumpiyansa, kung gayon hindi ito sumasalungat sa hypothesis, dahil umaangkop sa loob ng mga limitasyon ng mga random na pagbabagu-bago (na may posibilidad na 95%). Kung ang nasubok na punto ay nasa labas ng agwat ng kumpiyansa, kung gayon ang posibilidad ng naturang kaganapan ay napakaliit, sa anumang kaso sa ibaba ng katanggap-tanggap na antas. Samakatuwid, ang hypothesis ay tinanggihan bilang sumasalungat sa naobserbahang data. Sa aming kaso, ang expectation hypothesis ay nasa labas ng confidence interval (ang nasubok na value na 90 ay hindi kasama sa interval na 100±7.5), kaya dapat itong tanggihan. Ang pagsagot sa primitive na tanong sa itaas, dapat sabihin ng isa: hindi, hindi ito maaaring, sa anumang kaso, ito ay napakabihirang mangyari. Kadalasan, ito ay nagpapahiwatig ng isang tiyak na posibilidad ng maling pagtanggi sa hypothesis (p-level), at hindi isang naibigay na antas, ayon sa kung saan ang agwat ng kumpiyansa ay binuo, ngunit higit pa sa ibang pagkakataon.

Tulad ng nakikita mo, hindi mahirap bumuo ng isang agwat ng kumpiyansa para sa mean (o inaasahan sa matematika). Ang pangunahing bagay ay upang mahuli ang kakanyahan, at pagkatapos ay pupunta ang mga bagay. Sa pagsasagawa, karamihan ay gumagamit ng 95% na agwat ng kumpiyansa, na halos dalawang karaniwang error ang lapad sa magkabilang panig ng mean.

Yun lang muna. Lahat ng pinakamahusay!

Mula sa artikulong ito matututunan mo ang:

    Ano agwat ng kumpiyansa?

    Ano ang punto 3 mga tuntunin ng sigma?

    Paano maisasabuhay ang kaalamang ito?

Sa ngayon, dahil sa labis na impormasyon na nauugnay sa isang malaking uri ng mga produkto, direksyon sa pagbebenta, empleyado, aktibidad, atbp., mahirap pumili ng pangunahing, na, una sa lahat, ay nagkakahalaga ng pagbibigay pansin at pagsisikap na pamahalaan. Kahulugan agwat ng kumpiyansa at pagsusuri ng paglampas sa mga hangganan nito ng aktwal na mga halaga - isang pamamaraan na tulungan kang matukoy ang mga sitwasyon, nakakaimpluwensya sa mga uso. Magagawa mong bumuo ng mga positibong salik at mabawasan ang impluwensya ng mga negatibo. Ang teknolohiyang ito ay ginagamit sa maraming kilalang kumpanya sa mundo.

May mga tinatawag na mga alerto", na ipaalam sa mga tagapamahala na nagsasabi na ang susunod na halaga sa isang tiyak na direksyon lumampas agwat ng kumpiyansa. Anong ibig sabihin nito? Isa itong senyales na may nangyaring hindi karaniwang kaganapan, na maaaring magbago sa kasalukuyang trend sa direksyong ito. Ito ang senyales sa ganyan upang ayusin ito sa sitwasyon at unawain kung ano ang nakaimpluwensya nito.

Halimbawa, isaalang-alang ang ilang sitwasyon. Kinakalkula namin ang forecast ng mga benta na may mga hangganan ng pagtataya para sa 100 mga item ng kalakal para sa 2011 ayon sa mga buwan at aktwal na mga benta noong Marso:

  1. Para sa "Sunflower oil" nalampasan nila ang itaas na limitasyon ng forecast at hindi nahulog sa agwat ng kumpiyansa.
  2. Para sa "Dry yeast" ay lumampas sa mas mababang limitasyon ng hula.
  3. Sa "Oatmeal Porridge" ay nakalusot sa itaas na limitasyon.

Para sa iba pang mga kalakal, ang aktwal na mga benta ay nasa loob ng tinukoy na mga hangganan ng pagtataya. Yung. ang kanilang mga benta ay naaayon sa inaasahan. Kaya, natukoy namin ang 3 produkto na lumampas sa mga hangganan, at nagsimulang malaman kung ano ang nakaimpluwensya sa paglampas sa mga hangganan:

  1. Sa Sunflower Oil, pumasok kami sa isang bagong network ng kalakalan, na nagbigay sa amin ng karagdagang dami ng benta, na humantong sa paglampas sa pinakamataas na limitasyon. Para sa produktong ito, ito ay nagkakahalaga ng muling pagkalkula ng forecast hanggang sa katapusan ng taon, na isinasaalang-alang ang forecast para sa mga benta sa chain na ito.
  2. Para sa Dry Yeast, natigil ang kotse sa customs, at nagkaroon ng kakulangan sa loob ng 5 araw, na nakaapekto sa pagbaba ng mga benta at lumampas sa lower border. Maaaring sulit na malaman kung ano ang sanhi ng dahilan at subukang huwag ulitin ang sitwasyong ito.
  3. Para sa Oatmeal, isang promosyon sa pagbebenta ang inilunsad, na nagresulta sa isang makabuluhang pagtaas sa mga benta at humantong sa isang overshoot ng forecast.

Natukoy namin ang 3 salik na nakaimpluwensya sa overshoot ng hula. Maaaring marami pa ang mga ito sa buhay. Upang mapabuti ang katumpakan ng pagtataya at pagpaplano, ang mga salik na humahantong sa katotohanan na ang aktwal na mga benta ay maaaring lumampas sa hula, ito ay nagkakahalaga ng pag-highlight at pagbuo ng mga pagtataya at mga plano para sa kanila nang hiwalay. At pagkatapos ay isaalang-alang ang kanilang epekto sa pangunahing pagtataya ng mga benta. Maaari mo ring regular na suriin ang epekto ng mga salik na ito at baguhin ang sitwasyon para sa mas mahusay para sa sa pamamagitan ng pagbabawas ng impluwensya ng negatibo at pagtaas ng impluwensya ng mga positibong salik.

Sa pagitan ng kumpiyansa, maaari nating:

  1. I-highlight ang mga destinasyon, na kung saan ay nagkakahalaga ng pagbibigay pansin sa, dahil mga pangyayaring naganap sa mga lugar na ito na maaaring makaapekto pagbabago sa kalakaran.
  2. Tukuyin ang mga Salik na talagang gumawa ng isang pagkakaiba.
  3. Upang tanggapin timbang na desisyon(halimbawa, tungkol sa pagkuha, kapag nagpaplano, atbp.).

Ngayon tingnan natin kung ano ang agwat ng kumpiyansa at kung paano kalkulahin ito sa Excel gamit ang isang halimbawa.

Ano ang confidence interval?

Ang agwat ng kumpiyansa ay ang mga hangganan ng pagtataya (itaas at ibaba), kung saan na may ibinigay na posibilidad (sigma) makuha ang aktwal na mga halaga.

Yung. kinakalkula namin ang forecast - ito ang aming pangunahing benchmark, ngunit naiintindihan namin na ang aktwal na mga halaga ay malamang na hindi 100% katumbas ng aming forecast. At ang tanong ay lumitaw hanggang saan maaaring makakuha ng mga aktwal na halaga, kung magpapatuloy ang kasalukuyang kalakaran? At ang tanong na ito ay makakatulong sa amin na masagot pagkalkula ng agwat ng kumpiyansa, ibig sabihin. - upper at lower bounds ng forecast.

Ano ang ibinigay na probability sigma?

Kapag nagkalkula confidence interval kaya natin itakda ang posibilidad mga hit aktwal na mga halaga sa loob ng ibinigay na mga hangganan ng pagtataya. Paano ito gagawin? Upang gawin ito, itinakda namin ang halaga ng sigma at, kung ang sigma ay katumbas ng:

    3 sigma- pagkatapos, ang posibilidad na maabot ang susunod na aktwal na halaga sa pagitan ng kumpiyansa ay magiging 99.7%, o 300 hanggang 1, o mayroong 0.3% na posibilidad na lumampas sa mga hangganan.

    2 sigma- kung gayon, ang posibilidad na maabot ang susunod na halaga sa loob ng mga hangganan ay ≈ 95.5%, i.e. ang mga logro ay humigit-kumulang 20 hanggang 1, o mayroong 4.5% na posibilidad na lumampas sa mga hangganan.

    1 sigma- pagkatapos, ang posibilidad ay ≈ 68.3%, ibig sabihin. ang mga pagkakataon ay humigit-kumulang 2 hanggang 1, o mayroong 31.7% na pagkakataon na ang susunod na halaga ay babagsak sa labas ng agwat ng kumpiyansa.

Nag-formula kami 3 Sigma Rule,na nagsasabi na hit probability isa pang random na halaga sa pagitan ng kumpiyansa na may ibinigay na halaga tatlong sigma ay 99.7%.

Pinatunayan ng mahusay na Russian mathematician na si Chebyshev ang isang theorem na mayroong 10% na pagkakataon na lumampas sa mga hangganan ng isang forecast na may ibinigay na halaga ng tatlong sigma. Yung. ang posibilidad na mahulog sa 3 sigma confidence interval ay hindi bababa sa 90%, habang ang isang pagtatangka upang kalkulahin ang forecast at ang mga hangganan nito "sa pamamagitan ng mata" ay puno ng mas makabuluhang mga error.

Paano malayang kalkulahin ang agwat ng kumpiyansa sa Excel?

Isaalang-alang natin ang pagkalkula ng agwat ng kumpiyansa sa Excel (ibig sabihin, ang upper at lower bounds ng forecast) gamit ang isang halimbawa. Mayroon kaming serye ng oras - mga benta sa pamamagitan ng mga buwan sa loob ng 5 taon. Tingnan ang naka-attach na file.

Upang kalkulahin ang mga hangganan ng forecast, kinakalkula namin:

  1. Pagtataya ng benta().
  2. Sigma - karaniwang paglihis mga modelo ng hula mula sa mga aktwal na halaga.
  3. Tatlong sigma.
  4. Agwat ng kumpiyansa.

1. Pagtataya ng benta.

=(RC[-14] (data sa time series)-RC[-1] (halaga ng modelo))^2(kuwadrado)


3. Sum para sa bawat buwan ang mga halaga ng paglihis mula sa stage 8 Sum((Xi-Ximod)^2), i.e. Isama natin ang Enero, Pebrero... para sa bawat taon.

Upang gawin ito, gamitin ang formula =SUMIF()

SUMIF(array na may mga bilang ng mga tuldok sa loob ng cycle (para sa mga buwan mula 1 hanggang 12); reference sa bilang ng period sa cycle; reference sa array na may mga parisukat ng pagkakaiba sa pagitan ng paunang data at mga halaga ng mga panahon)


4. Kalkulahin ang standard deviation para sa bawat yugto sa cycle mula 1 hanggang 12 (stage 10 sa kalakip na file).

Upang gawin ito, mula sa halaga na kinakalkula sa yugto 9, kinukuha namin ang ugat at hinahati sa bilang ng mga yugto sa siklong ito na minus 1 = ROOT((Sum(Xi-Ximod)^2/(n-1))

Gamitin natin ang mga formula sa Excel =ROOT(R8 (sanggunian sa (Sum(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (reference sa isang array na may mga cycle number); O8 (sanggunian sa isang tiyak na numero ng cycle, na isinasaalang-alang namin sa array))-1))

Gamit ang Excel formula = COUNTIF binibilang namin ang bilang n


Sa pamamagitan ng pagkalkula ng karaniwang paglihis ng aktwal na data mula sa modelo ng pagtataya, nakuha namin ang halaga ng sigma para sa bawat buwan - yugto 10 sa kalakip na file.

3. Kalkulahin ang 3 sigma.

Sa yugto 11, itinakda namin ang bilang ng mga sigma - sa aming halimbawa, "3" (yugto 11 sa kalakip na file):

Gayundin ang mga praktikal na halaga ng sigma:

1.64 sigma - 10% na pagkakataong lumampas sa limitasyon (1 pagkakataon sa 10);

1.96 sigma - 5% na posibilidad na lumampas sa mga hangganan (1 pagkakataon sa 20);

2.6 sigma - 1% na posibilidad na lumampas sa mga hangganan (1 sa 100 na pagkakataon).

5) Kinakalkula namin ang tatlong sigma, para dito pinarami namin ang mga halaga ng "sigma" para sa bawat buwan ng "3".

3. Tukuyin ang pagitan ng kumpiyansa.

  1. Pinakamataas na limitasyon sa pagtataya- forecast ng mga benta na isinasaalang-alang ang paglago at seasonality + (plus) 3 sigma;
  2. Lower Forecast Bound- forecast ng benta na isinasaalang-alang ang paglago at seasonality - (minus) 3 sigma;

Para sa kaginhawaan ng pagkalkula ng agwat ng kumpiyansa sa mahabang panahon (tingnan ang nakalakip na file), ginagamit namin ang formula ng Excel =Y8+VLOOKUP(W8;$U$8:$V$19;2;0), saan

Y8- pagtataya ng mga benta;

W8- ang bilang ng buwan kung saan kukunin namin ang halaga ng 3 sigma;

Yung. Pinakamataas na limitasyon sa pagtataya= "sales forecast" + "3 sigma" (sa halimbawa, VLOOKUP(month number; table na may 3 sigma values; column kung saan kinukuha namin ang sigma value na katumbas ng buwan na numero sa kaukulang row; 0)).

Lower Forecast Bound= "pagtataya ng benta" bawas "3 sigma".

Kaya, nakalkula namin ang agwat ng kumpiyansa sa Excel.

Ngayon ay mayroon na tayong forecast at isang hanay na may mga hangganan kung saan ang mga aktwal na halaga ay mahuhulog na may ibinigay na probability sigma.

Sa artikulong ito, tiningnan namin kung ano ang sigma at ang tatlong sigma na panuntunan, kung paano matukoy ang agwat ng kumpiyansa, at kung ano ang magagamit mo sa pamamaraang ito sa pagsasanay.

Tumpak na mga hula at tagumpay sa iyo!

Paano Matutulungan ka ng Forecast4AC PROkapag kinakalkula ang agwat ng kumpiyansa?:

    Awtomatikong kakalkulahin ng Forecast4AC PRO ang itaas o mas mababang mga limitasyon sa pagtataya para sa higit sa 1000 serye ng oras nang sabay-sabay;

    Ang kakayahang pag-aralan ang mga hangganan ng forecast kumpara sa forecast, trend at aktwal na mga benta sa chart na may isang keystroke;

Sa programang Forcast4AC PRO, posibleng itakda ang halaga ng sigma mula 1 hanggang 3.

Sumali ka!

I-download ang Libreng Pagtataya at Business Intelligence Apps:


  • Novo Forecast Lite- awtomatiko pagkalkula ng pagtataya sa excel.
  • 4analytics- Pagsusuri ng ABC-XYZ at pagsusuri ng mga emisyon sa Excel.
  • Qlik Sense Desktop at Qlik ViewPersonal na Edisyon - Mga sistema ng BI para sa pagsusuri at paggunita ng data.

Subukan ang mga tampok ng mga bayad na solusyon:

  • Novo Forecast PRO- pagtataya sa Excel para sa malalaking data array.

Kadalasan ang appraiser ay kailangang suriin ang real estate market ng segment kung saan matatagpuan ang appraisal object. Kung ang merkado ay binuo, maaaring mahirap pag-aralan ang buong hanay ng mga ipinakita na bagay, samakatuwid, ang isang sample ng mga bagay ay ginagamit para sa pagsusuri. Ang sample na ito ay hindi palaging homogenous, kung minsan ay kinakailangan na alisin ito sa mga sukdulan - masyadong mataas o masyadong mababa ang mga alok sa merkado. Para sa layuning ito, inilapat ito agwat ng kumpiyansa. Ang layunin ng pag-aaral na ito ay magsagawa ng comparative analysis ng dalawang paraan para sa pagkalkula ng confidence interval at piliin ang pinakamahusay na opsyon sa pagkalkula kapag nagtatrabaho sa iba't ibang sample sa estimatica.pro system.

Agwat ng kumpiyansa - kinakalkula batay sa sample, ang pagitan ng mga halaga ng katangian, na may kilalang posibilidad ay naglalaman ng tinantyang parameter ng pangkalahatang populasyon.

Ang kahulugan ng pagkalkula ng agwat ng kumpiyansa ay ang pagbuo ng ganoong agwat batay sa sample na data upang ito ay maigiit na may ibinigay na posibilidad na ang halaga ng tinantyang parameter ay nasa pagitan na ito. Sa madaling salita, ang agwat ng kumpiyansa na may tiyak na posibilidad ay naglalaman ng hindi kilalang halaga ng tinantyang dami. Kung mas malawak ang pagitan, mas mataas ang kamalian.

Mayroong iba't ibang mga pamamaraan para sa pagtukoy ng agwat ng kumpiyansa. Sa artikulong ito, isasaalang-alang natin ang 2 paraan:

  • sa pamamagitan ng median at standard deviation;
  • sa pamamagitan ng kritikal na halaga ng t-statistic (koepisyent ng mag-aaral).

Mga yugto ng isang paghahambing na pagsusuri ng iba't ibang mga pamamaraan para sa pagkalkula ng CI:

1. bumuo ng sample ng data;

2. pinoproseso namin ito gamit ang mga istatistikal na pamamaraan: kinakalkula namin ang mean value, median, variance, atbp.;

3. kinakalkula namin ang pagitan ng kumpiyansa sa dalawang paraan;

4. Suriin ang mga nalinis na sample at ang nakuhang confidence interval.

Stage 1. Data sampling

Ang sample ay nabuo gamit ang estimatica.pro system. Kasama sa sample ang 91 na alok para sa pagbebenta ng mga apartment na may 1 silid sa ika-3 na zone ng presyo na may uri ng pagpaplano na "Khrushchev".

Talahanayan 1. Paunang sample

Ang presyo ng 1 sq.m., c.u.

Fig.1. Paunang sample



Stage 2. Pagproseso ng unang sample

Ang pagpoproseso ng sample sa pamamagitan ng mga istatistikal na pamamaraan ay nangangailangan ng pagkalkula ng mga sumusunod na halaga:

1. Arithmetic mean

2. Median - isang numero na nagpapakilala sa sample: eksaktong kalahati ng mga elemento ng sample ay mas malaki kaysa sa median, ang isa pang kalahati ay mas mababa sa median

(para sa isang sample na may kakaibang bilang ng mga halaga)

3. Saklaw - ang pagkakaiba sa pagitan ng maximum at minimum na mga halaga sa sample

4. Variance - ginagamit upang mas tumpak na matantya ang variation sa data

5. Ang karaniwang paglihis para sa sample (mula dito ay tinutukoy bilang RMS) ay ang pinakakaraniwang tagapagpahiwatig ng pagpapakalat ng mga halaga ng pagsasaayos sa paligid ng arithmetic mean.

6. Coefficient of variation - sumasalamin sa antas ng dispersion ng mga halaga ng pagsasaayos

7. oscillation coefficient - sumasalamin sa kamag-anak na pagbabagu-bago ng mga matinding halaga ng mga presyo sa sample sa paligid ng average

Talahanayan 2. Mga tagapagpahiwatig ng istatistika ng orihinal na sample

Ang coefficient ng variation, na nagpapakilala sa homogeneity ng data, ay 12.29%, ngunit ang coefficient ng oscillation ay masyadong malaki. Kaya, maaari nating sabihin na ang orihinal na sample ay hindi homogenous, kaya magpatuloy tayo sa pagkalkula ng agwat ng kumpiyansa.

Stage 3. Pagkalkula ng agwat ng kumpiyansa

Paraan 1. Pagkalkula sa pamamagitan ng median at standard deviation.

Ang agwat ng kumpiyansa ay tinutukoy bilang mga sumusunod: ang pinakamababang halaga - ang karaniwang paglihis ay ibinabawas mula sa median; ang pinakamataas na halaga - ang karaniwang paglihis ay idinagdag sa median.

Kaya, ang agwat ng kumpiyansa (47179 CU; 60689 CU)

kanin. 2. Mga halaga sa loob ng pagitan ng kumpiyansa 1.



Paraan 2. Pagbuo ng agwat ng kumpiyansa sa pamamagitan ng kritikal na halaga ng t-statistics (Koepisyent ng mag-aaral)

S.V. Gribovsky sa aklat na "Mga pamamaraan ng matematika para sa pagtatasa ng halaga ng ari-arian" ay naglalarawan ng isang paraan para sa pagkalkula ng agwat ng kumpiyansa sa pamamagitan ng koepisyent ng Mag-aaral. Kapag nagkalkula sa pamamagitan ng pamamaraang ito, ang estimator mismo ay dapat magtakda ng antas ng kabuluhan ∝, na tumutukoy sa posibilidad na mabuo ang pagitan ng kumpiyansa. Ang mga antas ng kahalagahan ng 0.1 ay karaniwang ginagamit; 0.05 at 0.01. Tumutugma sila sa mga probabilidad ng kumpiyansa na 0.9; 0.95 at 0.99. Sa pamamaraang ito, ang mga tunay na halaga ng inaasahan at pagkakaiba sa matematika ay itinuturing na halos hindi alam (na halos palaging totoo kapag nilutas ang mga problema sa praktikal na pagsusuri).

Formula sa pagitan ng kumpiyansa:

n - laki ng sample;

Ang kritikal na halaga ng t-statistics (Mga distribusyon ng Mag-aaral) na may antas ng kahalagahan ∝, ang bilang ng mga antas ng kalayaan n-1, na tinutukoy ng mga espesyal na talahanayan ng istatistika o gamit ang MS Excel (→"Statistical"→ STUDRASPOBR);

∝ - antas ng kahalagahan, kinukuha namin ang ∝=0.01.

kanin. 2. Mga halaga sa loob ng agwat ng kumpiyansa 2.

Hakbang 4. Pagsusuri ng iba't ibang paraan upang makalkula ang pagitan ng kumpiyansa

Dalawang paraan ng pagkalkula ng agwat ng kumpiyansa - sa pamamagitan ng median at koepisyent ng Mag-aaral - na humantong sa iba't ibang mga halaga ng mga agwat. Alinsunod dito, nakuha ang dalawang magkaibang purified sample.

Talahanayan 3. Mga tagapagpahiwatig ng istatistika para sa tatlong sample.

Index

Paunang sample

1 opsyon

Opsyon 2

ibig sabihin

Pagpapakalat

Coef. mga pagkakaiba-iba

Coef. mga oscillations

Bilang ng mga retiradong bagay, mga pcs.

Batay sa mga kalkulasyon na isinagawa, maaari nating sabihin na ang mga halaga ng mga agwat ng kumpiyansa na nakuha ng iba't ibang mga pamamaraan ay nagsalubong, kaya maaari mong gamitin ang alinman sa mga pamamaraan ng pagkalkula sa pagpapasya ng appraiser.

Gayunpaman, naniniwala kami na kapag nagtatrabaho sa estimatica.pro system, ipinapayong pumili ng paraan para sa pagkalkula ng agwat ng kumpiyansa, depende sa antas ng pag-unlad ng merkado:

  • kung ang merkado ay hindi binuo, ilapat ang paraan ng pagkalkula sa pamamagitan ng median at standard deviation, dahil ang bilang ng mga retiradong bagay sa kasong ito ay maliit;
  • kung ang merkado ay binuo, ilapat ang pagkalkula sa pamamagitan ng kritikal na halaga ng t-statistics (estudyante's coefficient), dahil posible na bumuo ng isang malaking paunang sample.

Sa paghahanda ng artikulo ay ginamit:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Mga pamamaraan ng matematika para sa pagtatasa ng halaga ng ari-arian. Moscow, 2014

2. Data mula sa estimatica.pro system