Paano makalkula ang karaniwang paglihis ng isang sample. Mga parameter ng istatistika

Ang isa sa mga pangunahing tool ng statistical analysis ay ang pagkalkula ng standard deviation. Ang tagapagpahiwatig na ito ay nagpapahintulot sa iyo na gumawa ng isang pagtatantya ng karaniwang paglihis para sa isang sample o para sa pangkalahatang populasyon. Alamin natin kung paano gamitin ang standard deviation formula sa Excel.

Agad nating tukuyin kung ano ang standard deviation at kung ano ang hitsura ng formula nito. Ang halagang ito ay ang parisukat na ugat ng arithmetic mean ng mga parisukat ng pagkakaiba sa pagitan ng lahat ng mga halaga ng serye at ng kanilang arithmetic mean. Mayroong magkaparehong pangalan para sa tagapagpahiwatig na ito - karaniwang paglihis. Ang parehong mga pangalan ay ganap na katumbas.

Ngunit, siyempre, sa Excel, hindi kailangang kalkulahin ito ng gumagamit, dahil ginagawa ng programa ang lahat para sa kanya. Alamin natin kung paano kalkulahin ang standard deviation sa Excel.

Pagkalkula sa Excel

Maaari mong kalkulahin ang tinukoy na halaga sa Excel gamit ang dalawang espesyal na function STDEV.B(ayon sa sample) at STDEV.G(ayon sa pangkalahatang populasyon). Ang prinsipyo ng kanilang operasyon ay ganap na pareho, ngunit maaari silang tawagan sa tatlong paraan, na tatalakayin natin sa ibaba.

Paraan 1: Function Wizard


Paraan 2: Tab na Mga Formula


Paraan 3: Manu-manong pagpasok ng formula

Mayroon ding paraan kung saan hindi mo kailangang tawagan ang argument window sa lahat. Upang gawin ito, ipasok ang formula nang manu-mano.


Tulad ng nakikita mo, ang mekanismo para sa pagkalkula ng karaniwang paglihis sa Excel ay napaka-simple. Kailangan lang ng user na magpasok ng mga numero mula sa populasyon o mga link sa mga cell na naglalaman ng mga ito. Ang lahat ng mga kalkulasyon ay ginagawa ng mismong programa. Mas mahirap maunawaan kung ano ang kinakalkula na tagapagpahiwatig at kung paano mailalapat ang mga resulta ng pagkalkula sa pagsasanay. Ngunit ang pag-unawa dito ay higit na nabibilang sa larangan ng mga istatistika kaysa sa pag-aaral kung paano magtrabaho sa software.

Mula sa Wikipedia, ang malayang ensiklopedya

karaniwang lihis(kasingkahulugan: karaniwang lihis, karaniwang lihis, karaniwang lihis; mga kaugnay na termino: karaniwang lihis, karaniwang pagkalat) - sa teorya at istatistika ng posibilidad, ang pinakakaraniwang tagapagpahiwatig ng pagpapakalat ng mga halaga ng isang random na variable na nauugnay sa inaasahan ng matematika nito. Sa limitadong array ng mga sample ng mga value, sa halip na ang mathematical expectation, ang arithmetic mean ng populasyon ng mga sample ang ginagamit.

Pangunahing impormasyon

Ang karaniwang paglihis ay sinusukat sa mga yunit ng random na variable mismo at ginagamit kapag kinakalkula ang karaniwang error ng arithmetic mean, kapag bumubuo ng mga pagitan ng kumpiyansa, kapag sinusubok ng istatistika ang mga hypotheses, kapag sinusukat ang isang linear na relasyon sa pagitan ng mga random na variable. Tinukoy bilang square root ng variance ng isang random variable.

Karaniwang lihis:

\sigma=\sqrt(\frac(1)(n)\sum_(i=1)^n\left(x_i-\bar(x)\right)^2).

Karaniwang lihis(pagtatantya ng standard deviation ng isang random variable x kaugnay sa inaasahan sa matematika nito batay sa isang walang pinapanigan na pagtatantya ng pagkakaiba nito) s:

s=\sqrt(\frac(n)(n-1)\sigma^2)=\sqrt(\frac(1)(n-1)\sum_(i=1)^n\left(x_i-\bar (x)\kanan)^2);

tatlong sigma na panuntunan

tatlong sigma na panuntunan (3\sigma) - halos lahat ng mga halaga ng isang normal na ibinahagi na random na variable ay nasa pagitan \left(\bar(x)-3\sigma;\bar(x)+3\sigma\right). Mas mahigpit - humigit-kumulang na may probabilidad na 0.9973 ang halaga ng isang karaniwang ibinabahagi na random na variable ay nasa tinukoy na agwat (sa kondisyon na ang halaga \bar(x) totoo, at hindi nakuha bilang resulta ng pagproseso ng sample).

Kung ang tunay na halaga \bar(x) hindi alam, pagkatapos ay dapat mong gamitin \sigma, a s. Kaya, ang panuntunan ng tatlong sigma ay binago sa panuntunan ng tatlo s .

Interpretasyon ng halaga ng standard deviation

Ang isang mas malaking halaga ng karaniwang paglihis ay nagpapahiwatig ng isang mas malaking pagkalat ng mga halaga sa ipinakita na hanay kasama ang ibig sabihin ng hanay; ang isang mas maliit na halaga, ayon sa pagkakabanggit, ay nagpapahiwatig na ang mga halaga sa hanay ay pinagsama-sama sa average na halaga.

Halimbawa, mayroon kaming tatlong set ng numero: (0, 0, 14, 14), (0, 6, 8, 14) at (6, 6, 8, 8). Ang lahat ng tatlong set ay may mean values ​​na 7 at standard deviations na 7, 5, at 1, ayon sa pagkakabanggit. Ang huling set ay may maliit na standard deviation dahil ang mga value sa set ay clustered sa paligid ng mean; ang unang hanay ay may pinakamalaking halaga ng karaniwang paglihis - ang mga halaga sa loob ng hanay ay malakas na nag-iiba mula sa average na halaga.

Sa pangkalahatang kahulugan, ang karaniwang paglihis ay maaaring ituring na isang sukatan ng kawalan ng katiyakan. Halimbawa, sa physics, ang standard deviation ay ginagamit upang matukoy ang error ng isang serye ng sunud-sunod na mga sukat ng ilang dami. Ang halagang ito ay napakahalaga para sa pagtukoy ng katumpakan ng kababalaghan sa ilalim ng pag-aaral kumpara sa halaga na hinulaang ng teorya: kung ang ibig sabihin ng halaga ng mga sukat ay naiiba nang malaki sa mga halagang hinulaan ng teorya (malaking standard deviation), kung gayon ang ang mga nakuhang halaga o ang paraan ng pagkuha ng mga ito ay dapat suriin muli.

Praktikal na paggamit

Sa pagsasagawa, pinapayagan ka ng karaniwang paglihis na matantya kung gaano karaming mga halaga mula sa isang set ang maaaring mag-iba mula sa average na halaga.

Ekonomiks at pananalapi

Standard deviation ng portfolio return \sigma =\sqrt(D[X]) ay kinilala sa panganib ng portfolio.

Klima

Ipagpalagay na mayroong dalawang lungsod na may parehong average na maximum na pang-araw-araw na temperatura, ngunit ang isa ay matatagpuan sa baybayin at ang isa ay nasa kapatagan. Ang mga lungsod sa baybayin ay kilala na mayroong maraming iba't ibang pang-araw-araw na pinakamataas na temperatura na mas mababa kaysa sa mga lungsod sa loob ng bansa. Samakatuwid, ang karaniwang paglihis ng maximum na pang-araw-araw na temperatura sa coastal city ay magiging mas mababa kaysa sa pangalawang lungsod, sa kabila ng katotohanan na ang average na halaga ng halagang ito ay pareho para sa kanila, na sa pagsasanay ay nangangahulugan na ang posibilidad na ang maximum na hangin temperatura ng bawat partikular na araw ng taon ay magiging mas malakas na naiiba mula sa average na halaga, mas mataas para sa isang lungsod na matatagpuan sa loob ng kontinente.

palakasan

Ipagpalagay natin na mayroong ilang mga koponan ng football na niraranggo ayon sa ilang hanay ng mga parameter, halimbawa, ang bilang ng mga layunin na naitala at natanggap, mga pagkakataong makapuntos, atbp. Malamang na ang pinakamahusay na koponan sa pangkat na ito ay magkakaroon ng pinakamahusay mga halaga sa higit pang mga parameter. Kung mas maliit ang standard deviation ng team para sa bawat isa sa mga ipinakitang parameter, mas predictable ang resulta ng team, balanse ang mga naturang team. Sa kabilang banda, ang isang koponan na may malaking standard deviation ay mahirap hulaan ang resulta, na kung saan ay ipinaliwanag ng isang kawalan ng timbang, halimbawa, isang malakas na depensa, ngunit isang mahinang pag-atake.

Ang paggamit ng karaniwang paglihis ng mga parameter ng koponan ay nagbibigay-daan sa isa na mahulaan ang resulta ng tugma sa pagitan ng dalawang koponan sa ilang lawak, sinusuri ang mga kalakasan at kahinaan ng mga koponan, at samakatuwid ang mga napiling paraan ng pakikibaka.

Tingnan din

Sumulat ng pagsusuri sa artikulong "Standard deviation"

Panitikan

  • Borovikov V. STATISTICS. Ang sining ng pagtatasa ng data ng computer: Para sa mga propesyonal / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 p. - ISBN 5-272-00078-1..

Isang sipi na nagpapakilala sa karaniwang paglihis

At, mabilis na binuksan ang pinto, lumabas siya nang may matatag na hakbang patungo sa balkonahe. Ang pag-uusap ay biglang tumigil, ang mga sumbrero at takip ay tinanggal, at ang lahat ng mga mata ay napunta sa bilang na lumabas.
- Hello guys! mabilis at malakas na sabi ng bilangan. - Salamat sa pagpunta. Lalabas ako sa iyo ngayon, ngunit una sa lahat kailangan nating harapin ang kontrabida. Kailangan nating parusahan ang kontrabida na pumatay sa Moscow. Hintayin mo ako! - At ang bilang ay mabilis na bumalik sa mga silid, malakas na sinara ang pinto.
Isang bulungan ng pagsang-ayon ang bumalot sa karamihan. “Siya, kung gayon, ang magkokontrol sa paggamit ng mga kontrabida! At sasabihin mong isang Pranses ... kakalas niya ang buong distansya para sa iyo! sabi ng mga tao, na parang sinisisi ang isa't isa dahil sa kanilang kawalan ng pananampalataya.
Pagkaraan ng ilang minuto, nagmamadaling lumabas ang isang opisyal sa pintuan, nag-order ng isang bagay, at nag-unat ang mga dragoon. Matakaw na gumalaw ang mga tao mula sa balkonahe patungo sa balkonahe. Paglabas sa balkonahe na may galit na mabilis na mga hakbang, si Rostopchin ay nagmamadaling tumingin sa paligid niya, na parang may hinahanap.
- Nasaan na siya? - sabi ng konde, at kasabay ng kanyang pagsasabi nito, nakita niya mula sa paligid ng sulok ng bahay na lumabas sa pagitan ng dalawang dragoons isang binata na may mahabang manipis na leeg, na ang kanyang ulo ay kalahating ahit at tinutubuan. Ang binatang ito ay nakasuot ng dati ay isang maputi, asul na damit, sira-sira na soro na balat ng tupa at marumi, linen na pantalon ng preso, pinalamanan sa marumi, sira-sirang manipis na bota. Nakasabit nang husto ang mga kadena sa manipis at mahihinang mga binti, dahilan para mahirapan ang pag-aalinlangan ng binata.
- PERO! - sabi ni Rostopchin, dali-daling iniwas ang tingin sa binata na naka-fox coat at itinuro ang ibabang hakbang ng balkonahe. - Ilagay mo dito! - Ang binata, na nakagapos sa kanyang mga tanikala, ay humakbang nang mabigat sa ipinahiwatig na hakbang, hawak ang nakadiin na kwelyo ng amerikana ng balat ng tupa gamit ang kanyang daliri, pinihit ang kanyang mahabang leeg ng dalawang beses at, buntong-hininga, itinupi ang kanyang manipis, hindi gumaganang mga kamay sa harap ng kanyang tiyan na may sunud-sunod na kilos.
Ilang segundong natahimik ang binata nang umayos na ang binata sa hagdan. Sa mga likurang hanay lamang ng mga taong nagsisiksikan sa isang lugar, ang mga daing, mga daing, mga kilig at mga kalansing ng mga muling inayos na binti ang maririnig.
Si Rostopchin, naghihintay sa kanya na huminto sa ipinahiwatig na lugar, nakasimangot na hinimas ang kanyang mukha gamit ang kanyang kamay.
- Guys! - sabi ni Rostopchin sa isang metal na boses, - ang taong ito, si Vereshchagin, ay ang parehong scoundrel kung saan namatay ang Moscow.
Ang binata sa fox coat ay nakatayo sa isang sunud-sunuran na pose, na ang kanyang mga kamay ay magkadikit sa harap ng kanyang tiyan at bahagyang nakayuko. Payat, na may walang pag-asa na ekspresyon, pumangit ng isang ahit na ulo, ang kanyang batang mukha ay ibinaba. Sa unang mga salita ng bilang, dahan-dahan niyang itinaas ang ulo at tumingin sa ibaba sa konte, na para bang may gustong sabihin sa kanya o salubungin man lang ang kanyang tingin. Ngunit hindi siya nilingon ni Rostopchin. Sa mahaba at manipis na leeg ng binata, parang lubid, may ugat sa likod ng tenga na tumigas at naging asul, at biglang namula ang mukha.
Lahat ng mata ay nakatutok sa kanya. Tumingin siya sa karamihan, at, na parang napanatag sa ekspresyon na nabasa niya sa mukha ng mga tao, ngumiti siya ng malungkot at mahiyain, at ibinaba muli ang kanyang ulo, itinuwid ang kanyang mga paa sa hakbang.
"Ipinagkanulo niya ang kanyang tsar at amang-bayan, ibinigay niya ang kanyang sarili kay Bonaparte, siya lamang sa lahat ng mga Ruso ang nagsira sa pangalan ng isang Ruso, at ang Moscow ay namamatay mula sa kanya," sabi ni Rastopchin sa isang pantay, matalas na boses; ngunit bigla niyang sinulyapan si Vereshchagin, na patuloy na nakatayo sa parehong sunud-sunod na pose. Para bang pinasabog siya ng tingin na ito, siya, itinaas ang kanyang kamay, halos sumigaw, lumingon sa mga tao: - Harapin mo siya sa iyong paghatol! Binagay ko sa iyo!
Natahimik ang mga tao at lalo lang nagdidiin sa isa't isa. Ang paghawak sa isa't isa, paghinga sa nahawaang pagkakalapit na ito, walang lakas na kumilos at naghihintay para sa isang bagay na hindi alam, hindi maintindihan at kakila-kilabot ay naging hindi mabata. Ang mga taong nakatayo sa harap na hanay, na nakakita at nakarinig ng lahat ng nangyari sa kanilang harapan, lahat ay may takot na dilat na mga mata at nakanganga ang mga bibig, na pilit nang buong lakas, ay pinanatili ang presyon ng mga nasa likuran sa kanilang likuran.
- Talunin siya! .. Hayaang mamatay ang taksil at huwag ipahiya ang pangalan ng Ruso! sigaw ni Rastopchin. - Ruby! order ako! - Hindi marinig ang mga salita, ngunit ang galit na tunog ng boses ni Rostopchin, ang karamihan ng tao ay dumaing at sumulong, ngunit muling tumigil.
- Bilang! .. - Ang mahiyain ni Vereshchagin at kasabay na sabi ng theatrical voice sa gitna ng panandaliang katahimikan. "Count, isang diyos ang nasa itaas natin..." sabi ni Vereshchagin, itinaas ang kanyang ulo, at muli ang makapal na ugat sa kanyang manipis na leeg ay napuno ng dugo, at ang kulay ay mabilis na lumabas at tumakas mula sa kanyang mukha. Hindi niya natapos ang gusto niyang sabihin.
- Putulin siya! Umorder ako! .. - sigaw ni Rostopchin, biglang naging kasing putla ni Vereshchagin.
- Sabers out! sigaw ng opisyal sa mga dragoon, iginuhit ang kanyang sable.
Ang isa pang mas malakas na alon ay pumailanlang sa mga tao, at, nang marating ang mga hanay sa harapan, ang alon na ito ay gumalaw sa mga harapan, na nakakagulat, dinala sila sa mismong mga baitang ng beranda. Isang matangkad na lalaki, na may petrified na ekspresyon sa kanyang mukha at may tumigil na nakataas na kamay, ang tumayo sa tabi ni Vereshchagin.
- Ruby! halos bumulong ng isang opisyal sa mga dragoon, at ang isa sa mga sundalo ay biglang, na may baluktot na mukha ng galit, hinampas si Vereshchagin sa ulo ng isang mapurol na broadsword.
"PERO!" - Sumigaw si Vereshchagin sa ilang sandali at sa gulat, tumingin sa paligid sa takot at parang hindi naiintindihan kung bakit ito ginawa sa kanya. Ang parehong daing ng sorpresa at kakila-kilabot ay tumakbo sa karamihan.
"Oh Diyos ko!" - may narinig na malungkot na bulalas.
Ngunit kasunod ng bulalas ng sorpresa na nakatakas mula sa Vereshchagin, siya ay sumigaw ng malungkot sa sakit, at ang sigaw na ito ay sumira sa kanya. Ang hadlang na iyon ng damdamin ng tao, na nakaunat sa pinakamataas na antas, na humahawak pa rin sa karamihan, ay agad na bumagsak. Ang krimen ay nagsimula, ito ay kinakailangan upang makumpleto ito. Ang malungkot na daing ng panunuya ay nalunod ng mabigat at galit na dagundong ng karamihan. Tulad ng huling ikapitong alon na lumalabag sa mga barko, ang huling hindi mapigilang alon na ito ay pumailanlang mula sa likurang hanay, umabot sa mga harapan, nagpabagsak sa kanila at nilamon ang lahat. Ang dragon na nakatama ay gustong ulitin ang kanyang suntok. Si Vereshchagin na may sigaw ng kakila-kilabot, na pinoprotektahan ang kanyang sarili sa kanyang mga kamay, ay sumugod sa mga tao. Ang matangkad na lalaki, na kanyang natisod, ay hinawakan ang manipis na leeg ni Vereshchagin gamit ang kanyang mga kamay, at sa isang mabangis na sigaw, kasama niya, ay nahulog sa ilalim ng mga paa ng umuungal na mga tao na nakasalansan.
Ang ilan ay binugbog at pinunit si Vereshchagin, ang iba ay matatangkad na kapwa. At ang mga hiyawan ng mga durog na tao at ang mga nagtangkang iligtas ang matangkad na kasama ay pumukaw lamang sa galit ng karamihan. Sa loob ng mahabang panahon ay hindi napalaya ng mga dragon ang duguan, binugbog hanggang mamatay na manggagawa sa pabrika. At sa mahabang panahon, sa kabila ng lahat ng nilalagnat na pagmamadali kung saan sinubukan ng karamihan na tapusin ang gawain sa sandaling nagsimula, ang mga taong iyon na bumugbog, sumakal at pumunit kay Vereshchagin ay hindi maaaring patayin siya; ngunit ang karamihan ng tao ay dinurog sila mula sa lahat ng panig, kasama sila sa gitna, tulad ng isang misa, umiindayog mula sa magkabilang gilid at hindi sila binigyan ng pagkakataong tapusin siya o iwanan siya.

Ang mga halaga na nakuha mula sa karanasan ay hindi maaaring hindi naglalaman ng mga pagkakamali dahil sa iba't ibang mga kadahilanan. Kabilang sa mga ito, ang sistematiko at random na mga pagkakamali ay dapat na makilala. Ang mga sistematikong error ay dahil sa mga sanhi na kumikilos sa isang napaka-espesipikong paraan, at maaaring palaging alisin o isinasaalang-alang nang may sapat na katumpakan. Ang mga random na error ay sanhi ng napakalaking bilang ng mga indibidwal na dahilan na hindi tumpak na matutugunan at kumilos nang iba sa bawat indibidwal na pagsukat. Ang mga pagkakamaling ito ay hindi maaaring ganap na maalis; maaari silang isaalang-alang lamang sa karaniwan, kung saan kinakailangang malaman ang mga batas kung saan napapailalim ang mga random na pagkakamali.

Ipapahiwatig namin ang sinusukat na halaga sa pamamagitan ng A, at ang random na error sa pagsukat x. Dahil ang error na x ay maaaring tumagal ng anumang halaga, ito ay isang tuluy-tuloy na random variable, na ganap na nailalarawan ng sarili nitong batas sa pamamahagi.

Ang pinakasimpleng at pinakatumpak na sumasalamin sa katotohanan (sa karamihan ng mga kaso) ay ang tinatawag na normal na pamamahagi ng mga error:

Ang batas sa pamamahagi na ito ay maaaring makuha mula sa iba't ibang teoretikal na lugar, lalo na, mula sa pangangailangan na ang pinaka-malamang na halaga ng isang hindi kilalang dami kung saan ang isang serye ng mga halaga na may parehong antas ng katumpakan ay nakuha sa pamamagitan ng direktang pagsukat ay ang arithmetic mean ng ang mga halagang ito. Ang halaga 2 ay tinatawag pagpapakalat ng normal na batas na ito.

Katamtaman

Pagpapasiya ng dispersion ayon sa pang-eksperimentong data. Kung para sa anumang dami ng A, ang n mga halaga a i ay nakuha sa pamamagitan ng direktang pagsukat na may parehong antas ng katumpakan, at kung ang mga pagkakamali sa dami A ay napapailalim sa normal na batas sa pamamahagi, kung gayon ang pinakamalamang na halaga ng A ay magiging karaniwan:

a - ibig sabihin ng aritmetika,

a i - sinusukat na halaga sa i-th na hakbang.

Paglihis ng naobserbahang halaga (para sa bawat pagmamasid) a i ng halagang mula sa A ibig sabihin ng aritmetika: a i - a.

Upang matukoy ang pagpapakalat ng normal na pamamahagi ng mga error sa kasong ito, gamitin ang formula:

2 - pagpapakalat,
a - ibig sabihin ng aritmetika,
n ay ang bilang ng mga sukat ng parameter,

karaniwang lihis

karaniwang lihis nagpapakita ng ganap na paglihis ng mga sinusukat na halaga mula sa ibig sabihin ng aritmetika. Alinsunod sa formula para sa sukat ng katumpakan ng linear na kumbinasyon root mean square error ang arithmetic mean ay tinutukoy ng formula:

, saan


a - ibig sabihin ng aritmetika,
n ay ang bilang ng mga sukat ng parameter,
a i - sinusukat na halaga sa i-th na hakbang.

Ang koepisyent ng pagkakaiba-iba

Ang koepisyent ng pagkakaiba-iba nailalarawan ang kamag-anak na antas ng paglihis ng mga sinusukat na halaga mula sa ibig sabihin ng aritmetika:

, saan

V - koepisyent ng pagkakaiba-iba,
- karaniwang lihis,
a - ibig sabihin ng aritmetika.

Mas malaki ang halaga koepisyent ng pagkakaiba-iba, mas malaki ang scatter at hindi gaanong pagkakapareho ng mga pinag-aralan na halaga. Kung ang ang koepisyent ng pagkakaiba-iba mas mababa sa 10%, kung gayon ang pagkakaiba-iba ng serye ng variation ay itinuturing na hindi gaanong mahalaga, mula 10% hanggang 20% ​​ay tumutukoy sa average, higit sa 20% at mas mababa sa 33% sa makabuluhan, at kung ang koepisyent ng pagkakaiba-iba lumampas sa 33%, ito ay nagpapahiwatig ng heterogeneity ng impormasyon at ang pangangailangan na ibukod ang pinakamalaki at pinakamaliit na halaga.

Average na linear deviation

Ang isa sa mga tagapagpahiwatig ng saklaw at intensity ng pagkakaiba-iba ay ibig sabihin ng linear deviation(average na modulus ng deviation) mula sa arithmetic mean. Average na linear deviation kinakalkula ng formula:

, saan

_
a - average na linear deviation,
a - ibig sabihin ng aritmetika,
n ay ang bilang ng mga sukat ng parameter,
a i - sinusukat na halaga sa i-th na hakbang.

Upang suriin ang pagsunod ng mga pinag-aralan na halaga sa batas ng normal na pamamahagi, ginagamit ang kaugnayan index ng kawalaan ng simetrya sa kanyang pagkakamali at ugali tagapagpahiwatig ng kurtosis sa kanyang pagkakamali.

Asymmetry index

Asymmetry index Ang (A) at ang error nito (m a) ay kinakalkula gamit ang mga sumusunod na formula:

, saan

A - tagapagpahiwatig ng kawalaan ng simetrya,
- karaniwang lihis,
a - ibig sabihin ng aritmetika,
n ay ang bilang ng mga sukat ng parameter,
a i - sinusukat na halaga sa i-th na hakbang.

Tagapagpahiwatig ng kurtosis

Tagapagpahiwatig ng kurtosis(E) at ang error nito (m e) ay kinakalkula gamit ang mga sumusunod na formula:

, saan

Ang pinakaperpektong katangian ng variation ay ang standard deviation, na tinatawag na standard (o standard deviation). Karaniwang lihis() ay katumbas ng square root ng mean square ng mga deviations ng mga indibidwal na feature values ​​mula sa arithmetic mean:

Ang karaniwang paglihis ay simple:

Ang weighted standard deviation ay inilapat para sa nakapangkat na data:

Sa pagitan ng mean square at mean linear deviations sa ilalim ng mga kondisyon ng normal na distribution, ang sumusunod na relasyon ay nagaganap: ~ 1.25.

Ang karaniwang paglihis, bilang pangunahing ganap na sukatan ng pagkakaiba-iba, ay ginagamit sa pagtukoy ng mga halaga ng mga ordinate ng normal na curve ng pamamahagi, sa mga kalkulasyon na may kaugnayan sa organisasyon ng sample na pagmamasid at pagtatatag ng katumpakan ng mga katangian ng sample, pati na rin sa pagtatasa ng mga hangganan ng pagkakaiba-iba ng isang katangian sa isang homogenous na populasyon.

Ang pagpapakalat, mga uri nito, karaniwang paglihis.

Pagkakaiba-iba ng isang random na variable- isang sukatan ng pagkalat ng isang naibigay na random na variable, ibig sabihin, ang paglihis nito mula sa inaasahan sa matematika. Sa mga istatistika, ang pagtatalaga o ay kadalasang ginagamit. Ang square root ng variance ay tinatawag na standard deviation, standard deviation, o standard spread.

Kabuuang pagkakaiba (σ2) sinusukat ang pagkakaiba-iba ng isang katangian sa buong populasyon sa ilalim ng impluwensya ng lahat ng mga salik na naging sanhi ng pagkakaiba-iba na ito. Kasabay nito, salamat sa paraan ng pagpapangkat, posibleng ihiwalay at sukatin ang pagkakaiba-iba dahil sa tampok na pagpapangkat, at ang pagkakaiba-iba na nangyayari sa ilalim ng impluwensya ng hindi natukoy na mga kadahilanan.

pagkakaiba-iba sa pagitan ng pangkat (σ 2 m.gr) ay nagpapakilala sa sistematikong pagkakaiba-iba, ibig sabihin, mga pagkakaiba sa laki ng pinag-aralan na katangian na nagmumula sa ilalim ng impluwensya ng katangian - ang salik na pinagbabatayan ng pagpapangkat.

karaniwang lihis(kasingkahulugan: standard deviation, standard deviation, standard deviation; magkatulad na termino: standard deviation, standard spread) - sa probability theory at statistics, ang pinakakaraniwang indicator ng dispersion ng mga value ng random variable na may kaugnayan sa matematikal na inaasahan nito. Sa limitadong mga arrays ng mga sample ng mga value, sa halip na ang mathematical expectation, ang arithmetic mean ng set ng mga sample ang ginagamit.

Ang standard deviation ay sinusukat sa mga unit ng random variable mismo at ginagamit sa pagkalkula ng standard error ng arithmetic mean, sa pagbuo ng confidence interval, sa statistical testing ng hypotheses, at sa pagsukat ng linear na relasyon sa pagitan ng random variables. Ito ay tinukoy bilang square root ng variance ng isang random variable.


Karaniwang lihis:

Karaniwang lihis(pagtatantya ng standard deviation ng isang random variable x kaugnay sa inaasahan sa matematika nito batay sa isang walang pinapanigan na pagtatantya ng pagkakaiba nito):

nasaan ang pagpapakalat; — i-ika sample na elemento; - laki ng sample; - arithmetic mean ng sample:

Dapat tandaan na ang parehong mga pagtatantya ay may kinikilingan. Sa pangkalahatang kaso, imposibleng bumuo ng walang pinapanigan na pagtatantya. Gayunpaman, ang isang pagtatantya batay sa isang walang pinapanigan na pagtatantya ng pagkakaiba ay pare-pareho.

Kakanyahan, saklaw at pamamaraan para sa pagtukoy ng mode at median.

Bilang karagdagan sa mga average ng power-law sa mga istatistika, para sa isang kamag-anak na katangian ng magnitude ng isang iba't ibang katangian at ang panloob na istraktura ng serye ng pamamahagi, ang mga istrukturang average ay ginagamit, na pangunahing kinakatawan ng mode at median.

Fashion- Ito ang pinakakaraniwang variant ng serye. Ang fashion ay ginagamit, halimbawa, sa pagtukoy ng laki ng mga damit, sapatos, na kung saan ay sa pinakamalaking demand sa mga mamimili. Ang mode para sa isang discrete series ay ang variant na may pinakamataas na frequency. Kapag kinakalkula ang mode para sa serye ng pagkakaiba-iba ng agwat, kailangan mo munang matukoy ang modal interval (sa pamamagitan ng maximum na dalas), at pagkatapos ay ang halaga ng modal value ng attribute ayon sa formula:

- - halaga ng fashion

- - mas mababang limitasyon ng modal interval

- - halaga ng pagitan

- - dalas ng pagitan ng modal

- - dalas ng agwat bago ang modal

- - dalas ng agwat kasunod ng modal

Median - ito ang halaga ng feature na sumasailalim sa ranggo na serye at hinahati ang seryeng ito sa dalawang bahagi na magkapantay ang bilang.

Upang matukoy ang median sa isang discrete na serye sa pagkakaroon ng mga frequency, kalkulahin muna ang kalahating kabuuan ng mga frequency , at pagkatapos ay tukuyin kung anong halaga ng variant ang nahuhulog dito. (Kung ang pinagsunod-sunod na row ay naglalaman ng kakaibang bilang ng mga feature, ang median na numero ay kinakalkula ng formula:

M e \u003d (n (bilang ng mga tampok sa pinagsama-samang) + 1) / 2,

sa kaso ng pantay na bilang ng mga feature, ang median ay magiging katumbas ng average ng dalawang feature sa gitna ng row).

Kapag nagkalkula median para sa isang serye ng pagkakaiba-iba ng pagitan, tukuyin muna ang median interval kung saan matatagpuan ang median, at pagkatapos ay ang halaga ng median ayon sa formula:

- ay ang nais na median

- ay ang lower bound ng interval na naglalaman ng median

- - halaga ng pagitan

- - ang kabuuan ng mga frequency o ang bilang ng mga miyembro ng serye

Ang kabuuan ng mga naipon na frequency ng mga pagitan bago ang median

- ay ang dalas ng median na pagitan

Halimbawa. Hanapin ang mode at median.

Desisyon:
Sa halimbawang ito, ang modal interval ay nasa loob ng pangkat ng edad na 25-30 taon, dahil ang agwat na ito ay tumutukoy sa pinakamataas na dalas (1054).

Kalkulahin natin ang halaga ng mode:

Nangangahulugan ito na ang modal age ng mga mag-aaral ay 27 taon.

Kalkulahin ang median. Ang median interval ay nasa pangkat ng edad na 25-30 taon, dahil sa loob ng agwat na ito mayroong isang variant na naghahati sa populasyon sa dalawang pantay na bahagi (Σf i /2 = 3462/2 = 1731). Susunod, pinapalitan namin ang kinakailangang numerical data sa formula at makuha ang halaga ng median:

Nangangahulugan ito na ang kalahati ng mga mag-aaral ay wala pang 27.4 taong gulang, at ang kalahati ay higit sa 27.4 taong gulang.

Bilang karagdagan sa mode at median, ang mga tagapagpahiwatig tulad ng mga quartile ay maaaring gamitin, na naghahati sa ranggo na serye sa 4 na pantay na bahagi, decile- 10 bahagi at porsyento - bawat 100 bahagi.

Ang konsepto ng selective observation at saklaw nito.

Selective observation nalalapat kapag naglalapat ng tuluy-tuloy na pagmamasid pisikal na imposible dahil sa malaking halaga ng data o hindi praktikal sa ekonomiya. Ang pisikal na imposibilidad ay nangyayari, halimbawa, kapag pinag-aaralan ang mga daloy ng pasahero, mga presyo sa merkado, mga badyet ng pamilya. Ang kawalan ng kakayahan sa ekonomiya ay nangyayari kapag tinatasa ang kalidad ng mga kalakal na nauugnay sa kanilang pagkasira, halimbawa, pagtikim, pagsubok ng mga brick para sa lakas, atbp.

Ang mga yunit ng istatistika na pinili para sa pagmamasid ay bumubuo ng isang sample o sample, at ang kanilang buong hanay - ang pangkalahatang populasyon (GS). Sa kasong ito, ang bilang ng mga yunit sa sample ay nagpapahiwatig n, at sa buong HS - N. Saloobin n/n tinatawag na relatibong laki o proporsyon ng sample.

Ang kalidad ng mga resulta ng sampling ay nakasalalay sa pagiging kinatawan ng sample, ibig sabihin, kung gaano ito kinatawan sa HS. Upang matiyak ang pagiging kinatawan ng sample, kinakailangan na obserbahan prinsipyo ng random na pagpili ng mga yunit, na ipinapalagay na ang pagsasama ng isang unit ng HS sa sample ay hindi maaaring maimpluwensyahan ng anumang iba pang salik maliban sa pagkakataon.

Umiiral 4 na paraan ng random na pagpili magpakita ng halimbawa:

  1. Talagang random pagpili o "paraan ng lotto", kapag ang mga serial number ay itinalaga sa mga istatistikal na halaga, ipinasok sa ilang partikular na bagay (halimbawa, mga kegs), na pagkatapos ay hinahalo sa ilang lalagyan (halimbawa, sa isang bag) at pinili nang random. Sa pagsasagawa, ang pamamaraang ito ay isinasagawa gamit ang isang random na generator ng numero o mga talahanayan ng matematika ng mga random na numero.
  2. Mekanikal pagpili, ayon sa kung saan ang bawat ( N/n)-ika halaga ng pangkalahatang populasyon. Halimbawa, kung naglalaman ito ng 100,000 value, at gusto mong pumili ng 1,000, ang bawat 100,000 / 1000 = 100th value ay mahuhulog sa sample. Bukod dito, kung hindi sila niraranggo, kung gayon ang una ay pinili nang random mula sa unang daan, at ang mga bilang ng iba ay magiging isang daan pa. Halimbawa, kung ang numero ng unit na 19 ang una, ang numero 119 ay dapat na susunod, pagkatapos ay numero 219, pagkatapos ay numero 319, at iba pa. Kung ang mga unit ng populasyon ay niraranggo, ang #50 ang pipiliin muna, pagkatapos ang #150, pagkatapos ay #250, at iba pa.
  3. Ang pagpili ng mga halaga mula sa isang magkakaibang hanay ng data ay isinasagawa pinagsasapin-sapin(stratified) na paraan, kapag ang pangkalahatang populasyon ay nahahati dati sa mga homogenous na grupo, kung saan inilalapat ang random o mekanikal na pagpili.
  4. Ang isang espesyal na paraan ng sampling ay serye pagpili, kung saan hindi mga indibidwal na dami ang random o mekanikal na pinili, ngunit ang kanilang mga serye (mga pagkakasunud-sunod mula sa ilang numero hanggang sa ilang magkakasunod), kung saan isinasagawa ang patuloy na pagmamasid.

Ang kalidad ng mga sample na obserbasyon ay nakasalalay din sa uri ng sampling: paulit-ulit o hindi paulit-ulit.

Sa muling pagpili ang mga istatistikal na halaga o ang kanilang mga serye na nahulog sa sample ay ibinalik sa pangkalahatang populasyon pagkatapos gamitin, na may pagkakataong makapasok sa isang bagong sample. Kasabay nito, ang lahat ng mga halaga ng pangkalahatang populasyon ay may parehong posibilidad na maisama sa sample.

Hindi paulit-ulit na pagpili nangangahulugan na ang mga istatistikal na halaga o ang kanilang serye na kasama sa sample ay hindi ibinalik sa pangkalahatang populasyon pagkatapos gamitin, at samakatuwid ang posibilidad na makapasok sa susunod na sample ay tumataas para sa natitirang mga halaga ng huli.

Ang hindi paulit-ulit na sampling ay nagbibigay ng mas tumpak na mga resulta, kaya mas madalas itong ginagamit. Ngunit may mga sitwasyon na hindi ito mailalapat (pag-aaral ng mga daloy ng pasahero, demand ng consumer, atbp.) at pagkatapos ay isinasagawa ang muling pagpili.

Ang marginal error ng observation sample, ang average na error ng sample, ang pagkakasunud-sunod kung saan sila kinakalkula.

Isaalang-alang natin nang detalyado ang mga pamamaraan sa itaas ng pagbuo ng isang sample na populasyon at ang mga error na lumitaw sa kasong ito. pagiging kinatawan .
Actually-random ang sample ay batay sa pagpili ng mga yunit mula sa pangkalahatang populasyon nang random nang walang anumang mga elemento ng pagkakapare-pareho. Sa teknikal, ang wastong random na pagpili ay isinasagawa sa pamamagitan ng pagguhit ng mga lot (halimbawa, mga lottery) o sa pamamagitan ng isang talahanayan ng mga random na numero.

Ang aktwal na random na pagpili "sa dalisay nitong anyo" sa pagsasanay ng pumipili na pagmamasid ay bihirang ginagamit, ngunit ito ay ang paunang bukod sa iba pang mga uri ng pagpili, ito ay nagpapatupad ng mga pangunahing prinsipyo ng pumipili na pagmamasid. Isaalang-alang natin ang ilang mga katanungan ng teorya ng paraan ng sampling at ang formula ng error para sa isang simpleng random na sample.

Error sa pag-sample- ito ang pagkakaiba sa pagitan ng halaga ng parameter sa pangkalahatang populasyon, at ang halaga nito na kinakalkula mula sa mga resulta ng sample na pagmamasid. Para sa isang average na quantitative na katangian, ang sampling error ay tinutukoy ng

Ang tagapagpahiwatig ay tinatawag na marginal sampling error.
Ang sample mean ay isang random na variable na maaaring tumagal sa iba't ibang mga halaga depende sa kung aling mga unit ang nasa sample. Samakatuwid, ang mga sampling error ay mga random na variable din at maaaring tumagal sa iba't ibang mga halaga. Samakatuwid, tukuyin ang average ng mga posibleng pagkakamali - ibig sabihin ng sampling error, na depende sa:

Laki ng sample: mas malaki ang numero, mas maliit ang average na error;

Ang antas ng pagbabago ng pinag-aralan na katangian: mas maliit ang pagkakaiba-iba ng katangian, at, dahil dito, ang pagkakaiba, mas maliit ang average na error sa sampling.

Sa random na muling pagpili ang average na error ay kinakalkula:
.
Sa pagsasagawa, ang pangkalahatang pagkakaiba ay hindi eksaktong kilala, ngunit sa teorya ng posibilidad napatunayan na
.
Dahil ang halaga para sa sapat na malaking n ay malapit sa 1, maaari nating ipagpalagay na . Pagkatapos ay maaaring kalkulahin ang mean sampling error:
.
Ngunit sa mga kaso ng isang maliit na sample (para sa n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

Sa random sampling ang mga ibinigay na formula ay itinatama ng halaga. Kung gayon ang average na error ng non-sampling ay:
at .
kasi ay palaging mas mababa sa , pagkatapos ang salik () ay palaging mas mababa sa 1. Nangangahulugan ito na ang average na error sa hindi paulit-ulit na pagpili ay palaging mas mababa kaysa sa paulit-ulit na pagpili.
Mechanical sampling ay ginagamit kapag ang pangkalahatang populasyon ay inayos sa ilang paraan (halimbawa, mga listahan ng botante sa alpabetikong pagkakasunud-sunod, mga numero ng telepono, mga numero ng bahay, mga apartment). Ang pagpili ng mga yunit ay isinasagawa sa isang tiyak na agwat, na katumbas ng katumbas ng porsyento ng sample. Kaya, na may 2% sample, bawat 50 unit = 1 / 0.02 ay pinili, na may 5%, bawat 1 / 0.05 = 20 unit ng pangkalahatang populasyon.

Ang pinagmulan ay pinili sa iba't ibang paraan: random, mula sa gitna ng pagitan, na may pagbabago sa pinagmulan. Ang pangunahing bagay ay upang maiwasan ang sistematikong pagkakamali. Halimbawa, na may 5% na sample, kung ang ika-13 ay pinili bilang unang yunit, pagkatapos ay ang susunod na 33, 53, 73, atbp.

Sa mga tuntunin ng katumpakan, ang mekanikal na pagpili ay malapit sa tamang random sampling. Samakatuwid, upang matukoy ang average na error ng mechanical sampling, ginagamit ang mga formula ng tamang random na pagpili.

Sa tipikal na seleksyon ang na-survey na populasyon ay preliminarily nahahati sa homogenous, solong-uri na mga grupo. Halimbawa, kapag nagsusuri ng mga negosyo, ang mga ito ay maaaring mga industriya, mga sub-sektor, habang pinag-aaralan ang populasyon - mga lugar, panlipunan o mga pangkat ng edad. Pagkatapos ang isang independiyenteng pagpili ay ginawa mula sa bawat pangkat sa isang mekanikal o wastong random na paraan.

Ang karaniwang sampling ay nagbibigay ng mas tumpak na mga resulta kaysa sa iba pang mga pamamaraan. Tinitiyak ng typification ng pangkalahatang populasyon ang representasyon ng bawat typological group sa sample, na ginagawang posible na ibukod ang impluwensya ng pagkakaiba-iba ng intergroup sa average na error sa sample. Samakatuwid, kapag nahanap ang error ng isang tipikal na sample ayon sa panuntunan ng pagdaragdag ng mga pagkakaiba-iba (), kinakailangang isaalang-alang lamang ang average ng mga pagkakaiba-iba ng grupo. Kung gayon ang mean sampling error ay:
sa muling pagpili
,
na may hindi paulit-ulit na pagpili
,
saan ay ang ibig sabihin ng mga pagkakaiba-iba ng intra-grupo sa sample.

Serial (o nested) na seleksyon ginagamit kapag ang populasyon ay nahahati sa serye o mga grupo bago magsimula ang sample survey. Ang mga seryeng ito ay maaaring mga pakete ng mga natapos na produkto, mga grupo ng mag-aaral, mga koponan. Ang mga serye para sa pagsusuri ay pinipili nang mekanikal o random, at sa loob ng serye ay isinasagawa ang isang kumpletong survey ng mga yunit. Samakatuwid, ang average sampling error ay nakasalalay lamang sa intergroup (interseries) variance, na kinakalkula ng formula:

kung saan ang r ay ang bilang ng napiling serye;
- ang average ng i-th series.

Ang average na serial sampling error ay kinakalkula:

kapag muling pinili:
,
na may hindi umuulit na pagpili:
,
kung saan ang R ay ang kabuuang bilang ng mga serye.

pinagsama-sama pagpili ay isang kumbinasyon ng mga itinuturing na paraan ng pagpili.

Ang average na error sa pag-sample para sa anumang paraan ng pagpili ay higit sa lahat ay nakasalalay sa ganap na laki ng sample at, sa mas mababang lawak, sa porsyento ng sample. Ipagpalagay na 225 obserbasyon ang ginawa sa unang kaso mula sa isang populasyon na 4,500 na yunit at sa pangalawang kaso, mula sa 225,000 na mga yunit. Ang mga pagkakaiba sa parehong mga kaso ay katumbas ng 25. Pagkatapos, sa unang kaso, na may 5% na pagpili, ang sampling error ay:

Sa pangalawang kaso, na may 0.1% na seleksyon, ito ay magiging katumbas ng:


Sa gayon, na may pagbaba sa porsyento ng sample ng 50 beses, bahagyang tumaas ang error sa sample, dahil hindi nagbago ang laki ng sample.
Ipagpalagay na ang laki ng sample ay nadagdagan sa 625 na mga obserbasyon. Sa kasong ito, ang sampling error ay:

Ang pagtaas sa sample ng 2.8 beses na may parehong laki ng pangkalahatang populasyon ay binabawasan ang laki ng sampling error ng higit sa 1.6 na beses.

Mga pamamaraan at paraan ng pagbuo ng sample na populasyon.

Sa mga istatistika, ginagamit ang iba't ibang paraan ng pagbuo ng mga sample set, na tinutukoy ng mga layunin ng pag-aaral at nakasalalay sa mga detalye ng bagay ng pag-aaral.

Ang pangunahing kondisyon para sa pagsasagawa ng sample na survey ay upang maiwasan ang paglitaw ng mga sistematikong pagkakamali na nagmumula sa paglabag sa prinsipyo ng pantay na pagkakataon para sa bawat yunit ng pangkalahatang populasyon na makapasok sa sample. Ang pag-iwas sa mga sistematikong pagkakamali ay nakakamit bilang isang resulta ng paggamit ng mga pamamaraang nakabatay sa siyentipiko para sa pagbuo ng isang sample na populasyon.

Mayroong mga sumusunod na paraan upang pumili ng mga yunit mula sa pangkalahatang populasyon:

1) indibidwal na pagpili - ang mga indibidwal na yunit ay pinili sa sample;

2) pagpili ng grupo - ang mga qualitatively homogenous na grupo o serye ng mga unit na pinag-aaralan ay nahulog sa sample;

3) pinagsamang pagpili ay isang kumbinasyon ng indibidwal at pangkat na pagpili.
Ang mga paraan ng pagpili ay tinutukoy ng mga patakaran para sa pagbuo ng sampling na populasyon.

Ang sample ay maaaring:

  • tamang random ay binubuo sa katotohanan na ang sample ay nabuo bilang isang resulta ng random (hindi sinasadya) na pagpili ng mga indibidwal na yunit mula sa pangkalahatang populasyon. Sa kasong ito, ang bilang ng mga unit na napili sa sample set ay karaniwang tinutukoy batay sa tinatanggap na proporsyon ng sample. Ang sample share ay ang ratio ng bilang ng mga unit sa sample na populasyon n sa bilang ng mga unit sa pangkalahatang populasyon N, i.e.
  • mekanikal ay binubuo sa katotohanan na ang pagpili ng mga yunit sa sample ay ginawa mula sa pangkalahatang populasyon, na nahahati sa pantay na pagitan (mga grupo). Sa kasong ito, ang laki ng pagitan sa pangkalahatang populasyon ay katumbas ng katumbas ng proporsyon ng sample. Kaya, na may 2% sample, bawat ika-50 na unit ay pinipili (1:0.02), na may 5% na sample, bawat ika-20 na unit (1:0.05), atbp. Kaya, alinsunod sa tinatanggap na proporsyon ng pagpili, ang pangkalahatang populasyon ay, bilang ito ay, mekanikal na nahahati sa pantay na mga grupo. Isang yunit lamang ang pipiliin mula sa bawat pangkat sa sample.
  • tipikal - kung saan ang pangkalahatang populasyon ay unang nahahati sa homogenous na tipikal na mga grupo. Pagkatapos, mula sa bawat tipikal na grupo, ang isang indibidwal na pagpili ng mga yunit sa sample ay ginawa ng random o mekanikal na sample. Ang isang mahalagang katangian ng isang tipikal na sample ay ang pagbibigay nito ng mas tumpak na mga resulta kumpara sa iba pang mga paraan ng pagpili ng mga yunit sa isang sample;
  • serye- kung saan ang pangkalahatang populasyon ay nahahati sa mga grupo ng parehong laki - serye. Pinili ang mga serye sa sample set. Sa loob ng serye, isinasagawa ang patuloy na pagmamasid sa mga yunit na nahulog sa serye;
  • pinagsama-sama- Ang sampling ay maaaring dalawang yugto. Sa kasong ito, ang pangkalahatang populasyon ay nahahati muna sa mga grupo. Pagkatapos ay pipiliin ang mga grupo, at sa loob ng huli, pipiliin ang mga indibidwal na unit.

Sa mga istatistika, ang mga sumusunod na paraan ng pagpili ng mga yunit sa isang sample ay nakikilala::

  • iisang yugto sample - ang bawat napiling unit ay agad na sasailalim sa pag-aaral sa isang partikular na batayan (talagang random at serial sample);
  • multistage sampling - ang pagpili ay ginawa mula sa pangkalahatang populasyon ng mga indibidwal na grupo, at ang mga indibidwal na yunit ay pinili mula sa mga grupo (isang tipikal na sample na may mekanikal na paraan ng pagpili ng mga yunit sa sample na populasyon).

Bilang karagdagan, mayroong:

  • muling pagpili- ayon sa scheme ng ibinalik na bola. Sa kasong ito, ang bawat yunit o serye na nahulog sa sample ay ibinalik sa pangkalahatang populasyon at samakatuwid ay may pagkakataong maisama muli sa sample;
  • hindi paulit-ulit na pagpili- ayon sa pamamaraan ng hindi naibalik na bola. Mayroon itong mas tumpak na mga resulta para sa parehong laki ng sample.

Pagpapasiya ng kinakailangang laki ng sample (gamit ang talahanayan ng Mag-aaral).

Ang isa sa mga siyentipikong prinsipyo sa teorya ng sampling ay upang matiyak na ang isang sapat na bilang ng mga yunit ay napili. Theoretically, ang pangangailangan na sumunod sa prinsipyong ito ay ipinakita sa mga patunay ng limitasyon theorems ng probability theory, na nagbibigay-daan sa iyo upang maitaguyod kung gaano karaming mga yunit ang dapat piliin mula sa pangkalahatang populasyon upang ito ay sapat at matiyak ang pagiging kinatawan ng sample.

Ang pagbaba sa karaniwang error ng sample, at, dahil dito, ang pagtaas sa katumpakan ng pagtatantya ay palaging nauugnay sa isang pagtaas sa laki ng sample, samakatuwid, nasa yugto na ng pag-aayos ng isang sample na pagmamasid, kinakailangan na magpasya kung ano ang dapat na sukat ng sample upang matiyak ang kinakailangang katumpakan ng mga resulta ng pagmamasid. Ang pagkalkula ng kinakailangang laki ng sample ay binuo gamit ang mga formula na nagmula sa mga formula para sa mga marginal sampling error (A), na tumutugma sa isa o ibang uri at paraan ng pagpili. Kaya, para sa isang random na paulit-ulit na laki ng sample (n), mayroon kaming:

Ang kakanyahan ng formula na ito ay na sa isang random na muling pagpili ng kinakailangang numero, ang laki ng sample ay direktang proporsyonal sa parisukat ng koepisyent ng kumpiyansa. (t2) at variance ng variation feature (?2) at inversely proportional sa square ng marginal sampling error (?2). Sa partikular, sa pamamagitan ng pagdodoble sa marginal error, ang kinakailangang laki ng sample ay maaaring bawasan ng apat na salik. Sa tatlong parameter, dalawa (t at?) ang itinakda ng mananaliksik.

Kasabay nito, ang mananaliksik Para sa mga layunin ng sample na survey, ang tanong ay dapat na mapagpasyahan: sa anong dami ng kumbinasyon ang mas mahusay na isama ang mga parameter na ito upang maibigay ang pinakamainam na variant? Sa isang kaso, maaaring mas nasiyahan siya sa pagiging maaasahan ng mga resulta na nakuha (t) kaysa sa sukat ng katumpakan (?), sa kabilang banda - vice versa. Mas mahirap lutasin ang isyu tungkol sa halaga ng marginal sampling error, dahil ang mananaliksik ay walang indicator na ito sa yugto ng pagdidisenyo ng sample na obserbasyon, samakatuwid, sa pagsasagawa, kaugalian na itakda ang marginal sampling error, bilang isang panuntunan, sa loob ng 10% ng inaasahang average na antas ng katangian. Ang pagtatatag ng isang ipinapalagay na average na antas ay maaaring lapitan sa iba't ibang paraan: gamit ang data mula sa mga katulad na naunang survey, o paggamit ng data mula sa sampling frame at pagkuha ng maliit na pilot sample.

Ang pinakamahirap na bagay na itatag kapag nagdidisenyo ng isang sample na pagmamasid ay ang ikatlong parameter sa formula (5.2) - ang pagkakaiba-iba ng sample na populasyon. Sa kasong ito, kinakailangang gamitin ang lahat ng impormasyong magagamit ng imbestigador, na nakuha mula sa mga nakaraang katulad at pilot na survey.

Tanong ng kahulugan Ang kinakailangang laki ng sample ay nagiging mas kumplikado kung ang sample na survey ay nagsasangkot ng pag-aaral ng ilang mga tampok ng mga sampling unit. Sa kasong ito, ang mga average na antas ng bawat isa sa mga katangian at ang kanilang pagkakaiba-iba, bilang panuntunan, ay magkakaiba, at samakatuwid ay posible na magpasya kung aling pagpapakalat kung alin sa mga katangian ang bibigyan ng kagustuhan na isinasaalang-alang lamang ang layunin at layunin ng ang survey.

Kapag nagdidisenyo ng isang sample na pagmamasid, ang isang paunang natukoy na halaga ng pinahihintulutang sampling error ay ipinapalagay alinsunod sa mga layunin ng isang partikular na pag-aaral at ang posibilidad ng mga konklusyon batay sa mga resulta ng obserbasyon.

Sa pangkalahatan, binibigyang-daan ka ng formula para sa marginal error ng sample mean value na matukoy ang:

Ang laki ng posibleng mga paglihis ng mga tagapagpahiwatig ng pangkalahatang populasyon mula sa mga tagapagpahiwatig ng sample na populasyon;

Ang kinakailangang laki ng sample, na nagbibigay ng kinakailangang katumpakan, kung saan ang mga limitasyon ng isang posibleng error ay hindi lalampas sa isang tiyak na tinukoy na halaga;

Ang posibilidad na ang error sa sample ay magkakaroon ng ibinigay na limitasyon.

Pamamahagi ng mag-aaral sa probability theory, ito ay isang isang-parameter na pamilya ng ganap na tuluy-tuloy na mga distribusyon.

Serye ng dynamics (interval, moment), pagsasara ng series of dynamics.

Serye ng dynamics- ito ang mga halaga ng mga istatistikal na tagapagpahiwatig na ipinakita sa isang tiyak na pagkakasunud-sunod na magkakasunod.

Ang bawat serye ng oras ay naglalaman ng dalawang bahagi:

1) mga tagapagpahiwatig ng mga yugto ng panahon (taon, quarters, buwan, araw o petsa);

2) mga tagapagpahiwatig na nagpapakilala sa bagay na pinag-aaralan para sa mga yugto ng panahon o sa mga kaukulang petsa, na tinatawag na mga antas ng serye.

Ang mga antas ng serye ay ipinahayag parehong absolute at average o relative values. Depende sa likas na katangian ng mga tagapagpahiwatig, ang mga dinamikong serye ng ganap, kamag-anak at average na mga halaga ay binuo. Ang mga dinamikong serye ng mga kamag-anak at average na mga halaga ay itinayo batay sa derivative na serye ng mga ganap na halaga. Mayroong pagitan at sandali na serye ng mga dinamika.

Mga serye ng dynamic na pagitan naglalaman ng mga halaga ng mga tagapagpahiwatig para sa ilang mga tagal ng panahon. Sa serye ng agwat, ang mga antas ay maaaring summed up, pagkuha ng dami ng kababalaghan para sa isang mas mahabang panahon, o ang tinatawag na accumulated totals.

Mga serye ng dinamikong sandali sumasalamin sa mga halaga ng mga tagapagpahiwatig sa isang tiyak na punto ng oras (petsa ng oras). Sa serye ng sandali, maaaring interesado lang ang mananaliksik sa pagkakaiba ng mga phenomena, na sumasalamin sa pagbabago sa antas ng serye sa pagitan ng ilang partikular na petsa, dahil ang kabuuan ng mga antas dito ay walang tunay na nilalaman. Hindi kinakalkula dito ang mga pinagsama-samang kabuuan.

Ang pinakamahalagang kundisyon para sa tamang pagbuo ng dynamic na serye ay ang pagiging maihahambing ng mga antas ng serye na nauugnay sa iba't ibang panahon. Ang mga antas ay dapat iharap sa magkakatulad na dami, dapat mayroong parehong pagkakumpleto ng saklaw ng iba't ibang bahagi ng kababalaghan.

Nang sa gayon Upang maiwasan ang pagbaluktot sa tunay na dinamika, ang mga paunang kalkulasyon ay isinasagawa sa istatistikal na pag-aaral (ang pagsasara ng serye ng oras), na nauuna sa istatistikal na pagsusuri ng serye ng oras. Ang pagsasara ng serye ng oras ay nauunawaan bilang kumbinasyon ng dalawa o higit pang serye sa isang serye, ang mga antas nito ay kinakalkula ayon sa iba't ibang pamamaraan o hindi tumutugma sa mga hangganan ng teritoryo, atbp. Ang pagsasara ng serye ng mga dinamika ay maaari ring magpahiwatig ng pagbabawas ng ganap na antas ng serye ng mga dinamika sa isang karaniwang batayan, na nag-aalis ng hindi pagkakatugma ng mga antas ng serye ng mga dinamika.

Ang konsepto ng comparability ng time series, coefficients, growth at growth rate.

Serye ng dynamics- ito ay mga serye ng mga istatistikal na tagapagpahiwatig na nagpapakilala sa pag-unlad ng natural at panlipunang mga phenomena sa oras. Ang mga koleksyon ng istatistika na inilathala ng Komite ng Istatistika ng Estado ng Russia ay naglalaman ng isang malaking bilang ng mga serye ng oras sa anyong tabular. Ang mga serye ng dinamika ay nagbibigay-daan sa pagbubunyag ng mga pattern ng pag-unlad ng mga pinag-aralan na phenomena.

Ang serye ng oras ay naglalaman ng dalawang uri ng mga tagapagpahiwatig. Mga tagapagpahiwatig ng oras(mga taon, quarter, buwan, atbp.) o mga punto sa oras (sa simula ng taon, sa simula ng bawat buwan, atbp.). Mga tagapagpahiwatig ng antas ng hilera. Ang mga tagapagpahiwatig ng mga antas ng serye ng oras ay maaaring ipahayag sa mga ganap na halaga (produksyon sa tonelada o rubles), mga kamag-anak na halaga (bahagi ng populasyon ng lunsod sa%) at mga average na halaga (average na sahod ng mga manggagawa sa industriya ayon sa mga taon, atbp.). Sa anyong tabular, ang serye ng oras ay naglalaman ng dalawang column o dalawang row.

Ang tamang pagtatayo ng time series ay nagsasangkot ng katuparan ng ilang mga kinakailangan:

  1. lahat ng mga tagapagpahiwatig ng isang serye ng mga dinamika ay dapat na siyentipikong napatunayan, maaasahan;
  2. ang mga tagapagpahiwatig ng isang serye ng mga dinamika ay dapat na maihahambing sa oras, i.e. dapat kalkulahin para sa parehong mga yugto ng panahon o sa parehong mga petsa;
  3. ang mga tagapagpahiwatig ng isang bilang ng mga dinamika ay dapat na maihahambing sa buong teritoryo;
  4. ang mga tagapagpahiwatig ng isang serye ng mga dinamika ay dapat na maihahambing sa nilalaman, i.e. kinakalkula ayon sa isang solong pamamaraan, sa parehong paraan;
  5. ang mga tagapagpahiwatig ng isang serye ng mga dinamika ay dapat na maihahambing sa hanay ng mga sakahan na isinasaalang-alang. Ang lahat ng mga tagapagpahiwatig ng isang serye ng mga dinamika ay dapat ibigay sa parehong mga yunit ng pagsukat.

Mga tagapagpahiwatig ng istatistika maaaring makilala ang alinman sa mga resulta ng prosesong pinag-aaralan sa loob ng isang yugto ng panahon, o ang estado ng hindi pangkaraniwang bagay na pinag-aaralan sa isang tiyak na punto ng panahon, i.e. Ang mga indicator ay maaaring agwat (pana-panahon) at instant. Alinsunod dito, sa simula ang serye ng mga dinamika ay maaaring alinman sa pagitan o sandali. Ang serye ng sandali ng dynamics, sa turn, ay maaaring may pantay at hindi pantay na agwat ng oras.

Ang paunang serye ng mga dinamika ay maaaring ma-convert sa isang serye ng mga average na halaga at isang serye ng mga kamag-anak na halaga (chain at base). Ang nasabing serye ng oras ay tinatawag na derived time series.

Ang paraan ng pagkalkula ng average na antas sa serye ng dynamics ay iba, dahil sa uri ng serye ng dynamics. Gamit ang mga halimbawa, isaalang-alang ang mga uri ng serye ng oras at mga formula para sa pagkalkula ng average na antas.

Ganap na mga nadagdag (Δy) ipakita kung gaano karaming mga yunit ang nabago ng kasunod na antas ng serye kumpara sa nauna (hanay 3. - chain absolute increments) o kumpara sa unang antas (column 4. - basic absolute increments). Ang mga formula ng pagkalkula ay maaaring isulat bilang mga sumusunod:

Sa isang pagbawas sa ganap na mga halaga ng serye, magkakaroon ng "pagbaba", "pagbaba", ayon sa pagkakabanggit.

Ang mga tagapagpahiwatig ng ganap na paglago ay nagpapahiwatig na, halimbawa, noong 1998 ang produksyon ng produktong "A" ay tumaas ng 4,000 tonelada kumpara noong 1997, at ng 34,000 tonelada kumpara noong 1994; para sa iba pang mga taon, tingnan ang talahanayan. 11.5 gr. 3 at 4.

Paglago kadahilanan nagpapakita kung ilang beses nagbago ang antas ng serye kumpara sa nauna (column 5 - chain growth o decline factors) o kumpara sa paunang level (column 6 - basic growth o decline factors). Ang mga formula ng pagkalkula ay maaaring isulat bilang mga sumusunod:

Mga rate ng paglago ipakita kung gaano karaming porsyento ang susunod na antas ng serye ay inihambing sa nauna (kolumna 7 - mga rate ng paglago ng chain) o kumpara sa paunang antas (kolumna 8 - pangunahing mga rate ng paglago). Ang mga formula ng pagkalkula ay maaaring isulat bilang mga sumusunod:

Kaya, halimbawa, noong 1997, ang dami ng produksyon ng produkto na "A" kumpara noong 1996 ay 105.5% (

Mga rate ng paglago ipakita kung gaano karaming porsyento ang pagtaas ng antas ng panahon ng pag-uulat kumpara sa nauna (kolumna 9 - mga rate ng paglago ng chain) o kumpara sa paunang antas (kolumna 10 - mga pangunahing rate ng paglago). Ang mga formula ng pagkalkula ay maaaring isulat bilang mga sumusunod:

T pr \u003d T p - 100% o T pr \u003d ganap na pagtaas / antas ng nakaraang panahon * 100%

Kaya, halimbawa, noong 1996, kumpara noong 1995, ang produktong "A" ay ginawa nang higit pa ng 3.8% (103.8% - 100%) o (8:210) x 100%, at kumpara noong 1994. - ng 9% ( 109% - 100%).

Kung bumaba ang ganap na mga antas sa serye, ang rate ay magiging mas mababa sa 100% at, nang naaayon, magkakaroon ng rate ng pagtanggi (rate ng paglago na may minus sign).

Ganap na halaga ng 1% na pagtaas(column 11) ay nagpapakita kung gaano karaming mga yunit ang dapat gawin sa isang partikular na panahon upang ang antas ng nakaraang panahon ay tumaas ng 1%. Sa aming halimbawa, noong 1995 kinakailangan na gumawa ng 2.0 libong tonelada, at noong 1998 - 2.3 libong tonelada, i.e. mas malaki.

Mayroong dalawang paraan upang matukoy ang laki ng ganap na halaga ng 1% na paglago:

Hatiin ang antas ng nakaraang panahon ng 100;

Hatiin ang ganap na mga rate ng paglago ng chain sa mga katumbas na rate ng paglago ng chain.

Ganap na halaga ng 1% na pagtaas =

Sa dynamics, lalo na sa mahabang panahon, mahalagang sama-samang pag-aralan ang mga rate ng paglago kasama ang nilalaman ng bawat pagtaas o pagbaba ng porsyento.

Tandaan na ang isinasaalang-alang na pamamaraan para sa pagsusuri ng mga serye ng oras ay naaangkop kapwa para sa mga serye ng oras, ang mga antas ng kung saan ay ipinahayag sa mga ganap na halaga (t, libong rubles, ang bilang ng mga empleyado, atbp.), at para sa serye ng oras, ang mga antas ng na ipinahayag sa mga relatibong tagapagpahiwatig (% ng scrap , % ash na nilalaman ng karbon, atbp.) o mga average na halaga (average na ani sa c/ha, average na sahod, atbp.).

Kasama ang mga itinuturing na analytical indicator na kinakalkula para sa bawat taon kumpara sa nauna o paunang antas, kapag sinusuri ang serye ng oras, kinakailangan upang kalkulahin ang average na analytical indicator para sa panahon: ang average na antas ng serye, ang average na taunang ganap na pagtaas (pagbaba) at ang average na taunang rate ng paglago at rate ng paglago.

Ang mga pamamaraan para sa pagkalkula ng average na antas ng isang serye ng mga dinamika ay tinalakay sa itaas. Sa pagitan ng serye ng dinamika na aming isinasaalang-alang, ang average na antas ng serye ay kinakalkula ng formula ng arithmetic mean simple:

Ang average na taunang output ng produkto para sa 1994-1998. umabot sa 218.4 libong tonelada.

Ang average na taunang ganap na pagtaas ay kinakalkula din ng formula ng simpleng arithmetic mean:

Ang taunang ganap na mga pagtaas ay nag-iba sa mga taon mula 4 hanggang 12 libong tonelada (tingnan ang gr. 3), at ang average na taunang pagtaas ng produksyon para sa panahon ng 1995 - 1998. umabot sa 8.5 libong tonelada.

Ang mga pamamaraan para sa pagkalkula ng average na rate ng paglago at ang average na rate ng paglago ay nangangailangan ng mas detalyadong pagsasaalang-alang. Isaalang-alang natin ang mga ito sa halimbawa ng mga taunang tagapagpahiwatig ng antas ng serye na ibinigay sa talahanayan.

Ang gitnang antas ng hanay ng mga dinamika.

Serye ng dynamics (o time series)- ito ang mga numerical na halaga ng isang tiyak na tagapagpahiwatig ng istatistika sa sunud-sunod na mga sandali o mga yugto ng panahon (ibig sabihin, nakaayos sa magkakasunod na pagkakasunud-sunod).

Ang mga numerong halaga ng isang partikular na tagapagpahiwatig ng istatistika na bumubuo sa isang serye ng mga dinamika ay tinatawag antas ng isang numero at karaniwang tinutukoy ng titik y. Unang miyembro ng serye y 1 tinatawag na inisyal o baseline, at ang huli y n - pangwakas. Ang mga sandali o yugto ng panahon kung saan ang mga antas ay tinutukoy ng t.

Ang mga dinamikong serye, bilang panuntunan, ay ipinakita sa anyo ng isang talahanayan o graph, at isang sukat ng oras ay binuo sa kahabaan ng x-axis t, at kasama ang ordinate - ang sukat ng mga antas ng serye y.

Mga average na tagapagpahiwatig ng isang serye ng mga dinamika

Ang bawat serye ng dynamics ay maaaring ituring bilang isang tiyak na hanay n mga tagapagpahiwatig ng pagkakaiba-iba ng oras na maaaring ibuod bilang mga average. Ang mga naturang pangkalahatang (average) na mga tagapagpahiwatig ay kinakailangan lalo na kapag inihambing ang mga pagbabago sa isa o isa pang tagapagpahiwatig sa iba't ibang mga panahon, sa iba't ibang mga bansa, atbp.

Ang isang pangkalahatang katangian ng isang serye ng mga dinamika ay maaaring, una sa lahat, average na antas ng hilera. Ang paraan ng pagkalkula ng average na antas ay depende sa kung ito ay isang serye ng sandali o isang serye ng pagitan (panahon).

Kailan pagitan serye, ang average na antas nito ay tinutukoy ng formula ng isang simpleng arithmetic mean ng mga antas ng serye, i.e.

=
Kung bakante sandali hilera na naglalaman ng n antas ( y1, y2, …, yn) na may pantay na pagitan sa pagitan ng mga petsa (mga punto ng oras), kung gayon ang naturang serye ay madaling ma-convert sa isang serye ng mga average na halaga. Kasabay nito, ang indicator (level) sa simula ng bawat panahon ay sabay-sabay na indicator sa pagtatapos ng nakaraang panahon. Pagkatapos ang average na halaga ng indicator para sa bawat panahon (interval sa pagitan ng mga petsa) ay maaaring kalkulahin bilang kalahating kabuuan ng mga halaga sa sa simula at katapusan ng panahon, i.e. bilang . Ang bilang ng naturang mga average ay magiging . Tulad ng nabanggit kanina, para sa serye ng mga average, ang average na antas ay kinakalkula mula sa arithmetic average.

Samakatuwid, maaari tayong sumulat:
.
Pagkatapos ma-convert ang numerator, nakukuha natin ang:
,

saan Y1 at Yn- ang una at huling mga antas ng serye; Yi- mga intermediate na antas.

Ang average na ito ay kilala sa mga istatistika bilang average na kronolohikal para sa mga serye ng sandali. Natanggap niya ang pangalang ito mula sa salitang "cronos" (oras, lat.), dahil kinakalkula ito mula sa mga tagapagpahiwatig na nagbabago sa paglipas ng panahon.

Sa kaso ng hindi pantay agwat sa pagitan ng mga petsa, ang kronolohikal na average para sa serye ng sandali ay maaaring kalkulahin bilang ang arithmetic average ng mga average na halaga ng mga antas para sa bawat pares ng mga sandali, na natimbang ng mga distansya (mga agwat ng oras) sa pagitan ng mga petsa, i.e.
.
Sa kasong ito ipinapalagay na sa pagitan ng mga petsa ang mga antas ay kinuha sa iba't ibang mga halaga, at kami ay mula sa dalawang kilala ( yi at yi+1) tinutukoy namin ang mga average, kung saan namin kinakalkula ang pangkalahatang average para sa buong nasuri na panahon.
Kung ito ay ipinapalagay na ang bawat halaga yi nananatiling hindi nagbabago hanggang sa susunod (i+ 1)- ang sandali, i.e. ang eksaktong petsa ng pagbabago sa mga antas ay alam, pagkatapos ay ang pagkalkula ay maaaring isagawa gamit ang weighted arithmetic mean formula:
,

kung saan ang oras kung saan ang antas ay nanatiling hindi nagbabago.

Bilang karagdagan sa average na antas sa serye ng mga dinamika, ang iba pang mga average na tagapagpahiwatig ay kinakalkula din - ang average na pagbabago sa mga antas ng serye (pangunahing at chain method), ang average na rate ng pagbabago.

Ang ibig sabihin ng baseline ay ganap na pagbabago ay ang quotient ng huling pangunahing ganap na pagbabago na hinati sa bilang ng mga pagbabago. I.e

Ang kadena ay nangangahulugang ganap na pagbabago Ang mga antas ng isang serye ay ang quotient ng paghahati sa kabuuan ng lahat ng mga ganap na pagbabago sa chain sa bilang ng mga pagbabago, i.e.

Sa pamamagitan ng pag-sign ng average na ganap na mga pagbabago, ang likas na katangian ng pagbabago sa kababalaghan ay hinuhusgahan din sa karaniwan: paglago, pagbaba o katatagan.

Mula sa panuntunan para sa pagkontrol sa mga basic at chain absolute na pagbabago, sinusunod nito na ang pangunahing at chain average na mga pagbabago ay dapat na pantay.

Kasama ang average na ganap na pagbabago, ang average na kamag-anak ay kinakalkula din gamit ang basic at chain method.

Baseline Average na Relatibong Pagbabago ay tinutukoy ng formula:

Ang ibig sabihin ng chain ay relatibong pagbabago ay tinutukoy ng formula:

Naturally, ang mga pangunahing at chain average na kamag-anak na mga pagbabago ay dapat na pareho, at sa pamamagitan ng paghahambing ng mga ito sa criterion value na 1, ang isang konklusyon ay ginawa tungkol sa likas na katangian ng pagbabago sa phenomenon sa karaniwan: paglago, pagbaba o katatagan.
Sa pamamagitan ng pagbabawas ng 1 mula sa base o chain average na relatibong pagbabago, ang katumbas average na rate ng pagbabago, sa pamamagitan ng tanda kung saan maaari ring hatulan ng isa ang likas na pagbabago sa hindi pangkaraniwang bagay na pinag-aaralan, na sinasalamin ng seryeng ito ng dinamika.

Mga pagbabago sa pana-panahon at mga indeks ng seasonality.

Ang mga seasonal fluctuation ay stable intra-annual fluctuation.

Ang pangunahing prinsipyo ng pamamahala upang makuha ang pinakamataas na epekto ay ang pag-maximize ng kita at pagliit ng mga gastos. Sa pamamagitan ng pag-aaral ng mga seasonal fluctuations, ang problema ng maximum equation sa bawat antas ng taon ay nalutas.

Kapag nag-aaral ng mga pana-panahong pagbabagu-bago, dalawang magkakaugnay na gawain ang malulutas:

1. Pagkilala sa mga detalye ng pag-unlad ng kababalaghan sa intra-taunang dinamika;

2. Pagsukat ng mga seasonal na pagbabago-bago sa pagbuo ng isang seasonal wave model;

Ang mga pana-panahong turkey ay karaniwang binibilang upang masukat ang seasonality. Sa pangkalahatang mga termino, ang mga ito ay tinutukoy ng ratio ng orihinal na mga equation ng isang serye ng mga dinamika sa mga teoretikal na equation na nagsisilbing batayan para sa paghahambing.

Dahil ang mga random na paglihis ay nakapatong sa mga pana-panahong pagbabagu-bago, ang mga indeks ng seasonality ay ina-average upang maalis ang mga ito.

Sa kasong ito, para sa bawat panahon ng taunang cycle, ang mga pangkalahatang tagapagpahiwatig ay tinutukoy sa anyo ng mga average na pana-panahong mga indeks:

Ang mga average na indeks ng mga pana-panahong pagbabago ay libre mula sa impluwensya ng mga random na paglihis ng pangunahing trend ng pag-unlad.

Depende sa likas na katangian ng trend, ang formula para sa average na seasonality index ay maaaring magkaroon ng mga sumusunod na anyo:

1.Para sa mga serye ng intra-taunang dinamika na may malinaw na pangunahing trend ng pag-unlad:

2. Para sa serye ng intra-taunang dinamika kung saan walang pataas o pababang trend, o hindi gaanong mahalaga:

Nasaan ang pangkalahatang average;

Mga pamamaraan para sa pagsusuri ng pangunahing kalakaran.

Ang pagbuo ng mga phenomena sa paglipas ng panahon ay naiimpluwensyahan ng mga salik na naiiba sa kalikasan at lakas ng impluwensya. Ang ilan sa kanila ay random sa kalikasan, ang iba ay may halos pare-parehong epekto at bumubuo ng isang tiyak na trend ng pag-unlad sa serye ng mga dinamika.

Ang isang mahalagang gawain ng mga istatistika ay upang tukuyin ang isang trend sa serye ng mga dinamika, napalaya mula sa pagkilos ng iba't ibang mga random na kadahilanan. Para sa layuning ito, ang serye ng oras ay pinoproseso ng mga pamamaraan ng pagpapalaki ng pagitan, moving average at analytical alignment, atbp.

Pamamaraan ng interval coarsening ay batay sa pagpapalaki ng mga yugto ng panahon, na kinabibilangan ng mga antas ng isang serye ng mga dinamika, i.e. ay ang pagpapalit ng data na nauugnay sa maliliit na yugto ng panahon ng data mula sa mas malalaking yugto. Ito ay lalong epektibo kapag ang mga unang antas ng serye ay para sa maikling panahon. Halimbawa, ang mga serye ng mga tagapagpahiwatig na nauugnay sa mga pang-araw-araw na kaganapan ay pinapalitan ng mga serye na nauugnay sa lingguhan, buwanan, atbp. Ito ay mas malinaw na magpapakita "Axis of Development of the Phenomenon". Ang average, na kinakalkula batay sa pinalaki na mga agwat, ay ginagawang posible upang matukoy ang direksyon at karakter (pagpabilis ng paglago o pagbabawas ng bilis) ng pangunahing trend ng pag-unlad.

moving average na paraan katulad ng nauna, ngunit sa kasong ito, ang mga aktwal na antas ay pinapalitan ng mga average na antas na kinakalkula para sa sunud-sunod na paglipat (pag-slide) na pinalaki na mga pagitan na sumasaklaw sa m mga antas ng hilera.

Halimbawa kung tatanggapin m=3, pagkatapos, una, ang average ng unang tatlong antas ng serye ay kinakalkula, pagkatapos - mula sa parehong bilang ng mga antas, ngunit simula sa pangalawa sa isang hilera, pagkatapos - simula sa pangatlo, atbp. Kaya, ang average, bilang ito ay, "slide" kasama ang serye ng mga dinamika, gumagalaw para sa isang panahon. Kinakalkula mula sa m ang mga miyembro ng moving average ay tumutukoy sa gitna (gitna) ng bawat pagitan.

Ang pamamaraang ito ay nag-aalis lamang ng mga random na pagbabago. Kung ang serye ay may pana-panahong alon, pagkatapos ay mananatili ito pagkatapos ng pagpapakinis sa pamamagitan ng moving average na paraan.

Analytical alignment. Upang maalis ang mga random na pagbabagu-bago at matukoy ang isang trend, ang mga antas ng serye ay nakahanay ayon sa analytical formula (o analytical alignment). Ang kakanyahan nito ay upang palitan ang mga empirical (aktwal) na antas ng mga teoretikal, na kinakalkula ayon sa isang tiyak na equation, na kinuha bilang isang modelo ng matematika ng trend, kung saan ang mga antas ng teoretikal ay itinuturing bilang isang function ng oras: . Sa kasong ito, ang bawat aktwal na antas ay itinuturing bilang kabuuan ng dalawang bahagi: , kung saan ay isang sistematikong bahagi at ipinahayag ng isang tiyak na equation, at ito ay isang random na variable na nagdudulot ng mga pagbabago sa paligid ng trend.

Ang gawain ng analytical alignment ay ang mga sumusunod:

1. Pagtukoy sa batayan ng aktwal na data ang uri ng hypothetical function na maaaring pinaka-sapat na sumasalamin sa trend ng pag-unlad ng indicator na pinag-aaralan.

2. Paghahanap ng mga parameter ng tinukoy na function (equation) mula sa empirical data

3. Pagkalkula ayon sa nahanap na equation ng theoretical (leveled) level.

Ang pagpili ng isang partikular na function ay isinasagawa, bilang panuntunan, batay sa isang graphical na representasyon ng empirical data.

Ang mga modelo ay mga equation ng regression, ang mga parameter na kung saan ay kinakalkula sa pamamagitan ng least squares method

Nasa ibaba ang pinakakaraniwang ginagamit na mga equation ng regression para sa pag-level ng serye ng oras, na nagsasaad kung aling mga trend ng pag-unlad ang pinakaangkop para sa pagpapakita.

Upang mahanap ang mga parameter ng mga equation sa itaas, mayroong mga espesyal na algorithm at mga programa sa computer. Sa partikular, upang mahanap ang mga parameter ng equation ng isang tuwid na linya, maaaring gamitin ang sumusunod na algorithm:

Kung ang mga panahon o sandali ng oras ay binibilang upang makuha ang St = 0, kung gayon ang mga algorithm sa itaas ay magiging makabuluhang pinasimple at magiging

Ang mga nakahanay na antas sa chart ay matatagpuan sa isang tuwid na linyang dumadaan sa pinakamalapit na distansya mula sa mga aktwal na antas ng dynamic na seryeng ito. Ang kabuuan ng mga squared deviations ay repleksyon ng impluwensya ng mga random na salik.

Sa tulong nito, kinakalkula namin ang average (standard) na error ng equation:

Narito ang n ay ang bilang ng mga obserbasyon, at ang m ay ang bilang ng mga parameter sa equation (mayroon kaming dalawa sa kanila - b 1 at b 0).

Ipinapakita ng pangunahing trend (trend) kung paano nakakaapekto ang mga sistematikong salik sa mga antas ng serye ng oras, at ang pagbabagu-bago ng mga antas sa paligid ng trend () ay nagsisilbing sukatan ng epekto ng mga natitirang salik.

Upang masuri ang kalidad ng modelo ng serye ng oras na ginamit, ginagamit din ito Fisher's F test. Ito ay ang ratio ng dalawang variances, katulad ng ratio ng variance na dulot ng regression, i.e. pinag-aralan na kadahilanan, sa pagpapakalat na dulot ng mga random na sanhi, i.e. natitirang pagkakaiba:

Sa pinalawak na anyo, ang pormula para sa pamantayang ito ay maaaring katawanin bilang mga sumusunod:

kung saan ang n ay ang bilang ng mga obserbasyon, i.e. bilang ng mga antas ng hilera,

m ay ang bilang ng mga parameter sa equation, y ay ang aktwal na antas ng serye,

Naka-align na antas ng row, - ang average na antas ng row.

Mas matagumpay kaysa sa iba, ang modelo ay maaaring hindi palaging sapat na kasiya-siya. Makikilala lamang ito kung ang criterion F para dito ay lumampas sa isang partikular na kritikal na limitasyon. Ang hangganang ito ay itinakda gamit ang F mga talahanayan ng pamamahagi.

Kakanyahan at pag-uuri ng mga indeks.

Ang isang index sa mga istatistika ay nauunawaan bilang isang kamag-anak na tagapagpahiwatig na nagpapakita ng pagbabago sa laki ng isang kababalaghan sa oras, espasyo, o kung ihahambing sa anumang pamantayan.

Ang pangunahing elemento ng kaugnayan ng index ay ang na-index na halaga. Ang isang naka-index na halaga ay nauunawaan bilang ang halaga ng isang tanda ng isang istatistikal na populasyon, ang pagbabago nito ay ang object ng pag-aaral.

Ang mga index ay nagsisilbi sa tatlong pangunahing layunin:

1) pagtatasa ng mga pagbabago sa isang kumplikadong kababalaghan;

2) pagpapasiya ng impluwensya ng mga indibidwal na kadahilanan sa pagbabago ng isang kumplikadong kababalaghan;

3) paghahambing ng magnitude ng ilang kababalaghan sa magnitude ng nakaraang panahon, ang magnitude ng isa pang teritoryo, pati na rin sa mga pamantayan, plano, pagtataya.

Ang mga indeks ay inuri ayon sa 3 pamantayan:

2) ayon sa antas ng saklaw ng mga elemento ng populasyon;

3) sa pamamagitan ng mga paraan ng pagkalkula ng mga pangkalahatang indeks.

Sa pamamagitan ng nilalaman ng mga na-index na halaga, ang mga indeks ay nahahati sa mga indeks ng quantitative (volumetric) na mga tagapagpahiwatig at mga indeks ng mga tagapagpahiwatig ng husay. Mga indeks ng mga tagapagpahiwatig ng dami - mga indeks ng pisikal na dami ng pang-industriyang produksyon, pisikal na dami ng mga benta, numero, atbp. Mga indeks ng mga tagapagpahiwatig ng husay - mga indeks ng mga presyo, gastos, produktibidad ng paggawa, average na sahod, atbp.

Ayon sa antas ng saklaw ng mga yunit ng populasyon, ang mga indeks ay nahahati sa dalawang klase: indibidwal at pangkalahatan. Upang makilala ang mga ito, ipinakilala namin ang mga sumusunod na kombensiyon na pinagtibay sa pagsasanay ng paglalapat ng paraan ng index:

q- dami (volume) ng anumang produkto sa uri ; R- presyo ng yunit ng produksyon; z- halaga ng yunit ng produksyon; t- oras na ginugol sa paggawa ng isang yunit ng output (labor intensity) ; w- output ng produksyon sa mga tuntunin ng halaga bawat yunit ng oras; v- output sa pisikal na mga tuntunin sa bawat yunit ng oras; T- kabuuang oras na ginugol o bilang ng mga empleyado.

Upang makilala kung aling panahon o bagay ang nabibilang sa mga na-index na halaga, kaugalian na maglagay ng mga subscript pagkatapos ng kaukulang simbolo sa kanang ibaba. Kaya, halimbawa, sa mga index ng dynamics, bilang panuntunan, para sa mga panahon ng paghahambing (kasalukuyan, pag-uulat), ang subscript 1 ay ginagamit at para sa mga panahon kung saan ginawa ang paghahambing,

Indibidwal na mga indeks nagsisilbing katangian ng pagbabago sa mga indibidwal na elemento ng isang kumplikadong kababalaghan (halimbawa, isang pagbabago sa dami ng output ng isang uri ng produkto). Kinakatawan nila ang mga kamag-anak na halaga ng dinamika, katuparan ng mga obligasyon, paghahambing ng mga na-index na halaga.

Natutukoy ang indibidwal na index ng pisikal na dami ng produksyon

Mula sa isang analytical na pananaw, ang ibinigay na indibidwal na mga indeks ng dinamika ay katulad ng mga koepisyent (mga rate) ng paglago at nailalarawan ang pagbabago sa na-index na halaga sa kasalukuyang panahon kumpara sa batayang isa, ibig sabihin, ipakita kung gaano karaming beses itong tumaas (bumaba). ) o kung gaano karaming porsyento ito ay paglago (pagbaba). Ang mga halaga ng index ay ipinahayag sa mga coefficient o porsyento.

Pangkalahatang (composite) index sumasalamin sa pagbabago sa lahat ng elemento ng isang komplikadong phenomenon.

Pinagsama-samang index ay ang pangunahing anyo ng index. Tinatawag itong aggregate dahil ang numerator at denominator nito ay isang set ng "aggregate"

Average na mga indeks, ang kanilang kahulugan.

Bilang karagdagan sa mga pinagsama-samang indeks, ang isa pang anyo ng mga ito ay ginagamit sa mga istatistika - mga average na timbang na indeks. Ang kanilang pagkalkula ay ginagamit kapag ang impormasyong magagamit ay hindi nagpapahintulot sa pagkalkula ng pangkalahatang pinagsama-samang index. Kaya, kung walang data sa mga presyo, ngunit mayroong impormasyon sa halaga ng mga produkto sa kasalukuyang panahon at ang mga indibidwal na indeks ng presyo para sa bawat produkto ay kilala, kung gayon ang pangkalahatang indeks ng presyo ay hindi maaaring matukoy bilang isang pinagsama-samang isa, ngunit posible upang kalkulahin ito bilang isang average ng mga indibidwal. Sa parehong paraan, kung ang mga dami ng mga indibidwal na produkto na ginawa ay hindi alam, ngunit ang mga indibidwal na mga indeks at ang gastos ng produksyon ng batayang panahon ay kilala, kung gayon ang pangkalahatang indeks ng pisikal na dami ng produksyon ay maaaring matukoy bilang isang timbang na average.

Average na index - Ito isang index na kinakalkula bilang isang average ng mga indibidwal na indeks. Ang pinagsama-samang index ay ang pangunahing anyo ng pangkalahatang index, kaya ang average na index ay dapat na magkapareho sa pinagsama-samang index. Kapag kinakalkula ang mga average na indeks, dalawang anyo ng mga average ang ginagamit: arithmetic at harmonic.

Ang arithmetic mean index ay magkapareho sa pinagsama-samang index kung ang mga timbang ng mga indibidwal na indeks ay ang mga termino ng denominator ng pinagsama-samang index. Sa kasong ito lamang ang halaga ng index na kinakalkula ng arithmetic mean formula ay magiging katumbas ng pinagsama-samang index.

Kapag istatistikal na pagsubok ng mga pagpapalagay, kapag sinusukat ang isang linear na relasyon sa pagitan ng mga random na variable.

Karaniwang lihis:

Karaniwang lihis(isang pagtatantya ng standard deviation ng random variable Floor, mga pader sa paligid natin at sa kisame, x kaugnay sa inaasahan sa matematika nito batay sa isang walang pinapanigan na pagtatantya ng pagkakaiba nito):

kung saan - pagkakaiba-iba; - Ang sahig, ang mga dingding sa paligid natin at ang kisame, i-ika sample na elemento; - laki ng sample; - arithmetic mean ng sample:

Dapat tandaan na ang parehong mga pagtatantya ay may kinikilingan. Sa pangkalahatang kaso, imposibleng bumuo ng walang pinapanigan na pagtatantya. Gayunpaman, ang isang pagtatantya batay sa isang walang pinapanigan na pagtatantya ng pagkakaiba ay pare-pareho.

tatlong sigma na panuntunan

tatlong sigma na panuntunan() - halos lahat ng mga halaga ng isang normal na ibinahagi na random na variable ay nasa pagitan. Mas mahigpit - na may hindi bababa sa 99.7% na katiyakan, ang halaga ng isang normal na ibinabahagi na random na variable ay nasa tinukoy na agwat (sa kondisyon na ang halaga ay totoo, at hindi nakuha bilang resulta ng pagpoproseso ng sample).

Kung ang tunay na halaga ay hindi alam, kung gayon hindi mo dapat gamitin, ngunit ang sahig, ang mga dingding sa paligid natin at ang kisame, s. Kaya, ang panuntunan ng tatlong sigma ay isinalin sa panuntunan ng tatlong Palapag, mga pader sa paligid natin at sa kisame, s .

Interpretasyon ng halaga ng standard deviation

Ang isang malaking halaga ng karaniwang paglihis ay nagpapakita ng isang malaking pagkalat ng mga halaga sa ipinakita na hanay na may average na halaga ng hanay; ang isang maliit na halaga, ayon sa pagkakabanggit, ay nagpapahiwatig na ang mga halaga sa hanay ay pinagsama-sama sa average na halaga.

Halimbawa, mayroon kaming tatlong set ng numero: (0, 0, 14, 14), (0, 6, 8, 14) at (6, 6, 8, 8). Ang lahat ng tatlong set ay may mean values ​​na 7 at standard deviations na 7, 5, at 1, ayon sa pagkakabanggit. Ang huling set ay may maliit na standard deviation dahil ang mga value sa set ay clustered sa paligid ng mean; ang unang hanay ay may pinakamalaking halaga ng karaniwang paglihis - ang mga halaga sa loob ng hanay ay malakas na nag-iiba mula sa average na halaga.

Sa pangkalahatang kahulugan, ang karaniwang paglihis ay maaaring ituring na isang sukatan ng kawalan ng katiyakan. Halimbawa, sa physics, ang standard deviation ay ginagamit upang matukoy ang error ng isang serye ng sunud-sunod na mga sukat ng ilang dami. Ang halagang ito ay napakahalaga para sa pagtukoy ng katumpakan ng kababalaghan sa ilalim ng pag-aaral kumpara sa halaga na hinulaang ng teorya: kung ang ibig sabihin ng halaga ng mga sukat ay naiiba nang malaki sa mga halagang hinulaan ng teorya (malaking standard deviation), kung gayon ang ang mga nakuhang halaga o ang paraan ng pagkuha ng mga ito ay dapat suriin muli.

Praktikal na paggamit

Sa pagsasagawa, ang karaniwang paglihis ay nagbibigay-daan sa iyo upang matukoy kung magkano ang mga halaga sa hanay ay maaaring mag-iba mula sa average na halaga.

Klima

Ipagpalagay na mayroong dalawang lungsod na may parehong average na pang-araw-araw na maximum na temperatura, ngunit ang isa ay matatagpuan sa baybayin at ang isa ay nasa loob ng bansa. Ang mga lungsod sa baybayin ay kilala na mayroong maraming iba't ibang pang-araw-araw na pinakamataas na temperatura na mas mababa kaysa sa mga lungsod sa loob ng bansa. Samakatuwid, ang karaniwang paglihis ng maximum na pang-araw-araw na temperatura sa coastal city ay magiging mas mababa kaysa sa pangalawang lungsod, sa kabila ng katotohanan na ang average na halaga ng halagang ito ay pareho para sa kanila, na sa pagsasanay ay nangangahulugan na ang posibilidad na ang maximum na hangin temperatura ng bawat partikular na araw ng taon ay magiging mas malakas na naiiba mula sa average na halaga, mas mataas para sa isang lungsod na matatagpuan sa loob ng kontinente.

palakasan

Ipagpalagay natin na mayroong ilang mga koponan ng football na niraranggo ayon sa ilang hanay ng mga parameter, halimbawa, ang bilang ng mga layunin na naitala at natanggap, mga pagkakataong makapuntos, atbp. Malamang na ang pinakamahusay na koponan sa pangkat na ito ay magkakaroon ng pinakamahusay mga halaga sa higit pang mga parameter. Kung mas maliit ang standard deviation ng team para sa bawat isa sa mga ipinakitang parameter, mas predictable ang resulta ng team, balanse ang mga naturang team. Sa kabilang banda, ang isang koponan na may malaking standard deviation ay mahirap hulaan ang resulta, na kung saan ay ipinaliwanag ng isang kawalan ng timbang, halimbawa, isang malakas na depensa, ngunit isang mahinang pag-atake.

Ang paggamit ng karaniwang paglihis ng mga parameter ng koponan ay nagbibigay-daan sa isa na mahulaan ang resulta ng tugma sa pagitan ng dalawang koponan sa ilang lawak, sinusuri ang mga kalakasan at kahinaan ng mga koponan, at samakatuwid ang mga napiling paraan ng pakikibaka.

Teknikal na pagsusuri

Tingnan din

Panitikan

* Borovikov, V. STATISTICS. Ang sining ng pagtatasa ng data ng computer: Para sa mga propesyonal / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 p. - ISBN 5-272-00078-1.