Ang numerical value ng variation series ay tinatawag. Serye ng pagkakaiba-iba

pagkakaiba-iba tinatawag na serye ng pamamahagi na binuo sa isang quantitative na batayan. Ang mga halaga ng mga quantitative na katangian sa mga indibidwal na yunit ng populasyon ay hindi pare-pareho, higit pa o mas kaunti ay naiiba sa bawat isa.

pagkakaiba-iba- pagbabagu-bago, pagkakaiba-iba ng halaga ng katangian sa mga yunit ng populasyon. Ang hiwalay na mga numerical na halaga ng katangiang nagaganap sa pinag-aralan na populasyon ay tinatawag mga pagpipilian mga halaga. Ang kakulangan ng average na halaga para sa isang kumpletong paglalarawan ng populasyon ay ginagawang kinakailangan upang madagdagan ang average na mga halaga ng mga tagapagpahiwatig na ginagawang posible upang masuri ang tipikal ng mga average na ito sa pamamagitan ng pagsukat ng pagbabagu-bago (variation) ng katangian na pinag-aaralan.

Ang pagkakaroon ng pagkakaiba-iba ay dahil sa impluwensya ng isang malaking bilang ng mga kadahilanan sa pagbuo ng antas ng katangian. Ang mga salik na ito ay kumikilos nang may hindi pantay na puwersa at sa iba't ibang direksyon. Ang mga tagapagpahiwatig ng pagkakaiba-iba ay ginagamit upang ilarawan ang sukatan ng pagkakaiba-iba ng katangian.

Mga gawain ng istatistikal na pag-aaral ng pagkakaiba-iba:

  • 1) ang pag-aaral ng kalikasan at antas ng pagkakaiba-iba ng mga palatandaan sa mga indibidwal na yunit ng populasyon;
  • 2) pagpapasiya ng papel ng mga indibidwal na kadahilanan o kanilang mga grupo sa pagkakaiba-iba ng ilang mga tampok ng populasyon.

Sa mga istatistika, ang mga espesyal na pamamaraan para sa pag-aaral ng pagkakaiba-iba ay ginagamit, batay sa paggamit ng isang sistema ng mga tagapagpahiwatig, kasama kung saan sinusukat ang pagkakaiba-iba.

Ang pag-aaral ng pagkakaiba-iba ay mahalaga. Ang pagsukat ng mga variation ay kinakailangan kapag nagsasagawa ng sample observation, correlation at variance analysis, atbp. Ermolaev O.Yu. Mga istatistika ng matematika para sa mga psychologist: Textbook [Text] / O.Yu. Ermolaev. - M.: Flint Publishing House ng Moscow Psychological and Social Institute, 2012. - 335p.

Ayon sa antas ng pagkakaiba-iba, maaaring hatulan ng isa ang homogeneity ng populasyon, ang katatagan ng mga indibidwal na halaga ng mga tampok at ang tipikal ng average. Sa kanilang batayan, ang mga tagapagpahiwatig ng pagiging malapit ng ugnayan sa pagitan ng mga palatandaan, ang mga tagapagpahiwatig para sa pagtatasa ng katumpakan ng pumipili na pagmamasid ay binuo.

Mayroong pagkakaiba-iba sa espasyo at pagkakaiba-iba sa oras.

Ang pagkakaiba-iba sa espasyo ay nauunawaan bilang ang pagbabagu-bago ng mga halaga ng isang tampok sa mga yunit ng populasyon na kumakatawan sa magkahiwalay na mga teritoryo. Sa ilalim ng pagkakaiba-iba ng oras ay nangangahulugan ng pagbabago sa mga halaga ng katangian sa iba't ibang yugto ng panahon.

Upang pag-aralan ang pagkakaiba-iba sa serye ng pamamahagi, ang lahat ng mga variant ng mga halaga ng katangian ay nakaayos sa pataas o pababang pagkakasunud-sunod. Ang prosesong ito ay tinatawag na series ranking.

Ang pinakasimpleng mga palatandaan ng pagkakaiba-iba ay minimum at maximum- ang pinakamaliit at pinakamalaking halaga ng katangian sa pinagsama-samang. Ang bilang ng mga pag-uulit ng mga indibidwal na variant ng mga halaga ng tampok ay tinatawag na dalas ng pag-uulit (fi). Ito ay maginhawa upang palitan ang mga frequency sa mga frequency - wi. Dalas - isang kamag-anak na tagapagpahiwatig ng dalas, na maaaring ipahayag sa mga praksyon ng isang yunit o isang porsyento at nagbibigay-daan sa iyong paghambingin ang serye ng variation na may ibang bilang ng mga obserbasyon. Ipinahayag ng formula:

kung saan Xmax, Xmin - ang maximum at minimum na mga halaga ng katangian sa pinagsama-samang; n ay ang bilang ng mga pangkat.

Upang sukatin ang pagkakaiba-iba ng isang katangian, ginagamit ang iba't ibang absolute at relative indicator. Ang mga ganap na tagapagpahiwatig ng pagkakaiba-iba ay kinabibilangan ng hanay ng pagkakaiba-iba, ang average na linear na paglihis, pagkakaiba, karaniwang paglihis. Ang mga kamag-anak na tagapagpahiwatig ng pagbabagu-bago ay kinabibilangan ng koepisyent ng oscillation, ang kamag-anak na linear deviation, ang koepisyent ng variation.

Isang halimbawa ng paghahanap ng serye ng variation

Mag-ehersisyo. Para sa sample na ito:

  • a) Maghanap ng serye ng variation;
  • b) Buuin ang function ng pamamahagi;

Hindi.=42. Mga sample na item:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Desisyon.

  • a) pagbuo ng isang ranggo na variational series:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) pagbuo ng isang discrete variational series.

Kalkulahin natin ang bilang ng mga pangkat sa serye ng variation gamit ang formula ng Sturgess:

Kunin natin ang bilang ng mga pangkat na katumbas ng 7.

Alam ang bilang ng mga pangkat, kinakalkula namin ang halaga ng agwat:

Para sa kaginhawaan ng pagbuo ng talahanayan, kukunin namin ang bilang ng mga pangkat na katumbas ng 8, ang pagitan ay magiging 1.

kanin. isa Ang dami ng mga benta ng mga kalakal ng tindahan para sa isang tiyak na tagal ng panahon

Ang paraan ng pagpapangkat ay nagpapahintulot din sa iyo na sukatin pagkakaiba-iba(variability, fluctuation) ng mga palatandaan. Sa medyo maliit na bilang ng mga yunit ng populasyon, ang pagkakaiba-iba ay sinusukat sa batayan ng isang ranggo na serye ng mga yunit na bumubuo sa populasyon. Tinatawag ang hilera niraranggo kung ang mga yunit ay nakaayos sa pataas (pababa) na tampok.

Gayunpaman, ang ranggo na serye ay sa halip ay nagpapahiwatig kapag ang isang paghahambing na katangian ng pagkakaiba-iba ay kinakailangan. Bilang karagdagan, sa maraming mga kaso ang isang tao ay kailangang harapin ang mga istatistikal na pinagsama-samang binubuo ng isang malaking bilang ng mga yunit, na halos mahirap na katawanin sa anyo ng isang tiyak na serye. Sa pagsasaalang-alang na ito, para sa paunang pangkalahatang kakilala sa istatistikal na data at lalo na upang mapadali ang pag-aaral ng pagkakaiba-iba ng mga palatandaan, ang mga pinag-aralan na phenomena at proseso ay karaniwang pinagsama sa mga grupo, at ang mga resulta ng pagpapangkat ay iginuhit sa anyo ng mga talahanayan ng grupo. .

Kung mayroon lamang dalawang hanay sa talahanayan ng pangkat - mga pangkat ayon sa napiling tampok (mga opsyon) at ang bilang ng mga pangkat (mga frequency o frequency), ito ay tinatawag malapit sa pamamahagi.

Saklaw ng pamamahagi - ang pinakasimpleng uri ng structural grouping ayon sa isang attribute, na ipinapakita sa isang group table na may dalawang column na naglalaman ng mga variant at frequency ng attribute. Sa maraming mga kaso, na may tulad na isang structural grouping, i.e. sa pagsasama-sama ng serye ng pamamahagi, ang pag-aaral ng paunang istatistikal na materyal ay nagsisimula.

Ang isang istrukturang pagpapangkat sa anyo ng isang serye ng pamamahagi ay maaaring gawing isang tunay na istrukturang pagpapangkat kung ang mga napiling grupo ay nailalarawan hindi lamang sa pamamagitan ng mga frequency, kundi pati na rin ng iba pang mga istatistikal na tagapagpahiwatig. Ang pangunahing layunin ng serye ng pamamahagi ay pag-aralan ang pagkakaiba-iba ng mga tampok. Ang teorya ng serye ng pamamahagi ay binuo nang detalyado sa pamamagitan ng mga istatistika ng matematika.

Ang serye ng pamamahagi ay nahahati sa katangian(pagpapangkat ayon sa mga katangiang katangian, halimbawa, ang paghahati ng populasyon ayon sa kasarian, nasyonalidad, katayuan sa pag-aasawa, atbp.) at pagkakaiba-iba(pagpapangkat ayon sa dami ng mga katangian).

Serye ng pagkakaiba-iba ay isang talahanayan ng pangkat na naglalaman ng dalawang column: isang pagpapangkat ng mga unit ayon sa isang quantitative attribute at ang bilang ng mga unit sa bawat grupo. Ang mga agwat sa serye ng pagkakaiba-iba ay karaniwang nabuo nang pantay at sarado. Ang serye ng variation ay ang sumusunod na pagpapangkat ng populasyon ng Russia sa mga tuntunin ng average per capita cash income (Talahanayan 3.10).

Talahanayan 3.10

Distribusyon ng populasyon ng Russia sa pamamagitan ng average per capita income noong 2004-2009

Mga pangkat ng populasyon ayon sa average na per capita cash income, rub./month

Populasyon sa pangkat, sa % ng kabuuan

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Higit sa 25,000.0

Lahat ng populasyon

Ang variational series, naman, ay nahahati sa discrete at interval. discrete pinagsasama-sama ng serye ng variation ang mga variant ng mga discrete na feature na nag-iiba-iba sa loob ng makitid na limitasyon. Ang isang halimbawa ng isang discrete variation series ay ang pamamahagi ng mga pamilyang Ruso ayon sa bilang ng mga anak na mayroon sila.

Pagitan pinagsasama-sama ng variational series ang mga variant ng alinman sa tuluy-tuloy na feature o discrete na feature na nagbabago sa malawak na hanay. Ang serye ng pagitan ay ang variational na serye ng pamamahagi ng populasyon ng Russia sa mga tuntunin ng average na per capita cash na kita.

Ang discrete variational series ay hindi masyadong madalas na ginagamit sa pagsasanay. Samantala, ang pag-compile ng mga ito ay hindi mahirap, dahil ang komposisyon ng mga grupo ay tinutukoy ng mga partikular na variant na aktwal na taglay ng mga pinag-aralan na katangian ng pagpapangkat.

Mas laganap ang interval variational series. Sa pag-compile ng mga ito, ang mahirap na tanong ay lumitaw sa bilang ng mga grupo, pati na rin ang laki ng mga agwat na dapat itatag.

Ang mga prinsipyo para sa paglutas ng isyung ito ay itinakda sa kabanata sa pamamaraan para sa pagbuo ng mga istatistikal na pagpapangkat (tingnan ang talata 3.3).

Ang mga serye ng variation ay isang paraan ng pagbagsak o pag-compress ng magkakaibang impormasyon sa isang compact form; magagamit ang mga ito upang gumawa ng medyo malinaw na paghatol tungkol sa likas na katangian ng variation, upang pag-aralan ang mga pagkakaiba sa mga palatandaan ng mga phenomena na kasama sa set na pinag-aaralan. Ngunit ang pinakamahalagang kahalagahan ng variational series ay na sa kanilang batayan ang mga espesyal na generalizing na katangian ng variation ay kinakalkula (tingnan ang Kabanata 7).

Ang konsepto ng isang variation series. Ang unang hakbang sa pag-systematize ng mga materyales ng istatistikal na pagmamasid ay ang pagbibilang ng bilang ng mga yunit na may isa o ibang tampok. Nang maiayos ang mga unit sa pataas o pababang pagkakasunud-sunod ng kanilang quantitative attribute at pagbibilang ng bilang ng mga unit na may partikular na halaga ng attribute, nakakakuha kami ng serye ng variation. Inilalarawan ng serye ng variation ang distribusyon ng mga yunit ng isang partikular na istatistikal na populasyon ayon sa ilang quantitative attribute.

Ang serye ng variation ay binubuo ng dalawang column, ang kaliwang column ay naglalaman ng mga value ng variable na attribute, na tinatawag na mga variant at tinutukoy ng (x), at ang kanang column ay naglalaman ng mga absolute number na nagpapakita kung gaano karaming beses nangyayari ang bawat variant. Ang mga halaga sa hanay na ito ay tinatawag na mga frequency at tinutukoy ng (f).

Sa eskematiko, ang serye ng variation ay maaaring katawanin sa anyo ng Talahanayan 5.1:

Talahanayan 5.1

Uri ng serye ng variation

Mga Pagpipilian (x)

Mga frequency (f)

Sa kanang column, ang mga kamag-anak na tagapagpahiwatig na nagpapakita ng proporsyon ng dalas ng mga indibidwal na variant sa kabuuang dami ng mga frequency ay maaari ding gamitin. Ang mga kamag-anak na tagapagpahiwatig na ito ay tinatawag na mga frequency at karaniwang tinutukoy ng , i.e. . Ang kabuuan ng lahat ng mga frequency ay katumbas ng isa. Ang mga frequency ay maaari ding ipahayag bilang isang porsyento, at pagkatapos ang kanilang kabuuan ay magiging katumbas ng 100%.

Ang mga variable na palatandaan ay maaaring magkaiba. Ang mga variant ng ilang mga palatandaan ay ipinahayag sa mga integer, halimbawa, ang bilang ng mga kuwarto sa isang apartment, ang bilang ng mga nai-publish na libro, atbp. Ang mga palatandaang ito ay tinatawag na discontinuous, o discrete. Ang mga variant ng iba pang mga tampok ay maaaring tumagal sa anumang mga halaga sa loob ng ilang mga limitasyon, tulad ng katuparan ng mga nakaplanong target, sahod, atbp. Ang mga tampok na ito ay tinatawag na tuloy-tuloy.

Discrete variation series. Kung ang mga variant ng variational series ay ipinahayag bilang discrete values, kung gayon ang naturang variational series ay tinatawag na discrete, ang hitsura nito ay ipinakita sa Table. 5.2:

Talahanayan 5.2

Pamamahagi ng mga mag-aaral ayon sa mga markang nakuha sa pagsusulit

Mga rating (x)

Bilang ng mga mag-aaral (f)

Sa % ng kabuuang ()

Ang likas na katangian ng pamamahagi sa discrete series ay inilalarawan nang grapiko bilang isang polygon ng pamamahagi, Fig.5.1.

kanin. 5.1. Pamamahagi ng mga mag-aaral ayon sa mga markang nakuha sa pagsusulit.

Serye ng pagkakaiba-iba ng pagitan. Para sa tuluy-tuloy na mga tampok, ang mga serye ng pagkakaiba-iba ay itinayo bilang serye ng pagitan, i.e. Ang mga halaga ng tampok sa mga ito ay ipinahayag bilang mga pagitan "mula sa at hanggang". Sa kasong ito, ang pinakamababang halaga ng isang feature sa naturang pagitan ay tinatawag na lower limit ng interval, at ang maximum na value ay tinatawag na upper limit ng interval.

Ang interval variational series ay binuo kapwa para sa mga hindi tuluy-tuloy na feature (discrete) at para sa mga iba-iba sa isang malaking hanay. Ang mga interval row ay maaaring may pantay at hindi pantay na pagitan. Sa pang-ekonomiyang kasanayan, para sa karamihan, hindi pantay na pagitan ang ginagamit, unti-unting tumataas o bumababa. Ang ganitong pangangailangan ay lumitaw lalo na sa mga kaso kung saan ang pagbabagu-bago ng pag-sign ay isinasagawa nang hindi pantay at sa loob ng malalaking limitasyon.

Isaalang-alang ang uri ng serye ng pagitan na may pantay na pagitan, Talahanayan. 5.3:

Talahanayan 5.3

Pamamahagi ng mga manggagawa ayon sa output

Output, tr. (X)

Bilang ng mga manggagawa (f)

Pinagsama-samang dalas (f´)

Ang serye ng pamamahagi ng pagitan ay graphic na inilalarawan bilang isang histogram, Fig.5.2.

Fig.5.2. Pamamahagi ng mga manggagawa ayon sa output

Naipon (cumulative) frequency. Sa pagsasagawa, kailangang i-convert ang serye ng pamamahagi sa pinagsama-samang mga hilera, binuo sa naipon na mga frequency. Magagamit ang mga ito para tukuyin ang mga structural average na nagpapadali sa pagsusuri ng data ng serye ng pamamahagi.

Natutukoy ang pinagsama-samang mga frequency sa pamamagitan ng sunud-sunod na pagdaragdag sa mga frequency (o frequency) ng unang pangkat ng mga indicator na ito ng mga kasunod na grupo ng serye ng pamamahagi. Ang mga cumulate at ogive ay ginagamit upang ilarawan ang serye ng pamamahagi. Upang mabuo ang mga ito, ang mga halaga ng isang discrete na tampok (o ang mga dulo ng mga agwat) ay minarkahan sa abscissa axis, at ang lumalaking kabuuan ng mga frequency (cumulate) ay minarkahan sa ordinate axis, Fig.5.3.

kanin. 5.3. Ang pinagsama-samang pamamahagi ng mga manggagawa sa pamamagitan ng pag-unlad

Kung ang mga kaliskis ng mga frequency at variant ay ipinagpapalit, i.e. sumasalamin sa mga naipon na frequency sa abscissa axis, at ang mga halaga ng mga opsyon sa ordinate axis, kung gayon ang curve na nagpapakilala sa pagbabago ng mga frequency mula sa grupo patungo sa grupo ay tatawaging distribution ogive, Fig. 5.4.

kanin. 5.4. Ogiva pamamahagi ng mga manggagawa para sa produksyon

Ang mga serye ng pagkakaiba-iba na may pantay na pagitan ay nagbibigay ng isa sa pinakamahalagang kinakailangan para sa serye ng pamamahagi ng istatistika, na tinitiyak ang kanilang pagiging maihahambing sa oras at espasyo.

Densidad ng pamamahagi. Gayunpaman, ang mga frequency ng mga indibidwal na hindi pantay na pagitan sa mga seryeng ito ay hindi direktang maihahambing. Sa ganitong mga kaso, upang matiyak ang kinakailangang paghahambing, ang density ng pamamahagi ay kinakalkula, i.e. tukuyin kung gaano karaming mga yunit sa bawat pangkat ang bawat yunit ng halaga ng pagitan.

Kapag bumubuo ng isang graph ng pamamahagi ng isang variational series na may hindi pantay na mga agwat, ang taas ng mga parihaba ay tinutukoy sa proporsyon hindi sa mga frequency, ngunit sa mga tagapagpahiwatig ng density ng pamamahagi ng mga halaga ng pinag-aralan na katangian sa kaukulang mga agwat. .

Ang pagsasama-sama ng isang variational series at ang graphical na representasyon nito ay ang unang hakbang sa pagproseso ng paunang data at ang unang hakbang sa pagsusuri ng pinag-aralan na populasyon. Ang susunod na hakbang sa pagsusuri ng variational series ay ang pagpapasiya ng mga pangunahing generalizing indicator, na tinatawag na mga katangian ng serye. Ang mga katangiang ito ay dapat magbigay ng ideya ng average na halaga ng katangian sa mga yunit ng populasyon.

average na halaga. Ang average na halaga ay isang pangkalahatang katangian ng pinag-aralan na katangian sa pinag-aralan na populasyon, na sumasalamin sa karaniwang antas nito sa bawat yunit ng populasyon sa mga partikular na kondisyon ng lugar at oras.

Ang average na halaga ay palaging pinangalanan, ay may parehong dimensyon bilang katangian ng mga indibidwal na yunit ng populasyon.

Bago kalkulahin ang mga average na halaga, kinakailangan na pangkatin ang mga yunit ng pinag-aralan na populasyon, na i-highlight ang mga qualitatively homogenous na mga grupo.

Ang average na kinakalkula para sa populasyon sa kabuuan ay tinatawag na pangkalahatang average, at para sa bawat grupo - mga average ng grupo.

Mayroong dalawang uri ng average: power (aritmetika average, harmonic average, geometric average, root mean quadratic); istruktura (mode, median, quartiles, deciles).

Ang pagpili ng average para sa pagkalkula ay depende sa layunin.

Mga uri ng mga average ng kapangyarihan at mga pamamaraan para sa kanilang pagkalkula. Sa pagsasagawa ng pagpoproseso ng istatistika ng nakolektang materyal, iba't ibang mga problema ang lumitaw, para sa solusyon kung saan kinakailangan ang iba't ibang mga average.

Ang mga istatistika ng matematika ay nakakakuha ng iba't ibang paraan mula sa mga formula ng power mean:

nasaan ang average na halaga; x - mga indibidwal na pagpipilian (mga halaga ng tampok); z - exponent (sa z = 1 - arithmetic mean, z = 0 geometric mean, z = - 1 - harmonic mean, z = 2 - mean quadratic).

Gayunpaman, ang tanong kung anong uri ng average ang dapat ilapat sa bawat indibidwal na kaso ay nireresolba ng isang partikular na pagsusuri ng populasyon na pinag-aaralan.

Ang pinakakaraniwang uri ng average sa mga istatistika ay ibig sabihin ng aritmetika. Kinakalkula ito sa mga kasong iyon kapag ang dami ng na-average na katangian ay nabuo bilang kabuuan ng mga halaga nito para sa mga indibidwal na yunit ng pinag-aralan na istatistikal na populasyon.

Depende sa likas na katangian ng paunang data, ang arithmetic mean ay tinutukoy sa iba't ibang paraan:

Kung ang data ay ungrouped, pagkatapos ay ang pagkalkula ay isinasagawa ayon sa formula ng isang simpleng average na halaga

Pagkalkula ng arithmetic mean sa isang discrete series nangyayari ayon sa formula 3.4.

Pagkalkula ng arithmetic mean sa serye ng pagitan. Sa isang serye ng pagkakaiba-iba ng agwat, kung saan ang gitna ng agwat ay may kondisyong kinukuha bilang halaga ng isang tampok sa bawat pangkat, ang arithmetic mean ay maaaring mag-iba mula sa mean na kinakalkula mula sa hindi nakagrupong data. Bukod dito, mas malaki ang pagitan sa mga pangkat, mas malaki ang posibleng mga paglihis ng average na kinakalkula mula sa nakapangkat na data mula sa average na kinakalkula mula sa hindi nakagrupong data.

Kapag kinakalkula ang average para sa isang serye ng pagkakaiba-iba ng pagitan, upang maisagawa ang mga kinakailangang kalkulasyon, ang isa ay pumasa mula sa mga pagitan patungo sa kanilang mga midpoint. At pagkatapos ay kalkulahin ang average na halaga sa pamamagitan ng formula ng arithmetic weighted average.

Mga katangian ng arithmetic mean. Ang ibig sabihin ng aritmetika ay may ilang mga katangian na nagpapahintulot sa amin na gawing simple ang mga kalkulasyon, isaalang-alang natin ang mga ito.

1. Ang arithmetic mean ng pare-parehong mga numero ay katumbas ng pare-parehong bilang na ito.

Kung x = a. Pagkatapos .

2. Kung ang mga timbang ng lahat ng mga opsyon ay proporsyonal na binago, ibig sabihin. pagtaas o pagbaba ng parehong bilang ng beses, kung gayon ang arithmetic mean ng bagong serye ay hindi magbabago mula rito.

Kung ang lahat ng mga timbang f ay nababawasan ng k beses, kung gayon .

3. Ang kabuuan ng mga positibo at negatibong paglihis ng mga indibidwal na opsyon mula sa average, na pinarami ng mga timbang, ay katumbas ng zero, i.e.

Kung , kung gayon . Mula rito.

Kung ang lahat ng mga opsyon ay nabawasan o nadagdagan ng ilang numero, ang arithmetic mean ng bagong serye ay bababa o tataas ng parehong halaga.

Bawasan ang lahat ng mga pagpipilian x sa a, ibig sabihin. x´ = xa.

Pagkatapos

Ang arithmetic mean ng paunang serye ay maaaring makuha sa pamamagitan ng pagdaragdag sa pinababang mean ng bilang na dati nang ibinawas mula sa mga variant. a, ibig sabihin. .

5. Kung ang lahat ng mga opsyon ay nabawasan o nadagdagan k beses, pagkatapos ay ang arithmetic mean ng bagong serye ay bababa o tataas ng parehong halaga, i.e. sa k minsan.

Hayaan mo na .

Samakatuwid, i.e. upang makuha ang average ng orihinal na serye, ang arithmetic mean ng bagong serye (na may mga pinababang opsyon) ay dapat na tumaas ng k minsan.

Average na harmonic. Ang harmonic mean ay ang reciprocal ng arithmetic mean. Ito ay ginagamit kapag ang istatistikal na impormasyon ay hindi naglalaman ng mga frequency para sa indibidwal na mga opsyon sa populasyon, ngunit ipinakita bilang kanilang produkto (M = xf). Ang harmonic mean ay kakalkulahin gamit ang formula 3.5

Ang praktikal na aplikasyon ng harmonic mean ay upang kalkulahin ang ilang mga indeks, sa partikular, ang index ng presyo.

Geometric ibig sabihin. Kapag ginagamit ang geometric mean, ang mga indibidwal na halaga ng katangian ay, bilang panuntunan, mga kamag-anak na halaga ng dinamika, na binuo sa anyo ng mga halaga ng chain, bilang isang ratio sa nakaraang antas ng bawat antas sa serye ng dinamika . Ang average sa gayon ay nagpapakilala sa average na rate ng paglago.

Ginagamit din ang geometric mean upang matukoy ang katumbas na halaga mula sa pinakamataas at pinakamababang halaga ng katangian. Halimbawa, ang isang kompanya ng seguro ay pumasok sa mga kontrata para sa pagkakaloob ng mga serbisyo ng seguro sa sasakyan. Depende sa partikular na nakasegurong kaganapan, ang bayad sa insurance ay maaaring mag-iba mula 10,000 hanggang 100,000 dolyar bawat taon. Ang average na pagbabayad ng insurance ay US$.

Ang geometric mean ay ang halaga na ginamit bilang average ng mga ratio o sa serye ng pamamahagi, na ipinakita bilang isang geometric na pag-unlad, kapag z = 0. Ang average na ito ay maginhawang gamitin kapag ang pansin ay binabayaran hindi sa ganap na mga pagkakaiba, ngunit sa mga ratio ng dalawang numero.

Ang mga formula para sa pagkalkula ay ang mga sumusunod

kung saan ang mga variant ng na-average na tampok; - ang produkto ng mga pagpipilian; f– dalas ng mga pagpipilian.

Ang geometric na ibig sabihin ay ginagamit sa pagkalkula ng average na taunang mga rate ng paglago.

Mean square. Ang root mean square formula ay ginagamit upang sukatin ang antas ng pagbabagu-bago ng mga indibidwal na halaga ng isang katangian sa paligid ng arithmetic mean sa serye ng pamamahagi. Kaya, kapag kinakalkula ang mga tagapagpahiwatig ng pagkakaiba-iba, ang average ay kinakalkula mula sa mga parisukat ng mga paglihis ng mga indibidwal na halaga ng katangian mula sa arithmetic mean.

Ang ibig sabihin ng square value ay kinakalkula ng formula

Sa pananaliksik sa ekonomiya, ang binagong anyo ng root mean square ay malawakang ginagamit sa pagkalkula ng mga tagapagpahiwatig ng pagkakaiba-iba ng isang katangian, tulad ng pagkakaiba-iba, karaniwang paglihis.

Pamumuno ng karamihan. Mayroong sumusunod na ugnayan sa pagitan ng mga average ng batas ng kapangyarihan - kung mas malaki ang exponent, mas malaki ang halaga ng average, Talahanayan 5.4:

Talahanayan 5.4

Relasyon sa pagitan ng mga average

z halaga

Ang ratio sa pagitan ng mga average

Ang ugnayang ito ay tinatawag na rule of majorance.

Mga katamtamang istruktura. Upang makilala ang istraktura ng populasyon, ginagamit ang mga espesyal na tagapagpahiwatig, na maaaring tawaging mga average na istruktura. Kasama sa mga panukalang ito ang mode, median, quartile, at deciles.

Fashion. Ang Mode (Mo) ay ang pinakamadalas na nagaganap na value ng isang feature sa mga unit ng populasyon. Ang mode ay ang halaga ng attribute na tumutugma sa pinakamataas na punto ng theoretical distribution curve.

Ang fashion ay malawakang ginagamit sa komersyal na kasanayan sa pag-aaral ng demand ng consumer (kapag tinutukoy ang mga sukat ng mga damit at sapatos na may malaking demand), pagpaparehistro ng presyo. Maaaring may ilang mod sa kabuuan.

Pagkalkula ng mode sa isang discrete na serye. Sa isang discrete series, ang mode ay ang variant na may pinakamataas na frequency. Pag-isipang maghanap ng mode sa isang discrete na serye.

Pagkalkula ng fashion sa isang serye ng pagitan. Sa serye ng pagkakaiba-iba ng pagitan, ang gitnang variant ng modal interval ay tinatayang itinuturing na isang mode, ibig sabihin. ang pagitan na may pinakamataas na dalas (frequency). Sa loob ng agwat, kinakailangan upang mahanap ang halaga ng katangian, na kung saan ay ang mode. Para sa isang serye ng pagitan, ang mode ay tutukuyin ng formula

kung saan ang mas mababang limitasyon ng modal interval; ay ang halaga ng modal interval; ay ang dalas na naaayon sa modal interval; ay ang dalas bago ang modal interval; ay ang dalas ng agwat kasunod ng modal.

Median. Ang median () ay ang value ng feature sa gitnang unit ng ranggo na serye. Ang isang ranggo na serye ay isang serye kung saan ang mga katangiang halaga ay nakasulat sa pataas o pababang pagkakasunud-sunod. O ang median ay isang value na naghahati sa bilang ng isang ordered variational series sa dalawang pantay na bahagi: ang isang bahagi ay may value ng variable na feature na mas mababa sa average na variant, at ang isa ay malaki.

Upang mahanap ang median, ang serial number nito ay unang tinutukoy. Upang gawin ito, na may isang kakaibang bilang ng mga yunit, ang isa ay idinagdag sa kabuuan ng lahat ng mga frequency at ang lahat ay nahahati sa dalawa. Sa pantay na bilang ng mga unit, ang median ay makikita bilang ang halaga ng katangian ng unit, ang serial number nito ay tinutukoy ng kabuuang kabuuan ng mga frequency na hinati sa dalawa. Alam ang ordinal na numero ng median, madaling mahanap ang halaga nito mula sa mga naipon na frequency.

Pagkalkula ng median sa isang discrete series. Ayon sa sample na survey, nakuha ang data sa distribusyon ng mga pamilya ayon sa bilang ng mga bata, Table. 5.5. Upang matukoy ang median, tukuyin muna ang ordinal na numero nito

Sa mga pamilyang ito, ang bilang ng mga bata ay 2, samakatuwid, = 2. Kaya, sa 50% ng mga pamilya, ang bilang ng mga bata ay hindi lalampas sa 2.

–naipon na dalas bago ang median na pagitan;

Sa isang banda, ito ay isang napakapositibong pag-aari. sa kasong ito, ang epekto ng lahat ng sanhi na nakakaapekto sa lahat ng yunit ng populasyon na pinag-aaralan ay isinasaalang-alang. Sa kabilang banda, kahit na ang isang obserbasyon na hindi sinasadyang kasama sa paunang data ay maaaring makabuluhang baluktot ang ideya ng antas ng pag-unlad ng pinag-aralan na katangian sa populasyon na isinasaalang-alang (lalo na sa maikling serye).

Quartiles at deciles. Sa pamamagitan ng pagkakatulad sa paghahanap ng median sa variational series, mahahanap ng isa ang halaga ng isang feature sa alinmang ranggo na unit ng serye sa pagkakasunud-sunod. Kaya, sa partikular, mahahanap ng isa ang halaga ng isang tampok para sa mga yunit na naghahati sa serye sa 4 na pantay na bahagi, sa 10, atbp.

Quartiles. Ang mga variant na naghahati sa ranggo na serye sa apat na pantay na bahagi ay tinatawag na quartile.

Kasabay nito, ang mga sumusunod ay nakikilala: ang mas mababang (o una) quartile (Q1) - ang halaga ng tampok ng yunit ng ranggo na serye, na naghahati sa populasyon sa ratio na ¼ hanggang ¾ at ang itaas (o pangatlo. ) quartile (Q3) - ang halaga ng feature ng unit ng ranggo na serye, na hinahati ang populasyon sa ratio na ¾ hanggang ¼.

– mga frequency ng quartile interval (ibaba at itaas)

Ang mga pagitan na naglalaman ng Q1 at Q3 ay tinutukoy mula sa mga naipon na frequency (o mga frequency).

Deciles. Bilang karagdagan sa mga quartile, ang mga decile ay kinakalkula - mga opsyon na naghahati sa ranggo na serye sa 10 pantay na bahagi.

Ang mga ito ay tinutukoy ng D, ang unang decile D1 ay naghahati sa serye sa ratio na 1/10 at 9/10, ang pangalawang D2 - 2/10 at 8/10, atbp. Kinakalkula ang mga ito sa parehong paraan tulad ng median at quartiles.

Parehong nabibilang ang median, at quartile, at deciles sa tinatawag na ordinal statistics, na nauunawaan bilang isang variant na sumasakop sa isang partikular na ordinal na lugar sa isang ranggo na serye.

Ang mga hilera na binuo ayon sa dami, ay tinatawag pagkakaiba-iba.

Ang serye ng pamamahagi ay binubuo ng mga pagpipilian(characteristic values) at mga frequency(bilang ng mga pangkat). Ang mga frequency na ipinahayag bilang mga kamag-anak na halaga (mga pagbabahagi, mga porsyento) ay tinatawag mga frequency. Ang kabuuan ng lahat ng mga frequency ay tinatawag na dami ng serye ng pamamahagi.

Ayon sa uri, ang serye ng pamamahagi ay nahahati sa discrete(binuo sa mga hindi tuluy-tuloy na halaga ng tampok) at pagitan(itinayo sa tuluy-tuloy na mga halaga ng tampok).

Serye ng pagkakaiba-iba kumakatawan sa dalawang hanay (o mga hilera); ang isa ay naglalaman ng mga indibidwal na halaga ng variable na katangian, na tinatawag na mga variant at tinutukoy ng X; at sa iba pa - ganap na mga numero na nagpapakita kung gaano karaming beses (gaano kadalas) nangyayari ang bawat opsyon. Ang mga tagapagpahiwatig ng ikalawang hanay ay tinatawag na mga frequency at conventionally ay tinutukoy ng f. Muli, tandaan namin na sa pangalawang hanay, ang mga kamag-anak na tagapagpahiwatig na nagpapakilala sa proporsyon ng dalas ng mga indibidwal na variant sa kabuuang dami ng mga frequency ay maaari ding gamitin. Ang mga kamag-anak na tagapagpahiwatig na ito ay tinatawag na mga frequency at karaniwang tinutukoy ng ω Ang kabuuan ng lahat ng mga frequency sa kasong ito ay katumbas ng isa. Gayunpaman, ang mga frequency ay maaari ding ipahayag bilang isang porsyento, at pagkatapos ay ang kabuuan ng lahat ng mga frequency ay nagbibigay ng 100%.

Kung ang mga variant ng variational series ay ipinahayag bilang discrete value, kung gayon ang naturang variational series ay tinatawag na discrete.

Para sa tuluy-tuloy na mga tampok, ang mga serye ng pagkakaiba-iba ay itinayo bilang pagitan, iyon ay, ang mga halaga ng katangian sa kanila ay ipinahayag "mula sa ... hanggang ...". Sa kasong ito, ang pinakamababang halaga ng katangian sa naturang pagitan ay tinatawag na mas mababang limitasyon ng agwat, at ang maximum - ang pinakamataas na limitasyon.

Ang interval variational series ay binuo din para sa mga discrete na feature na nag-iiba-iba sa malawak na hanay. Ang serye ng pagitan ay maaaring pantay at hindi pantay mga pagitan.

Isaalang-alang kung paano natutukoy ang halaga ng pantay na pagitan. Ipakilala natin ang sumusunod na notasyon:

i- halaga ng pagitan;

- ang pinakamataas na halaga ng katangian para sa mga yunit ng populasyon;

- ang pinakamababang halaga ng katangian para sa mga yunit ng populasyon;

n- ang bilang ng mga inilaan na pangkat.

kung kilala ang n.

Kung ang bilang ng mga inilalaang grupo ay mahirap matukoy nang maaga, kung gayon ang pormula na iminungkahi ni Sturgess noong 1926 ay maaaring irekomenda upang kalkulahin ang pinakamainam na laki ng agwat na may sapat na laki ng populasyon:

n = 1+ 3.322 log N, kung saan ang N ay ang bilang ng mga nasa populasyon.

Ang halaga ng hindi pantay na mga agwat ay tinutukoy sa bawat indibidwal na kaso, na isinasaalang-alang ang mga katangian ng bagay ng pag-aaral.

Ang istatistikal na pamamahagi ng sample tawagan ang listahan ng mga opsyon at ang kanilang kaukulang frequency (o relative frequency).

Ang istatistikal na pamamahagi ng sample ay maaaring tukuyin sa anyo ng isang talahanayan, sa unang hanay kung saan mayroong mga pagpipilian, at sa pangalawa - ang mga frequency na naaayon sa mga pagpipiliang ito. ni, o mga relatibong frequency Pi .

Statistical distribution ng sample

Ang mga serye ng pagkakaiba-iba ay tinatawag na serye ng pagitan, kung saan ang mga halaga ng mga tampok na pinagbabatayan ng kanilang pagbuo ay ipinahayag sa loob ng ilang mga limitasyon (mga agwat). Ang mga frequency sa kasong ito ay hindi tumutukoy sa mga indibidwal na halaga ng katangian, ngunit sa buong agwat.

Binubuo ang serye ng pamamahagi ng pagitan ayon sa tuluy-tuloy na dami ng mga katangian, gayundin ayon sa mga discrete na katangian, na nag-iiba-iba sa loob ng makabuluhang saklaw.

Ang serye ng pagitan ay maaaring katawanin ng istatistikal na pamamahagi ng sample, na nagpapahiwatig ng mga agwat at ang kanilang mga kaukulang frequency. Sa kasong ito, ang kabuuan ng mga frequency ng variant na nahulog sa agwat na ito ay kinukuha bilang dalas ng agwat.

Kapag pinapangkat ayon sa dami ng tuluy-tuloy na mga tampok, mahalagang matukoy ang laki ng agwat.

Bilang karagdagan sa sample mean at sample variance, ginagamit din ang iba pang mga katangian ng serye ng variation.

Fashion pangalanan ang variant na may pinakamataas na frequency.

Bilang resulta ng pagkabisado ng kabanatang ito, ang mag-aaral ay dapat: alam

  • mga tagapagpahiwatig ng pagkakaiba-iba at ang kanilang relasyon;
  • mga pangunahing batas ng pamamahagi ng mga tampok;
  • ang kakanyahan ng pamantayan ng pagpayag; magagawang
  • kalkulahin ang mga rate ng variation at goodness of fit;
  • matukoy ang mga katangian ng mga pamamahagi;
  • suriin ang mga pangunahing katangian ng numero ng serye ng pamamahagi ng istatistika;

sariling

  • mga pamamaraan ng istatistikal na pagsusuri ng serye ng pamamahagi;
  • mga pangunahing kaalaman sa pagsusuri ng pagpapakalat;
  • mga pamamaraan para sa pagsuri sa mga serye ng pamamahagi ng istatistika para sa pagsunod sa mga pangunahing batas ng pamamahagi.

Mga tagapagpahiwatig ng pagkakaiba-iba

Sa istatistikal na pag-aaral ng mga katangian ng iba't ibang istatistikal na populasyon, malaking interes na pag-aralan ang pagkakaiba-iba ng katangian ng mga indibidwal na istatistikal na yunit ng populasyon, gayundin ang likas na katangian ng pamamahagi ng mga yunit ayon sa tampok na ito. pagkakaiba-iba - ito ang mga pagkakaiba sa mga indibidwal na halaga ng katangian sa mga yunit ng pinag-aralan na populasyon. Ang pag-aaral ng pagkakaiba-iba ay may malaking praktikal na kahalagahan. Sa antas ng pagkakaiba-iba, maaaring hatulan ng isa ang mga hangganan ng pagkakaiba-iba ng katangian, ang homogeneity ng populasyon para sa katangiang ito, ang tipikal ng average, ang relasyon ng mga salik na tumutukoy sa pagkakaiba-iba. Ang mga tagapagpahiwatig ng pagkakaiba-iba ay ginagamit upang makilala at mag-order ng mga istatistikal na populasyon.

Ang mga resulta ng buod at pagpapangkat ng mga materyales sa pagmamasid sa istatistika, na iginuhit sa anyo ng serye ng pamamahagi ng istatistika, ay kumakatawan sa isang nakaayos na pamamahagi ng mga yunit ng pinag-aralan na populasyon sa mga pangkat ayon sa isang pagpapangkat (variable) na katangian. Kung ang isang husay na katangian ay kinuha bilang batayan para sa pagpapangkat, kung gayon ang naturang serye ng pamamahagi ay tinatawag katangian(pamamahagi ayon sa propesyon, kasarian, kulay, atbp.). Kung ang serye ng pamamahagi ay binuo sa isang dami na batayan, kung gayon ang naturang serye ay tinatawag pagkakaiba-iba(pamamahagi ayon sa taas, timbang, sahod, atbp.). Ang pagbuo ng isang serye ng pagkakaiba-iba ay nangangahulugan ng pag-order ng dami ng pamamahagi ng mga yunit ng populasyon ayon sa mga katangiang halaga, upang mabilang ang bilang ng mga yunit ng populasyon na may mga halagang ito (dalas), upang ayusin ang mga resulta sa isang talahanayan.

Sa halip na dalas ng isang variant, posibleng gamitin ang ratio nito sa kabuuang dami ng mga obserbasyon, na tinatawag na frequency (relative frequency).

Mayroong dalawang uri ng serye ng variation: discrete at interval. Discrete na serye- ito ay tulad ng isang variational na serye, ang pagbuo nito ay batay sa mga palatandaan na may isang hindi tuloy-tuloy na pagbabago (discrete sign). Kasama sa huli ang bilang ng mga empleyado sa negosyo, ang kategorya ng sahod, ang bilang ng mga anak sa pamilya, atbp. Ang discrete variational series ay isang table na binubuo ng dalawang column. Ang unang column ay nagpapahiwatig ng partikular na halaga ng katangian, at ang pangalawa - ang bilang ng mga yunit ng populasyon na may partikular na halaga ng katangian. Kung ang isang palatandaan ay may tuluy-tuloy na pagbabago (ang halaga ng kita, karanasan sa trabaho, ang halaga ng mga nakapirming asset ng isang negosyo, atbp., na, sa loob ng ilang mga limitasyon, ay maaaring tumagal ng anumang mga halaga), kung gayon para sa sign na ito posible na bumuo serye ng pagkakaiba-iba ng pagitan. Ang talahanayan kapag gumagawa ng serye ng pagkakaiba-iba ng pagitan ay mayroon ding dalawang column. Ang una ay nagpapahiwatig ng halaga ng tampok sa pagitan ng "mula - hanggang" (mga opsyon), ang pangalawa - ang bilang ng mga yunit na kasama sa pagitan (dalas). Dalas (dalas ng pag-uulit) - ang bilang ng mga pag-uulit ng isang partikular na variant ng mga halaga ng katangian. Maaaring sarado at bukas ang mga agwat. Ang mga saradong agwat ay limitado sa magkabilang panig, i.e. may hangganan na parehong mas mababa (“mula”) at itaas (“sa”). Ang mga bukas na pagitan ay may anumang isang hangganan: alinman sa itaas o mas mababa. Kung ang mga pagpipilian ay nakaayos sa pataas o pababang pagkakasunud-sunod, kung gayon ang mga hilera ay tinatawag niraranggo.

Para sa variational series, mayroong dalawang uri ng frequency response options: cumulative frequency at cumulative frequency. Ipinapakita ng pinagsama-samang dalas kung gaano karaming mga obserbasyon ang kinuha ng halaga ng tampok sa mga halaga na mas mababa kaysa sa tinukoy na halaga. Ang pinagsama-samang dalas ay natutukoy sa pamamagitan ng pagbubuod ng mga halaga ng katangian ng dalas para sa isang partikular na grupo kasama ang lahat ng mga frequency ng mga nakaraang grupo. Ang naipon na dalas ay nagpapakilala sa proporsyon ng mga yunit ng pagmamasid kung saan ang mga halaga ng tampok ay hindi lalampas sa itaas na limitasyon ng pangkat ng araw. Kaya, ang naipon na dalas ay nagpapakita ng partikular na timbang ng variant sa pinagsama-samang, na may halagang hindi mas malaki kaysa sa ibinigay. Ang dalas, dalas, ganap at kamag-anak na densidad, pinagsama-samang dalas at dalas ay mga katangian ng magnitude ng variant.

Ang mga pagkakaiba-iba sa tanda ng mga yunit ng istatistika ng populasyon, pati na rin ang likas na katangian ng pamamahagi, ay pinag-aralan gamit ang mga tagapagpahiwatig at katangian ng serye ng pagkakaiba-iba, na kinabibilangan ng average na antas ng serye, ang average na linear deviation, ang standard deviation, dispersion , oscillation coefficients, variation, asymmetry, kurtosis, atbp.

Ang mga average na halaga ay ginagamit upang makilala ang sentro ng pamamahagi. Ang average ay isang pangkalahatang istatistikal na katangian, kung saan ang karaniwang antas ng isang katangian na taglay ng mga miyembro ng pinag-aralan na populasyon ay binibilang. Gayunpaman, maaaring may mga kaso kung saan ang ibig sabihin ng aritmetika ay nag-tutugma sa ibang uri ng pamamahagi, samakatuwid, bilang mga istatistikal na katangian ng serye ng pagkakaiba-iba, ang tinatawag na mga istrukturang average ay kinakalkula - mode, median, pati na rin ang mga dami na naghahati sa pamamahagi. serye sa pantay na bahagi (quartiles, decile, percentiles, atbp.). ).

Fashion - ito ang value ng feature na mas madalas na nangyayari sa distribution series kaysa sa iba pang value nito. Para sa discrete series, ito ang variant na may pinakamataas na frequency. Sa pagitan ng variational series, upang matukoy ang mode, ito ay kinakailangan una sa lahat upang matukoy ang agwat kung saan ito matatagpuan, ang tinatawag na modal interval. Sa isang variational series na may pantay na pagitan, ang modal interval ay tinutukoy ng pinakamataas na dalas, sa serye na may hindi pantay na pagitan - ngunit sa pamamagitan ng pinakamataas na density ng pamamahagi. Pagkatapos, upang matukoy ang mode sa mga hilera na may pantay na pagitan, ilapat ang formula

kung saan ang Mo ay ang halaga ng fashion; x Mo - ang mas mababang limitasyon ng modal interval; h- lapad ng agwat ng modal; / Mo - dalas ng pagitan ng modal; / Mo j - dalas ng pagitan ng pre-modal; Ang / Mo+1 ay ang dalas ng pagitan ng post-modal, at para sa isang serye na may hindi pantay na pagitan sa formula ng pagkalkula na ito, sa halip na mga frequency / Mo, / Mo, / Mo, dapat gamitin ang mga density ng pamamahagi. Isip 0 _| , Isip 0> UMO+"

Kung mayroong isang solong mode, ang probability distribution ng random variable ay tinatawag na unimodal; kung mayroong higit sa isang mode, ito ay tinatawag na multimodal (polymodal, multimodal), sa kaso ng dalawang mga mode - bimodal. Bilang isang tuntunin, ang multimodality ay nagpapahiwatig na ang pamamahagi sa ilalim ng pag-aaral ay hindi sumusunod sa normal na batas sa pamamahagi. Ang mga homogenous na populasyon, bilang isang panuntunan, ay nailalarawan sa pamamagitan ng mga unimodal na pamamahagi. Ipinapahiwatig din ng Multivertex ang heterogeneity ng pinag-aralan na populasyon. Ang hitsura ng dalawa o higit pang mga vertices ay ginagawang kinakailangan upang muling pagpangkatin ang data upang ihiwalay ang mas magkakatulad na mga grupo.

Sa isang serye ng pagkakaiba-iba ng pagitan, ang mode ay maaaring matukoy nang grapiko gamit ang isang histogram. Upang gawin ito, dalawang intersecting na linya ang iginuhit mula sa mga tuktok na punto ng pinakamataas na column ng histogram hanggang sa mga tuktok na punto ng dalawang magkatabing column. Pagkatapos, mula sa punto ng kanilang intersection, ang isang patayo ay ibinaba sa abscissa axis. Ang halaga ng tampok sa abscissa na naaayon sa patayo ay ang mode. Sa maraming mga kaso, kapag tinutukoy ang populasyon bilang isang pangkalahatang tagapagpahiwatig, ang kagustuhan ay ibinibigay sa mode, sa halip na ang ibig sabihin ng aritmetika.

Median - ito ang sentral na halaga ng feature; ito ay nagmamay-ari ng sentral na miyembro ng ranggo na serye ng pamamahagi. Sa discrete series, para mahanap ang value ng median, ang serial number nito ay unang tinutukoy. Upang gawin ito, na may isang kakaibang bilang ng mga yunit, ang isa ay idinagdag sa kabuuan ng lahat ng mga frequency, ang bilang ay hinati sa dalawa. Kung mayroong pantay na bilang ng 1, magkakaroon ng 2 median 1 sa serye, kaya sa kasong ito ang median ay tinukoy bilang ang average ng mga halaga ng 2 median 1s. Kaya, ang median sa isang discrete variation series ay ang value na naghahati sa serye sa dalawang bahagi na naglalaman ng parehong bilang ng mga opsyon.

Sa serye ng pagitan, pagkatapos matukoy ang ordinal na numero ng median, ang median na pagitan ay matatagpuan ng mga naipon na frequency (mga frequency), at pagkatapos, gamit ang formula para sa pagkalkula ng median, ang halaga ng median mismo ay tinutukoy:

kung saan Ako ang halaga ng median; x Ako - ang mas mababang limitasyon ng median interval; h- median na lapad ng pagitan; - ang kabuuan ng mga frequency ng serye ng pamamahagi; /D - ang naipon na dalas ng pre-median interval; / Me - ang dalas ng median interval.

Ang median ay makikita sa graphic na paraan gamit ang cumulate. Upang gawin ito, sa sukat ng mga naipon na frequency (mga frequency) ng pinagsama-samang, mula sa punto na tumutugma sa ordinal na numero ng median, isang tuwid na linya ay iguguhit parallel sa abscissa axis hanggang sa ito ay intersects sa cumulate. Dagdag pa, mula sa punto ng intersection ng ipinahiwatig na tuwid na linya na may pinagsama-samang, isang patayo ay ibinaba sa abscissa axis. Ang halaga ng tampok sa x-axis na tumutugma sa iginuhit na ordinate (perpendicular) ay ang median.

Ang median ay nailalarawan sa pamamagitan ng mga sumusunod na katangian.

  • 1. Hindi ito nakadepende sa mga attribute value na iyon na matatagpuan sa magkabilang panig nito.
  • 2. Ito ay may pag-aari ng minimality, na nangangahulugan na ang kabuuan ng ganap na mga paglihis ng mga halaga ng katangian mula sa median ay ang pinakamababang halaga kumpara sa paglihis ng mga halaga ng katangian mula sa anumang iba pang halaga.
  • 3. Kapag pinagsasama ang dalawang distribusyon sa mga kilalang median, imposibleng mahulaan nang maaga ang median na halaga ng bagong distribusyon.

Ang mga katangian ng median ay malawakang ginagamit sa pagdidisenyo ng lokasyon ng mga mass service point - mga paaralan, klinika, mga istasyon ng gas, mga bomba ng tubig, atbp. Halimbawa, kung ito ay binalak na magtayo ng isang polyclinic sa isang tiyak na quarter ng lungsod, kung gayon ito ay mas kapaki-pakinabang na hanapin ito sa isang punto sa quarter na hindi hinahati ang haba ng quarter, ngunit ang bilang ng mga naninirahan.

Ang ratio ng mode, median at arithmetic mean ay nagpapahiwatig ng likas na katangian ng pamamahagi ng katangian sa pinagsama-samang, ay nagbibigay-daan sa iyo upang suriin ang simetrya ng pamamahagi. Kung ang x Ako pagkatapos ay may kanang-kamay na kawalaan ng simetrya ng serye. Sa normal na pamamahagi X - Ako - Mo.

K. Pearson, batay sa pagkakahanay ng iba't ibang uri ng mga kurba, natukoy na para sa katamtamang asymmetric na mga distribusyon, ang mga sumusunod na tinatayang relasyon sa pagitan ng arithmetic mean, median at mode ay wasto:

kung saan Ako ang halaga ng median; Mo - halaga ng fashion; x arithm - ang halaga ng arithmetic mean.

Kung may pangangailangan na pag-aralan ang istraktura ng serye ng pagkakaiba-iba nang mas detalyado, kung gayon ang mga halaga ng katangian ay kinakalkula, katulad ng median. Ang ganitong mga halaga ng tampok ay naghahati sa lahat ng mga yunit ng pamamahagi sa pantay na mga numero, ang mga ito ay tinatawag na quantiles o gradients. Ang mga quantiles ay nahahati sa mga quartile, deciles, percentiles, atbp.

Hinahati ng Quartiles ang populasyon sa apat na pantay na bahagi. Ang unang quartile ay kinakalkula nang katulad sa median gamit ang formula para sa pagkalkula ng unang quartile, na dati nang natukoy ang unang quarterly interval:

kung saan ang Qi ay ang halaga ng unang quartile; xQ^- ang mas mababang limitasyon ng unang quartile interval; h- lapad ng unang quarterly interval; /, - mga frequency ng serye ng pagitan;

Naipon na dalas sa pagitan bago ang unang quartile interval; Jq ( - dalas ng unang quartile interval.

Ang unang quartile ay nagpapakita na 25% ng mga yunit ng populasyon ay mas mababa kaysa sa halaga nito, at 75% ay higit pa. Ang pangalawang quartile ay katumbas ng median, i.e. Q2 = ako.

Sa pamamagitan ng pagkakatulad, ang ikatlong quartile ay kinakalkula, na dati nang natagpuan ang ikatlong quarterly interval:

kung saan ang mas mababang limitasyon ng ikatlong quartile interval; h- lapad ng ikatlong quartile interval; /, - mga frequency ng serye ng pagitan; /X"- naipon na dalas sa pagitan ng nauna

G

ikatlong quartile interval; Jq - dalas ng ikatlong quartile interval.

Ang ikatlong quartile ay nagpapakita na 75% ng mga yunit ng populasyon ay mas mababa kaysa sa halaga nito, at 25% ay higit pa.

Ang pagkakaiba sa pagitan ng ikatlo at unang quartile ay ang interquartile interval:

kung saan ang Aq ay ang halaga ng interquartile interval; Q 3 - ang halaga ng ikatlong quartile; Q, - ang halaga ng unang quartile.

Hinahati ng mga desiles ang populasyon sa 10 pantay na bahagi. Ang decile ay isang halaga ng isang tampok sa isang serye ng pamamahagi na tumutugma sa ikasampu ng populasyon. Sa pamamagitan ng pagkakatulad sa mga quartile, ang unang decile ay nagpapakita na 10% ng mga yunit ng populasyon ay mas mababa kaysa sa halaga nito, at 90% ay higit pa, at ang ikasiyam na decile ay nagpapakita na ang 90% ng mga yunit ng populasyon ay mas mababa kaysa sa halaga nito, at 10% ay higit pa. Ang ratio ng ikasiyam at unang decile, i.e. decile coefficient, malawakang ginagamit sa pag-aaral ng pagkakaiba-iba ng kita upang sukatin ang ratio ng mga antas ng kita ng 10% ng pinakamayaman at 10% ng hindi gaanong mayaman na populasyon. Hinahati ng mga porsyento ang ranggo na populasyon sa 100 pantay na bahagi. Ang pagkalkula, kahulugan at paggamit ng mga percentile ay katulad ng mga decile.

Ang mga quartile, decile at iba pang mga katangiang istruktura ay maaaring matukoy nang grapiko sa pamamagitan ng pagkakatulad sa median gamit ang cumulate.

Upang sukatin ang laki ng variation, ginagamit ang mga sumusunod na indicator: ang range ng variation, ang average na linear deviation, ang standard deviation, at ang variance. Ang magnitude ng hanay ng variation ay ganap na nakasalalay sa randomness ng pamamahagi ng mga matinding miyembro ng serye. Ang tagapagpahiwatig na ito ay interesado sa mga kaso kung saan mahalagang malaman kung ano ang amplitude ng mga pagbabago sa mga halaga ng katangian:

saan R- ang halaga ng hanay ng pagkakaiba-iba; x max - ang pinakamataas na halaga ng katangian; x tt - ang pinakamababang halaga ng katangian.

Kapag kinakalkula ang hanay ng variation, ang halaga ng karamihan ng mga miyembro ng serye ay hindi isinasaalang-alang, habang ang variation ay nauugnay sa bawat halaga ng miyembro ng serye. Ang pagkukulang na ito ay walang mga tagapagpahiwatig na mga average na nakuha mula sa mga paglihis ng mga indibidwal na halaga ng katangian mula sa kanilang average na halaga: ang average na linear deviation at ang standard deviation. Mayroong direktang kaugnayan sa pagitan ng mga indibidwal na paglihis mula sa karaniwan at ang pagbabagu-bago ng isang partikular na katangian. Kung mas malakas ang pagkasumpungin, mas malaki ang ganap na sukat ng mga paglihis mula sa average.

Ang average na linear deviation ay ang arithmetic average ng mga ganap na halaga ng mga deviations ng mga indibidwal na opsyon mula sa kanilang average na halaga.

Mean Linear Deviation para sa Ungrouped Data

kung saan / pr - ang halaga ng average na linear deviation; x, - - ang halaga ng tampok; X - P - bilang ng mga yunit ng populasyon.

Nakapangkat na Serye Average na Linear Deviation

kung saan / vz - ang halaga ng average na linear deviation; x, - ang halaga ng tampok; X - ang average na halaga ng katangian para sa pinag-aralan na populasyon; / - ang bilang ng mga yunit ng populasyon sa isang hiwalay na pangkat.

Ang mga palatandaan ng paglihis ay binabalewala sa kasong ito, kung hindi, ang kabuuan ng lahat ng mga paglihis ay magiging katumbas ng zero. Ang average na linear deviation depende sa pagpapangkat ng nasuri na data ay kinakalkula gamit ang iba't ibang mga formula: para sa nakapangkat at hindi nakapangkat na data. Ang average na linear deviation, dahil sa conventionality nito, na hiwalay sa iba pang mga indicator ng variation, ay ginagamit na medyo bihira sa pagsasanay (sa partikular, upang makilala ang katuparan ng mga obligasyong kontraktwal sa mga tuntunin ng pagkakapareho ng supply; sa pagsusuri ng foreign trade turnover, ang komposisyon ng mga empleyado, ang ritmo ng produksyon, kalidad ng produkto, isinasaalang-alang ang mga teknolohikal na tampok ng produksyon at iba pa).

Ang karaniwang paglihis ay nagpapakilala kung gaano kalaki ang mga indibidwal na halaga ng pinag-aralan na katangian na lumihis sa average mula sa average na halaga para sa populasyon, at ipinahayag sa mga yunit ng pinag-aralan na katangian. Ang karaniwang paglihis, bilang isa sa mga pangunahing sukatan ng pagkakaiba-iba, ay malawakang ginagamit sa pagtatasa ng mga hangganan ng pagkakaiba-iba ng isang katangian sa isang homogenous na populasyon, sa pagtukoy ng mga halaga ng mga ordinate ng normal na curve ng pamamahagi, gayundin sa mga kalkulasyon na nauugnay sa organisasyon ng sample na pagmamasid at pagtatatag ng katumpakan ng mga katangian ng sample. Ang karaniwang paglihis para sa hindi nakapangkat na data ay kinakalkula ayon sa sumusunod na algorithm: ang bawat paglihis mula sa average ay squared, lahat ng mga parisukat ay summed, pagkatapos kung saan ang kabuuan ng mga parisukat ay hinati sa bilang ng mga termino sa serye at ang square root ay kinuha mula sa ang quotient:

kung saan ang isang Iip - ang halaga ng karaniwang paglihis; Xj- halaga ng tampok; X- ang average na halaga ng katangian para sa pinag-aralan na populasyon; P - bilang ng mga yunit ng populasyon.

Para sa pinagsama-samang nasuri na data, ang standard deviation ng data ay kinakalkula gamit ang weighted formula

saan - ang halaga ng standard deviation; Xj- halaga ng tampok; X - ang average na halaga ng katangian para sa pinag-aralan na populasyon; fx- ang bilang ng mga yunit ng populasyon sa isang partikular na pangkat.

Ang expression sa ilalim ng ugat sa parehong mga kaso ay tinatawag na variance. Kaya, ang pagkakaiba ay kinakalkula bilang ang average na parisukat ng mga paglihis ng mga halaga ng katangian mula sa kanilang average na halaga. Para sa hindi natimbang (simple) na mga halaga ng tampok, ang pagkakaiba ay tinukoy bilang sumusunod:

Para sa may timbang na mga halaga ng katangian

Mayroon ding isang espesyal na pinasimple na paraan upang kalkulahin ang pagkakaiba-iba: sa mga pangkalahatang tuntunin

para sa hindi timbang (simple) na mga halaga ng tampok para sa timbang na mga halaga ng katangian
gamit ang paraan ng pagbibilang mula sa conditional zero

kung saan ang isang 2 - ang halaga ng pagpapakalat; x, - - ang halaga ng tampok; X - ang average na halaga ng tampok, h- halaga ng pagitan ng pangkat, t 1 - timbang (A =

Ang dispersion ay may independiyenteng pagpapahayag sa mga istatistika at isa sa pinakamahalagang tagapagpahiwatig ng pagkakaiba-iba. Ito ay sinusukat sa mga yunit na tumutugma sa parisukat ng mga yunit ng pagsukat ng katangiang pinag-aaralan.

Ang dispersion ay may mga sumusunod na katangian.

  • 1. Ang dispersion ng isang pare-parehong halaga ay zero.
  • 2. Ang pagbabawas ng lahat ng mga halaga ng tampok sa pamamagitan ng parehong halaga ng A ay hindi nagbabago sa halaga ng pagkakaiba. Nangangahulugan ito na ang ibig sabihin ng parisukat ng mga deviations ay maaaring kalkulahin hindi mula sa ibinigay na mga halaga ng katangian, ngunit mula sa kanilang mga deviations mula sa ilang pare-parehong numero.
  • 3. Pagbabawas ng lahat ng value ng feature sa k binabawasan ng mga oras ang pagpapakalat sa k 2 beses, at ang standard deviation - in k beses, i.e. ang lahat ng mga halaga ng tampok ay maaaring hatiin ng ilang pare-parehong numero (sabihin, sa pamamagitan ng halaga ng pagitan ng serye), kalkulahin ang karaniwang paglihis, at pagkatapos ay i-multiply ito sa isang pare-parehong numero.
  • 4. Kung kalkulahin natin ang average na parisukat ng mga deviations mula sa anumang halaga At sa ay naiiba sa ilang lawak mula sa arithmetic mean, pagkatapos ay ito ay palaging mas malaki kaysa sa mean square ng mga deviations na kinakalkula mula sa arithmetic mean. Sa kasong ito, ang ibig sabihin ng parisukat ng mga paglihis ay magiging mas malaki sa pamamagitan ng isang mahusay na tinukoy na halaga - sa pamamagitan ng parisukat ng pagkakaiba sa pagitan ng average at ito na may kondisyong kinuhang halaga.

Ang pagkakaiba-iba ng isang alternatibong tampok ay ang pagkakaroon o kawalan ng pinag-aralan na ari-arian sa mga yunit ng populasyon. Sa dami, ang pagkakaiba-iba ng isang alternatibong katangian ay ipinahayag ng dalawang halaga: ang presensya ng pinag-aralan na ari-arian sa isang yunit ay tinutukoy ng isa (1), at ang kawalan nito ay tinutukoy ng zero (0). Ang proporsyon ng mga yunit na mayroong pag-aari na pinag-aaralan ay tinutukoy ng P, at ang proporsyon ng mga yunit na walang ganitong pag-aari ay tinutukoy ng G. Kaya, ang pagkakaiba-iba ng isang alternatibong katangian ay katumbas ng produkto ng proporsyon ng mga yunit na may ibinigay na katangian (P) sa pamamagitan ng proporsyon ng mga yunit na walang ganitong katangian. (G). Ang pinakamalaking pagkakaiba-iba ng populasyon ay nakakamit sa mga kaso kung saan ang isang bahagi ng populasyon, na 50% ng kabuuang dami ng populasyon, ay may tampok, at ang iba pang bahagi ng populasyon, na katumbas din ng 50%, ay walang tampok na ito, habang ang pagkakaiba ay umabot sa maximum na halaga na 0.25, m .e. P = 0.5, G= 1 - P \u003d 1 - 0.5 \u003d 0.5 at o 2 \u003d 0.5 0.5 \u003d 0.25. Ang mas mababang limitasyon ng tagapagpahiwatig na ito ay katumbas ng zero, na tumutugma sa isang sitwasyon kung saan walang pagkakaiba-iba sa pinagsama-samang. Ang praktikal na aplikasyon ng pagkakaiba-iba ng isang alternatibong tampok ay ang pagbuo ng mga pagitan ng kumpiyansa kapag nagsasagawa ng isang sample na pagmamasid.

Kung mas maliit ang pagkakaiba at karaniwang paglihis, mas homogenous ang populasyon at magiging mas tipikal ang average. Sa pagsasagawa ng mga istatistika, madalas na kinakailangan upang ihambing ang mga pagkakaiba-iba ng iba't ibang mga tampok. Halimbawa, kagiliw-giliw na ihambing ang mga pagkakaiba-iba sa edad ng mga manggagawa at kanilang mga kwalipikasyon, haba ng serbisyo at sahod, gastos at tubo, haba ng serbisyo at produktibidad ng paggawa, atbp. Para sa gayong mga paghahambing, ang mga tagapagpahiwatig ng ganap na pagkakaiba-iba ng mga katangian ay hindi angkop: imposibleng ihambing ang pagkakaiba-iba ng karanasan sa trabaho, na ipinahayag sa mga taon, na may pagkakaiba-iba ng sahod, na ipinahayag sa rubles. Upang maisagawa ang mga naturang paghahambing, pati na rin ang mga paghahambing ng pagbabagu-bago ng parehong katangian sa ilang mga populasyon na may iba't ibang paraan ng aritmetika, ginagamit ang mga tagapagpahiwatig ng pagkakaiba-iba - ang koepisyent ng oscillation, ang linear na koepisyent ng pagkakaiba-iba at ang koepisyent ng pagkakaiba-iba, na nagpapakita ng sukat ng pagbabagu-bago ng matinding halaga sa paligid ng average.

Salik ng oscillation:

saan V R - ang halaga ng oscillation coefficient; R- ang halaga ng hanay ng pagkakaiba-iba; X -

Linear coefficient ng variation".

saan vj- ang halaga ng linear coefficient ng variation; ako- ang halaga ng average na linear deviation; X - ang average na halaga ng katangian para sa populasyon na pinag-aaralan.

Ang koepisyent ng pagkakaiba-iba:

saan Va- ang halaga ng koepisyent ng pagkakaiba-iba; a - ang halaga ng karaniwang paglihis; X - ang average na halaga ng katangian para sa populasyon na pinag-aaralan.

Ang oscillation coefficient ay ang porsyento ng hanay ng variation sa mean value ng trait na pinag-aaralan, at ang linear coefficient ng variation ay ang ratio ng mean linear deviation sa mean value ng trait na pinag-aaralan, na ipinahayag bilang porsyento. Ang coefficient of variation ay ang porsyento ng standard deviation sa average na halaga ng trait na pinag-aaralan. Bilang isang kamag-anak na halaga, na ipinahayag bilang isang porsyento, ang koepisyent ng pagkakaiba-iba ay ginagamit upang ihambing ang antas ng pagkakaiba-iba ng iba't ibang mga katangian. Gamit ang koepisyent ng pagkakaiba-iba, tinatantya ang homogeneity ng istatistikal na populasyon. Kung ang koepisyent ng pagkakaiba-iba ay mas mababa sa 33%, kung gayon ang populasyon sa ilalim ng pag-aaral ay homogenous, at ang pagkakaiba-iba ay mahina. Kung ang koepisyent ng variation ay higit sa 33%, ang populasyon na pinag-aaralan ay heterogenous, ang variation ay malakas, at ang average na halaga ay hindi tipikal at hindi maaaring gamitin bilang generalizing indicator ng populasyon na ito. Bilang karagdagan, ang mga coefficient ng variation ay ginagamit upang ihambing ang pagbabagu-bago ng isang katangian sa iba't ibang populasyon. Halimbawa, upang masuri ang pagkakaiba-iba sa haba ng serbisyo ng mga manggagawa sa dalawang negosyo. Kung mas malaki ang value ng coefficient, mas makabuluhan ang variation ng feature.

Batay sa kinakalkula na mga quartile, posible ring kalkulahin ang kamag-anak na tagapagpahiwatig ng quarterly variation gamit ang formula

kung saan Q 2 at

Ang hanay ng interquartile ay tinutukoy ng formula

Ginagamit ang quartile deviation sa halip na ang range ng variation para maiwasan ang mga disadvantages na nauugnay sa paggamit ng extreme value:

Para sa hindi pantay na interval variational series, kinakalkula din ang density ng pamamahagi. Ito ay tinukoy bilang ang quotient ng katumbas na dalas o dalas na hinati sa halaga ng pagitan. Sa hindi pantay na serye ng agwat, ginagamit ang absolute at relative distribution density. Ang absolute distribution density ay ang dalas sa bawat yunit ng haba ng agwat. Relatibong density ng pamamahagi - ang dalas sa bawat yunit ng haba ng pagitan.

Ang lahat ng nasa itaas ay totoo para sa serye ng pamamahagi na ang batas sa pamamahagi ay mahusay na inilarawan ng normal na batas sa pamamahagi o malapit dito.