Gumawa ng serye ng mga halimbawa. Serye ng pagkakaiba-iba

  • panimulang aralin libre;
  • Ang isang malaking bilang ng mga nakaranasang guro (katutubo at nagsasalita ng Ruso);
  • Ang mga kurso ay HINDI para sa isang tiyak na panahon (buwan, anim na buwan, taon), ngunit para sa isang tiyak na bilang ng mga aralin (5, 10, 20, 50);
  • Higit sa 10,000 nasiyahang mga customer.
  • Ang halaga ng isang aralin sa isang guro na nagsasalita ng Ruso - mula sa 600 rubles, na may katutubong nagsasalita - mula sa 1500 rubles

Ang konsepto ng isang variation series. Ang unang hakbang sa pag-systematize ng mga materyales ng istatistikal na pagmamasid ay ang pagbibilang ng bilang ng mga yunit na may isa o ibang tampok. Nang maiayos ang mga unit sa pataas o pababang pagkakasunud-sunod ng kanilang quantitative attribute at pagbibilang ng bilang ng mga unit na may partikular na value ng attribute, nakakakuha kami ng serye ng variation. Inilalarawan ng serye ng variation ang distribusyon ng mga yunit ng isang partikular na istatistikal na populasyon ayon sa ilang quantitative attribute.

Ang serye ng variation ay binubuo ng dalawang column, ang kaliwang column ay naglalaman ng mga value ng variable na attribute, na tinatawag na mga variant at tinutukoy ng (x), at ang kanang column ay naglalaman ng mga absolute number na nagpapakita kung gaano karaming beses nangyayari ang bawat variant. Ang mga halaga sa hanay na ito ay tinatawag na mga frequency at tinutukoy ng (f).

Sa eskematiko, ang serye ng variation ay maaaring katawanin sa anyo ng Talahanayan 5.1:

Talahanayan 5.1

Uri ng serye ng variation

Mga Pagpipilian (x)

Mga frequency (f)

Sa kanang column, ang mga kamag-anak na tagapagpahiwatig na nagpapakita ng proporsyon ng dalas ng mga indibidwal na variant sa kabuuang dami ng mga frequency ay maaari ding gamitin. Ang mga kamag-anak na tagapagpahiwatig na ito ay tinatawag na mga frequency at karaniwang tinutukoy ng , i.e. . Ang kabuuan ng lahat ng mga frequency ay katumbas ng isa. Ang mga frequency ay maaari ding ipahayag bilang isang porsyento, at pagkatapos ang kanilang kabuuan ay magiging katumbas ng 100%.

Ang mga variable na palatandaan ay maaaring magkaiba. Ang mga variant ng ilang mga palatandaan ay ipinahayag sa mga integer, halimbawa, ang bilang ng mga kuwarto sa isang apartment, ang bilang ng mga nai-publish na libro, atbp. Ang mga palatandaang ito ay tinatawag na discontinuous, o discrete. Ang mga variant ng iba pang mga tampok ay maaaring tumagal sa anumang mga halaga sa loob ng ilang mga limitasyon, tulad ng katuparan ng mga nakaplanong target, sahod, atbp. Ang mga tampok na ito ay tinatawag na tuloy-tuloy.

Discrete variation series. Kung ang mga variant ng variational series ay ipinahayag bilang discrete values, kung gayon ang naturang variational series ay tinatawag na discrete, ang hitsura nito ay ipinakita sa Table. 5.2:

Talahanayan 5.2

Pamamahagi ng mga mag-aaral ayon sa mga markang nakuha sa pagsusulit

Mga rating (x)

Bilang ng mga mag-aaral (f)

Sa % ng kabuuang ()

Ang likas na katangian ng pamamahagi sa discrete series ay inilalarawan nang grapiko bilang isang polygon ng pamamahagi, Fig.5.1.

kanin. 5.1. Pamamahagi ng mga mag-aaral ayon sa mga markang nakuha sa pagsusulit.

Serye ng pagkakaiba-iba ng pagitan. Para sa tuluy-tuloy na mga tampok, ang mga serye ng pagkakaiba-iba ay itinayo bilang serye ng pagitan, i.e. Ang mga halaga ng tampok sa mga ito ay ipinahayag bilang mga pagitan "mula sa at hanggang". Sa kasong ito, ang pinakamababang halaga ng isang feature sa naturang pagitan ay tinatawag na lower limit ng interval, at ang maximum na value ay tinatawag na upper limit ng interval.

Ang interval variational series ay binuo kapwa para sa mga hindi tuluy-tuloy na feature (discrete) at para sa mga iba-iba sa isang malaking hanay. Ang mga interval row ay maaaring may pantay at hindi pantay na pagitan. Sa pang-ekonomiyang kasanayan, para sa karamihan, hindi pantay na pagitan ang ginagamit, unti-unting tumataas o bumababa. Ang ganitong pangangailangan ay lumitaw lalo na sa mga kaso kung saan ang pagbabagu-bago ng pag-sign ay isinasagawa nang hindi pantay at sa loob ng malalaking limitasyon.

Isaalang-alang ang uri ng serye ng pagitan na may pantay na pagitan, Talahanayan. 5.3:

Talahanayan 5.3

Pamamahagi ng mga manggagawa ayon sa output

Output, tr. (X)

Bilang ng mga manggagawa (f)

Pinagsama-samang dalas (f´)

Ang serye ng pamamahagi ng pagitan ay graphic na inilalarawan bilang isang histogram, Fig.5.2.

Fig.5.2. Pamamahagi ng mga manggagawa ayon sa output

Naipon (cumulative) frequency. Sa pagsasagawa, kailangang i-convert ang serye ng pamamahagi sa pinagsama-samang mga hilera, binuo sa mga naipon na frequency. Magagamit ang mga ito upang tukuyin ang mga average na istruktura na nagpapadali sa pagsusuri ng data ng serye ng pamamahagi.

Ang pinagsama-samang mga frequency ay tinutukoy sa pamamagitan ng sunud-sunod na pagdaragdag sa mga frequency (o mga frequency) ng unang pangkat ng mga tagapagpahiwatig na ito ng mga kasunod na grupo ng serye ng pamamahagi. Ang mga cumulate at ogive ay ginagamit upang ilarawan ang serye ng pamamahagi. Upang mabuo ang mga ito, ang mga halaga ng isang discrete na tampok (o ang mga dulo ng mga agwat) ay minarkahan sa abscissa axis, at ang lumalaking kabuuan ng mga frequency (cumulate) ay minarkahan sa ordinate axis, Fig.5.3.

kanin. 5.3. Ang pinagsama-samang pamamahagi ng mga manggagawa sa pamamagitan ng pag-unlad

Kung ang mga kaliskis ng mga frequency at mga pagpipilian ay ipinagpapalit, i.e. sumasalamin sa mga naipon na frequency sa abscissa axis, at ang mga halaga ng mga opsyon sa ordinate axis, kung gayon ang curve na nagpapakita ng pagbabago sa mga frequency mula sa grupo patungo sa grupo ay tatawaging distribution ogive, Fig. 5.4.

kanin. 5.4. Ogiva pamamahagi ng mga manggagawa para sa kaunlaran

Ang mga serye ng pagkakaiba-iba na may pantay na pagitan ay nagbibigay ng isa sa pinakamahalagang kinakailangan para sa serye ng pamamahagi ng istatistika, na tinitiyak ang kanilang pagiging maihahambing sa oras at espasyo.

Densidad ng pamamahagi. Gayunpaman, ang mga frequency ng mga indibidwal na hindi pantay na pagitan sa mga seryeng ito ay hindi direktang maihahambing. Sa ganitong mga kaso, upang matiyak ang kinakailangang paghahambing, ang density ng pamamahagi ay kinakalkula, i.e. tukuyin kung gaano karaming mga yunit sa bawat pangkat ang bawat yunit ng halaga ng pagitan.

Kapag bumubuo ng isang graph ng pamamahagi ng isang variational series na may hindi pantay na mga agwat, ang taas ng mga parihaba ay tinutukoy sa proporsyon hindi sa mga frequency, ngunit sa mga tagapagpahiwatig ng density ng pamamahagi ng mga halaga ng pinag-aralan na katangian sa kaukulang mga agwat. .

Ang pag-drawing ng variational series at ang graphical na representasyon nito ay ang unang hakbang sa pagproseso ng paunang data at ang unang hakbang sa pagsusuri sa populasyon na pinag-aaralan. Ang susunod na hakbang sa pagsusuri ng variational series ay ang pagpapasiya ng mga pangunahing generalizing indicator, na tinatawag na mga katangian ng serye. Ang mga katangiang ito ay dapat magbigay ng ideya ng average na halaga ng katangian sa mga yunit ng populasyon.

average na halaga. Ang average na halaga ay isang pangkalahatang katangian ng pinag-aralan na katangian sa pinag-aralan na populasyon, na sumasalamin sa karaniwang antas nito sa bawat yunit ng populasyon sa mga partikular na kondisyon ng lugar at oras.

Ang average na halaga ay palaging pinangalanan, ay may parehong dimensyon bilang katangian ng mga indibidwal na yunit ng populasyon.

Bago kalkulahin ang mga average na halaga, kinakailangan na pangkatin ang mga yunit ng pinag-aralan na populasyon, na i-highlight ang mga qualitatively homogenous na mga grupo.

Ang average na kinakalkula para sa populasyon sa kabuuan ay tinatawag na pangkalahatang average, at para sa bawat grupo - mga average ng grupo.

Mayroong dalawang uri ng average: power (aritmetika average, harmonic average, geometric average, root mean quadratic); istruktura (mode, median, quartiles, deciles).

Ang pagpili ng average para sa pagkalkula ay depende sa layunin.

Mga uri ng mga average ng kapangyarihan at mga pamamaraan para sa kanilang pagkalkula. Sa pagsasagawa ng pagpoproseso ng istatistika ng nakolektang materyal, iba't ibang mga problema ang lumitaw, para sa solusyon kung saan kinakailangan ang iba't ibang mga average.

Ang mga istatistika ng matematika ay nakakakuha ng iba't ibang paraan mula sa mga formula ng power mean:

nasaan ang average na halaga; x - mga indibidwal na pagpipilian (mga halaga ng tampok); z - exponent (sa z = 1 - arithmetic mean, z = 0 geometric mean, z = - 1 - harmonic mean, z = 2 - mean quadratic).

Gayunpaman, ang tanong kung anong uri ng average ang dapat ilapat sa bawat indibidwal na kaso ay nireresolba ng isang partikular na pagsusuri ng populasyon na pinag-aaralan.

Ang pinakakaraniwang uri ng average sa mga istatistika ay ibig sabihin ng aritmetika. Kinakalkula ito sa mga kasong iyon kapag ang dami ng na-average na katangian ay nabuo bilang kabuuan ng mga halaga nito para sa mga indibidwal na yunit ng pinag-aralan na istatistikal na populasyon.

Depende sa likas na katangian ng paunang data, ang arithmetic mean ay tinutukoy sa iba't ibang paraan:

Kung ang data ay ungrouped, pagkatapos ay ang pagkalkula ay isinasagawa ayon sa formula ng isang simpleng average na halaga

Pagkalkula ng arithmetic mean sa isang discrete series nangyayari ayon sa formula 3.4.

Pagkalkula ng arithmetic mean sa serye ng pagitan. Sa isang serye ng pagkakaiba-iba ng agwat, kung saan ang gitna ng agwat ay may kondisyong kinukuha bilang halaga ng isang tampok sa bawat pangkat, ang arithmetic mean ay maaaring mag-iba mula sa mean na kinakalkula mula sa hindi nakagrupong data. Bukod dito, mas malaki ang pagitan sa mga pangkat, mas malaki ang posibleng mga paglihis ng average na kinakalkula mula sa nakapangkat na data mula sa average na kinakalkula mula sa hindi nakagrupong data.

Kapag kinakalkula ang average para sa isang serye ng pagkakaiba-iba ng pagitan, upang maisagawa ang mga kinakailangang kalkulasyon, ang isa ay pumasa mula sa mga pagitan patungo sa kanilang mga midpoint. At pagkatapos ay kalkulahin ang average na halaga sa pamamagitan ng formula ng arithmetic weighted average.

Mga katangian ng arithmetic mean. Ang ibig sabihin ng aritmetika ay may ilang mga katangian na nagpapahintulot sa amin na gawing simple ang mga kalkulasyon, isaalang-alang natin ang mga ito.

1. Ang arithmetic mean ng pare-parehong mga numero ay katumbas ng pare-parehong bilang na ito.

Kung x = a. Pagkatapos .

2. Kung ang mga timbang ng lahat ng mga opsyon ay proporsyonal na binago, ibig sabihin. pagtaas o pagbaba ng parehong bilang ng beses, kung gayon ang arithmetic mean ng bagong serye ay hindi magbabago mula rito.

Kung ang lahat ng mga timbang f ay nababawasan ng k beses, kung gayon .

3. Ang kabuuan ng mga positibo at negatibong paglihis ng mga indibidwal na opsyon mula sa average, na pinarami ng mga timbang, ay katumbas ng zero, i.e.

Kung , kung gayon . Mula rito.

Kung ang lahat ng mga opsyon ay nabawasan o nadagdagan ng ilang numero, ang arithmetic mean ng bagong serye ay bababa o tataas ng parehong halaga.

Bawasan ang lahat ng mga pagpipilian x sa a, ibig sabihin. x´ = xa.

Pagkatapos

Ang arithmetic mean ng paunang serye ay maaaring makuha sa pamamagitan ng pagdaragdag sa pinababang mean ng bilang na dati nang ibinawas mula sa mga variant. a, ibig sabihin. .

5. Kung ang lahat ng mga opsyon ay nabawasan o nadagdagan k beses, pagkatapos ay ang arithmetic mean ng bagong serye ay bababa o tataas ng parehong halaga, i.e. sa k minsan.

Hayaan mo na .

Samakatuwid, i.e. upang makuha ang average ng orihinal na serye, ang arithmetic mean ng bagong serye (na may mga pinababang opsyon) ay dapat na tumaas ng k minsan.

Average na harmonic. Ang harmonic mean ay ang reciprocal ng arithmetic mean. Ito ay ginagamit kapag ang istatistikal na impormasyon ay hindi naglalaman ng mga frequency para sa indibidwal na mga opsyon sa populasyon, ngunit ipinakita bilang kanilang produkto (M = xf). Ang harmonic mean ay kakalkulahin gamit ang formula 3.5

Ang praktikal na aplikasyon ng harmonic mean ay upang kalkulahin ang ilang mga indeks, sa partikular, ang index ng presyo.

Geometric ibig sabihin. Kapag ginagamit ang geometric mean, ang mga indibidwal na halaga ng katangian ay, bilang panuntunan, mga kamag-anak na halaga ng dinamika, na binuo sa anyo ng mga halaga ng chain, bilang isang ratio sa nakaraang antas ng bawat antas sa serye ng dinamika . Ang average sa gayon ay nagpapakilala sa average na rate ng paglago.

Ginagamit din ang geometric mean upang matukoy ang katumbas na halaga mula sa pinakamataas at pinakamababang halaga ng katangian. Halimbawa, ang isang kompanya ng seguro ay pumasok sa mga kontrata para sa pagkakaloob ng mga serbisyo ng seguro sa sasakyan. Depende sa partikular na nakasegurong kaganapan, ang bayad sa insurance ay maaaring mag-iba mula 10,000 hanggang 100,000 dolyar bawat taon. Ang average na pagbabayad ng insurance ay US$.

Ang geometric mean ay ang halaga na ginamit bilang average ng mga ratio o sa serye ng pamamahagi, na ipinakita bilang isang geometric na pag-unlad, kapag z = 0. Ang average na ito ay maginhawang gamitin kapag ang pansin ay binabayaran hindi sa ganap na mga pagkakaiba, ngunit sa mga ratio ng dalawang numero.

Ang mga formula para sa pagkalkula ay ang mga sumusunod

kung saan ang mga variant ng na-average na tampok; - ang produkto ng mga pagpipilian; f– dalas ng mga pagpipilian.

Ang geometric na ibig sabihin ay ginagamit sa pagkalkula ng average na taunang mga rate ng paglago.

Mean square. Ang root mean square formula ay ginagamit upang sukatin ang antas ng pagbabagu-bago ng mga indibidwal na halaga ng isang katangian sa paligid ng arithmetic mean sa serye ng pamamahagi. Kaya, kapag kinakalkula ang mga tagapagpahiwatig ng pagkakaiba-iba, ang average ay kinakalkula mula sa mga parisukat ng mga paglihis ng mga indibidwal na halaga ng katangian mula sa arithmetic mean.

Ang ibig sabihin ng square value ay kinakalkula ng formula

Sa pananaliksik sa ekonomiya, ang binagong anyo ng root mean square ay malawakang ginagamit sa pagkalkula ng mga tagapagpahiwatig ng pagkakaiba-iba ng isang katangian, tulad ng pagkakaiba-iba, karaniwang paglihis.

Pamumuno ng karamihan. Mayroong sumusunod na ugnayan sa pagitan ng mga exponential average - kung mas malaki ang exponent, mas malaki ang halaga ng average, Talahanayan 5.4:

Talahanayan 5.4

Relasyon sa pagitan ng mga average

z halaga

Ang ratio sa pagitan ng mga average

Ang ugnayang ito ay tinatawag na rule of majorance.

Mga katamtamang istruktura. Upang makilala ang istraktura ng populasyon, ginagamit ang mga espesyal na tagapagpahiwatig, na maaaring tawaging mga average na istruktura. Kasama sa mga panukalang ito ang mode, median, quartile, at deciles.

Fashion. Ang Mode (Mo) ay ang pinakamadalas na nagaganap na value ng isang feature sa mga unit ng populasyon. Ang mode ay ang halaga ng attribute na tumutugma sa pinakamataas na punto ng theoretical distribution curve.

Ang fashion ay malawakang ginagamit sa komersyal na kasanayan sa pag-aaral ng demand ng consumer (kapag tinutukoy ang laki ng mga damit at sapatos na may malaking demand), pagpaparehistro ng presyo. Maaaring may ilang mod sa kabuuan.

Pagkalkula ng mode sa isang discrete na serye. Sa isang discrete series, ang mode ay ang variant na may pinakamataas na frequency. Pag-isipang maghanap ng mode sa isang discrete na serye.

Pagkalkula ng fashion sa isang serye ng pagitan. Sa serye ng pagkakaiba-iba ng pagitan, ang gitnang variant ng modal interval ay tinatayang itinuturing na isang mode, ibig sabihin. ang pagitan na may pinakamataas na dalas (frequency). Sa loob ng agwat, kinakailangan upang mahanap ang halaga ng katangian, na kung saan ay ang mode. Para sa isang serye ng pagitan, ang mode ay tutukuyin ng formula

kung saan ang mas mababang limitasyon ng modal interval; ay ang halaga ng modal interval; ay ang dalas na naaayon sa modal interval; ay ang dalas bago ang modal interval; ay ang dalas ng agwat kasunod ng modal.

Median. Ang median () ay ang value ng feature sa gitnang unit ng ranggo na serye. Ang isang ranggo na serye ay isang serye kung saan ang mga katangiang halaga ay nakasulat sa pataas o pababang pagkakasunud-sunod. O ang median ay isang value na naghahati sa bilang ng isang ordered variational series sa dalawang pantay na bahagi: ang isang bahagi ay may value ng variable na feature na mas mababa sa average na variant, at ang isa ay malaki.

Upang mahanap ang median, ang serial number nito ay unang tinutukoy. Upang gawin ito, na may isang kakaibang bilang ng mga yunit, ang isa ay idinagdag sa kabuuan ng lahat ng mga frequency at ang lahat ay nahahati sa dalawa. Sa pantay na bilang ng mga unit, ang median ay makikita bilang ang halaga ng katangian ng unit, ang serial number nito ay tinutukoy ng kabuuang kabuuan ng mga frequency na hinati sa dalawa. Alam ang ordinal na numero ng median, madaling mahanap ang halaga nito mula sa mga naipon na frequency.

Pagkalkula ng median sa isang discrete series. Ayon sa sample na survey, nakuha ang datos sa distribusyon ng mga pamilya ayon sa bilang ng mga bata, Table. 5.5. Upang matukoy ang median, tukuyin muna ang ordinal na numero nito

=

Pagkatapos ay bumuo kami ng isang serye ng mga pinagsama-samang frequency (, sa pamamagitan ng serial number at ang pinagsama-samang dalas ay makikita namin ang median. Ang pinagsama-samang frequency 33 ay nagpapakita na sa 33 pamilya ang bilang ng mga bata ay hindi lalampas sa 1 bata, ngunit dahil ang median na numero ay 50, ang median ay nasa hanay mula 34 hanggang 55 pamilya.

Talahanayan 5.5

Pamamahagi ng bilang ng mga pamilya mula sa bilang ng mga bata

Bilang ng mga anak sa pamilya

Ang bilang ng mga pamilya, ay ang halaga ng median interval;

Ang lahat ng itinuturing na anyo ng ibig sabihin ng kapangyarihan ay may mahalagang pag-aari (sa kaibahan sa mga paraan ng istruktura) - ang pormula para sa pagtukoy ng ibig sabihin ay kinabibilangan ng lahat ng mga halaga ng serye i.e. ang laki ng average ay naiimpluwensyahan ng halaga ng bawat opsyon.

Sa isang banda, ito ay isang napakapositibong pag-aari. sa kasong ito, ang epekto ng lahat ng sanhi na nakakaapekto sa lahat ng yunit ng pinag-aralan na populasyon ay isinasaalang-alang. Sa kabilang banda, kahit na ang isang obserbasyon na hindi sinasadyang kasama sa paunang data ay maaaring makabuluhang baluktot ang ideya ng antas ng pag-unlad ng pinag-aralan na katangian sa populasyon na isinasaalang-alang (lalo na sa maikling serye).

Quartiles at deciles. Sa pamamagitan ng pagkakatulad sa paghahanap ng median sa variational series, mahahanap ng isa ang halaga ng isang feature sa alinmang ranggo na unit ng serye sa pagkakasunud-sunod. Kaya, sa partikular, mahahanap ng isa ang halaga ng isang tampok para sa mga yunit na naghahati sa serye sa 4 na pantay na bahagi, sa 10, atbp.

Quartiles. Ang mga variant na naghahati sa ranggo na serye sa apat na pantay na bahagi ay tinatawag na quartile.

Kasabay nito, ang mga sumusunod ay nakikilala: ang mas mababang (o una) quartile (Q1) - ang halaga ng tampok ng yunit ng ranggo na serye, na naghahati sa populasyon sa ratio na ¼ hanggang ¾ at ang itaas (o pangatlo. ) quartile (Q3) - ang halaga ng feature ng unit ng ranggo na serye, na hinahati ang populasyon sa ratio na ¾ hanggang ¼.

Ang pangalawang quartile ay ang median Q2 = Me. Ang lower at upper quartile sa interval series ay kinakalkula gamit ang formula na katulad ng median.

kung saan ay ang mas mababang limitasyon ng pagitan na naglalaman ng mas mababa at itaas na quartile, ayon sa pagkakabanggit;

ay ang pinagsama-samang dalas ng pagitan bago ang agwat na naglalaman ng mas mababa o itaas na quartile;

– mga frequency ng quartile interval (ibaba at itaas)

Ang mga pagitan na naglalaman ng Q1 at Q3 ay tinutukoy mula sa mga naipon na frequency (o mga frequency).

Deciles. Bilang karagdagan sa mga quartile, ang mga decile ay kinakalkula - mga opsyon na naghahati sa ranggo na serye sa 10 pantay na bahagi.

Ang mga ito ay tinutukoy ng D, ang unang decile D1 ay naghahati sa serye sa ratio na 1/10 at 9/10, ang pangalawang D2 - 2/10 at 8/10, atbp. Kinakalkula ang mga ito sa parehong paraan tulad ng median at quartiles.

Parehong nabibilang ang median, at quartile, at deciles sa tinatawag na ordinal statistics, na nauunawaan bilang isang variant na sumasakop sa isang partikular na ordinal na lugar sa isang ranggo na serye.

Ang paraan ng pagpapangkat ay nagpapahintulot din sa iyo na sukatin pagkakaiba-iba(variability, fluctuation) ng mga palatandaan. Sa medyo maliit na bilang ng mga yunit ng populasyon, ang pagkakaiba-iba ay sinusukat sa batayan ng isang ranggo na serye ng mga yunit na bumubuo sa populasyon. Tinatawag ang hilera niraranggo kung ang mga yunit ay nakaayos sa pataas (pababa) na tampok.

Gayunpaman, ang ranggo na serye ay sa halip ay nagpapahiwatig kapag ang isang paghahambing na katangian ng pagkakaiba-iba ay kinakailangan. Bilang karagdagan, sa maraming mga kaso ang isang tao ay kailangang harapin ang mga istatistikal na pinagsama-samang binubuo ng isang malaking bilang ng mga yunit, na halos mahirap na katawanin sa anyo ng isang tiyak na serye. Sa pagsasaalang-alang na ito, para sa paunang pangkalahatang kakilala sa istatistikal na data at lalo na upang mapadali ang pag-aaral ng pagkakaiba-iba ng mga palatandaan, ang mga pinag-aralan na phenomena at proseso ay karaniwang pinagsama sa mga grupo, at ang mga resulta ng pagpapangkat ay iginuhit sa anyo ng mga talahanayan ng grupo. .

Kung mayroon lamang dalawang hanay sa talahanayan ng pangkat - mga pangkat ayon sa napiling tampok (mga opsyon) at ang bilang ng mga pangkat (mga frequency o frequency), ito ay tinatawag malapit sa pamamahagi.

Saklaw ng pamamahagi - ang pinakasimpleng uri ng structural grouping ayon sa isang attribute, na ipinapakita sa isang group table na may dalawang column na naglalaman ng mga variant at frequency ng attribute. Sa maraming mga kaso, na may tulad na isang structural grouping, i.e. sa pagsasama-sama ng serye ng pamamahagi, ang pag-aaral ng paunang istatistikal na materyal ay magsisimula.

Ang isang istrukturang pagpapangkat sa anyo ng isang serye ng pamamahagi ay maaaring gawing isang tunay na istrukturang pagpapangkat kung ang mga napiling grupo ay nailalarawan hindi lamang sa pamamagitan ng mga frequency, kundi pati na rin ng iba pang mga istatistikal na tagapagpahiwatig. Ang pangunahing layunin ng serye ng pamamahagi ay pag-aralan ang pagkakaiba-iba ng mga tampok. Ang teorya ng serye ng pamamahagi ay binuo nang detalyado sa pamamagitan ng mga istatistika ng matematika.

Ang serye ng pamamahagi ay nahahati sa katangian(pagpapangkat ayon sa mga katangiang katangian, halimbawa, ang paghahati ng populasyon ayon sa kasarian, nasyonalidad, katayuan sa pag-aasawa, atbp.) at pagkakaiba-iba(pagpapangkat ayon sa dami ng mga katangian).

Serye ng pagkakaiba-iba ay isang talahanayan ng pangkat na naglalaman ng dalawang column: isang pagpapangkat ng mga unit ayon sa isang quantitative attribute at ang bilang ng mga unit sa bawat grupo. Ang mga agwat sa serye ng variation ay karaniwang nabuo nang pantay at sarado. Ang serye ng variation ay ang sumusunod na pagpapangkat ng populasyon ng Russia sa mga tuntunin ng average per capita cash income (Talahanayan 3.10).

Talahanayan 3.10

Distribusyon ng populasyon ng Russia sa pamamagitan ng average per capita income noong 2004-2009

Mga pangkat ng populasyon ayon sa average na per capita cash income, rub./month

Populasyon sa pangkat, sa % ng kabuuan

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Higit sa 25,000.0

Lahat ng populasyon

Ang variational series, naman, ay nahahati sa discrete at interval. discrete pinagsasama-sama ng serye ng variation ang mga variant ng mga discrete na feature na nag-iiba-iba sa loob ng makitid na limitasyon. Ang isang halimbawa ng isang discrete variation series ay ang pamamahagi ng mga pamilyang Ruso ayon sa bilang ng mga anak na mayroon sila.

Pagitan pinagsasama-sama ng variational series ang mga variant ng alinman sa tuluy-tuloy na feature o discrete na feature na nagbabago sa malawak na hanay. Ang serye ng pagitan ay ang variational na serye ng pamamahagi ng populasyon ng Russia sa mga tuntunin ng average na per capita cash na kita.

Ang discrete variational series ay hindi masyadong madalas na ginagamit sa pagsasanay. Samantala, ang pag-compile ng mga ito ay hindi mahirap, dahil ang komposisyon ng mga grupo ay tinutukoy ng mga partikular na variant na talagang taglay ng pinag-aralan na mga katangian ng pagpapangkat.

Mas laganap ang interval variational series. Sa pag-compile ng mga ito, ang mahirap na tanong ay lumitaw sa bilang ng mga grupo, pati na rin ang laki ng mga agwat na dapat itatag.

Ang mga prinsipyo para sa paglutas ng isyung ito ay itinakda sa kabanata sa pamamaraan para sa pagbuo ng mga istatistikal na pagpapangkat (tingnan ang talata 3.3).

Ang mga serye ng variation ay isang paraan ng pagbagsak o pag-compress ng magkakaibang impormasyon sa isang compact form; magagamit ang mga ito upang gumawa ng medyo malinaw na paghatol tungkol sa likas na katangian ng variation, upang pag-aralan ang mga pagkakaiba sa mga palatandaan ng mga phenomena na kasama sa set na pinag-aaralan. Ngunit ang pinakamahalagang kahalagahan ng variational series ay na sa kanilang batayan ang mga espesyal na generalizing na katangian ng variation ay kinakalkula (tingnan ang Kabanata 7).

Serye ng pagkakaiba-iba: kahulugan, mga uri, pangunahing katangian. Paraan ng pagkalkula
fashion, median, arithmetic mean sa medikal at istatistikal na pag-aaral
(Ipakita sa isang kondisyon na halimbawa).

Ang variational series ay isang serye ng mga numerical na halaga ng katangian na pinag-aaralan, na naiiba sa bawat isa sa kanilang magnitude at nakaayos sa isang tiyak na pagkakasunud-sunod (sa pataas o pababang pagkakasunud-sunod). Ang bawat numerical value ng serye ay tinatawag na variant (V), at ang mga numerong nagpapakita kung gaano kadalas nangyayari ito o ang variant na iyon sa komposisyon ng seryeng ito ay tinatawag na frequency (p).

Ang kabuuang bilang ng mga kaso ng mga obserbasyon, kung saan binubuo ang serye ng variation, ay tinutukoy ng titik n. Ang pagkakaiba sa kahulugan ng mga pinag-aralan na katangian ay tinatawag na baryasyon. Kung ang variable sign ay walang quantitative measure, ang variation ay tinatawag na qualitative, at ang distribution series ay tinatawag na attribute (halimbawa, distribution ayon sa resulta ng sakit, health status, atbp.).

Kung ang isang variable na sign ay may quantitative expression, ang naturang variation ay tinatawag na quantitative, at ang distribution series ay tinatawag na variational.

Ang variational series ay nahahati sa discontinuous at continuous - ayon sa likas na katangian ng quantitative trait, simple at weighted - ayon sa dalas ng paglitaw ng variant.

Sa isang simpleng variational series, ang bawat variant ay nangyayari nang isang beses lamang (p=1), sa isang weighted, ang parehong variant ay nangyayari nang ilang beses (p>1). Ang mga halimbawa ng naturang serye ay tatalakayin mamaya sa teksto. Kung ang quantitative attribute ay tuluy-tuloy, i.e. sa pagitan ng mga integer na halaga ay mayroong mga intermediate na fractional na halaga, ang variational series ay tinatawag na tuloy-tuloy.

Halimbawa: 10.0 - 11.9

14.0 - 15.9, atbp.

Kung ang quantitative sign ay hindi nagpapatuloy, i.e. ang mga indibidwal na halaga nito (mga opsyon) ay naiiba sa bawat isa sa pamamagitan ng isang integer at walang mga intermediate fractional na halaga, ang serye ng variation ay tinatawag na discontinuous o discrete.

Gamit ang data mula sa nakaraang halimbawa tungkol sa rate ng puso

para sa 21 mag-aaral, bubuo kami ng serye ng variation (Talahanayan 1).

Talahanayan 1

Distribusyon ng mga medikal na estudyante ayon sa pulse rate (bpm)

Kaya, upang makabuo ng isang variational series ay nangangahulugan ng pag-systematize, pag-streamline ng mga umiiral na numerical values ​​(mga opsyon), i.e. ayusin sa isang tiyak na pagkakasunud-sunod (sa pataas o pababang pagkakasunud-sunod) sa kanilang kaukulang mga frequency. Sa halimbawang isinasaalang-alang, ang mga opsyon ay inayos sa pataas na pagkakasunud-sunod at ipinahayag bilang mga discontinuous (discrete) integer, ang bawat opsyon ay nangyayari nang maraming beses, i.e. kami ay nakikitungo sa isang timbang, hindi tuloy-tuloy o discrete variational series.

Bilang isang patakaran, kung ang bilang ng mga obserbasyon sa istatistikal na populasyon na aming pinag-aaralan ay hindi lalampas sa 30, kung gayon ito ay sapat na upang ayusin ang lahat ng mga halaga ng katangian sa ilalim ng pag-aaral sa isang variational na serye sa pagtaas ng pagkakasunud-sunod, tulad ng sa Talahanayan. 1, o sa pababang pagkakasunud-sunod.

Sa isang malaking bilang ng mga obserbasyon (n>30), ang bilang ng mga nagaganap na variant ay maaaring maging napakalaki, sa kasong ito, ang isang pagitan o pinagsama-samang serye ng variational ay pinagsama-sama, kung saan, upang gawing simple ang kasunod na pagproseso at linawin ang likas na katangian ng pamamahagi, ang ang mga variant ay pinagsama sa mga pangkat.

Karaniwan ang bilang ng mga opsyon ng pangkat ay mula 8 hanggang 15.

Dapat mayroong hindi bababa sa 5 sa kanila, dahil. kung hindi, ito ay magiging masyadong magaspang, labis na pagpapalaki, na nakakasira sa pangkalahatang larawan ng pagkakaiba-iba at lubos na nakakaapekto sa katumpakan ng mga average na halaga. Kapag ang bilang ng mga pagpipilian sa pangkat ay higit sa 20-25, ang katumpakan ng pagkalkula ng mga average na halaga ay tumataas, ngunit ang mga tampok ng pagkakaiba-iba ng tampok ay makabuluhang baluktot at ang pagproseso ng matematika ay nagiging mas kumplikado.

Kapag nag-compile ng isang pinagsama-samang serye, kinakailangang isaalang-alang

− dapat ilagay ang mga variant na grupo sa isang partikular na pagkakasunud-sunod (pataas o pababa);

- ang mga pagitan sa mga variant na grupo ay dapat na pareho;

− ang mga halaga ng mga hangganan ng mga pagitan ay hindi dapat magkasabay, dahil hindi magiging malinaw kung aling mga grupo ang iuugnay ang mga indibidwal na opsyon;

- kinakailangang isaalang-alang ang mga katangian ng husay ng nakolektang materyal kapag nagtatakda ng mga limitasyon ng mga agwat (halimbawa, kapag pinag-aaralan ang bigat ng mga matatanda, ang isang pagitan ng 3-4 kg ay katanggap-tanggap, at para sa mga bata sa mga unang buwan ng buhay hindi ito dapat lumagpas sa 100 g.)

Bumuo tayo ng isang pinagsama-samang (interval) na serye na nagpapakita ng data sa rate ng pulso (bilang ng mga beats bawat minuto) para sa 55 mga medikal na estudyante bago ang pagsusulit: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Upang bumuo ng nakagrupong serye, kailangan mo:

1. Tukuyin ang halaga ng pagitan;

2. Tukuyin ang gitna, simula at wakas ng mga pangkat ng variant ng serye ng variation.

● Ang halaga ng agwat (i) ay tinutukoy ng bilang ng mga inaasahang pangkat (r), ang bilang nito ay nakatakda depende sa bilang ng mga obserbasyon (n) ayon sa isang espesyal na talahanayan

Bilang ng mga pangkat depende sa bilang ng mga obserbasyon:

Sa aming kaso, para sa 55 mga mag-aaral, posible na bumuo ng mula 8 hanggang 10 mga grupo.

Ang halaga ng pagitan (i) ay tinutukoy ng sumusunod na formula -

i = Vmax-Vmin/r

Sa aming halimbawa, ang halaga ng pagitan ay 82-58/8= 3.

Kung ang halaga ng pagitan ay isang fractional na numero, ang resulta ay dapat na i-round up sa isang integer.

Mayroong ilang mga uri ng mga average:

● arithmetic mean,

● geometric na ibig sabihin,

● harmonic mean,

● root mean square,

● katamtamang progresibo,

● panggitna

Sa mga medikal na istatistika, ang mga average ng arithmetic ay kadalasang ginagamit.

Ang arithmetic mean (M) ay isang pangkalahatang halaga na tumutukoy sa karaniwang halaga na katangian ng buong populasyon. Ang mga pangunahing pamamaraan para sa pagkalkula ng M ay: ang arithmetic mean method at ang paraan ng mga sandali (conditional deviations).

Ang arithmetic mean method ay ginagamit upang kalkulahin ang simpleng arithmetic mean at ang weighted arithmetic mean. Ang pagpili ng paraan para sa pagkalkula ng arithmetic mean value ay depende sa uri ng variation series. Sa kaso ng isang simpleng variational series, kung saan ang bawat variant ay nangyayari nang isang beses, ang simpleng arithmetic mean ay tinutukoy ng formula:

kung saan: М – arithmetic mean value;

Ang V ay ang halaga ng variable na tampok (mga opsyon);

Σ - nagpapahiwatig ng aksyon - pagbubuod;

n ay ang kabuuang bilang ng mga obserbasyon.

Ang isang halimbawa ng pagkalkula ng arithmetic mean ay simple. Respiratory rate (bilang ng mga paghinga bawat minuto) sa 9 na lalaki na may edad na 35: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Upang matukoy ang average na antas ng respiratory rate sa mga lalaking may edad na 35, ito ay kinakailangan:

1. Bumuo ng variational series, na inilalagay ang lahat ng opsyon sa pataas o pababang pagkakasunod-sunod. Nakakuha kami ng simpleng variational series, dahil isang beses lang nangyayari ang mga variant value.

M = ∑V/n = 171/9 = 19 na paghinga kada minuto

Konklusyon. Ang rate ng paghinga sa mga lalaking may edad na 35 ay nasa average na 19 na paghinga bawat minuto.

Kung ang mga indibidwal na halaga ng isang variant ay paulit-ulit, hindi na kailangang isulat ang bawat variant sa isang linya; ito ay sapat na upang ilista ang mga laki ng variant na nagaganap (V) at sa tabi upang ipahiwatig ang bilang ng kanilang mga pag-uulit (p ). tulad ng isang variational series, kung saan ang mga variant ay, kumbaga, tinimbang ayon sa bilang ng mga frequency na naaayon sa kanila, ay tinatawag na weighted variational series, at ang kinakalkula na average na halaga ay ang arithmetic weighted average.

Ang arithmetic weighted average ay tinutukoy ng formula: M= ∑Vp/n

kung saan ang n ay ang bilang ng mga obserbasyon na katumbas ng kabuuan ng mga frequency - Σr.

Isang halimbawa ng pagkalkula ng arithmetic weighted average.

Ang tagal ng kapansanan (sa mga araw) sa 35 mga pasyente na may acute respiratory disease (ARI) na ginagamot ng isang lokal na doktor sa unang quarter ng kasalukuyang taon ay: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 araw .

Ang pamamaraan para sa pagtukoy ng average na tagal ng kapansanan sa mga pasyente na may talamak na impeksyon sa paghinga ay ang mga sumusunod:

1. Bumuo tayo ng isang weighted variational series, dahil Ang mga indibidwal na halaga ng variant ay paulit-ulit nang maraming beses. Upang gawin ito, maaari mong ayusin ang lahat ng mga pagpipilian sa pataas o pababang pagkakasunud-sunod sa kanilang mga kaukulang frequency.

Sa aming kaso, ang mga opsyon ay nasa pataas na pagkakasunud-sunod.

2. Kalkulahin ang arithmetic weighted average gamit ang formula: M = ∑Vp/n = 233/35 = 6.7 araw

Pamamahagi ng mga pasyente na may acute respiratory infection ayon sa tagal ng kapansanan:

Tagal ng kawalan ng kakayahan para sa trabaho (V) Bilang ng mga pasyente (p) vp
∑p = n = 35 ∑Vp = 233

Konklusyon. Ang tagal ng kapansanan sa mga pasyenteng may acute respiratory disease ay may average na 6.7 araw.

Ang Mode (Mo) ay ang pinakakaraniwang variant sa serye ng variation. Para sa pamamahagi na ipinakita sa talahanayan, ang mode ay tumutugma sa variant na katumbas ng 10, ito ay nangyayari nang mas madalas kaysa sa iba - 6 na beses.

Pamamahagi ng mga pasyente ayon sa haba ng pananatili sa kama sa ospital (sa mga araw)

V
p

Minsan mahirap matukoy ang eksaktong halaga ng mode, dahil maaaring mayroong ilang mga obserbasyon sa data na pinag-aaralan na nangyayari "pinaka madalas".

Ang Median (Me) ay isang non-parametric indicator na naghahati sa serye ng variation sa dalawang pantay na kalahati: ang parehong bilang ng mga opsyon ay matatagpuan sa magkabilang panig ng median.

Halimbawa, para sa distribusyon na ipinapakita sa talahanayan, ang median ay 10 dahil sa magkabilang panig ng halagang ito ay matatagpuan sa ika-14 na opsyon, i.e. ang numero 10 ay sumasakop sa isang sentral na posisyon sa seryeng ito at ang median nito.

Dahil ang bilang ng mga obserbasyon sa halimbawang ito ay pantay (n=34), ang median ay maaaring matukoy tulad ng sumusunod:

Ako = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Nangangahulugan ito na ang gitna ng serye ay nahuhulog sa ikalabimpitong opsyon, na tumutugma sa median na 10. Para sa pamamahagi na ipinakita sa talahanayan, ang arithmetic mean ay:

M = ∑Vp/n = 334/34 = 10.1

Kaya, para sa 34 na obserbasyon mula sa Talahanayan. 8, nakuha namin ang: Mo=10, Me=10, ang arithmetic mean (M) ay 10.1. Sa aming halimbawa, ang lahat ng tatlong mga tagapagpahiwatig ay naging pantay o malapit sa isa't isa, kahit na sila ay ganap na naiiba.

Ang arithmetic mean ay ang resultang kabuuan ng lahat ng mga impluwensya; lahat ng mga opsyon, nang walang pagbubukod, ay nakikibahagi sa pagbuo nito, kabilang ang mga sukdulan, kadalasang hindi tipikal para sa isang partikular na phenomenon o set.

Ang mode at median, sa kaibahan sa arithmetic mean, ay hindi nakasalalay sa halaga ng lahat ng mga indibidwal na halaga ng variable na katangian (ang mga halaga ng matinding variant at ang antas ng pagkakalat ng serye). Ang arithmetic mean ay nagpapakilala sa buong masa ng mga obserbasyon, ang mode at median ay nagpapakilala sa bulk

Serye ng pamamahagi ng istatistika- ito ay isang maayos na pamamahagi ng mga yunit ng populasyon sa mga pangkat ayon sa isang tiyak na iba't ibang katangian.
Depende sa katangiang pinagbabatayan ng pagbuo ng isang serye ng pamamahagi, mayroong katangian at serye ng pamamahagi ng variation.

Ang pagkakaroon ng isang karaniwang tampok ay ang batayan para sa pagbuo ng isang istatistikal na populasyon, na mga resulta ng isang paglalarawan o pagsukat ng mga karaniwang tampok ng mga bagay ng pag-aaral.

Ang paksa ng pag-aaral sa istatistika ay nagbabago (nag-iiba-iba) ng mga tampok o mga tampok na istatistika.

Mga uri ng mga tampok na istatistika.

Ang serye ng pamamahagi ay tinatawag na serye ng katangian. binuo sa kalidad ng mga batayan. Attributive- ito ay isang palatandaan na may pangalan (halimbawa, isang propesyon: isang mananahi, guro, atbp.).
Nakaugalian na ayusin ang serye ng pamamahagi sa anyo ng mga talahanayan. Sa mesa. Ang 2.8 ay nagpapakita ng isang attribute series ng distribution.
Talahanayan 2.8 - Pamamahagi ng mga uri ng legal na tulong na ibinigay ng mga abogado sa mga mamamayan ng isa sa mga rehiyon ng Russian Federation.

Serye ng pagkakaiba-iba ay mga tampok na halaga (o mga hanay ng mga halaga) at ang kanilang mga frequency.
Ang mga serye ng pagkakaiba-iba ay serye ng pamamahagi binuo sa isang quantitative na batayan. Ang anumang variational series ay binubuo ng dalawang elemento: mga variant at frequency.
Ang mga variant ay mga indibidwal na halaga ng isang feature na kinukuha nito sa isang serye ng variation.
Ang mga frequency ay ang mga bilang ng mga indibidwal na variant o bawat pangkat ng serye ng variation, i.e. ito ay mga numerong nagpapakita kung gaano kadalas nangyayari ang ilang mga opsyon sa isang serye ng pamamahagi. Tinutukoy ng kabuuan ng lahat ng mga frequency ang laki ng buong populasyon, ang dami nito.
Ang mga frequency ay tinatawag na mga frequency, na ipinahayag sa mga fraction ng isang yunit o bilang isang porsyento ng kabuuan. Alinsunod dito, ang kabuuan ng mga frequency ay katumbas ng 1 o 100%. Nagbibigay-daan sa amin ang variational series na suriin ang anyo ng batas sa pamamahagi batay sa aktwal na data.

Depende sa likas na katangian ng pagkakaiba-iba ng katangian, mayroong discrete at interval variation series.
Ang isang halimbawa ng isang discrete variational series ay ibinigay sa Table. 2.9.
Talahanayan 2.9 - Pamamahagi ng mga pamilya ayon sa bilang ng mga silid na inookupahan sa mga indibidwal na apartment noong 1989 sa Russian Federation.

Ang unang column ng talahanayan ay nagpapakita ng mga variant ng isang discrete variational series, ang pangalawang column ay naglalaman ng mga frequency ng variational series, at ang ikatlong column ay naglalaman ng frequency indicator.

Serye ng pagkakaiba-iba

Sa pangkalahatang populasyon, ang isang tiyak na quantitative na katangian ay sinisiyasat. Ang isang sample ng volume ay random na kinuha mula dito n, ibig sabihin, ang bilang ng mga elemento sa sample ay n. Sa unang yugto ng pagproseso ng istatistika, sumasaklaw mga sample, i.e. pag-order ng numero x 1 , x 2 , …, x n Paakyat. Ang bawat naobserbahang halaga x i tinawag opsyon. Dalas m i ay ang bilang ng mga obserbasyon ng halaga x i sa sample. Relatibong dalas (dalas) w i ay ang frequency ratio m i sa laki ng sample n: .
Kapag nag-aaral ng variational series, ginagamit din ang mga konsepto ng cumulative frequency at cumulative frequency. Hayaan x ilang numero. Pagkatapos ang bilang ng mga pagpipilian , na ang mga halaga ay mas mababa x, ay tinatawag na accumulated frequency: para sa x i n ay tinatawag na accumulated frequency w i max .
Ang isang katangian ay tinatawag na discretely variable kung ang mga indibidwal na halaga nito (mga variant) ay naiiba sa isa't isa sa ilang tiyak na halaga (karaniwan ay isang integer). Ang isang variational series ng naturang feature ay tinatawag na discrete variational series.

Talahanayan 1. Pangkalahatang view ng discrete variational series ng mga frequency

Mga halaga ng tampokx i x 1 x2 x n
Mga frequencym i m 1 m2 m n

Ang isang katangian ay tinatawag na patuloy na nag-iiba-iba kung ang mga halaga nito ay naiiba sa bawat isa sa pamamagitan ng isang maliit na halaga, i.e. ang tanda ay maaaring tumagal ng anumang halaga sa isang tiyak na agwat. Ang tuluy-tuloy na serye ng pagkakaiba-iba para sa gayong katangian ay tinatawag na serye ng pagitan.

Talahanayan 2. Pangkalahatang view ng pagkakaiba-iba ng pagitan ng serye ng mga frequency

Talahanayan 3. Mga graphic na larawan ng serye ng variation

hileraPolygon o histogramEmpirical distribution function
discrete
pagitan
Sa pagtingin sa mga resulta ng mga obserbasyon, natutukoy kung gaano karaming mga halaga ng mga variant ang nahulog sa bawat tiyak na agwat. Ipinapalagay na ang bawat pagitan ay kabilang sa isa sa mga dulo nito: alinman sa lahat ng mga kaso sa kaliwa (mas madalas), o sa lahat ng mga kaso sa kanan, at ang mga frequency o frequency ay nagpapakita ng bilang ng mga opsyon na nakapaloob sa ipinahiwatig na mga hangganan. Mga Pagkakaiba a i – a i +1 ay tinatawag na mga partial interval. Upang pasimplehin ang mga kasunod na kalkulasyon, ang serye ng pagkakaiba-iba ng agwat ay maaaring palitan ng isang may kondisyon na discrete. Sa kasong ito, ang ibig sabihin ng halaga i-th interval ay kinuha bilang isang opsyon x i, at ang katumbas na dalas ng pagitan m i- para sa dalas ng agwat na ito.
Para sa graphic na representasyon ng variational series, kadalasang ginagamit ang polygon, histogram, cumulative curve at empirical distribution function.

Sa mesa. 2.3 (Pagpapangkat ng populasyon ng Russia ayon sa laki ng average per capita income noong Abril 1994) serye ng pagkakaiba-iba ng pagitan.
Maginhawang suriin ang serye ng pamamahagi gamit ang isang graphical na representasyon, na ginagawang posible ring hatulan ang hugis ng pamamahagi. Ang isang visual na representasyon ng katangian ng pagbabago sa mga frequency ng variational series ay ibinibigay ng polygon at histogram.
Ginagamit ang polygon kapag nagpapakita ng discrete variational series.
Ilarawan natin, halimbawa, ang graphical na pamamahagi ng stock ng pabahay ayon sa uri ng mga apartment (Talahanayan 2.10).
Talahanayan 2.10 - Pamamahagi ng stock ng pabahay ng urban area ayon sa uri ng mga apartment (conditional figures).


kanin. Polygon ng pamamahagi ng pabahay


Sa y-axis, hindi lamang ang mga halaga ng mga frequency, kundi pati na rin ang mga frequency ng serye ng pagkakaiba-iba ay maaaring i-plot.
Kinukuha ang histogram upang ipakita ang serye ng pagkakaiba-iba ng pagitan. Kapag gumagawa ng isang histogram, ang mga halaga ng mga pagitan ay naka-plot sa abscissa axis, at ang mga frequency ay inilalarawan ng mga parihaba na binuo sa kaukulang mga agwat. Ang taas ng mga haligi sa kaso ng pantay na pagitan ay dapat na proporsyonal sa mga frequency. Ang histogram ay isang graph kung saan ang isang serye ay ipinapakita bilang mga bar na katabi ng bawat isa.
Ilarawan natin nang grapiko ang serye ng pamamahagi ng pagitan na ibinigay sa Talahanayan. 2.11.
Talahanayan 2.11 - Pamamahagi ng mga pamilya ayon sa laki ng tirahan bawat tao (conditional figures).
N p / p Mga pangkat ng mga pamilya ayon sa laki ng tirahan bawat tao Bilang ng mga pamilya na may partikular na laki ng tirahan Naipon na bilang ng mga pamilya
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
KABUUAN 115 ----


kanin. 2.2. Histogram ng pamamahagi ng mga pamilya ayon sa laki ng living space bawat tao


Gamit ang data ng naipon na serye (Talahanayan 2.11), bumuo kami pinagsama-samang pamamahagi.


kanin. 2.3. Ang pinagsama-samang pamamahagi ng mga pamilya ayon sa laki ng tirahan bawat tao


Ang representasyon ng isang variational series sa anyo ng isang cumulate ay lalong epektibo para sa variational series, ang mga frequency nito ay ipinahayag bilang mga fraction o porsyento ng kabuuan ng mga frequency ng serye.
Kung babaguhin natin ang mga axes sa graphic na representasyon ng variational series sa anyo ng isang cumulate, pagkatapos ay makukuha natin ogivu. Sa fig. 2.4 ay nagpapakita ng ogive na binuo batay sa data sa Talahanayan. 2.11.
Ang isang histogram ay maaaring ma-convert sa isang polygon ng pamamahagi sa pamamagitan ng paghahanap ng mga midpoint ng mga gilid ng mga parihaba at pagkatapos ay ikonekta ang mga puntong ito sa mga tuwid na linya. Ang resultang polygon ng pamamahagi ay ipinapakita sa fig. 2.2 tuldok na linya.
Kapag bumubuo ng isang histogram ng pamamahagi ng isang variational series na may hindi pantay na mga agwat, kasama ang ordinate axis, hindi mga frequency ang inilalapat, ngunit ang density ng pamamahagi ng tampok sa kaukulang mga agwat.
Ang density ng pamamahagi ay ang dalas na kinakalkula sa bawat lapad ng pagitan ng yunit, i.e. kung gaano karaming mga yunit sa bawat pangkat ang bawat halaga ng pagitan ng yunit. Ang isang halimbawa ng pagkalkula ng density ng pamamahagi ay ipinakita sa Talahanayan. 2.12.
Talahanayan 2.12 - Pamamahagi ng mga negosyo ayon sa bilang ng mga empleyado (ang mga numero ay may kondisyon)
N p / p Mga grupo ng mga negosyo ayon sa bilang ng mga empleyado, pers. Bilang ng mga negosyo Laki ng pagitan, pers. Densidad ng pamamahagi
PERO 1 2 3=1/2
1 hanggang sa 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
KABUUAN 147 ---- ----

Para sa isang graphical na representasyon ng variation series ay maaari ding gamitin pinagsama-samang kurba. Sa tulong ng cumulate (ang curve ng mga sums), isang serye ng mga naipon na frequency ay ipinapakita. Ang pinagsama-samang mga frequency ay tinutukoy sa pamamagitan ng sunud-sunod na pagbubuod ng mga frequency ayon sa mga grupo at ipinapakita kung gaano karaming mga yunit ng populasyon ang may mga tampok na halaga na hindi hihigit sa isinasaalang-alang na halaga.


kanin. 2.4. Ogiva distribution ng mga pamilya ayon sa laki ng living space bawat tao

Kapag binubuo ang pinagsama-samang serye ng pagkakaiba-iba ng pagitan, ang mga variant ng serye ay naka-plot sa kahabaan ng abscissa axis, at ang mga naipon na frequency sa kahabaan ng ordinate axis.

Patuloy na serye ng variation

Ang tuluy-tuloy na variational series ay isang serye na binuo batay sa isang quantitative statistical sign. Halimbawa. Ang average na tagal ng mga sakit ng mga bilanggo (mga araw bawat tao) sa panahon ng taglagas-taglamig sa kasalukuyang taon ay:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5

pagkakaiba-iba tinatawag na serye ng pamamahagi na binuo sa isang quantitative na batayan. Ang mga halaga ng mga quantitative na katangian sa mga indibidwal na yunit ng populasyon ay hindi pare-pareho, higit pa o mas kaunti ay naiiba sa bawat isa.

pagkakaiba-iba- pagbabagu-bago, pagkakaiba-iba ng halaga ng katangian sa mga yunit ng populasyon. Ang hiwalay na mga numerical na halaga ng katangiang nagaganap sa pinag-aralan na populasyon ay tinatawag mga pagpipilian mga halaga. Ang kakulangan ng average na halaga para sa isang kumpletong paglalarawan ng populasyon ay ginagawang kinakailangan upang madagdagan ang average na mga halaga ng mga tagapagpahiwatig na ginagawang posible upang masuri ang tipikal ng mga average na ito sa pamamagitan ng pagsukat ng pagbabagu-bago (variation) ng katangian na pinag-aaralan.

Ang pagkakaroon ng pagkakaiba-iba ay dahil sa impluwensya ng isang malaking bilang ng mga kadahilanan sa pagbuo ng antas ng katangian. Ang mga salik na ito ay kumikilos nang may hindi pantay na puwersa at sa iba't ibang direksyon. Ang mga tagapagpahiwatig ng pagkakaiba-iba ay ginagamit upang ilarawan ang sukatan ng pagkakaiba-iba ng katangian.

Mga gawain ng istatistikal na pag-aaral ng pagkakaiba-iba:

  • 1) ang pag-aaral ng kalikasan at antas ng pagkakaiba-iba ng mga palatandaan sa mga indibidwal na yunit ng populasyon;
  • 2) pagpapasiya ng papel ng mga indibidwal na kadahilanan o kanilang mga grupo sa pagkakaiba-iba ng ilang mga tampok ng populasyon.

Sa mga istatistika, ang mga espesyal na pamamaraan para sa pag-aaral ng pagkakaiba-iba ay ginagamit, batay sa paggamit ng isang sistema ng mga tagapagpahiwatig, kasama kung saan sinusukat ang pagkakaiba-iba.

Ang pag-aaral ng pagkakaiba-iba ay mahalaga. Ang pagsukat ng mga variation ay kinakailangan kapag nagsasagawa ng sample observation, correlation at variance analysis, atbp. Ermolaev O.Yu. Mga istatistika ng matematika para sa mga psychologist: Textbook [Text] / O.Yu. Ermolaev. - M.: Flint Publishing House ng Moscow Psychological and Social Institute, 2012. - 335p.

Ayon sa antas ng pagkakaiba-iba, maaaring hatulan ng isa ang homogeneity ng populasyon, ang katatagan ng mga indibidwal na halaga ng mga tampok at ang tipikal ng average. Sa kanilang batayan, ang mga tagapagpahiwatig ng pagiging malapit ng ugnayan sa pagitan ng mga palatandaan, ang mga tagapagpahiwatig para sa pagtatasa ng katumpakan ng pumipili na pagmamasid ay binuo.

Mayroong pagkakaiba-iba sa espasyo at pagkakaiba-iba sa oras.

Ang pagkakaiba-iba sa espasyo ay nauunawaan bilang ang pagbabagu-bago ng mga halaga ng isang tampok sa mga yunit ng populasyon na kumakatawan sa magkahiwalay na mga teritoryo. Sa ilalim ng pagkakaiba-iba ng oras ay sinadya ang pagbabago sa mga halaga ng katangian sa iba't ibang yugto ng panahon.

Upang pag-aralan ang pagkakaiba-iba sa serye ng pamamahagi, ang lahat ng mga variant ng mga halaga ng katangian ay nakaayos sa pataas o pababang pagkakasunud-sunod. Ang prosesong ito ay tinatawag na series ranking.

Ang pinakasimpleng mga palatandaan ng pagkakaiba-iba ay minimum at maximum- ang pinakamaliit at pinakamalaking halaga ng katangian sa pinagsama-samang. Ang bilang ng mga pag-uulit ng mga indibidwal na variant ng mga halaga ng tampok ay tinatawag na dalas ng pag-uulit (fi). Ito ay maginhawa upang palitan ang mga frequency sa mga frequency - wi. Dalas - isang kamag-anak na tagapagpahiwatig ng dalas, na maaaring ipahayag sa mga praksyon ng isang yunit o isang porsyento at nagbibigay-daan sa iyong paghambingin ang serye ng variation na may ibang bilang ng mga obserbasyon. Ipinahayag ng formula:

kung saan Xmax, Xmin - ang maximum at minimum na mga halaga ng katangian sa pinagsama-samang; n ay ang bilang ng mga pangkat.

Upang sukatin ang pagkakaiba-iba ng isang katangian, ginagamit ang iba't ibang absolute at relative indicator. Ang mga ganap na tagapagpahiwatig ng pagkakaiba-iba ay kinabibilangan ng hanay ng pagkakaiba-iba, ang average na linear na paglihis, pagkakaiba, karaniwang paglihis. Ang mga kamag-anak na tagapagpahiwatig ng pagbabagu-bago ay kinabibilangan ng koepisyent ng oscillation, ang kamag-anak na linear deviation, ang koepisyent ng variation.

Isang halimbawa ng paghahanap ng serye ng variation

Mag-ehersisyo. Para sa sample na ito:

  • a) Maghanap ng serye ng variation;
  • b) Buuin ang function ng pamamahagi;

Hindi.=42. Mga sample na item:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Desisyon.

  • a) pagbuo ng isang ranggo na variational series:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) pagbuo ng isang discrete variational series.

Kalkulahin natin ang bilang ng mga pangkat sa serye ng variation gamit ang formula ng Sturgess:

Kunin natin ang bilang ng mga pangkat na katumbas ng 7.

Alam ang bilang ng mga pangkat, kinakalkula namin ang halaga ng agwat:

Para sa kaginhawaan ng pagbuo ng talahanayan, kukunin namin ang bilang ng mga pangkat na katumbas ng 8, ang pagitan ay magiging 1.

kanin. isa Ang dami ng mga benta ng mga kalakal ng tindahan para sa isang tiyak na tagal ng panahon