Paano makahanap ng x mean sa mga istatistika. Mga average na halaga sa mga istatistika

Ayon sa sample na survey, ang mga depositor ay pinagsama ayon sa laki ng deposito sa Sberbank ng lungsod:

tukuyin:

1) saklaw ng pagkakaiba-iba;

2) average na halaga ng deposito;

3) average na linear deviation;

4) pagpapakalat;

5) karaniwang paglihis;

6) koepisyent ng pagkakaiba-iba ng mga kontribusyon.

Desisyon:

Ang serye ng pamamahagi na ito ay naglalaman ng mga bukas na agwat. Sa naturang serye, ang halaga ng pagitan ng unang pangkat ay karaniwang ipinapalagay na katumbas ng halaga ng pagitan ng susunod, at ang halaga ng pagitan ng huling pangkat ay katumbas ng halaga ng pagitan ng nakaraang isa.

Ang halaga ng pagitan ng pangalawang pangkat ay 200, samakatuwid, ang halaga ng unang pangkat ay 200 din. Ang halaga ng pagitan ng penultimate na pangkat ay 200, na nangangahulugan na ang huling pagitan ay magkakaroon din ng halaga na katumbas ng 200.

1) Tukuyin ang hanay ng variation bilang pagkakaiba sa pagitan ng pinakamalaki at pinakamaliit na value ng attribute:

Ang saklaw ng pagkakaiba-iba sa laki ng kontribusyon ay 1000 rubles.

2) Ang average na laki ng kontribusyon ay tinutukoy ng formula ng arithmetic weighted average.

Paunang tukuyin natin ang discrete value ng attribute sa bawat interval. Upang gawin ito, gamit ang simpleng arithmetic mean formula, makikita natin ang mga midpoint ng mga pagitan.

Ang average na halaga ng unang pagitan ay magiging katumbas ng:

ang pangalawa - 500, atbp.

Ilagay natin ang mga resulta ng mga kalkulasyon sa talahanayan:

Halaga ng deposito, kuskusin.Bilang ng mga nag-aambag, fAng gitna ng pagitan, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Kabuuan 400 - 312000

Ang average na deposito sa Sberbank ng lungsod ay magiging 780 rubles:

3) Ang average na linear deviation ay ang arithmetic average ng absolute deviations ng mga indibidwal na halaga ng attribute mula sa kabuuang average:

Ang pamamaraan para sa pagkalkula ng average na linear deviation sa interval distribution series ay ang mga sumusunod:

1. Ang arithmetic weighted average ay kinakalkula, tulad ng ipinapakita sa talata 2).

2. Ang mga ganap na paglihis ng variant mula sa mean ay tinutukoy:

3. Ang mga nakuhang deviation ay pinarami ng mga frequency:

4. Ang kabuuan ng mga weighted deviations ay matatagpuan nang hindi isinasaalang-alang ang sign:

5. Ang kabuuan ng mga weighted deviations ay hinati sa kabuuan ng mga frequency:

Maginhawang gamitin ang talahanayan ng kinakalkula na data:

Halaga ng deposito, kuskusin.Bilang ng mga nag-aambag, fAng gitna ng pagitan, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Kabuuan 400 - - - 81280

Ang average na linear deviation ng laki ng deposito ng mga kliyente ng Sberbank ay 203.2 rubles.

4) Ang dispersion ay ang arithmetic mean ng squared deviations ng bawat feature value mula sa arithmetic mean.

Ang pagkalkula ng pagkakaiba-iba sa serye ng pamamahagi ng agwat ay isinasagawa ayon sa pormula:

Ang pamamaraan para sa pagkalkula ng pagkakaiba-iba sa kasong ito ay ang mga sumusunod:

1. Tukuyin ang arithmetic weighted average, tulad ng ipinapakita sa talata 2).

2. Maghanap ng mga paglihis mula sa mean:

3. Pag-squaring ng deviation ng bawat opsyon mula sa mean:

4. I-multiply ang mga squared deviation sa pamamagitan ng mga timbang (mga frequency):

5. Ibuod ang mga natanggap na gawa:

6. Ang resultang halaga ay hinati sa kabuuan ng mga timbang (mga frequency):

Ilagay natin ang mga kalkulasyon sa isang talahanayan:

Halaga ng deposito, kuskusin.Bilang ng mga nag-aambag, fAng gitna ng pagitan, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Kabuuan 400 - - - 23040000

Kapag pinoproseso ng istatistika ang mga resulta ng mga pag-aaral ng iba't ibang uri, ang mga nakuha na halaga ay madalas na pinagsama sa isang pagkakasunud-sunod ng mga agwat. Upang kalkulahin ang mga pangkalahatang katangian ng naturang mga pagkakasunud-sunod, kung minsan ay kinakailangan upang kalkulahin gitna pagitan- "sentral na opsyon". Ang mga pamamaraan para sa pagkalkula nito ay medyo simple, ngunit mayroon silang ilang mga tampok na nagmula sa parehong sukat na ginamit para sa pagsukat at mula sa likas na katangian ng pagpapangkat (bukas o saradong mga pagitan).

Pagtuturo

Kung ang pagitan ay isang seksyon ng tuluy-tuloy na numerical sequence, kung gayon upang mahanap ang gitna nito, gamitin ang karaniwang mga pamamaraan ng matematika para sa pagkalkula ng arithmetic mean. Pinakamababang halaga pagitan(simula nito) magdagdag ng maximum (end) at hatiin ang resulta sa kalahati - ito ay isang paraan upang makalkula ang arithmetic mean. Halimbawa, nalalapat ang panuntunang ito pagdating sa edad pagitan X. Sabihin na natin mid-age pagitan sa saklaw mula 21 taon hanggang 33 taon magkakaroon ng marka ng 27 taon, mula noong (21 + 33) / 2 = 27.

Minsan mas maginhawang gumamit ng ibang paraan para sa pagkalkula ng arithmetic mean sa pagitan ng upper at lower bounds. pagitan. Sa variant na ito, tukuyin muna ang lapad ng hanay - ibawas ang minimum mula sa maximum na halaga. Pagkatapos ay hatiin ang resultang halaga sa kalahati at idagdag ang resulta sa pinakamababang halaga ng hanay. Halimbawa, kung ang lower bound ay 47.15 at ang upper bound ay 79.13, ang lapad ng range ay magiging 79.13-47.15=31.98. Tapos yung gitna pagitan ay magiging 63.14, dahil 47.15+(31.98/2) = 47.15+15.99 = 63.14.

Kung ang pagitan ay hindi isang seksyon ng karaniwang numerical sequence, pagkatapos ay kalkulahin ito gitna alinsunod sa cyclicity at sukat ng sukat ng pagsukat na ginamit. Halimbawa, kung pinag-uusapan natin ang isang makasaysayang panahon, pagkatapos ay ang gitna pagitan ay magiging isang tiyak na petsa sa kalendaryo. Kaya para sa pagitan Mula Enero 1, 2012 hanggang Enero 31, 2012, ang midpoint ay Enero 16, 2012.

Bilang karagdagan sa karaniwang (sarado) na mga agwat, ang mga pamamaraan ng istatistikal na pananaliksik ay maaari ding gumana sa mga "bukas" na mga pamamaraan. Para sa mga naturang saklaw, hindi tinukoy ang isa sa mga hangganan. Halimbawa, ang isang bukas na pagitan ay maaaring tukuyin bilang "50 taong gulang o mas matanda". Ang gitna sa kasong ito ay tinutukoy ng paraan ng pagkakatulad - kung ang lahat ng iba pang mga saklaw ng pagkakasunud-sunod na isinasaalang-alang ay may parehong lapad, pagkatapos ay ipinapalagay na ang bukas na pagitan na ito ay may parehong sukat. Kung hindi, kailangan mong tukuyin ang dynamics ng pagbabago sa lapad ng mga agwat bago ang bukas, at makuha ang kondisyonal na lapad nito batay sa nagresultang trend ng pagbabago.

Pagtuturo

Kung ang agwat ay isang seksyon ng tuluy-tuloy na numerical sequence, kung gayon upang mahanap ang gitna nito, gumamit ng mga mathematical na pamamaraan para sa pagkalkula ng arithmetic mean. Idagdag ang minimum na halaga (simula nito) sa maximum () at hatiin ang resulta sa kalahati - ito ay isang paraan upang makalkula ang arithmetic mean. Halimbawa, naaangkop ito pagdating sa edad pagitan X. Sabihin na natin mid-age pagitan sa saklaw mula 21 taon hanggang 33 taon magkakaroon ng marka ng 27 taon, mula noong (21 + 33) / 2 = 27.

Minsan mas maginhawang gumamit ng ibang paraan para sa pagkalkula ng arithmetic mean sa pagitan ng upper at lower bounds. pagitan. Sa variant na ito, tukuyin muna ang lapad ng hanay - ibawas ang minimum mula sa maximum na halaga. Pagkatapos ay hatiin ang resultang halaga sa kalahati at idagdag ang resulta sa pinakamababang halaga ng hanay. Halimbawa, kung ang ibabang halaga ay 47.15 at ang pinakamataas na halaga ay 79.13, ang lapad ng hanay ay magiging 79.13-47.15=31.98. Tapos yung gitna pagitan ay magiging 63.14, dahil 47.15+(31.98/2) = 47.15+15.99 = 63.14.

Kung ang pagitan ay hindi isang seksyon ng karaniwang numerical sequence, pagkatapos ay kalkulahin ito gitna alinsunod sa cyclicity at sukat ng sukat ng pagsukat na ginamit. Halimbawa, kung pinag-uusapan natin ang isang makasaysayang panahon, pagkatapos ay ang gitna pagitan ay magiging isang tiyak na petsa sa kalendaryo. Kaya para sa pagitan Mula Enero 1, 2012 hanggang Enero 31, 2012, ang midpoint ay Enero 16, 2012.

Bilang karagdagan sa karaniwang (sarado) na mga agwat, ang mga pamamaraan ng istatistikal na pananaliksik ay maaari ding gumana sa mga "bukas" na mga pamamaraan. Para sa mga naturang saklaw, hindi tinukoy ang isa sa mga hangganan. Halimbawa, ang isang bukas na pagitan ay maaaring tukuyin bilang "50 taong gulang o mas matanda". Ang gitna sa kasong ito ay tinutukoy ng paraan ng pagkakatulad - kung ang lahat ng iba pang mga saklaw ng pagkakasunud-sunod na isinasaalang-alang ay may parehong lapad, pagkatapos ay ipinapalagay na ang bukas na agwat na ito ay pareho. Kung hindi, kailangan mong matukoy ang dynamics ng lapad ng mga agwat bago ang bukas, at ang kondisyonal na lapad nito, batay sa nagresultang pagbabago ng trend.

Mga pinagmumulan:

  • ano ang open interval

Kapag nag-aaral ng pagkakaiba-iba - mga pagkakaiba sa mga indibidwal na halaga ng isang katangian sa mga yunit ng populasyon na pinag-aaralan - isang bilang ng mga ganap at kamag-anak na mga tagapagpahiwatig ay kinakalkula. Sa pagsasagawa, ang koepisyent ng pagkakaiba-iba ay natagpuan ang pinakamalaking aplikasyon sa mga kamag-anak na tagapagpahiwatig.

Pagtuturo

Pakitandaan na ang koepisyent ng pagkakaiba-iba ay ginagamit sa pagsasanay hindi lamang para sa isang paghahambing na pagtatasa ng pagkakaiba-iba, kundi pati na rin para sa pagkilala sa homogeneity ng populasyon. Kung ang tagapagpahiwatig na ito ay hindi lalampas sa 0.333, o 33.3%, ang pagkakaiba-iba ng katangian ay itinuturing na mahina, at kung ito ay higit sa 0.333, ito ay itinuturing na malakas. Sa kaso ng malakas na pagkakaiba-iba, ang istatistikal na populasyon sa ilalim ng pag-aaral ay itinuturing na heterogenous, at ang average na halaga ay itinuturing na hindi tipikal; hindi ito maaaring gamitin bilang isang pangkalahatang tagapagpahiwatig ng populasyon na ito. Ang mas mababang limitasyon ng koepisyent ng pagkakaiba-iba ay zero; walang pinakamataas na limitasyon. Gayunpaman, kasabay ng pagtaas ng variation ng isang feature, tumataas din ang halaga nito.

Kapag kinakalkula ang koepisyent ng variation, kakailanganin mong gamitin ang mean deviation. Ito ay tinukoy bilang square root, na kung saan ay mahahanap mo ang mga sumusunod: D \u003d Σ (X-Xav) ^ 2 / N. Sa madaling salita, ang variance ay ang average na parisukat ng deviation mula sa arithmetic mean. tinutukoy kung gaano kalaki ang mga tukoy na tagapagpahiwatig ng serye na lumilihis sa average mula sa kanilang average na halaga. Ito ay isang ganap na sukatan ng pagbabagu-bago ng isang katangian, at samakatuwid ay malinaw na binibigyang-kahulugan.

Kadalasan sa mga istatistika, kapag sinusuri ang isang kababalaghan o proseso, kinakailangang isaalang-alang hindi lamang ang impormasyon tungkol sa mga average na antas ng pinag-aralan na mga tagapagpahiwatig, kundi pati na rin scatter o pagkakaiba-iba sa mga halaga ng mga indibidwal na yunit , na isang mahalagang katangian ng pinag-aralan na populasyon.

Ang mga presyo ng stock, dami ng supply at demand, mga rate ng interes sa iba't ibang yugto ng panahon at sa iba't ibang lugar ay napapailalim sa pinakamalaking pagkakaiba-iba.

Ang mga pangunahing tagapagpahiwatig na nagpapakilala sa pagkakaiba-iba , ay ang range, variance, standard deviation at coefficient of variation.

Pagbabago ng span ay ang pagkakaiba sa pagitan ng maximum at minimum na mga halaga ng katangian: R = Xmax – Xmin. Ang kawalan ng tagapagpahiwatig na ito ay sinusuri lamang nito ang mga hangganan ng pagkakaiba-iba ng katangian at hindi sumasalamin sa pagbabagu-bago nito sa loob ng mga hangganang ito.

Pagpapakalat wala sa pagkukulang na ito. Kinakalkula ito bilang average na parisukat ng mga paglihis ng mga halaga ng katangian mula sa kanilang average na halaga:

Pinasimpleng paraan upang makalkula ang pagkakaiba ay isinasagawa gamit ang mga sumusunod na formula (simple at may timbang):

Ang mga halimbawa ng aplikasyon ng mga formula na ito ay ipinakita sa mga gawain 1 at 2.

Ang isang malawak na ginagamit na tagapagpahiwatig sa pagsasanay ay karaniwang lihis :

Ang standard deviation ay tinukoy bilang square root ng variance at may parehong dimensyon sa trait na pinag-aaralan.

Ginagawang posible ng mga itinuturing na tagapagpahiwatig na makuha ang ganap na halaga ng pagkakaiba-iba, i.e. suriin ito sa mga yunit ng sukat ng katangiang pinag-aaralan. Hindi tulad nila, ang koepisyent ng pagkakaiba-iba sinusukat ang pagbabagu-bago sa mga kamag-anak na termino - nauugnay sa average na antas, na sa maraming mga kaso ay mas kanais-nais.

Formula para sa pagkalkula ng koepisyent ng pagkakaiba-iba.

Mga halimbawa ng paglutas ng mga problema sa paksang "Mga tagapagpahiwatig ng pagkakaiba-iba sa mga istatistika"

Gawain 1 . Kapag pinag-aaralan ang impluwensya ng advertising sa laki ng average na buwanang deposito sa mga bangko ng rehiyon, 2 bangko ang sinuri. Ang mga sumusunod na resulta ay nakuha:

tukuyin:
1) para sa bawat bangko: a) average na buwanang deposito; b) pagpapakalat ng kontribusyon;
2) ang average na buwanang deposito para sa dalawang bangko na magkasama;
3) Pagpapakalat ng deposito para sa 2 bangko, depende sa advertising;
4) Pagpapakalat ng deposito para sa 2 bangko, depende sa lahat ng mga kadahilanan maliban sa advertising;
5) Kabuuang pagkakaiba-iba gamit ang panuntunan sa karagdagan;
6) Koepisyent ng pagpapasiya;
7) Kaugnayang ugnayan.

Desisyon

1) Gumawa tayo ng talahanayan ng pagkalkula para sa isang bangko na may advertising . Upang matukoy ang average na buwanang deposito, hinahanap namin ang mga midpoint ng mga pagitan. Sa kasong ito, ang halaga ng bukas na agwat (ang una) ay may kondisyon na katumbas sa halaga ng agwat na katabi nito (ang pangalawa).

Nahanap namin ang average na laki ng kontribusyon gamit ang weighted arithmetic mean formula:

29,000/50 = 580 rubles

Ang pagpapakalat ng kontribusyon ay matatagpuan sa pamamagitan ng formula:

23 400/50 = 468

Magsasagawa kami ng mga katulad na aksyon para sa isang bangko na walang mga ad :

2) Hanapin ang average na deposito para sa dalawang bangko nang magkasama. Xav \u003d (580 × 50 + 542.8 × 50) / 100 \u003d 561.4 rubles.

3) Ang pagkakaiba-iba ng deposito, para sa dalawang bangko, depende sa advertising, makikita natin sa pamamagitan ng formula: σ 2 =pq (formula ng variance ng isang alternatibong sign). Dito ang p=0.5 ay ang proporsyon ng mga salik na nakadepende sa advertising; q=1-0.5, pagkatapos ay σ 2 =0.5*0.5=0.25.

4) Dahil ang bahagi ng iba pang mga kadahilanan ay 0.5, kung gayon ang pagkakaiba-iba ng deposito para sa dalawang bangko, na nakasalalay sa lahat ng mga kadahilanan maliban sa advertising, ay 0.25 din.

5) Tukuyin ang kabuuang pagkakaiba gamit ang tuntunin sa pagdaragdag.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 \u003d σ 2 katotohanan + σ 2 pahinga \u003d 552.08 + 345.96 \u003d 898.04

6) Coefficient of determination η 2 = σ 2 fact / σ 2 = 345.96/898.04 = 0.39 = 39% - ang laki ng kontribusyon ay depende sa advertising ng 39%.

7) Empirical correlation ratio η = √η 2 = √0.39 = 0.62 - medyo malapit ang relasyon.

Gawain 2 . Mayroong isang pagpapangkat ng mga negosyo ayon sa halaga ng mga mabibiling produkto:

Tukuyin: 1) ang pagpapakalat ng halaga ng mga mabibiling produkto; 2) karaniwang paglihis; 3) koepisyent ng pagkakaiba-iba.

Desisyon

1) Sa pamamagitan ng kundisyon, ipinakita ang isang serye ng pamamahagi ng pagitan. Dapat itong ipahayag nang discretely, iyon ay, hanapin ang gitna ng pagitan (x "). Sa mga pangkat ng mga saradong agwat, makikita natin ang gitna sa pamamagitan ng isang simpleng arithmetic mean. Sa mga pangkat na may pinakamataas na limitasyon, bilang pagkakaiba sa pagitan ng pinakamataas na limitasyong ito. at kalahati ng laki ng pagitan kasunod nito (200-(400 -200):2=100).

Sa mga pangkat na may mas mababang limitasyon - ang kabuuan ng mas mababang limitasyong ito at kalahati ng laki ng nakaraang agwat (800+(800-600):2=900).

Ang pagkalkula ng average na halaga ng mga mabibiling produkto ay ginagawa ayon sa pormula:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Dito ang a=500 ay ang laki ng variant sa pinakamataas na frequency, ang k=600-400=200 ay ang laki ng pagitan sa pinakamataas na dalas Ilagay natin ang resulta sa isang talahanayan:

Kaya, ang average na halaga ng mabibiling output para sa panahon na pinag-aaralan sa kabuuan ay Xav = (-5:37) × 200 + 500 = 472.97 thousand rubles.

2) Nahanap namin ang dispersion gamit ang sumusunod na formula:

σ 2 \u003d (33/37) * 2002-(472.97-500) 2 \u003d 35,675.67-730.62 \u003d 34,945.05

3) standard deviation: σ = ±√σ 2 = ±√34 945.05 ≈ ±186.94 thousand rubles.

4) koepisyent ng pagkakaiba-iba: V \u003d (σ / Xav) * 100 \u003d (186.94 / 472.97) * 100 \u003d 39.52%

Ang mga palatandaan ng mga yunit ng mga pinagsama-samang istatistika ay naiiba sa kanilang kahulugan, halimbawa, ang sahod ng mga manggagawa ng isang propesyon ng isang negosyo ay hindi pareho para sa parehong tagal ng panahon, ang mga presyo sa merkado para sa parehong mga produkto ay naiiba, ang mga ani ng pananim sa mga bukid ng rehiyon, atbp. Samakatuwid, upang matukoy ang halaga ng isang tampok na katangian ng buong populasyon ng mga yunit sa ilalim ng pag-aaral, ang mga average na halaga ay kinakalkula.
average na halaga ito ay isang pangkalahatang katangian ng hanay ng mga indibidwal na halaga ng ilang quantitative na katangian.

Ang populasyon na pinag-aralan ng isang quantitative attribute ay binubuo ng mga indibidwal na halaga; sila ay naiimpluwensyahan ng parehong pangkalahatang mga sanhi at indibidwal na mga kondisyon. Sa average na halaga, ang mga deviations na katangian ng mga indibidwal na halaga ay kinansela. Ang average, bilang isang function ng isang set ng mga indibidwal na halaga, ay kumakatawan sa buong set na may isang halaga at sumasalamin sa karaniwang bagay na likas sa lahat ng mga yunit nito.

Tinatawag ang average na kinakalkula para sa mga populasyon na binubuo ng qualitatively homogenous units karaniwang average. Halimbawa, maaari mong kalkulahin ang average na buwanang suweldo ng isang empleyado ng isa o ibang propesyonal na grupo (miner, doktor, librarian). Siyempre, ang mga antas ng buwanang sahod ng mga minero, dahil sa pagkakaiba sa kanilang mga kwalipikasyon, haba ng serbisyo, oras na nagtrabaho bawat buwan at maraming iba pang mga kadahilanan, ay naiiba sa bawat isa, at mula sa antas ng karaniwang sahod. Gayunpaman, ang average na antas ay sumasalamin sa mga pangunahing kadahilanan na nakakaapekto sa antas ng sahod, at kapwa na-offset ang mga pagkakaiba na lumitaw dahil sa mga indibidwal na katangian ng empleyado. Ang karaniwang sahod ay sumasalamin sa karaniwang antas ng sahod para sa ganitong uri ng manggagawa. Ang pagkuha ng karaniwang average ay dapat na mauna sa pamamagitan ng pagsusuri kung paano ang populasyon na ito ay qualitatively homogenous. Kung ang populasyon ay binubuo ng magkakahiwalay na bahagi, dapat itong hatiin sa mga tipikal na grupo (average na temperatura sa ospital).

Ang mga average na halaga na ginagamit bilang mga katangian para sa mga heterogenous na populasyon ay tinatawag mga average ng system. Halimbawa, ang average na halaga ng gross domestic product (GDP) per capita, ang average na pagkonsumo ng iba't ibang grupo ng mga produkto bawat tao at iba pang katulad na halaga na kumakatawan sa mga pangkalahatang katangian ng estado bilang isang solong sistema ng ekonomiya.

Ang average ay dapat kalkulahin para sa mga populasyon na binubuo ng isang sapat na malaking bilang ng mga yunit. Ang pagsunod sa kondisyong ito ay kinakailangan upang ang batas ng malalaking numero ay magkabisa, bilang isang resulta kung saan ang mga random na paglihis ng mga indibidwal na dami mula sa pangkalahatang kalakaran ay kanselahin ang bawat isa.

Mga uri ng mga average at pamamaraan para sa pagkalkula ng mga ito

Ang pagpili ng uri ng average ay tinutukoy ng pang-ekonomiyang nilalaman ng isang tiyak na tagapagpahiwatig at ang paunang data. Gayunpaman, dapat kalkulahin ang anumang average na halaga upang kapag pinalitan nito ang bawat variant ng na-average na feature, ang pangwakas, generalizing, o, gaya ng karaniwang tawag dito, ay hindi magbabago. tagapagpahiwatig ng pagtukoy, na nauugnay sa average. Halimbawa, kapag pinapalitan ang aktwal na bilis sa magkahiwalay na mga seksyon ng landas, hindi dapat baguhin ng kanilang average na bilis ang kabuuang distansya na nilakbay ng sasakyan sa parehong oras; kapag pinapalitan ang aktwal na sahod ng mga indibidwal na empleyado ng negosyo ng karaniwang sahod, hindi dapat magbago ang pondo ng sahod. Dahil dito, sa bawat partikular na kaso, depende sa likas na katangian ng magagamit na data, mayroon lamang isang tunay na average na halaga ng indicator na sapat sa mga katangian at kakanyahan ng socio-economic phenomenon na pinag-aaralan.
Ang pinakakaraniwang ginagamit ay ang arithmetic mean, harmonic mean, geometric mean, mean square, at mean cubic.
Ang mga nakalistang average ay nabibilang sa klase kapangyarihan average at pinagsama ng pangkalahatang formula:
,
nasaan ang average na halaga ng pinag-aralan na katangian;
m ay ang exponent ng mean;
– kasalukuyang halaga (variant) ng na-average na tampok;
n ay ang bilang ng mga tampok.
Depende sa halaga ng exponent m, ang mga sumusunod na uri ng mga average ng kapangyarihan ay nakikilala:
sa m = -1 – mean harmonic ;
sa m = 0 – geometric na ibig sabihin ;
sa m = 1 – arithmetic mean;
sa m = 2 – root mean square;
sa m = 3 - average na kubiko.
Kapag gumagamit ng parehong paunang data, mas malaki ang exponent m sa formula sa itaas, mas malaki ang halaga ng average na halaga:
.
Ang pag-aari na ito ng kapangyarihan-batas ay nangangahulugang tumaas na may pagtaas sa exponent ng pagtukoy ng function ay tinatawag ang tuntunin ng mayorya ng paraan.
Ang bawat isa sa mga minarkahang average ay maaaring magkaroon ng dalawang anyo: simple lang at natimbang.
Ang simpleng anyo ng gitna nalalapat kapag ang average ay kinakalkula sa pangunahing (ungrouped) data. timbang na anyo– kapag kinakalkula ang average para sa pangalawang (nakapangkat) na data.

Ang ibig sabihin ng aritmetika

Ang arithmetic mean ay ginagamit kapag ang dami ng populasyon ay ang kabuuan ng lahat ng mga indibidwal na halaga ng iba't ibang katangian. Dapat tandaan na kung ang uri ng average ay hindi ipinahiwatig, ang arithmetic average ay ipinapalagay. Ang lohikal na formula nito ay:

simpleng ibig sabihin ng aritmetika kalkulado sa pamamagitan ng ungrouped data ayon sa formula:
o,
nasaan ang mga indibidwal na halaga ng tampok;
j ay ang serial number ng yunit ng pagmamasid, na kung saan ay nailalarawan sa pamamagitan ng halaga ;
Ang N ay ang bilang ng mga yunit ng pagmamasid (set size).
Halimbawa. Sa panayam na "Buod at pagpapangkat ng data ng istatistika", ang mga resulta ng pagmamasid sa karanasan sa trabaho ng isang pangkat ng 10 tao ay isinasaalang-alang. Kalkulahin ang karaniwang karanasan sa trabaho ng mga manggagawa ng brigada. 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.

Ayon sa pormula ng arithmetic mean simple, isa rin ang kinakalkula kronolohikal na mga average, kung ang mga agwat ng oras kung saan ipinakita ang mga katangian ng mga halaga ay pantay.
Halimbawa. Ang dami ng mga produktong naibenta para sa unang quarter ay umabot sa 47 den. mga yunit, para sa pangalawang 54, para sa ikatlong 65 at para sa ikaapat na 58 den. mga yunit Ang average na quarterly turnover ay (47+54+65+58)/4 = 56 den. mga yunit
Kung ang mga panandaliang tagapagpahiwatig ay ibinigay sa magkakasunod na serye, kung gayon kapag kinakalkula ang average, sila ay pinalitan ng kalahating kabuuan ng mga halaga sa simula at pagtatapos ng panahon.
Kung mayroong higit sa dalawang sandali at ang mga pagitan sa pagitan ng mga ito ay pantay, kung gayon ang average ay kinakalkula gamit ang formula para sa average na kronolohikal.

,
kung saan ang n ay ang bilang ng mga punto ng oras
Kapag ang data ay nakapangkat ayon sa mga halaga ng katangian (i.e., isang discrete variational distribution series ang binuo) na may weighted arithmetic mean ay kinakalkula gamit ang alinman sa mga frequency , o mga frequency ng pagmamasid ng mga partikular na halaga ng tampok , ang bilang kung saan (k) ay makabuluhang mas mababa kaysa sa bilang ng mga obserbasyon (N) .
,
,
kung saan ang k ay ang bilang ng mga pangkat ng serye ng variation,
i ang bilang ng pangkat ng serye ng variation.
Dahil , at , nakukuha namin ang mga formula na ginagamit para sa mga praktikal na kalkulasyon:
at
Halimbawa. Kalkulahin natin ang average na haba ng serbisyo ng mga nagtatrabahong pangkat para sa nakagrupong serye.
a) gamit ang mga frequency:

b) gamit ang mga frequency:

Kapag ang data ay nakapangkat ayon sa mga pagitan , ibig sabihin. ay ipinakita sa anyo ng serye ng pamamahagi ng agwat; kapag kinakalkula ang ibig sabihin ng aritmetika, ang gitna ng agwat ay kinukuha bilang halaga ng tampok, batay sa pagpapalagay ng isang pare-parehong pamamahagi ng mga yunit ng populasyon sa pagitan na ito. Ang pagkalkula ay isinasagawa ayon sa mga formula:
at
nasaan ang gitna ng pagitan: ,
kung saan at ang ibaba at itaas na mga hangganan ng mga pagitan (sa kondisyon na ang itaas na hangganan ng pagitan na ito ay tumutugma sa mas mababang hangganan ng susunod na pagitan).

Halimbawa. Kalkulahin natin ang arithmetic mean ng interval variation series na binuo mula sa mga resulta ng pag-aaral ng taunang sahod ng 30 manggagawa (tingnan ang lecture na "Buod at pagpapangkat ng statistical data").
Talahanayan 1 - Interval variation series of distribution.

Mga pagitan, UAH

Dalas, pers.

dalas,

Ang gitna ng pagitan

600-700
700-800
800-900
900-1000
1000-1100
1100-1200

3
6
8
9
3
1

0,10
0,20
0,267
0,30
0,10
0,033

(600+700):2=650
(700+800):2=750
850
950
1050
1150

1950
4500
6800
8550
3150
1150

65
150
226,95
285
105
37,95

UAH o UAH
Ang ibig sabihin ng aritmetika na kinakalkula batay sa paunang data at serye ng pagkakaiba-iba ng pagitan ay maaaring hindi magkatugma dahil sa hindi pantay na pamamahagi ng mga halaga ng katangian sa loob ng mga pagitan. Sa kasong ito, para sa isang mas tumpak na pagkalkula ng arithmetic weighted average, hindi dapat gamitin ang gitna ng mga pagitan, ngunit ang arithmetic simple average na kinakalkula para sa bawat pangkat ( mga average ng grupo). Ang average na kinakalkula mula sa pangkat ay nangangahulugang gamit ang isang timbang na formula ng pagkalkula ay tinatawag pangkalahatang average.
Ang arithmetic mean ay may ilang mga katangian.
1. Ang kabuuan ng mga deviations ng variant mula sa mean ay zero:
.
2. Kung ang lahat ng mga halaga ng opsyon ay tumaas o bumaba ng halaga A, ang average na halaga ay tumataas o bumaba ng parehong halaga A:

3. Kung ang bawat opsyon ay nadagdagan o nababawasan ng B beses, ang average na halaga ay tataas o bababa din sa parehong bilang ng beses:
o
4. Ang kabuuan ng mga produkto ng variant sa pamamagitan ng mga frequency ay katumbas ng produkto ng average na halaga sa pamamagitan ng kabuuan ng mga frequency:

5. Kung ang lahat ng frequency ay hinati o i-multiply sa anumang numero, hindi magbabago ang arithmetic mean:

6) kung sa lahat ng mga pagitan ang mga frequency ay katumbas ng bawat isa, kung gayon ang arithmetic weighted average ay katumbas ng simpleng arithmetic average:
,
kung saan ang k ay ang bilang ng mga pangkat sa serye ng variation.

Ang paggamit ng mga katangian ng average ay nagpapahintulot sa iyo na gawing simple ang pagkalkula nito.
Ipagpalagay na ang lahat ng mga opsyon (x) ay unang binabawasan ng parehong numero A, at pagkatapos ay binabawasan ng isang kadahilanan ng B. Ang pinakamalaking pagpapasimple ay makakamit kapag ang halaga ng gitna ng agwat na may pinakamataas na dalas ay pinili bilang A, at ang halaga ng agwat bilang B (para sa mga hilera na may parehong mga agwat). Ang dami A ay tinatawag na pinagmulan, kaya ang pamamaraang ito ng pagkalkula ng average ay tinatawag paraan b ohm reference mula sa conditional zero o paraan ng mga sandali.
Pagkatapos ng naturang pagbabago, kumuha kami ng bagong variational distribution series, na ang mga variant ay katumbas ng . Ang kanilang arithmetic mean, tinatawag sandali ng unang order, ay ipinahayag ng formula at ayon sa pangalawa at pangatlong katangian, ang arithmetic mean ay katumbas ng mean ng orihinal na bersyon, na binawasan muna ng A, at pagkatapos ay ng B beses, ibig sabihin.
Upang makatanggap tunay na average(gitna ng orihinal na hilera) kailangan mong i-multiply ang sandali ng unang pagkakasunud-sunod sa B at idagdag ang A:

Ang pagkalkula ng arithmetic mean sa pamamagitan ng paraan ng mga sandali ay inilalarawan ng data sa Talahanayan. 2.
Talahanayan 2 - Pamamahagi ng mga empleyado ng enterprise shop ayon sa haba ng serbisyo


Karanasan sa trabaho, taon

Dami ng manggagawa

Interval midpoint

0 – 5
5 – 10
10 – 15
15 – 20
20 – 25
25 – 30

12
16
23
28
17
14

2,5
7,5
12,7
17,5
22,5
27,5

15
-10
-5
0
5
10

3
-2
-1
0
1
2

36
-32
-23
0
17
28

Paghahanap ng sandali ng unang order . Pagkatapos, alam na A = 17.5, at B = 5, kinakalkula namin ang average na karanasan sa trabaho ng mga manggagawa sa tindahan:
taon

Average na harmonic
Gaya ng ipinakita sa itaas, ang arithmetic mean ay ginagamit upang kalkulahin ang average na halaga ng isang feature sa mga kaso kung saan ang mga variant nito x at ang kanilang mga frequency f ay kilala.
Kung ang istatistikal na impormasyon ay hindi naglalaman ng mga frequency f para sa mga indibidwal na opsyon x ng populasyon, ngunit ipinakita bilang kanilang produkto, ang formula ay inilapat average na maharmonya na timbang. Upang kalkulahin ang average, tukuyin , kung saan . Ang pagpapalit ng mga expression na ito sa weighted arithmetic mean formula, makuha namin ang weighted harmonic mean formula:
,
kung saan ang dami (bigat) ng mga halaga ng katangian ng tagapagpahiwatig sa pagitan na may numero i (i=1,2, …, k).

Kaya, ang harmonic mean ay ginagamit sa mga kaso kung saan hindi ang mga pagpipilian mismo ang napapailalim sa pagbubuod, ngunit ang kanilang mga kapalit: .
Sa mga kaso kung saan ang bigat ng bawat opsyon ay katumbas ng isa, i.e. Ang mga indibidwal na halaga ng kabaligtaran na tampok ay nangyayari nang isang beses, ilapat simpleng harmonic na ibig sabihin:
,
nasaan ang mga indibidwal na variant ng kabaligtaran na katangian na nangyayari nang isang beses;
Ang N ay ang bilang ng mga opsyon.
Kung mayroong mga harmonic na average para sa dalawang bahagi ng populasyon na may bilang ng at, kung gayon ang kabuuang average para sa buong populasyon ay kinakalkula ng formula:

at tinawag weighted harmonic mean ng ibig sabihin ng grupo.

Halimbawa. Tatlong deal ang ginawa sa unang oras ng pangangalakal sa palitan ng pera. Ang data sa halaga ng mga benta ng hryvnia at ang halaga ng palitan ng hryvnia laban sa dolyar ng US ay ibinibigay sa Talahanayan. 3 (kolumna 2 at 3). Tukuyin ang average na halaga ng palitan ng hryvnia laban sa dolyar ng US para sa unang oras ng pangangalakal.
Talahanayan 3 - Data sa kurso ng pangangalakal sa palitan ng pera

Ang average na halaga ng palitan ng dolyar ay tinutukoy ng ratio ng halaga ng mga hryvnia na ibinebenta sa kurso ng lahat ng mga transaksyon sa halaga ng mga dolyar na nakuha bilang resulta ng parehong mga transaksyon. Ang kabuuang halaga ng benta ng hryvnia ay kilala mula sa column 2 ng talahanayan, at ang halaga ng mga dolyar na binili sa bawat transaksyon ay tinutukoy sa pamamagitan ng paghahati ng halaga ng benta ng hryvnia sa halaga ng palitan nito (column 4). Isang kabuuang $22 milyon ang nabili sa tatlong transaksyon. Nangangahulugan ito na ang average na halaga ng palitan ng Hryvnia para sa isang dolyar ay
.
Ang resultang halaga ay totoo, dahil ang kanyang pagpapalit ng aktwal na halaga ng palitan ng hryvnia sa mga transaksyon ay hindi magbabago sa kabuuang halaga ng mga benta ng hryvnia, na nagsisilbing tagapagpahiwatig ng pagtukoy: mln. UAH
Kung ang arithmetic mean ay ginamit para sa pagkalkula, i.e. Hryvnia, pagkatapos ay sa halaga ng palitan para sa pagbili ng 22 milyong dolyar. UAH 110.66 milyon ang kailangang gastusin, na hindi totoo.

Geometric ibig sabihin
Ang geometric na ibig sabihin ay ginagamit upang pag-aralan ang dynamics ng mga phenomena at nagbibigay-daan sa iyo upang matukoy ang average na rate ng paglago. Kapag kinakalkula ang geometric mean, ang mga indibidwal na halaga ng katangian ay mga kamag-anak na tagapagpahiwatig ng dinamika, na binuo sa anyo ng mga halaga ng chain, bilang ratio ng bawat antas sa nauna.
Ang geometric simple mean ay kinakalkula ng formula:
,
nasaan ang tanda ng produkto,
Ang N ay ang bilang ng mga na-average na halaga.
Halimbawa. Ang bilang ng mga rehistradong krimen sa loob ng 4 na taon ay tumaas ng 1.57 beses, kabilang ang para sa una - ng 1.08 beses, para sa ika-2 - ng 1.1 beses, para sa ika-3 - ng 1.18 at para sa ika-4 - 1.12 beses. Kung gayon ang average na taunang rate ng paglago ng bilang ng mga krimen ay: , i.e. Ang bilang ng mga rehistradong krimen ay lumaki ng average na 12% taun-taon.

1,8
-0,8
0,2
1,0
1,4

1
3
4
1
1

3,24
0,64
0,04
1
1,96

3,24
1,92
0,16
1
1,96

Upang kalkulahin ang mean square weighted, tinutukoy namin at ipinasok sa talahanayan at. Kung gayon ang average na halaga ng mga paglihis ng haba ng mga produkto mula sa isang naibigay na pamantayan ay katumbas ng:

Ang ibig sabihin ng aritmetika sa kasong ito ay hindi angkop, dahil bilang resulta, makakakuha tayo ng zero deviation.
Ang paggamit ng root mean square ay tatalakayin mamaya sa exponents of variation.