Tukuyin ang m arithmetic mean sa pamamagitan ng paraan ng mga sandali. Pagkalkula ng arithmetic mean na natimbang ng paraan ng mga sandali

Sa isang malaking bilang ng mga obserbasyon o may malaking numerong halaga, ang opsyon ay ginagamit

isang pinasimpleng paraan upang makalkula ang arithmetic mean ay ang paraan ng mga sandali.

M = A+ iSap

kung saan ang M ay ang arithmetic mean; A - conditional average; i - agwat sa pagitan ng opsyon ng mga grupo;

S - tanda ng pagbubuod.; a - conditional deviation ng bawat opsyon mula sa conditional average;

p ay ang dalas ng paglitaw ng variant; n ay ang bilang ng mga obserbasyon.

Isang halimbawa ng pagkalkula ng arithmetic mean sa pamamagitan ng paraan ng mga sandali (average na timbang ng katawan

mga batang wala pang 18 taong gulang)

V(n sa kg) R a (V-A) a. R
+2 +4
+1 +3
M o \u003d 62
-1 -6
-2 -8
-3 -3
n = 25 Sar \u003d - 10 kg

Mga yugto ng pagkalkula ng average sa pamamagitan ng paraan ng mga sandali:

2) tinutukoy namin ang "a" - ang conditional deviation ng mga opsyon mula sa conditional average, para dito ibinabawas namin ang conditional average mula sa bawat opsyon: isang \u003d V - A, (halimbawa, isang \u003d 64 - 62 \u003d + 2, atbp.).

3) pinarami namin ang conditional deviation "a" sa dalas ng "p" ng bawat opsyon at makuha ang produkto a p;

4) hanapin ang kabuuan Sa. p = - 10kg

5) kalkulahin ang arithmetic mean sa pamamagitan ng paraan ng mga sandali:

M = A + i SaP\u003d 62 - 1 × 0.4 \u003d 61.6 kg

Kaya, maaari nating tapusin na sa grupo ng mga kabataang lalaki na pinag-aralan natin, ang average na timbang ng katawan

Ang arithmetic mean mismo ay walang sinasabi tungkol sa variational series kung saan

siya ay kalkulado. Ang typicality (reliability) nito ay apektado ng homogeneity ng isinasaalang-alang

pagkakaiba-iba ng materyal at serye.

Halimbawa: dalawang variational series na magkapareho sa bilang ng mga obserbasyon ang ibinigay, kung saan

nagpapakita ng data ng pagsukat ng circumference ng ulo ng mga batang may edad na 1 hanggang 2 taon

Ang pagkakaroon ng parehong bilang ng mga obserbasyon at ang parehong arithmetic ay nangangahulugan (M = 46 cm), ang serye

may mga pagkakaiba sa pamamahagi sa loob. Kaya ang mga variant ng unang hilera ay lumihis sa pangkalahatan mula sa

arithmetic mean na may mas mababang halaga kaysa sa mga opsyon sa pangalawang hilera, na nagbibigay

posibilidad na ipagpalagay na ang arithmetic mean (46 cm) ay mas tipikal para sa una

hilera kaysa sa pangalawa.

Sa mga istatistika, upang makilala ang pagkakaiba-iba ng serye ng pagkakaiba-iba, ginagamit nila ang karaniwan

karaniwang lihis(mga)

Mayroong dalawang paraan upang makalkula ang karaniwang paglihis: arithmetic mean

paraan at paraan ng mga sandali. Gamit ang arithmetic mean na paraan ng pagkalkula, ang formula ay ginagamit:

kung saan ang d ay ang tunay na paglihis ng bawat opsyon mula sa tunay na mean M. Ang formula ay ginagamit kapag

isang maliit na bilang ng mga obserbasyon (n<30)

Formula para sa pagtukoy ng s sa pamamagitan ng paraan ng mga sandali:

kung saan ang a ay ang conditional deviation ng mga opsyon mula sa conditional average;

Ang sandali ng ikalawang antas, at ang sandali ng unang antas, parisukat.

Ito ay theoretically at praktikal na pinatunayan na kung, sa isang malaking bilang ng mga obserbasyon, sa average

aritmetika idagdag at ibawas mula dito 1s (M ± 1s), pagkatapos ay sa loob ng nakuha na mga halaga

68.3% ng lahat ng variant ng variation series ay makikita. Kung sa arithmetic mean

magdagdag at magbawas ng 2s (M ± 2s), pagkatapos ay 95.5% ang nasa loob ng mga nakuhang halaga

lahat ng pagpipilian. Kasama sa M ±3s ang 99.7% ng lahat ng variant ng serye ng variation.

Batay sa probisyong ito, posibleng suriin ang typicality ng arithmetic mean para sa

variational series kung saan ito kinakalkula. Para sa mga ito, ito ay kinakailangan sa average

magdagdag ng arithmetic at ibawas ng tatlong beses s (M ± 3s) mula dito. Kung sa loob ng limitasyon

binigyan ng variational series na akma, kung gayon ang arithmetic mean ay tipikal, i.e. siya ay

nagpapahayag ng pangunahing regularidad ng serye at maaari itong gamitin.

Ang probisyong ito ay malawakang ginagamit sa pagbuo ng iba't ibang pamantayan (damit,

sapatos, kasangkapan sa paaralan, atbp.).

Degree ng pagkakaiba-iba ang katangian sa variational series ay maaaring matantya ng koepisyent

mga pagkakaiba-iba(ang ratio ng standard deviation sa arithmetic mean,

pinarami ng 100%)

Sa v = s x 100

Sa C v mas mababa sa 10%, ang isang mahinang pagkakaiba-iba ay nabanggit, sa C v 10-20% - average, at sa higit sa 20% -

malakas na pagkakaiba-iba ng katangian.

Pagtatasa ng pagiging maaasahan ng mga resulta ng isang istatistikal na pag-aaral

Tulad ng sinabi namin, ang pinaka maaasahang mga resulta ay maaaring makuha sa pamamagitan ng pag-apply

tuloy-tuloy na paraan i.e. kapag pinag-aaralan ang pangkalahatang populasyon.

Samantala, ang pag-aaral ng pangkalahatang populasyon ay nauugnay sa makabuluhang pagiging matrabaho.

Samakatuwid, sa biomedical na pananaliksik, bilang isang panuntunan, pumipili

mga obserbasyon. Upang ang mga datos na nakuha mula sa pag-aaral ng sample na populasyon ay maaaring

ay inilipat sa pangkalahatang populasyon, ito ay kinakailangan upang masuri ang pagiging maaasahan

ang mga resulta ng isang istatistikal na pag-aaral. Maaaring hindi sapat ang sampling frame

ganap na kumakatawan sa populasyon, kaya palaging ang mga sample na obserbasyon

sinamahan ng error sa representasyon. Sa laki ng mean error (m), maaring husgahan ng isa

kung paano naiiba ang nahanap na sample mean sa pangkalahatang mean

pinagsama-samang. Ang isang maliit na error ay nagpapahiwatig ng pagiging malapit ng mga tagapagpahiwatig na ito, isang malaking error tulad

hindi nagbibigay ng kumpiyansa.

Ang halaga ng average na error ng arithmetic mean ay apektado ng sumusunod na dalawang pangyayari.

Una, ang homogeneity ng nakolektang materyal: mas maliit ang dispersion ng variant sa paligid

ang ibig sabihin nito, mas maliit ang pagkakamali ng pagiging kinatawan. Pangalawa, ang bilang ng mga obserbasyon:

ang average na error ay magiging mas maliit, mas malaki ang bilang ng mga obserbasyon.

Ang average na error ng arithmetic mean ay kinakalkula gamit ang sumusunod na formula:

Ang average na error (error of representativeness) para sa mga kamag-anak na halaga ay tinutukoy ng

formula:

kung saan ang m p ay ang average na error ng indicator;

p - tagapagpahiwatig sa% o sa% o

q - (100 -p), (1000 -p)

n - kabuuang bilang ng mga obserbasyon

Umalis sa institusyong medikal ang 289 na pasyente, 12 sa kanila ang namatay.

Relative value (mortality rate) p = (12:289)x100 = 4.1%; q=100 -p=

100-4.1 \u003d 95.9, mula saan

m p = ±

Kaya, ang kamag-anak na halaga sa muling pagsusuri ay tumutugma sa

Mga hangganan ng kumpiyansa ay ang pinakamataas at pinakamababang halaga kung saan

para sa isang naibigay na antas ng posibilidad ng isang walang error na pagtataya, maaaring mayroong isang kamag-anak

indicator o average sa pangkalahatang populasyon

Ang mga limitasyon ng kumpiyansa ng relatibong halaga sa pangkalahatang populasyon ay tinutukoy ng

P gene = P sample ± tm m

Ang mga limitasyon ng kumpiyansa ng arithmetic mean sa pangkalahatang populasyon ay tinutukoy ng formula:

M gene = M piliin ± tm m

kung saan ang P gene at M gene ay ang kamag-anak at average na mga halaga na nakuha para sa pangkalahatan

pinagsama-samang.

P vyb at M vyb - ang mga halaga ng kamag-anak at average na mga halaga na nakuha para sa sample na populasyon.

m p at m m - error sa representasyon para sa average at kaugnay na mga halaga.

t - pamantayan ng pagiging maaasahan.

Ito ay itinatag na kung t= 1, ang pagiging maaasahan ay hindi lalampas sa 68%; kung t=2 -95%; kung t=3- 99%

Sa medikal at biological na pananaliksik, ito ay itinuturing na sapat kung ang criterion

kumpiyansa t ³ 2 (95% kumpiyansa)

Upang mahanap ang criterion t para sa bilang ng mga obserbasyon £ 30, kinakailangang gumamit ng espesyal

mesa

Habang bumababa ang laki ng error ng pagiging representatibo, bumababa ang mga limitasyon ng kumpiyansa.

average at kamag-anak na mga halaga, i.e. ang mga resulta ng pag-aaral ay tinukoy, papalapit

ang kaukulang mga halaga ng pangkalahatang populasyon. Kung mali ang representasyon

malaki, pagkatapos ay makakuha ng malalaking limitasyon ng kumpiyansa, na maaaring sumalungat

lohikal na pagtatasa ng nais na halaga sa pangkalahatang populasyon. Mga hangganan ng kumpiyansa

depende rin sa antas ng posibilidad ng isang walang error na pagtataya na pinili ng mananaliksik. Sa

isang mataas na antas ng posibilidad ng isang walang error na forecast na hanay ng mga limitasyon ng kumpiyansa

M cf - kinakalkula gamit ang paraan ng mga sandali = 61.6 kg

Ang arithmetic mean ay may tatlong katangian.

1. Ang gitna ay sumasakop sa gitnang posisyon sa serye ng variation . Sa isang mahigpit na simetriko na hilera: M \u003d M 0 \u003d M e.

2. Ang average ay isang pangkalahatang halaga at random na pagbabagu-bago, ang mga pagkakaiba sa indibidwal na data ay hindi nakikita sa likod ng average, ito ay nagpapakita na ang tipikal na katangian ng buong populasyon . Ang average ay ginagamit sa tuwing kinakailangan upang ibukod ang random na impluwensya ng mga indibidwal na mga kadahilanan, upang matukoy ang mga karaniwang tampok, umiiral na mga pattern, upang makakuha ng isang kumpleto at malalim na ideya ng pinakakaraniwan at katangian na mga tampok ng buong grupo.

3. Ang kabuuan ng mga paglihis ng lahat ng mga opsyon mula sa mean ay zero : S(V-M)=0 . Ito ay dahil ang average na halaga ay lumampas sa mga sukat ng ilang mga variant at mas maliit kaysa sa mga sukat ng iba pang mga variant.

Sa madaling salita, ang tunay na paglihis ng variant mula sa totoong mean (d=v-m) maaaring positibo o negatibo, kaya ang kabuuan S lahat ng "+"d at "-"d ay katumbas ng zero.

Ang property na ito ng average ay ginagamit kapag sinusuri ang kawastuhan ng mga kalkulasyon M. Kung ang kabuuan ng mga deviations ng variant mula sa mean ay zero, pagkatapos ay maaari nating tapusin na ang ibig sabihin ay kinakalkula nang tama. Ang pag-aari na ito ay batay sa paraan ng mga sandali para sa pagtukoy M. Pagkatapos ng lahat, kung ang conditional average PERO ay magiging katumbas ng totoo M, kung gayon ang kabuuan ng mga paglihis ng variant mula sa conditional mean ay magiging katumbas ng zero.

Ang papel ng mga average sa biology ay napakahusay. Sa isang banda, ginagamit ang mga ito upang makilala ang mga phenomena sa kabuuan, sa kabilang banda, kinakailangan upang suriin ang mga indibidwal na dami. Kapag inihambing ang mga indibidwal na halaga sa mga average, ang mga mahahalagang katangian ay nakuha para sa bawat isa sa kanila. Ang paggamit ng mga average ay nangangailangan ng mahigpit na pagsunod sa prinsipyo ng homogeneity ng populasyon. Ang paglabag sa prinsipyong ito ay sumisira sa ideya ng mga tunay na proseso.

Ang pagkalkula ng mga average mula sa isang socio-economic na heterogenous na populasyon ay ginagawa silang kathang-isip, baluktot. Samakatuwid, upang magamit nang tama ang mga average, dapat tiyakin ng isang tao na nailalarawan nila ang magkakatulad na populasyon ng istatistika.

MGA KATANGIAN NG PAGKAKAIBA NG ALAMAT B

ISTASTISTIKANG POPULASYON

Ang halaga ng ito o ang tampok na iyon ay hindi pareho para sa lahat ng miyembro ng populasyon, sa kabila ng relatibong homogeneity nito. Halimbawa, sa isang grupo ng mga bata na magkakatulad sa edad, kasarian, at lugar ng tirahan, ang taas ng bawat bata ay naiiba sa taas ng kanilang mga kapantay. Ang parehong ay maaaring masabi tungkol sa bilang ng mga pagbisita na ginawa ng mga indibidwal sa polyclinic, tungkol sa antas ng protina ng dugo sa bawat pasyente na may rayuma, tungkol sa antas ng presyon ng dugo sa mga indibidwal na may hypertension, atbp. Ito ay nagpapakita ng pagkakaiba-iba, pagbabagu-bago ng sign sa pinag-aralan na populasyon. Ang pagkakaiba-iba ay maaaring kinakatawan ng halimbawa ng paglaki sa mga grupo ng mga kabataan.



Nagbibigay-daan sa amin ang mga istatistika na ilarawan ito ng mga espesyal na pamantayan na tumutukoy sa antas ng pagkakaiba-iba ng bawat tampok sa isang partikular na grupo. Kasama sa mga pamantayang ito limitasyon (lim), serye amplitude (Am), standard deviation (s) at coefficient of variation (C v). Dahil ang bawat isa sa mga pamantayang ito ay may sariling independiyenteng halaga, kinakailangang pag-isipan ang mga ito nang hiwalay.

limitasyon- tinutukoy ng matinding halaga ng variant sa serye ng variation

Malawak (Am) - pagkakaiba ng sukdulan

Limitasyon at amplitude - magbigay ng ilang impormasyon tungkol sa antas ng pagkakaiba-iba sa paglaki sa bawat pangkat. Gayunpaman, ang parehong limitasyon at ang amplitude ng serye ay may isang makabuluhang disbentaha. Isinasaalang-alang lamang nila ang pagkakaiba-iba ng mga matinding variant at hindi pinapayagan ang pagkuha ng impormasyon tungkol sa pagkakaiba-iba ng isang katangian sa kabuuan, na isinasaalang-alang ang panloob na istraktura nito. Ang katotohanan ay ang pagkakaiba-iba ay ipinakita hindi gaanong sa matinding mga variant tulad ng sa pagsusuri ng buong panloob na istraktura ng grupo. Samakatuwid, ang mga pamantayang ito ay maaaring gamitin para sa isang tinatayang paglalarawan ng pagkakaiba-iba, lalo na sa isang maliit na bilang ng mga obserbasyon (n<30).

Ang pinakakumpletong paglalarawan ng pagkakaiba-iba ng isang katangian sa pinagsama-samang ay ibinibigay ng tinatawag na karaniwang lihis, na tinutukoy ng letrang Griyego na "sigma" -s.

Mayroong dalawang mga paraan upang makalkula ang karaniwang paglihis: arithmetic mean at paraan ng mga sandali.

Gamit ang arithmetic mean na paraan ng pagkalkula, isang formula ang ginagamit kung saan d- tunay na paglihis ng variant mula sa tunay na mean (V-M).

Ang formula ay ginagamit sa isang maliit na bilang ng mga obserbasyon (n<30), когда в вариационном ряду все частоты p= 1.

Sa R> 1 gumamit ng formula tulad nito:

Sa pagkakaroon ng teknolohiya ng computer, ang formula na ito ay ginagamit din para sa isang malaking bilang ng mga obserbasyon.

Ang formula na ito ay idinisenyo upang matukoy ang "sigma" sa pamamagitan ng paraan ng mga sandali:

saan:a- conditional deviation mula sa conditional average ( V-A); p- dalas ng paglitaw para sa mga variant; n- opsyon sa numero; ako- ang laki ng agwat sa pagitan ng mga pangkat.

Ang pamamaraang ito ay ginagamit sa mga kaso kung saan walang teknolohiya sa kompyuter, at ang variational series ay mahirap dahil sa malaking bilang ng mga obserbasyon at dahil sa variant na ipinahayag sa mga multi-valued na numero. Sa bilang ng mga obserbasyon na katumbas ng 30 o mas kaunti, sa sandali ng ikalawang antas P palitan ng (P-1).

Tulad ng makikita mula sa pormula para sa karaniwang paglihis (4), ang denominator ay ( P-1), ibig sabihin. kapag ang bilang ng mga obserbasyon ay katumbas o mas mababa sa 30 (n £ 30), kinakailangang kunin ang denominator ng formula ( P-isa). Kung, kapag tinutukoy ang ibig sabihin ng aritmetika M isaalang-alang ang lahat ng mga elemento ng serye, pagkatapos, pagkalkula a, ito ay kinakailangan upang kunin hindi lahat ng mga kaso, ngunit isa mas mababa (n-1).

Sa malaking bilang ng mga obserbasyon (n>30), ang denominator ng formula ay P, Kaya dahil hindi binabago ng isang yunit ang mga resulta ng pagkalkula at samakatuwid ay awtomatikong tinanggal.

Dapat tandaan na ang karaniwang paglihis ay isang pinangalanang halaga, kaya dapat itong magkaroon ng isang pagtatalaga na karaniwan sa variant at ang arithmetic mean (dimensyon - kg, tingnan ang km, atbp.).

Ang pagkalkula ng karaniwang paglihis sa pamamagitan ng paraan ng mga sandali ay isinasagawa pagkatapos ng pagkalkula ng average na halaga.

May isa pang criterion na nagpapakilala sa antas ng pagkakaiba-iba ng mga halaga ng katangian sa pinagsama-samang, - koepisyent ng pagkakaiba-iba.

Coefficient ng variation (Cv)- ay isang kamag-anak na sukat ng pagkakaiba-iba, dahil ito ay kinakalkula bilang isang porsyento ng karaniwang paglihis (a) sa ibig sabihin ng aritmetika (M). Ang formula para sa koepisyent ng pagkakaiba-iba ay:

Para sa isang tinatayang pagtatasa ng antas ng pagkakaiba-iba ng isang katangian, ang mga sumusunod na gradasyon ng koepisyent ng pagkakaiba-iba ay ginagamit. Kung ang koepisyent ay higit sa 20%, kung gayon ang isang malakas na pagkakaiba-iba ay nabanggit; sa 20-10% - ang average, at kung ang koepisyent ay mas mababa sa 10%, kung gayon ito ay itinuturing na ang pagkakaiba-iba ay mahina.

Ang koepisyent ng pagkakaiba-iba ay ginagamit kapag inihahambing ang antas ng pagkakaiba-iba ng mga tampok na may mga pagkakaiba sa laki ng mga tampok o kanilang hindi pantay na sukat. Ipagpalagay na gusto mong ihambing ang antas ng pagkakaiba-iba sa timbang ng katawan sa mga bagong silang at 5 taong gulang na bata. Malinaw na ang mga bagong silang ay palaging magkakaroon ng mas kaunting "sigma" kaysa sa pitong taong gulang na mga bata, dahil ang kanilang indibidwal na timbang ay mas mababa. Magiging mas maliit ang standard deviation kung saan mas maliit ang value ng feature mismo. Sa kasong ito, upang matukoy ang pagkakaiba sa antas ng pagkakaiba-iba, kinakailangang tumuon hindi sa karaniwang paglihis, ngunit sa kamag-anak na sukatan ng pagkakaiba-iba - ang koepisyent ng pagkakaiba-iba Сv.

Malaki rin ang kahalagahan ng koepisyent ng pagkakaiba-iba para sa pagtatasa at paghahambing ng antas ng pagkakaiba-iba ng ilang mga tampok na may iba't ibang dimensyon. Sa pamamagitan ng karaniwang paglihis imposible pa ring hatulan ang pagkakaiba sa antas ng pagkakaiba-iba ng mga ipinahiwatig na mga character. Upang gawin ito, kailangan mong gamitin ang koepisyent ng pagkakaiba-iba - Cv.

Ang karaniwang paglihis ay nauugnay sa istraktura ng serye ng pamamahagi ng tampok. Sa eskematiko, maaari itong ilarawan bilang mga sumusunod.

Pinatunayan ng teorya ng istatistika na sa normal na distribusyon sa loob ng M ± s mayroong 68% ng lahat ng kaso, sa loob ng M ± 2s - 95.5% ng lahat ng kaso, at sa loob ng M ± 3s - 99.7% ng lahat ng kaso na bumubuo sa populasyon. . Kaya, ang M±3s ay sumasaklaw sa halos buong variational series.

Ang teoretikal na posisyong ito ng mga istatistika sa mga regularidad ng istruktura ng isang serye ay may malaking kahalagahan para sa praktikal na aplikasyon ng karaniwang paglihis. Maaari mong gamitin ang panuntunang ito upang linawin - ang tanong ng tipikal ng karaniwan. Kung 95% ng lahat ng mga variant ay nasa loob ng M ± 2s, kung gayon ang average - ay katangian para sa seryeng ito at hindi kinakailangang dagdagan ang bilang ng mga obserbasyon sa pinagsama-samang. Upang matukoy ang typicality ng mean, ang aktwal na distribusyon ay inihambing sa teoretikal sa pamamagitan ng pagkalkula ng sigma deviations.

Ang praktikal na kahalagahan ng karaniwang paglihis ay nakasalalay din sa katotohanan na ang pag-alam M at s, posibleng bumuo ng kinakailangang variational series para sa praktikal na paggamit. Sigma ( s) ay ginagamit din upang ihambing ang antas ng pagkakaiba-iba ng mga homogenous na katangian, halimbawa, kapag inihambing ang mga pagbabagu-bago (variability) sa paglaki ng mga bata sa mga lunsod o bayan at kanayunan. Alam ang sigma ( s), posibleng kalkulahin ang koepisyent ng pagkakaiba-iba (Cv) na kinakailangan upang ihambing ang antas ng pagkakaiba-iba ng mga tampok na ipinahayag sa iba't ibang mga yunit ng pagsukat (sentimetro, kilo, atbp.). Nagbibigay-daan ito sa iyong matukoy ang mas matatag (permanente) at hindi gaanong matatag na mga palatandaan sa pinagsama-samang.

Paghahambing ng mga koepisyent ng pagkakaiba-iba (Cv), posible na gumawa ng mga konklusyon tungkol sa kung ano ang pinaka-matatag na tampok sa kabuuan ng mga tampok. Karaniwang lihis (mga) Ginagamit din ito upang suriin ang mga indibidwal na katangian ng isang bagay. Ang standard deviation ay nagpapahiwatig kung gaano karaming sigma ( s) mula sa karaniwan (M) tinatanggihan ang mga indibidwal na sukat.

Karaniwang lihis ( s) maaaring magamit sa biology at ekolohiya sa pagbuo ng mga problema ng pamantayan at patolohiya.

Sa wakas, ang standard deviation ay isang mahalagang bahagi ng formula t m- mean error ng arithmetic mean (error of representativeness):

saan t m- average na error ng arithmetic mean (mali sa pagiging kinatawan), P- bilang ng mga obserbasyon.

pagiging kinatawan. Ang pinakamahalagang teoretikal na pundasyon ng pagiging kinatawan ay na-highlight sa itaas sa seksyon ng sampling at pangkalahatang populasyon. Ang pagiging representatibo ay nangangahulugang ang pagiging kinatawan sa sample set ng lahat ng itinuturing na katangian (kasarian, edad, propesyon, haba ng serbisyo, atbp.) ng mga yunit ng obserbasyon na bumubuo sa pangkalahatang populasyon. Ang pagiging kinatawan ng sample na populasyon na may kaugnayan sa pangkalahatang populasyon ay nakakamit sa tulong ng mga espesyal na paraan ng pagpili, na inilarawan sa ibaba.

Ang pagtatasa ng pagiging maaasahan ng mga resulta ng pag-aaral ay batay sa mga teoretikal na pundasyon ng pagiging kinatawan.

PAGTATAYA NG PAGKAKAAASAHAN NG MGA RESULTA NG PANANALIKSIK

Ang pagiging maaasahan ng mga istatistikal na tagapagpahiwatig ay dapat na maunawaan bilang ang antas ng kanilang pagsunod sa katotohanan na kanilang sinasalamin. Ang mga maaasahang resulta ay ang mga hindi nakakasira at wastong sumasalamin sa layunin ng katotohanan.

Upang masuri ang pagiging maaasahan ng mga resulta ng pag-aaral ay nangangahulugan na matukoy kung ano ang posibilidad na mailipat ang mga resulta na nakuha sa sample na populasyon sa buong populasyon.

Sa karamihan ng mga pag-aaral, ang mananaliksik, bilang panuntunan, ay kailangang harapin ang isang bahagi ng hindi pangkaraniwang bagay na pinag-aaralan, at ilipat ang mga konklusyon batay sa mga resulta ng naturang pag-aaral sa buong kababalaghan sa kabuuan - sa pangkalahatang populasyon.

Kaya, ang isang pagtatasa ng pagiging maaasahan ay kinakailangan upang hatulan ang kababalaghan sa kabuuan, ang mga regularidad nito, sa pamamagitan ng bahagi ng phenomenon.

Ang pagtatasa ng pagiging maaasahan ng mga resulta ng pag-aaral ay nagsasangkot ng pagpapasiya ng:

1) mga error sa representasyon (average na mga error ng arithmetic means at relative values) -t;

2) mga limitasyon ng kumpiyansa ng average (o kamag-anak) na mga halaga;

3) ang pagiging maaasahan ng pagkakaiba sa pagitan ng average (o kamag-anak) na mga halaga
(ayon sa criterion
t );

4) ang pagiging maaasahan ng pagkakaiba sa pagitan ng mga inihambing na grupo ayon sa pamantayanc 2 .

1. Pagtukoy sa average na error ng mean (o relative) value (representativeness error) - i.e.

Error sa kinatawan ( m) ay ang pinakamahalagang istatistikal na halaga na kailangan upang masuri ang pagiging maaasahan ng mga resulta ng pag-aaral. Ang error na ito ay nangyayari sa mga kasong iyon kung kailan kinakailangan na ilarawan ang kababalaghan sa kabuuan sa bahagi. Ang mga pagkakamaling ito ay hindi maiiwasan. Nagmumula ang mga ito sa likas na katangian ng sampling; ang pangkalahatang populasyon ay maaaring mailalarawan sa pamamagitan ng sample na populasyon lamang na may ilang error, na sinusukat ng error sa representasyon.

Ang mga error sa pagiging representatibo ay hindi dapat malito sa karaniwang ideya ng mga pagkakamali: pamamaraan, katumpakan ng pagsukat, aritmetika, atbp.

Tinutukoy ng magnitude ng error ng representasyon kung gaano kalaki ang mga resulta na nakuha sa panahon ng selective observation ay naiiba sa mga resulta na maaaring makuha sa pamamagitan ng pagsasagawa ng tuluy-tuloy na pag-aaral ng lahat ng elemento ng pangkalahatang populasyon nang walang pagbubukod.

Ito ang tanging uri ng mga error na isinasaalang-alang ng mga istatistikal na pamamaraan, na hindi maaaring alisin maliban kung ang isang paglipat sa tuluy-tuloy na pag-aaral ay ginawa. Ang mga error sa pagiging representatibo ay maaaring bawasan sa isang medyo maliit na halaga, ibig sabihin, sa halaga ng pinahihintulutang error. Ginagawa ito sa pamamagitan ng pagsasama ng sapat na bilang ng mga obserbasyon sa sample. (P).

Ang bawat average ay M(average na tagal ng paggamot, average na taas, average na timbang ng katawan, average na antas ng protina sa dugo, atbp.), pati na rin ang bawat kamag-anak na halaga - R(mortality rate, morbidity, atbp.) ay dapat ipakita sa kanilang average na error - t. Kaya, ang arithmetic mean ng sample (M) ay may error sa representasyon, na tinatawag na average na error ng arithmetic mean (m m) at tinutukoy ng formula:

Tulad ng makikita mula sa formula na ito, ang halaga ng average na error ng arithmetic mean ay direktang proporsyonal sa antas ng pagkakaiba-iba ng tampok at inversely proporsyonal sa square root ng bilang ng mga obserbasyon. Samakatuwid, ang pagbaba sa laki ng error na ito sa pagtukoy ng antas ng pagkakaiba-iba ( s) ay posible sa pamamagitan ng pagtaas ng bilang ng mga obserbasyon.

Ang prinsipyong ito ay ang batayan para sa paraan ng pagtukoy ng sapat na bilang ng mga obserbasyon para sa isang sample na pag-aaral.

Mga kamag-anak na halaga (R), na nakuha sa isang sample na pag-aaral ay mayroon ding sariling error sa representasyon, na tinatawag na average na error ng relative value at tinutukoy m p

Upang matukoy ang average na error ng kamag-anak na halaga (R) ang sumusunod na formula ay ginagamit:

saan R- kamag-anak na halaga. Kung ang tagapagpahiwatig ay ipinahayag bilang isang porsyento, kung gayon q=100-P, kung R- sa ppm, pagkatapos q=1000-P, kung R- sa mga decimil, kung gayon q= 10000-R atbp.; P- bilang ng mga obserbasyon. Kapag ang bilang ng mga obserbasyon ay mas mababa sa 30, ang denominator ay dapat kunin ( P - 1 ).

Ang bawat arithmetic mean o relative value na nakuha mula sa isang sample na populasyon ay dapat ipakita ng sarili nitong mean error. Ginagawa nitong posible na kalkulahin ang mga limitasyon ng kumpiyansa ng average at kamag-anak na mga halaga, pati na rin upang matukoy ang pagiging maaasahan ng pagkakaiba sa pagitan ng mga inihambing na tagapagpahiwatig (mga resulta ng pananaliksik).

May tatlong uri ng average: mode (M0), median (Me), arithmetic mean (M).

Hindi nila maaaring palitan ang isa't isa, at tanging sa pinagsama-samang mga ito ay lubos na kumpleto at sa isang maigsi na anyo, kinakatawan nila ang mga tampok ng variational series.

Fashion (Mo)- ang pinakamadalas na nangyayari sa serye ng pamamahagi ng variant. Nagbibigay ito ng ideya ng sentro ng pamamahagi ng serye ng pagkakaiba-iba. Ginamit:

Upang matukoy ang sentro ng pamamahagi sa bukas na serye ng variation

Upang matukoy ang average na antas sa mga hilera na may matinding asymmetric distribution

Median- ito ang gitnang opsyon, ang sentral na miyembro ng ranggo na serye. Ang pangalang median ay kinuha mula sa geometry, kung saan ito ang pangalan ng linya na naghahati sa gilid ng tatsulok sa dalawang pantay na bahagi.

Inilapat ang median:

Upang matukoy ang average na antas ng isang feature sa numerical series na may hindi pantay na pagitan sa mga grupo

Upang matukoy ang average na antas ng isang tampok, kapag ang pinagmulan ng data ay ipinakita bilang mga katangian ng husay at kapag ang tanging paraan upang ipahiwatig ang isang tiyak na sentro ng grabidad ng populasyon ay upang ipahiwatig ang variant (variant group) na sumasakop sa isang sentral na posisyon

Kapag kinakalkula ang ilang demograpikong tagapagpahiwatig (average na pag-asa sa buhay)

Kapag tinutukoy ang pinakanakapangangatwiran na lokasyon para sa mga pasilidad ng kalusugan, mga pasilidad ng komunidad, atbp. (ibig sabihin ay isinasaalang-alang ang pinakamainam na distansya ng mga institusyon mula sa lahat ng mga pasilidad ng serbisyo)

Sa kasalukuyan, ang iba't ibang mga survey (marketing, sociological, atbp.) ay napaka-pangkaraniwan, kung saan ang mga sumasagot ay hinihiling na magbigay ng mga puntos sa mga produkto, pulitiko, atbp. Pagkatapos, ang mga average na puntos ay kinakalkula mula sa nakuha na mga pagtatantya at itinuturing bilang integral na mga marka na ibinigay ng pangkat ng mga respondente. Sa kasong ito, ang arithmetic mean ay karaniwang ginagamit upang matukoy ang average. Gayunpaman, ang pamamaraang ito ay hindi aktwal na mailalapat. Sa kasong ito, makatwirang gamitin ang median o mode bilang mga mean na marka.

Upang makilala ang average na antas ng isang katangian, ang arithmetic mean (M) ay kadalasang ginagamit sa medisina.

Ang ibig sabihin ng aritmetika - ito ay isang pangkalahatang quantitative na katangian ng isang tiyak na katangian ng pinag-aralan na phenomena, na bumubuo ng qualitatively homogeneous statistical aggregate.

Matukoy ang pagkakaiba sa pagitan ng simpleng arithmetic mean at weighted mean.

Ang simpleng arithmetic mean ay kinakalkula para sa isang hindi nakagrupong serye ng variation sa pamamagitan ng pagsusuma sa lahat ng mga opsyon at paghahati sa kabuuan na ito sa kabuuang bilang ng mga opsyon na kasama sa serye ng variation.

Ang simpleng arithmetic mean ay kinakalkula ng formula:

M - arithmetic weighted average,

Ang ∑Vp ay ang kabuuan ng mga produkto ng isang variant at ang kanilang mga frequency,

n ay ang bilang ng mga obserbasyon.

Bilang karagdagan sa tinukoy na paraan ng direktang pagkalkula ng weighted arithmetic average, may iba pang mga pamamaraan, lalo na, ang paraan ng mga sandali kung saan ang mga kalkulasyon ng aritmetika ay medyo pinasimple.

Ang pagkalkula ng arithmetic mean ng mga sandali ay isinasagawa ayon sa pormula:

M = A + ∑dp
n

A - conditional average (madalas, ang M0 mode ay kinukuha bilang conditional average)

d - paglihis ng bawat opsyon mula sa conditional average (V-A)

Ang ∑dp ay ang kabuuan ng mga produkto ng mga paglihis at ang dalas ng mga ito.

Ang pagkakasunud-sunod ng pagkalkula ay ipinakita sa talahanayan (kumuha kami ng M0 = 76 na mga beats bawat minuto bilang isang conditional average).

bilis ng pulso V R d(V-A) dp
-16 -16
-14 -28
-12 -36
-10 -30
-8 -24
-6 -54
-4 -24
-2 -14
n=54 | ∑dp=-200

kung saan ang i ay ang pagitan sa pagitan ng mga grupo.

Ang pagkakasunud-sunod ng pagkalkula ay ipinakita sa talahanayan. (para sa conditional average na kumukuha kami ng M 0 = 73 beats bawat minuto, kung saan i = 3)

Pagpapasiya ng arithmetic mean sa pamamagitan ng paraan ng mga sandali

n=54 ∑dp=-13

M = A + ∑dp = 73+ -13*3 \u003d 73 - 0.7 \u003d 72.3 (mga beats bawat minuto
n

Kaya, ang halaga ng arithmetic mean na nakuha sa paraan ng mga sandali ay magkapareho sa nahanap sa karaniwang paraan.

Mga pamamaraan para sa pagkalkula ng arithmetic mean (simple at weighted arithmetic mean, sa pamamagitan ng paraan ng mga sandali)

Tinutukoy namin ang mga average na halaga:

Mode (Mo) \u003d 11, dahil madalas na nangyayari ang variant na ito sa serye ng variation (p=6).

Median (Me) - ang serial number ng variant na sumasakop sa gitnang posisyon = 23, ang lugar na ito sa variation series ay inookupahan ng variant na katumbas ng 11. Ang arithmetic mean (M) ay nagbibigay-daan sa iyo na lubos na makilala ang average na antas ng katangiang pinag-aaralan. Upang kalkulahin ang arithmetic mean, dalawang pamamaraan ang ginagamit: ang arithmetic mean na paraan at ang paraan ng mga sandali.

Kung ang dalas ng paglitaw ng bawat variant sa serye ng variation ay katumbas ng 1, kung gayon ang simpleng arithmetic mean ay kinakalkula gamit ang arithmetic mean method: M = .

Kung ang dalas ng paglitaw ng variant sa serye ng variation ay naiiba sa 1, ang weighted arithmetic mean ay kinakalkula, ayon sa arithmetic mean method:

Ayon sa paraan ng mga sandali: A - conditional average,

M = A + =11 += 10.4 d=V-A, A=Mo=11

Kung higit sa 30 ang bilang ng mga opsyon sa serye ng variation, bubuo ang isang nakapangkat na serye. Pagbuo ng nakagrupong serye:

1) pagpapasiya ng Vmin at Vmax Vmin=3, Vmax=20;

2) pagpapasiya ng bilang ng mga grupo (ayon sa talahanayan);

3) pagkalkula ng agwat sa pagitan ng mga grupo ako = 3;

4) pagpapasiya ng simula at pagtatapos ng mga grupo;

5) pagpapasiya ng variant ng dalas ng bawat pangkat (Talahanayan 2).

talahanayan 2

Pamamaraan para sa pagbuo ng isang pinagsama-samang serye

Tagal

paggamot sa mga araw

n=45 p=480 p=30 2 p=766

Ang bentahe ng isang nakapangkat na serye ng variational ay hindi gumagana ang mananaliksik sa bawat variant, ngunit sa mga variant lang na karaniwan para sa bawat pangkat. Ginagawa nitong mas madaling kalkulahin ang average.

Ang halaga ng ito o ang tampok na iyon ay hindi pareho para sa lahat ng miyembro ng populasyon, sa kabila ng relatibong homogeneity nito. Ang tampok na ito ng istatistikal na populasyon ay nailalarawan sa pamamagitan ng isa sa mga katangian ng pangkat ng pangkalahatang populasyon - pagkakaiba-iba ng katangian. Halimbawa, kumuha tayo ng grupo ng mga 12 taong gulang na lalaki at sukatin ang kanilang taas. Pagkatapos ng mga kalkulasyon, ang average na antas ng katangiang ito ay magiging 153 cm. Ngunit ang average ay nagpapakilala sa pangkalahatang sukat ng pinag-aralan na katangian. Sa mga batang lalaki sa edad na ito ay may mga lalaki na ang taas ay 165 cm o 141 cm. Ang mas maraming mga batang lalaki na may taas maliban sa 153 cm, mas malaki ang pagkakaiba-iba ng katangiang ito sa istatistikal na populasyon.

Nagbibigay-daan sa amin ang mga istatistika na tukuyin ang katangiang ito sa pamamagitan ng mga sumusunod na pamantayan:

limitasyon (lim),

amplitude (Amp),

karaniwang lihis ( y) ,

koepisyent ng pagkakaiba-iba (Cv).

Limitasyon (lim) ay tinutukoy ng matinding halaga ng variant sa serye ng variation:

lim=Vmin /Vmax

Amplitude (Amp) - pagkakaiba ng matinding mga pagpipilian:

Amp=Vmax -Vmin

Isinasaalang-alang lamang ng mga halagang ito ang pagkakaiba-iba ng mga matinding pagpipilian at hindi pinapayagan ang pagkuha ng impormasyon tungkol sa pagkakaiba-iba ng katangian sa kabuuan, na isinasaalang-alang ang panloob na istraktura nito. Samakatuwid, ang mga pamantayang ito ay maaaring gamitin para sa isang tinatayang paglalarawan ng pagkakaiba-iba, lalo na sa isang maliit na bilang ng mga obserbasyon (n<30).

mga istatistika ng medikal na serye ng pagkakaiba-iba

Ang mga kalkulasyon ng ibig sabihin ng aritmetika ay maaaring maging mahirap kung ang mga opsyon (mga halaga ng tampok) at mga timbang ay may napakalaki o napakaliit na mga halaga at ang proseso ng pagkalkula mismo ay nagiging mahirap. Pagkatapos, para sa kadalian ng pagkalkula, ang isang bilang ng mga katangian ng arithmetic mean ay ginagamit:

1) kung bawasan mo (dagdagan) ang lahat ng mga opsyon sa pamamagitan ng anumang arbitrary na numero PERO, pagkatapos ay bababa (tataas) ang bagong average ng parehong numero PERO, ibig sabihin ay magbabago sa ± PERO;

2) kung babawasan natin ang lahat ng mga opsyon (mga halaga ng tampok) sa parehong bilang ng beses ( Upang), pagkatapos ay bababa ang average ng parehong halaga, at may pagtaas sa ( Upang) beses - tataas sa ( Upang) minsan;

3) kung binabawasan o pinapataas natin ang mga timbang (mga frequency) ng lahat ng variant ng ilang pare-parehong bilang PERO, kung gayon ang arithmetic mean ay hindi magbabago;

4) ang kabuuan ng mga deviations ng lahat ng mga opsyon mula sa kabuuang average ay zero.

Ang mga nakalistang katangian ng arithmetic mean ay nagbibigay-daan, kung kinakailangan, na pasimplehin ang mga kalkulasyon sa pamamagitan ng pagpapalit ng absolute frequency ng mga kamag-anak, upang bawasan ang mga opsyon (mga halaga ng tampok) ng anumang numero PERO, bawasan ang mga ito sa Upang beses at kalkulahin ang arithmetic mean ng pinababang bersyon, at pagkatapos ay lumipat sa mean ng orihinal na serye.

Ang paraan ng pagkalkula ng arithmetic mean gamit ang mga katangian nito ay kilala sa mga istatistika bilang "conditional zero method", o "conditional average", o paano "paraan ng mga sandali".

Sa madaling sabi, ang pamamaraang ito ay maaaring isulat bilang isang pormula

Kung ang mga pinababang variant (mga halaga ng character) ay tinutukoy ng , kung gayon ang formula sa itaas ay maaaring muling isulat bilang .

Kapag gumagamit ng formula upang pasimplehin ang pagkalkula ng arithmetic mean weighted interval series kapag tinutukoy ang halaga ng anumang numero PERO gumamit ng mga ganitong paraan ng kahulugan nito.

Halaga PERO ay katumbas ng halaga:

1) ang unang halaga ng average na halaga ng pagitan (magpapatuloy kami sa halimbawa ng problema, kung saan milyong dolyar, at .

Pagkalkula ng average ng pinababang opsyon

Mga pagitan Interval ibig sabihin Bilang ng mga pabrika f Trabaho
Hanggang 2 1,5 0 (1,5–1,5)
2–3 2,5 1 (2,5–1,5)
3–4 3,5 2 (3,5–1,5)
4–5 4,5 3 (4,5–1,5)
5–6 5,5 4 (5,5–1,5)
Higit sa 6 6,5 5 (6,5–1,5)
Kabuuan: 3,7

,

2) halaga PERO kinuha namin ang katumbas ng halaga ng average na halaga ng agwat na may pinakamataas na dalas ng mga pag-uulit, sa kasong ito PERO= 3.5 sa ( f= 30), o ang halaga ng gitnang variant, o ang pinakamalaking variant (sa kasong ito, ang pinakamalaking halaga ng feature X= 6.5) at hinati sa laki ng pagitan (1 sa halimbawang ito).

Pagkalkula ng average sa PERO = 3,5, f = 30, Upang= 1 sa parehong halimbawa.

Pagkalkula ng average na paraan ng mga sandali

Mga pagitan Interval ibig sabihin Bilang ng mga pabrika f Trabaho
Hanggang 2 1,5 (1,5 – 3,5) : 1 = –2 –20
2–3 2,5 (2,5 – 3,5) : 1 = –1 –20
3–4 3,5 (3,5 – 3,5) : 1 = 0
4–5 4,5 (4,5 – 3,5) : 1 = 1
5–6 5,5 (5,5 – 3,5) : 1 = 2
Higit sa 6 6,5 (6,5 – 3,5) : 1 = 3
Kabuuan: 3,7

; ; ;

Ang paraan ng mga sandali, conditional zero o conditional average ay na sa pinababang paraan ng pagkalkula ng arithmetic mean, pinipili namin ang ganoong sandali na sa bagong serye ay isa sa mga value ng feature , ibig sabihin, itinutumbas namin at mula sa dito namin piliin ang halaga PERO at Upang.

Dapat isaisip na kung XPERO) : Upang, saan Upang ay ang katumbas na halaga ng pagitan, pagkatapos ay ang mga bagong variant na nakuha ay nabuo sa equal-interval na serye ng mga natural na numero (1, 2, 3, atbp.) na positibo pababa at negatibong pataas mula sa zero. Ang arithmetic mean ng mga bagong variant na ito ay tinatawag na moment of the first order at ipinapahayag ng formula

.

Upang matukoy ang halaga ng arithmetic mean, kailangan mong i-multiply ang halaga ng sandali ng unang pagkakasunud-sunod sa halaga ng agwat na iyon ( Upang), kung saan hinahati namin ang lahat ng mga opsyon, at idinaragdag sa resultang produkto ang halaga ng mga opsyon ( PERO) na binasa.

;

Kaya, gamit ang paraan ng mga sandali o conditional zero, mas madaling kalkulahin ang arithmetic mean mula sa variational series, kung ang serye ay equal-interval.

Fashion

Ang mode ay ang halaga ng isang feature (variant) na pinakamadalas na nauulit sa pinag-aralan na populasyon.

Para sa discrete distribution series, ang mode ay ang halaga ng mga variant na may pinakamataas na frequency.

Halimbawa. Kapag tinutukoy ang plano para sa paggawa ng mga sapatos ng lalaki, pinag-aralan ng pabrika ang demand ng consumer batay sa mga resulta ng pagbebenta. Ang pamamahagi ng mga sapatos na ibinebenta ay nailalarawan sa pamamagitan ng mga sumusunod na tagapagpahiwatig:

Ang mga sapatos na may sukat na 41 ay nasa pinakamalaking demand at umabot sa 30% ng dami ng naibenta. Sa serye ng pamamahagi na ito M 0 = 41.

Para sa serye ng pamamahagi ng agwat na may pantay na agwat, ang mode ay tinutukoy ng formula

.

Una sa lahat, kinakailangan upang mahanap ang agwat kung saan matatagpuan ang mode, ibig sabihin, ang agwat ng modal.

Sa isang variational series na may pantay na pagitan modal spacing ay tinutukoy ng pinakamataas na dalas, sa serye na may hindi pantay na mga pagitan - sa pamamagitan ng pinakamataas na density ng pamamahagi, kung saan: - ang halaga ng mas mababang hangganan ng pagitan na naglalaman ng mode; ay ang dalas ng modal interval; - ang dalas ng agwat bago ang modal, i.e. premodal; - ang dalas ng agwat kasunod ng modal, i.e. post-modal.

Isang halimbawa ng pagkalkula ng mode sa isang serye ng pagitan

Ibinibigay ang pagpapangkat ng mga negosyo ayon sa bilang ng mga tauhan sa industriya at produksyon. Maghanap ng fashion. Sa aming problema, ang pinakamalaking bilang ng mga negosyo (30) ay mayroong grupo na may 400 hanggang 500 empleyado. Samakatuwid, ang agwat na ito ay ang modal na agwat ng pantay na pagitan ng serye ng pagpapalaganap. Ipakilala natin ang sumusunod na notasyon:

Palitan ang mga halagang ito sa formula ng pagkalkula ng mode at kalkulahin:

Kaya, natukoy namin ang halaga ng modal value ng attribute na nasa pagitan na ito (400–500), i.e. M 0 = 467 tao

Sa maraming mga kaso, kapag ang pagkilala sa populasyon bilang isang pangkalahatang tagapagpahiwatig, ang kagustuhan ay ibinibigay sa fashion, hindi ang ibig sabihin ng aritmetika. Kaya, kapag pinag-aaralan ang mga presyo sa merkado, hindi ang average na presyo para sa isang tiyak na produkto ang naayos at pinag-aralan sa dinamika, ngunit ang modal. Kapag pinag-aaralan ang pangangailangan ng populasyon para sa isang tiyak na laki ng sapatos o damit, interesante na matukoy ang modal number, at hindi ang average na laki, na hindi mahalaga. Kung ang arithmetic mean ay malapit sa halaga sa mode, ito ay tipikal.

MGA GAWAIN PARA SA SOLUSYON

Gawain 1

Sa istasyon ng iba't ibang binhi, kapag tinutukoy ang kalidad ng mga buto ng trigo, ang sumusunod na pagpapasiya ng mga buto ay nakuha sa pamamagitan ng porsyento ng pagtubo:

Tukuyin ang fashion.

Gawain 2

Kapag nagrerehistro ng mga presyo sa mga pinaka-abalang oras ng kalakalan, inirehistro ng mga indibidwal na nagbebenta ang mga sumusunod na aktwal na presyo ng pagbebenta (USD bawat kg):

Patatas: 0.2; 0.12; 0.12; 0.15; 0.2; 0.2; 0.2; 0.15; 0.15; 0.15; 0.15; 0.12; 0.12; 0.12; 0.15.

Karne ng baka: 2; 2.5; 2; 2; 1.8; 1.8; 2; 2.2; 2.5; 2; 2; 2; 2; 3; 3; 2.2; 2; 2; 2; 2.

Anong mga presyo para sa patatas at karne ng baka ang modal?

Gawain 3

Mayroong datos sa sahod ng 16 na mekaniko ng pagawaan. Hanapin ang modal value ng sahod.

Sa dolyar: 118; 120; 124; 126; 130; 130; 130; 130; 132; 135; 138; 140; 140; 140; 142; 142.

Pagkalkula ng Median

Sa mga istatistika, ang median ay ang variant na matatagpuan sa gitna ng serye ng variation. Kung ang discrete distribution series ay may kakaibang bilang ng mga miyembro ng serye, ang median ay ang variant na matatagpuan sa gitna ng ranggo na serye, ibig sabihin, magdagdag ng 1 sa kabuuan ng mga frequency at hatiin ang lahat sa 2 - ang resulta ay magbibigay ng ordinal na numero ng median.

Kung mayroong kahit na bilang ng mga opsyon sa variational series, ang median ay magiging kalahati ng kabuuan ng dalawang gitnang opsyon.

Upang mahanap ang median sa serye ng pagkakaiba-iba ng pagitan, tinutukoy muna namin ang median na pagitan para sa mga naipon na frequency. Ang ganitong agwat ay magiging isa na ang pinagsama-samang (cumulative) na dalas ay katumbas o lumalampas sa kalahati ng kabuuan ng mga frequency. Ang mga naipon na frequency ay nabuo sa pamamagitan ng unti-unting pagsusuma ng mga frequency, simula sa pagitan na may pinakamababang halaga ng katangian.

Pagkalkula ng median sa serye ng pagkakaiba-iba ng pagitan

Mga pagitan Mga frequency ( f) Pinagsama-samang (naipon) na mga frequency
60–70 10 (10)
70–80 40 (10+30)
80–90 90 (40+50)
90–100 15 (90+60)
100–110 295 (150+145)
110–120 405 (295+110)
120–130 485 (405+80)
130–140 500 (485+15)
Sum: f = 500

Ang kalahati ng kabuuan ng mga naipon na frequency sa halimbawa ay 250 (500:2). Samakatuwid, ang median interval ay magiging isang interval na may feature value na 100–110.

Bago ang agwat na ito, ang kabuuan ng mga naipon na frequency ay 150. Samakatuwid, upang makuha ang halaga ng median, kinakailangang magdagdag ng isa pang 100 unit (250 - 150). Kapag tinutukoy ang halaga ng median, ipinapalagay na ang halaga ng tampok sa loob ng mga hangganan ng pagitan ay ipinamamahagi nang pantay-pantay. Samakatuwid, kung ang 145 na mga yunit sa pagitan na ito ay ibinahagi nang pantay-pantay sa pagitan, katumbas ng 10, kung gayon 100 mga yunit ay tumutugma sa halaga:

10: 145 ´ 100 = 6.9.

Ang pagdaragdag ng nakuhang halaga sa pinakamababang hangganan ng median interval, makuha namin ang nais na halaga ng median:

O ang median sa variational interval series ay maaaring kalkulahin ng formula:

,

kung saan ang halaga ng mas mababang hangganan ng median na pagitan (); – ang halaga ng median interval ( =10); – ang kabuuan ng mga frequency ng serye (ang bilang ng serye ay 500); ay ang kabuuan ng mga naipon na frequency sa pagitan bago ang median ( = 150); ay ang dalas ng median na pagitan ( = 145).