Selective observation: konsepto, mga uri, mga error sa sampling, pagsusuri ng mga resulta. Mga halimbawa ng paglutas ng problema

Sa panahon ng pumipili na pagmamasid, dapat itong tiyakin aksidente pagpili ng yunit. Ang bawat yunit ay dapat magkaroon ng pantay na pagkakataon na mapili kasama ng iba. Ito ang pinagbabatayan ng random sampling.

SA tamang random sample ay tumutukoy sa pagpili ng mga yunit mula sa buong pangkalahatang populasyon (nang walang paunang paghahati nito sa anumang mga grupo) sa pamamagitan ng pagguhit ng mga palabunutan (pangunahin) o ilang iba pang katulad na pamamaraan, halimbawa, gamit ang isang talahanayan ng mga random na numero. Random na pagpili Ang pagpili na ito ay hindi random. Ang prinsipyo ng randomness ay nagmumungkahi na ang pagsasama o pagbubukod ng isang bagay mula sa sample ay hindi maaaring maimpluwensyahan ng anumang kadahilanan maliban sa pagkakataon. Isang halimbawa random talaga Ang pagpili ay maaaring magsilbi bilang mga sirkulasyon ng mga panalo: mula sa kabuuang bilang ng mga na-isyu na tiket, isang tiyak na bahagi ng mga numero na account para sa mga panalo ay random na pinili. Bukod dito, ang lahat ng mga numero ay binibigyan ng pantay na pagkakataon upang makapasok sa sample. Sa kasong ito, ang bilang ng mga yunit na napili sa sample set ay karaniwang tinutukoy batay sa tinatanggap na proporsyon ng sample.

Sample share ay ang ratio ng bilang ng mga yunit ng sample na populasyon sa bilang ng mga yunit ng pangkalahatang populasyon:

Kaya, na may 5% sample mula sa isang batch ng mga bahagi sa 1000 units. laki ng sample P ay 50 units, at may 10% sample - 100 units. atbp. Sa wastong pang-agham na organisasyon ng sampling, ang mga error sa pagiging representatibo ay maaaring bawasan sa minimal na mga halaga, bilang resulta, ang selective observation ay nagiging sapat na tumpak.

Ang wastong random na pagpili "sa dalisay nitong anyo" ay bihirang ginagamit sa pagsasagawa ng selective observation, ngunit ito ang panimulang punto sa lahat ng iba pang uri ng pagpili, naglalaman ito at nagpapatupad ng mga pangunahing prinsipyo ng selective observation.

Isaalang-alang natin ang ilang mga katanungan ng teorya ng paraan ng sampling at ang formula ng error para sa isang simpleng random na sample.

Kapag nag-aaplay ng paraan ng sampling sa mga istatistika, dalawang pangunahing uri ng mga generalizing indicator ang karaniwang ginagamit: ang average na halaga ng isang quantitative trait At ang relatibong halaga ng alternatibong tampok(ang proporsyon o proporsyon ng mga yunit sa istatistikal na populasyon, na naiiba sa lahat ng iba pang yunit ng populasyon na ito sa pamamagitan lamang ng pagkakaroon ng katangiang pinag-aaralan).

Sample share (w), o dalas, ay tinutukoy ng ratio ng bilang ng mga yunit na may katangiang pinag-aaralan T, sa kabuuang bilang ng mga sampling unit P:

Halimbawa, kung sa 100 sample na detalye ( n=100), 95 na bahagi ang naging pamantayan (T=95), pagkatapos ay ang sample fraction

w=95/100=0,95 .

Upang makilala ang pagiging maaasahan ng mga tagapagpahiwatig ng sample, mayroong gitna At marginal sampling error.

Error sa pag-sample ? o, sa madaling salita, ang error sa representasyon ay ang pagkakaiba sa pagitan ng kaukulang sample at pangkalahatang katangian:

*

*

Ang sampling error ay katangian lamang ng mga piling obserbasyon. Kung mas malaki ang halaga ng error na ito, mas naiiba ang mga sample indicator mula sa mga kaukulang pangkalahatang indicator.

Ang sample mean at ang sample share ay likas mga random na variable, na maaaring tumagal sa iba't ibang mga halaga depende sa kung aling mga yunit ng populasyon ang kasama sa sample. Samakatuwid, ang mga sampling error ay mga random na variable din at maaaring tumagal sa iba't ibang mga halaga. Samakatuwid, tukuyin ang average ng mga posibleng error - ang average na sample error.

Ano ang nakasalalay dito ibig sabihin ng sampling error? Napapailalim sa prinsipyo ng random na pagpili, ang karaniwang error sa sampling ay pangunahing tinutukoy laki ng sample: mas malaki ang populasyon, ceteris paribus, mas maliit ang average sampling error. Sumasaklaw sa isang sample na survey na may tumataas na bilang ng mga yunit ng pangkalahatang populasyon, higit at mas tumpak nating nailalarawan ang buong populasyon.

Ang ibig sabihin ng sampling error ay nakasalalay din sa antas ng pagkakaiba-iba pinag-aralan na katangian. Ang antas ng pagkakaiba-iba, tulad ng alam mo, ay nailalarawan sa pamamagitan ng pagpapakalat? 2 o w(1-w)-- para sa isang alternatibong tampok. Kung mas maliit ang variation ng feature, at dahil dito ang variance, mas maliit ang average na sampling error, at vice versa. Sa zero dispersion (ang attribute ay hindi nag-iiba), ang average na sampling error ay zero, ibig sabihin, anumang unit ng pangkalahatang populasyon ay tumpak na maglalarawan sa buong populasyon ayon sa katangiang ito.

Ang pag-asa ng average na error sa sampling sa dami nito at ang antas ng pagkakaiba-iba ng katangian ay makikita sa mga formula na maaaring magamit upang kalkulahin ang average na error sa sampling sa ilalim ng mga kondisyon ng sample na pagmamasid, kapag ang mga pangkalahatang katangian ( x,p) ay hindi kilala, at samakatuwid, hindi posibleng mahanap ang totoong error sa pag-sample nang direkta mula sa mga formula (form. 1), (form. 2).

W Sa random na pagpili karaniwang mga pagkakamali theoretically kinakalkula ng mga sumusunod na formula:

* para sa average na quantitative trait

* para sa pagbabahagi (alternatibong katangian)

Dahil halos ang pagkakaiba ng katangian sa pangkalahatang populasyon? 2 ay hindi eksaktong kilala, sa pagsasanay ginagamit nila ang halaga ng pagkakaiba-iba S 2 na kinakalkula para sa sample na populasyon batay sa batas ng malalaking numero, ayon sa kung saan ang sample na populasyon na may sapat na malaking sukat ng sample ay tumpak na nagpaparami ng mga katangian ng pangkalahatang populasyon.

kaya, mga formula ng pagkalkula gitna mga error sa sampling Ang random resampling ay magiging ganito:

* para sa average na quantitative trait

* para sa pagbabahagi (alternatibong katangian)

Gayunpaman, ang variance ng sample na populasyon ay hindi katumbas ng variance ng pangkalahatang populasyon, at samakatuwid, ang average na sampling error na kinakalkula ng mga formula (form. 5) at (form. 6) ay magiging tantiya. Ngunit sa teorya ng probabilidad ay pinatunayan na ang pangkalahatang pagkakaiba ay ipinahayag sa pamamagitan ng elektibo ng sumusunod na kaugnayan:

kasi P/(n-1) para sa sapat na laki P -- halaga na malapit sa pagkakaisa, maaari itong ipagpalagay na, at samakatuwid, sa mga praktikal na kalkulasyon ng average na mga error sa sampling, ang mga formula (form. 5) at (form. 6) ay maaaring gamitin. At sa mga kaso lamang ng isang maliit na sample (kapag ang laki ng sample ay hindi lalampas sa 30) kinakailangan na isaalang-alang ang koepisyent P/(n-1) at kalkulahin maliit na sample ang ibig sabihin ng error ayon sa formula:

W X Sa random na hindi paulit-ulit na pagpili sa mga formula sa itaas para sa pagkalkula ng average na mga error sa sampling, kinakailangan upang i-multiply ang root expression sa pamamagitan ng 1-(n / N), dahil ang bilang ng mga yunit sa pangkalahatang populasyon ay nabawasan sa proseso ng hindi paulit-ulit na sampling. Samakatuwid, para sa isang hindi paulit-ulit na pagpili mga formula ng pagkalkula ibig sabihin ng sampling error kukuha ng sumusunod na anyo:

* para sa average na quantitative trait

* para sa pagbabahagi (alternatibong katangian)

. (form. 10)

kasi P laging mas mababa N, pagkatapos ay ang karagdagang kadahilanan 1-( n/N) ay palaging mas mababa sa isa. Ito ay sumusunod mula dito na ang karaniwang error na may hindi paulit-ulit na pagpili ay palaging mas mababa kaysa sa paulit-ulit na pagpili. Kasabay nito, na may medyo maliit na porsyento ng sample, ang salik na ito ay malapit sa isa (halimbawa, na may 5% sample ay 0.95; na may 2% na sample ay 0.98, atbp.). Samakatuwid, minsan sa pagsasanay, ang mga formula (mga form 5) at (mga form 6) ay ginagamit upang matukoy ang average na error sa sampling nang walang tinukoy na multiplier, bagama't ang sample ay nakaayos bilang isang hindi paulit-ulit. Ito ay nangyayari kapag ang bilang ng mga yunit ng pangkalahatang populasyon N ay hindi alam o walang limitasyon, o kung kailan P napakaliit kumpara sa N, at sa esensya, ang pagpapakilala ng karagdagang salik, na malapit sa halaga sa isa, ay halos hindi makakaapekto sa halaga ng average na error sa sampling.

Mechanical sampling ay binubuo sa katotohanan na ang pagpili ng mga yunit sa sample mula sa pangkalahatan, na hinati ng isang neutral na pamantayan sa pantay na pagitan (mga grupo), ay isinasagawa sa paraang isang yunit lamang ang napili mula sa bawat naturang grupo sa sample. Upang maiwasan ang sistematikong pagkakamali, dapat piliin ang yunit na nasa gitna ng bawat pangkat.

Kapag nag-aayos ng mekanikal na pagpili, ang mga yunit ng populasyon ay paunang nakaayos (karaniwan ay nasa isang listahan) sa isang tiyak na pagkakasunud-sunod (halimbawa, ayon sa alpabeto, ayon sa lokasyon, sa pataas o pababang pagkakasunud-sunod ng mga halaga ng anumang tagapagpahiwatig na hindi nauugnay. kasama ang pag-aari na pinag-aaralan, atbp.). atbp.), pagkatapos kung saan ang isang naibigay na bilang ng mga yunit ay pinili nang mekanikal, sa isang tiyak na pagitan. Sa kasong ito, ang laki ng agwat sa pangkalahatang populasyon ay katumbas ng reciprocal ng sample share. Kaya, na may 2% sample, bawat ika-50 unit (1: 0.02) ay pinipili at sinusuri, na may 5% sample, bawat ika-20 unit (1: 0.05), halimbawa, pababang detalye mula sa makina.

Sa sapat na malaking populasyon, ang mekanikal na pagpili sa mga tuntunin ng katumpakan ng mga resulta ay malapit sa tamang random. Samakatuwid, upang matukoy ang average na error ng isang mekanikal na sample, ang mga formula para sa self-random na hindi paulit-ulit na sampling ay ginagamit (form. 9), (form. 10).

Upang pumili ng mga yunit mula sa isang heterogenous na populasyon, ang tinatawag na tipikal na sample , na ginagamit sa mga kaso kung saan ang lahat ng mga yunit ng pangkalahatang populasyon ay maaaring hatiin sa ilang qualitatively homogenous, katulad na mga grupo ayon sa mga katangian na nakakaapekto sa pinag-aralan na mga indicator.

Kapag nagsusuri ng mga negosyo, ang mga naturang grupo ay maaaring, halimbawa, industriya at sub-sektor, mga anyo ng pagmamay-ari. Pagkatapos, mula sa bawat tipikal na grupo, ang isang indibidwal na pagpili ng mga yunit sa sample ay ginawa ng isang wastong random o mekanikal na sample.

Karaniwang ginagamit ang isang tipikal na sample sa pag-aaral ng mga kumplikadong istatistikal na populasyon. Halimbawa, sa isang sample na survey ng mga badyet ng pamilya ng mga manggagawa at empleyado sa ilang mga sektor ng ekonomiya, produktibidad sa paggawa ng mga manggagawa sa isang negosyo, na kinakatawan ng magkahiwalay na mga grupo ng kasanayan.

Ang isang karaniwang sample ay nagbibigay ng mas tumpak na mga resulta kumpara sa iba pang mga paraan ng pagpili ng mga unit sa isang sample set. Tinitiyak ng pag-type ng pangkalahatang populasyon ang pagiging kinatawan ng naturang sample, ang representasyon ng bawat typological group sa loob nito, na ginagawang posible na ibukod ang impluwensya ng intergroup dispersion sa average na error sa sample.

Kapag nagpapasiya average na error ng isang tipikal na sample bilang tagapagpahiwatig ng pagkakaiba-iba ay ang average ng mga pagkakaiba-iba ng intragroup.

Ang ibig sabihin ng sampling error ay matatagpuan sa pamamagitan ng mga formula:

* para sa average na quantitative trait

(muling pagpili); (form. 11)

(hindi maibabalik na pagpili); (form. 12)

* para sa pagbabahagi (alternatibong katangian)

(muling pagpili); (form.13)

(hindi paulit-ulit na pagpili), (form. 14)

kung saan ang average ng mga pagkakaiba-iba ng intra-grupo para sa sample na populasyon;

Ang average ng mga pagkakaiba-iba ng intra-grupo ng bahagi (alternatibong katangian) sa sample na populasyon.

serial sampling nagsasangkot ng random na pagpili mula sa pangkalahatang populasyon hindi ng mga indibidwal na yunit, ngunit ng kanilang mga pantay na grupo (mga pugad, serye) upang isailalim ang lahat ng mga yunit nang walang pagbubukod sa pagmamasid sa naturang mga grupo.

Ang paggamit ng serial sampling ay dahil sa katotohanan na maraming mga kalakal para sa kanilang transportasyon, imbakan at pagbebenta ay nakaimpake sa mga pack, kahon, atbp. Samakatuwid, kapag kinokontrol ang kalidad ng mga nakabalot na kalakal, mas makatwiran na suriin ang ilang mga pakete (serye) kaysa piliin ang kinakailangang halaga ng mga kalakal mula sa lahat ng mga pakete.

Dahil sa loob ng mga grupo (serye) lahat ng unit nang walang pagbubukod ay sinusuri, ang average na sampling error (kapag pumipili ng pantay na serye) ay nakadepende lamang sa intergroup (interseries) variance.

W Ang mean sampling error para sa mean score sa panahon ng serial selection, matatagpuan ang mga ito sa pamamagitan ng mga formula:

(muling pagpili); (form.15)

(hindi paulit-ulit na pagpili), (form. 16)

saan r- bilang ng napiling serye; R- kabuuang bilang ng mga episode.

Ang pagkakaiba-iba ng intergroup ng serial sample ay kinakalkula tulad ng sumusunod:

nasaan ang average i- ika-series; - ang pangkalahatang average para sa buong sample na populasyon.

W Average na sampling error para sa pagbabahagi (alternatibong tampok) sa serial selection:

(muling pagpili); (form. 17)

(hindi paulit-ulit na pagpili). (form. 18)

Intergroup(inter-serye) pagkakaiba-iba ng serial sample share tinutukoy ng formula:

, (form. 19)

nasaan ang bahagi ng tampok i ika-serye; - ang kabuuang bahagi ng katangian sa buong sample.

Sa pagsasagawa ng mga istatistikal na survey, bilang karagdagan sa mga naunang isinasaalang-alang na mga pamamaraan ng pagpili, ang kanilang kumbinasyon ay ginagamit (pinagsamang seleksyon).

Ang konsepto at pagkalkula ng sampling error.

Ang gawain ng selective observation ay magbigay ng mga tamang ideya tungkol sa summary indicators ng buong populasyon batay sa ilang bahagi ng mga ito na sumailalim sa obserbasyon. Tinatawag ang posibleng paglihis ng sample share at sample mean mula sa share at mean sa pangkalahatang populasyon error sa sampling o pagkakamali sa pagiging kinatawan. Kung mas malaki ang halaga ng error na ito, mas naiiba ang mga indicator ng sample observation kumpara sa pangkalahatang populasyon.

Magkaiba:

Mga error sa pag-sample;

Mga error sa pagpaparehistro.

Mga error sa pagpaparehistro nangyayari kapag ang isang katotohanan ay hindi wastong naitatag sa proseso ng pagmamasid. Ang mga ito ay katangian ng parehong patuloy na pagmamasid at pumipili na pagmamasid, ngunit mas mababa ang mga ito sa pumipili na pagmamasid.

Ang likas na katangian ng error ay:

Tendentious - sinadya, i.e. alinman sa pinakamahusay o pinakamasamang mga yunit ng populasyon ang napili. Sa kasong ito, nawawalan ng kahulugan ang mga obserbasyon;

Random - ang pangunahing prinsipyo ng organisasyon ng selective observation ay upang maiwasan ang sinasadyang pagpili, i.e. tiyakin ang mahigpit na pagsunod sa prinsipyo ng random na pagpili.

Pangkalahatang tuntunin ng random na pagpili ay: ang mga indibidwal na yunit ng pangkalahatang populasyon ay dapat na may eksaktong kaparehong mga kondisyon at pagkakataong mahulog sa bilang ng mga yunit na kasama sa sample. Ito ay nagpapakilala sa kalayaan ng sample na resulta mula sa kalooban ng nagmamasid. Ang kalooban ng tagamasid ay bumubuo ng mga malimit na pagkakamali. Ang sampling error sa random na pagpili ay random. Nailalarawan nito ang laki ng mga paglihis ng mga pangkalahatang katangian mula sa mga sample.

Dahil sa ang katunayan na ang mga katangian sa pinag-aralan na populasyon ay nag-iiba, ang komposisyon ng mga yunit sa sample ay maaaring hindi nag-tutugma sa komposisyon ng mga yunit ng buong populasyon. Ibig sabihin nito ay R at hindi tumutugma sa W At . Ang posibleng pagkakaiba sa pagitan ng mga katangiang ito ay tinutukoy ng sampling error, na tinutukoy ng formula:

nasaan ang pangkalahatang pagkakaiba.

nasaan ang sample variance.

Ipinapakita nito kung saan naiiba ang pangkalahatang pagkakaiba sa sample na pagkakaiba sa mga oras.

Mayroong paulit-ulit at hindi paulit-ulit na pagpili. Ang kakanyahan ng muling pagpili ay ang bawat yunit sa sample, pagkatapos ng pagmamasid, ay bumalik sa pangkalahatang populasyon at maaaring muling suriin. Kapag nag-resampling, kinakalkula ang average na error sa sampling:

Para sa tagapagpahiwatig ng bahagi ng isang alternatibong katangian, ang sample na pagkakaiba ay tinutukoy ng formula:

Sa pagsasagawa, ang muling pagpili ay bihirang ginagamit. Sa hindi paulit-ulit na pagpili, ang laki ng pangkalahatang populasyon N bumababa sa panahon ng sampling, ang formula para sa average na sampling error para sa quantitative attribute ay:



Ang isa sa mga posibleng halaga kung saan ang bahagi ng pinag-aralan na katangian ay maaaring katumbas ng:

nasaan ang sampling error ng alternatibong feature.

Halimbawa.

Sa isang sample na survey ng 10% ng mga produkto ng isang batch ng mga natapos na produkto ayon sa pamamaraan nang walang muling pagpili, nakuha ang sumusunod na data sa moisture content sa mga sample.

Tukuyin ang average na moisture%, variance, standard deviation, na may probabilidad na 0.954, ang mga posibleng limitasyon kung saan inaasahan ang average. % moisture ng lahat ng mga natapos na produkto, na may posibilidad na 0.987, posibleng mga limitasyon ng tiyak na gravity ng mga karaniwang produkto, sa kondisyon na ang mga produktong may moisture content na hanggang 13 at higit sa 19% ay nabibilang sa isang hindi karaniwang batch.

Tanging sa isang tiyak na probabilidad maaari itong maipangatuwiran na ang pangkalahatang bahagi ng bahagi ng sample at ang pangkalahatang average ng sample na ibig sabihin ay lumilihis sa t minsan.

Sa mga istatistika, ang mga paglihis na ito ay tinatawag marginal sampling error at minarkahan.

Ang posibilidad ng mga paghatol ay maaaring dagdagan o bawasan t minsan. Na may posibilidad na 0.683, na may 0.954, na may 0.987, kung gayon ang mga tagapagpahiwatig ng pangkalahatang populasyon ayon sa mga tagapagpahiwatig ng sample ay tinutukoy:

Average na sampling error ay palaging naroroon sa mga sample na pag-aaral at lumilitaw dahil sa katotohanan na hindi lahat ng mga yunit ng istatistikal na populasyon ay sinuri, ngunit bahagi lamang nito.

Ang ibig sabihin ng sampling error ay nagiging marginal error Δ kapag pinarami ng confidence factor t , na paunang itinakda batay sa kinakailangang katumpakan ng pagmamasid. Ang marginal error ay nagpapahintulot sa iyo na hatulan ang "tunay" na laki ng parameter sa pangkalahatang populasyon na may isang tiyak na antas ng posibilidad

Para sa tipikal at serial na pagpili, kapag kinakalkula ang sampling error sa halip na kabuuang pagkakaiba 2 ) gamitin ang mean ng mga pagkakaiba-iba sa loob ng pangkat at pagkakaiba-iba sa pagitan ng pangkat
, Saan
- pribadong pagkakaiba-iba ng pangkat i, dami i pangkat

Mga formula para sa marginal error ng isang random na sample sa pagtukoy ng average

Para sa muling pagpili

Mga formula para sa marginal error ng isang random na sample sa pagtukoy ng bahagi

Para sa muling pagpili

Para sa hindi paulit-ulit na pagpili

Mga formula para sa laki ng random na sample sa pagtukoy ng average na halaga

Mga formula para sa bilang ng mga random na sample sa pagtukoy ng bahagi ng pinag-aralan na katangian

Ang marginal difference sa pagitan ng general at sample mean ay tumutugma sa marginal error

Mga halaga ng posibilidad at ayon sa pagkakabanggit t ay nasa mga talahanayan ng pamamahagi:

  • Mag-aaral (sa kaso ng isang maliit na sample)

Ang mga random na sampling formula ay angkop din para sa mechanical sampling.

Kung kailangan ang rounding, na may random sampling - rounding up, na may mechanical sampling - rounding down.

Maliit na sample

Kung ang laki ng sample ay hindi hihigit sa 30 mga yunit, kung gayon ang average na error ng isang maliit na sample sa pagtukoy ng average na halaga ay kinakalkula ng formula:

Upang kalkulahin ang error ng isang maliit na sample, ginagamit ang refined variance formula

Mga uri ng sampling na gawain

    kahulugan ng sampling error,

    pagpapasiya ng laki ng sample n ,

    pagpapasiya ng posibilidad na ang sample mean (o bahagi) ay lumihis mula sa pangkalahatan nang hindi hihigit sa isang naibigay na halaga t=Δ/μ,

    pagtatasa ng randomness ng mga pagkakaiba sa mga tagapagpahiwatig ng mga sample na obserbasyon,

    paglipat ng mga sample na katangian sa pangkalahatang populasyon.

Pagsusuri sa Mean at Proporsyon ng Hypothesis

Pagtatantya ng randomness ng mga pagkakaiba sa mga indicator ng mga sample na obserbasyon


Mga pamamaraan para sa paglilipat ng sample na data sa pangkalahatang populasyon

    paraan ng pagtimbang;

    paraan ng muling pagtimbang;

    paraan ng pagpuno sa pamamagitan ng random na pagpili sa mga kapalit na klase.

marginal error- ang pinakamataas na posibleng pagkakaiba sa pagitan ng mga paraan o ang pinakamataas na error para sa isang naibigay na posibilidad ng paglitaw nito.

1. Ang marginal sampling error para sa average sa panahon ng paulit-ulit na pagpili sa ay kinakalkula ng formula:

kung saan t - normalized deviation - "confidence factor", na nakasalalay sa probabilidad na ginagarantiyahan ang marginal sampling error;

mu x ay ang ibig sabihin ng sampling error.

2. Marginal Sampling Error para sa Proporsyon kapag ang muling pagpili ay tinutukoy ng formula:

3. Ang marginal sampling error para sa mean na may hindi paulit-ulit na pagpili:

Limitahan ang kamag-anak na error ang sampling ay tinukoy bilang ang ratio ng porsyento ng marginal sampling error sa kaukulang katangian ng sampling na populasyon. Ito ay tinukoy tulad nito:

Maliit na sample

Ang teorya ng maliliit na sample ay binuo English statistician Student sa simula ng ika-20 siglo. Noong 1908, natuklasan niya ang isang espesyal na pamamahagi na ginagawang posible, kahit na may maliliit na sample, upang maiugnay ang t at ang posibilidad ng kumpiyansa F(t). Para sa n higit sa 100, nagbibigay sila ng parehong mga resulta tulad ng mga talahanayan ng Laplace probability integral, para sa 30< n < 100 различия получаются незначительные. Поэтому на практике к малым выборкам относятся выборки объемом менее 30 единиц.

Tulad ng nalalaman, sa mga istatistika mayroong dalawang paraan ng pagmamasid sa mass phenomena, depende sa pagkakumpleto ng saklaw ng bagay: tuloy-tuloy at hindi tuloy-tuloy. Ang isang pagkakaiba-iba ng hindi tuloy-tuloy na pagmamasid ay piling pagmamasid.

Sa ilalim piling pagmamasid ay nauunawaan bilang isang hindi tuloy-tuloy na obserbasyon, kung saan ang mga yunit ng pinag-aralan na populasyon, pinili nang random, ay sumasailalim sa istatistikal na pagsusuri (obserbasyon).

Ang selective observation ay nagtatakda mismo ng gawain ng pagkilala sa buong populasyon ng mga yunit para sa napagmasdan na bahagi, napapailalim sa lahat ng mga patakaran at mga prinsipyo ng istatistikal na pagmamasid at siyentipikong organisadong gawain sa pagpili ng mga yunit.

Ang hanay ng mga yunit na pinili para sa survey sa mga istatistika ay karaniwang tinatawag sample na populasyon , at ang hanay ng mga yunit kung saan ginawa ang pagpili ay tinatawag pangkalahatang populasyon . Ang mga pangunahing katangian ng pangkalahatan at sample na populasyon ay ipinakita sa Talahanayan 1.

Talahanayan 1 - Ang mga pangunahing katangian ng pangkalahatan at sample na populasyon
IndexPagtatalaga o formula
Populasyon Sampol na populasyon
Bilang ng mga yunit N n
Ang bilang ng mga unit na may feature M m
Proporsyon ng mga yunit na may tampok na ito p = M/N ω = m/n
Proporsyon ng mga unit na walang ganitong katangian q = 1 - p 1 - w
Average na halaga tanda
Pagpapakalat tanda
Pagpapakalat ng isang alternatibong tampok (pagpapakalat ng isang bahagi) pq ω (1 - ω)

Kapag nagsasagawa ng pumipili na pagmamasid, nangyayari ang mga sistematiko at random na pagkakamali. Ang mga sistematikong error ay lumitaw dahil sa paglabag sa mga patakaran para sa pagpili ng mga yunit sa sample. Sa pamamagitan ng pagbabago sa mga panuntunan sa pagpili, ang mga naturang error ay maaaring alisin.

Ang mga random na error ay lumitaw dahil sa hindi tuloy-tuloy na katangian ng survey. Kung hindi man, ang mga ito ay tinatawag na mga pagkakamali sa pagiging kinatawan (representativeness). Ang mga random na error ay nahahati sa average at marginal sampling na mga error, na tinutukoy kapwa kapag kinakalkula ang tampok at kapag kinakalkula ang bahagi.

Ang average at limitasyon ng mga error ay nauugnay sa sumusunod na kaugnayan :Δ = tμ, kung saan ang Δ ay ang marginal sampling error, μ ay ang average sampling error, t ay ang confidence factor na tinutukoy depende sa antas ng probabilidad. Ang talahanayan 2 ay nagpapakita ng ilang mga halaga ng t kinuha mula sa teorya ng posibilidad.

Ang halaga ng average na error sa sampling ay kinakalkula nang naiiba depende sa paraan ng pagpili at pamamaraan ng sampling. Ang mga pangunahing formula para sa pagkalkula ng mga sampling error ay ipinakita sa Talahanayan 3.

Talahanayan 3 - Mga Pangunahing Formula para sa Pagkalkula ng Mga Sampling Error sa Paulit-ulit at Hindi Paulit-ulit na Pagpili
IndexPagtatalaga at formula
Populasyon Sampol na populasyon
Mean feature error para sa random resampling
Mean share error para sa random resampling
Limitahan ang error ng isang feature sa kaso ng random na muling pagpili
Error sa Marginal Share sa Random Reselection
Average na error ng isang feature para sa random na hindi paulit-ulit na pagpili
Mean share error sa random na hindi paulit-ulit na pagpili
Limitahan ang error ng isang feature na may random na hindi paulit-ulit na pagpili
Error sa marginal share para sa random na hindi paulit-ulit na pagpili

Ang pagkalkula ng average at marginal sampling error ay nagpapahintulot sa iyo na matukoy ang mga posibleng limitasyon kung saan ang mga katangian ng pangkalahatang populasyon ay magiging .

Halimbawa, para sa isang sample na ibig sabihin, ang mga naturang limitasyon ay itinakda batay sa mga sumusunod na relasyon:

Mga limitasyon ng bahagi ng katangian sa pangkalahatang populasyon p.

Mga halimbawa ng paglutas ng mga problema sa paksang "Sampling observation in statistics"

Gawain 1 . Mayroong impormasyon sa output ng mga produkto (gawa, serbisyo) na nakuha batay sa 10% sample na pagmamasid ng mga negosyo sa rehiyon:

Tukuyin: 1) para sa mga negosyong kasama sa sample: a) ang average na laki ng output bawat enterprise; b) pagpapakalat ng dami ng produksyon; c) ang bahagi ng mga negosyo na may dami ng produksyon na higit sa 400 libong rubles; 2) para sa rehiyon sa kabuuan, na may posibilidad na 0.954, ang mga limitasyon kung saan maaaring asahan ng isa: a) ang average na dami ng produksyon sa bawat negosyo; b) ang bahagi ng mga negosyo na may dami ng produksyon na higit sa 400 libong rubles; 3) ang kabuuang dami ng output sa rehiyon.

Solusyon

Upang malutas ang problema, pinalawak namin ang iminungkahing talahanayan.

1) Para sa mga negosyong kasama sa sample, ang average na laki ng output bawat enterprise

110800/400 = 277 libong rubles

Kinakalkula namin ang pagpapakalat ng dami ng produksyon sa isang pinasimpleng paraan σ 2 = 35640000/400 - 277 2 = 89100 - 76229 = 12371.

Ang bilang ng mga negosyo na ang dami ng produksyon ay lumampas sa 400 libong rubles. katumbas ng 36+12 = 48, at ang kanilang bahagi ay katumbas ng ω = 48:400 = 0.12 = 12%.

2) Mula sa teorya ng probabilidad ay alam na may probabilidad P=0.954 ang confidence factor t=2. Marginal sampling error

2√12371:400 = 11.12 libong rubles

Itakda natin ang mga hangganan ng pangkalahatang average: 277-11.12 ≤Xav ≤ 277+11.12; 265.88 ≤Xav ≤ 288.12

Marginal sampling error ng bahagi ng mga negosyo

2√0,12*0,88/400 = 0,03

Tukuyin natin ang mga hangganan ng pangkalahatang bahagi: 0.12-0.03≤ p ≤0.12+0.03; 0.09≤ p≤0.15

3) Dahil ang itinuturing na grupo ng mga negosyo ay 10% ng kabuuang bilang ng mga negosyo sa rehiyon, mayroong 4,000 mga negosyo sa rehiyon sa kabuuan. Pagkatapos ang kabuuang dami ng output sa rehiyon ay nasa loob ng 265.88×4000≤Q≤288.12×4000; 1063520 ≤ Q ≤ 1152480

Gawain 2 . Ayon sa mga resulta ng isang control audit ng mga awtoridad sa buwis ng 400 mga istruktura ng negosyo, 140 sa kanila ay hindi ganap na nagpapahiwatig ng kita na napapailalim sa pagbubuwis sa kanilang mga tax return. Tukuyin sa pangkalahatang populasyon (para sa buong rehiyon) ang bahagi ng mga istruktura ng negosyo na nagtago ng bahagi ng kanilang mga kita sa buwis na may posibilidad na 0.954.

Solusyon

Ayon sa kondisyon ng problema, ang bilang ng mga yunit sa sample na populasyon ay n=400, ang bilang ng mga yunit na may itinuturing na tampok ay m=140, ang posibilidad ay P=0.954.

Mula sa teorya ng probabilidad ay alam na sa probability P=0.954 ang confidence factor t=2.

Ang proporsyon ng mga yunit na may ipinahiwatig na katangian ay tinutukoy ng formula: p=w+∆p, kung saan w = m/n=140/400=0.35=35%,
at ang limitasyon ng error ng tampok na ∆p ay nakuha mula sa formula: ∆p= t √w(1-w)/n = 2√0.35×0.65/400 ≈ 0.5 = 5%

Pagkatapos p = 35±5%.

Sagot : Ang bahagi ng mga istruktura ng negosyo na nagtago ng bahagi ng kanilang kita sa buwis na may posibilidad na 0.954 ay 35±5%.