Sample size kung paano hanapin ang formula. Laki ng sample - pumipili na paraan ng sosyolohikal na pananaliksik

Alam ng istatistika ang lahat. At Ilf at E. Petrov, "12 Upuan"

Isipin na nagtatayo ka ng isang malaking shopping center at gusto mong suriin ang daloy ng trapiko sa pasukan sa parking area. Hindi, magbigay tayo ng isa pang halimbawa... hinding-hindi nila gagawin ito. Kailangan mong suriin ang mga kagustuhan sa panlasa ng iyong mga bisita sa portal, kung saan kailangan mong magsagawa ng isang survey sa kanila. Paano i-link ang dami ng data at ang posibleng error? Walang kumplikado - mas malaki ang iyong sample, mas maliit ang error. Gayunpaman, may mga nuances din dito.

Teoretikal na minimum

Hindi magiging labis na i-refresh ang ating memorya, ang mga terminong ito ay magiging kapaki-pakinabang sa atin sa ibang pagkakataon.

  • populasyon- Ang hanay ng lahat ng mga bagay kung saan isinasagawa ang pananaliksik.
  • Sampol– Isang subset, isang bahagi ng mga bagay mula sa buong populasyon na direktang kasangkot sa pag-aaral.
  • Type I error- (α) Probability ng pagtanggi sa null hypothesis habang ito ay totoo.
  • Uri II error- (β) Probability hindi tanggihan ang null hypothesis kapag ito ay mali.
  • 1-β- Statistical power ng criterion.
  • μ 0 at μ 1- Mean na mga halaga sa ilalim ng null at alternatibong hypotheses.


Nasa mismong mga kahulugan ng kamalian ng una at pangalawang uri ay may puwang para sa debate at interpretasyon. Paano magpasya sa mga ito at kung alin ang pipiliin bilang zero? Kung sinusuri mo ang antas ng polusyon sa lupa o tubig, paano mo bubuoin ang null hypothesis: may polusyon ba, o walang polusyon? Ngunit mula dito depende ang laki ng sample mula sa pangkalahatang populasyon ng mga bagay.



Inisyal populasyon, pati na rin ang sample maaaring magkaroon ng anumang distribusyon, ngunit ang ibig sabihin ay mayroon normal o Pamamahagi ng Gaussian salamat sa Central Limit Theorem.


Tungkol sa mga parameter ng pamamahagi at ang ibig sabihin sa partikular, ilang uri ng mga hinuha ang posible. Una na kung saan ay tinatawag na agwat ng kumpiyansa. Ipinapahiwatig nito ang hanay ng mga posibleng halaga para sa parameter, kasama ang tinukoy salik ng kumpiyansa. Kaya halimbawa 100(1-α)% agwat ng kumpiyansa para sa μ magiging ganito (Lv. 1).




Pangalawa mula sa hinuha pagsubok ng hypothesis. Ito ay maaaring isang bagay tulad nito.

  • H 0: μ = h
  • H 1: µ > h
  • H2: μ< h

MULA SA agwat ng kumpiyansa 100(1-α) para sa μ maaari kang pumili ng pabor sa H 1 at H 2:

  • Kung ang mas mababang limitasyon agwat ng kumpiyansa 100(1-α)< h , то тогда tanggihan ang H 0 pabor sa H 2 .
  • Kung ang pinakamataas na limitasyon agwat ng kumpiyansa 100(1-α) > h, pagkatapos tanggihan ang H 0 pabor sa H 1 .
  • Kung ang agwat ng kumpiyansa Kasama sa 100(1-α) ang h, kung gayon hindi natin matatanggihan ang H 0 at ang ganitong resulta ay itinuturing na walang katiyakan.

Kung kailangan nating suriin ang halaga μ para sa isa mga sample mula sa kabuuang populasyon, kung gayon ang criterion ay kukuha ng anyo



Agwat ng kumpiyansa, error at laki ng sample

Kunin ang pinakaunang equation at ipahayag ang lapad mula doon agwat ng kumpiyansa(Lv. 2).



Sa ilang mga kaso, maaari nating palitan ang t-statistic ng Estudyante ng z standard normal distribution. Pinapalitan ng isa pang pagpapasimple ang kalahati ng w sa error sa pagsukat E. Pagkatapos ang ating equation ay kukuha ng anyo (Eq. 3).



Sa nakikita natin bumababa talaga ang error kasabay ng paglaki ng bilang ng input data. Mula sa kung saan madaling makuha ang iyong hinahanap (Eq. 4).


Pagsasanay - bilangin kasama si R

Subukan natin ang hypothesis na ang average na halaga ng ibinigay na sample ng bilang ng mga insekto sa bitag ay 1.

  • H 0: μ = 1
  • H1: μ > 1
Mga insekto 0 1 2 3 4 5 6
Mga bitag 10 9 5 5 1 2 1

> x<- read.table("/tmp/tcounts.txt") >y = unlist(x, use.names="false") > mean(z);sd(z) 1.636364 1.654883

Tandaan na ang mean at standard deviation ay halos pantay, na natural para sa isang Poisson distribution. 95% confidence interval para sa Student's t-statistic at df=32 .


> qt(.975, 32) 2.036933

at sa wakas ay nakukuha natin ang kritikal na pagitan para sa ibig sabihin: 1.05 - 2.22 .


> μ=mean(z) > st = qt(.975, 32) > μ + st * sd(z)/sqrt(33) 2.223159 > μ - st * sd(z)/sqrt(33) 1.049568

Bilang resulta, dapat tanggihan ang H 0 at tanggapin ang H 1, dahil may posibilidad na 95%, μ > 1.


Sa parehong halimbawa, ipagpalagay na alam natin ang aktwal na standard deviation - σ , at hindi ang pagtatantya nito na nakuha gamit ang isang random na sample, maaari mong kalkulahin ang kinakailangang n para sa isang naibigay na error. Kalkulahin natin para sa E=0.5 .


> za2 = qnorm(.975) > (za2*sd(z)/.5)^2 42.08144

pagwawasto ng hangin

Sa katunayan, walang dahilan upang maniwala na malalaman natin σ (variance), habang μ (mean) hindi pa natin na-estimate. Dahil dito, ang equation 4 ay hindi gaanong praktikal na gamit, maliban sa mga partikular na pinong halimbawa mula sa larangan ng combinatorics, at ang makatotohanang equation para sa n ay medyo mas kumplikado para sa hindi alam. σ (Lv. 5).



tandaan mo yan σ sa huling equation, hindi na may takip (^), ngunit may tilde (~). Isa itong kinahinatnan ng katotohanan na sa simula pa lang ay wala kaming tinantyang standard deviation ng random sample - , at sa halip ay ginagamit namin binalak- . Saan natin makukuha ang pinakabago? Masasabi natin iyon mula sa kisame: ekspertong paghuhusga, magaspang na pagtatantya, nakaraang karanasan, atbp.


At paano naman ang pangalawang termino sa kanang bahagi ng 5th equation, saan ito nanggaling? Dahil kay , kailangan ang pagwawasto ni Günther.


Bilang karagdagan sa mga equation 4 at 5, mayroong ilang higit pang tinatayang-evaluative na mga formula, ngunit nararapat na ito sa isang hiwalay na post.

Ang formula sa ibaba upang kalkulahin laki ng sample ay ginagamit sa mga kaso kung saan ang mga respondente (tumugon) ay tinanong lamang ng isang katanungan, kung saan mayroon lamang dalawang posibleng sagot. Halimbawa, "Oo" at "Hindi"; "Ginagamit ko" at "Hindi ko ginagamit". Siyempre, ang formula na ito ay mailalapat lamang kapag nagsasagawa ng pinakasimpleng pag-aaral. Kung kailangan mong matukoy ang laki ng sample kapag nagsasagawa ng mas malalaking pag-aaral, tulad ng mga questionnaire, dapat gumamit ng ibang mga formula.

Isang simpleng formula para sa pagkalkula ng laki ng sample

saan: n- laki ng sample;

z ay ang normalized deviation na tinutukoy batay sa napiling antas ng kumpiyansa. Ang tagapagpahiwatig na ito ay nagpapakilala sa posibilidad, ang posibilidad na makakuha ng mga sagot sa isang espesyal na agwat ng kumpiyansa. Sa pagsasagawa, ang antas ng kumpiyansa ay kadalasang kinukuha bilang 95% o 99%. Kung gayon ang mga halaga ng z ay magiging 1.96 at 2.58, ayon sa pagkakabanggit;

p– pagkakaiba-iba para sa sample, sa mga pagbabahagi. Sa esensya, ang p ay ang posibilidad na ang mga respondent ay pipili ng isa o ibang opsyon sa sagot. Ipagpalagay na kung naniniwala tayo na ang isang-kapat ng mga respondente ay pipili ng sagot na "Oo", kung gayon ang p ay magiging katumbas ng 25%, iyon ay, p = 0.25;

q= (1 – p);

e– pinahihintulutang pagkakamali, sa mga fraction.

Halimbawa ng pagkalkula ng laki ng sample

Plano ng kumpanya na magsagawa ng sociological study upang matukoy ang proporsyon ng mga naninigarilyo sa populasyon ng lungsod. Para magawa ito, tatanungin ng mga empleyado ng kumpanya ang mga dumadaan ng isang tanong: "Naninigarilyo ka ba?". Kaya, mayroon lamang dalawang posibleng sagot: "Oo" at "Hindi".

Ang laki ng sample sa kasong ito ay kinakalkula bilang mga sumusunod. Ang antas ng kumpiyansa ay kinuha bilang 95%, pagkatapos ay ang normalized deviation z = 1.96. Tinatanggap namin ang pagkakaiba-iba bilang 50%, iyon ay, may kondisyon kaming naniniwala na ang kalahati ng mga sumasagot ay makakasagot sa tanong kung sila ay naninigarilyo - "Oo". Pagkatapos p=0.5. Mula dito makikita natin q = 1 – p = 1 – 0.5 = 0,5 . Ang katanggap-tanggap na sampling error ay kinuha bilang 10%, ibig sabihin e = 0.1.

Pinapalitan namin ang data na ito sa formula at kinakalkula:

Pagkuha ng sample size n = 96 tao.

Saklaw ng formula na ito

Kapag nagsasagawa ng simpleng pananaliksik, kapag kailangan mong makakuha ng sagot sa isang simpleng tanong lamang. Sa kasong ito, ang sukat ng mga tugon, bilang panuntunan, ay may dichotomous na kalikasan. Iyon ay, ang mga sagot ay inaalok (o ipinahiwatig) ng uri na "Oo" - "Hindi", "Itim" - "Puti", atbp.

Mga tampok ng formula na ito para sa pagkalkula ng laki ng sample

Galyaudinov R.R.


© Ang pagkopya ng materyal ay pinapayagan lamang kung tumukoy ka ng direktang hyperlink sa

Ang mga populasyon ay madalas na gaganapin sa malalaking grupo ng mga tao. Madalas na maling isipin na ang pagiging maaasahan ng mga resulta ay magiging mas mataas kung ang mga tanong ay sasagutin ng bawat miyembro ng lipunan. Dahil sa malaking oras, pera at mga gastos sa paggawa, ang naturang pagsusuri ay hindi katanggap-tanggap. Sa pagtaas ng bilang ng mga sumasagot, hindi lamang tataas ang mga gastos, ngunit tataas din ang panganib na makatanggap ng maling data. Mula sa praktikal na pananaw, maraming questionnaire at coder ang magbabawas sa posibilidad ng maaasahang kontrol sa kanilang mga aksyon. Ang nasabing survey ay tinatawag na tuloy-tuloy.

Sa sosyolohiya, kadalasang ginagamit ang isang hindi tuloy na pag-aaral, o isang piling pamamaraan. Ang mga resulta nito ay maaaring pahabain sa isang malaking hanay ng mga tao, na tinatawag na pangkalahatan.

Kahulugan at kahulugan ng paraan ng sampling

Ang paraan ng sampling ay isang quantitative na paraan ng pagpili ng isang bahagi ng pinag-aralan na mga yunit mula sa kabuuang masa, habang ang mga resulta ng survey ay ilalapat din sa bawat indibidwal na hindi nakibahagi dito.

Ang pamamaraan ng sampling ay parehong paksa ng siyentipikong pananaliksik at isang akademikong disiplina. Ito ay gumaganap bilang isang paraan ng pagkuha ng maaasahang impormasyon tungkol sa pangkalahatang populasyon at tumutulong upang suriin ang lahat ng mga parameter nito. Ang mga kondisyon para sa pagpili ng mga yunit ay makakaapekto sa istatistikal na pagsusuri ng mga resulta. Kung ang mga pamamaraan ng sampling ay hindi maganda ang pagpapatupad, ang paggamit ng kahit na ang pinaka-maaasahang paraan ng pagproseso ng nakolektang impormasyon ay magiging walang silbi.

Mga Pangunahing Konsepto ng Teorya ng Pagpili

Tinatawag nila ang relasyon ng mga yunit, na may kaugnayan kung saan ang mga konklusyon ng sample na pag-aaral ay nabuo. Maaari itong mga residente ng isang bansa, isang partikular na lokalidad, ang pangkat ng trabaho ng isang negosyo, atbp.

Ang sample (o sample) ay bahagi ng pangkalahatan, na pinili gamit ang mga espesyal na pamamaraan at pamantayan. Halimbawa, ang mga istatistikal na pamantayan ay isinasaalang-alang sa proseso ng pagbuo.

Ang bilang ng mga indibidwal na kasama sa isang ibinigay na hanay ay tinatawag na dami nito. Ngunit maaari itong ipahayag hindi lamang sa bilang ng mga tao, kundi pati na rin ng mga istasyon ng botohan, mga pamayanan, iyon ay, tiyak na malalaking yunit na kinabibilangan ng mga yunit ng pagmamasid. Ngunit isa na itong multistage na sample.

Ang yunit ng pagpili ay ang mga bumubuong bahagi ng pangkalahatang populasyon, maaari silang maging direktang mga yunit ng pagmamasid (single-stage sampling) o mas malalaking pormasyon.

Ang isang mahalagang papel sa pagkuha ng maaasahang mga resulta ng pananaliksik gamit ang isang paraan ng sampling ay isang katangian bilang ang pagiging kinatawan ng pagpili. Ibig sabihin, ang bahagi ng pangkalahatang populasyon na naging mga tumutugon ay dapat na ganap na magparami ng lahat ng mga katangian nito. Ang anumang paglihis ay itinuturing na isang error.

Mga hakbang para sa paglalapat ng paraan ng sampling

Ang bawat empirical ay binubuo ng mga yugto. Kung ang paraan ng sampling ay inilapat, ang kanilang pagkakasunud-sunod ay isasaayos tulad ng sumusunod:

  1. Paglikha ng isang draft na sample: ang pangkalahatang populasyon ay itinatag, mga pamamaraan ng pagpili, mga volume ay nailalarawan.
  2. Pagpapatupad ng proyekto: sa kurso ng pagkolekta ng sosyolohikal na impormasyon, ang mga talatanungan ay nagsasagawa ng mga gawain na may indikasyon ng paraan ng pagpili ng mga sumasagot.
  3. Pagkilala at pagwawasto ng mga pagkakamali ng pagiging kinatawan.

Mga uri ng sample sa sosyolohiya

Matapos matukoy ang pangkalahatang populasyon, ang mananaliksik ay nagpapatuloy sa mga piling pamamaraan. Maaari silang nahahati sa dalawang uri (pamantayan):

  1. Ang papel ng mga probabilistikong batas sa kurso ng sampling.
  2. Ang bilang ng mga yugto ng pagpili.

Kung ang unang criterion ay inilapat, pagkatapos ay ang paraan ng random sampling at hindi random na pagpili ay nakikilala. Batay sa huli, maaaring pagtalunan na ang sample ay maaaring single-stage at multi-stage.

Ang mga uri ng mga sample ay direktang makikita hindi lamang sa mga yugto ng paghahanda at pagsasagawa ng pag-aaral, kundi pati na rin sa mga resulta nito. Bago bigyan ng kagustuhan ang isa sa mga ito, dapat mong maunawaan ang nilalaman ng mga konsepto.

Ang kahulugan ng "random" sa pang-araw-araw na paggamit ay nakatanggap ng ganap na kabaligtaran na kahulugan kaysa sa matematika. Ang ganitong pagpili ay isinasagawa ayon sa mahigpit na mga patakaran, walang paglihis mula sa kanila ang pinahihintulutan, dahil mahalagang tiyakin na ang bawat yunit ng pangkalahatang populasyon ay may parehong pagkakataon na maisama sa sample. Kung hindi matugunan ang mga kundisyong ito, mag-iiba ang posibilidad na ito.

Sa turn, ang random na sample ay nahahati sa:

  • simple;
  • mekanikal (sistematiko);
  • nesting (serial, cluster);
  • stratified (karaniwan o zoned).

Ang isang simpleng paraan ng sampling ay isinasagawa gamit ang isang talahanayan ng mga random na numero. Sa una, ang laki ng sample ay tinutukoy; isang kumpletong listahan ng mga may bilang na mga respondent na kasama sa pangkalahatang populasyon ay nilikha. Ang mga espesyal na talahanayan na nakapaloob sa mga publikasyong matematika at istatistika ay ginagamit para sa pagpili. Ang sinuman maliban sa kanila ay ipinagbabawal. Kung ang laki ng sample ay isang tatlong-digit na numero, kung gayon ang bilang ng bawat sampling unit ay dapat na tatlong-digit, ibig sabihin, mula 001 hanggang 790. Ang huling numero ay nagpapahiwatig ng kabuuang bilang ng mga tao. Isasama sa pag-aaral ang mga taong nabigyan ng numero sa tinukoy na hanay, na makikita sa talahanayan.

Ang sistematikong pagpili ay batay sa mga kalkulasyon. Ang isang alpabetikong listahan ng lahat ng mga elemento ng pangkalahatang populasyon ay paunang pinagsama-sama, ang hakbang ay itinakda, at pagkatapos lamang - ang laki ng sample. Ang formula para sa isang hakbang ay ang mga sumusunod:

N: n, kung saan ang N ay ang populasyon at n ang sample.

Halimbawa, 150,000: 5,000 = 30. Kaya, bawat tatlumpung tao ay pipiliin na lumahok sa survey.

Nest type na entity

Ginagamit ang clustered sample kapag ang populasyon ng mga taong pinag-aaralan ay binubuo ng maliliit na natural na grupo. Sa kasong ito, dapat tandaan na ang listahan ng numero ng naturang mga pugad ay tinutukoy sa unang hakbang. Sa tulong ng isang talahanayan ng mga random na numero, ang pagpili ay ginawa at ang isang tuluy-tuloy na survey ng lahat ng mga respondente sa bawat napiling pugad ay isinasagawa. Bukod dito, mas marami sa kanila ang nakibahagi sa pag-aaral, mas maliit ang average na error sa sampling. Gayunpaman, posible na gumamit ng gayong pamamaraan sa kondisyon na ang mga pinag-aralan na pugad ay may katulad na katangian.

Ang kakanyahan ng stratified choice

Ang isang stratified sample ay naiiba sa mga nauna dahil sa bisperas ng pagpili, ang pangkalahatang populasyon ay nahahati sa strata, iyon ay, mga homogenous na bahagi na may isang karaniwang tampok. Halimbawa, ang antas ng edukasyon, mga kagustuhan sa elektoral, ang antas ng kasiyahan sa iba't ibang aspeto ng buhay. Ang pinakasimpleng opsyon ay ang paghiwalayin ang mga paksa ayon sa kasarian at edad. Sa prinsipyo, kinakailangan na isakatuparan ang pagpili sa paraang ang isang bilang ng mga tao na proporsyonal sa kabuuang bilang ay natutukoy mula sa bawat stratum.

Ang laki ng sample sa kasong ito ay maaaring mas maliit kaysa sa isang sitwasyon na may random na pagpili, ngunit ang pagiging kinatawan ay magiging mas mataas. Dapat itong kilalanin na ang stratified sampling ang magiging pinakamahal sa mga tuntuning pinansyal at impormasyon, at ang nested sampling ang magiging pinakakapaki-pakinabang sa bagay na ito.

Non-random na quota sampling

Mayroon ding sample ng quota. Ito ang tanging uri ng hindi random na pagpili na may katwiran sa matematika. Ang sample ng quota ay nabuo mula sa mga unit na dapat na kinakatawan ng mga proporsyon at tumutugma sa pangkalahatang populasyon. Sa form na ito, ang may layunin na pamamahagi ng mga tampok ay isinasagawa. Kung ang mga opinyon at pagtatasa ng mga tao ay kabilang sa mga pinag-aralan na tampok, kung gayon ang kasarian, edad, at edukasyon ng mga sumasagot ay kadalasang mga quota.

Sa isang sosyolohikal na pag-aaral, dalawang paraan ng pagpili ay nakikilala din: paulit-ulit at hindi paulit-ulit. Sa unang kaso, ang napiling yunit pagkatapos ng survey ay ibabalik sa pangkalahatang populasyon upang patuloy na makilahok sa pagpili. Sa pangalawang opsyon, ang mga respondente ay pinag-uuri-uri, na nagpapataas ng pagkakataon ng natitirang mga miyembro ng populasyon na mapili.

Ang sosyologong si G. A. Churchill ay binuo ang sumusunod na panuntunan: ang laki ng sample ay dapat magsikap na magbigay ng hindi bababa sa 100 obserbasyon para sa pangunahin at 20-50 para sa pangalawang bahagi ng pag-uuri. Dapat tandaan na ang ilan sa mga respondent na kasama sa sample, para sa iba't ibang dahilan, ay maaaring hindi makilahok sa survey o tumanggi ito nang buo.

Mga pamamaraan para sa pagtukoy ng laki ng sample

Sa sosyolohikal na pananaliksik, ang mga sumusunod na pamamaraan ay naaangkop:

1. Arbitrary, ibig sabihin, ang laki ng sample ay tinutukoy sa loob ng 5-10% ng komposisyon ng pangkalahatang populasyon.

2. Ang tradisyonal na paraan ng pagkalkula ay batay sa pagsasagawa ng mga regular na survey, halimbawa isang beses sa isang taon, na sumasaklaw sa 600, 2,000 o 2,500 na mga respondente.

3. Statistical - ay upang maitaguyod ang pagiging maaasahan ng impormasyon. Ang mga istatistika bilang isang agham ay hindi bubuo sa paghihiwalay. Ang mga paksa at lugar ng kanyang pananaliksik ay aktibong kasangkot sa iba pang mga kaugnay na larangan: teknikal, pang-ekonomiya at humanitarian. Kaya, ang mga pamamaraan nito ay ginagamit sa sosyolohiya, sa paghahanda para sa mga survey at, sa partikular, sa pagtukoy ng mga laki ng sample. Ang mga istatistika bilang isang agham ay may malawak na baseng pamamaraan.

4. Mahal, kung saan ang pinahihintulutang halaga ng mga gastos para sa pananaliksik ay itinatag.

5. Ang laki ng sample ay maaaring katumbas ng bilang ng mga yunit ng pangkalahatang populasyon, kung gayon ang pag-aaral ay magpapatuloy. Ang diskarte na ito ay naaangkop sa maliliit na grupo. Halimbawa, ang mga manggagawa, mga mag-aaral, atbp.

Noong nakaraan, posibleng maitatag na ang sample ay ituring na kinatawan kapag ang mga katangian nito ay naglalarawan ng mga katangian ng pangkalahatang populasyon na may pinakamababang error.

Ang pagtatantya sa laki ng sample ay nauuna sa mga huling kalkulasyon ng bilang ng mga yunit na pipiliin mula sa pangkalahatang populasyon:

n = Npqt 2: N∆ 2 p + pqt 2 , kung saan ang N ay ang bilang ng mga yunit ng pangkalahatang populasyon, p ay ang bahagi ng katangiang pinag-aaralan (q = 1 - p), t ay ang koepisyent ng pagsusulatan ng ang posibilidad ng kumpiyansa P (natukoy mula sa isang espesyal na talahanayan), ∆ p - pinahihintulutang error.

Isa lang itong variation kung paano kinakalkula ang laki ng sample. Maaaring magbago ang formula depende sa mga kundisyon at sa napiling pamantayan sa pag-aaral (halimbawa, resampling o non-replicating sampling).

Mga error sa pag-sample

Ang mga sosyolohikal na survey ng populasyon ay batay sa paggamit ng isa sa mga uri ng sampling na aming napag-isipan sa itaas. Gayunpaman, sa anumang kaso, ang gawain ng bawat mananaliksik ay dapat na masuri ang antas ng katumpakan ng nakuha na mga tagapagpahiwatig, iyon ay, kinakailangan upang matukoy kung gaano nila ipinapakita ang mga katangian ng pangkalahatang populasyon.

Ang mga error sa pag-sample ay maaaring hatiin sa random at non-random. Ang unang uri ay nagpapahiwatig ng paglihis ng sample indicator mula sa pangkalahatan, na maaaring ipahayag sa pamamagitan ng pagkakaiba sa kanilang mga bahagi (average) at na sanhi lamang ng isang hindi tuloy-tuloy na uri ng survey. At ito ay medyo natural kung ang tagapagpahiwatig na ito ay bumababa laban sa background ng isang pagtaas sa bilang ng mga sumasagot na sinuri.

Ang isang sistematikong error ay isang paglihis mula sa pangkalahatang tagapagpahiwatig, na natagpuan din bilang isang resulta ng pagbabawas ng sample at pangkalahatang pagbabahagi at nagmumula sa hindi pagkakatugma ng pamamaraan ng sampling sa mga itinatag na panuntunan.

Ang mga uri ng error na ito ay kasama sa kabuuang sampling error. Sa isang pag-aaral, isang sample lamang ang maaaring kunin mula sa populasyon. Ang pagkalkula ng maximum na posibleng paglihis ng sample indicator ay maaaring isagawa gamit ang isang espesyal na formula. Ito ay tinatawag na marginal sampling error. Mayroon ding isang bagay tulad ng mean sampling error. Ito ang karaniwang paglihis ng sample mula sa pangkalahatang bahagi.

Mayroon ding posterior (post-experimental) na uri ng error. Nangangahulugan ito ng paglihis ng mga tagapagpahiwatig ng sample mula sa pangkalahatang bahagi (average). Kinakalkula ito sa pamamagitan ng paghahambing ng pangkalahatang tagapagpahiwatig, impormasyon tungkol sa kung saan nagmula sa mga mapagkakatiwalaang mapagkukunan, at ang sample, na itinatag sa panahon ng survey. Ang mga departamento ng tauhan ng mga negosyo, mga katawan ng istatistika ng estado ay madalas na kumikilos bilang maaasahang mapagkukunan ng impormasyon.

Mayroon ding isang priori error, na isa ring paglihis ng sample at pangkalahatang mga tagapagpahiwatig, na maaaring ipahayag bilang pagkakaiba sa pagitan ng kanilang mga pagbabahagi at maaaring kalkulahin gamit ang isang espesyal na formula.

Sa pananaliksik na pang-edukasyon, ang mga sumusunod na pagkakamali ay kadalasang ginagawa kapag pumipili ng mga respondent para sa isang survey:

1. Mga halimbawang hanay ng mga pangkat na kabilang sa iba't ibang pangkalahatang populasyon. Kapag ginagamit ang mga ito, nabuo ang mga istatistikal na inferences na naaangkop sa buong sample. Malinaw na hindi ito katanggap-tanggap.

2. Ang mga kakayahan sa organisasyon at pananalapi ng mananaliksik ay hindi isinasaalang-alang kapag ang mga uri ng mga sample ay isinasaalang-alang, at ang isa sa mga ito ay binibigyan ng kagustuhan.

3. Ang mga pamantayang istatistika para sa istruktura ng pangkalahatang populasyon ay hindi ginagamit nang buo upang maiwasan ang mga pagkakamali sa sampling.

4. Ang mga kinakailangan para sa pagiging kinatawan ng pagpili ng mga respondente sa kurso ng paghahambing na pag-aaral ay hindi isinasaalang-alang.

5. Ang mga tagubilin para sa tagapanayam ay dapat iakma sa tiyak na uri ng pagpili na pinagtibay.

Ang katangian ng partisipasyon ng mga respondente sa pag-aaral ay maaaring bukas o hindi nagpapakilala. Dapat itong isaalang-alang kapag bumubuo ng sample, dahil, na hindi sumasang-ayon sa mga kondisyon, maaaring umalis ang mga kalahok.

Kapag nagdidisenyo ng isang sample na pagmamasid, ang tanong ay lumitaw sa kinakailangang laki ng sample. Ang numerong ito ay maaaring matukoy batay sa pinahihintulutang error sa sampling, sa batayan ng posibilidad na batayan kung saan ang laki ng error na itatakda ay maaaring garantisadong, at sa wakas ay batay sa paraan ng pagpili.

Ang mga formula para sa kinakailangang laki ng sample para sa iba't ibang paraan ng sampling ay maaaring makuha mula sa mga katumbas na ratio na ginamit sa pagkalkula ng mga marginal sampling error. Narito ang pinakakaraniwang ginagamit sa mga expression ng pagsasanay para sa kinakailangang laki ng sample:

wastong random at mechanical sampling:

(muling pagpili)

(hindi paulit-ulit na pagpili)

tipikal na sample:

(muling pagpili)

(hindi paulit-ulit na pagpili)

serial sampling:

(muling pagpili)

(hindi paulit-ulit na pagpili)

Sa kasong ito, depende sa mga layunin ng pag-aaral, ang mga pagkakaiba at mga error sa pag-sample ay maaaring kalkulahin para sa average na halaga o proporsyon ng katangian.

Isaalang-alang natin ang mga halimbawa ng pagtukoy ng kinakailangang laki ng sample para sa iba't ibang paraan ng pagbuo ng sample na populasyon.

Halimbawa 5 Sa 100 mga ahensya ng paglalakbay ng lungsod, ito ay binalak na magsagawa ng isang survey ng average na buwanang bilang ng mga nabentang voucher sa pamamagitan ng paraan ng mekanikal na pagpili. Ano ang dapat na laki ng sample upang may posibilidad na 0.683 ang error ay hindi lalampas sa 3 voucher, kung, ayon sa pilot survey, ang pagkakaiba ay 225.

Solusyon. Kalkulahin ang kinakailangang laki ng sample:

Mga ahensya.

Halimbawa 6 Upang matukoy ang proporsyon ng mga empleyado ng mga komersyal na bangko sa rehiyon sa edad na 40, pinlano na ayusin ang isang tipikal na sample na proporsyonal sa bilang ng mga empleyado ng lalaki at babae na may mekanikal na pagpili sa loob ng mga grupo. Ang kabuuang bilang ng mga empleyado sa bangko ay 12 libong tao, kabilang ang 7 libong kalalakihan at 5 libong kababaihan.

Batay sa mga nakaraang survey, ang average ng mga pagkakaiba-iba sa loob ng grupo ay kilala na 1600. Tukuyin ang kinakailangang laki ng sample na may posibilidad na 0.997 at isang error na 5%.

Solusyon. Kalkulahin ang kabuuang sukat ng isang tipikal na sample:

mga tao

Kalkulahin natin ngayon ang dami ng mga indibidwal na tipikal na grupo:

mga tao

mga tao

Kaya, ang kinakailangang sample size ng mga empleyado ng bangko ay 550 katao, kasama. 319 lalaki at 231 babae.

Halimbawa 7 Ang joint-stock na kumpanya ay mayroong 200 pangkat ng mga manggagawa. Ito ay binalak na magsagawa ng isang sample survey upang matukoy ang proporsyon ng mga manggagawa na may mga sakit sa trabaho. Nabatid na ang pagkakaiba-iba ng inter-serye ng proporsyon ay 225. Sa probabilidad na 0.954, kalkulahin ang kinakailangang bilang ng mga pangkat na magsusurbey ng mga manggagawa kung ang error sa sampling ay hindi dapat lumampas sa 5%.

Solusyon. Ang kinakailangang bilang ng mga brigada ay kakalkulahin batay sa formula para sa dami ng serial na hindi paulit-ulit na sampling:

mga brigada.

3. Pagtukoy sa kinakailangang laki ng sample

Napakahalaga na matukoy ang pinakamainam na sukat ng sample, na, na may tiyak na posibilidad, ay magbibigay ng tinukoy na katumpakan ng mga resulta ng pagmamasid. Habang tumataas ang laki ng sample, bumababa ang error sa sampling. Ngunit dahil ang mga yunit na pinili para sa isang survey ay madalas na nawasak, ang mga sampling rate ng mga yunit sa sample ay dapat na pinakamainam. Maaaring makuha ang pinakamainam na laki ng sample mula sa mga formula ng error sa sampling.

Talahanayan 8.4

Mga formula para sa pagtukoy ng pinakamainam na laki ng sample

Paraan ng pagpili

Para sa medium

Self-random paulit-ulit

Random at mekanikal na hindi nauulit

Typological na hindi paulit-ulit

Serial na hindi paulit-ulit na may pantay na serye

Ipinapakita ng mga formula na habang tumataas ang tinantyang error sa pag-sample, bumababa nang malaki ang kinakailangang laki ng sample.

Upang kalkulahin ang laki ng sample, kailangan mong malaman ang pagkakaiba. Maaaring hiramin ito mula sa mga naunang survey ng pareho o katulad na populasyon, o maaaring magsagawa ng ad hoc sample survey na maliit ang sukat.

Halimbawa 2 : Sa negosyo, 100 manggagawa sa 1000 ang kinapanayam sa pagkakasunud-sunod ng isang random na hindi paulit-ulit na sample at ang mga sumusunod na data ay nakuha sa kanilang kita para sa Oktubre (Talahanayan 8.5).

Talahanayan 8.5

Pamamahagi ng mga manggagawa ayon sa average na buwanang kita

tukuyin:

1) ang average na buwanang kita ng mga empleyado ng negosyong ito, na ginagarantiyahan ang resulta na may posibilidad na 0.997;

2) ang bahagi ng mga manggagawa ng negosyo na may buwanang kita na 19 libong rubles. at mas mataas, ginagarantiyahan ang isang resulta na may posibilidad na 0.954;

3) ang kinakailangang laki ng sample sa pagtukoy ng average na buwanang kita ng mga empleyado ng negosyo, upang may posibilidad na 0.954 ang marginal sampling error ay hindi lalampas sa 200 rubles.

Solusyon:

1) Tukuyin natin ang average na buwanang kita ng mga empleyado ng negosyong ito, na ginagarantiyahan ang resulta na may posibilidad na 0.997.

n= 100 tao

N= 1000 tao

Solusyon: upang matukoy ang pagitan ng average na buwanang kita ng mga empleyado ng isang naibigay na negosyo sa pangkalahatang populasyon, kinakailangang malaman ang halaga ng marginal sampling error at ang laki ng average na buwanang kita ng mga manggagawa ayon sa sample survey .


t at mean sampling error .

Dahil P \u003d 0.997, pagkatapos (ayon sa Talahanayan 8.2) t= 3.

Isang random na hindi paulit-ulit na pagpili ang ginawa, ayon sa talahanayan. 8.3 pipiliin namin ang formula para sa pagkalkula ng average sampling error para sa average:

, saan
ay ang sample na pagkakaiba-iba.

Ang laki ng average na buwanang kita ng mga manggagawa ayon sa sample na survey ay matutukoy ng formula ng arithmetic weighted average:
.

Ang mga karagdagang kalkulasyon ay isasagawa sa sumusunod na talahanayan:

buwanang kita,

Bilang ng mga manggagawa, pers.

Interval midpoint

libong rubles.

libong rubles.

Alam t at
Alamin natin ang halaga ng marginal sampling error:

libo kuskusin.

Kung gayon ang agwat ng average na buwanang kita ng mga manggagawa ng negosyong ito ay ang mga sumusunod:

;

.

Sagot: ang average na buwanang kita ng mga empleyado ng negosyong ito na may posibilidad na 0.997 ay nasa hanay na 18.08 libong rubles. hanggang sa 18.92 libong rubles.

2) Tukuyin natin ang bahagi ng mga manggagawa ng negosyo na may buwanang kita na 19 libong rubles. at mas mataas, na ginagarantiyahan ang isang resulta na may posibilidad na 0.954.

n= 100 tao

N= 1000 tao

Solusyon: upang matukoy ang pagitan ng bahagi ng mga manggagawa na may buwanang kita na 19 libong rubles. at sa itaas, kailangang malaman ang halaga ng marginal sampling error ng fraction
at ang proporsyon ng mga manggagawa na may ganitong average na buwanang kita ayon sa sample W.

Ang marginal sampling error ay tinutukoy ng formula
. Depende ito sa halaga ng confidence factor t at mean sampling error.

Dahil P \u003d 0.954, pagkatapos (ayon sa Talahanayan 8.2) t= 2.

Isang random na hindi paulit-ulit na pagpili ang ginawa, ayon sa talahanayan. 8.3 piliin ang formula para sa pagkalkula ng average sampling error para sa bahagi:

, saan W- ang bahagi ng mga manggagawa ng negosyo na may average na buwanang kita na 19 libong rubles. at mas mataas sa sample.

Ang sample na bahagi ay tinutukoy ng ratio ng bilang ng mga yunit na may katangiang pinag-aaralan m sa kabuuang bilang ng mga sampling unit n, o
.

Pagkatapos ang average na error ng share ay

Alam t at tukuyin ang halaga ng marginal sampling error para sa fraction:

Pagkatapos ang pagitan ng bahagi ng mga manggagawa na may buwanang kita na 19 libong rubles. at sa itaas sa pangkalahatang populasyon ay ang mga sumusunod:

.

Sagot: ang bahagi ng mga manggagawa sa negosyo na may buwanang kita na 19 libong rubles. at mas mataas, na may posibilidad na 0.954 ay nasa hanay mula 19.4% hanggang 36.6%.

    Tukuyin natin ang kinakailangang laki ng sample kapag tinutukoy ang average na buwanang kita ng mga empleyado ng negosyo, upang may posibilidad na 0.954 ang marginal sampling error ay hindi lalampas sa 200 rubles.

N= 1000 tao

Solusyon: ang kinakailangang laki ng sample upang matukoy ang average na buwanang kita ay tinutukoy ng formula (ayon sa Talahanayan 8.4):

Ayon sa kondisyon ng problema, ito ay kilala: na may posibilidad na P = 0.954 t\u003d 2 (tingnan ang talahanayan. 8.2);

0.2 libong rubles;
(ayon sa nakaraang sample).

mga tao

Sagot: upang may posibilidad na 0.954 ang marginal sampling error ay hindi lalampas sa 200 rubles, 189 na tao ang dapat suriin.

4.5. Pagpapasiya ng laki ng sample

Kasama sa sample na pamamaraan ng disenyo sunud-sunod na solusyon ng sumusunod na tatlong gawain:

Kahulugan ng bagay ng pag-aaral;

Pagpapasiya ng sample na istraktura;

Pagtukoy sa laki ng sample.

kadalasan, bagay ng pananaliksik sa marketing ay isang hanay ng mga bagay ng pagmamasid, na maaaring mga mamimili, empleyado ng kumpanya, tagapamagitan, atbp. Kung ang populasyon na ito ay napakaliit na ang pangkat ng pananaliksik ay may kinakailangang lakas sa paggawa, pananalapi at oras upang magtatag ng pakikipag-ugnayan sa bawat isa sa mga elemento nito, kung gayon ay lubos na makatotohanang magsagawa ng patuloy na pag-aaral ng buong populasyon. Sa kasong ito, nang matukoy ang object ng pananaliksik, maaari kang magpatuloy sa susunod na pamamaraan (pagpili ng paraan ng pagkolekta ng data, tool sa pananaliksik at paraan ng komunikasyon sa madla).

Gayunpaman, sa pagsasagawa, madalas na hindi posible o angkop na magsagawa ng patuloy na pag-aaral ng buong populasyon. Maaaring may mga sumusunod na dahilan para dito:

Ang imposibilidad ng pagtatatag ng pakikipag-ugnay sa ilang mga elemento ng populasyon;

Hindi makatwirang mataas na gastos para sa pagsasagawa ng kumpletong pag-aaral o pagkakaroon ng mga paghihigpit sa pananalapi na hindi nagpapahintulot sa pagsasagawa ng kumpletong pag-aaral;

Ang maikling oras na inilaan para sa pag-aaral, dahil sa pagkawala ng kaugnayan ng impormasyon sa paglipas ng panahon o iba pang mga kadahilanan, at kung saan hindi pinapayagan ang koleksyon, sistematisasyon at pagsusuri ng malawak na data para sa buong populasyon.

Samakatuwid, ang malaki at nakakalat na populasyon ay madalas na pinag-aaralan sa tulong ng isang sample, na, tulad ng alam mo, ay nauunawaan bilang isang bahagi ng populasyon, na idinisenyo upang kumatawan sa populasyon sa kabuuan.

Ang katumpakan kung saan ang isang sample ay sumasalamin sa populasyon sa kabuuan ay nakasalalay istraktura at laki ng sample.

Mayroong dalawang mga diskarte sa sample na istraktura- probabilistiko at deterministiko.

Probabilistic na diskarte sa sample na istraktura Ipinapalagay na ang anumang elemento ng populasyon ay maaaring mapili na may tiyak (hindi zero) na posibilidad. Mayroong iba't ibang uri ng mga sample batay sa probability theory (typical, nested, atbp.). Ang pinakasimple at pinakakaraniwan sa pagsasanay ay isang simpleng random na sample, kung saan ang bawat elemento ng populasyon ay may pantay na posibilidad na mapili para sa pananaliksik.

Ang probabilistic sampling ay mas tumpak, pinapayagan nito ang mananaliksik na masuri ang antas ng pagiging maaasahan ng data na kanyang nakolekta, bagaman ito ay mas kumplikado at mas mahal kaysa sa deterministic sampling.

Deterministikong Pagdulog sa sample na istraktura Ipinapalagay na ang pagpili ng mga elemento ng populasyon ay ginagawa sa pamamagitan ng mga pamamaraan batay sa alinman sa mga pagsasaalang-alang sa kaginhawahan, o sa desisyon ng mananaliksik, o sa mga grupong hindi nagbabago.

para sa kaginhawaan, ay binubuo sa pagpili ng anumang elemento ng populasyon batay sa kadalian ng pakikipag-ugnayan sa kanila. Ang di-kasakdalan ng pamamaraang ito ay dahil, marahil, sa mababang representasyon ng sample na nakuha, dahil Ang mga elemento ng populasyon na maginhawa para sa mananaliksik ay maaaring hindi sapat na katangian ng mga kinatawan ng populasyon dahil sa kanilang hindi random at hindi makatwirang pagpili.

Gayunpaman, sa kabilang banda, ang pagiging simple, ekonomiya at kahusayan ng pag-aaral na isinagawa ng pamamaraang ito ay nakakuha ito ng medyo malawak na distribusyon sa pagsasanay at, higit sa lahat, sa pagsasagawa ng mga paunang pag-aaral na naglalayong linawin ang mga pangunahing problema.

Batay sa paraan ng sampling sa desisyon ng mananaliksik, ay binubuo sa pagpili ng mga elemento ng populasyon, na, sa kanyang opinyon, ay ang mga katangiang kinatawan nito. Ang pamamaraang ito ay mas perpekto kaysa sa nauna, dahil ito ay batay sa isang oryentasyon patungo sa mga katangian ng mga kinatawan ng pinag-aralan na populasyon, kahit na sila ay pinili batay sa mga pansariling ideya ng mga mananaliksik tungkol dito.

Paraan ng sampling batay sa contingent norms, ay binubuo sa pagpili ng mga elementong katangian ng populasyon alinsunod sa mga dating nakuhang katangian ng populasyon sa kabuuan. Ang mga katangiang ito ay maaaring makuha sa pamamagitan ng pagsasagawa ng mga paunang pag-aaral at, hindi katulad ng naunang pamamaraan, ay hindi subjective. Samakatuwid, ang pamamaraang ito ay mas advanced, nagbibigay-daan ito upang makakuha ng mga sample na populasyon na hindi gaanong kinatawan kaysa sa mga sample ng probabilidad sa makabuluhang mas mababang gastos para sa pagsasagawa ng isang survey.

Ang pagkakaroon ng napiling sample na istraktura (ang diskarte sa pagbuo nito, ang uri ng probabilistic o throwing formation ng isang deterministic sample), ang mananaliksik ay kailangang matukoy ang volume, i.e. ang bilang ng mga elemento ng sample.

Laki ng sample tinutukoy ang pagiging maaasahan ng impormasyon nakuha bilang resulta ng pag-aaral nito, gayundin ang mga gastos na kailangan para sa pag-aaral. Depende ang laki ng sample sa antas ng homogeneity o pagkakaiba-iba ng mga pinag-aralan na bagay.

Kung mas malaki ang sukat ng sample, mas mataas ang katumpakan nito at mas malaki ang gastos sa pagsasagawa ng survey nito. Sa isang probabilistic na diskarte sa sample na istraktura, ang dami nito ay maaaring matukoy gamit ang mga kilalang istatistikal na formula, batay sa tinukoy na mga kinakailangan para sa katumpakan nito.

Sa pagsasagawa, maraming mga diskarte ang ginagamit upang matukoy ang laki ng sample:

1. Arbitrary na diskarte batay sa aplikasyon ng "rule of thumb". Halimbawa, ipinapalagay na walang ebidensya na upang makakuha ng tumpak na mga resulta, ang sample ay dapat na 5% ng populasyon. Ang diskarte na ito ay simple at madaling ipatupad, ngunit hindi posible na maitatag ang katumpakan ng mga resulta na nakuha. Sa sapat na malaking populasyon, maaari rin itong maging medyo mahal.

Maaaring itakda ang laki ng sample batay sa ilang mga paunang natukoy na kundisyon. Halimbawa, alam ng isang customer ng market research na kapag nag-aaral ng pampublikong opinyon, ang sample ay karaniwang 1000-1200 tao, kaya inirerekomenda niya na manatili ang mananaliksik sa figure na ito. Kung sakaling ang mga taunang survey ay isinasagawa sa isang partikular na merkado, isang sample ng parehong laki ang ginagamit bawat taon. Sa kaibahan sa unang diskarte, dito, kapag tinutukoy ang laki ng sample, ang kilalang lohika ay ginagamit, na, gayunpaman, ay lubhang mahina.

Halimbawa, kapag nagsasagawa ng ilang mga pag-aaral, ang katumpakan ay maaaring mas mababa kaysa sa pag-aaral ng pampublikong opinyon, at ang laki ng populasyon ay maaaring maraming beses na mas maliit kaysa sa pag-aaral ng pampublikong opinyon. Kaya, ang pamamaraang ito ay hindi isinasaalang-alang ang mga kasalukuyang pangyayari at maaaring maging medyo mahal.

Sa ilang mga kaso, ang halaga ng survey ay ginagamit bilang pangunahing argumento sa pagtukoy ng laki ng sample. Kaya, ang badyet para sa pananaliksik sa marketing ay nagbibigay para sa gastos ng pagsasagawa ng ilang mga survey, na hindi maaaring lumampas. Malinaw, ang halaga ng impormasyong natanggap ay hindi isinasaalang-alang. Gayunpaman, sa ilang mga kaso kahit na ang isang maliit na sample ay maaaring magbigay ng medyo tumpak na mga resulta.

Tila makatwirang isaalang-alang ang mga gastos hindi sa ganap na paraan, ngunit may kaugnayan sa pagiging kapaki-pakinabang ng impormasyong nakuha bilang resulta ng mga survey. Dapat isaalang-alang ng kliyente at mananaliksik ang iba't ibang laki ng sample at paraan ng pagkolekta ng data, gastos, iba pang mga salik

2. Laki ng sample mula sa antas ng agwat ng kumpiyansa ng pinahihintulutang error, na, gaya ng nabanggit na, ay natutukoy ng angkop na katumpakan ng mga panghuling paglalahat: mula sa mataas hanggang sa tinatayang. Gayunpaman, dito nasa isip natin ang tinatawag na random na mga error na nauugnay sa likas na katangian ng anumang statistical error. Sila ang kinakalkula bilang mga pagkakamali ng pagiging kinatawan ng mga probabilistikong sample.

Ibinibigay ng V. I. Paniotto ang mga sumusunod na kalkulasyon ng isang kinatawan na sample na may pag-aakalang may 5 porsiyentong error (Talahanayan 4.2).

Talahanayan 4.2

Tinantyang sample na talahanayan

Para sa populasyon na higit sa 100,000, ang sample ay 400 units. Kung, gayunpaman, nasa isip natin ang pangkalahatang populasyon na 5 libo o higit pa, kung gayon, ayon sa mga kalkulasyon ng parehong may-akda, posibleng ipahiwatig ang laki ng aktwal na error sa sampling depende sa dami nito, na napakahalaga para sa atin. , na isinaisip na ang laki ng pinahihintulutang error ay nakasalalay sa layunin ng pananaliksik at hindi kinakailangang lapitan ang 5 porsiyentong antas.

Talahanayan 4.3

Talahanayan ng pagkalkula

Kasama ng mga random na error, posible ang mga sistematikong error. Nakadepende sila sa organisasyon ng sample na survey. Ito ay iba't ibang sample biases patungo sa isa sa mga pole ng sample parameter.

3. Sukat ng sample batay sa pagsusuri sa istatistika . Ang diskarte na ito ay batay sa pagtukoy ng pinakamababang laki ng sample batay sa ilang mga kinakailangan para sa pagiging maaasahan at pagiging maaasahan ng mga resulta. Ginagamit din ito sa pagsusuri ng mga resultang nakuha para sa mga indibidwal na subgroup na nabuo bilang bahagi ng sample ayon sa kasarian, edad, antas ng edukasyon, atbp. Ang mga kinakailangan para sa pagiging maaasahan at katumpakan ng mga resulta para sa mga indibidwal na subgroup ay nagdidikta ng ilang mga kinakailangan para sa laki ng sample sa kabuuan.

Ang pinaka-teoretikal na makatwiran at tamang diskarte sa pagtukoy ng laki ng sample ay batay sa pagkalkula ng maaasahang mga pagitan. Inilalarawan ng konsepto ng variation ang dami ng dissimilarity (similarity) ng mga sagot ng mga respondent sa isang partikular na tanong. Sa isang mas mahigpit na kahulugan, ang pagkakaiba-iba sa mga halaga ng isang tampok sa pinagsama-samang ay ang pagkakaiba sa mga halaga nito sa iba't ibang mga yunit ng ibinigay na pinagsama-sama sa parehong panahon o punto ng oras. Ang mga resulta ng mga tugon sa mga tanong sa sarbey ay kadalasang ipinakita sa anyo ng isang kurba ng pamamahagi (Larawan 4.1). Sa mataas na pagkakapareho ng mga tugon, nagsasalita sila ng isang maliit na pagkakaiba-iba (makitid na kurba ng pamamahagi) at may mababang pagkakatulad ng mga sagot, isang mataas na pagkakaiba-iba (malawak na kurba ng pamamahagi).

Bilang sukatan ng variation, karaniwang kinukuha ang standard deviation, na nagpapakilala sa average na distansya mula sa average na marka ng mga sagot ng bawat respondent sa isang partikular na tanong.

Maliit na pagkakaiba-iba

mataas na pagkakaiba-iba

kanin. 4.1. Variation at Distribution Curves

Dahil ang lahat ng mga desisyon sa marketing ay ginawa sa ilalim ng mga kondisyon ng kawalan ng katiyakan, ipinapayong isaalang-alang ang sitwasyong ito kapag tinutukoy ang laki ng sample. Dahil ang kahulugan ng mga pinag-aralan na halaga para sa isang populasyon sa isang makitid ay isinasagawa sa batayan ng mga sample na istatistika, kinakailangan upang maitatag ang hanay (confidence interval) kung saan ang mga pagtatantya para sa populasyon sa kabuuan ay inaasahang pagkahulog, at ang pagkakamali sa kanilang pagpapasiya.

Ang agwat ng kumpiyansa ay isang hanay na ang mga matinding puntos ay tumutugma sa isang tiyak na porsyento ng ilang mga sagot sa isang tanong. Ang pagitan ng kumpiyansa ay malapit na nauugnay sa karaniwang paglihis ng pinag-aralan na katangian sa pangkalahatang populasyon: kung mas malaki ito, mas malawak ang agwat ng kumpiyansa upang maisama ang isang tiyak na porsyento ng mga tugon.

Ang agwat ng kumpiyansa na alinman sa 95% o 99% ay pamantayan sa pananaliksik sa marketing. Walang kompanya ang nagsasagawa ng market research na may maraming sample. At ginagawang posible ng mga istatistika ng matematika na makakuha ng ilang impormasyon tungkol sa pamamahagi ng sample, na mayroong data lamang sa pagkakaiba-iba ng isang sample.

Ang isang tagapagpahiwatig ng lawak kung saan ang isang pagtatantya na totoo para sa populasyon sa kabuuan ay naiiba sa isang pagtatantya na inaasahan para sa isang karaniwang sample ay ang karaniwang error. Bukod dito, mas malaki ang laki ng sample, mas maliit ang error. Ang mataas na variation value ay nagdudulot ng mataas na error value at vice versa.

Kapag ang isang ibinigay na tanong ay may dalawang sagot lamang, na ipinahayag bilang isang porsyento (isang porsyento na sukat ang ginagamit), ang laki ng sample ay tinutukoy ng sumusunod na formula:

kung saan ang n ay ang sample size; z ay ang normalized deviation na tinutukoy batay sa napiling antas ng kumpiyansa; p ay ang natagpuang pagkakaiba-iba para sa sample; g - (100-r); e ay isang katanggap-tanggap na error.

Kapag tinutukoy ang tagapagpahiwatig ng pagkakaiba-iba para sa isang tiyak na populasyon, una sa lahat ay ipinapayong magsagawa ng isang paunang pagsusuri ng husay ng populasyon na pinag-aaralan, una sa lahat, upang maitaguyod ang pagkakapareho ng mga yunit ng populasyon sa demograpiko, panlipunan at iba pang aspeto. ng interes ng mananaliksik. Posibleng magsagawa ng pilot study, gamit ang mga resulta ng mga katulad na pag-aaral na isinagawa noong nakaraan. Kapag gumagamit ng isang porsyento na sukatan ng pagkakaiba-iba, ang pangyayari ay isinasaalang-alang na ang pinakamataas na pagkakaiba-iba ay nakakamit para sa p = 50%, na siyang pinakamasamang kaso. Bilang karagdagan, ang tagapagpahiwatig na ito ay hindi radikal na nakakaapekto sa laki ng sample. Ang opinyon ng customer ng pag-aaral sa laki ng sample ay isinasaalang-alang din.

Posibleng matukoy ang laki ng sample batay sa paggamit ng mga average sa halip na mga porsyento.

kung saan ang s ay ang standard deviation.

Sa pagsasagawa, kung ang sample ay nabuo muli at ang mga katulad na survey ay hindi naisagawa, kung gayon ang s ay hindi kilala. Sa kasong ito, ipinapayong tukuyin ang error e sa mga fraction ng standard deviation. Ang formula ng pagkalkula ay na-convert at kinuha ang sumusunod na anyo:

saan .

Sa itaas, pinag-usapan namin ang tungkol sa mga pinagsama-samang napakalaking sukat. Gayunpaman, sa ilang mga kaso ang populasyon ay hindi malaki. Karaniwan, kung ang sample ay mas mababa sa limang porsyento ng populasyon, kung gayon ang populasyon ay itinuturing na malaki at ang mga kalkulasyon ay isinasagawa ayon sa mga panuntunan sa itaas. Kung ang laki ng sample ay lumampas sa 5% ng populasyon, kung gayon ang huli ay itinuturing na maliit at isang kadahilanan ng pagwawasto ay ipinakilala sa mga formula sa itaas.

Ang laki ng sample sa kasong ito ay tinutukoy bilang mga sumusunod:

,

Praktikal na gawain Blg. 8. "Pagtukoy sa kinakailangang laki ng sample"

"Pagtukoy sa kinakailangang laki ng sample"

Ang pinakalaganap na uri ng hindi tuloy-tuloy na pagmamasid ay ang selective observation, kung saan hindi lahat ng unit ng pinag-aralan na populasyon ay sinusuri, ngunit isang partikular na bahagi lamang ng mga ito ang napili.

Ang buong hanay ng mga bagay (obserbasyon) na pag-aaralan ay tinatawag pangkalahatang populasyon. Sampol na populasyon o sample tinatawag na bahagi ng pangkalahatang populasyon, pinili para sa pag-aaral ng mga ari-arian na nagbibigay ng pagiging kinatawan.

Ang pagpili mula sa pangkalahatang populasyon ay isinasagawa sa paraang, sa batayan ng sample, ang isang medyo tumpak na ideya ng mga pangunahing parameter ng populasyon sa kabuuan ay maaaring makuha. Sa kasong ito, pinag-uusapan natin ang parehong pagtatantya ng punto, na kinukuha bilang katumbas na halaga ng average, bahagi, atbp., na nakuha bilang resulta ng sample, at isang pagtatantya ng pagitan, i.e. tungkol sa mga limitasyon kung saan, na may tiyak na posibilidad, ang halaga ng nais na parameter sa pangkalahatang populasyon ay maaaring. Ang pangunahing kinakailangan na dapat matugunan ng sample ay ang pangangailangan ng pagiging kinatawan nito, i.e. pagiging kinatawan.

Sa mga istatistika, ang mga resulta ng patuloy na pagmamasid ay minsan sinusuri bilang mga piling katangian. Ang ganitong interpretasyon ng data na nakuha ay nagaganap sa mga kaso kung saan ang bilang ng mga yunit na napagmasdan ay maliit at walang matatag na paniniwala na ang mga katangian sa ilalim ng pag-aaral ay hindi maaaring kumuha ng iba pang mga halaga kaysa sa mga natukoy bilang resulta ng pagmamasid. Kapag nagsasagawa ng mga eksperimento, ang bilang ng mga halaga ay maaaring walang hanggan na malaki, samakatuwid, kapag bumubuo ng mga konklusyon batay sa kanilang limitadong bilang, kinakailangang isaalang-alang ang data na nakuha bilang mga piling katangian.

Kapag pinalawak ang mga resulta ng isang sample na survey sa pangkalahatang populasyon, dapat tandaan na maaaring mayroong pagkakaiba sa pagitan ng mga katangian ng pangkalahatan at sample na populasyon, dahil sa katotohanan na hindi ang buong populasyon ang nasuri, ngunit bahagi lamang. nito.

Error sa pagmamasid sa istatistika ang halaga ng paglihis sa pagitan ng kinakalkula at aktwal na mga halaga ng mga katangian ng mga bagay na pinag-aaralan ay isinasaalang-alang.

Ang paraan ng sampling ay nagbibigay ng makabuluhang pagtitipid sa materyal at pinansiyal na mapagkukunan kapag nagsasagawa ng istatistikal na pagmamasid, na ginagawang posible na palawakin ang programa ng survey at dagdagan ang kahusayan nito. Ang pangalawang bentahe ay ang mataas na pagiging maaasahan ng data na nakuha, dahil sa isang medyo maliit na sukat ng sample, posible na ayusin ang epektibong kontrol sa kalidad ng impormasyong nakolekta. Kaya, ang posibilidad ng paglitaw ng mga error sa pagpaparehistro at ang kanilang hindi pagtuklas sa yugto ng pag-verify ng pangunahing impormasyon ay nabawasan. At sa wakas, sa ilang mga kaso, kapag ang kumpletong obserbasyon ay nauugnay sa pagkasira o pagkasira ng mga nasuri na yunit (halimbawa, kapag sinusuri ang kalidad ng mga produktong pagkain na pumapasok sa merkado), isang pumipili na survey lamang ang posible.

Ang katumpakan ng mga pagtatantya na nakuha batay sa paraan ng sampling ay hindi nakasalalay sa proporsyon ng mga yunit na sinuri, ngunit sa kanilang bilang.

Ang mga pangunahing yugto ng pumipili na pagmamasid;

1) pagpapasiya ng layunin, mga gawain at pagguhit ng isang programa sa pagmamasid;

2) sampling;

3) pangongolekta ng datos batay sa binuong programa;

4) pagsusuri ng mga nakuhang resulta at pagkalkula ng mga pangunahing katangian ng sample;

5) pagkalkula ng error sa sampling at pamamahagi ng mga resulta nito sa pangkalahatang populasyon.

Makilala mga uri ng sample:

1) random(talagang random);

2) mekanikal(halimbawa, tuwing 10, 20, atbp.);

3) tipikal (pinagsasapin-sapin), kapag ang pangkalahatang populasyon ay nahahati sa mga grupo at ilang mga bagay ang sinusuri sa bawat pangkat));

4) serye (pugad) kapag ang buong serye ay random na pinili.

Ang pinakasimpleng paraan upang bumuo ng sample na populasyon ay ang wastong random na pagpili. Ang mga teoretikal na pundasyon ng paraan ng sampling, na orihinal na binuo na may kaugnayan sa aktwal na random na pagpili, ay ginagamit din upang matukoy ang mga error sa sampling sa ibang mga paraan ng pagmamasid.

Sa totoo lang ang random na pagpili ay maaaring ulitin at hindi paulit-ulit. Sa paulit-ulit Sa pagpili, ang bawat yunit na pinili nang random mula sa pangkalahatang populasyon, pagkatapos na maibalik ang obserbasyon sa populasyon na ito, ay maaaring muling suriin. Sa pagsasagawa, ang pamamaraang ito ng pagpili ay bihira. Ang mas karaniwan ay talagang random hindi paulit-ulit pagpili kung saan ang mga na-survey na yunit ay hindi ibinalik sa populasyon at hindi na muling masusuri. Sa paulit-ulit na pagpili, ang posibilidad na mapabilang sa sample para sa bawat yunit ng pangkalahatang populasyon ay nananatiling hindi nagbabago. Sa hindi paulit-ulit na pagpili, ito ay nagbabago, ngunit para sa lahat ng mga yunit na natitira sa pangkalahatang populasyon pagkatapos ng pagpili ng ilang mga yunit mula dito, ang posibilidad na maisama sa sample ay pareho.

Katumpakan - ang antas ng error sa mga resulta ng survey o ang laki ng agwat ng kumpiyansa.

Ang ganap na katumpakan ay ibinibigay ng isang tiyak na agwat kung saan dapat ang tinantyang halaga.

Ang kaugnay na katumpakan ay tinukoy na may kaugnayan sa antas ng pagtatantya ng parameter.

Ang kumpiyansa ay ang antas ng kumpiyansa na ang isang pagtatantya ay malapit sa tunay na halaga.

Maraming mga kadahilanan ng husay ang dapat isaalang-alang kapag tinutukoy ang laki ng sample: ang kahalagahan ng desisyon na gagawin, ang likas na katangian ng pag-aaral, ang bilang ng mga variable, ang likas na katangian ng pagsusuri, ang mga sukat ng sample na ginamit sa naturang mga pag-aaral, ang saklaw rate, rate ng pagkumpleto, at mga hadlang sa mapagkukunan. Ang laki ng sample na tinutukoy ng istatistika ay ang net, o panghuling, laki ng sample, i.e. mga yunit ng populasyon na natitira pagkatapos ibukod ang mga potensyal na respondente na hindi nakakatugon sa ibinigay na pamantayan o hindi nakakumpleto ng panayam. Depende sa mga rate ng saklaw at pagkakumpleto, maaaring kailanganin ang isang mas malaking paunang sample size. Sa pananaliksik sa komersyal na marketing, ang kakulangan ng oras, pera, at mabubuting tao ay maaaring maging kritikal sa pagtukoy ng laki ng sample. Sa Project Loyalty Study Project ng Department Store, tiyak na natukoy ang laki ng sample para sa mga kadahilanang ito.

Paraan ng agwat ng kumpiyansa:

Ang pagtukoy ng laki ng sample sa pamamagitan ng paraan ng mga agwat ng kumpiyansa ay batay sa kanilang paglikha sa paligid ng sample mean o sample fraction gamit ang karaniwang formula ng error. Bilang halimbawa, ipagpalagay na ang isang mananaliksik ay gumagamit ng simple random sampling upang pumili ng isang sample ng 300 na sambahayan upang tantyahin ang buwanang paggastos ng isang sambahayan sa pamimili sa isang department store at tinutukoy na ang average na buwanang paggasta ng sambahayan sa sample ay $182. Ipinakita ng mga nakaraang pag-aaral na ang RMS ang paglihis ng mga paggasta sa populasyon ng pag-aaral ay $55.

Gusto naming makahanap ng pagitan kung saan mahuhulog ang isang tiyak na porsyento ng sample na paraan. Ipagpalagay na gusto naming tukuyin ang isang agwat sa paligid ng ibig sabihin ng populasyon na magsasama ng 95% ng sample na paraan, batay sa isang sample ng 300 pamilya; Ang 95% ng sample na ibig sabihin ay maaaring hatiin sa dalawang pantay na bahagi, kalahating mas mababa at kalahating higit pa kaysa sa ibig sabihin, tulad ng ipinapakita sa Fig. 1. Kasama sa pagkalkula ng agwat ng kumpiyansa ang pagtukoy sa lugar na mas mababa sa (XL) at higit sa (XU) ang average na halaga (X) ng gastos.

Ang mga halaga ng z-factor na tumutugma sa XL at XU ay maaaring kalkulahin tulad ng sumusunod:

Samakatuwid, ang pinakamababang halaga ng X ay tinukoy bilang

at ang pinakamataas na halaga

Ngayon, magtakda tayo ng 95% na agwat ng kumpiyansa sa paligid ng sample mean na $182. Una, kakalkulahin natin ang karaniwang error ng mean:

Ang gitnang 95% ng normal na distribusyon ay nasa loob ng ?1.96 z-values; Ang 95% confidence interval ay tinukoy bilang

Kaya, ang 95% na agwat ng kumpiyansa ay umaabot mula $175.77 hanggang $188.23. Mayroong 95% na pagkakataon na ang tunay na mean ng naobserbahang populasyon ay nasa pagitan ng $175.77 at $188.23.

Average na paraan:

Ang paraan na ginamit upang lumikha ng agwat ng kumpiyansa ay maaaring mabago upang matukoy ang laki ng sample na ibinigay sa nais na agwat ng kumpiyansa. Ipagpalagay na gusto mong kalkulahin ang buwanang paggasta ng department store ng pamilya nang mas tumpak upang ang resulta ay nasa loob ng $5.0 ng tunay na average ng populasyon na pinag-aaralan. Ano dapat ang sample size? Ang talahanayan ay naglalaman ng kinakailangang listahan ng mga aksyon na dapat mong gawin.


  • 1. Tukuyin ang antas ng katumpakan. Ito ang maximum na pinahihintulutang pagkakaiba (D) sa pagitan ng sample mean at ng population mean. Sa aming halimbawa, D = +$5.0
  • 2. Tukuyin ang antas ng kumpiyansa. Ipagpalagay na ang nais na antas ng kumpiyansa ay 95%.
  • 3. Tukuyin ang halaga ng normalized deviation z na nauugnay sa ibinigay na antas ng kumpiyansa. Sa 95% na antas ng kumpiyansa, ang posibilidad na ang ibig sabihin ng populasyon ay mahuhulog sa labas ng one-sided interval ay 0.025 (0.05/2). Ang katumbas na z value ay 1.96.
  • 4. Tukuyin ang karaniwang paglihis ng mean ng populasyon. Maaari itong makuha mula sa mga pangalawang mapagkukunan o kalkulahin mula sa isang pilot study. Bilang karagdagan, ang karaniwang paglihis ay maaaring itakda batay sa opinyon ng mananaliksik. Halimbawa, ang hanay ng isang normal na ipinamamahaging variable ay humigit-kumulang anim na karaniwang deviations (tatlo sa kaliwa at tatlo sa kanan ng mean).

5. Tukuyin ang sample size gamit ang formula para sa standard error ng mean

Sa ating halimbawa

(na-round up sa pinakamalapit na buong numero).

Ito ay makikita mula sa sample size formula na ito ay lumalaki na may pagtaas sa pagkakaiba-iba (dispersion) ng pangkalahatang populasyon, pati na rin sa isang pagtaas sa antas ng pagiging maaasahan at ang antas ng katumpakan kung saan ang mga kalkulasyon ay dapat isagawa. . Ang laki ng sample ay direktang proporsyonal sa Q2, kaya kung mas malaki ang pagkakaiba ng populasyon, mas malaki ang laki ng sample. Katulad nito, ang mas mataas na antas ng kumpiyansa ay nagpapahiwatig ng mas malaking z value at samakatuwid ay mas malaking sample size. Ang mga variable na Q2 at z ay nasa numerator. Ang pagtaas ng antas ng katumpakan ay nakakamit sa pamamagitan ng pagpapababa ng halaga ng D at, samakatuwid, pinapataas ang laki ng sample, dahil ang D ay nasa denominator.

6. Kung ang laki ng sample ay 10% o higit pa sa laki ng populasyon, ang huling pagsasaayos ng populasyon (fpc) ​​​​ay ilalapat. Pagkatapos ang kinakailangang laki ng sample ay kinakalkula ng formula

7. Kung hindi alam ang standard deviation o ng populasyon at ginamit ang tinantyang halaga nito, dapat itong kalkulahin muli pagkatapos makuha ang sample. Ang sample na standard deviation s ay ginagamit bilang hula para sa Q. Ang itinamang agwat ng kumpiyansa ay dapat pagkatapos ay kalkulahin upang matukoy ang antas ng katumpakan na aktwal na nakuha.

Ipagpalagay na ang halagang 55.00 ay ginamit bilang hula para sa isang dahil ang tunay na halaga ay hindi alam. Isang sample ang nakuha kung saan n = 465. Batay sa datos ng pag-aaral, ang mean X ay kinakalkula, katumbas ng 180.00, at ang standard deviation ng sample s, katumbas ng 50.00. Kung gayon ang itinamang agwat ng kumpiyansa ay:

Tandaan na ang resultang confidence interval ay tinatantya na. Ito ay dahil ang standard deviation ng populasyon ay na-overestimated batay sa mga katangian ng sample.

8. Minsan ang katumpakan ay tinukoy sa kamag-anak sa halip na ganap na mga termino. Sa madaling salita, maaaring malaman na ang resulta ng pagkalkula ay dapat na plus o minus R% ng average. Sa kasong ito, ang laki ng sample ay maaaring tukuyin bilang

Ang laki ng populasyon na N ay hindi direktang nakakaapekto sa laki ng sample, maliban kung ang isang panghuling kadahilanan sa pagsasaayos ng populasyon ay inilapat. Maaaring mukhang hindi kapani-paniwala, ngunit kung iisipin mo ito, ang pahayag na ito ay may katuturan. Halimbawa, kung ang mga pinag-aralan na katangian ng lahat ng elemento ng populasyon ay magkapareho, kung gayon ang isang sample na binubuo ng isang elemento ay sapat na upang makalkula ang average. Tama rin ito kung ang populasyon ay binubuo ng 50, 500, 5000, o 50,000 item. Kasabay nito, ang pagkakaiba-iba ng mga katangian ng populasyon ay direktang nakakaapekto sa laki ng sample. Isinasaalang-alang ang pagkakaiba-iba na ito kapag kinakalkula ang laki ng sample gamit ang pangkalahatang variance Q2 o ang sample na variance s2.

Paraan ng pagbabahagi:

Kung ang mga istatistikang pinag-aaralan ay kinakatawan hindi ng average, ngunit ng bahagi, pagkatapos ay tinutukoy ng marketer ang laki ng sample sa parehong paraan. Ipagpalagay na ang mananaliksik ay interesado sa pagtukoy sa proporsyon ng mga sambahayan na nagmamay-ari ng isang department store credit card. Ang pamamaraan ay ang mga sumusunod.

1. Tukuyin ang antas ng katumpakan. Ipagpalagay na ang nais na antas ng katumpakan ay tulad na ang pagitan ng pagpapaubaya ay nakatakda sa

D \u003d p - l \u003d ± 0.05.

  • 2. Tukuyin ang antas ng kumpiyansa. Ipagpalagay na ang isang 95% na antas ng kumpiyansa ay ninanais.
  • 3. Tukuyin ang z value na nauugnay sa ibinigay na antas ng kumpiyansa. Tulad ng ipinaliwanag kapag kinakalkula ang average, ito ay magiging 1.96.
  • 4. Tukuyin ang kabuuang bahagi ng n. Gaya ng ipinahiwatig namin kanina, maaari itong makuha mula sa mga pangalawang mapagkukunan, sa kurso ng isang eksperimentong pag-aaral, o batay sa opinyon ng mananaliksik. Ipagpalagay na, batay sa pangalawang data, ang mananaliksik ay nag-iisip na 64% ng mga pamilya sa populasyon na pinag-aaralan ay may isang department store na credit card. Samakatuwid, l = 0.64.
  • 5. Tukuyin ang sample size gamit ang proportion standard error formula:

Sa ating halimbawa

  • (na-round up sa pinakamalapit na buong numero).
  • 6. Kung ang panghuling laki ng sample ay 10% o higit pa sa laki ng populasyon, isang panghuling pagsasaayos ng populasyon (fpc) ​​​​ay ilalapat. Pagkatapos ang kinakailangang laki ng sample ay kinakalkula ng formula

kung saan ang n ay ang sample size bago ilapat ang panghuling pagwawasto; nc ay ang sample size pagkatapos ilapat ang panghuling pagwawasto.

7. Kung mali ang kalkulasyon ng TC, ang agwat ng kumpiyansa ay magiging mas tumpak kaysa kinakailangan. Ipagpalagay na sa dulo ng sample, ang halaga ng share p ay kinakalkula na katumbas ng 0.55. Ang agwat ng kumpiyansa ay muling kinukuwenta, na ginagamit ang sp upang kalkulahin ang hindi kilalang Qp, tulad ng sumusunod:

Sa ating halimbawa

Ang agwat ng kumpiyansa ay pagkatapos ay 0.55 ± 1.96 (0.0264) = 0.55 + 0.052, ibig sabihin ay mas malawak ito kaysa sa tinukoy. Ito ay ipinaliwanag sa pamamagitan ng katotohanan na ang standard deviation ng sample p = 0.55 ay naging mas malaki kaysa sa tinantyang halaga ng standard deviation ng pangkalahatang populasyon sa n = 0.64.

Kung hindi katanggap-tanggap ang isang agwat na mas malaki kaysa sa tinukoy na agwat, maaaring isaayos ang laki ng sample upang ipakita ang pinakamataas na posibleng paglihis sa populasyon. Ang ganitong paglihis ay nangyayari kapag ang produkto l (1 - l) ay umabot sa pinakamataas na halaga nito, kung saan ang l ay dapat na katumbas ng 0.5. Ang konklusyon na ito ay maaaring maabot nang walang mga kalkulasyon. Dahil ang kalahati ng populasyon ay may isang katangian na halaga at ang isa pang kalahati ay may isa pa, mas maraming data ang kakailanganin upang makagawa ng tamang konklusyon kaysa kapag ang sitwasyon ay mas malinaw na tinukoy at karamihan sa mga elemento ay may parehong katangian na halaga. Sa aming halimbawa, magreresulta ito sa isang sample na laki ng

  • (na-round up sa pinakamalapit na buong numero).
  • 8. Minsan ang katumpakan ay tinukoy sa kamag-anak sa halip na ganap na mga termino. Sa madaling salita, maaaring malaman na ang resulta ng pagkalkula ay dapat na plus o minus R% ng proporsyon ng populasyon. Nangangahulugan ito na ang D = Rl. Sa kasong ito, ang laki ng sample ay maaaring tukuyin bilang