Survey ng isang kinatawan na grupo ng 500 ninth-graders. Pangkalahatang populasyon at paraan ng sampling

Sa pagbuo ng isang sample na populasyon, isang mahalagang papel ang ginagampanan sa pamamagitan ng pagtukoy sa dami nito at pagtiyak ng pagiging kinatawan.

"Kung ang uri ng sample ay nagsasabi kung paano nakapasok ang mga tao sa sample, ang laki ng sample ay nagsasabi kung gaano karaming tao ang nakarating doon." Ibig sabihin, ang sample size ay ang bilang ng mga unit na kasama sa sample. At napakahalaga na ang sample ay kinatawan, iyon ay, hindi nito binabaluktot ang mga ideya tungkol sa pangkalahatang populasyon sa kabuuan. "Ang mga kinakailangan para sa pagiging kinatawan ng sample ay nangangahulugan na, ayon sa mga napiling parameter (pamantayan), ang komposisyon ng sinuri ay dapat na lapitan ang kaukulang proporsyon sa pangkalahatang populasyon."

Ang isa sa mga pangunahing problema na karaniwang kinakaharap ng isang sosyologo, na nagpapasya kung magtitiwala sa data na nakuha sa panahon nito o hindi, ay kung gaano karaming mga tao ang dapat kapanayamin upang makakuha ng tunay na kinatawan ng impormasyon. Sa kasamaang palad, ang isang solong at malinaw na formula, kung saan maaaring kalkulahin ang pinakamainam na laki ng sample, ay hindi umiiral sa kalikasan. At ito ay ipinaliwanag nang napakasimple. Ang katotohanan ay ang pagtukoy sa laki ng sample na populasyon ay hindi gaanong istatistikal na problema kundi isang makabuluhan.

Sa madaling salita, ang laki ng sample na populasyon ay nakasalalay sa maraming mga kadahilanan, ang mga pangunahing ay ang mga sumusunod:

  • 1. ang halaga ng pagkolekta ng impormasyon, kabilang ang oras;
  • 2. ang pagnanais para sa isang tiyak na istatistikal na pagiging maaasahan ng mga resulta, na inaasahan ng mananaliksik na matanggap;
  • 3. ang halaga at pagiging bago ng impormasyong nakuha bilang resulta ng sarbey.

Ang laki ng sample ay tinutukoy ng antas ng homogeneity o heterogeneity ng pangkalahatang populasyon, ang bilang ng mga tampok na nagpapakilala dito. Ang homogenous ay isang hanay kung saan ang isang kinokontrol na katangian, halimbawa, ang antas ng karunungang bumasa't sumulat, ay ibinahagi nang pantay-pantay, iyon ay, hindi ito bumubuo ng mga voids at condensations, pagkatapos ay sa pamamagitan ng pakikipanayam lamang ng ilang mga tao, maaari nating tapusin na ang karamihan sa mga tao ay literate. Kung mas homogenous ang populasyon, mas maliit ang sample size. Halimbawa, "sabihin nating pipili tayo mula sa isang populasyon na 2000 katao, na kinokontrol ang komposisyon ng sample na populasyon batay sa" kasarian "": 70% lalaki at 30% babae. Ayon sa teorya ng probabilidad, maaaring ipagpalagay na sa bawat sampung napiling respondente ay magkakaroon ng tatlong babae. Kung gusto nating makapanayam ng hindi bababa sa 90 kababaihan, pagkatapos ay batay sa ratio sa itaas, kailangan nating pumili ng hindi bababa sa 300 katao. Ngayon ipagpalagay na ang pangkalahatang populasyon ay 90% lalaki at 10% babae. Sa kasong ito, upang makakuha ng 90 kababaihan sa sample, kinakailangan na pumili ng hindi bababa sa 900 tao. Makikita mula sa halimbawa na ang laki ng sample ay nakasalalay sa scatter ng tampok (dispersion), at dapat itong kalkulahin batay sa tampok, ang pagkakaiba-iba ng mga halaga kung saan ang pinakamalaking.

"Ang antas ng homogeneity ng isang panlipunang bagay ay nakasalalay, sa esensya, sa kung gaano ka detalyado ang balak nating pag-aralan ito. Halos anuman, ang pinaka "elementarya" na bagay ay lumalabas na lubhang kumplikado. Sa pagsusuri lamang natin ito ipinapakita bilang medyo simple, na nagha-highlight ng isa o isa pa sa mga katangian nito. Kung mas masinsinan at mas detalyado ang pagsusuri, mas maraming mga katangian ng isang partikular na bagay na nilalayon naming isaalang-alang sa kanilang kumbinasyon, at hindi sa paghihiwalay, mas malaki dapat ang sukat ng sample."

Sa isang sample na kinatawan, ang lahat ng elemento ng pangkalahatang populasyon ay kinakatawan sa parehong proporsyon. Ngunit gaano man kaingat ang pagsunod mo sa prinsipyong ito, magkakaroon pa rin ng mga random na pagkakamali. May kakayahan kaming matukoy ang error sa pagiging representatibo. Ang error sa representasyon, bilang panuntunan, ay tinatawag na "ang pagkakaiba sa pagitan ng dalawang hanay - ang pangkalahatan, kung saan ang teoretikal na interes ng sociologist ay nakadirekta at ang ideya ng mga katangian na nais niyang makuha sa dulo, at ang sample , kung saan ang praktikal na interes ng sosyolohista ay nakadirekta, na kumikilos nang sabay-sabay bilang isang bagay ng pagsusuri at paraan ng pagkuha ng impormasyon tungkol sa pangkalahatang populasyon. Mahalagang isaalang-alang na sa tulong ng paraan ng sampling ay hindi kailanman posible na makakuha ng isang ganap na tumpak na pagtatasa ng naobserbahang katangian, palaging may posibilidad ng pagkakamali, ngunit kung ang posibilidad ng pagkakamali ay maliit, kung gayon ang karamihan malamang na hindi mangyayari. Sa panitikang Ruso, kasama ang terminong "error sa pagiging representatibo" mayroong isa pang termino - "error sa pag-sampling". Karaniwang ginagamit ang mga ito nang palitan, ngunit ang error sa sampling ay mas tumpak sa dami kaysa sa error sa representasyon. Ang sampling error ay “ang paglihis ng karaniwang katangian ng sample na populasyon mula sa karaniwang katangian ng pangkalahatang populasyon. Sa pagsasagawa, ito ay natutukoy sa pamamagitan ng paghahambing ng mga kilalang katangian ng pangkalahatang populasyon sa sample na paraan.

Ang pagiging kinatawan ng sample ay tinutukoy ng dalawang bahagi: sistematiko at random na mga error. Ang mga random na error ay nauugnay "sa mga error sa istatistika (depende sa dinamika ng mga pinag-aralan na tampok) at hindi inaasahang mga paglabag sa pamamaraan ng pagkolekta ng impormasyon (mga error sa pamamaraan na ginawa sa panahon ng pagpaparehistro ng mga tampok)". Ang mga random na error ay bumababa sa pagtaas ng laki ng sample. Ang random na error ay maaaring masukat sa pamamagitan ng mga pamamaraan ng matematikal na istatistika, kung ang prinsipyo ng randomness ay naobserbahan sa panahon ng pagbuo ng sample na populasyon, na ibinibigay ng mahigpit na tinukoy na mga panuntunan na bumubuo sa paraan ng pagbuo ng sample na populasyon, at inalis.

Sa pagsasagawa, napakahirap na obserbahan ang prinsipyo ng randomness, at kung minsan ay imposible lamang, na humahantong sa paglitaw ng isang sistematikong error na lumitaw "dahil sa hindi kumpletong objectivity ng sample ng pangkalahatang populasyon (kakulangan ng impormasyon tungkol sa pangkalahatang populasyon, pagpili ng pinaka "maginhawa" na elemento ng pangkalahatang populasyon para sa pananaliksik), pati na rin dahil sa hindi pagkakapare-pareho ng sample sa mga layunin at layunin ng pag-aaral. Minsan ang mga ganitong error ay tinatawag na offset error. Lumilitaw ang mga ito sa iba't ibang mga survey sa telebisyon, kapag inanyayahan ng nagtatanghal ng TV ang mga manonood na tumawag sa ilang mga numero ng telepono, magpadala ng isang mensaheng SMS at ipahayag ang kanilang opinyon sa ilang isyu. Naturally, hindi natin masasabi na ang mga taong ito ay sumasalamin sa opinyon ng buong populasyon ng bansa, at maging ng madla sa TV. Malamang, ang mga naturang botohan ay nagsasangkot ng mas maraming edukado at aktibong tao kaysa sa pangkalahatang populasyon, kaya ang anumang poll sa telebisyon ay naglalaman ng isang sistematikong pagbaluktot at mababaw.

Ngunit ang mga sistematikong pagkakamali ay nangyayari rin sa kurso ng isang wastong organisadong survey. Halimbawa, sa kalye, ang mga hindi nagmamadaling sumagot sa mga tanong ng isang tagapanayam. Maiiwasan ang mga pagbaluktot kung susundin ang mga prinsipyo ng random na pagpili at, halimbawa, ang bawat ikasampung dumadaan ay kapanayamin.

Mga sanhi ng sistematikong pagkakamali:

  • 1. “sa panahon ng pag-aaral, ang sampling frame ay hindi wastong pinagsama-sama (luma na, hindi kumpletong data ang ginamit o walang mga istatistika sa ilang mga katangian na mahalaga para sa sampling),
  • 2. hindi matagumpay na napiling paraan para sa pagpili ng mga yunit ng pagmamasid,
  • 3. Ang ilan sa mga sumasagot ay "bumaba" sa survey para sa iba't ibang dahilan (wala, tumangging sumagot) at iba pa."

Sa tulong ng mga paraan ng matematika, ang mga naturang pagkakamali ay hindi maaaring alisin, samakatuwid, kinakailangan na magsagawa ng isang lohikal na pagsusuri ng mga sanhi ng paglitaw ng mga sistematikong pagkakamali at bumuo ng mga hakbang na maaaring maalis ang mga ito. "Imposibleng matukoy ang laki ng mga error sa bias gamit ang mga mathematical formula, kaya awtomatiko silang inililipat sa mga resulta at konklusyon ng pag-aaral. Ang mga error sa offset ay karaniwang resulta ng:

  • - hindi tamang paunang istatistikal na data sa mga parameter ng mga palatandaan ng kontrol ng pangkalahatang populasyon;
  • - masyadong maliit (hindi gaanong mahalaga) sample size;
  • - maling aplikasyon ng paraan ng pagpili ng mga yunit ng pagsusuri (halimbawa, pagpili mula sa isang maling pinagsama-samang listahan, hindi matagumpay na pagpili ng lugar at oras ng survey)” .

Mayroong ilang mga limitasyon ng error sa sampling, na nakadepende sa layunin ng pag-aaral. Ang mga economic at demographic projection, tulad ng mga census ng populasyon, ay nangangailangan ng mas mataas na pagiging maaasahan at katumpakan. Para sa gayong mga pagtataya, ang mga makabuluhang pagkakamali ay nagiging milyon-milyong mga pagkalugi ng mga materyal na mapagkukunan at mga maling kalkulasyon sa mga pagtataya at pagpaplano. Ngunit mas madalas, ang mga sosyolohikal na pag-aaral ay isinasagawa upang linawin ang mga pangkalahatang uso, isang pangkalahatang oryentasyon sa panlipunang globo, na hindi nangangailangan ng isang daang porsyento na pagiging maaasahan. Mayroong isang magaspang na pagtatantya ng pagiging maaasahan ng mga resulta ng pag-aaral: "Ang pagtaas ng pagiging maaasahan ay nagbibigay-daan para sa isang error sa sampling na hanggang 3%. Ordinaryo - hanggang sa 3-10%, tinatayang - pagkatapos ay 10 hanggang 20%, tinatayang - mula 20 hanggang 40%, at tinatantya - higit sa 40%.

Kaya, maraming mga paraan upang maiwasan ang error:

  • § bawat elemento ng pangkalahatang populasyon ay dapat magkaroon ng parehong posibilidad na mapabilang sa sample;
  • § mas mabuti na ang pangkalahatang populasyon ay homogenous;
  • § kinakailangang magkaroon ng impormasyon tungkol sa istruktura ng pangkalahatang populasyon at mga katangiang katangian nito;
  • § kapag nag-compile ng isang sample na populasyon, isaalang-alang ang mga random at sistematikong error nang maaga.

Halimbawa, kung pagkatapos ng pakikipanayam sa 380 katao sa isang settlement kung saan ang kabuuang solvent na populasyon ay 10 libong tao, nalaman namin na 36% ng mga na-survey na mamimili ang mas gusto ang mga domestic na produkto, pagkatapos ay may 95 porsiyento na antas ng posibilidad na masasabi natin na 46 ± 5% patuloy na bumibili ng mga produktong domestic.(iyon ay, mula 41 hanggang 51%) ng mga naninirahan sa pamayanang ito.

Maraming mga pangyayari ang nagpapalubha sa problema ng pagkalkula ng sample at kadalasang maaaring humantong sa katotohanan na ang isang sample na kinatawan ng pormal na istatistika ay lumalabas na hindi kumakatawan sa husay.

Ang kalidad ng sample ay sinusuri ng dalawang tagapagpahiwatig: pagiging kinatawan at pagiging maaasahan. Ang pagiging kinatawan ay tinalakay na sa itaas. At upang lumikha ng isang maaasahang sample, kinakailangan na tama na bumuo ng batayan nito. Para dito, natutugunan ang mga sumusunod na kinakailangan:

  • 1. Pagkumpleto ng sample, na nangangailangan ng pagkakaroon ng lahat ng elemento ng populasyon sa frame ng sample. Kung ang sample ay hindi kasama ang maraming mga yunit ng obserbasyon, lalo na ang mga nagdadala ng mga mahahalagang katangian at katangian ng bagay, kung gayon ang mga resulta ng pag-aaral ay magiging hindi kumpleto at isang panig.
  • 2. Ang kawalan ng pagdoble, na nagpapahiwatig ng hindi pagtanggap ng muling pagsasama sa sample ng parehong yunit ng pagmamasid (halimbawa, ang isang mag-aaral ay lumipat upang mag-aral sa ibang paaralan, siya ay kasama sa isang bagong listahan nang hindi tinanggal mula sa lumang isa, kaya dalawang beses siyang isinama sa sample) .
  • 3. Katumpakan ng sample na impormasyon, sa pag-aakalang ang pagbubukod ng mga di-umiiral na yunit ng pagmamasid mula sa sampling frame. Halimbawa, sa mga listahan ng elektoral na inihahanda para sa susunod na halalan ng mga deputies sa iba't ibang antas, madalas na nananatili ang mga patay o residente ng mga giniba na bahay.
  • 4. Kasapatan, na nangangahulugan na ang batayan ng pinagsama-samang sample ay dapat na maiugnay sa solusyon ng mga gawaing itinakda sa pag-aaral. Halimbawa, ang kumpletong listahan ng lahat ng mga mag-aaral sa isang paaralan ay isang magandang batayan para sa sampling kapag pinag-aaralan ang problema ng pangkalahatang akademikong tagumpay. Ngunit kung interesado tayo sa saloobin ng mga mag-aaral sa mataas na paaralan sa mga pangunahing disiplinang pang-akademiko, kung gayon ang listahang ito ay magagamit lamang upang bumuo ng isang bagong sampling frame - ang listahan ng mga mag-aaral sa high school.
  • 5. Kaginhawaan ng pagtatrabaho sa sampling frame, kung saan kinakailangan na malinaw na bilangin ang lahat ng mga elemento na kasama dito, at iimbak ang mga pinagsama-samang listahan sa gitna.

"Mayroong dalawang pangunahing paraan upang patunayan ang pagiging kinatawan ng sample:

  • 1. Sa pamamagitan ng istatistikal na diskarte, ang pagiging kinatawan ay tinitiyak ng mga espesyal na pamamaraan ng probabilistic sampling. Upang gawing pangkalahatan ang mga resulta ng pag-aaral sa pangkalahatang populasyon, ang mahigpit na inductive statistical inference na pamamaraan ay ginagamit, ang sampling error ay tinatantya na may ibinigay na posibilidad.
  • 2. Ang hindi pang-istatistika na pagbibigay-katwiran para sa pagiging kinatawan ay nagsasangkot ng teoretikal na patunay na ang sample ay kumakatawan sa populasyon nang makatwirang mabuti. Kapag ginagamit ang diskarteng ito, hindi ginagawa ang istatistikal na pagtatantya ng mga error sa pag-sample.

Sa unang sulyap, tila imposibleng tiyakin ang isang kinatawan na sample sa pagsasanay, ngunit sa katunayan ang lahat ay nakasalalay sa mga layunin at layunin ng programa ng pag-aaral.

Kung nagsasagawa kami ng isang survey ng malaking interes ng publiko, sa dulo kung saan kinakailangan na gumawa ng mga konklusyon tungkol sa buong populasyon, kung gayon kinakailangan na mahigpit na sundin ang lahat ng mga kinakailangan ng isang kinatawan na pamamaraan ng sampling, dahil ang mga pagkakamali sa naturang pag-aaral ay hindi katanggap-tanggap.

Kung tayo ay nahaharap sa mas katamtamang mga gawain at ang antas ng pagiging maaasahan ng mga konklusyon ay maaaring ligtas na mapababa, kung gayon kinakailangan na sundin ang lahat ng mga kinakailangan para sa husay na representasyon ng sample na populasyon. Kung pipiliin naming bigyang-diin ang pagiging maaasahan ng istatistika ng data, maliligaw namin ang mga taong iyon na nakasanayan nang maniwala sa mga kalkulasyon ng matematika. Hindi natin dapat kalimutan na ang impormasyong natatanggap natin sa pamamagitan ng mga survey at iba pang mga pamamaraan ay may kondisyong isinasalin lamang sa mga quantitative indicator. At hindi karaniwan para sa mga quantitative indicator na humigit-kumulang lamang na sumasalamin sa kakanyahan ng mga prosesong panlipunan. "Samakatuwid, ang mga pagsisikap na naglalayong higpit ng istatistikal na pagpapatunay ng mga resulta ay nagiging makabuluhan lamang sa ilalim ng kondisyon ng isang seryosong pagsusuri ng husay ng problema, ang makabuluhang pag-aaral nito."

Dapat alalahanin na ang isang sosyologo ay dapat ituon ang kanyang pansin nang tumpak sa kakanyahan ng mga problema sa lipunan, kasangkot ang iba pang mga espesyalista, practitioner at theorist sa trabaho, maingat na pag-aralan ang panitikan sa larangan ng ekonomiya, sikolohiya, sosyolohiya sa paksa ng pananaliksik. At upang malutas ang mga problema sa istatistika, tungkol sa uri at laki ng sample, kailangan muna niyang malinaw na bumalangkas ng mga tiyak na katanungan na kailangang lutasin, at pagkatapos ay bumaling sa kaukulang mga kalkulasyon ng iba't ibang mga istatistika.

Ang konsepto ng pagiging kinatawan ay madalas na matatagpuan sa istatistikal na pag-uulat at sa paghahanda ng mga talumpati at mga ulat. Marahil, kung wala ito, mahirap isipin ang anumang uri ng pagtatanghal ng impormasyon para sa pagsusuri.

Pagkakatawan - ano ito?

Ang pagiging representatibo ay sumasalamin kung paano tumutugma ang mga napiling bagay o bahagi sa nilalaman at kahulugan ng set ng data kung saan sila napili.

Iba pang mga kahulugan

Ang konsepto ng pagiging kinatawan ay maaaring mabuo sa iba't ibang konteksto. Ngunit sa kahulugan nito, ang pagiging kinatawan ay ang pagsusulatan ng mga tampok at katangian ng mga napiling yunit mula sa pangkalahatang populasyon, na tumpak na sumasalamin sa mga katangian ng buong pangkalahatang database sa kabuuan.

Gayundin, ang pagiging kinatawan ng impormasyon ay tinukoy bilang ang kakayahan ng sample na data na kumatawan sa mga parameter at katangian ng populasyon na mahalaga mula sa punto ng view ng patuloy na pag-aaral.

Sampol ng Kinatawan

Ang prinsipyo ng sampling ay ang piliin ang pinakamahalaga at tumpak na sumasalamin sa mga katangian ng kabuuang set ng data. Para dito, ginagamit ang iba't ibang mga pamamaraan na nagbibigay-daan sa pagkuha ng tumpak na mga resulta at isang pangkalahatang ideya ng paggamit lamang ng mga piling materyales na naglalarawan sa kalidad ng lahat ng data.

Kaya, hindi kinakailangan na pag-aralan ang buong materyal, ngunit sapat na upang isaalang-alang ang sample representativeness. Ano ito? Ito ay isang seleksyon ng mga indibidwal na data upang magkaroon ng ideya ng kabuuang masa ng impormasyon.

Depende sa pamamaraan, sila ay nakikilala bilang probabilistiko at hindi malamang. Ang isang probabilistic ay isang sample na ginawa sa pamamagitan ng pagkalkula ng pinakamahalaga at kawili-wiling data, na mga karagdagang kinatawan ng pangkalahatang populasyon. Ito ay isang sinasadyang pagpili o isang random na pagpili, gayunpaman, nabibigyang-katwiran ng nilalaman nito.

Hindi kapani-paniwala - ito ay isa sa mga uri ng random sampling, na pinagsama-sama ayon sa prinsipyo ng isang ordinaryong loterya. Sa kasong ito, ang opinyon ng isa na bumubuo ng naturang sample ay hindi isinasaalang-alang. Isang blind lot lang ang ginagamit.

Probability sampling

Ang mga sample ng probabilidad ay maaari ding nahahati sa ilang uri:

  • Ang isa sa pinakasimple at pinakanaiintindihan na mga prinsipyo ay ang non-representative sampling. Halimbawa, ang paraang ito ay kadalasang ginagamit sa mga social survey. Kasabay nito, ang mga kalahok sa survey ay hindi pinipili mula sa karamihan sa anumang partikular na batayan, at ang impormasyon ay nakuha mula sa unang 50 tao na nakibahagi dito.
  • Naiiba ang mga sinadyang sample dahil mayroon silang ilang mga kinakailangan at kundisyon sa pagpili, ngunit umaasa pa rin sa random na pagkakataon, hindi hinahabol ang mga mahuhusay na istatistika bilang kanilang layunin.
  • Ang quota-based sampling ay isa pang variation ng non-probabilistic sampling na kadalasang ginagamit upang suriin ang malalaking dataset. Gumagamit ito ng maraming tuntunin at kundisyon. Pinili ang mga bagay na dapat tumutugma sa kanila. Iyon ay, gamit ang halimbawa ng isang social survey, maaari itong ipalagay na 100 katao ang kapanayamin, ngunit ang opinyon lamang ng isang tiyak na bilang ng mga tao na nakakatugon sa mga itinatag na mga kinakailangan ay isasaalang-alang kapag nag-iipon ng isang istatistikang ulat.

Mga sample ng posibilidad

Para sa mga probabilistikong sample, ang isang bilang ng mga parameter ay kinakalkula na ang mga bagay sa sample ay tumutugma sa, at kabilang sa mga ito, sa iba't ibang paraan, tiyak na ang mga katotohanan at data na ipapakita bilang representasyon ng sample na data ay maaaring mapili. Ang ganitong mga paraan ng pagkalkula ng kinakailangang data ay maaaring:

  • Isang simpleng random na sample. Binubuo ito sa katotohanan na kabilang sa napiling segment, pinipili ng isang ganap na random na paraan ng lottery ang kinakailangang dami ng data, na magiging isang sample na kinatawan.
  • Ginagawang posible ng systematic at random sampling na gumuhit ng isang sistema para sa pagkalkula ng kinakailangang data batay sa isang random na napiling segment. Kaya, kung ang unang random na numero na nagpapahiwatig ng sequence number ng data na pinili mula sa kabuuang populasyon ay 5, kung gayon ang kasunod na data na pipiliin ay maaaring, halimbawa, 15, 25, 35, at iba pa. Ang halimbawang ito ay malinaw na nagpapaliwanag na kahit na ang isang random na pagpipilian ay maaaring batay sa mga sistematikong kalkulasyon ng kinakailangang data ng input.

Sample ng mga mamimili

Ang intentional sampling ay isang paraan na binubuo sa pagsasaalang-alang sa bawat indibidwal na segment, at batay sa pagtatasa nito, ang isang populasyon ay pinagsama-sama na sumasalamin sa mga katangian at katangian ng pangkalahatang database. Sa ganitong paraan, mas maraming data ang nakolekta na nakakatugon sa mga kinakailangan ng isang sample na kinatawan. Madaling pumili ng ilang opsyon na hindi isasama sa kabuuang bilang, nang hindi nawawala ang kalidad ng napiling data na kumakatawan sa kabuuang populasyon. Sa ganitong paraan, natutukoy ang pagiging kinatawan ng mga resulta ng pag-aaral.

Laki ng sample

Hindi ang huling isyu na tatalakayin ay ang laki ng sample para sa isang kinatawan na representasyon ng populasyon. Ang laki ng sample ay hindi palaging nakadepende sa bilang ng mga source sa pangkalahatang populasyon. Gayunpaman, ang pagiging kinatawan ng sample na populasyon ay direktang nakasalalay sa kung gaano karaming mga segment ang dapat na hatiin sa resulta. Kung mas maraming ganoong mga segment, mas maraming data ang nakukuha sa resultang sample. Kung ang mga resulta ay nangangailangan ng isang pangkalahatang notasyon at hindi nangangailangan ng mga detalye, kung gayon, nang naaayon, ang sample ay nagiging mas maliit, dahil, nang hindi pumasok sa mga detalye, ang impormasyon ay ipinakita nang mas mababaw, na nangangahulugan na ang pagbabasa nito ay magiging pangkalahatan.

Ang konsepto ng error sa representasyon

Ang error sa pagiging representatibo ay isang partikular na pagkakaiba sa pagitan ng mga katangian ng populasyon at sample na data. Kapag nagsasagawa ng anumang sample na pag-aaral, imposibleng makakuha ng ganap na tumpak na data, tulad ng sa isang kumpletong pag-aaral ng mga pangkalahatang populasyon at isang sample na ibinigay na may bahagi lamang ng impormasyon at mga parameter, habang ang isang mas detalyadong pag-aaral ay posible lamang kapag pinag-aaralan ang buong populasyon. Kaya, ang ilang mga pagkakamali at pagkakamali ay hindi maiiwasan.

Mga uri ng pagkakamali

Mayroong ilang mga error na nangyayari kapag nag-compile ng isang sample na kinatawan:

  • sistematiko.
  • Random.
  • Sinadya.
  • Hindi sinasadya.
  • Pamantayan.
  • Limitahan.

Ang dahilan para sa paglitaw ng mga random na pagkakamali ay maaaring ang hindi tuloy-tuloy na katangian ng pag-aaral ng pangkalahatang populasyon. Karaniwan, ang random na pagkakamali ng pagiging kinatawan ay hindi gaanong sukat at likas.

Ang mga sistematikong error, samantala, ay lumitaw kapag ang mga patakaran para sa pagpili ng data mula sa kabuuang populasyon ay nilabag.

Ang mean error ay ang pagkakaiba sa pagitan ng sample mean at ng pinagbabatayan na populasyon. Hindi ito nakasalalay sa bilang ng mga yunit sa sample. Inversely proportional ito. Kung mas malaki ang volume, mas maliit ang halaga ng average na error.

Ang marginal error ay ang pinakamalaking posibleng pagkakaiba sa pagitan ng mga average na halaga ng sample na ginawa at ng kabuuang populasyon. Ang nasabing error ay nailalarawan bilang ang pinakamataas na posibleng mga error sa ilalim ng ibinigay na mga kondisyon ng kanilang paglitaw.

Sinadya at hindi sinasadyang mga pagkakamali ng pagiging kinatawan

Ang mga error sa offset ng data ay maaaring sinadya o hindi sinasadya.

Kung gayon ang mga dahilan para sa paglitaw ng mga sinasadyang pagkakamali ay ang diskarte sa pagpili ng data sa pamamagitan ng paraan ng pagtukoy ng mga uso. Ang mga hindi sinasadyang pagkakamali ay nangyayari kahit na sa yugto ng paghahanda ng isang sample na pagmamasid, na bumubuo ng isang kinatawan ng sample. Para maiwasan ang mga ganitong error, kailangang gumawa ng magandang sampling frame para sa paglilista ng mga sampling unit. Dapat itong ganap na sumunod sa mga layunin ng sampling, maging maaasahan, sumasaklaw sa lahat ng aspeto ng pag-aaral.

Validity, reliability, representativeness. Error sa Pagkalkula

Pagkalkula ng error ng representativeness (Mm) ng arithmetic mean (M).

Standard deviation: laki ng sample (>30).

Error sa kinatawan (Mr) at (R): laki ng sample (n>30).

Sa kaso kapag kailangan mong pag-aralan ang isang populasyon kung saan ang bilang ng mga sample ay maliit at mas mababa sa 30 mga yunit, ang bilang ng mga obserbasyon ay bababa ng isang yunit.

Ang magnitude ng error ay direktang proporsyonal sa laki ng sample. Ang pagiging kinatawan ng impormasyon at ang pagkalkula ng antas ng posibilidad ng paggawa ng tumpak na hula ay sumasalamin sa isang tiyak na halaga ng marginal error.

Mga sistema ng representasyon

Hindi lamang isang kinatawan na sample ang ginagamit sa proseso ng pagsusuri sa presentasyon ng impormasyon, ngunit ang taong tumatanggap ng impormasyon mismo ay gumagamit ng mga sistema ng kinatawan. Kaya, pinoproseso ng utak ang ilan sa pamamagitan ng paglikha ng isang kinatawan na sample mula sa buong daloy ng impormasyon upang masuri nang husay at mabilis ang isinumiteng data at maunawaan ang kakanyahan ng isyu. Sagutin ang tanong: "Pagiging kinatawan - ano ito?" - sa sukat ng kamalayan ng tao ay medyo simple. Upang gawin ito, ginagamit ng utak ang lahat ng mga paksa, depende sa kung anong uri ng impormasyon ang kailangang ihiwalay sa pangkalahatang daloy. Kaya, nakikilala nila ang:

  • Ang visual representational system, kung saan ang mga organo ng visual na perception ng mata ay kasangkot. Ang mga taong madalas gumamit ng ganitong sistema ay tinatawag na visual. Sa tulong ng sistemang ito, pinoproseso ng isang tao ang impormasyong nanggagaling sa anyo ng mga imahe.
  • auditory representational system. Ang pangunahing organ na ginagamit ay pandinig. Ang impormasyong ibinibigay sa anyo ng mga sound file o pagsasalita ay pinoproseso ng partikular na sistemang ito. Ang mga taong mas nakakaunawa ng impormasyon sa pamamagitan ng tainga ay tinatawag na auditory.
  • Ang kinesthetic representational system ay ang pagproseso ng daloy ng impormasyon sa pamamagitan ng pagdama nito sa tulong ng mga olpaktoryo at tactile na channel.
  • Ang digital representational system ay ginagamit kasama ng iba bilang paraan ng pagkuha ng impormasyon mula sa labas. pang-unawa at pag-unawa sa natanggap na datos.

Kaya, pagiging kinatawan - ano ito? Isang simpleng pagpili mula sa maraming tao o isang mahalagang pamamaraan sa pagproseso ng impormasyon? Talagang masasabi nating ang pagiging kinatawan ay higit na tumutukoy sa ating pananaw sa mga daloy ng data, na tumutulong na ihiwalay ang pinakamahalaga at makabuluhan mula rito.

Sampol ng Kinatawan

Sampol ng Kinatawan

Ang isang kinatawan na sample ay isang sample na may parehong distribusyon ng mga kaugnay na katangian gaya ng pangkalahatang populasyon.

Sa Ingles: sample ng kinatawan

Tingnan din: Mga sample na populasyon

Finam Financial Dictionary.


Tingnan kung ano ang "Representative Sample" sa ibang mga diksyunaryo:

    Sampol ng Kinatawan- Isang pangkat ng mga kalahok na higit o hindi gaanong tumpak na kumakatawan sa komposisyon ng populasyon na pinag-aaralan. Maaaring ipakita ng sample ang distribusyon ayon sa mga katangian ng edad at kasarian, pati na rin ang anumang iba pang katangian na nakakaapekto sa resulta ng eksperimento sa mga tuntunin ng ... ...

    sample ng kinatawan- — [Glosaryo ng English-Russian ng mga pangunahing termino sa pagbabakuna at pagbabakuna. World Health Organization, 2009] Mga Paksa Vaccinology, Immunization EN representative sampling … Handbook ng Teknikal na Tagasalin

    SAMPLE NG REPRESENTATIVE- (representative sample) isang sample na (o itinuturing) isang tunay na pagmuni-muni ng populasyon ng magulang, iyon ay, mayroon itong parehong profile ng tampok, halimbawa, istraktura ng edad, istraktura ng klase, antas ng edukasyon. Kinatawan ...... Malaking paliwanag sosyolohikal na diksyunaryo

    SAMPLE NG REPRESENTATIVE- Tingnan ang sample na kinatawan... Explanatory Dictionary of Psychology

    SAMPLE NG REPRESENTATIVE- tulad ng isang sample kung saan ang lahat ng mga pangunahing tampok ng pangkalahatang populasyon kung saan kinuha ang sample na ito ay kinakatawan sa humigit-kumulang sa parehong proporsyon o may parehong dalas kung saan ang tampok na ito ay lumilitaw sa pangkalahatang populasyon na ito ... Encyclopedic Dictionary of Psychology and Pedagogy

    Sampol ng Kinatawan- ito ay tulad ng isang sample kung saan ang lahat ng mga pangunahing tampok ng pangkalahatang populasyon kung saan ang sample na ito ay nakuha ay ipinakita sa humigit-kumulang sa parehong proporsyon o may parehong dalas kung saan ang tampok na ito ay lumilitaw sa pangkalahatang ito ... ... Sociological Dictionary Socium

    Sampol ng Kinatawan- (kinatawan na sample). Isang sample na tumpak na sumasalamin sa estado at mga katangian ng buong populasyon ... Sikolohiya ng pag-unlad. Diksyunaryo ayon sa aklat

    sample ng kinatawan- (representative sample) isang sample na ginawa ayon sa mga patakaran, iyon ay, sa paraang sumasalamin ito sa mga detalye ng pangkalahatang populasyon kapwa sa mga tuntunin ng komposisyon at mga indibidwal na katangian ng mga paksang kasama. Diksyunaryo ng praktikal na psychologist. M .: AST, ...... Great Psychological Encyclopedia

    Ingles sampling, kinatawan; Aleman Stichprobe, reprasentative. Isang sample na may kaparehong distribusyon ng mga kaugnay na katangian gaya ng populasyon. Antinazi. Encyclopedia of Sociology, 2009 ... Encyclopedia of Sociology

    Representative sample Isang sample na may parehong distribusyon ng mga relatibong katangian gaya ng populasyon Bokabularyo ng mga termino sa negosyo. Akademik.ru. 2001... Glossary ng mga termino ng negosyo

Sa katunayan, magsisimula tayo sa hindi isa, ngunit tatlong tanong: ano ang sample? kailan ito kinatawan? ano ang kinakatawan niya?

Pinagsama-sama - ito ay anumang grupo ng mga tao, organisasyon, mga kaganapan na interesado sa amin, tungkol sa kung saan nais naming gumawa ng mga konklusyon, at nangyayari, o bagay, - anumang elemento ng naturang koleksyon 1 .Sample – anumang subgroup ng hanay ng mga kaso (mga bagay) na pinili para sa pagsusuri. Kung gusto nating pag-aralan ang aktibidad sa paggawa ng desisyon ng mga mambabatas ng estado, maaari nating pag-aralan ang naturang aktibidad sa mga lehislatura ng mga estado ng Virginia, North Carolina at South Carolina, at hindi sa lahat ng limampung estado, at, sa batayan na ito, ipamahagi nakatanggap ng data sa populasyon kung saan napili ang tatlong estadong ito. Kung gusto naming imbestigahan ang sistema ng kagustuhan ng botante ng Pennsylvania, magagawa namin ito sa pamamagitan ng pakikipanayam sa 50 manggagawa sa U.S. S. Steele sa Pittsburgh at ipamahagi ang mga resulta ng botohan sa lahat ng botante sa estado. Gayundin, kung gusto naming sukatin ang katalinuhan ng mga mag-aaral sa kolehiyo, maaari naming subukan ang lahat ng mga nagtatanggol na manlalaro na nakarehistro sa Ohio State sa isang partikular na season ng football at pagkatapos ay i-extend ang mga resulta sa populasyon kung saan sila bahagi. Sa bawat halimbawa, nagpapatuloy kami bilang mga sumusunod: nagtatatag kami ng isang subgroup sa loob ng pangkalahatang populasyon, medyo pinag-aaralan namin ang subgroup na ito, o sample, nang detalyado, at pinapalawak ang aming mga resulta sa buong populasyon. Ito ang mga pangunahing yugto ng sampling.

Gayunpaman, tila medyo halata na ang bawat isa sa mga sample na ito ay may isang makabuluhang disbentaha. Halimbawa, habang ang mga lehislatura ng Virginia, North Carolina, at South Carolina ay bahagi lahat ng konstelasyon ng mga lehislatura ng estado, sila ay, para sa makasaysayang, heograpiko, at pampulitika na mga kadahilanan, malamang na gumana sa halos magkatulad na mga paraan at ibang-iba mula sa gayong kakaiba. mga lehislatura. estado tulad ng New York, Nebraska at Alaska. Bagama't ang limampung manggagawa ng asero sa Pittsburgh ay maaaring talagang mga botante sa Pennsylvania, maaari silang, sa bisa ng kanilang katayuan sa socioeconomic, edukasyon, at karanasan sa buhay, ay may ibang-iba na pananaw kumpara sa marami pang ibang tao na mga botante sa parehong paraan. Gayundin, kahit na ang mga footballer ng Ohio State ay mga mag-aaral sa kolehiyo, maaaring iba sila sa ibang mga mag-aaral sa iba't ibang dahilan. Sa madaling salita, kahit na ang bawat isa sa mga subgroup na ito ay talagang isang sample, ang mga miyembro ng bawat isa sa kanila ay sistematikong naiiba sa karamihan ng iba pang mga miyembro ng populasyon kung saan sila pinili. Bilang isang hiwalay na grupo, wala sa kanila ang tipikal sa mga tuntunin ng pamamahagi ng mga tampok ng mga opinyon, mga motibo sa pag-uugali at mga katangian sa pangkalahatang populasyon kung saan ito nauugnay. Alinsunod dito, sasabihin ng mga siyentipikong pampulitika na wala sa mga sample na ito ang kinatawan.

Sampol ng Kinatawan - ito ay tulad ng isang sample kung saan ang lahat ng mga pangunahing tampok ng pangkalahatang populasyon kung saan kinuha ang sample na ito ay kinakatawan sa humigit-kumulang sa parehong proporsyon o sa parehong dalas kung saan ang tampok na ito ay lumilitaw sa pangkalahatang populasyon na ito. Kaya, kung 50% ng lahat ng mga lehislatura ng estado ay nagpupulong isang beses lamang sa bawat dalawang taon, halos kalahati ng isang kinatawan na sample ng mga lehislatura ng estado ay dapat sa ganitong uri. Kung 30% ng mga botante ng Pennsylvania ay blue-collar, humigit-kumulang 30% ng isang kinatawan ang mga sample para sa mga botante na ito (sa halip na 100% tulad ng sa halimbawa sa itaas) ay dapat na blue collar. At kung 2% ng lahat ng mga mag-aaral sa kolehiyo ay mga atleta, tungkol sa parehong proporsyon ng isang kinatawan na sample ng mga mag-aaral sa kolehiyo ay dapat na mga atleta. Sa madaling salita, ang isang sample na kinatawan ay isang microcosm, isang mas maliit ngunit tumpak na modelo ng populasyon na nilalayon nitong katawanin. Sa lawak na ang sample ay kinatawan, ang mga konklusyon batay sa pag-aaral ng sample na ito ay maaaring ligtas na ituring na naaangkop sa orihinal na populasyon. Ang distribusyon na ito ng mga resulta ay tinatawag nating generalizability.

Marahil ang isang graphic na paglalarawan ay makakatulong na linawin ito. Ipagpalagay na gusto nating pag-aralan ang mga pattern ng pagiging miyembro ng grupong pampulitika sa mga nasa hustong gulang sa US. Ang Figure 5.1 ay nagpapakita ng tatlong bilog na nahahati sa anim na pantay na sektor. Ang Figure 5.1a ay kumakatawan sa buong populasyon na isinasaalang-alang. Ang mga miyembro ng populasyon ay inuri ayon sa mga pangkat pampulitika (tulad ng mga partido at grupo ng interes) kung saan sila nabibilang. Sa halimbawang ito, ang bawat nasa hustong gulang ay kabilang sa hindi bababa sa isa at hindi hihigit sa anim na grupong pampulitika; at ang anim na antas ng membership na ito ay pantay na karaniwan sa pinagsama-samang (samakatuwid ang mga pantay na sektor). Ipagpalagay na gusto nating imbestigahan ang mga motibo ng mga tao sa pagsali sa isang grupo, pagpili ng grupo, at mga pattern ng pakikilahok, ngunit dahil sa mga hadlang sa mapagkukunan, nasusuri lamang natin ang isa sa bawat anim na miyembro ng populasyon. Sino ang dapat piliin para sa pagsusuri?

kanin. 5.1. Pagbuo ng isang sample mula sa pangkalahatang populasyon

Ang isa sa mga posibleng sample ng isang ibinigay na laki ay inilalarawan ng may kulay na lugar sa Fig. 5.1b, ngunit malinaw na hindi ito sumasalamin sa istruktura ng populasyon. Kung i-generalize natin mula sa sample na ito, maghihinuha tayo: (1) na ang lahat ng nasa hustong gulang na Amerikano ay kabilang sa limang grupong pampulitika at (2) na ang lahat ng pag-uugali ng grupong Amerikano ay tumutugma sa pag-uugali ng mga eksaktong kabilang sa limang grupo. Gayunpaman, alam natin na ang unang konklusyon ay hindi totoo, at ito ay maaaring magdulot sa atin ng pagdududa sa bisa ng pangalawa. Sa ganitong paraan, ang sample na ipinapakita sa Figure 5.1b ay hindi kinatawan dahil hindi ito nagpapakita ng distribusyon ng isang naibigay na pag-aari ng populasyon (madalas na tinutukoy bilang parameter ) ayon sa aktwal na pamamahagi nito. Ang nasabing sample ay sinasabing lumipat patungo sa miyembro ng limang grupo o lumipat palayo sa lahat ng iba pang modelo ng membership ng grupo. Batay sa naturang biased sampling, kadalasan ay nagkakaroon tayo ng mga maling konklusyon tungkol sa populasyon.

Ito ay pinakamalinaw na maipapakita sa pamamagitan ng halimbawa ng sakuna na nangyari sa magasing Literary Digest noong 1930s, na nag-organisa ng pampublikong opinyon poll sa mga resulta ng mga halalan. Ang Literary Digest ay isang peryodiko na muling naglimbag ng mga editoryal ng pahayagan at iba pang materyal na opinyon ng publiko; ang magasing ito ay napakapopular sa simula ng siglo. Simula noong 1920, nagsagawa ang magasin ng malawak na survey sa buong bansa kung saan ang mga balota ay ipinadala sa higit sa isang milyong tao na humihiling sa kanila na markahan ang kanilang ginustong kandidato para sa paparating na halalan sa pagkapangulo. Sa loob ng ilang taon, ang mga resulta ng botohan ng magazine ay napakatumpak na ang botohan noong Setyembre ay tila hindi gaanong mahalaga ang halalan sa Nobyembre. At paano maaaring mangyari ang isang error sa napakalaking sample? Gayunpaman, noong 1936, ito mismo ang nangyari: na may malaking mayorya ng mga boto (60:40), ang tagumpay ay hinulaan ng kandidatong Republikano na si Alf Landon. Sa halalan, natalo si Landon sa isang taong may kapansanan - Franklin D. Roosevelt - na may halos parehong resulta kung saan siya ay dapat na nanalo. Ang kredibilidad ng Literary Digest ay lubhang nasira kaya ang magasin ay nawala sa pag-imprenta sa lalong madaling panahon. Anong nangyari? Ito ay napaka-simple: ang Digest poll ay gumamit ng isang bias na sample. Ang mga postkard ay ipinadala sa mga tao na ang mga pangalan ay kinuha mula sa dalawang mapagkukunan: mga direktoryo ng telepono at mga listahan ng pagpaparehistro ng sasakyan. At bagama't ang pamamaraang ito ng pagpili ay hindi gaanong naiiba sa ibang mga pamamaraan noon, ang sitwasyon ay ibang-iba na ngayon, sa panahon ng Great Depression ng 1936, kung kailan ang hindi gaanong mayayamang mga botante, ang malamang na mainstay ni Roosevelt, ay hindi kayang magkaroon ng telepono, hayaan nag-iisang sasakyan. Kaya, sa katunayan, ang sample na ginamit sa poll ng Digest ay may kinikilingan sa mga malamang na maging Republican, at nakakagulat pa rin na si Roosevelt ay nagkaroon ng napakagandang resulta.

Paano malutas ang problemang ito? Pagbabalik sa ating halimbawa, ihambing natin ang sample sa Fig. 5.1b sa sample sa Fig. 5.1c. Sa huling kaso, ang ikaanim ng populasyon ay pinili din para sa pagsusuri, ngunit ang bawat isa sa mga pangunahing uri ng populasyon ay kinakatawan sa sample sa proporsyon kung saan ito ay kinakatawan sa buong populasyon. Ang nasabing sample ay nagpapakita na isa sa bawat anim na Amerikanong nasa hustong gulang ay kabilang sa isang pangkat pampulitika, isa sa anim hanggang dalawa, at iba pa. Ipapakita rin ng naturang sample ang iba pang pagkakaiba sa mga miyembro nito na maaaring nauugnay sa pakikilahok sa ibang bilang ng mga grupo. Kaya, ang sample na ipinakita sa Figure 5.1c ay isang kinatawan na sample para sa populasyon na isinasaalang-alang.

Siyempre, ang halimbawang ito ay isang pagpapasimple sa hindi bababa sa dalawang napakahalagang paraan. Una, ang karamihan sa mga populasyon na interesado sa mga siyentipikong pampulitika ay mas magkakaibang kaysa sa isa sa halimbawa. Mga tao, dokumento, pamahalaan, organisasyon, desisyon, atbp. naiiba sa bawat isa hindi sa isa, ngunit sa isang mas malaking bilang ng mga katangian. Samakatuwid, ang isang kinatawan na sample ay dapat na ganoon bawat isa mula sa pangunahing, iba't ibang lugar ay ipinakita sa proporsyon sa bahagi nito sa pinagsama-samang. Pangalawa, ang sitwasyon kung saan ang aktwal na distribusyon ng mga variable, o mga katangian na gusto nating sukatin, ay hindi alam nang maaga ay mas karaniwan kaysa sa kabaligtaran - marahil hindi ito nasusukat sa nakaraang sensus ng populasyon. Kaya, ang isang kinatawan na sample ay dapat na idinisenyo upang tumpak na maipakita nito ang umiiral na pamamahagi kahit na hindi namin direktang masuri ang bisa nito. Ang pamamaraan ng sampling ay dapat may panloob na lohika na may kakayahang kumbinsihin tayo na, kung nagawa nating ihambing ang sample sa census, ito ay talagang magiging kinatawan.

Upang tumpak na maipakita ang masalimuot na organisasyon ng isang naibigay na populasyon, at upang magbigay ng ilang antas ng kumpiyansa na ang mga iminungkahing pamamaraan ay may kakayahang gawin ito, ang mga mananaliksik ay bumaling sa istatistikal na pamamaraan. Sa paggawa nito, gumagana sila sa dalawang direksyon. Una, gamit ang ilang mga patakaran (panloob na lohika), nagpapasya ang mga mananaliksik kung aling mga partikular na bagay ang pag-aaralan, kung ano ang eksaktong isasama sa isang partikular na sample. Pangalawa, gamit ang ibang mga panuntunan, sila ang magpapasya kung gaano karaming mga bagay ang pipiliin. Hindi namin pag-aaralan nang detalyado ang maraming panuntunang ito, isasaalang-alang lamang namin ang kanilang papel sa pananaliksik sa agham pampulitika. Magsimula tayo sa mga estratehiya para sa pagpili ng mga bagay na bumubuo ng isang sample na kinatawan.

Sa katunayan, magsisimula tayo sa hindi isa, ngunit tatlong tanong: ano ang sample? kailan ito kinatawan? ano ang kinakatawan niya?

Pinagsama-sama- ito ay anumang grupo ng mga tao, organisasyon, mga kaganapan na interesado sa amin, tungkol sa kung saan nais naming gumawa ng mga konklusyon, at nangyayari, o bagay, - anumang elemento ng naturang koleksyon.

Sample- anumang subgroup ng hanay ng mga kaso (mga bagay) na pinili para sa pagsusuri.

Kung gusto nating pag-aralan ang aktibidad sa paggawa ng desisyon ng mga mambabatas ng estado, maaari nating pag-aralan ang naturang aktibidad sa mga lehislatura ng mga estado ng Virginia, North Carolina at South Carolina, at hindi sa lahat ng limampung estado, at, sa batayan na ito, ipamahagi nakatanggap ng data sa populasyon kung saan napili ang tatlong estadong ito. Kung gusto naming imbestigahan ang sistema ng kagustuhan ng botante ng Pennsylvania, magagawa namin ito sa pamamagitan ng pakikipanayam sa 50 manggagawa sa U.S. S. Steele sa Pittsburgh at ipamahagi ang mga resulta ng botohan sa lahat ng botante sa estado.

Ganun din Kung gusto naming sukatin ang katalinuhan ng mga mag-aaral sa kolehiyo, maaari naming subukan ang lahat ng mga nagtatanggol na manlalaro na nakarehistro sa Ohio State sa isang partikular na season ng football at pagkatapos ay i-extend ang mga resulta sa populasyon kung saan sila bahagi. Sa bawat halimbawa, nagpapatuloy kami sa mga sumusunod: nagtatatag kami ng isang subgroup sa loob ng populasyon, pinag-aaralan ang subgroup na ito, o sample, sa ilang detalye, at pinapalawak ang aming mga resulta sa buong populasyon. Ito ang mga pangunahing yugto ng sampling.

Gayunpaman parang Halatang halata na ang bawat isa sa mga sample na ito ay may malaking disbentaha. Halimbawa, habang ang mga lehislatura ng Virginia, North Carolina, at South Carolina ay bahagi lahat ng konstelasyon ng mga lehislatura ng estado, sila ay, para sa makasaysayang, heograpiko, at pampulitika na mga kadahilanan, malamang na gumana sa halos magkatulad na mga paraan at ibang-iba mula sa gayong kakaiba. mga lehislatura. estado tulad ng New York, Nebraska at Alaska. Bagama't ang limampung manggagawa ng asero sa Pittsburgh ay maaaring talagang mga botante sa Pennsylvania, maaari silang, sa bisa ng kanilang katayuan sa socioeconomic, edukasyon, at karanasan sa buhay, ay may ibang-iba na pananaw kumpara sa marami pang ibang tao na mga botante sa parehong paraan.

Gayundin, kahit na ang mga footballer ng Ohio State ay mga mag-aaral sa kolehiyo, maaaring iba sila sa ibang mga mag-aaral sa iba't ibang dahilan. Sa madaling salita, kahit na ang bawat isa sa mga subgroup na ito ay talagang isang sample, ang mga miyembro ng bawat isa sa kanila ay sistematikong naiiba sa karamihan ng iba pang mga miyembro ng populasyon kung saan sila pinili. Bilang isang hiwalay na grupo, wala sa kanila ang tipikal sa mga tuntunin ng pamamahagi ng mga tampok ng mga opinyon, mga motibo sa pag-uugali at mga katangian sa pangkalahatang populasyon kung saan ito nauugnay. Alinsunod dito, sasabihin ng mga siyentipikong pampulitika na wala sa mga sample na ito ang kinatawan.


Sampol ng Kinatawan- ito ay tulad ng isang sample kung saan ang lahat ng mga pangunahing tampok ng pangkalahatang populasyon kung saan ang ibinigay na sample ay iniharap ay tinatayang sa parehong proporsyon o may parehong dalas kung saan ang tampok na ito ay lumilitaw sa pangkalahatang populasyon na ito. Kaya, kung 50% ng lahat ng mga lehislatura ng estado ay nagpupulong isang beses lamang sa bawat dalawang taon, halos kalahati ng isang kinatawan na sample ng mga lehislatura ng estado ay dapat sa ganitong uri. Kung 30% ng mga botante ng Pennsylvania ay blue-collar, humigit-kumulang 30% ng isang kinatawan na sample ng mga botante na iyon (sa halip na 100% tulad ng sa halimbawa sa itaas) ay dapat na blue-collar.

At kung 2% ng lahat ng mga mag-aaral sa kolehiyo ay mga atleta, tungkol sa parehong proporsyon ng isang kinatawan na sample ng mga mag-aaral sa kolehiyo ay dapat na mga atleta. Sa madaling salita, ang isang sample na kinatawan ay isang microcosm, isang mas maliit ngunit tumpak na modelo ng populasyon na nilalayon nitong katawanin. Sa lawak na ang sample ay kinatawan, ang mga konklusyon batay sa pag-aaral ng sample na ito ay maaaring ligtas na ituring na naaangkop sa orihinal na populasyon. Ang distribusyon na ito ng mga resulta ay tinatawag nating generalizability.

Marahil ang isang graphic na paglalarawan ay makakatulong na linawin ito. Ipagpalagay na gusto nating pag-aralan ang mga pattern ng pagiging miyembro ng grupong pampulitika sa mga nasa hustong gulang sa US. Ang Figure 5.1 ay nagpapakita ng tatlong bilog na nahahati sa anim na pantay na sektor. Ang Figure 5.1a ay kumakatawan sa buong populasyon na isinasaalang-alang. Ang mga miyembro ng populasyon ay inuri ayon sa mga pangkat pampulitika (tulad ng mga partido at grupo ng interes) kung saan sila nabibilang.

Sa halimbawang ito bawat nasa hustong gulang ay kabilang sa hindi bababa sa isa at hindi hihigit sa anim na grupong pampulitika; at ang anim na antas ng membership na ito ay pantay na karaniwan sa pinagsama-samang (samakatuwid ang mga pantay na sektor). Ipagpalagay na gusto nating imbestigahan ang mga motibo ng mga tao sa pagsali sa isang grupo, pagpili ng grupo, at mga pattern ng pakikilahok, ngunit dahil sa mga hadlang sa mapagkukunan, nasusuri lamang natin ang isa sa bawat anim na miyembro ng populasyon. Sino ang dapat piliin para sa pagsusuri?

kanin. 5.1. Pagbuo ng isang sample mula sa pangkalahatang populasyon

Ang isa sa mga posibleng sample ng isang naibigay na laki ay inilalarawan ng may kulay na lugar sa Fig. 5.1b, gayunpaman, malinaw na hindi ito sumasalamin sa istruktura ng populasyon.

Kung gagawa tayo ng mga generalization batay sa sample na ito, magtatapos tayo:

1) na ang lahat ng nasa hustong gulang na Amerikano ay kabilang sa limang grupong pampulitika at

2) na ang buong pag-uugali ng grupo ng mga Amerikano ay kasabay ng pag-uugali ng mga tiyak na nabibilang sa limang grupo.

Gayunpaman, alam natin na ang unang konklusyon ay hindi totoo, at ito ay maaaring magdulot sa atin ng pagdududa sa bisa ng pangalawa.

Kaya, ang sample na ipinapakita sa Figure 5.1b ay hindi kinatawan dahil hindi ito nagpapakita ng distribusyon ng isang naibigay na pag-aari ng populasyon (madalas na tinatawag na isang parameter) ayon sa aktwal na distribusyon nito. Ang nasabing sample ay sinasabing lumipat patungo sa miyembro ng limang grupo o lumipat palayo sa lahat ng iba pang modelo ng membership ng grupo. Batay sa naturang biased sampling, kadalasan ay nagkakaroon tayo ng mga maling konklusyon tungkol sa populasyon.

Ito ay pinakamalinaw na maipapakita sa pamamagitan ng halimbawa ng sakuna na nangyari sa magasing Literary Digest noong 1930s, na nag-organisa ng pampublikong opinyon poll sa mga resulta ng mga halalan. “ Literary Digest” ay isang peryodiko na muling naglimbag ng mga editoryal mula sa mga pahayagan at iba pang materyal na nagpapakita ng opinyon ng publiko; ang magasing ito ay napakapopular sa simula ng siglo.

Mula noong 1920. Ang magazine ay nagsagawa ng malawak na nationwide poll kung saan ang mga balota ay ipinadala sa higit sa isang milyong tao na humihiling sa kanila na markahan ang kanilang ginustong kandidato para sa paparating na halalan sa pagkapangulo. Sa loob ng ilang taon, ang mga resulta ng botohan ng magazine ay napakatumpak na ang botohan noong Setyembre ay tila hindi gaanong mahalaga ang halalan sa Nobyembre.

At paano maaaring mangyari ang isang pagkakamali sa napakalaking sample? Gayunpaman, noong 1936, ito mismo ang nangyari: na may malaking mayorya ng mga boto (60:40), ang tagumpay ay hinulaan ng kandidatong Republikano na si Alf Landon. Sa halalan, natalo si Landon sa isang taong may kapansanan - Franklin D. Roosevelt- halos may parehong resulta kung saan siya ay dapat na nanalo. Ang kredibilidad ng Literary Digest ay lubhang nasira kaya ang magasin ay nawala sa pag-imprenta sa lalong madaling panahon. Anong nangyari? Ito ay napaka-simple: ang Digest poll ay gumamit ng isang bias na sample. Ang mga postkard ay ipinadala sa mga tao na ang mga pangalan ay kinuha mula sa dalawang mapagkukunan: mga direktoryo ng telepono at mga listahan ng pagpaparehistro ng sasakyan.

At bagama't ang pamamaraang ito ng pagpili ay hindi gaanong naiiba sa ibang mga pamamaraan noon, ang sitwasyon ay ibang-iba na ngayon, sa panahon ng Great Depression ng 1936, kung kailan ang hindi gaanong mayayamang mga botante, ang malamang na mainstay ni Roosevelt, ay hindi kayang magkaroon ng telepono, hayaan nag-iisang sasakyan. Kaya, sa katunayan, ang sample na ginamit sa poll ng Digest ay may kinikilingan sa mga malamang na maging Republican, at nakakagulat pa rin na si Roosevelt ay nagkaroon ng napakagandang resulta.

Paano malutas ang problemang ito? Pagbabalik sa aming halimbawa, ihambing natin ang sample sa Fig. 5.1b na may seleksyon sa fig. 5.1c. Sa huling kaso, ang ikaanim ng populasyon ay pinili din para sa pagsusuri, ngunit ang bawat isa sa mga pangunahing uri ng populasyon ay kinakatawan sa sample sa proporsyon kung saan ito ay kinakatawan sa buong populasyon. Ang nasabing sample ay nagpapakita na isa sa bawat anim na Amerikanong nasa hustong gulang ay kabilang sa isang pangkat pampulitika, isa sa anim hanggang dalawa, at iba pa. Ipapakita rin ng naturang sample ang iba pang pagkakaiba sa mga miyembro nito na maaaring nauugnay sa pakikilahok sa ibang bilang ng mga grupo. Kaya, ang sample na ipinakita sa Figure 5.1c ay isang kinatawan na sample para sa populasyon na isinasaalang-alang.

Siyempre, ang halimbawang ito ay pinasimple mula sa hindi bababa sa dalawang napakahalagang punto ng view. Una, ang karamihan sa mga populasyon na interesado sa mga siyentipikong pampulitika ay mas magkakaibang kaysa sa isa sa halimbawa. Mga tao, dokumento, pamahalaan, organisasyon, desisyon, atbp. naiiba sa bawat isa hindi sa isa, ngunit sa isang mas malaking bilang ng mga katangian. Samakatuwid, ang isang kinatawan na sample ay dapat na ganoon bawat isa ng core, ang isang natatanging lugar ay kinakatawan sa proporsyon sa bahagi nito sa populasyon.

Pangalawa, ang sitwasyon kung saan ang aktwal na distribusyon ng mga variable, o mga katangian na gusto nating sukatin, ay hindi alam nang maaga ay mas karaniwan kaysa sa kabaligtaran - marahil hindi ito nasusukat sa nakaraang sensus ng populasyon. Kaya, ang isang kinatawan na sample ay dapat na idinisenyo upang tumpak na maipakita nito ang umiiral na pamamahagi kahit na hindi namin direktang masuri ang bisa nito. Ang pamamaraan ng sampling ay dapat may panloob na lohika na may kakayahang kumbinsihin tayo na, kung nagawa nating ihambing ang sample sa census, ito ay talagang magiging kinatawan.

Upang magbigay ng pagkakataon tumpak na pagmuni-muni ng kumplikadong organisasyon ng isang naibigay na populasyon at isang tiyak na antas ng kumpiyansa na ang mga iminungkahing pamamaraan ay magagawa ito, ang mga mananaliksik ay bumaling sa mga istatistikal na pamamaraan. Sa paggawa nito, gumagana sila sa dalawang direksyon. Una, gamit ang ilang mga patakaran (panloob na lohika), nagpapasya ang mga mananaliksik kung aling mga partikular na bagay ang pag-aaralan, kung ano ang eksaktong isasama sa isang partikular na sample. Pangalawa, gamit ang ibang mga panuntunan, sila ang magpapasya kung gaano karaming mga bagay ang pipiliin. Hindi namin pag-aaralan nang detalyado ang maraming panuntunang ito, isasaalang-alang lamang namin ang kanilang papel sa pananaliksik sa agham pampulitika. Magsimula tayo sa mga estratehiya para sa pagpili ng mga bagay na bumubuo ng isang sample na kinatawan.