Mga modelo ng istatistika. Mga prinsipyo para sa pagbuo ng mga istatistikal na bagay ng eco-processes

Ang static na pagmomodelo ay isang representasyon o paglalarawan ng isang tiyak na kababalaghan o sistema ng mga relasyon sa pagitan ng mga phenomena sa pamamagitan ng isang hanay ng mga variable (mga tagapagpahiwatig, katangian) at istatistikal na relasyon sa pagitan ng mga ito. Ang layunin ng static na pagmomodelo (tulad ng anumang iba pang pagmomodelo) ay upang ipakita ang pinakamahalagang katangian ng phenomenon na pinag-aaralan sa isang visual at naa-access na anyo para sa pag-aaral. Ang lahat ng istatistikal na modelo ay idinisenyo upang sukatin ang lakas at direksyon ng mga ugnayan sa pagitan ng dalawa o higit pang mga variable. Ang pinaka-kumplikadong mga modelo ay nagpapahintulot din sa isa na hatulan ang istraktura ng mga relasyon sa pagitan ng ilang mga variable. Karamihan sa mga istatistikal na modelo ay maaaring malawak na nahahati sa correlational, structural at causal. Ang mga modelo ng ugnayan ay ginagamit upang sukatin ang magkapares na "di-direksyon" na mga ugnayan sa pagitan ng mga variable, ibig sabihin. mga ganitong koneksyon kung saan wala o binabalewala ang sangkap na sanhi. Ang mga halimbawa ng naturang mga modelo ay ang pairwise linear correlation coefficient ng Pearson, rank coefficients ng pairwise at multiple correlations, at karamihan sa mga sukat ng asosasyon na binuo para sa contingency table (maliban sa information-theoretic coefficients at log-linear analysis).

Ang mga istrukturang modelo sa static na pagmomodelo ay idinisenyo upang pag-aralan ang istruktura ng isang tiyak na hanay ng mga variable o bagay. Ang paunang data para sa pag-aaral ng istraktura ng mga relasyon sa pagitan ng ilang mga variable ay ang matrix ng mga ugnayan sa pagitan nila. Ang pagsusuri ng correlation matrix ay maaaring isagawa nang manu-mano o gamit ang multidimensional na mga pamamaraan ng pagsusuri sa istatistika - kadahilanan, kumpol, multidimensional na paraan ng scaling. Sa maraming kaso, ang pag-aaral sa istruktura ng mga ugnayan sa pagitan ng mga variable ay isang paunang hakbang sa paglutas ng mas kumplikadong problema - pagbabawas ng dimensyon ng feature space.

Upang pag-aralan ang istraktura ng isang hanay ng mga bagay, ginagamit ang mga pamamaraan ng pagsusuri ng kumpol at multidimensional scaling. Ang matrix ng mga distansya sa pagitan ng mga ito ay ginagamit bilang paunang data. Ang distansya sa pagitan ng mga bagay ay mas maliit, mas ang mga bagay ay "katulad" sa bawat isa sa kahulugan ng mga halaga ng mga variable na sinusukat sa kanila; kung ang mga halaga ng lahat ng mga variable para sa dalawang bagay ay pareho, ang distansya sa pagitan ng mga ito ay zero. Depende sa mga layunin ng pag-aaral, ang mga modelo ng istruktura ay maaaring ipakita sa anyo ng mga matrice (mga ugnayan, mga distansya), istruktura ng kadahilanan, o biswal. Ang mga resulta ng pagtatasa ng kumpol ay madalas na ipinakita sa anyo ng isang dendrogram; ang mga resulta ng factor analysis at multidimensional scaling ay ipinakita sa anyo ng isang scatterplot. Ang istruktura ng correlation matrix ay maaari ding ipakita sa anyo ng isang graph na sumasalamin sa pinakamahalagang ugnayan sa pagitan ng mga variable. Ang mga modelong sanhi ay idinisenyo upang tuklasin ang mga ugnayang sanhi sa pagitan ng dalawa o higit pang mga variable. Ang mga variable na sumusukat sa mga sanhi ng phenomena ay tinatawag na mga independent variable o predictors sa mga istatistika; Ang mga variable na sumusukat sa mga phenomena ng kinahinatnan ay tinatawag na umaasa. Karamihan sa mga istatistikal na modelo ng sanhi ay ipinapalagay ang isang dependent variable at isa o higit pang mga predictor. Ang pagbubukod ay mga linear-structural na modelo, kung saan ang ilang mga dependent variable ay maaaring gamitin nang sabay-sabay, at ang ilang mga variable ay maaaring sabay-sabay na kumilos bilang umaasa kaugnay sa ilang mga indicator at bilang mga predictor na may kaugnayan sa iba.

Mayroong dalawang lugar ng aplikasyon ng istatistikal na paraan ng pagmomolde: static simulation modeling planning

  • - para sa pag-aaral ng mga stochastic system;
  • - para sa paglutas ng mga deterministikong problema.

Ang pangunahing ideya na ginagamit upang malutas ang mga deterministikong problema gamit ang statistical modeling method ay upang palitan ang deterministic na problema sa isang katumbas na circuit ng ilang stochastic system, ang mga katangian ng output ng huli ay nag-tutugma sa resulta ng paglutas ng deterministic na problema. Sa ganitong kapalit, bumababa ang error sa pagtaas ng bilang ng mga pagsubok (pagpapatupad ng algorithm ng pagmomolde) N.

Bilang resulta ng statistical modelling ng system S isang serye ng mga bahagyang halaga ng nais na dami o pag-andar ay nakuha, ang pagpoproseso ng istatistika na ginagawang posible upang makakuha ng impormasyon tungkol sa pag-uugali ng isang tunay na bagay o proseso sa mga di-makatwirang sandali sa oras. Kung ang dami ng benta N ay sapat na malaki, pagkatapos ang nakuha na mga resulta ng pagmomodelo ng system ay nakakakuha ng istatistikal na katatagan at maaaring tanggapin nang may sapat na katumpakan bilang mga pagtatantya ng mga kinakailangang katangian ng proseso ng paggana ng system S.

Ang pagmomodelo ng istatistika ay isang numerical na paraan para sa paglutas ng mga problema sa matematika, kung saan ang mga nais na dami ay kinakatawan ng mga probabilistikong katangian ng ilang random na phenomenon. Ang kababalaghan na ito ay na-modelo, pagkatapos kung saan ang mga kinakailangang katangian ay tinatayang tinutukoy ng istatistikal na pagproseso ng "mga obserbasyon" ng modelo.

Ang pagbuo ng naturang mga modelo ay binubuo ng pagpili ng isang paraan ng pagtatasa ng istatistika, pagpaplano ng proseso ng pagkuha ng data, pag-assemble ng data tungkol sa sistemang ekolohikal, pag-algoritmo at pagkalkula ng computer ng mga ugnayang istatistika. Ang pagbabago ng mga pattern ng pag-unlad ng ekolohikal na sitwasyon ay nangangailangan ng pag-uulit ng inilarawan na pamamaraan, ngunit sa isang bagong kapasidad.

Kasama sa istatistikal na paghahanap ng isang mathematical model ang pagpili ng uri ng modelo at pagtukoy ng mga parameter nito. Bukod dito, ang gustong function ay maaaring maging function ng isang independent variable (single-factor) o maraming variable (multi-factor). Ang gawain ng pagpili ng uri ng modelo ay isang impormal na gawain, dahil ang parehong pag-asa ay maaaring inilarawan na may parehong error sa pamamagitan ng iba't ibang mga analytical expression (regression equation). Ang isang makatwirang pagpili ng uri ng modelo ay maaaring mabigyang-katwiran sa pamamagitan ng pagsasaalang-alang ng isang bilang ng mga pamantayan: pagiging compactness (halimbawa, inilarawan ng isang monomial o polynomial), interpretability (ang kakayahang magbigay ng makabuluhang kahulugan sa koepisyent ng modelo), atbp . Ang gawain ng pagkalkula ng mga parameter ng napiling modelo ay kadalasang puro pormal at isinasagawa sa isang computer.

Kapag bumubuo ng isang istatistikal na hypothesis tungkol sa isang tiyak na sistemang ekolohikal, kinakailangan na magkaroon ng isang hanay ng magkakaibang data (database), na maaaring hindi makatwirang malaki. Ang isang sapat na pag-unawa sa sistema ay nauugnay sa kasong ito sa paghihiwalay ng hindi mahalagang impormasyon. Parehong ang listahan (uri) ng data at ang dami ng data ay maaaring bawasan. Ang isa sa mga pamamaraan para sa pagsasagawa ng naturang pag-compress ng impormasyon sa kapaligiran (nang walang priori na pagpapalagay tungkol sa istraktura at dinamika ng naobserbahang ecosystem) ay maaaring maging factor analysis. Ang pagbabawas ng data ay isinasagawa sa pamamagitan ng paraan ng hindi bababa sa mga parisukat, pangunahing mga bahagi at iba pang mga multivariate na istatistikal na pamamaraan, gamit sa hinaharap, halimbawa, pagsusuri ng kumpol.

Tandaan na ang pangunahing impormasyon sa kapaligiran ay mayroon humigit kumulang ang mga sumusunod na tampok:

– multidimensionality ng data;

– nonlinearity at kalabuan ng mga relasyon sa sistemang pinag-aaralan;

- error sa pagsukat;

- ang impluwensya ng hindi natukoy na mga kadahilanan;

– spatiotemporal na dinamika.

Kapag nilulutas ang unang problema ng pagpili ng uri ng modelo, ipinapalagay na ang m input (x 1, x 2, ..., x m at n output (y 1, y 2, ..., y) na data ay kilala. Sa kasong ito, posible, sa partikular, ang sumusunod na dalawang modelo sa matrix notation:

kung saan ang X at Y ay kilala na mga parameter ng input (output) at output (input) ng isang environmental object ("black box") sa vector notation form; Ang A at B ay ang nais na mga matrice ng pare-pareho ang mga coefficient ng modelo (mga parameter ng modelo).

Kasama ang ipinahiwatig na mga modelo ang isang mas pangkalahatang anyo ng statistical modeling ay isinasaalang-alang:

kung saan ang F ay ang vector ng nakatagong mga salik na nakakaimpluwensya; Ang C at D ay ang kinakailangang coefficient matrice.

Kapag nilulutas ang mga suliraning pangkapaligiran Maipapayo na gumamit ng parehong linear at nonlinear na mga modelo ng matematika, dahil maraming mga pattern sa kapaligiran ang hindi gaanong pinag-aralan. Bilang resulta, isasaalang-alang ang multidimensionality at nonlinearity ng mga modelong relasyon.

Batay sa isang pangkalahatang modelo posible na matukoy ang panloob na mga nakatagong kadahilanan ng mga prosesong pangkapaligiran na pinag-aaralan na hindi alam ng enhinyero sa kapaligiran, ngunit ang kanilang pagpapakita ay makikita sa mga bahagi ng mga vectors X at Y. Ang pamamaraang ito ay pinakaangkop sa kaso kung saan walang mahigpit na sanhi-at-epekto na relasyon sa pagitan ng mga halaga ng X at Y. Ang isang pangkalahatang modelo na isinasaalang-alang ang impluwensya ng mga nakatagong kadahilanan ay nag-aalis ng isang tiyak na kontradiksyon sa pagitan ng dalawang modelo na may mga matrice A at B, kung sa katunayan dalawang magkaibang mga modelo ay maaaring gamitin upang ilarawan ang parehong proseso sa kapaligiran. Ang kontradiksyon na ito ay sanhi ng kabaligtaran na kahulugan ng sanhi-at-epekto na relasyon sa pagitan ng mga dami A at Y (sa isang kaso, X ang input, at Y ang output, at sa isa pa, vice versa). Ang isang pangkalahatang modelo, na isinasaalang-alang ang halaga F, ay naglalarawan ng isang mas kumplikadong sistema kung saan ang parehong mga halaga ng X at Y ay output, at ang mga nakatagong kadahilanan F ay kumikilos sa input.

Mahalaga sa pagmomodelo ng istatistika na gumamit ng isang priori data, kapag sa panahon ng proseso ng pagpapasya ang ilang mga regularidad ng mga modelo ay maaaring maitatag at ang kanilang potensyal na numero ay maaaring paliitin.

Ipagpalagay na ito ay kinakailangan upang lumikha ng isang modelo sa tulong kung saan ang pagkamayabong ng isang tiyak na uri ng lupa ay maaaring matukoy ayon sa numero sa loob ng 24 na oras, na isinasaalang-alang ang temperatura nito T at halumigmig W. Ni ang trigo o ang puno ng mansanas ay hindi makakapagbunga ng pananim sa 24 na oras. Ngunit para sa pagsubok na paghahasik, maaari mong gamitin ang bakterya na may maikling siklo ng buhay, at gamitin ang dami ng P na inilabas na CO 2 bawat yunit ng oras bilang isang quantitative criterion para sa intensity ng kanilang mahahalagang aktibidad. Pagkatapos ang modelo ng matematika ng prosesong pinag-aaralan ay ang pagpapahayag

kung saan ang P 0 ay isang numerical indicator ng kalidad ng lupa.

Tila wala kaming anumang data sa anyo ng function na f(T, W) dahil ang engineer ng system ay walang kinakailangang kaalaman sa agronomic. Ngunit hindi ganoon. Sino ang hindi nakakaalam na sa T≈0°C ang tubig ay nagyeyelo at, samakatuwid, ang CO 2 ay hindi mailalabas, at sa 80°C ang pasteurisasyon ay nangyayari, ibig sabihin, karamihan sa mga bakterya ay namamatay. Ang isang priori data ay sapat na upang sabihin na ang gustong function ay parang parabolic sa kalikasan, malapit sa zero sa T = 0 at 80°C at may extremum sa loob ng hanay ng temperatura na ito. Ang katulad na pangangatwiran tungkol sa halumigmig ay humahantong sa katotohanan na ang pinakamataas na sukdulan ng nais na pag-andar ay naitala sa W=20% at ang paglapit nito sa zero sa W=0 at 40%. Kaya, ang anyo ng tinatayang modelo ng matematika ay natukoy na priori, at ang gawain ng eksperimento ay linawin lamang ang katangian ng function na f(T, W) sa T = 20 ... 30 at 50 ... 60 ° C, pati na rin para sa W = 10 ... 15 at 25 ... 30% at mas tumpak na pagpapasiya ng mga coordinate ng extremum (na binabawasan ang dami ng eksperimentong gawain, ibig sabihin, ang dami ng istatistikal na data).

Pagmomodelo ng Istatistika

isang numerical na pamamaraan para sa paglutas ng mga problema sa matematika, kung saan ang mga kinakailangang dami ay kinakatawan ng mga probabilistikong katangian ng ilang random na kababalaghan, ang hindi pangkaraniwang bagay na ito ay na-modelo, pagkatapos kung saan ang mga kinakailangang katangian ay tinatayang tinutukoy ng istatistikal na pagproseso ng mga "obserbasyon" ng modelo. Halimbawa, kinakailangan upang kalkulahin ang mga daloy ng init sa isang pinainit na manipis na metal plate, ang mga gilid nito ay pinananatili sa zero na temperatura. Ang distribusyon ng init ay inilalarawan ng parehong equation bilang ang pagkalat ng isang lugar ng pintura sa isang layer ng likido (tingnan ang Thermal conductivity, Diffusion). Samakatuwid, ginagaya nila ang eroplanong Brownian motion ng mga particle na "pintura" sa plato, na sinusubaybayan ang kanilang mga posisyon sa ilang sandali. kτ, k= 0, 1, 2,... Tinatayang ipinapalagay na sa isang maliit na pagitan τ gumagalaw ang butil ng isang hakbang h pantay na malamang sa lahat ng direksyon. Sa bawat oras na ang direksyon ay pinili nang random, anuman ang lahat ng nakaraan. Ang relasyon sa pagitan ng τ at h tinutukoy ng koepisyent ng thermal conductivity. Ang paggalaw ay nagsisimula sa pinagmumulan ng init at nagtatapos kapag ang gilid ay unang naabot (ang pagdikit ng "pintura" sa gilid ay sinusunod). Ang daloy ng init Q (C) sa seksyon C ng hangganan ay sinusukat sa dami ng pintura na nakadikit. Sa kabuuang dami N mga particle ayon sa batas ng malalaking numero ang naturang pagtatantya ay nagbibigay ng random na kamag-anak na error ng order h dahil sa discreteness ng napiling modelo).

Ang nais na halaga ay kinakatawan ng mathematical na inaasahan (Tingnan ang Mathematical expectation) ng isang numerical function f mula sa random na kinalabasan ω ng phenomenon: , ibig sabihin, isang integral sa sukat ng probabilidad na P (tingnan ang Sukat ng isang set). Para sa pagsusuri , kung saan ang ω 1 ,..., ω N -simulate na mga resulta ay maaaring tingnan bilang isang quadrature formula para sa ipinahiwatig na integral na may mga random na node ω k at random na error R Karaniwang tinatanggap ang N , isinasaalang-alang ang isang malaking error na bale-wala; Pagpapakalat Df maaaring masuri sa pamamagitan ng mga obserbasyon (tingnan ang Error theory).

Sa halimbawa sa itaas f(ω)= 1 , kapag ang trajectory ay nagtatapos sa C; kung hindi f(ω) = 0. Pagkakaiba-iba

Ang pagsasagawa ng bawat "eksperimento" ay nahahati sa dalawang bahagi: ang "draw" ng isang random na kinalabasan ω at ang kasunod na pagkalkula ng function f(ω). Kapag ang espasyo ng lahat ng kinalabasan at ang probability measure P ay masyadong kumplikado, ang pagguhit ay isinasagawa nang sunud-sunod sa ilang yugto (tingnan ang halimbawa). Ang random na pagpili sa bawat yugto ay isinasagawa gamit ang mga random na numero, halimbawa ay nabuo ng ilang pisikal na sensor; Ginagamit din ang kanilang arithmetic imitation - mga pseudorandom na numero (tingnan ang Random at pseudorandom na mga numero). Ang mga katulad na pamamaraan ng random na pagpili ay ginagamit sa mga istatistika ng matematika at teorya ng laro.

Ang SM ay malawakang ginagamit para sa paglutas ng mga integral equation sa isang computer, halimbawa, sa pag-aaral ng malalaking sistema (tingnan ang Malaking sistema). Ang mga ito ay maginhawa dahil sa kanilang kagalingan sa maraming bagay, bilang isang patakaran, hindi sila nangangailangan ng isang malaking halaga ng memorya. Ang kawalan ay malalaking random na error, na bumababa nang masyadong mabagal habang tumataas ang bilang ng mga eksperimento. Samakatuwid, ang mga pamamaraan para sa pagbabago ng mga modelo ay binuo na ginagawang posible upang mabawasan ang scatter ng mga naobserbahang halaga at ang dami ng eksperimento ng modelo.

Lit.: Paraan ng mga istatistikal na pagsusulit (Monte Carlo method), M., 1962; Ermakov S. M., pamamaraan ng Monte Carlo at mga kaugnay na isyu, M., 1971.

N. N. Chentsov.


Great Soviet Encyclopedia. - M.: Encyclopedia ng Sobyet. 1969-1978 .

Tingnan kung ano ang "Statistical Modeling" sa iba pang mga diksyunaryo:

    Statistical at econometric modelling pag-aaral ng mga bagay ng kaalaman sa kanilang mga istatistikal na modelo; pagbuo at pag-aaral ng mga modelo ng totoong buhay na mga bagay, proseso o phenomena (halimbawa: mga prosesong pang-ekonomiya sa ... ... Wikipedia

    Pagmomodelo ng Istatistika- isang paraan upang pag-aralan ang mga proseso ng pag-uugali ng mga probabilistikong sistema sa mga kondisyon kung saan ang mga panloob na pakikipag-ugnayan sa mga sistemang ito ay hindi alam. Binubuo ito ng makinang imitasyon ng prosesong pinag-aaralan, na, kumbaga, kinopya sa... ... Diksyunaryo ng ekonomiko-matematika

    Isang paraan ng inilapat at computational na matematika, na binubuo sa pagpapatupad sa isang computer ng mga espesyal na binuo na stochastics. modelo ng mga phenomena o bagay na pinag-aaralan. Ang pagpapalawak ng saklaw ng aplikasyon ng S. m. ay nauugnay sa mabilis na pag-unlad ng teknolohiya at lalo na... ... Mathematical Encyclopedia

    Pagmomodelo ng mga sitwasyon gamit ang mga istatistikal na pattern na likas sa hindi pangkaraniwang bagay na isinasaalang-alang. Diksyunaryo ng mga termino ng negosyo. Akademik.ru. 2001... Diksyunaryo ng mga termino ng negosyo

    Ang pagmomodelo ay ang pag-aaral ng mga bagay ng kaalaman sa kanilang mga modelo; pagbuo at pag-aaral ng mga modelo ng totoong buhay na mga bagay, proseso o phenomena upang makakuha ng mga paliwanag sa mga phenomena na ito, gayundin upang mahulaan ang mga phenomena na interesante... ... Wikipedia

    SIMULATION MODELING sa sosyolohiya- isang uri ng mathematical modeling na binubuo ng muling paggawa ng isang prosesong panlipunan o ang paggana ng isang sistemang panlipunan sa isang computer. Halos palaging nagsasangkot ng pagpaparami ng mga random na salik na nakakaimpluwensya sa hindi pangkaraniwang bagay na pinag-aaralan, at, bilang kinahinatnan,... ... Sosyolohiya: Encyclopedia

    PAGMOMODEL, STATISTICAL- pagbuo ng iba't ibang mga modelo na sumasalamin sa mga istatistikal na pattern ng inilarawan na bagay, phenomenon. Ang isang karaniwang partikular na tampok ng mga modelong ito ay ang pagsasaalang-alang ng mga random na abala o paglihis. Mga Bagay S.m. ay magkaiba... ... Malaking pang-ekonomiyang diksyunaryo

    PAGMOMODELANG ISTATISTIKA- representasyon o paglalarawan ng isang tiyak na kababalaghan o sistema ng mga relasyon sa pagitan ng mga phenomena sa pamamagitan ng isang hanay ng mga variable (mga tagapagpahiwatig, katangian) at istatistikal na relasyon sa pagitan ng mga ito. Ang layunin ng M.S. (tulad ng ibang pagmomodelo) isipin mo... ... Sosyolohiya: Encyclopedia

    Upang mapabuti ang artikulong ito, ipinapayong?: Iwasto ang artikulo ayon sa mga tuntuning pangkakanyahan ng Wikipedia. Simulation modeling (situational... Wikipedia

    SIMULATION MODELING- (...mula sa French modele sample) isang paraan ng pag-aaral ng anumang phenomena at proseso gamit ang statistical tests (Monte Carlo method) gamit ang computer. Ang pamamaraan ay batay sa pagguhit (paggaya) ng impluwensya ng mga random na salik sa kababalaghang pinag-aaralan o... ... Encyclopedic Dictionary of Psychology and Pedagogy

Mga libro

  • Pagmomodelo ng istatistika. Mga pamamaraan ng Monte Carlo. Textbook para sa bachelor's at master's degree, Mikhailov G.A. Ang aklat-aralin ay nakatuon sa mga tampok ng pagmomodelo ng mga random na variable, proseso at field. Ang partikular na atensyon ay binabayaran sa numerical integration, lalo na ang Monte Carlo method. Binibigyan ng solusyon...

Ang ideya ng random na pagpili. Bago natin simulan ang paglalarawan ng mga istatistikal na hypotheses, muli nating talakayin ang konsepto ng random na pagpili.

Isinasantabi ang mga detalye at ilang (kahit mahalaga) na mga eksepsiyon, masasabing lahat ng istatistikal na pagsusuri ay batay sa ang ideya ng random na pagpipilian. Tinatanggap namin ang thesis na ang magagamit na data ay lumitaw bilang isang resulta ng isang random na pagpili mula sa isang tiyak na pangkalahatang populasyon, kadalasang haka-haka. Karaniwan naming ipinapalagay na ang random na pagpipilian na ito ay ginawa ng kalikasan. Gayunpaman, sa maraming mga problema ang pangkalahatang populasyon na ito ay medyo totoo, at ang pagpili mula dito ay ginawa ng isang aktibong tagamasid.

Para sa maikli, sasabihin namin na ang lahat ng data na aming pag-aaralan sa kabuuan ay isang obserbasyon. Ang likas na katangian ng kolektibong pagmamasid na ito ay maaaring magkakaiba. Maaari itong maging isang solong numero, isang sequence ng mga numero, isang sequence ng mga character, isang number table, atbp. Ipahiwatig natin sa sandaling ito ang sama-samang pagmamasid ni X. Kapag nagbilang tayo X resulta ng random na pagpili, dapat nating ipahiwatig ang pangkalahatang populasyon kung saan X napili. Nangangahulugan ito na dapat nating ipahiwatig ang mga halagang iyon na maaaring lumitaw sa halip na ang tunay X. Tukuyin natin ang koleksyong ito sa pamamagitan ng X. Isang grupo ng X tinatawag din sampol na ispasyo, o sample space.

Ipinapalagay namin na ang tinukoy na pagpipilian ay naganap alinsunod sa isang tiyak na pamamahagi ng posibilidad sa set X, ayon sa kung saan ang bawat elemento ng X ay may tiyak na pagkakataong mapili. Kung X - ay isang may hangganan na hanay, pagkatapos ang bawat isa sa mga elemento nito x; may positibong posibilidad R(X) na pipiliin. Ang random na pagpili ayon sa naturang probabilistikong batas ay madaling maunawaan nang literal. Para sa mas kumplikadong infinite set X kinakailangan upang matukoy ang posibilidad hindi para sa mga indibidwal na puntos nito, ngunit para sa mga subset. Ang random na pagpili ng isa sa walang katapusang bilang ng mga posibilidad ay mas mahirap isipin, ito ay katulad ng pagpili ng isang punto X mula sa isang segment o spatial na rehiyon X.

Kaugnayan sa pagitan ng pagmamasid X at sample space X, sa pagitan ng mga elemento kung saan ibinahagi ang probabilidad - eksaktong kapareho ng sa pagitan ng elementarya na mga kinalabasan at ang espasyo ng elementarya na mga resulta kung saan ang teorya ng probabilidad ay tumatalakay. Dahil dito, ang teorya ng probabilidad ay nagiging batayan ng mga istatistika ng matematika, at samakatuwid, sa partikular, maaari nating ilapat ang mga probabilistikong pagsasaalang-alang sa problema ng pagsubok ng mga istatistikal na hypotheses.

Pragmatikong tuntunin. Malinaw na kapag napagtibay namin ang isang probabilistikong pananaw sa pinagmulan ng aming data (ibig sabihin, naniniwala kami na nakuha ang mga ito sa pamamagitan ng random na pagpili), kung gayon ang lahat ng karagdagang paghuhusga batay sa data na ito ay magiging probabilistiko sa kalikasan. Ang anumang pahayag ay magiging totoo lamang na may ilang posibilidad, at may ilang positibong posibilidad na ito ay maaaring maging mali. Magiging kapaki-pakinabang ba ang gayong mga konklusyon, at posible bang makakuha ng maaasahang mga resulta sa landas na ito?



Ang parehong mga tanong na ito ay dapat na sagutin nang positibo. Una, ang kaalaman sa mga probabilidad ng mga kaganapan ay kapaki-pakinabang, dahil ang mananaliksik ay mabilis na bumuo ng probabilistikong intuwisyon, na nagpapahintulot sa kanya na gumana nang may mga probabilidad, distribusyon, mga inaasahan sa matematika, atbp., na nakikinabang mula dito. Pangalawa, ang puro probabilistikong mga resulta ay maaaring lubos na kapani-paniwala: ang isang konklusyon ay maaaring ituring na praktikal na maaasahan kung ang posibilidad nito ay malapit sa isa.

Ang mga sumusunod ay masasabi pragmatikong tuntunin na gumagabay sa mga tao at nag-uugnay sa teorya ng posibilidad sa ating mga aktibidad.

Itinuturing namin na halos tiyak ang isang kaganapan na ang posibilidad ay malapit sa 1;

Itinuturing namin na halos imposible para sa isang kaganapan na ang posibilidad ay malapit sa 0.

At hindi lamang namin iniisip ito, ngunit kumilos din alinsunod dito!

Ang pragmatikong tuntunin na itinakda ay, sa mahigpit na kahulugan, siyempre, mali, dahil hindi ito ganap na nagpoprotekta laban sa mga pagkakamali. Ngunit ang mga error kapag ginagamit ito ay bihira. Ang panuntunan ay kapaki-pakinabang dahil ginagawang posible ang praktikal na paggamit ng mga probabilistikong konklusyon.

Minsan ang parehong panuntunan ay bahagyang naiiba: sa isang pagsubok ang hindi malamang na kaganapan ay hindi mangyayari(at vice versa - isang kaganapan ay kinakailangang mangyari, ang posibilidad ng kung saan ay malapit sa 1). Ang salitang "single" ay ipinasok para sa kapakanan ng paglilinaw, dahil sa isang sapat na mahabang pagkakasunud-sunod ng mga independiyenteng pag-uulit ng eksperimento, ang nabanggit na hindi malamang (sa isang eksperimento!) na kaganapan ay halos tiyak na magaganap. Ngunit ito ay isang ganap na naiibang sitwasyon.

Ito ay nananatiling hindi malinaw kung anong posibilidad ang dapat ituring na mababa. Walang quantitative na sagot sa tanong na ito na naaangkop sa lahat ng kaso. Ang sagot ay depende sa kung anong panganib ang dulot ng pagkakamali sa atin. Madalas - kapag sinusubukan ang mga istatistikal na hypotheses, halimbawa, tingnan sa ibaba - ang mga probabilidad ay ipinapalagay na maliit, simula sa 0.01 ¸ 0.05. Ang isa pang bagay ay ang pagiging maaasahan ng mga teknikal na aparato, halimbawa, mga preno ng kotse. Dito ang posibilidad ng pagkabigo ay hindi katanggap-tanggap na mataas, sabihin nating 0.001, dahil ang pagkabigo ng mga preno isang beses bawat libong mga kaganapan sa pagpepreno ay hahantong sa isang malaking bilang ng mga aksidente. Samakatuwid, kapag kinakalkula ang pagiging maaasahan, madalas na kinakailangan na ang posibilidad ng operasyon na walang kabiguan ay nasa pagkakasunud-sunod ng 1-10 -6. Hindi namin tatalakayin dito kung gaano katotoo ang mga naturang pangangailangan: kung ang isang hindi maiiwasang tinatayang modelo ng matematika ay makakapagbigay ng ganoong katumpakan sa pagkalkula ng probabilidad at kung paano pagkatapos ay ihambing ang kinakalkula at tunay na mga resulta.

Mga babala 1. Ang ilang payo ay dapat ibigay sa kung paano bumuo ng mga istatistikal na modelo, kadalasan sa mga problema na walang malinaw na istatistikal na katangian. Upang gawin ito, kinakailangan na ipahayag ang mga likas na katangian ng problemang tinatalakay sa mga tuntuning nauugnay sa sample space at probability distribution. Sa kasamaang palad, ang prosesong ito ay hindi maaaring ilarawan sa pangkalahatang mga termino. Bukod dito, ang prosesong ito ay malikhain at hindi maaaring maging kabisaduhin tulad ng, sabihin nating, isang talahanayan ng pagpaparami. Pero kaya niya matutong, sa pamamagitan ng pag-aaral ng mga huwaran at halimbawa at pagsunod sa kanilang diwa. Titingnan natin ang ilang tulad na mga halimbawa. Sa hinaharap, bibigyan din namin ng espesyal na pansin ang yugtong ito ng istatistikal na pananaliksik.

2. Kapag ginagawang pormal ang mga tunay na problema, maaaring lumitaw ang napaka-magkakaibang mga modelo ng istatistika. Gayunpaman, ang teorya ng matematika ay naghanda ng mga paraan para sa pag-aaral lamang ng isang limitadong bilang ng mga modelo. Para sa isang bilang ng mga karaniwang modelo, ang teorya ay binuo sa mahusay na detalye, at doon ay makakakuha ng mga sagot sa mga pangunahing katanungan na interesado sa mananaliksik. Tatalakayin natin ang ilan sa mga karaniwang modelong ito, na pinakamadalas nating harapin sa pagsasanay, sa aklat na ito. Ang iba ay matatagpuan sa mas dalubhasa at detalyadong mga gabay at sangguniang aklat.

3. Ito ay nagkakahalaga ng pag-alala sa mga limitasyon ng mathematical tools kapag mathematically formalizing isang eksperimento. Kung maaari, dapat nating bawasan ang usapin sa isang karaniwang problema sa istatistika. Ang mga pagsasaalang-alang na ito ay lalong mahalaga kapag pagpaplano eksperimento o pananaliksik; kapag nangongolekta ng impormasyon, kung pinag-uusapan natin ang isang istatistikal na survey; kapag nagse-set up ng mga eksperimento, kung isang aktibong eksperimento ang pinag-uusapan.

Pagmamasid sa istatistika.

Ang kakanyahan ng istatistikal na pagmamasid.

Ang paunang yugto ng anumang istatistikal na pananaliksik ay ang sistematiko, organisadong siyentipikong koleksyon ng mga datos sa mga phenomena at proseso ng buhay panlipunan, na tinatawag na statistical observation. Ang kabuluhan ng yugtong ito ng pag-aaral ay natutukoy sa pamamagitan ng katotohanan na ang paggamit lamang ng ganap na layunin at sapat na kumpletong data na nakuha bilang resulta ng istatistikal na obserbasyon sa mga susunod na yugto ay nakapagbibigay ng mga konklusyon na batay sa siyentipiko tungkol sa kalikasan at mga pattern ng pag-unlad ng bagay na pinag-aaralan. Ang pagmamasid sa istatistika ay isinasagawa sa pamamagitan ng pagtatasa at pagtatala ng mga katangian ng mga yunit ng populasyon na pinag-aaralan sa mga nauugnay na dokumento ng accounting. Ang data na nakuha sa paraang ito ay kumakatawan sa mga katotohanan na sa isang paraan o iba pa ay nagpapakilala sa mga phenomena ng buhay panlipunan. Ang paggamit ng argumentasyong batay sa ebidensya ay hindi sumasalungat sa paggamit ng teoretikal na pagsusuri, dahil ang anumang teorya ay sa huli ay nakabatay sa makatotohanang materyal. Ang katibayan ng kapangyarihan ng mga katotohanan ay tumataas nang higit pa bilang isang resulta ng pagpoproseso ng istatistika, na nagsisiguro ng kanilang sistematisasyon at presentasyon sa isang naka-compress na anyo. Ang pagmamasid sa istatistika ay dapat na nakikilala mula sa iba pang mga anyo ng pagmamasid na isinasagawa sa pang-araw-araw na buhay, batay sa pandama na pang-unawa. Tanging ang gayong pagmamasid ay maaaring tawaging istatistika na nagsisiguro sa pagpaparehistro ng mga itinatag na katotohanan sa mga dokumento ng accounting para sa kanilang kasunod na pangkalahatan. Ang mga partikular na halimbawa ng istatistikal na obserbasyon ay ang sistematikong pagkolekta ng impormasyon, halimbawa, sa mga negosyong gumagawa ng makina tungkol sa bilang ng mga makina at sangkap na ginawa, mga gastos sa produksyon, kita, atbp. Ang obserbasyon ng istatistika ay dapat matugunan ang medyo mahigpit na mga kinakailangan: 1. Ang mga naobserbahang phenomena ay dapat may isang tiyak na pambansang pang-ekonomiyang kahalagahan, pang-agham o praktikal na halaga, nagpapahayag ng ilang mga sosyo-ekonomikong uri ng mga phenomena. 2. Dapat tiyakin ng pagmamasid sa istatistika ang koleksyon ng data ng masa, na sumasalamin sa buong hanay ng mga katotohanan na may kaugnayan sa isyung isinasaalang-alang, dahil ang mga social phenomena ay nasa patuloy na pagbabago, pag-unlad, at may iba't ibang mga estado ng husay.

Ang hindi kumpletong data na hindi sapat na komprehensibong katangian ng proseso ay humahantong sa mga maling konklusyon na nakuha mula sa kanilang pagsusuri. 3. Ang iba't ibang mga sanhi at mga kadahilanan na tumutukoy sa pag-unlad ng panlipunan at pang-ekonomiyang mga phenomena ay paunang natukoy ang oryentasyon ng istatistikal na pagmamasid, kasama ang koleksyon ng mga datos na direktang nagpapakilala sa bagay na pinag-aaralan, upang isaalang-alang ang mga katotohanan at mga kaganapan sa ilalim ng impluwensya ng kung saan nangyayari ang mga pagbabago sa mga estado nito. 4. Upang matiyak ang pagiging maaasahan ng istatistikal na data sa yugto ng istatistikal na pagmamasid, isang masusing pagsusuri sa kalidad ng mga nakolektang katotohanan ay kinakailangan. Ang mahigpit na pagiging maaasahan ng data nito ay isa sa pinakamahalagang katangian ng statistical observation. Ang mga depekto sa istatistikal na impormasyon, na ipinahayag sa hindi pagiging maaasahan nito, ay hindi maaaring alisin sa proseso ng karagdagang pagproseso, kaya ang kanilang hitsura ay nagpapahirap sa paggawa ng mga desisyon na nakabatay sa siyentipiko at balansehin ang ekonomiya. 5. Ang pagmamasid sa istatistika ay dapat isagawa sa isang siyentipikong batayan ayon sa isang paunang binuo na sistema, plano at mga patakaran (programa), na nagbibigay ng isang mahigpit na siyentipikong solusyon sa lahat ng mga isyung programmatic, methodological at organisasyon.

Software at metodolohikal na suporta para sa istatistikal na pagmamasid.

Paghahanda para sa istatistikal na obserbasyon, pagtiyak sa tagumpay ng kaso, ipinapalagay ang pangangailangan upang napapanahong lutasin ang isang bilang ng mga metodolohikal na isyu na may kaugnayan sa kahulugan ng mga gawain, layunin, bagay, yunit ng pagmamasid, pagbuo ng mga programa at kasangkapan, at pagpapasiya ng pamamaraan ng pagkolekta ng istatistikal na datos. Ang mga gawain ng istatistikal na pagmamasid ay direktang sumusunod mula sa mga gawain ng istatistikal na pananaliksik at binubuo, sa partikular, ng pagkuha ng mass data nang direkta sa estado ng bagay na pinag-aaralan, isinasaalang-alang ang estado ng mga phenomena na nakakaimpluwensya sa bagay, at pag-aaral ng data sa proseso ng pag-unlad ng mga phenomena. Ang mga layunin ng pagsubaybay ay tinutukoy, una sa lahat, sa pamamagitan ng mga pangangailangan ng suporta sa impormasyon para sa pang-ekonomiya at panlipunang pag-unlad ng lipunan. Ang mga layunin na itinakda para sa mga istatistika ng estado ay nilinaw at tinukoy ng mga namumunong katawan nito, bilang isang resulta kung saan ang mga direksyon at saklaw ng trabaho ay tinutukoy. Depende sa layunin, ang tanong ng object ng statistical observation ay napagpasyahan, i.e. kung ano talaga ang dapat obserbahan. Ang isang bagay ay nauunawaan bilang isang hanay ng mga materyal na bagay, negosyo, kolektibo ng trabaho, indibidwal, atbp., kung saan isinasagawa ang mga phenomena at proseso na napapailalim sa istatistikal na pananaliksik. Ang mga bagay ng pagmamasid, depende sa mga layunin, ay maaaring, sa partikular, masa ng mga yunit ng kagamitan sa produksyon, produkto, imbentaryo, pamayanan, rehiyon, negosyo, organisasyon at institusyon ng iba't ibang sektor ng pambansang ekonomiya, populasyon at mga indibidwal na kategorya nito. , atbp. Ang pagtatatag ng isang bagay ng istatistikal na pagmamasid ay nauugnay sa pagpapasiya ng mga hangganan nito batay sa isang naaangkop na pamantayan, na ipinahayag ng ilang katangiang paghihigpit na tinatawag na kwalipikasyon. Ang pagpili ng kwalipikasyon ay may malaking epekto sa pagbuo ng mga homogenous na populasyon at tinitiyak ang imposibilidad ng paghahalo ng iba't ibang mga bagay o pag-undercount ng ilang bahagi ng bagay. Ang kakanyahan ng object ng istatistikal na pagmamasid ay higit na nauunawaan kapag isinasaalang-alang ang mga yunit kung saan ito ay binubuo: Ang mga yunit ng pagmamasid ay ang mga pangunahing elemento ng bagay ng istatistikal na pagmamasid, na mga carrier ng mga nakarehistrong katangian.

Ang isang yunit ng pag-uulat ay dapat na naiiba mula sa isang yunit ng pagmamasid. Ang yunit ng pag-uulat ay ang yunit ng istatistikal na obserbasyon kung saan ang impormasyong napapailalim sa pagpaparehistro ay natanggap sa inireseta na paraan. Sa ilang mga kaso, ang parehong mga konsepto ay nag-tutugma, ngunit kadalasan mayroon silang ganap na independiyenteng kahulugan. Ito ay lumalabas na imposible at hindi praktikal na isaalang-alang ang buong hanay ng mga tampok na nagpapakilala sa object ng pagmamasid, samakatuwid, kapag bumubuo ng isang statistical observation plan, ang isyu ng komposisyon ng mga tampok na mairehistro alinsunod sa layunin ay dapat na maingat. at mahusay na nagpasya. Ang isang listahan ng mga katangian na nabuo sa anyo ng mga tanong na tinutugunan sa mga yunit ng populasyon, kung saan ang isang istatistikal na pag-aaral ay dapat sagutin, ay kumakatawan sa isang programa ng istatistikal na pagmamasid.

Upang makakuha ng komprehensibong paglalarawan ng hindi pangkaraniwang bagay na pinag-aaralan, dapat isaalang-alang ng programa ang buong hanay ng mga mahahalagang tampok nito. Gayunpaman, ang may problemang katangian ng praktikal na pagpapatupad ng prinsipyong ito ay nangangailangan ng pagsasama sa programa ng mga pinakamahalagang tampok lamang na nagpapahayag ng mga sosyo-ekonomikong uri ng phenomenon, ang pinakamahalagang katangian, katangian at relasyon nito. Ang saklaw ng programa ay kinokontrol ng dami ng mga mapagkukunang magagamit sa mga awtoridad sa istatistika, ang oras ng pagkuha ng mga resulta, mga kinakailangan para sa antas ng detalye ng mga pag-unlad, atbp. Ang nilalaman ng programa ay tinutukoy ng likas at katangian ng bagay na pinag-aaralan, ang mga layunin at layunin ng pag-aaral. Kabilang sa mga pangkalahatang kinakailangan para sa pagbuo ng isang programa ay ang hindi katanggap-tanggap na pagsasama ng mga tanong kung saan mahirap makakuha ng tumpak, ganap na maaasahang mga sagot na nagbibigay ng isang layunin na larawan ng isang partikular na sitwasyon. Kapag isinasaalang-alang ang ilan sa mga pinakamahalagang katangian, kaugalian na isama ang mga tanong sa pagkontrol sa programa upang matiyak ang pagkakapare-pareho ng impormasyong natanggap. Para mapahusay ang mutual verification ng mga tanong at ang analytical na katangian ng observation program, ang magkakaugnay na mga tanong ay inaayos sa isang tiyak na pagkakasunod-sunod, minsan sa mga bloke ng magkakaugnay na katangian.

Ang mga tanong ng programa sa pagmamasid sa istatistika ay dapat na bumalangkas nang malinaw, maigsi, at maigsi, nang hindi pinapayagan ang posibilidad ng iba't ibang interpretasyon. Ang programa ay madalas na nagbibigay ng isang listahan ng mga posibleng pagpipilian sa sagot, kung saan ang semantikong nilalaman ng mga tanong ay nilinaw. Ang metodolohikal na suporta para sa istatistikal na pagmamasid ay ipinapalagay na kasabay ng programa ng pagmamasid, ang isang programa para sa pag-unlad nito ay iginuhit. Ang mga layunin ng pananaliksik ay nabuo sa isang listahan ng mga pangkalahatang tagapagpahiwatig ng istatistika. Ang mga tagapagpahiwatig na ito ay dapat makuha bilang isang resulta ng pagproseso ng nakolektang materyal, ang mga katangian kung saan tumutugma ang bawat tagapagpahiwatig, at ang mga layout ng mga talahanayan ng istatistika, na nagpapakita ng mga resulta ng pagproseso ng pangunahing impormasyon. Ang programa ng pagpapaunlad, sa pamamagitan ng pagtukoy ng nawawalang impormasyon, ay nagbibigay-daan sa iyo na linawin ang programa sa pagmamasid sa istatistika. Ang pagsasagawa ng istatistikal na pagmamasid ay nangangailangan ng paghahanda ng mga naaangkop na tool: mga form at mga tagubilin para sa pagpuno sa mga ito. Ang istatistikal na porma ay isang pangunahing dokumento na nagtatala ng mga sagot sa mga tanong sa programa para sa bawat yunit ng populasyon. Ang form, samakatuwid, ay isang carrier ng pangunahing impormasyon. Ang lahat ng mga form ay nailalarawan sa pamamagitan ng ilang mga mandatoryong elemento: isang bahagi ng nilalaman, kabilang ang isang listahan ng mga tanong sa programa, isang libreng column o ilang mga column para sa pagtatala ng mga sagot at mga response code, pag-print ng pamagat at address. Upang matiyak ang pagkakapareho ng interpretasyon ng kanilang nilalaman, ang mga istatistikal na anyo ay karaniwang sinasamahan ng mga tagubilin, i.e. nakasulat na mga tagubilin at paliwanag para sa pagpuno ng mga pormularyo ng pagmamasid sa istatistika. Ang mga tagubilin ay nagpapaliwanag ng layunin ng istatistikal na pagmamasid, katangian ng bagay at yunit nito, ang oras at tagal ng pagmamasid, ang pamamaraan para sa paghahanda ng dokumentasyon, at ang takdang panahon para sa pagpapakita ng mga resulta. Gayunpaman, ang pangunahing layunin ng mga tagubilin ay upang ipaliwanag ang nilalaman ng mga tanong sa programa, kung paano sasagutin ang mga ito at punan ang form.

Mga uri at paraan ng pagmamasid sa istatistika.

Ang tagumpay ng pagkolekta ng mataas na kalidad at kumpletong paunang data, na isinasaalang-alang ang pangangailangan para sa matipid na paggamit ng materyal, paggawa at mga mapagkukunang pinansyal, ay higit na tinutukoy ng desisyon sa pagpili ng uri, pamamaraan at pang-organisasyon na anyo ng istatistikal na pagmamasid.

Mga uri ng istatistikal na pagmamasid.

Ang pangangailangan na pumili ng isa o isa pang opsyon para sa pagkolekta ng istatistikal na data na pinakaangkop sa mga kondisyon ng problemang niresolba ay tinutukoy ng pagkakaroon ng ilang uri ng pagmamasid, pangunahing naiiba sa likas na katangian ng pagtatala ng mga katotohanan sa paglipas ng panahon. Ang sistematikong pagmamasid, na isinasagawa nang tuluy-tuloy at kinakailangan habang lumilitaw ang mga palatandaan ng isang kababalaghan, ay tinatawag na kasalukuyang. Ang kasalukuyang pagmamasid ay isinasagawa batay sa mga pangunahing dokumento na naglalaman ng impormasyong kinakailangan para sa isang medyo kumpletong paglalarawan ng hindi pangkaraniwang bagay na pinag-aaralan. Ang pagmamasid sa istatistika na isinasagawa sa ilang pantay na pagitan ng oras ay tinatawag na periodic. Ang isang halimbawa ay ang sensus ng populasyon. Ang pagmamasid na isinasagawa sa pana-panahon, nang walang pagmamasid sa mahigpit na dalas o sa isang beses na batayan, ay tinatawag na isang beses. Ang mga uri ng istatistikal na pagmamasid ay pinag-iiba-iba na isinasaalang-alang ang mga pagkakaiba sa impormasyon batay sa pagkakumpleto ng saklaw ng populasyon. Sa bagay na ito, ang isang pagkakaiba ay ginawa sa pagitan ng tuloy-tuloy at hindi tuloy-tuloy na mga obserbasyon. Ang patuloy na pagmamasid ay isa na isinasaalang-alang ang lahat ng mga yunit ng populasyon na pinag-aaralan nang walang pagbubukod. Ang hindi tuloy-tuloy na obserbasyon ay malinaw na nakatuon sa pagsasaalang-alang sa isang tiyak, kadalasang napakalaking bahagi ng mga yunit ng obserbasyon, na gayunpaman ay ginagawang posible upang makakuha ng matatag na pangkalahatang katangian ng buong istatistikal na populasyon. Sa istatistikal na kasanayan, iba't ibang uri ng hindi tuloy-tuloy na pagmamasid ang ginagamit: pumipili, maramihang pamamaraan, talatanungan at monograpiko. Ang kalidad ng hindi tuloy-tuloy na pagmamasid ay mas mababa sa mga resulta ng tuloy-tuloy na pagmamasid, gayunpaman, sa ilang mga kaso, ang istatistikal na pagmamasid sa pangkalahatan ay nagiging posible lamang bilang hindi tuloy-tuloy. Upang makakuha ng isang kinatawan na katangian ng buong istatistikal na populasyon para sa ilang bahagi ng mga yunit nito, ginagamit ang sample na obserbasyon, batay sa mga siyentipikong prinsipyo ng pagbuo ng isang sample na populasyon. Ang random na katangian ng pagpili ng mga yunit ng populasyon ay ginagarantiyahan ang pagiging walang kinikilingan ng mga resulta ng sampling at pinipigilan ang kanilang bias. Gamit ang pangunahing pamamaraan ng array, ang pinakamalaki, pinakamahalagang yunit ng populasyon ay pinipili, nangingibabaw sa kanilang kabuuang masa ayon sa katangiang pinag-aaralan. Ang isang tiyak na uri ng istatistikal na pagmamasid ay isang monograpikong paglalarawan, na isang detalyadong pagsusuri ng isang hiwalay, ngunit napaka tipikal na bagay, na kung saan ay interesado mula sa punto ng view ng pag-aaral ng buong populasyon.

Mga pamamaraan ng istatistikal na pagmamasid.

Ang pagkakaiba-iba ng mga uri ng istatistikal na obserbasyon ay posible rin depende sa mga mapagkukunan at pamamaraan ng pagkuha ng pangunahing impormasyon. Kaugnay nito, may ginawang pagkakaiba sa pagitan ng direktang pagmamasid, survey at dokumentaryo na pagmamasid. Ang direktang pagmamasid ay isinasagawa sa pamamagitan ng pagbibilang, pagsukat ng mga halaga ng mga palatandaan, pagkuha ng mga pagbabasa ng instrumento ng mga espesyal na tao na nagsasagawa ng mga obserbasyon, sa madaling salita, mga recorder. Kadalasan, dahil sa imposibilidad ng paggamit ng iba pang mga pamamaraan, ang pagmamasid sa istatistika ay isinasagawa sa pamamagitan ng isang survey sa isang tiyak na listahan ng mga katanungan. Ang mga sagot ay naitala sa isang espesyal na anyo. Depende sa mga paraan ng pagtanggap ng mga tugon, ang isang pagkakaiba ay ginawa sa pagitan ng mga paraan ng pagpapasa at mga kasulatan, pati na rin ang paraan ng pagpaparehistro sa sarili. Ang paraan ng pagpapasa ng survey ay isinasagawa nang pasalita ng isang espesyal na tao (counter, forwarder), na sabay na pinupunan ang isang form o survey form.

Ang paraan ng sarbey ng koresponden ay inayos ng mga estadistika na katawan na namamahagi ng mga form ng survey sa isang partikular na angkop na inihandang lupon ng mga tao na tinatawag na mga koresponden. Ang huli ay obligado, ayon sa kasunduan, na punan ang form at ibalik ito sa istatistikal na organisasyon. Ang pagsuri sa kawastuhan ng pagsagot sa mga form ay nagaganap sa panahon ng survey gamit ang self-registration. Ang mga talatanungan ay pinupunan, tulad ng pamamaraan ng koresponden, ng mga respondente mismo, ngunit ang mga ito ay ipinamamahagi at kinokolekta, pati na rin ang itinuro at sinusubaybayan para sa tamang pagkumpleto, ng mga enumerator.

Pangunahing organisasyonal na anyo ng istatistikal na pagmamasid.

Ang lahat ng iba't ibang uri at pamamaraan ng pagmamasid ay isinasagawa sa pagsasanay sa pamamagitan ng dalawang pangunahing anyo ng organisasyon: pag-uulat at espesyal na organisadong pagmamasid. Ang pag-uulat ng istatistika ay ang pangunahing anyo ng pagmamasid sa istatistika sa lipunang panlipunan, na sumasaklaw sa lahat ng mga negosyo, organisasyon at institusyon ng mga larangan ng produksyon at hindi produksyon. Ang pag-uulat ay ang sistematikong pagtatanghal ng accounting at istatistikal na dokumentasyon sa isang napapanahong paraan sa anyo ng mga ulat na komprehensibong nagpapakilala sa mga resulta ng gawain ng mga negosyo at institusyon sa mga panahon ng pag-uulat. Ang pag-uulat ay direktang nauugnay sa pangunahin at mga dokumento ng accounting, ay batay sa mga ito at kumakatawan sa kanilang systematization, i.e. ang resulta ng pagproseso at paglalahat. Ang pag-uulat ay isinasagawa sa isang mahigpit na itinatag na form, na inaprubahan ng State Statistics Committee ng Russia. Ang listahan ng lahat ng mga form na nagsasaad ng kanilang mga detalye (mga accessory) ay tinatawag na isang reporting sheet. Ang bawat form sa pag-uulat ay dapat maglaman ng sumusunod na impormasyon: pangalan; numero at petsa ng pag-apruba; pangalan ng negosyo, address at subordination nito; mga address kung saan isinumite ang pag-uulat; dalas, petsa ng pagtatanghal, paraan ng paghahatid; nilalaman sa anyo ng isang talahanayan; ang opisyal na komposisyon ng mga taong responsable para sa pagbuo at pagiging maaasahan ng data ng pag-uulat, i.e. kinakailangang lagdaan ang ulat. Ang iba't ibang mga kondisyon ng proseso ng produksyon sa iba't ibang sektor ng materyal na produksyon, ang pagtitiyak ng proseso ng pagpaparami sa mga lokal na kondisyon, na isinasaalang-alang ang kahalagahan ng ilang mga tagapagpahiwatig ay tumutukoy sa pagkakaiba sa mga uri ng pag-uulat. Mayroong, una sa lahat, karaniwan at dalubhasang pag-uulat. Ang karaniwang pag-uulat ay may parehong anyo at nilalaman para sa lahat ng negosyo o institusyon sa pambansang ekonomiya. Ang espesyal na pag-uulat ay nagpapahayag ng mga aspetong partikular sa mga indibidwal na negosyo sa industriya. Batay sa prinsipyo ng dalas, ang pag-uulat ay nahahati sa taunang at kasalukuyan: quarterly, monthly, biweekly, weekly. Depende sa paraan ng pagpapadala ng impormasyon, ang pag-uulat ng postal at telegraph ay nakikilala. Ang mga istatistikal na census ay nagsisilbing pangalawang pinakamahalagang organisasyonal na anyo ng istatistikal na pagmamasid. Ang census ay isang espesyal na organisadong istatistikal na obserbasyon na naglalayong itala ang bilang at komposisyon ng ilang mga bagay (phenomena), pati na rin ang pagtatatag ng mga katangian ng husay ng kanilang mga pinagsama-sama sa isang tiyak na punto ng oras. Ang mga census ay nagbibigay ng istatistikal na impormasyon na hindi ibinigay para sa pag-uulat, at sa ilang mga kaso ay makabuluhang nililinaw ang kasalukuyang data ng accounting.

Upang matiyak ang mataas na kalidad ng mga resulta ng istatistikal na sensus, isinasagawa ang isang kumplikadong gawaing paghahanda. Ang nilalaman ng mga hakbang sa organisasyon para sa paghahanda ng mga census, na isinagawa alinsunod sa mga kinakailangan at tuntunin ng agham ng istatistika, ay itinakda sa isang espesyal na binuo na dokumento na tinatawag na plano ng organisasyon para sa istatistikal na pagmamasid. Sa plano ng organisasyon, ang mga isyu ng paksa (tagapagpatupad) ng istatistikal na pagmamasid, ang lugar, oras, tiyempo at pamamaraan ng pag-uugali, ang organisasyon ng mga lugar ng census, ang pagpili at pagsasanay ng pagbibilang ng mga manggagawa, na nagbibigay sa kanila ng kinakailangang dokumentasyon ng accounting , isang bilang ng iba pang gawaing paghahanda at iba pa. Ang paksa ng pagmamasid ay ang organisasyon (institusyon) o ang dibisyon nito na responsable para sa pagmamasid, pag-aayos ng pagpapatupad nito, pati na rin ang direktang pagsasagawa ng mga function ng pagkolekta at pagproseso ng istatistikal na data. Ang tanong ng lugar ng pagmamasid (ang lugar kung saan ang mga katotohanan ay naitala) ay lumitaw lalo na kapag nagsasagawa ng istatistika at sosyolohikal na pananaliksik at nalutas depende sa layunin ng pag-aaral.

Ang oras ng pagmamasid ay ang tagal ng panahon kung saan ang gawain ng pagtatala at pag-verify ng data na nakuha ay dapat simulan at tapusin. Ang oras ng pagmamasid ay pinili batay sa criterion ng minimal spatial mobility ng bagay na pinag-aaralan. Ang kritikal na sandali kung saan ang nakolektang data ay napetsahan ay dapat na makilala mula sa oras ng pagmamasid.

Ang konsepto ng istatistikal na pagmamasid ay isang kawili-wiling paksa upang isaalang-alang. Ginagamit ang mga istatistikal na obserbasyon sa halos lahat ng dako kung saan maaaring matukoy ang kanilang aplikasyon. Kasabay nito, sa kabila ng malawak na saklaw ng aplikasyon, ang mga obserbasyon sa istatistika ay medyo kumplikadong paksa at ang mga pagkakamali ay hindi pangkaraniwan. Gayunpaman, sa pangkalahatan, ang mga istatistikal na obserbasyon bilang isang paksa para sa pagsasaalang-alang ay may malaking interes.