Eșantionul este reprezentativ. Reprezentativitatea - ce este? Eșantionarea sistematică aleatorie

De fapt, vom începe cu nu una, ci trei întrebări: ce este un eșantion? cand este reprezentativ? ce reprezinta ea?

Agregat- acesta este orice grup de persoane, organizații, evenimente de interes pentru noi, despre care dorim să tragem concluzii și intamplandu-se, sau obiect, - orice element al unei astfel de colecții.

Probă- orice subgrup al setului de cazuri (obiecte) selectat pentru analiză.

Dacă dorim să studiem activitatea de luare a deciziilor a legiuitorilor de stat, am putea examina o astfel de activitate în legislaturi ale statelor Virginia, Carolina de Nord și Carolina de Sud, și nu în toate cele cincizeci de state și, pe baza acestui fapt, distribui datele obţinute asupra populaţiei din care au fost selectate cele trei state. Dacă dorim să investigăm sistemul de preferințe ale alegătorilor din Pennsylvania, am putea face acest lucru intervievând 50 de lucrători din SUA. S. Steele din Pittsburgh și să distribuie rezultatele sondajului tuturor alegătorilor din stat.

În mod similar Dacă dorim să măsurăm inteligența studenților, am putea testa toți jucătorii defensivi înregistrați în statul Ohio într-un anumit sezon de fotbal și apoi să extindem rezultatele la populația din care fac parte. În fiecare exemplu, procedăm după cum urmează: stabilim un subgrup în cadrul populației, studiem acest subgrup sau eșantion, în detaliu și extindem rezultatele la întreaga populație. Acestea sunt principalele etape ale eșantionării.

in orice caz pare Este destul de evident că fiecare dintre aceste mostre are un dezavantaj semnificativ. De exemplu, deși legislaturile din Virginia, Carolina de Nord și Carolina de Sud fac parte din constelația legislaturii statale, ele sunt, din motive istorice, geografice și politice, probabil să funcționeze în moduri foarte similare și foarte diferit de astfel de legislaturi distincte. state precum New York, Nebraska și Alaska. În timp ce cei cincizeci de siderurgici din Pittsburgh pot fi într-adevăr alegători în Pennsylvania, ei s-ar putea bine, în virtutea statutului lor socioeconomic, a educației și a experienței de viață, să aibă opinii diferite de cele ale multor alți oameni care sunt alegători în același mod.

De asemenea, deși fotbaliștii din Ohio State sunt studenți, ei pot fi diferiți de alți studenți din mai multe motive. Cu alte cuvinte, deși fiecare dintre aceste subgrupuri este într-adevăr un eșantion, membrii fiecăruia dintre ele sunt sistematic diferiți de majoritatea celorlalți membri ai populației din care sunt selectați. Ca grup separat, niciunul dintre ei nu este tipic în ceea ce privește distribuția trăsăturilor opiniilor, motivelor comportamentale și caracteristicilor în populația generală cu care este asociat. În consecință, politologii ar spune că niciuna dintre aceste mostre nu este reprezentativă.


Probă reprezentativă- acesta este un astfel de eșantion în care toate trăsăturile principale ale populației generale din care este prelevat eșantionul dat sunt prezentate aproximativ în aceeași proporție sau cu aceeași frecvență cu care această trăsătură apare în această populație generală. Astfel, dacă 50% din totalul legislaturii statale se întrunesc doar o dată la doi ani, aproximativ jumătate dintr-un eșantion reprezentativ de legislaturi de stat ar trebui să fie de acest tip. Dacă 30% dintre alegătorii din Pennsylvania sunt lucrători, aproximativ 30% dintr-un eșantion reprezentativ al acelor alegători (mai degrabă decât 100% ca în exemplul de mai sus) ar trebui să fie lucrători.

Și dacă 2% din toți studenții sunt sportivi, aproximativ aceeași proporție dintr-un eșantion reprezentativ de studenți ar trebui să fie sportivi. Cu alte cuvinte, un eșantion reprezentativ este un microcosmos, un model mai mic, dar precis al populației pe care intenționează să o reprezinte. În măsura în care eșantionul este reprezentativ, concluziile bazate pe studiul acestui eșantion pot fi considerate în siguranță aplicabile populației inițiale. Această distribuție a rezultatelor este ceea ce numim generalizare.

Poate că o ilustrare grafică va ajuta la clarificarea acestui lucru. Să presupunem că vrem să studiem modelele de apartenență la grupuri politice în rândul adulților din SUA. Figura 5.1 prezintă trei cercuri împărțite în șase sectoare egale. Figura 5.1a reprezintă întreaga populație luată în considerare. Membrii populației sunt clasificați în funcție de grupurile politice (cum ar fi partidele și grupurile de interese) cărora le aparțin.

În acest exemplu fiecare adult aparține de cel puțin una și nu mai mult de șase grupuri politice; iar aceste șase niveluri de apartenență sunt la fel de comune în total (de unde sectoarele egale). Să presupunem că vrem să investigăm motivele oamenilor de a se alătura unui grup, alegerea grupului și modelele de participare, dar din cauza constrângerilor de resurse, suntem capabili să examinăm doar unul din șase membri ai populației. Cine ar trebui să fie selectat pentru analiză?

Orez. 5.1. Formarea unui eșantion din populația generală

Una dintre probele posibile de o dimensiune dată este ilustrată de zona umbrită din Fig. Cu toate acestea, 5.1b nu reflectă în mod clar structura populației.

Dacă ar fi să facem generalizări pe baza acestui eșantion, am concluziona:

1) că toți americanii adulți aparțin a cinci grupuri politice și

2) că întreg comportamentul de grup al americanilor coincide cu comportamentul celor care aparțin tocmai celor cinci grupuri.

Cu toate acestea, știm că prima concluzie nu este adevărată, iar acest lucru ne poate face să ne îndoim de validitatea celei de-a doua.

Astfel, eșantionul prezentat în Figura 5.1b nu este reprezentativ deoarece nu reflectă distribuția unei proprietăți date a populației (numită adesea parametru) în funcție de distribuția sa reală. Se spune că un astfel de eșantion este deplasat spre membrii celor cinci grupuri sau mutat departe de toate celelalte modele de apartenență la grup. Pe baza unei astfel de eșantionări părtinitoare, ajungem de obicei la concluzii eronate despre populație.

Acest lucru poate fi demonstrat cel mai clar de exemplul catastrofei care a avut loc în anii 1930 în revista Literary Digest, care a organizat un sondaj de opinie publică cu privire la rezultatele alegerilor. „ Rezumat literar” a fost un periodic care a retipărit editoriale din ziare și alte materiale care reflectau opinia publică; această revistă era foarte populară la începutul secolului.

Din 1920. Revista a efectuat un sondaj amplu la nivel național în care peste un milion de persoane au primit buletine de vot prin poștă, cerându-le să-și marcheze candidatul preferat pentru viitoarele alegeri prezidențiale. Timp de câțiva ani, rezultatele sondajelor revistei au fost atât de precise încât sondajul din septembrie părea să facă alegerile din noiembrie irelevante.

Și cum ar putea să apară o greșeală cu un eșantion atât de mare? Totuși, în 1936, exact așa s-a întâmplat: cu o mare majoritate de voturi (60:40), victoria a fost prezisă de candidatul republican Alf Landon. La alegeri, Landon a pierdut în fața unei persoane cu dizabilități - Franklin D. Roosevelt- practic cu acelasi rezultat cu care ar fi trebuit sa castige. Credibilitatea Literary Digest a fost atât de grav subminată, încât revista s-a epuizat la scurt timp după aceea. Ce s-a întâmplat? Este foarte simplu: sondajul Digest a folosit un eșantion părtinitor. Cărți poștale au fost trimise persoanelor ale căror nume au fost extrase din două surse: agende telefonice și liste de înmatriculare a mașinilor.

Deși această metodă de selecție nu fusese anterior foarte diferită de alte metode, era destul de diferită acum, în timpul Marii Depresiuni din 1936, când alegătorii mai puțin înstăriți, cel mai probabil pilonul lui Roosevelt, nu își puteau permite un telefon, darămite mașină. Astfel, de fapt, eșantionul folosit în sondajul Digest a fost părtinitor față de cei care aveau cele mai multe șanse să candideze pentru republicani și este încă surprinzător că Roosevelt a avut un rezultat atât de bun.

Cum se rezolvă această problemă? Revenind la exemplul nostru, să comparăm eșantionul din Fig. 5.1b cu o selecție din fig. 5.1c. În acest din urmă caz, a fost selectată și o șaseme din populație pentru analiză, dar fiecare dintre principalele tipuri de populație este reprezentată în eșantion în proporția în care este reprezentată în întreaga populație. Un astfel de eșantion arată că unul din șase adulți americani aparține unui grup politic, unul din șase până la doi și așa mai departe. Un astfel de eșantion ar dezvălui și alte diferențe între membrii săi care ar putea fi legate de participarea la un număr diferit de grupuri. Astfel, eșantionul prezentat în Figura 5.1c este un eșantion reprezentativ pentru populația luată în considerare.

Desigur, acest exemplu este simplificată din cel puţin două puncte de vedere extrem de importante. În primul rând, majoritatea populațiilor de interes pentru oamenii de știință politică sunt mai diverse decât cea din exemplu. Oameni, documente, guverne, organizații, decizii etc. diferă unele de altele nu într-una, ci într-un număr mult mai mare de caracteristici. Prin urmare, un eșantion reprezentativ ar trebui să fie astfel încât fiecare a nucleului, o zonă distinctă era reprezentată proporţional cu ponderea acesteia în populaţie.

În al doilea rând, situația în care distribuția reală a variabilelor, sau caracteristicile pe care dorim să le măsurăm, nu este cunoscută dinainte, este mult mai frecventă decât invers - poate că nu a fost măsurată în recensământul anterior al populației. Astfel, un eșantion reprezentativ trebuie proiectat astfel încât să reflecte cu acuratețe distribuția existentă chiar și atunci când nu putem evalua în mod direct validitatea acestuia. Procedura de eșantionare trebuie să aibă o logică internă capabilă să ne convingă că, dacă am putea compara eșantionul cu recensământul, acesta ar fi într-adevăr reprezentativ.

Pentru a oferi oportunitatea reflectarea exactă a organizării complexe a unei populații date și un anumit grad de încredere că procedurile propuse sunt capabile să facă acest lucru, cercetătorii apelează la metode statistice. Procedând astfel, aceștia operează în două direcții. În primul rând, folosind anumite reguli (logica internă), cercetătorii decid ce obiecte anume să studieze, ce anume să includă într-un anumit eșantion. În al doilea rând, folosind reguli foarte diferite, ei decid câte obiecte să selecteze. Nu vom studia aceste numeroase reguli în detaliu, vom lua în considerare doar rolul lor în cercetarea în științe politice. Să începem cu strategiile de selectare a obiectelor care formează un eșantion reprezentativ.

Scopul final al studierii unei populații eșantion este întotdeauna obținerea de informații despre populație. Pentru a face acest lucru, un studiu eșantion trebuie să îndeplinească anumite condiții. Una dintre principalele condiții reprezentativitatea (reprezentativitatea) eșantionului. După cum sa discutat mai devreme, se face o distincție între reprezentativitatea calitativă și cea cantitativă.

Aleatoritatea, care garantează reprezentativitatea calitativă (structurală) a studiilor statistice, se realizează prin îndeplinirea unui număr de condiții pentru formarea grupurilor de eșantion (seturi):

1. Fiecare membru al populației generale trebuie să aibă o probabilitate egală de a fi inclus în eșantion.

2. Selecția unităților de observație din populația generală trebuie efectuată indiferent de trăsătura studiată. Dacă selecția este efectuată în mod intenționat, atunci este, de asemenea, necesar să se respecte condițiile pentru independența distribuției trăsăturii studiate.

3. Selecția trebuie efectuată din grupuri omogene.

Respectarea conditiilor care garanteaza apropierea maxima a esantionului si a populatiei generale se asigura prin metode speciale de selectie. În funcție de metoda de formare, se disting următoarele mostre:

1. Eșantioane care nu necesită împărțirea populației generale în părți (de fapt, eșantionare aleatorie repetată sau nerepetată).

2. Eșantioane care necesită împărțirea populației generale în părți (probe mecanice, tipice sau tipologice, cohortă, probe conjugate pereche).

De fapt, un eșantion aleatoriu este format prin selecție aleatorie - la întâmplare. Selecția aleatorie se bazează pe amestecare. De exemplu: alegerea unei mingi într-un loto sportiv după amestecarea tuturor bilelor, alegerea numerelor câștigătoare la loterie, alegerea aleatorie a cardurilor de pacienți pentru cercetare etc. Uneori se folosesc numere aleatoare, obținute din tabele de numere aleatoare sau folosind generatoare de numere aleatoare. Conform acestor numere, dintr-o matrice prenumerată a populației generale, sunt selectate unități de observație cu numere corespunzătoare numerelor aleatorii care au căzut.

La compilarea unui eșantion aleatoriu, după ce obiectul este selectat și toate datele necesare despre acesta sunt înregistrate, puteți face două lucruri: obiectul poate fi returnat sau nu poate fi returnat populației generale. Conform cu aceasta eșantionul se numește repetat(obiectul este restituit populaţiei) sau nerepetitive(obiectul nu este restituit populației). Întrucât în ​​majoritatea studiilor statistice nu există practic nicio diferență între probele repetate și cele nerepetate, este acceptată a priori condiția ca eșantionul să fie repetat.

Estimarea dimensiunii eșantionului necesar

Pentru ca eșantionul să fie reprezentativ cantitativ pentru populația generală, este necesar să se estimeze mai întâi cantitatea de date care urmează să fie incluse în eșantion.

Cu o dimensiune necunoscută a populației generale cantitatea de reeșantionare care garantează rezultate reprezentative dacă rezultatul este reflectat în indicator ca valoare relativă (cota), determinată de formula:

unde p este valoarea indicatorului trăsăturii studiate, în %; q = (100- p) ;

t este un coeficient de încredere care arată care este probabilitatea ca mărimea indicatorului să nu depășească limitele erorii marginale (de obicei se ia t = 2, care oferă o probabilitate de 95% pentru o prognoză fără erori);

 - eroarea marginală a indicatorului.

De exemplu: unul dintre indicatorii care caracterizează starea de sănătate a lucrătorilor din întreprinderile industriale este procentul lucrătorilor care nu au fost bolnavi în cursul anului. Să presupunem că pentru sectorul industrial din care aparține întreprinderea chestionată, acest indicator este de 25%. Eroarea marginală care poate fi permisă astfel încât răspândirea valorilor indicatorului să nu depășească limite rezonabile este de 5%. În acest caz, indicatorul poate lua valori de 25% ± 5%, adică. de la 20% la 30%. Presupunând t = 2, obținem

In acest caz, dacă indicatorul este valoarea medie, atunci numărul de observații poate fi determinat prin formula:

unde σ este abaterea standard, care poate fi obținută din studii anterioare sau pe baza unor studii experimentale (pilot).

Cu selecție repetitivăși în condiţia unei populaţii generale cunoscute pentru a determina dimensiunea necesară aleatoare a eșantionului în cazul utilizării valori relative (acțiuni) se aplica formula:

pentru valori medii se foloseste formula:

unde N este dimensiunea populației generale.

Pe baza condițiilor din exemplul de mai sus și presupunând dimensiunea populației generale N=500 muncitori, obținem:

Este ușor de observat că dimensiunea eșantionului necesară pentru eșantionarea nerepetitivă este mai mică decât pentru eșantionarea repetată (respectiv, 188 și 300 de lucrători).

În general, numărul de observații necesare pentru a obține date reprezentative variază invers cu pătratul erorii permise.

Prelevare mecanică- eșantionarea, când unitățile de observație sunt selectate mecanic din populația chestionată. De exemplu: selectarea fiecărui cincilea sau al zecelea lucrător conform fișelor departamentului de personal al întreprinderii sau conform fișelor de ambulatoriu ale policlinicii unității medicale.

tipic, tipologic sau zonat eşantionarea presupune împărţirea populaţiei generale într-un număr de grupuri omogene calitativ. De exemplu: atunci când se studiază incidența studenților universitari pentru o examinare aprofundată în fiecare curs, sunt selectate grupuri de studenți care sunt tipice în componența lor. Adesea, această metodă de selecție este combinată cu alte metode. De exemplu: teritoriul orașului este împărțit în zone tipice în funcție de gradul de poluare, în aceste zone se formează grupuri de observație prin selecție aleatorie.

selecția cohortei se referă la selecția vizată. Prin această metodă, indivizii sunt selectați din populația generală (distribuția în subgrupe este nealeatorie), uniți prin momentul apariției oricărui semn sau efectul studiat care joacă un rol semnificativ în studiu (anul nașterii, debutul). a bolii, luarea medicamentului etc.).

Studiu caz-control(SC) este un tip de studiu epidemiologic în care distribuția unui factor de risc este comparată între un grup de pacienți cu o boală și un grup de control. Studiul (SC) se referă la retrospectiv, întrucât cercetătorul, împărțind pacienții în grupuri, în funcție de faptul că au sau nu o boală, află de la aceștia informații din trecut.

Ar trebui să ne oprim separat asupra utilizării metodei de eșantionare în statistica sanitară atunci când studiem morbiditatea generală a populației. Premisele teoretice ale metodei de eșantionare au fost testate în cadrul unor studii speciale. Deci, V.S. Bykhovsky și colab. în 1928 au realizat procesarea paralelă a 132,8 mii carduri cu date despre boli printr-o metodă continuă și prin metoda selecției mecanice a fiecărei a cincea carduri. O analiză a rezultatelor acestei prelucrări a arătat o reprezentativitate ridicată a datelor dintr-un studiu selectiv al morbidității. Cu toate acestea, până în prezent, nu există abordări metodologice unificate pentru realizarea unor studii sanitaro-statistice selective în practică largă.

Reprezentativitatea eșantionului

Nume parametru Sens
Subiect articol: Reprezentativitatea eșantionului
Rubrica (categoria tematica) Psihologie

Cerințe pentru mostre

Eșantionului i se aplică o serie de cerințe obligatorii, determinate, în primul rând, de scopurile și obiectivele studiului. Planificarea unui experiment ar trebui să includă luarea în considerare atât a dimensiunii eșantionului, cât și a unui număr de caracteristici ale acestuia. Astfel, în cercetarea psihologică, cerinţa omogenitate mostre. Înseamnă că un psiholog, care studiază, de exemplu, adolescenții, nu poate include adulții în același eșantion. Dimpotrivă, un studiu realizat prin metoda tăierilor de vârstă presupune, în principiu, prezența subiecților de diferite vârste. În același timp, în acest caz, trebuie respectată omogenitatea eșantionului, dar după alte criterii, în primul rând precum vârsta și sexul. Baza formării unui eșantion omogen poate fi diferite caracteristici, cum ar fi nivelul de inteligență, naționalitatea, absența anumitor boli etc., pe baza obiectivelor studiului.

În statistica generală, există un concept repetateși nerepetitive selectii sau, cu alte cuvinte, selectii cu returnare si fara returnare. De exemplu, de regulă, este dată alegerea unei mingi luate dintr-un container. În cazul unei remițe cu retur, fiecare minge selectată este din nou returnată în container și, prin urmare, trebuie selectată din nou. Cu o selecție nerepetitivă, mingea odată selectată este pusă deoparte și nu mai poate participa la selecție. În cercetarea psihologică, se pot găsi analogi ai acestui tip de metode de organizare a cercetării selective, deoarece un psiholog trebuie adesea să testeze aceiași subiecți de mai multe ori folosind aceeași metodologie. În același timp, strict vorbind, procedura de testare se repetă în acest caz. Un eșantion de subiecți cu identitate completă a compoziției în cazul studiilor repetate va avea întotdeauna unele diferențe datorate variabilității funcționale și de vârstă inerente tuturor oamenilor. O astfel de selecție prin natura procedurii se repetă, deși sensul termenului aici este evident diferit de cel în cazul mingilor.

Este important de subliniat că toate cerințele pentru orice eșantion se rezumă la faptul că, pe baza acestuia, psihologul trebuie să obțină cele mai complete, nedistorsionate informații despre caracteristicile populației generale din care este prelevat acest eșantion. Cu alte cuvinte, eșantionul ar trebui să reflecte cât mai complet posibil caracteristicile populației generale studiate.

Compoziția eșantionului experimental ar trebui să reprezinte (simulare) populația generală, deoarece concluziile obținute în experiment se presupune că vor fi transferate întregii populații generale în viitor. Din acest motiv, proba trebuie să aibă o calitate deosebită - reprezentativitate, făcând posibilă extinderea concluziilor obţinute asupra acesteia la întreaga populaţie generală.

Reprezentativitatea eșantionului este foarte importantă, totuși, din motive obiective, este extrem de dificil de menținut. Astfel, este un fapt binecunoscut că de la 70% la 90% din toate studiile psihologice ale comportamentului uman au fost efectuate în SUA în anii 60 ai secolului XX cu studenți, cei mai mulți dintre ei fiind studenți la psihologie. În studiile de laborator efectuate pe animale, cel mai frecvent obiect de studiu sunt șobolanii. Din acest motiv, nu este o coincidență faptul că psihologia era numită ʼʼștiința studenților de secundă și a șobolanilor albiʼʼ. Studenții la psihologie reprezintă doar 3% din populația totală a SUA. Evident, eșantionul de studenți nu este reprezentativ ca model care pretinde că reprezintă întreaga populație a țării.

Reprezentant eșantion sau, după cum se spune, reprezentant un esantion este un astfel de esantion in care toate caracteristicile principale ale populatiei generale sunt reprezentate aproximativ in aceeasi proportie si cu aceeasi frecventa cu care aceasta caracteristica apare in aceasta populatie generala. Cu alte cuvinte, un eșantion reprezentativ este un model mai mic, dar precis al populației pe care intenționează să o reprezinte. În măsura în care eșantionul este reprezentativ, concluziile bazate pe studiul acestui eșantion pot fi luate în considerare cu un grad ridicat de certitudine aplicabil întregii populații. Această diseminare a rezultatelor se numește generalizare.

În mod ideal, un eșantion reprezentativ ar trebui să fie astfel încât fiecare dintre caracteristicile de bază studiate de psiholog, trăsături, trăsături de personalitate etc. ar fi reprezentat în ea proporţional cu aceleaşi trăsături în populaţia generală. Conform acestor cerințe, procedura de eșantionare trebuie să aibă o logică internă care să-l convingă pe cercetător că, în comparație cu populația generală, ea se va dovedi într-adevăr reprezentativă, reprezentativă.

În activitatea sa specifică, psihologul acționează astfel: stabilește un subgrup (eșantion) în cadrul populației generale, studiază acest eșantion în detaliu (realizează lucrări experimentale cu acesta), iar apoi, dacă rezultatele analizei statistice permit, extinde constatări pentru întreaga populație. Acestea sunt principalele etape ale muncii unui psiholog cu un eșantion.

Psihologul începător trebuie să țină cont de o greșeală des repetată: de fiecare dată când culege orice date prin orice metodă și din orice sursă, este mereu tentat să-și extindă concluziile la întreaga populație. Pentru a evita o astfel de greșeală, trebuie nu doar să ai bunul simț, ci, mai presus de toate, să stăpânești bine conceptele de bază ale statisticii matematice.

Reprezentativitatea eșantionului - concept și tipuri. Clasificarea și caracteristicile categoriei „Reprezentativitatea eșantionului” 2017, 2018.

Conceptul de reprezentativitate se regăsește adesea în raportarea statistică și în pregătirea discursurilor și rapoartelor. Poate că, fără ea, este greu de imaginat orice tip de prezentare a informațiilor pentru revizuire.

Reprezentativitatea - ce este?

Reprezentativitatea reflectă modul în care obiectele sau părțile selectate corespund conținutului și semnificației setului de date din care au fost selectate.

Alte definiții

Conceptul de reprezentativitate poate fi dezvoltat în diferite contexte. Dar, în sensul său, reprezentativitatea este corespondența caracteristicilor și proprietăților unităților selectate din populația generală, care reflectă cu acuratețe caracteristicile întregii baze de date generale în ansamblu.

De asemenea, reprezentativitatea informației este definită ca fiind capacitatea datelor eșantionului de a reprezenta parametrii și proprietățile populației care sunt importante din punctul de vedere al studiului în curs.

Probă reprezentativă

Principiul eșantionării este de a selecta cele mai importante și de a reflecta cu acuratețe proprietățile setului total de date. Pentru aceasta, se folosesc diverse metode care permit obținerea de rezultate precise și o idee generală de utilizare doar a materialelor selective care descriu calitatea tuturor datelor.

Astfel, nu este necesar să se studieze întregul material, dar este suficient să se ia în considerare reprezentativitatea eșantionului. Ce este asta? Aceasta este o selecție de date individuale pentru a avea o idee despre masa totală de informații.

În funcție de metodă, acestea se disting ca probabilistice și improbabile. Unul probabilist este un eșantion care se realizează prin calcularea celor mai importante și interesante date, care sunt în continuare reprezentanți ai populației generale. Aceasta este o alegere deliberată sau o selecție aleatorie, totuși, justificată de conținutul ei.

Incredibil - aceasta este una dintre varietățile de eșantionare aleatorie, compilate conform principiului unei loterie obișnuite. În acest caz, părerea celui care alcătuiește o astfel de probă nu este luată în considerare. Se folosește doar un lot orb.

Eșantionare probabilă

Probele probabilistice pot fi, de asemenea, împărțite în mai multe tipuri:

  • Unul dintre cele mai simple și mai înțelese principii este eșantionarea nereprezentativă. De exemplu, această metodă este adesea folosită în anchetele sociale. În același timp, participanții la sondaj nu sunt selectați din mulțime din motive specifice, iar informațiile sunt obținute de la primele 50 de persoane care au participat la acesta.
  • Eșantioanele intenționate diferă prin faptul că au o serie de cerințe și condiții în selecție, dar se bazează totuși pe coincidențe aleatorii, fără a urmări scopul de a obține statistici bune.
  • Eșantionarea pe bază de cote este o altă variantă a eșantionării non-probabilistice care este adesea folosită pentru a examina seturi mari de date. Folosește o mulțime de termeni și condiții. Sunt selectate obiectele care ar trebui să le corespundă. Adică, folosind exemplul unui sondaj social, se poate presupune că vor fi intervievate 100 de persoane, dar la întocmirea unui raport statistic se va ține cont doar de opinia unui anumit număr de persoane care îndeplinesc cerințele stabilite.

Probe probabilistice

Pentru eșantioanele probabilistice se calculează un număr de parametri cărora obiectele din eșantion îi vor corespunde, iar dintre aceștia, în moduri diferite, pot fi selectate tocmai acele fapte și date care vor fi prezentate ca reprezentativitate a datelor eșantionului. Astfel de moduri de calculare a datelor necesare pot fi:

  • O mostră simplă aleatorie. Constă în faptul că, printre segmentul selectat, o metodă de loterie complet aleatorie selectează cantitatea necesară de date, care va fi un eșantion reprezentativ.
  • Eșantionarea sistematică și aleatorie face posibilă elaborarea unui sistem de calcul al datelor necesare pe baza unui segment selectat aleatoriu. Astfel, dacă primul număr aleatoriu care indică numărul de secvență al datelor selectate din populația totală este 5, atunci datele ulterioare care trebuie selectate pot fi, de exemplu, 15, 25, 35 și așa mai departe. Acest exemplu explică clar că chiar și o alegere aleatorie se poate baza pe calcule sistematice ale datelor de intrare necesare.

Eșantion de consumatori

Eșantionarea intenționată este o metodă care constă în luarea în considerare a fiecărui segment individual, iar pe baza evaluării acestuia se întocmește o populație care reflectă caracteristicile și proprietățile bazei de date în ansamblu. În acest fel, se colectează mai multe date care îndeplinesc cerințele unui eșantion reprezentativ. Este ușor să selectați un număr de opțiuni care nu vor fi incluse în numărul total, fără a pierde calitatea datelor selectate reprezentând populația totală. În acest fel, se determină reprezentativitatea rezultatelor studiului.

Marime de mostra

Nu ultima problemă care trebuie abordată este dimensiunea eșantionului pentru o reprezentare reprezentativă a populației. Mărimea eșantionului nu depinde întotdeauna de numărul de surse din populația generală. Cu toate acestea, reprezentativitatea populației eșantionului depinde direct de câte segmente trebuie împărțit rezultatul. Cu cât mai multe astfel de segmente, cu atât mai multe date intră în eșantionul rezultat. Dacă rezultatele necesită o notație generală și nu necesită precizări, atunci, în consecință, eșantionul devine mai mic, deoarece, fără a intra în detalii, informația este prezentată mai superficial, ceea ce înseamnă că citirea acesteia va fi generală.

Conceptul de eroare de reprezentativitate

Eroarea de reprezentativitate este o discrepanță specifică între caracteristicile populației și datele eșantionului. La efectuarea oricărui studiu prin eșantion, este imposibil să se obțină date absolut exacte, ca în cazul unui studiu complet al populațiilor generale și al unui eșantion furnizat doar cu o parte din informații și parametri, în timp ce un studiu mai detaliat este posibil doar atunci când se studiază întreaga populație. Astfel, unele erori și erori sunt inevitabile.

Tipuri de erori

Există câteva erori care apar la compilarea unui eșantion reprezentativ:

  • Sistematic.
  • Aleatoriu.
  • Delibera.
  • Neintenționat.
  • Standard.
  • Limită.

Motivul apariției erorilor aleatoare poate fi caracterul discontinuu al studiului populației generale. De obicei, eroarea aleatorie a reprezentativității este de dimensiune și natură neglijabile.

Între timp, erorile sistematice apar atunci când sunt încălcate regulile de selectare a datelor din populația totală.

Eroarea medie este diferența dintre media eșantionului și populația subiacentă. Nu depinde de numărul de unități din eșantion. Este invers proporțională, atunci cu cât volumul este mai mare, cu atât valoarea erorii medii este mai mică.

Eroarea marginală este cea mai mare diferență posibilă între valorile medii ale eșantionului realizat și populația totală. O astfel de eroare este caracterizată ca maximul de erori probabile în condițiile date de apariție a acestora.

Erori intenționate și neintenționate de reprezentativitate

Erorile de compensare a datelor pot fi intenționate sau neintenționate.

Apoi, motivul apariției erorilor deliberate este abordarea selecției datelor prin metoda de determinare a tendințelor. Erorile neintenționate apar chiar și în etapa de pregătire a unei observări a probei, formând un eșantion reprezentativ. Pentru a evita astfel de erori, este necesar să se creeze un cadru de eșantionare bun pentru listarea unităților de eșantionare. Trebuie să respecte pe deplin obiectivele eșantionării, să fie de încredere, acoperind toate aspectele studiului.

Valabilitate, fiabilitate, reprezentativitate. Calcularea erorilor

Calculul erorii de reprezentativitate (Mm) a mediei aritmetice (M).

Abatere standard: dimensiunea eșantionului (>30).

Eroare reprezentativă (Mr) și (R): dimensiunea eșantionului (n>30).

În cazul în care trebuie să studiezi o populație în care numărul de eșantioane este mic și este mai mic de 30 de unități, atunci numărul de observații va deveni mai mic cu o unitate.

Mărimea erorii este direct proporțională cu dimensiunea eșantionului. Reprezentativitatea informațiilor și calculul gradului de posibilitate de a face o prognoză corectă reflectă o anumită eroare marginală.

Sisteme reprezentative

Nu numai că este utilizat un eșantion reprezentativ în procesul de evaluare a prezentării informațiilor, dar persoana care primește informația însuși folosește sisteme reprezentative. Astfel, creierul prelucrează unele prin crearea unui eșantion reprezentativ din întregul flux de informații pentru a evalua calitativ și rapid datele transmise și a înțelege esența problemei. Răspundeți la întrebarea: "Reprezentativitatea - ce este?" - la scara conștiinței umane este destul de simplu. Pentru a face acest lucru, creierul folosește toți subiecții, în funcție de ce fel de informații trebuie izolate din fluxul general. Astfel, ei disting:

  • Sistemul de reprezentare vizuală, în care sunt implicate organele percepției vizuale ale ochiului. Oamenii care folosesc adesea un astfel de sistem se numesc vizuale. Cu ajutorul acestui sistem, o persoană prelucrează informațiile care vin sub formă de imagini.
  • sistemul reprezentativ auditiv. Principalul organ care este folosit este auzul. Informațiile furnizate sub formă de fișiere de sunet sau vorbire sunt procesate de acest sistem special. Persoanele care percep informațiile mai bine după ureche sunt numiți auditive.
  • Sistemul de reprezentare kinestezic este procesarea fluxului de informații prin perceperea acestuia cu ajutorul canalelor olfactive și tactile.
  • Sistemul digital de reprezentare este folosit împreună cu altele ca mijloc de obținere a informațiilor din exterior. percepția și înțelegerea datelor primite.

Deci, reprezentativitatea - ce este? O simplă selecție dintr-o multitudine sau o procedură integrală în prelucrarea informațiilor? Putem spune cu siguranță că reprezentativitatea determină în mare măsură percepția noastră asupra fluxurilor de date, ajutând la izolarea celor mai semnificative și semnificative de acestea.

Populația- un set de unitati care au caracter de masa, tipicitate, uniformitate calitativa si prezenta variatiei.

Populația statistică este formată din obiecte existente material (Angajați, întreprinderi, țări, regiuni), este un obiect.

Unitatea de populație- fiecare unitate specifică a populaţiei statistice.

Una și aceeași populație statistică poate fi omogenă într-o trăsătură și eterogenă în alta.

Uniformitate calitativă- asemănarea tuturor unităților populației pentru orice caracteristică și neasemănarea pentru toate celelalte.

Într-o populație statistică, diferențele dintre o unitate a populației și alta sunt de cele mai multe ori de natură cantitativă. Modificările cantitative ale valorilor atributului diferitelor unități ale populației se numesc variație.

Variație caracteristică- modificarea cantitativă a unui semn (pentru un semn cantitativ) în timpul trecerii de la o unitate a populației la alta.

semn- aceasta este o proprietate, caracteristică sau altă trăsătură a unităților, obiectelor și fenomenelor care pot fi observate sau măsurate. Semnele sunt împărțite în cantitative și calitative. Diversitatea și variabilitatea valorii unei caracteristici în unități individuale ale populației se numesc variație.

Caracteristicile atributive (calitative) nu sunt cuantificabile (compunerea populației pe sex). Caracteristicile cantitative au o expresie numerică (compunerea populației pe vârstă).

Index- aceasta este o caracteristică cantitativă și calitativă generalizantă a oricărei proprietăți a unităților sau agregatelor în scopul scopului în condiții specifice de timp și loc.

Tabloul de punctaj este un set de indicatori care reflectă cuprinzător fenomenul studiat.

De exemplu, luați în considerare salariul:
  • Semn - salarii
  • Populația statistică - toți angajații
  • Unitatea populației este fiecare muncitor
  • Omogenitate calitativă - salariu acumulat
  • Variație caracteristică - o serie de numere

Populația generală și eșantionul din ea

Baza este un set de date obținute ca urmare a măsurării uneia sau mai multor caracteristici. Setul de obiecte observat efectiv, reprezentat statistic printr-o serie de observații ale unei variabile aleatorii, este prelevarea de probe, și existentul ipotetic (gândit) - populația generală. Populația generală poate fi finită (număr de observații N = const) sau infinit ( N = ∞), iar un eșantion din populația generală este întotdeauna rezultatul unui număr limitat de observații. Numărul de observații care alcătuiesc un eșantion se numește marime de mostra. Dacă dimensiunea eșantionului este suficient de mare n→∞) se ia în considerare eșantionul mare, altfel se numește probă volum limitat. Se ia în considerare eșantionul mic, dacă, la măsurarea unei variabile aleatoare unidimensionale, dimensiunea eșantionului nu depășește 30 ( n<= 30 ), iar când se măsoară simultan mai multe ( k) caracteristici într-o relație spațială multidimensională n la k mai puțin decât 10 (n/k< 10) . Formele eșantionului serie de variații dacă membrii săi sunt statisticile comenzilor, adică valorile eșantionului ale variabilei aleatoare X sunt sortate în ordine crescătoare (clasate), valorile atributului sunt numite Opțiuni.

Exemplu. Aproape același set de obiecte selectat aleatoriu - băncile comerciale ale unui district administrativ al Moscovei, poate fi considerat ca un eșantion din populația generală a tuturor băncilor comerciale din acest district și ca un eșantion din populația generală a tuturor băncilor comerciale din Moscova , precum si un esantion de banci comerciale din tara si etc.

Metode de bază de eșantionare

De fiabilitatea concluziilor statistice și interpretarea semnificativă a rezultatelor depinde reprezentativitate mostre, adică completitudinea și adecvarea reprezentării proprietăților populației generale, în raport cu care acest eșantion poate fi considerat reprezentativ. Studiul proprietăţilor statistice ale populaţiei poate fi organizat în două moduri: utilizând continuuși discontinuu. Observație continuă include examinarea tuturor unitati studiat agregate, A observație necontinuă (selectivă).- doar părți din ea.

Există cinci moduri principale de organizare a eșantionării:

1. selecție aleatorie simplă, în care obiectele sunt extrase aleatoriu din populația generală de obiecte (de exemplu, folosind un tabel sau un generator de numere aleatorii), iar fiecare dintre eșantioanele posibile are o probabilitate egală. Se numesc astfel de mostre de fapt aleatoriu;

2. selecție simplă printr-o procedură obișnuită se realizează folosind o componentă mecanică (de exemplu, datele, zilele săptămânii, numerele apartamentelor, literele alfabetului etc.) iar eșantioanele obținute în acest fel se numesc mecanic;

3. stratificat selecţia constă în faptul că populaţia generală de volum este subdivizată în submulţimi sau straturi (straturi) de volum astfel încât . Straturile sunt obiecte omogene din punct de vedere al caracteristicilor statistice (de exemplu, populația este împărțită în straturi pe grupe de vârstă sau clasă socială; întreprinderi pe industrie). În acest caz, eșantioanele sunt numite stratificat(in caz contrar, stratificat, tipic, zonat);

4. metode serial selecția sunt folosite pentru a forma serial sau mostre imbricate. Sunt convenabile dacă este necesară examinarea unui „bloc” sau a unei serii de obiecte deodată (de exemplu, un transport de mărfuri, produse dintr-o anumită serie sau populația din diviziunea administrativă teritorială a țării). Selectarea serii poate fi efectuată în mod aleatoriu sau mecanic. În același timp, se efectuează o cercetare continuă a unui anumit lot de mărfuri sau a unei întregi unități teritoriale (o clădire de locuit sau un sfert);

5. combinate selecția (în trepte) poate combina mai multe metode de selecție simultan (de exemplu, stratificată și aleatorie sau aleatorie și mecanică); se numeste un astfel de esantion combinate.

Tipuri de selecție

De minte există selecție individuală, de grup și combinată. La selecție individuală Unitățile individuale ale populației generale sunt selectate în setul de eșantion, cu selecția grupului sunt grupuri (serii) de unități calitativ omogene și selecție combinată implică o combinație între primul și al doilea tip.

De metodă selectie distinge repetate și nerepetitive probă.

irepetabil numită selecție, în care unitatea care a intrat în eșantion nu revine la populația inițială și nu participă la selecția ulterioară; în timp ce numărul de unităţi ale populaţiei generale N redus în timpul procesului de selecție. La repetate selecţie prinsîn eșantion, unitatea după înregistrare este returnată populației generale și, astfel, își păstrează șanse egale, alături de alte unități, de a fi utilizată în continuarea procedurii de selecție; în timp ce numărul de unităţi ale populaţiei generale N rămâne neschimbată (metoda este rar folosită în studiile socio-economice). Cu toate acestea, cu un mare N (N → ∞) formule pentru nerepetat selecția sunt apropiate de cele pentru repetate selecția și acestea din urmă sunt folosite aproape mai des ( N = const).

Principalele caracteristici ale parametrilor populației generale și eșantionului

La baza concluziilor statistice ale studiului se află distribuția unei variabile aleatoare, în timp ce valorile observate (x 1, x 2, ..., x n) se numesc realizări ale variabilei aleatoare X(n este dimensiunea eșantionului). Distribuția unei variabile aleatoare în populația generală este teoretică, de natură ideală, iar analogul eșantionului este empiric distributie. Unele distribuții teoretice sunt date analitic, i.e. lor Opțiuni determinați valoarea funcției de distribuție în fiecare punct din spațiul valorilor posibile ale variabilei aleatoare. Pentru un eșantion, este dificil, și uneori imposibil, să se determine funcția de distribuție, prin urmare Opțiuni sunt estimate din date empirice și apoi sunt substituite într-o expresie analitică care descrie distribuția teoretică. În acest caz, ipoteza (sau ipoteză) despre tipul de distribuție poate fi atât corectă statistic, cât și eronată. Dar, în orice caz, distribuția empirică reconstruită din eșantion o caracterizează doar aproximativ pe cea adevărată. Cei mai importanți parametri de distribuție sunt valorea estimatași dispersie.

Prin însăși natura lor, distribuțiile sunt continuuși discret. Cea mai cunoscută distribuție continuă este normal. Analogi selectivi ai parametrilor și pentru ei sunt: ​​valoarea medie și varianța empirică. Dintre cele discrete în studiile socio-economice, cele mai frecvent utilizate alternativă (dihotomică) distributie. Parametrul de așteptare al acestei distribuții exprimă valoarea relativă (sau acțiune) unități ale populației care au caracteristica studiată (se indică prin litera ); proporţia populaţiei care nu are această caracteristică se notează cu literă q (q = 1 - p). Varianta distribuției alternative are și un analog empiric.

În funcție de tipul de distribuție și de metoda de selectare a unităților de populație, caracteristicile parametrilor de distribuție se calculează diferit. Principalele distribuții teoretice și empirice sunt date în tabel. 9.1.

Cota de probă k n este raportul dintre numărul de unități ale populației eșantionului și numărul de unități ale populației generale:

k n = n/N.

Cotă de probă w este raportul dintre unitățile care au trăsătura în studiu X la dimensiunea eșantionului n:

w = n n / n.

Exemplu.Într-un lot de mărfuri ce conține 1000 de unități, cu o probă de 5%. fracția de probă k nîn valoare absolută este de 50 de unități. (n = N*0,05); dacă în această probă se găsesc 2 produse defecte, atunci fracția de probă w va fi 0,04 (w = 2/50 = 0,04 sau 4%).

Deoarece populația eșantion este diferită de populația generală, există erori de eșantionare.

Tabelul 9.1 Principalii parametri ai populației generale și eșantionului

Erori de eșantionare

Cu orice (solide și selective) pot apărea erori de două tipuri: înregistrare și reprezentativitate. Greșeli înregistrare poate avea Aleatoriuși sistematic caracter. Aleatoriu erorile sunt alcătuite din multe cauze diferite de necontrolat, sunt de natură neintenționată și, de obicei, se echilibrează între ele în combinație (de exemplu, modificări ale citirilor instrumentului din cauza fluctuațiilor de temperatură din cameră).

Sistematic erorile sunt părtinitoare, deoarece încalcă regulile de selectare a obiectelor din eșantion (de exemplu, abateri ale măsurătorilor la modificarea setărilor dispozitivului de măsurare).

Exemplu. Pentru a evalua statutul social al populației din oraș, se preconizează examinarea a 25% dintre familii. Dacă, totuși, selecția fiecărui al patrulea apartament se bazează pe numărul său, atunci există pericolul de a selecta toate apartamentele de un singur tip (de exemplu, apartamente cu o cameră), ceea ce va introduce o eroare sistematică și va distorsiona rezultatele; alegerea numărului apartamentului după lot este mai de preferat, deoarece eroarea va fi aleatorie.

Erori de reprezentativitate inerente doar observarii selective, ele nu pot fi evitate si apar ca urmare a faptului ca proba nu o reproduce integral pe cea generala. Valorile indicatorilor obținuți din eșantion diferă de indicatorii acelorași valori în populația generală (sau obținuți în timpul observației continue).

Eroare de eșantionare este diferența dintre valoarea parametrului în populația generală și valoarea eșantionului acestuia. Pentru valoarea medie a unui atribut cantitativ, aceasta este egală cu: , iar pentru cota (atribut alternativ) - .

Erorile de eșantionare sunt inerente numai în observațiile eșantionului. Cu cât aceste erori sunt mai mari, cu atât distribuția empirică diferă de cea teoretică. Parametrii distribuției empirice și sunt variabile aleatoare, prin urmare, erorile de eșantionare sunt, de asemenea, variabile aleatoare, pot lua valori diferite pentru diferite eșantioane și, prin urmare, este obișnuit să se calculeze eroare medie.

Eroare medie de eșantionare este o valoare care exprimă abaterea standard a mediei eșantionului de la așteptările matematice. Această valoare, supusă principiului selecției aleatoare, depinde în primul rând de mărimea eșantionului și de gradul de variație al trăsăturii: cu cât variația trăsăturii este mai mare și mai mică (deci, valoarea lui ), cu atât valoarea lui este mai mică. eroarea medie de eșantionare . Raportul dintre variațiile populației generale și eșantionului este exprimat prin formula:

acestea. pentru suficient de mare, putem presupune că . Eroarea medie de eșantionare arată posibilele abateri ale parametrului populației eșantionului față de parametrul populației generale. În tabel. 9.2 prezintă expresii pentru calcularea erorii medii de eșantionare pentru diferite metode de organizare a observației.

Tabelul 9.2 Eroarea medie (m) a mediei și proporția eșantionului pentru diferite tipuri de eșantion

Unde este media variațiilor eșantionului intragrup pentru o caracteristică continuă;

Media dispersiunilor intragrup ale cotei;

— numărul de serii selectate; — numărul total de serii;

,

unde este media seriei a-lea;

- media generală pe întregul eșantion pentru o caracteristică continuă;

,

unde este proporția trăsăturii din seria a III-a;

— ponderea totală a trăsăturii pe întregul eșantion.

Cu toate acestea, mărimea erorii medii poate fi apreciată doar cu o anumită probabilitate Р (Р ≤ 1). Lyapunov A.M. a demonstrat că distribuția mediilor eșantionului, și deci abaterile acestora de la media generală, cu un număr suficient de mare, respectă aproximativ legea distribuției normale, cu condiția ca populația generală să aibă o medie finită și o varianță limitată.

Matematic, această afirmație pentru medie este exprimată astfel:

iar pentru fracție, expresia (1) va lua forma:

Unde - există eroare marginală de eșantionare, care este un multiplu al erorii medii de eșantionare , iar factorul de multiplicitate este criteriul lui Student („factor de încredere”), propus de W.S. Gosset (pseudonim „Student”); valorile pentru diferite dimensiuni ale eșantionului sunt stocate într-un tabel special.

Valorile funcției Ф(t) pentru unele valori ale lui t sunt:

Prin urmare, expresia (3) poate fi citită astfel: cu probabilitate P = 0,683 (68,3%) se poate susține că diferența dintre eșantion și media generală nu va depăși o valoare a erorii medii m(t=1), cu probabilitate P = 0,954 (95,4%)— că nu depășește valoarea a două erori medii m (t = 2), cu probabilitate P = 0,997 (99,7%)- nu va depăși trei valori m (t = 3) . Astfel, determină probabilitatea ca această diferență să depășească de trei ori valoarea erorii medii nivelul de eroareși nu este mai mult decât 0,3% .

În tabel. Sunt date 9.3 formule de calcul al erorii marginale de eșantionare.

Tabelul 9.3 Eroarea marginală de eșantionare (D) pentru medie și proporție (p) pentru diferite tipuri de eșantionare

Extinderea rezultatelor eșantionului la populație

Scopul final al observării eșantionului este de a caracteriza populația generală. Pentru dimensiunile mici ale eșantionului, estimările empirice ale parametrilor ( și ) se pot abate semnificativ de la valorile lor adevărate ( și ). Prin urmare, devine necesar să se stabilească limitele în care se află valorile adevărate ( și ) pentru valorile eșantion ale parametrilor ( și ).

Interval de încredere al unui parametru θ al populației generale se numește un interval aleator de valori ale acestui parametru, care cu o probabilitate apropiată de 1 ( fiabilitate) conține valoarea adevărată a acestui parametru.

eroare marginală mostre Δ vă permite să determinați valorile limită ale caracteristicilor populației generale și ale acestora intervale de încredere, care sunt egale cu:

Concluzie interval de încredere obtinut prin scadere eroare marginală din eșantion înseamnă (cota), iar cea de sus prin adăugarea acesteia.

Interval de încredere pentru medie, folosește eroarea marginală de eșantionare și pentru un anumit nivel de încredere este determinat de formula:

Aceasta înseamnă că cu o probabilitate dată R, care se numește nivelul de încredere și este determinat în mod unic de valoare t, se poate argumenta că adevărata valoare a mediei se află în intervalul de la , iar valoarea reală a acțiunii este în intervalul de la

La calcularea intervalului de încredere pentru cele trei niveluri de încredere standard P=95%, P=99% și P=99,9% valoarea este selectată de . Aplicații în funcție de numărul de grade de libertate. Dacă dimensiunea eșantionului este suficient de mare, atunci valorile corespunzătoare acestor probabilități t sunt egale: 1,96, 2,58 și 3,29 . Astfel, eroarea marginală de eșantionare ne permite să determinăm valorile marginale ale caracteristicilor populației generale și intervalele de încredere ale acestora:

Distribuția rezultatelor observației selective către populația generală în studiile socio-economice are propriile sale caracteristici, deoarece necesită caracterul complet al reprezentativității tuturor tipurilor și grupurilor sale. Baza pentru posibilitatea unei astfel de distribuții este calculul eroare relativă:

Unde Δ % - eroare relativă marginală de eșantionare; , .

Există două metode principale pentru extinderea unei observații prin eșantion la populație: conversie directă și metoda coeficienților.

Esență conversie directă este de a înmulți media eșantionului!!\overline(x) cu dimensiunea populației.

Exemplu. Să fie estimat numărul mediu de copii mici din oraș printr-o metodă de eșantionare și valoarea unei persoane. Dacă în oraș sunt 1000 de familii tinere, atunci numărul de locuri necesare în creșa municipală se obține prin înmulțirea acestei medii cu mărimea populației generale N = 1000, adică. va fi de 1200 de locuri.

Metoda coeficienților se recomanda folosirea in cazul in care se efectueaza observatia selectiva pentru a clarifica datele de observatie continua.

În acest sens, se utilizează formula:

unde toate variabilele sunt mărimea populației:

Mărimea eșantionului necesară

Tabelul 9.4 Mărimea eșantionului necesară (n) pentru diferite tipuri de organizații de eșantionare

Atunci când planificați o anchetă de eșantionare cu o valoare predeterminată a erorii admisibile de eșantionare, este necesar să se estimeze corect valoarea necesară marime de mostra. Această sumă poate fi determinată pe baza erorii admisibile în timpul observației selective pe baza unei probabilități date care garantează un nivel de eroare acceptabil (ținând cont de modul în care este organizată observația). Formulele pentru determinarea dimensiunii necesare a eșantionului n pot fi obținute cu ușurință direct din formulele pentru eroarea marginală de eșantionare. Deci, din expresia pentru eroarea marginală:

dimensiunea eșantionului este direct determinată n:

Această formulă arată că odată cu descreșterea erorii marginale de eșantionare Δ crește semnificativ dimensiunea eșantionului necesară, care este proporțională cu varianța și pătratul testului t Student.

Pentru o metodă specifică de organizare a observației, dimensiunea necesară a eșantionului este calculată conform formulelor date în tabel. 9.4.

Exemple practice de calcul

Exemplul 1. Calculul valorii medii și al intervalului de încredere pentru o caracteristică cantitativă continuă.

Pentru a evalua viteza de decontare cu creditorii din bancă, a fost efectuat un eșantion aleatoriu de 10 documente de plată. Valorile lor s-au dovedit a fi egale (în zile): 10; 3; cincisprezece; cincisprezece; 22; 7; opt; unu; 19; douăzeci.

Obligatoriu cu probabilitate P = 0,954 determina eroarea marginală Δ media eșantionului și limitele de încredere ale timpului mediu de calcul.

Soluţie. Valoarea medie este calculată prin formula din tabel. 9.1 pentru populația eșantion

Dispersia este calculată conform formulei din tabel. 9.1.

Eroarea pătratică medie a zilei.

Eroarea mediei se calculează cu formula:

acestea. valoarea medie este x ± m = 12,0 ± 2,3 zile.

Fiabilitatea mediei a fost

Eroarea limită este calculată prin formula din tabel. 9.3 pentru reselecție, deoarece dimensiunea populației este necunoscută, și pt P = 0,954 nivel de încredere.

Astfel, valoarea medie este `x ± D = `x ± 2m = 12,0 ± 4,6, i.e. adevărata sa valoare se află în intervalul de la 7,4 la 16,6 zile.

Utilizarea tabelului Studentului. Aplicația ne permite să concluzionăm că pentru n = 10 - 1 = 9 grade de libertate valoarea obținută este de încredere cu un nivel de semnificație a £ 0,001, i.e. valoarea medie rezultată este semnificativ diferită de 0.

Exemplul 2. Estimarea probabilității (cota generală) r.

Cu o metodă de eșantionare mecanică de anchetă a statutului social a 1000 de familii, a fost relevat că proporția familiilor cu venituri mici a fost w = 0,3 (30%)(eșantionul a fost 2% , adică n/N = 0,02). Necesar cu nivel de încredere p = 0,997 definiți un indicator R familii cu venituri mici din întreaga regiune.

Soluţie. Conform valorilor funcţiei prezentate Ф(t) găsiți pentru un anumit nivel de încredere P = 0,997 sens t=3(vezi formula 3). Eroare de cotă marginală w determinați prin formula din tabel. 9.3 pentru eșantionarea nerepetată (prelevarea mecanică este întotdeauna nerepetată):

Limitarea erorii relative de eșantionare în % va fi:

Probabilitatea (ponderea generală) a familiilor cu venituri mici din regiune va fi p=w±Δw, iar limitele de încredere p sunt calculate pe baza inegalității duble:

w — Δw ≤ p ≤ w — Δw, adică adevărata valoare a lui p se află în:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Astfel, cu o probabilitate de 0,997, se poate susține că proporția familiilor cu venituri mici în rândul tuturor familiilor din regiune variază de la 28,6% la 31,4%.

Exemplul 3 Calculul valorii medii și al intervalului de încredere pentru o caracteristică discretă specificată de o serie de intervale.

În tabel. 9.5. se stabileşte repartizarea aplicaţiilor pentru producerea comenzilor în funcţie de momentul implementării lor de către întreprindere.

Tabelul 9.5 Distribuția observațiilor în funcție de momentul apariției

Soluţie. Timpul mediu de finalizare a comenzii este calculat prin formula:

Timpul mediu va fi:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23,1 luni

Primim același răspuns dacă folosim datele de pe p i din penultima coloană a tabelului. 9.5 folosind formula:

Rețineți că mijlocul intervalului pentru ultima gradație se găsește prin completarea artificială a acestuia cu lățimea intervalului gradației anterioare egală cu 60 - 36 = 24 luni.

Dispersia se calculează prin formula

Unde x i- mijlocul seriei de intervale.

Prin urmare!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) iar eroarea standard este .

Eroarea mediei este calculată prin formula pentru luni, adică media este!!\overline(x) ± m = 23,1 ± 13,4.

Eroarea limită este calculată prin formula din tabel. 9,3 pentru reselecție deoarece dimensiunea populației este necunoscută, pentru un nivel de încredere de 0,954:

Deci media este:

acestea. adevărata sa valoare se află în intervalul de la 0 la 50 de luni.

Exemplul 4 Pentru a determina viteza decontărilor cu creditorii ai N = 500 de întreprinderi ale corporației într-o bancă comercială, este necesar să se efectueze un studiu selectiv folosind metoda selecției aleatorii nerepetitive. Determinați dimensiunea eșantionului necesar n astfel încât, cu o probabilitate P = 0,954, eroarea mediei eșantionului să nu depășească 3 zile, dacă estimările testului au arătat că abaterea standard s a fost de 10 zile.

Soluţie. Pentru a determina numărul de studii necesare n, folosim formula pentru selecția nerepetitivă din tabel. 9.4:

În ea, valoarea lui t este determinată de la nivelul de încredere Р = 0,954. Este egal cu 2. Valoarea pătrată medie s = 10, dimensiunea populației N = 500 și eroarea marginală a mediei Δ x = 3. Înlocuind aceste valori în formulă, obținem:

acestea. este suficient să se facă un eșantion de 41 de întreprinderi pentru a estima parametrul necesar - viteza decontărilor cu creditorii.