Eșantion reprezentativ. Cerințe pentru mostre

Scopul final al studierii unei populații eșantion este întotdeauna obținerea de informații despre populație. Pentru a face acest lucru, un studiu eșantion trebuie să îndeplinească anumite condiții. Una dintre principalele condiții reprezentativitatea (reprezentativitatea) eșantionului. După cum sa discutat mai devreme, se face o distincție între reprezentativitatea calitativă și cea cantitativă.

Aleatoritatea, care garantează reprezentativitatea calitativă (structurală) a studiilor statistice, se realizează prin îndeplinirea unui număr de condiții pentru formarea grupurilor de eșantion (seturi):

1. Fiecare membru al populației trebuie să aibă o probabilitate egală de a fi inclus în eșantion.

2. Selecția unităților de observație din populația generală trebuie efectuată indiferent de trăsătura studiată. Dacă selecția este efectuată în mod intenționat, atunci este, de asemenea, necesar să se respecte condițiile pentru independența distribuției trăsăturii studiate.

3. Selecția trebuie efectuată din grupuri omogene.

Respectarea condițiilor care garantează proximitatea maximă a eșantionului și a populației generale este asigurată prin metode speciale de selecție. În funcție de metoda de formare, se disting următoarele eșantioane:

1. Eșantioane care nu necesită împărțirea populației generale în părți (de fapt, eșantionare aleatorie repetată sau nerepetată).

2. Eșantioane care necesită împărțirea populației generale în părți (eșantioane mecanice, tipice sau tipologice, probe de cohortă, eșantioane conjugate perechi).

De fapt, un eșantion aleatoriu este format prin selecție aleatorie - la întâmplare. Selecția aleatorie se bazează pe amestecare. De exemplu: alegerea unei mingi într-un loto sportiv după amestecarea tuturor bilelor, alegerea numerelor câștigătoare la loterie, alegerea aleatorie a cardurilor de pacienți pentru cercetare etc. Uneori se folosesc numere aleatoare, obținute din tabele de numere aleatoare sau folosind generatoare de numere aleatoare. Conform acestor numere, dintr-o matrice prenumerată a populației generale, sunt selectate unități de observație cu numere corespunzătoare numerelor aleatorii care au căzut.

La compilarea unui eșantion aleatoriu, după ce obiectul este selectat și toate datele necesare despre acesta sunt înregistrate, puteți face două lucruri: obiectul poate fi returnat sau nu poate fi returnat populației generale. Conform cu aceasta eșantionul se numește repetat(obiectul este restituit populaţiei) sau nerepetitive(obiectul nu este restituit populației). Deoarece în majoritatea studiilor statistice nu există practic nicio diferență între probele repetate și cele nerepetate, este acceptată a priori condiția ca eșantionul să fie repetat.

Estimarea dimensiunii eșantionului necesar

Pentru ca eșantionul să fie reprezentativ cantitativ pentru populația generală, este necesar să se estimeze mai întâi cantitatea de date care urmează să fie incluse în eșantion.

Cu o dimensiune necunoscută a populației generale cantitatea de reeșantionare care garantează rezultate reprezentative dacă rezultatul este reflectat în indicator ca valoare relativă (cota), determinată de formula:

unde p este valoarea indicatorului trăsăturii studiate, în %; q = (100- p) ;

t este un coeficient de încredere care arată care este probabilitatea ca mărimea indicatorului să nu depășească limitele erorii marginale (de obicei se ia t = 2, care oferă o probabilitate de 95% pentru o prognoză fără erori);

 - eroarea marginală a indicatorului.

De exemplu: unul dintre indicatorii care caracterizează starea de sănătate a lucrătorilor din întreprinderile industriale este procentul lucrătorilor care nu au fost bolnavi pe parcursul anului. Să presupunem că pentru sectorul industrial din care aparține întreprinderea chestionată, acest indicator este de 25%. Eroarea marginală care poate fi permisă astfel încât răspândirea valorilor indicatorului să nu depășească limite rezonabile este de 5%. În acest caz, indicatorul poate lua valori de 25% ± 5%, adică de la 20% la 30%. Presupunând t = 2, obținem

In acest caz, dacă indicatorul este valoarea medie, atunci numărul de observații poate fi determinat prin formula:

unde σ este abaterea standard, care poate fi obținută din studii anterioare sau pe baza unor studii experimentale (pilot).

Cu selecție repetitivăși în condiţia unei populaţii generale cunoscute pentru a determina mărimea eșantionului aleatoriu necesară în cazul utilizării valori relative (acțiuni) se aplica formula:

pentru valori medii se foloseste formula:

unde N este dimensiunea populației generale.

Pe baza condițiilor din exemplul de mai sus și presupunând dimensiunea populației generale N=500 muncitori, obținem:

Este ușor de observat că dimensiunea eșantionului necesară pentru eșantionarea nerepetitivă este mai mică decât pentru eșantionarea repetată (respectiv, 188 și 300 de lucrători).

În general, numărul de observații necesare pentru a obține date reprezentative variază invers cu pătratul erorii permise.

Prelevare mecanică de probe- eșantionarea, când unitățile de observație sunt selectate mecanic din populația chestionată. De exemplu: selectarea fiecărui cincilea sau al zecelea lucrător conform fișelor departamentului de personal al întreprinderii sau conform fișelor de ambulatoriu ale policlinicii unității medicale.

tipic, tipologic sau zonat eşantionarea presupune împărţirea populaţiei generale într-un număr de grupuri omogene calitativ. De exemplu: atunci când se studiază incidența studenților universitari pentru o examinare aprofundată în fiecare curs, sunt selectate grupuri de studenți care sunt tipice în componența lor. Adesea, această metodă de selecție este combinată cu alte metode. De exemplu: teritoriul orașului este împărțit în zone tipice în funcție de gradul de poluare, în aceste zone se formează grupuri de observație prin selecție aleatorie.

selecția cohortei se referă la selecția vizată. Prin această metodă, indivizii sunt selectați din populația generală (distribuția în subgrupe este nealeatorie), uniți prin momentul apariției oricărui semn sau efectul studiat care joacă un rol semnificativ în studiu (anul nașterii, debutul). a bolii, luarea medicamentului etc.).

Studiu caz-control(SC) este un tip de studiu epidemiologic în care distribuția unui factor de risc este comparată între un grup de pacienți cu o boală și un grup de control. Studiul (SC) se referă la retrospectiv, întrucât cercetătorul, împărțind pacienții în grupuri în funcție de faptul că au sau nu o boală, află de la aceștia informații din trecut.

Ar trebui să ne oprim separat asupra utilizării metodei de eșantionare în statistica sanitară atunci când studiem morbiditatea generală a populației. Premisele teoretice ale metodei de eșantionare au fost testate în cadrul unor studii speciale. Deci, V.S. Bykhovsky și colab. în 1928 au realizat procesarea paralelă a 132,8 mii carduri cu date despre boli printr-o metodă continuă și prin metoda selecției mecanice a fiecărui al cincilea card. O analiză a rezultatelor acestei prelucrări a arătat o reprezentativitate ridicată a datelor dintr-un studiu selectiv al morbidității. Cu toate acestea, până în prezent, nu există abordări metodologice unificate pentru efectuarea de studii sanitaro-statistice selective în practică largă.

Populația- un set de unitati care au caracter de masa, tipicitate, uniformitate calitativa si prezenta variatiei.

Populația statistică este formată din obiecte existente material (Angajați, întreprinderi, țări, regiuni), este un obiect.

Unitatea de populație- fiecare unitate specifică a populaţiei statistice.

Una și aceeași populație statistică poate fi omogenă într-o trăsătură și eterogenă în alta.

Uniformitate calitativă- asemănarea tuturor unităților populației pentru orice caracteristică și neasemănarea pentru toate celelalte.

Într-o populație statistică, diferențele dintre o unitate a populației și alta sunt mai adesea de natură cantitativă. Modificările cantitative ale valorilor atributului diferitelor unități ale populației se numesc variație.

Variație caracteristică- modificarea cantitativă a unui semn (pentru un semn cantitativ) în timpul trecerii de la o unitate a populației la alta.

semn- aceasta este o proprietate, caracteristică sau altă trăsătură a unităților, obiectelor și fenomenelor care pot fi observate sau măsurate. Semnele sunt împărțite în cantitative și calitative. Diversitatea și variabilitatea valorii unei caracteristici în unități individuale ale populației se numesc variație.

Caracteristicile atributive (calitative) nu sunt cuantificabile (compunerea populației pe sex). Caracteristicile cantitative au o expresie numerică (compunerea populației pe vârstă).

Index- aceasta este o caracteristică generalizantă cantitativă și calitativă a oricărei proprietăți a unităților sau agregatelor în acest scop în condiții specifice de timp și loc.

Tabloul de punctaj este un set de indicatori care reflectă cuprinzător fenomenul studiat.

De exemplu, luați în considerare salariul:
  • Semn - salarii
  • Populația statistică - toți angajații
  • Unitatea populației este fiecare muncitor
  • Omogenitate calitativă - salariu acumulat
  • Variație caracteristică - o serie de numere

Populația generală și eșantionul din ea

Baza este un set de date obținute ca urmare a măsurării uneia sau mai multor caracteristici. Setul de obiecte observat efectiv, reprezentat statistic printr-o serie de observații ale unei variabile aleatorii, este prelevarea de probe, și existentul ipotetic (gândit) - populația generală. Populația generală poate fi finită (număr de observații N = const) sau infinit ( N = ∞), iar un eșantion din populația generală este întotdeauna rezultatul unui număr limitat de observații. Se numește numărul de observații care alcătuiesc un eșantion marime de mostra. Dacă dimensiunea eșantionului este suficient de mare n→∞) se ia în considerare eșantionul mare, altfel se numește probă volum limitat. Se ia în considerare eșantionul mic, dacă, la măsurarea unei variabile aleatoare unidimensionale, dimensiunea eșantionului nu depășește 30 ( n<= 30 ), iar când se măsoară simultan mai multe ( k) caracteristici într-o relație spațială multidimensională n la k mai puțin decât 10 (n/k< 10) . Formele eșantionului serie de variații dacă membrii săi sunt statisticile comenzilor, adică valorile eșantionului ale variabilei aleatoare X sunt sortate în ordine crescătoare (clasate), valorile atributului sunt numite Opțiuni.

Exemplu. Aproape același set de obiecte selectat aleatoriu - băncile comerciale ale unui district administrativ al Moscovei, poate fi considerat ca un eșantion din populația generală a tuturor băncilor comerciale din acest district și ca un eșantion din populația generală a tuturor băncilor comerciale din Moscova , precum si un esantion de banci comerciale din tara si etc.

Metode de bază de eșantionare

De fiabilitatea concluziilor statistice și interpretarea semnificativă a rezultatelor depinde reprezentativitate mostre, adică completitudinea și adecvarea prezentării proprietăților populației generale, în raport cu care acest eșantion poate fi considerat reprezentativ. Studiul proprietăţilor statistice ale populaţiei poate fi organizat în două moduri: utilizând continuuși discontinuu. Observație continuă include examinarea tuturor unitati studiat agregate, A observație necontinuă (selectivă).- doar părți din ea.

Există cinci moduri principale de organizare a eșantionării:

1. selecție aleatorie simplă, în care obiectele sunt selectate aleatoriu din populația generală de obiecte (de exemplu, folosind un tabel sau un generator de numere aleatorii), iar fiecare dintre eșantioanele posibile are o probabilitate egală. Se numesc astfel de mostre de fapt aleatoriu;

2. selecție simplă printr-o procedură obișnuită se realizează folosind o componentă mecanică (de exemplu, datele, zilele săptămânii, numerele apartamentelor, literele alfabetului etc.) iar eșantioanele obținute în acest fel se numesc mecanic;

3. stratificat selecţia constă în faptul că populaţia generală de volum este subdivizată în submulţimi sau straturi (straturi) de volum astfel încât . Straturile sunt obiecte omogene din punct de vedere al caracteristicilor statistice (de exemplu, populația este împărțită în straturi pe grupe de vârstă sau clasă socială; întreprinderi pe industrie). În acest caz, eșantioanele sunt numite stratificat(in caz contrar, stratificat, tipic, zonat);

4. metode serial selecția sunt folosite pentru a forma serial sau mostre imbricate. Sunt convenabile dacă este necesar să se examineze simultan un „bloc” sau o serie de obiecte (de exemplu, un transport de mărfuri, produse dintr-o anumită serie sau o populație din diviziunea teritorial-administrativă a țării). Selectarea serii poate fi efectuată în mod aleatoriu sau mecanic. În același timp, se efectuează o cercetare continuă a unui anumit lot de mărfuri sau a unei întregi unități teritoriale (o clădire de locuit sau un sfert);

5. combinate selecția (în trepte) poate combina mai multe metode de selecție simultan (de exemplu, stratificată și aleatorie sau aleatorie și mecanică); se numeste un astfel de esantion combinate.

Tipuri de selecție

De minte există selecție individuală, de grup și combinată. La selecție individuală unități individuale ale populației generale sunt selectate în setul de eșantion, cu selecția grupului sunt grupuri (serii) de unități calitativ omogene și selecție combinată implică o combinație între primul și al doilea tip.

De metodă selectie distinge repetate și nerepetitive probă.

irepetabil numită selecție, în care unitatea care a intrat în eșantion nu revine la populația inițială și nu participă la selecția ulterioară; în timp ce numărul de unităţi ale populaţiei generale N redus în timpul procesului de selecție. La repetate selecţie prinsîn eșantion, unitatea după înregistrare este returnată populației generale și, astfel, își păstrează o șansă egală, alături de alte unități, de a fi utilizată în continuarea procedurii de selecție; în timp ce numărul de unităţi ale populaţiei generale N rămâne neschimbată (metoda este rar folosită în studiile socio-economice). Cu toate acestea, cu un mare N (N → ∞) formule pentru nerepetat selecția sunt apropiate de cele pentru repetate selecția și acestea din urmă sunt folosite aproape mai des ( N = const).

Principalele caracteristici ale parametrilor populației generale și eșantionului

La baza concluziilor statistice ale studiului se află distribuția unei variabile aleatoare, în timp ce valorile observate (x 1, x 2, ..., x n) se numesc realizări ale variabilei aleatoare X(n este dimensiunea eșantionului). Distribuția unei variabile aleatoare în populația generală este teoretică, de natură ideală, iar analogul eșantionului este empiric distributie. Unele distribuții teoretice sunt date analitic, i.e. lor Opțiuni determinați valoarea funcției de distribuție în fiecare punct din spațiul valorilor posibile ale variabilei aleatoare. Pentru un eșantion, este dificil, și uneori imposibil, să se determine funcția de distribuție, prin urmare Opțiuni sunt estimate din date empirice și apoi sunt substituite într-o expresie analitică care descrie distribuția teoretică. În acest caz, ipoteza (sau ipoteză) despre tipul de distribuție poate fi atât corectă statistic, cât și eronată. Dar, în orice caz, distribuția empirică reconstruită din eșantion o caracterizează doar aproximativ pe cea adevărată. Cei mai importanți parametri de distribuție sunt valorea estimatași dispersie.

Prin însăși natura lor, distribuțiile sunt continuuși discret. Cea mai cunoscută distribuție continuă este normal. Analogi selectivi ai parametrilor și pentru ei sunt: ​​valoarea medie și varianța empirică. Dintre cele discrete în studiile socio-economice, cele mai frecvent utilizate alternativă (dihotomică) distributie. Parametrul de așteptare al acestei distribuții exprimă valoarea relativă (sau acțiune) unități ale populației care au caracteristica studiată (se indică prin litera ); proporţia populaţiei care nu are această caracteristică se notează cu literă q (q = 1 - p). Varianta distribuției alternative are și un analog empiric.

În funcție de tipul de distribuție și de metoda de selectare a unităților de populație, caracteristicile parametrilor de distribuție se calculează diferit. Principalele distribuții teoretice și empirice sunt date în tabel. 9.1.

Cota de probă k n este raportul dintre numărul de unități ale populației eșantionului și numărul de unități ale populației generale:

k n = n/N.

Cotă de probă w este raportul dintre unitățile care au trăsătura în studiu X la dimensiunea eșantionului n:

w = n n / n.

Exemplu.Într-un lot de mărfuri ce conține 1000 de unități, cu o probă de 5%. fracția de probă k nîn valoare absolută este de 50 de unități. (n = N*0,05); dacă în această probă se găsesc 2 produse defecte, atunci fracția de probă w va fi 0,04 (w = 2/50 = 0,04 sau 4%).

Deoarece populația eșantion este diferită de populația generală, există erori de eșantionare.

Tabelul 9.1 Principalii parametri ai populației generale și eșantionului

Erori de eșantionare

Cu orice (solide și selective) pot apărea erori de două tipuri: înregistrare și reprezentativitate. Greșeli înregistrare poate avea Aleatoriuși sistematic caracter. Aleatoriu erorile sunt alcătuite din multe cauze diferite de necontrolat, sunt de natură neintenționată și, de obicei, se echilibrează între ele (de exemplu, modificări ale citirilor instrumentului din cauza fluctuațiilor de temperatură din cameră).

Sistematic erorile sunt părtinitoare, deoarece încalcă regulile de selectare a obiectelor din eșantion (de exemplu, abateri ale măsurătorilor la modificarea setărilor dispozitivului de măsurare).

Exemplu. Pentru a evalua statutul social al populației din oraș, se preconizează examinarea a 25% dintre familii. Dacă, totuși, selecția fiecărui al patrulea apartament se bazează pe numărul său, atunci există pericolul de a selecta toate apartamentele de un singur tip (de exemplu, apartamente cu o cameră), ceea ce va introduce o eroare sistematică și va distorsiona rezultatele; alegerea numărului apartamentului după lot este mai de preferat, deoarece eroarea va fi aleatorie.

Erori de reprezentativitate inerente doar observarii selective, ele nu pot fi evitate si apar ca urmare a faptului ca proba nu o reproduce integral pe cea generala. Valorile indicatorilor obținuți din eșantion diferă de indicatorii acelorași valori în populația generală (sau obținuți în timpul observației continue).

Eroare de eșantionare este diferența dintre valoarea parametrului în populația generală și valoarea eșantionului acestuia. Pentru valoarea medie a unui atribut cantitativ, aceasta este egală cu: , iar pentru cota (atribut alternativ) - .

Erorile de eșantionare sunt inerente numai în observațiile eșantionului. Cu cât aceste erori sunt mai mari, cu atât distribuția empirică diferă de cea teoretică. Parametrii distribuției empirice și sunt variabile aleatoare, prin urmare, erorile de eșantionare sunt, de asemenea, variabile aleatoare, pot lua valori diferite pentru diferite eșantioane și, prin urmare, este obișnuit să se calculeze eroare medie.

Eroare medie de eșantionare este o valoare care exprimă abaterea standard a mediei eșantionului de la așteptările matematice. Această valoare, supusă principiului selecției aleatorii, depinde în primul rând de mărimea eșantionului și de gradul de variație al trăsăturii: cu cât variația trăsăturii este mai mare și mai mică (deci, valoarea lui ), cu atât valoarea lui este mai mică. eroarea medie de eșantionare . Raportul dintre variațiile populației generale și eșantionului este exprimat prin formula:

acestea. pentru suficient de mare, putem presupune că . Eroarea medie de eșantionare arată posibilele abateri ale parametrului populației eșantionului față de parametrul populației generale. În tabel. 9.2 prezintă expresii pentru calcularea erorii medii de eșantionare pentru diferite metode de organizare a observației.

Tabelul 9.2 Eroarea medie (m) a mediei și proporția eșantionului pentru diferite tipuri de eșantion

Unde este media variațiilor eșantionului intragrup pentru o caracteristică continuă;

Media dispersiunilor intragrup ale cotei;

— numărul de serii selectate; — numărul total de serii;

,

unde este media seriei a-lea;

- media generală pe întregul eșantion pentru o caracteristică continuă;

,

unde este proporția trăsăturii din seria a III-a;

— ponderea totală a trăsăturii pe întregul eșantion.

Cu toate acestea, mărimea erorii medii poate fi apreciată doar cu o anumită probabilitate Р (Р ≤ 1). Lyapunov A.M. a demonstrat că distribuția mediilor eșantionului, și deci abaterile acestora de la media generală, cu un număr suficient de mare, respectă aproximativ legea distribuției normale, cu condiția ca populația generală să aibă o medie finită și varianță limitată.

Matematic, această afirmație pentru medie este exprimată astfel:

iar pentru fracție, expresia (1) va lua forma:

Unde - există eroare marginală de eșantionare, care este un multiplu al erorii medii de eșantionare , iar factorul de multiplicitate este criteriul lui Student („factor de încredere”), propus de W.S. Gosset (pseudonim „Student”); valorile pentru diferite dimensiuni ale eșantionului sunt stocate într-un tabel special.

Valorile funcției Ф(t) pentru unele valori ale lui t sunt:

Prin urmare, expresia (3) poate fi citită astfel: cu probabilitate P = 0,683 (68,3%) se poate susține că diferența dintre eșantion și media generală nu va depăși o valoare a erorii medii m(t=1), cu probabilitate P = 0,954 (95,4%)— că nu depășește valoarea a două erori medii m (t = 2), cu probabilitate P = 0,997 (99,7%)- nu va depăși trei valori m (t = 3) . Astfel, determină probabilitatea ca această diferență să depășească de trei ori valoarea erorii medii nivelul de eroareși nu este mai mult decât 0,3% .

În tabel. Sunt date 9.3 formule de calcul al erorii marginale de eșantionare.

Tabelul 9.3 Eroarea marginală de eșantionare (D) pentru medie și proporție (p) pentru diferite tipuri de eșantionare

Extinderea rezultatelor eșantionului la populație

Scopul final al observării eșantionului este de a caracteriza populația generală. Pentru dimensiunile mici ale eșantionului, estimările empirice ale parametrilor ( și ) se pot abate semnificativ de la valorile lor adevărate ( și ). Prin urmare, devine necesar să se stabilească limitele în care se află adevăratele valori ( și ) pentru valorile eșantion ale parametrilor ( și ).

Interval de încredere al unui parametru θ al populației generale se numește un interval aleator de valori ale acestui parametru, care cu o probabilitate apropiată de 1 ( fiabilitate) conține valoarea adevărată a acestui parametru.

eroare marginală mostre Δ vă permite să determinați valorile limită ale caracteristicilor populației generale și ale acestora intervale de încredere, care sunt egale cu:

Concluzie interval de încredere obtinut prin scadere eroare marginală din eșantion înseamnă (cota), iar cea de sus prin adăugarea acesteia.

Interval de încredere pentru medie, folosește eroarea marginală de eșantionare și pentru un anumit nivel de încredere este determinat de formula:

Aceasta înseamnă că cu o probabilitate dată R, care se numește nivelul de încredere și este determinat în mod unic de valoare t, se poate argumenta că adevărata valoare a mediei se află în intervalul de la , iar valoarea reală a acțiunii este în intervalul de la

La calcularea intervalului de încredere pentru cele trei niveluri de încredere standard P=95%, P=99% și P=99,9% valoarea este selectată de . Aplicații în funcție de numărul de grade de libertate. Dacă dimensiunea eșantionului este suficient de mare, atunci valorile corespunzătoare acestor probabilități t sunt egale: 1,96, 2,58 și 3,29 . Astfel, eroarea marginală de eșantionare ne permite să determinăm valorile marginale ale caracteristicilor populației generale și intervalele de încredere ale acestora:

Distribuția rezultatelor observației selective către populația generală în studiile socio-economice are propriile sale caracteristici, deoarece necesită caracterul complet al reprezentativității tuturor tipurilor și grupurilor sale. Baza pentru posibilitatea unei astfel de distribuții este calculul eroare relativă:

Unde Δ % - eroare relativă marginală de eșantionare; , .

Există două metode principale pentru extinderea unei observații prin eșantion la populație: conversie directă și metoda coeficienților.

Esență conversie directă este de a înmulți media eșantionului!!\overline(x) cu dimensiunea populației.

Exemplu. Să fie estimat numărul mediu de copii mici din oraș printr-o metodă de eșantionare și valoarea unei persoane. Dacă în oraș sunt 1000 de familii tinere, atunci numărul de locuri necesare în creșa municipală se obține prin înmulțirea acestei medii cu mărimea populației generale N = 1000, adică. va fi de 1200 de locuri.

Metoda coeficienților se recomanda folosirea in cazul in care se efectueaza observatia selectiva pentru a clarifica datele de observatie continua.

În acest sens, se utilizează formula:

unde toate variabilele sunt mărimea populației:

Mărimea eșantionului necesară

Tabelul 9.4 Mărimea eșantionului necesară (n) pentru diferite tipuri de organizații de eșantionare

Atunci când se planifica o anchetă de eșantionare cu o valoare predeterminată a erorii de eșantionare admisibile, este necesar să se estimeze corect valoarea necesară marime de mostra. Această sumă poate fi determinată pe baza erorii admisibile în timpul observației selective pe baza unei probabilități date care garantează un nivel de eroare acceptabil (ținând cont de modul în care este organizată observația). Formulele pentru determinarea dimensiunii necesare a eșantionului n pot fi obținute cu ușurință direct din formulele pentru eroarea marginală de eșantionare. Deci, din expresia pentru eroarea marginală:

dimensiunea eșantionului este direct determinată n:

Această formulă arată că odată cu descreșterea erorii marginale de eșantionare Δ crește semnificativ dimensiunea eșantionului necesară, care este proporțională cu varianța și pătratul testului t Student.

Pentru o metodă specifică de organizare a observației, dimensiunea necesară a eșantionului este calculată conform formulelor date în tabel. 9.4.

Exemple practice de calcul

Exemplul 1. Calculul valorii medii și al intervalului de încredere pentru o caracteristică cantitativă continuă.

Pentru a evalua viteza de decontare cu creditorii din bancă, a fost efectuat un eșantion aleatoriu de 10 documente de plată. Valorile lor s-au dovedit a fi egale (în zile): 10; 3; cincisprezece; cincisprezece; 22; 7; opt; unu; 19; douăzeci.

Obligatoriu cu probabilitate P = 0,954 determina eroarea marginală Δ media eșantionului și limitele de încredere ale timpului mediu de calcul.

Soluţie. Valoarea medie este calculată prin formula din tabel. 9.1 pentru populația eșantion

Dispersia este calculată conform formulei din tabel. 9.1.

Eroarea pătratică medie a zilei.

Eroarea mediei se calculează cu formula:

acestea. valoarea medie este x ± m = 12,0 ± 2,3 zile.

Fiabilitatea mediei a fost

Eroarea limită este calculată prin formula din tabel. 9.3 pentru reselecție, deoarece dimensiunea populației este necunoscută, și pt P = 0,954 nivel de încredere.

Astfel, valoarea medie este `x ± D = `x ± 2m = 12,0 ± 4,6, i.e. valoarea sa reală se află în intervalul de la 7,4 la 16,6 zile.

Utilizarea tabelului Studentului. Aplicația ne permite să concluzionăm că pentru n = 10 - 1 = 9 grade de libertate valoarea obținută este de încredere cu un nivel de semnificație a £ 0,001, i.e. valoarea medie rezultată este semnificativ diferită de 0.

Exemplul 2. Estimarea probabilității (cota generală) r.

Cu o metodă de eșantionare mecanică de anchetă a statutului social a 1000 de familii, a fost relevat că proporția familiilor cu venituri mici a fost w = 0,3 (30%)(eșantionul a fost 2% , adică n/N = 0,02). Necesar cu nivel de încredere p = 0,997 definiți un indicator R familii cu venituri mici din întreaga regiune.

Soluţie. Conform valorilor funcţiei prezentate Ф(t) găsiți pentru un anumit nivel de încredere P = 0,997 sens t=3(vezi formula 3). Eroare de cotă marginală w determinați prin formula din tabel. 9.3 pentru eșantionarea nerepetată (prelevarea mecanică este întotdeauna nerepetată):

Limitarea erorii relative de eșantionare în % va fi:

Probabilitatea (ponderea generală) a familiilor cu venituri mici din regiune va fi p=w±Δw, iar limitele de încredere p sunt calculate pe baza inegalității duble:

w — Δw ≤ p ≤ w — Δw, adică adevărata valoare a lui p se află în:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Astfel, cu o probabilitate de 0,997, se poate argumenta că proporția familiilor cu venituri mici în rândul tuturor familiilor din regiune variază de la 28,6% la 31,4%.

Exemplul 3 Calculul valorii medii și al intervalului de încredere pentru o caracteristică discretă specificată de o serie de intervale.

În tabel. 9.5. se stabileşte repartizarea aplicaţiilor pentru producerea comenzilor în funcţie de momentul implementării lor de către întreprindere.

Tabelul 9.5 Distribuția observațiilor în funcție de momentul apariției

Soluţie. Timpul mediu de finalizare a comenzii este calculat prin formula:

Timpul mediu va fi:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23,1 luni

Primim același răspuns dacă folosim datele de pe p i din penultima coloană a tabelului. 9.5 folosind formula:

Rețineți că mijlocul intervalului pentru ultima gradație se găsește prin completarea artificială a acestuia cu lățimea intervalului gradației anterioare egală cu 60 - 36 = 24 luni.

Dispersia se calculează prin formula

Unde x i- mijlocul seriei de intervale.

Prin urmare!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) iar eroarea standard este .

Eroarea mediei este calculată prin formula pentru luni, adică media este!!\overline(x) ± m = 23,1 ± 13,4.

Eroarea limită este calculată prin formula din tabel. 9,3 pentru reselecție deoarece dimensiunea populației este necunoscută, pentru un nivel de încredere de 0,954:

Deci media este:

acestea. adevărata sa valoare se află în intervalul de la 0 la 50 de luni.

Exemplul 4 Pentru a determina viteza decontărilor cu creditorii ai N = 500 de întreprinderi ale corporației într-o bancă comercială, este necesar să se efectueze un studiu selectiv folosind metoda selecției aleatorii nerepetitive. Determinați dimensiunea eșantionului necesar n astfel încât, cu o probabilitate P = 0,954, eroarea mediei eșantionului să nu depășească 3 zile, dacă estimările testului au arătat că abaterea standard s a fost de 10 zile.

Soluţie. Pentru a determina numărul de studii necesare n, folosim formula pentru selecția nerepetitivă din tabel. 9.4:

În ea, valoarea lui t este determinată de la nivelul de încredere P = 0,954. Este egal cu 2. Valoarea pătrată medie s = 10, dimensiunea populației N = 500 și eroarea marginală a mediei Δ x = 3. Înlocuind aceste valori în formulă, obținem:

acestea. este suficient să se facă un eșantion de 41 de întreprinderi pentru a estima parametrul necesar – viteza decontărilor cu creditorii.

Un eșantion este un set de date prelevate folosind anumite proceduri de la o populație generală pentru analiză exploratorie. Reprezentativitatea este proprietatea de a reproduce reprezentarea întregului în partea sa. Cu alte cuvinte, este posibilitatea de a extinde ideea unei părți la întreg, care include această parte.

Reprezentativitatea eșantionului este un indicator că eșantionul trebuie să reflecte pe deplin și în mod fiabil caracteristicile populației din care face parte. De asemenea, poate fi definită ca proprietatea eșantionului de a reprezenta cel mai complet caracteristicile populației generale care sunt semnificative din punctul de vedere al scopului studiului.

Să presupunem că populația generală este toți elevii școlii (900 de persoane din 30 de clase, 30 de persoane în fiecare clasă). Obiectul studiului este atitudinea școlarilor față de fumat. Un eșantion de 90 de elevi va reprezenta doar întreaga populație mult mai rău decât un eșantion din aceiași 90 de elevi, care ar include 3 elevi din fiecare clasă. Motivul principal este distribuția inegală în funcție de vârstă. Astfel, în primul caz, reprezentativitatea eșantionului va fi scăzută. În al doilea caz - mare.

În sociologie, ei spun că există o reprezentativitate a eșantionului și nereprezentativitatea acestuia.

Un exemplu de eșantion nereprezentativ este un caz clasic care a avut loc în 1936 în Statele Unite, în timpul alegerilor prezidențiale.

Literary Digest, care până acum a avut mare succes în prezicerea rezultatelor alegerilor anterioare, a greșit de data aceasta, chiar dacă a trimis câteva milioane de întrebări scrise atât abonaților, cât și respondenților pe care i-au selectat din agendele telefonice și listele de înmatriculare a mașinilor. În 1/4 din buletinele de vot care au revenit umplute, voturile au fost distribuite astfel: 57% au votat pentru candidatul republican pe nume Alf Landon, iar 41% l-au preferat pe actualul democrat Franklin Roosevelt.

De fapt, F. Roosevelt a câștigat alegerile cu aproape 60% din voturi. Eroarea „Literary Digest” a fost următoarea. Au dorit să crească reprezentativitatea eșantionului . Și întrucât știau că majoritatea abonaților lor s-au identificat drept republicani, au decis să extindă eșantionul cu respondenți selectați de ei din agendele telefonice și listele de înmatriculare a mașinilor. Dar nu au ținut cont de realitățile existente și de fapt au selectat și mai mulți susținători ai republicanilor, pentru că la acea vreme clasa de mijloc și de sus își permitea să aibă mașini și telefoane. Și erau în mare parte republicani, nu democrați.

Există diferite tipuri de eșantionare: aleatorie simplă, în serie, tipică, mecanică și combinată.

Eșantionarea aleatorie simplă constă în selectarea aleatorie din întreaga populație a unităților studiate fără niciun sistem.

Eșantionarea mecanică este utilizată atunci când există ordine în populația generală, de exemplu, există o anumită succesiune de unități de muncitori, liste electorale, numere de telefon ale respondenților, numere de apartamente și case etc.).

Selecția tipică este utilizată atunci când întreaga populație poate fi împărțită în grupuri în funcție de tipuri. Când se lucrează cu populația, acestea pot fi, de exemplu, grupuri educaționale, de vârstă, sociale; atunci când studiază întreprinderi, acestea pot fi o industrie sau o organizație separată etc.

Selecția în serie este utilă atunci când unitățile sunt grupate în serii sau grupuri mici. O astfel de serie poate fi loturi de produse finite, clase școlare și alte grupuri.

Eșantionarea combinată implică utilizarea tuturor tipurilor anterioare de eșantionare într-o combinație sau alta.

Există două tipuri principale de eșantioane: reprezentative și nereprezentative. Ce înseamnă acest lucru și de ce este important să facem distincție între ele?

Un eșantion reprezentativ(din engleză, represent - to represent) este de așa natură încât ne oferă posibilitatea de a distribui atât de înaltă calitate, cât și cantitativ rezultatele cercetărilor sale asupra unei anumite populații mari. În contextul sondajelor de opinie, un eșantion reprezentativ este unul care ne permite să ne extindem cantitativ rezultatele interviului nu numai asupra participanților la studiu, ci și asupra multor alte persoane.

De exemplu, pe baza unui sondaj, am aflat că 18% dintre respondenții care s-au înscris în eșantionul nostru, reprezentativ pentru populația adultă a Ucrainei, au o opinie X. Deci, putem spune că aproximativ 18% din populația adultă a Ucrainei are opinia X. Dacă eșantionul nu ar fi reprezentativ, atunci am putea doar presupune:„o minoritate din populația adultă a Ucrainei are opinia X”, „mai puțin de o treime are opinia X”, „mai puțin de un sfert are opinia X”. Dar aceste presupuneri ar putea verifica numai datorită reprezentant studiu. Deci, în contextul cercetării opiniilor oamenilor, un eșantion nereprezentativ este, de asemenea, un eșantion cantitativ rezultatele studiului care NU poate fi extinsă la alte persoane decât cele care au luat parte la studiu. Sau mai general: eșantionare nereprezentativă - este una care face imposibilă extinderea rezultatelor cantitative ale cercetării ei la o anumită populație mare.

Să ne imaginăm că într-o zi caldă de vară ieșim afară și întrebăm 10 trecători la noi acasă sau la birou dacă le place vremea ca acum. Să spună ce le place; 1 ezit cu un răspuns, 2 indică că nu le place o astfel de vreme și se simt mai confortabil la o temperatură mai scăzută. Pe baza acestui sondaj, noi NU putem spune că 70% dintre oameni le place vremea așa cum este acum. Și chiar NU noi putem a fi sigur cel mai oamenilor le place vremea ca acum. Putem exprima presupunere, că majoritatea oamenilor le place, dar nu putem ști sigur. A fost nereprezentativ probă.

O concepție greșită despre eșantionare este că orice eșantion mare este reprezentativ; Cu cât sondam mai mult, cu atât este mai reprezentativ. Nu este adevarat. Dacă ne continuăm sondajul meteorologic pe stradă până când am intervievat 100 sau chiar 1000 de persoane, tot nu putem spune nimic cu certitudine despre cei care nu au fost întrebați. De ce este asta? Nu sunt 100, darămite 1000 de oameni nu sunt suficiente pentru a trage concluzii certe despre preferințele celorlalți?

Cert este că, pentru a asigura reprezentativitatea, este important nu doar numărul de respondenți, ci și modulși „x a fost selectat.În exemplul de mai sus, nu ne-am gândit cine, unde și cum selectat, dar pur și simplu a început să comunice cu trecătorii. Să ne uităm în jur. Poate suntem lângă universitate într-o zi de școală? Apoi, printre trecători, se numără în mare parte tineri care, per ansamblu, tolerează căldura mai ușor decât persoanele în vârstă și, prin urmare, procentul de oameni care sunt mulțumiți de vreme se poate dovedi a fi artificial ridicat. Sau poate am ajuns într-un loc în care printre trecători sunt mai mulți bătrâni, cărora probabil le este greu să suporte înfundarea zilelor toride de vară? Apoi, procentul celor mulțumiți de vreme poate fi subestimat în comparație cu toți locuitorii așezării.

Probă reprezentativă

Probă reprezentativă

Un eșantion reprezentativ este un eșantion care are aceeași distribuție a caracteristicilor relative ca și populația generală.

În limba engleză: eşantion reprezentativ

Vezi si: Eșantion de populații

Dicţionar financiar Finam.


Vedeți ce este „Eșantion reprezentativă” în alte dicționare:

    Probă reprezentativă- Un grup de participanți care reprezintă mai mult sau mai puțin corect compoziția populației studiate. Eșantionul poate reflecta distribuția după caracteristicile de vârstă și gen, precum și orice alte caracteristici care afectează rezultatul experimentului în termeni de ... ...

    eşantion reprezentativ- — [Glosar englez-rus de termeni de bază privind vaccinologie și imunizare. Organizația Mondială a Sănătății, 2009] Subiecte Vaccinologie, Imunizare Eșantionare reprezentativă EN… Manualul Traducătorului Tehnic

    MOSTRA REPREZENTATIVA- (eșantion reprezentativ) un eșantion care este (sau este considerat) o reflectare fidelă a populației părinte, adică are același profil caracteristic, de exemplu, structura de vârstă, structura clasei, nivelul de educație. Reprezentant ...... Marele dicționar sociologic explicativ

    MOSTRA REPREZENTATIVA- Vezi reprezentativul eșantionului... Dicţionar explicativ de psihologie

    MOSTRA REPREZENTATIVA- un astfel de eșantion în care toate caracteristicile principale ale populației generale din care este prelevat acest eșantion sunt reprezentate aproximativ în aceeași proporție sau cu aceeași frecvență cu care această trăsătură apare în această populație generală... Dicţionar Enciclopedic de Psihologie şi Pedagogie

    Probă reprezentativă- acesta este un astfel de eșantion în care toate caracteristicile principale ale populației generale din care este extras acest eșantion sunt prezentate în aproximativ aceeași proporție sau cu aceeași frecvență cu care această caracteristică apare în acest general ... ... Dicţionar sociologic Socium

    Probă reprezentativă- (probă reprezentativă). Un eșantion care reflectă cu acuratețe starea și proprietățile întregii populații... Psihologia dezvoltării. Dicţionar după carte

    eşantion reprezentativ- (eşantion reprezentativ) un eşantion realizat conform regulilor, adică în aşa fel încât să reflecte specificul populaţiei generale atât în ​​ceea ce priveşte componenţa, cât şi caracteristicile individuale ale subiecţilor incluşi. Dicționar de psiholog practic. M .: AST, ...... Marea Enciclopedie Psihologică

    Engleză eșantionare, reprezentativă; limba germana Stichprobe, reprezentativ. Un eșantion care are în esență aceeași distribuție a caracteristicilor relative ca și populația. antinazi. Enciclopedia de Sociologie, 2009... Enciclopedia Sociologiei

    Eșantion reprezentativ Un eșantion care are aceeași distribuție a caracteristicilor relative ca și populația Vocabularul termenilor de afaceri. Akademik.ru. 2001... Glosar de termeni de afaceri