Dimensiunea eșantionului cum să găsiți formula. Mărimea eșantionului - metodă selectivă de cercetare sociologică

Statistica știe totul. Și Ilf și E. Petrov, „12 scaune”

Imaginați-vă că construiți un centru comercial mare și doriți să evaluați fluxul de trafic de la intrarea în zona de parcare. Nu, hai să dăm un alt exemplu... oricum nu o vor face niciodată. Trebuie să evaluați preferințele de gust ale vizitatorilor portalului dvs., pentru care trebuie să efectuați un sondaj printre aceștia. Cum se conectează cantitatea de date și posibila eroare? Nimic complicat - cu cât eșantionul este mai mare, cu atât eroarea este mai mică. Cu toate acestea, există și aici nuanțe.

Minimum teoretic

Nu va fi de prisos să ne împrospătăm memoria, acești termeni ne vor fi de folos mai târziu.

  • populatie- Ansamblul tuturor obiectelor printre care se efectuează cercetări.
  • Probă– Un subset, o parte a obiectelor din întreaga populație care este direct implicată în studiu.
  • Eroare de tip I- (α) Probabilitatea de a respinge ipoteza nulă în timp ce aceasta este adevărată.
  • Eroare de tip II- (β) Probabilitate nu respinge ipoteza nulă atunci când este falsă.
  • 1-β- Puterea statistică a criteriului.
  • μ 0 și μ 1- Valori medii în ipoteza nulă și alternativă.


Deja în definițiile erorii de primul și al doilea fel există loc de dezbatere și interpretare. Cum să decizi asupra lor și pe care să o alegi ca zero? Dacă examinați nivelul de poluare în sol sau apă, cum ați formula ipoteza nulă: există poluare sau nu există poluare? Dar din asta dimensiunea eșantionului depinde din populația generală de obiecte.



Iniţială populatie, precum și probă poate avea orice distribuție, dar media are normal sau distributie gaussiana datorită Teoremei limitei centrale.


În ceea ce privește parametrii de distribuție și în special media, sunt posibile mai multe tipuri de inferențe. Primul din care se numeste interval de încredere. Indică intervalul de valori posibile pentru parametru, cu cele specificate factor de încredere. Deci, de exemplu, 100(1-α)% interval de încredere pentru μ va fi așa (Lv. 1).




Al doilea din inferență testarea ipotezelor. Ar putea fi ceva de genul asta.

  • H0: μ = h
  • H1: p > h
  • H2: μ< h

Cu interval de încredere 100(1-α) pentru μ puteți face o alegere în favoarea H 1 și H 2:

  • Dacă limita inferioară interval de încredere 100(1-α)< h , то тогда respinge H 0în favoarea lui H2.
  • Dacă limita superioară interval de încredere 100(1-α) > h, atunci respinge H 0în favoarea lui H 1 .
  • În cazul în care un interval de încredere 100(1-α) include h, atunci nu putem respinge H 0 și un astfel de rezultat este considerat nedeterminat.

Dacă trebuie să verificăm valoarea μ pentru un mostre din populația totală, atunci criteriul va lua forma



Interval de încredere, eroare și dimensiunea eșantionului

Luați chiar prima ecuație și exprimați lățimea de acolo interval de încredere(Liv. 2).



În unele cazuri, putem înlocui statistica t a lui Student cu distribuția normală standard z. O altă simplificare înlocuiește jumătate din w pe eroarea de măsurare E. Atunci ecuația noastră va lua forma (Ec. 3).



După cum vedem eroarea chiar scade odată cu creșterea numărului de date de intrare. De unde este ușor să deduceți ceea ce căutați (Ecuația 4).


Practică - numără cu R

Să testăm ipoteza că valoarea medie a eșantionului dat a numărului de insecte din capcană este 1.

  • H0: μ = 1
  • H1: μ > 1
Insecte 0 1 2 3 4 5 6
Capcane 10 9 5 5 1 2 1

> x<- read.table("/tmp/tcounts.txt") >y = unlist(x, use.names="false") > mean(z);sd(z) 1,636364 1,654883

Rețineți că media și abaterea standard sunt aproape egale, ceea ce este firesc pentru o distribuție Poisson. Interval de încredere de 95% pentru statistica t a lui Student și df=32 .


> qt(.975, 32) 2,036933

și în final obținem intervalul critic pentru medie: 1.05 - 2.22 .


> μ=mean(z) > st = qt(.975, 32) > μ + st * sd(z)/sqrt(33) 2,223159 > μ - st * sd(z)/sqrt(33) 1,049568

Ca rezultat, H 0 ar trebui respins și H 1 acceptat, deoarece cu o probabilitate de 95%, μ > 1.


În același exemplu, presupunând că cunoaștem abaterea standard reală - σ , și nu estimarea acesteia obținută folosind un eșantion aleator, puteți calcula n necesar pentru o anumită eroare. Să calculăm pentru E=0,5.


> za2 = qnorm(.975) > (za2*sd(z)/.5)^2 42.08144

corectarea vântului

De fapt, nu există niciun motiv să credem că vom ști σ (varianta), in timp ce μ (înseamnă) încă avem de estimat. Din această cauză, ecuația 4 este de puțină utilitate practică, cu excepția exemplelor deosebit de rafinate din domeniul combinatoriei, iar ecuația realistă pentru n este ceva mai complicată pentru necunoscut σ (Liv. 5).



Rețineți că σ în ultima ecuație, nu cu un capac (^), ci cu o tildă (~). Aceasta este o consecință a faptului că la început nu avem nici măcar o abatere standard estimată a unui eșantion aleatoriu - și în schimb folosim planificat- . De unde luăm cele mai recente? Putem spune că din plafon: judecată expert, estimări brute, experiență trecută etc.


Și cum rămâne cu al doilea termen din partea dreaptă a ecuației a 5-a, de unde a venit? Din moment ce , este necesară corectarea lui Günther.


Pe lângă ecuațiile 4 și 5, există mai multe formule aproximativ-evaluative, dar aceasta merită deja o postare separată.

Formula de mai jos pentru a calcula marime de mostra este utilizat în cazurile în care respondenților (respondenților) li se pune o singură întrebare, la care există doar două răspunsuri posibile. De exemplu, „Da” și „Nu”; „Eu folosesc” și „Nu folosesc”. Desigur, această formulă poate fi aplicată numai atunci când se efectuează cele mai simple studii. Dacă trebuie să determinați dimensiunea eșantionului atunci când efectuați studii mai mari, cum ar fi chestionare, atunci ar trebui utilizate alte formule.

O formulă simplă pentru calcularea dimensiunii eșantionului

Unde: n- marime de mostra;

z este abaterea normalizată determinată pe baza nivelului de încredere selectat. Acest indicator caracterizează posibilitatea, probabilitatea de a obține răspunsuri într-un interval special - de încredere. În practică, nivelul de încredere este adesea considerat ca 95% sau 99%. Apoi, valorile z vor fi 1,96 și, respectiv, 2,58;

p– variație pentru eșantion, în acțiuni. În esență, p este probabilitatea ca respondenții să aleagă una sau alta opțiune de răspuns. Să presupunem că dacă credem că un sfert dintre respondenți vor alege răspunsul „Da”, atunci p va fi egal cu 25%, adică p = 0,25;

q= (1 – p);

e– eroare admisă, în fracții.

Exemplu de calcul al dimensiunii eșantionului

Compania intenționează să efectueze un studiu sociologic pentru a identifica proporția de fumători în populația orașului. Pentru a face acest lucru, angajații companiei vor pune trecătorilor o întrebare: „Fumați?”. Astfel, există doar două răspunsuri posibile: „Da” și „Nu”.

Mărimea eșantionului în acest caz este calculată după cum urmează. Nivelul de încredere este considerat 95%, apoi abaterea normalizată z = 1,96. Acceptăm variația ca 50%, adică credem condiționat că jumătate dintre respondenți pot răspunde la întrebarea dacă fumează - „Da”. Apoi p=0,5. De aici găsim q = 1 – p = 1 – 0,5 = 0,5 . Eroarea de eșantionare acceptabilă este considerată 10%, adică e = 0,1.

Înlocuim aceste date în formulă și calculăm:

Obținerea dimensiunii eșantionului n = 96 persoane.

Domeniul de aplicare al acestei formule

Când efectuați o cercetare simplă, atunci când trebuie să obțineți un răspuns la o singură întrebare simplă. În acest caz, scara răspunsurilor, de regulă, este de natură dihotomică. Adică sunt oferite (sau implicite) răspunsuri de tipul „Da” – „Nu”, „Negru” – „Alb”, etc.

Caracteristicile acestei formule pentru calcularea mărimii eșantionului

Galyautdinov R.R.


© Copierea materialului este permisă numai dacă specificați un hyperlink direct către

Populațiile sunt adesea deținute în rândul unor grupuri mari de oameni. Adesea este eronat să credem că fiabilitatea rezultatelor va fi mai mare dacă întrebările primesc răspuns de către fiecare membru al societății. Din cauza costurilor uriașe de timp, bani și forță de muncă, o astfel de examinare este inacceptabilă. Odată cu creșterea numărului de respondenți, nu numai că vor crește costurile, dar va crește și riscul de a primi date incorecte. Din punct de vedere practic, multe chestionare și codificatori vor reduce probabilitatea unui control fiabil al acțiunilor lor. Un astfel de sondaj se numește continuu.

În sociologie, cel mai des este folosit un studiu discontinuu sau o metodă selectivă. Rezultatele sale pot fi extinse la un set mare de oameni, care se numește general.

Definiția și semnificația metodei de eșantionare

Metoda de eșantionare este o modalitate cantitativă de selectare a unei părți a unităților studiate din masa totală, în timp ce rezultatele anchetei se vor aplica și fiecărui individ care nu a participat la aceasta.

Metoda de eșantionare este atât subiectul cercetării științifice, cât și o disciplină academică. Acționează ca un mijloc de obținere a informațiilor fiabile despre populația generală și ajută la evaluarea tuturor parametrilor acesteia. Condițiile de selectare a unităților afectează ulterior analiza statistică a rezultatelor. Dacă procedurile de eșantionare sunt implementate prost, utilizarea chiar și a celor mai fiabile metode de prelucrare a informațiilor colectate va fi inutilă.

Concepte cheie ale teoriei alegerii

Ei denumesc relația de unități, în raport cu care se formulează concluziile studiului prin eșantion. Poate fi rezidenți ai unei țări, a unei anumite localități, a echipei de lucru a unei întreprinderi etc.

Eșantionul (sau eșantionul) face parte din general, care a fost selectat folosind metode și criterii speciale. De exemplu, criteriile statistice sunt luate în considerare în procesul de formare.

Numărul de indivizi incluși într-un anumit set se numește volumul acestuia. Dar poate fi exprimat nu numai prin numărul de oameni, ci și prin secții de votare, localități, adică cu siguranță unități mari care includ unități de observare. Dar acesta este deja un eșantion în mai multe etape.

Unitatea de selecție o constituie părțile constitutive ale populației generale, acestea putând fi fie unități de observare directă (eșantionare într-o singură etapă), fie formațiuni mai mari.

Un rol important în obținerea de rezultate de cercetare fiabile folosind o metodă de eșantionare este o proprietate precum reprezentativitatea selecției. Adică, partea populației generale care a devenit respondenți trebuie să reproducă pe deplin toate caracteristicile sale. Orice abatere este considerată o eroare.

Etape pentru aplicarea metodei de eșantionare

Fiecare empiric constă din etape. Dacă se aplică metoda de eșantionare, ordinea acestora va fi aranjată după cum urmează:

  1. Realizarea unui proiect de eșantion: se stabilește populația generală, se caracterizează procedurile de selecție, se caracterizează volumele.
  2. Implementarea proiectului: în cursul culegerii informațiilor sociologice, chestionarele îndeplinesc sarcini cu indicarea metodei de selectare a respondenților.
  3. Identificarea si corectarea erorilor de reprezentativitate.

Tipuri de mostre în sociologie

După determinarea populației generale, cercetătorul trece la proceduri selective. Ele pot fi împărțite în două tipuri (criterii):

  1. Rolul legilor probabilistice în cursul eșantionării.
  2. Numărul de etape de selecție.

Dacă se aplică primul criteriu, atunci se disting metoda de eșantionare aleatorie și selecția non-aleatorie. Pe baza acestora din urmă, se poate argumenta că eșantionul poate fi cu o singură etapă și cu mai multe etape.

Tipurile de probe sunt reflectate direct nu numai în etapele de pregătire și desfășurare a studiului, ci și în rezultatele acestuia. Înainte de a da preferință unuia dintre ele, ar trebui să înțelegeți conținutul conceptelor.

Definiția „aleatorie” în utilizarea de zi cu zi a primit un sens complet opus decât în ​​matematică. O astfel de selecție se efectuează după reguli stricte, nu este permisă nicio abatere de la acestea, deoarece este important să se asigure că fiecare unitate a populației generale are aceleași șanse de a fi inclusă în eșantion. Dacă aceste condiții nu sunt îndeplinite, această probabilitate va fi diferită.

La rândul său, eșantionul aleatoriu este împărțit în:

  • simplu;
  • mecanic (sistematic);
  • cuibărit (serial, cluster);
  • stratificat (tipic sau zonat).

O metodă simplă de eșantionare este efectuată folosind un tabel de numere aleatorii. Inițial, se determină dimensiunea eșantionului; este creată o listă completă a respondenților numerotați incluși în populația generală. Pentru selecție sunt folosite tabele speciale conținute în publicațiile matematice și statistice. Orice altele decât ele sunt interzise. Dacă dimensiunea eșantionului este un număr din trei cifre, atunci numărul fiecărei unități de eșantionare trebuie să fie din trei cifre, și anume de la 001 la 790. Ultimul număr indică numărul total de persoane. Studiul va implica acele persoane cărora li s-a atribuit un număr în intervalul specificat, găsit în tabel.

Selecția sistematică se bazează pe calcule. O listă alfabetică a tuturor elementelor populației generale este compilată preliminar, pasul este stabilit și numai apoi - dimensiunea eșantionului. Formula pasului este următoarea:

N: n, unde N este populația și n este eșantionul.

De exemplu, 150.000: 5.000 = 30. Astfel, fiecare a treizecea persoană va fi selectată pentru a participa la sondaj.

Entitate de tip cuib

Un eșantion grupat este utilizat atunci când populația de persoane studiate este formată din grupuri naturale mici. În acest caz, trebuie remarcat faptul că numărul de listă al unor astfel de cuiburi este determinat la primul pas. Cu ajutorul unui tabel de numere aleatorii, se face selecția și se realizează un sondaj continuu al tuturor respondenților din fiecare cuib selectat. Mai mult, cu cât au participat mai mulți la studiu, cu atât eroarea medie de eșantionare este mai mică. Cu toate acestea, este posibil să se folosească o astfel de tehnică cu condiția ca cuiburile studiate să aibă o caracteristică similară.

Esența alegerii stratificate

Un eșantion stratificat diferă de cele anterioare prin aceea că, în ajunul selecției, populația generală este împărțită în straturi, adică părți omogene care au o trăsătură comună. De exemplu, nivelul de educație, preferințele electorale, nivelul de satisfacție față de diverse aspecte ale vieții. Cea mai simplă opțiune este să separați subiecții după sex și vârstă. În principiu, este necesar să se efectueze selecția în așa fel încât din fiecare strat să fie selectate un număr de persoane proporțional cu numărul total.

Dimensiunea eșantionului în acest caz poate fi mai mică decât într-o situație cu selecție aleatorie, dar reprezentativitatea va fi mai mare. Trebuie recunoscut faptul că eșantionarea stratificată va fi cea mai costisitoare din punct de vedere financiar și informațional, iar eșantionarea imbricată va fi cea mai benefică în acest sens.

Eșantionarea cotelor non-aleatorie

Există și un eșantion de cotă. Este singurul tip de selecție non-aleatorie care are o justificare matematică. Eșantionul de cotă este format din unități care trebuie reprezentate prin proporții și să corespundă populației generale. În această formă, se realizează o distribuție intenționată a caracteristicilor. Dacă opiniile și evaluările oamenilor se numără printre caracteristicile studiate, atunci sexul, vârsta și educația respondenților sunt adesea cote.

Într-un studiu sociologic se disting și două metode de selecție: repetată și nerepetată. În primul caz, unitatea selectată după sondaj este returnată populației generale pentru a continua să participe la selecție. În a doua opțiune, respondenții sunt sortați, ceea ce crește șansele ca membrii rămași ai populației să fie selectați.

Sociologul G. A. Churchill a dezvoltat următoarea regulă: dimensiunea eșantionului ar trebui să se străduiască să ofere cel puțin 100 de observații pentru componenta de clasificare primară și 20-50 pentru componenta de clasificare secundară. Trebuie avut în vedere faptul că unii dintre respondenții incluși în eșantion, din diverse motive, pot să nu participe la sondaj sau să-l refuze cu totul.

Metode de determinare a mărimii eșantionului

În cercetarea sociologică sunt aplicabile următoarele metode:

1. Arbitrar, adică mărimea eșantionului se determină în limita a 5-10% din componența populației generale.

2. Metoda tradițională de calcul se bazează pe efectuarea de sondaje regulate, de exemplu o dată pe an, care acoperă 600, 2.000 sau 2.500 de respondenți.

3. Statistic - este de a stabili fiabilitatea informaţiei. Statistica ca știință nu se dezvoltă izolat. Subiectele și domeniile cercetării sale sunt implicate activ în alte domenii conexe: tehnic, economic și umanitar. Astfel, metodele sale sunt folosite în sociologie, în pregătirea pentru anchete și, în special, în determinarea dimensiunilor eșantionului. Statistica ca știință are o bază metodologică extinsă.

4. Scump, în care se stabilește suma admisă a cheltuielilor pentru cercetare.

5. Mărimea eșantionului poate fi egală cu numărul de unități ale populației generale, atunci studiul va fi continuu. Această abordare este aplicabilă în grupuri mici. De exemplu, forța de muncă, studenții etc.

Anterior, s-a putut stabili că eșantionul va fi considerat reprezentativ atunci când caracteristicile sale descriu proprietățile populației generale cu o eroare minimă.

Estimarea dimensiunii eșantionului precede calculele finale ale numărului de unități care vor fi selectate din populația generală:

n = Npqt 2: N∆ 2 p + pqt 2 , în care N este numărul de unități ale populației generale, p este ponderea trăsăturii studiate (q = 1 - p), t este coeficientul de corespondență al probabilitatea de încredere P (determinată dintr-un tabel special), ∆ p - eroare admisă.

Aceasta este doar o variație a modului în care este calculată dimensiunea eșantionului. Formula se poate modifica în funcție de condiții și de criteriile de studiu selectate (de exemplu, reeșantionare sau eșantionare nereplicativă).

Erori de eșantionare

Anchetele sociologice ale populației se bazează pe utilizarea unuia dintre tipurile de eșantionare pe care le-am considerat mai sus. Cu toate acestea, în orice caz, sarcina fiecărui cercetător ar trebui să fie să evalueze gradul de acuratețe al indicatorilor obținuți, adică este necesar să se determine cât de mult reflectă aceștia caracteristicile populației generale.

Erorile de eșantionare pot fi împărțite în aleatoare și non-aleatoare. Primul tip presupune abaterea indicatorului eșantionului de la cel general, care poate fi exprimată prin diferența ponderilor acestora (medie) și care este cauzată doar de un tip de anchetă necontinuu. Și este firesc dacă acest indicator scade pe fondul unei creșteri a numărului de respondenți chestionați.

O eroare sistematică este o abatere de la indicatorul general, constatată și ca urmare a scăderii eșantionului și a cotelor generale și care decurge din inconsecvența metodologiei de eșantionare cu regulile stabilite.

Aceste tipuri de erori sunt incluse în eroarea totală de eșantionare. Într-un studiu, din populație poate fi prelevat un singur eșantion. Calculul abaterii maxime posibile a indicatorului eșantionului poate fi efectuat folosind o formulă specială. Se numește eroare marginală de eșantionare. Există, de asemenea, eroarea medie de eșantionare. Aceasta este abaterea standard a eșantionului de la cota generală.

Există, de asemenea, un tip de eroare a posteriori (post-experimental). Înseamnă abaterea indicatorilor eșantionului de la ponderea generală (medie). Se calculează prin compararea indicatorului general, despre care informațiile proveneau din surse sigure, și eșantionul, care a fost stabilit în timpul anchetei. Departamentele de personal ale întreprinderilor, organele de statistică de stat acționează adesea ca surse de încredere de informații.

Există și o eroare a priori, care este și o abatere a eșantionului și a indicatorilor generali, care poate fi exprimată ca diferență între cotele lor și poate fi calculată folosind o formulă specială.

În cercetarea educațională, următoarele greșeli sunt cel mai adesea făcute la selectarea respondenților pentru un sondaj:

1. Seturi de mostre de grupuri aparținând diferitelor populații generale. Când sunt utilizate, sunt dezvoltate inferențe statistice care se aplică întregului eșantion. Este destul de evident că acest lucru nu poate fi acceptabil.

2. Capacitățile organizatorice și financiare ale cercetătorului nu sunt luate în considerare atunci când se iau în considerare tipuri de eșantioane, iar una dintre ele este preferată.

3. Criteriile statistice pentru structura populației generale nu sunt utilizate în totalitate pentru a preveni erorile de eșantionare.

4. Cerințele de reprezentativitate a selecției respondenților în cursul studiilor comparative nu sunt luate în considerare.

5. Instrucțiunile pentru intervievator trebuie adaptate tipului specific de selecție adoptat.

Natura participării respondenților la studiu poate fi deschisă sau anonimă. Acest lucru ar trebui să fie luat în considerare la formarea eșantionului, deoarece, după ce nu sunt de acord cu condițiile, participanții pot pleca.

Atunci când se proiectează un eșantion de observație, se pune întrebarea cu privire la dimensiunea necesară a eșantionului. Acest număr poate fi determinat pe baza erorii admisibile la eșantionare, pe baza probabilității pe baza căreia se poate garanta mărimea erorii de setat și, în final, pe baza metodei de selecție.

Formulele pentru dimensiunea necesară a eșantionului pentru diferite metode de eșantionare pot fi derivate din rapoartele corespunzătoare utilizate la calcularea erorilor marginale de eșantionare. Iată cele mai frecvent utilizate expresii în practică pentru dimensiunea necesară a eșantionului:

eșantionare corectă aleatorie și mecanică:

(reselectare)

(selecție nerepetată)

mostră tipică:

(reselectare)

(selecție nerepetată)

eșantionare în serie:

(reselectare)

(selecție nerepetată)

În acest caz, în funcție de obiectivele studiului, varianțele și erorile de eșantionare pot fi calculate pentru valoarea medie sau proporția trăsăturii.

Să luăm în considerare exemple de determinare a mărimii eșantionului necesar pentru diferite metode de formare a unei populații de eșantion.

Exemplul 5În 100 de agenții de turism ale orașului, este planificat să se efectueze un studiu al numărului mediu lunar de vouchere vândute prin metoda selecției mecanice. Care ar trebui să fie dimensiunea eșantionului pentru ca cu o probabilitate de 0,683 eroarea să nu depășească 3 bonuri, dacă, conform anchetei pilot, varianța este 225.

Decizie. Calculați dimensiunea necesară a eșantionului:

Agenții.

Exemplul 6 Pentru a determina proporția de angajați ai băncilor comerciale din regiune cu vârsta peste 40 de ani, se preconizează organizarea unui eșantion tipic proporțional cu numărul de angajați bărbați și femei cu o selecție mecanică în cadrul grupelor. Numărul total de angajați ai băncii este de 12 mii de persoane, inclusiv 7 mii de bărbați și 5 mii de femei.

Pe baza anchetelor anterioare, se știe că media variațiilor în cadrul grupului este de 1600. Determinați dimensiunea necesară a eșantionului cu o probabilitate de 0,997 și o eroare de 5%.

Decizie. Calculați dimensiunea totală a unui eșantion tipic:

oameni

Să calculăm acum volumul grupurilor tipice individuale:

oameni

oameni

Astfel, dimensiunea necesară a eșantionului de angajați ai băncii este de 550 de persoane, incl. 319 bărbați și 231 femei.

Exemplul 7 Societatea pe acțiuni are 200 de echipe de muncitori. Este planificată efectuarea unei anchete prin sondaj pentru a determina proporția lucrătorilor cu boli profesionale. Se știe că varianța inter-serială a proporției este de 225. Cu o probabilitate de 0,954, se calculează numărul necesar de echipe pentru chestionarea lucrătorilor dacă eroarea de eșantionare nu trebuie să depășească 5%.

Decizie. Numărul necesar de brigăzi va fi calculat pe baza formulei pentru volumul de eșantionare nerepetitivă în serie:

brigăzi.

3. Determinarea dimensiunii eșantionului necesar

Este foarte important să se determine dimensiunea optimă a eșantionului, care, cu o anumită probabilitate, va oferi precizia specificată a rezultatelor observației. Pe măsură ce dimensiunea eșantionului crește, eroarea de eșantionare scade. Dar, deoarece unitățile eșantionate pentru o anchetă sunt adesea distruse, ratele de eșantionare ale unităților din eșantion trebuie să fie optime. Mărimea optimă a eșantionului poate fi obținută din formulele de eroare de eșantionare.

Tabelul 8.4

Formule pentru determinarea mărimii optime a eșantionului

Metoda de selecție

Pentru mediu

Auto-aleatoriu repetat

Aleatoriu și mecanic nerepetabil

Tipologic nerepetitiv

Serial nerepetitiv cu serii egale

Formulele arată că pe măsură ce eroarea de eșantionare estimată crește, dimensiunea necesară a eșantionului scade semnificativ.

Pentru a calcula dimensiunea eșantionului, trebuie să cunoașteți varianța. Poate fi împrumutat din anchete anterioare ale aceleiași populații sau similare sau poate fi efectuată o anchetă ad-hoc prin eșantion de dimensiuni reduse.

Exemplul 2 : La întreprindere, 100 de lucrători din 1000 au fost intervievați în ordinea unui eșantion nerepetitiv aleatoriu și s-au obținut următoarele date privind veniturile lor pentru luna octombrie (Tabelul 8.5).

Tabelul 8.5

Distribuția lucrătorilor după venitul mediu lunar

Defini:

1) venitul mediu lunar al salariaților acestei întreprinderi, garantând rezultatul cu o probabilitate de 0,997;

2) ponderea lucrătorilor întreprinderii cu un venit lunar de 19 mii de ruble. și mai mare, garantând un rezultat cu o probabilitate de 0,954;

3) dimensiunea eșantionului necesară pentru determinarea venitului mediu lunar al angajaților întreprinderii, astfel încât, cu o probabilitate de 0,954, eroarea marginală de eșantionare să nu depășească 200 de ruble.

Decizie:

1) Să determinăm venitul mediu lunar al angajaților acestei întreprinderi, garantând rezultatul cu o probabilitate de 0,997.

n= 100 de persoane

N= 1000 de persoane

Decizie: pentru a determina intervalul venitului mediu lunar al angajaților unei întreprinderi date în populația generală, este necesar să se cunoască valoarea erorii marginale de eșantionare și mărimea venitului mediu lunar al lucrătorilor conform anchetei prin sondaj .


tși eroarea medie de eșantionare .

Deoarece P \u003d 0,997, atunci (conform tabelului 8.2) t= 3.

S-a făcut o selecție aleatorie nerepetitivă, conform tabelului. 8.3 selectăm formula pentru calcularea erorii medii de eșantionare pentru medie:

, Unde
este varianța eșantionului.

Mărimea venitului mediu lunar al lucrătorilor conform anchetei prin sondaj va fi determinată de formula mediei ponderate aritmetice:
.

Calcule suplimentare vor fi efectuate în următorul tabel:

venit lunar,

Număr de lucrători, pers.

Punct de mijloc al intervalului

mii de ruble.

mii de ruble.

știind tși
Să determinăm valoarea erorii marginale de eșantionare:

Mie freca.

Atunci intervalul venitului mediu lunar al lucrătorilor acestei întreprinderi va fi următorul:

;

.

Răspuns: venitul mediu lunar al angajaților acestei întreprinderi cu o probabilitate de 0,997 este în intervalul de 18,08 mii de ruble. până la 18,92 mii de ruble.

2) Să determinăm ponderea lucrătorilor întreprinderii cu un venit lunar de 19 mii de ruble. și mai mare, garantând un rezultat cu o probabilitate de 0,954.

n= 100 de persoane

N= 1000 de persoane

Decizie: pentru a determina intervalul ponderii lucrătorilor cu un venit lunar de 19 mii de ruble. iar mai sus, este necesar să se cunoască valoarea erorii marginale de eșantionare a fracției
și proporția lucrătorilor cu acest venit mediu lunar conform eșantionului W.

Eroarea marginală de eșantionare este determinată de formulă
. Depinde de valoarea factorului de încredere tși eroarea medie de eșantionare.

Deoarece P \u003d 0,954, atunci (conform tabelului 8.2) t= 2.

S-a făcut o selecție aleatorie nerepetitivă, conform tabelului. 8.3 selectați formula pentru calcularea erorii medii de eșantionare pentru cotă:

, Unde W- ponderea lucrătorilor întreprinderii cu un venit mediu lunar de 19 mii de ruble. și mai mare în eșantion.

Ponderea eșantionului este determinată de raportul dintre numărul de unități care au trăsătura în studiu m la numărul total de unităţi de eşantionare n, sau
.

Atunci eroarea medie a cotei este

știind tși determinați valoarea erorii marginale de eșantionare pentru fracția:

Apoi, intervalul cotei lucrătorilor cu un venit lunar de 19 mii de ruble. și mai sus în populația generală va fi după cum urmează:

.

Răspuns: ponderea lucrătorilor întreprinderii cu un venit lunar de 19 mii de ruble. și mai mare, cu o probabilitate de 0,954 este în intervalul de la 19,4% la 36,6%.

    Să determinăm dimensiunea eșantionului necesară atunci când determinăm venitul mediu lunar al angajaților întreprinderii, astfel încât, cu o probabilitate de 0,954, eroarea marginală de eșantionare să nu depășească 200 de ruble.

N= 1000 de persoane

Decizie: dimensiunea eșantionului necesară pentru a determina venitul mediu lunar este determinată de formula (conform Tabelului 8.4):

După starea problemei, se știe: cu o probabilitate P = 0,954 t\u003d 2 (a se vedea tabelul. 8.2);

0,2 mii de ruble;
(conform eșantionului precedent).

oameni

Răspuns: pentru ca, cu o probabilitate de 0,954, eroarea marginală de eșantionare să nu depășească 200 de ruble, trebuie examinate 189 de persoane.

4.5. Determinarea mărimii eșantionului

Procedura de proiectare a eșantionului include rezolvarea secvențială a următoarelor trei sarcini:

Definirea obiectului de studiu;

Determinarea structurii probei;

Determinarea dimensiunii eșantionului.

Obișnuit, obiect al cercetării de marketing este un ansamblu de obiecte de observație, care pot fi consumatori, angajați ai companiei, intermediari etc. Dacă această populație este atât de mică încât echipa de cercetare are capacitățile necesare de muncă, financiare și de timp pentru a stabili contactul cu fiecare dintre elementele sale, atunci este destul de realist să se efectueze un studiu continuu al întregii populații. În acest caz, după ce ați determinat obiectul cercetării, puteți trece la următoarea procedură (alegerea metodei de colectare a datelor, a instrumentului de cercetare și a metodei de comunicare cu publicul).

Cu toate acestea, în practică, de foarte multe ori nu este posibil sau adecvat să se efectueze un studiu continuu al întregii populații. Pot exista următoarele motive pentru aceasta:

Imposibilitatea stabilirii contactului cu unele elemente ale populatiei;

Costuri nerezonabil de mari pentru realizarea unui studiu complet sau existența unor restricții financiare care nu permit efectuarea unui studiu complet;

Timpul scurt alocat studiului, din cauza pierderii de relevanță a informațiilor în timp sau din alte motive, și care nu permit colectarea, sistematizarea și analiza unor date extinse pentru întreaga populație.

Prin urmare, populațiile mari și împrăștiate sunt adesea studiate cu ajutorul unui eșantion, care, după cum știți, este înțeles ca o parte a populației, concepută pentru a reprezenta populația în ansamblu.

De acuratețea cu care un eșantion reflectă populația în ansamblu depinde structura și dimensiunea eșantionului.

Există două abordări ale structurii eșantionului- probabilistice şi deterministe.

Abordare probabilistică a structurii eșantionului presupune că orice element al populației poate fi selectat cu o anumită probabilitate (nu zero). Există diferite tipuri de eșantioane bazate pe teoria probabilității (tipic, imbricat etc.). Cel mai simplu și cel mai comun în practică este un eșantion simplu aleatoriu, în care fiecare element al populației are o probabilitate egală de a fi selectat pentru cercetare.

Eșantionarea probabilistică este mai precisă, permite cercetătorului să evalueze gradul de fiabilitate al datelor pe care le-a colectat, deși este mai complicată și mai costisitoare decât eșantionarea deterministă.

Abordare deterministă la structura probei presupune că selecția elementelor populației se face prin metode bazate fie pe considerente de comoditate, fie pe decizia cercetătorului, fie pe grupuri contingente.

din motive de comoditate, constă în alegerea oricăror elemente ale populaţiei pe baza uşurinţei stabilirii contactului cu acestea. Imperfecțiunea acestei metode se datorează, poate, reprezentativității scăzute a probei obținute, întrucât elementele populației care sunt convenabile pentru cercetător pot să nu fie reprezentanți suficient de caracteristici ai populației din cauza selecției lor nealeatoare și nerezonabile.

Totuși, pe de altă parte, simplitatea, economia și eficiența studiului efectuat prin această metodă i-au adus acestuia o răspândire destul de largă în practică și, mai ales, în realizarea unor studii preliminare menite să clarifice principalele probleme.

Bazat pe metoda de eșantionare la decizia cercetătorului, constă în alegerea elementelor populaţiei, care, în opinia sa, sunt reprezentanţii ei caracteristici. Această metodă este mai perfectă decât cea anterioară, întrucât se bazează pe o orientare către reprezentanții caracteristici ai populației studiate, deși aceștia sunt selectați pe baza ideilor subiective ale cercetătorilor despre aceasta.

Metoda de eșantionare bazată pe norme contingente, consta in alegerea elementelor caracteristice ale populatiei in concordanta cu caracteristicile obtinute anterior ale populatiei in ansamblu. Aceste caracteristici pot fi obținute prin efectuarea de studii preliminare și, spre deosebire de metoda anterioară, nu sunt subiective. Prin urmare, această metodă este mai avansată, ea permite obținerea unor populații de eșantion care nu sunt mai puțin reprezentative decât eșantioanele probabile la costuri semnificativ mai mici pentru realizarea unui sondaj.

După ce a ales structura eșantionului (abordarea formării acesteia, tipul de formare probabilistică sau de aruncare a unui eșantion determinist), cercetătorul va trebui să determine volumul, i.e. numărul de elemente ale probei.

Marime de mostra determină fiabilitatea informaţiei obtinute in urma studiului acestuia, precum si a costurilor necesare studiului. Mărimea eșantionului depinde pe nivelul de omogenitate sau varietate a obiectelor studiate.

Cu cât dimensiunea eșantionului este mai mare, cu atât este mai mare acuratețea acestuia și costul efectuării sondajului este mai mare. Cu o abordare probabilistică a structurii eșantionului, volumul acestuia poate fi determinat folosind formule statistice binecunoscute, bazate pe cerințele specificate pentru acuratețea acestuia.

În practică, se utilizează mai multe abordări pentru a determina dimensiunea eșantionului:

1. Abordare arbitrară pe baza aplicării „regula de bază”. De exemplu, se presupune fără dovezi că pentru a obține rezultate exacte, eșantionul trebuie să fie de 5% din populație. Această abordare este simplă și ușor de implementat, dar nu se poate stabili acuratețea rezultatelor obținute. Cu o populație suficient de mare, poate fi și destul de scumpă.

Mărimea eșantionului poate fi setată pe baza anumitor condiții predeterminate. De exemplu, un client de cercetare de piață știe că atunci când studiază opinia publică, eșantionul este de obicei de 1000-1200 de persoane, așa că îi recomandă cercetătorului să rămână la această cifră. În cazul în care studiile anuale sunt efectuate pe o anumită piață, un eșantion de aceeași dimensiune este utilizat în fiecare an. Spre deosebire de prima abordare, aici, la determinarea mărimii eșantionului, se folosește logica cunoscută, care însă este foarte vulnerabilă.

De exemplu, atunci când se efectuează anumite studii, acuratețea poate fi mai mică decât în ​​studiul opiniei publice, iar dimensiunea populației poate fi de multe ori mai mică decât în ​​studiul opiniei publice. Astfel, această abordare nu ține cont de circumstanțele actuale și poate fi destul de costisitoare.

În unele cazuri, costul efectuării unui sondaj este folosit ca argument principal în determinarea mărimii eșantionului. Astfel, bugetul pentru cercetare de marketing prevede costul efectuării unor sondaje, care nu poate fi depășit. Evident, nu se ține cont de valoarea informațiilor primite. Cu toate acestea, în unele cazuri, chiar și un eșantion mic poate da rezultate destul de precise.

Pare rezonabil să luăm în considerare costurile nu într-un mod absolut, ci în raport cu utilitatea informațiilor obținute în urma anchetelor. Clientul și cercetătorul ar trebui să ia în considerare diferite dimensiuni ale eșantionului și metode de colectare a datelor, costuri, alți factori

2. Mărimea eșantionului de la nivelul intervalului de încredere al erorii admisibile, care, după cum s-a menționat deja, este dată de acuratețea oportună a generalizărilor finale: de la crescut la aproximativ. Totuși, aici avem în vedere așa-numitele erori aleatorii asociate cu natura oricăror erori statistice. Acestea sunt calculate ca erori ale reprezentativității eșantioanelor probabilistice.

V. I. Paniotto oferă următoarele calcule ale unui eșantion reprezentativ cu ipoteza unei erori de 5 procente (Tabelul 4.2).

Tabelul 4.2

Tabel eșantion estimat

Pentru o populație de peste 100.000, eșantionul este de 400 de unități. Dacă, totuși, avem în vedere populații generale de 5 mii sau mai mult, atunci, conform calculelor aceluiași autor, este posibil să se indice mărimea erorii efective de eșantionare în funcție de volumul acesteia, ceea ce este foarte important pentru noi. , având în vedere că amploarea erorii admisibile depinde de scopul cercetării și nu trebuie neapărat să se apropie de nivelul de 5%.

Tabelul 4.3

Tabel de calcul

Alături de erorile aleatorii, sunt posibile erorile sistematice. Acestea depind de organizarea anchetei prin sondaj. Acestea sunt diverse prejudecăți ale eșantionului către unul dintre polii parametrului eșantionului.

3. Mărimea eșantionului pe baza analizei statistice . Această abordare se bazează pe determinarea dimensiunii minime a eșantionului pe baza anumitor cerințe pentru fiabilitatea și fiabilitatea rezultatelor. Este utilizat și în analiza rezultatelor obținute pentru subgrupuri individuale formate ca parte a unui eșantion pe sex, vârstă, nivel de educație etc. Cerințele pentru fiabilitatea și acuratețea rezultatelor pentru subgrupuri individuale dictează anumite cerințe pentru dimensiunea eșantionului în ansamblu.

Cea mai justificată și corectă abordare teoretic pentru determinarea mărimii eșantionului se bazează pe calcularea intervalelor de încredere. Conceptul de variație caracterizează cantitatea de diferență (asemănarea) răspunsurilor respondenților la o anumită întrebare. Într-un sens mai strict, variația valorilor unei caracteristici în agregat este diferența dintre valorile sale între diferite unități ale agregatului dat în aceeași perioadă sau moment în timp. Rezultatele răspunsurilor la întrebările sondajului sunt de obicei prezentate sub forma unei curbe de distribuție (Fig. 4.1). Cu o asemănare mare a răspunsurilor, ei vorbesc de o variație mică (curbă de distribuție îngustă) și cu o asemănare scăzută a răspunsurilor, o variație mare (curba de distribuție largă).

Ca măsură a variației, se ia de obicei abaterea standard, care caracterizează distanța medie față de scorul mediu al răspunsurilor fiecărui respondent la o anumită întrebare.

Mică variație

variație mare

Orez. 4.1. Curbe de variație și distribuție

Deoarece toate deciziile de marketing sunt luate în condiții de incertitudine, este recomandabil să se țină cont de această circumstanță atunci când se determină dimensiunea eșantionului. Deoarece definirea valorilor studiate pentru o populație într-o populație restrânsă se realizează pe baza statisticilor eșantionului, este necesar să se stabilească intervalul (interval de încredere) în care estimările pentru populația în ansamblu sunt de așteptat să căderea și eroarea în determinarea lor.

Un interval de încredere este un interval ale cărui puncte extreme corespund unui anumit procent din anumite răspunsuri la o întrebare. Intervalul de încredere este strâns legat de abaterea standard a trăsăturii studiate în populația generală: cu cât este mai mare, cu atât intervalul de încredere ar trebui să fie mai larg pentru a include un anumit procent de răspunsuri.

Un interval de încredere de 95% sau 99% este standard în cercetarea de marketing. Nicio firmă nu efectuează cercetări de piață cu mai multe mostre. Iar statistica matematică face posibilă obținerea unor informații despre distribuția eșantionului, având doar date despre variația unui singur eșantion.

Un indicator al măsurii în care o estimare care este adevărată pentru populația în ansamblu diferă de o estimare care este așteptată pentru un eșantion tipic este eroarea standard. În plus, cu cât dimensiunea eșantionului este mai mare, cu atât eroarea este mai mică. O valoare mare de variație determină o valoare mare de eroare și invers.

Când o întrebare dată are doar două răspunsuri, exprimate ca procent (se folosește o măsură procentuală), dimensiunea eșantionului este determinată de următoarea formulă:

unde n este dimensiunea eșantionului; z este abaterea normalizată determinată pe baza nivelului de încredere selectat; p este variația găsită pentru eșantion; g - (100-p); e este o eroare acceptabilă.

La determinarea indicatorului de variație pentru o anumită populație, este în primul rând recomandabil să se efectueze o analiză calitativă preliminară a populației studiate, în primul rând, pentru a stabili asemănarea unităților populației din punct de vedere demografic, social și de altă natură. de interes pentru cercetător. Este posibil să se efectueze un studiu pilot, folosind rezultatele unor studii similare efectuate în trecut. Atunci când se utilizează o măsură procentuală a variabilității, se ia în considerare împrejurarea că variabilitatea maximă este atinsă pentru p = 50%, care este cel mai rău caz. În plus, acest indicator nu afectează radical dimensiunea eșantionului. Se ia in considerare si opinia clientului studiului asupra marimii esantionului.

Este posibil să se determine dimensiunea eșantionului pe baza utilizării mediilor mai degrabă decât a procentelor.

unde s este abaterea standard.

În practică, dacă eșantionul este format din nou și nu au fost efectuate anchete similare, atunci s nu este cunoscut. În acest caz, este recomandabil să specificați eroarea e în fracțiuni din abaterea standard. Formula de calcul este convertită și ia următoarea formă:

Unde .

Mai sus, am vorbit despre agregate de dimensiuni foarte mari. Cu toate acestea, în unele cazuri populațiile nu sunt mari. De obicei, dacă eșantionul este mai mic de cinci procente din populație, atunci populația este considerată mare și calculele sunt efectuate conform regulilor de mai sus. Dacă dimensiunea eșantionului depășește 5% din populație, atunci aceasta din urmă este considerată mică și se introduce un factor de corecție în formulele de mai sus.

Mărimea eșantionului în acest caz este determinată după cum urmează:

,

Lucrare practică nr. 8. „Determinarea dimensiunii eșantionului necesar”

„Determinarea dimensiunii eșantionului necesar”

Cel mai răspândit tip de observație discontinuă este observația selectivă, în care nu sunt examinate toate unitățile populației studiate, ci doar o anumită parte dintre acestea sunt selectate.

Se numește întregul set de obiecte (observații) de studiat populatia generala. Populație sau eșantion de eșantion numită partea populației generale, selectată pentru studiul proprietăților care oferă reprezentativitate.

Selecția din populația generală se realizează în așa fel încât, pe baza eșantionului, să se poată obține o idee destul de exactă a parametrilor principali ai populației în ansamblu. În acest caz, vorbim atât de o estimare punctuală, care este luată ca valoare corespunzătoare a mediei, cotei etc., obținute ca urmare a eșantionului, cât și de o estimare de interval, i.e. despre limitele în care, cu o anumită probabilitate, se poate afla valoarea parametrului dorit în populația generală. Principala cerință pe care trebuie să o îndeplinească eșantionul este cerința reprezentativității sale, adică. reprezentativitate.

În statistică, rezultatele observării continue sunt uneori evaluate ca caracteristici selective. O astfel de interpretare a datelor obținute are loc în cazurile în care numărul de unități examinate este mic și nu există convingerea fermă că caracteristicile studiate nu pot lua alte valori decât cele identificate ca urmare a observației. Atunci când se efectuează experimente, numărul de valori poate fi infinit de mare, prin urmare, atunci când se formulează concluzii pe baza numărului lor limitat, este necesar să se ia în considerare datele obținute ca caracteristici selective.

La extinderea rezultatelor unei anchete prin sondaj la populația generală, trebuie avut în vedere că poate exista o discrepanță între caracteristicile populației generale și ale populației eșantionate, din cauza faptului că nu întreaga populație este chestionată, ci doar o parte. din ea.

Eroare de observare statistică se ia în considerare valoarea abaterii dintre valorile calculate și cele reale ale caracteristicilor obiectelor studiate.

Metoda de eșantionare asigură economii semnificative de resurse materiale și financiare la efectuarea observației statistice, ceea ce face posibilă extinderea programului de anchetă și creșterea eficienței acestuia. Al doilea avantaj este fiabilitatea ridicată a datelor obținute, deoarece cu o dimensiune relativ mică a eșantionului, este posibil să se organizeze un control eficient asupra calității informațiilor colectate. Astfel, probabilitatea de apariție a erorilor de înregistrare și nedetectarea acestora în etapa de verificare a informațiilor primare este redusă. Și, în sfârșit, într-o serie de cazuri, când observarea continuă este asociată cu distrugerea sau deteriorarea unităților examinate (de exemplu, la verificarea calității produselor alimentare care intră pe piață), este posibilă doar o anchetă selectivă.

Acuratețea estimărilor obținute pe baza metodei de eșantionare nu depinde de proporția unităților chestionate, ci de numărul acestora.

Principalele etape ale observației selective;

1) determinarea scopului, sarcinilor și întocmirea unui program de observare;

2) prelevarea de probe;

3) colectarea datelor pe baza programului elaborat;

4) analiza rezultatelor obţinute şi calculul principalelor caracteristici ale probei;

5) calculul erorii de eșantionare și distribuția rezultatelor acesteia către populația generală.

Distinge tipuri de mostre:

1) Aleatoriu(de fapt aleatoriu);

2) mecanic(de exemplu, la fiecare 10, 20 etc.);

3) tipic (stratificat), când populația generală este împărțită în grupuri și sunt examinate mai multe obiecte în fiecare grupă));

4) serial (cuibărit) atunci când serii întregi sunt selectate aleatoriu.

Cel mai simplu mod de a forma o populație eșantion este să selecție aleatorie adecvată. Fundamentele teoretice ale metodei de eșantionare, dezvoltate inițial în raport cu selecția aleatorie reală, sunt de asemenea folosite pentru a determina erorile de eșantionare în alte metode de observare.

De fapt, selecția aleatorie poate fi repetată și nerepetată. La repetate La selecție, fiecare unitate selectată la întâmplare din populația generală, după ce observația este returnată acestei populații, poate fi reexaminată. În practică, această metodă de selecție este rară. Mult mai frecvent este de fapt aleatoriu nerepetitive selecție în care unitățile chestionate nu sunt returnate populației și nu pot fi reevaluate. La selecția repetată, probabilitatea de a fi inclus în eșantion pentru fiecare unitate a populației generale rămâne neschimbată. La selecția nerepetitivă, se modifică, dar pentru toate unitățile rămase în populația generală după selectarea mai multor unități din aceasta, probabilitatea de a fi incluse în eșantion este aceeași.

Acuratețe - gradul de eroare în rezultatele sondajului sau dimensiunea intervalului de încredere.

Precizia absolută este dată de un anumit interval în care ar trebui să fie valoarea estimată.

Precizia relativă este definită în raport cu nivelul de estimare a parametrilor.

Încrederea este gradul de încredere că o estimare este aproape de valoarea reală.

La determinarea dimensiunii eșantionului trebuie luați în considerare mai mulți factori calitativi: importanța deciziei care trebuie luată, natura studiului, numărul de variabile, natura analizei, dimensiunile eșantionului utilizat în astfel de studii, acoperirea rata, rata de finalizare și constrângerile de resurse. Mărimea eșantionului determinată statistic este dimensiunea netă sau finală a eșantionului, adică unități de populație rămase după excluderea potențialilor respondenți care nu îndeplinesc criteriile date sau nu au finalizat interviul. În funcție de ratele de acoperire și de exhaustivitate, poate fi necesară o dimensiune inițială a eșantionului mult mai mare. În cercetarea de marketing comercial, lipsa de timp, bani și oameni buni pot fi esențiale în determinarea dimensiunii eșantionului. În cadrul Proiectului de studiu de loialitate a magazinelor universale, mărimea eșantionului a fost determinată tocmai din aceste motive.

Metoda intervalului de încredere:

Determinarea mărimii eșantionului prin metoda intervalelor de încredere se bazează pe crearea acestora în jurul mediei eșantionului sau al fracției eșantionului folosind formula de eroare standard. De exemplu, să presupunem că un cercetător folosește eșantionarea aleatorie simplă pentru a selecta un eșantion de 300 de gospodării pentru a estima cheltuielile lunare ale unei gospodării pentru cumpărături la un magazin universal și determină că cheltuielile medii lunare ale gospodăriilor din eșantion sunt de 182 USD. Studiile anterioare au arătat că RMS abaterea cheltuielilor în populația studiată este de 55 USD.

Dorim să găsim un interval în care să scadă un anumit procent din mediile eșantionului. Să presupunem că dorim să definim un interval în jurul mediei populației care ar include 95% din mediile eșantionului, pe baza unui eșantion de 300 de familii; 95% din mediile eșantionului pot fi împărțite în două părți egale, jumătate mai puțin și jumătate mai mult decât media, așa cum se arată în Fig. 1. Calculul intervalului de încredere include determinarea ariei mai mici de (XL) și mai mari decât (XU) a valorii medii (X) a cheltuielilor.

Valorile factorului z corespunzătoare XL și XU pot fi calculate după cum urmează:

Prin urmare, valoarea minimă a lui X este definită ca

și valoarea maximă

Acum să stabilim un interval de încredere de 95% în jurul mediei eșantionului de 182 USD. Mai întâi, vom calcula eroarea standard a mediei:

95% central din distribuția normală se află în valorile z de ?1,96; Intervalul de încredere de 95% este definit ca

Astfel, intervalul de încredere de 95% se extinde de la 175,77 USD la 188,23 USD Există o șansă de 95% ca adevărata medie a populației observate să fie între 175,77 USD și 188,23 USD.

Metoda medie:

Metoda utilizată pentru a crea intervalul de încredere poate fi modificată pentru a determina dimensiunea eșantionului având în vedere intervalul de încredere dorit. Să presupunem că doriți să calculați mai precis cheltuielile lunare ale magazinelor universale ale familiei, astfel încât rezultatul să se situeze la 5,0 USD din media reală a populației studiate. Care ar trebui să fie dimensiunea eșantionului? Tabelul conține lista necesară de acțiuni pe care trebuie să le efectuați.


  • 1. Determinați gradul de precizie. Aceasta este diferența maximă admisă (D) între media eșantionului și media populației. În exemplul nostru, D = +5,0 USD
  • 2. Specificați nivelul de încredere. Să presupunem că nivelul de încredere dorit este de 95%.
  • 3. Determinați valoarea abaterii normalizate z asociată cu nivelul de încredere dat. La nivelul de încredere de 95%, probabilitatea ca media populației să se încadreze în afara intervalului unilateral este de 0,025 (0,05/2). Valoarea z corespunzătoare este 1,96.
  • 4. Determinați abaterea standard a mediei populației. Poate fi obținut din surse secundare sau calculat dintr-un studiu pilot. În plus, abaterea standard poate fi stabilită pe baza opiniei cercetătorului. De exemplu, intervalul unei variabile distribuite normal este de aproximativ șase abateri standard (trei la stânga și trei la dreapta mediei).

5. Determinați dimensiunea eșantionului folosind formula pentru eroarea standard a mediei

În exemplul nostru

(rotunjit la cel mai apropiat număr întreg).

Din formula mărimii eșantionului se poate observa că aceasta crește odată cu creșterea variabilității (dispersiei) populației generale, precum și cu creșterea nivelului de fiabilitate și a gradului de acuratețe cu care trebuie efectuate calculele. . Mărimea eșantionului este direct proporțională cu Q2, prin urmare, cu cât varianța populației este mai mare, cu atât dimensiunea eșantionului este mai mare. În mod similar, un nivel de încredere mai mare implică o valoare z mai mare și, prin urmare, o dimensiune mai mare a eșantionului. Variabilele Q2 și z sunt la numărător. Creșterea gradului de precizie se realizează prin scăderea valorii lui D și, prin urmare, crește dimensiunea eșantionului, deoarece D este la numitor.

6. Dacă dimensiunea eșantionului este de 10% sau mai mult din dimensiunea populației, atunci se aplică ajustarea finală a populației (fpc). Apoi dimensiunea eșantionului necesară este calculată prin formula

7. Dacă abaterea standard a populației o este necunoscută și este utilizată valoarea estimată a acesteia, atunci aceasta trebuie recalculată după obținerea eșantionului. Deviația standard a eșantionului s este utilizată ca estimare pentru Q. Intervalul de încredere corectat ar trebui apoi calculat pentru a determina gradul de acuratețe efectiv obținut.

Să presupunem că valoarea 55,00 a fost folosită ca estimare pentru a, deoarece valoarea adevărată a fost necunoscută. S-a obţinut un eşantion în care n = 465. Pe baza datelor studiului se calculează media X, egală cu 180,00, iar abaterea standard a probei s, egală cu 50,00. Atunci intervalul de încredere corectat va fi:

Rețineți că intervalul de încredere rezultat este deja estimat. Acest lucru se datorează faptului că abaterea standard a populației este supraestimată pe baza caracteristicilor eșantionului.

8. Uneori acuratețea este definită mai degrabă în termeni relativi decât absoluti. Cu alte cuvinte, se poate ști că rezultatul calculului ar trebui să fie plus sau minus R% din medie. În acest caz, dimensiunea eșantionului poate fi definită ca

Mărimea populației N nu afectează direct dimensiunea eșantionului, cu excepția cazului în care se aplică un factor final de ajustare a populației. Poate părea incredibil, dar dacă te gândești bine, această afirmație are sens. De exemplu, dacă caracteristicile studiate ale tuturor elementelor populației sunt identice, atunci un eșantion format dintr-un element este suficient pentru a calcula media. Acest lucru este corect și dacă populația este formată din 50, 500, 5000 sau 50.000 de elemente. În același timp, variabilitatea caracteristicilor populației afectează în mod direct dimensiunea eșantionului. Această variabilitate este luată în considerare atunci când se calculează dimensiunea eșantionului utilizând varianța generală Q2 sau varianța eșantionului s2.

Metoda de distribuire:

Dacă statistica studiată este reprezentată nu de medie, ci de cotă, atunci marketerul determină dimensiunea eșantionului în același mod. Să presupunem că cercetătorul este interesat să determine proporția de gospodării care dețin un card de credit al unui magazin universal. Procedura va fi după cum urmează.

1. Specificați gradul de precizie. Să presupunem că gradul de precizie dorit este astfel încât intervalul de toleranță este setat la

D \u003d p - l \u003d ± 0,05.

  • 2. Specificați nivelul de încredere. Să presupunem că se dorește un nivel de încredere de 95%.
  • 3. Determinați valoarea z asociată cu nivelul de încredere dat. După cum sa explicat la calcularea mediei, aceasta va fi 1,96.
  • 4. Determinați fracția totală a lui n. După cum am indicat mai devreme, aceasta poate fi obținută din surse secundare, în cursul unui studiu experimental, sau pe baza opiniei cercetătorului. Să presupunem că, pe baza unor date secundare, cercetătorul face ipoteza că 64% dintre familiile din populația studiată au un card de credit pentru magazine universale. Prin urmare, l = 0,64.
  • 5. Determinați dimensiunea eșantionului folosind formula de eroare standard a proporției:

În exemplul nostru

  • (rotunjit la cel mai apropiat număr întreg).
  • 6. Dacă dimensiunea finală a eșantionului este de 10% sau mai mult din dimensiunea populației, se aplică o ajustare finală a populației (fpc). Apoi dimensiunea eșantionului necesară este calculată prin formula

unde n este dimensiunea eșantionului înainte de aplicarea corecției finale; nc este dimensiunea eșantionului după aplicarea corecției finale.

7. Dacă calculul TC a fost greșit, atunci intervalul de încredere va fi mai mult sau mai puțin precis decât este necesar. Să presupunem că la sfârșitul eșantionului se calculează valoarea cotei p egală cu 0,55. Intervalul de încredere este apoi recalculat, sp fiind utilizat pentru a calcula Qp necunoscut, după cum urmează:

În exemplul nostru

Intervalul de încredere este atunci 0,55 ± 1,96 (0,0264) = 0,55 + 0,052, ceea ce înseamnă că este mai larg decât ceea ce a fost specificat. Acest lucru se explică prin faptul că abaterea standard a eșantionului p = 0,55 s-a dovedit a fi mai mare decât valoarea estimată a abaterii standard a populației generale la n = 0,64.

Dacă un interval mai mare decât intervalul specificat este inacceptabil, dimensiunea eșantionului poate fi ajustată pentru a reflecta abaterea maximă posibilă în populație. O astfel de abatere apare atunci când produsul l (1 - l) atinge valoarea sa maximă, pentru care l trebuie să fie egal cu 0,5. La această concluzie se poate ajunge fără calcule. Deoarece jumătate din populație are o valoare caracteristică, iar cealaltă jumătate are alta, vor fi necesare mai multe date pentru a trage o concluzie corectă decât atunci când situația este mai clar definită și majoritatea elementelor au aceeași valoare caracteristică. În exemplul nostru, aceasta va avea ca rezultat o dimensiune a eșantionului de

  • (rotunjit la cel mai apropiat număr întreg).
  • 8. Uneori acuratețea este definită mai degrabă în termeni relativi decât absoluti. Cu alte cuvinte, se poate ști că rezultatul calculului ar trebui să fie plus sau minus R% din proporția populației. Aceasta înseamnă că D = Rl. În acest caz, dimensiunea eșantionului poate fi definită ca