Eșantion reprezentativ. Probă

obiectivele de învățare

  1. Este clar să se facă distincția între conceptele de recensământ (calificare) și eșantionare.
  2. Cunoașteți esența și succesiunea celor șase etape implementate de cercetători pentru a obține o populație eșantion.
  3. Definiți conceptul de „cadru de eșantionare”.
  4. Explicați diferența dintre eșantionarea probabilistică și cea deterministă.
  5. Distingeți între eșantionarea cu dimensiune fixă ​​și eșantionarea în mai multe etape (consecutive).
  6. Explicați ce este eșantionarea deliberată și descrieți atât punctele sale tari, cât și punctele slabe.
  7. Definiți conceptul de eșantionare în cote.
  8. Explicați ce este un parametru într-o procedură de selecție.
  9. Explicați ce este o mulțime derivată.
  10. Explicați de ce conceptul de distribuție a eșantionării este cel mai important concept de statistică.

Așadar, cercetătorul a definit problema cu precizie și a asigurat proiectarea cercetării și instrumentele de colectare a datelor adecvate pentru rezolvarea acesteia. Următorul pas în procesul de cercetare ar trebui să fie selectarea acelor elemente care urmează să fie examinate. Este posibil să se examineze fiecare element al unei populații date făcând un recensământ complet al acestei populații. Un studiu complet al populației se numește recensământ (calificare). Există o altă posibilitate. O anumită parte a populației, un eșantion de elemente dintr-un grup mare, este supusă examinării statistice, iar conform datelor obținute pe acest subset se trag anumite concluzii cu privire la întregul grup. Capacitatea de a generaliza rezultatele obținute din datele eșantionului la un grup mare depinde de metoda prin care a fost prelevat proba. O mare parte din acest capitol va fi dedicată modului în care ar trebui extras eșantionul și de ce.

Recensământ (calificare)
Recensământul complet al populației (populației).
Probă
O colecție de elemente ale unui subset al unui grup mai mare de obiecte.

Conceptul de „populație” sau „colecție” se poate referi nu numai la oameni, ci și la firmele care activează în industria prelucrătoare, la comercianți cu amănuntul sau angrosisti, sau chiar la obiecte complet neînsuflețite, cum ar fi piesele produse de întreprindere; acest concept este definit ca întregul ansamblu de elemente care satisfac anumite condiţii date. Aceste condiții definesc în mod unic atât elementele care aparțin grupului țintă, cât și elementele care ar trebui excluse din luare în considerare.

Un studiu care își propune să determine profilul demografic al consumatorilor de pizza congelată ar trebui să înceapă prin a identifica cine ar trebui și nu ar trebui să fie clasificat ca atare. Oamenii care au încercat măcar o dată astfel de pizza aparțin acestei categorii? Persoane fizice care cumpără cel puțin o pizza pe lună? In saptamana? Persoane care mănâncă mai mult de o anumită cantitate minimă de pizza într-o lună? Cercetatorul trebuie sa fie foarte precis in determinarea grupului tinta. De asemenea, trebuie avut grijă să se asigure că eșantionul este extras din populația țintă și nu din „o anumită” populație, ceea ce este cazul când cadrul de eșantionare este inadecvat sau incomplet. Acesta din urmă este o listă de elemente din care se va forma o probă reală.

Un cercetător poate prefera o abordare prin eșantionare unui sondaj asupra întregii populații din mai multe motive. În primul rând, o examinare completă a unei populații, chiar și de dimensiuni relativ mici, necesită costuri foarte mari de material și timp. Adesea, în momentul în care recensământul este finalizat și datele sunt procesate, informațiile sunt deja depășite. În unele cazuri, calificarea este pur și simplu imposibilă. Să presupunem că cercetătorii și-au propus să verifice conformitatea duratei de viață efective a lămpilor electrice cu incandescență cu cea calculată, pentru care trebuie să le țină aprinse până când se defectează. Dacă examinați întreaga aprovizionare de lămpi în acest fel, se vor obține date fiabile, dar nu va exista nimic de tranzacționat.

În cele din urmă, spre marea uimire a începătorilor, cercetătorul poate prefera eșantionarea în locul recensământului, străduindu-se pentru acuratețea rezultatelor. Recensămintele necesită un personal mare, ceea ce crește probabilitatea unor erori de părtinire (neeșantionare). Această împrejurare este unul dintre motivele pentru care Biroul de Recensământ din SUA utilizează sondaje prin sondaj pentru a testa acuratețea diferitelor tipuri de recensământ. Ai citit bine: pot fi efectuate sondaje prin sondaj pentru a testa acuratețea datelor de calificare.

Exemple de etape de proiectare

Pe fig. Figura 15.1 prezintă o secvență în șase pași pe care un cercetător o poate urma atunci când proiectează un eșantion. În primul rând, este necesar să se determine populația țintă sau setul de elemente despre care cercetătorul dorește să știe ceva.

De exemplu, atunci când studiază preferințele copiilor, cercetătorii trebuie să decidă dacă populația țintă va consta numai din copii, numai părinți sau ambii.

Agregat (populație)
Un set de elemente care satisfac anumite condiții date.
Cadru de eșantionare (bază)
Lista elementelor din care se va face selecția; poate consta din unități teritoriale, organizații, persoane și alte elemente.

O anumită companie și-a testat „cursele” electrice doar pe copii. Copiii au fost complet încântați. Părinții au reacționat diferit la noutate. Mamicilor nu le-a placut faptul ca atractia nu i-a invatat pe copii sa fie prietenosi cu masina, iar taticilor nu le-a placut faptul ca produsul a fost facut ca o jucarie.
Este posibilă și situația inversă. O firmă a lansat un nou produs alimentar și a lansat o campanie publicitară la nivel național care s-a concentrat pe copilul precoce.Firma a testat eficiența reclamelor doar pe mamele care au fost încântate de încântare. Copiii, în schimb, au găsit dezgustătoare această „accelerare”, și odată cu ea și produsul reclamat. Produs terminat 1 .

Cercetătorul trebuie să decidă din cine sau din ce va consta populația relevantă: indivizi, familii, firme, alte organizații, tranzacții cu cardul de credit etc. În luarea unor astfel de decizii, este necesar să se determine elementele care ar trebui excluse din populații. Trebuie făcute atât referirea temporală, cât și geografică a elementelor, care în unele cazuri pot face obiectul unor condiții sau restricții suplimentare. De exemplu, dacă vorbim de indivizi, populația dorită poate fi formată numai din persoane cu vârsta peste 18 ani, sau numai din femei, sau numai din persoane cu studii medii cel puțin.

Sarcina de a determina granițele geografice pentru populația țintă în cercetarea internațională de marketing poate fi o problemă deosebită, deoarece aceasta crește eterogenitatea sistemului în cauză. De exemplu, raportul relativ dintre zonele urbane și rurale poate varia semnificativ de la o țară la alta. Aspectul teritorial are un impact grav asupra compoziției populației și în cadrul aceleiași țări. De exemplu, în nordul Chile, o populație predominant indiană trăiește compact, în timp ce în regiunile sudice ale țării trăiesc în principal descendenți ai europenilor.

Acoperire (incident)
Procentul de membri ai unei populații sau grup care îndeplinesc condițiile pentru includerea în eșantion.

În general, cu cât populația țintă este mai simplă definită, cu atât este mai mare acoperirea (incidența) a acesteia și procedura de eșantionare este mai ușoară și mai ieftină. Acoperire (incident) corespunde proporției de elemente dintr-o populație sau grup, exprimată în procente, care îndeplinesc condițiile de includere în eșantion. Acoperirea afectează în mod direct timpul și costurile materiale necesare pentru efectuarea unui sondaj. Dacă acoperirea este mare (adică majoritatea elementelor populației îndeplinesc unul sau mai multe dintre criteriile simple utilizate pentru identificarea potențialilor respondenți), timpul și costurile materiale necesare pentru colectarea datelor sunt minimizate. În schimb, odată cu creșterea numărului de criterii pe care potențialii respondenți trebuie să le îndeplinească, atât costurile materiale, cât și cele de timp cresc.

Pe fig. 15.2 arată proporția populației adulte implicată în anumite sporturi. Datele din figură indică faptul că este mult mai dificil și mai costisitor să se examineze persoanele care merg la motocicletă (doar 3,6% din numărul total de adulți) decât să se examineze persoanele care fac plimbări recreative regulate (27,4% din numărul total de persoane). adulti). Principalul lucru este ca cercetătorul să fie precis în a determina ce elemente ar trebui incluse în populația de studiu și ce elemente ar trebui excluse din aceasta. O declarație clară a scopului studiului facilitează foarte mult rezolvarea acestei probleme. Al doilea pas în procesul de selecție a probei este determinarea cadrului de eșantion, care, după cum știți deja, este lista de elemente din care va fi extras eșantionul. Fie ca populația țintă a unui anumit studiu să fie toate familiile care trăiesc în zona Dallas. La prima vedere, directorul telefonic din Dallas ar putea fi un cadru de eșantionare bun și ușor accesibil. Cu toate acestea, la o examinare mai atentă, devine evident că lista familiilor cuprinsă în director nu este în întregime corectă, deoarece în ea sunt omise numerele unor familii (desigur, nu include familiile care nu au telefon), în timp ce unele familii au mai multe numere de telefon . Persoanele care și-au schimbat recent locul de reședință și, în consecință, numărul de telefon, nu sunt, de asemenea, prezente în agendă.

Cercetătorii cu experiență ajung la concluzia că o potrivire exactă între cadrul de eșantionare și populația țintă de interes este foarte rară. Unul dintre cei mai creativi pași în proiectarea unui eșantion este determinarea unui cadru de eșantionare adecvat în cazurile în care listarea elementelor populației este dificilă. Acest lucru poate necesita eșantionare din blocuri de lucru și prefixe atunci când, de exemplu, apelarea aleatorie este utilizată din cauza deficiențelor agendelor telefonice. Cu toate acestea, creșterea semnificativă a unităților de muncă din ultimii 10 ani a făcut această sarcină mai dificilă. Situații similare pot apărea și în cazul observării selective a zonelor sau organizațiilor teritoriale, urmată de prelevarea de subeșantioane, atunci când, să zicem, populația țintă este indivizi, dar nu există o listă exactă la zi a acestora.

Sursa: pe baza datelor cuprinse în SSI- LITe TM: L ow Incidenţă T vizate S ampling" (Fairfield, Connecticut: Survey Sampling, Inc., 1994).

Al treilea pas din procedura de eșantionare este strâns legat de determinarea cadrului de eșantionare. Alegerea metodei sau procedurii de eșantionare depinde în mare măsură de cadrul de eșantionare adoptat de cercetător. Diferite tipuri de probe necesită diferite tipuri de cadre de eșantionare. Acest capitol și următorul capitol vor oferi o privire de ansamblu asupra principalelor tipuri de mostre utilizate în cercetarea de marketing. Când le descriem, legătura dintre cadrul de eșantionare și metoda de formare a acestuia ar trebui să devină evidentă.

Al patrulea pas în procedura de eșantionare este determinarea dimensiunii eșantionului. Această problemă este discutată în cap. 17. La a cincea etapă, cercetătorul trebuie să selecteze efectiv elementele care vor fi supuse sondajului. Metoda utilizată pentru aceasta este determinată de tipul de eșantion ales; atunci când discutăm despre metodele de eșantionare, vom vorbi și despre selecția elementelor acesteia. Și, în sfârșit, cercetătorul trebuie să examineze efectiv respondenții identificați. În această etapă, există o probabilitate mare de a comite o serie de erori.
Aceste probleme și unele metode de rezolvare a acestora sunt discutate în Cap. optsprezece.

Tipuri de planuri de eșantionare (eșantionare)

Toate metodele de eșantionare pot fi împărțite în două categorii: observarea probelor probabilistice și observarea eșantioanelor deterministe. Într-un eșantion probabilistic, fiecare membru al populației poate fi inclus cu o anumită probabilitate specificată diferită de zero. Probabilitatea includerii anumitor membri ai populației în eșantion poate fi diferită, dar probabilitatea includerii fiecărui element în el este cunoscută. Această probabilitate este determinată de o procedură mecanică specială utilizată pentru selectarea membrilor eșantionului.

Pentru eșantioanele deterministe, estimarea probabilității includerii oricărui element în eșantion devine imposibilă. Reprezentativitatea unui astfel de eșantion nu poate fi garantată. De exemplu, Allstate Corporation dezvolta un sistem de procesare a datelor privind daunele a 14 milioane de gospodării (clienții săi). Compania intenționează să folosească aceste date pentru a determina modele de cerere pentru serviciile sale, cum ar fi probabilitatea ca o gospodărie care deține un Mercedes Benz să dețină și o casă de vacanță (care va necesita asigurare). Deși baza de date este foarte mare, compania nu are niciun mijloc de a estima probabilitatea ca un anumit client să facă o revendicare. Astfel, compania nu poate fi sigură că datele clienților care fac reclamații sunt reprezentative pentru toți clienții companiei; si intr-o masura si mai mica – in raport cu potentialii clienti.

Toate eșantioanele deterministe se bazează pe poziția personală, judecata sau preferința cercetătorului, mai degrabă decât pe o procedură de selecție mecanică pentru eșantionare. Astfel de preferințe pot oferi uneori estimări bune ale caracteristicilor populației, dar nu există nicio modalitate de a determina în mod obiectiv adecvarea eșantionului pentru sarcină. O evaluare a acurateții rezultatelor eșantionului poate fi făcută numai dacă au fost cunoscute probabilitățile de selectare a anumitor elemente. Din acest motiv, lucrul cu eșantionarea probabilă este de obicei considerată a fi o metodă mai bună pentru estimarea mărimii erorii de eșantionare. Probele pot fi, de asemenea, subdivizate în eșantioane de dimensiune fixă ​​și mostre secvențiale. Când se lucrează cu eșantioane de dimensiuni fixe, dimensiunea eșantionului este determinată înainte de începerea anchetei, iar analiza rezultatelor este precedată de colectarea tuturor datelor necesare. Vom fi interesați în principal de mostre de dimensiuni fixe, deoarece acest tip este de obicei folosit în cercetările de marketing.

Eșantionarea probabilă
Un eșantion în care fiecare element al populației poate fi inclus cu o probabilitate cunoscută diferită de zero.
Eșantionarea deterministă
Eșantionarea pe baza unor preferințe sau judecăți particulare care determină selecția anumitor elemente; în același timp, devine imposibil de estimat probabilitatea includerii unui element arbitrar al populației în eșantion.

Cu toate acestea, nu trebuie uitat că există și eșantioane secvențiale care pot fi utilizate cu fiecare dintre modelele de eșantionare de bază discutate mai jos.

Într-o probă secvenţială, numărul elementelor selectate nu este cunoscut în prealabil, acesta fiind determinat pe baza unei serii de decizii secvenţiale. Dacă o anchetă a unui eșantion mic nu conduce la un rezultat fiabil, gama de elemente de examinat este extinsă. Dacă rezultatul rămâne neconcludent după aceea, dimensiunea eșantionului este mărită din nou. În fiecare etapă, se ia o decizie dacă se consideră rezultatul obținut suficient de convingător sau dacă se continuă colectarea datelor. Lucrul cu eșantionarea secvențială face posibilă evaluarea tendinței (tendinței) datelor pe măsură ce acestea sunt colectate, ceea ce vă permite să reduceți costurile asociate cu observațiile suplimentare în cazurile în care oportunitatea lor este în zadar.

Atât planurile de eșantionare probabilistice, cât și deterministe se încadrează în mai multe tipuri. De exemplu, eșantioanele deterministe pot fi nereprezentative (conveniente), intenționate sau cote; eșantioanele probabilistice sunt împărțite în simple aleatorii, stratificate sau de grup (cluster), ele, la rândul lor, pot fi împărțite în subtipuri. Pe fig. Figura 15.3 prezintă tipurile de eșantioane care vor fi discutate în acest capitol și în următorul capitol.

Eșantion fix (Eșantion fix)
Un eșantion a cărui mărime este determinată a priori; informaţia cerută este determinată de elementele selectate.
Prelevare secvenţială
Un eșantion format pe baza unei serii de decizii succesive. Dacă, după luarea în considerare a unui eșantion mic, rezultatul este neconcludent, se ia în considerare un eșantion mai mare; dacă acest pas nu conduce la un rezultat, mărimea eșantionului crește din nou etc. Astfel, la fiecare etapă se ia o decizie dacă rezultatul obținut poate fi considerat suficient de convingător.

Trebuie amintit că tipurile de bază de probe pot fi combinate pentru a forma planuri de eșantionare mai complexe. Dacă înveți tipurile lor inițiale de bază, îți va fi mai ușor să faci față combinațiilor mai complexe.

Selecții deterministe

După cum sa menționat deja, la selectarea elementelor unui eșantion determinist, estimările sau deciziile private joacă un rol decisiv. Uneori aceste estimări provin de la cercetător, în timp ce în alte cazuri selecția elementelor populației este dată personalului de teren. Deoarece elementele nu sunt selectate mecanic, devine imposibil să se determine probabilitatea includerii unui element arbitrar în eșantion și, în consecință, eroarea de eșantionare. Ignorarea erorii din cauza procedurii de eșantionare aleasă îi împiedică pe cercetători să evalueze acuratețea estimărilor lor.

Mostre nereprezentative (de comoditate).

Mostre nereprezentative (de comoditate). uneori denumite aleatoriu, deoarece selecția elementelor eșantionului se realizează într-un mod „aleatoriu” - sunt selectate acele elemente care sunt sau par a fi cele mai accesibile în timpul perioadei de selecție.

Viața noastră de zi cu zi este plină de exemple de astfel de selecții. Discutam cu prietenii si, pe baza reactiilor si pozitiilor lor, tragem concluzii despre predilectiile politice predominante in societate; un post de radio local încurajează oamenii să-și exprime opinia cu privire la o problemă controversată, opinia lor este interpretată ca fiind predominantă; facem apel la cooperarea voluntarilor și lucrăm cu cei care se oferă voluntari pentru a ne ajuta. Problema cu eșantioanele de conveniență este evidentă – nu putem fi siguri că eșantioanele de acest fel reprezintă de fapt populația țintă. Încă ne putem îndoi că opiniile prietenilor noștri reflectă corect opiniile politice predominante în societate, dar de multe ori vrem să credem că eșantioanele mai mari, selectate în acest fel, sunt reprezentative. Să arătăm eroarea unei astfel de presupuneri cu un exemplu.
În urmă cu câțiva ani, unul dintre posturile locale de televiziune din orașul în care locuiește autorul acestei cărți a realizat zilnic un sondaj de opinie publică pe teme de interes pentru comunitatea locală. Sondajele, numite „The Madison Pulse”, au fost efectuate după cum urmează. În fiecare seară, în cadrul știrilor de la ora șase, postul punea telespectatorilor o întrebare cu privire la o anumită problemă controversată, la care era necesar să se dea un răspuns pozitiv sau negativ.

În cazul unui răspuns pozitiv, a fost necesar să apelați unul, în cazul unui răspuns negativ - la un alt număr de telefon. Numărul de voturi „pentru” și „împotrivă” a fost numărat automat. Ştirile de la ora zece raportau rezultatele sondajului telefonic. În fiecare seară, între 500 și 1000 de persoane au sunat la studio pentru a-și exprima poziția cu privire la cutare sau cutare problemă; comentatorul de televiziune a interpretat rezultatele sondajului ca fiind opinia dominantă în societate.

Eșantion nereprezentativ (de comoditate).
Uneori numit aleatoriu, deoarece selectarea elementelor eșantionului se realizează într-un mod „aleatoriu” - sunt selectate acele elemente care sunt sau par a fi cele mai accesibile în timpul perioadei de selecție.

Într-unul dintre episoadele de șase ore, telespectatorilor li s-a adresat următoarea întrebare: „Nu crezi că vârsta de băut în Madison ar trebui să fie redusă la 18 ani?” Calificarea juridică existentă corespundea 21 de ani. Publicul a reacționat la această întrebare cu o activitate extraordinară – aproape 4.000 de persoane au sunat la studio în acea seară, dintre care 78% s-au declarat în favoarea scăderii limitei de vârstă. Pare clar că un eșantion de 4 000 „ar trebui să fie reprezentativ” pentru o comunitate de 180 000. Nimic de genul ăsta. După cum probabil ați ghicit, anumite grupe de vârstă au fost mai interesate de un rezultat cunoscut decât altele. În consecință, nu a fost surprinzător că în discuția despre această problemă, care a avut loc câteva săptămâni mai târziu, s-a dovedit că, în timpul alocat sondajului, studenții au acționat concertat. Au sunat la televizor pe rând, fiecare de mai multe ori. Astfel, nici dimensiunea eșantionului și nici procentul avocaților pentru liberalizarea legii nu au fost ceva surprinzător. Eșantionul nu a fost reprezentativ.

Simpla creștere a dimensiunii eșantionului nu îl face reprezentativ. Reprezentativitatea probei este asigurată nu de mărime, ci de procedura adecvată de selectare a elementelor. Atunci când participanții la sondaj sunt selectați voluntar sau elementele eșantionului sunt selectate pe baza disponibilității lor, planul de eșantionare nu garantează reprezentativitatea eșantionului. Dovezile empirice sugerează că eșantioanele alese pentru comoditate sunt rareori reprezentative (indiferent de mărimea lor). Sondajele telefonice, care iau în considerare 800-900 de voturi, sunt cea mai comună formă de eșantioane mari, dar nereprezentative.

Prelevarea de probe intenționată
Eșantionarea deterministă (țintită), ale cărei elemente sunt selectate manual; sunt selectate acele elemente care, în opinia cercetătorului, îndeplinesc obiectivele anchetei.
Eșantionarea intenționată, în funcție de capacitatea cercetătorului de a stabili setul inițial de respondenți cu caracteristicile dorite; atunci acești respondenți sunt utilizați ca informatori care determină selecția ulterioară a indivizilor.

Din păcate, mulți oameni tratează rezultatele unor astfel de sondaje cu încredere. Unul dintre cele mai tipice exemple de utilizare a eșantioanelor nereprezentative în cercetările internaționale de marketing este ancheta în anumite țări pe baza unui eșantion format din străini care locuiesc în prezent pe teritoriul țării care a inițiat ancheta (de exemplu, scandinavii care locuiesc în Statele Unite). Deși astfel de eșantioane pot aduce o oarecare lumină asupra anumitor aspecte ale populației luate în considerare, trebuie amintit că acești indivizi reprezintă de obicei o elită „americanizată”, a cărei legătură cu propria lor țară poate fi destul de arbitrară. Utilizarea de eșantioane nereprezentative nu este recomandată pentru anchetele descriptive sau cauzale. Ele sunt permise numai în cercetările exploratorii care vizează testarea anumitor idei sau idei, dar chiar și în acest caz este de preferat să se utilizeze mostre deliberate.

Selecții intenționate

Eșantioanele intenționate sunt uneori denumite neconcentrat; elementele acestora, care, în opinia cercetătorului, îndeplinesc obiectivele studiului, sunt selectate manual. Procter & Gamble a folosit această metodă când a afișat reclame persoanelor cu vârste cuprinse între 13 și 17 ani care locuiesc în apropierea sediului său din Cincinnati. Divizia de alimente și băuturi a companiei a angajat acest grup de adolescenți pentru a servi ca un fel de eșantion de consumator. Lucrând 10 ore pe săptămână în schimbul a 1.000 de dolari și mergând la un concert, s-au uitat la reclame de televiziune, au vizitat supermarketuri cu managerii companiei pentru a inspecta afișajele de produse, au testat produse noi și au discutat despre comportamentul de cumpărare. Selectând reprezentanți pentru eșantion printr-un proces de „angajare”, mai degrabă decât aleatoriu, o companie s-ar putea concentra pe trăsături pe care le considera utile, cum ar fi capacitatea unui adolescent de a se exprima clar, cu riscul ca opiniile lor să nu fie reprezentative pentru ceilalți. grupa lor de vârstă.

După cum sa menționat deja, trăsătura distinctivă a eșantionării deliberate este selecția direcțională a elementelor sale. În unele cazuri, elementele eșantionului sunt selectate nu pentru că sunt reprezentative, ci pentru că pot oferi cercetătorilor informații de interes pentru aceștia. Atunci când instanța se ghidează după mărturia unui expert, ea, într-un anumit sens, recurge la utilizarea unei selecții deliberate. O poziție similară poate prevala în dezvoltarea proiectelor de cercetare. În timpul studiului inițial al problemei, cercetătorul este interesat în primul rând de a determina perspectivele pentru studiu, care determină selecția elementelor eșantionului.

Eșantionare bulgăre de zăpadă este un tip de eșantionare deliberată utilizat atunci când se ocupă cu tipuri specifice de populații. Acest eșantion depinde de capacitatea cercetătorului de a specifica un set inițial de respondenți cu caracteristicile dorite. Acești respondenți sunt apoi utilizați ca informatori pentru a determina selecția ulterioară a indivizilor.

Imaginați-vă, de exemplu, că o companie dorește să evalueze necesitatea unui produs care să permită persoanelor surde să comunice la telefon. Cercetătorii pot începe să dezvolte această problemă prin identificarea unor figuri cheie din comunitatea surzilor; acesta din urmă ar putea numi alți membri ai grupului care ar fi de acord să participe la sondaj. Cu această tactică, proba crește ca un bulgăre de zăpadă.

În timp ce cercetătorul se află în fazele inițiale ale rezolvării problemelor, când sunt determinate perspectivele și posibilele limitări ale anchetei planificate, utilizarea eșantionării intenționate poate fi foarte eficientă. Dar în niciun caz nu trebuie să uităm de punctele slabe ale acestui tip de eșantion, deoarece acesta poate fi folosit și de către cercetător în studii descriptive sau cauzale, care nu vor întârzia să afecteze calitatea rezultatelor lor. Un exemplu clasic al acestei uitări este indicele prețurilor de consum („IPC”). După cum subliniază Südman ( Sudman): „IPC este determinat doar pentru 56 de orașe și zone metropolitane, a căror selecție este influențată și de factorul politic. De fapt, aceste orașe se pot reprezenta doar pe sine, în timp ce indexul este numit indicele prețurilor de consum pentru locuitorii orașului care câștigă salarii pe oră*, și angajatiși apare pentru majoritatea oamenilor ca un indice care reflectă nivelul prețurilor în orice zonă a Statelor Unite. Alegerea punctelor de vânzare cu amănuntul se face, de asemenea, non-aleatoriu, drept urmare estimarea posibilei erori de eșantionare devine imposibilă» (italicele noastre) 2 .

* Adică muncitori. - Notă. pe.

Mostre de cote

Al treilea tip de eșantionare deterministă − mostre de cotă; reprezentativitatea sa cunoscută se realizează prin includerea în el a aceleiași proporții de elemente cu anumite caracteristici ca și în populația chestionată (vezi „Fereastra de cercetare 15.1”). Ca exemplu, luați în considerare încercarea de a crea un eșantion reprezentativ de studenți care locuiesc în campus. Dacă nu există un singur elev senior într-un anumit eșantion de 500 de indivizi, vom avea dreptul să ne îndoim de reprezentativitatea acestuia și de validitatea aplicării rezultatelor obținute pe acest eșantion la populația examinată. Atunci când lucrează cu eșantionarea proporțională, cercetătorul se poate asigura că proporția studenților din eșantion corespunde proporției acestora în numărul total de studenți.

Să presupunem că un cercetător efectuează un studiu selectiv al studenților universitari, în timp ce el este interesat de faptul că eșantionul reflectă nu numai apartenența acestora la unul sau altul gen, ci și distribuția lor pe cursuri. Să fie numărul total de studenți de 10.000: 3.200 de boboci, 2.600 de studenți, 2.200 de studenți în anul III și 2.000 de studenți în anul IV; dintre care 7.000 de băieți și 3.000 de fete. Pentru o dimensiune a eșantionului de 1.000, planul de eșantionare proporțională necesită 320 de boboci, 260 de studenți, 220 de studenți și 200 de absolvenți, 700 de băieți și 300 de fete. Cercetătorul poate implementa acest plan acordând fiecărui intervievator o anumită cotă, care va determina ce studenți ar trebui să contacteze.

Eșantionarea cotelor Un eșantion determinist selectat în așa fel încât proporția elementelor eșantionului cu anumite caracteristici să corespundă aproximativ proporției acelorași elemente în populația studiată; fiecărui muncitor de teren i se atribuie o cotă care determină caracteristicile populaţiei cu care trebuie să contacteze.

Un intervievator care urmează să efectueze 20 de interviuri poate fi instruit să întrebe:

            • șase elevi din anul I - cinci băieți și o fată;
            • șase studenți - patru băieți și două fete;
            • patru elevi din anul III - trei băieți și o fată;
            • patru elevi din anul IV - doi băieți și două fete.

Rețineți că selecția elementelor specifice eșantionului nu este determinată de designul cercetării, ci de alegerea intervievatorului, care este chemat să respecte doar condițiile care au fost stabilite de cotă: intervievați cinci boboci, un boboc etc.

Rețineți, de asemenea, că această cotă reflectă cu acuratețe distribuția pe sexe a populației studențești, dar distorsionează oarecum distribuția studenților între cursuri; 70% (14 din 20) interviuri sunt cu băieți, dar doar 30% (6 din 20) cu elevi din anul I, în timp ce aceștia reprezintă 32% din numărul total de studenți. Cota alocată fiecărui intervievator individual poate să nu reflecte și de obicei nu reflectă distribuția caracteristicilor de control în populație – doar eșantionul final ar trebui să fie proporțional.

Trebuie amintit că eșantionarea proporțională depinde mai mult de atitudini sau judecăți personale, subiective decât de o procedură de eșantionare obiectivă. În plus, spre deosebire de eșantionarea deliberată, judecata personală aici nu aparține dezvoltatorului proiectului, ci intervievatorului. Se pune întrebarea dacă eșantioanele proporționale pot fi considerate reprezentative, chiar dacă reproduc raportul componentelor inerente populației care au anumite caracteristici de control. În acest sens, trebuie făcute trei observații.

În primul rând, eșantionul poate fi izbitor de diferit de populație în alte caracteristici importante, care pot avea un impact grav asupra rezultatului. De exemplu, dacă studiul este dedicat problemei prejudecăților rasiale în rândul studenților, poate să nu fie indiferentă circumstanța de unde provin respondenții: din oraș sau din mediul rural. Deoarece cota pentru caracteristica „de la oraș/rural” nu a fost desemnată, o reprezentare exactă a acestei caracteristici devine puțin probabilă. Desigur, există o astfel de alternativă: definirea cotelor pentru toate caracteristicile potențial semnificative. Cu toate acestea, o creștere a numărului de caracteristici de control duce la o complicație a specificației. Acest lucru, la rândul său, complică - și uneori chiar face imposibilă - selecția elementelor eșantionului și, în orice caz, duce la creșterea prețului acesteia. Dacă, de exemplu, afilierea urbană sau rurală și statutul socioeconomic sunt, de asemenea, relevante pentru studiu, atunci intervievatorul poate fi nevoit să caute un student din primul an care este urban și din clasa superioară sau mijlocie. Sunt de acord că este mult mai ușor să găsești doar un boboc de sex masculin.

În al doilea rând, este foarte dificil să ne asigurăm că acest eșantion este cu adevărat reprezentativ. Desigur, puteți verifica eșantionul pentru a vedea dacă distribuția caracteristicilor care nu sunt incluse în control, distribuția lor în populație. Cu toate acestea, un astfel de test poate duce doar la concluzii negative. Este posibil să se dezvăluie doar divergența distribuțiilor. Dacă distribuțiile eșantionului și ale populației pentru fiecare dintre aceste caracteristici se repetă, există posibilitatea ca eșantionul să difere de populație într-o altă trăsătură, care nu este dată în mod explicit.

Și în sfârșit, în al treilea rând. Intervievatorii, fiind lăsați în voia lor, sunt predispuși la anumite acțiuni. Ei recurg prea des la chestionarea prietenilor lor. Deoarece se dovedesc adesea a fi ca intervievatorii înșiși, există pericolul de eroare. Dovezile din Anglia sugerează că eșantioanele de cote tind să:

  1. exagerarea rolului celor mai accesibile elemente;
  2. minimalizarea rolului familiilor mici;
  3. exagerarea rolului familiilor cu copii;
  4. minimalizarea rolului muncitorilor industriali;
  5. minimalizarea rolului celor cu cele mai mari și mai mici venituri;
  6. minimalizarea rolului cetățenilor slab educați;
  7. minimalizarea rolului persoanelor care ocupă o poziţie socială scăzută.
Intervievatorii care aleg cote predeterminate prin oprirea trecătorilor la întâmplare sunt probabil să se concentreze asupra zonelor cu un număr mare de respondenți potențiali, cum ar fi centrele comerciale, gările și aeroporturile, intrările în supermarketurile mari și altele asemenea. Această practică duce la o suprareprezentare a acelor grupuri de oameni care vizitează cel mai des astfel de locuri. Atunci când sunt necesare vizite la domiciliu, intervievatorii sunt adesea conduși de comoditate.
De exemplu, aceștia pot efectua sondaje doar în timpul zilei, ceea ce duce la o subestimare a opiniei lucrătorilor. Printre altele, nu intră în clădirile dărăpănate și, de regulă, nu urcă la etajele superioare ale clădirilor care nu au lift.

În funcție de specificul problemei studiate, aceste tendințe pot duce la diverse tipuri de erori, dar corectarea lor în etapa de analiză a datelor pare a fi foarte, foarte dificilă. Pe de altă parte, cu o selecție obiectivă a elementelor eșantionului, cercetătorii au la dispoziție anumite instrumente care fac posibilă simplificarea procedurii de evaluare a reprezentativității unui eșantion dat. Atunci când analizează problema reprezentativității unor astfel de eșantioane, cercetătorul ia în considerare nu atât compoziția eșantionului, cât procedura de selectare a elementelor acestuia.

Fereastra de cercetare: genial! Dar cine o va citi?

În fiecare an, agenții de publicitate cheltuiesc milioane de dolari pe reclame care apar pe paginile nenumăratelor publicații de la Advertising Age până la Yankee. O anumită evaluare a textului și imaginii poate fi făcută înainte de publicarea lui, după cum se spune, acasă, într-o agenție de publicitate; nu este cu adevărat testat și judecat decât după ce anunțul este publicat, înconjurat de zeci de reclame la fel de atent concepute, care luptă pentru atenția cititorului.

Companie Roper Starch la nivel mondial evaluează lizibilitatea reclamelor plasate în reviste și ziare pentru consumatori, afaceri, comerț și profesionale. Rezultatele cercetării sunt aduse la cunoștința agenților de publicitate și agențiilor - desigur, pentru o taxă adecvată. Pentru că agenții de publicitate fac tot posibilul în fiecare zi pentru a-și transmite reclamele către consumator, companie Amidon a decis să creeze un eșantion care să ofere abonaților informații în timp util și precise despre eficiența publicității. În fiecare an compania Amidon a intervievat peste 50.000 de persoane, în timp ce au luat în considerare aproximativ 20.000 de reclame. Aproximativ 500 de publicații individuale au fost studiate anual.

Amidonul a folosit eșantionare proporțională, cu un minim de 100 de cititori de un gen și 100 de cititori de celălalt gen. Amidonul a concluzionat că, cu această dimensiune a eșantionului, principalele abateri ale nivelului de lizibilitate s-au stabilizat. Cititorii cu vârsta peste 18 ani au fost intervievați personal și au fost luate în considerare toate publicațiile, cu excepția celor destinate unor populații speciale (să zicem, fetele de vârsta potrivită au fost intervievate pentru a evalua publicațiile din revista Seventeen).

La efectuarea sondajelor, s-a luat în considerare aria de distribuție a unei anumite publicații. Să presupunem că studiul revistei Los Angeles a analizat cititorii care trăiesc în sudul Californiei. „Timpul” a fost studiat la nivel național. Sondajul a fost dedicat numerelor individuale ale revistei și a fost realizat în 20-30 de orașe în același timp.

Fiecare intervievator a primit o mică cotă de interviuri, care a servit scopului de a minimiza variația rezultatelor sondajului. Chestionarele au fost distribuite între persoane de diferite profesii și vârste cu venituri diferite. Fiecare astfel de studiu a făcut posibilă prezentarea pozițiilor unui public destul de larg. Atunci când s-au luat în considerare o serie de publicații profesionale, de afaceri și din industrie, s-a luat în considerare și specificul abonamentului și distribuției acestora. Listele de abonament dedicate publicațiilor cu tiraj destul de restrâns au făcut posibilă selectarea respondenților acceptabili.

În fiecare sondaj, intervievatorii le-au cerut respondenților să răsfoiască publicația și au întrebat dacă au observat vreun anunț. Dacă răspunsul a fost afirmativ, registratorul a pus o serie de întrebări pentru a evalua gradul de acceptare a reclamei.

Această evaluare ar putea fi triplă:

  • Atenție: cei care au acordat deja atenție faptului însuși apariției unui astfel de anunț.
  • Cunoscuți: cei care și-au amintit orice parte a reclamei, care se referă la marca comercială sau agentul de publicitate promovat.
  • Citește: oameni care citesc cel puțin jumătate din reclamă.

După ce au analizat toate anunțurile, intervievatorii au înregistrat informații cheie de clasificare: sex, vârstă, ocupație, stare civilă, naționalitate, venit, dimensiunea familiei și componența familiei, ceea ce a permis încrucișarea gradului de interes al cititorului.

Când sunt utilizate corect, datele companiei Amidon permite agenților de publicitate și agențiilor să identifice atât tipurile nereușite, cât și cele de succes de scheme de publicitate care atrag și rețin atenția cititorului. Informațiile de acest fel sunt extrem de valoroase pentru agenții de publicitate care sunt interesați în primul rând de eficacitatea campaniei lor de publicitate.

Sursa: Roper Starch Worldwide, Mamaronek, NY 10543.

Probe probabilistice

Cercetătorul poate determina probabilitatea includerii oricărui element al populației în eșantionul probabil, deoarece selecția elementelor acesteia se realizează pe baza unui proces obiectiv și nu depinde de capriciile și predilecțiile cercetătorului sau lucrătorului de teren. Întrucât procedura de selecție a elementelor este obiectivă, cercetătorul poate evalua fiabilitatea rezultatelor obținute, ceea ce a fost imposibil în cazul probelor deterministe, oricât de atentă a fost selecția elementelor acestora din urmă.

Nu trebuie considerat că eșantioanele probabiliste sunt întotdeauna mai reprezentative decât cele deterministe. De fapt, un eșantion determinist poate fi, de asemenea, mai reprezentativ. Avantajul eșantioanelor probabilistice este că permit o estimare a erorii potențiale de eșantionare. Dacă cercetătorul lucrează cu un eșantion determinist, el nu are o metodă obiectivă de evaluare a adecvării acestuia la obiectivele studiului.

Eșantionare aleatorie simplă

Majoritatea oamenilor dau peste eșantioane simple aleatorii într-un fel sau altul, fie ca parte a unui curs de statistică la institut, fie citind despre rezultatele unor studii relevante în ziare sau reviste. Într-un eșantion aleator simplu, fiecare element inclus în eșantion are aceeași probabilitate dată de a fi printre elementele studiate și orice combinație de elemente din populația inițială poate deveni un eșantion. De exemplu, dacă dorim să facem un eșantion aleatoriu simplu din toți studenții înscriși într-o anumită facultate, trebuie doar să facem o listă cu toți studenții, să atribuim un număr fiecărui nume din acesta și să folosim un computer pentru a selecta aleatoriu un anumit număr de elemente.

Populația

Populația
Un set de elemente care satisfac anumite condiții specificate; numită și populația de studiu (țintă).
Parametru
O anumită caracteristică sau indicator al populației generale sau studiate.

Set general sau studiat este colecția din care se face selecția. Acest set (populație) poate fi descris printr-o serie de parametri specifici care sunt caracteristici populației generale, fiecare dintre acestea fiind un anumit indicator cantitativ care distinge un set de altul.

Imaginați-vă că populația studiată este întreaga populație adultă din Cincinnati. O serie de parametri pot fi utilizați pentru a descrie această populație: vârsta medie, proporția populației cu studii superioare, nivelul de venit etc. Rețineți că toți acești indicatori au o anumită valoare fixă. Desigur, le putem calcula prin efectuarea unui recensământ complet al populației studiate. De obicei, nu ne bazăm pe calificare, ci pe eșantion selectam și folosim valorile obținute în timpul observației selective pentru a determina parametrii dorințați ai populației.

Ilustram ceea ce s-a spus dat in tabel. 15.1 un exemplu de populație ipotetică de 20 de persoane. Lucrul cu o populație ipotetică mică ca aceasta are o serie de avantaje. În primul rând, dimensiunea mică a eșantionului facilitează calcularea parametrilor populației care pot fi utilizați pentru a-l descrie. În al doilea rând, acest volum vă permite să înțelegeți ce se poate întâmpla atunci când este adoptat un anumit plan de eșantionare. Ambele caracteristici facilitează compararea rezultatelor eșantionului cu valoarea populației „adevărată” și, în acest caz, cunoscută, ceea ce nu este cazul pentru situația tipică în care valoarea efectivă a populației este necunoscută. Compararea evaluării cu valoarea „adevărată” în acest caz capătă o claritate deosebită.

Să presupunem că dorim să estimăm, din două elemente alese aleatoriu, venitul mediu al indivizilor din populația inițială. Venitul mediu va fi parametrul acestuia. Pentru a estima această valoare medie, pe care o desemnăm ca μ, trebuie să împărțim suma tuturor valorilor la numărul lor:

Media populației μ = Suma elementelor populației / Numărul elementelor.

În cazul nostru, calculele dau:

Populație derivată

Populație derivată constă din toate eșantioanele posibile care pot fi selectate din populația generală conform unui plan de eșantionare dat (plan de eșantionare). Statistici este o caracteristică sau un indicator al eșantionului. Valoarea statistică a eșantionului este utilizată pentru a estima un anumit parametru al populației. Eșantioane diferite oferă statistici sau estimări diferite pentru același parametru de populație.

Populație derivată
Ansamblul tuturor eșantioanelor distincte posibile care pot fi selectate din populația generală conform unui plan de eșantionare dat. Statistici O caracteristică sau măsură a unui eșantion.

Luați în considerare setul derivat al tuturor eșantioanelor posibile care pot fi selectate din populația noastră ipotetică de 20 de indivizi printr-un plan de eșantionare care presupune că dimensiunea eșantionului este n=2 poate fi obținută prin selecție aleatorie nerepetitivă.

Să presupunem pentru o clipă că datele pentru fiecare unitate a populației - în cazul nostru, numele și venitul unui individ - sunt scrise pe cercuri, după care sunt coborâte într-un ulcior și amestecate. Cercetătorul scoate un cerc din ulcior, șterge informațiile din el și îl pune deoparte. La fel face și cu a doua cană luată din ulcior. Apoi, cercetătorul returnează ambele căni în ulcior, amestecă conținutul acestuia și repetă aceeași succesiune de acțiuni. În tabel. 15.2 arată rezultatele posibile ale procedurii numite. Pentru 20 de cercuri, sunt posibile 190 de astfel de combinații de perechi.

Pentru fiecare combinație, puteți calcula venitul mediu. Să spunem pentru eșantionare AB (k= 1)

k-e Sample Mean = Suma eșantioanelor / Numărul de eșantioane =

Pe fig. 15.4 arată estimarea venitului mediu pentru întreaga populație și valoarea erorii pentru fiecare estimare pentru eșantioane k = 25, 62.108.147și 189 .

Înainte de a trece la considerarea relației dintre venitul mediu al eșantionului (statistici) și venitul mediu al populației (un parametru care trebuie estimat), să spunem câteva cuvinte despre populația derivată. În primul rând, în practică nu compilam agregate de acest fel. Ar necesita prea mult timp și efort. Practicianul se limitează la compilarea unui singur eșantion de dimensiunea necesară. Cercetatorul foloseste concept populația derivată și conceptul aferent de distribuție a eșantionării la formularea concluziilor finale.

Cum va fi prezentat mai jos. În al doilea rând, trebuie amintit că o populație derivată este definită ca totalitatea tuturor eșantioanelor diferite posibile care pot fi selectate din populația generală conform unui plan de eșantionare dat. Când se modifică orice parte a planului de eșantionare, se modifică și populația derivată. Deci, dacă, la alegerea cercurilor, cercetătorul returnează primul dintre discurile îndepărtate în ulcior înainte de a-l scoate pe al doilea, setul derivat va include.

probe AA, BB etc. Dacă numărul de probe nerepetate este de 3 în loc de 2, vor exista mostre de tip ABC, iar acestea vor fi 1140, nu 190, așa cum a fost cazul precedent. Atunci când selecția aleatorie simplă este schimbată cu orice altă metodă de determinare a elementelor eșantionului, populația derivată se modifică și ea.

De asemenea, trebuie amintit că selectarea unui eșantion de o dimensiune dată din populația generală este echivalentă cu selecția unui element (1 din 190) din populația derivată. Acest fapt ne permite să tragem multe concluzii statistice.

Media eșantionului și media generală

Putem echivala media eșantionului cu media reală a populației? În orice caz, pornim de la faptul că sunt interconectate. Cu toate acestea, credem și că va exista o eroare. De exemplu, se poate presupune că informațiile primite de la utilizatorii de internet vor diferi semnificativ de rezultatele unui sondaj al populației „obișnuite”. În alte cazuri, putem presupune o potrivire destul de precisă, altfel nu am putea folosi valoarea eșantionului pentru a estima valoarea celei generale. Dar cât de mare poate fi greșeala pe care o facem în acest sens?

Să adunăm toate mijloacele eșantionului conținute în tabel. 15.2 și împărțiți suma rezultată la numărul de eșantioane, adică să facem media mediilor.
Vom obține următorul rezultat:

El coincide cu valoarea medie a populației generale. Ei spun că în acest caz avem de-a face statistică imparțială.

O statistică se numește imparțial dacă media ei pentru toate eșantioanele posibile este egală cu parametrul populației estimate. Rețineți că aici nu vorbim despre o anumită valoare. Estimarea parțială poate fi foarte departe de valoarea adevărată - luați, de exemplu, eșantioanele AB sau ST. În unele cazuri, adevărata valoare a populației poate să nu fie realizabilă atunci când se ia în considerare orice eșantion posibil, chiar dacă statisticile sunt imparțiale. În cazul nostru, acesta nu este cazul: un număr de eșantioane posibile - de exemplu, AT - oferă o medie a eșantionului egală cu media reală a populației.

Este logic să luăm în considerare distribuția acestor estimări ale eșantionului și, în special, relația dintre această dispersie a estimărilor și variația nivelului venitului în populație. Varianta populației generale este utilizată ca măsură a variației. Pentru a determina varianța populației generale, trebuie să calculăm abaterea fiecărei valori de la medie, să adunăm pătratele tuturor abaterilor și să împărțim suma rezultată la numărul de termeni. Notați cu a^ varianța populației generale. Apoi:

Varianta populației σ 2 = Suma diferențelor pătrate ale fiecărui element
populația și media populației / Numărul elementelor populației =

Dispersia Valoarea medie nivelul venitului poate fi definit în același mod. Adică, o putem găsi determinând abaterile fiecărei medii de la media lor totală, însumând pătratele abaterilor și împărțind suma rezultată la numărul de termeni.

De asemenea, putem defini varianța nivelului mediu al venitului într-un alt mod, folosind varianța nivelurilor de venit în populația generală, deoarece între cele două există o relație directă. Pentru a fi precis, în cazurile în care eșantionul reprezintă doar o mică parte a populației, varianța mediei eșantionului este egală cu varianța populației împărțită la dimensiunea eșantionului:

unde σ x 2 este varianța valorii medii a eșantionului a nivelului de venit, σ 2 este varianța nivelului de venit în populația generală, n- marime de mostra.

Acum să comparăm distribuția rezultatelor cu distribuția unei trăsături cantitative în populația generală. Figura 15.5 arată că distribuția trăsăturii populației prezentate în caseta A este multi-vertex (fiecare dintre cele 20 de valori apare o singură dată) și este simetrică față de media reală a populației de 9400.

Distribuția eșantionării
Distribuția valorilor unei anumite statistici calculate pentru toate probele distincte posibile care pot fi extrase din populație conform unui plan de eșantionare dat.

Distribuția notelor prezentate în câmpul B se bazează pe datele din tabel. 15.3, care, la rândul său, a fost compilat prin alocarea de valori din tabel. 15.2 unuia sau altuia, în funcție de mărimea acestora, cu calcularea ulterioară a numărului lor în grup. Câmpul B este o histogramă tradițională, considerată chiar la începutul cursului de studiu al statisticii, care reprezintă distribuția eșantionului statistici. Remarcăm în treacăt următoarele: conceptul de distribuție prin eșantionare este cel mai important concept de statistică, este piatra de temelie a construcției inferențelor statistice. În funcție de distribuția eșantionului cunoscută a statisticilor studiate, putem concluziona despre parametrul corespunzător al populației generale. Dacă, pe de altă parte, se știe doar că estimarea eșantionului se modifică de la un eșantion la altul, dar natura acestei modificări este necunoscută, devine imposibil să se determine eroarea de eșantionare asociată cu această estimare. Deoarece distribuția de eșantionare a unei estimări descrie modul în care se modifică de la un eșantion la altul, ea oferă o bază pentru determinarea validității unei estimări de eșantion. Din acest motiv, un proiect de eșantionare probabil este atât de important pentru inferența statistică.

Având în vedere probabilitățile cunoscute de includere a fiecărui membru al populației în eșantion, intervievatorii pot găsi distribuția eșantionului a diferitelor statistici. Pe aceste distribuții se bazează cercetătorii - indiferent dacă este vorba de media eșantionului, fracția eșantionului, varianța eșantionului sau alte statistici - atunci când extind rezultatul unei observații eșantionului la populația generală. De asemenea, rețineți că pentru eșantioanele de dimensiunea 2, distribuția mediei eșantionului este unimodală și simetrică față de media adevărată.

Deci am arătat că:

  1. Media tuturor mediilor posibile ale eșantionului este egală cu media generală.
  2. Varianta mediilor eșantionului este legată într-un fel de varianța generală.
  3. Distribuția mediilor eșantionului este unimodală, în timp ce distribuția valorilor unui atribut cantitativ în populația generală este multimodală.

Teorema limitei centrale

O teoremă care spune că pentru eșantioane aleatoare simple de dimensiune n, selectat din populația generală cu media generală μ și varianța σ 2 , în general n distribuția mediei eșantionului x se apropie de normal cu un centru egal cu μ și o varianță σ 2 . Precizia acestei aproximări crește odată cu creșterea n.

Teorema limitei centrale. Distribuția unimodală a estimărilor poate fi considerată ca o manifestare a teoremei limitei centrale, care afirmă că pentru eșantioane aleatoare simple de volum n, selectat din populația generală cu adevărata medie μ și varianța σ 2 , pentru mare n distribuția mediilor eșantionului se apropie de normal cu un centru egal cu media adevărată și o varianță egală cu raportul dintre varianța populației și dimensiunea eșantionului, adică:

Această aproximare devine din ce în ce mai precisă pe măsură ce n. Tine minte asta. Indiferent de tipul de populație, distribuția mediilor eșantionului va fi normală pentru eșantioanele de dimensiuni suficient de mari. Ce se înțelege prin volum suficient de mare? Dacă distribuția valorilor unui atribut cantitativ al populației generale este normală, atunci distribuția mijloacelor eșantionului pentru eșantioanele cu un volum de n=1. Dacă distribuția unei variabile (atribut cantitativ) în populație este simetrică, dar nu normală, eșantioanele de dimensiuni foarte mici vor da o distribuție normală a mediilor eșantionului. Dacă distribuția unui atribut cantitativ al populației generale are o asimetrie pronunțată, este nevoie de eșantioane mai mari. Și totuși, distribuția mediei eșantionului poate fi considerată normală doar dacă avem de-a face cu un eșantion de dimensiune suficientă.

Pentru a trage concluzii folosind o curbă normală, nu este deloc necesar să se pornească de la condiția de normalitate a distribuției valorilor unui atribut cantitativ al populației generale. Mai degrabă, ne bazăm pe teorema limită centrală și, în funcție de distribuția populației, determinăm o astfel de dimensiune a eșantionului care ne-ar permite să lucrăm cu o curbă normală. Din fericire, distribuția normală a statisticilor este asigurată de eșantioane de dimensiuni relativ mici - Fig. 15.6 demonstrează clar această circumstanță. Estimări ale intervalului de încredere. Ne pot ajuta cele de mai sus să facem anumite concluzii despre media generală? Într-adevăr, în practică, selectăm doar unul, și nu toate eșantioanele posibile de o dimensiune dată, iar pe baza datelor obținute, tragem anumite concluzii cu privire la grupul țintă.

Cum se întâmplă? După cum știți, cu o distribuție normală, un anumit procent din toate observațiile au o anumită abatere standard; să spunem că 95% dintre observații se încadrează în ±1,96 deviații standard ale mediei. Distribuția normală a mediilor eșantionului, la care se poate aplica teorema limită centrală, nu face excepție în acest sens. Media unei astfel de distribuții de eșantion este egală cu media generală μ, iar abaterea sa standard se numește eroarea standard a mediei:

Se pare că:

  • 68,26% din mediile eșantionului se abate de la media generală cu cel mult ± σ x ;
  • 95,45% din mediile eșantionului se abate de la media generală cu cel mult ±σ x ;
  • 99,73% din mediile eșantionului se abate de la media generală cu cel mult ± σ x ,

adică o anumită proporție de eșantion înseamnă în funcție de valoarea aleasă z vor fi incluse în intervalul determinat de valoare z. Această expresie poate fi rescrisă ca o inegalitate:

Media generală - z < Среднее по выборке < Генеральное среднее + z(Eroarea standard a mediei)

astfel, media eșantionului cu o anumită probabilitate se află în intervalul, ale cărui limite sunt suma și diferența valorii medii a distribuției și un anumit număr de abateri standard. Această inegalitate poate fi convertită în forma:

Mediul eșantionului - z(Eroarea standard a mediei)< Генеральное среднее < Среднее по выборке + z(Eroarea standard a mediei)

Dacă se observă raportul 15,1, de exemplu, în 95% din cazuri ( z= 1,96), apoi în 95% din cazuri se observă și raportul 15,2. În cazurile în care concluzia se bazează pe o singură medie eșantionului, folosim expresia 15.2.

Este important să ne amintim că expresia 15.2 nu înseamnă că intervalul corespunzător unui eșantion dat trebuie să includă în mod necesar media generală. Intervalul are mai mult de-a face cu procedura de selecție. Intervalul construit în jurul acestei medii poate include sau nu media reală a populației. Încrederea noastră în corectitudinea concluziilor făcute se bazează pe faptul că 95% din toate intervalele construite conform planului de eșantionare selectat vor conține media adevărată. Credem că eșantionul nostru aparține acestui procent de 95%.

Pentru a ilustra acest punct important, imaginați-vă pentru un moment că distribuția eșantionului înseamnă eșantioane de dimensiune n= 2 în exemplul nostru ipotetic este normal. Tabelul 15.4 ilustrează grafic rezultatul pentru primele 10 dintre cele 190 de eșantioane posibile care pot fi selectate conform designului dat. Rețineți că doar 7 din 10 intervale includ o medie generală sau adevărată. Încrederea în corectitudinea concluziei se datorează nu unei evaluări private, ci tocmai procedură estimări. Această procedură este astfel încât pentru 100 de eșantioane pentru care se vor calcula media eșantionului și intervalul de încredere, în 95 de cazuri acest interval va include valoarea generală adevărată. Precizia acestei probe este determinată de procedura prin care sa format proba. Un proiect de eșantionare reprezentativ nu garantează reprezentativitatea tuturor probelor. Procedurile de inferență statistică se bazează pe reprezentativitatea planului de eșantionare, motiv pentru care această procedură este atât de critică pentru eșantioanele probabilistice.

Eșantionarea probabilistică ne permite să evaluăm acuratețea rezultatelor ca proximitate a estimărilor produse de valoarea reală. Cu cât eroarea standard a statisticilor este mai mare, cu atât este mai mare gradul de împrăștiere a estimărilor și cu atât acuratețea procedurii este mai mică.

Unii pot fi confuzi de faptul că nivelul de încredere este legat de procedură și nu de o anumită valoare a eșantionului, cu toate acestea, trebuie amintit că valoarea nivelului de încredere al estimării valorii generale poate fi ajustată prin cercetător. Dacă nu doriți să riscați și vă este teamă că s-ar putea să întâlniți unul dintre cele cinci intervale de eșantion alese care nu include media populației, puteți alege un interval de încredere de 99% în care doar unul dintre cele sute de intervale de eșantionare nu include nu includ media populației. În plus, dacă puteți crește dimensiunea eșantionului, veți crește gradul de încredere în rezultat, oferind acuratețea dorită a estimării valorii populației. Despre aceasta vom vorbi mai detaliat în cap. 17.

Procedura pe care o descriem mai are o componentă, care poate provoca o anumită jenă. La estimarea intervalului de încredere se folosesc trei mărimi: x , zși σ x . Media eșantionului x este calculată din datele eșantionului, z este ales în funcție de nivelul de încredere dorit. Dar cum rămâne cu eroarea pătratică medie a mediei σ x? Este egal cu:

și, prin urmare, pentru a o determina, trebuie să întrebăm abaterea standard a atributului cantitativ al populației generale, adică 5. Ce trebuie făcut în cazurile în care abaterea standard s necunoscut? Această problemă nu apare din două motive. În primul rând, de obicei, pentru majoritatea caracteristicilor cantitative utilizate în cercetarea de marketing, variația se modifică mult mai lent decât nivelul majorității variabilelor de interes pentru marketer. În consecință, dacă studiul este repetat, putem folosi valoarea anterioară, obținută anterior, a lui s în calcule. În al doilea rând, odată ce eșantionul este selectat și datele sunt obținute, putem estima varianța populației prin determinarea varianței eșantionului. Varianta imparțială a eșantionului este definită astfel:

Varianta eșantionului ŝ 2 = Suma abaterilor pătrate de la media eșantionului / (număr de articole eșantionate -1). Pentru a determina varianța eșantionului, trebuie mai întâi să găsim media eșantionului. Apoi se constată diferențele dintre fiecare dintre valorile eșantionului și media eșantionului; aceste diferențe sunt pătrate, însumate și împărțite la un număr egal cu numărul de observații din eșantion minus unu. Varianța eșantionului nu numai că oferă o estimare a varianței totale, dar poate fi folosită și pentru a estima eroarea standard a mediei. Când se cunoaște varianța generală σ 2, se cunoaște și eroarea pătratică medie σ x, deoarece:

Când varianța generală este necunoscută, eroarea standard a mediei poate fi doar estimată. Această estimare este dată ŝ x , care este egală cu abaterea standard a eșantionului împărțită la rădăcina pătrată a dimensiunii eșantionului, adică . Estimarea este determinată în același mod în care a fost determinată estimarea valorii adevărate, dar în locul abaterii standard generale, abaterea standard a eșantionului este înlocuită în formula de calcul. Deci, să presupunem pentru eșantionul AB cu o medie a eșantionului de 5800:

În consecință, ŝ = 283 și

iar distanța de 95% este acum

care este mai mică decât valoarea anterioară.

În tabel. 15.5 rezumă formulele de calcul pentru diferite medii și dispersii, care au fost discutate în acest capitol. Formarea unei probe aleatorii simple. În exemplul nostru, selecția elementelor eșantionului a fost efectuată folosind un ulcior, care conținea toate elementele populației inițiale. Acest lucru ne-a permis să vizualizăm conceptele de populație derivată și distribuția eșantionării. Nu recomandăm utilizarea unei astfel de metode în practică, deoarece aceasta crește probabilitatea de eroare. Cănile pot diferi atât în ​​ceea ce privește dimensiunea, cât și textura, ceea ce în anumite cazuri poate duce la preferința pentru una față de alta. Selecția participanților la campania vietnameză, efectuată prin intermediul unei loterie, poate servi ca exemplu de greșeală de acest fel.

Selecția s-a făcut prin tragerea de discuri cu date de naștere din toba mare. Televiziunea a difuzat această procedură în toată țara. Din păcate, discurile au fost încărcate în tobă într-un mod sistematic, datele din ianuarie venind primele și cele din decembrie ultima. Deși toba a fost supusă unei învârtiri intense, datele din decembrie au căzut mult mai des decât în ​​ianuarie. Ulterior, această procedură a fost revizuită în așa fel încât probabilitatea unor astfel de erori sistematice a fost redusă semnificativ. Metoda preferată pentru generarea unui eșantion aleator simplu se bazează pe utilizarea unui tabel de numere aleatoare.

Utilizarea unui astfel de tabel implică următoarea secvență de pași. În primul rând, elementelor populației trebuie să li se atribuie numere consecutive de la 1 la N; în populaţia noastră ipotetică la element DAR numărul 1 va fi atribuit elementului B- numărul 2 etc. În al doilea rând, numărul de cifre din tabelul numerelor aleatoare trebuie să fie același cu cel al numărului N. Pentru N= se vor folosi 20 de numere din două cifre; pentru Nîntre 100 și 999 - numere din trei cifre etc. În al treilea rând, poziția de plecare trebuie determinată aleatoriu. Putem deschide tabelul corespunzător al numerelor aleatoare și, închizând ochii, după cum se spune, să băgăm cu degetul în el. Deoarece numerele din tabelul cu numere aleatoare sunt în ordine aleatorie, poziția de pornire nu contează cu adevărat.

Și, în sfârșit, ne putem deplasa în orice direcție aleasă în mod arbitrar - în sus, în jos sau peste, selectând acele elemente ale căror numere vor corespunde numerelor aleatorii din tabel. Pentru a ilustra ceea ce s-a spus, luați în considerare tabelul prescurtat al numerelor aleatoare (Tabelul 15.6). Pentru că N= 20, ar trebui să lucrăm numai cu numere cu două cifre. În acest sens, Tab. 15.6 ni se potrivește perfect. Să presupunem că am decis în prealabil să ne deplasăm în jos pe coloană, poziția inițială se află la intersecția celui de-al unsprezecelea rând și a patra coloană, unde se află numărul 77. Acest număr este prea mare și, prin urmare, ar trebui aruncat. Următoarele două numere vor fi, de asemenea, eliminate, în timp ce a patra valoare 02 va fi folosită deoarece 2 este numărul elementului LA.

Următoarele cinci numere vor fi, de asemenea, eliminate ca fiind prea mari, în timp ce numărul 05 va indica elementul E. Deci elementele LAși E va deveni eșantionul nostru cu două elemente, după care vom judeca nivelul veniturilor acestei populații. Este posibilă și o strategie alternativă, în care un program de calculator care generează numere aleatorii va fi folosit ca bază pentru selecție. Publicațiile recente indică faptul că numerele generate de astfel de programe nu sunt complet aleatorii, ceea ce se poate manifesta într-un anumit fel la construirea unor modele matematice complexe, dar pot fi folosite pentru majoritatea cercetărilor de marketing aplicate. Rețineți din nou că un eșantion aleator simplu necesită compilarea unei liste numerotate secvențiale de elemente ale populației generale.

Cu alte cuvinte, fiecare membru al populației originale trebuie să fie identificat. Pentru unele populații, acest lucru nu este greu de realizat, de exemplu, într-un studiu al celor mai mari 500 de corporații americane, a căror listă este dată în revista Fortune. Această listă a fost deja compilată, astfel încât formarea unui eșantion aleator simplu în acest caz nu va fi dificilă. Pentru alte populații inițiale (de exemplu, pentru toate familiile care locuiesc într-un anumit oraș), alcătuirea unei liste generale este extrem de dificilă, ceea ce obligă cercetătorii să recurgă la alte scheme de sondaj prin sondaj.

rezumat

Obiectivul de învățare 1
Faceți distincția clară între conceptele de recensământ (calificare) și eșantionare

Se numește un recensământ complet al populației (populației). calificat. Probă set, format din elementele selectate.

Obiectivul de învățare 2
Cunoașteți esența și succesiunea celor șase etape implementate de cercetători pentru a obține o populație eșantion

Procesul de eșantionare este împărțit în șase etape:

  1. repartizarea populației;
  2. determinarea cadrului de eșantionare;
  3. alegerea procedurii de selecție;
  4. determinarea dimensiunii eșantionului;
  5. selectarea elementelor eșantionului;
  6. examinarea elementelor selectate.

Obiectivul de învățare 3
Definiți conceptul de „cadru de eșantionare”

Cadrul de eșantionare este lista articolelor din care va fi prelevată proba.

Obiectivul de învățare 4
Explicați diferența dintre eșantionarea probabilistică și cea deterministă

Într-un eșantion probabilistic, fiecare membru al populației poate fi inclus cu un anumit dat diferit de zero probabilitate. Probabilitățile includerii anumitor membri ai populației în eșantion pot diferi unele de altele, dar probabilitatea includerii fiecărui element în ea este cunoscută. Pentru eșantioanele deterministe, estimarea probabilității includerii oricărui element în eșantion devine imposibilă. Reprezentativitatea unui astfel de eșantion nu poate fi garantată. Toate selecțiile deterministe se bazează, mai degrabă, pe o poziție personală, judecată sau preferință. Astfel de preferințe pot oferi uneori estimări bune ale caracteristicilor populației, dar nu există nicio modalitate de a determina în mod obiectiv adecvarea eșantionului pentru sarcină.

Obiectivul de învățare 5
Distingeți între eșantionarea cu dimensiune fixă ​​și eșantionarea în mai multe etape (consecutive).

Când se lucrează cu eșantioane de dimensiuni fixe, dimensiunea eșantionului este determinată înainte de începerea anchetei, iar analiza rezultatelor este precedată de colectarea tuturor datelor necesare. Într-o probă secvenţială, numărul elementelor selectate nu este cunoscut în prealabil, acesta fiind determinat pe baza unei serii de decizii secvenţiale.

Obiectivul de învățare 6
Explicați ce este eșantionarea deliberată și descrieți atât punctele sale tari, cât și punctele slabe

Elementele de eșantionare intenționată sunt selectate manual și prezentate cercetătorului, după caz, în scopul anchetei. Se presupune că elementele selectate pot oferi o imagine completă a populației studiate. Atâta timp cât cercetătorul se află în stadiile incipiente ale rezolvării problemelor, când sunt determinate perspectivele și posibilele limitări ale anchetei planificate, utilizarea eșantionării intenționate poate fi foarte eficientă. Dar în niciun caz nu trebuie să uităm de punctele slabe ale acestui tip de eșantion, deoarece acesta poate fi folosit și de către cercetător în studii descriptive sau cauzale, care nu vor întârzia să afecteze calitatea rezultatelor lor.

Obiectivul de învățare 7
Definiți conceptul de eșantionare în cote

Eșantionarea proporțională este selectată în așa fel încât proporția elementelor eșantionului cu anumite caracteristici să corespundă aproximativ proporției acelorași elemente în populația studiată; pentru a face acest lucru, fiecărui ghişeu i se atribuie o cotă care determină caracteristicile populaţiei cu care trebuie să contacteze.

Obiectivul de învățare 8
Explicați ce este un parametru într-o procedură de selecție

Parametru - o anumită caracteristică sau indicator al populației generale sau studiate; un anumit indicator cantitativ care distinge un set de altul.

Obiectivul de învățare 9
Explicați ce este o mulțime derivată

Populația derivată constă din toate eșantioanele posibile care pot fi selectate din populația generală conform unui plan de eșantionare dat.

Obiectivul de învățare 10
Explicați de ce conceptul de distribuție a eșantionării este cel mai important concept de statistică.

Conceptul de distribuție a eșantionării este piatra de temelie a inferenței statistice. În funcție de distribuția eșantionului cunoscută a statisticilor studiate, putem concluziona despre parametrul corespunzător al populației generale. Dacă, pe de altă parte, se știe doar că estimarea eșantionului se modifică de la un eșantion la altul, dar natura acestei modificări este necunoscută, devine imposibil să se determine eroarea de eșantionare asociată cu această estimare. Deoarece distribuția de eșantionare a unei estimări descrie modul în care se modifică de la un eșantion la altul, ea oferă o bază pentru determinarea validității unei estimări de eșantion.

Empirice sunt considerate unul dintre principalele mijloace de studiere a relațiilor și proceselor sociale. Ele oferă informații fiabile, complete și reprezentative.

Specificitatea tehnicilor

Oferă empiric obținerea de cunoștințe de stabilire a faptelor. Ele contribuie la stabilirea și generalizarea circumstanțelor prin înregistrarea indirectă sau directă a evenimentelor inerente relațiilor, obiectelor, fenomenelor studiate. Metodele empirice diferă de cele teoretice prin faptul că subiectul analizei este:

  1. Comportamentul indivizilor și al grupurilor lor.
  2. Produse ale activității umane.
  3. Acțiunile verbale ale indivizilor, judecățile, opiniile, opiniile lor.

Exemple de studii

Studiul empiric este întotdeauna axat pe obținerea de informații obiective și exacte, de date cantitative. În acest sens, atunci când se realizează, este necesar să se asigure reprezentativitatea informațiilor. În consecință, corect set de prelevare. aceasta Aceasta înseamnă că selecția trebuie efectuată în așa fel încât datele obținute dintr-un grup restrâns să reflecte tendințele care au loc în masa generală a respondenților. De exemplu, la sondajul a 200-300 de persoane, datele obținute pot fi extrapolate la întreaga populație urbană. Indicatorii setului de eșantion permit o abordare diferită a studiului proceselor socio-economice din regiune, în ansamblul țării.

Terminologie

Pentru a înțelege mai bine problemele legate de sondajele prin sondaj, unele definiții trebuie clarificate. Unitatea de observație este sursa directă de informație. Poate fi un individ, un grup, un document, o organizație și așa mai departe. Populația generală este set de unitati de observatie. Toate ar trebui să fie relevante pentru problema studiată. supuse analizei directe. Studiul este realizat în conformitate cu metodele dezvoltate de colectare a informațiilor. Pentru a determina această proporție din întreaga gamă de respondenți, utilizați conceptul de „probă”. Proprietatea sa de a reflecta parametrii cheie ai masei totale de oameni se numește reprezentativitate. În unele cazuri nu există potriviri. Apoi se vorbește de o eroare de reprezentativitate.

Asigurarea reprezentativității

Problemele legate de acesta sunt analizate în detaliu în cadrul statisticilor. Problemele sunt complexe pentru că, pe de o parte, vorbim despre furnizarea unei reprezentări cantitative care dă populatia generala. aceastaînseamnă, în special, că grupurile de respondenți ar trebui să fie reprezentate într-un număr optim. Cantitatea trebuie să fie suficientă pentru o reprezentare normală. Pe de altă parte, înseamnă și reprezentare calitativă. Presupune o anumită alcătuire a subiectului, care formează set de prelevare. aceastaînseamnă că, de exemplu, reprezentativitatea nu poate fi discutată dacă sunt intervievați doar bărbați sau doar femei, vârstnici sau tineri. Studiul trebuie realizat în cadrul tuturor grupurilor reprezentate.

Caracteristica eșantionului

Acest termen este considerat sub două aspecte. În primul rând, este definit ca un complex de elemente din gama generală de oameni a căror opinie este studiată - aceasta este set de prelevare. aceasta de asemenea procesul de creare a unei anumite categorii de respondenţi cu reprezentativitatea cerută. În practică, există mai multe tipuri și tipuri de selecție. Să le luăm în considerare.

Tipuri

Sunt trei dintre ele:

  1. spontan set de prelevare. aceasta un set de respondenți selectați pe bază voluntară. Totodată, se asigură accesibilitatea intrării unităților din masa totală de oameni într-o anumită grupă de studiu. Selecția spontană în practică este folosită destul de des. De exemplu, în sondaje în presă, prin poștă. Cu toate acestea, această abordare are un dezavantaj semnificativ. Este imposibil să se reprezinte calitativ întregul volum al eșantionului general. Această tehnică este aplicată în ceea ce privește economie. În unele sondaje, această opțiune este singura posibilă.
  2. spontan set de prelevare. aceasta una dintre principalele metode utilizate în studiu. Principiul cheie al unei astfel de selecții este oferirea unei oportunități pentru fiecare unitate de observație de a trece din masa generală de indivizi într-un grup restrâns. Pentru aceasta se folosesc metode diferite. De exemplu, poate fi o loterie, selecție mecanică, un tabel cu numere aleatorii.
  3. Eșantionarea stratificată (cotă). Se bazează pe formarea unui model calitativ al masei totale de respondenți. După aceea, se efectuează selecția unităților din populația eșantion. De exemplu, se realizează în funcție de vârstă sau sex, în funcție de grupuri de populație etc.

feluri

Există următoarele selecții:

În plus

Probele pot fi, de asemenea, dependente și independente. În primul caz, procedura experimentului și rezultatele care vor fi obținute în timpul acestuia pentru un grup de respondenți au un anumit impact asupra celuilalt. În consecință, eșantioanele independente nu implică un astfel de impact. Aici, totuși, trebuie remarcat un punct important. Un grup de subiecți, pentru care examenul psihologic a fost efectuat de două ori (chiar dacă a avut ca scop studierea diferitelor calități, caracteristici, semne), în mod implicit, va fi considerat dependent.

Selectii probabilistice

Luați în considerare câteva tipuri de mostre:

  1. Aleatoriu. Ea presupune omogenitatea populației totale, o probabilitate a disponibilității tuturor componentelor, precum și prezența unei liste complete de elemente. De regulă, în procesul de selecție se folosește un tabel cu numere aleatorii.
  2. Mecanic. Acest tip de eșantionare aleatorie presupune ordonarea în funcție de un anumit atribut. De exemplu, după numărul de telefon, în ordine alfabetică, după data nașterii și așa mai departe. Prima componentă este aleasă aleatoriu. În continuare, fiecare k element este selectat cu un pas n. Valoarea populației totale va fi N=k*n.
  3. Stratificat. Acest eșantion este utilizat atunci când populația totală este eterogenă. Acesta din urmă este împărțit în straturi (grupe). În fiecare dintre ele, selecția se realizează mecanic sau aleatoriu.
  4. Serial. Grupurile sunt selectate aleatoriu. În interiorul lor, obiectele sunt studiate până la capăt.

Selecții incredibile

Ele implică eșantionarea nu pe baza aleatoriei, ci pe motive subiective: tipicitate, accesibilitate, reprezentare egală și așa mai departe. Selecțiile din această categorie includ:

Nuanţă

Este necesară o listă exactă și completă a unităților de populație pentru a asigura reprezentativitatea. Obiectele de observație, de regulă, sunt o singură persoană. Selectarea din listă se face cel mai bine prin numerotarea unităților și folosind un tabel cu numere aleatorii. Dar metoda cvasialeatorie este de asemenea folosită. Acesta presupune selecția din lista fiecărui n element.

Factori care influențează

Volumul unei populații este numărul de unități ale acesteia. Potrivit experților, nu trebuie să fie mare. Fără îndoială, cu cât numărul respondenților este mai mare, cu atât rezultatul este mai precis. Totuși, în același timp, un volum mare nu garantează întotdeauna succesul. De exemplu, acest lucru se întâmplă atunci când gama totală de respondenți este eterogen. Omogen va fi considerat un astfel de set în care parametrul controlat, de exemplu, nivelul de alfabetizare, este distribuit uniform, adică nu există goluri sau condensuri. În acest caz, va fi suficient să intervievezi mai multe persoane. Pe baza rezultatelor sondajului, se va putea concluziona că majoritatea oamenilor au un nivel normal de alfabetizare. De aici rezultă că reprezentativitatea informației este influențată nu de caracteristicile cantitative, ci de caracteristicile calitative ale populației - nivelul de omogenitate a acesteia, în special.

Greșeli

Ele reprezintă abaterea parametrilor medii ai populației eșantionului de la valorile masei totale a respondenților. În practică, erorile sunt determinate prin potrivire. La sondajul adulților, se folosesc de obicei datele recensământului, înregistrările statistice și rezultatele anchetelor anterioare. Parametrii de control sunt de obicei Comparația valorilor medii ale populațiilor (general și eșantion), determinarea erorii în conformitate cu aceasta și reducerea acestei abateri se numește control al reprezentativității.

concluzii

Cercetarea prin eșantion este o modalitate de a colecta date despre atitudinile și comportamentul oamenilor printr-un sondaj pe grupuri special selectate de respondenți. Această tehnică este considerată fiabilă și economică, deși necesită o anumită tehnică. Eșantionul este baza. Acționează ca o anumită proporție din masa totală a oamenilor. Selecția se face folosind tehnici speciale și are ca scop obținerea de informații despre întreaga populație. Acesta din urmă, la rândul său, este reprezentat de toate obiectele sociale posibile sau de grupul care va fi studiat. Adesea, populația este atât de mare încât ar fi destul de costisitoare și greoaie să se efectueze un sondaj asupra fiecăruia dintre membrii săi. Prin urmare, se utilizează un model redus. Eșantionul include toți cei care primesc chestionare, care sunt numiți respondenți, care, de fapt, acționează ca obiect de studiu. Mai simplu spus, este format din mulți oameni care sunt intervievați.

Concluzie

Obiectivele anchetei sunt determinate de categorii specifice incluse în populație. În ceea ce privește o pondere specifică din masa totală a oamenilor, aceasta este alcătuită din subiecți incluși în grupuri folosind calcule matematice. Pentru selectarea unităților este necesară o descriere a obiectului populației inițiale. După determinarea numărului de subiecți, se determină recepția sau metoda de formare a grupurilor. Rezultatele sondajului ne vor permite să descriem trăsătura studiată în raport cu toți reprezentanții masei generale de oameni. După cum arată practica, studiile selective mai degrabă decât continue sunt efectuate în principal.

Studiile statistice sunt foarte consumatoare de timp și costisitoare, așa că a apărut ideea de a înlocui observația continuă cu una selectivă.

Scopul principal al observației necontinue este obținerea caracteristicilor populației statistice studiate pentru partea examinată a acesteia.

Observație selectivă- este o metodă de cercetare statistică, în care indicatorii generalizatori ai populației se stabilesc doar pentru o singură parte, în baza prevederilor selecției aleatorii.

În metoda de eșantionare este studiată doar o anumită parte a populației studiate, în timp ce populația statistică care urmează a fi studiată se numește populație generală.

Un eșantion sau pur și simplu un eșantion poate fi numit o parte a unităților selectate din populația generală, care va fi supusă cercetării statistice.

Valoarea metodei de eșantionare: cu un număr minim de unități în studiu, cercetările statistice se vor desfășura în perioade mai scurte de timp și cu cel mai mic cost al fondurilor și al forței de muncă.

În populația generală, proporția de unități care au trăsătura studiată se numește proporție generală (notat R), iar valoarea medie a trăsăturii variabile studiate este media generală (notat X).

În populația eșantionului, ponderea trăsăturii studiate se numește cota eșantionului, sau parte (notată cu w), valoarea medie a eșantionului este eșantion mediu.

Dacă în perioada anchetei sunt respectate toate regulile organizării sale științifice, atunci metoda de eșantionare va da rezultate destul de precise și, prin urmare, este recomandabil să utilizați această metodă pentru a verifica datele de observație continuă.

Această metodă a devenit larg răspândită în statisticile de stat și non-departamentale, deoarece la examinarea numărului minim de unități studiate, permite un studiu amănunțit și precis.

Populația statistică studiată este formată din unități cu caracteristici diferite. Compoziția eșantionului poate diferi de cea a populației generale, această discrepanță între caracteristicile eșantionului și populația generală constituie eroarea de eșantionare.

Erorile inerente observației selective caracterizează dimensiunea discrepanței dintre datele observației selective și întreaga populație. Erorile care apar în timpul eșantionării se numesc erori de reprezentativitate și sunt împărțite în aleatoare și sistematice.

Dacă populația eșantionului nu reproduce cu acuratețe întreaga populație din cauza naturii necontinue a observației, atunci aceasta se numește erori aleatoare, iar dimensiunile lor sunt determinate cu suficientă acuratețe pe baza legii numerelor mari și a teoriei probabilităților.

Erorile sistematice apar ca urmare a încălcării principiului selecției aleatorii a unităților de populație pentru observare.

2. Tipuri și scheme de selecție

Mărimea erorii de eșantionare și metodele de determinare a acesteia depind de tipul și schema de selecție.

Există patru tipuri de selecție a unui set de unități de observație:

1) aleatoriu;

2) mecanic;

3) tipic;

4) serial (imbricat).

selectie aleatorie- cea mai comună metodă de selecție într-un eșantion aleatoriu, se mai numește și metoda loteriei, în care se întocmește un bilet cu un număr de serie pentru fiecare unitate a populației statistice.

În continuare, numărul necesar de unități ale populației statistice este selectat aleatoriu. În aceste condiții, fiecare dintre ei are aceeași probabilitate de a intra în eșantion, de exemplu, curse câștigătoare, atunci când o anumită parte a numerelor care reprezintă câștigurile este selectată aleatoriu din numărul total de bilete emise. În acest caz, tuturor numerelor li se oferă șanse egale de a intra în eșantion.

Selecția mecanică- aceasta este o metoda cand intreaga populatie este impartita in grupuri de marime omogena dupa o caracteristica aleatorie, apoi se ia o singura unitate din fiecare grup.Toate unitatile populatiei statistice studiate sunt dispuse preliminar intr-o anumita ordine, dar in functie de dimensiunea eșantionului, numărul necesar de unități este selectat mecanic la un anumit interval.

Selecția tipică - aceasta este o metodă prin care populația statistică studiată este împărțită în funcție de o trăsătură esențială, tipică, în grupuri similare calitativ omogene, apoi se selectează aleatoriu un anumit număr de unități din fiecare din acest grup, proporțional cu ponderea grupului în intreaga populatie.

Selecția tipică oferă rezultate mai precise, deoarece include reprezentanți ai tuturor grupurilor tipice din eșantion.

Selectare în serie (imbricare). Grupuri întregi (serie, cuiburi), selectate aleatoriu sau mecanic, sunt supuse selecției. Pentru fiecare astfel de grup, se efectuează o serie de observații continue, iar rezultatele sunt transferate întregii populații.

Precizia eșantionării depinde și de schema de selecție. Eșantionarea poate fi efectuată conform schemei de selecție repetată și nerepetată.

Reselectare. Fiecare unitate sau serie selectată este returnată întregii populații și poate fi re-eșantionată.Aceasta este așa-numita schemă de minge returnată.

Selecție repetitivă. Fiecare unitate chestionată este retrasă și nu restituită populației, deci nu este re-evaluată. Această schemă se numește bila nereturnată.

Selecția nerepetitivă dă rezultate mai precise, deoarece cu aceeași dimensiune a eșantionului, observația acoperă mai multe unități din populația studiată.

Selecție combinată poate parcurge unul sau mai mulți pași. Un eșantion se numește monoetapă dacă unitățile populației selectate odată sunt supuse studiului.

Un eșantion se numește multietapă dacă selecția populației trece prin etape, etape succesive, iar fiecare etapă, etapă de selecție are propria sa unitate de selecție.

Eșantionarea în mai multe faze - în toate etapele de eșantionare, se păstrează aceeași unitate de eșantionare, dar se efectuează mai multe etape, faze ale anchetelor prin eșantionare, care diferă unele de altele prin amploarea programului de anchetă și dimensiunea eșantionului.

Caracteristicile parametrilor populației generale și eșantionului sunt indicate prin următoarele simboluri:

N- volumul populatiei generale;

n- marime de mostra;

X- media generală;

X este media eșantionului;

R– cota generală;

w - cota de eșantion;

2 - varianța generală (dispersia unei trăsături în populația generală);

2 - varianța eșantionului a aceleiași caracteristici;

? - abaterea standard în populaţia generală;

? este abaterea standard din eșantion.

3. Erori de eșantionare

Fiecare unitate dintr-un eșantion de observare ar trebui să aibă șanse egale de a fi selectată cu celelalte - aceasta este baza unui eșantion aleatoriu.

Eșantionare auto-aleatorie - aceasta este selecția unităților din întreaga populație generală prin tragere la sorți sau în alt mod similar.

Principiul aleatoriei este că includerea sau excluderea unui obiect din eșantion nu poate fi influențată de niciun alt factor decât întâmplărea.

Cotă de probă este raportul dintre numărul de unități din eșantion și numărul de unități din populația generală:


Selecția auto-aleatorie în forma sa pură este cea inițială dintre toate celelalte tipuri de selecție; ea conține și implementează principiile de bază ale observației statistice selective.

Cele două tipuri principale de indicatori generalizatori care sunt utilizați în metoda de eșantionare sunt valoarea medie a unui atribut cantitativ și valoarea relativă a unui atribut alternativ.

Ponderea eșantionului (w), sau particularitatea, este determinată de raportul dintre numărul de unități care au trăsătura în studiu m, la numărul total de unități de eșantionare (n):


Pentru a caracteriza fiabilitatea indicatorilor eșantionului, se disting erorile medii și marginale ale eșantionului.

Eroarea de eșantionare, numită și eroarea de reprezentativitate, este diferența dintre eșantionul corespunzător și caracteristicile generale:

?x = | x - x |;

?w =|х – p|.

Numai observațiile eșantionate au eroare de eșantionare

Media eșantionului și cota eșantionului- sunt variabile aleatorii care iau valori diferite în funcție de unitățile populației statistice studiate care au fost incluse în eșantion. În consecință, erorile de eșantionare sunt, de asemenea, variabile aleatoare și pot lua, de asemenea, valori diferite. Prin urmare, se determină media erorilor posibile - eroarea medie de eșantionare.

Eroarea medie de eșantionare este determinată de dimensiunea eșantionului: cu cât populația este mai mare, toate celelalte lucruri fiind egale, cu atât eroarea medie de eșantionare este mai mică. Acoperind o anchetă prin sondaj cu un număr tot mai mare de unități ale populației generale, caracterizăm tot mai precis întreaga populație.

Eroarea medie de eșantionare depinde de gradul de variație a trăsăturii studiate, la rândul său, gradul de variație este caracterizat de varianță? 2 sau w(l - w)- pentru un semn alternativ. Cu cât variația și varianța caracteristicilor sunt mai mici, cu atât eroarea medie de eșantionare este mai mică și invers.

Pentru reeșantionarea aleatorie, erorile medii sunt calculate teoretic folosind următoarele formule:

1) pentru trăsătura cantitativă medie:


Unde? 2 - valoarea medie a dispersiei unei trăsături cantitative.

2) pentru o cotă (semn alternativ):


Deci, cum este varianța trăsăturii în populație? 2 nu este cunoscută exact, în practică se utilizează valoarea varianței S 2 calculată pentru populația eșantionului pe baza legii numerelor mari, conform căreia populația eșantionului cu o dimensiune a eșantionului suficient de mare reproduce cu acuratețe caracteristicile populația generală.

Formulele pentru eroarea medie de eșantionare pentru reeșantionarea aleatorie sunt următoarele. Pentru valoarea medie a unui atribut cantitativ: varianța generală este exprimată prin opțiune prin următorul raport:


unde S 2 este valoarea dispersiei.

Prelevare mecanică de probe- aceasta este selecția unităților dintr-un set de probă din general, care este împărțit în grupuri egale după un criteriu neutru; se face în așa fel încât să fie selectată doar o unitate din fiecare astfel de grup din eșantion.

Cu selecția mecanică, unitățile populației statistice studiate sunt dispuse preliminar într-o anumită ordine, după care se selectează mecanic un anumit număr de unități la un anumit interval. În acest caz, mărimea intervalului în populația generală este egală cu reciproca ponderii eșantionului.

Cu o populatie suficient de mare, selectia mecanica in ceea ce priveste acuratetea rezultatelor este apropiata de cea aleatorie.De aceea, pentru a determina eroarea medie a esantionarii mecanice se folosesc formulele esantionarii aleatorii nerepetitive.

Pentru selectarea unităților dintr-o populație eterogenă se folosește așa-numitul eșantion tipic, acesta fiind utilizat atunci când toate unitățile populației generale pot fi împărțite în mai multe grupuri omogene calitativ, similare în funcție de caracteristicile de care depind indicatorii studiați.

Apoi, din fiecare grup tipic, o selecție individuală a unităților din eșantion este făcută printr-un eșantion aleator sau mecanic.

Eșantionarea tipică este de obicei utilizată în studiul populațiilor statistice complexe.

Eșantionarea tipică oferă rezultate mai precise. Tipificarea populației generale asigură reprezentativitatea unui astfel de eșantion, reprezentarea fiecărui grup tipologic din acesta, ceea ce face posibilă excluderea influenței varianței intergrupurilor asupra erorii medii ale eșantionului. Prin urmare, atunci când se determină eroarea medie a unui eșantion tipic, media variațiilor intragrup acționează ca un indicator al variației.

Eșantionarea în serie implică selecția aleatorie dintr-o populație generală de grupuri de dimensiuni egale pentru a supune toate unitățile fără excepție la observație în astfel de grupuri.

Deoarece toate unitățile, fără excepție, sunt examinate în cadrul grupurilor (serii), eroarea medie de eșantionare (atunci când se selectează serii egale) depinde doar de varianța intergrup (interserii).

4. Modalități de extindere a rezultatelor eșantionului la populație

Caracterizarea populației generale pe baza rezultatelor eșantionului este scopul final al observării eșantionului.

Metoda de eșantionare este utilizată pentru obținerea caracteristicilor populației generale pentru anumiți indicatori ai eșantionului. În funcție de obiectivele studiului, acesta se realizează prin recalcularea directă a indicatorilor eșantionului pentru populația generală sau prin metoda de calcul a factorilor de corecție.

Metoda recalculării directe este aceea că cu ea indicatorii cotei eșantionului w sau mediu X sunt extinse la populația generală, ținând cont de eroarea de eșantionare.

Metoda factorilor de corecție este utilizată atunci când scopul metodei de eșantionare este de a rafina rezultatele contabilității complete. Această metodă este utilizată pentru a rafina datele recensământului anual de animale ale populației.

Conceptul de „reprezentativitate” în raport cu sondajele sociologice – sondaje de opinie publică – are un efect aproape magic asupra oamenilor. Termenul „reprezentare” în sine are, pe lângă științific, și un sens clar politic.

Care este motivul? Chestia este că se presupune că eșantionul (un grup de persoane selectate pentru sondaj) poate reprezenta (reprezenta) întreaga populație. Populația generală în cazul anchetelor în întregime rusă este întreaga populație a țării. Acum să ne imaginăm că vorbim despre o decizie politică – susținerea unui proiect de lege sau votarea la alegeri. Cu ajutorul unui sondaj prin sondaj, obținem un excelent mecanism de reprezentare politică - un mecanism în care un grup mic de oameni poate reprezenta opinia sau poziția întregii populații a țării. Prin urmare, reprezentativității studiului i se acordă un loc atât de important.

Conceptul de reprezentativitate este folosit, desigur, nu numai în studiile politice. Termenul este folosit aproape întotdeauna când se vorbește despre studii ample, fie în domeniul marketingului, al comportamentului economic sau al educației.

Metodologia anchetelor reprezentative

Cum, după sondajul a 1.500 de persoane, se poate trage concluzii despre toți rușii, dintre care sunt peste 140 de milioane (și chiar și alegători peste 110 milioane)? Tehnologia din spatele sondajelor reprezentative se bazează pe legi statistice. Cel mai apropiat motiv este legea numerelor mari sau teorema lui Bernoulli.

Simplificat, sensul său poate fi transmis după cum urmează. Să presupunem că avem o caracteristică, de exemplu, cantitatea de precipitații pe zi în Ekaterinburg în timpul secolului al XX-lea. Dacă scriem toate valorile sale împreună cu frecvența lor (aceasta se numește distribuție), apoi luăm aleatoriu un număr suficient de mare de cazuri (adică nu toate zilele din secolul al XX-lea, ci destul de multe), atunci vom vedea că distribuția în eșantionul nostru va fi foarte asemănătoare cu distribuția pentru întregul secol XX. Astfel, dacă selectăm unele unități din populație, acestea pot reprezenta într-adevăr întreaga populație și nu este cu adevărat necesar să colectăm date pentru toate cazurile.

Cu toate acestea, există o condiție cheie: aceasta este adevărată numai dacă selecția este strict aleatorie. Singura problemă aici poate fi abaterea de la aleatoriu. Deci, dacă luăm doar date despre precipitații din ultimii ani (de exemplu, pentru că aceste date sunt mai ușor de găsit) sau intervievăm 1500 dintre cunoscuții noștri (pentru că este mai ușor să-i contactăm), și nu oameni aleatori, atunci eșantionul, desigur , nu va fi reprezentativ.

Imaginați-vă că din 143,5 milioane de ruși, selectați aleatoriu cei 1.500 de oameni de care aveți nevoie. Apoi, de exemplu, proporția de manageri de mijloc dintre aceștia va fi aproximativ egală cu proporția de manageri de mijloc din populație, ceea ce arată că eșantionul dumneavoastră poate reprezenta întreaga populație. Se poate întâmpla ca acești doi indicatori să fie foarte diferiți? De exemplu, printre ruși este de 14%, dar în eșantion va fi doar 1%? Teoretic, acest lucru este posibil, dar probabilitatea este atât de mică încât poate fi neglijată (cum ar fi întâlnirea cu un dragon pe stradă).

Mai mult, cel mai plăcut lucru la această probabilitate nu este nici măcar că este mică, ci că pentru procese aleatorii această probabilitate poate fi calculată. Putem spune cu ce probabilitate valoarea eșantionului nostru se va abate de la valoarea populației generale cu 13% (ca în exemplul de mai sus) și cu care, să zicem, cu 2,5%. De obicei, totuși, ei procedează invers: în primul rând, determină probabilitatea cu care dorim ca valoarea noastră să nu devieze de la valoarea din populația generală (cel mai adesea este fixată la nivelul de 95%), apoi se uită la magnitudinea abaterii pentru o anumită dimensiune a eșantioanelor. Această abatere se numește interval de încredere, uneori denumit eroare de eșantionare sau eroare statistică și este adesea enumerată alături de rezultatele sondajului.

Deci, probabilitatea abaterii, valoarea abaterii (intervalul de încredere) și dimensiunea eșantionului sunt legate. Pe baza acesteia, formula de calcul a mărimii eșantionului este următoarea:

unde n este dimensiunea eșantionului, Δ este intervalul de încredere, z este valoarea funcției de distribuție normală pentru o probabilitate dată de respingere (pentru o probabilitate de 5%, această valoare este 1,96).

Aceasta este o formulă simplificată, sondajele reale folosesc formule puțin mai complexe. Această formulă poate eșua și dacă valoarea indicatorului este foarte diferită de 50% (deci, de exemplu, această formulă nu este potrivită pentru estimarea proporției de pacienți cu o boală rară într-o țară).

Iată ce se întâmplă dacă înlocuiți unele valori în această formulă:

Cu alte cuvinte, dacă am luat un eșantion aleatoriu de ruși cu o dimensiune de 1600 de persoane și am estimat un indicator, de exemplu, dorința de a vota pentru un anumit politician, atunci cu o probabilitate de 95% estimarea noastră nu va diferi de disponibilitatea să-l voteze printre toți rușii cu mai mult de 2, 45%.

Marime de mostra

Deci, cu cât dimensiunea eșantionului este mai mare, cu atât este mai probabil să fim mai aproape de o pondere în populație. S-ar părea că aceasta înseamnă că trebuie să încercăm să aducem eșantionul mai aproape de 143,5 milioane.De fapt, după cum puteți vedea din tabel, natura proceselor aleatoare este de așa natură încât de la un anumit moment probabilitatea de a cădea în interval începe să crească foarte încet (și acest moment vine destul de repede). După ce eșantionăm 1500 de unități, indiferent cât de mult am crește dimensiunea eșantionului, probabilitatea ca valoarea eșantionului nostru să cadă în valoarea populației va crește foarte, foarte lent.

De fapt, nu există aproape nicio diferență între 1.500 și 10.000 de respondenți. Undeva până în 1500 putem spune deja că estimările noastre vor diferi de ponderea în populația generală cu 2-3%. Dacă creștem eșantionul în continuare, atunci această posibilă eroare va scădea, dar foarte ușor. Cu alte cuvinte, un eșantion de 100.000 este mai bun decât un eșantion de 2500, dar diferența este atât de mică încât nu are sens și, în cazul anchetelor sociale, nu este justificată economic. De obicei, creșterea eșantionului este costisitoare și, prin urmare, nu are sens să-l umflați pentru a câștiga un punct procentual în valoarea intervalului de încredere.

Este important ca dimensiunea populației generale să nu apară deloc în formulă. Cert este că atunci când populația este mare (mai mult de 20.000), aceasta are puțin sau deloc efect asupra dimensiunii eșantionului. Astfel, nu trebuie să știm câți oameni trăiesc în Rusia pentru a construi un eșantion reprezentativ. Este clar că alegerea a 1500 din 2000 cel mai probabil nu are sens - este mai ușor să examinezi 2000 și să obții o estimare precisă. Dar, dacă este necesar, făcând un eșantion, avem ocazia de a generaliza rezultatele acestuia pentru populația generală. Și din același motiv, dimensiunea eșantionului nu va diferi pentru țările mari și mici.

Reprezentativitate și acuratețe

Pentru a înțelege semnificația conceptului de „reprezentativitate”, să luăm în considerare un eșantion de 15 persoane. Destul de ciudat, dacă ai făcut-o din întâmplare, este și reprezentativ. Mai mult, puteți face o mostră dintr-o unitate. Imaginați-vă o cutie de bile din care trageți la întâmplare o minge. Dacă este o minge aleasă aleatoriu, atunci va reprezenta și toate bilele care se află în această casetă. El îi va reprezenta doar. nu chiar. De ce? Pentru că există o probabilitate foarte mare de a greși. Data viitoare putem trage o altă minge și ne putem face o altă idee despre bilele din cutie. A reprezenta incorect înseamnă a avea o gamă largă de estimări.

La fel, 15 persoane reprezintă orice populație generală, dar o reprezintă inexact, deoarece eroarea, intervalul de încredere, este foarte mare. Va trebui să adăugăm +/- 33% pentru a obține o șansă de 95% să cădem în interval. Dacă suntem gata să recunoaștem acest lucru, atunci luăm 15 oameni, aflăm că 7 dintre ei sunt manageri de mijloc și apoi obținem o estimare că 7/15 din total, adică 47% +/- 33%, este ponderea estimată a managerilor în populația generală, iar aceasta este o concluzie absolut corectă. Doar că nu are valoare. Am putea spune asta fără examinare. Prin urmare, atunci când planificați un eșantion, este logic să obțineți o dimensiune care să fie adecvată în ceea ce privește rentabilitatea.

Toate cele de mai sus sunt menite să transmită o idee simplă, care de multe ori nu este realizată: dimensiunea eșantionului nu este legată de reprezentativitatea acestuia.

Un eșantion mic este imprecis, dar poate fi totuși reprezentativ. Dimensiunile eșantionului care sunt folosite astăzi în anchetele de masă din Rusia au aproape întotdeauna o precizie destul de ridicată.

Reprezentativitatea eșantionului este amenințată nu de dimensiunea sa, ci de părtinire, adică de abaterea de la principiul aleatoriei.

Încălcarea principiului aleatoriei

Dacă începem să alegem unități non-aleatorie, eșantionul devine nereprezentator. De exemplu, dacă ceva ne împiedică să le selectăm aleatoriu. Imaginează-ți că vrem să selectăm bile din cutia noastră la întâmplare, dar apoi se dovedește că unele dintre bile mușcă. Mecanismul prin care vom lua doar acele bile care ne sunt date este un mecanism care încalcă aleatorietatea și, prin urmare, încalcă reprezentativitatea. În acest caz, indiferent câte bile vom lua din cutie (chiar dacă luăm toate bilele care nu mușcă), vom avea o probă nereprezentativă, pentru că nu vom număra niciuna dintre cele care mușcă - pur și simplu ne ocolesc. proba .

Cea mai mare problemă cu bile care mușcă este că pot fi diferite de cele care vin în mâinile noastre și diferă exact în modul în care ne interesează. Această situație se numește părtinire de eșantionare.

Este necesar să distingem situația reprezentării inexacte, pe care am descris-o mai sus, de situația nereprezentării. Acestea sunt probleme diferite și au soluții diferite. Nu poți rezolva una dintre ele rezolvând-o pe cealaltă. Dacă eșantionul este lipsit de reprezentativitate, este inutil să îl creștem. Mai mult, eșantioanele mari din anchetele sociale tind să acumuleze erori, astfel că problema reprezentării nu poate fi agravată decât de o creștere mare a eșantionului.

De ce este imposibilă reprezentativitatea?

În notele la tabelele cu rezultatele sondajelor, se poate observa adesea că „mărimea eșantionului este de 1600 de persoane, eșantionul este reprezentativ pentru sex și vârstă”. Din cele spuse mai sus, este evident că aceștia sunt doi parametri diferiți: o indicație de reprezentativitate nu este legată de dimensiunea eșantionului. De fapt, ceea ce se înțelege aici este că au fost urmate anumite proceduri pentru a asigura corespondența dintre eșantion și populație. De exemplu, pentru a asigura reprezentativitatea pe sex, bărbații și femeile sunt recrutați în eșantion în aceleași proporții care există în rândul rușilor conform datelor recensământului. Dar reprezentativitatea după gen nu înseamnă reprezentativitate, de exemplu, după opinii politice.

De ce este necesară alinierea eșantionului pe gen și alte categorii socio-demografice? Pentru că doar un eșantion aleatoriu poate oferi o adevărată reprezentativitate și este imposibil să o implementăm în practică din multe motive. De îndată ce încercați să faceți acest lucru, veți întâmpina o mulțime de probleme - indiferent de metoda pe care o alegeți să utilizați. Unii dintre respondenți nu vor fi deloc disponibili pentru metoda dvs. (de exemplu, pentru interviurile personale, casele cu interfoane și securitate sunt o mare problemă), o altă parte va fi absentă, nu va răspunde sau preferă să-și facă treaba. Sunt oameni care au probleme cu limba și nu pot vorbi cu noi. Sunt oameni care nu înțeleg de ce este necesar acest lucru și nu vor să vorbească cu noi. Toate acestea sunt încălcări grave ale aleatoriei, care fac imposibilă realizarea acesteia.

Cei care reduc problema reprezentării în anchetele de masă la statistici uită că oamenii sunt marmură foarte specifică. Sunt bile care aleargă și se ascund. Sunt bile care mușcă. Nu sunt obiecte pasive, ci lovesc înapoi. Ei spun: „Nu vreau să particip la sondajul tău”, încălcând astfel aleatoriu. Prin urmare, în sensul strict al cuvântului, reprezentativitatea în anchetele de masă este, desigur, imposibilă sub orice formă.

S-a dezvoltat un mecanism prin care se asigură de obicei aspectul reprezentativității: aliniem eșantionul în unele categorii și pretindem că este aliniat și în toate celelalte categorii posibile. De fapt, nu avem niciun motiv să afirmăm acest lucru. Dar problema este că nu există nicio modalitate de a verifica acest lucru - din nou, din cauza faptului că unele bile mușcă. Pentru a verifica părtinirea, examinatorul ar trebui să meargă la cei pe care nu i-am intervievat și să îi intervieveze. Dar ei, după cum ne amintim, nu doresc deloc să fie chestionați. Este imposibil să-i interoghezi pe cei care nu răspund categoric. Prin urmare, toată lumea lucrează pe ipoteza că, dacă am aliniat eșantionul pe doi sau trei parametri, acesta reprezintă întreaga populație, deși nu există o bază serioasă pentru această ipoteză.

Eșantionarea reprezentativă este o tehnologie împrumutată de sociologi din statistică. Prin urmare, poartă inevitabil elemente ale tabloului matematico-statistic al lumii. Probabil cea mai puternică presupunere este că ancheta prin eșantion în sine este neutră din punct de vedere politic și sociologic: participarea și neparticiparea la sondaj nu au semnificație politică și nu sunt legate de alți parametri importanți din punct de vedere sociologic. Dar astăzi, sondajele au devenit una dintre principalele instituții politice și au devenit un intermediar cheie între marile corporații și consumatori. În aceste condiții, nu se mai poate crede în sterilitatea lor politică. Cu toate acestea, știm încă puține despre modul în care sondajele sunt înțelese în societățile contemporane și despre ce reprezintă ele de fapt.

Una dintre componentele principale ale unui studiu bine conceput este definirea eșantionului și ceea ce este un eșantion reprezentativ. Este ca exemplul tortului. La urma urmei, nu este necesar să mănânci întregul desert pentru a-i înțelege gustul? O mică parte este suficientă.

Deci, tortul este populatia (adică toți respondenții care se califică pentru sondaj). Poate fi exprimat teritorial, de exemplu, numai locuitorii regiunii Moscova. Gen - numai femei. Sau au restricții de vârstă - rușii au peste 65 de ani.

Este dificil să calculezi populația: trebuie să ai date de la recensământul populației sau anchete de evaluare preliminară. Prin urmare, de obicei populația generală este „estimată”, iar din numărul rezultat se calculează cadru de prelevare sau prelevarea de probe.

Ce este un eșantion reprezentativ?

Probă este un număr bine definit de respondenți. Structura sa ar trebui să coincidă cât mai mult posibil cu structura populației generale în ceea ce privește principalele caracteristici ale selecției.

De exemplu, dacă respondenții potențiali sunt întreaga populație a Rusiei, unde 54% sunt femei și 46% sunt bărbați, atunci eșantionul ar trebui să conțină exact același procent. Dacă parametrii se potrivesc, atunci eșantionul poate fi numit reprezentativ. Aceasta înseamnă că inexactitățile și erorile din studiu sunt minimizate.

Mărimea eșantionului este determinată ținând cont de cerințele de acuratețe și economie. Aceste cerințe sunt invers proporționale între ele: cu cât dimensiunea eșantionului este mai mare, cu atât rezultatul este mai precis. În plus, cu cât este mai mare acuratețea, cu atât sunt necesare mai multe costuri pentru studiu. Și invers, cu cât eșantionul este mai mic, cu atât costă mai puțin, cu atât sunt reproduse mai puțin precis și mai aleatoriu proprietățile populației generale.

Prin urmare, pentru a calcula cantitatea de alegere, sociologii au inventat o formulă și au creat calculator special:

Probabilitatea de încredereși eroare de încredere

Ce înseamnă termenii " nivel de încredere" și " eroare de încredere"? Nivelul de încredere este o măsură a acurateței măsurătorilor. O eroare de încredere este o posibilă eroare în rezultatele studiului. De exemplu, cu o populație generală de peste 500,00 de persoane (de exemplu, care locuiește în Novokuznetsk), eșantionul va fi de 384 de persoane cu un nivel de încredere de 95% și o eroare de 5% SAU (cu un interval de încredere de 95 ± 5%).

Ce rezultă din asta? La efectuarea a 100 de studii cu un astfel de eșantion (384 de persoane), în 95 la sută din cazuri, răspunsurile primite, conform legilor statisticii, se vor situa în ± 5% față de original. Și vom obține un eșantion reprezentativ cu o probabilitate minimă de eroare statistică.

După ce se calculează dimensiunea eșantionului, puteți vedea dacă există un număr suficient de respondenți în versiunea demo a panoului de chestionare. Puteți afla mai multe despre cum să efectuați un sondaj de grup.