Beispielgröße, wie man die Formel findet. Stichprobengröße - selektive Methode der soziologischen Forschung

Statistik weiß alles. Und Ilf und E. Petrov, "12 Stühle"

Stellen Sie sich vor, Sie bauen ein großes Einkaufszentrum und möchten den Verkehrsfluss der Einfahrt zum Parkplatz auswerten. Nein, geben wir ein anderes Beispiel… sie werden es sowieso nie tun. Sie müssen die Geschmackspräferenzen Ihrer Portalbesucher auswerten, wofür Sie eine Umfrage unter ihnen durchführen müssen. Wie verknüpft man die Datenmenge und den möglichen Fehler? Nichts Kompliziertes - je größer Ihre Stichprobe, desto kleiner der Fehler. Allerdings gibt es auch hier Nuancen.

Theoretisches Minimum

Es wird nicht überflüssig sein, unser Gedächtnis aufzufrischen, diese Begriffe werden uns später nützlich sein.

  • Population- Die Menge aller Objekte, unter denen geforscht wird.
  • Probe– Eine Teilmenge, ein Teil von Objekten aus der gesamten Population, die direkt an der Studie beteiligt ist.
  • Fehler 1. Art- (α) Wahrscheinlichkeit, die Nullhypothese abzulehnen, obwohl sie wahr ist.
  • Fehler 2. Art- (β) Wahrscheinlichkeit nicht lehnen die Nullhypothese ab, wenn sie falsch ist.
  • 1-β- Statistische Aussagekraft des Kriteriums.
  • μ 0 und u 1- Mittelwerte unter den Null- und Alternativhypothesen.


Schon bei den Definitionen von Fehlern erster und zweiter Art gibt es Raum für Diskussionen und Interpretationen. Wie soll man sich für sie entscheiden und welche als Null wählen? Wenn Sie den Verschmutzungsgrad von Böden oder Gewässern untersuchen, wie würden Sie die Nullhypothese formulieren: Gibt es eine Verschmutzung oder gibt es keine Verschmutzung? Aber davon Stichprobengröße abhängig aus der allgemeinen Population von Objekten.



Initial Population, ebenso gut wie Probe kann jede Verteilung haben, aber der Mittelwert hat normal oder Gaußsche Verteilung dank des zentralen Grenzwertsatzes.


Hinsichtlich der Verteilungsparameter und insbesondere des Mittelwerts sind mehrere Arten von Rückschlüssen möglich. Zuerst davon heißt Konfidenzintervall. Es gibt den Bereich möglicher Werte für den Parameter an, wobei der angegebene Vertrauensfaktor. Also zum Beispiel 100(1-α)% Konfidenzintervall zum μ wird so sein (Lv. 1).




Zweite aus der Schlussfolgerung Hypothesentest. Es könnte so etwas sein.

  • H 0: μ = h
  • H 1: µ > h
  • H2: μ< h

AUS Konfidenzintervall 100(1-α) für μ Sie können sich für H 1 und H 2 entscheiden:

  • Wenn die untere Grenze Konfidenzintervall 100(1-α)< h , то тогда lehne H 0 ab zugunsten von H2.
  • Wenn die Obergrenze Konfidenzintervall 100(1-α) > h, dann lehne H 0 ab zugunsten von H1.
  • Wenn ein Konfidenzintervall 100(1-α) h enthält, dann können wir H 0 und nicht ablehnen ein solches Ergebnis gilt als unbestimmt.

Wenn wir den Wert überprüfen müssen μ für eine Proben aus der Gesamtbevölkerung, dann nimmt das Kriterium die Form an



Konfidenzintervall, Fehler und Stichprobenumfang

Nehmen Sie die allererste Gleichung und drücken Sie die Breite von dort aus Konfidenzintervall(Lv. 2).



In einigen Fällen können wir die Student-t-Statistik durch die z-Standardnormalverteilung ersetzen. Eine weitere Vereinfachung ersetzt die Hälfte von w vom Messfehler E. Dann nimmt unsere Gleichung die Form (Gl. 3) an.



Wie wir sehen der Fehler nimmt wirklich zusammen mit dem Wachstum der Anzahl von Eingabedaten ab. Daraus lässt sich leicht ableiten, wonach Sie suchen (Gl. 4).


Übe - zähle mit R

Lassen Sie uns die Hypothese testen, dass der Durchschnittswert der gegebenen Stichprobe der Anzahl der Insekten in der Falle 1 ist.

  • H0: μ = 1
  • H1: μ > 1
Insekten 0 1 2 3 4 5 6
Fallen 10 9 5 5 1 2 1

> x<- read.table("/tmp/tcounts.txt") >y = unlist(x, use.names="false") > mean(z);sd(z) 1,636364 1,654883

Beachten Sie, dass der Mittelwert und die Standardabweichung fast gleich sind, was für eine Poisson-Verteilung natürlich ist. 95 % Konfidenzintervall für Student's t-Statistik und df=32.


> qt(0,975, 32) 2,036933

und schließlich erhalten wir das kritische Intervall für den Mittelwert: 1.05 - 2.22 .


> μ=Mittelwert(z) > st = qt(0,975, 32) > μ + st * sd(z)/sqrt(33) 2,223159 > μ - st * sd(z)/sqrt(33) 1,049568

Als Ergebnis ist H 0 abzulehnen und H 1 zu akzeptieren, da mit einer Wahrscheinlichkeit von 95 % μ > 1.


Im selben Beispiel, vorausgesetzt, wir kennen die tatsächliche Standardabweichung - σ , und nicht seine Schätzung, die anhand einer Zufallsstichprobe erhalten wurde, können Sie das erforderliche n für einen bestimmten Fehler berechnen. Lassen Sie uns für E=0.5 rechnen.


> za2 = qnorm(.975) > (za2*sd(z)/.5)^2 42.08144

Windkorrektur

Tatsächlich gibt es keinen Grund zu glauben, dass wir es wissen werden σ (Varianz), während μ (gemein) müssen wir noch abschätzen. Aus diesem Grund ist Gleichung 4 bis auf besonders raffinierte Beispiele aus dem Bereich der Kombinatorik von geringem praktischem Nutzen, und die realistische Gleichung für n ist für Unbekannt etwas komplizierter σ (Lv. 5).



beachten Sie, dass σ in der letzten Gleichung nicht mit einem Cap (^), sondern mit einer Tilde (~). Dies ist eine Folge davon, dass wir ganz am Anfang nicht einmal eine geschätzte Standardabweichung einer Stichprobe haben - , sondern verwenden geplant- . Wo bekommen wir das Neueste? Wir können das von der Decke sagen: Expertenurteil, grobe Schätzungen, Erfahrungen aus der Vergangenheit usw.


Und was ist mit dem zweiten Term auf der rechten Seite der 5. Gleichung, wo kommt er her? Da ist Günthers Korrektur nötig.


Neben den Gleichungen 4 und 5 gibt es noch einige weitere Näherungs-Bewertungsformeln, die aber schon einen eigenen Beitrag verdienen.

Die Formel unten zu berechnen Stichprobengröße wird in Fällen verwendet, in denen den Befragten (Befragten) nur eine Frage gestellt wird, auf die es nur zwei mögliche Antworten gibt. Zum Beispiel „Ja“ und „Nein“; „Ich nutze“ und „Ich nutze nicht“. Natürlich kann diese Formel nur bei der Durchführung der einfachsten Studien angewendet werden. Wenn Sie bei der Durchführung größerer Studien, z. B. Fragebögen, die Stichprobengröße bestimmen müssen, sollten andere Formeln verwendet werden.

Eine einfache Formel zur Berechnung der Stichprobengröße

wo: n– Stichprobengröße;

z ist die normalisierte Abweichung, die basierend auf dem ausgewählten Konfidenzniveau bestimmt wird. Dieser Indikator charakterisiert die Möglichkeit, die Wahrscheinlichkeit, Antworten in einem speziellen Konfidenzintervall zu erhalten. In der Praxis wird das Konfidenzniveau oft mit 95 % oder 99 % angenommen. Dann betragen die z-Werte 1,96 bzw. 2,58;

p– Variation für die Stichprobe, in Aktien. Im Wesentlichen ist p die Wahrscheinlichkeit, dass die Befragten die eine oder andere Antwortoption wählen. Angenommen, wir glauben, dass ein Viertel der Befragten die Antwort „Ja“ wählen wird, dann ist p gleich 25 %, dh p = 0,25;

q= (1 – p);

e– zulässiger Fehler, in Bruchteilen.

Beispiel zur Berechnung der Stichprobengröße

Das Unternehmen plant, eine soziologische Studie durchzuführen, um den Anteil der Raucher an der Bevölkerung der Stadt zu ermitteln. Dazu stellen Mitarbeiter des Unternehmens Passanten eine Frage: „Rauchen Sie?“. Daher gibt es nur zwei Antwortmöglichkeiten: „Ja“ und „Nein“.

Die Stichprobengröße wird in diesem Fall wie folgt berechnet. Als Konfidenzniveau wird 95 % angenommen, dann die normalisierte Abweichung z = 1,96. Wir akzeptieren die Abweichung von 50 %, das heißt, wir glauben bedingt, dass die Hälfte der Befragten die Frage, ob sie rauchen, mit „Ja“ beantworten kann. Dann p = 0,5. Ab hier finden wir q = 1 – p = 1 – 0,5 = 0,5 . Der akzeptable Stichprobenfehler wird mit 10 % angenommen e = 0,1.

Wir setzen diese Daten in die Formel ein und berechnen:

Abrufen der Stichprobengröße n = 96 Personen.

Geltungsbereich dieser Formel

Bei der Durchführung einfacher Recherchen, wenn Sie eine Antwort auf nur eine einfache Frage erhalten müssen. Die Antwortskala ist dabei in der Regel dichotomer Natur. Das heißt, es werden Antworten vom Typ "Ja" - "Nein", "Schwarz" - "Weiß" usw. angeboten (oder impliziert).

Merkmale dieser Formel zur Berechnung des Stichprobenumfangs

Galyautdinov R.R.


© Das Kopieren von Material ist nur erlaubt, wenn Sie einen direkten Hyperlink angeben

Populationen werden oft in großen Gruppen von Menschen gehalten. Es ist oft ein Irrtum zu glauben, dass die Zuverlässigkeit der Ergebnisse höher ist, wenn die Fragen von jedem Mitglied der Gesellschaft beantwortet werden. Aufgrund der enormen Zeit-, Geld- und Arbeitskosten ist eine solche Prüfung nicht akzeptabel. Mit steigender Zahl der Befragten steigen nicht nur die Kosten, sondern auch das Risiko, falsche Daten zu erhalten. Aus praktischer Sicht verringern viele Fragebögen und Kodierer die Wahrscheinlichkeit einer zuverlässigen Kontrolle ihrer Handlungen. Eine solche Erhebung wird als kontinuierlich bezeichnet.

In der Soziologie wird am häufigsten eine diskontinuierliche Studie oder eine selektive Methode verwendet. Seine Ergebnisse können auf eine große Gruppe von Menschen ausgedehnt werden, die als General bezeichnet werden.

Definition und Bedeutung des Stichprobenverfahrens

Das Stichprobenverfahren ist eine quantitative Möglichkeit, einen Teil der untersuchten Einheiten aus der Gesamtmasse auszuwählen, wobei die Ergebnisse der Umfrage auch für jede einzelne Person gelten, die nicht daran teilgenommen hat.

Das Stichprobenverfahren ist sowohl Gegenstand wissenschaftlicher Forschung als auch eine akademische Disziplin. Es dient dazu, zuverlässige Informationen über die allgemeine Bevölkerung zu erhalten, und hilft, alle ihre Parameter zu bewerten. Die Bedingungen für die Auswahl der Einheiten wirken sich anschließend auf die statistische Auswertung der Ergebnisse aus. Wenn die Probenahmeverfahren schlecht implementiert sind, ist der Einsatz selbst der zuverlässigsten Methoden zur Verarbeitung der gesammelten Informationen nutzlos.

Schlüsselkonzepte der Wahltheorie

Sie nennen das Verhältnis von Einheiten, in Bezug auf die die Schlussfolgerungen der Beispielstudie formuliert werden. Dies können Einwohner eines Landes, eines bestimmten Ortes, das Arbeitsteam eines Unternehmens usw. sein.

Die Stichprobe (oder Probe) ist Teil des Allgemeinen, das nach speziellen Methoden und Kriterien ausgewählt wurde. Bei der Bildung werden beispielsweise statistische Kriterien berücksichtigt.

Die Anzahl der in einer gegebenen Menge enthaltenen Individuen wird Volumen genannt. Aber es kann nicht nur durch die Anzahl der Menschen ausgedrückt werden, sondern auch durch Wahllokale, Siedlungen, also definitiv große Einheiten, die Beobachtungseinheiten enthalten. Dies ist jedoch bereits eine mehrstufige Probe.

Auswahleinheit sind die Bestandteile der Allgemeinbevölkerung, sie können entweder direkt Beobachtungseinheiten (einstufige Stichprobe) oder größere Formationen sein.

Eine wichtige Rolle bei der Gewinnung zuverlässiger Forschungsergebnisse mit einem Stichprobenverfahren spielt eine Eigenschaft wie die Repräsentativität der Auswahl. Das heißt, der Teil der allgemeinen Bevölkerung, der zu Befragten wurde, muss alle seine Merkmale vollständig reproduzieren. Jede Abweichung gilt als Fehler.

Schritte zur Anwendung des Stichprobenverfahrens

Jede Empirie besteht aus Stufen. Wenn das Stichprobenverfahren angewendet wird, wird ihre Reihenfolge wie folgt angeordnet:

  1. Erstellung einer Entwurfsstichprobe: Erhebung der Grundgesamtheit, Auswahlverfahren, Mengencharakterisierung.
  2. Projektdurchführung: Im Zuge der Erhebung soziologischer Informationen erfüllen die Fragebögen Aufgaben mit Angabe der Methode der Befragtenauswahl.
  3. Ermittlung und Korrektur von Repräsentativitätsfehlern.

Arten von Stichproben in der Soziologie

Nach der Bestimmung der Allgemeinbevölkerung fährt der Forscher mit selektiven Verfahren fort. Sie können in zwei Arten (Kriterien) unterteilt werden:

  1. Die Rolle probabilistischer Gesetze im Verlauf der Stichprobenziehung.
  2. Die Anzahl der Auswahlstufen.

Wird das erste Kriterium angewendet, so wird zwischen dem Verfahren der zufälligen Auswahl und der nicht zufälligen Auswahl unterschieden. Basierend auf letzterem kann argumentiert werden, dass die Stichprobe einstufig und mehrstufig sein kann.

Die Art der Proben spiegelt sich nicht nur in den Phasen der Vorbereitung und Durchführung der Studie, sondern auch in ihren Ergebnissen direkt wider. Bevor Sie einem von ihnen den Vorzug geben, sollten Sie den Inhalt der Konzepte verstehen.

Die Definition von „Zufall“ hat im alltäglichen Gebrauch eine völlig entgegengesetzte Bedeutung bekommen als in der Mathematik. Diese Auswahl erfolgt nach strengen Regeln, von denen nicht abgewichen werden darf, da es wichtig ist sicherzustellen, dass jede Einheit der Allgemeinbevölkerung die gleichen Chancen hat, in die Stichprobe aufgenommen zu werden. Wenn diese Bedingungen nicht erfüllt sind, wird diese Wahrscheinlichkeit anders sein.

Die Stichprobe wiederum wird unterteilt in:

  • einfach;
  • mechanisch (systematisch);
  • Verschachtelung (seriell, Cluster);
  • geschichtet (typisch oder zoniert).

Ein einfaches Stichprobenverfahren wird unter Verwendung einer Tabelle von Zufallszahlen durchgeführt. Zunächst wird der Stichprobenumfang festgelegt; Es wird eine vollständige Liste der nummerierten Befragten erstellt, die zur allgemeinen Bevölkerung gehören. Zur Auswahl werden spezielle Tabellen verwendet, die in mathematischen und statistischen Publikationen enthalten sind. Alle anderen sind verboten. Wenn der Stichprobenumfang eine dreistellige Zahl ist, muss die Nummer jeder Stichprobeneinheit dreistellig sein, nämlich von 001 bis 790. Die letzte Zahl gibt die Gesamtzahl der Personen an. An der Studie werden diejenigen Personen teilnehmen, denen eine Nummer im angegebenen Bereich zugewiesen wurde, der in der Tabelle zu finden ist.

Die systematische Auswahl basiert auf Berechnungen. Eine alphabetische Liste aller Elemente der Allgemeinbevölkerung wird vorläufig zusammengestellt, der Schritt wird festgelegt und erst dann die Stichprobengröße. Die Stufenformel lautet wie folgt:

N: n, wobei N die Grundgesamtheit und n die Stichprobe ist.

Beispiel: 150.000: 5.000 = 30. Somit wird jede dreißigste Person zur Teilnahme an der Umfrage ausgewählt.

Nesttyp-Entität

Eine geclusterte Stichprobe wird verwendet, wenn die Population der untersuchten Personen aus kleinen natürlichen Gruppen besteht. Dabei ist zu beachten, dass die Listennummer solcher Nester im ersten Schritt bestimmt wird. Mit Hilfe einer Zufallszahlentabelle wird eine Auswahl getroffen und eine kontinuierliche Befragung aller Befragten in jedem ausgewählten Nest durchgeführt. Je mehr von ihnen an der Studie teilnahmen, desto geringer war zudem der durchschnittliche Stichprobenfehler. Es ist jedoch möglich, eine solche Technik zu verwenden, vorausgesetzt, dass die untersuchten Nester ein ähnliches Merkmal aufweisen.

Die Essenz der stratifizierten Wahl

Eine geschichtete Stichprobe unterscheidet sich von den vorherigen dadurch, dass die allgemeine Bevölkerung am Vorabend der Auswahl in Schichten unterteilt wird, dh homogene Teile, die ein gemeinsames Merkmal aufweisen. Zum Beispiel das Bildungsniveau, Wahlpräferenzen, die Zufriedenheit mit verschiedenen Aspekten des Lebens. Am einfachsten ist es, die Probanden nach Geschlecht und Alter zu trennen. Grundsätzlich ist die Auswahl so vorzunehmen, dass aus jeder Schicht eine zur Gesamtzahl proportionale Anzahl von Personen herausgegriffen wird.

Die Stichprobengröße kann in diesem Fall kleiner sein als in einer Situation mit zufälliger Auswahl, aber die Repräsentativität wird höher sein. Es sollte anerkannt werden, dass geschichtete Stichproben in finanzieller und informationstechnischer Hinsicht am kostspieligsten sind und verschachtelte Stichproben in dieser Hinsicht am vorteilhaftesten sind.

Nicht zufällige Quotenstichprobe

Es gibt auch eine Quotenprobe. Es ist die einzige Art der nicht-zufälligen Auswahl, die eine mathematische Begründung hat. Die Quotenstichprobe wird aus Einheiten gebildet, die durch Anteile repräsentiert werden müssen und der Allgemeinbevölkerung entsprechen. In dieser Form erfolgt eine gezielte Merkmalsverteilung. Gehören Meinungen und Einschätzungen von Personen zu den untersuchten Merkmalen, dann sind Geschlecht, Alter und Bildung der Befragten oft Quoten.

Auch in einer soziologischen Studie werden zwei Selektionsmethoden unterschieden: wiederholt und nicht wiederholt. Im ersten Fall wird die ausgewählte Einheit nach der Befragung an die Allgemeinbevölkerung zurückgegeben, um sich weiterhin an der Auswahl zu beteiligen. Bei der zweiten Option werden die Befragten sortiert, was die Chancen erhöht, dass die verbleibenden Mitglieder der Grundgesamtheit ausgewählt werden.

Der Soziologe G. A. Churchill entwickelte die folgende Regel: Die Stichprobengröße sollte darauf abzielen, mindestens 100 Beobachtungen für die primäre und 20-50 für die sekundäre Klassifizierungskomponente zu liefern. Es ist zu beachten, dass einige der in die Stichprobe aufgenommenen Befragten aus verschiedenen Gründen möglicherweise nicht an der Umfrage teilnehmen oder sie ganz ablehnen.

Methoden zur Bestimmung der Stichprobengröße

In der soziologischen Forschung sind folgende Methoden anwendbar:

1. Willkürlich, dh die Stichprobengröße wird innerhalb von 5-10% der Zusammensetzung der Allgemeinbevölkerung festgelegt.

2. Die traditionelle Berechnungsmethode basiert auf der Durchführung regelmäßiger Umfragen, zum Beispiel einmal im Jahr, mit 600, 2.000 oder 2.500 Befragten.

3. Statistik - dient der Feststellung der Zuverlässigkeit von Informationen. Statistik als Wissenschaft entwickelt sich nicht isoliert. Die Themen und Bereiche ihrer Forschung sind aktiv in andere verwandte Bereiche eingebunden: technische, wirtschaftliche und humanitäre. So werden ihre Methoden in der Soziologie, bei der Vorbereitung von Befragungen und insbesondere bei der Ermittlung von Stichprobenumfängen eingesetzt. Die Statistik als Wissenschaft verfügt über eine umfangreiche methodische Basis.

4. Teuer, in dem die erstattungsfähige Höhe der Forschungskosten festgelegt wird.

5. Die Stichprobengröße kann der Anzahl der Einheiten der Allgemeinbevölkerung entsprechen, dann wird die Studie kontinuierlich sein. Dieser Ansatz ist in kleinen Gruppen anwendbar. Zum Beispiel die Belegschaft, Studenten usw.

Bisher konnte festgestellt werden, dass die Stichprobe dann als repräsentativ gilt, wenn ihre Merkmale die Eigenschaften der Allgemeinbevölkerung mit einem minimalen Fehler beschreiben.

Die Schätzung der Stichprobengröße geht den endgültigen Berechnungen der Anzahl der Einheiten voraus, die aus der allgemeinen Bevölkerung ausgewählt werden:

n = Npqt 2: N∆ 2 p + pqt 2 , wobei N die Anzahl der Einheiten der Allgemeinbevölkerung ist, p der Anteil des untersuchten Merkmals ist (q = 1 - p), t der Übereinstimmungskoeffizient von ist die Konfidenzwahrscheinlichkeit P (bestimmt aus einer speziellen Tabelle), ∆ p - zulässiger Fehler.

Dies ist nur eine Variante der Berechnung des Stichprobenumfangs. Die Formel kann sich abhängig von den Bedingungen und den ausgewählten Untersuchungskriterien (z. B. Resampling oder Non-Replicating Sampling) ändern.

Stichprobenfehler

Soziologische Befragungen der Bevölkerung basieren auf der Verwendung einer der oben betrachteten Stichprobenarten. In jedem Fall sollte es jedoch die Aufgabe jedes Forschers sein, den Grad der Genauigkeit der erhaltenen Indikatoren zu bewerten, dh es muss festgestellt werden, inwieweit sie die Merkmale der Allgemeinbevölkerung widerspiegeln.

Stichprobenfehler können in zufällige und nicht zufällige Fehler unterteilt werden. Der erste Typ impliziert die Abweichung des Stichprobenindikators vom allgemeinen, die durch die Differenz ihrer Anteile (Durchschnitt) ausgedrückt werden kann und die nur durch eine nicht kontinuierliche Erhebungsart verursacht wird. Und es ist ganz natürlich, wenn dieser Indikator vor dem Hintergrund einer Zunahme der Zahl der befragten Befragten abnimmt.

Ein systematischer Fehler ist eine Abweichung vom allgemeinen Indikator, die auch als Ergebnis der Subtraktion der Stichprobe und der allgemeinen Anteile festgestellt wird und sich aus der Inkonsistenz der Stichprobenmethode mit den festgelegten Regeln ergibt.

Diese Arten von Fehlern sind im Gesamtstichprobenfehler enthalten. In einer Studie kann nur eine Stichprobe aus der Grundgesamtheit gezogen werden. Die Berechnung der maximal möglichen Abweichung des Stichprobenindikators kann mit einer speziellen Formel durchgeführt werden. Er wird als marginaler Stichprobenfehler bezeichnet. Es gibt auch so etwas wie den mittleren Stichprobenfehler. Dies ist die Standardabweichung der Stichprobe vom allgemeinen Anteil.

Es gibt auch einen a posteriori (postexperimentellen) Fehlertyp. Es bedeutet die Abweichung der Indikatoren der Stichprobe vom allgemeinen Anteil (Durchschnitt). Es wird berechnet, indem der allgemeine Indikator, dessen Informationen aus zuverlässigen Quellen stammen, und die Stichprobe, die während der Umfrage erstellt wurde, verglichen werden. Personalabteilungen von Unternehmen, staatliche Statistikämter fungieren häufig als verlässliche Informationsquellen.

Es gibt auch einen A-priori-Fehler, der ebenfalls eine Abweichung der Stichprobe und der allgemeinen Indikatoren ist, die als Differenz ihrer Anteile ausgedrückt und mit einer speziellen Formel berechnet werden können.

In der Bildungsforschung werden bei der Auswahl der Befragten für eine Umfrage am häufigsten folgende Fehler gemacht:

1. Stichprobensätze von Gruppen, die zu verschiedenen Allgemeinbevölkerungen gehören. Wenn sie verwendet werden, werden statistische Rückschlüsse entwickelt, die für die gesamte Stichprobe gelten. Dass dies nicht hingenommen werden kann, liegt auf der Hand.

2. Die organisatorischen und finanziellen Möglichkeiten des Forschers werden bei der Berücksichtigung von Probentypen nicht berücksichtigt und einer von ihnen wird der Vorzug gegeben.

3. Statistische Kriterien für die Struktur der Allgemeinbevölkerung werden nicht vollständig genutzt, um Stichprobenfehler zu vermeiden.

4. Die Anforderungen an die Repräsentativität der Auswahl der Befragten im Rahmen von Vergleichsstudien werden nicht berücksichtigt.

5. Die Anweisungen für den Interviewer sollten an die spezifische Art der vorgenommenen Auswahl angepasst werden.

Die Art der Teilnahme der Befragten an der Studie kann offen oder anonym sein. Dies sollte bei der Stichprobenbildung berücksichtigt werden, da die Teilnehmer bei Nichteinhaltung der Bedingungen aussteigen können.

Beim Design einer Stichprobenbeobachtung stellt sich die Frage nach der erforderlichen Stichprobengröße. Diese Zahl kann anhand des zulässigen Stichprobenfehlers, anhand der Wahrscheinlichkeit, anhand derer die Größe des festzusetzenden Fehlers garantiert werden kann, und schließlich anhand des Auswahlverfahrens bestimmt werden.

Die Formeln für den erforderlichen Stichprobenumfang für verschiedene Stichprobenverfahren können aus den entsprechenden Verhältnissen abgeleitet werden, die zur Berechnung der marginalen Stichprobenfehler verwendet werden. Hier sind die in der Praxis am häufigsten verwendeten Ausdrücke für die erforderliche Stichprobengröße:

ordnungsgemäße stichprobenartige und maschinelle Probenahme:

(Neuauswahl)

(nicht wiederholte Auswahl)

typische Probe:

(Neuauswahl)

(nicht wiederholte Auswahl)

Serienbemusterung:

(Neuauswahl)

(nicht wiederholte Auswahl)

In diesem Fall können je nach Zielsetzung der Studie die Varianzen und Stichprobenfehler für den Mittelwert oder Anteil des Merkmals berechnet werden.

Betrachten wir Beispiele zur Bestimmung der erforderlichen Stichprobengröße für verschiedene Methoden zur Bildung einer Stichprobenpopulation.

Beispiel 5 In 100 Reisebüros der Stadt ist geplant, eine Erhebung der durchschnittlichen monatlichen Anzahl verkaufter Gutscheine durch die Methode der maschinellen Auswahl durchzuführen. Wie groß sollte der Stichprobenumfang sein, damit mit einer Wahrscheinlichkeit von 0,683 der Fehler 3 Voucher nicht überschreitet, wenn laut Piloterhebung die Varianz 225 beträgt.

Lösung. Berechnen Sie die erforderliche Stichprobengröße:

Agenturen.

Beispiel 6 Um den Anteil der Mitarbeiter von Geschäftsbanken in der Region über 40 Jahren zu ermitteln, ist geplant, eine typische Stichprobe proportional zur Anzahl der männlichen und weiblichen Mitarbeiter mit einer mechanischen Auswahl innerhalb der Gruppen zu organisieren. Die Gesamtzahl der Bankangestellten beträgt 12.000 Personen, darunter 7.000 Männer und 5.000 Frauen.

Aufgrund früherer Erhebungen ist der Durchschnitt der gruppeninternen Varianzen mit 1600 bekannt. Bestimmen Sie den erforderlichen Stichprobenumfang mit einer Wahrscheinlichkeit von 0,997 und einem Fehler von 5 %.

Lösung. Berechnen Sie die Gesamtgröße einer typischen Stichprobe:

Personen

Berechnen wir nun die Lautstärke einzelner typischer Gruppen:

Personen

Personen

Somit beträgt die erforderliche Stichprobengröße der Bankangestellten 550 Personen, inkl. 319 Männer und 231 Frauen.

Beispiel 7 Die Aktiengesellschaft hat 200 Arbeiterteams. Es ist geplant, eine Stichprobenerhebung durchzuführen, um den Anteil der Beschäftigten mit Berufskrankheiten zu ermitteln. Es ist bekannt, dass die Interserien-Varianz des Anteils 225 beträgt. Berechnen Sie mit einer Wahrscheinlichkeit von 0,954 die erforderliche Anzahl von Teams für die Befragung der Arbeitnehmer, wenn der Stichprobenfehler 5% nicht überschreiten sollte.

Lösung. Die erforderliche Brigadenzahl errechnet sich nach der Formel für das Volumen der seriellen einmaligen Probenahme:

Brigaden.

3. Bestimmung der erforderlichen Stichprobengröße

Es ist sehr wichtig, die optimale Größe der Stichprobe zu bestimmen, die mit einer bestimmten Wahrscheinlichkeit die angegebene Genauigkeit der Beobachtungsergebnisse liefert. Mit zunehmender Stichprobengröße nimmt der Stichprobenfehler ab. Da aber die Stichprobeneinheiten für eine Erhebung oft vernichtet werden, müssen die Stichprobenquoten der Einheiten in der Stichprobe optimal sein. Die optimale Stichprobengröße kann den Stichprobenfehlerformeln entnommen werden.

Tabelle 8.4

Formeln zur Bestimmung des optimalen Stichprobenumfangs

Auswahlverfahren

Für mittel

Selbst zufällig wiederholt

Zufällig und mechanisch nicht wiederholbar

Typologische Nichtwiederholung

Seriell nicht repetitiv mit gleicher Serie

Die Formeln zeigen, dass mit zunehmendem geschätzten Stichprobenfehler die erforderliche Stichprobengröße erheblich abnimmt.

Um den Stichprobenumfang zu berechnen, müssen Sie die Varianz kennen. Es kann aus früheren Erhebungen derselben oder einer ähnlichen Grundgesamtheit entlehnt werden, oder es kann eine Ad-hoc-Stichprobenerhebung geringer Größe durchgeführt werden.

Beispiel 2 : In dem Unternehmen wurden 100 von 1000 Arbeitnehmern in der Reihenfolge einer zufälligen, sich nicht wiederholenden Stichprobe befragt, und es wurden die folgenden Daten zu ihrem Einkommen für Oktober erhoben (Tabelle 8.5).

Tabelle 8.5

Verteilung der Arbeitnehmer nach durchschnittlichem Monatseinkommen

Definieren:

1) das durchschnittliche monatliche Einkommen der Mitarbeiter dieses Unternehmens, das das Ergebnis mit einer Wahrscheinlichkeit von 0,997 garantiert;

2) der Anteil der Arbeitnehmer des Unternehmens mit einem monatlichen Einkommen von 19 Tausend Rubel. und höher, was ein Ergebnis mit einer Wahrscheinlichkeit von 0,954 garantiert;

3) die erforderliche Stichprobengröße bei der Bestimmung des durchschnittlichen monatlichen Einkommens der Arbeitnehmer des Unternehmens, damit der Grenzstichprobenfehler mit einer Wahrscheinlichkeit von 0,954 200 Rubel nicht überschreitet.

Lösung:

1) Bestimmen wir das durchschnittliche monatliche Einkommen der Mitarbeiter dieses Unternehmens und garantieren das Ergebnis mit einer Wahrscheinlichkeit von 0,997.

n= 100 Personen

N= 1000 Personen

Lösung: Um das Intervall des durchschnittlichen monatlichen Einkommens der Arbeitnehmer eines bestimmten Unternehmens in der Allgemeinbevölkerung zu bestimmen, muss der Wert des marginalen Stichprobenfehlers bekannt sein und die Höhe des durchschnittlichen Monatseinkommens der Erwerbstätigen laut Stichprobenerhebung .


t und mittlerer Stichprobenfehler .

Da P \u003d 0,997, dann (gemäß Tabelle 8.2) t= 3.

Gemäß der Tabelle wurde eine zufällige, sich nicht wiederholende Auswahl getroffen. 8.3 wählen wir die Formel zur Berechnung des durchschnittlichen Stichprobenfehlers für den Durchschnitt:

, wo
ist die Stichprobenvarianz.

Die Höhe des durchschnittlichen Monatseinkommens der Arbeitnehmer gemäß der Stichprobenerhebung wird durch die Formel des arithmetisch gewichteten Durchschnitts bestimmt:
.

Zusätzliche Berechnungen werden in der folgenden Tabelle durchgeführt:

monatliches Einkommen,

Anzahl der Arbeiter, Pers.

Intervallmittelpunkt

Tausend Rubel.

Tausend Rubel.

Wissen t und
Lassen Sie uns den Wert des marginalen Stichprobenfehlers bestimmen:

Tausend reiben.

Dann ist das Intervall des durchschnittlichen monatlichen Einkommens der Arbeitnehmer dieses Unternehmens wie folgt:

;

.

Antwort: Das durchschnittliche monatliche Einkommen der Mitarbeiter dieses Unternehmens liegt mit einer Wahrscheinlichkeit von 0,997 im Bereich von 18,08 Tausend Rubel. bis zu 18,92 Tausend Rubel.

2) Bestimmen wir den Anteil der Arbeitnehmer des Unternehmens mit einem monatlichen Einkommen von 19.000 Rubel. und höher, was ein Ergebnis mit einer Wahrscheinlichkeit von 0,954 garantiert.

n= 100 Personen

N= 1000 Personen

Lösung: um das Intervall des Anteils der Arbeitnehmer mit einem monatlichen Einkommen von 19 Tausend Rubel zu bestimmen. und darüber ist es notwendig, den Wert des marginalen Stichprobenfehlers des Anteils zu kennen
und der Anteil der Erwerbstätigen mit diesem durchschnittlichen Monatseinkommen laut Stichprobe W.

Der marginale Stichprobenfehler wird durch die Formel bestimmt
. Es hängt vom Wert des Konfidenzfaktors ab t und mittlerer Stichprobenfehler.

Da P \u003d 0,954, dann (gemäß Tabelle 8.2) t= 2.

Gemäß der Tabelle wurde eine zufällige, sich nicht wiederholende Auswahl getroffen. 8.3 Wählen Sie die Formel zur Berechnung des durchschnittlichen Stichprobenfehlers für die Aktie:

, wo W- der Anteil der Arbeitnehmer des Unternehmens mit einem durchschnittlichen Monatseinkommen von 19.000 Rubel. und höher in der Probe.

Der Stichprobenanteil wird durch das Verhältnis der Anzahl der Einheiten bestimmt, die das untersuchte Merkmal aufweisen m auf die Gesamtzahl der Probenahmeeinheiten n, oder
.

Dann ist der durchschnittliche Fehler der Aktie

Wissen t und bestimmen Sie den Wert des marginalen Stichprobenfehlers für die Aktie:

Dann das Intervall des Anteils der Arbeitnehmer mit einem monatlichen Einkommen von 19 Tausend Rubel. und darüber in der Allgemeinbevölkerung wie folgt sein:

.

Antwort: der Anteil der Unternehmensarbeiter mit einem monatlichen Einkommen von 19.000 Rubel. und höher liegt mit einer Wahrscheinlichkeit von 0,954 im Bereich von 19,4 % bis 36,6 %.

    Bestimmen wir die erforderliche Stichprobengröße bei der Bestimmung des durchschnittlichen monatlichen Einkommens der Mitarbeiter des Unternehmens, damit der Grenzstichprobenfehler mit einer Wahrscheinlichkeit von 0,954 200 Rubel nicht überschreitet.

N= 1000 Personen

Lösung: Die erforderliche Stichprobengröße zur Ermittlung des durchschnittlichen Monatseinkommens ergibt sich aus der Formel (gemäß Tabelle 8.4):

Je nach Zustand des Problems ist es bekannt: mit einer Wahrscheinlichkeit P = 0,954 t\u003d 2 (siehe Tabelle 8.2);

0,2 Tausend Rubel;
(nach vorherigem Beispiel).

Personen

Antwort: Damit bei einer Wahrscheinlichkeit von 0,954 der marginale Stichprobenfehler 200 Rubel nicht überschreitet, müssen 189 Personen untersucht werden.

4.5. Bestimmung des Stichprobenumfangs

Das Beispielentwurfsverfahren umfasst sequentielle Lösung der folgenden drei Aufgaben:

Definition des Studiengegenstandes;

Bestimmung der Probenstruktur;

Bestimmung der Stichprobengröße.

Allgemein, Gegenstand der Marktforschung ist eine Reihe von Beobachtungsobjekten, die Verbraucher, Mitarbeiter von Unternehmen, Vermittler usw. sein können. Wenn diese Population so klein ist, dass das Forschungsteam die notwendigen Arbeits-, Finanz- und Zeitkapazitäten hat, um mit jedem seiner Elemente Kontakt aufzunehmen, dann ist es durchaus realistisch, eine kontinuierliche Untersuchung der gesamten Population durchzuführen. In diesem Fall können Sie nach Bestimmung des Forschungsgegenstands mit dem nächsten Verfahren fortfahren (Auswahl der Datenerhebungsmethode, des Forschungsinstruments und der Kommunikationsmethode mit dem Publikum).

In der Praxis ist es jedoch sehr oft nicht möglich oder sinnvoll, eine kontinuierliche Untersuchung der gesamten Bevölkerung durchzuführen. Dafür kann es folgende Gründe geben:

Die Unmöglichkeit, mit einigen Teilen der Bevölkerung Kontakt aufzunehmen;

Unangemessen hohe Kosten für die Durchführung einer vollständigen Studie oder das Bestehen finanzieller Beschränkungen, die die Durchführung einer vollständigen Studie nicht zulassen;

Die kurze Zeit, die für die Studie zur Verfügung steht, weil Informationen im Laufe der Zeit an Relevanz verlieren oder aus anderen Gründen, und die die Sammlung, Systematisierung und Analyse umfangreicher Daten für die gesamte Bevölkerung nicht zulassen.

Daher werden große und verstreute Populationen oft mit Hilfe einer Stichprobe untersucht, die bekanntlich als Teil der Population verstanden wird, die die Population als Ganzes repräsentieren soll.

Die Genauigkeit, mit der eine Stichprobe die Bevölkerung als Ganzes widerspiegelt, hängt von ab Struktur und Stichprobengröße.

Es gibt zwei Ansätze zur Probenstruktur- probabilistisch und deterministisch.

Probabilistischer Ansatz zur Probenstruktur geht davon aus, dass jedes Element der Grundgesamtheit mit einer bestimmten Wahrscheinlichkeit (nicht null) ausgewählt werden kann. Es gibt verschiedene Arten von Stichproben, die auf der Wahrscheinlichkeitstheorie basieren (typisch, verschachtelt usw.). Am einfachsten und in der Praxis am weitesten verbreitet ist eine einfache Zufallsstichprobe, bei der jedes Element der Grundgesamtheit die gleiche Wahrscheinlichkeit hat, für die Forschung ausgewählt zu werden.

Probabilistisches Sampling ist genauer, es ermöglicht dem Forscher, den Grad der Zuverlässigkeit der von ihm gesammelten Daten zu beurteilen, obwohl es komplizierter und teurer ist als deterministisches Sampling.

Deterministischer Ansatz zur Probenstruktur geht davon aus, dass die Auswahl von Populationselementen durch Methoden erfolgt, die entweder auf Zweckmäßigkeitserwägungen oder auf der Entscheidung des Forschers oder auf kontingenten Gruppen beruhen.

aus Bequemlichkeitsgründen, besteht darin, beliebige Elemente der Bevölkerung auszuwählen, basierend auf der Leichtigkeit, mit ihnen Kontakt aufzunehmen. Die Unvollkommenheit dieser Methode liegt möglicherweise an der geringen Repräsentativität der erhaltenen Probe, da Elemente der Population, die für den Forscher geeignet sind, sind möglicherweise aufgrund ihrer nicht zufälligen und unvernünftigen Auswahl keine ausreichend charakteristischen Repräsentanten der Population.

Andererseits haben die Einfachheit, Wirtschaftlichkeit und Effizienz der mit dieser Methode durchgeführten Studie ihr eine ziemlich weite Verbreitung in der Praxis und vor allem bei der Durchführung von Vorstudien zur Klärung der Hauptprobleme eingebracht.

Basierend auf der Stichprobenmethode auf die Entscheidung des Forschers, besteht darin, die Elemente der Bevölkerung auszuwählen, die seiner Meinung nach ihre charakteristischen Vertreter sind. Diese Methode ist perfekter als die vorherige, da sie auf einer Orientierung an den charakteristischen Vertretern der untersuchten Population basiert, obwohl sie aufgrund der subjektiven Vorstellungen der Forscher darüber ausgewählt werden.

Stichprobenverfahren basierend auf kontingente Normen, besteht darin, die charakteristischen Elemente der Population in Übereinstimmung mit den zuvor erhaltenen Merkmalen der Population als Ganzes auszuwählen. Diese Eigenschaften können durch Vorstudien ermittelt werden und sind im Gegensatz zur bisherigen Methode nicht subjektiv. Daher ist diese Methode fortschrittlicher und ermöglicht es, Stichprobenpopulationen zu erhalten, die nicht weniger repräsentativ sind als Wahrscheinlichkeitsstichproben, und zwar zu wesentlich geringeren Kosten für die Durchführung einer Umfrage.

Nach der Auswahl der Probenstruktur (der Herangehensweise an ihre Bildung, die Art der probabilistischen oder werfenden Bildung einer deterministischen Probe) muss der Forscher das Volumen bestimmen, d.h. die Anzahl der Elemente der Probe.

Stichprobengröße bestimmt die Verlässlichkeit von Informationen die durch das Studium erzielt wurden, sowie die für das Studium notwendigen Kosten. Die Stichprobengröße hängt davon ab auf der Ebene der Homogenität oder Vielfalt der untersuchten Objekte.

Je größer die Stichprobengröße, desto höher die Genauigkeit und desto höher die Kosten für die Durchführung der Umfrage. Mit einem probabilistischen Ansatz für die Probenstruktur kann ihr Volumen unter Verwendung bekannter statistischer Formeln basierend auf den spezifizierten Anforderungen an ihre Genauigkeit bestimmt werden.

In der Praxis werden mehrere Ansätze verwendet, um die Stichprobengröße zu bestimmen:

1. Willkürlicher Ansatz basierend auf der Anwendung der „Faustregel“. Beispielsweise wird ohne Nachweis angenommen, dass die Stichprobe 5 % der Bevölkerung umfassen muss, um genaue Ergebnisse zu erhalten. Dieser Ansatz ist einfach und leicht zu implementieren, aber es ist nicht möglich, die Genauigkeit der erhaltenen Ergebnisse festzustellen. Bei einer ausreichend großen Bevölkerung kann es auch ziemlich teuer werden.

Die Stichprobengröße kann basierend auf bestimmten vorbestimmten Bedingungen eingestellt werden. Beispielsweise weiß ein Marktforschungskunde, dass die Stichprobe bei der Untersuchung der öffentlichen Meinung normalerweise 1000 bis 1200 Personen umfasst, und empfiehlt dem Forscher daher, sich an diese Zahl zu halten. Für den Fall, dass auf einem bestimmten Markt jährliche Erhebungen durchgeführt werden, wird jedes Jahr eine gleich große Stichprobe verwendet. Im Gegensatz zum ersten Ansatz wird hier bei der Ermittlung des Stichprobenumfangs die bekannte Logik verwendet, die jedoch sehr anfällig ist.

Beispielsweise kann bei der Durchführung bestimmter Studien die Genauigkeit geringer sein als bei der Untersuchung der öffentlichen Meinung, und die Größe der Bevölkerung kann um ein Vielfaches kleiner sein als bei der Untersuchung der öffentlichen Meinung. Daher berücksichtigt dieser Ansatz nicht die aktuellen Umstände und kann ziemlich teuer sein.

In einigen Fällen werden die Kosten für die Durchführung einer Umfrage als Hauptargument für die Bestimmung der Stichprobengröße herangezogen. So sieht das Budget für Marktforschung die Kosten für die Durchführung bestimmter Umfragen vor, die nicht überschritten werden dürfen. Offensichtlich wird der Wert der erhaltenen Informationen nicht berücksichtigt. In einigen Fällen kann jedoch sogar eine kleine Stichprobe ziemlich genaue Ergebnisse liefern.

Es erscheint sinnvoll, die Kosten nicht absolut zu betrachten, sondern im Verhältnis zur Nützlichkeit der aus den Erhebungen gewonnenen Informationen. Der Kunde und der Forscher sollten unterschiedliche Stichprobengrößen und Datenerhebungsmethoden, Kosten und andere Faktoren berücksichtigen

2. Stichprobenumfang aus der Höhe des Konfidenzintervalls des zulässigen Fehlers, was, wie bereits erwähnt, durch die zweckmäßige Genauigkeit der endgültigen Verallgemeinerungen gegeben ist: von erhöht bis angenähert. Allerdings denken wir hier an die sogenannten zufälligen Fehler, die mit der Art statistischer Fehler verbunden sind. Sie werden als Fehler der Repräsentativität probabilistischer Stichproben berechnet.

V. I. Paniotto gibt die folgenden Berechnungen einer repräsentativen Stichprobe mit der Annahme eines 5-prozentigen Fehlers an (Tabelle 4.2).

Tabelle 4.2

Geschätzte Beispieltabelle

Bei einer Bevölkerung von mehr als 100.000 beträgt die Stichprobe 400 Einheiten. Wenn wir jedoch an allgemeine Populationen von 5.000 oder mehr denken, ist es nach den Berechnungen desselben Autors möglich, die Größe des tatsächlichen Stichprobenfehlers in Abhängigkeit von seinem Volumen anzugeben, was für uns sehr wichtig ist , wobei zu berücksichtigen ist, dass die Größe des zulässigen Fehlers vom Forschungszweck abhängt und sich nicht unbedingt der 5-Prozent-Grenze annähern muss.

Tabelle 4.3

Berechnungstabelle

Neben zufälligen Fehlern sind auch systematische Fehler möglich. Sie hängen von der Organisation der Stichprobenerhebung ab. Dies sind verschiedene Probenverzerrungen in Richtung eines der Pole des Probenparameters.

3. Stichprobengröße basierend auf statistischer Analyse . Dieser Ansatz basiert auf der Bestimmung des Mindeststichprobenumfangs anhand bestimmter Anforderungen an die Verlässlichkeit und Verlässlichkeit der Ergebnisse. Es wird auch bei der Analyse der Ergebnisse verwendet, die für einzelne im Rahmen einer Stichprobe gebildete Untergruppen nach Geschlecht, Alter, Bildungsniveau usw. Aus den Anforderungen an die Verlässlichkeit und Genauigkeit der Ergebnisse einzelner Untergruppen ergeben sich gewisse Anforderungen an den Stichprobenumfang insgesamt.

Der theoretisch begründeteste und richtige Ansatz zur Bestimmung des Stichprobenumfangs basiert auf der Berechnung zuverlässiger Intervalle. Der Begriff der Variation charakterisiert das Ausmaß der Unähnlichkeit (Ähnlichkeit) der Antworten der Befragten auf eine bestimmte Frage. Im engeren Sinne ist die Variation der Werte eines Attributs im Aggregat die Differenz seiner Werte zwischen verschiedenen Einheiten des gegebenen Aggregats im selben Zeitraum oder Zeitpunkt. Die Ergebnisse der Antworten auf Umfragefragen werden üblicherweise in Form einer Verteilungskurve dargestellt (Abb. 4.1). Bei einer hohen Antwortähnlichkeit spricht man von einer kleinen Streuung (enge Verteilungskurve) und bei einer geringen Antwortähnlichkeit von einer hohen Streuung (breite Verteilungskurve).

Als Streuungsmaß wird in der Regel die Standardabweichung genommen, die den durchschnittlichen Abstand von der durchschnittlichen Punktzahl der Antworten jedes Befragten auf eine bestimmte Frage charakterisiert.

Kleine Variante

hohe Variation

Reis. 4.1. Variations- und Verteilungskurven

Da alle Marketingentscheidungen unter Unsicherheit getroffen werden, empfiehlt es sich, diesen Umstand bei der Bestimmung des Stichprobenumfangs zu berücksichtigen. Da die Definition der untersuchten Werte für eine Population in einer engen Population auf der Grundlage von Stichprobenstatistiken erfolgt, ist es notwendig, den Bereich (Konfidenzintervall) festzulegen, in dem die Schätzungen für die Population als Ganzes erwartet werden fallen, und der Fehler in ihrer Bestimmung.

Ein Konfidenzintervall ist ein Bereich, dessen Extrempunkte einem bestimmten Prozentsatz bestimmter Antworten auf eine Frage entsprechen. Das Konfidenzintervall steht in engem Zusammenhang mit der Standardabweichung des untersuchten Merkmals in der Allgemeinbevölkerung: Je größer es ist, desto breiter sollte das Konfidenzintervall sein, um einen bestimmten Prozentsatz der Antworten einzuschließen.

In der Marktforschung ist ein Konfidenzintervall von entweder 95 % oder 99 % üblich. Kein Unternehmen führt Marktforschung mit mehreren Stichproben durch. Und die mathematische Statistik ermöglicht es, einige Informationen über die Stichprobenverteilung zu erhalten, da nur Daten über die Variation einer einzelnen Stichprobe vorliegen.

Ein Indikator dafür, inwieweit eine für die Grundgesamtheit zutreffende Schätzung von einer für eine typische Stichprobe erwarteten Schätzung abweicht, ist der Standardfehler. Außerdem ist der Fehler umso kleiner, je größer die Stichprobengröße ist. Ein hoher Variationswert verursacht einen hohen Fehlerwert und umgekehrt.

Wenn eine bestimmte Frage nur zwei Antworten hat, die als Prozentsatz ausgedrückt werden (es wird ein Prozentmaß verwendet), wird die Stichprobengröße durch die folgende Formel bestimmt:

wobei n die Stichprobengröße ist; z die normalisierte Abweichung ist, die basierend auf dem ausgewählten Konfidenzniveau bestimmt wird; p ist die gefundene Variation für die Stichprobe; g - (100-r); e ist ein akzeptabler Fehler.

Bei der Bestimmung des Variationsindikators für eine bestimmte Bevölkerung ist es ratsam, zunächst eine vorläufige qualitative Analyse der untersuchten Bevölkerung durchzuführen, um zunächst die Ähnlichkeit der Bevölkerungseinheiten in demografischer, sozialer und anderer Hinsicht festzustellen von Interesse für den Forscher. Es ist möglich, eine Pilotstudie durchzuführen, die auf den Ergebnissen ähnlicher Studien basiert, die in der Vergangenheit durchgeführt wurden. Bei der Verwendung eines prozentualen Streuungsmaßes wird der Umstand berücksichtigt, dass die maximale Streuung bei p = 50 % erreicht wird, was der ungünstigste Fall ist. Darüber hinaus wirkt sich dieser Indikator nicht radikal auf die Stichprobengröße aus. Auch die Meinung des Auftraggebers der Studie zum Stichprobenumfang wird berücksichtigt.

Es ist möglich, den Stichprobenumfang anhand von Durchschnittswerten statt Prozentsätzen zu bestimmen.

wobei s die Standardabweichung ist.

In der Praxis ist s nicht bekannt, wenn die Stichprobe neu gebildet wird und ähnliche Erhebungen nicht durchgeführt wurden. In diesem Fall empfiehlt es sich, den Fehler e in Bruchteilen der Standardabweichung anzugeben. Die Berechnungsformel wird umgerechnet und hat folgende Form:

wo .

Oben haben wir über sehr große Aggregate gesprochen. In einigen Fällen sind die Populationen jedoch nicht groß. Wenn die Stichprobe weniger als fünf Prozent der Bevölkerung ausmacht, wird die Bevölkerung normalerweise als groß angesehen und die Berechnungen werden gemäß den oben genannten Regeln durchgeführt. Wenn die Stichprobengröße 5 % der Bevölkerung übersteigt, wird letztere als klein betrachtet und ein Korrekturfaktor wird in die obigen Formeln eingeführt.

Der Stichprobenumfang wird in diesem Fall wie folgt bestimmt:

,

Praktikum Nr. 8. „Ermittlung des erforderlichen Stichprobenumfangs“

"Ermittlung des erforderlichen Stichprobenumfangs"

Die am weitesten verbreitete Art der diskontinuierlichen Beobachtung ist die selektive Beobachtung, bei der nicht alle Einheiten der untersuchten Population untersucht, sondern nur ein bestimmter Teil davon ausgewählt wird.

Die gesamte Menge der zu untersuchenden Objekte (Beobachtungen) wird aufgerufen die allgemeine Bevölkerung. Stichprobenpopulation oder Stichprobe bezeichnet den Teil der allgemeinen Bevölkerung, der für die Untersuchung von repräsentativen Eigenschaften ausgewählt wurde.

Die Auswahl aus der Allgemeinbevölkerung wird so durchgeführt, dass anhand der Stichprobe eine ziemlich genaue Vorstellung von den Hauptparametern der Gesamtbevölkerung gewonnen werden kann. In diesem Fall sprechen wir sowohl von einer Punktschätzung, die als entsprechender Wert des Durchschnitts, Anteils usw. angenommen wird, der als Ergebnis der Stichprobe erhalten wird, als auch von einer Intervallschätzung, d.h. über die Grenzen, innerhalb derer mit einer gewissen Wahrscheinlichkeit der Wert des gesuchten Parameters in der Allgemeinbevölkerung liegen kann. Die Hauptanforderung, die die Stichprobe erfüllen muss, ist die Anforderung ihrer Repräsentativität, d. h. Repräsentativität.

In der Statistik werden die Ergebnisse der kontinuierlichen Beobachtung mitunter als selektive Merkmale gewertet. Eine solche Interpretation der erhaltenen Daten erfolgt in Fällen, in denen die Anzahl der untersuchten Einheiten gering ist und keine feste Überzeugung besteht, dass die untersuchten Merkmale keine anderen Werte als die aufgrund von Beobachtungen ermittelten annehmen können. Bei der Durchführung von Experimenten kann die Anzahl der Werte unendlich groß sein. Daher müssen die erhaltenen Daten bei der Formulierung von Schlussfolgerungen aufgrund ihrer begrenzten Anzahl als selektive Merkmale betrachtet werden.

Bei der Ausweitung der Ergebnisse einer Stichprobenerhebung auf die Allgemeinbevölkerung ist zu beachten, dass es zu einer Diskrepanz zwischen den Merkmalen der Allgemeinbevölkerung und der Stichprobe kommen kann, da nicht die gesamte Bevölkerung, sondern nur ein Teil der Bevölkerung befragt wird davon.

Statistischer Beobachtungsfehler der Wert der Abweichung zwischen den berechneten und tatsächlichen Werten der Eigenschaften der untersuchten Objekte wird berücksichtigt.

Das Stichprobenverfahren bietet erhebliche Einsparungen an materiellen und finanziellen Ressourcen bei der Durchführung statistischer Beobachtungen, wodurch das Erhebungsprogramm erweitert und seine Effizienz gesteigert werden kann. Der zweite Vorteil ist die hohe Zuverlässigkeit der gewonnenen Daten, da mit einer relativ kleinen Stichprobengröße eine effektive Kontrolle über die Qualität der gesammelten Informationen organisiert werden kann. Somit wird die Wahrscheinlichkeit des Auftretens von Registrierungsfehlern und deren Nichtentdeckung im Stadium der Überprüfung der Primärinformationen verringert. Und schließlich ist in einer Reihe von Fällen, in denen eine vollständige Beobachtung mit der Zerstörung oder dem Verderb der untersuchten Einheiten verbunden ist (z. B. bei der Überprüfung der Qualität von Lebensmitteln, die auf den Markt kommen), nur eine punktuelle Erhebung möglich.

Die Genauigkeit der auf Basis des Stichprobenverfahrens gewonnenen Schätzungen hängt nicht vom Anteil der befragten Einheiten ab, sondern von deren Anzahl.

Die Hauptstadien der selektiven Beobachtung;

1) Bestimmung des Ziels, der Aufgaben und Erstellung eines Beobachtungsprogramms;

2) Probenahme;

3) Datensammlung basierend auf dem entwickelten Programm;

4) Analyse der erhaltenen Ergebnisse und Berechnung der Hauptmerkmale der Probe;

5) Berechnung des Stichprobenfehlers und Verteilung seiner Ergebnisse auf die allgemeine Bevölkerung.

Unterscheiden Beispieltypen:

1) zufällig(eigentlich zufällig);

2) mechanisch(z. B. alle 10, 20 usw.);

3) typisch (geschichtet), wenn die Allgemeinbevölkerung in Gruppen eingeteilt wird und in jeder Gruppe mehrere Objekte untersucht werden));

4) seriell (Verschachtelung), wenn ganze Serien zufällig ausgewählt werden.

Der einfachste Weg, eine Stichprobenpopulation zu bilden, ist richtige Zufallsauswahl. Die theoretischen Grundlagen des Stichprobenverfahrens, die ursprünglich in Bezug auf die eigentliche Zufallsauswahl entwickelt wurden, werden auch zur Bestimmung von Stichprobenfehlern bei anderen Beobachtungsmethoden verwendet.

Tatsächlich kann eine zufällige Auswahl wiederholt und nicht wiederholt werden. Bei wiederholt Auswahl, jede Einheit, die zufällig aus der allgemeinen Population ausgewählt wird, wird nach der Beobachtung auf diese Population zurückgeführt und kann erneut untersucht werden. In der Praxis ist diese Auswahlmethode selten. Viel häufiger ist eigentlich zufällig nicht wiederholend Auswahl, bei der die befragten Einheiten nicht an die Bevölkerung zurückgegeben werden und nicht erneut vermessen werden können. Bei wiederholter Auswahl bleibt die Wahrscheinlichkeit, in die Stichprobe aufgenommen zu werden, für jede Einheit der Allgemeinbevölkerung unverändert. Bei nicht-repetitiver Auswahl ändert sie sich, aber für alle Einheiten, die nach der Auswahl mehrerer Einheiten aus ihr in der Allgemeinbevölkerung verbleiben, ist die Wahrscheinlichkeit, in die Stichprobe aufgenommen zu werden, gleich.

Genauigkeit - der Grad des Fehlers in den Ergebnissen der Umfrage oder die Größe des Konfidenzintervalls.

Die absolute Genauigkeit ist durch ein bestimmtes Intervall gegeben, in dem der geschätzte Wert liegen sollte.

Die relative Genauigkeit wird relativ zum Parameterschätzungsniveau definiert.

Konfidenz ist das Maß an Vertrauen, dass eine Schätzung nahe am wahren Wert liegt.

Bei der Bestimmung des Stichprobenumfangs sollten mehrere qualitative Faktoren berücksichtigt werden: die Bedeutung der zu treffenden Entscheidung, die Art der Studie, die Anzahl der Variablen, die Art der Analyse, die in solchen Studien verwendeten Stichprobenumfänge, die Abdeckung Rate, die Abschlussrate und Ressourcenbeschränkungen. Der statistisch ermittelte Stichprobenumfang ist der Netto- oder Endstichprobenumfang, d. h. verbleibende Bevölkerungseinheiten nach Ausschluss potenzieller Befragter, die die vorgegebenen Kriterien nicht erfüllen oder das Interview nicht abgeschlossen haben. Je nach Abdeckungsgrad und Vollständigkeit kann eine wesentlich größere Ausgangsstichprobe erforderlich sein. In der kommerziellen Marktforschung kann der Mangel an Zeit, Geld und guten Leuten entscheidend für die Bestimmung der Stichprobengröße sein. Im Studienprojekt Kaufhaustreue wurde die Stichprobengröße genau aus diesen Gründen festgelegt.

Konfidenzintervallmethode:

Die Bestimmung des Stichprobenumfangs nach der Methode der Konfidenzintervalle basiert auf deren Bildung um den Stichprobenmittelwert oder Stichprobenbruch herum unter Verwendung der Standardfehlerformel. Angenommen, ein Forscher verwendet eine einfache Zufallsstichprobe, um eine Stichprobe von 300 Haushalten auszuwählen, um die monatlichen Ausgaben eines Haushalts für den Einkauf in einem Kaufhaus zu schätzen, und stellt fest, dass die durchschnittlichen monatlichen Haushaltsausgaben in der Stichprobe 182 US-Dollar betragen RMS beträgt die Abweichung der Ausgaben in der Studienpopulation 55 $.

Wir möchten ein Intervall finden, in das ein bestimmter Prozentsatz der Stichprobenmittelwerte fallen würde. Angenommen, wir möchten ein Intervall um den Populationsmittelwert herum definieren, das 95 % der Stichprobenmittelwerte umfassen würde, basierend auf einer Stichprobe von 300 Familien; 95 % der Stichprobenmittelwerte können in zwei gleiche Teile geteilt werden, die Hälfte weniger und die Hälfte mehr als der Mittelwert, wie in Abb. 1. Die Berechnung des Konfidenzintervalls umfasst die Bestimmung der Fläche kleiner als (XL) und größer als (XU) des Durchschnittswerts (X) der Ausgaben.

Die XL und XU entsprechenden Z-Faktor-Werte können wie folgt berechnet werden:

Daher ist der Mindestwert von X definiert als

und den Maximalwert

Legen wir nun ein 95 %-Konfidenzintervall um den Stichprobenmittelwert von 182 $ fest. Zuerst berechnen wir den Standardfehler des Mittelwerts:

Die mittleren 95 % der Normalverteilung liegen innerhalb von ?1,96 z-Werten; Das 95-%-Konfidenzintervall ist definiert als

Somit erstreckt sich das 95 %-Konfidenzintervall von 175,77 $ bis 188,23 $. Es besteht eine Wahrscheinlichkeit von 95 %, dass der wahre Mittelwert der beobachteten Grundgesamtheit zwischen 175,77 $ und 188,23 $ liegt.

Durchschnittliche Methode:

Die zum Erstellen des Konfidenzintervalls verwendete Methode kann modifiziert werden, um den Stichprobenumfang bei gegebenem gewünschten Konfidenzintervall zu bestimmen. Angenommen, Sie möchten die monatlichen Kaufhausausgaben der Familie genauer berechnen, sodass das Ergebnis nicht mehr als 5,0 $ des tatsächlichen Durchschnitts der untersuchten Bevölkerung beträgt. Wie groß sollte die Stichprobe sein? Die Tabelle enthält die erforderliche Liste der Aktionen, die Sie ausführen müssen.


  • 1. Bestimmen Sie den Genauigkeitsgrad. Dies ist die maximal zulässige Differenz (D) zwischen dem Mittelwert der Stichprobe und dem Mittelwert der Grundgesamtheit. In unserem Beispiel ist D = +5,0 $
  • 2. Geben Sie das Konfidenzniveau an. Angenommen, das gewünschte Konfidenzniveau beträgt 95 %.
  • 3. Bestimmen Sie den Wert der normalisierten Abweichung z, die dem gegebenen Konfidenzniveau zugeordnet ist. Bei einem Konfidenzniveau von 95 % beträgt die Wahrscheinlichkeit, dass der Mittelwert der Grundgesamtheit außerhalb des einseitigen Intervalls liegt, 0,025 (0,05/2). Der entsprechende z-Wert ist 1,96.
  • 4. Bestimmen Sie die Standardabweichung des Mittelwerts der Grundgesamtheit. Sie kann aus Sekundärquellen bezogen oder aus einer Pilotstudie berechnet werden. Darüber hinaus kann die Standardabweichung basierend auf der Meinung des Forschers festgelegt werden. Beispielsweise beträgt der Bereich einer normalverteilten Variablen ungefähr sechs Standardabweichungen (drei links und drei rechts vom Mittelwert).

5. Bestimmen Sie den Stichprobenumfang anhand der Formel für den Standardfehler des Mittelwerts

In unserem Beispiel

(aufgerundet auf die nächste ganze Zahl).

Aus der Stichprobenumfangsformel ist ersichtlich, dass sie mit zunehmender Variabilität (Streuung) der Allgemeinbevölkerung wächst, sowie mit zunehmender Zuverlässigkeit und Genauigkeit, mit der die Berechnungen durchgeführt werden müssen . Der Stichprobenumfang ist direkt proportional zu Q2, daher ist der Stichprobenumfang umso größer, je größer die Grundgesamtheitsvarianz ist. Ebenso impliziert ein höheres Konfidenzniveau einen größeren z-Wert und daher einen größeren Stichprobenumfang. Die Variablen Q2 und z befinden sich im Zähler. Die Erhöhung des Genauigkeitsgrades wird durch Verringerung des Wertes von D erreicht und erhöht daher den Stichprobenumfang, da D im Nenner steht.

6. Wenn die Stichprobengröße 10 % oder mehr der Populationsgröße beträgt, wird die endgültige Populationsanpassung (fpc) ​​angewendet. Dann wird die erforderliche Stichprobengröße durch die Formel berechnet

7. Wenn die Grundgesamtheits-Standardabweichung o unbekannt ist und ihr Schätzwert verwendet wird, sollte sie neu berechnet werden, nachdem die Stichprobe erhalten wurde. Die Stichproben-Standardabweichung s wird als Schätzwert für Q verwendet. Das korrigierte Konfidenzintervall sollte dann berechnet werden, um den tatsächlich erhaltenen Genauigkeitsgrad zu bestimmen.

Angenommen, der Wert 55,00 wurde als Schätzwert für a verwendet, weil der wahre Wert unbekannt war. Es wurde eine Stichprobe mit n = 465 erhalten. Basierend auf den Daten der Studie wird der Mittelwert X berechnet, gleich 180,00, und die Standardabweichung der Stichprobe s, gleich 50,00. Dann ist das korrigierte Konfidenzintervall:

Beachten Sie, dass das resultierende Konfidenzintervall bereits geschätzt ist. Dies liegt daran, dass die Standardabweichung der Grundgesamtheit basierend auf Stichprobenmerkmalen überschätzt wird.

8. Genauigkeit wird manchmal relativ und nicht absolut definiert. Mit anderen Worten, es kann bekannt sein, dass das Ergebnis der Berechnung plus oder minus R% des Durchschnitts sein sollte. In diesem Fall kann die Stichprobengröße definiert werden als

Die Populationsgröße N wirkt sich nicht direkt auf die Stichprobengröße aus, außer wenn ein endgültiger Populationsanpassungsfaktor angewendet wird. Es mag unglaublich erscheinen, aber wenn Sie darüber nachdenken, macht diese Aussage Sinn. Wenn beispielsweise die untersuchten Merkmale aller Elemente der Grundgesamtheit identisch sind, reicht eine aus einem Element bestehende Stichprobe völlig aus, um den Durchschnitt zu berechnen. Dies ist auch richtig, wenn die Grundgesamtheit aus 50, 500, 5000 oder 50.000 Elementen besteht. Gleichzeitig wirkt sich die Variabilität der Populationsmerkmale direkt auf die Stichprobengröße aus. Diese Streuung wird bei der Berechnung des Stichprobenumfangs mit der allgemeinen Streuung Q2 bzw. der Stichprobenstreuung s2 berücksichtigt.

Share-Methode:

Wenn die untersuchte Statistik nicht durch den Durchschnitt, sondern durch den Anteil dargestellt wird, bestimmt der Vermarkter die Stichprobengröße auf die gleiche Weise. Angenommen, der Forscher möchte den Anteil der Haushalte ermitteln, die eine Kaufhauskreditkarte besitzen. Das Verfahren wird wie folgt sein.

1. Genauigkeitsgrad angeben. Angenommen, der gewünschte Genauigkeitsgrad ist so, dass das Toleranzintervall auf eingestellt ist

D \u003d p - l \u003d ± 0,05.

  • 2. Geben Sie das Konfidenzniveau an. Nehmen Sie an, dass ein Konfidenzniveau von 95 % erwünscht ist.
  • 3. Bestimmen Sie den z-Wert, der dem gegebenen Konfidenzniveau zugeordnet ist. Wie bei der Berechnung des Durchschnitts erläutert, beträgt er 1,96.
  • 4. Bestimmen Sie den Gesamtanteil von n. Wie wir bereits angedeutet haben, kann er aus Sekundärquellen, im Verlauf einer experimentellen Studie oder basierend auf der Meinung des Forschers erhalten werden. Angenommen, der Forscher geht auf der Grundlage von Sekundärdaten davon aus, dass 64 % der Familien in der untersuchten Bevölkerung eine Kaufhauskreditkarte besitzen. Daher l = 0,64.
  • 5. Bestimmen Sie den Stichprobenumfang mithilfe der Formel für den Anteil des Standardfehlers:

In unserem Beispiel

  • (aufgerundet auf die nächste ganze Zahl).
  • 6. Wenn die endgültige Stichprobengröße 10 % oder mehr der Populationsgröße beträgt, wird eine endgültige Populationsanpassung (fpc) ​​angewendet. Dann wird die erforderliche Stichprobengröße durch die Formel berechnet

wobei n der Stichprobenumfang vor Anwendung der endgültigen Korrektur ist; nc ist die Stichprobengröße nach Anwendung der endgültigen Korrektur.

7. Wenn die TC-Berechnung falsch war, ist das Konfidenzintervall mehr oder weniger genau als nötig. Angenommen, am Ende der Stichprobe wird der Wert des Anteils p mit 0,55 berechnet. Das Konfidenzintervall wird dann neu berechnet, wobei sp verwendet wird, um das unbekannte Qp wie folgt zu berechnen:

In unserem Beispiel

Das Konfidenzintervall beträgt dann 0,55 ± 1,96 (0,0264) = 0,55 + 0,052, ist also breiter als angegeben. Dies erklärt sich dadurch, dass die Standardabweichung der Stichprobe p = 0,55 größer ausfiel als der Schätzwert der Standardabweichung der Allgemeinbevölkerung bei n = 0,64.

Wenn ein Intervall größer als das angegebene Intervall nicht akzeptabel ist, kann der Stichprobenumfang angepasst werden, um die maximal mögliche Abweichung in der Grundgesamtheit widerzuspiegeln. Eine solche Abweichung tritt auf, wenn das Produkt l (1 - l) seinen Maximalwert erreicht, für den l gleich 0,5 sein muss. Diese Schlussfolgerung kann ohne Berechnungen erreicht werden. Da die eine Hälfte der Bevölkerung einen charakteristischen Wert hat und die andere Hälfte einen anderen, werden mehr Daten benötigt, um eine korrekte Schlussfolgerung zu ziehen, als wenn die Situation klarer definiert ist und die meisten Elemente denselben charakteristischen Wert haben. In unserem Beispiel ergibt dies eine Stichprobengröße von

  • (aufgerundet auf die nächste ganze Zahl).
  • 8. Genauigkeit wird manchmal relativ und nicht absolut definiert. Mit anderen Worten, es kann bekannt sein, dass das Ergebnis der Berechnung plus oder minus R% des Bevölkerungsanteils sein sollte. Das bedeutet, dass D = Rl. In diesem Fall kann die Stichprobengröße definiert werden als