Repräsentative Stichprobe. Probe

Lernziele

Es ist klar, zwischen den Konzepten der Volkszählung (Qualifikation) und der Stichprobenziehung zu unterscheiden.
Kennen Sie das Wesen und die Abfolge der sechs Schritte, die von Forschern durchgeführt werden, um eine Stichprobenpopulation zu erhalten.
Definieren Sie den Begriff „Stichprobengrundlage“.
Erklären Sie den Unterschied zwischen probabilistischem und deterministischem Sampling.
Unterscheiden Sie zwischen Stichproben mit fester Größe und mehrstufigen (konsekutiven) Stichproben.
Erklären Sie, was absichtliches Sampling ist, und beschreiben Sie seine Stärken und Schwächen.
Definieren Sie das Konzept der Quotenstichprobe.
Erklären Sie, was ein Parameter in einem Auswahlverfahren ist.
Erklären Sie, was eine abgeleitete Menge ist.
Erklären Sie, warum das Konzept der Stichprobenverteilung das wichtigste Konzept der Statistik ist.

Der Forscher hat also das Problem genau definiert und sich die geeigneten Forschungsdesign- und Datenerfassungswerkzeuge zu seiner Lösung gesichert. Der nächste Schritt im Forschungsprozess sollte die Auswahl der zu untersuchenden Elemente sein. Es ist möglich, jedes Element einer gegebenen Population zu untersuchen, indem man eine vollständige Zählung dieser Population durchführt. Eine vollständige Erhebung der Bevölkerung wird als Volkszählung (Qualifikation) bezeichnet. Es gibt noch eine andere Möglichkeit. Ein bestimmter Teil der Bevölkerung, eine Stichprobe von Elementen einer großen Gruppe, wird einer statistischen Untersuchung unterzogen, und anhand der für diese Teilmenge erhaltenen Daten werden bestimmte Schlussfolgerungen in Bezug auf die gesamte Gruppe gezogen. Die Möglichkeit, die aus Probendaten gewonnenen Ergebnisse auf eine große Gruppe auszudehnen, hängt von der Methode ab, mit der die Probe entnommen wurde. Ein Großteil dieses Kapitels wird sich damit befassen, wie die Stichprobe gezogen werden sollte und warum.

Volkszählung (Qualifikation)
Vollständige Volkszählung (Bevölkerung).
Probe
Eine Sammlung von Elementen einer Teilmenge einer größeren Gruppe von Objekten.

Der Begriff „Bevölkerung“ oder „Sammlung“ kann sich nicht nur auf Personen beziehen, sondern auch auf Unternehmen des verarbeitenden Gewerbes, Einzel- oder Großhändler oder sogar auf völlig unbelebte Gegenstände, wie z. B. vom Unternehmen hergestellte Teile; Dieses Konzept ist definiert als die Gesamtheit der Elemente, die bestimmte gegebene Bedingungen erfüllen. Diese Bedingungen definieren eindeutig sowohl die Elemente, die zur Zielgruppe gehören, als auch die Elemente, die von der Berücksichtigung ausgeschlossen werden sollten.

Eine Studie, die darauf abzielt, das demografische Profil von Tiefkühlpizza-Konsumenten zu bestimmen, sollte damit beginnen, zu ermitteln, wer als solcher eingestuft werden sollte und wer nicht. Gehören Menschen, die eine solche Pizza mindestens einmal probiert haben, zu dieser Kategorie? Einzelpersonen, die mindestens eine Pizza pro Monat kaufen? In der Woche? Personen, die in einem Monat mehr als eine bestimmte Mindestmenge Pizza essen? Der Forscher muss bei der Bestimmung der Zielgruppe sehr genau sein. Es muss auch darauf geachtet werden, dass die Stichprobe aus der Zielpopulation gezogen wird und nicht aus „irgendeiner“ Population, was bei unzureichender oder unvollständiger Stichprobengrundlage der Fall ist. Letzteres ist eine Liste von Elementen, aus denen eine reale Probe gebildet wird.

Ein Forscher kann aus mehreren Gründen einen Stichprobenansatz einer Befragung der gesamten Bevölkerung vorziehen. Erstens erfordert eine vollständige Erhebung einer Bevölkerung, selbst einer relativ kleinen, sehr große Material- und Zeitkosten. Wenn die Volkszählung abgeschlossen ist und die Daten verarbeitet sind, sind die Informationen häufig bereits veraltet. In manchen Fällen ist die Qualifizierung einfach unmöglich. Nehmen wir an, die Forscher wollten überprüfen, ob die tatsächliche Lebensdauer von elektrischen Glühlampen mit der berechneten übereinstimmt, für die sie sie bis zum Ausfall eingeschaltet halten müssen. Wenn Sie auf diese Weise das gesamte Lampenangebot untersuchen, erhalten Sie zuverlässige Daten, aber es gibt nichts zu handeln.

Schließlich kann der Forscher zum großen Erstaunen von Anfängern die Stichprobenziehung der Volkszählung vorziehen und sich um die Genauigkeit der Ergebnisse bemühen. Volkszählungen erfordern viel Personal, was die Wahrscheinlichkeit von Verzerrungsfehlern (Nicht-Stichproben) erhöht. Dieser Umstand ist einer der Gründe, warum das US Census Bureau Stichprobenerhebungen einsetzt, um die Genauigkeit verschiedener Arten von Volkszählungen zu testen. Sie haben richtig gelesen: Um die Genauigkeit der Qualifikationsdaten zu überprüfen, können Stichprobenerhebungen durchgeführt werden.

Beispielentwurfsschritte

Auf Abb. Abbildung 15.1 zeigt eine sechsstufige Abfolge, der ein Forscher beim Entwerfen einer Stichprobe folgen kann. Zunächst ist es notwendig, die Zielpopulation oder die Menge der Elemente zu bestimmen, über die der Forscher etwas wissen möchte.

Beispielsweise müssen Forscher bei der Untersuchung der Vorlieben von Kindern entscheiden, ob die Zielpopulation nur aus Kindern, nur aus Eltern oder beidem bestehen soll.

Aggregat (Bevölkerung)
Eine Menge von Elementen, die bestimmte gegebene Bedingungen erfüllen.
Probenahmerahmen (Basis)
Die Liste der Elemente, aus denen die Auswahl getroffen wird; kann aus Gebietseinheiten, Organisationen, Personen und anderen Elementen bestehen.

Eine bestimmte Firma testete ihre elektrischen "Rennen" nur an Kindern. Die Kinder waren restlos begeistert. Die Eltern reagierten unterschiedlich auf die Neuheit. Den Müttern gefiel die Tatsache nicht, dass die Attraktion den Kindern nicht beibrachte, autofreundlich zu sein, und den Vätern gefiel die Tatsache nicht, dass das Produkt wie ein Spielzeug hergestellt wurde.
Auch die umgekehrte Situation ist möglich. Eine Firma brachte ein neues Lebensmittelprodukt auf den Markt und startete eine landesweite Werbekampagne, die sich auf frühreife Kinder konzentrierte.Die Firma testete die Wirksamkeit von Werbespots nur an Müttern, die begeistert waren. Die Kinder hingegen fanden diese „Beschleunigung“ und damit das beworbene Produkt selbst ekelhaft. Produkt endete am 1.

Der Forscher muss entscheiden, aus wem oder was die relevante Grundgesamtheit bestehen soll: Einzelpersonen, Familien, Firmen, andere Organisationen, Kreditkartentransaktionen usw. Bei solchen Entscheidungen müssen die Elemente bestimmt werden, die aus Grundgesamtheiten ausgeschlossen werden sollen. Es sollte sowohl eine zeitliche als auch eine räumliche Referenzierung der Elemente vorgenommen werden, die in einigen Fällen zusätzlichen Bedingungen oder Einschränkungen unterliegen können. Wenn wir beispielsweise von Einzelpersonen sprechen, kann die gewünschte Population nur aus Personen über 18 Jahren oder nur aus Frauen oder nur aus Personen mit mindestens einem Sekundarschulabschluss bestehen.

Die Aufgabe, die geografischen Grenzen für die Zielpopulation in der internationalen Marktforschung zu bestimmen, kann ein besonderes Problem darstellen, da dies die Heterogenität des betrachteten Systems erhöht. Beispielsweise kann das relative Verhältnis von städtischen und ländlichen Gebieten von Land zu Land erheblich variieren. Der territoriale Aspekt hat schwerwiegende Auswirkungen auf die Zusammensetzung der Bevölkerung und innerhalb desselben Landes. Beispielsweise lebt im Norden Chiles eine überwiegend indianische Bevölkerung kompakt, während in den südlichen Regionen des Landes hauptsächlich Nachkommen von Europäern leben.

Abdeckung (Vorfall)
Der Prozentsatz der Mitglieder einer Population oder Gruppe, die die Bedingungen für die Aufnahme in die Stichprobe erfüllen.

Generell gilt: Je einfacher die Zielpopulation definiert ist, desto höher ist ihre Abdeckung (Inzidenz) und desto einfacher und billiger ist das Stichprobenverfahren. Abdeckung (Vorfall) entspricht dem prozentualen Anteil der Elemente einer Grundgesamtheit oder Gruppe, die die Bedingungen für die Aufnahme in die Stichprobe erfüllen. Die Abdeckung wirkt sich direkt auf den Zeit- und Materialaufwand aus, der für die Durchführung einer Umfrage erforderlich ist. Wenn die Abdeckung groß ist (d. h. die meisten Populationselemente erfüllen eines oder mehrere der einfachen Kriterien, die zum Identifizieren potenzieller Befragter verwendet werden), werden Zeit und Kosten, die zum Sammeln von Daten erforderlich sind, minimiert. Umgekehrt steigen mit zunehmender Anzahl an Kriterien, die potenzielle Befragte erfüllen müssen, sowohl die Sach- als auch die Zeitkosten.

Auf Abb. 15.2 zeigt den Anteil der erwachsenen Bevölkerung, der bestimmte Sportarten betreibt. Die Daten der Abbildung zeigen, dass es viel schwieriger und teurer ist, Personen zu untersuchen, die Motorrad fahren (nur 3,6 % der Gesamtzahl der Erwachsenen), als Personen zu untersuchen, die regelmäßig Freizeitspaziergänge unternehmen (27,4 % der Gesamtzahl der Erwachsenen). Erwachsene). Die Hauptsache ist, dass der Forscher genau bestimmt, welche Elemente in die Studienpopulation aufgenommen und welche Elemente davon ausgeschlossen werden sollten. Eine klare Aussage über den Zweck der Studie erleichtert die Lösung dieses Problems erheblich. Der zweite Schritt im Stichprobenauswahlprozess besteht darin, den Stichprobenrahmen zu bestimmen, der, wie Sie bereits wissen, die Liste der Elemente ist, aus denen die Stichprobe gezogen wird. Lassen Sie die Zielpopulation einer bestimmten Studie alle Familien sein, die in der Gegend von Dallas leben. Auf den ersten Blick mag das Dallas-Telefonbuch ein guter und leicht zugänglicher Stichprobenrahmen sein. Bei näherer Betrachtung wird jedoch deutlich, dass die im Verzeichnis enthaltene Familienliste nicht ganz korrekt ist, da die Nummern einiger Familien darin weggelassen werden (natürlich nicht Familien, die kein Telefon haben), während Manche Familien haben mehrere Telefonnummern. Personen, die kürzlich ihren Wohnort und dementsprechend ihre Telefonnummer geändert haben, sind ebenfalls nicht im Verzeichnis enthalten.

Erfahrene Forscher kommen zu dem Schluss, dass eine genaue Übereinstimmung zwischen dem Stichprobenrahmen und der interessierenden Zielpopulation sehr selten ist. Einer der kreativsten Schritte beim Entwerfen einer Stichprobe ist die Bestimmung eines geeigneten Stichprobenrahmens in Fällen, in denen die Auflistung von Populationsmitgliedern schwierig ist. Dies kann ein Abtasten von Arbeitsblöcken und Präfixen erfordern, wenn beispielsweise aufgrund von Mängeln in Telefonverzeichnissen eine Zufallswahl verwendet wird. Allerdings hat die deutliche Zunahme der Arbeitseinheiten in den letzten 10 Jahren diese Aufgabe erschwert. Ähnliche Situationen können auch bei der selektiven Beobachtung von territorialen Zonen oder Organisationen mit anschließender Teilstichprobennahme entstehen, wenn beispielsweise die Zielpopulation Einzelpersonen sind, aber keine genaue aktuelle Liste von ihnen vorliegt.

Quelle: Basierend auf Daten in SSI- LITe TM: L ow Vorfall T gezielt S Amplifikation" (Fairfield, Conn.: Survey Sampling, Inc., 1994).

Der dritte Schritt des Stichprobenverfahrens steht in engem Zusammenhang mit der Festlegung des Stichprobenrahmens. Die Wahl der Stichprobenmethode oder des Stichprobenverfahrens hängt weitgehend von dem vom Forscher gewählten Stichprobenrahmen ab. Unterschiedliche Arten von Proben erfordern unterschiedliche Arten von Probenahmerahmen. Dieses und das nächste Kapitel geben einen Überblick über die wichtigsten Arten von Stichproben, die in der Marktforschung verwendet werden. Bei ihrer Beschreibung sollte der Zusammenhang zwischen dem Stichprobenrahmen und der Methode seiner Bildung deutlich werden.

Der vierte Schritt des Stichprobenverfahrens besteht in der Bestimmung des Stichprobenumfangs. Dieses Problem wird in Kap. 17. In der fünften Phase muss der Forscher die Elemente auswählen, die der Umfrage unterzogen werden. Die dabei verwendete Methode wird durch die gewählte Probenart bestimmt; Bei der Erörterung von Stichprobenverfahren werden wir auch über die Auswahl ihrer Elemente sprechen. Und schließlich muss der Forscher die identifizierten Befragten tatsächlich untersuchen. In diesem Stadium besteht eine hohe Wahrscheinlichkeit, dass eine Reihe von Fehlern begangen werden.
Diese Probleme und einige Methoden zu ihrer Lösung werden in Kap. achtzehn.

Arten von Probenahmeplänen (Probenahme)

Alle Stichprobenverfahren können in zwei Kategorien unterteilt werden: Beobachtung von Wahrscheinlichkeitsstichproben und Beobachtung von deterministischen Stichproben. In einer probabilistischen Stichprobe kann jedes Mitglied der Grundgesamtheit mit einer bestimmten festgelegten Wahrscheinlichkeit ungleich Null enthalten sein. Die Wahrscheinlichkeit, bestimmte Mitglieder der Grundgesamtheit in die Stichprobe aufzunehmen, kann unterschiedlich sein, aber die Wahrscheinlichkeit, dass jedes Element darin enthalten ist, ist bekannt. Diese Wahrscheinlichkeit wird durch ein spezielles mechanisches Verfahren ermittelt, das zur Auswahl der Stichproben verwendet wird.

Bei deterministischen Stichproben wird es unmöglich, die Wahrscheinlichkeit abzuschätzen, dass irgendein Element in der Stichprobe enthalten ist. Die Repräsentativität einer solchen Stichprobe kann nicht garantiert werden. Zum Beispiel, Allstate Corporation entwickelte ein System zur Verarbeitung der Schadendaten von 14 Millionen Haushalten (seine Kunden). Das Unternehmen plant, diese Daten zu verwenden, um Nachfragemuster für seine Dienstleistungen zu bestimmen, wie z. B. die Wahrscheinlichkeit, dass ein Haushalt, der einen Mercedes Benz besitzt, auch ein Ferienhaus besitzt (das eine Versicherung erfordert). Obwohl die Datenbank sehr umfangreich ist, verfügt das Unternehmen nicht über die Mittel, um die Wahrscheinlichkeit abzuschätzen, dass ein bestimmter Kunde einen Anspruch geltend machen wird. Das Unternehmen kann daher nicht sicher sein, dass die Kundendaten, die den Anspruch erheben, repräsentativ für alle Kunden des Unternehmens sind; und in noch geringerem Maße - in Bezug auf potenzielle Kunden.

Alle deterministischen Stichproben basieren auf der persönlichen Position, dem Urteil oder der Präferenz des Forschers und nicht auf einem mechanischen Auswahlverfahren für Stichprobenmitglieder. Solche Präferenzen können manchmal gute Schätzungen der Merkmale der Population liefern, aber es gibt keine Möglichkeit, die Eignung der Stichprobe für die Aufgabe objektiv zu bestimmen. Eine Bewertung der Genauigkeit der Ergebnisse der Stichprobe kann nur erfolgen, wenn die Wahrscheinlichkeiten für die Auswahl bestimmter Elemente bekannt waren. Aus diesem Grund wird das Arbeiten mit Wahrscheinlichkeitsstichproben im Allgemeinen als eine bessere Methode zum Schätzen der Größe des Stichprobenfehlers angesehen. Samples können auch in Samples mit fester Größe und sequenzielle Samples unterteilt werden. Beim Arbeiten mit Feststichproben wird der Stichprobenumfang vor Beginn der Erhebung festgelegt und der Analyse der Ergebnisse geht die Erhebung aller notwendigen Daten voraus. Wir interessieren uns hauptsächlich für Stichproben mit fester Größe, da diese Art normalerweise in der Marktforschung verwendet wird.

Wahrscheinlichkeitsstichprobe
Eine Stichprobe, in der jedes Element der Grundgesamtheit mit einer bekannten Wahrscheinlichkeit ungleich Null enthalten sein kann.
Deterministisches Sampling
Stichproben basierend auf bestimmten Präferenzen oder Urteilen, die die Auswahl bestimmter Elemente bestimmen; Gleichzeitig wird es unmöglich, die Wahrscheinlichkeit abzuschätzen, dass ein beliebiges Element der Grundgesamtheit in die Stichprobe aufgenommen wird.

Es sollte jedoch nicht vergessen werden, dass es auch sequentielle Stichproben gibt, die mit jedem der unten besprochenen grundlegenden Stichprobenentwürfe verwendet werden können.

Bei einer sequentiellen Stichprobe ist die Anzahl der ausgewählten Elemente nicht im Voraus bekannt, sie wird auf der Grundlage einer Reihe sequentieller Entscheidungen bestimmt. Wenn eine Befragung einer kleinen Stichprobe zu keinem verlässlichen Ergebnis führt, wird die Bandbreite der zu untersuchenden Elemente erweitert. Bleibt das Ergebnis danach unschlüssig, wird der Stichprobenumfang wieder erhöht. In jeder Phase wird entschieden, ob das erzielte Ergebnis als ausreichend überzeugend angesehen wird oder ob mit der Datenerhebung fortgefahren wird. Die Arbeit mit sequentieller Stichprobennahme ermöglicht es, den Trend (Trend) der Daten während ihrer Erfassung zu beurteilen, wodurch Sie die Kosten für zusätzliche Beobachtungen reduzieren können, wenn sich deren Zweckmäßigkeit als nichtig erweist.

Sowohl probabilistische als auch deterministische Stichprobenpläne fallen in eine Reihe von Typen. Beispielsweise können deterministische Stichproben nicht-repräsentativ (bequem), absichtlich oder quotiert sein; probabilistische Stichproben werden in einfache zufällige, stratifizierte oder Gruppenstichproben (Cluster) unterteilt, die wiederum in Subtypen unterteilt werden können. Auf Abb. Abbildung 15.3 zeigt die Arten von Stichproben, die in diesem und im nächsten Kapitel behandelt werden.

Festes Muster (Festes Muster)
Eine Stichprobe, deren Größe a priori bestimmt wird; die erforderlichen Informationen werden durch die ausgewählten Elemente bestimmt.
Sequentielle Probenahme
Eine Stichprobe, die auf der Grundlage einer Reihe aufeinanderfolgender Entscheidungen gebildet wird. Wenn nach Betrachtung einer kleinen Stichprobe das Ergebnis nicht schlüssig ist, wird eine größere Stichprobe berücksichtigt; führt dieser Schritt zu keinem Ergebnis, erhöht sich der Stichprobenumfang wieder usw. Somit wird in jedem Schritt entschieden, ob das erzielte Ergebnis als ausreichend überzeugend angesehen werden kann.

Es sei daran erinnert, dass die Grundtypen von Stichproben kombiniert werden können, um komplexere Stichprobenpläne zu bilden. Wenn Sie ihre grundlegenden Anfangstypen lernen, wird es Ihnen leichter fallen, mit komplexeren Kombinationen umzugehen.

Deterministische Auswahl

Wie bereits erwähnt, spielen bei der Auswahl von Elementen einer deterministischen Stichprobe private Einschätzungen oder Entscheidungen eine entscheidende Rolle. Manchmal kommen diese Einschätzungen vom Forscher, während in anderen Fällen Außendienstmitarbeiter die Auswahl der Populationselemente übernehmen. Da die Elemente nicht mechanisch ausgewählt werden, wird es unmöglich, die Wahrscheinlichkeit des Einschließens eines beliebigen Elements in die Probe und dementsprechend den Stichprobenfehler zu bestimmen. Die Unkenntnis des Fehlers aufgrund des gewählten Stichprobenverfahrens hindert die Forscher daran, die Genauigkeit ihrer Schätzungen zu beurteilen.

Nicht repräsentative (Convenience) Proben

Nicht repräsentative (Convenience) Proben manchmal als zufällig bezeichnet, da die Auswahl der Stichprobenelemente auf „zufällige“ Weise erfolgt – diejenigen Elemente, die während des Auswahlzeitraums am zugänglichsten sind oder zu sein scheinen, werden ausgewählt.

Unser tägliches Leben ist voll von Beispielen für solche Selektionen. Wir sprechen mit Freunden und ziehen aus ihren Reaktionen und Positionen Rückschlüsse auf die in der Gesellschaft vorherrschenden politischen Vorlieben; ein lokaler Radiosender ermutigt Menschen, ihre Meinung zu einem kontroversen Thema zu äußern, ihre Meinung wird als vorherrschend interpretiert; Wir fordern die Zusammenarbeit von Freiwilligen und arbeiten mit denen zusammen, die uns freiwillig helfen. Das Problem mit Convenience Samples liegt auf der Hand – wir können nicht sicher sein, dass Samples dieser Art tatsächlich die Zielpopulation repräsentieren. Wir können immer noch bezweifeln, dass die Meinungen unserer Freunde die in der Gesellschaft vorherrschenden politischen Ansichten korrekt widerspiegeln, aber wir sind oft sehr daran interessiert zu glauben, dass größere Stichproben, die auf diese Weise ausgewählt wurden, repräsentativ sind. Lassen Sie uns den Irrtum einer solchen Annahme an einem Beispiel zeigen.
Vor einigen Jahren führte einer der lokalen Fernsehsender in der Stadt, in der der Autor dieses Buches lebt, eine tägliche öffentliche Meinungsumfrage zu Themen durch, die für die lokale Gemeinschaft von Interesse sind. Die Umfragen mit dem Titel „The Madison Pulse“ wurden wie folgt durchgeführt. Jeden Abend während der Sechs-Uhr-Nachrichten stellte der Sender den Zuschauern eine Frage zu einem bestimmten kontroversen Thema, auf die es eine positive oder negative Antwort geben musste.

Bei einer positiven Antwort musste man anrufen, bei einer negativen Antwort eine andere Telefonnummer. Die Anzahl der Stimmen „dafür“ und „dagegen“ wurde automatisch gezählt. Die Zehn-Uhr-Nachrichtensendung berichtete über die Ergebnisse der Telefonumfrage. Jeden Abend riefen zwischen 500 und 1000 Menschen im Studio an, um ihre Position zu diesem oder jenem Thema zu äußern; der Fernsehkommentator interpretierte die Ergebnisse der Umfrage als vorherrschende Meinung in der Gesellschaft.

Nicht repräsentative (Convenience-)Stichprobe
Manchmal als zufällig bezeichnet, weil die Auswahl der Stichprobenelemente auf „zufällige“ Weise erfolgt – diejenigen Elemente, die während des Auswahlzeitraums am zugänglichsten sind oder zu sein scheinen, werden ausgewählt.

In einer der sechsstündigen Folgen wurde den Zuschauern folgende Frage gestellt: „Finden Sie nicht, dass das Alkoholalter in Madison auf 18 gesenkt werden sollte?“ Die bestehende gesetzliche Qualifikation entsprach 21 Jahren. Das Publikum reagierte auf diese Frage mit außerordentlicher Aktivität – fast 4.000 Menschen riefen an diesem Abend im Studio an, davon sprachen sich 78 % für eine Herabsetzung der Altersgrenze aus. Es scheint klar, dass eine Stichprobe von 4.000 für eine Gemeinschaft von 180.000 „repräsentativ“ sein sollte. Wie Sie vielleicht erraten haben, waren bestimmte Altersgruppen mehr an einem bekannten Ergebnis interessiert als andere. Dementsprechend war es nicht verwunderlich, dass sich in der einige Wochen später stattfindenden Diskussion zu diesem Thema herausstellte, dass die Studierenden während der für die Erhebung vorgesehenen Zeit gemeinsam agierten. Sie riefen nacheinander den Fernseher an, jeder mehrmals. So war weder die Stichprobengröße noch der Anteil der Befürworter einer Gesetzesliberalisierung überraschend. Die Stichprobe war nicht repräsentativ.

Eine einfache Erhöhung der Stichprobengröße macht sie nicht repräsentativ. Die Repräsentativität der Stichprobe wird nicht durch die Größe, sondern durch das richtige Verfahren zur Auswahl der Elemente gewährleistet. Bei der freiwilligen Auswahl der Befragungsteilnehmer oder der Auswahl von Stichproben aufgrund ihrer Verfügbarkeit garantiert der Stichprobenplan keine Repräsentativität der Stichprobe. Empirische Beweise deuten darauf hin, dass Stichproben, die der Einfachheit halber ausgewählt wurden, selten repräsentativ sind (unabhängig von ihrer Größe). Telefonumfragen, die 800-900 Stimmen berücksichtigen, sind die häufigste Form großer, aber nicht repräsentativer Stichproben.

Absichtliche Probenahme
Deterministische (gezielte) Probenahme, deren Elemente manuell ausgewählt werden; Es werden diejenigen Elemente ausgewählt, die nach Meinung des Forschers den Zielen der Umfrage entsprechen.
Absichtliche Auswahl, abhängig von der Fähigkeit des Forschers, die anfängliche Gruppe von Befragten mit den gewünschten Merkmalen festzulegen; dann werden diese Befragten als Informanten verwendet, die die weitere Auswahl von Personen bestimmen.

Leider behandeln viele Menschen die Ergebnisse solcher Umfragen mit Zuversicht. Eines der typischsten Beispiele für die Verwendung nicht-repräsentativer Stichproben in der internationalen Marktforschung ist die Erhebung bestimmter Länder auf der Grundlage einer Stichprobe, die aus Ausländern besteht, die derzeit auf dem Territorium des Landes leben, das die Erhebung initiiert hat (z die USA). Obwohl solche Stichproben einiges Licht auf bestimmte Aspekte der betrachteten Bevölkerung werfen können, muss daran erinnert werden, dass diese Personen normalerweise eine „amerikanisierte“ Elite darstellen, deren Verbindung mit ihrem eigenen Land eher willkürlich sein kann. Die Verwendung nicht repräsentativer Stichproben wird für deskriptive oder kausale Erhebungen nicht empfohlen. Sie sind nur bei explorativer Forschung zulässig, die darauf abzielt, bestimmte Ideen oder Ideen zu testen, aber auch in diesem Fall ist es vorzuziehen, bewusst Stichproben zu verwenden.

Absichtliche Auswahl

Absichtliche Proben werden manchmal als bezeichnet unkonzentriert; ihre Elemente, die nach Meinung des Forschers den Zielen der Studie entsprechen, werden manuell ausgewählt. Procter & Gamble nutzte diese Methode, um Anzeigen für Personen im Alter von 13 bis 17 Jahren zu schalten, die in der Nähe seines Hauptsitzes in Cincinnati leben. Die Lebensmittel- und Getränkeabteilung des Unternehmens stellte diese Gruppe von Teenagern ein, um als eine Art Verbraucherprobe zu dienen. Sie arbeiteten 10 Stunden pro Woche für 1.000 Dollar und gingen zu einem Konzert, sie sahen sich Fernsehwerbung an, besuchten mit Firmenmanagern Supermärkte, um sich Produktpräsentationen anzusehen, testeten neue Produkte und diskutierten über das Kaufverhalten. Durch die Auswahl von Vertretern für die Stichprobe durch einen „Einstellungsprozess“ und nicht zufällig, könnte sich ein Unternehmen auf Eigenschaften konzentrieren, die es als nützlich erachtet, wie z. B. die Fähigkeit eines Teenagers, sich klar auszudrücken, auf die Gefahr hin, dass ihre Ansichten möglicherweise nicht repräsentativ für ihre Altersgruppe sind .

Wie bereits erwähnt, ist das Unterscheidungsmerkmal des bewussten Samplings die richtungsweisende Auswahl seiner Elemente. In einigen Fällen werden Stichproben ausgewählt, nicht weil sie repräsentativ sind, sondern weil sie den Forschern Informationen liefern können, die für sie von Interesse sind. Wenn sich das Gericht an der Aussage eines Sachverständigen orientiert, greift es gewissermaßen auf eine bewusste Auswahl zurück. Eine ähnliche Position kann bei der Entwicklung von Forschungsprojekten vorherrschen. Bei der Erstbearbeitung der Fragestellung interessiert sich der Forscher in erster Linie für die Ermittlung der Studienaussichten, die die Auswahl der Stichprobenelemente bestimmen.

Schneeball-Probenahme ist eine Art der absichtlichen Probenahme, die beim Umgang mit bestimmten Arten von Populationen verwendet wird. Diese Stichprobe hängt von der Fähigkeit des Forschers ab, eine anfängliche Gruppe von Befragten mit den gewünschten Merkmalen anzugeben. Diese Befragten werden dann als Informanten verwendet, um die weitere Auswahl von Personen zu bestimmen.

Stellen Sie sich zum Beispiel vor, dass ein Unternehmen den Bedarf an einem Produkt evaluieren möchte, mit dem gehörlose Menschen am Telefon kommunizieren können. Forscher können mit der Entwicklung dieses Problems beginnen, indem sie Schlüsselfiguren in der Gehörlosengemeinschaft identifizieren; Letzterer könnte andere Mitglieder der Gruppe benennen, die bereit wären, an der Umfrage teilzunehmen. Mit dieser Taktik wächst die Probe wie ein Schneeball.

Solange sich der Forscher in der Anfangsphase der Problemlösung befindet, wenn die Aussichten und möglichen Grenzen der geplanten Erhebung bestimmt werden, kann der Einsatz einer absichtlichen Stichprobenziehung sehr effektiv sein. Aber wir sollten auf keinen Fall die Schwächen dieser Art von Proben vergessen, da sie auch vom Forscher in deskriptiven oder kausalen Studien verwendet werden können, was sich nicht nachteilig auf die Qualität ihrer Ergebnisse auswirken wird. Ein klassisches Beispiel für diese Vergesslichkeit ist der Verbraucherpreisindex („VPI“). Wie Südman betont ( Sudmann): „CPI wird nur für 56 Städte und Ballungsräume ermittelt, deren Auswahl auch vom politischen Faktor beeinflusst wird. Tatsächlich können diese Städte nur sich selbst darstellen, während der Index aufgerufen wird Verbraucherpreisindex für Städter mit Stundenlohn*, und Mitarbeiter und erscheint den meisten Menschen als Index, der das Preisniveau in jedem Gebiet der Vereinigten Staaten widerspiegelt. Auch die Auswahl der Verkaufsstellen erfolgt nicht zufällig, was zur Folge hat Die Abschätzung möglicher Stichprobenfehler wird unmöglich» (unsere Kursivschrift) 2 .

* Das heißt, Arbeiter. - Notiz. pro.

Quotenproben

Die dritte Art der deterministischen Stichprobe − Quotenproben; seine bekannte Repräsentativität wird dadurch erreicht, dass darin der gleiche Anteil an Elementen mit bestimmten Merkmalen wie in der befragten Grundgesamtheit enthalten ist (siehe „Forschungsfenster 15.1“). Versuchen Sie beispielsweise, eine repräsentative Stichprobe von Studenten zu erstellen, die auf dem Campus leben. Wenn es in einer bestimmten Stichprobe von 500 Personen keinen einzigen älteren Schüler gibt, haben wir das Recht, ihre Repräsentativität und die Gültigkeit der Anwendung der Ergebnisse dieser Stichprobe auf die untersuchte Population anzuzweifeln. Beim Arbeiten mit proportionaler Stichprobe kann der Forscher sicherstellen, dass der Anteil der Studierenden in der Stichprobe ihrem Anteil an der Gesamtzahl der Studierenden entspricht.

Angenommen, ein Forscher führt eine selektive Untersuchung von Universitätsstudenten durch, während er daran interessiert ist, dass die Stichprobe nicht nur ihre Zugehörigkeit zu dem einen oder anderen Geschlecht widerspiegelt, sondern auch ihre Verteilung nach Kursen. Die Gesamtzahl der Studenten sei 10.000: 3.200 Erstsemester, 2.600 Studenten im zweiten Jahr, 2.200 Studenten im dritten Jahr und 2.000 Studenten im vierten Jahr; davon 7.000 Jungen und 3.000 Mädchen. Für eine Stichprobe von 1.000 Personen erfordert der proportionale Stichprobenplan 320 Erstsemester, 260 Studenten im zweiten Jahr, 220 Drittklässler und 200 Absolventen, 700 Jungen und 300 Mädchen. Der Forscher kann diesen Plan umsetzen, indem er jedem Interviewer eine bestimmte Quote gibt, die bestimmt, welche Studenten er kontaktieren soll.

Quotenstrichprobenerhebung Eine deterministische Stichprobe, die so ausgewählt ist, dass der Anteil der Stichprobenelemente mit bestimmten Merkmalen ungefähr dem Anteil gleicher Elemente in der untersuchten Grundgesamtheit entspricht; Jedem Außendienstmitarbeiter wird eine Quote zugewiesen, die die Merkmale der Bevölkerung festlegt, mit der er Kontakt aufnehmen muss.

Ein Interviewer, der 20 Interviews führen soll, kann angewiesen werden, Folgendes zu fragen:

sechs Studenten im ersten Jahr - fünf Jungen und ein Mädchen;
sechs Studenten im zweiten Jahr - vier Jungen und zwei Mädchen;
vier Studenten im dritten Jahr - drei Jungen und ein Mädchen;
vier Studenten im vierten Jahr - zwei Jungen und zwei Mädchen.

Beachten Sie, dass die Auswahl bestimmter Stichprobenelemente nicht durch das Untersuchungsdesign bestimmt wird, sondern durch die Wahl des Interviewers, der nur die Bedingungen erfüllen muss, die durch die Quote festgelegt wurden: Interview fünf Studienanfänger, ein Studienanfänger usw.

Beachten Sie auch, dass diese Quote die Geschlechterverteilung der Studentenpopulation genau widerspiegelt, aber die Verteilung der Studenten auf die Kurse etwas verzerrt; 70 % (14 von 20) Interviews werden mit Jungen geführt, aber nur 30 % (6 von 20) mit Studienanfängern, während sie 32 % der Gesamtzahl der Studierenden ausmachen. Die jedem einzelnen Interviewer zugewiesene Quote spiegelt möglicherweise nicht die Verteilung der Kontrollmerkmale in der Grundgesamtheit wider und spiegelt dies normalerweise nicht wider – nur die endgültige Stichprobe sollte proportional sein.

Dabei ist zu bedenken, dass die proportionale Stichprobenziehung mehr von persönlichen, subjektiven Einstellungen oder Urteilen abhängt als von einem objektiven Stichprobenverfahren. Zudem gehört hier im Gegensatz zum bewussten Sampling die persönliche Beurteilung nicht dem Projektentwickler, sondern dem Interviewer. Es stellt sich die Frage, ob anteilige Stichproben als repräsentativ angesehen werden können, selbst wenn sie das Verhältnis von der Grundgesamtheit innewohnenden Komponenten mit bestimmten Kontrollmerkmalen wiedergeben. Dazu sind drei Anmerkungen zu machen.

Erstens kann sich die Stichprobe in einigen anderen wichtigen Merkmalen auffallend von der Grundgesamtheit unterscheiden, was einen schwerwiegenden Einfluss auf das Ergebnis haben kann. Wenn sich die Studie beispielsweise dem Problem rassistischer Vorurteile unter Studenten widmet, kann es nicht gleichgültig sein, woher die Befragten kamen: aus der Stadt oder vom Land. Da die Quote für das Merkmal „Stadt/Land“ nicht ausgewiesen ist, ist eine genaue Darstellung dieses Merkmals unwahrscheinlich. Natürlich gibt es eine solche Alternative: Quoten für alle potenziell signifikanten Merkmale zu definieren. Allerdings führt eine Erhöhung der Anzahl von Steuercharakteristiken zu einer Verkomplizierung der Spezifikation. Dies wiederum erschwert – und macht sie teilweise sogar unmöglich – die Auswahl der Musterelemente und führt in jedem Fall zu deren Verteuerung. Wenn beispielsweise auch die Stadt- oder Landzugehörigkeit und der sozioökonomische Status für die Studie relevant sind, muss der Interviewer möglicherweise nach einem Studienanfänger suchen, der aus der Stadt stammt und der oberen oder mittleren Schicht angehört. Ich stimme zu, dass es viel einfacher ist, nur einen männlichen Neuling zu finden.

Zweitens ist es sehr schwierig sicherzustellen, dass diese Stichprobe wirklich repräsentativ ist. Natürlich kann man in der Stichprobe überprüfen, ob die Verteilung von Merkmalen, die nicht in die Kontrolle eingehen, deren Verteilung in der Grundgesamtheit entspricht. Ein solcher Test kann jedoch nur zu negativen Schlussfolgerungen führen. Es ist möglich, nur die Divergenz der Verteilungen aufzudecken. Wenn sich die Verteilungen der Stichprobe und der Grundgesamtheit für jedes dieser Merkmale wiederholen, besteht die Möglichkeit, dass sich die Stichprobe in einem anderen, nicht ausdrücklich spezifizierten Merkmal von der Grundgesamtheit unterscheidet.

Und schließlich drittens. Interviewer, die sich selbst überlassen sind, neigen zu bestimmten Handlungen. Sie greifen allzu oft darauf zurück, ihre Freunde zu befragen. Da sie sich oft als die Interviewer selbst entpuppen, besteht die Gefahr von Fehlern. Beweise aus England deuten darauf hin, dass Quotenstichproben dazu tendieren:

Übertreibung der Rolle der am besten zugänglichen Elemente;
Herunterspielen der Rolle kleiner Familien;
Übertreibung der Rolle von Familien mit Kindern;
Herunterspielen der Rolle der Industriearbeiter;
Herunterspielen der Rolle derjenigen mit den höchsten und niedrigsten Einkommen;
Herunterspielen der Rolle schlecht ausgebildeter Bürger;
Herunterspielen der Rolle von Personen, die eine niedrige soziale Position einnehmen.

Interviewer, die vorgegebene Quoten auswählen, indem sie zufällige Passanten anhalten, konzentrieren sich wahrscheinlich auf Bereiche mit einer großen Anzahl potenzieller Befragter, wie Einkaufszentren, Bahnhöfe und Flughäfen, Eingänge zu großen Supermärkten und dergleichen. Diese Praxis führt zu einer Überrepräsentation der Personengruppen, die solche Orte am häufigsten besuchen. Wenn Hausbesuche erforderlich sind, sind Interviewer oft von Bequemlichkeit getrieben.
Beispielsweise führen sie möglicherweise nur tagsüber Umfragen durch, was zu einer Unterschätzung der Meinung der Arbeitnehmer führt. Sie betreten unter anderem keine baufälligen Gebäude und fahren in der Regel nicht in die oberen Stockwerke von Gebäuden ohne Aufzug.

Abhängig von den Besonderheiten des untersuchten Problems können diese Tendenzen zu verschiedenen Arten von Fehlern führen, während ihre Korrektur in der Phase der Datenanalyse sehr, sehr schwierig zu sein scheint. Andererseits stehen Forschern mit einer objektiven Auswahl von Stichprobenelementen gewisse Werkzeuge zur Verfügung, die es ermöglichen, das Verfahren zur Beurteilung der Repräsentativität einer gegebenen Stichprobe zu vereinfachen. Bei der Analyse des Problems der Repräsentativität solcher Proben berücksichtigt der Forscher weniger die Zusammensetzung der Probe als das Verfahren zur Auswahl ihrer Elemente.

Forschungsfenster: Brillant! Aber wer wird es lesen?

Jedes Jahr geben Werbetreibende Millionen von Dollar für Anzeigen aus, die auf den Seiten unzähliger Publikationen vom Werbezeitalter bis zum Yankee erscheinen. Eine gewisse Beurteilung von Text und Bild kann vor der Veröffentlichung sozusagen zu Hause in einer Werbeagentur erfolgen; es wird erst nach der Veröffentlichung der Anzeige wirklich getestet und beurteilt, umgeben von Dutzenden von ebenso sorgfältig gestalteten Anzeigen, die um die Aufmerksamkeit des Lesers wetteifern.

Unternehmen Roper Stärke weltweit bewertet die Lesbarkeit von Anzeigen in Verbraucher-, Wirtschafts-, Fach- und Fachzeitschriften und -zeitungen. Die Ergebnisse der Recherche werden Werbetreibenden und Agenturen zur Kenntnis gebracht – natürlich gegen ein angemessenes Honorar. Weil Werbetreibende jeden Tag große Anstrengungen unternehmen, um ihre Anzeigen beim Verbraucher, dem Unternehmen, zu platzieren Stärke beschlossen, ein Muster zu erstellen, das den Abonnenten zeitnahe und genaue Informationen über die Wirksamkeit von Werbung geben würde. Jedes Jahr das Unternehmen Stärke befragte mehr als 50.000 Menschen und berücksichtigte dabei etwa 20.000 Anzeigen. Jährlich wurden etwa 500 Einzelpublikationen untersucht.

Starch verwendete eine proportionale Stichprobe mit mindestens 100 Lesern eines Geschlechts und 100 Lesern des anderen Geschlechts. Starch kam zu dem Schluss, dass sich bei dieser Stichprobengröße die Hauptabweichungen in der Lesbarkeit stabilisieren. Leser über 18 Jahre wurden persönlich befragt, und alle Veröffentlichungen wurden berücksichtigt, mit Ausnahme derjenigen, die für besondere Bevölkerungsgruppen bestimmt waren (z. B. wurden Mädchen im entsprechenden Alter befragt, um Veröffentlichungen der Zeitschrift Seventeen zu bewerten).

Bei der Durchführung von Umfragen wurde das Verbreitungsgebiet einer bestimmten Publikation berücksichtigt. Nehmen wir an, die Studie des Magazins Los Angeles hat sich mit Lesern befasst, die in Südkalifornien leben. "Zeit" wurde bundesweit untersucht. Die Umfrage widmete sich einzelnen Ausgaben des Magazins und wurde gleichzeitig in 20-30 Städten durchgeführt.

Jedem Interviewer wurde ein kleines Kontingent an Interviews zugeteilt, was dazu diente, die Streuung der Befragungsergebnisse zu minimieren. Fragebögen wurden an Personen unterschiedlicher Berufe und Altersgruppen mit unterschiedlichem Einkommen verteilt. Jede dieser Studien ermöglichte es, Positionen einer ziemlich breiten Leserschaft vorzustellen. Bei der Betrachtung einer Reihe von Fach-, Wirtschafts- und Branchenpublikationen wurden auch die Besonderheiten ihrer Subskription und Verbreitung berücksichtigt. Abonnementlisten für Veröffentlichungen mit relativ geringer Auflage ermöglichten die Auswahl akzeptabler Befragter.

Bei jeder Umfrage baten die Interviewer die Befragten, die Publikation durchzusehen, und fragten, ob ihnen eine Anzeige aufgefallen sei. Wenn die Antwort ja war, stellte der Registrar eine Reihe von Fragen, um den Grad der Akzeptanz der Anzeige zu beurteilen.

Diese Bewertung könnte dreifach sein:

Achtung: diejenigen, die bereits auf die Tatsache des Erscheinens einer solchen Ankündigung geachtet haben.
Bekannt: Personen, die sich an irgendeinen Teil der Werbung erinnerten, der sich mit der beworbenen Marke oder dem Werbetreibenden befasste.
Lesen: Personen, die mindestens die Hälfte der Anzeige gelesen haben.

Nach Prüfung aller Anzeigen erfassten die Interviewer wichtige Klassifizierungsinformationen: Geschlecht, Alter, Beruf, Familienstand, Nationalität, Einkommen, Familiengröße und Familienzusammensetzung, die eine Kreuztabelle des Leserinteresses ermöglichten.

Bei bestimmungsgemäßer Verwendung Unternehmensdaten Stärke ermöglichen es Werbetreibenden und Agenturen, sowohl erfolglose als auch erfolgreiche Arten von Werbemaßnahmen zu identifizieren, die die Aufmerksamkeit des Lesers auf sich ziehen und halten. Informationen dieser Art sind für Werbetreibende, die in erster Linie an der Effektivität ihrer Werbekampagne interessiert sind, äußerst wertvoll.

Quelle: Roper Starch Worldwide, Mamaronek, NY 10543.

Wahrscheinlichkeitsstichproben

Der Forscher kann die Wahrscheinlichkeit bestimmen, irgendein Element der Population in die Wahrscheinlichkeitsstichprobe aufzunehmen, da die Auswahl seiner Elemente auf der Grundlage eines objektiven Prozesses durchgeführt wird und nicht von den Launen und Vorlieben des Forschers oder Außendienstmitarbeiters abhängt. Da das Elementauswahlverfahren objektiv ist, kann der Forscher die Zuverlässigkeit der erhaltenen Ergebnisse beurteilen, was im Fall deterministischer Stichproben unmöglich war, egal wie sorgfältig die Auswahl der Elemente letzterer war.

Es sollte nicht angenommen werden, dass probabilistische Stichproben immer repräsentativer sind als deterministische. Tatsächlich kann eine deterministische Stichprobe auch repräsentativer sein. Der Vorteil von Wahrscheinlichkeitsstichproben besteht darin, dass sie eine Schätzung des potenziellen Stichprobenfehlers ermöglichen. Wenn der Forscher mit einer deterministischen Stichprobe arbeitet, hat er keine objektive Methode, um deren Angemessenheit für die Ziele der Studie zu beurteilen.

Einfache Zufallsstichprobe

Auf einfache Stichproben stoßen die meisten Menschen auf die eine oder andere Weise, entweder im Rahmen eines Statistikkurses am Institut oder durch das Lesen von Ergebnissen einschlägiger Studien in Zeitungen oder Zeitschriften. In einer einfachen Zufallsstichprobe hat jedes in der Stichprobe enthaltene Element die gleiche gegebene Wahrscheinlichkeit, zu den untersuchten Elementen zu gehören, und jede Kombination von Elementen in der ursprünglichen Grundgesamtheit kann möglicherweise zu einer Stichprobe werden. Wenn wir beispielsweise eine einfache Zufallsstichprobe aller an einem bestimmten College eingeschriebenen Studenten erstellen möchten, müssen wir nur eine Liste aller Studenten erstellen, jedem darin enthaltenen Namen eine Nummer zuweisen und einen Computer verwenden, um zufällig einen bestimmten auszuwählen Anzahl der Elemente.

Bevölkerung

Bevölkerung
Eine Menge von Elementen, die bestimmte gegebene Bedingungen erfüllen; auch Studienpopulation (Zielpopulation) genannt.
Parameter
Ein bestimmtes Merkmal oder ein Indikator der allgemeinen oder untersuchten Bevölkerung.

Allgemeiner oder studierter Satz ist die Sammlung, aus der die Auswahl getroffen wird. Diese Bevölkerung (Bevölkerung) kann durch eine Reihe spezifischer Parameter beschrieben werden, die Merkmale der allgemeinen Bevölkerung sind, von denen jeder ein bestimmter quantitativer Indikator ist, der eine Bevölkerung von einer anderen unterscheidet.

Stellen Sie sich vor, dass die untersuchte Bevölkerung die gesamte erwachsene Bevölkerung von Cincinnati ist. Eine Reihe von Parametern kann verwendet werden, um diese Bevölkerung zu beschreiben: Durchschnittsalter, Anteil der Bevölkerung mit einem Hochschulabschluss, Einkommensniveau usw. Beachten Sie, dass alle diese Indikatoren einen bestimmten festen Wert haben. Natürlich können wir sie berechnen, indem wir eine vollständige Volkszählung der untersuchten Bevölkerung durchführen. In der Regel verlassen wir uns nicht auf die Qualifikation, sondern auf die von uns ausgewählte Stichprobe und verwenden die bei der selektiven Beobachtung erhaltenen Werte, um die gewünschten Parameter der Population zu bestimmen.

Wir veranschaulichen das Gesagte in der Tabelle. 15.1 ein Beispiel für eine hypothetische Population von 20 Personen. Die Arbeit mit einer kleinen hypothetischen Population wie dieser hat eine Reihe von Vorteilen. Erstens erleichtert die kleine Stichprobengröße die Berechnung der Populationsparameter, die zu ihrer Beschreibung verwendet werden können. Zweitens ermöglicht Ihnen dieser Band zu verstehen, was passieren kann, wenn ein bestimmter Stichprobenplan angenommen wird. Beides macht es einfach, Stichprobenergebnisse mit dem „wahren“ und in diesem Fall bekannten Populationswert zu vergleichen, was in der typischen Situation, in der der tatsächliche Populationswert unbekannt ist, nicht der Fall ist. Der Vergleich der Bewertung mit dem „wahren“ Wert gewinnt in diesem Fall besondere Klarheit.

Angenommen, wir möchten anhand zweier zufällig ausgewählter Elemente das Durchschnittseinkommen von Einzelpersonen in der ursprünglichen Population schätzen. Das Durchschnittseinkommen wird sein Parameter sein. Um diesen Durchschnittswert abzuschätzen, den wir mit μ bezeichnen, müssen wir die Summe aller Werte durch ihre Anzahl dividieren:

Populationsmittelwert μ = Summe der Populationselemente / Anzahl der Elemente.

In unserem Fall ergeben die Berechnungen:

Abgeleitete Bevölkerung

Abgeleitete Bevölkerung besteht aus allen möglichen Stichproben, die nach einem vorgegebenen Stichprobenplan (Stichprobenplan) aus der Allgemeinbevölkerung ausgewählt werden können. Statistiken ist ein Merkmal oder Indikator der Probe. Der Stichprobenstatistikwert wird verwendet, um einen bestimmten Populationsparameter zu schätzen. Unterschiedliche Stichproben liefern unterschiedliche Statistiken oder Schätzungen für denselben Populationsparameter.

Abgeleitete Bevölkerung
Die Menge aller möglichen unterscheidbaren Stichproben, die gemäß einem vorgegebenen Stichprobenplan aus der Allgemeinbevölkerung ausgewählt werden können. Statistik Ein Merkmal oder Maß einer Stichprobe.

Betrachten Sie den abgeleiteten Satz aller möglichen Stichproben, die aus unserer hypothetischen Population von 20 Personen unter einem Stichprobenplan ausgewählt werden können, der davon ausgeht, dass die Stichprobengröße ist n=2 kann durch zufällige, nicht wiederholte Auswahl erhalten werden.

Nehmen Sie für einen Moment an, dass die Daten für jede Bevölkerungseinheit - in unserem Fall der Name und das Einkommen einer Person - auf Kreise geschrieben werden, wonach sie in einen Krug gesenkt und gemischt werden. Der Forscher nimmt einen Kreis aus dem Krug, schreibt Informationen darauf ab und legt ihn beiseite. Dasselbe macht er mit dem zweiten Krug, der aus dem Krug genommen wird. Dann stellt der Forscher beide Becher wieder in den Krug, mischt seinen Inhalt und wiederholt die gleiche Abfolge von Aktionen. Im Tisch. 15.2 zeigt die möglichen Ergebnisse des genannten Verfahrens. Bei 20 Kreisen sind 190 solcher Paarkombinationen möglich.

Für jede Kombination können Sie das Durchschnittseinkommen berechnen. Sagen wir mal zur Probenahme AB (k= 1)

k-e Stichprobenmittelwert = Summe der Stichproben / Anzahl der Stichproben =

Auf Abb. 15.4 zeigt die Schätzung des mittleren Einkommens für die gesamte Bevölkerung und die Fehlerhöhe für jede Schätzung für die Stichproben k = 25.62.108.147 und 189 .

Bevor wir die Beziehung zwischen dem Durchschnittseinkommen der Stichprobe (Statistik) und dem Durchschnittseinkommen der Grundgesamtheit (ein Parameter, der geschätzt werden muss) betrachten, lassen Sie uns ein paar Worte über die abgeleitete Grundgesamtheit sagen. Erstens erstellen wir in der Praxis keine Aggregate dieser Art. Es würde zu viel Zeit und Mühe erfordern. Der Praktiker ist darauf beschränkt, nur eine Probe der erforderlichen Größe zusammenzustellen. Der Forscher verwendet Konzept abgeleitete Grundgesamtheit und das damit verbundene Konzept der Stichprobenverteilung bei der Formulierung abschließender Schlussfolgerungen.

Wie wird weiter unten gezeigt. Zweitens ist zu bedenken, dass eine abgeleitete Grundgesamtheit als die Gesamtheit aller möglichen unterschiedlichen Stichproben definiert ist, die gemäß einem vorgegebenen Stichprobenplan aus der Grundgesamtheit ausgewählt werden können. Wenn irgendein Teil des Stichprobenplans geändert wird, ändert sich auch die abgeleitete Grundgesamtheit. Wenn der Forscher also beim Auswählen von Kreisen die erste der entfernten Scheiben in den Krug zurücklegt, bevor er die zweite entfernt, enthält der abgeleitete Satz.

Samples AA, BB usw. Wenn die Anzahl der nicht wiederholten Samples 3 statt 2 ist, gibt es Samples vom Typ ABC, und es gibt 1140 davon, nicht 190, wie es im vorherigen Fall der Fall war. Wenn die einfache Zufallsauswahl auf eine andere Methode zur Bestimmung der Elemente der Stichprobe geändert wird, ändert sich auch die abgeleitete Grundgesamtheit.

Es sollte auch daran erinnert werden, dass die Auswahl einer Stichprobe einer bestimmten Größe aus der allgemeinen Grundgesamtheit der Auswahl eines Elements (1 von 190) aus der abgeleiteten Grundgesamtheit entspricht. Diese Tatsache erlaubt uns, viele statistische Schlussfolgerungen zu ziehen.

Stichprobenmittelwert und allgemeiner Mittelwert

Können wir den Mittelwert der Stichprobe mit dem wahren Mittelwert der Grundgesamtheit gleichsetzen? Jedenfalls gehen wir davon aus, dass sie miteinander verbunden sind. Wir gehen aber auch davon aus, dass sich ein Fehler einschleichen wird. So ist beispielsweise davon auszugehen, dass die von Internetnutzern erhaltenen Informationen deutlich von den Ergebnissen einer Befragung der „normalen“ Bevölkerung abweichen werden. In anderen Fällen können wir von einer ziemlich genauen Übereinstimmung ausgehen, da wir sonst den Beispielwert nicht verwenden könnten, um den Wert des allgemeinen zu schätzen. Aber wie groß kann der Fehler sein, den wir dabei machen?

Lassen Sie uns alle in der Tabelle enthaltenen Stichprobenmittelwerte zusammenzählen. 15.2, und dividieren Sie die resultierende Summe durch die Anzahl der Proben, d.h. lassen Sie uns die Mittelwerte mitteln.
Wir erhalten folgendes Ergebnis:

Er deckt sich mit dem Durchschnittswert der Allgemeinbevölkerung. Sie sagen, dass wir es in diesem Fall zu tun haben unvoreingenommene Statistik.

Eine Statistik wird als unverzerrt bezeichnet, wenn ihr Durchschnitt über alle möglichen Stichproben gleich dem geschätzten Populationsparameter ist. Beachten Sie, dass wir hier nicht über einen bestimmten Wert sprechen. Die partielle Schätzung kann sehr weit vom wahren Wert entfernt sein – nehmen Sie zum Beispiel die AB- oder ST-Abtastungen. In einigen Fällen ist der wahre Wert der Grundgesamtheit unter Berücksichtigung einer möglichen Stichprobe möglicherweise nicht erreichbar, selbst wenn die Statistiken unvoreingenommen sind. In unserem Fall ist dies nicht der Fall: Eine Anzahl möglicher Stichproben – zum Beispiel AT – ergibt einen Stichprobenmittelwert, der dem wahren Mittelwert der Grundgesamtheit entspricht.

Es ist sinnvoll, die Verteilung dieser Stichprobenschätzungen und insbesondere die Beziehung zwischen dieser Streuung der Schätzungen und der Variation des Einkommensniveaus in der Bevölkerung zu betrachten. Als Streuungsmaß wird die Varianz der Allgemeinbevölkerung verwendet. Um die Varianz der Grundgesamtheit zu bestimmen, müssen wir die Abweichung jedes Werts vom Mittelwert berechnen, die Quadrate aller Abweichungen addieren und die resultierende Summe durch die Anzahl der Terme dividieren. Bezeichnen Sie mit a^ die Varianz der allgemeinen Bevölkerung. Dann:

Populationsvarianz σ 2 = Summe der quadrierten Differenzen jedes Elements
Bevölkerung und Bevölkerungsdurchschnitt / Anzahl der Bevölkerungselemente =

Streuung Mittelwert Einkommensniveau kann auf die gleiche Weise definiert werden. Das heißt, wir können es finden, indem wir die Abweichungen jedes Mittelwerts von ihrem Gesamtmittelwert bestimmen, die Quadrate der Abweichungen summieren und die resultierende Summe durch die Anzahl der Terme dividieren.

Wir können die Varianz des mittleren Einkommensniveaus auch auf andere Weise definieren, indem wir die Varianz der Einkommensniveaus in der Allgemeinbevölkerung verwenden, da zwischen beiden ein direkter Zusammenhang besteht. Genauer gesagt, in Fällen, in denen die Stichprobe nur einen kleinen Teil der Grundgesamtheit darstellt, ist die Varianz des Stichprobenmittelwerts gleich der Varianz der Grundgesamtheit dividiert durch die Stichprobengröße:

wobei σ x 2 die Varianz des durchschnittlichen Stichprobenwertes des Einkommensniveaus ist, σ 2 die Varianz des Einkommensniveaus in der Allgemeinbevölkerung ist, n— Stichprobengröße.

Vergleichen wir nun die Verteilung der Ergebnisse mit der Verteilung eines quantitativen Merkmals in der Allgemeinbevölkerung. Abbildung 15.5 zeigt, dass die Verteilung des in Box A gezeigten Populationsmerkmals multi-vertex ist (jeder der 20 Werte kommt nur einmal vor) und symmetrisch um den wahren Populationsmittelwert von 9400 ist.

Stichprobenverteilung
Die Verteilung der Werte einer bestimmten Statistik, berechnet für alle möglichen unterscheidbaren Stichproben, die nach einem bestimmten Stichprobenplan aus der Grundgesamtheit extrahiert werden können.

Die im Feld B dargestellte Notenverteilung basiert auf den Daten der Tabelle. 15.3, die wiederum durch Zuweisung von Werten aus Tabelle zusammengestellt wurde. 15.2 an die eine oder andere Gruppe, je nach Größe, mit anschließender Berechnung ihrer Anzahl in der Gruppe. Feld B ist ein traditionelles Histogramm, das ganz am Anfang des Statistikstudiums betrachtet wird Stichprobenverteilung Statistiken. Nebenbei bemerken wir Folgendes: Das Konzept der Stichprobenverteilung ist das wichtigste Konzept der Statistik, es ist der Eckpfeiler der Konstruktion statistischer Inferenzen. Aufgrund der bekannten Stichprobenverteilung der untersuchten Statistik kann auf den entsprechenden Parameter der Allgemeinbevölkerung geschlossen werden. Wenn nur bekannt ist, dass sich die Stichprobenschätzung von Stichprobe zu Stichprobe ändert, die Art dieser Änderung jedoch unbekannt ist, wird es unmöglich, den dieser Schätzung zugeordneten Stichprobenfehler zu bestimmen. Da die Stichprobenverteilung einer Schätzung beschreibt, wie sie sich von Stichprobe zu Stichprobe ändert, bietet sie eine Grundlage zur Bestimmung der Gültigkeit einer Stichprobenschätzung. Aus diesem Grund ist ein Wahrscheinlichkeits-Stichprobendesign für statistische Inferenzen so wichtig.

Angesichts der bekannten Wahrscheinlichkeiten, jedes Mitglied der Grundgesamtheit in die Stichprobe aufzunehmen, können Interviewer die Stichprobenverteilung verschiedener Statistiken finden. Auf diese Verteilungen verlassen sich Forscher – sei es der Stichprobenmittelwert, der Stichprobenanteil, die Stichprobenvarianz oder eine andere Statistik – wenn sie das Ergebnis einer Stichprobenbeobachtung auf die Allgemeinbevölkerung ausdehnen. Beachten Sie auch, dass bei Stichproben der Größe 2 die Verteilung der Stichprobenmittelwerte unimodal und symmetrisch um den wahren Mittelwert ist.

Wir haben also gezeigt:

Der Mittelwert aller möglichen Stichprobenmittelwerte ist gleich dem allgemeinen Mittelwert.
Die Varianz der Stichprobenmittelwerte hängt in gewisser Weise mit der allgemeinen Varianz zusammen.
Die Verteilung der Stichprobenmittelwerte ist unimodal, während die Verteilung der Werte eines quantitativen Merkmals in der Allgemeinbevölkerung multimodal ist.

Zentraler Grenzwertsatz

Ein Satz, der besagt, dass für einfache Zufallsstichproben der Größe n, isoliert von der Allgemeinbevölkerung mit dem allgemeinen Durchschnitt μ und der Varianz σ 2 , insgesamt n die Verteilung des Stichprobenmittelwerts x nähert sich der Normalverteilung mit einem Mittelpunkt gleich μ und einer Varianz σ 2 . Die Genauigkeit dieser Annäherung nimmt mit zunehmendem Wert zu n.

Zentraler Grenzwertsatz. Die unimodale Verteilung von Schätzungen kann als Manifestation des zentralen Grenzwertsatzes angesehen werden, der dies für einfache Zufallsstichproben des Volumens besagt n, ausgewählt aus der Allgemeinbevölkerung mit dem wahren Mittelwert μ und der Varianz σ 2 , für groß n Die Verteilung der Stichprobenmittelwerte nähert sich der Normalverteilung mit einem Zentrum, das dem wahren Mittelwert entspricht, und einer Varianz, die dem Verhältnis der Varianz der Grundgesamtheit zur Stichprobengröße entspricht, d. h.:

Diese Annäherung wird immer genauer, da n. Merk dir das. Unabhängig von der Art der Grundgesamtheit ist die Verteilung der Stichprobenmittelwerte für ausreichend große Stichproben normal. Was versteht man unter einem ausreichend großen Volumen? Wenn die Verteilung der Werte eines quantitativen Merkmals der Allgemeinbevölkerung normal ist, bedeutet die Verteilung der Stichproben für Stichproben mit einem Volumen von n=1. Wenn die Verteilung einer Variablen (quantitatives Attribut) in der Grundgesamtheit symmetrisch, aber nicht normal ist, ergeben sehr kleine Stichproben eine normale Verteilung der Stichprobenmittelwerte. Weist die Verteilung eines quantitativen Merkmals der Allgemeinbevölkerung eine ausgeprägte Asymmetrie auf, sind größere Stichproben erforderlich. Allerdings kann die Verteilung des Stichprobenmittelwerts nur dann als normal angesehen werden, wenn es sich um eine ausreichend große Stichprobe handelt.

Um Schlussfolgerungen unter Verwendung einer Normalkurve zu ziehen, ist es überhaupt nicht erforderlich, von der Bedingung der Normalität der Verteilung von Werten eines quantitativen Merkmals der Allgemeinbevölkerung auszugehen. Vielmehr verlassen wir uns auf den zentralen Grenzwertsatz und ermitteln je nach Populationsverteilung einen solchen Stichprobenumfang, der es uns erlauben würde, mit einer Normalkurve zu arbeiten. Glücklicherweise wird die Normalverteilung der Statistik durch relativ kleine Stichproben bereitgestellt - Abb. 15.6 zeigt diesen Umstand deutlich. Schätzungen des Konfidenzintervalls. Kann uns das obige dabei helfen, bestimmte Schlussfolgerungen über den allgemeinen Durchschnitt zu ziehen? Tatsächlich wählen wir in der Praxis nur eine und nicht alle möglichen Stichproben einer bestimmten Größe aus und ziehen auf der Grundlage der erhaltenen Daten bestimmte Rückschlüsse auf die Zielgruppe.

Wie passiert es? Wie Sie wissen, hat bei einer Normalverteilung ein bestimmter Prozentsatz aller Beobachtungen eine bestimmte Standardabweichung; Angenommen, 95 % der Beobachtungen passen innerhalb von ±1,96 Standardabweichungen vom Mittelwert. Die Normalverteilung von Stichprobenmitteln, auf die der zentrale Grenzwertsatz angewendet werden kann, bildet in diesem Sinne keine Ausnahme. Der Mittelwert einer solchen Stichprobenverteilung ist gleich dem allgemeinen Mittelwert μ, und seine Standardabweichung wird als Standardfehler des Mittelwerts bezeichnet:

Es stellt sich heraus, dass:

68,26 % der Stichprobenmittelwerte weichen vom allgemeinen Mittelwert um nicht mehr als ± σ x ab;
95,45 % der Stichprobenmittelwerte weichen vom allgemeinen Mittelwert um nicht mehr als ±σ x ab;
99,73 % der Stichprobenmittelwerte weichen vom allgemeinen Mittelwert um nicht mehr als ± σ x ab,

d.h. je nach gewähltem Wert ein gewisser Anteil an Stichprobenmitteln z wird in dem durch den Wert bestimmten Intervall eingeschlossen z. Dieser Ausdruck kann als Ungleichung umgeschrieben werden:

Allgemeiner Durchschnitt - z < Среднее по выборке < Генеральное среднее + z(Standardfehler des Mittelwerts)

Der Stichprobenmittelwert liegt also mit einer bestimmten Wahrscheinlichkeit in dem Intervall, dessen Grenzen die Summe und die Differenz des Mittelwerts der Verteilung und einer bestimmten Anzahl von Standardabweichungen sind. Diese Ungleichung kann in die Form umgewandelt werden:

Stichprobenmittelwert - z(Standardfehler des Mittelwerts)< Генеральное среднее < Среднее по выборке + z(Standardfehler des Mittelwerts)

Wird zum Beispiel in 95 % der Fälle das Verhältnis 15,1 eingehalten ( z= 1,96), dann wird in 95 % der Fälle auch das Verhältnis 15,2 beobachtet. In Fällen, in denen die Schlussfolgerung auf einem einzelnen Stichprobenmittelwert basiert, verwenden wir Ausdruck 15.2.

Es ist wichtig, sich an den Ausdruck 15.2 zu erinnern bedeutet nicht, dass das einer bestimmten Stichprobe entsprechende Intervall unbedingt den allgemeinen Mittelwert enthalten muss. Das Intervall hat mehr mit dem Auswahlverfahren zu tun. Das um diesen Mittelwert gebildete Intervall kann den wahren Mittelwert der Grundgesamtheit enthalten oder nicht. Unser Vertrauen in die Richtigkeit der getroffenen Schlussfolgerungen basiert auf der Tatsache, dass 95 % aller gemäß dem ausgewählten Stichprobenplan konstruierten Intervalle den wahren Mittelwert enthalten. Wir glauben, dass unsere Stichprobe zu diesen 95 % gehört.

Um diesen wichtigen Punkt zu veranschaulichen, stellen Sie sich für einen Moment vor, dass die Verteilung der Stichprobe für die Stichprobengröße bedeutet n= 2 in unserem hypothetischen Beispiel ist normal. Tabelle 15.4 veranschaulicht grafisch das Ergebnis für die ersten 10 der möglichen 190 Stichproben, die gemäß dem gegebenen Design ausgewählt werden können. Beachten Sie, dass nur 7 von 10 Intervallen einen allgemeinen oder wahren Mittelwert enthalten. Das Vertrauen in die Richtigkeit der Schlussfolgerung beruht nicht auf einer privaten Einschätzung, sondern genau Verfahren Schätzungen. Dieses Verfahren ist so, dass für 100 Proben, für die der Probenmittelwert und das Konfidenzintervall berechnet werden, in 95 Fällen dieses Intervall den wahren allgemeinen Wert enthält. Die Genauigkeit dieser Probe wird durch das Verfahren bestimmt, mit dem die Probe gebildet wurde. Ein repräsentatives Stichprobendesign garantiert nicht die Repräsentativität aller Stichproben. Statistische Inferenzverfahren setzen auf die Repräsentativität des Stichprobenplans, weshalb dieses Verfahren für Wahrscheinlichkeitsstichproben so entscheidend ist.

Probabilistisches Sampling ermöglicht es uns, die Genauigkeit der Ergebnisse als Nähe der erstellten Schätzungen zum wahren Wert zu bewerten. Je größer der Standardfehler der Statistik, desto größer die Streuung der Schätzungen und desto geringer die Genauigkeit des Verfahrens.

Einige mögen durch die Tatsache verwirrt sein, dass das Konfidenzniveau auf das Verfahren und nicht auf einen bestimmten Stichprobenwert bezogen ist, aber es sollte daran erinnert werden, dass der Wert des Konfidenzniveaus der Schätzung des allgemeinen Werts vom Forscher angepasst werden kann. Wenn Sie kein Risiko eingehen möchten und befürchten, dass eines der fünf ausgewählten Stichprobenintervalle den Grundgesamtheitsmittelwert nicht enthält, können Sie ein Konfidenzintervall von 99 % wählen, bei dem nur eines der hundert Stichprobenintervalle keinen enthält den Mittelwert der Bevölkerung einbeziehen. Wenn Sie die Stichprobengröße erhöhen können, erhöhen Sie außerdem das Vertrauen in das Ergebnis, wodurch die gewünschte Genauigkeit der Schätzung des Populationswerts erreicht wird. Darauf werden wir in Kap. 17.

Das Verfahren, das wir beschreiben, hat noch eine Komponente, die eine gewisse Verlegenheit hervorrufen kann. Bei der Schätzung des Konfidenzintervalls werden drei Größen verwendet: x , z und σ x . Der Stichprobenmittelwert x wird aus den Stichprobendaten berechnet, z wird basierend auf dem gewünschten Konfidenzniveau ausgewählt. Aber was ist mit dem mittleren quadratischen Fehler des Mittelwerts σ x ? Es ist gleich:

und deshalb müssen wir, um es zu bestimmen, die Standardabweichung des quantitativen Attributs der allgemeinen Bevölkerung fragen, d. H. 5. Was ist in Fällen zu tun, in denen die Standardabweichung s Unbekannt? Dieses Problem tritt aus zwei Gründen nicht auf. Erstens ändert sich bei den meisten quantitativen Merkmalen, die in der Marktforschung verwendet werden, die Schwankung normalerweise viel langsamer als das Niveau der meisten Variablen, die für den Vermarkter von Interesse sind. Dementsprechend können wir, wenn die Studie wiederholt wird, den vorherigen, zuvor erhaltenen Wert von s in den Berechnungen verwenden. Zweitens können wir, sobald die Stichprobe ausgewählt und die Daten erhalten sind, die Populationsvarianz schätzen, indem wir die Stichprobenvarianz bestimmen. Die unverzerrte Stichprobenvarianz ist definiert als:

Stichprobenabweichung ŝ 2 = Summe der quadrierten Abweichungen vom Stichprobenmittelwert / (Anzahl der Stichproben -1). Um die Stichprobenvarianz zu bestimmen, müssen wir zuerst den Stichprobenmittelwert finden. Dann werden die Differenzen zwischen jedem der Stichprobenwerte und dem Stichprobenmittelwert gefunden; diese Differenzen werden quadriert, summiert und durch eine Zahl dividiert, die der Anzahl der Stichprobenbeobachtungen minus eins entspricht. Die Stichprobenvarianz liefert nicht nur eine Schätzung der Gesamtvarianz, sondern kann auch zur Schätzung des Standardfehlers des Mittelwerts verwendet werden. Wenn die allgemeine Varianz σ 2 bekannt ist, ist auch der mittlere quadratische Fehler σ x bekannt, weil:

Wenn die allgemeine Varianz unbekannt ist, kann der Standardfehler des Mittelwerts nur geschätzt werden. Diese Schätzung ist gegeben ŝ x , was gleich der Standardabweichung der Stichprobe dividiert durch die Quadratwurzel des Stichprobenumfangs ist, d. h. Der Schätzwert wird auf die gleiche Weise bestimmt wie der Schätzwert des wahren Werts bestimmt wurde, aber anstelle der allgemeinen Standardabweichung wird die Standardabweichung der Stichprobe in die Berechnungsformel eingesetzt. Sagen wir also für Beispiel AB mit einem Beispielmittelwert von 5800:

Dementsprechend ist ŝ = 283 und

und 95% Abstand ist jetzt

was kleiner als der vorherige Wert ist.

Im Tisch. 15.5 fasst die in diesem Kapitel besprochenen Berechnungsformeln für verschiedene Mittelwerte und Streuungen zusammen. Bildung einer einfachen Zufallsstichprobe. In unserem Beispiel wurde die Auswahl der Stichprobenelemente anhand eines Krugs durchgeführt, der alle Elemente der ursprünglichen Grundgesamtheit enthielt. Dadurch konnten wir die Konzepte der abgeleiteten Grundgesamtheit und Stichprobenverteilung visualisieren. Wir raten davon ab, eine solche Methode in der Praxis anzuwenden, da dies die Fehlerwahrscheinlichkeit erhöht. Tassen können sich sowohl in Größe als auch in Textur unterscheiden, was in bestimmten Fällen dazu führen kann, dass eine gegenüber der anderen bevorzugt wird. Als Beispiel für einen solchen Fehler kann die per Lotterie durchgeführte Auswahl der Teilnehmer am Vietnamkrieg dienen.

Die Auswahl erfolgte, indem Scheiben mit Geburtsdaten aus der großen Trommel gezogen wurden. Das Fernsehen übertrug dieses Verfahren im ganzen Land. Leider wurden die Discs systematisch in die Trommel geladen, wobei die Januardaten zuerst und die Dezemberdaten zuletzt kamen. Obwohl die Trommel intensiv gedreht wurde, fielen Dezemberdaten viel häufiger als Januar. Anschließend wurde dieses Verfahren so überarbeitet, dass die Wahrscheinlichkeit solcher systematischer Fehler deutlich reduziert wurde. Das bevorzugte Verfahren zum Erzeugen einer einfachen Zufallsstichprobe basiert auf der Verwendung einer Tabelle von Zufallszahlen.

Die Verwendung einer solchen Tabelle beinhaltet die folgende Abfolge von Schritten. Zunächst müssen den Elementen der Grundgesamtheit fortlaufende Nummern von 1 bis zugeordnet werden N; in unserer hypothetischen Bevölkerung zum Element SONDERN Dem Element wird die Nummer 1 zugewiesen B- Zahl 2 usw. Zweitens muss die Anzahl der Ziffern in der Tabelle der Zufallszahlen mit der Zahl übereinstimmen N. Für N= 20 zweistellige Zahlen werden verwendet; zum N zwischen 100 und 999 - dreistellige Zahlen usw. Drittens muss die Startposition zufällig bestimmt werden. Wir können die entsprechende Tabelle mit Zufallszahlen öffnen und mit geschlossenen Augen, wie sie sagen, mit dem Finger darauf zeigen. Da die Zahlen in der Zufallszahlentabelle in zufälliger Reihenfolge sind, spielt die Startposition keine Rolle.

Und schließlich können wir uns in jede beliebige Richtung bewegen - nach oben, unten oder quer, und diejenigen Elemente auswählen, deren Nummern Zufallszahlen aus der Tabelle entsprechen. Betrachten Sie zur Veranschaulichung des Gesagten die verkürzte Tabelle der Zufallszahlen (Tab. 15.6). Soweit N= 20, sollten wir nur mit zweistelligen Zahlen arbeiten. In diesem Sinne Tab. 15.6 passt perfekt zu uns. Angenommen, wir haben uns im Voraus entschieden, die Spalte nach unten zu verschieben, die Ausgangsposition befindet sich am Schnittpunkt der elften Reihe und der vierten Spalte, wo sich die Zahl 77 befindet.Diese Zahl ist zu groß und sollte daher verworfen werden. Die nächsten beiden Zahlen werden ebenfalls verworfen, während der vierte Wert 02 verwendet wird, da 2 die Elementnummer ist BEIM.

Die nächsten fünf Zahlen werden ebenfalls als zu groß verworfen, während die Zahl 05 das Element anzeigt E. Also die Elemente BEIM und E wird unsere Zwei-Elemente-Stichprobe, anhand derer wir das Einkommensniveau dieser Population beurteilen. Es ist auch eine alternative Strategie möglich, bei der ein Computerprogramm, das Zufallszahlen erzeugt, als Grundlage für die Auswahl verwendet wird. Neuere Veröffentlichungen weisen darauf hin, dass die von solchen Programmen generierten Zahlen nicht völlig zufällig sind, was sich in gewisser Weise beim Erstellen komplexer mathematischer Modelle manifestieren kann, aber sie können für die meisten angewandten Marktforschungen verwendet werden. Beachten Sie erneut, dass eine einfache Zufallsstichprobe die Zusammenstellung einer fortlaufend nummerierten Liste von Elementen der allgemeinen Bevölkerung erfordert.

Mit anderen Worten, jedes Mitglied der ursprünglichen Population muss identifiziert werden. Für einige Bevölkerungsgruppen ist dies nicht schwierig, zum Beispiel in einer Studie der 500 größten amerikanischen Unternehmen, deren Liste im Fortune-Magazin aufgeführt ist. Diese Liste wurde bereits erstellt, sodass die Bildung einer einfachen Stichprobe in diesem Fall nicht schwierig sein wird. Für andere Ausgangspopulationen (z. B. für alle Familien, die in einer bestimmten Stadt leben) ist die Erstellung einer allgemeinen Liste äußerst schwierig, was die Forscher zwingt, auf andere Stichprobenerhebungsschemata zurückzugreifen.

Zusammenfassung

Lernziel 1
Unterscheiden Sie klar zwischen den Konzepten der Volkszählung (Qualifikation) und der Stichprobenziehung

Eine vollständige Zählung der Bevölkerung (Bevölkerung) heißt qualifiziert. Probe Satz, gebildet aus den ausgewählten Elementen.

Lernziel 2
Kennen Sie das Wesen und die Abfolge der sechs Schritte, die von Forschern durchgeführt werden, um eine Stichprobenpopulation zu erhalten

Der Probenahmeprozess gliedert sich in sechs Schritte:

Bevölkerungszuordnung;
Bestimmung des Stichprobenrahmens;
Wahl des Auswahlverfahrens;
Bestimmung des Stichprobenumfangs;
Auswahl von Beispielelementen;
Prüfung der ausgewählten Elemente.

Lernziel 3
Definieren Sie das Konzept des „Stichprobenrahmens“

Der Stichprobenrahmen ist die Liste der Gegenstände, aus denen die Stichprobe gezogen wird.

Lernziel 4
Erklären Sie den Unterschied zwischen probabilistischem und deterministischem Sampling

In einer probabilistischen Stichprobe kann jedes Mitglied der Bevölkerung mit einer bestimmten Zahl eingeschlossen werden gegeben ungleich Null Wahrscheinlichkeit. Die Wahrscheinlichkeiten, bestimmte Mitglieder der Grundgesamtheit in die Stichprobe aufzunehmen, können voneinander abweichen, aber die Wahrscheinlichkeit, dass jedes Element darin enthalten ist, ist bekannt. Bei deterministischen Stichproben wird es unmöglich, die Wahrscheinlichkeit abzuschätzen, dass irgendein Element in der Stichprobe enthalten ist. Die Repräsentativität einer solchen Stichprobe kann nicht garantiert werden. Alle deterministischen Auswahlen basieren vielmehr auf einer persönlichen Position, einem Urteil oder einer Präferenz. Solche Präferenzen können manchmal gute Schätzungen der Merkmale der Population liefern, aber es gibt keine Möglichkeit, die Eignung der Stichprobe für die Aufgabe objektiv zu bestimmen.

Lernziel 5
Unterscheiden Sie zwischen Stichproben mit fester Größe und mehrstufigen (konsekutiven) Stichproben

Beim Arbeiten mit Feststichproben wird der Stichprobenumfang vor Beginn der Erhebung festgelegt und der Analyse der Ergebnisse geht die Erhebung aller erforderlichen Daten voraus. Bei einer sequentiellen Stichprobe ist die Anzahl der ausgewählten Elemente nicht im Voraus bekannt, sie wird auf der Grundlage einer Reihe sequentieller Entscheidungen bestimmt.

Lernziel 6
Erklären Sie, was absichtliches Sampling ist, und beschreiben Sie seine Stärken und Schwächen

Die absichtlichen Stichprobenelemente werden von Hand ausgewählt und dem Forscher in geeigneter Weise für die Zwecke der Umfrage vorgelegt. Es wird davon ausgegangen, dass die ausgewählten Elemente ein vollständiges Bild der untersuchten Population vermitteln können. Solange sich der Forscher in den frühen Stadien der Problemlösung befindet, wenn die Aussichten und möglichen Grenzen der geplanten Erhebung bestimmt werden, kann der Einsatz einer absichtlichen Stichprobenziehung sehr effektiv sein. Aber wir sollten auf keinen Fall die Schwächen dieser Art von Proben vergessen, da sie auch vom Forscher in deskriptiven oder kausalen Studien verwendet werden können, was sich nicht nachteilig auf die Qualität ihrer Ergebnisse auswirken wird.

Lernziel 7
Definieren Sie das Konzept der Quotenstichprobe

Die verhältnismäßige Stichprobenziehung wird so gewählt, dass der Anteil der Stichprobenelemente mit bestimmten Merkmalen in etwa dem Anteil gleicher Elemente in der untersuchten Grundgesamtheit entspricht; Dazu wird jedem Zähler eine Quote zugewiesen, die die Merkmale der Bevölkerung festlegt, mit der er Kontakt aufnehmen muss.

Lernziel 8
Erklären Sie, was ein Parameter in einem Auswahlverfahren ist

Parameter - ein bestimmtes Merkmal oder ein Indikator der allgemeinen oder untersuchten Bevölkerung; ein bestimmter quantitativer Indikator, der einen Satz von einem anderen unterscheidet.

Lernziel 9
Erklären Sie, was eine abgeleitete Menge ist

Die abgeleitete Grundgesamtheit besteht aus allen möglichen Stichproben, die gemäß einem vorgegebenen Stichprobenplan aus der Grundgesamtheit ausgewählt werden können.

Lernziel 10
Erklären Sie, warum das Konzept der Stichprobenverteilung das wichtigste Konzept der Statistik ist.

Das Konzept der Stichprobenverteilung ist der Eckpfeiler der statistischen Inferenz. Aufgrund der bekannten Stichprobenverteilung der untersuchten Statistik kann auf den entsprechenden Parameter der Allgemeinbevölkerung geschlossen werden. Wenn nur bekannt ist, dass sich die Stichprobenschätzung von Stichprobe zu Stichprobe ändert, die Art dieser Änderung jedoch unbekannt ist, wird es unmöglich, den dieser Schätzung zugeordneten Stichprobenfehler zu bestimmen. Da die Stichprobenverteilung einer Schätzung beschreibt, wie sie sich von Stichprobe zu Stichprobe ändert, bietet sie eine Grundlage zur Bestimmung der Gültigkeit einer Stichprobenschätzung.

Empirische gelten als eines der wichtigsten Mittel zur Untersuchung sozialer Beziehungen und Prozesse. Sie liefern zuverlässige, vollständige und repräsentative Informationen.

Spezifität der Techniken

Empirische liefern den Erhalt faktenfestigender Erkenntnisse. Sie tragen zur Feststellung und Verallgemeinerung von Umständen durch indirekte oder direkte Registrierung von Ereignissen bei, die den untersuchten Beziehungen, Objekten und Phänomenen innewohnen. Empirische Methoden unterscheiden sich von theoretischen dadurch, dass der Gegenstand der Analyse ist:

Verhalten von Individuen und ihren Gruppen.
Produkte menschlicher Aktivität.
Verbale Handlungen von Einzelpersonen, ihre Urteile, Ansichten, Meinungen.

Beispielstudien

Empirische Studien konzentrieren sich immer darauf, objektive und genaue Informationen und quantitative Daten zu erhalten. In diesem Zusammenhang muss bei der Durchführung die Repräsentativität der Informationen gewährleistet werden. Dementsprechend richtig Probenahme-Set. Das Das bedeutet, dass die Auswahl so erfolgen muss, dass die aus einer engen Gruppe gewonnenen Daten die Trends widerspiegeln, die in der allgemeinen Masse der Befragten stattfinden. Beispielsweise können bei einer Befragung von 200-300 Personen die gewonnenen Daten auf die gesamte Stadtbevölkerung hochgerechnet werden. Die Indikatoren des Stichprobensatzes ermöglichen eine andere Herangehensweise an die Untersuchung sozioökonomischer Prozesse in der Region, im ganzen Land.

Terminologie

Um die Probleme im Zusammenhang mit Stichprobenerhebungen besser zu verstehen, müssen einige Definitionen geklärt werden. Die Beobachtungseinheit ist die direkte Informationsquelle. Dabei kann es sich um eine Einzelperson, eine Gruppe, ein Dokument, eine Organisation usw. handeln. Die allgemeine Bevölkerung ist Reihe von Beobachtungseinheiten. Sie sollten alle für das untersuchte Problem relevant sein. Gegenstand direkter Analyse. Die Studie wird gemäß den entwickelten Methoden zur Erhebung von Informationen durchgeführt. Verwenden Sie zur Bestimmung dieses Anteils an der gesamten Gruppe der Befragten das Konzept der "Probe". Seine Eigenschaft, die Schlüsselparameter der Gesamtmasse der Menschen widerzuspiegeln, wird als Repräsentativität bezeichnet. In einigen Fällen gibt es keine Übereinstimmungen. Dann spricht man von einem Repräsentativitätsfehler.

Repräsentativität sicherstellen

Die damit verbundenen Fragen werden im Rahmen der Statistik ausführlich behandelt. Die Probleme sind komplex, weil es einerseits darum geht, eine quantitative Darstellung bereitzustellen, die gegeben ist die allgemeine Bevölkerung. Das bedeutet insbesondere, dass die Gruppen der Befragten in optimaler Zahl vertreten sein sollten. Die Menge muss für eine normale Darstellung ausreichen. Andererseits bedeutet es auch qualitative Repräsentation. Es setzt eine bestimmte fachliche Zusammensetzung voraus, die sich bildet Probenahme-Set. Das bedeutet, dass beispielsweise von Repräsentativität nicht gesprochen werden kann, wenn nur Männer oder nur Frauen, ältere oder junge Menschen befragt werden. Die Studie sollte in allen vertretenen Gruppen durchgeführt werden.

Probencharakteristik

Dieser Begriff wird in zweierlei Hinsicht betrachtet. Zunächst einmal wird es als ein Komplex von Elementen aus der allgemeinen Gruppe von Personen definiert, deren Meinung untersucht wird - das ist Probenahme-Set. Das auch der Prozess der Schaffung einer bestimmten Kategorie von Befragten mit der erforderlichen Repräsentativität. In der Praxis gibt es mehrere Arten und Arten der Auswahl. Betrachten wir sie.

Typen

Es gibt drei davon:

spontan Probenahme-Set. Das eine Gruppe von Befragten, die auf freiwilliger Basis ausgewählt werden. Gleichzeitig ist die Zugänglichkeit des Eintrags von Einheiten aus der Gesamtmasse der Personen in eine bestimmte Studiengruppe gewährleistet. Spontane Selektion wird in der Praxis recht häufig eingesetzt. Zum Beispiel bei Umfragen in der Presse, per Mail. Dieser Ansatz hat jedoch einen erheblichen Nachteil. Es ist unmöglich, das gesamte Volumen der allgemeinen Stichprobe qualitativ darzustellen. Diese Technik wird im Hinblick auf die Wirtschaftlichkeit angewendet. Bei manchen Umfragen ist diese Option die einzig mögliche.
spontan Probenahme-Set. Das eine der Hauptmethoden, die in der Studie verwendet werden. Das Schlüsselprinzip einer solchen Auswahl besteht darin, jeder Beobachtungseinheit die Möglichkeit zu geben, aus der allgemeinen Masse von Individuen in eine enge Gruppe zu gelangen. Dazu werden unterschiedliche Methoden verwendet. Zum Beispiel kann es sich um eine Lotterie, eine mechanische Auswahl oder eine Tabelle mit Zufallszahlen handeln.
Geschichtete (Quoten-)Probenahme. Es basiert auf der Bildung eines qualitativen Modells der Gesamtmasse der Befragten. Danach erfolgt die Auswahl der Einheiten in der Grundgesamtheit. Sie wird beispielsweise nach Alter oder Geschlecht, nach Bevölkerungsgruppen usw. durchgeführt.

Arten

Es gibt folgende Auswahlmöglichkeiten:

Zusätzlich

Stichproben können auch abhängig und unabhängig sein. Im ersten Fall haben der Ablauf des Experiments und die Ergebnisse, die dabei für eine Gruppe von Befragten erzielt werden, einen gewissen Einfluss auf die andere. Dementsprechend implizieren unabhängige Stichproben keine solche Auswirkung. Hier ist jedoch ein wichtiger Punkt zu beachten. Eine Gruppe von Probanden, für die die psychologische Untersuchung zweimal durchgeführt wurde (auch wenn sie darauf abzielte, unterschiedliche Eigenschaften, Merkmale, Zeichen zu untersuchen), wird standardmäßig als abhängig angesehen.

Wahrscheinlichkeitsauswahl

Betrachten Sie einige Arten von Proben:

Zufällig. Es setzt die Homogenität der Gesamtpopulation, eine Wahrscheinlichkeit der Verfügbarkeit aller Komponenten sowie das Vorhandensein einer vollständigen Liste von Elementen voraus. Bei der Auswahl wird in der Regel eine Tabelle mit Zufallszahlen verwendet.
Mechanisch. Bei dieser Art der Stichprobenziehung wird nach einem bestimmten Attribut geordnet. Zum Beispiel nach Telefonnummer, alphabetisch, nach Geburtsdatum und so weiter. Die erste Komponente wird zufällig ausgewählt. Als nächstes wird jedes k Element mit einem Schritt n ausgewählt. Der Wert der Gesamtpopulation beträgt N=k*n.
Geschichtet. Diese Stichprobe wird verwendet, wenn die Gesamtpopulation heterogen ist. Letztere ist in Schichten (Gruppen) unterteilt. In jedem von ihnen erfolgt die Auswahl mechanisch oder zufällig.
Seriell. Die Gruppen werden zufällig ausgewählt. In ihnen werden die Objekte vollständig untersucht.

Unglaubliche Auswahl

Sie beinhalten eine Stichprobenziehung nicht auf der Grundlage von Zufälligkeit, sondern aus subjektiven Gründen: Typizität, Zugänglichkeit, gleichberechtigte Repräsentation und so weiter. Zur Auswahl in dieser Kategorie gehören:

Nuance

Um die Repräsentativität zu gewährleisten, ist eine genaue und vollständige Liste der Bevölkerungseinheiten erforderlich. Die Beobachtungsobjekte sind in der Regel eine Person. Die Auswahl aus der Liste erfolgt am besten durch Nummerierung der Einheiten und Verwendung einer Tabelle mit Zufallszahlen. Aber auch die Quasi-Random-Methode wird oft verwendet. Es setzt die Auswahl aus der Liste jedes n Elements voraus.

Beeinflussende Faktoren

Das Volumen einer Population ist die Anzahl ihrer Einheiten. Laut Experten muss es nicht groß sein. Zweifellos ist das Ergebnis umso genauer, je größer die Anzahl der Befragten ist. Gleichzeitig garantiert ein großes Volumen jedoch nicht immer den Erfolg. Dies ist beispielsweise der Fall, wenn die Gesamtgruppe der Befragten heterogen ist. Als homogen wird ein solcher Satz betrachtet, bei dem der kontrollierte Parameter, beispielsweise der Alphabetisierungsgrad, gleichmäßig verteilt ist, dh es gibt keine Lücken oder Verdichtungen. In diesem Fall reicht es aus, mehrere Personen zu befragen. Aus den Ergebnissen der Umfrage lässt sich schließen, dass die Mehrheit der Menschen über ein normales Maß an Alphabetisierung verfügt. Daraus folgt, dass die Repräsentativität von Informationen nicht von quantitativen Merkmalen, sondern von qualitativen Merkmalen der Grundgesamtheit – insbesondere dem Grad ihrer Homogenität – beeinflusst wird.

Fehler

Sie stellen die Abweichung der durchschnittlichen Parameter der Stichprobenpopulation von den Werten der Gesamtmasse der Befragten dar. In der Praxis werden Fehler durch Matching ermittelt. Bei der Befragung von Erwachsenen werden in der Regel Daten aus Volkszählungen, statistischen Erhebungen und die Ergebnisse vergangener Befragungen verwendet. Die Kontrollparameter sind in der Regel der Vergleich der Mittelwerte der Grundgesamtheiten (allgemein und Stichprobe), die Bestimmung des Fehlers danach und die Reduzierung dieser Abweichung wird als Repräsentativitätskontrolle bezeichnet.

Ergebnisse

Stichprobenforschung ist eine Möglichkeit, durch eine Befragung speziell ausgewählter Gruppen von Befragten Daten über die Einstellungen und das Verhalten von Menschen zu sammeln. Diese Technik gilt als zuverlässig und wirtschaftlich, obwohl sie eine bestimmte Technik erfordert. Grundlage ist das Muster. Es handelt sich um einen bestimmten Anteil an der Gesamtmasse der Menschen. Die Auswahl erfolgt mit speziellen Techniken und zielt darauf ab, Informationen über die gesamte Bevölkerung zu erhalten. Letztere wiederum wird durch alle möglichen sozialen Objekte bzw. durch die zu untersuchende Gruppe repräsentiert. Oft ist die Population so groß, dass es ziemlich kostspielig und umständlich wäre, eine Umfrage bei jedem ihrer Mitglieder durchzuführen. Daher wird ein reduziertes Modell verwendet. Die Stichprobe umfasst alle diejenigen, die Fragebögen erhalten, die als Befragte bezeichnet werden, die tatsächlich als Untersuchungsobjekt fungieren. Einfach gesagt, es besteht aus vielen Menschen, die interviewt werden.

Fazit

Die Ziele der Umfrage werden durch spezifische Kategorien bestimmt, die in der Bevölkerung enthalten sind. Was einen bestimmten Anteil an der Gesamtmasse der Menschen betrifft, so besteht er aus Subjekten, die in Gruppen zusammengefasst sind, die mathematische Berechnungen verwenden. Für die Auswahl der Einheiten ist eine Beschreibung des Objekts der Grundgesamtheit notwendig. Nach Festlegung der Probandenzahl wird der Empfang bzw. die Art der Gruppenbildung festgelegt. Die Ergebnisse der Umfrage werden es uns ermöglichen, das untersuchte Merkmal in Bezug auf alle Vertreter der allgemeinen Masse der Menschen zu beschreiben. Wie die Praxis zeigt, werden überwiegend punktuelle statt kontinuierliche Studien durchgeführt.

Statistische Studien sind sehr zeitaufwändig und teuer, daher entstand die Idee, die kontinuierliche Beobachtung durch eine selektive zu ersetzen.

Der Hauptzweck der diskontinuierlichen Beobachtung besteht darin, die Merkmale der untersuchten statistischen Grundgesamtheit für den untersuchten Teil davon zu erhalten.

Selektive Beobachtung- Dies ist eine Methode der statistischen Forschung, bei der verallgemeinernde Indikatoren der Bevölkerung nur für einen einzelnen Teil festgelegt werden, basierend auf den Bestimmungen der Zufallsauswahl.

Bei der Stichprobenmethode wird nur ein bestimmter Teil der untersuchten Bevölkerung untersucht, während die zu untersuchende statistische Bevölkerung als allgemeine Bevölkerung bezeichnet wird.

Eine Stichprobe oder einfach eine Stichprobe kann als Teil der Einheiten bezeichnet werden, die aus der allgemeinen Bevölkerung ausgewählt wurden und einer statistischen Untersuchung unterzogen werden.

Der Wert der Stichprobenmethode: Mit einer minimalen Anzahl von untersuchten Einheiten wird die statistische Forschung in kürzeren Zeiträumen und mit den niedrigsten Kosten für Mittel und Arbeit durchgeführt.

In der Allgemeinbevölkerung wird der Anteil der Einheiten, die das untersuchte Merkmal aufweisen, als allgemeiner Anteil bezeichnet (bezeichnet als R), und der Durchschnittswert des untersuchten variablen Merkmals ist der allgemeine Durchschnitt (bezeichnet als X).

In der Stichprobenpopulation wird der Anteil des untersuchten Merkmals als Stichprobenanteil bezeichnet, oder Teil (mit w bezeichnet), der Durchschnittswert in der Stichprobe ist Stichprobenmittelwert.

Wenn während des Untersuchungszeitraums alle Regeln seiner wissenschaftlichen Organisation eingehalten werden, liefert die Stichprobenmethode ziemlich genaue Ergebnisse, und daher ist es ratsam, diese Methode zur Überprüfung der Daten der kontinuierlichen Beobachtung zu verwenden.

Diese Methode ist in der staatlichen und nicht-departementalen Statistik weit verbreitet, da sie bei der Untersuchung der minimalen Anzahl von untersuchten Einheiten eine gründliche und genaue Untersuchung ermöglicht.

Die untersuchte Grundgesamtheit besteht aus Einheiten mit unterschiedlichen Merkmalen. Die Zusammensetzung der Stichprobe kann von der Zusammensetzung der Allgemeinbevölkerung abweichen, diese Diskrepanz zwischen den Merkmalen der Stichprobe und der Allgemeinbevölkerung stellt den Stichprobenfehler dar.

Der selektiven Beobachtung innewohnende Fehler charakterisieren die Größe der Diskrepanz zwischen den Daten der selektiven Beobachtung und der Gesamtpopulation. Fehler, die während der Stichprobenziehung auftreten, werden als Repräsentativitätsfehler bezeichnet und in zufällige und systematische Fehler unterteilt.

Wenn die Stichprobenpopulation aufgrund der nicht kontinuierlichen Natur der Beobachtung die gesamte Population nicht genau wiedergibt, spricht man von Zufallsfehlern, und ihre Größe wird auf der Grundlage des Gesetzes der großen Zahlen und der Wahrscheinlichkeitstheorie mit ausreichender Genauigkeit bestimmt.

Systematische Fehler entstehen durch Verletzung des Prinzips der zufälligen Auswahl von Bevölkerungseinheiten für die Beobachtung.

2. Arten und Schemata der Auswahl

Die Größe des Stichprobenfehlers und die Methoden zu seiner Bestimmung hängen von der Art und dem Schema der Auswahl ab.

Es gibt vier Arten der Auswahl eines Satzes von Beobachtungseinheiten:

1) zufällig;

2) mechanisch;

3) typisch;

4) seriell (verschachtelt).

zufällige Auswahl- die gebräuchlichste Auswahlmethode in einer Zufallsstichprobe, sie wird auch als Lotteriemethode bezeichnet, bei der für jede Einheit der statistischen Grundgesamtheit ein Los mit einer Seriennummer erstellt wird.

Als nächstes wird die erforderliche Anzahl von Einheiten der statistischen Grundgesamtheit zufällig ausgewählt. Unter diesen Bedingungen hat jeder von ihnen die gleiche Wahrscheinlichkeit, in die Stichprobe zu gelangen, zum Beispiel Gewinnziehungen, wenn ein bestimmter Teil der Zahlen, die für Gewinne ausmachen, zufällig aus der Gesamtzahl der ausgegebenen Tickets ausgewählt wird. In diesem Fall haben alle Nummern die gleiche Chance, in die Stichprobe zu gelangen.

Mechanische Auswahl- Dies ist eine Methode, bei der die gesamte Population auf zufälliger Basis in Gruppen homogener Größe aufgeteilt wird, dann wird jeder Gruppe nur eine Einheit entnommen.Alle Einheiten der untersuchten statistischen Population werden in einer bestimmten Reihenfolge vorgeordnet, aber abhängig von der Probengröße wird die erforderliche Stückzahl in einem bestimmten Intervall mechanisch ausgewählt .

Typische Auswahl - Dies ist ein Verfahren, bei dem die zu untersuchende statistische Grundgesamtheit nach einem wesentlichen, typischen Merkmal in qualitativ homogene, ähnliche Gruppen eingeteilt wird, und dann aus jeder dieser Gruppen eine bestimmte Anzahl von Einheiten zufällig ausgewählt wird, proportional zum Anteil der Gruppe die gesamte Bevölkerung.

Die typische Auswahl liefert genauere Ergebnisse, da sie Vertreter aller typischen Gruppen in der Stichprobe umfasst.

Serielle (Verschachtelungs-)Auswahl. Ganze Gruppen (Serien, Nester), zufällig oder mechanisch ausgewählt, unterliegen der Auswahl. Für jede solche Gruppe, Serie, wird eine kontinuierliche Beobachtung durchgeführt und die Ergebnisse werden auf die gesamte Bevölkerung übertragen.

Die Abtastgenauigkeit hängt auch vom Auswahlschema ab. Die Stichprobenziehung kann nach dem Schema der wiederholten und nicht wiederholten Auswahl erfolgen.

Neuauswahl. Jede ausgewählte Einheit oder Serie wird an die gesamte Grundgesamtheit zurückgegeben und kann erneut abgetastet werden.Dies ist das sogenannte zurückgegebene Ballschema.

Wiederkehrende Auswahl. Jede vermessene Einheit wird zurückgezogen und nicht der Bevölkerung zurückgegeben, sie wird also nicht erneut vermessen. Dieses Schema wird als nicht zurückgegebener Ball bezeichnet.

Die sich nicht wiederholende Auswahl liefert genauere Ergebnisse, da die Beobachtung bei gleicher Stichprobengröße mehr Einheiten der untersuchten Grundgesamtheit abdeckt.

Kombinierte Auswahl kann einen oder mehrere Schritte durchlaufen. Eine Stichprobe wird als einstufig bezeichnet, wenn die einmal ausgewählten Einheiten der Grundgesamtheit einer Untersuchung unterzogen werden.

Eine Stichprobe wird als mehrstufig bezeichnet, wenn die Auswahl der Grundgesamtheit Stufen, aufeinander folgende Stufen durchläuft und jede Stufe, jede Stufe der Auswahl ihre eigene Auswahleinheit hat.

Mehrphasige Stichprobenziehung - In allen Stufen der Stichprobenziehung wird dieselbe Stichprobeneinheit beibehalten, es werden jedoch mehrere Stufen, Phasen von Stichprobenerhebungen durchgeführt, die sich in der Breite des Erhebungsprogramms und der Stichprobengröße voneinander unterscheiden.

Merkmale der Parameter der Grund- und Stichprobenpopulationen sind durch folgende Symbole gekennzeichnet:

N- das Volumen der allgemeinen Bevölkerung;

n– Stichprobengröße;

X– allgemeiner Durchschnitt;

X ist der Stichprobenmittelwert;

R– allgemeiner Anteil;

w - Stichprobenanteil;

2 - allgemeine Varianz (Streuung eines Merkmals in der Allgemeinbevölkerung);

2 - Stichprobenvarianz desselben Merkmals;

? - Standardabweichung in der Allgemeinbevölkerung;

? ist die Standardabweichung in der Stichprobe.

3. Stichprobenfehler

Jede Einheit in einer Stichprobenbeobachtung sollte die gleiche Chance haben, mit den anderen ausgewählt zu werden – dies ist die Grundlage einer Zufallsstichprobe.

Selbststichprobe - dies ist die Auswahl von Einheiten aus der gesamten allgemeinen Bevölkerung durch Lotterie oder auf andere ähnliche Weise.

Das Zufallsprinzip besagt, dass die Aufnahme oder der Ausschluss eines Objekts aus der Stichprobe durch keinen anderen Faktor als den Zufall beeinflusst werden kann.

Probe teilen ist das Verhältnis der Anzahl der Einheiten in der Stichprobe zur Anzahl der Einheiten in der Allgemeinbevölkerung:

Die Selbst-Random-Selektion in ihrer reinen Form ist die erste unter allen anderen Selektionsarten, sie enthält und verwirklicht die Grundprinzipien der selektiven statistischen Beobachtung.

Die zwei Haupttypen von verallgemeinernden Indikatoren, die bei der Stichprobenmethode verwendet werden, sind der Durchschnittswert eines quantitativen Attributs und der relative Wert eines alternativen Attributs.

Der Stichprobenanteil (w) oder die Besonderheit wird durch das Verhältnis der Anzahl der Einheiten bestimmt, die das untersuchte Merkmal aufweisen m, auf die Gesamtzahl der Probenahmeeinheiten (n):

Um die Zuverlässigkeit von Stichprobenindikatoren zu charakterisieren, werden die durchschnittlichen und marginalen Fehler der Stichprobe unterschieden.

Der Stichprobenfehler, auch Repräsentativitätsfehler genannt, ist die Differenz zwischen der entsprechenden Stichprobe und allgemeinen Merkmalen:

?x = | x - x |;

?w =|х – p|.

Nur Stichprobenbeobachtungen weisen einen Stichprobenfehler auf

Stichprobenmittelwert und Stichprobenanteil- Dies sind Zufallsvariablen, die je nach den Einheiten der untersuchten statistischen Grundgesamtheit, die in die Stichprobe aufgenommen wurden, unterschiedliche Werte annehmen. Dementsprechend sind auch Stichprobenfehler Zufallsvariablen und können auch unterschiedliche Werte annehmen. Daher wird der Durchschnitt der möglichen Fehler bestimmt - der durchschnittliche Stichprobenfehler.

Der durchschnittliche Stichprobenfehler wird durch den Stichprobenumfang bestimmt: Je größer die Grundgesamtheit ist, desto kleiner ist der durchschnittliche Stichprobenfehler. Indem wir eine Stichprobenerhebung mit einer zunehmenden Anzahl von Einheiten der Allgemeinbevölkerung abdecken, charakterisieren wir die Gesamtbevölkerung immer genauer.

Der durchschnittliche Stichprobenfehler hängt vom Variationsgrad des untersuchten Merkmals ab, der Variationsgrad wiederum ist durch Varianz gekennzeichnet? 2 oder w(l - w)- für ein alternatives Zeichen. Je kleiner die Merkmalsvarianz und -varianz ist, desto kleiner ist der mittlere Stichprobenfehler und umgekehrt.

Für zufälliges Resampling werden mittlere Fehler theoretisch mit den folgenden Formeln berechnet:

1) für das durchschnittliche quantitative Merkmal:

wo? 2 - der Durchschnittswert der Streuung eines quantitativen Merkmals.

2) für eine Aktie (Alternativzeichen):

Wie ist also die Varianz des Merkmals in der Population? 2 nicht genau bekannt ist, verwendet man in der Praxis den Wert der Varianz S 2 , der für die Stichprobengesamtheit auf der Grundlage des Gesetzes der großen Zahlen berechnet wird, wonach die Stichprobengesamtheit bei ausreichend großem Stichprobenumfang die Eigenschaften der Stichprobe genau wiedergibt Durchschnittsbevölkerung.

Die Formeln für den mittleren Stichprobenfehler für zufälliges Resampling lauten wie folgt. Für den Durchschnittswert eines quantitativen Merkmals: Die allgemeine Varianz wird durch das Wahlfach durch das folgende Verhältnis ausgedrückt:

wobei S 2 der Dispersionswert ist.

Mechanische Probenahme- dies ist die Auswahl von Einheiten in einer Stichprobe aus dem Allgemeinen, die nach einem neutralen Kriterium in gleiche Gruppen eingeteilt wird; wird so durchgeführt, dass nur eine Einheit aus jeder solchen Gruppe in der Stichprobe ausgewählt wird.

Bei der mechanischen Auswahl werden die Einheiten der untersuchten statistischen Grundgesamtheit vorläufig in einer bestimmten Reihenfolge angeordnet, wonach eine bestimmte Anzahl von Einheiten in einem bestimmten Intervall mechanisch ausgewählt wird. In diesem Fall ist die Größe des Intervalls in der Allgemeinbevölkerung gleich dem Kehrwert des Stichprobenanteils.

Bei einer ausreichend großen Grundgesamtheit ist die mechanische Auswahl hinsichtlich der Genauigkeit der Ergebnisse nahe an der zufälligen, daher werden zur Bestimmung des mittleren Fehlers der mechanischen Stichprobe die Formeln der zufälligen, nicht wiederholten Stichprobe verwendet.

Um Einheiten aus einer heterogenen Bevölkerung auszuwählen, wird die sogenannte typische Stichprobe verwendet. Sie wird verwendet, wenn alle Einheiten der Allgemeinbevölkerung gemäß den Merkmalen, von denen die untersuchten Indikatoren abhängen, in mehrere qualitativ homogene, ähnliche Gruppen unterteilt werden können.

Dann wird aus jeder typischen Gruppe eine individuelle Auswahl von Einheiten in die Stichprobe durch eine Zufalls- oder mechanische Stichprobe getroffen.

Bei der Untersuchung komplexer statistischer Grundgesamtheiten wird normalerweise eine typische Stichprobenziehung verwendet.

Eine typische Probenahme liefert genauere Ergebnisse. Die Typisierung der Allgemeinbevölkerung gewährleistet die Repräsentativität einer solchen Stichprobe, die Repräsentation jeder typologischen Gruppe darin, wodurch der Einfluss der Intergruppenstreuung auf den durchschnittlichen Stichprobenfehler ausgeschlossen werden kann. Bei der Bestimmung des durchschnittlichen Fehlers einer typischen Stichprobe dient daher der Durchschnitt der gruppeninternen Varianzen als Streuungsindikator.

Bei der seriellen Probenahme handelt es sich um eine zufällige Auswahl aus einer Grundgesamtheit gleichgroßer Gruppen, um in solchen Gruppen ausnahmslos alle Einheiten einer Beobachtung zu unterziehen.

Da alle Einheiten ausnahmslos innerhalb von Gruppen (Serien) untersucht werden, hängt der durchschnittliche Stichprobenfehler (bei Auswahl gleicher Serien) nur von der Varianz zwischen den Gruppen (Interserien) ab.

4. Möglichkeiten zur Ausweitung der Stichprobenergebnisse auf die Bevölkerung

Die Charakterisierung der Allgemeinbevölkerung anhand von Stichprobenergebnissen ist das oberste Ziel der Stichprobenbeobachtung.

Das Stichprobenverfahren wird verwendet, um die Merkmale der Allgemeinbevölkerung für bestimmte Indikatoren der Stichprobe zu erhalten. Je nach Zielsetzung der Studie erfolgt dies durch direkte Rückrechnung der Stichprobenindikatoren für die Allgemeinbevölkerung oder durch die Methode der Berechnung von Korrekturfaktoren.

Die Methode der direkten Rückrechnung ist die, mit der sich die Kennziffern der Stichprobe teilen w oder mittel X werden unter Berücksichtigung des Stichprobenfehlers auf die Allgemeinbevölkerung ausgedehnt.

Die Methode der Korrekturfaktoren wird angewendet, wenn das Stichprobenverfahren dazu dient, die Ergebnisse der vollständigen Rechnungslegung zu verfeinern. Mit dieser Methode werden die Daten der jährlichen Viehzählungen der Bevölkerung veredelt.

Der Begriff der „Repräsentativität“ in Bezug auf soziologische Umfragen – Meinungsumfragen – hat eine geradezu magische Wirkung auf die Menschen. Der Begriff „Repräsentation“ selbst hat neben einer wissenschaftlichen auch eine eindeutig politische Bedeutung.

Was ist der Grund? Die Sache ist die, dass angenommen wird, dass die Stichprobe (eine für die Umfrage ausgewählte Gruppe von Personen) die gesamte Bevölkerung repräsentieren (repräsentieren) kann. Die allgemeine Bevölkerung im Fall von gesamtrussischen Erhebungen ist die gesamte Bevölkerung des Landes. Stellen wir uns nun vor, wir sprechen über eine politische Entscheidung – die Unterstützung eines Gesetzentwurfs oder die Stimmabgabe bei einer Wahl. Mit Hilfe einer Stichprobenerhebung erhalten wir einen hervorragenden Mechanismus der politischen Repräsentation - einen Mechanismus, bei dem eine kleine Gruppe von Personen die Meinung oder Position der gesamten Bevölkerung des Landes vertreten kann. Daher wird der Repräsentativität der Studie ein so wichtiger Stellenwert eingeräumt.

Der Begriff der Repräsentativität wird natürlich nicht nur in der Politikwissenschaft verwendet. Der Begriff wird fast immer verwendet, wenn es um große Studien geht, sei es im Bereich Marketing, wirtschaftliches Verhalten oder Bildung.

Methodik repräsentativer Befragungen

Wie kann man nach einer Befragung von 1.500 Personen Rückschlüsse auf alle Russen ziehen, von denen es mehr als 140 Millionen (und sogar mehr als 110 Millionen Wähler) gibt? Die Technologie hinter repräsentativen Umfragen basiert auf statistischen Gesetzmäßigkeiten. Der nächste Grund ist das Gesetz der großen Zahlen oder der Satz von Bernoulli.

Vereinfacht kann seine Bedeutung wie folgt vermittelt werden. Angenommen, wir haben ein Feature, zum Beispiel die Niederschlagsmenge pro Tag in Jekaterinburg im 20. Jahrhundert. Wenn wir alle seine Werte zusammen mit ihrer Häufigkeit (dies wird als Verteilung bezeichnet) aufschreiben und dann zufällig eine ausreichend große Anzahl von Fällen nehmen (dh nicht alle Tage im zwanzigsten Jahrhundert, aber ziemlich viele), dann Wir werden sehen, dass die Verteilung in unserer Stichprobe der Verteilung für das gesamte 20. Jahrhundert sehr ähnlich sein wird. Wenn wir also einige Einheiten aus der Grundgesamtheit auswählen, können diese tatsächlich die gesamte Grundgesamtheit repräsentieren, und es ist nicht wirklich notwendig, Daten für alle Fälle zu sammeln.

Es gibt jedoch eine Schlüsselbedingung: Dies gilt nur, wenn die Auswahl streng zufällig ist. Das einzige Problem hier kann die Abweichung von der Zufälligkeit sein. Wenn wir also nur Niederschlagsdaten der letzten Jahre nehmen (zum Beispiel, weil diese Daten leichter zu finden sind) oder 1500 unserer Bekannten befragen (weil es einfacher ist, sie zu kontaktieren) und keine zufälligen Personen, dann wird die Stichprobe sicherlich nicht repräsentativ sein.

Stellen Sie sich vor, Sie wählen aus 143,5 Millionen Russen zufällig die 1.500 Personen aus, die Sie brauchen. Dann entspricht beispielsweise der Anteil der mittleren Führungskräfte etwa dem Anteil der mittleren Führungskräfte an der Gesamtbevölkerung, was zeigt, dass Ihre Stichprobe die gesamte Bevölkerung repräsentieren kann. Kann es passieren, dass diese beiden Indikatoren sehr unterschiedlich sind? Bei den Russen sind es beispielsweise 14%, aber in der Stichprobe werden es nur 1% sein? Theoretisch ist dies möglich, aber die Wahrscheinlichkeit dafür ist so gering, dass es vernachlässigt werden kann (wie die Begegnung mit einem Drachen auf der Straße).

Außerdem ist das Angenehme an dieser Wahrscheinlichkeit nicht einmal, dass sie klein ist, sondern dass sich diese Wahrscheinlichkeit für Zufallsvorgänge berechnen lässt. Wir können sagen, mit welcher Wahrscheinlichkeit unser Stichprobenwert um 13 % (wie im obigen Beispiel) und mit welcher, sagen wir, um 2,5 % vom Wert in der Allgemeinbevölkerung abweicht. Meistens machen sie aber das Gegenteil: Zuerst bestimmen sie die Wahrscheinlichkeit, mit der wir wollen, dass unser Wert nicht von dem Wert in der Allgemeinbevölkerung abweicht (meistens wird er auf das Niveau von 95 % festgelegt), und dann schauen sie nach was die Abweichung für Proben einer bestimmten Größe ist. Diese Abweichung wird als Konfidenzintervall bezeichnet, manchmal auch als Stichprobenfehler oder statistischer Fehler bezeichnet, und wird häufig neben den Umfrageergebnissen aufgeführt.

Die Wahrscheinlichkeit der Abweichung, die Höhe der Abweichung (Konfidenzintervall) und die Stichprobengröße hängen also zusammen. Auf dieser Grundlage lautet die Formel zur Berechnung des Stichprobenumfangs wie folgt:

wobei n der Stichprobenumfang, Δ das Konfidenzintervall, z der Wert der Normalverteilungsfunktion für eine gegebene Ablehnungswahrscheinlichkeit ist (bei einer Wahrscheinlichkeit von 5 % beträgt dieser Wert 1,96).

Dies ist eine vereinfachte Formel, echte Umfragen verwenden etwas komplexere Formeln. Diese Formel kann auch versagen, wenn der Wert des Indikators stark von 50 % abweicht (so dass diese Formel beispielsweise nicht geeignet ist, den Anteil der Patienten mit einer seltenen Krankheit in einem Land zu schätzen).

Folgendes passiert, wenn Sie einige Werte in dieser Formel ersetzen:

Mit anderen Worten, wenn wir eine Zufallsstichprobe von Russen mit einer Größe von 1600 Personen nehmen und einen Indikator schätzen, beispielsweise die Bereitschaft, einen bestimmten Politiker zu wählen, dann wird sich unsere Schätzung mit einer Wahrscheinlichkeit von 95% nicht von der Bereitschaft unterscheiden unter allen Russen mit mehr als 2,45% für ihn zu stimmen.

Stichprobengröße

Je größer die Stichprobengröße, desto wahrscheinlicher ist es, dass wir näher an einem Anteil an der Grundgesamtheit liegen. Es scheint, dass dies bedeutet, dass wir versuchen müssen, die Stichprobe näher an 143,5 Millionen zu bringen.Wie Sie der Tabelle entnehmen können, ist die Natur zufälliger Prozesse so, dass ab einem bestimmten Moment die Wahrscheinlichkeit besteht, in das Intervall zu fallen beginnt sehr langsam anzusteigen (und dieser Moment kommt ziemlich schnell). Nachdem wir 1500 Einheiten als Stichprobe genommen haben, steigt die Wahrscheinlichkeit, dass unser Stichprobenwert in den Grundgesamtheitswert fällt, sehr, sehr langsam an, ganz gleich, wie stark wir die Stichprobengröße erhöhen.

Tatsächlich gibt es fast keinen Unterschied zwischen 1.500 und 10.000 Befragten. Irgendwann um 1500 können wir bereits sagen, dass unsere Schätzungen um 2-3% vom Anteil an der allgemeinen Bevölkerung abweichen werden. Wenn wir die Stichprobe weiter erhöhen, verringert sich dieser mögliche Fehler, aber sehr geringfügig. Mit anderen Worten, eine Stichprobe von 100.000 ist besser als eine Stichprobe von 2500, aber der Unterschied ist so gering, dass er keinen Sinn ergibt und im Falle von Sozialerhebungen wirtschaftlich nicht gerechtfertigt ist. Üblicherweise ist die Stichprobenvergrößerung teuer und daher macht es keinen Sinn, sie aufzublähen, um einen Prozentpunkt im Wert des Konfidenzintervalls zu gewinnen.

Wichtig ist, dass die Größe der Gesamtbevölkerung überhaupt nicht in der Formel auftaucht. Tatsache ist, dass eine große Population (mehr als 20.000) wenig bis gar keine Auswirkungen auf die Stichprobengröße hat. Daher müssen wir nicht wissen, wie viele Menschen in Russland leben, um eine repräsentative Stichprobe zu erstellen. Es ist klar, dass die Auswahl von 1500 aus 2000 höchstwahrscheinlich keinen Sinn macht – es ist einfacher, 2000 zu untersuchen und eine genaue Schätzung zu erhalten. Wenn wir jedoch eine Stichprobe erstellen, haben wir die Möglichkeit, die Ergebnisse für die allgemeine Bevölkerung zu verallgemeinern. Und aus dem gleichen Grund wird sich die Stichprobengröße für große und kleine Länder nicht unterscheiden.

Repräsentativität und Genauigkeit

Um die Bedeutung des Begriffs „Repräsentativität“ zu verstehen, betrachten wir eine Stichprobe von 15 Personen. Seltsamerweise ist es auch repräsentativ, wenn Sie es versehentlich gemacht haben. Darüber hinaus können Sie ein Muster von einer Einheit erstellen. Stellen Sie sich eine Schachtel mit Kugeln vor, aus der Sie zufällig eine Kugel ziehen. Wenn es sich um einen zufällig ausgewählten Ball handelt, repräsentiert er auch alle Bälle, die sich in dieser Box befinden. Er wird sie nur vertreten. nicht genau. Wieso den? Denn die Wahrscheinlichkeit, sich zu irren, ist sehr hoch. Beim nächsten Mal können wir einen anderen Ball zeichnen und bekommen eine andere Vorstellung von den Bällen in der Box. Ungenau darzustellen bedeutet, eine große Bandbreite an Schätzungen zu haben.

Auf die gleiche Weise repräsentieren 15 Personen eine allgemeine Bevölkerung, aber sie repräsentieren sie ungenau, weil der Fehler, das Konfidenzintervall, sehr groß ist. Wir müssen +/- 33 % hinzufügen, um eine Chance von 95 % zu erhalten, dass wir in das Intervall fallen. Wenn wir bereit sind, dies zuzugeben, dann nehmen wir 15 Leute, finden heraus, dass 7 von ihnen mittlere Führungskräfte sind, und erhalten dann eine Schätzung, dass 7/15 der Gesamtzahl, also 47 % +/- 33 %, es sind den geschätzten Anteil von Führungskräften an der Gesamtbevölkerung, und das ist eine absolut richtige Schlussfolgerung. Es hat einfach keinen Wert. Das könnten wir ohne Prüfung sagen. Daher ist es sinnvoll, bei der Planung einer Stichprobe ein wirtschaftlich angemessenes Volumen zu erreichen.

All dies soll eine einfache Idee vermitteln, die sehr oft nicht realisiert wird: Die Stichprobengröße steht in keinem Zusammenhang mit ihrer Repräsentativität.

Eine kleine Stichprobe ist ungenau, kann aber dennoch repräsentativ sein. Die Stichprobenumfänge, die heute in Massenerhebungen in Russland verwendet werden, haben fast immer eine ziemlich hohe Genauigkeit.

Die Repräsentativität der Stichprobe wird nicht durch ihre Größe gefährdet, sondern durch Verzerrungen, dh Abweichungen vom Zufallsprinzip.

Verletzung des Zufallsprinzips

Wenn wir beginnen, Einheiten nicht zufällig auszuwählen, wird die Stichprobe nicht repräsentativ. Zum Beispiel, wenn uns etwas daran hindert, sie zufällig auszuwählen. Stellen Sie sich vor, wir wollen zufällig Bälle aus unserer Kiste auswählen, aber dann stellt sich heraus, dass einige der Bälle beißen. Der Mechanismus, durch den wir nur die Murmeln nehmen, die uns gegeben werden, ist ein Mechanismus, der die Zufälligkeit und damit die Repräsentativität verletzt. In diesem Fall haben wir, egal wie viele Murmeln wir aus der Schachtel nehmen (selbst wenn wir alle Murmeln nehmen, die nicht beißen), eine nicht repräsentative Probe, weil wir keine der Murmeln berücksichtigen, die beißen – sie umgehen Sie einfach unser Beispiel.

Das größte Problem bei Beißbällen ist, dass sie sich von denen unterscheiden können, die in unsere Hände kommen, und sich genau so unterscheiden, wie wir interessiert sind. Diese Situation wird als Stichprobenverzerrung bezeichnet.

Es ist notwendig, die Situation der unrichtigen Darstellung, die wir oben beschrieben haben, von der Situation der Nichtdarstellung zu unterscheiden. Dies sind unterschiedliche Probleme und sie haben unterschiedliche Lösungen. Sie können die eine nicht lösen, indem Sie die andere lösen. Wenn es der Stichprobe an Repräsentativität mangelt, ist es sinnlos, sie zu erhöhen. Darüber hinaus neigen große Stichproben in Sozialerhebungen dazu, Fehler zu akkumulieren, sodass das Problem der Repräsentation nur durch eine starke Erhöhung der Stichprobengröße verschärft werden kann.

Warum ist Repräsentativität unmöglich?

In den Anmerkungen zu den Tabellen mit den Ergebnissen der Umfragen ist oft zu sehen, dass "die Stichprobengröße 1600 Personen beträgt, die Stichprobe repräsentativ für Geschlecht und Alter ist". Aus dem oben Gesagten geht hervor, dass es sich um zwei unterschiedliche Parameter handelt: Eine Angabe zur Repräsentativität steht in keinem Zusammenhang mit der Stichprobengröße. Tatsächlich ist hier gemeint, dass bestimmte Verfahren befolgt wurden, um die Übereinstimmung zwischen der Stichprobe und der Grundgesamtheit sicherzustellen. Um beispielsweise die Repräsentativität nach Geschlecht zu gewährleisten, werden Männer und Frauen in den gleichen Proportionen in die Stichprobe rekrutiert, die laut Volkszählungsdaten unter Russen bestehen. Aber Repräsentativität nach Geschlecht bedeutet nicht Repräsentativität beispielsweise nach politischen Ansichten.

Warum ist es notwendig, die Stichprobe nach Geschlecht und anderen soziodemografischen Kategorien auszurichten? Denn nur eine Zufallsstichprobe kann echte Repräsentativität liefern und ist in der Praxis aus vielen Gründen nicht umsetzbar. Sobald Sie dies versuchen, werden Sie auf viele Probleme stoßen - egal für welche Methode Sie sich entscheiden. Einige Befragte werden Ihrer Methode überhaupt nicht zur Verfügung stehen (z. B. bei persönlichen Interviews sind Häuser mit Gegensprechanlagen und Sicherheit ein großes Problem), ein anderer Teil wird abwesend sein, nicht antworten oder lieber seinen Geschäften nachgehen. Es gibt Menschen, die Sprachprobleme haben und nicht mit uns sprechen können. Es gibt Leute, die verstehen nicht, warum das notwendig ist, und sie wollen nicht mit uns reden. All dies sind schwerwiegende Verletzungen der Zufälligkeit, die ihre Verwirklichung unmöglich machen.

Wer das Problem der Repräsentation in Massenbefragungen auf Statistiken reduziert, vergisst, dass Menschen sehr spezifische Murmeln sind. Es gibt Bälle, die rennen und sich verstecken. Es gibt Bälle, die beißen. Sie sind keine passiven Objekte, sie schlagen zurück. Sie sagen: „Ich möchte nicht an Ihrer Umfrage teilnehmen“ und verletzen damit die Zufälligkeit. Daher ist Repräsentativität bei Massenbefragungen im engeren Sinne natürlich in keiner Form möglich.

Es wurde ein Mechanismus entwickelt, durch den in der Regel der Anschein von Repräsentativität sichergestellt wird: Wir gleichen die Stichprobe in einigen Kategorien ab und tun so, als ob sie auch in allen anderen möglichen Kategorien abgeglichen wäre. Tatsächlich haben wir keinen Grund, dies zu behaupten. Aber das Problem ist, dass es keine Möglichkeit gibt, dies zu überprüfen - wiederum aufgrund der Tatsache, dass einige Bälle beißen. Um auf Voreingenommenheit zu prüfen, müsste der Prüfer zu denen gehen, die wir nicht befragt haben, und sie befragen. Aber sie wollen, wie wir uns erinnern, überhaupt nicht befragt werden. Es ist unmöglich, diejenigen zu befragen, die kategorisch nicht antworten. Daher gehen alle davon aus, dass, wenn wir die Stichprobe auf zwei oder drei Parameter ausrichten, sie die gesamte Bevölkerung repräsentiert, obwohl es für diese Annahme keine ernsthafte Grundlage gibt.

Repräsentatives Sampling ist eine Technik, die Soziologen der Statistik entlehnt haben. Daher trägt es zwangsläufig Elemente des mathematischen und statistischen Bildes der Welt in sich. Die vielleicht stärkste Annahme ist, dass die Stichprobenerhebung selbst politisch und soziologisch neutral ist: Teilnahme und Nichtteilnahme an der Umfrage haben keine politische Bedeutung und hängen nicht mit anderen soziologisch wichtigen Parametern zusammen. Aber heute sind Umfragen zu einer der wichtigsten politischen Institutionen und zu einem wichtigen Vermittler zwischen großen Unternehmen und Verbrauchern geworden. Unter diesen Bedingungen ist es nicht mehr möglich, an ihre politische Sterilität zu glauben. Allerdings wissen wir noch wenig darüber, wie Umfragen in heutigen Gesellschaften verstanden werden und was sie tatsächlich darstellen.

Einer der Hauptbestandteile einer gut konzipierten Studie ist die Definition der Stichprobe und was eine repräsentative Stichprobe ist. Es ist wie im Kuchenbeispiel. Schließlich muss man nicht das ganze Dessert essen, um seinen Geschmack zu verstehen? Ein kleiner Teil reicht.

Also der Kuchen ist Population (d. h. alle Befragten, die sich für die Umfrage qualifizieren). Es kann territorial zum Beispiel nur Einwohner der Region Moskau ausgedrückt werden. Geschlecht - nur Frauen. Oder haben Altersbeschränkungen - Russen sind über 65 Jahre alt.

Es ist schwierig, die Bevölkerung zu berechnen: Sie benötigen Daten aus der Volkszählung oder aus vorläufigen Erhebungen. Daher wird normalerweise die allgemeine Bevölkerung „geschätzt“ und aus der resultierenden Zahl berechnet Stichprobenrahmen oder Probenahme.

Was ist eine repräsentative Stichprobe?

Probe ist eine genau definierte Anzahl von Befragten. Ihre Struktur sollte hinsichtlich der Hauptmerkmale der Selektion möglichst mit der Struktur der Allgemeinbevölkerung übereinstimmen.

Wenn die potenziellen Befragten beispielsweise die gesamte Bevölkerung Russlands sind, wo 54 % Frauen und 46 % Männer sind, dann sollte die Stichprobe genau denselben Prozentsatz enthalten. Stimmen die Parameter überein, kann die Probe als repräsentativ bezeichnet werden. Dadurch werden Ungenauigkeiten und Fehler in der Studie minimiert.

Der Stichprobenumfang wird unter Berücksichtigung der Anforderungen an Genauigkeit und Wirtschaftlichkeit festgelegt. Diese Anforderungen sind umgekehrt proportional zueinander: Je größer der Stichprobenumfang, desto genauer das Ergebnis. Je höher die Genauigkeit, desto mehr Kosten fallen zudem für die Studie an. Und umgekehrt, je kleiner die Stichprobe ist, desto weniger kostet sie, desto ungenauer und zufälliger werden die Eigenschaften der Allgemeinbevölkerung reproduziert.

Um die Auswahl zu berechnen, haben Soziologen daher eine Formel erfunden und erstellt spezieller Rechner:

Vertrauenswahrscheinlichkeit und Vertrauensfehler

Was bedeuten die Begriffe " Vertrauensstufe" und " Vertrauensfehler"? Das Konfidenzniveau ist ein Maß für die Genauigkeit der Messungen. Ein Konfidenzfehler ist ein möglicher Fehler in den Ergebnissen der Studie. Bei einer Gesamtbevölkerung von beispielsweise mehr als 500.000 Personen (die beispielsweise in Nowokusnezk leben) besteht die Stichprobe aus 384 Personen mit einem Konfidenzniveau von 95 % und einem Fehler von 5 % OR (mit einem Konfidenzintervall von 95 ± 5 %).

Was folgt daraus? Bei der Durchführung von 100 Studien mit einer solchen Stichprobe (384 Personen) liegen die erhaltenen Antworten in 95 Prozent der Fälle nach den Gesetzen der Statistik innerhalb von ± 5% des Originals. Und wir erhalten eine repräsentative Stichprobe mit einer minimalen Wahrscheinlichkeit eines statistischen Fehlers.

Nachdem die Berechnung der Stichprobengröße abgeschlossen ist, können Sie in der Demoversion des Fragebogen-Panels sehen, ob genügend Befragte vorhanden sind. Erfahren Sie mehr darüber, wie Sie eine Panel-Umfrage durchführen.

Portal für den Studenten. Selbsttraining