Selektive Beobachtung: Konzept, Typen, Stichprobenfehler, Bewertung der Ergebnisse. Beispiele für Problemlösungen

Bei der punktuellen Beobachtung sollte darauf geachtet werden Unfall Auswahl der Einheit. Jede Einheit muss die gleichen Chancen haben, mit den anderen ausgewählt zu werden. Darauf basiert die Zufallsstichprobe.

ZU richtige Zufallsstichprobe bezieht sich auf die Auswahl von Einheiten aus der Gesamtbevölkerung (ohne vorherige Aufteilung in irgendwelche Gruppen) durch Auslosung (hauptsächlich) oder eine andere ähnliche Methode, beispielsweise unter Verwendung einer Tabelle mit Zufallszahlen. Zufällige Auswahl Diese Auswahl ist nicht zufällig. Das Zufallsprinzip legt nahe, dass die Aufnahme oder der Ausschluss eines Objekts aus der Stichprobe durch keinen anderen Faktor als den Zufall beeinflusst werden kann. Ein Beispiel eigentlich zufällig Die Auswahl kann als Gewinnumlauf dienen: Aus der Gesamtzahl der ausgegebenen Lose wird ein bestimmter Teil der Zahlen, die den Gewinn ausmachen, zufällig ausgewählt. Darüber hinaus haben alle Zahlen die gleichen Chancen, in die Stichprobe aufgenommen zu werden. In diesem Fall wird die Anzahl der im Stichprobensatz ausgewählten Einheiten normalerweise anhand des akzeptierten Anteils der Stichprobe bestimmt.

Beispielfreigabe ist das Verhältnis der Anzahl der Einheiten der Stichprobenpopulation zur Anzahl der Einheiten der Gesamtbevölkerung:

Also mit einer 5 %-Stichprobe aus einer Teilecharge von 1000 Einheiten. Stichprobengröße P beträgt 50 Einheiten und bei einer 10 %-Stichprobe 100 Einheiten. usw. Mit der richtigen wissenschaftlichen Organisation der Probenahme können Repräsentativitätsfehler auf minimale Werte reduziert werden, wodurch die selektive Beobachtung ausreichend genau wird.

Die richtige Zufallsauswahl „in ihrer reinen Form“ wird in der Praxis der selektiven Beobachtung selten angewendet, ist aber der Ausgangspunkt aller anderen Auswahlarten, sie enthält und implementiert die Grundprinzipien der selektiven Beobachtung.

Betrachten wir einige Fragen der Theorie des Stichprobenverfahrens und der Fehlerformel für eine einfache Zufallsstichprobe.

Bei der Anwendung der Stichprobenmethode in der Statistik werden üblicherweise zwei Haupttypen verallgemeinernder Indikatoren verwendet: der Durchschnittswert eines quantitativen Merkmals Und der relative Wert des alternativen Merkmals(der Anteil oder Anteil von Einheiten in der statistischen Grundgesamtheit, die sich von allen anderen Einheiten dieser Grundgesamtheit nur durch das Vorhandensein des untersuchten Merkmals unterscheiden).

Beispielfreigabe (w), oder Häufigkeit, wird durch das Verhältnis der Anzahl der Einheiten bestimmt, die das untersuchte Merkmal aufweisen T, zur Gesamtzahl der Stichprobeneinheiten P:

Wenn beispielsweise von 100 Probendetails ( N=100), erwiesen sich 95 Teile als Standard (T=95), dann die Probenfraktion

w=95/100=0,95 .

Um die Zuverlässigkeit von Stichprobenindikatoren zu charakterisieren, gibt es Mitte Und marginaler Stichprobenfehler.

Stichprobenfehler ? oder mit anderen Worten, der Repräsentativitätsfehler ist die Differenz zwischen der entsprechenden Stichprobe und den allgemeinen Merkmalen:

*

*

Stichprobenfehler sind nur für selektive Beobachtungen charakteristisch. Je größer der Wert dieses Fehlers ist, desto stärker weichen die Stichprobenindikatoren von den entsprechenden allgemeinen Indikatoren ab.

Der Stichprobenmittelwert und der Stichprobenanteil sind inhärent zufällige Variablen, die je nachdem, welche Bevölkerungseinheiten in die Stichprobe einbezogen wurden, unterschiedliche Werte annehmen können. Daher sind Stichprobenfehler ebenfalls Zufallsvariablen und können unterschiedliche Werte annehmen. Bestimmen Sie daher den Durchschnitt der möglichen Fehler – den durchschnittlichen Stichprobenfehler.

Wovon hängt es ab mittlerer Stichprobenfehler? Nach dem Prinzip der Zufallsauswahl wird in erster Linie der durchschnittliche Stichprobenfehler ermittelt Stichprobengröße: Je größer die Grundgesamtheit ist, desto geringer ist ceteris paribus der durchschnittliche Stichprobenfehler. Indem wir eine Stichprobenerhebung mit einer zunehmenden Anzahl von Einheiten der Allgemeinbevölkerung abdecken, charakterisieren wir die gesamte Bevölkerung immer genauer.

Der mittlere Stichprobenfehler hängt auch davon ab Grad der Variation untersuchtes Merkmal. Wie Sie wissen, ist der Grad der Variation durch Streuung gekennzeichnet? 2 oder w(1-w)-- für eine alternative Funktion. Je kleiner die Variation des Merkmals und damit die Varianz ist, desto kleiner ist der durchschnittliche Stichprobenfehler und umgekehrt. Bei einer Streuung von Null (das Attribut variiert nicht) ist der durchschnittliche Stichprobenfehler Null, d. h. jede Einheit der Gesamtbevölkerung wird die gesamte Bevölkerung anhand dieses Attributs genau charakterisieren.

Die Abhängigkeit des durchschnittlichen Stichprobenfehlers von seinem Volumen und dem Variationsgrad des Attributs spiegelt sich in den Formeln wider, mit denen der durchschnittliche Stichprobenfehler unter Bedingungen der Stichprobenbeobachtung berechnet werden kann, wenn die allgemeinen Merkmale ( x, p) sind unbekannt und daher ist es nicht möglich, den tatsächlichen Stichprobenfehler direkt aus den Formeln (Form. 1), (Form. 2) zu ermitteln.

W Mit zufälliger Auswahl durchschnittliche Fehler theoretisch nach folgenden Formeln berechnet:

* für das durchschnittliche quantitative Merkmal

* für Anteil (alternatives Merkmal)

Da praktisch die Varianz des Attributs in der Allgemeinbevölkerung? 2 ist nicht genau bekannt, in der Praxis verwenden sie den Wert der Varianz S 2, der für die Stichprobenpopulation auf der Grundlage des Gesetzes der großen Zahlen berechnet wird, wonach die Stichprobenpopulation mit einer ausreichend großen Stichprobengröße die Merkmale der Stichprobe genau wiedergibt Durchschnittsbevölkerung.

Auf diese Weise, Berechnungsformeln Mitte Stichprobenfehler Das zufällige Resampling sieht wie folgt aus:

* für das durchschnittliche quantitative Merkmal

* für Anteil (alternatives Merkmal)

Allerdings ist die Varianz der Stichprobenpopulation nicht gleich der Varianz der Gesamtbevölkerung, und daher sind die mit den Formeln (Formular 5) und (Formular 6) berechneten durchschnittlichen Stichprobenfehler Näherungswerte. In der Wahrscheinlichkeitstheorie ist jedoch bewiesen, dass die allgemeine Varianz durch das Wahlfach durch die folgende Beziehung ausgedrückt wird:

Als P/(N-1) für ausreichend groß P -- Wert nahe eins, kann davon ausgegangen werden, dass und daher in praktischen Berechnungen der durchschnittlichen Stichprobenfehler die Formeln (Form. 5) und (Form. 6) verwendet werden können. Und nur bei einer kleinen Stichprobe (wenn die Stichprobengröße 30 nicht überschreitet) muss der Koeffizient berücksichtigt werden P/(N-1) und berechnen kleiner mittlerer Stichprobenfehler nach der Formel:

W X Mit zufälliger, sich nicht wiederholender Auswahl In den obigen Formeln zur Berechnung der durchschnittlichen Stichprobenfehler ist es notwendig, den Wurzelausdruck mit 1-(n / N) zu multiplizieren, da die Anzahl der Einheiten in der Gesamtbevölkerung im Prozess der nicht wiederholten Stichprobe reduziert wird. Daher für eine sich nicht wiederholende Auswahl Berechnungsformeln mittlerer Stichprobenfehler wird folgende Form annehmen:

* für das durchschnittliche quantitative Merkmal

* für Anteil (alternatives Merkmal)

. (Formular 10)

Als P immer weniger N, dann der zusätzliche Faktor 1-( n/n) wird immer kleiner als eins sein. Daraus folgt, dass der durchschnittliche Fehler bei nicht wiederholter Auswahl immer geringer sein wird als bei wiederholter Auswahl. Gleichzeitig liegt dieser Faktor bei einem relativ kleinen Prozentsatz der Stichprobe nahe bei eins (z. B. bei einer 5 %-Stichprobe beträgt er 0,95; bei einer 2 %-Stichprobe beträgt er 0,98 usw.). Daher werden in der Praxis manchmal Formeln (Formulare 5) und (Formulare 6) verwendet, um den durchschnittlichen Stichprobenfehler ohne den angegebenen Multiplikator zu bestimmen, obwohl die Stichprobe als nicht wiederholte Stichprobe organisiert ist. Dies geschieht, wenn die Anzahl der Einheiten der Gesamtbevölkerung N unbekannt oder unbegrenzt ist oder wenn P sehr wenig im Vergleich zu N und im Wesentlichen hat die Einführung eines zusätzlichen Faktors, dessen Wert nahe bei eins liegt, praktisch keinen Einfluss auf den Wert des durchschnittlichen Stichprobenfehlers.

Mechanische Probenahme besteht darin, dass die Auswahl der Einheiten der Stichprobe aus der allgemeinen, nach einem neutralen Kriterium in gleiche Intervalle (Gruppen) unterteilten Einheit so erfolgt, dass aus jeder dieser Gruppen der Stichprobe nur eine Einheit ausgewählt wird. Um systematische Fehler zu vermeiden, sollte die Einheit ausgewählt werden, die sich in der Mitte jeder Gruppe befindet.

Bei der Organisation der mechanischen Auswahl werden die Bevölkerungseinheiten (normalerweise in einer Liste) in einer bestimmten Reihenfolge (z. B. alphabetisch, nach Standort, in aufsteigender oder absteigender Reihenfolge der Werte aller nicht zugeordneten Indikatoren) vorab angeordnet mit der zu untersuchenden Immobilie usw.). usw.), wonach in einem bestimmten Intervall mechanisch eine bestimmte Anzahl von Einheiten ausgewählt wird. In diesem Fall entspricht die Größe des Intervalls in der Gesamtbevölkerung dem Kehrwert des Stichprobenanteils. So wird bei einer 2 %-Stichprobe jede 50. Einheit (1:0,02) ausgewählt und überprüft, bei einer 5 %-Stichprobe jede 20. Einheit (1:0,05), beispielsweise absteigende Details von der Maschine.

Bei einer ausreichend großen Grundgesamtheit kommt die mechanische Selektion hinsichtlich der Genauigkeit der Ergebnisse nahezu dem Zufallsprinzip nahe. Um den durchschnittlichen Fehler einer mechanischen Probe zu bestimmen, werden daher die Formeln für die selbstzufällige, nicht wiederkehrende Probenahme verwendet (Formular 9), (Formular 10).

Um Einheiten aus einer heterogenen Population auszuwählen, werden die sogenannten typische Probe , Dies wird in Fällen verwendet, in denen alle Einheiten der Allgemeinbevölkerung entsprechend den Merkmalen, die die untersuchten Indikatoren beeinflussen, in mehrere qualitativ homogene, ähnliche Gruppen eingeteilt werden können.

Bei der Befragung von Unternehmen können solche Gruppen beispielsweise Branchen- und Teilsektor-Eigentumsformen sein. Anschließend erfolgt aus jeder typischen Gruppe eine individuelle Auswahl von Einheiten für die Stichprobe durch eine zufällige oder mechanische Stichprobe.

Eine typische Stichprobe wird normalerweise bei der Untersuchung komplexer statistischer Populationen verwendet. Beispielsweise wird in einer Stichprobenerhebung über die Familienbudgets von Arbeitnehmern und Angestellten in bestimmten Wirtschaftszweigen die Arbeitsproduktivität der Arbeitnehmer in einem Unternehmen, dargestellt durch einzelne Qualifikationsgruppen, ermittelt.

Eine typische Stichprobe liefert genauere Ergebnisse im Vergleich zu anderen Methoden zur Auswahl von Einheiten in einem Stichprobensatz. Die Typisierung der Allgemeinbevölkerung gewährleistet die Repräsentativität einer solchen Stichprobe, die Darstellung jeder darin enthaltenen typologischen Gruppe, wodurch der Einfluss der Streuung zwischen Gruppen auf den durchschnittlichen Stichprobenfehler ausgeschlossen werden kann.

Bei der Bestimmung durchschnittlicher Fehler einer typischen Stichprobe als Indikator für Variation gilt der Durchschnitt der gruppeninternen Varianzen.

Der mittlere Stichprobenfehler werden durch die Formeln gefunden:

* für das durchschnittliche quantitative Merkmal

(Wiederwahl); (Formular 11)

(irreversible Auswahl); (Formular 12)

* für Anteil (alternatives Merkmal)

(Wiederwahl); (Formular 13)

(nicht wiederkehrende Auswahl), (Form. 14)

Wo ist der Durchschnitt der gruppeninternen Varianzen für die Stichprobenpopulation?

Der Durchschnitt der gruppeninternen Varianzen des Anteils (alternatives Merkmal) in der Stichprobenpopulation.

Serienbemusterung Dabei handelt es sich um eine zufällige Auswahl nicht einzelner Einheiten, sondern gleicher Gruppen (Nester, Reihen) aus der Gesamtbevölkerung, um ausnahmslos alle Einheiten in solchen Gruppen der Beobachtung zu unterziehen.

Der Einsatz der Serienbemusterung ist darauf zurückzuführen, dass viele Güter für den Transport, die Lagerung und den Verkauf in Paketen, Kartons usw. verpackt sind. Daher ist es bei der Kontrolle der Qualität verpackter Waren sinnvoller, mehrere Verpackungen (Serien) zu prüfen, als aus allen Verpackungen die erforderliche Warenmenge auszuwählen.

Da innerhalb von Gruppen (Reihen) ausnahmslos alle Einheiten untersucht werden, hängt der durchschnittliche Stichprobenfehler (bei Auswahl gleicher Reihen) nur von der Intergruppen-(Interreihen-)Varianz ab.

W Der mittlere Stichprobenfehler für die mittlere Punktzahl Bei der Serienauswahl werden sie anhand der Formeln ermittelt:

(Wiederwahl); (Formular 15)

(nicht wiederkehrende Auswahl), (Form. 16)

Wo R- Anzahl der ausgewählten Serien; R- Gesamtzahl der Episoden.

Die Intergruppenvarianz der Reihenstichprobe wird wie folgt berechnet:

Wo ist der Durchschnitt? ich- Serie; - der allgemeine Durchschnitt für die gesamte Stichprobenpopulation.

W Durchschnittlicher Stichprobenfehler für Anteil (alternative Funktion) in der Serienauswahl:

(Wiederwahl); (Formular 17)

(nicht wiederkehrende Auswahl). (Formular 18)

Intergruppe(serienübergreifend) Varianz des seriellen Stichprobenanteils bestimmt durch die Formel:

, (Form. 19)

Wo ist der Anteil des Features? ich Serie; – der Gesamtanteil des Merkmals in der gesamten Stichprobe.

In der Praxis statistischer Erhebungen kommt neben den bisher betrachteten Auswahlmethoden auch deren Kombination zum Einsatz (kombinierte Auswahl).

Das Konzept und die Berechnung des Stichprobenfehlers.

Die Aufgabe der selektiven Beobachtung besteht darin, anhand eines Teils der beobachteten Personen korrekte Vorstellungen über die Gesamtindikatoren der Gesamtbevölkerung zu gewinnen. Als mögliche Abweichung des Stichprobenanteils und des Stichprobenmittelwerts vom Anteil und Mittelwert in der Gesamtbevölkerung wird bezeichnet Stichprobenfehler oder Repräsentativitätsfehler. Je größer der Wert dieses Fehlers ist, desto stärker weichen die Indikatoren der Stichprobenbeobachtung von denen der Gesamtbevölkerung ab.

Abweichen:

Stichprobenfehler;

Registrierungsfehler.

Registrierungsfehler treten auf, wenn im Verlauf der Beobachtung eine Tatsache falsch festgestellt wird. Sie sind sowohl für die kontinuierliche Beobachtung als auch für die selektive Beobachtung charakteristisch, bei der selektiven Beobachtung sind sie jedoch weniger ausgeprägt.

Die Art des Fehlers ist:

Tendenziell – absichtlich, d.h. Es wurden entweder die besten oder die schlechtesten Einheiten der Bevölkerung ausgewählt. In diesem Fall verlieren die Beobachtungen ihre Bedeutung;

Zufällig – das wichtigste Organisationsprinzip der selektiven Beobachtung besteht darin, eine bewusste Auswahl zu verhindern, d.h. achten auf die strikte Einhaltung des Zufallsprinzips.

Allgemeine Regel der Zufallsauswahl ist: Einzelne Einheiten der Gesamtbevölkerung müssen genau die gleichen Bedingungen und Möglichkeiten haben, in die Anzahl der in die Stichprobe einbezogenen Einheiten zu fallen. Dies kennzeichnet die Unabhängigkeit des Probenergebnisses vom Willen des Beobachters. Der Wille des Beobachters erzeugt tendenziöse Fehler. Der Stichprobenfehler bei der Zufallsauswahl ist zufällig. Es charakterisiert die Größe der Abweichungen der allgemeinen Merkmale von den Stichprobenmerkmalen.

Aufgrund der Tatsache, dass die Merkmale in der untersuchten Population variieren, stimmt die Zusammensetzung der Einheiten in der Stichprobe möglicherweise nicht mit der Zusammensetzung der Einheiten der gesamten Population überein. Das bedeutet es R und stimmen nicht mit überein W Und . Die mögliche Abweichung zwischen diesen Merkmalen wird durch den Stichprobenfehler bestimmt, der durch die Formel bestimmt wird:

Wo ist die allgemeine Varianz?

Wo ist die Stichprobenvarianz?

Dies zeigt, wo sich die allgemeine Varianz zeitlich von der Stichprobenvarianz unterscheidet.

Es gibt wiederholte und nicht wiederholte Auswahl. Der Kern der Neuauswahl besteht darin, dass jede Einheit in der Stichprobe nach der Beobachtung zur Gesamtbevölkerung zurückkehrt und erneut untersucht werden kann. Beim Resampling wird der durchschnittliche Stichprobenfehler berechnet:

Für den Indikator des Anteils eines alternativen Attributs wird die Stichprobenvarianz durch die Formel bestimmt:

In der Praxis wird die Neuauswahl selten angewendet. Bei nicht-repetitiver Selektion die Größe der Gesamtbevölkerung N während der Stichprobe abnimmt, lautet die Formel für den durchschnittlichen Stichprobenfehler für ein quantitatives Attribut:



Einer der möglichen Werte, in denen der Anteil des untersuchten Merkmals liegen kann, ist gleich:

Wo ist der Stichprobenfehler des alternativen Merkmals?

Beispiel.

Bei einer Stichprobenerhebung von 10 % der Produkte einer Fertigwarencharge nach der Methode ohne Neuselektion wurden folgende Daten zum Feuchtigkeitsgehalt in den Proben gewonnen.

Bestimmen Sie die durchschnittliche Feuchtigkeit %, Varianz, Standardabweichung, mit einer Wahrscheinlichkeit von 0,954, die möglichen Grenzen, in denen der Durchschnitt erwartet wird. % Feuchtigkeitsgehalt aller Fertigprodukte, mit einer Wahrscheinlichkeit von 0,987, die möglichen Grenzen des spezifischen Gewichts von Standardprodukten, vorausgesetzt, dass Produkte mit einem Feuchtigkeitsgehalt von bis zu 13 und über 19 % zu einer nicht standardmäßigen Charge gehören.

Nur mit einer gewissen Wahrscheinlichkeit kann argumentiert werden, dass der allgemeine Anteil des Stichprobenanteils und der allgemeine Durchschnitt des Stichprobenmittelwerts voneinander abweichen T einmal.

In der Statistik nennt man diese Abweichungen geringfügige Stichprobenfehler und sind gekennzeichnet.

Die Wahrscheinlichkeit von Urteilen kann erhöht oder verringert werden T einmal. Mit einer Wahrscheinlichkeit von 0,683, mit 0,954, mit 0,987 werden dann die Indikatoren der Allgemeinbevölkerung entsprechend den Indikatoren der Stichprobe ermittelt:

Durchschnittlicher Stichprobenfehler ist in Stichprobenstudien immer vorhanden und erscheint aufgrund der Tatsache, dass nicht alle Einheiten der statistischen Grundgesamtheit befragt werden, sondern nur ein Teil davon.

Der mittlere Stichprobenfehler wird marginaler Fehler Δ wenn mit dem Konfidenzfaktor multipliziert T , die anhand der erforderlichen Beobachtungsgenauigkeit voreingestellt wird. Mithilfe des Grenzfehlers können Sie mit einer gewissen Wahrscheinlichkeit die „wahre“ Größe des Parameters in der Gesamtbevölkerung beurteilen

Für typische und serielle Auswahl, wenn der Stichprobenfehler anstelle der Gesamtvarianz berechnet wird 2 ) Verwenden Sie den Mittelwert der Varianzen innerhalb der Gruppe und der Varianz zwischen den Gruppen
, Wo
- private Varianz der Gruppe i, Band I Gruppe

Formeln für den Grenzfehler einer Zufallsstichprobe bei der Ermittlung des Durchschnitts

Zur Neuauswahl

Formeln für den Grenzfehler einer Zufallsstichprobe bei der Ermittlung des Anteils

Zur Neuauswahl

Zur einmaligen Auswahl

Formeln für die Größe einer Zufallsstichprobe bei der Ermittlung des Durchschnittswerts

Formeln für die Anzahl der Zufallsstichproben zur Bestimmung des Anteils des untersuchten Merkmals

Der marginale Unterschied zwischen dem allgemeinen Mittel und dem Stichprobenmittel entspricht dem marginalen Fehler

Wahrscheinlichkeitswerte bzw T stehen in den Verteilungstabellen:

  • Student (bei einer kleinen Stichprobe)

Zufallsstichprobenformeln eignen sich auch für die mechanische Probenahme.

Wenn eine Rundung erforderlich ist, bei Zufallsstichproben – Aufrunden, bei mechanischen Stichproben – Abrunden.

Kleine Probe

Wenn die Stichprobengröße nicht mehr als 30 Einheiten beträgt, wird der durchschnittliche Fehler einer kleinen Stichprobe bei der Bestimmung des Durchschnittswerts nach folgender Formel berechnet:

Um den Fehler einer kleinen Stichprobe zu berechnen, wird die verfeinerte Varianzformel verwendet

Arten von Probenahmeaufgaben

    Definition des Stichprobenfehlers,

    Bestimmung der Stichprobengröße N ,

    Bestimmung der Wahrscheinlichkeit, dass der Stichprobenmittelwert (oder Anteil) vom allgemeinen Mittelwert (oder Anteil) um nicht mehr als einen bestimmten Betrag abweicht t=Δ/μ,

    Einschätzung der Zufälligkeit von Abweichungen bei den Indikatoren von Stichprobenbeobachtungen,

    Übertragung von Stichprobenmerkmalen auf die Allgemeinbevölkerung.

Testen von Mittelwert- und Proportionshypothesen

Schätzung der Zufälligkeit von Abweichungen bei den Indikatoren von Stichprobenbeobachtungen


Methoden zur Übertragung von Stichprobendaten an die Allgemeinbevölkerung

    Wiegemethode;

    Nachwiegemethode;

    Methode zum Auffüllen durch Zufallsauswahl in Ersatzklassen.

marginaler Fehler- die maximal mögliche Abweichung zwischen den Mittelwerten oder der maximale Fehler bei einer gegebenen Eintrittswahrscheinlichkeit.

1. Der marginale Stichprobenfehler für den Durchschnitt bei wiederholter Auswahl wird nach folgender Formel berechnet:

wobei t – normalisierte Abweichung – „Konfidenzfaktor“ ist, der von der Wahrscheinlichkeit abhängt, die den marginalen Stichprobenfehler garantiert;

mu x ist der mittlere Stichprobenfehler.

2. Geringfügiger Stichprobenfehler für den Anteil wenn die Neuauswahl durch die Formel bestimmt wird:

3. Der marginale Stichprobenfehler für den Mittelwert bei nicht wiederholter Auswahl:

Begrenzen Sie den relativen Fehler Die Stichprobe ist definiert als das prozentuale Verhältnis des marginalen Stichprobenfehlers zum entsprechenden Merkmal der Stichprobenpopulation. Es ist wie folgt definiert:

Kleine Probe

Die Theorie der kleinen Stichproben wurde entwickelt Englischer Statistiker-Student zu Beginn des 20. Jahrhunderts. 1908 entdeckte er eine spezielle Verteilung, die es ermöglicht, auch bei kleinen Stichproben einen Zusammenhang zwischen t und der Konfidenzwahrscheinlichkeit F(t) herzustellen. Für n größer als 100 liefern sie die gleichen Ergebnisse wie die Tabellen des Laplace-Wahrscheinlichkeitsintegrals für 30< n < 100 различия получаются незначительные. Поэтому на практике к малым выборкам относятся выборки объемом менее 30 единиц.

Bekanntlich gibt es in der Statistik je nach Vollständigkeit der Objektabdeckung zwei Möglichkeiten, Massenphänomene zu beobachten: kontinuierlich und nicht kontinuierlich. Eine Variante der diskontinuierlichen Beobachtung ist die selektive Beobachtung.

Unter selektive Beobachtung Unter einer nicht kontinuierlichen Beobachtung versteht man eine nicht kontinuierliche Beobachtung, bei der zufällig ausgewählte Einheiten der untersuchten Population einer statistischen Untersuchung (Beobachtung) unterzogen werden.

Die selektive Beobachtung stellt sich die Aufgabe, die gesamte Einheitenpopulation für den untersuchten Teil zu charakterisieren, unter Beachtung aller Regeln und Grundsätze der statistischen Beobachtung und einer wissenschaftlich organisierten Arbeit zur Einheitenauswahl.

Üblicherweise wird die Menge der für die Erhebung in der Statistik ausgewählten Einheiten aufgerufen Stichprobenpopulation , und die Menge der Einheiten, aus denen die Auswahl getroffen wird, wird aufgerufen Durchschnittsbevölkerung . Die Hauptmerkmale der Allgemein- und Stichprobenpopulation sind in Tabelle 1 dargestellt.

Tabelle 1 - Die Hauptmerkmale der Allgemein- und Stichprobenbevölkerung
IndexBezeichnung oder Formel
Bevölkerung Stichprobenpopulation
Anzahl der Einheiten N N
Die Anzahl der Einheiten, die über eine Funktion verfügen M M
Anteil der Einheiten mit dieser Funktion p = M/N ω = m/n
Anteil der Einheiten, die diese Funktion nicht haben q = 1 - p 1 - w
Durchschnittswert Zeichen
Streuung Zeichen
Streuung eines Alternativmerkmals (Streuung eines Anteils) pq ω (1 - ω)

Bei der selektiven Beobachtung treten systematische und zufällige Fehler auf. Systematische Fehler entstehen durch Verstöße gegen die Regeln zur Auswahl von Einheiten in der Stichprobe. Durch eine Änderung der Auswahlregeln können solche Fehler behoben werden.

Aufgrund des diskontinuierlichen Charakters der Umfrage kommt es zu zufälligen Fehlern. Andernfalls spricht man von Repräsentativitätsfehlern (Repräsentativitätsfehlern). Zufällige Fehler werden in durchschnittliche und marginale Stichprobenfehler unterteilt, die sowohl bei der Berechnung des Merkmals als auch bei der Berechnung des Anteils ermittelt werden.

Die Durchschnitts- und Grenzfehler hängen durch die folgende Beziehung zusammen :Δ = tμ, wobei Δ der marginale Stichprobenfehler ist, μ der durchschnittliche Stichprobenfehler ist, t der Vertrauensfaktor ist, der in Abhängigkeit vom Wahrscheinlichkeitsgrad bestimmt wird. Tabelle 2 zeigt einige Werte von t aus der Wahrscheinlichkeitstheorie.

Der Wert des durchschnittlichen Stichprobenfehlers wird je nach Auswahlmethode und Stichprobenverfahren differenziell berechnet. Die wichtigsten Formeln zur Berechnung von Stichprobenfehlern sind in Tabelle 3 aufgeführt.

Tisch 3 - Grundlegende Formeln zur Berechnung von Stichprobenfehlern bei wiederholter und nicht wiederholter Auswahl
IndexBezeichnung und Formel
Bevölkerung Stichprobenpopulation
Mittlerer Feature-Fehler für zufälliges Resampling
Mittlerer Anteilsfehler für zufälliges Resampling
Begrenzen Sie den Fehler einer Funktion im Falle einer zufälligen Neuauswahl
Geringfügiger Anteilsfehler bei zufälliger Neuauswahl
Durchschnittlicher Fehler eines Features bei zufälliger, sich nicht wiederholender Auswahl
Mittlerer Anteilsfehler bei zufälliger, sich nicht wiederholender Auswahl
Begrenzen Sie den Fehler eines Features durch zufällige, sich nicht wiederholende Auswahl
Geringfügiger Anteilsfehler für zufällige, sich nicht wiederholende Auswahl

Durch die Berechnung der durchschnittlichen und marginalen Stichprobenfehler können Sie die möglichen Grenzen bestimmen, in denen die Merkmale der Gesamtbevölkerung liegen .

Für einen Stichprobenmittelwert werden solche Grenzwerte beispielsweise auf der Grundlage der folgenden Beziehungen festgelegt:

Grenzen des Anteils des Merkmals in der Gesamtbevölkerung p.

Beispiele zur Lösung von Problemen zum Thema „Stichprobenbeobachtung in der Statistik“

Aufgabe 1 . Es liegen Informationen über die Produktion von Produkten (Bauarbeiten, Dienstleistungen) vor, die auf der Grundlage einer 10 %-Stichprobenbeobachtung von Unternehmen in der Region gewonnen wurden:

Bestimmen Sie: 1) für die in die Stichprobe einbezogenen Unternehmen: a) die durchschnittliche Produktionsgröße pro Unternehmen; b) Streuung des Produktionsvolumens; c) der Anteil der Unternehmen mit einem Produktionsvolumen von mehr als 400.000 Rubel; 2) für die gesamte Region mit einer Wahrscheinlichkeit von 0,954 die Grenzen, innerhalb derer man erwarten kann: a) das durchschnittliche Produktionsvolumen pro Unternehmen; b) der Anteil der Unternehmen mit einem Produktionsvolumen von mehr als 400.000 Rubel; 3) das Gesamtproduktionsvolumen in der Region.

Lösung

Um das Problem zu lösen, erweitern wir die vorgeschlagene Tabelle.

1) Für die in die Stichprobe einbezogenen Unternehmen die durchschnittliche Produktionsgröße pro Unternehmen

110800/400 = 277 Tausend Rubel

Wir berechnen vereinfacht die Streuung des Produktionsvolumens σ 2 = 35640000/400 - 277 2 = 89100 - 76229 = 12371.

Die Anzahl der Unternehmen, deren Produktionsvolumen 400.000 Rubel übersteigt. beträgt 36+12 = 48, und ihr Anteil beträgt ω = 48:400 = 0,12 = 12 %.

2) Aus der Wahrscheinlichkeitstheorie ist bekannt, dass bei einer Wahrscheinlichkeit P=0,954 der Konfidenzfaktor t=2 ist. Geringfügiger Stichprobenfehler

2√12371:400 = 11,12 Tausend Rubel

Legen wir die Grenzen des allgemeinen Durchschnitts fest: 277-11,12 ≤Xav ≤ 277+11,12; 265,88 ≤Xav ≤ 288,12

Grenzstichprobenfehler des Anteils der Unternehmen

2√0,12*0,88/400 = 0,03

Definieren wir die Grenzen des allgemeinen Anteils: 0,12-0,03≤ p ≤0,12+0,03; 0,09 ≤ p ≤ 0,15

3) Da die betrachtete Unternehmensgruppe 10 % der Gesamtzahl der Unternehmen in der Region ausmacht, gibt es in der gesamten Region 4.000 Unternehmen. Dann liegt das Gesamtproduktionsvolumen in der Region innerhalb von 265,88×4000≤Q≤288,12×4000; 1063520 ≤ Q ≤ 1152480

Aufgabe 2 . Nach den Ergebnissen einer Kontrollprüfung der Steuerbehörden bei 400 Unternehmensstrukturen geben 140 von ihnen in ihrer Steuererklärung die steuerpflichtigen Einkünfte nicht vollständig an. Bestimmen Sie in der Gesamtbevölkerung (für die gesamte Region) den Anteil der Unternehmensstrukturen, die einen Teil ihrer Steuereinnahmen mit einer Wahrscheinlichkeit von 0,954 versteckt haben.

Lösung

Gemäß der Bedingung des Problems beträgt die Anzahl der Einheiten in der Stichprobenpopulation n=400, die Anzahl der Einheiten mit dem betrachteten Merkmal beträgt m=140, die Wahrscheinlichkeit beträgt P=0,954.

Aus der Wahrscheinlichkeitstheorie ist bekannt, dass bei der Wahrscheinlichkeit P=0,954 der Konfidenzfaktor t=2 ist.

Der Anteil der Einheiten, die das angegebene Attribut aufweisen, wird durch die Formel p=w+∆p bestimmt, wobei w = m/n=140/400=0,35=35 %,
und der Grenzfehler des Merkmals ∆p wird aus der Formel erhalten: ∆p= t √w(1-w)/n = 2√0,35×0,65/400 ≈ 0,5 = 5 %

Dann ist p = 35 ± 5 %.

Antworten : Der Anteil der Unternehmensstrukturen, die mit einer Wahrscheinlichkeit von 0,954 einen Teil ihres Einkommens vor Steuern versteckt haben, beträgt 35 ± 5 %.