Die Variationsreihe wird aufgerufen. Definiere eine Variationsreihe

Variationsreihen, ihre Elemente.

Ein Forscher, der sich für die Tarifkategorie der mechanischen Arbeiter interessiert
Shop, führte eine Umfrage unter 100 Arbeitnehmern durch. Suchen Sie die beobachteten Werte
Preis-Naka in aufsteigender Reihenfolge. Diese Operation wird Ranking genannt
tistische Daten. Als Ergebnis erhalten wir die folgende Reihe, die aufruft-
Xia Rang:

1,1,..1, 2,2..2, 3,3,..3, 4,4,..4, 5,5,..5, 6,6,..6.

Aus der Rangfolge folgt, dass das untersuchte Merkmal (Tarif
Ziffer) nahm sechs verschiedene Werte an: 1, 2, 3, 4, 5 und 6.

Des Weiteren verschiedene Bedeutungen Preis-Naka wird aufgerufen Möglichkeit-
mi,
und unter Variante - Verstehen Sie die Änderung der Werte des Attributs.

Abhängig von den Werten, die das Vorzeichen einnimmt, werden die Vorzeichen geteilt
auf der diskret variierend und kontinuierlich variierend.

Die Tarifstufe ist ein diskret variierendes Merkmal. Anzahl, Impressionen-
wie oft die Variante x in einer Reihe von Beobachtungen vorkommt, heißt Stunde-
Spielzeug
Möglichkeit m x .

Anstelle der Häufigkeit der Variante x kann man ihre Beziehung zum Allgemeinen betrachten
Anzahl Beobachtungen n, Was heisst häufig Variante und ihre Beziehung Bezeichnung-beginnt w x .

w x =m x /n=m x /åm x

Eine Tabelle, mit der Sie die Verteilung von Häufigkeiten (oder Häufigkeiten) zwischen Optionen beurteilen können, wird aufgerufen diskrete Variationsreihe.

Zusammen mit dem Konzept der Frequenz wird das Konzept verwendet akkumulierte Frequenz,
was bezeichnet wird t x gem. Die kumulierte Stunde zeigt, wie viele
Beobachtungen nahm das Vorzeichen Werte an, die kleiner als der angegebene Wert x waren. Relativ
akkumulierte Frequenz zu Gesamtzahl Es werden n Beobachtungen aufgerufen angesammelt-
Frequenz
und bezeichnen w x nac. Es ist klar, dass



w x nac =m x nac /n=m x nac /åm x .

Kumulierte Häufigkeiten (Häufigkeiten_ für eine diskrete Variationsreihe, berechnet in der folgenden Tabelle:

X mx m x nak w x nac
0+4=4 0,04
4+6=10 0,10
10+12=22 0,22
22+16=38 0,38
38+44=82 0,82
82+18=100 1,00
Über 6

Gegeben sei die Ausbringung pro Arbeiter – ein Maschinenbediener einer mechanischen Werkstatt im Berichtsjahr in Prozent vorheriges Jahr. Dabei ist das untersuchte Merkmal x der Output im Berichtsjahr in Prozent des Vorjahres. Dies ist ein sich ständig änderndes Zeichen. Zu identifizieren Charakteristische Eigenschaften Variationen in den Werten des Attributs werden zu Gruppen von Arbeitern zusammengefasst, deren Output innerhalb von 10 % variiert. Wir präsentieren die gruppierten Daten in der Tabelle:

Forschung Merkmal x Anzahl der Arbeiter m Anteil der Arbeiter w Angesammelt Frequenz m x gem w x nac
80-90 8/117 8/117
90-100 15/117 8+15=23 23/117
100-110 46/117 23+46=69 69/117
110-120 29/117 69+29=98 98/117
120-130 13/117 98+13=111 111/117
130-140 3/117 111+3=114 114/117
140-150 3/117 114+3=117 117/117
å

In der Häufigkeitstabelle zeigt m an, wie viele Beobachtungen das Merkmal Werte angenommen hat, dazu gehören oder ein anderes Intervall. Diese Frequenz wird aufgerufen Intervall, und sein Verhältnis zur Gesamtzahl der Beobachtungen ist Intervallfrequenz w. Eine Tabelle, mit der Sie die Häufigkeitsverteilung zwischen den Variationsintervallen der Werte eines Merkmals beurteilen können, wird aufgerufen Reihe von Intervallvariationen.

Die Intervallvariationsreihe wird nach Beobachtungsdaten für aufgebaut
diskontinuierlich variierendes Merkmal sowie diskret variierendes, wenn
eine große Anzahl beobachteter Optionen. Eine diskrete Variationsreihe wird aufgebaut
nur für ein diskretes variables Merkmal

Manchmal wird die Intervallvariationsreihe bedingt durch eine diskrete ersetzt.
Dann wird der mittlere Wert des Intervalls als Option x genommen und dementsprechend
Intervallfrequenz - z t x.

Zur Bestimmung des optimalen konstanten Intervalls wird häufig h verwendet Sturgess-Formel:

h=(xmax – xmin)/(1+3,322*lg n).

Konstruktion der int.var.Reihe

Häufigkeiten m zeigen, wie viele Beobachtungen das Merkmal Werte angenommen hat, die zu einem bestimmten Intervall gehören. Eine solche Häufigkeit wird Intervallhäufigkeit genannt, und ihr Verhältnis zur Gesamtzahl der Beobachtungen ist die Intervallhäufigkeit w. Eine Tabelle, die es ermöglicht, die Verteilung von Häufigkeiten (oder Häufigkeiten) zwischen den Variationsintervallen in den Werten eines Merkmals zu beurteilen, wird als Intervallvariationsreihe bezeichnet.

Eine Intervallvariationsreihe wird anhand von Beobachtungsdaten für ein kontinuierlich variierendes Merkmal sowie für ein diskret variierendes Merkmal erstellt, wenn die Anzahl der beobachteten Varianten groß ist. Eine diskret variierende Reihe wird nur für ein diskret variierendes Merkmal erstellt.

Manchmal wird die Intervallvariationsreihe bedingt durch eine diskrete ersetzt. Dann wird der mittlere Wert des Intervalls als Variante x genommen und die entsprechende Intervallhäufigkeit wird als mx genommen

Um eine Intervallvariationsreihe zu konstruieren, ist es notwendig, den Wert des Intervalls zu bestimmen, set volle Skala Intervalle und gruppieren danach die Ergebnisse der Beobachtungen.

Zur Bestimmung des optimalen konstanten Intervalls h wird häufig die Sturgess-Formel verwendet:

h = (xmax – xmin) /(1+ 3,322 log n) .

wobei xmax xmin die maximale bzw. minimale Option sind. Wenn sich h als Ergebnis von Berechnungen als Bruchzahl herausstellt, sollte entweder die nächste ganze Zahl oder der nächste einfache Bruch als Wert des Intervalls genommen werden.

Es wird empfohlen, als Beginn des ersten Intervalls den Wert a1=xmin-h/2 anzunehmen; der Beginn des zweiten Intervalls fällt mit dem Ende des ersten zusammen und ist gleich a2 = a1 + h; der Beginn des dritten Intervalls fällt mit dem Ende des zweiten zusammen und ist gleich a3=a2 + h. Die Konstruktion von Intervallen wird fortgesetzt, bis der Beginn des nächsten Intervalls in der Reihenfolge nicht größer als xmax ist. Nach Festlegung der Intervallskala sollten die Ergebnisse der Beobachtungen gruppiert werden.

5) Konzept, Ausdrucksformen und Typen statistischer Indikatoren.

Statistik ist ein quantitatives Merkmal sozioökonomischer Phänomene und Prozesse im Sinne qualitativer Gewissheit. Die qualitative Sicherheit des Indikators liegt darin, dass er in direktem Zusammenhang steht interne Inhalte das zu untersuchende Phänomen oder der zu untersuchende Prozess, seine Essenz.

Statistisches Kennzahlensystem ist eine Reihe von miteinander verbundenen Indikatoren, die eine ein- oder mehrstufige Struktur haben und darauf abzielen, ein bestimmtes statistisches Problem zu lösen.

Im Gegensatz zu einem Zeichen wird ein statistischer Indikator durch Berechnung erhalten. Dies kann eine einfache Zählung von Bevölkerungseinheiten, die Summierung ihrer Attributwerte, ein Vergleich von 2 oder mehr Werten oder komplexere Berechnungen sein.

Es wird zwischen einem spezifischen statistischen Indikator und einer Indikatorkategorie unterschieden.

Spezifische Statistik charakterisiert die Größe, das Ausmaß des Phänomens oder Prozesses, der an einem bestimmten Ort und in untersucht wird gegebene Zeit. Allerdings hinein theoretische Arbeiten und in der Entwurfsphase der statistischen Beobachtung arbeiten sie auch mit absoluten Indikatoren oder Indikatoren-Kategorien.

Kategorieindikatoren spiegeln die Essenz, allgemein charakteristische Eigenschaften bestimmte statistische Indikatoren gleicher Art ohne Angabe von Ort, Zeit und Zahlenwert. Alle statistischen Indikatoren sind nach der Abdeckung der Bevölkerungseinheiten in individuell und frei und nach der Form in absolut, relativ und durchschnittlich unterteilt.

Individuelle Indikatoren charakterisieren ein separates Objekt oder eine separate Einheit der Bevölkerung - ein Unternehmen, eine Firma, eine Bank usw. Ein Beispiel ist die Anzahl des Industrie- und Produktionspersonals eines Unternehmens. Auf der Grundlage der Korrelation zweier absoluter Einzelindikatoren, die dasselbe Objekt oder dieselbe Einheit charakterisieren, wird ein individueller Relativindikator erhalten.

Zusammenfassende Indikatoren anders als einzelne charakterisieren sie eine Gruppe von Einheiten, die einen Teil der statistischen Grundgesamtheit oder die gesamte Grundgesamtheit darstellt. Diese Indikatoren sind in volumetrische und berechnete unterteilt.

Lautstärkeanzeigen werden durch Addieren der Werte des Attributs einzelner Bevölkerungseinheiten erhalten. Der resultierende Wert, der als Volumen des Attributs bezeichnet wird, kann als absoluter Volumenindikator dienen und mit einem anderen absoluten Volumenwert oder dem Volumen der Grundgesamtheit verglichen werden. In den letzten 2 Fällen werden volumetrische relative und volumetrische Mittelwerte erhalten.

Geschätzte Indikatoren, berechnet nach verschiedenen Formeln, dienen der individuellen Lösung Statistische Aufgaben Analyse - Messung der Variation, Merkmale struktureller Veränderungen, Bewertung der Beziehung usw. Sie werden auch in absolut, relativ oder durchschnittlich unterteilt.

Diese Gruppe umfasst Indizes, Näherungskoeffizienten, Stichprobenfehler und andere Indikatoren.

Der Erfassungsbereich von Bevölkerungseinheiten und die Form der Darstellung sind die wichtigsten, aber nicht die einzigen Klassifizierungsmerkmale statistischer Indikatoren. Wichtig Klassifikationsmerkmal ist auch ein Zeitfaktor. Sozioökonomische Prozesse und Phänomene spiegeln sich in statistischen Kennzahlen wider bzw. ab einen bestimmten Moment Zeit, normalerweise bestimmtes Datum, Anfang oder Ende eines Monats, Jahres oder bestimmten Zeitraum- Tag, Woche, Monat, Quartal, Jahr. Im ersten Fall sind die Indikatoren momentan, in dieser Sekunde - Intervall.

Je nach Zugehörigkeit zu einem oder zwei Studienobjekten gibt es einzelnes Objekt und Interobjektindikatoren. Wenn erstere nur einen Gegenstand charakterisieren, dann erhält man letztere durch Vergleich zweier Größen, die sich auf verschiedene Gegenstände beziehen.

Aus Sicht der räumlichen Sicherheit werden statistische Indikatoren unterteilt in allterritorial Charakterisierung des untersuchten Objekts oder Phänomens im ganzen Land, regional und lokal in Bezug auf einen Teil des Hoheitsgebiets oder ein separates Objekt.

6) Arten und Beziehung relativer Indikatoren.

Relativer Indikator ist das Ergebnis der Division eines absoluten Indikators durch einen anderen und drückt das Verhältnis zwischen diesen aus quantitative Merkmale sozioökonomische Prozesse und Phänomene. Daher in Bezug auf absolute Indikatoren relative Indikatoren oder Indikatoren im Formular relative Werte sind Derivate.

Bei der Berechnung eines relativen Indikators wird der absolute Indikator aufgerufen, der sich im Zähler des resultierenden Verhältnisses befindet aktuell oder vergleichbar. Der Indikator, mit dem verglichen wird und der im Nenner steht, wird als Basis oder Vergleichsbasis bezeichnet. Relative Indikatoren können als Prozentsätze, ppm, Verhältnisse ausgedrückt oder als Zahlen bezeichnet werden.

Alle in der Praxis verwendeten relativen Indikatoren sind unterteilt in:

Dynamik; planen; Umsetzung des Plans; Strukturen; Koordinierung; Intensität und Grad der Öko-Go-Entwicklung; Vergleiche.

Relativer Indikator der Dynamik pre-ist das Verhältnis des Niveaus des untersuchten Prozesses oder Phänomens für einen bestimmten Zeitraum zum Niveau desselben Prozesses oder Phänomens in der Vergangenheit.

OPD = aktueller Indikator / vorheriger. Oder Grundlinie.

Der so errechnete Wert zeigt, wie oft Aktuelles Level den vorherigen übersteigt oder welchen Anteil der letzte hat. Wenn dieser Indikator als multiples Verhältnis ausgedrückt wird, wird er aufgerufen Wachstumsfaktor, wenn dieser Koeffizient mit 100 % multipliziert wird, erhalten wir Wachstumsrate.

Relativer Strukturindex stellt das Verhältnis der strukturellen Teile des untersuchten Objekts und ihres Ganzen dar. Der relative Indikator der Struktur wird in Bruchteilen einer Einheit oder in Prozent ausgedrückt. Die errechneten Werte (d i), jeweils Anteile oder spezifisches Gewicht genannt, zeigen, welcher Anteil entweder hat oder welchen spezifisches Gewicht hat den i-ten Anteil an der Summe.

Relative Indikatoren der Koordination charakterisieren das Verhältnis einzelner Teile des Ganzen zueinander. Als Vergleichsbasis wird dabei der Teil gewählt, der den größten Anteil hat oder aus wirtschaftlicher, sozialer oder sonstiger Sicht vorrangig ist. Das Ergebnis ist, wie viele Einheiten jedes Strukturteils 1 Einheit des Grundstrukturteils ausmachen.

Relative Intensitätsanzeige charakterisiert den Grad der Verbreitung des untersuchten Prozesses oder Phänomens in seiner inhärenten Umgebung. Dieser Indikator wird wann berechnet absoluter Wert erweist sich als unzureichend, um vernünftige Schlussfolgerungen über das Ausmaß des Phänomens, seine Größe, Sättigung und Verteilungsdichte zu formulieren. Er kann in Prozent, ppm oder als benannter Wert ausgedrückt werden. Eine Vielzahl von relativen Intensitätsindikatoren sind relative Indikatoren für das Niveau der öko-th-Entwicklung, Charakterisierung der Pro-Kopf-Produktion und des Spielens wichtige Rolle bei der Beurteilung der Entwicklung der staatlichen Wirtschaft. In Bezug auf die Ausdrucksform liegen diese Indikatoren nahe an den Durchschnittsindikatoren, was häufig zu ihrer Verwirrung oder Identifizierung führt. Der Unterschied zwischen ihnen liegt nur darin, dass es sich bei der Berechnung des Durchschnitts um eine Menge von Einheiten handelt, von denen jede Träger eines Durchschnittsmerkmals ist.

Relativer Vergleichsindex ist das Verhältnis der absoluten Kennziffern gleichen Namens verschiedene Objekte(Unternehmen, Firmen, Regionen, Kreise etc.)

Variationsindikatoren

Das Studium der Variation (Änderung der Werte eines Merkmals innerhalb der Population) hat sehr wichtig in Statistik und Sozial- und Wirtschaftsforschung im Allgemeinen. Absolute und relative Variationsindikatoren, die die Schwankung der Werte eines variierenden Attributs charakterisieren, ermöglichen es insbesondere, den Grad der Verbindung und Beziehung zu messen, den Grad der Homogenität der Population, die Typizität und Stabilität zu beurteilen des Mittelwerts und um die Größe des möglichen Fehlers der Stichprobenbeobachtung zu bestimmen.

Zu den absoluten Schwankungsindikatoren gehört die Schwankungsbreite, der Durchschnitt lineare Abweichung, Varianz, Mittelwert Standardabweichung und vierteljährliche Abweichung.

Die Schwankungsbreite zeigt, wie stark sich der Wert eines quantitativ variierenden Merkmals ändert

R=xmax-xmin, wobei xmax(xmin) der maximale (minimale) Wert des Attributs im Aggregat (in der Verteilungsreihe) ist.

Die mittlere lineare Abweichung d ist definiert als Durchschnittswert aus den Abweichungen der Merkmalsoptionen vom Durchschnitt im ersten Grad, genommen durch das Modulo:

Die mittlere lineare Abweichung wird relativ selten verwendet, um die Variation eines Merkmals zu beurteilen. Typischerweise werden die Varianz und die Standardabweichung berechnet.

Wenn es notwendig ist, die Fluktuation mehrerer Merkmale in einem Satz oder das gleiche Merkmal in mehreren Sätzen mit zu vergleichen verschiedene Indikatoren Verteilungszentrum, dann verwenden Sie die relativen Variationsindikatoren.

Dazu gehören die folgenden Indikatoren:

1. Schwingungskoeffizient:

2. Relative lineare Abweichung:

3. Variationskoeffizient:

4. Relativer Indikator der Quartilsvariation:

Das am häufigsten verwendete Maß für die relative Variation ist der Variationskoeffizient. Dieser Indikator dient nicht nur der vergleichenden Bewertung der Variation, sondern auch als Merkmal für die Homogenität der Population. Die Menge wird als homogen angesehen, wenn<0,33.

Formen.

1. Stat. Berichterstattung ist eine solche Organisationsform, in der Einheiten von Observables in Form von Formularen Auskunft über ihre Aktivitäten geben, ein Regelapparat.

Die Besonderheit der Meldung besteht darin, dass sie verbindlich begründet, in der Ausführung verpflichtend und durch die Unterschrift des Leiters bzw. Verantwortlichen rechtskräftig bestätigt wird.

2. Die eigens organisierte Beobachtung ist das schlagendste und einfachste Beispiel für diese Form der Beobachtung. Volkszählung. Der Zensus wird in der Regel in regelmäßigen Abständen gleichzeitig im gesamten Untersuchungsgebiet zur gleichen Zeit durchgeführt.

Russische statistische Stellen führen Zählungen der Bevölkerung bestimmter Arten von Siedlungen und Organisationen, materiellen Ressourcen, mehrjährigen Plantagen, neuseeländischen Bauobjekten usw. durch.

4. Erfassungsform des Registers – basierend auf der Führung des statistischen Registers. Im Register jeweils Einheit obl-I har-Xia Anzahl von Indikatoren. In der inländischen statistischen Praxis sind die am weitesten verbreiteten Register us-I- und p / p-Register.

Registrierung der Bevölkerung - durchgeführt vom Standesamt

Registrierung p / p - USREO lead.org. Statistiken.

Arten.

können wie folgt in Gruppen eingeteilt werden. gekennzeichnet:

a) zum Zeitpunkt der Registrierung

b) in Bezug auf die Deckung von Kosteneinheiten

Nach Zeitreg. sie sind:

Strom (kontinuierlich)

Diskontinuierlich (periodisch und einmalig)

Bei Strom obs. Veränderungen von Phänomenen und Prozessen werden erfasst, sobald sie verfügbar sind (Registrierung von Geburt, Tod, Heirat, Scheidung usw.)

Periodisch obs. durchgeführt durch die Intervalle (N-Zählung alle 10 Jahre)

Einmal obs. unregelmäßig oder einmalig (Volksabstimmung)

Nach Umfang cos. stat. obl. es gibt:

fest

diskontinuierlich

Kontinuierliche Beobachtung ist eine Übersicht aller Einheiten von cos

Nicht kontinuierliche Beobachtung geht davon aus, dass nur ein Teil der Forschung gewartet werden muss.

Es gibt verschiedene Arten der diskontinuierlichen Beobachtung:

Hauptmethode Reihe

Selektiv (selbst)

Monographie

Diese Methode ist x-Xia, da in der Regel die meisten Kreaturen ausgewählt werden, normalerweise die größten Einheiten. Eulen in einer Katze. mittlere bedeutet. Teil aller beobachtbaren Zeichen.

Mit monographischer Betrachtung, sorgfältiger u. unterliegen Einheiten studiere oh Eulen oder m.b. oder typisch für diese cov-ti-Einheiten. oder stellen einige neue Arten von Phänomenen dar.

Beob. durchgeführt, um Trends in der Entwicklung zu erkennen oder sich abzeichnende Trends zu erkennen dieses Phänomen.

Wege

Direkte Beobachtung

Dokumentarische Beobachtung

Direkt angerufen. so beobachtbar mit einer Katze die Registrare selbst stellen durch direkte Messung, Berechnung, Eingrenzung den registrierungspflichtigen Umstand fest und nehmen auf dieser Grundlage einen Eintrag in das Formular vor.

Dokumentarische Methode obl. basierend auf der Verwendung verschiedener Dokumente als Informationsquellen, in der Regel der Rechnungslegung x-ra (dh statistische Berichterstattung)

Poll ist eine Überzeugungsmethode bei einer Katze. die notwendigen Informationen werden aus den Worten des Befragten (d. h. des Befragten) gewonnen (mündlich, Korrespondent, Fragebogen, privat usw.)

Ermittlung von Stichprobenfehlern.

Bei der Stichprobenbeobachtung werden zwei Arten von Fehlern unterschieden: Registrierung und Repräsentativität.

Registrierungsfehler - Abweichungen zwischen dem Wert des Indikators, der während der statistischen Beobachtung erhalten wurde, und seinem tatsächlichen Wert. Diese Fehler können sowohl bei kontinuierlicher als auch bei nicht kontinuierlicher Beobachtung auftreten. Registrierungsfehler treten aufgrund falscher oder ungenauer Informationen auf. Die Quellen für diese Art von Fehlern können ein Missverständnis des Wesens des Problems, die Unaufmerksamkeit des Registrars, das Auslassen oder wiederholte Zählen einzelner Beobachtungseinheiten sein. Registrierungsfehler werden unterteilt in systematisch aufgrund einseitig wirkender Ursachen, die das Prüfungsergebnis glätten (Zahlenrundung) und zufällig, die das Ergebnis der Wirkung verschiedener Zufallsfaktoren sind (Umordnung benachbarter Ziffern). Zufällige Fehler haben unterschiedliche Richtungen und heben sich bei ausreichend großem Volumen der befragten Grundgesamtheit gegenseitig auf.

Repräsentativitätsfehler - Abweichung der Werte des Indikators der befragten Bevölkerung von seinem Wert in der Ausgangsbevölkerung. Diese Fehler werden ebenfalls unterteilt in systematisch, die als Folge einer Verletzung der Grundsätze der Auswahl von Einheiten auftreten, die von der ursprünglichen Population einzuhalten sind, und zufällig die entstehen, wenn die ausgewählte Grundgesamtheit die gesamte Grundgesamtheit unvollständig reproduziert. Die Menge des zufälligen Fehlers kann geschätzt werden.

Stichprobenfehler- die Differenz zwischen dem Wert des Attributs in der Allgemeinbevölkerung und seinem aus den Ergebnissen der selektiven Beobachtung berechneten Wert. In der Praxis der Stichprobenerhebungen werden meist die durchschnittlichen und marginalen Stichprobenfehler ermittelt.

Der durchschnittliche Stichprobenfehler für verschiedene Auswahlmethoden wird unterschiedlich berechnet. Wenn zufällige oder mechanische Auswahl, dann

Für den Durchschnitt: m \u003d s 2 / (n) 1/2

Für Bruch: m = (w(1-w)/n) 1/ 2 , wobei

m - mittlerer Stichprobenfehler

s 2 - allgemeine Streuung

n - Volumen Stichprobenrahmen

Wenn die Stichprobe auf der Grundlage einer typischen Stichprobe gebildet wird und die Auswahl der Einheiten proportional zum Volumen typischer Gruppen erfolgt, beträgt der durchschnittliche Fehler:

Für die Mitte: m = (s ich 2 / n) 1/2

Zum Teilen: m = (w ich (1-w ich) / n) 1/2 , wo

s i 2 - der Durchschnitt der gruppeninternen Varianzen

w i ist der Anteil der Einheiten in der gesamten Gruppe, die das untersuchte Merkmal aufweisen.

s ich 2 = ås 2 n ich / ån ich

Der durchschnittliche Fehler der seriellen Probenahme ist gleich:

Für die Mitte: m = (d x 2 / r) 1/2

Zum Teilen: m = (d 2 w / r) 1/2

d 2 w - Intergruppenvarianz des Anteils

d x 2 - Streuung eines quantitativen Merkmals zwischen den Gruppen.

r ist die Nummer der ausgewählten Serie/

d 2 x \u003d å (x i -x) 2 / r

d 2 w \u003d å (w ich - w) 2 / r

Wenn die Auswahl von Einheiten aus der Allgemeinbevölkerung auf nicht-wiederholende Weise durchgeführt wird, wird eine Änderung an den mittleren Fehlerformeln vorgenommen: (1-n/N) 1/2

Geringfügiger Stichprobenfehler D wird als Produkt aus dem Vertrauensfaktor t und dem durchschnittlichen Stichprobenfehler berechnet: D = t*m. D bezieht sich auf das Wahrscheinlichkeitsniveau, das es garantiert. Dieses Niveau bestimmt den Vertrauensfaktor t und umgekehrt. Die Werte von t sind in speziellen mathematischen Tabellen angegeben.

Bestimmung der Stichprobengröße.

Der Stichprobenumfang wird in der Regel bereits bei der Konzeption einer Stichprobenerhebung berechnet. Die Formeln zur Bestimmung des Stichprobenumfangs folgen aus den Formeln für die marginalen Stichprobenfehler.

Das Volumen von Stichproben und mechanischen Wiederholungsproben wird durch die Formeln bestimmt:

Für mittel n \u003d t 2 s 2 / D 2

Zum Teilen n \u003d t 2 w (1-w) / D 2

Im Falle einer nicht wiederholten Probenahme:

Für mittel n \u003d t 2 s 2 N / ND 2 + t 2 s 2

Zum Teilen n = t 2 w(1-w)N / ND 2 +t 2 w(1-w).

Die Werte s 2 und w vor der zufälligen Beobachtung sind unbekannt. Sie werden ungefähr so ​​gefunden:

1. aus früheren Erhebungen übernommen;

2. Wenn die Maximal- und Minimalwerte des Attributs bekannt sind, wird die Standardabweichung nach der „Drei-Sigma“-Regel bestimmt:

s= xmax – xmin / 6

3. Wenn bei der Untersuchung eines alternativen Zeichens keine Informationen über seinen Anteil an der Allgemeinbevölkerung vorliegen, wird der maximal mögliche Wert w = 0,5 angenommen

Bei der typischen Auswahl, proportional zur Größe der typischen Gruppen, wird die Stichprobengröße für jede Gruppe durch die Formel bestimmt : n ich = n*N ich / N, wo

n ich - Stichprobengröße aus der i-ten Gruppe

N ich- das Volumen der i-ten Gruppe im Gen-ten cos-ti.

Bei einer Stichprobe, die proportional zur Variation des Merkmals ist, wird die Stichprobengröße aus jeder Gruppe wie folgt ermittelt: n ich = nN ich s ich /åN ich s ich .

Bei einem typischen Resampling, proportional zur Größe der Gruppen, ergibt sich der Gesamtstichprobenumfang wie folgt:

Für mittel n \u003d t 2 s 2 ich / D 2

Zum Teilen n \u003d t 2 w (1-w) / D 2

Bei sich nicht wiederholender typischer Probenahme:

Für mittel n = t 2 s 2 ich N / D 2 N + t 2 s 2 ich

Zum Teilen n = t 2 w(1-w)N / D 2 N+t 2 w(1-w)

Grundbegriffe und Voraussetzungen für den Einsatz der Korrelations- und Regressionsanalyse.

Korrelation ist eine statistische Abhängigkeit zwischen Zufallsvariablen, die keinen streng funktionalen Charakter haben, bei der eine Änderung in einer von zufällige Variablen führt zu einer Veränderung der mathematischen Erwartung des anderen.

Korrelationsanalyse- hat als Aufgabe die quantitative Bestimmung der Enge der Verbindung zwischen zwei Zeichen und zwischen den Wirk- und Vielfaktorzeichen. Die Festigkeit der Verbindung wird quantitativ durch den Wert der Korrelationskoeffizienten ausgedrückt.

Korrelations-Regression Analyse als allgemeines Konzept umfasst die Messung der Enge, der Kommunikationsrichtung und die Feststellung einer analytischen Ausdrucksform (Form) der Kommunikation (Regressionsanalyse).

Regressionsanalyse besteht darin, den analytischen Ausdruck der Beziehung zu bestimmen, bei der die Änderung eines Werts (als abhängiges oder effektives Merkmal bezeichnet) auf den Einfluss einer oder mehrerer unabhängiger Variablen (Faktoren) und der Menge aller anderen Faktoren zurückzuführen ist, die sich ebenfalls auswirken die abhängige bedeutung, nimmt - müht sich um die konstanten und durchschnittlichen bedeutungen. Die Regression kann einfaktoriell (Paar) und mehrfaktoriell (mehrfach) sein.

Der Zweck der Regressionsanalyse ist eine Bewertung der funktionalen Abhängigkeit des bedingten Mittelwerts des effektiven Attributs (Y) von den faktoriellen (x 1, x 2, ... x k) Vorzeichen.

Die Hauptprämisse der Regressionsanalyse ist, dass nur das resultierende Vorzeichen (Y) dem Normalverteilungsgesetz gehorcht und die Faktorzeichen x 1, x 2, ..., x k ein willkürliches Verteilungsgesetz haben können. Bei der Analyse von Zeitreihen fungiert die Zeit t als Faktorvorzeichen. Gleichzeitig wird bei der Regressionsanalyse das Vorliegen kausaler Zusammenhänge zwischen den effektiven (Y) Fakultäten (x 1, x 2, ..., x k) Vorzeichen impliziert. Die Regressionsgleichung oder das statistische Modell der Beziehung sozioökonomischer Phänomene, ausgedrückt durch die Funktion Y x \u003d f (x 1, x 2, ..., x k), ist dem realen simulierten Phänomen oder Prozess durchaus angemessen wenn folgendes beachtet wird Anforderungen an ihre Konstruktion.

1. Die Gesamtheit der untersuchten Ausgangsdaten ist homogen und mathematisch durch stetige Funktionen beschrieben.

2. Die Möglichkeit, das simulierte Phänomen durch eine oder mehrere Gleichungen von Ursache-Wirkungs-Beziehungen zu beschreiben.

3. Alle Faktorzeichen müssen einen quantitativen (numerischen) Ausdruck haben.

4. Das Vorhandensein eines ausreichend großen Volumens der zu untersuchenden Probe.

5. Ursache-Wirkungs-Beziehungen zwischen Phänomenen und Prozessen sollten in einer linearen oder linearen Abhängigkeitsform beschrieben werden.

6. Fehlen quantitativer Beschränkungen der Parameter des Kommunikationsmodells.

7. Die Konstanz der territorialen und zeitlichen Struktur der untersuchten Bevölkerung.

Die theoretische Gültigkeit der auf der Grundlage von Korrelations- und Regressionsanalysen aufgebauten Beziehungsmodelle wird durch folgendes beachtet Grundvoraussetzungen.

1. Alle Zeichen und ihre gemeinsamen Verbreitungen müssen dem normalen Verbreitungsgesetz gehorchen;

2. Die Varianz des modellierten Merkmals (Y) sollte immer konstant bleiben, wenn der Wert (Y) und die Werte von Faktormerkmalen geändert werden.

3. Separate Beobachtungen sollten unabhängig sein, d.h. die Ergebnisse der i-ten Beobachtung sollten nicht mit den vorherigen zusammenhängen und Informationen über nachfolgende Beobachtungen enthalten sowie diese beeinflussen.

ZUSAMMENFASSUNG ZIELE UND INHALT

Beobachtung liefert Informationen über jede Einheit des untersuchten Objekts. Die erhaltenen Daten sind keine allgemeinen Indikatoren. Mit ihrer Hilfe ist ohne vorherige Datenverarbeitung kein Rückschluss auf das Gesamtobjekt möglich.

Das Ziel der nächsten Stufe der statistischen Forschung ist es daher, die Primärdaten zu systematisieren und auf dieser Grundlage eine zusammenfassende Charakteristik des gesamten Objekts unter Verwendung generalisierender statistischer Daten zu erhalten.

Zusammenfassung - eine Reihe aufeinanderfolgender Operationen zur Verallgemeinerung spezifischer Einzelfakten, die eine Menge bilden, um typische Merkmale und Muster zu identifizieren, die dem untersuchten Phänomen als Ganzes innewohnen.

werden bei der statistischen beobachtung daten über jede einheit eines objekts erhoben, so sind das ergebnis der zusammenfassung detaillierte daten, die die gesamte Population als Ganzes widerspiegeln

Eine statistische Zusammenfassung sollte auf der Grundlage einer vorläufigen theoretischen Analyse von Phänomenen und Prozessen durchgeführt werden, damit während der Zusammenfassung Informationen über das untersuchte Phänomen nicht verloren gehen und alle statistischen Ergebnisse die wichtigsten charakteristischen Merkmale des Objekts widerspiegeln.

Je nach Tiefe der Materialbearbeitung kann die Zusammenfassung einfach und komplex sein.

Eine einfache Zusammenfassung ist die Berechnung der Summen für dieselben Beobachtungseinheiten.

Eine komplexe Zusammenfassung ist eine Reihe von Operationen, die das Gruppieren von Beobachtungseinheiten, das Zählen der Summen für jede Gruppe und für das gesamte Objekt und das Präsentieren der Gruppierungs- und Zusammenfassungsergebnisse in Form von statistischen Tabellen umfasst.

Der Zusammenfassung geht die Entwicklung ihres Programms voraus, das aus den folgenden Phasen besteht: Auswahl der Gruppierungsmerkmale; Festlegung der Reihenfolge der Gruppenbildung; Entwicklung eines Systems statistischer Pok-Lei zur Charakterisierung von Gruppen und des Objekts als Ganzes; Entwicklung eines Systems von Layouts statistischer Tabellen, in denen die Ergebnisse der Zusammenfassung dargestellt werden sollen.

Je nach Form der Materialbearbeitung lautet die Zusammenfassung: dezentral und zentral.

Bei einer dezentralen Zusammenfassung (sie wird in der Regel bei der Verarbeitung der statistischen Berichterstattung verwendet) erfolgt die Entwicklung des Materials in aufeinanderfolgenden Phasen. So werden die Unternehmensberichte von den Statistikbehörden der Teilstaaten der Russischen Föderation zusammengefasst, und die Ergebnisse für die Region werden bereits an das Staatliche Statistikkomitee Russlands übermittelt und dort für die gesamte Volkswirtschaft der Russischen Föderation ermittelt Land.

Bei einer zentralen Zusammenfassung gelangt das gesamte Primärmaterial in eine Organisation, wo es von Anfang bis Ende verarbeitet wird. Die zentrale Zusammenfassung wird normalerweise verwendet, um Materialien aus einmaligen statistischen Erhebungen zu verarbeiten.

Je nach Ausführungstechnik wird die statistische Zusammenfassung in mechanisierte und manuelle unterteilt.

Mechanisierte Zusammenfassung - bei der alle Vorgänge mit elektronischen Computern ausgeführt werden. Bei manuellen Zusammenfassungen werden alle Grundoperationen (Berechnung von Gruppen- und Gesamtsummen) manuell durchgeführt.

Zur Durchführung der Zusammenfassung wird ein Plan erstellt, der organisatorische Fragen festlegt: von wem und wann alle Operationen durchgeführt werden, das Verfahren zu ihrer Durchführung, die Zusammenstellung der in den Zeitschriften zu veröffentlichenden Informationen.

Schließende Din-Ki-Reihen

Beim Analysieren von Din-Ki-Reihen ist es notwendig, sie zu schließen – zwei oder mehr Reihen zu einer Reihe zu kombinieren. Ein Abschluss ist in Fällen erforderlich, in denen die Ebenen der Reihen aufgrund von Gebietsänderungen, aufgrund von Preisänderungen und aufgrund einer Änderung der Methode zur Berechnung der Ebenen der Reihen nicht vergleichbar sind. Es ist notwendig, die beiden obigen Reihen zu einer zu schließen (kombinieren). Dies kann mit Hilfe des Vergleichbarkeitsfaktors erfolgen. Wenn wir die Daten für das Jahr mit dem erhaltenen Koeffizienten multiplizieren, erhalten wir eine geschlossene (vergleichbare) Reihe von Dynamiken absoluter Werte , und nachdem die Änderung als 100% angenommen wird, und der Rest wird als Prozentsatz relativ zu diesen Niveaus neu berechnet.

30. M-dy Ausrichtungsreihen din-ki

Jede Reihe von Din-Ki kann theoretisch als drei Komponenten dargestellt werden:

Trend (der Haupttrend und die Entwicklung der dynamischen Serie);

Zyklische (periodische) Schwankungen, einschließlich saisonaler;

Zufällige Schwankungen.

Eine der Aufgaben, die sich bei der Analyse dynamischer Reihen ergeben, besteht darin, Änderungen in den Ebenen des untersuchten Phänomens festzustellen. In manchen Fällen ist das Änderungsmuster in den Stufen einer Reihe von Din-ki ziemlich klar, zum Beispiel entweder eine systematische Abnahme der Stufen einer Reihe oder deren Zunahme. manchmal erfahren die Niveaus der Reihe eine Vielzahl von Änderungen (manchmal steigen sie, manchmal sinken sie). Hier kann nur von einer generellen Tendenz und Entwicklung gesprochen werden: entweder zum Wachstum oder zum Rückgang.

Die Identifizierung des Haupttrends und der Entwicklung (Trend) wird als Ausrichtung der Zeitreihe bezeichnet, und m-dy Identifizierung des Haupttrends m-dy Nivellierung.

Die direkte Auswahl des Trends kann durch drei me-mi erfolgen.

* Md grobe Intervalle. Dieses MD basiert auf der Erweiterung von Zeitlinien, die die Ebenen der Serie enthalten. Zum Beispiel eine Reihe von Din-Ki

die tägliche Produktion wird durch eine Reihe von monatlichen Produktionsprognosen ersetzt und so weiter.

* Md Gleitender Durchschnitt. In diesem m-de werden die Anfangspegel der Reihe durch Mittelwerte ersetzt, die aus einem gegebenen Pegel und mehreren symmetrisch umgebenden erhalten werden. Die ganzzahlige Anzahl von Stufen, über die der Mittelwert berechnet wird, wird als Glättungsintervall bezeichnet. Das Glättungsintervall kann ungerade (3, 5, 7 usw. Punkte) oder gerade (2, 4, 6 usw. Punkte) sein. Die Berechnung der Durchschnittswerte erfolgt nach der gleitenden Methode, dh durch schrittweises Ausschließen der ersten Ebene aus dem akzeptierten gleitenden Zeitraum und Einbeziehen der nächsten. Bei ungerader Glättung wird der resultierende arithmetische Mittelwert der Mitte des berechneten Intervalls zugeordnet.

Das „-“ m-dika der Glättung durch gleitende Durchschnitte besteht in der Herkömmlichkeit, geglättete Pegel für Punkte am Anfang und am Ende der Reihe zu bestimmen.

* Analytische Ausrichtung - ist der effektivste Weg, um den Haupttrend und die Entwicklung zu identifizieren. In diesem Fall werden die Pegel einer Reihe von Dynamiken als Funktion der Zeit ausgedrückt: Yt=f(t)

Zweck des analytischen Abgleichs der din-ten Reihe ist die Bestimmung der Analyt-ten Fabrik f(t). In der Praxis wird entsprechend den verfügbaren Zeitreihen die Form festgelegt und die Parameter der Funktion f(t) gefunden, und dann wird das Verhalten von Abweichungen vom Trend analysiert.

In der Wirtschaftswissenschaft wird häufig eine Funktion der Form verwendet: Уi = а0 +∑ ai +ti

Von den Funktionen der Form (3.12) wird am häufigsten beim Nivellieren das lineare System / (*) \u003d ao + a1 * t oder das parabolische f (t) \u003d a0 + att + a2 t2 verwendet.

Die Koeffizienten ao,a,a2,...,ap werden in der Formel durch die kleinsten Quadrate gefunden.

Um die Parameter des Polynoms p-ten Grades zu finden, ist es gemäß dieser Methode notwendig, das System der sogenannten Normalgleichungen zu lösen:

nao+a1∑t=∑Y

ao∑t+ a1∑t*t= ∑Y*t.

Der Trend zeigt, wie systematische Faktoren die Niveaus der Din-ki beeinflussen. Die Fluktuation der Niveaus um den Trend herum dient als Maß für die Auswirkung von verbleibenden (zufälligen) Faktoren. Diese Auswirkung kann abgeschätzt werden

nach der Standardabweichungsformel.

Grundkonzepte der Korrelations-Regressions-Analyse.

Parametername Bedeutung
Betreff des Artikels: Variationsreihe
Rubrik (thematische Kategorie) Produktion

Beobachtete Werte einer Zufallsvariablen X 1 , X 2 , …, x k genannt Optionen.

Frequenz Optionen X Ich werde eine Zahl genannt n ich (ich=1,…,k) zeigt, wie oft diese Variante in der Stichprobe vorkommt.

Frequenz(relative Häufigkeit, Anteile) Optionen x ich (ich=1,…,k) wird üblicherweise das Verhältnis seiner Frequenz genannt n ich zur Stichprobengröße n.

Frequenzen und Frequenzen werden genannt Waage.

Kumulierte Frequenz Es ist üblich, die Anzahl der Optionen zu nennen, deren Werte kleiner als vorgegeben sind X:

Kumulierte Frequenz Es ist üblich, das Verhältnis der akkumulierten Häufigkeit zur Stichprobengröße zu nennen:

Variationsreihe(Statistische Reihe) - Es ist üblich, eine Folge von Optionen in aufsteigender Reihenfolge und ihre entsprechenden Gewichte zu nennen.

Die Variationsreihe sollte sein diskret(Stichprobe von Werten einer diskreten Zufallsvariablen) und kontinuierlich (Intervall)(Auswahl von Werten einer kontinuierlichen Zufallsvariablen).

Die diskrete Variationsreihe hat die Form:

Wenn die Anzahl der Optionen groß ist oder das Merkmal kontinuierlich ist (eine Zufallsvariable kann in einem bestimmten Intervall jeden Wert annehmen), sind sie es Intervall Variationsreihe.

Um eine Intervallvariationsserie zu erstellen, führen Sie aus Gruppierung Option - sie sind in separate Intervalle unterteilt:

Die Anzahl der Intervalle wird manchmal mit bestimmt Sturges-Formeln:

Dann wird die Anzahl der Varianten berechnet, die in jedes Intervall fallen – Häufigkeiten n ich(oder Frequenz n ich/n). Befindet sich die Variante am Rand des Intervalls, wird sie an das rechte Intervall angehängt.

Die Intervallvariationsreihe hat die Form:

Optionen
Frequenzen

Empirische (statistische) Verteilungsfunktion Es ist üblich, eine Funktion aufzurufen, deren Wert an dem Punkt X ist gleich der relativen Häufigkeit, mit der die Variante einen Wert kleiner als annimmt X(kumulierte Häufigkeit für X):

Frequenzpolygon heißt Polylinie, deren Segmente Punkte mit Koordinaten verbinden ( X 1 ; n 1), (X 2 ; n 2), …, (x k; nk). Das Frequenzpolygon, das das statistische Analogon des Verteilungspolygons ist.

Es ist erwähnenswert, dass für eine kontinuierliche Variationsreihe ein Polygon erstellt werden kann, wenn die Werte X 1 , X 2 , …, x k Nimm die Mittelpunkte der Intervalle.

Eine Intervall-Variationsserie wird üblicherweise mit grafisch dargestellt Histogramme.

Balkendiagramm- eine gestufte Figur, die aus Rechtecken besteht, deren Basen Teillängenintervalle sind h= x ich +1 – x ich, ich= 0,…,k-1, und die Höhen sind gleich den Frequenzen (oder Häufigkeiten) der Intervalle n ich (w ich).

Kumulieren(Summenkurve) - Kurve der akkumulierten Häufigkeiten (Frequenzen). Zum diskrete Reihe die Kumulierung ist eine unterbrochene Linie, die die Punkte oder verbindet. Zum Intervallserie Kumulieren beginnt an dem Punkt, dessen Abszisse gleich dem Beginn des ersten Intervalls ist und dessen Ordinate die akkumulierte Frequenz (Frequenz) gleich Null ist. Andere Punkte dieser unterbrochenen Linie entsprechen den Enden der Intervalle.

Variationsserie - Konzept und Typen. Klassifizierung und Merkmale der Kategorie "Variationsserien" 2017, 2018.

  • - Variationsreihe der Verteilung

    Verteilung des Einzelhandelsumsatzes in der Russischen Föderation im Jahr 1995 nach Eigentumsart, Mio. Rubel Arten von Vertriebsreihen Vorlesung VIII. Verteilungsreihen Als Ergebnis der Verarbeitung und Systematisierung primärstatistischer Daten erhalten sie ....


  • - Variationsreihe

    Die einfachste Transformation statistischer Daten ist ihre Ordnung nach Größenordnung. Stichprobenumfang aus der Allgemeinbevölkerung, geordnet in nicht absteigender Reihenfolge der Elemente, d. h. , wird als Variationsreihe bezeichnet: . Für den Fall, dass das Volumen der Beobachtungen ... .


  • - Aufgabe 2. Intervallvariationsserie

    1. Erstellen Sie basierend auf einer gegebenen Probe, die der Aufgabenvariante entspricht, eine Intervallvariationsserie; Erstellen Sie ein Histogramm und kumulieren Sie (verwenden Sie zwei Methoden: Einfügen eines Excel-Diagramms und den Modus "Histogramm" des Pakets "Datenanalyse"). 2. Analysieren Sie das resultierende Histogramm. ... .


  • - Erstellen Sie eine Variationsreihe der Variabilität des Merkmals von Bohnensamen oder Blättern einer beliebigen Pflanze gleichen Alters. Muster der Merkmalsvariabilität aufdecken.

    Eine Population ist eine strukturelle Einheit einer Art. Die Anzahl der Bevölkerungen. Ursachen von Bevölkerungsschwankungen. Die Beziehung von Individuen in Populationen und zwischen verschiedenen Populationen derselben und verschiedener Arten. 1. Ein wichtiges Merkmal einer Art ist ihre Verbreitung in Gruppen, Populationen in ...

  • Variationsreihe: Definition, Typen, Hauptmerkmale. Berechnungsmethode
    Mode, Median, arithmetisches Mittel in medizinischen und statistischen Studien
    (Zeigen Sie an einem bedingten Beispiel).

    Eine Variationsreihe ist eine Reihe von Zahlenwerten des untersuchten Merkmals, die sich in ihrer Größe voneinander unterscheiden und in denen sie liegen bestimmte Reihenfolge(in aufsteigender oder absteigender Reihenfolge). Jeder Zahlenwert der Reihe wird als Variante (V) bezeichnet, und die Zahl, die angibt, wie oft diese oder jene Variante in der Zusammensetzung dieser Reihe vorkommt, wird als Häufigkeit (p) bezeichnet.

    Die Gesamtzahl der Beobachtungsfälle, aus denen die Variationsreihe besteht, wird mit dem Buchstaben n bezeichnet. Der Unterschied in der Bedeutung der untersuchten Merkmale wird als Variation bezeichnet. Wenn die Variable Vorzeichen kein quantitatives Maß hat, wird die Variation als qualitativ und die Verteilungsreihe als Attribut bezeichnet (z. B. Verteilung nach Krankheitsausgang, Gesundheitszustand usw.).

    Wenn ein variables Vorzeichen einen quantitativen Ausdruck hat, wird eine solche Variation als quantitativ und die Verteilungsreihe als Variation bezeichnet.

    Variationsreihen werden unterteilt in diskontinuierliche und kontinuierliche - je nach Art des quantitativen Merkmals, einfache und gewichtete - je nach Häufigkeit des Auftretens der Variante.

    In einer einfachen Variationsreihe kommt jede Variante nur einmal vor (p=1), in einer gewichteten kommt dieselbe Variante mehrmals vor (p>1). Beispiele für solche Reihen werden später im Text besprochen. Wenn ein quantitatives Zeichen ist stetig, d.h. zwischen ganzen Zahlen gibt es Zwischenzahlen Bruchteile, die Variationsreihe heißt stetig.

    Zum Beispiel: 10.0 - 11.9

    14,0 - 15,9 usw.

    Wenn das quantitative Vorzeichen diskontinuierlich ist, d.h. seine einzelnen Werte (Varianten) unterscheiden sich um eine ganze Zahl und haben keine Zwischenwerte Bruchwerte, die Variationsreihe heißt diskontinuierlich oder diskret.

    Verwenden Sie die Daten aus dem vorherigen Beispiel zur Herzfrequenz

    für 21 Schüler werden wir eine Variationsreihe aufbauen (Tabelle 1).

    Tabelle 1

    Verteilung der Medizinstudenten nach Pulsfrequenz (bpm)

    Eine Variationsserie zu bauen bedeutet also das Verfügbare Zahlenwerte(Optionen) systematisieren, straffen, d.h. in einer bestimmten Reihenfolge (in aufsteigender oder absteigender Reihenfolge) mit ihren entsprechenden Frequenzen anordnen. Im betrachteten Beispiel sind die Optionen aufsteigend geordnet und als diskontinuierliche (diskrete) ganze Zahl ausgedrückt, jede Option kommt mehrfach vor, d.h. wir haben es mit einer gewichteten, unstetigen oder diskreten Variationsreihe zu tun.

    Wenn die Anzahl der Beobachtungen in der von uns untersuchten statistischen Population 30 nicht überschreitet, reicht es in der Regel aus, alle Werte des untersuchten Merkmals in einer Variationsreihe in aufsteigender Reihenfolge wie in Tabelle anzuordnen. 1 oder in absteigender Reihenfolge.

    Bei in großen Zahlen Beobachtungen (n>30) die Zahl der vorkommenden Varianten sehr groß sein kann, wird in diesem Fall eine Intervall- oder gruppierte Variationsreihe erstellt, in der zur Vereinfachung der Weiterverarbeitung und zur Verdeutlichung der Art der Verteilung die Varianten zu Gruppen zusammengefasst werden .

    Normalerweise Nummer Gruppenoption reicht von 8 bis 15.

    Es müssen mindestens 5 sein, denn. Andernfalls wird es zu grob, zu stark vergrößert, was das Gesamtbild der Schwankungen verzerrt und die Genauigkeit der Mittelwerte stark beeinträchtigt. Wenn die Anzahl der Gruppenoptionen mehr als 20-25 beträgt, erhöht sich die Genauigkeit der Berechnung der Durchschnittswerte, aber die Merkmale der Merkmalsvariation werden erheblich verzerrt und die mathematische Verarbeitung wird komplizierter.

    Bei der Zusammenstellung einer gruppierten Serie ist dies zu berücksichtigen

    − Variantengruppen müssen in einer bestimmten Reihenfolge angeordnet werden (aufsteigend oder absteigend);

    - die Intervalle in den Variantengruppen sollten gleich sein;

    − Die Werte der Grenzen der Intervalle sollten nicht übereinstimmen, weil es wird nicht klar sein, welchen Gruppen einzelne Optionen zugeordnet werden sollen;

    - Bei der Festlegung der Intervallgrenzen müssen die qualitativen Merkmale des gesammelten Materials berücksichtigt werden (z. B. ist bei der Untersuchung des Gewichts von Erwachsenen ein Intervall von 3-4 kg akzeptabel und für Kinder in den ersten Monaten des Lebens sollte es 100 g nicht überschreiten.)

    Bauen wir eine gruppierte (Intervall-)Reihe, die die Daten zur Pulsfrequenz (Anzahl der Schläge pro Minute) für 55 Medizinstudenten vor der Prüfung charakterisiert: 64, 66, 60, 62,

    64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

    64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

    79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

    Um eine gruppierte Serie zu erstellen, benötigen Sie:

    1. Bestimmen Sie den Wert des Intervalls;

    2. Mitte, Anfang und Ende der Gruppen der Variante der Variationsreihe bestimmen.

    ● Der Wert des Intervalls (i) wird durch die Anzahl der erwarteten Gruppen (r) bestimmt, deren Anzahl in Abhängigkeit von der Anzahl der Beobachtungen (n) gemäß einer speziellen Tabelle festgelegt wird

    Anzahl der Gruppen abhängig von der Anzahl der Beobachtungen:

    In unserem Fall können bei 55 Schülern 8 bis 10 Gruppen gebildet werden.

    Der Wert des Intervalls (i) wird durch die folgende Formel bestimmt -

    i = Vmax-Vmin/r

    In unserem Beispiel ist der Wert des Intervalls 82-58/8= 3.

    Wenn der Intervallwert ist Bruchzahl, sollte das Ergebnis auf eine Ganzzahl aufgerundet werden.

    Es gibt verschiedene Arten von Durchschnittswerten:

    arithmetisches Mittel,

    geometrisches Mittel,

    ● harmonisches Mittel,

    quadratischer Mittelwert,

    ● mittel progressiv,

    ● Mittelwert

    In der medizinischen Statistik werden am häufigsten arithmetische Mittelwerte verwendet.

    Mittel arithmetischer Wert(M) ist ein verallgemeinernder Wert, der das Typische bestimmt, das für die gesamte Population charakteristisch ist. Die Hauptmethoden zur Berechnung von M sind: die Methode des arithmetischen Mittels und die Methode der Momente (bedingte Abweichungen).

    Das arithmetische Mittelverfahren dient zur Berechnung des einfachen arithmetischen Mittels und des gewichteten arithmetischen Mittels. Die Wahl der Methode zur Berechnung des arithmetischen Mittelwertes hängt von der Art der Variationsreihe ab. Bei einer einfachen Variationsreihe, in der jede Variante nur einmal vorkommt, wird das einfache arithmetische Mittel durch die Formel bestimmt:

    wobei: М – arithmetischer Mittelwert;

    V ist der Wert des variablen Merkmals (Optionen);

    Σ - gibt die Aktion an - Summierung;

    n ist die Gesamtzahl der Beobachtungen.

    Ein Beispiel für die Berechnung des arithmetischen Mittels ist einfach. Atemfrequenz (Anzahl der Atemzüge pro Minute) bei 9 Männern im Alter von 35 Jahren: 20, 22, 19, 15, 16, 21, 17, 23, 18.

    Um die durchschnittliche Atemfrequenz bei Männern im Alter von 35 Jahren zu bestimmen, ist Folgendes erforderlich:

    1. Erstellen Sie eine Variationsreihe, indem Sie alle Optionen in aufsteigender oder absteigender Reihenfolge anordnen Wir haben eine einfache Variationsreihe, weil Variantenwerte kommen nur einmal vor.

    M = ∑V/n = 171/9 = 19 Atemzüge pro Minute

    Fazit. Die Atemfrequenz bei Männern im Alter von 35 Jahren beträgt im Durchschnitt 19 Atembewegungen pro Minute.

    Wiederholen sich die einzelnen Werte der Variante, muss nicht jede Variante in einer Zeile ausgeschrieben werden, es reicht aus, die auftretenden Maße der Variante aufzulisten (V) und daneben die Anzahl ihrer Wiederholungen anzugeben ( p). eine solche Variationsreihe, bei der die Varianten gleichsam nach der Anzahl der ihnen entsprechenden Häufigkeiten gewichtet sind, heißt die gewichtete Variationsreihe, und der errechnete Mittelwert ist der arithmetisch gewichtete Mittelwert.

    Der arithmetisch gewichtete Durchschnitt wird nach folgender Formel bestimmt: M= ∑Vp/n

    wobei n die Anzahl der Beobachtungen ist, gleich der Summe Frequenzen - Σr.

    Ein Beispiel für die Berechnung des arithmetisch gewichteten Durchschnitts.

    Dauer der Behinderung (in Tagen) bei 35 Patienten mit akuten Atemwegserkrankungen (ARI), die im ersten Quartal von einem örtlichen Arzt behandelt wurden laufendes Jahr war: 6, 7, 5, 3, 9, 8, 7, 5, 6, 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6, 7 Tage.

    Die Methodik zur Bestimmung der durchschnittlichen Dauer der Behinderung bei Patienten mit akuten Atemwegsinfektionen lautet wie folgt:

    1. Lassen Sie uns eine gewichtete Variationsreihe aufbauen, weil einzelne Variantenwerte werden mehrfach wiederholt. Dazu können Sie alle Optionen in aufsteigender oder absteigender Reihenfolge mit ihren entsprechenden Häufigkeiten anordnen.

    In unserem Fall sind die Optionen in aufsteigender Reihenfolge.

    2. Berechnen Sie den arithmetisch gewichteten Durchschnitt mit der Formel: M = ∑Vp/n = 233/35 = 6,7 Tage

    Verteilung der Patienten mit akuten Atemwegsinfektionen nach Dauer der Behinderung:

    Dauer der Arbeitsunfähigkeit (V) Anzahl der Patienten (p) vp
    ∑p = n = 35 ∑Vp = 233

    Fazit. Die Dauer der Behinderung bei Patienten mit akuten Atemwegserkrankungen betrug im Durchschnitt 6,7 Tage.

    Mode (Mo) ist die häufigste Variante in der Variationsreihe. Für die in der Tabelle dargestellte Verteilung entspricht der Modus der Variante gleich 10, er kommt häufiger vor als andere - 6 mal.

    Verteilung der Patienten nach Aufenthaltsdauer Krankenhausbett(in Tagen)

    v
    p

    Manchmal ist es schwierig, den genauen Wert des Modus zu bestimmen, da es mehrere Beobachtungen in den untersuchten Daten geben kann, die „am häufigsten“ vorkommen.

    Der Median (Me) ist ein nichtparametrischer Indikator, der die Variationsreihe in zwei gleiche Hälften teilt: Auf beiden Seiten befindet sich der Median die gleiche Nummer Möglichkeit.

    Für die in der Tabelle gezeigte Verteilung ist der Median beispielsweise 10, weil auf beiden Seiten dieses Wertes befindet sich auf der 14. Option, d.h. die Zahl 10 nimmt zentrale Lage in dieser Reihe ist ihr Median.

    Da die Anzahl der Beobachtungen in diesem Beispiel gerade ist (n=34), kann der Median wie folgt bestimmt werden:

    Ich = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

    Das bedeutet, dass die Mitte der Reihe auf die siebzehnte Option fällt, was einem Median von 10 entspricht. Für die in der Tabelle dargestellte Verteilung beträgt das arithmetische Mittel:

    M = ∑Vp/n = 334/34 = 10,1

    Also für 34 Beobachtungen aus Tabelle. 8, wir haben: Mo=10, Me=10, arithmetisches Mittel (M) ist 10,1. In unserem Beispiel erwiesen sich alle drei Indikatoren als gleich oder nahe beieinander, obwohl sie völlig unterschiedlich sind.

    Das arithmetische Mittel ist die resultierende Summe aller Einflüsse, an seiner Bildung sind ausnahmslos alle Optionen beteiligt, auch extreme, oft untypisch für ein bestimmtes Phänomen oder eine Menge.

    Modus und Median hängen im Gegensatz zum arithmetischen Mittel nicht vom Wert von all ab individuelle Werte variables Vorzeichen (Werte der Extremvariante und Streuungsgrad der Reihe). Das arithmetische Mittel charakterisiert die gesamte Masse der Beobachtungen, Modus und Median charakterisieren die Masse

    Variationsserien – eine Serie, in der sie verglichen werden (in aufsteigender oder absteigender Reihenfolge) Optionen und ihre jeweiligen Frequenzen

    Varianten sind separate quantitative Ausdrücke eines Merkmals. Festgelegt Lateinischer Buchstabe v . klassisches Verständnis der Begriff "Variante" impliziert, dass jeder Einzigartiger Wert Funktion, unabhängig von der Anzahl der Wiederholungen.

    Zum Beispiel in der Variationsreihe von Indikatoren der Systole Blutdruck bei zehn Patienten gemessen:

    110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

    nur 6 Werte sind Optionen:

    110, 120, 130, 140, 160, 170.

    Häufigkeit ist eine Zahl, die angibt, wie oft eine Option wiederholt wird. Bezeichnet mit einem lateinischen Buchstaben P . Die Summe aller Häufigkeiten (die natürlich gleich der Anzahl aller untersuchten ist) wird als bezeichnet n.

      In unserem Beispiel nehmen die Frequenzen folgende Werte an:
    • für Variante 110 Häufigkeit P = 1 (Wert 110 tritt bei einem Patienten auf),
    • für Variante 120 Häufigkeit P = 2 (Wert 120 tritt bei zwei Patienten auf),
    • für Variante 130 Häufigkeit P = 3 (Wert 130 tritt bei drei Patienten auf),
    • für Variante 140 Häufigkeit P = 2 (Wert 140 tritt bei zwei Patienten auf),
    • für Variante 160 Häufigkeit P = 1 (Wert 160 tritt bei einem Patienten auf),
    • für Variante 170 Häufigkeit P = 1 (Wert 170 tritt bei einem Patienten auf),

    Arten von Variationsreihen:

    1. einfach- Dies ist eine Reihe, in der jede Option nur einmal vorkommt (alle Häufigkeiten sind gleich 1);
    2. suspendiert- eine Reihe, in der eine oder mehrere Optionen wiederholt vorkommen.

    Die Variationsreihe dient der Beschreibung großer Zahlenfelder, in dieser Form werden die gesammelten Daten der Mehrheit zunächst dargestellt. medizinische Forschung. Um die Variationsreihen zu charakterisieren, werden spezielle Indikatoren berechnet, darunter Durchschnittswerte, Variabilitätsindikatoren (die sogenannte Streuung), Indikatoren für die Repräsentativität von Stichprobendaten.

    Indikatoren für Variationsreihen

    1) Das arithmetische Mittel ist ein verallgemeinernder Indikator, der die Größe des untersuchten Merkmals charakterisiert. Das arithmetische Mittel wird als bezeichnet M , ist die häufigste Art des Durchschnitts. Das arithmetische Mittel wird als Verhältnis der Summe der Werte der Indikatoren aller Beobachtungseinheiten zur Anzahl aller untersuchten Einheiten berechnet. Die Methode zur Berechnung des arithmetischen Mittels unterscheidet sich für eine einfache und eine gewichtete Variationsreihe.

    Formel zur Berechnung einfaches arithmetisches Mittel:

    Formel zur Berechnung gewichtetes arithmetisches Mittel:

    M = Σ(V * P)/ n

    ​ 2) Modus – ein weiterer Durchschnittswert der Variationsreihe, der der am häufigsten wiederholten Variante entspricht. Oder anders ausgedrückt, dies ist die Option, die der höchsten Frequenz entspricht. Bezeichnet als Mo . Der Modus wird nur für gewichtete Reihen berechnet, da in einfache Reihen keine der Optionen wird wiederholt und alle Frequenzen sind gleich eins.

    Zum Beispiel in der Variationsreihe der Herzfrequenzwerte:

    80, 84, 84, 86, 86, 86, 90, 94;

    der Wert des Modus ist 86, da diese Variante 3 mal vorkommt, also ihre Häufigkeit am höchsten ist.

    3) Median - der Wert der Option, der die Variationsreihe halbiert: auf beiden Seiten davon gleiche Anzahl Möglichkeit. Der Median sowie das arithmetische Mittel und der Modus beziehen sich auf Durchschnittswerte. Bezeichnet als Mir

    4) Standardabweichung (Synonyme: Standardabweichung, Sigma-Abweichung, Sigma) - ein Maß für die Variabilität der Variationsreihe. Es ist ein integraler Indikator, der alle Fälle der Abweichung einer Variante vom Mittelwert kombiniert. Tatsächlich beantwortet es die Frage: Wie weit und wie oft weichen die Optionen vom arithmetischen Mittel ab. Bezeichnet griechischer Brief σ ("sigma").

    Wenn die Populationsgröße mehr als 30 Einheiten beträgt, wird die Standardabweichung anhand der folgenden Formel berechnet:

    Für kleine Populationen – 30 Beobachtungseinheiten oder weniger – wird die Standardabweichung mit einer anderen Formel berechnet:

    Nennen wir verschiedene Beispielwerte Optionen eine Reihe von Werten und bezeichnen: X 1 , X 2, …. Lassen Sie uns zuerst machen reicht Optionen, d.h. Ordnen Sie sie in aufsteigender oder absteigender Reihenfolge an. Für jede Option wird ihr eigenes Gewicht angegeben, d.h. Zahl, die den Beitrag dieser Option charakterisiert Gesamtbevölkerung. Frequenzen oder Frequenzen wirken als Gewichte.

    Frequenz n ich Möglichkeit x ich eine Zahl genannt, die angibt, wie oft diese Option in der betrachteten Stichprobenpopulation vorkommt.

    Häufigkeit oder relative Häufigkeit w ich Möglichkeit x ich die Nummer wird angerufen gleich dem Verhältnis Häufigkeit der Variante zur Summe der Häufigkeiten aller Varianten. Die Häufigkeit zeigt, welcher Teil der Einheiten der Stichprobenpopulation eine bestimmte Variante aufweist.

    Die Folge von Optionen mit ihren entsprechenden Gewichten (Frequenzen oder Frequenzen), geschrieben in aufsteigender (oder absteigender) Reihenfolge, wird aufgerufen Variationsreihe.

    Variationsreihen sind diskret und Intervall.

    Bei einer diskreten Variationsreihe werden die Punktwerte des Attributs angegeben, bei der Intervallreihe werden die Attributwerte in Form von Intervallen angegeben. Variationsreihen können die Verteilung von Häufigkeiten oder zeigen relative Häufigkeiten(Frequenzen), je nachdem, welcher Wert für jede Option angegeben ist - Frequenz oder Frequenz.

    Diskrete Variationsreihe der Häufigkeitsverteilung sieht aus wie:

    Frequenzen werden durch die Formel gefunden, i = 1, 2, …, m.

    w 1 +w 2 + … + w m = 1.

    Beispiel 4.1. Für eine bestimmte Menge von Zahlen

    4, 6, 6, 3, 4, 9, 6, 4, 6, 6

    diskret konstruieren Variationsreihe Verteilungen von Häufigkeiten und Häufigkeiten.

    Lösung . Das Bevölkerungsvolumen ist n= 10. Die diskrete Häufigkeitsverteilungsreihe hat die Form

    Intervallreihen haben eine ähnliche Aufzeichnungsform.

    Intervallvariationsreihe der Häufigkeitsverteilung wird geschrieben als:

    Die Summe aller Häufigkeiten ist gleich der Gesamtzahl der Beobachtungen, d.h. volle Lautstärke: n = n 1 +n 2 + … + n m .

    Intervallvariationsreihen der Verteilung relativer Häufigkeiten (Häufigkeiten) sieht aus wie:

    Die Frequenz ergibt sich aus der Formel , i = 1, 2, …, m.

    Die Summe aller Frequenzen ist gleich eins: w 1 +w 2 + … + w m = 1.

    In der Praxis werden am häufigsten Intervallreihen verwendet. Wenn es viele statistische Stichprobendaten gibt und deren Werte willkürlich voneinander abweichen geringe Menge, dann wird die diskrete Reihe für diese Daten ziemlich umständlich und unbequem für weitere Nachforschungen. In diesem Fall wird Datengruppierung verwendet, d.h. Das Intervall, das alle Werte des Attributs enthält, wird in mehrere Teilintervalle unterteilt, und nach Berechnung der Häufigkeit für jedes Intervall wird eine Intervallreihe erhalten. Lassen Sie uns das Schema zum Erstellen einer Intervallreihe detaillierter aufschreiben, wobei wir davon ausgehen, dass die Längen der Teilintervalle gleich sind.

    2.2 Erstellen einer Intervallserie

    Um eine Intervallserie zu erstellen, benötigen Sie:

    Bestimmen Sie die Anzahl der Intervalle;

    Bestimmen Sie die Länge der Intervalle;

    Bestimmen Sie die Position der Intervalle auf der Achse.

    Zum Bestimmen Anzahl Intervalle k Es gibt eine Sturges-Formel, nach der

    ,

    wo n- das Volumen der Gesamtheit.

    Wenn es beispielsweise 100 Merkmalswerte (Variante) gibt, dann empfiehlt es sich, die Anzahl der Intervalle gleich den Intervallen zu nehmen, um eine Intervallreihe zu konstruieren.

    In der Praxis wird die Anzahl der Intervalle jedoch sehr oft vom Forscher selbst gewählt, da diese Anzahl nicht sehr groß sein sollte, damit die Reihe nicht umständlich ist, aber auch nicht sehr klein, um einige Eigenschaften der nicht zu verlieren Verteilung.

    Intervalllänge h wird durch folgende Formel bestimmt:

    ,

    wo x maximal und x min ist die größte und am meisten kleiner Wert Optionen.

    der Wert genannt im großen Stil die Zeile.

    Um die Intervalle selbst zu konstruieren, gehen sie auf unterschiedliche Weise vor. Einer der meisten einfache Wege ist wie folgt. Der Wert wird als Beginn des ersten Intervalls genommen
    . Dann werden die restlichen Grenzen der Intervalle durch die Formel gefunden. Offensichtlich das Ende des letzten Intervalls a m+1 muss die Bedingung erfüllen

    Nachdem alle Grenzen der Intervalle gefunden sind, werden die Häufigkeiten (oder Häufigkeiten) dieser Intervalle bestimmt. Um dieses Problem zu lösen, sehen sie alle Optionen durch und bestimmen die Anzahl der Optionen, die in ein bestimmtes Intervall fallen. Vollständiger Aufbau Betrachten wir eine Intervallreihe anhand eines Beispiels.

    Beispiel 4.2. Erstellen Sie für die folgenden Statistiken in aufsteigender Reihenfolge eine Intervallreihe mit der Anzahl der Intervalle gleich 5:

    11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

    Lösung. Gesamt n=50 Variantenwerte.

    Die Anzahl der Intervalle wird in der Problembedingung angegeben, d. h. k=5.

    Die Länge der Intervalle beträgt
    .

    Lassen Sie uns die Grenzen der Intervalle definieren:

    a 1 = 11 − 8,5 = 2,5; a 2 = 2,5 + 17 = 19,5; a 3 = 19,5 + 17 = 36,5;

    a 4 = 36,5 + 17 = 53,5; a 5 = 53,5 + 17 = 70,5; a 6 = 70,5 + 17 = 87,5;

    a 7 = 87,5 +17 = 104,5.

    Um die Häufigkeit von Intervallen zu bestimmen, zählen wir die Anzahl der Optionen, die in dieses Intervall fallen. Zum Beispiel fallen die Optionen 11, 12, 12, 14, 14, 15 in das erste Intervall von 2,5 bis 19,5.Ihre Anzahl ist 6, daher ist die Häufigkeit des ersten Intervalls n 1=6. Die Frequenz des ersten Intervalls ist . Die Varianten 21, 21, 22, 23, 25, deren Anzahl 5 ist, fallen in das zweite Intervall von 19,5 bis 36,5. Daher ist die Häufigkeit des zweiten Intervalls n 2 = 5 und die Frequenz . Nachdem wir in ähnlicher Weise Häufigkeiten und Häufigkeiten für alle Intervalle gefunden haben, erhalten wir die folgende Intervallreihe.

    Die Intervallreihe der Häufigkeitsverteilung hat die Form:

    Die Summe der Häufigkeiten ist 6+5+9+11+8+11=50.

    Die Intervallreihe der Häufigkeitsverteilung hat die Form:

    Die Summe der Häufigkeiten ist 0,12+0,1+0,18+0,22+0,16+0,22=1. ■

    Bei der Konstruktion von Intervallreihen können je nach den spezifischen Bedingungen des betrachteten Problems andere Regeln angewendet werden, nämlich

    1. Intervallvariationsserien können aus Teilintervallen bestehen unterschiedliche Längen. Ungleiche Intervalllängen ermöglichen es, die Eigenschaften einer statistischen Grundgesamtheit mit einer ungleichmäßigen Verteilung eines Merkmals herauszugreifen. Wenn beispielsweise die Grenzen der Intervalle die Einwohnerzahl in Städten bestimmen, dann empfiehlt es sich bei dieser Aufgabe, Intervalle ungleicher Länge zu verwenden. Es ist offensichtlich, dass für große Städte Angelegenheiten und kein großer unterschied in der Einwohnerzahl, und für große Städte ist der Unterschied zwischen Dutzenden und Hunderten von Einwohnern nicht signifikant. Intervallserie mit ungleich langen Teilintervallen werden hauptsächlich in untersucht Allgemeine Theorie Statistiken und deren Berücksichtigung würde den Rahmen dieses Handbuchs sprengen.

    2. Ein mathematische Statistik manchmal werden Intervallreihen betrachtet, bei denen die linke Grenze des ersten Intervalls mit –∞ und die rechte Grenze des letzten Intervalls mit +∞ angenommen wird. Dies geschieht, um zu bringen statistische Verteilung zum Theoretischen.

    3. Bei der Konstruktion von Intervallreihen kann es vorkommen, dass der Wert einer Variante genau mit der Intervallgrenze zusammenfällt. Das Beste, was in diesem Fall zu tun ist, ist wie folgt. Wenn es nur eine solche Koinzidenz gibt, dann bedenken Sie, dass die betrachtete Variante mit ihrer Häufigkeit in das Intervall näher an der Mitte der Intervallreihe gefallen ist, wenn es mehrere solcher Varianten gibt, werden entweder alle den Intervallen zugeordnet rechts von diesen Varianten oder ganz links.

    4. Nachdem die Anzahl der Intervalle und ihre Länge bestimmt wurden, kann die Lokalisierung der Intervalle auf andere Weise erfolgen. Finden Sie das arithmetische Mittel aller betrachteten Werte der Optionen X vgl. und bauen Sie das erste Intervall so auf, dass dieser Stichprobenmittelwert innerhalb eines Intervalls liegt. Damit erhalten wir das Intervall aus X vgl. – 0,5 h Vor X Durchschnitt + 0,5 h. Dann links und rechts, indem wir die Länge des Intervalls addieren, bauen wir die verbleibenden Intervalle bis auf x min und x max fällt nicht in das erste bzw. letzte Intervall.

    5. Intervallreihe für große Zahlen Es ist bequem, Intervalle vertikal zu schreiben, d.h. Notieren Sie Intervalle nicht in der ersten Zeile, sondern in der ersten Spalte und Frequenzen (oder Häufigkeiten) in der zweiten Spalte.

    Beispieldaten können als Werte einer Zufallsvariablen betrachtet werden X. Eine Zufallsvariable hat ihr eigenes Verteilungsgesetz. Aus der Wahrscheinlichkeitstheorie ist bekannt, dass das Verteilungsgesetz einer diskreten Zufallsvariablen als Verteilungsreihe und für eine stetige durch eine Verteilungsdichtefunktion angegeben werden kann. Es gibt jedoch ein universelles Verteilungsgesetz, das sowohl für diskrete als auch für kontinuierliche Zufallsvariablen gilt. Dieses Verteilungsgesetz wird als Verteilungsfunktion angegeben F(x) = P(X<x). Für Beispieldaten können Sie ein Analogon der Verteilungsfunktion angeben - die empirische Verteilungsfunktion.


    Ähnliche Informationen.