Erstellen Sie eine Reihe von Beispielen. Variationsreihe

  • Einführungsstunde ist gratis;
  • Eine große Anzahl erfahrener Lehrer (muttersprachlich und russischsprachig);
  • Kurse NICHT für einen bestimmten Zeitraum (Monat, Halbjahr, Jahr), sondern für eine bestimmte Anzahl von Unterrichtsstunden (5, 10, 20, 50);
  • Über 10.000 zufriedene Kunden.
  • Die Kosten für eine Unterrichtsstunde mit einem russischsprachigen Lehrer - ab 600 Rubel, mit einem Muttersprachler - ab 1500 Rubel

Das Konzept einer Variationsreihe. Der erste Schritt bei der Systematisierung des statistischen Beobachtungsmaterials besteht darin, die Anzahl der Einheiten zu zählen, die das eine oder andere Merkmal aufweisen. Nachdem wir die Einheiten in aufsteigender oder absteigender Reihenfolge ihres quantitativen Attributs angeordnet und die Anzahl der Einheiten mit einem bestimmten Wert des Attributs gezählt haben, erhalten wir eine Variationsreihe. Die Variationsreihe charakterisiert die Verteilung von Einheiten einer bestimmten statistischen Grundgesamtheit gemäß einem quantitativen Merkmal.

Die Variationsreihe besteht aus zwei Spalten, die linke Spalte enthält die Werte des variablen Attributs, Varianten genannt und mit (x) bezeichnet, und die rechte Spalte enthält absolute Zahlen, die zeigen, wie oft jede Variante vorkommt. Die Werte in dieser Spalte werden Frequenzen genannt und mit (f) bezeichnet.

Schematisch lassen sich die Variationsreihen in Form von Tabelle 5.1 darstellen:

Tabelle 5.1

Art der Variationsserie

Optionen (x)

Frequenzen (f)

In der rechten Spalte können auch relative Indikatoren verwendet werden, die den Anteil der Häufigkeit einzelner Varianten an der Gesamthäufigkeit charakterisieren. Diese relativen Indikatoren werden als Häufigkeiten bezeichnet und üblicherweise mit bezeichnet, d. h. . Die Summe aller Frequenzen ist gleich eins. Häufigkeiten können auch in Prozent ausgedrückt werden, dann ergibt ihre Summe 100 %.

Variable Zeichen können unterschiedlicher Natur sein. Varianten einiger Zeichen werden in ganzen Zahlen ausgedrückt, z. B. die Anzahl der Zimmer in einer Wohnung, die Anzahl der veröffentlichten Bücher usw. Diese Zeichen werden diskontinuierlich oder diskret genannt. Varianten anderer Merkmale können innerhalb gewisser Grenzen beliebige Werte annehmen, wie z. B. die Erfüllung geplanter Ziele, Löhne usw. Diese Merkmale werden als kontinuierlich bezeichnet.

Diskrete Variationsserie. Wenn die Varianten der Variationsreihe als diskrete Werte ausgedrückt werden, wird eine solche Variationsreihe als diskret bezeichnet, ihr Aussehen ist in der Tabelle dargestellt. 5.2:

Tabelle 5.2

Verteilung der Studierenden nach Prüfungsnoten

Bewertungen (x)

Anzahl Studierende (w)

In % von insgesamt ()

Die Art der Verteilung in diskreten Reihen wird grafisch als Verteilungspolygon dargestellt, Abb.5.1.

Reis. 5.1. Verteilung der Studierenden nach Prüfungsnoten.

Serie von Intervallvariationen. Bei kontinuierlichen Merkmalen werden Variationsreihen als Intervallreihen konstruiert, d.h. Merkmalswerte in ihnen werden als Intervalle "von und bis" ausgedrückt. Dabei wird der Minimalwert eines Merkmals in einem solchen Intervall als Untergrenze des Intervalls und der Maximalwert als Obergrenze des Intervalls bezeichnet.

Intervall-Variationsreihen werden sowohl für diskontinuierliche Merkmale (diskret) als auch für solche erstellt, die über einen weiten Bereich variieren. Intervallreihen können gleiche und ungleiche Intervalle haben. In der wirtschaftlichen Praxis werden meist ungleiche Intervalle verwendet, die progressiv ansteigen oder abfallen. Ein solcher Bedarf entsteht insbesondere in Fällen, in denen die Schwankung der Charakteristik ungleichmäßig und über einen weiten Bereich ist.

Betrachten Sie die Art der Intervallreihe mit gleichen Intervallen, Tabelle. 5.3:

Tabelle 5.3

Verteilung der Arbeiter nach Output

Ausgang, tr. (X)

Anzahl der Arbeiter (w)

Summenhäufigkeit (f´)

Die Intervallverteilungsreihe wird grafisch als Histogramm dargestellt, Abb.5.2.

Abb.5.2. Verteilung der Arbeiter nach Output

Kumulierte (kumulierte) Häufigkeit. In der Praxis besteht die Notwendigkeit, die Verteilungsreihe in umzuwandeln kumulative Zeilen, baut auf den akkumulierten Frequenzen auf. Sie können verwendet werden, um strukturelle Durchschnitte zu definieren, die die Analyse von Verteilungsreihendaten erleichtern.

Die kumulativen Häufigkeiten werden ermittelt, indem die Häufigkeiten (oder Häufigkeiten) der ersten Gruppe dieser Indikatoren der nachfolgenden Gruppen der Verteilungsreihe sequentiell addiert werden. Zur Veranschaulichung der Verbreitungsreihen werden Kumulate und Spitzbogen verwendet. Um sie zu bilden, werden die Werte eines diskreten Merkmals (oder die Enden der Intervalle) auf der Abszissenachse markiert, und die wachsenden Summen von Häufigkeiten (kumulieren) werden auf der Ordinatenachse markiert, Abb.5.3.

Reis. 5.3. Die kumulierte Verteilung der Arbeitnehmer nach Entwicklung

Werden die Skalen von Häufigkeiten und Varianten vertauscht, d.h. die akkumulierten Häufigkeiten auf der Abszissenachse und die Werte der Optionen auf der Ordinatenachse wiedergeben, dann wird die Kurve, die die Änderung der Häufigkeiten von Gruppe zu Gruppe charakterisiert, als Verteilungsogive bezeichnet, Abb. 5.4.

Reis. 5.4. Ogiva-Verteilung von Arbeitern für die Produktion

Schwankungsreihen mit gleichen Intervallen stellen eine der wichtigsten Voraussetzungen für statistische Verteilungsreihen dar, um deren zeitliche und räumliche Vergleichbarkeit zu gewährleisten.

Verteilungsdichte. Allerdings sind die Häufigkeiten einzelner ungleicher Intervalle in diesen Reihen nicht direkt vergleichbar. In solchen Fällen wird zur Gewährleistung der notwendigen Vergleichbarkeit die Verteilungsdichte berechnet, d.h. Bestimmen Sie, wie viele Einheiten in jeder Gruppe pro Einheit des Intervallwerts sind.

Beim Erstellen eines Diagramms der Verteilung einer Variationsreihe mit ungleichen Intervallen wird die Höhe der Rechtecke nicht proportional zu den Häufigkeiten, sondern zu den Indikatoren der Verteilungsdichte der Werte des untersuchten Merkmals in den entsprechenden Intervallen bestimmt .

Die Zusammenstellung einer Variationsreihe und ihre grafische Darstellung ist der erste Schritt bei der Verarbeitung der Ausgangsdaten und der erste Schritt bei der Analyse der untersuchten Population. Der nächste Schritt bei der Analyse von Variationsreihen ist die Bestimmung der wichtigsten verallgemeinernden Indikatoren, die als Merkmale der Reihe bezeichnet werden. Diese Merkmale sollen eine Vorstellung vom Durchschnittswert des Attributs in den Einheiten der Grundgesamtheit vermitteln.

Durchschnittswert. Der Durchschnittswert ist ein verallgemeinertes Merkmal des untersuchten Merkmals in der untersuchten Population, das sein typisches Niveau pro Bevölkerungseinheit unter bestimmten Bedingungen von Ort und Zeit widerspiegelt.

Der Durchschnittswert wird immer genannt, hat die gleiche Dimension wie das Attribut einzelner Einheiten der Bevölkerung.

Vor der Berechnung der Durchschnittswerte müssen die Einheiten der untersuchten Population gruppiert werden, wobei qualitativ homogene Gruppen hervorgehoben werden.

Der für die Gesamtbevölkerung berechnete Durchschnitt wird als allgemeiner Durchschnitt und für jede Gruppe als Gruppendurchschnitt bezeichnet.

Es gibt zwei Arten von Durchschnitten: Leistung (arithmetischer Durchschnitt, harmonischer Durchschnitt, geometrischer Durchschnitt, quadratischer Mittelwert); strukturell (Modus, Median, Quartile, Dezile).

Die Wahl des Durchschnitts für die Berechnung hängt vom Zweck ab.

Arten von Leistungsmittelwerten und Methoden zu ihrer Berechnung. In der Praxis der statistischen Verarbeitung des gesammelten Materials treten verschiedene Probleme auf, für deren Lösung unterschiedliche Mittelwerte erforderlich sind.

Die mathematische Statistik leitet verschiedene Mittelwerte aus Potenzmittelformeln ab:

wo ist der Durchschnittswert; x - individuelle Optionen (Merkmalswerte); z - Exponent (bei z = 1 - arithmetisches Mittel, z = 0 geometrisches Mittel, z = - 1 - harmonisches Mittel, z = 2 - quadratisches Mittel).

Die Frage, welche Art von Durchschnitt im Einzelfall anzuwenden ist, wird jedoch durch eine spezifische Analyse der untersuchten Population gelöst.

Die häufigste Art des Durchschnitts in der Statistik ist arithmetisches Mittel. Es wird in den Fällen berechnet, in denen das Volumen des gemittelten Attributs als Summe seiner Werte für einzelne Einheiten der untersuchten statistischen Grundgesamtheit gebildet wird.

Je nach Art der Ausgangsdaten wird der arithmetische Mittelwert auf unterschiedliche Weise ermittelt:

Wenn die Daten nicht gruppiert sind, erfolgt die Berechnung nach der Formel eines einfachen Mittelwerts

Berechnung des arithmetischen Mittels in einer diskreten Reihe erfolgt nach Formel 3.4.

Berechnung des arithmetischen Mittels in der Intervallreihe. In einer Intervallvariationsreihe, bei der die Mitte des Intervalls bedingt als Wert eines Merkmals in jeder Gruppe genommen wird, kann das arithmetische Mittel von dem aus nicht gruppierten Daten berechneten Mittel abweichen. Je größer das Intervall in Gruppen ist, desto größer sind außerdem die möglichen Abweichungen des aus gruppierten Daten berechneten Durchschnitts von dem aus nicht gruppierten Daten berechneten Durchschnitt.

Bei der Berechnung des Durchschnitts für eine Reihe von Intervallvariationen geht man zur Durchführung der erforderlichen Berechnungen von den Intervallen zu ihren Mittelpunkten über. Berechnen Sie dann den Durchschnittswert nach der Formel des arithmetisch gewichteten Durchschnitts.

Eigenschaften des arithmetischen Mittels. Das arithmetische Mittel hat einige Eigenschaften, die es uns ermöglichen, Berechnungen zu vereinfachen, betrachten wir sie.

1. Das arithmetische Mittel der konstanten Zahlen ist gleich dieser konstanten Zahl.

Wenn x = a. Dann .

2. Wenn die Gewichte aller Optionen proportional geändert werden, d.h. gleich oft erhöhen oder verringern, dann ändert sich das arithmetische Mittel der neuen Reihe hiervon nicht.

Wenn alle Gewichte f um k-mal reduziert werden, dann .

3. Die Summe der positiven und negativen Abweichungen der einzelnen Optionen vom Durchschnitt, multipliziert mit den Gewichten, ist gleich Null, d.h.

Wenn, dann . Von hier.

Wenn alle Optionen um eine Zahl verringert oder erhöht werden, wird das arithmetische Mittel der neuen Reihe um denselben Betrag verringert oder erhöht.

Reduzieren Sie alle Optionen x auf der a, d.h. x´ = xa.

Dann

Das arithmetische Mittel der Anfangsreihe erhält man, indem man zum reduzierten Mittel die zuvor von den Varianten subtrahierte Zahl addiert a, d.h. .

5. Wenn alle Optionen reduziert oder erhöht werden k Mal, dann wird das arithmetische Mittel der neuen Reihe um den gleichen Betrag abnehmen oder zunehmen, d.h. in k einmal.

Lass dann .

Daher, d.h. Um den Durchschnitt der ursprünglichen Reihe zu erhalten, muss das arithmetische Mittel der neuen Reihe (mit reduzierten Optionen) um erhöht werden k einmal.

Durchschnittliche Oberschwingung. Das harmonische Mittel ist der Kehrwert des arithmetischen Mittels. Es wird verwendet, wenn statistische Informationen keine Häufigkeiten für einzelne Populationsoptionen enthalten, sondern als deren Produkt (M = xf) dargestellt werden. Der harmonische Mittelwert wird nach Formel 3.5 berechnet

Die praktische Anwendung des harmonischen Mittels besteht darin, einige Indizes zu berechnen, insbesondere den Preisindex.

Geometrisches Mittel. Bei der Verwendung des geometrischen Mittels sind die Einzelwerte des Attributs in der Regel relative Werte der Dynamik, aufgebaut in Form von Kettenwerten, im Verhältnis zur vorherigen Stufe jeder Stufe in der Dynamikreihe . Der Durchschnitt charakterisiert somit die durchschnittliche Wachstumsrate.

Das geometrische Mittel wird auch verwendet, um den äquidistanten Wert aus den maximalen und minimalen Werten des Attributs zu bestimmen. Beispielsweise schließt eine Versicherungsgesellschaft Verträge über die Erbringung von Autoversicherungsleistungen ab. Je nach Versicherungsfall kann die Versicherungsleistung zwischen 10.000 und 100.000 Euro pro Jahr betragen. Die durchschnittliche Versicherungsauszahlung beträgt US$.

Der geometrische Mittelwert ist der Wert, der als Durchschnitt der Verhältnisse oder in der Verteilungsreihe verwendet wird, dargestellt als geometrische Progression, wenn z = 0. Dieser Durchschnitt ist praktisch zu verwenden, wenn nicht auf absolute Unterschiede geachtet wird, sondern auf die Verhältnisse von zwei Nummern.

Formeln zur Berechnung sind wie folgt

wo sind Varianten des gemittelten Merkmals; - das Produkt von Optionen; f– Häufigkeit der Optionen.

Das geometrische Mittel wird zur Berechnung der durchschnittlichen jährlichen Wachstumsraten verwendet.

Quadratischer Mittelwert. Mit der quadratischen Mittelwertformel wird der Schwankungsgrad der Einzelwerte eines Merkmals um das arithmetische Mittel in der Verteilungsreihe gemessen. Bei der Berechnung der Variationsindikatoren wird der Durchschnitt also aus den Quadraten der Abweichungen der Einzelwerte des Merkmals vom arithmetischen Mittel berechnet.

Der mittlere quadratische Wert wird durch die Formel berechnet

In der Wirtschaftsforschung wird die modifizierte Form des quadratischen Mittelwerts häufig zur Berechnung von Indikatoren für die Variation eines Merkmals verwendet, z. B. Varianz, Standardabweichung.

Mehrheitsregel. Zwischen Potenzgesetzmittelwerten besteht folgender Zusammenhang – je größer der Exponent, desto größer der Mittelwert, Tabelle 5.4:

Tabelle 5.4

Verhältnis zwischen Durchschnittswerten

z-Wert

Das Verhältnis zwischen den Durchschnittswerten

Diese Beziehung wird Majoranzregel genannt.

Strukturelle Durchschnitte. Zur Charakterisierung der Bevölkerungsstruktur werden spezielle Indikatoren verwendet, die als strukturelle Durchschnitte bezeichnet werden können. Diese Maße umfassen Modus, Median, Quartile und Dezile.

Mode. Modus (Mo) ist der am häufigsten vorkommende Wert eines Merkmals in Bevölkerungseinheiten. Modus ist der Wert des Attributs, das dem höchsten Punkt der theoretischen Verteilungskurve entspricht.

Mode wird in der Handelspraxis häufig bei der Untersuchung der Verbrauchernachfrage (bei der Bestimmung der Größe von stark nachgefragten Kleidungsstücken und Schuhen) und der Preisregistrierung verwendet. Es kann insgesamt mehrere Mods geben.

Modusberechnung in einer diskreten Reihe. In einer diskreten Reihe ist der Modus die Variante mit der höchsten Frequenz. Erwägen Sie, einen Modus in einer diskreten Reihe zu finden.

Berechnung der Mode in einer Intervallreihe. In der Intervallvariationsreihe wird die zentrale Variante des modalen Intervalls näherungsweise als Modus betrachtet, d.h. das Intervall mit der höchsten Häufigkeit (Frequenz). Innerhalb des Intervalls ist es notwendig, den Wert des Attributs zu finden, das der Modus ist. Bei einer Intervallserie wird der Modus durch die Formel bestimmt

wo ist die untere Grenze des modalen Intervalls; der Wert des modalen Intervalls ist; die Frequenz ist, die dem modalen Intervall entspricht; die Frequenz ist, die dem modalen Intervall vorausgeht; ist die Häufigkeit des Intervalls nach dem Modal.

Median. Der Median () ist der Wert des Merkmals in der mittleren Einheit der Rangfolge. Eine Rangreihe ist eine Reihe, in der die Kennwerte in aufsteigender oder absteigender Reihenfolge geschrieben werden. Oder der Median ist ein Wert, der die Anzahl einer geordneten Variationsreihe in zwei gleiche Teile teilt: Ein Teil hat einen Wert eines variablen Merkmals, der kleiner als die durchschnittliche Variante ist, und der andere ist groß.

Um den Median zu finden, wird zunächst seine Seriennummer ermittelt. Dazu wird bei einer ungeraden Anzahl von Einheiten zur Summe aller Frequenzen eins addiert und alles durch zwei geteilt. Bei einer geraden Anzahl von Einheiten ergibt sich der Median als Wert des Attributs der Einheit, deren Seriennummer sich aus der Gesamtsumme der Häufigkeiten dividiert durch zwei ergibt. Wenn man die Ordnungszahl des Medians kennt, ist es einfach, seinen Wert aus den akkumulierten Häufigkeiten zu finden.

Berechnung des Medians in einer diskreten Reihe. Gemäß der Stichprobenerhebung wurden Daten zur Verteilung der Familien nach der Anzahl der Kinder erhoben, Tabelle. 5.5. Um den Median zu bestimmen, bestimmen Sie zunächst seine Ordnungszahl

=

Dann bauen wir eine Reihe von kumulierten Häufigkeiten (, durch die Seriennummer und die kumulierte Häufigkeit finden wir den Median. Die kumulierte Häufigkeit 33 zeigt, dass in 33 Familien die Anzahl der Kinder 1 Kind nicht überschreitet, aber da die Anzahl der Median ist 50 liegt der Median im Intervall von 34 bis 55 Familien.

Tabelle 5.5

Verteilung der Anzahl der Familien aus der Anzahl der Kinder

Anzahl der Kinder in der Familie

Die Anzahl der Familien ist der Wert des Medianintervalls;

Alle betrachteten Formen des Potenzmittels haben eine wichtige Eigenschaft (im Gegensatz zu Strukturmitteln) – die Formel zur Bestimmung des Mittelwerts umfasst alle Werte der Reihe, d.h. die Größe des Durchschnitts wird durch den Wert jeder Option beeinflusst.

Das ist einerseits eine sehr positive Eigenschaft. in diesem Fall wird die Wirkung aller Ursachen berücksichtigt, die alle Einheiten der untersuchten Population betreffen. Andererseits kann sogar eine Beobachtung, die versehentlich in die Ausgangsdaten aufgenommen wurde, die Vorstellung vom Entwicklungsstand des untersuchten Merkmals in der betrachteten Population (insbesondere in kurzen Serien) erheblich verzerren.

Quartile und Dezile. In Analogie zum Ermitteln des Medians in Variationsreihen kann man den Wert eines Merkmals in jeder geordneten Reiheneinheit in der Reihenfolge finden. So kann man insbesondere den Wert eines Merkmals für Einheiten finden, indem man die Reihe in 4 gleiche Teile, in 10 usw. teilt.

Quartile. Varianten, die die Rangfolge in vier gleiche Teile teilen, werden als Quartile bezeichnet.

Gleichzeitig wird Folgendes unterschieden: das untere (oder erste) Quartil (Q1) - der Wert des Merkmals der Einheit der Rangfolge, der die Bevölkerung im Verhältnis ¼ zu ¾ und das obere (oder dritte) teilt ) Quartil (Q3) - der Wert des Merkmals der Einheit der Rangfolge, der die Bevölkerung im Verhältnis ¾ zu ¼ teilt.

Das zweite Quartil ist der Median Q2 = Me. Das untere und obere Quartil in der Intervallreihe werden mit der Formel ähnlich dem Median berechnet.

wobei die untere Grenze des Intervalls ist, das das untere bzw. obere Quartil enthält;

ist die kumulative Häufigkeit des Intervalls, das dem Intervall vorausgeht, das das untere oder obere Quartil enthält;

– Häufigkeiten von Quartilintervallen (unteres und oberes)

Die Intervalle, die Q1 und Q3 enthalten, werden aus den akkumulierten Häufigkeiten (oder Häufigkeiten) bestimmt.

Dezile. Neben Quartilen werden Dezile berechnet - Optionen, die die Rangfolge in 10 gleiche Teile teilen.

Sie werden mit D bezeichnet, das erste Dezil D1 teilt die Reihe im Verhältnis 1/10 und 9/10, das zweite D2 - 2/10 und 8/10 usw. Sie werden auf die gleiche Weise berechnet wie der Median und die Quartile.

Sowohl der Median, als auch Quartile und Dezile gehören zur sogenannten Ordinalstatistik, worunter eine Variante verstanden wird, die in einer Rangfolge einen bestimmten Ordinalplatz einnimmt.

Mit der Gruppierungsmethode können Sie auch messen Variation(Variabilität, Fluktuation) von Vorzeichen. Bei einer relativ kleinen Anzahl von Bevölkerungseinheiten wird die Variation auf der Grundlage einer Rangfolge von Einheiten gemessen, aus denen die Bevölkerung besteht. Die Zeile wird aufgerufen rangiert wenn die Einheiten aufsteigend (absteigend) angeordnet sind.

Rangreihen sind jedoch eher indikativ, wenn ein vergleichendes Merkmal der Streuung benötigt wird. Außerdem hat man es in vielen Fällen mit statistischen Aggregaten zu tun, die aus einer großen Anzahl von Einheiten bestehen, die in Form einer bestimmten Reihe praktisch nur schwer darstellbar sind. In diesem Zusammenhang werden zum ersten allgemeinen Kennenlernen statistischer Daten und insbesondere zum Erleichtern des Studiums der Zeichenvariation die untersuchten Phänomene und Prozesse in Gruppen zusammengefasst und die Ergebnisse der Gruppierung in Form von Gruppentabellen erstellt .

Wenn in der Gruppentabelle nur zwei Spalten vorhanden sind - Gruppen nach dem ausgewählten Merkmal (Optionen) und der Anzahl der Gruppen (Frequenzen oder Frequenzen), wird sie aufgerufen Nahverteilung.

Verbreitungsgebiet - die einfachste Art der strukturellen Gruppierung nach einem Merkmal, dargestellt in einer Gruppentabelle mit zwei Spalten, die Varianten und Häufigkeiten des Merkmals enthalten. In vielen Fällen ist bei einer solchen baulichen Gruppierung, d.h. Mit der Erstellung von Verteilungsreihen beginnt die Untersuchung des statistischen Ausgangsmaterials.

Aus einer Strukturgruppierung in Form einer Verteilungsreihe kann eine echte Strukturgruppierung werden, wenn die ausgewählten Gruppen nicht nur durch Häufigkeiten, sondern auch durch andere statistische Indikatoren charakterisiert werden. Der Hauptzweck von Verteilungsserien besteht darin, die Variation von Merkmalen zu untersuchen. Die Theorie der Verteilungsreihen wird im Detail von der mathematischen Statistik entwickelt.

Die Verteilungsserien sind unterteilt in attributiv(Gruppierung nach attributiven Merkmalen, z. B. die Aufteilung der Bevölkerung nach Geschlecht, Nationalität, Familienstand usw.) und variabel(Gruppierung nach quantitativen Merkmalen).

Variationsreihe ist eine Gruppentabelle, die zwei Spalten enthält: eine Gruppierung von Einheiten gemäß einem quantitativen Attribut und die Anzahl der Einheiten in jeder Gruppe. Die Intervalle in den Variationsreihen sind in der Regel gleich und geschlossen ausgebildet. Die Variationsreihe ist die folgende Gruppierung der russischen Bevölkerung in Bezug auf das durchschnittliche Bareinkommen pro Kopf (Tabelle 3.10).

Tabelle 3.10

Verteilung der russischen Bevölkerung nach dem durchschnittlichen Pro-Kopf-Einkommen in den Jahren 2004-2009

Bevölkerungsgruppen nach durchschnittlichem Pro-Kopf-Bareinkommen, Rubel/Monat

Bevölkerung in der Gruppe, in % der Gesamtzahl

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Über 25.000,0

Alle Bevölkerung

Variationsreihen wiederum werden in diskrete und Intervalle unterteilt. Diskret Variationsserien kombinieren Varianten von diskreten Merkmalen, die innerhalb enger Grenzen variieren. Ein Beispiel für eine diskrete Variationsreihe ist die Verteilung russischer Familien nach der Anzahl ihrer Kinder.

Intervall Variationsserien kombinieren Varianten von entweder kontinuierlichen Merkmalen oder diskreten Merkmalen, die sich über einen weiten Bereich ändern. Die Intervallreihe ist die Variationsreihe der Verteilung der russischen Bevölkerung in Bezug auf das durchschnittliche Pro-Kopf-Bareinkommen.

Diskrete Variationsreihen werden in der Praxis nicht sehr oft verwendet. Deren Zusammenstellung ist mittlerweile unproblematisch, da die Zusammensetzung der Gruppen durch die konkreten Varianten bestimmt wird, die die untersuchten Gruppierungsmerkmale tatsächlich besitzen.

Intervall-Variationsreihen sind weiter verbreitet. Bei deren Zusammenstellung stellt sich die schwierige Frage nach der Anzahl der Gruppen sowie nach der Größe der zu bildenden Intervalle.

Die Grundsätze zur Lösung dieses Problems sind im Kapitel über die Methodik zur Erstellung statistischer Gruppierungen dargelegt (siehe Abschnitt 3.3).

Variationsreihen sind ein Mittel, um verschiedene Informationen in eine kompakte Form zu bringen oder zu komprimieren; sie können verwendet werden, um ein ziemlich klares Urteil über die Art der Variation zu treffen, um die Unterschiede in den Vorzeichen der Phänomene zu untersuchen, die in der untersuchten Menge enthalten sind. Die wichtigste Bedeutung der Variationsreihen besteht aber darin, dass auf ihrer Grundlage die speziellen verallgemeinernden Merkmale der Variation berechnet werden (siehe Kapitel 7).

Variationsreihe: Definition, Typen, Hauptmerkmale. Berechnungsmethode
Mode, Median, arithmetisches Mittel in medizinischen und statistischen Studien
(Zeigen Sie an einem bedingten Beispiel).

Eine Variationsreihe ist eine Reihe von Zahlenwerten des untersuchten Merkmals, die sich in ihrer Größe voneinander unterscheiden und in einer bestimmten Reihenfolge (in aufsteigender oder absteigender Reihenfolge) angeordnet sind. Jeder Zahlenwert der Reihe wird als Variante (V) bezeichnet, und die Zahl, die angibt, wie oft diese oder jene Variante in der Zusammensetzung dieser Reihe vorkommt, wird als Häufigkeit (p) bezeichnet.

Die Gesamtzahl der Beobachtungsfälle, aus denen die Variationsreihe besteht, wird mit dem Buchstaben n bezeichnet. Der Unterschied in der Bedeutung der untersuchten Merkmale wird als Variation bezeichnet. Wenn die Variable Vorzeichen kein quantitatives Maß hat, wird die Variation als qualitativ und die Verteilungsreihe als Attribut bezeichnet (z. B. Verteilung nach Krankheitsausgang, Gesundheitszustand usw.).

Wenn ein variables Vorzeichen einen quantitativen Ausdruck hat, wird eine solche Variation als quantitativ und die Verteilungsreihe als Variation bezeichnet.

Variationsreihen werden unterteilt in diskontinuierliche und kontinuierliche - je nach Art des quantitativen Merkmals, einfache und gewichtete - je nach Häufigkeit des Auftretens der Variante.

In einer einfachen Variationsreihe kommt jede Variante nur einmal vor (p=1), in einer gewichteten kommt dieselbe Variante mehrmals vor (p>1). Beispiele für solche Reihen werden später im Text besprochen. Wenn das quantitative Attribut stetig ist, d.h. zwischen ganzzahligen Werten gibt es gebrochene Zwischenwerte, die Variationsreihe wird als kontinuierlich bezeichnet.

Zum Beispiel: 10.0 - 11.9

14,0 - 15,9 usw.

Wenn das quantitative Vorzeichen diskontinuierlich ist, d.h. seine einzelnen Werte (Optionen) unterscheiden sich um eine ganze Zahl und haben keine Zwischenbruchwerte, die Variationsreihe wird als diskontinuierlich oder diskret bezeichnet.

Verwenden Sie die Daten aus dem vorherigen Beispiel zur Herzfrequenz

für 21 Schüler werden wir eine Variationsreihe aufbauen (Tabelle 1).

Tabelle 1

Verteilung der Medizinstudenten nach Pulsfrequenz (bpm)

Eine Variationsreihe aufzubauen bedeutet also, die vorhandenen Zahlenwerte (Optionen) zu systematisieren, zu rationalisieren, d.h. in einer bestimmten Reihenfolge (in aufsteigender oder absteigender Reihenfolge) mit ihren entsprechenden Frequenzen anordnen. Im betrachteten Beispiel sind die Optionen aufsteigend geordnet und als diskontinuierliche (diskrete) ganze Zahl ausgedrückt, jede Option kommt mehrfach vor, d.h. wir haben es mit einer gewichteten, unstetigen oder diskreten Variationsreihe zu tun.

Wenn die Anzahl der Beobachtungen in der von uns untersuchten statistischen Population 30 nicht überschreitet, reicht es in der Regel aus, alle Werte des untersuchten Merkmals in einer Variationsreihe in aufsteigender Reihenfolge wie in Tabelle anzuordnen. 1 oder in absteigender Reihenfolge.

Bei einer großen Anzahl von Beobachtungen (n>30) kann die Anzahl der vorkommenden Varianten sehr groß sein, in diesem Fall wird eine Intervall- oder gruppierte Variationsreihe erstellt, in der, um die spätere Bearbeitung zu vereinfachen und die Art der Verteilung zu verdeutlichen, die Varianten werden in Gruppen zusammengefasst.

Normalerweise reicht die Anzahl der Gruppenoptionen von 8 bis 15.

Es müssen mindestens 5 sein, denn. Andernfalls wird es zu grob, zu stark vergrößert, was das Gesamtbild der Schwankungen verzerrt und die Genauigkeit der Mittelwerte stark beeinträchtigt. Wenn die Anzahl der Gruppenoptionen mehr als 20-25 beträgt, erhöht sich die Genauigkeit der Berechnung der Durchschnittswerte, aber die Merkmale der Merkmalsvariation werden erheblich verzerrt und die mathematische Verarbeitung wird komplizierter.

Bei der Zusammenstellung einer gruppierten Serie ist dies zu berücksichtigen

− Variantengruppen müssen in einer bestimmten Reihenfolge angeordnet werden (aufsteigend oder absteigend);

- die Intervalle in den Variantengruppen sollten gleich sein;

− Die Werte der Grenzen der Intervalle sollten nicht übereinstimmen, weil es wird nicht klar sein, welchen Gruppen einzelne Optionen zugeordnet werden sollen;

- Bei der Festlegung der Intervallgrenzen müssen die qualitativen Merkmale des gesammelten Materials berücksichtigt werden (z. B. ist bei der Untersuchung des Gewichts von Erwachsenen ein Intervall von 3-4 kg akzeptabel und für Kinder in den ersten Monaten des Lebens sollte es 100 g nicht überschreiten.)

Bauen wir eine gruppierte (Intervall-)Reihe, die die Daten zur Pulsfrequenz (Anzahl der Schläge pro Minute) für 55 Medizinstudenten vor der Prüfung charakterisiert: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Um eine gruppierte Serie zu erstellen, benötigen Sie:

1. Bestimmen Sie den Wert des Intervalls;

2. Mitte, Anfang und Ende der Gruppen der Variante der Variationsreihe bestimmen.

● Der Wert des Intervalls (i) wird durch die Anzahl der erwarteten Gruppen (r) bestimmt, deren Anzahl in Abhängigkeit von der Anzahl der Beobachtungen (n) gemäß einer speziellen Tabelle festgelegt wird

Anzahl der Gruppen abhängig von der Anzahl der Beobachtungen:

In unserem Fall können bei 55 Schülern 8 bis 10 Gruppen gebildet werden.

Der Wert des Intervalls (i) wird durch die folgende Formel bestimmt -

i = Vmax-Vmin/r

In unserem Beispiel ist der Wert des Intervalls 82-58/8= 3.

Wenn der Intervallwert eine Bruchzahl ist, sollte das Ergebnis auf eine Ganzzahl aufgerundet werden.

Es gibt verschiedene Arten von Durchschnittswerten:

● arithmetisches Mittel,

● geometrisches Mittel,

● harmonisches Mittel,

● quadratischer Mittelwert,

● mittel progressiv,

● Mittelwert

In der medizinischen Statistik werden am häufigsten arithmetische Mittelwerte verwendet.

Der arithmetische Mittelwert (M) ist ein verallgemeinernder Wert, der den typischen Wert bestimmt, der für die gesamte Population charakteristisch ist. Die Hauptmethoden zur Berechnung von M sind: die Methode des arithmetischen Mittels und die Methode der Momente (bedingte Abweichungen).

Das arithmetische Mittelverfahren dient zur Berechnung des einfachen arithmetischen Mittels und des gewichteten arithmetischen Mittels. Die Wahl der Methode zur Berechnung des arithmetischen Mittelwertes hängt von der Art der Variationsreihe ab. Bei einer einfachen Variationsreihe, in der jede Variante nur einmal vorkommt, wird das einfache arithmetische Mittel durch die Formel bestimmt:

wobei: М – arithmetischer Mittelwert;

V ist der Wert des variablen Merkmals (Optionen);

Σ - gibt die Aktion an - Summierung;

n ist die Gesamtzahl der Beobachtungen.

Ein Beispiel für die Berechnung des arithmetischen Mittels ist einfach. Atemfrequenz (Anzahl der Atemzüge pro Minute) bei 9 Männern im Alter von 35 Jahren: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Um die durchschnittliche Atemfrequenz bei Männern im Alter von 35 Jahren zu bestimmen, ist Folgendes erforderlich:

1. Erstellen Sie eine Variationsreihe, indem Sie alle Optionen in aufsteigender oder absteigender Reihenfolge anordnen Wir haben eine einfache Variationsreihe, weil Variantenwerte kommen nur einmal vor.

M = ∑V/n = 171/9 = 19 Atemzüge pro Minute

Fazit. Die Atemfrequenz bei Männern im Alter von 35 Jahren beträgt im Durchschnitt 19 Atemzüge pro Minute.

Wenn sich die einzelnen Werte der Variante wiederholen, ist es nicht nötig, jede Variante in einer Zeile auszuschreiben, es reicht aus, die auftretenden Maße der Variante aufzulisten (V) und daneben die Anzahl ihrer Wiederholungen anzugeben ( p). eine solche Variationsreihe, bei der die Optionen gleichsam nach der Anzahl der ihnen entsprechenden Häufigkeiten gewichtet sind, heißt gewichtete Variationsreihe, und der berechnete Mittelwert ist der arithmetisch gewichtete Durchschnitt.

Der arithmetisch gewichtete Durchschnitt wird nach folgender Formel bestimmt: M= ∑Vp/n

wobei n die Anzahl der Beobachtungen gleich der Summe der Häufigkeiten ist - Σr.

Ein Beispiel für die Berechnung des arithmetisch gewichteten Durchschnitts.

Die Dauer der Behinderung (in Tagen) bei 35 Patienten mit akuten Atemwegserkrankungen (ARI), die im ersten Quartal des laufenden Jahres von einem örtlichen Arzt behandelt wurden, betrug: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 Tage .

Die Methodik zur Bestimmung der durchschnittlichen Dauer der Behinderung bei Patienten mit akuten Atemwegsinfektionen lautet wie folgt:

1. Lassen Sie uns eine gewichtete Variationsreihe aufbauen, weil einzelne Variantenwerte werden mehrfach wiederholt. Dazu können Sie alle Optionen in aufsteigender oder absteigender Reihenfolge mit ihren entsprechenden Häufigkeiten anordnen.

In unserem Fall sind die Optionen in aufsteigender Reihenfolge.

2. Berechnen Sie den arithmetisch gewichteten Durchschnitt mit der Formel: M = ∑Vp/n = 233/35 = 6,7 Tage

Verteilung der Patienten mit akuten Atemwegsinfektionen nach Dauer der Behinderung:

Dauer der Arbeitsunfähigkeit (V) Anzahl der Patienten (p) vp
∑p = n = 35 ∑Vp = 233

Fazit. Die Dauer der Behinderung bei Patienten mit akuten Atemwegserkrankungen betrug im Durchschnitt 6,7 Tage.

Mode (Mo) ist die häufigste Variante in der Variationsreihe. Für die in der Tabelle dargestellte Verteilung entspricht der Modus der Variante gleich 10, er kommt häufiger vor als andere - 6 mal.

Verteilung der Patienten nach Verweildauer in einem Krankenhausbett (in Tagen)

v
p

Manchmal ist es schwierig, den genauen Wert des Modus zu bestimmen, da es mehrere Beobachtungen in den untersuchten Daten geben kann, die „am häufigsten“ vorkommen.

Der Median (Me) ist ein nichtparametrischer Indikator, der die Variationsreihe in zwei gleiche Hälften teilt: Auf beiden Seiten des Medians befindet sich die gleiche Anzahl von Optionen.

Für die in der Tabelle gezeigte Verteilung ist der Median beispielsweise 10, weil auf beiden Seiten dieses Wertes befindet sich auf der 14. Option, d.h. Die Zahl 10 nimmt in dieser Reihe eine zentrale Position ein und ist ihr Median.

Da die Anzahl der Beobachtungen in diesem Beispiel gerade ist (n=34), kann der Median wie folgt bestimmt werden:

Ich = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Das bedeutet, dass die Mitte der Reihe auf die siebzehnte Option fällt, was einem Median von 10 entspricht. Für die in der Tabelle dargestellte Verteilung beträgt das arithmetische Mittel:

M = ∑Vp/n = 334/34 = 10,1

Also für 34 Beobachtungen aus Tabelle. 8, wir haben: Mo=10, Me=10, arithmetisches Mittel (M) ist 10,1. In unserem Beispiel erwiesen sich alle drei Indikatoren als gleich oder nahe beieinander, obwohl sie völlig unterschiedlich sind.

Das arithmetische Mittel ist die resultierende Summe aller Einflüsse, an seiner Bildung sind ausnahmslos alle Varianten beteiligt, auch extreme, oft untypisch für ein bestimmtes Phänomen oder eine Menge.

Modus und Median hängen im Gegensatz zum arithmetischen Mittel nicht vom Wert aller Einzelwerte des Variablenattributs ab (die Werte der Extremvarianten und der Streuungsgrad der Reihe). Das arithmetische Mittel charakterisiert die gesamte Masse der Beobachtungen, Modus und Median charakterisieren die Masse

Statistische Verbreitungsreihen- Dies ist eine geordnete Verteilung von Bevölkerungseinheiten in Gruppen nach einem bestimmten variierenden Merkmal.
Je nach Merkmal, das der Bildung einer Verbreitungsreihe zugrunde liegt, gibt es Attribut- und Variationsverteilungsreihen.

Das Vorhandensein eines gemeinsamen Merkmals ist die Grundlage für die Bildung einer statistischen Grundgesamtheit, die das Ergebnis einer Beschreibung oder Messung gemeinsamer Merkmale der Untersuchungsobjekte ist.

Studiengegenstand der Statistik sind wechselnde (veränderliche) Merkmale oder statistische Merkmale.

Arten von statistischen Merkmalen.

Verteilungsreihen werden Attributreihen genannt. aus Qualitätsgründen gebaut. Attributiv- Dies ist ein Zeichen mit einem Namen (z. B. ein Beruf: Näherin, Lehrerin usw.).
Es ist üblich, die Verteilungsreihen in Form von Tabellen zu ordnen. Im Tisch. 2.8 zeigt eine Attributreihe der Verteilung.
Tabelle 2.8 - Verteilung der Arten der Rechtshilfe, die Anwälte Bürgern einer der Regionen der Russischen Föderation leisten.

Variationsreihe sind Merkmalswerte (oder Wertebereiche) und deren Häufigkeiten.
Variationsserien sind Verteilungsserien quantitativ aufgebaut. Jede Variationsreihe besteht aus zwei Elementen: Varianten und Frequenzen.
Varianten sind Einzelwerte eines Merkmals, die es in einer Variationsreihe aufnimmt.
Häufigkeiten sind die Anzahlen einzelner Varianten oder jeder Gruppe der Variantenreihe, d.h. dies sind Zahlen, die angeben, wie oft bestimmte Optionen in einer Verteilungsserie vorkommen. Die Summe aller Häufigkeiten bestimmt die Größe der Gesamtpopulation, ihr Volumen.
Frequenzen werden Frequenzen genannt, ausgedrückt in Bruchteilen einer Einheit oder als Prozentsatz der Gesamtheit. Dementsprechend ist die Summe der Häufigkeiten gleich 1 oder 100 %. Die Variationsreihe ermöglicht es uns, die Form des Verteilungsgesetzes auf der Grundlage tatsächlicher Daten zu bewerten.

Abhängig von der Art der Variation des Merkmals gibt es diskrete und Intervall-Variationsreihen.
Ein Beispiel einer diskreten Variationsreihe ist in der Tabelle angegeben. 2.9.
Tabelle 2.9 - Verteilung der Familien nach der Anzahl der in einzelnen Wohnungen belegten Zimmer im Jahr 1989 in der Russischen Föderation.

Die erste Spalte der Tabelle stellt Varianten einer diskreten Variationsreihe dar, die zweite Spalte enthält die Häufigkeiten der Variationsreihe und die dritte Spalte enthält die Häufigkeitsindikatoren.

Variationsreihe

In der Allgemeinbevölkerung wird ein bestimmtes quantitatives Merkmal untersucht. Eine Volumenprobe wird zufällig daraus entnommen n, das heißt, die Anzahl der Elemente in der Stichprobe ist n. In der ersten Stufe der statistischen Verarbeitung, reicht Proben, d.h. Nummer bestellen x 1 , x 2 , …, x n Aufsteigend. Jeder beobachtete Wert x ich genannt Möglichkeit. Frequenz m ich ist die Anzahl der Beobachtungen des Werts x ich in der Probe. Relative Häufigkeit (Frequenz) w ich ist das Frequenzverhältnis m ich zur Stichprobengröße n: .
Beim Studium einer Variationsreihe werden auch die Konzepte der kumulativen Häufigkeit und der kumulativen Häufigkeit verwendet. Lassen x irgendeine Zahl. Dann die Anzahl der Optionen , dessen Werte geringer sind x, wird die akkumulierte Häufigkeit genannt: für x i n wird die akkumulierte Frequenz w i max genannt.
Ein Attribut wird als diskret variabel bezeichnet, wenn sich seine einzelnen Werte (Varianten) um einen endlichen Betrag (normalerweise eine ganze Zahl) voneinander unterscheiden. Eine Variationsreihe eines solchen Merkmals wird als diskrete Variationsreihe bezeichnet.

Tabelle 1. Allgemeine Ansicht der diskreten Variationsreihe von Frequenzen

Eigenschaftswertex ich x 1 x2 x n
Frequenzenm ich m 1 m2 m n

Ein Attribut wird als kontinuierlich variierend bezeichnet, wenn seine Werte um einen beliebig kleinen Betrag voneinander abweichen, d.h. das Vorzeichen kann in einem bestimmten Intervall einen beliebigen Wert annehmen. Eine kontinuierliche Variationsreihe für ein solches Merkmal wird als Intervallreihe bezeichnet.

Tabelle 2. Allgemeine Ansicht der Intervallvariationsreihe von Frequenzen

Tabelle 3. Grafische Darstellungen der Variationsreihe

Die ZeilePolygon oder HistogrammEmpirische Verteilungsfunktion
Diskret
Intervall
Betrachtet man die Ergebnisse der Beobachtungen, wird bestimmt, wie viele Werte der Optionen in jedes spezifische Intervall fielen. Es wird angenommen, dass jedes Intervall zu einem seiner Enden gehört: entweder in allen Fällen links (häufiger) oder in allen Fällen rechts, und die Häufigkeiten oder Häufigkeiten zeigen die Anzahl der Optionen, die in den angegebenen Grenzen enthalten sind. Unterschiede ein ich – ein ich +1 werden Teilintervalle genannt. Um nachfolgende Berechnungen zu vereinfachen, kann die Intervallvariationsreihe durch eine bedingt diskrete ersetzt werden. In diesem Fall der Mittelwert ich-ten Intervall wird als Option genommen x ich, und die entsprechende Intervallfrequenz m ich- für die Häufigkeit dieses Intervalls.
Zur grafischen Darstellung von Variationsreihen werden am häufigsten Polygone, Histogramme, Summenkurven und empirische Verteilungsfunktionen verwendet.

Im Tisch. 2.3 (Gruppierung der Bevölkerung Russlands nach der Größe des durchschnittlichen Pro-Kopf-Einkommens im April 1994) dargestellt Reihe von Intervallvariationen.
Es ist bequem, die Verteilungsreihe mit einer grafischen Darstellung zu analysieren, die es auch ermöglicht, die Form der Verteilung zu beurteilen. Eine visuelle Darstellung der Art der Änderung in den Frequenzen der Variationsreihen ist gegeben durch Polygon und Histogramm.
Das Polygon wird verwendet, wenn diskrete Variationsreihen angezeigt werden.
Stellen wir uns beispielsweise die Verteilung des Wohnungsbestands nach Wohnungstypen grafisch vor (Tab. 2.10).
Tabelle 2.10 - Verteilung des Wohnungsbestands im Stadtgebiet nach Wohnungstyp (bedingte Zahlen).


Reis. Wohnungsverteilungspolygon


Auf der y-Achse können nicht nur die Werte von Häufigkeiten, sondern auch die Häufigkeiten der Variationsreihen aufgetragen werden.
Das Histogramm wird verwendet, um die Intervallvariationsreihe anzuzeigen. Beim Erstellen eines Histogramms werden die Werte der Intervalle auf der Abszissenachse aufgetragen, und die Häufigkeiten werden durch Rechtecke dargestellt, die auf den entsprechenden Intervallen aufgebaut sind. Die Höhe der Säulen sollte bei gleichen Abständen proportional zu den Häufigkeiten sein. Ein Histogramm ist ein Diagramm, in dem eine Reihe als nebeneinander liegende Balken dargestellt wird.
Lassen Sie uns die in Tabelle angegebene Intervallverteilungsreihe grafisch darstellen. 2.11.
Tabelle 2.11 - Verteilung der Familien nach Größe der Wohnfläche pro Person (bedingte Zahlen).
N p / p Familiengruppen nach Größe der Wohnfläche pro Person Anzahl der Familien mit einer gegebenen Wohnfläche Kumulierte Anzahl von Familien
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
GESAMT 115 ----


Reis. 2.2. Histogramm der Verteilung von Familien nach Wohnfläche pro Person


Unter Verwendung der Daten der akkumulierten Reihen (Tabelle 2.11) konstruieren wir Verteilung kumulativ.


Reis. 2.3. Die kumulierte Verteilung der Familien nach Wohnfläche pro Person


Die Darstellung einer Variationsreihe in Form einer Kumulierung ist besonders effektiv für Variationsreihen, deren Häufigkeiten als Bruchteile oder Prozentsätze der Summe der Häufigkeiten der Reihe ausgedrückt werden.
Wenn wir die Achsen in der grafischen Darstellung der Variationsreihe in Form einer Kumulierung ändern, dann erhalten wir ogivu. Auf Abb. 2.4 zeigt eine Ogive, die auf der Grundlage der Daten in Tabelle gebaut wurde. 2.11.
Ein Histogramm kann in ein Verteilungspolygon umgewandelt werden, indem man die Mittelpunkte der Seiten der Rechtecke findet und diese Punkte dann mit geraden Linien verbindet. Das resultierende Verteilungspolygon ist in Abb. 1 dargestellt. 2.2 gepunktete Linie.
Bei der Erstellung eines Histogramms der Verteilung einer Variationsreihe mit ungleichen Intervallen werden entlang der Ordinatenachse nicht die Häufigkeiten aufgetragen, sondern die Verteilungsdichte des Merkmals in den entsprechenden Intervallen.
Die Verteilungsdichte ist die pro Intervallbreite berechnete Häufigkeit, d.h. wie viele Einheiten in jeder Gruppe sind pro Einheit Intervallwert. Ein Beispiel zur Berechnung der Verteilungsdichte ist in der Tabelle dargestellt. 2.12.
Tabelle 2.12 - Verteilung der Unternehmen nach Anzahl der Beschäftigten (Angaben unter Vorbehalt)
N p / p Unternehmensgruppen nach Anzahl der Beschäftigten, Pers. Anzahl der Unternehmen Intervallgröße, pers. Verteilungsdichte
ABER 1 2 3=1/2
1 bis zu 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
GESAMT 147 ---- ----

Für eine grafische Darstellung können auch Variationsreihen verwendet werden Summenkurve. Mit Hilfe des Kumulierens (der Kurve der Summen) wird eine Reihe von akkumulierten Häufigkeiten angezeigt. Die kumulativen Häufigkeiten werden durch sukzessives Summieren der Häufigkeiten nach Gruppen bestimmt und zeigen, wie viele Einheiten der Grundgesamtheit Merkmalswerte haben, die nicht größer als der betrachtete Wert sind.


Reis. 2.4. Ogiva-Verteilung der Familien nach Größe der Wohnfläche pro Person

Bei der Konstruktion der Kumulierung einer Intervallvariationsreihe werden die Varianten der Reihe entlang der Abszissenachse und die akkumulierten Häufigkeiten entlang der Ordinatenachse aufgetragen.

Kontinuierliche Variationsreihe

Eine kontinuierliche Variationsreihe ist eine Reihe, die auf der Grundlage eines quantitativen statistischen Zeichens aufgebaut ist. Beispiel. Die durchschnittliche Krankheitsdauer von Sträflingen (Tage pro Person) in der Herbst-Winter-Periode im laufenden Jahr betrug:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5

variabel sogenannte Verteilungsreihen, die auf quantitativer Basis aufgebaut sind. Die Werte quantitativer Merkmale in einzelnen Bevölkerungseinheiten sind nicht konstant, sondern unterscheiden sich mehr oder weniger voneinander.

Variation- Fluktuation, Variabilität des Wertes des Attributs in Einheiten der Bevölkerung. Es werden separate numerische Werte des in der untersuchten Population vorkommenden Merkmals genannt Optionen Werte. Die Unzulänglichkeit des Durchschnittswerts für eine vollständige Charakterisierung der Population macht es erforderlich, die Durchschnittswerte durch Indikatoren zu ergänzen, die es ermöglichen, die Typizität dieser Durchschnittswerte zu beurteilen, indem die Fluktuation (Variation) des untersuchten Merkmals gemessen wird.

Das Vorhandensein von Variationen ist auf den Einfluss einer großen Anzahl von Faktoren auf die Bildung des Merkmalsniveaus zurückzuführen. Diese Faktoren wirken mit ungleicher Kraft und in unterschiedliche Richtungen. Variationsindikatoren werden verwendet, um das Maß der Merkmalsvariabilität zu beschreiben.

Aufgaben der statistischen Variationsstudie:

  • 1) die Untersuchung der Art und des Variationsgrades der Zeichen in einzelnen Bevölkerungseinheiten;
  • 2) Bestimmung der Rolle einzelner Faktoren oder ihrer Gruppen bei der Variation bestimmter Merkmale der Bevölkerung.

In der Statistik werden spezielle Methoden zur Untersuchung der Variation verwendet, die auf der Verwendung eines Systems von Indikatoren basieren. Mit an welcher Abweichung gemessen wird.

Das Studium der Variation ist von wesentlicher Bedeutung. Die Messung von Schwankungen ist notwendig bei der Durchführung von Stichprobenbeobachtungen, Korrelations- und Varianzanalysen usw. Ermolaev O.Yu. Mathematische Statistik für Psychologen: Lehrbuch [Text] / O.Yu. Ermolajew. - M.: Flint Verlag des Moskauer Instituts für Psychologie und Soziales, 2012. - 335p.

Je nach Variationsgrad kann man die Homogenität der Population, die Stabilität einzelner Merkmalswerte und die Typizität des Durchschnitts beurteilen. Auf ihrer Grundlage werden Indikatoren für die Nähe der Beziehung zwischen den Zeichen und Indikatoren zur Beurteilung der Genauigkeit der selektiven Beobachtung entwickelt.

Es gibt Variationen im Raum und Variationen in der Zeit.

Variation im Raum wird als Schwankung der Werte eines Merkmals in Einheiten der Bevölkerung verstanden, die getrennte Gebiete darstellen. Unter dem zeitlichen Verlauf versteht man die Veränderung der Werte des Attributs in unterschiedlichen Zeiträumen.

Um die Variation in den Verteilungsreihen zu untersuchen, werden alle Varianten der Attributwerte in aufsteigender oder absteigender Reihenfolge angeordnet. Dieser Vorgang wird als Reihenranking bezeichnet.

Die einfachsten Variationszeichen sind Minimum und Maximum- der kleinste und größte Wert des Attributs im Aggregat. Die Anzahl der Wiederholungen einzelner Varianten von Merkmalswerten wird als Wiederholungshäufigkeit (fi) bezeichnet. Es ist bequem, Frequenzen durch Frequenzen zu ersetzen - wi. Häufigkeit - ein relativer Häufigkeitsindikator, der in Bruchteilen einer Einheit oder einem Prozentsatz ausgedrückt werden kann und es Ihnen ermöglicht, Variationsreihen mit einer unterschiedlichen Anzahl von Beobachtungen zu vergleichen. Ausgedrückt durch die Formel:

wo Xmax, Xmin - die maximalen und minimalen Werte des Attributs im Aggregat; n ist die Anzahl der Gruppen.

Um die Variation eines Merkmals zu messen, werden verschiedene absolute und relative Indikatoren verwendet. Zu den absoluten Schwankungsindikatoren gehören Schwankungsbreite, durchschnittliche lineare Abweichung, Varianz, Standardabweichung. Zu den relativen Schwankungsindikatoren gehören der Oszillationskoeffizient, die relative lineare Abweichung, der Variationskoeffizient.

Ein Beispiel für das Suchen einer Variationsserie

Übung. Für dieses Beispiel:

  • a) Finden Sie eine Variationsreihe;
  • b) Konstruieren Sie die Verteilungsfunktion;

Nr.=42. Beispielartikel:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Lösung.

  • a) Konstruktion einer geordneten Variationsreihe:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) Konstruktion einer diskreten Variationsreihe.

Lassen Sie uns die Anzahl der Gruppen in der Variationsreihe mit der Sturgess-Formel berechnen:

Nehmen wir die Anzahl der Gruppen gleich 7.

Da wir die Anzahl der Gruppen kennen, berechnen wir den Wert des Intervalls:

Um die Tabelle einfacher zu erstellen, nehmen wir die Anzahl der Gruppen gleich 8, das Intervall ist 1.

Reis. eines Das Verkaufsvolumen von Waren durch das Geschäft für einen bestimmten Zeitraum