Diskrete Variationsreihen in der Statistikdefinition. Variationsreihe

Der Satz von Werten des in einem bestimmten Experiment oder einer bestimmten Beobachtung untersuchten Parameters, geordnet nach Größe (Zunahme oder Abnahme), wird als Variationsreihe bezeichnet.

Nehmen wir an, wir haben den Blutdruck von zehn Patienten gemessen, um eine obere Blutdruckschwelle zu erhalten: systolischer Druck, d.h. nur eine Nummer.

Stellen Sie sich vor, dass eine Reihe von Beobachtungen (statistische Grundgesamtheit) des arteriellen systolischen Drucks in 10 Beobachtungen die folgende Form hat (Tabelle 1):

Tabelle 1

Die Bestandteile einer Variationsreihe werden als Varianten bezeichnet. Varianten repräsentieren den numerischen Wert des untersuchten Merkmals.

Die Konstruktion einer Variationsreihe aus einem statistischen Satz von Beobachtungen ist nur der erste Schritt zum Verständnis der Merkmale des gesamten Satzes. Als nächstes muss der durchschnittliche Wert des untersuchten quantitativen Merkmals bestimmt werden (der durchschnittliche Blutproteinspiegel, das durchschnittliche Gewicht der Patienten, der durchschnittliche Zeitpunkt des Beginns der Anästhesie usw.).

Das durchschnittliche Niveau wird anhand von Kriterien gemessen, die als Durchschnitte bezeichnet werden. Der Mittelwert ist ein verallgemeinerndes numerisches Merkmal qualitativ homogener Werte, das durch eine Zahl die gesamte statistische Grundgesamtheit nach einem Merkmal charakterisiert. Der Durchschnittswert drückt das Allgemeine aus, das für ein Merkmal in einem bestimmten Satz von Beobachtungen charakteristisch ist.

Es gibt drei gebräuchliche Arten von Durchschnittswerten: Modus (), Median () und arithmetisches Mittel ().

Um einen Durchschnittswert zu bestimmen, müssen die Ergebnisse einzelner Beobachtungen verwendet und in Form einer Variationsreihe geschrieben werden (Tabelle 2).

Mode- der Wert, der in einer Reihe von Beobachtungen am häufigsten vorkommt. In unserem Beispiel ist Modus = 120. Wenn es keine sich wiederholenden Werte in der Variationsreihe gibt, dann sagen sie, dass es keinen Modus gibt. Wenn mehrere Werte gleich oft wiederholt werden, wird der kleinste von ihnen als Modus genommen.

Median- der Wert, der die Verteilung in zwei gleiche Teile teilt, der Mittel- oder Medianwert einer Reihe von Beobachtungen, die in aufsteigender oder absteigender Reihenfolge angeordnet sind. Wenn es also 5 Werte in der Variationsreihe gibt, dann ist ihr Median gleich dem dritten Mitglied der Variationsreihe, wenn es eine gerade Anzahl von Mitgliedern in der Reihe gibt, dann ist der Median das arithmetische Mittel seiner beiden zentrale Beobachtungen, d.h. Wenn die Serie 10 Beobachtungen enthält, ist der Median gleich dem arithmetischen Mittel von 5 und 6 Beobachtungen. In unserem Beispiel.

Beachten Sie ein wichtiges Merkmal des Modus und des Medians: Ihre Werte werden nicht von den numerischen Werten der Extremvarianten beeinflusst.

Arithmetisches Mittel berechnet nach der Formel:

wobei der beobachtete Wert in der -ten Beobachtung und die Anzahl der Beobachtungen ist. Für unseren Fall.

Das arithmetische Mittel hat drei Eigenschaften:

Der mittlere nimmt die mittlere Position in der Variationsreihe ein. In einer streng symmetrischen Reihe.

Der Durchschnitt ist ein verallgemeinernder Wert und zufällige Schwankungen, Unterschiede einzelner Daten sind hinter dem Durchschnitt nicht sichtbar. Es spiegelt das Typische wider, das für die gesamte Bevölkerung charakteristisch ist.

Die Summe der Abweichungen aller Varianten vom Mittelwert ist gleich Null: . Angegeben ist die Abweichung der Variante vom Mittelwert.

Die Variationsreihe besteht aus Varianten und ihren entsprechenden Frequenzen. Von den zehn erhaltenen Werten wurde die Zahl 120 6 Mal angetroffen, 115 - 3 Mal, 125 - 1 Mal. Häufigkeit () - die absolute Anzahl der einzelnen Optionen in der Grundgesamtheit, die angibt, wie oft diese Option in der Variationsreihe vorkommt.

Die Variationsreihe kann einfach (Frequenzen = 1) oder gruppiert verkürzt sein, jeweils 3-5 Optionen. Eine einfache Reihe wird mit einer kleinen Anzahl von Beobachtungen () verwendet, gruppiert - mit einer großen Anzahl von Beobachtungen ().

Variationsreihe: Definition, Typen, Hauptmerkmale. Berechnungsmethode
Mode, Median, arithmetisches Mittel in medizinischen und statistischen Studien
(Zeigen Sie an einem bedingten Beispiel).

Eine Variationsreihe ist eine Reihe von Zahlenwerten des untersuchten Merkmals, die sich in ihrer Größe voneinander unterscheiden und in einer bestimmten Reihenfolge (in aufsteigender oder absteigender Reihenfolge) angeordnet sind. Jeder Zahlenwert der Reihe wird als Variante (V) bezeichnet, und die Zahl, die angibt, wie oft diese oder jene Variante in der Zusammensetzung dieser Reihe vorkommt, wird als Häufigkeit (p) bezeichnet.

Die Gesamtzahl der Beobachtungsfälle, aus denen die Variationsreihe besteht, wird mit dem Buchstaben n bezeichnet. Der Unterschied in der Bedeutung der untersuchten Merkmale wird als Variation bezeichnet. Wenn die Variable Vorzeichen kein quantitatives Maß hat, wird die Variation als qualitativ und die Verteilungsreihe als attributiv bezeichnet (z. B. Verteilung nach Krankheitsausgang, Gesundheitszustand usw.).

Wenn ein variables Vorzeichen einen quantitativen Ausdruck hat, wird eine solche Variation als quantitativ und die Verteilungsreihe als Variation bezeichnet.

Variationsreihen werden unterteilt in diskontinuierliche und kontinuierliche - je nach Art des quantitativen Merkmals, einfache und gewichtete - je nach Häufigkeit des Auftretens der Variante.

In einer einfachen Variationsreihe kommt jede Variante nur einmal vor (p=1), in einer gewichteten kommt dieselbe Variante mehrmals vor (p>1). Beispiele für solche Reihen werden später im Text besprochen. Wenn das quantitative Attribut stetig ist, d.h. zwischen ganzzahligen Werten gibt es gebrochene Zwischenwerte, die Variationsreihe wird als kontinuierlich bezeichnet.

Zum Beispiel: 10.0 - 11.9

14,0 - 15,9 usw.

Wenn das quantitative Vorzeichen diskontinuierlich ist, d.h. seine einzelnen Werte (Optionen) unterscheiden sich um eine ganze Zahl und haben keine Zwischenbruchwerte, die Variationsreihe wird als diskontinuierlich oder diskret bezeichnet.

Verwenden Sie die Daten aus dem vorherigen Beispiel zur Herzfrequenz

für 21 Schüler werden wir eine Variationsreihe aufbauen (Tabelle 1).

Tabelle 1

Verteilung der Medizinstudenten nach Pulsfrequenz (bpm)

Eine Variationsreihe aufzubauen bedeutet also, die vorhandenen Zahlenwerte (Optionen) zu systematisieren, zu rationalisieren, d.h. in einer bestimmten Reihenfolge (in aufsteigender oder absteigender Reihenfolge) mit ihren entsprechenden Frequenzen anordnen. Im betrachteten Beispiel sind die Optionen aufsteigend geordnet und als diskontinuierliche (diskrete) ganze Zahl ausgedrückt, jede Option kommt mehrfach vor, d.h. wir haben es mit einer gewichteten, unstetigen oder diskreten Variationsreihe zu tun.

Wenn die Anzahl der Beobachtungen in der von uns untersuchten statistischen Population 30 nicht überschreitet, reicht es in der Regel aus, alle Werte des untersuchten Merkmals in einer Variationsreihe in aufsteigender Reihenfolge wie in Tabelle anzuordnen. 1 oder in absteigender Reihenfolge.

Bei einer großen Anzahl von Beobachtungen (n>30) kann die Anzahl der vorkommenden Varianten sehr groß sein, in diesem Fall wird eine Intervall- oder gruppierte Variationsreihe erstellt, in der, um die spätere Bearbeitung zu vereinfachen und die Art der Verteilung zu verdeutlichen, die Varianten werden in Gruppen zusammengefasst.

Normalerweise reicht die Anzahl der Gruppenoptionen von 8 bis 15.

Es müssen mindestens 5 sein, denn. Andernfalls wird es zu grob, zu stark vergrößert, was das Gesamtbild der Schwankungen verzerrt und die Genauigkeit der Mittelwerte stark beeinträchtigt. Wenn die Anzahl der Gruppenoptionen mehr als 20-25 beträgt, erhöht sich die Genauigkeit der Berechnung der Durchschnittswerte, aber die Merkmale der Variation des Attributs werden erheblich verzerrt und die mathematische Verarbeitung wird komplizierter.

Bei der Zusammenstellung einer gruppierten Serie ist dies zu berücksichtigen

− Variantengruppen müssen in einer bestimmten Reihenfolge angeordnet werden (aufsteigend oder absteigend);

- die Intervalle in den Variantengruppen sollten gleich sein;

− Die Werte der Grenzen der Intervalle sollten nicht übereinstimmen, weil es wird nicht klar sein, welchen Gruppen einzelne Optionen zugeordnet werden sollen;

- Bei der Festlegung der Intervallgrenzen müssen die qualitativen Merkmale des gesammelten Materials berücksichtigt werden (z. B. ist bei der Untersuchung des Gewichts von Erwachsenen ein Intervall von 3-4 kg akzeptabel und für Kinder in den ersten Monaten des Lebens sollte es 100 g nicht überschreiten.)

Bauen wir eine gruppierte (Intervall-)Reihe, die die Daten zur Pulsfrequenz (Anzahl der Schläge pro Minute) für 55 Medizinstudenten vor der Prüfung charakterisiert: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Um eine gruppierte Serie zu erstellen, benötigen Sie:

1. Bestimmen Sie den Wert des Intervalls;

2. Mitte, Anfang und Ende der Gruppen der Variante der Variationsreihe bestimmen.

● Der Wert des Intervalls (i) wird durch die Anzahl der erwarteten Gruppen (r) bestimmt, deren Anzahl in Abhängigkeit von der Anzahl der Beobachtungen (n) gemäß einer speziellen Tabelle festgelegt wird

Anzahl der Gruppen abhängig von der Anzahl der Beobachtungen:

In unserem Fall können bei 55 Schülern 8 bis 10 Gruppen gebildet werden.

Der Wert des Intervalls (i) wird durch die folgende Formel bestimmt -

i = Vmax-Vmin/r

In unserem Beispiel ist der Wert des Intervalls 82-58/8= 3.

Wenn der Intervallwert eine Bruchzahl ist, sollte das Ergebnis auf eine Ganzzahl aufgerundet werden.

Es gibt verschiedene Arten von Durchschnittswerten:

● arithmetisches Mittel,

● geometrisches Mittel,

● harmonisches Mittel,

● quadratischer Mittelwert,

● mittel progressiv,

● Mittelwert

In der medizinischen Statistik werden am häufigsten arithmetische Mittelwerte verwendet.

Der arithmetische Mittelwert (M) ist ein verallgemeinernder Wert, der den typischen Wert bestimmt, der für die gesamte Population charakteristisch ist. Die Hauptmethoden zur Berechnung von M sind: die Methode des arithmetischen Mittels und die Methode der Momente (bedingte Abweichungen).

Das arithmetische Mittelverfahren dient zur Berechnung des einfachen arithmetischen Mittels und des gewichteten arithmetischen Mittels. Die Wahl der Methode zur Berechnung des arithmetischen Mittelwertes hängt von der Art der Variationsreihe ab. Bei einer einfachen Variationsreihe, in der jede Variante nur einmal vorkommt, wird das einfache arithmetische Mittel durch die Formel bestimmt:

wobei: М – arithmetischer Mittelwert;

V ist der Wert des variablen Merkmals (Optionen);

Σ - gibt die Aktion an - Summierung;

n ist die Gesamtzahl der Beobachtungen.

Ein Beispiel für die Berechnung des arithmetischen Mittels ist einfach. Atemfrequenz (Anzahl der Atemzüge pro Minute) bei 9 Männern im Alter von 35 Jahren: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Um die durchschnittliche Atemfrequenz bei Männern im Alter von 35 Jahren zu bestimmen, ist Folgendes erforderlich:

1. Erstellen Sie eine Variationsreihe, indem Sie alle Optionen in aufsteigender oder absteigender Reihenfolge anordnen Wir haben eine einfache Variationsreihe, weil Variantenwerte kommen nur einmal vor.

M = ∑V/n = 171/9 = 19 Atemzüge pro Minute

Fazit. Die Atemfrequenz bei Männern im Alter von 35 Jahren beträgt im Durchschnitt 19 Atemzüge pro Minute.

Wiederholen sich einzelne Werte einer Variante, muss nicht jede Variante in einer Zeile ausgeschrieben werden, es genügt, die auftretenden Größen der Variante aufzulisten (V) und daneben die Anzahl ihrer Wiederholungen anzugeben (S ). eine solche Variationsreihe, bei der die Optionen gleichsam nach der Anzahl der ihnen entsprechenden Häufigkeiten gewichtet sind, heißt gewichtete Variationsreihe, und der berechnete Mittelwert ist der arithmetisch gewichtete Durchschnitt.

Der arithmetisch gewichtete Durchschnitt wird nach folgender Formel bestimmt: M= ∑Vp/n

wobei n die Anzahl der Beobachtungen gleich der Summe der Häufigkeiten ist - Σr.

Ein Beispiel für die Berechnung des arithmetisch gewichteten Durchschnitts.

Die Dauer der Behinderung (in Tagen) bei 35 Patienten mit akuten Atemwegserkrankungen (ARI), die im ersten Quartal des laufenden Jahres von einem örtlichen Arzt behandelt wurden, betrug: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 Tage .

Die Methodik zur Bestimmung der durchschnittlichen Dauer der Behinderung bei Patienten mit akuten Atemwegsinfektionen lautet wie folgt:

1. Lassen Sie uns eine gewichtete Variationsreihe aufbauen, weil einzelne Variantenwerte werden mehrfach wiederholt. Dazu können Sie alle Optionen in aufsteigender oder absteigender Reihenfolge mit ihren entsprechenden Häufigkeiten anordnen.

In unserem Fall sind die Optionen in aufsteigender Reihenfolge.

2. Berechnen Sie den arithmetisch gewichteten Durchschnitt mit der Formel: M = ∑Vp/n = 233/35 = 6,7 Tage

Verteilung der Patienten mit akuten Atemwegsinfektionen nach Dauer der Behinderung:

Dauer der Arbeitsunfähigkeit (V) Anzahl der Patienten (p) vp
∑p = n = 35 ∑Vp = 233

Fazit. Die Dauer der Behinderung bei Patienten mit akuten Atemwegserkrankungen betrug im Durchschnitt 6,7 Tage.

Mode (Mo) ist die häufigste Variante in der Variationsreihe. Für die in der Tabelle dargestellte Verteilung entspricht der Modus der Variante gleich 10, er kommt häufiger vor als andere - 6 mal.

Verteilung der Patienten nach Verweildauer in einem Krankenhausbett (in Tagen)

v
p

Manchmal ist es schwierig, den genauen Wert des Modus zu bestimmen, da es mehrere Beobachtungen in den untersuchten Daten geben kann, die „am häufigsten“ vorkommen.

Der Median (Me) ist ein nichtparametrischer Indikator, der die Variationsreihe in zwei gleiche Hälften teilt: Auf beiden Seiten des Medians befindet sich die gleiche Anzahl von Optionen.

Für die in der Tabelle gezeigte Verteilung ist der Median beispielsweise 10, weil auf beiden Seiten dieses Wertes befindet sich auf der 14. Option, d.h. Die Zahl 10 nimmt in dieser Reihe eine zentrale Position ein und ist ihr Median.

Da die Anzahl der Beobachtungen in diesem Beispiel gerade ist (n=34), kann der Median wie folgt bestimmt werden:

Ich = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Das bedeutet, dass die Mitte der Reihe auf die siebzehnte Option fällt, was einem Median von 10 entspricht. Für die in der Tabelle dargestellte Verteilung beträgt das arithmetische Mittel:

M = ∑Vp/n = 334/34 = 10,1

Also für 34 Beobachtungen aus Tabelle. 8, wir haben: Mo=10, Me=10, arithmetisches Mittel (M) ist 10,1. In unserem Beispiel erwiesen sich alle drei Indikatoren als gleich oder nahe beieinander, obwohl sie völlig unterschiedlich sind.

Das arithmetische Mittel ist die resultierende Summe aller Einflüsse, an seiner Bildung sind ausnahmslos alle Varianten beteiligt, auch extreme, oft untypisch für ein bestimmtes Phänomen oder eine Menge.

Modus und Median hängen im Gegensatz zum arithmetischen Mittel nicht vom Wert aller Einzelwerte des Variablenattributs ab (die Werte der Extremvarianten und der Streuungsgrad der Reihe). Das arithmetische Mittel charakterisiert die gesamte Masse der Beobachtungen, Modus und Median charakterisieren die Masse

Mit der Gruppierungsmethode können Sie auch messen Variation(Variabilität, Fluktuation) von Vorzeichen. Bei einer relativ kleinen Anzahl von Bevölkerungseinheiten wird die Variation auf der Grundlage einer Rangfolge von Einheiten gemessen, aus denen die Bevölkerung besteht. Die Zeile wird aufgerufen rangiert wenn die Einheiten aufsteigend (absteigend) angeordnet sind.

Rangreihen sind jedoch eher indikativ, wenn ein vergleichendes Merkmal der Streuung benötigt wird. Außerdem hat man es in vielen Fällen mit statistischen Aggregaten zu tun, die aus einer großen Anzahl von Einheiten bestehen, die in Form einer bestimmten Reihe praktisch nur schwer darstellbar sind. In diesem Zusammenhang werden zum ersten allgemeinen Kennenlernen statistischer Daten und insbesondere zum Erleichtern des Studiums der Zeichenvariation die untersuchten Phänomene und Prozesse in Gruppen zusammengefasst und die Ergebnisse der Gruppierung in Form von Gruppentabellen erstellt .

Wenn in der Gruppentabelle nur zwei Spalten vorhanden sind - Gruppen nach dem ausgewählten Merkmal (Optionen) und der Anzahl der Gruppen (Frequenzen oder Frequenzen), wird sie aufgerufen Nahverteilung.

Verbreitungsgebiet - die einfachste Art der strukturellen Gruppierung nach einem Merkmal, dargestellt in einer Gruppentabelle mit zwei Spalten, die Varianten und Häufigkeiten des Merkmals enthalten. In vielen Fällen ist bei einer solchen baulichen Gruppierung, d.h. Mit der Erstellung von Verteilungsreihen beginnt die Untersuchung des statistischen Ausgangsmaterials.

Aus einer Strukturgruppierung in Form einer Verteilungsreihe kann eine echte Strukturgruppierung werden, wenn die ausgewählten Gruppen nicht nur durch Häufigkeiten, sondern auch durch andere statistische Indikatoren charakterisiert werden. Der Hauptzweck von Verteilungsserien besteht darin, die Variation von Merkmalen zu untersuchen. Die Theorie der Verteilungsreihen wird im Detail von der mathematischen Statistik entwickelt.

Die Verteilungsserien sind unterteilt in attributiv(Gruppierung nach attributiven Merkmalen, z. B. die Aufteilung der Bevölkerung nach Geschlecht, Nationalität, Familienstand usw.) und variabel(Gruppierung nach quantitativen Merkmalen).

Variationsreihe ist eine Gruppentabelle, die zwei Spalten enthält: eine Gruppierung von Einheiten gemäß einem quantitativen Attribut und die Anzahl der Einheiten in jeder Gruppe. Die Intervalle in den Variationsreihen sind in der Regel gleich und geschlossen ausgebildet. Die Variationsreihe ist die folgende Gruppierung der russischen Bevölkerung in Bezug auf das durchschnittliche Bareinkommen pro Kopf (Tabelle 3.10).

Tabelle 3.10

Verteilung der russischen Bevölkerung nach dem durchschnittlichen Pro-Kopf-Einkommen in den Jahren 2004-2009

Bevölkerungsgruppen nach durchschnittlichem Pro-Kopf-Bareinkommen, Rubel/Monat

Bevölkerung in der Gruppe, in % der Gesamtzahl

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Über 25.000,0

Alle Bevölkerung

Variationsreihen wiederum werden in diskrete und Intervalle unterteilt. Diskret Variationsserien kombinieren Varianten von diskreten Merkmalen, die innerhalb enger Grenzen variieren. Ein Beispiel für eine diskrete Variationsreihe ist die Verteilung russischer Familien nach der Anzahl ihrer Kinder.

Intervall Variationsserien kombinieren Varianten von entweder kontinuierlichen Merkmalen oder diskreten Merkmalen, die sich über einen weiten Bereich ändern. Die Intervallreihe ist die Variationsreihe der Verteilung der russischen Bevölkerung in Bezug auf das durchschnittliche Pro-Kopf-Bareinkommen.

Diskrete Variationsreihen werden in der Praxis nicht sehr oft verwendet. Deren Zusammenstellung ist mittlerweile unproblematisch, da die Zusammensetzung der Gruppen durch die konkreten Varianten bestimmt wird, die die untersuchten Gruppierungsmerkmale tatsächlich besitzen.

Intervall-Variationsreihen sind weiter verbreitet. Bei deren Zusammenstellung stellt sich die schwierige Frage nach der Anzahl der Gruppen sowie nach der Größe der zu bildenden Intervalle.

Die Grundsätze zur Lösung dieses Problems sind im Kapitel über die Methodik zur Erstellung statistischer Gruppierungen dargelegt (siehe Abschnitt 3.3).

Variationsreihen sind ein Mittel, um verschiedene Informationen in eine kompakte Form zu bringen oder zu komprimieren; sie können verwendet werden, um ein ziemlich klares Urteil über die Art der Variation zu treffen, um die Unterschiede in den Vorzeichen der Phänomene zu untersuchen, die in der untersuchten Menge enthalten sind. Die wichtigste Bedeutung der Variationsreihen besteht aber darin, dass auf ihrer Grundlage die speziellen verallgemeinernden Merkmale der Variation berechnet werden (siehe Kapitel 7).

Ein besonderer Platz in der statistischen Analyse gehört der Bestimmung des durchschnittlichen Niveaus des untersuchten Merkmals oder Phänomens. Das durchschnittliche Niveau eines Features wird durch Durchschnittswerte gemessen.

Der Durchschnittswert charakterisiert das allgemeine quantitative Niveau des untersuchten Merkmals und ist eine Gruppeneigenschaft der statistischen Grundgesamtheit. Es nivelliert, schwächt die zufälligen Abweichungen einzelner Beobachtungen in die eine oder andere Richtung ab und hebt die hauptsächliche, typische Eigenschaft des untersuchten Merkmals hervor.

Durchschnitte sind weit verbreitet:

1. Для оценки состояния здоровья населения: характеристики физического развития (рост, вес, окружность грудной клетки и пр.), выявления распространенности и длительности различных заболеваний, анализа демографических показателей (естественного движения населения, средней продолжительности предстоящей жизни, воспроизводства населения, средней численности населения usw.).

2. Untersuchung der Aktivitäten medizinischer Einrichtungen, medizinischen Personals und Bewertung der Qualität ihrer Arbeit, Planung und Ermittlung der Bedürfnisse der Bevölkerung in verschiedenen Arten der medizinischen Versorgung (durchschnittliche Anzahl von Anträgen oder Besuchen pro Einwohner und Jahr, durchschnittliche Aufenthaltsdauer). eines Patienten in einem Krankenhaus, durchschnittliche Untersuchungsdauer des Patienten, durchschnittliche Versorgung mit Ärzten, Betten usw.).

3. Charakterisierung des hygienischen und epidemiologischen Zustands (durchschnittliche Staubigkeit der Luft in der Werkstatt, durchschnittliche Fläche pro Person, durchschnittlicher Verbrauch an Proteinen, Fetten und Kohlenhydraten usw.).

4. Bestimmung der medizinischen und physiologischen Parameter in Norm und Pathologie bei der Verarbeitung von Labordaten zur Feststellung der Zuverlässigkeit der Ergebnisse einer selektiven Studie in sozialhygienischen, klinischen, experimentellen Studien.

Die Berechnung der Durchschnittswerte erfolgt auf Basis von Variationsreihen. Variationsreihe- Dies ist ein qualitativ homogener statistischer Satz, dessen einzelne Einheiten die quantitativen Unterschiede des untersuchten Merkmals oder Phänomens charakterisieren.

Quantitative Schwankungen können zweierlei Art sein: diskontinuierlich (diskret) und kontinuierlich.

Ein diskontinuierliches (diskretes) Zeichen wird nur als ganze Zahl ausgedrückt und kann keine Zwischenwerte haben (z. B. die Anzahl der Besuche, die Bevölkerung des Standorts, die Anzahl der Kinder in der Familie, die Schwere der Krankheit in Punkten). , etc.).

Ein kontinuierliches Zeichen kann innerhalb bestimmter Grenzen beliebige Werte annehmen, einschließlich Bruchzahlen, und wird nur ungefähr ausgedrückt (z. B. Gewicht - für Erwachsene können Sie sich auf Kilogramm beschränken, und für Neugeborene - Gramm; Größe, Blutdruck, Zeit Ausgaben für die Behandlung eines Patienten usw.).



Der digitale Wert jedes einzelnen Merkmals oder Phänomens, das in der Variationsreihe enthalten ist, wird als Variante bezeichnet und wird durch den Buchstaben angezeigt v . Es gibt zum Beispiel auch andere Notationen in der mathematischen Literatur x oder j.

Eine Variationsreihe, bei der jede Option einmal angegeben ist, heißt einfach. Solche Reihen werden bei den meisten statistischen Problemen im Fall der Computerdatenverarbeitung verwendet.

Mit zunehmender Anzahl von Beobachtungen gibt es in der Regel wiederholte Werte der Variante. In diesem Fall erstellt es gruppierte Variationsreihe, wobei die Anzahl der Wiederholungen angegeben ist (Frequenz, gekennzeichnet durch den Buchstaben " R »).

Ranglisten-Variationsserie besteht aus Optionen, die in aufsteigender oder absteigender Reihenfolge angeordnet sind. Sowohl einfache als auch gruppierte Serien können mit Rangfolge zusammengestellt werden.

Serie von Intervallvariationen werden zusammengestellt, um spätere Berechnungen ohne Computer mit einer sehr großen Anzahl von Beobachtungseinheiten (mehr als 1000) zu vereinfachen.

Kontinuierliche Variationsreihe enthält Variantenwerte, die ein beliebiger Wert sein können.

Wenn in der Variationsserie die Werte des Attributs (Optionen) in Form von separaten spezifischen Nummern angegeben sind, wird eine solche Serie aufgerufen diskret.

Die allgemeinen Merkmale der Werte des Attributs, die sich in der Variationsreihe widerspiegeln, sind die Durchschnittswerte. Unter ihnen sind die am häufigsten verwendeten: das arithmetische Mittel M, Mode Mo und Median Mir. Jede dieser Eigenschaften ist einzigartig. Sie können einander nicht ersetzen, und nur in der Summe, ganz vollständig und in knapper Form, sind die Merkmale der Variationsreihe.

Mode (Mo) Nennen Sie den Wert der am häufigsten vorkommenden Optionen.

Median (mich) ist der Wert der Variante, die die Reihe der Variationsreihen halbiert (auf jeder Seite des Medians gibt es eine Hälfte der Variante). In seltenen Fällen sind bei einer symmetrischen Variationsreihe Modus und Median gleich und stimmen mit dem Wert des arithmetischen Mittels überein.

Das typischste Merkmal von Variantenwerten ist arithmetisches Mittel Wert( M ). In der mathematischen Literatur wird es bezeichnet .

Arithmetisches Mittel (M, ) ist ein allgemeines quantitatives Merkmal eines bestimmten Merkmals der untersuchten Phänomene, die einen qualitativ homogenen statistischen Satz bilden. Unterscheiden Sie zwischen dem einfachen arithmetischen Mittel und dem gewichteten Mittel. Das einfache arithmetische Mittel wird für eine einfache Variationsreihe berechnet, indem alle Optionen summiert und diese Summe durch die Gesamtzahl der in dieser Variationsreihe enthaltenen Optionen geteilt wird. Berechnungen werden nach der Formel durchgeführt:

,

wo: M - einfaches arithmetisches Mittel;

Σ v - Betragsoption;

n- Anzahl der Beobachtungen.

In den gruppierten Variationsreihen wird ein gewichtetes arithmetisches Mittel gebildet. Die Formel für seine Berechnung:

,

wo: M - arithmetisch gewichteter Durchschnitt;

Σ vp - die Summe der Produkte einer Variante nach ihren Häufigkeiten;

n- Anzahl der Beobachtungen.

Bei einer großen Anzahl von Beobachtungen bei manuellen Berechnungen kann die Momentenmethode verwendet werden.

Das arithmetische Mittel hat folgende Eigenschaften:

die Summe der Abweichungen der Variante vom Mittelwert ( Σ d ) gleich Null ist (siehe Tabelle 15);

Bei der Multiplikation (Division) aller Optionen mit demselben Faktor (Divisor) wird das arithmetische Mittel mit demselben Faktor (Divisor) multipliziert (dividiert);

Wenn Sie zu allen Optionen dieselbe Zahl addieren (subtrahieren), erhöht (verringert) sich das arithmetische Mittel um dieselbe Zahl.

Arithmetische Mittelwerte, die für sich genommen genommen werden, ohne die Variabilität der Reihen zu berücksichtigen, aus denen sie berechnet werden, spiegeln die Eigenschaften der Variationsreihe möglicherweise nicht vollständig wider, insbesondere wenn ein Vergleich mit anderen Mittelwerten erforderlich ist. Wertnahe Mittelwerte können aus Reihen mit unterschiedlicher Streuung gewonnen werden. Je näher die einzelnen Optionen hinsichtlich ihrer quantitativen Eigenschaften beieinander liegen, desto weniger Streuung (Fluktuation, Variabilität) Serie, desto typischer sein Durchschnitt.

Die Hauptparameter, die es ermöglichen, die Variabilität eines Merkmals zu beurteilen, sind:

· Umfang;

Amplitude;

· Standardabweichung;

· Der Variationskoeffizient.

Annäherungsweise kann die Schwankung eines Merkmals anhand des Umfangs und der Amplitude der Variationsreihe beurteilt werden. Der Bereich gibt die maximalen (V max) und minimalen (V min) Optionen in der Serie an. Die Amplitude (Am) ist die Differenz zwischen diesen Optionen: Am = Vmax – Vmin.

Das wichtigste, allgemein akzeptierte Maß für die Fluktuation der Variationsreihe sind Streuung (D ). Am häufigsten wird jedoch der bequemere Parameter verwendet, der auf der Grundlage der Varianz berechnet wird - die Standardabweichung ( σ ). Es berücksichtigt den Abweichungswert ( d ) jeder Variante der Variationsreihe aus ihrem arithmetischen Mittel ( d=V - M ).

Da die Abweichungen der Variante vom Mittelwert positiv und negativ sein können, ergeben sie summiert den Wert „0“ (S d=0). Um dies zu vermeiden, werden die Abweichungswerte ( d) werden in die zweite Potenz erhoben und gemittelt. Somit ist die Varianz der Variationsreihe das durchschnittliche Quadrat der Abweichungen der Variante vom arithmetischen Mittel und wird nach der Formel berechnet:

.

Es ist das wichtigste Merkmal der Variabilität und wird zur Berechnung vieler statistischer Tests verwendet.

Da die Varianz als Quadrat der Abweichungen ausgedrückt wird, kann ihr Wert nicht im Vergleich zum arithmetischen Mittel verwendet werden. Für diese Zwecke wird es verwendet Standardabweichung, was mit dem Zeichen "Sigma" bezeichnet wird ( σ ). Er kennzeichnet die durchschnittliche Abweichung aller Varianten der Variationsreihe vom arithmetischen Mittel in denselben Einheiten wie der Mittelwert selbst, sodass sie gemeinsam verwendet werden können.

Die Standardabweichung wird durch die Formel bestimmt:

Diese Formel wird für die Anzahl der Beobachtungen ( n ) ist größer als 30. Mit einer kleineren Zahl n Der Wert der Standardabweichung weist einen Fehler auf, der mit der mathematischen Abweichung ( n - eines). In dieser Hinsicht kann ein genaueres Ergebnis erzielt werden, indem eine solche Verzerrung in der Formel zur Berechnung der Standardabweichung berücksichtigt wird:

Standardabweichung (s ) ist eine Schätzung der Standardabweichung der Zufallsvariablen X relativ zu seiner mathematischen Erwartung basierend auf einer unvoreingenommenen Schätzung seiner Varianz.

Für Werte n > 30 Standardabweichung ( σ ) und Standardabweichung ( s ) wird dasselbe sein ( σ=s ). Daher werden diese Kriterien in den meisten praktischen Handbüchern mit unterschiedlichen Bedeutungen behandelt. In Excel kann die Berechnung der Standardabweichung mit der Funktion =STDEV(range) erfolgen. Und um die Standardabweichung zu berechnen, müssen Sie eine entsprechende Formel erstellen.

Mit dem quadratischen Mittelwert oder der Standardabweichung können Sie bestimmen, wie stark die Werte eines Merkmals vom Mittelwert abweichen können. Angenommen, es gibt zwei Städte mit der gleichen durchschnittlichen Tagestemperatur im Sommer. Eine dieser Städte liegt an der Küste, die andere auf dem Kontinent. Es ist bekannt, dass in Städten an der Küste die Unterschiede der Tagestemperaturen geringer sind als in Städten im Landesinneren. Daher ist die Standardabweichung der Tagestemperaturen in der Nähe der Küstenstadt geringer als die der zweiten Stadt. In der Praxis bedeutet dies, dass die durchschnittliche Lufttemperatur an jedem einzelnen Tag in einer Stadt auf dem Kontinent stärker vom Durchschnitt abweicht als in einer Stadt an der Küste. Zusätzlich ermöglicht die Standardabweichung, mögliche Temperaturabweichungen vom Mittelwert mit der erforderlichen Wahrscheinlichkeit abzuschätzen.

Nach der Wahrscheinlichkeitstheorie besteht bei Phänomenen, die dem Normalverteilungsgesetz gehorchen, eine strenge Beziehung zwischen den Werten des arithmetischen Mittels, der Standardabweichung und der Optionen ( Drei-Sigma-Regel). Beispielsweise liegen 68,3 % der Werte eines Variablenattributs innerhalb von M ± 1 σ , 95,5 % - innerhalb von M ± 2 σ und 99,7 % - innerhalb von M ± 3 σ .

Der Wert der Standardabweichung ermöglicht eine Beurteilung der Art der Homogenität der Variationsreihe und der untersuchten Gruppe. Wenn der Wert der Standardabweichung klein ist, deutet dies auf eine ausreichend hohe Homogenität des untersuchten Phänomens hin. Das arithmetische Mittel sollte in diesem Fall als durchaus charakteristisch für diese Variationsreihe anerkannt werden. Ein zu kleines Sigma lässt jedoch an eine künstliche Auswahl von Beobachtungen denken. Bei einem sehr großen Sigma charakterisiert das arithmetische Mittel die Variationsreihe weniger stark, was auf eine signifikante Variabilität des untersuchten Merkmals oder Phänomens oder die Heterogenität der Studiengruppe hinweist. Ein Vergleich des Wertes der Standardabweichung ist jedoch nur für Vorzeichen gleicher Dimension möglich. In der Tat, wenn wir die Gewichtsunterschiede von Neugeborenen und Erwachsenen vergleichen, werden wir bei Erwachsenen immer höhere Sigma-Werte erhalten.

Ein Vergleich der Variabilität von Merkmalen unterschiedlicher Dimensionen kann mit durchgeführt werden Variationskoeffizient. Er drückt die Diversität als Prozentsatz des Mittelwerts aus, was einen Vergleich verschiedener Merkmale ermöglicht. Der Variationskoeffizient wird in der medizinischen Literatur durch das Zeichen " AUS ", und in der mathematischen " v» und berechnet nach der Formel:

.

Die Werte des Variationskoeffizienten unter 10 % deuten auf eine geringe Streuung hin, von 10 bis 20 % – etwa auf den Mittelwert, über 20 % – auf eine starke Streuung um den arithmetischen Mittelwert.

Der arithmetische Mittelwert wird in der Regel auf Basis von Stichprobendaten berechnet. Bei wiederholten Studien unter dem Einfluss von Zufallsphänomenen kann sich das arithmetische Mittel ändern. Dies liegt daran, dass in der Regel nur ein Teil der möglichen Betrachtungseinheiten, also eine Stichprobenpopulation, untersucht wird. Informationen über alle möglichen Einheiten, die das untersuchte Phänomen repräsentieren, können durch die Untersuchung der gesamten Allgemeinbevölkerung gewonnen werden, was nicht immer möglich ist. Gleichzeitig ist zur Verallgemeinerung der experimentellen Daten der Wert des Durchschnitts in der Allgemeinbevölkerung von Interesse. Um eine allgemeine Aussage über das untersuchte Phänomen zu formulieren, müssen daher die Ergebnisse, die auf der Grundlage der Stichprobenpopulation gewonnen wurden, mit statistischen Methoden auf die Allgemeinbevölkerung übertragen werden.

Um den Grad der Übereinstimmung zwischen der Stichprobenstudie und der Allgemeinbevölkerung zu bestimmen, ist es notwendig, den Fehlerbetrag abzuschätzen, der bei der Stichprobenbeobachtung zwangsläufig entsteht. Ein solcher Fehler wird aufgerufen Repräsentativitätsfehler“ oder „mittlerer Fehler des arithmetischen Mittels“. Es ist in der Tat die Differenz zwischen den Durchschnittswerten, die aus einer selektiven statistischen Beobachtung erhalten wurden, und ähnlichen Werten, die aus einer kontinuierlichen Untersuchung desselben Objekts erhalten würden, d.h. beim Studium der Allgemeinbevölkerung. Da es sich bei dem Stichprobenmittelwert um eine Zufallsvariable handelt, erfolgt eine solche Prognose mit einer für den Forscher akzeptablen Wahrscheinlichkeit. In der medizinischen Forschung sind es mindestens 95 %.

Der Repräsentativitätsfehler sollte nicht mit Registrierungsfehlern oder Aufmerksamkeitsfehlern (Druckfehler, Rechenfehler, Druckfehler usw.) verwechselt werden, die durch eine angemessene Methodik und im Experiment verwendete Werkzeuge minimiert werden sollten.

Die Größe des Repräsentativitätsfehlers hängt sowohl von der Stichprobengröße als auch von der Variabilität des Merkmals ab. Je größer die Anzahl der Beobachtungen, desto näher die Stichprobe an der Allgemeinbevölkerung und desto kleiner der Fehler. Je variabler das Merkmal ist, desto größer ist der statistische Fehler.

In der Praxis wird zur Ermittlung des Repräsentativitätsfehlers in Variationsreihen folgende Formel verwendet:

,

wo: m – Repräsentativitätsfehler;

σ - Standardabweichung;

n ist die Anzahl der Beobachtungen in der Stichprobe.

Aus der Formel ist ersichtlich, dass die Größe des durchschnittlichen Fehlers direkt proportional zur Standardabweichung ist, d. h. der Variabilität des untersuchten Merkmals, und umgekehrt proportional zur Quadratwurzel der Anzahl der Beobachtungen.

Bei der Durchführung statistischer Analysen auf Basis der Berechnung relativer Werte ist der Aufbau einer Variationsreihe nicht zwingend erforderlich. In diesem Fall kann die Bestimmung des durchschnittlichen Fehlers für relative Indikatoren mit einer vereinfachten Formel durchgeführt werden:

,

wo: R- der Wert des relativen Indikators, ausgedrückt in Prozent, ppm usw.;

q- der Kehrwert von P und ausgedrückt als (1-P), (100-P), (1000-P) usw., je nach Berechnungsgrundlage des Indikators;

n ist die Anzahl der Beobachtungen in der Stichprobe.

Die angegebene Formel zur Berechnung des Repräsentativitätsfehlers für relative Werte kann jedoch nur angewendet werden, wenn der Wert des Indikators kleiner als seine Basis ist. In einer Reihe von Fällen, in denen intensive Indikatoren berechnet werden, ist diese Bedingung nicht erfüllt, und der Indikator kann als Zahl von mehr als 100 % oder 1000 %o ausgedrückt werden. In einer solchen Situation wird eine Variationsreihe konstruiert und der Repräsentativitätsfehler mit der Formel für Mittelwerte auf Basis der Standardabweichung berechnet.

Die Vorhersage des Wertes des arithmetischen Mittels in der Allgemeinbevölkerung erfolgt unter Angabe von zwei Werten - dem Minimum und dem Maximum. Diese Extremwerte möglicher Abweichungen, innerhalb derer der angestrebte Durchschnittswert der Allgemeinbevölkerung schwanken kann, nennt man „ Vertrauensgrenzen».

Die Postulate der Wahrscheinlichkeitstheorie haben bewiesen, dass bei einer Normalverteilung eines Merkmals mit einer Wahrscheinlichkeit von 99,7% die Extremwerte der Abweichungen vom Mittelwert den Wert des dreifachen Repräsentativitätsfehlers nicht überschreiten ( M ± 3 m ); in 95,5% - nicht mehr als der Wert des doppelten Durchschnittsfehlers des Durchschnittswerts ( M ±2 m ); in 68,3% - nicht mehr als der Wert eines durchschnittlichen Fehlers ( M ± 1 m ) (Abb. 9).

P%

Reis. 9. Wahrscheinlichkeitsdichte der Normalverteilung.

Beachten Sie, dass die obige Aussage nur für ein Merkmal gilt, das dem normalen Gaußschen Verteilungsgesetz gehorcht.

Die meisten experimentellen Studien, auch in der Medizin, sind mit Messungen verbunden, deren Ergebnisse in einem bestimmten Intervall nahezu beliebige Werte annehmen können, daher werden sie in der Regel durch ein Modell kontinuierlicher Zufallsvariablen beschrieben. In dieser Hinsicht berücksichtigen die meisten statistischen Methoden kontinuierliche Verteilungen. Eine dieser Verteilungen, die in der mathematischen Statistik eine grundlegende Rolle spielt, ist Normal- oder Gaußsche Verteilung.

Dies hat mehrere Gründe.

1. Zunächst einmal lassen sich viele experimentelle Beobachtungen erfolgreich mit einer Normalverteilung beschreiben. Es sei gleich darauf hingewiesen, dass es keine Verteilungen empirischer Daten gibt, die genau normal wären, da eine normalverteilte Zufallsvariable im Bereich von bis liegt, was in der Praxis nie vorkommt. Die Normalverteilung ist jedoch sehr oft eine gute Näherung.

Ob Messungen von Gewicht, Größe und anderen physiologischen Parametern des menschlichen Körpers durchgeführt werden – überall beeinflussen sehr viele Zufallsfaktoren (natürliche Ursachen und Messfehler) die Ergebnisse. Und in der Regel ist die Wirkung jedes dieser Faktoren unbedeutend. Die Erfahrung zeigt, dass die Ergebnisse in solchen Fällen ungefähr normal verteilt sein werden.

2. Viele Verteilungen, die mit einer Zufallsstichprobe verbunden sind, werden mit einer Zunahme des Volumens der letzteren normal.

3. Die Normalverteilung eignet sich gut als ungefähre Beschreibung anderer kontinuierlicher Verteilungen (z. B. asymmetrischer).

4. Die Normalverteilung hat eine Reihe günstiger mathematischer Eigenschaften, die ihre weite Verbreitung in der Statistik weitgehend sichergestellt haben.

Gleichzeitig ist zu beachten, dass es in medizinischen Daten viele experimentelle Verteilungen gibt, die nicht durch das Normalverteilungsmodell beschrieben werden können. Zu diesem Zweck hat die Statistik Methoden entwickelt, die allgemein als "nichtparametrisch" bezeichnet werden.

Die Wahl eines statistischen Verfahrens, das für die Verarbeitung der Daten eines bestimmten Experiments geeignet ist, sollte in Abhängigkeit davon erfolgen, ob die erhaltenen Daten zum Normalverteilungsgesetz gehören. Die Hypothesenprüfung zur Unterordnung eines Vorzeichens unter das Normalverteilungsgesetz erfolgt anhand eines Histogramms der Häufigkeitsverteilung (Grafik) sowie einer Reihe statistischer Kriterien. Unter ihnen:

Asymmetriekriterium ( b );

Kriterien für die Überprüfung auf Kurtosis ( g );

Shapiro-Wilks-Kriterium ( W ) .

Für jeden Parameter wird eine Analyse der Art der Datenverteilung (auch Test auf Normalverteilung genannt) durchgeführt. Um die Übereinstimmung der Parameterverteilung mit dem Normalgesetz sicher beurteilen zu können, ist eine ausreichend große Anzahl von Beobachtungseinheiten (mindestens 30 Werte) erforderlich.

Bei einer Normalverteilung nehmen die Kriterien Schiefe und Kurtosis den Wert 0 an. Wenn die Verteilung nach rechts verschoben wird b > 0 (positive Asymmetrie), mit b < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона g =0. Bei g > 0 ist die Verteilungskurve schärfer, wenn g < 0 пик более сглаженный, чем функция нормального распределения.

Um mit dem Shapiro-Wilks-Test auf Normalität zu testen, muss der Wert dieses Kriteriums anhand statistischer Tabellen auf dem erforderlichen Signifikanzniveau und in Abhängigkeit von der Anzahl der Beobachtungseinheiten (Freiheitsgrade) ermittelt werden. Anhang 1. Die Hypothese der Normalität wird für kleine Werte dieses Kriteriums in der Regel abgelehnt, z w <0,8.

(Definition einer Variationsreihe; Bestandteile einer Variationsreihe; drei Formen einer Variationsreihe; Zweckmäßigkeit der Konstruktion einer Intervallreihe; Schlussfolgerungen, die aus der konstruierten Reihe gezogen werden können)

Eine Variationsreihe ist eine Folge aller Elemente einer Probe, die in nicht absteigender Reihenfolge angeordnet sind. Die gleichen Elemente werden wiederholt

Variational – das sind Serien, die auf quantitativer Basis aufgebaut sind.

Variationsverteilungsreihen bestehen aus zwei Elementen: Varianten und Häufigkeiten:

Varianten sind die Zahlenwerte eines quantitativen Merkmals in der Variationsreihe der Verteilung. Sie können positiv oder negativ, absolut oder relativ sein. Wenn Sie also Unternehmen nach den Ergebnissen der Wirtschaftstätigkeit gruppieren, sind die Optionen positiv - das ist Gewinn und negative Zahlen - das ist ein Verlust.

Häufigkeiten sind die Anzahlen einzelner Varianten oder jeder Gruppe der Variantenreihe, d.h. dies sind Zahlen, die angeben, wie oft bestimmte Optionen in einer Verteilungsserie vorkommen. Die Summe aller Häufigkeiten wird als Populationsvolumen bezeichnet und wird durch die Anzahl der Elemente der Gesamtpopulation bestimmt.

Häufigkeiten sind Häufigkeiten, die als relative Werte (Bruchteile von Einheiten oder Prozentangaben) ausgedrückt werden. Die Summe der Häufigkeiten ist gleich eins oder 100 %. Das Ersetzen von Häufigkeiten durch Häufigkeiten ermöglicht den Vergleich von Variationsreihen mit unterschiedlicher Anzahl von Beobachtungen.

Es gibt drei Formen von Variationsreihen: Rangreihen, diskrete Reihen und Intervallreihen.

Eine Rangfolge ist die Verteilung einzelner Bevölkerungseinheiten in aufsteigender oder absteigender Reihenfolge des untersuchten Merkmals. Das Ranking macht es einfach, quantitative Daten in Gruppen zu unterteilen, die kleinsten und größten Werte eines Merkmals sofort zu erkennen und die am häufigsten wiederholten Werte hervorzuheben.

Andere Formen der Variationsreihe sind Gruppentabellen, die nach der Art der Variation der Werte des untersuchten Merkmals zusammengestellt werden. Aufgrund der Art der Variation werden diskrete (diskontinuierliche) und kontinuierliche Zeichen unterschieden.

Eine diskrete Reihe ist eine solche Variationsreihe, deren Konstruktion auf Zeichen mit diskontinuierlicher Änderung (diskrete Zeichen) basiert. Zu letzteren gehören die Tarifklasse, die Anzahl der Kinder in der Familie, die Anzahl der Beschäftigten im Unternehmen etc. Diese Zeichen können nur eine endliche Anzahl bestimmter Werte annehmen.

Eine diskrete Variationsreihe ist eine Tabelle, die aus zwei Spalten besteht. Die erste Spalte gibt den spezifischen Wert des Attributs an und die zweite - die Anzahl der Bevölkerungseinheiten mit einem spezifischen Wert des Attributs.

Wenn ein Zeichen eine kontinuierliche Änderung aufweist (die Höhe des Einkommens, der Berufserfahrung, die Kosten des Anlagevermögens eines Unternehmens usw., die innerhalb bestimmter Grenzen jeden Wert annehmen können), muss für dieses Zeichen eine Intervallvariationsserie erstellt werden.



Auch hier ist die Gruppentabelle zweispaltig. Der erste gibt den Wert des Merkmals im Intervall "von - bis" (Optionen) an, der zweite - die Anzahl der im Intervall enthaltenen Einheiten (Häufigkeit).

Häufigkeit (Wiederholungshäufigkeit) – die Anzahl der Wiederholungen einer bestimmten Variante der Attributwerte, bezeichnet mit fi , und die Summe der Häufigkeiten gleich dem Volumen der untersuchten Population, bezeichnet

Dabei ist k die Anzahl der Attributwertoptionen

Sehr oft wird die Tabelle um eine Spalte ergänzt, in der die kumulierten Häufigkeiten S berechnet werden, die zeigen, wie viele Einheiten der Grundgesamtheit einen Merkmalswert nicht größer als diesen Wert haben.

Eine diskrete Variationsverteilungsreihe ist eine Reihe, in der Gruppen gemäß einem Merkmal zusammengesetzt werden, das diskret variiert und nur ganzzahlige Werte annimmt.

Die Intervallvariationsreihe der Verteilung ist eine Reihe, in der das Gruppierungsattribut, das die Grundlage der Gruppierung bildet, in einem bestimmten Intervall beliebige Werte annehmen kann, einschließlich gebrochener.

Eine Intervallvariationsreihe ist eine geordnete Menge von Variationsintervallen der Werte einer Zufallsvariablen mit den entsprechenden Häufigkeiten oder Häufigkeiten der Werte der Größe, die in jede von ihnen fallen.

Sinnvoll ist die Bildung einer Intervallverteilungsreihe zunächst bei einer kontinuierlichen Variation eines Merkmals und auch dann, wenn sich eine diskrete Variation über einen weiten Bereich, d.h. Die Anzahl der Optionen für ein diskretes Merkmal ist ziemlich groß.

Aus dieser Serie lassen sich bereits einige Schlussfolgerungen ziehen. Beispielsweise kann das durchschnittliche Element einer Schwankungsreihe (Median) eine Schätzung des wahrscheinlichsten Ergebnisses einer Messung sein. Das erste und letzte Element der Variationsreihe (d. h. das minimale und maximale Element der Stichprobe) zeigen die Streuung der Elemente der Stichprobe. Wenn sich das erste oder letzte Element stark vom Rest der Probe unterscheidet, werden sie manchmal aus den Messergebnissen ausgeschlossen, da diese Werte aufgrund eines groben Fehlers, beispielsweise einer Technologie, erzielt wurden.