Quadratischer Mittelwert. Berechnung der Standardabweichung in Microsoft Excel

Eines der wichtigsten Werkzeuge der statistischen Analyse ist die Berechnung der Standardabweichung. Mit diesem Indikator können Sie die Standardabweichung für eine Stichprobe oder für die Grundgesamtheit schätzen. Lassen Sie uns lernen, wie man die Standardabweichungsformel in Excel verwendet.

Lassen Sie uns sofort definieren, was die Standardabweichung ist und wie ihre Formel aussieht. Dieser Wert ist die Quadratwurzel des arithmetischen Mittels der Quadrate der Differenz zwischen allen Werten der Reihe und ihrem arithmetischen Mittel. Es gibt einen identischen Namen für diesen Indikator - Standardabweichung. Beide Namen sind völlig gleichwertig.

Aber natürlich muss der Benutzer in Excel dies nicht berechnen, da das Programm alles für ihn erledigt. Lassen Sie uns lernen, wie man die Standardabweichung in Excel berechnet.

Berechnung in Excel

Mit zwei speziellen Funktionen können Sie den angegebenen Wert in Excel berechnen STABW.B(laut Muster) und STABW.G(nach der allgemeinen Bevölkerung). Das Funktionsprinzip ist absolut gleich, aber sie können auf drei Arten aufgerufen werden, auf die wir weiter unten eingehen werden.

Methode 1: Funktionsassistent


Methode 2: Registerkarte „Formeln“.


Methode 3: Formel manuell eingeben

Es gibt auch eine Möglichkeit, das Argumentfenster überhaupt nicht aufzurufen. Geben Sie dazu die Formel manuell ein.


Wie Sie sehen können, ist der Mechanismus zur Berechnung der Standardabweichung in Excel sehr einfach. Der Benutzer muss nur Zahlen aus der Bevölkerung oder Links zu Zellen eingeben, die diese enthalten. Alle Berechnungen werden vom Programm selbst durchgeführt. Es ist viel schwieriger zu verstehen, was der berechnete Indikator ist und wie die Ergebnisse der Berechnung in der Praxis angewendet werden können. Aber das zu verstehen, gehört schon eher in den Bereich der Statistik als zum Erlernen des Umgangs mit Software.

Um das geometrische Mittel einfach zu berechnen, wird die Formel verwendet:

geometrisch gewichtet

Zur Bestimmung des geometrisch gewichteten Mittelwerts wird die Formel verwendet:

Die durchschnittlichen Durchmesser von Rädern, Rohren, die durchschnittlichen Seiten der Quadrate werden unter Verwendung des quadratischen Mittelwerts bestimmt.

RMS-Werte werden verwendet, um einige Indikatoren zu berechnen, wie z. B. den Variationskoeffizienten, der den Rhythmus der Ausgabe charakterisiert. Dabei wird die Standardabweichung von der Planleistung für einen bestimmten Zeitraum nach folgender Formel ermittelt:

Diese Werte charakterisieren genau die Veränderung der Wirtschaftsindikatoren im Vergleich zu ihrem Basiswert, gemessen an ihrem Durchschnittswert.

Quadratisch einfach

Der mittlere quadratische Mittelwert wird nach folgender Formel berechnet:

Quadratisch gewichtet

Der gewichtete quadratische Mittelwert ist:

22. Zu den absoluten Streuungsmaßen gehören:

Variationsbreite

mittlere lineare Abweichung

Streuung

Standardabweichung

Variationsbereich (r)

Span-Variation ist die Differenz zwischen den maximalen und minimalen Werten des Attributs

Es zeigt die Grenzen, in denen sich der Wert des Attributs in der untersuchten Population ändert.

Die Berufserfahrung von fünf Bewerbern im vorherigen Job beträgt: 2,3,4,7 und 9 Jahre. Lösung: Schwankungsbreite = 9 - 2 = 7 Jahre.

Für ein verallgemeinertes Merkmal der Unterschiede in den Werten des Attributs werden die durchschnittlichen Variationsindikatoren basierend auf der Berücksichtigung von Abweichungen vom arithmetischen Mittel berechnet. Die Differenz wird als Abweichung vom Mittelwert genommen.

Gleichzeitig muss man, um zu vermeiden, dass die Summe der Abweichungen der Merkmalsoptionen vom Mittelwert (die Nulleigenschaft des Mittelwerts) zu Null wird, entweder die Vorzeichen der Abweichung ignorieren, dh diese Summe modulo nehmen , oder quadrieren Sie die Abweichungswerte

Mittlere lineare und quadratische Abweichung

Durchschnittliche lineare Abweichung ist das arithmetische Mittel der absoluten Abweichungen der Einzelwerte des Attributs vom Mittelwert.

Die durchschnittliche lineare Abweichung ist einfach:

Die Berufserfahrung von fünf Bewerbern im vorherigen Job beträgt: 2,3,4,7 und 9 Jahre.

In unserem Beispiel: Jahre;

Antwort: 2,4 Jahre.

Durchschnittliche lineare Abweichung gewichtet gilt für gruppierte Daten:

Die durchschnittliche lineare Abweichung wird aufgrund ihrer Bedingtheit in der Praxis relativ selten verwendet (insbesondere zur Charakterisierung der Vertragserfüllung im Hinblick auf die Gleichmäßigkeit der Lieferung; bei der Analyse der Produktqualität unter Berücksichtigung der technologischen Besonderheiten der Produktion ).

Standardabweichung

Das perfekteste Merkmal der Variation ist die Standardabweichung, die als Standard (oder Standardabweichung) bezeichnet wird. Standardabweichung() ist gleich der Quadratwurzel des mittleren Quadrats der Abweichungen der Einzelwerte des Merkmals vom arithmetischen Mittel:

Die Standardabweichung ist einfach:

Für gruppierte Daten wird die gewichtete Standardabweichung angewendet:

Zwischen mittlerer quadratischer und mittlerer linearer Abweichung unter Normalverteilungsbedingungen besteht folgender Zusammenhang: ~ 1,25.

Die Standardabweichung, die das wichtigste absolute Streuungsmaß ist, wird bei der Bestimmung der Werte der Ordinaten der Normalverteilungskurve, bei Berechnungen im Zusammenhang mit der Organisation der Probenbeobachtung und der Feststellung der Genauigkeit der Probenmerkmale sowie in verwendet Beurteilung der Grenzen der Variation eines Merkmals in einer homogenen Population.

Anweisung

Seien es mehrere charakterisierende Zahlen - oder homogene Größen. Zum Beispiel die Ergebnisse von Messungen, Wägungen, statistischen Beobachtungen usw. Alle präsentierten Größen müssen mit derselben Messung gemessen werden. Gehen Sie wie folgt vor, um die Standardabweichung zu ermitteln.

Bestimmen Sie das arithmetische Mittel aller Zahlen: Addieren Sie alle Zahlen und teilen Sie die Summe durch die Gesamtzahl der Zahlen.

Bestimmen Sie die Streuung (Streuung) von Zahlen: Addieren Sie die Quadrate der zuvor gefundenen Abweichungen und teilen Sie die resultierende Summe durch die Anzahl der Zahlen.

Auf der Station befinden sich sieben Patienten mit einer Temperatur von 34, 35, 36, 37, 38, 39 und 40 Grad Celsius.

Es ist erforderlich, die durchschnittliche Abweichung vom Durchschnitt zu bestimmen.
Lösung:
"auf der Station": (34+35+36+37+38+39+40)/7=37 ºС;

Temperaturabweichungen vom Durchschnitt (in diesem Fall der Normalwert): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, es stellt sich heraus: -3, -2, -1 , 0, 1, 2, 3 (ºС);

Teilen Sie die Summe der zuvor erhaltenen Zahlen durch ihre Zahl. Für die Genauigkeit der Berechnung ist es besser, einen Taschenrechner zu verwenden. Das Ergebnis der Division ist das arithmetische Mittel der Summanden.

Achten Sie genau auf alle Phasen der Berechnung, da ein Fehler in mindestens einer der Berechnungen zu einem falschen endgültigen Indikator führt. Überprüfen Sie die erhaltenen Berechnungen in jeder Phase. Der arithmetische Durchschnitt hat denselben Zähler wie die Summanden der Zahlen, dh wenn Sie die durchschnittliche Anwesenheit ermitteln, sind alle Indikatoren „Person“.

Diese Berechnungsmethode wird nur bei mathematischen und statistischen Berechnungen verwendet. So hat beispielsweise das arithmetische Mittel in der Informatik einen anderen Berechnungsalgorithmus. Das arithmetische Mittel ist ein sehr bedingter Indikator. Es zeigt die Wahrscheinlichkeit eines Ereignisses, sofern es nur einen Faktor oder Indikator hat. Für eine möglichst gründliche Analyse müssen viele Faktoren berücksichtigt werden. Dazu wird die Berechnung allgemeinerer Größen verwendet.

Das arithmetische Mittel ist eines der Maße der zentralen Tendenz, das in Mathematik und statistischen Berechnungen weit verbreitet ist. Den arithmetischen Mittelwert für mehrere Werte zu finden ist sehr einfach, aber jede Aufgabe hat ihre eigenen Nuancen, die man einfach kennen muss, um korrekte Berechnungen durchzuführen.

Quantitative Ergebnisse solcher Experimente.

So finden Sie das arithmetische Mittel

Die Suche nach dem arithmetischen Mittel einer Reihe von Zahlen sollte mit der Bestimmung der algebraischen Summe dieser Werte beginnen. Wenn das Array beispielsweise die Zahlen 23, 43, 10, 74 und 34 enthält, beträgt ihre algebraische Summe 184. Beim Schreiben wird das arithmetische Mittel mit den Buchstaben μ (mu) oder x (x mit Balken) bezeichnet. . Als nächstes sollte die algebraische Summe durch die Anzahl der Zahlen im Array dividiert werden. In diesem Beispiel gab es fünf Zahlen, also ist das arithmetische Mittel 184/5 und 36,8.

Merkmale der Arbeit mit negativen Zahlen

Wenn das Array negative Zahlen enthält, wird das arithmetische Mittel mit einem ähnlichen Algorithmus ermittelt. Lediglich beim Rechnen in der Programmierumgebung oder bei zusätzlichen Bedingungen in der Aufgabe gibt es einen Unterschied. In diesen Fällen besteht die Ermittlung des arithmetischen Mittels von Zahlen mit unterschiedlichen Vorzeichen aus drei Schritten:

1. Ermittlung des gemeinsamen arithmetischen Mittels nach der Standardmethode;
2. Ermitteln des arithmetischen Mittels negativer Zahlen.
3. Berechnung des arithmetischen Mittels positiver Zahlen.

Die Antworten der einzelnen Aktionen werden durch Kommas getrennt geschrieben.

Natürliche Brüche und Dezimalbrüche

Wenn das Zahlenfeld durch Dezimalbrüche dargestellt wird, erfolgt die Lösung gemäß der Methode zur Berechnung des arithmetischen Mittels ganzer Zahlen, das Ergebnis wird jedoch gemäß den Anforderungen der Aufgabe für die Genauigkeit der Antwort reduziert.

Bei der Arbeit mit natürlichen Brüchen sollten diese auf einen gemeinsamen Nenner gebracht werden, der mit der Anzahl der Zahlen im Array multipliziert wird. Der Zähler der Antwort ist die Summe der gegebenen Zähler der ursprünglichen Bruchelemente.

Es wird in den Fällen verwendet, in denen beim Ersetzen einzelner Werte eines Merkmals durch einen Durchschnittswert die Quadratsumme der ursprünglichen Werte unverändert bleiben muss.

Das Haupteinsatzgebiet ist die Messung des Schwankungsgrades der Einzelwerte eines Merkmals relativ zum arithmetischen Mittel (Standardabweichung). Darüber hinaus wird der quadratische Mittelwert in Fällen verwendet, in denen der Durchschnittswert eines Merkmals in Quadrat- oder Kubikeinheiten berechnet werden muss (bei der Berechnung der durchschnittlichen Größe von quadratischen Querschnitten, durchschnittlichen Durchmessern von Rohren, Stämmen usw.).

quadratischer Mittelwert berechnet in zwei Formen:

- wie einfach

wie gewichtet

(4.22)

Alle Leistungsmittelwerte unterscheiden sich voneinander durch die Werte des Exponenten. Dabei,je höher der Exponent, desto mehr quantitativer Wert des Durchschnitts :

Diese Eigenschaft von Machtmitteln wird Eigenschaft genannt Majorität Mittel.

Auf diese Weise,Die Wahl des Typs des Durchschnittsindikators hat einen erheblichen Einfluss auf seinen numerischen Wert. Die Wahl der Art der Mittelung wird in bestimmt jeden Einzelfall durch Analyse der Studienpopulation, Studium des Inhalts des Phänomens. Der exponentielle Mittelwert ist richtig gewählt, wenn sich auf allen Etappen der Berechnungen seine logische Formel nicht ändert , diese. der sozioökonomische Inhalt des Durchschnitts Schild.

Eine besondere Art von Durchschnitten strukturelle Durchschnitte. Sie werden zur Untersuchung der internen Struktur der Verteilungsreihen von Merkmalswerten verwendet. Dazu gehören Modus und Median.

Modus und Median charakterisieren den Wert eines Merkmals einer statistischen Einheit, das eine bestimmte Position in der Variationsreihe einnimmt.

Mode (Mo) - der häufigste Wert des Merkmals in der Grundgesamtheit. Modus ist in der statistischen Praxis weit verbreitet für Untersuchung der Verbrauchernachfrage, Preisregistrierung usw.

Median ( Mir) - der Wert eines Merkmals einer statistischen Einheit, das in der Mitte der Rangfolge liegt und die Grundgesamtheit in zwei gleich große Teile teilt.

Für diskrete Variationsreihen Mo und Mir werden gemäß den Definitionen ausgewählt: Modus – als der Wert des Merkmals mit der höchsten Häufigkeit \ n ich ; Die Position des Medians für eine ungerade Populationsgröße wird durch seine Anzahl bestimmt
, wo N- das Volumen der statistischen Grundgesamtheit. Bei einer geraden Länge der Reihe entspricht der Median dem Durchschnitt der beiden Optionen in der Mitte der Reihe.

Als zuverlässigster Indikator wird der Median verwendet typisch Werte einer heterogenen Bevölkerung, da sie unempfindlich ist Extremwerte des Merkmals, die erheblich davon abweichen können das Hauptarray seiner Werte. Darüber hinaus findet der Median praktische Anwendung aufgrund einer besonderen mathematischen Eigenschaft:
.

Betrachten Sie die Definition von Modus und Median im Folgenden Beispiel:

Es gibt eine Reihe von Verteilungen von Arbeitsplätzen nach Qualifikationsniveau. Die Daten sind in Tabelle 4.4 dargestellt.

Tabelle 4.4 – Verteilung der Arbeitsbereiche nach Qualifikationsniveau

Angesammelt

Der Modus wird entsprechend dem maximalen Frequenzwert ausgewählt: at n max = 14, Mo= 4, d.h. die 4. Kategorie ist die häufigste. Um den Median zu finden Mir Zentraleinheiten sind definiert ( N+1)/2 . Dies sind die 25. und 26. Einheiten. Die Gruppe, in die diese Einheiten fallen, wird durch die akkumulierten Häufigkeiten bestimmt. Dies ist die 4. Gruppe, in der der Merkmalswert 4 ist. Mir= 4 bedeutet dies, dass die Hälfte der Arbeiter einen Rang unter 4 und die andere einen Rang über 4 hat.

In den Intervallreihenwerten Mo und Mir komplizierter berechnet.

Der Modus ist wie folgt definiert:

Das Intervall, in dem sich der Moduswert befindet, wird durch den maximalen Frequenzwert bestimmt. Es heißt modal.

Innerhalb des modalen Intervalls wird der Moduswert nach folgender Formel berechnet:

wo
- die untere Grenze des modalen Intervalls;

a Mo - modale Intervallbreite;

n Mo , n Mo-1 , n Mo+1 - jeweils die Häufigkeit von modalen, prämodalen (vorhergehenden modalen) und postmodalen (nachfolgenden modalen) Intervallen.

Der folgende Ansatz wird verwendet, um den Median in Intervallreihen zu berechnen:

Basierend auf den akkumulierten Häufigkeiten wird das mittlere Intervall gefunden.

Der Median ist das Intervall, das die zentrale Einheit enthält.

Innerhalb des mittleren Intervallwerts Mir wird durch die Formel bestimmt:

(4.25)

wo
- die untere Grenze des Medianintervalls;

a Mir -Breite des Medianintervalls;

N ist das Volumen der statistischen Grundgesamtheit;

N Ich-1- akkumulierte Häufigkeit des vormedianen Intervalls;

n Mir - Häufigkeit des Medianintervalls.

Betrachten wir die Berechnung von Modus und Median für die Intervallreihe der Verteilung am Beispiel einer Reihe der Verteilung von Arbeitnehmern nach Betriebszugehörigkeit (Tab. 4.5).

Tabelle 4.5 – Verteilung des Arbeitsbereichs nach Betriebszugehörigkeit

Intervall

a ich

n ich

N ich

BerechnungMo:

Maximale Frequenz n max = 13, es entspricht der vierten Gruppe, daher ist das Intervall mit Grenzen von 12–16 Jahren modal.

Der Modus wird nach folgender Formel berechnet:

Meistens gibt es Arbeiter mit einer Berufserfahrung von etwa 13 Jahren.

Der Modus befindet sich nicht in der Mitte des modalen Intervalls, er ist an dessen unterer Grenze verschoben, was auf die Struktur dieser Verteilungsreihe zurückzuführen ist (die Häufigkeit des prämodalen Intervalls ist viel höher als die Häufigkeit des postmodalen Intervalls).

Medianberechnung:

Das mittlere Intervall wird aus dem kumulativen Häufigkeitsdiagramm bestimmt. Es enthält die 25. und 26. statistische Einheit, die in verschiedenen Gruppen sind - in der 3. und 4.. Zur Findung Mir Sie können jede davon verwenden. Wir führen die Berechnung für die 3. Gruppe durch:

Selbe Bedeutung Mir erhält man bei der Berechnung für die 4. Gruppe:

Mit doppelter Mitte Mir befindet sich immer an der Kreuzung von Intervallen, die zentrale Einheiten enthalten. Berechneter Wert Mir zeigt, dass die ersten 25 Arbeitnehmer weniger als 12 Jahre Berufserfahrung haben und die verbleibenden 25 daher mehr als 12 Jahre.

Der Modus kann grafisch durch das Verteilungspolygon in diskreten Reihen, durch das Verteilungshistogramm - in Intervallreihen und den Median - durch Kumulierung bestimmt werden.

Um den Modus in der Intervallreihe zu finden, muss der rechte Eckpunkt des modalen Rechtecks ​​mit der oberen rechten Ecke des vorherigen Rechtecks ​​und der linke Eckpunkt mit der oberen linken Ecke des nächsten Rechtecks ​​verbunden werden. Die Abszisse des Schnittpunkts dieser Linien ist der Verteilungsmodus.

Zur Bestimmung des Medians wird die Höhe der größten Ordinate der Kumulierung, die der Gesamtbevölkerung entspricht, halbiert. Durch den erhaltenen Punkt wird parallel zur Abszissenachse eine gerade Linie gezogen, bis sie die Kumulierung schneidet. Die Abszisse des Schnittpunktes ist der Median.

Außer Mo und Mir in der Variantenreihe können weitere Strukturmerkmale – Quantile – bestimmt werden. Quantile sind für eine tiefere Untersuchung der Struktur der Verteilungsreihen gedacht. Quantil- Dies ist der Wert eines Merkmals, das einen bestimmten Platz in der nach diesem Merkmal geordneten Population einnimmt. Es gibt folgende Arten von Quantilen:

- Quartile– Attributwerte, die den geordneten Satz in 4 gleiche Teile teilen;

- Dezile– Attributwerte, die die Bevölkerung in 10 gleiche Teile teilen;

- Prozente- Attributwerte, die die Bevölkerung in 100 gleiche Teile teilen.

Um die Position des Zentrums der Verteilungsreihe zu charakterisieren, können daher 3 Indikatoren verwendet werden: mittlere BedeutungSchild,Modus, Median.

Bei der Auswahl der Art und Form eines bestimmten Indikators des Vertriebszentrums ist von den folgenden Empfehlungen auszugehen:

Für nachhaltige sozioökonomische Prozesse wird das arithmetische Mittel als Indikator der Mitte verwendet. Solche Prozesse sind durch symmetrische Verteilungen gekennzeichnet, bei denen

= Mir= Mo;

Bei instabilen Prozessen ist die Position des Verteilzentrums gekennzeichnet durch Mo oder Mir. Bei asymmetrischen Prozessen ist das bevorzugte Merkmal des Verteilungszentrums der Median, da er eine Position zwischen dem arithmetischen Mittel und dem Modus einnimmt.

Es sollte beachtet werden, dass diese Berechnung der Varianz einen Nachteil hat - sie erweist sich als voreingenommen, d.h. seine mathematische Erwartung ist nicht gleich dem wahren Wert der Varianz. Mehr dazu. Dabei ist nicht alles so schlimm. Mit zunehmender Stichprobengröße nähert es sich immer noch seinem theoretischen Gegenstück, d.h. ist asymptotisch unverzerrt. Daher kann bei großen Stichprobenumfängen die obige Formel verwendet werden.

Es ist sinnvoll, die Zeichensprache in die Wortsprache zu übersetzen. Es stellt sich heraus, dass die Varianz das durchschnittliche Quadrat der Abweichungen ist. Das heißt, zuerst wird der Durchschnittswert berechnet, dann wird die Differenz zwischen jedem Original- und Durchschnittswert genommen, quadriert, aufsummiert und dann durch die Anzahl der Werte in dieser Grundgesamtheit dividiert. Die Differenz zwischen Einzelwert und Mittelwert gibt das Maß der Abweichung wieder. Es wird quadriert, um sicherzustellen, dass alle Abweichungen ausschließlich positive Zahlen werden, und um eine gegenseitige Aufhebung positiver und negativer Abweichungen zu vermeiden, wenn sie summiert werden. Dann berechnen wir angesichts der quadrierten Abweichungen einfach das arithmetische Mittel. Durchschnitt - Quadrat - Abweichungen. Abweichungen werden quadriert und der Durchschnitt berücksichtigt. Die Antwort liegt in nur drei Worten.

In ihrer reinen Form, wie beispielsweise dem arithmetischen Mittel oder Index, wird die Streuung jedoch nicht verwendet. Es handelt sich vielmehr um einen Hilfs- und Zwischenindikator, der für andere Arten statistischer Analysen notwendig ist. Sie hat nicht einmal eine normale Maßeinheit. Nach der Formel zu urteilen, ist dies das Quadrat der ursprünglichen Dateneinheit. Ohne eine Flasche, wie sie sagen, werden Sie es nicht verstehen.

(Modul 111)

Um die Streuung in die Realität zurückzubringen, also für weltlichere Zwecke zu verwenden, wird daraus eine Quadratwurzel gezogen. Es stellt sich heraus, die sogenannte Standardabweichung (RMS). Es gibt Namen "Standardabweichung" oder "Sigma" (vom Namen des griechischen Buchstabens). Die Standardabweichungsformel lautet:

Um diesen Indikator für die Stichprobe zu erhalten, verwenden Sie die Formel:

Wie bei der Varianz gibt es eine etwas andere Berechnungsoption. Aber wenn die Stichprobe wächst, verschwindet der Unterschied.

Die Standardabweichung charakterisiert natürlich auch das Maß der Datenstreuung, kann aber jetzt (im Gegensatz zur Streuung) mit den Originaldaten verglichen werden, da sie die gleichen Maßeinheiten haben (dies geht aus der Berechnungsformel hervor). Dieser Indikator in seiner reinen Form ist jedoch nicht sehr aussagekräftig, da er zu viele Zwischenberechnungen enthält, die verwirrend sind (Abweichung, Quadrat, Summe, Durchschnitt, Wurzel). Dennoch ist es bereits möglich, direkt mit der Standardabweichung zu arbeiten, da die Eigenschaften dieses Indikators gut untersucht und bekannt sind. Zum Beispiel gibt es diese Drei-Sigma-Regel, die besagt, dass 997 von 1000 Datenpunkten innerhalb von ±3 Sigma des arithmetischen Mittels liegen. Die Standardabweichung als Maß für die Unsicherheit wird auch in viele statistische Berechnungen einbezogen. Mit seiner Hilfe wird der Grad der Genauigkeit verschiedener Schätzungen und Prognosen ermittelt. Ist die Streuung sehr groß, fällt auch die Standardabweichung groß aus, die Prognose wird also ungenau, was sich beispielsweise in sehr breiten Konfidenzintervallen ausdrückt.

Der Variationskoeffizient

Die Standardabweichung gibt eine absolute Schätzung des Streuungsmaßes an. Um zu verstehen, wie groß der Spread im Verhältnis zu den Werten selbst ist (d. h. unabhängig von ihrer Größenordnung), ist daher ein relativer Indikator erforderlich. Dieser Indikator wird aufgerufen Variationskoeffizient und errechnet sich nach folgender Formel:

Der Variationskoeffizient wird in Prozent gemessen (wenn mit 100 % multipliziert). Mit diesem Indikator können Sie eine Vielzahl von Phänomenen vergleichen, unabhängig von ihrer Größenordnung und Maßeinheit. Diese Tatsache macht den Variationskoeffizienten so beliebt.

In der Statistik wird akzeptiert, dass die Population als homogen angesehen wird, wenn der Wert des Variationskoeffizienten weniger als 33% beträgt, wenn er mehr als 33% beträgt, dann ist sie heterogen. Es fällt mir schwer, hier einen Kommentar abzugeben. Ich weiß nicht, wer und warum es so definiert hat, aber es wird als Axiom angesehen.

Ich habe das Gefühl, dass ich von einer trockenen Theorie mitgerissen wurde und etwas Visuelles und Figürliches mitbringen muss. Andererseits beschreiben alle Variationsindikatoren ungefähr dasselbe, nur werden sie unterschiedlich berechnet. Daher ist es schwierig, mit einer Vielzahl von Beispielen zu glänzen, da sich nur die Werte der Indikatoren unterscheiden können, nicht jedoch deren Wesen. Vergleichen wir also, wie sich die Werte verschiedener Variationsindikatoren für denselben Datensatz unterscheiden. Nehmen wir ein Beispiel mit der Berechnung der durchschnittlichen linearen Abweichung (von ). Hier die Originaldaten:

Und ein Erinnerungsdiagramm.

Basierend auf diesen Daten berechnen wir verschiedene Variationsindikatoren.

Der Mittelwert ist das übliche arithmetische Mittel.

Die Schwankungsbreite ist die Differenz zwischen Maximum und Minimum:

Die durchschnittliche lineare Abweichung wird nach folgender Formel berechnet:

Standardabweichung:

Wir fassen die Berechnung in einer Tabelle zusammen.

Wie Sie sehen können, ergeben der lineare Mittelwert und die Standardabweichung ähnliche Werte für den Grad der Datenvariation. Die Varianz ist Sigma zum Quadrat, also wird es immer eine relativ große Zahl sein, die eigentlich nichts aussagt. Die Variationsbreite ist der Unterschied zwischen den Extremen und kann viel aussagen.

Fassen wir einige Ergebnisse zusammen.

Die Variation eines Indikators spiegelt die Variabilität eines Prozesses oder Phänomens wider. Ihr Grad kann anhand mehrerer Indikatoren gemessen werden.

1. Die Schwankungsbreite ist die Differenz zwischen Maximum und Minimum. Gibt den Bereich der möglichen Werte wieder.
2. Durchschnittliche lineare Abweichung - spiegelt den Durchschnitt der absoluten (Modulo-) Abweichungen aller Werte der analysierten Grundgesamtheit von ihrem Durchschnittswert wider.
3. Streuung – das durchschnittliche Quadrat der Abweichungen.
4. Standardabweichung – die Wurzel der Varianz (mittlere quadratische Abweichungen).
5. Der Variationskoeffizient ist der universellste Indikator, der den Grad der Streuung von Werten widerspiegelt, unabhängig von ihrer Skala und Maßeinheit. Der Variationskoeffizient wird in Prozent gemessen und kann verwendet werden, um die Variation verschiedener Prozesse und Phänomene zu vergleichen.

In der statistischen Analyse gibt es also ein System von Indikatoren, die die Homogenität von Phänomenen und die Stabilität von Prozessen widerspiegeln. Variationsindikatoren haben oft keine eigenständige Aussagekraft und dienen der weiteren Datenanalyse (Berechnung von Konfidenzintervallen).