So finden Sie den x-Mittelwert in der Statistik. Durchschnittswerte in der Statistik

Gemäß der Stichprobenerhebung wurden die Einleger nach der Größe der Einlage bei der Sberbank der Stadt gruppiert:

Definieren:

1) Variationsbereich;

2) durchschnittlicher Einzahlungsbetrag;

3) durchschnittliche lineare Abweichung;

4) Streuung;

5) Standardabweichung;

6) Variationskoeffizient der Beiträge.

Lösung:

Diese Verteilungsreihe enthält offene Intervalle. In solchen Reihen wird herkömmlicherweise angenommen, dass der Wert des Intervalls der ersten Gruppe gleich dem Wert des Intervalls der nächsten Gruppe ist, und der Wert des Intervalls der letzten Gruppe gleich dem Wert des Intervalls der vorherigen Gruppe ist eines.

Der Intervallwert der zweiten Gruppe ist 200, daher ist der Wert der ersten Gruppe auch 200. Der Intervallwert der vorletzten Gruppe ist 200, was bedeutet, dass das letzte Intervall auch einen Wert gleich 200 haben wird.

1) Definieren Sie die Variationsbreite als die Differenz zwischen dem größten und dem kleinsten Wert des Merkmals:

Die Variationsbreite in der Höhe des Beitrags beträgt 1000 Rubel.

2) Die durchschnittliche Höhe des Beitrags wird durch die Formel des arithmetisch gewichteten Durchschnitts bestimmt.

Lassen Sie uns vorläufig den diskreten Wert des Attributs in jedem Intervall bestimmen. Dazu finden wir mit der einfachen arithmetischen Mittelformel die Mittelpunkte der Intervalle.

Der Durchschnittswert des ersten Intervalls ist gleich:

die zweite - 500 usw.

Lassen Sie uns die Ergebnisse der Berechnungen in die Tabelle eintragen:

Einzahlungsbetrag, reiben.Zahl der Mitwirkenden, fDie Mitte des Intervalls, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Gesamt 400 - 312000

Die durchschnittliche Einlage bei der Sberbank der Stadt beträgt 780 Rubel:

3) Die durchschnittliche lineare Abweichung ist das arithmetische Mittel der absoluten Abweichungen der Einzelwerte des Attributs vom Gesamtdurchschnitt:

Das Verfahren zur Berechnung der durchschnittlichen linearen Abweichung in der Intervallverteilungsreihe ist wie folgt:

1. Der arithmetisch gewichtete Durchschnitt wird wie in Absatz 2) dargestellt berechnet.

2. Die absoluten Abweichungen der Variante vom Mittelwert werden ermittelt:

3. Die erhaltenen Abweichungen werden mit den Frequenzen multipliziert:

4. Die Summe der gewichteten Abweichungen wird ohne Berücksichtigung des Vorzeichens ermittelt:

5. Die Summe der gewichteten Abweichungen wird durch die Summe der Häufigkeiten dividiert:

Es ist bequem, die Tabelle der berechneten Daten zu verwenden:

Einzahlungsbetrag, reiben.Zahl der Mitwirkenden, fDie Mitte des Intervalls, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Gesamt 400 - - - 81280

Die durchschnittliche lineare Abweichung der Höhe der Einlagen von Sberbank-Kunden beträgt 203,2 Rubel.

4) Streuung ist das arithmetische Mittel der quadrierten Abweichungen jedes Merkmalswerts vom arithmetischen Mittel.

Die Berechnung der Varianz in der Intervallverteilungsreihe erfolgt nach der Formel:

Das Verfahren zur Berechnung der Varianz ist in diesem Fall wie folgt:

1. Bestimmen Sie den arithmetisch gewichteten Durchschnitt, wie in Absatz 2 gezeigt).

2. Abweichungen vom Mittelwert finden:

3. Quadrieren der Abweichung jeder Option vom Mittelwert:

4. Quadratische Abweichungen mit Gewichten (Häufigkeiten) multiplizieren:

5. Fassen Sie die erhaltenen Arbeiten zusammen:

6. Der resultierende Betrag wird durch die Summe der Gewichte (Frequenzen) dividiert:

Lassen Sie uns die Berechnungen in eine Tabelle stellen:

Einzahlungsbetrag, reiben.Zahl der Mitwirkenden, fDie Mitte des Intervalls, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Gesamt 400 - - - 23040000

Bei der statistischen Verarbeitung der Ergebnisse von Studien verschiedener Art werden die erhaltenen Werte häufig in einer Folge von Intervallen gruppiert. Um die verallgemeinernden Eigenschaften solcher Sequenzen zu berechnen, muss manchmal gerechnet werden Mitte Intervall- "Zentrale Option". Die Berechnungsmethoden sind recht einfach, weisen jedoch einige Merkmale auf, die sich sowohl aus der zur Messung verwendeten Skala als auch aus der Art der Gruppierung (offene oder geschlossene Intervalle) ergeben.

Anweisung

Wenn das Intervall ein Abschnitt einer fortlaufenden Zahlenfolge ist, dann verwenden Sie die üblichen mathematischen Methoden zur Berechnung des arithmetischen Mittels, um seine Mitte zu finden. Mindestwert Intervall(sein Anfang) mit dem Maximum (Ende) addieren und das Ergebnis halbieren - das ist eine Möglichkeit, das arithmetische Mittel zu berechnen. Diese Regel gilt zum Beispiel, wenn es um das Alter geht Intervall X. Sagen wir Mitte Intervall im Bereich von 21 Jahren bis 33 Jahren wird es eine Note von 27 Jahren geben, da (21 + 33) / 2 = 27.

Manchmal ist es bequemer, eine andere Methode zur Berechnung des arithmetischen Mittels zwischen der Ober- und Untergrenze zu verwenden. Intervall. Bestimmen Sie bei dieser Variante zunächst die Breite des Bereichs - subtrahieren Sie den Mindestwert vom Höchstwert. Teilen Sie dann den resultierenden Wert in zwei Hälften und addieren Sie das Ergebnis zum Mindestwert des Bereichs. Wenn die untere Grenze beispielsweise 47,15 und die obere Grenze 79,13 beträgt, dann wäre die Bereichsbreite 79,13-47,15=31,98. Dann die Mitte Intervall 63,14, da 47,15+(31,98/2) = 47,15+15,99 = 63,14.

Wenn das Intervall kein Abschnitt der üblichen Zahlenfolge ist, berechnen Sie es Mitte entsprechend der Zyklizität und Dimension der verwendeten Messskala. Wenn wir zum Beispiel über eine historische Periode sprechen, dann die Mitte Intervall wird ein bestimmtes Kalenderdatum sein. So für Intervall Vom 1. Januar 2012 bis zum 31. Januar 2012 ist der Mittelpunkt der 16. Januar 2012.

Neben den üblichen (geschlossenen) Intervallen können statistische Forschungsmethoden auch mit „offenen“ Intervallen arbeiten. Für solche Bereiche ist eine der Grenzen nicht definiert. Beispielsweise kann ein offenes Intervall als „50 Jahre oder älter“ definiert werden. Die Mitte wird in diesem Fall durch das Analogieverfahren bestimmt – wenn alle anderen Bereiche der betrachteten Sequenz die gleiche Breite haben, dann wird angenommen, dass dieses offene Intervall die gleiche Dimension hat. Andernfalls müssen Sie die Dynamik der Änderung der Breite der Intervalle vor dem offenen Intervall bestimmen und ihre bedingte Breite basierend auf dem resultierenden Änderungstrend ableiten.

Anweisung

Wenn das Intervall ein Abschnitt einer kontinuierlichen Zahlenfolge ist, dann verwenden Sie mathematische Methoden zur Berechnung des arithmetischen Mittels, um seine Mitte zu finden. Addieren Sie den Minimalwert (seinen Anfang) zum Maximum () und teilen Sie das Ergebnis in zwei Hälften - dies ist eine Möglichkeit, das arithmetische Mittel zu berechnen. Dies gilt zum Beispiel, wenn es um das Alter geht Intervall X. Sagen wir Mitte Intervall im Bereich von 21 Jahren bis 33 Jahren wird es eine Note von 27 Jahren geben, da (21 + 33) / 2 = 27.

Manchmal ist es bequemer, eine andere Methode zur Berechnung des arithmetischen Mittels zwischen der Ober- und Untergrenze zu verwenden. Intervall. Bestimmen Sie bei dieser Variante zunächst die Breite des Bereichs - subtrahieren Sie den Mindestwert vom Höchstwert. Teilen Sie dann den resultierenden Wert in zwei Hälften und addieren Sie das Ergebnis zum Mindestwert des Bereichs. Wenn beispielsweise der unterste Wert 47,15 und der obere Wert 79,13 beträgt, beträgt die Bereichsbreite 79,13-47,15 = 31,98. Dann die Mitte Intervall 63,14, da 47,15+(31,98/2) = 47,15+15,99 = 63,14.

Wenn das Intervall kein Abschnitt der üblichen Zahlenfolge ist, berechnen Sie es Mitte entsprechend der Zyklizität und Dimension der verwendeten Messskala. Wenn wir zum Beispiel über eine historische Periode sprechen, dann die Mitte Intervall wird ein bestimmtes Kalenderdatum sein. So für Intervall Vom 1. Januar 2012 bis zum 31. Januar 2012 ist der Mittelpunkt der 16. Januar 2012.

Neben den üblichen (geschlossenen) Intervallen können statistische Forschungsmethoden auch mit „offenen“ Intervallen arbeiten. Für solche Bereiche ist eine der Grenzen nicht definiert. Beispielsweise kann ein offenes Intervall als „50 Jahre oder älter“ definiert werden. Die Mitte wird in diesem Fall durch das Analogieverfahren bestimmt – wenn alle anderen Bereiche der betrachteten Sequenz die gleiche Breite haben, dann wird angenommen, dass dieses offene Intervall gleich ist. Andernfalls müssen Sie die Dynamik der Breite der Intervalle vor der Eröffnung und ihre bedingte Breite basierend auf dem resultierenden Änderungstrend bestimmen.

Quellen:

  • Was ist ein offenes Intervall?

Bei der Untersuchung der Variation - Unterschiede in den Einzelwerten eines Merkmals in Einheiten der untersuchten Population - werden eine Reihe absoluter und relativer Indikatoren berechnet. In der Praxis hat der Variationskoeffizient die größte Anwendung unter den relativen Indikatoren gefunden.

Anweisung

Beachten Sie, dass der Variationskoeffizient in der Praxis nicht nur zum Vergleich der Variation, sondern auch zur Charakterisierung der Populationshomogenität verwendet wird. Wenn dieser Indikator 0,333 oder 33,3 % nicht überschreitet, wird die Merkmalsvariation als schwach angesehen, und wenn sie mehr als 0,333 beträgt, wird sie als stark angesehen. Bei starker Variation gilt die untersuchte Grundgesamtheit als heterogen und der Mittelwert als atypisch, er kann nicht als verallgemeinernder Indikator für diese Grundgesamtheit herangezogen werden. Die untere Grenze des Variationskoeffizienten ist Null, es gibt keine obere Grenze. Mit zunehmender Variation eines Merkmals steigt jedoch auch dessen Wert.

Bei der Berechnung des Variationskoeffizienten müssen Sie die mittlere Abweichung verwenden. Es ist als Quadratwurzel definiert, die Sie wiederum wie folgt finden können: D \u003d Σ (X-Xav) ^ 2 / N. Mit anderen Worten, die Varianz ist das durchschnittliche Quadrat der Abweichung vom arithmetischen Mittel. bestimmt, wie stark die spezifischen Indikatoren der Reihe im Durchschnitt von ihrem Durchschnittswert abweichen. Sie ist ein absolutes Maß für die Fluktuation eines Merkmals und daher eindeutig interpretierbar.

In der Statistik müssen bei der Analyse eines Phänomens oder Prozesses häufig nicht nur Informationen über die Durchschnittswerte der untersuchten Indikatoren berücksichtigt werden, sondern auch Streuung oder Schwankung der Werte einzelner Einheiten , was ein wichtiges Merkmal der untersuchten Population ist.

Aktienkurse, Angebots- und Nachfragevolumina, Zinssätze in verschiedenen Zeiträumen und an verschiedenen Orten unterliegen den größten Schwankungen.

Die Hauptindikatoren, die die Variation charakterisieren , sind die Spannweite, die Varianz, die Standardabweichung und der Variationskoeffizient.

Span-Variation ist die Differenz zwischen den maximalen und minimalen Werten des Attributs: R = Xmax – Xmin. Der Nachteil dieses Indikators besteht darin, dass er nur die Grenzen der Merkmalsvariation bewertet und nicht die Schwankung innerhalb dieser Grenzen widerspiegelt.

Streuung ohne diesen Mangel. Es wird als durchschnittliches Quadrat der Abweichungen der Attributwerte von ihrem Durchschnittswert berechnet:

Vereinfachte Methode zur Berechnung der Varianz erfolgt nach folgenden Formeln (einfach und gewichtet):

Beispiele für die Anwendung dieser Formeln werden in den Aufgaben 1 und 2 vorgestellt.

Ein in der Praxis weit verbreiteter Indikator ist Standardabweichung :

Die Standardabweichung ist als Quadratwurzel der Varianz definiert und hat dieselbe Dimension wie das untersuchte Merkmal.

Die betrachteten Indikatoren ermöglichen es, den absoluten Wert der Variation zu erhalten, d.h. Bewerten Sie es in Maßeinheiten des untersuchten Merkmals. Anders als sie, der Variationskoeffizient misst die Fluktuation relativ - relativ zum Durchschnittsniveau, was in vielen Fällen vorzuziehen ist.

Formel zur Berechnung des Variationskoeffizienten.

Beispiele zur Problemlösung zum Thema "Variationsindikatoren in der Statistik"

Aufgabe 1 . Bei der Untersuchung des Werbeeinflusses auf die Höhe der durchschnittlichen monatlichen Einlagen bei den Banken der Region wurden 2 Banken untersucht. Folgende Ergebnisse werden erhalten:

Definieren:
1) für jede Bank: a) durchschnittliche monatliche Einlage; b) Streuung des Beitrags;
2) die durchschnittliche monatliche Einzahlung für zwei Banken zusammen;
3) Streuung des Depots für 2 Banken, je nach Werbung;
4) Streuung der Einzahlung für 2 Banken, abhängig von allen Faktoren außer Werbung;
5) Gesamtvarianz unter Verwendung der Additionsregel;
6) Bestimmtheitsmaß;
7) Korrelationsbeziehung.

Lösung

1) Lassen Sie uns eine Berechnungstabelle für eine Bank mit Werbung erstellen . Um die durchschnittliche monatliche Einzahlung zu ermitteln, finden wir die Mittelpunkte der Intervalle. In diesem Fall wird der Wert des offenen Intervalls (des ersten) bedingt mit dem Wert des angrenzenden Intervalls (des zweiten) gleichgesetzt.

Wir finden die durchschnittliche Größe des Beitrags unter Verwendung der Formel für das gewichtete arithmetische Mittel:

29.000/50 = 580 Rubel

Die Streuung des Beitrags ergibt sich aus der Formel:

23 400/50 = 468

Wir werden ähnliche Aktionen durchführen für eine Bank ohne Werbung :

2) Finden Sie die durchschnittliche Einzahlung für zwei Banken zusammen. Xav \u003d (580 × 50 + 542,8 × 50) / 100 \u003d 561,4 Rubel.

3) Die Varianz der Einzahlung, für zwei Banken, je nach Werbung, finden wir durch die Formel: σ 2 =pq (Formel der Varianz eines alternativen Vorzeichens). Hier ist p=0,5 der Anteil werbeabhängiger Faktoren; q = 1–0,5, dann σ 2 = 0,5 × 0,5 = 0,25.

4) Da der Anteil anderer Faktoren 0,5 beträgt, beträgt die Varianz der Einlage für zwei Banken, die von allen Faktoren außer der Werbung abhängt, ebenfalls 0,25.

5) Bestimmen Sie die Gesamtvarianz mit Hilfe der Additionsregel.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 \u003d σ 2 Tatsache + σ 2 Rest \u003d 552,08 + 345,96 \u003d 898,04

6) Bestimmtheitsmaß η 2 = σ 2 Tatsache / σ 2 = 345,96/898,04 = 0,39 = 39 % – die Höhe des Beitrags hängt zu 39 % von der Werbung ab.

7) Empirisches Korrelationsverhältnis η = √η 2 = √0,39 = 0,62 - die Beziehung ist ziemlich eng.

Aufgabe 2 . Es gibt eine Gruppierung von Unternehmen nach dem Wert der marktfähigen Produkte:

Bestimmen Sie: 1) die Streuung des Wertes marktfähiger Produkte; 2) Standardabweichung; 3) Variationskoeffizient.

Lösung

1) Nach Bedingung wird eine Intervallverteilungsreihe dargestellt. Es muss diskret ausgedrückt werden, dh die Mitte des Intervalls (x ") finden. In Gruppen geschlossener Intervalle finden wir die Mitte durch ein einfaches arithmetisches Mittel. In Gruppen mit einer Obergrenze als Differenz zwischen dieser Obergrenze und halb so groß wie das folgende Intervall (200-(400 -200):2=100).

In Gruppen mit einer unteren Grenze - die Summe dieser unteren Grenze und der Hälfte der Größe des vorherigen Intervalls (800+(800-600):2=900).

Die Berechnung des Durchschnittswerts marktfähiger Produkte erfolgt nach der Formel:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Hier ist a=500 die Größe der Variante bei der höchsten Häufigkeit, k=600-400=200 ist die Größe des Intervalls bei der höchsten Frequenz Tragen wir das Ergebnis in eine Tabelle ein:

Der Durchschnittswert der marktfähigen Produktion für den gesamten Untersuchungszeitraum beträgt also Xav = (-5:37) × 200 + 500 = 472,97 Tausend Rubel.

2) Wir finden die Streuung mit der folgenden Formel:

σ 2 \u003d (33/37) * 2002-(472,97-500) 2 \u003d 35.675,67-730,62 \u003d 34.945,05

3) Standardabweichung: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 Tausend Rubel.

4) Variationskoeffizient: V \u003d (σ / Xav) * 100 \u003d (186,94 / 472,97) * 100 \u003d 39,52%

Zeichen von Einheiten statistischer Aggregate haben unterschiedliche Bedeutung, zum Beispiel sind die Löhne der Arbeitnehmer eines Berufs eines Unternehmens für denselben Zeitraum nicht gleich, die Marktpreise für dieselben Produkte sind unterschiedlich, die Ernteerträge in den landwirtschaftlichen Betrieben der Region usw. Um den Wert eines Merkmals zu bestimmen, das für die gesamte Population der untersuchten Einheiten charakteristisch ist, werden daher Durchschnittswerte berechnet.
Durchschnittswert es ist ein verallgemeinerndes Merkmal der Menge individueller Werte eines quantitativen Merkmals.

Die von einem quantitativen Attribut untersuchte Population besteht aus individuellen Werten; sie werden sowohl von allgemeinen Ursachen als auch von individuellen Bedingungen beeinflusst. Im Mittelwert heben sich die für die Einzelwerte charakteristischen Abweichungen auf. Der Durchschnitt stellt als Funktion einer Menge einzelner Werte die gesamte Menge mit einem Wert dar und spiegelt die Gemeinsamkeit wider, die allen ihren Einheiten innewohnt.

Der berechnete Durchschnitt für Populationen, die aus qualitativ homogenen Einheiten bestehen, wird aufgerufen typischer Durchschnitt. Sie können beispielsweise das durchschnittliche Monatsgehalt eines Mitarbeiters der einen oder anderen Berufsgruppe (Bergmann, Arzt, Bibliothekar) berechnen. Natürlich unterscheiden sich die monatlichen Löhne der Bergleute aufgrund der unterschiedlichen Qualifikationen, der Betriebszugehörigkeit, der monatlich geleisteten Arbeitsstunden und vieler anderer Faktoren voneinander und von der Höhe des Durchschnittslohns. Das Durchschnittsniveau spiegelt jedoch die Hauptfaktoren wider, die das Lohnniveau beeinflussen, und gleicht die Unterschiede aus, die sich aufgrund der individuellen Merkmale des Arbeitnehmers ergeben. Der Durchschnittslohn spiegelt das typische Lohnniveau für diesen Arbeitnehmertyp wider. Dem Erhalten eines typischen Durchschnitts sollte eine Analyse vorausgehen, inwiefern diese Population qualitativ homogen ist. Wenn die Bevölkerung aus einzelnen Teilen besteht, sollte sie in typische Gruppen (durchschnittliche Temperatur im Krankenhaus) eingeteilt werden.

Mittelwerte, die als Merkmale für heterogene Populationen verwendet werden, werden genannt Systemdurchschnitte. Zum Beispiel der Durchschnittswert des Bruttoinlandsprodukts (BIP) pro Kopf, der durchschnittliche Verbrauch verschiedener Gütergruppen pro Person und andere ähnliche Werte, die die allgemeinen Merkmale des Staates als einheitliches Wirtschaftssystem darstellen.

Der Durchschnitt sollte für Populationen berechnet werden, die aus einer ausreichend großen Anzahl von Einheiten bestehen. Die Einhaltung dieser Bedingung ist Voraussetzung für das Inkrafttreten des Gesetzes der großen Zahl, wodurch sich zufällige Abweichungen einzelner Größen vom allgemeinen Trend gegenseitig aufheben.

Arten von Durchschnittswerten und Methoden zu ihrer Berechnung

Die Wahl des Durchschnittstyps wird durch den wirtschaftlichen Gehalt eines bestimmten Indikators und die Ausgangsdaten bestimmt. Jeder Durchschnittswert muss jedoch so berechnet werden, dass sich beim Ersetzen jeder Variante des gemittelten Merkmals das endgültige, verallgemeinernde oder, wie es allgemein genannt wird, nicht ändert. definierender Indikator, die sich auf den Durchschnitt bezieht. Wenn beispielsweise die tatsächlichen Geschwindigkeiten auf getrennten Streckenabschnitten ersetzt werden, sollte deren Durchschnittsgeschwindigkeit die vom Fahrzeug in derselben Zeit zurückgelegte Gesamtstrecke nicht ändern; Beim Ersetzen der tatsächlichen Löhne einzelner Arbeitnehmer des Unternehmens durch den Durchschnittslohn sollte sich der Lohnfonds nicht ändern. Folglich gibt es in jedem konkreten Fall je nach Art der verfügbaren Daten nur einen wahren Durchschnittswert des Indikators, der den Eigenschaften und dem Wesen des untersuchten sozioökonomischen Phänomens angemessen ist.
Die am häufigsten verwendeten sind das arithmetische Mittel, das harmonische Mittel, das geometrische Mittel, das mittlere Quadrat und das mittlere kubische Mittel.
Die aufgeführten Mittelwerte gehören zur Klasse Energie Durchschnitt und werden durch die allgemeine Formel kombiniert:
,
wo ist der Durchschnittswert des untersuchten Merkmals;
m ist der Exponent des Mittelwerts;
– aktueller Wert (Variante) des gemittelten Merkmals;
n ist die Anzahl der Merkmale.
Abhängig vom Wert des Exponenten m werden folgende Arten von Leistungsmittelwerten unterschieden:
bei m = -1 – mittlere Harmonische ;
bei m = 0 – geometrischer Mittelwert ;
bei m = 1 – arithmetisches Mittel;
bei m = 2 – quadratischer Mittelwert ;
bei m = 3 - durchschnittliche Kubik.
Je größer bei gleichen Ausgangsdaten der Exponent m in obiger Formel, desto größer der Wert des Mittelwertes:
.
Diese Eigenschaft des Potenzgesetzes heißt, mit zunehmendem Exponenten der definierenden Funktion zuzunehmen die Regel der Mehrheit der Mittel.
Jeder der markierten Mittelwerte kann zwei Formen annehmen: einfach und gewichtet.
Die einfache Form der Mitte gilt, wenn der Durchschnitt aus primären (nicht gruppierten) Daten berechnet wird. gewichtete Form– bei der Berechnung des Durchschnitts für sekundäre (gruppierte) Daten.

Arithmetisches Mittel

Das arithmetische Mittel wird verwendet, wenn das Volumen der Bevölkerung die Summe aller Einzelwerte des variierenden Attributs ist. Zu beachten ist, dass bei fehlender Angabe der Art des Mittelwerts vom arithmetischen Mittelwert ausgegangen wird. Seine logische Formel lautet:

einfaches arithmetisches Mittel berechnet durch nicht gruppierte Daten nach der formel:
oder ,
wo sind die einzelnen Werte des Features;
j ist die laufende Nummer der Beobachtungseinheit, die durch den Wert gekennzeichnet ist;
N ist die Anzahl der Beobachtungseinheiten (Mengengröße).
Beispiel. In der Vorlesung „Zusammenfassung und Gruppierung statistischer Daten“ wurden die Ergebnisse der Beobachtung der Arbeitserfahrung eines Teams von 10 Personen betrachtet. Berechnen Sie die durchschnittliche Berufserfahrung der Arbeiter der Brigade. 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.

Nach der Formel des arithmetischen Mittels einfach rechnet man auch chronologische Mittelwerte, wenn die Zeitintervalle, für die die Kennwerte dargestellt werden, gleich sind.
Beispiel. Das Volumen der verkauften Produkte für das erste Quartal betrug 47 den. Einheiten, für die zweite 54, für die dritte 65 und für die vierte 58 den. Einheiten Der durchschnittliche Quartalsumsatz beträgt (47+54+65+58)/4 = 56 den. Einheiten
Wenn in der chronologischen Reihe momentane Indikatoren angegeben sind, werden sie bei der Berechnung des Durchschnitts durch Halbsummen von Werten zu Beginn und am Ende des Zeitraums ersetzt.
Wenn es mehr als zwei Momente gibt und die Intervalle zwischen ihnen gleich sind, wird der Durchschnitt mit der Formel für den chronologischen Durchschnitt berechnet

,
wobei n die Anzahl der Zeitpunkte ist
Wenn die Daten nach Attributwerten gruppiert sind (d. h. es wird eine diskrete Variationsverteilungsreihe konstruiert) mit gewichtetes arithmetisches Mittel wird entweder anhand von Häufigkeiten oder Beobachtungshäufigkeiten bestimmter Werte des Merkmals berechnet, deren Anzahl (k) deutlich kleiner ist als die Anzahl der Beobachtungen (N) .
,
,
wobei k die Anzahl der Gruppen der Variationsreihe ist,
i ist die Nummer der Gruppe der Variationsreihe.
Da , und , erhalten wir die für praktische Berechnungen verwendeten Formeln:
und
Beispiel. Lassen Sie uns die durchschnittliche Betriebszugehörigkeit der Arbeitsteams für die gruppierten Serien berechnen.
a) Verwendung von Frequenzen:

b) Verwendung von Frequenzen:

Wenn die Daten nach Intervallen gruppiert sind , d.h. werden in Form von Intervallverteilungsreihen dargestellt, wobei bei der Berechnung des arithmetischen Mittels die Intervallmitte als Wert des Merkmals angenommen wird, wobei von einer gleichmäßigen Verteilung der Bevölkerungseinheiten in diesem Intervall ausgegangen wird. Die Berechnung erfolgt nach den Formeln:
und
wo ist die Mitte des Intervalls: ,
wobei und die unteren und oberen Grenzen der Intervalle sind (vorausgesetzt, dass die obere Grenze dieses Intervalls mit der unteren Grenze des nächsten Intervalls zusammenfällt).

Beispiel. Berechnen wir das arithmetische Mittel der Intervallvariationsreihe, die aus den Ergebnissen einer Untersuchung der Jahreslöhne von 30 Arbeitern konstruiert wurde (siehe Vorlesung "Zusammenfassung und Gruppierung statistischer Daten").
Tabelle 1 – Intervallvariationsreihe der Verteilung.

Intervalle, UAH

Häufigkeit, pers.

Frequenz,

Die Mitte des Intervalls

600-700
700-800
800-900
900-1000
1000-1100
1100-1200

3
6
8
9
3
1

0,10
0,20
0,267
0,30
0,10
0,033

(600+700):2=650
(700+800):2=750
850
950
1050
1150

1950
4500
6800
8550
3150
1150

65
150
226,95
285
105
37,95

UAH oder UAH
Die auf Basis der Ausgangsdaten und Intervallvariationsreihen berechneten arithmetischen Mittel stimmen aufgrund der ungleichmäßigen Verteilung der Attributwerte innerhalb der Intervalle möglicherweise nicht überein. In diesem Fall sollte man für eine genauere Berechnung des arithmetisch gewichteten Durchschnitts nicht die Mitte der Intervalle verwenden, sondern die für jede Gruppe berechneten arithmetischen einfachen Durchschnitte ( Gruppendurchschnitt). Der aus Gruppenmittelwerten mit Hilfe einer gewichteten Berechnungsformel berechnete Durchschnitt wird aufgerufen allgemeiner Durchschnitt.
Das arithmetische Mittel hat eine Reihe von Eigenschaften.
1. Die Summe der Abweichungen der Variante vom Mittelwert ist Null:
.
2. Wenn alle Werte der Option um den Wert A steigen oder sinken, dann steigt oder sinkt der Durchschnittswert um denselben Wert A:

3. Wenn jede Option um B-mal erhöht oder verringert wird, erhöht oder verringert sich auch der Durchschnittswert um die gleiche Anzahl von Malen:
oder
4. Die Summe der Produkte der Variante durch die Häufigkeiten ist gleich dem Produkt des Mittelwerts durch die Summe der Häufigkeiten:

5. Wenn alle Frequenzen mit einer beliebigen Zahl geteilt oder multipliziert werden, ändert sich das arithmetische Mittel nicht:

6) Wenn in allen Intervallen die Häufigkeiten gleich sind, dann ist der arithmetische gewichtete Durchschnitt gleich dem einfachen arithmetischen Durchschnitt:
,
wobei k die Anzahl der Gruppen in der Variationsreihe ist.

Durch die Verwendung der Eigenschaften des Durchschnitts können Sie seine Berechnung vereinfachen.
Angenommen, alle Optionen (x) werden zuerst um dieselbe Zahl A und dann um den Faktor B reduziert. Die größte Vereinfachung wird erreicht, wenn der Wert der Mitte des Intervalls mit der höchsten Häufigkeit als A und der Wert des Intervalls als B gewählt wird (für Zeilen mit gleichen Intervallen). Die Größe A wird als Ursprung bezeichnet, daher heißt diese Methode zur Berechnung des Durchschnitts Weg b Ohm-Referenz von bedingter Null oder Weg der Momente.
Nach einer solchen Transformation erhalten wir eine neue Variationsverteilungsreihe, deren Varianten gleich sind. Ihr arithmetisches Mittel, genannt Moment der ersten Bestellung, wird durch die Formel ausgedrückt und gemäß der zweiten und dritten Eigenschaft ist das arithmetische Mittel gleich dem Mittel der ursprünglichen Version, reduziert zuerst um A und dann um B-mal, d.h.
Zum bekommen echter Durchschnitt(Mitte der ursprünglichen Zeile) müssen Sie den Moment der ersten Ordnung mit B multiplizieren und A hinzufügen:

Die Berechnung des arithmetischen Mittels nach der Momentenmethode wird durch die Daten in der Tabelle veranschaulicht. 2.
Tabelle 2 - Verteilung der Mitarbeiter des Unternehmensshops nach Betriebszugehörigkeit


Berufserfahrung, Jahre

Anzahl der Arbeiter

Intervallmittelpunkt

0 – 5
5 – 10
10 – 15
15 – 20
20 – 25
25 – 30

12
16
23
28
17
14

2,5
7,5
12,7
17,5
22,5
27,5

15
-10
-5
0
5
10

3
-2
-1
0
1
2

36
-32
-23
0
17
28

Den Moment der ersten Bestellung finden . Da wir wissen, dass A = 17,5 und B = 5 ist, berechnen wir dann die durchschnittliche Berufserfahrung der Ladenarbeiter:
Jahre

Durchschnittliche Oberschwingung
Wie oben gezeigt, wird das arithmetische Mittel verwendet, um den Mittelwert eines Merkmals zu berechnen, wenn seine Varianten x und ihre Häufigkeit f bekannt sind.
Wenn die statistischen Informationen keine Häufigkeiten f für einzelne Optionen x der Grundgesamtheit enthalten, sondern als deren Produkt dargestellt werden, wird die Formel angewendet durchschnittlich harmonisch gewichtet. Um den Durchschnitt zu berechnen, bezeichnen Sie , woher . Durch Einsetzen dieser Ausdrücke in die gewichtete arithmetische Mittelformel erhalten wir die gewichtete harmonische Mittelformel:
,
wo ist das Volumen (Gewicht) der Indikatorattributwerte im Intervall mit der Nummer i (i=1,2, …, k).

Das harmonische Mittel wird also in Fällen verwendet, in denen nicht die Optionen selbst summiert werden, sondern ihre Kehrwerte: .
In Fällen, in denen das Gewicht jeder Option gleich eins ist, d. h. einzelne Werte des inversen Merkmals einmal vorkommen, gelten einfaches harmonisches Mittel:
,
wo sind einzelne Varianten des inversen Merkmals, die einmal vorkommen;
N ist die Anzahl der Optionen.
Wenn es für zwei Teile der Bevölkerung harmonische Mittelwerte mit einer Anzahl von und gibt, wird der Gesamtmittelwert für die gesamte Bevölkerung nach folgender Formel berechnet:

und angerufen gewichteter harmonischer Mittelwert der Gruppenmittelwerte.

Beispiel. Während der ersten Handelsstunde an der Devisenbörse wurden drei Abschlüsse getätigt. Daten über die Höhe der Griwna-Verkäufe und den Wechselkurs der Griwna gegenüber dem US-Dollar sind in der Tabelle angegeben. 3 (Spalten 2 und 3). Bestimmen Sie den durchschnittlichen Wechselkurs der Griwna gegenüber dem US-Dollar für die erste Handelsstunde.
Tabelle 3 - Daten zum Handelsverlauf an der Devisenbörse

Der durchschnittliche Dollarkurs wird durch das Verhältnis der im Laufe aller Transaktionen verkauften Hryvnia-Menge zu der aufgrund derselben Transaktionen erworbenen Dollarmenge bestimmt. Der Gesamtbetrag des Hryvnia-Verkaufs ist aus Spalte 2 der Tabelle bekannt, und der bei jeder Transaktion gekaufte Dollarbetrag wird bestimmt, indem der Hryvnia-Verkaufsbetrag durch seinen Wechselkurs geteilt wird (Spalte 4). Bei drei Transaktionen wurden insgesamt 22 Millionen US-Dollar gekauft. Dies bedeutet, dass der durchschnittliche Griwna-Wechselkurs für einen Dollar war
.
Der resultierende Wert ist real, weil seine Ersetzung der tatsächlichen Griwna-Wechselkurse in Transaktionen wird nicht den Gesamtbetrag der Verkäufe der Griwna ändern, die als fungiert definierender Indikator: Mio. UAH
Wurde für die Berechnung das arithmetische Mittel verwendet, d.h. Griwna, dann zum Wechselkurs für den Kauf von 22 Millionen Dollar. Dafür müssten 110,66 Mio. UAH ausgegeben werden, was nicht stimmt.

Geometrisches Mittel
Das geometrische Mittel wird zur Analyse der Dynamik von Phänomenen verwendet und ermöglicht die Bestimmung der durchschnittlichen Wachstumsrate. Bei der Berechnung des geometrischen Mittels sind die einzelnen Werte des Attributs relative Dynamikindikatoren, die in Form von Kettenwerten als Verhältnis jeder Ebene zur vorherigen aufgebaut sind.
Der geometrische einfache Mittelwert wird nach folgender Formel berechnet:
,
Wo ist das Zeichen des Produkts,
N ist die Anzahl der gemittelten Werte.
Beispiel. Die Zahl der registrierten Straftaten über 4 Jahre stieg um das 1,57-fache, darunter für das 1. - um das 1,08-fache, für das 2. - um das 1,1-fache, für das 3. - um 1,18 und für das 4. - 1,12-fach. Dann beträgt die durchschnittliche jährliche Wachstumsrate der Zahl der Straftaten: , d.h. Die Zahl der registrierten Straftaten ist jährlich um durchschnittlich 12 % gestiegen.

1,8
-0,8
0,2
1,0
1,4

1
3
4
1
1

3,24
0,64
0,04
1
1,96

3,24
1,92
0,16
1
1,96

Um den quadratischen Mittelwert zu berechnen, bestimmen wir und tragen in die Tabelle und ein. Dann ist der Durchschnittswert der Abweichungen der Länge der Produkte von einer bestimmten Norm gleich:

Das arithmetische Mittel wäre in diesem Fall ungeeignet, weil als Ergebnis würden wir eine Nullabweichung erhalten.
Die Verwendung des quadratischen Mittelwerts wird später bei den Variationsexponenten besprochen.