So finden Sie die Varianz in einer Reihe von Zahlen. Mathematische Erwartung einer diskreten Zufallsvariablen

Für gruppierte Daten Restdispersion- Durchschnitt der Streuungen innerhalb der Gruppe:

Wobei σ 2 j die gruppeninterne Varianz der j-ten Gruppe ist.

Für nicht gruppierte Daten Restdispersion ist ein Maß für die Näherungsgenauigkeit, d.h. Annäherung der Regressionsgerade an die Originaldaten:
wobei y(t) die Prognose gemäß der Trendgleichung ist; y t – Anfangsserie der Dynamik; n ist die Anzahl der Punkte; p ist die Anzahl der Koeffizienten der Regressionsgleichung (die Anzahl der erklärenden Variablen).
In diesem Beispiel heißt es unvoreingenommene Schätzung der Varianz.

Beispiel 1. Die Verteilung der Arbeitnehmer von drei Unternehmen eines Verbandes nach Tarifkategorien ist durch folgende Daten gekennzeichnet:

Lohnklasse des ArbeitersAnzahl der Arbeitnehmer im Unternehmen
Unternehmen 1Unternehmen 2Unternehmen 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

Definieren:
1. Streuung je Unternehmen (konzerninterne Streuung);
2. Durchschnitt der gruppeninternen Streuungen;
3. Streuung zwischen den Gruppen;
4. Gesamtvarianz.

Lösung.
Bevor Sie mit der Lösung des Problems fortfahren, müssen Sie herausfinden, welches Merkmal effektiv und welches faktoriell ist. Im betrachteten Beispiel ist das wirksame Attribut "Tarifgruppe" und das Faktorattribut "Nummer (Name) des Unternehmens".
Dann haben wir drei Gruppen (Unternehmen), für die es notwendig ist, den Gruppendurchschnitt und die gruppeninternen Varianzen zu berechnen:


GesellschaftGruppendurchschnitt,Varianz innerhalb der Gruppe,
1 4 1,8

Der Durchschnitt der gruppeninternen Varianzen ( Restdispersion) berechnet nach der Formel:


wo kann man rechnen:
oder:


dann:
Die Gesamtdispersion ist gleich: s 2 \u003d 1,6 + 0 \u003d 1,6.
Die Gesamtabweichung kann auch mit einer der beiden folgenden Formeln berechnet werden:

Bei der Lösung praktischer Probleme hat man es oft mit einem Zeichen zu tun, das nur zwei alternative Werte annimmt. In diesem Fall sprechen sie nicht über das Gewicht eines bestimmten Werts eines Merkmals, sondern über seinen Anteil am Aggregat. Wenn der Anteil der Bevölkerungseinheiten, die das untersuchte Merkmal aufweisen, mit " R", und nicht besitzen - durch" q“, dann kann die Streuung nach folgender Formel berechnet werden:
s 2 = p × q

Beispiel #2. Bestimmen Sie auf der Grundlage der Daten zur Leistung von sechs Arbeitern der Brigade die Varianz zwischen den Gruppen und bewerten Sie die Auswirkungen der Arbeitsschicht auf ihre Arbeitsproduktivität, wenn die Gesamtvarianz 12,2 beträgt.

Nr. der ArbeitsbrigadeArbeitsleistung, Stk.
in der ersten Schichtin 2 Schicht
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

Lösung. Ausgangsdaten

Xf1f2f 3f4f5f6Gesamt
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
Gesamt 31 33 37 37 40 38

Dann haben wir 6 Gruppen, für die es notwendig ist, den Gruppenmittelwert und die gruppeninternen Varianzen zu berechnen.
1. Finden Sie die Durchschnittswerte jeder Gruppe.







2. Ermitteln Sie das mittlere Quadrat jeder Gruppe.







Wir fassen die Ergebnisse der Berechnung in einer Tabelle zusammen:
GruppennummerGruppendurchschnittVarianz innerhalb der Gruppe
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. Varianz innerhalb der Gruppe charakterisiert die Veränderung (Variation) des untersuchten (resultierenden) Merkmals innerhalb der Gruppe unter dem Einfluss aller Faktoren, mit Ausnahme des der Gruppierung zugrunde liegenden Faktors:
Den Durchschnitt der gruppeninternen Streuungen berechnen wir nach folgender Formel:


4. Intergruppenvarianz charakterisiert die Veränderung (Variation) des untersuchten (resultierenden) Merkmals unter dem Einfluss eines der Gruppierung zugrunde liegenden Faktors (faktorielles Merkmal).
Streuung zwischen Gruppen ist definiert als:

wo


Dann

Totale Varianz charakterisiert die Veränderung (Variation) des untersuchten (resultierenden) Merkmals unter dem Einfluss aller Faktoren (faktorielle Merkmale) ausnahmslos. Durch den Zustand des Problems ist es gleich 12.2.
Empirische Korrelationsbeziehung misst, wie viel der Gesamtschwankung des resultierenden Attributs durch den untersuchten Faktor verursacht wird. Dies ist das Verhältnis der faktoriellen Varianz zur Gesamtvarianz:

Wir bestimmen die empirische Korrelationsbeziehung:

Beziehungen zwischen Merkmalen können schwach oder stark (eng) sein. Ihre Kriterien werden auf der Chaddock-Skala bewertet:
0,1 0,3 0,5 0,7 0,9 In unserem Beispiel ist die Beziehung zwischen Merkmal Y Faktor X schwach
Bestimmtheitsmaß.

Lassen Sie uns das Bestimmtheitsmaß definieren:

Somit sind 0,67 % der Variation auf Unterschiede zwischen Merkmalen und 99,37 % auf andere Faktoren zurückzuführen.
Fazit: In diesem Fall hängt die Leistung der Arbeiter nicht von der Arbeit in einer bestimmten Schicht ab, d.h. der Einfluss der Arbeitsschicht auf ihre Arbeitsproduktivität ist nicht signifikant und auf andere Faktoren zurückzuführen.

Beispiel #3. Ermitteln Sie anhand der Daten zum Durchschnittslohn und der quadrierten Abweichungen von seinem Wert für zwei Gruppen von Arbeitnehmern die Gesamtvarianz, indem Sie die Varianzadditionsregel anwenden:

Lösung:
Durchschnitt der Varianzen innerhalb der Gruppe

Streuung zwischen Gruppen ist definiert als:


Die Gesamtvarianz beträgt: 480 + 13824 = 14304

Streuung in der Statistik findet man als Einzelwerte des Merkmals im Quadrat von . Abhängig von den Ausgangsdaten wird sie durch die einfachen und gewichteten Varianzformeln bestimmt:

1. (für nicht gruppierte Daten) wird nach folgender Formel berechnet:

2. Gewichtete Varianz (für eine Variationsreihe):

wobei n die Frequenz ist (Wiederholbarkeitsfaktor X)

Ein Beispiel zum Finden der Varianz

Diese Seite beschreibt ein Standardbeispiel zum Finden der Abweichung, Sie können sich auch andere Aufgaben ansehen, um sie zu finden

Beispiel 1. Wir haben die folgenden Daten für eine Gruppe von 20 Fernstudenten. Es ist notwendig, eine Intervallreihe der Merkmalsverteilung zu erstellen, den Mittelwert des Merkmals zu berechnen und seine Varianz zu untersuchen

Lassen Sie uns eine Intervallgruppierung erstellen. Lassen Sie uns den Bereich des Intervalls durch die Formel bestimmen:

wobei X max der Maximalwert des Gruppierungsmerkmals ist;
X min ist der Mindestwert des Gruppierungsmerkmals;
n ist die Anzahl der Intervalle:

Wir akzeptieren n=5. Der Schritt ist: h \u003d (192 - 159) / 5 \u003d 6,6

Machen wir eine Intervallgruppierung

Für weitere Berechnungen bauen wir eine Hilfstabelle auf:

X'i ist die Mitte des Intervalls. (zum Beispiel die Mitte des Intervalls 159 - 165,6 = 162,3)

Das durchschnittliche Wachstum der Schüler wird durch die Formel des arithmetisch gewichteten Durchschnitts bestimmt:

Wir bestimmen die Dispersion nach der Formel:

Die Varianzformel lässt sich wie folgt umrechnen:

Aus dieser Formel folgt das die Abweichung ist die Differenz zwischen dem Mittelwert der Quadrate der Optionen und dem Quadrat und dem Mittelwert.

Varianz in Variationsreihen mit gleichen Intervallen nach der Momentenmethode kann auf folgende Weise unter Verwendung der zweiten Streuungseigenschaft (Teilung aller Optionen durch den Wert des Intervalls) berechnet werden. Definition von Varianz, berechnet nach der Momentenmethode, nach folgender Formel ist weniger zeitaufwändig:

wobei i der Wert des Intervalls ist;
A - bedingte Null, die praktisch ist, um die Mitte des Intervalls mit der höchsten Frequenz zu verwenden;
m1 ist das Momentenquadrat erster Ordnung;
m2 - Moment zweiter Ordnung

(Wenn sich in der statistischen Grundgesamtheit das Attribut so ändert, dass es nur zwei sich gegenseitig ausschließende Optionen gibt, dann wird diese Variabilität als Alternative bezeichnet) kann durch die Formel berechnet werden:

Setzen wir in diese Dispersionsformel q = 1- p ein, erhalten wir:

Arten der Dispersion

Totale Varianz misst die Variation eines Merkmals über die gesamte Population als Ganzes unter dem Einfluss aller Faktoren, die diese Variation verursachen. Sie ist gleich dem mittleren Quadrat der Abweichungen der Einzelwerte des Attributs x vom Gesamtmittelwert x und kann als einfache Varianz oder gewichtete Varianz definiert werden.

charakterisiert zufällige Variation, d.h. Teil der Variation, der auf den Einfluss nicht berücksichtigter Faktoren zurückzuführen ist und nicht von dem der Gruppierung zugrunde liegenden Vorzeichenfaktor abhängt. Eine solche Varianz ist gleich dem mittleren Quadrat der Abweichungen der Einzelwerte eines Merkmals innerhalb der Gruppe X vom arithmetischen Mittel der Gruppe und kann als einfache Varianz oder als gewichtete Varianz berechnet werden.

Auf diese Weise, Varianzmaße innerhalb der Gruppe Variation eines Merkmals innerhalb einer Gruppe und wird durch die Formel bestimmt:

wo xi - Gruppendurchschnitt;
ni ist die Anzahl der Einheiten in der Gruppe.

Zum Beispiel zeigen gruppeninterne Varianzen, die bei der Untersuchung des Einflusses der Qualifikationen von Arbeitern auf das Niveau der Arbeitsproduktivität in einem Geschäft bestimmt werden müssen, Variationen im Output in jeder Gruppe, die durch alle möglichen Faktoren verursacht werden (technischer Zustand der Ausrüstung, Verfügbarkeit von Werkzeugen und Materialien, Alter der Arbeiter, Arbeitsintensität usw.), bis auf Unterschiede in der Qualifikationskategorie (innerhalb der Gruppe haben alle Arbeiter die gleiche Qualifikation).

Der Durchschnitt der gruppeninternen Varianzen spiegelt den Zufall wider, d. h. den Teil der Variation, der unter dem Einfluss aller anderen Faktoren mit Ausnahme des Gruppierungsfaktors aufgetreten ist. Es wird nach der Formel berechnet:

Es charakterisiert die systematische Variation des resultierenden Merkmals, die auf den Einfluss des der Gruppierung zugrunde liegenden Merkmalsfaktors zurückzuführen ist. Er ist gleich dem mittleren Quadrat der Abweichungen der Gruppenmittelwerte vom Gesamtmittelwert. Die Varianz zwischen den Gruppen wird nach folgender Formel berechnet:

Varianzadditionsregel in der Statistik

Entsprechend Varianzadditionsregel die Gesamtvarianz ist gleich der Summe des Durchschnitts der Intragruppen- und Intergruppenvarianzen:

Die Bedeutung dieser Regel ist, dass die Gesamtvarianz, die sich unter dem Einfluss aller Faktoren ergibt, gleich der Summe der Varianzen ist, die sich unter dem Einfluss aller anderen Faktoren ergibt, und der Varianz, die sich aufgrund des Gruppierungsfaktors ergibt.

Mit der Formel zur Addition von Varianzen ist es möglich, aus zwei bekannten Varianzen die dritte Unbekannte zu ermitteln und auch die Stärke des Einflusses des Gruppierungsmerkmals zu beurteilen.

Dispersionseigenschaften

1. Wenn alle Werte des Attributs um denselben konstanten Wert verringert (erhöht) werden, ändert sich die Abweichung davon nicht.
2. Wenn alle Werte des Attributs um die gleiche Anzahl von Malen n verringert (erhöht) werden, wird die Varianz entsprechend um n^2-mal verringert (erhöht).

Unter den vielen Indikatoren, die in der Statistik verwendet werden, muss die Berechnung der Varianz hervorgehoben werden. Es sollte beachtet werden, dass die manuelle Durchführung dieser Berechnung eine ziemlich mühsame Aufgabe ist. Glücklicherweise gibt es in Excel Funktionen, mit denen Sie den Berechnungsvorgang automatisieren können. Lassen Sie uns den Algorithmus für die Arbeit mit diesen Tools herausfinden.

Die Streuung ist ein Variationsindikator, der das durchschnittliche Quadrat der Abweichungen von der mathematischen Erwartung darstellt. Er drückt also die Streuung von Zahlen um den Mittelwert aus. Die Berechnung der Streuung kann sowohl für die Grundgesamtheit als auch für die Stichprobe durchgeführt werden.

Methode 1: Berechnung auf die allgemeine Bevölkerung

Um diesen Indikator in Excel für die allgemeine Bevölkerung zu berechnen, wird die Funktion verwendet ANZEIGEG. Die Syntax für diesen Ausdruck lautet wie folgt:

ANZEIGEG(Nummer1;Nummer2;…)

Insgesamt können 1 bis 255 Argumente verwendet werden. Argumente können sowohl numerische Werte als auch Verweise auf die Zellen sein, in denen sie enthalten sind.

Sehen wir uns an, wie dieser Wert für eine Reihe numerischer Daten berechnet wird.


Methode 2: Beispielrechnung

Anders als bei der Berechnung des Wertes für die Allgemeinbevölkerung ist der Nenner bei der Berechnung für die Stichprobe nicht die Gesamtzahl der Zahlen, sondern eine Zahl weniger. Dies geschieht, um den Fehler zu beheben. Excel berücksichtigt diese Nuance in einer speziellen Funktion, die für diese Art der Berechnung entwickelt wurde - DISP.V. Seine Syntax wird durch die folgende Formel dargestellt:

VAR.B(Zahl1;Zahl2;…)

Die Anzahl der Argumente kann wie in der vorherigen Funktion auch zwischen 1 und 255 liegen.


Wie Sie sehen können, ist das Excel-Programm in der Lage, die Berechnung der Varianz erheblich zu erleichtern. Diese Statistik kann von der Anwendung sowohl für die Grundgesamtheit als auch für die Stichprobe berechnet werden. In diesem Fall reduzieren sich alle Benutzeraktionen eigentlich nur auf die Angabe des zu verarbeitenden Zahlenbereichs, und Excel erledigt die Hauptarbeit selbst. Dies spart den Benutzern natürlich viel Zeit.

Rechnen wir einFRAUAUSGEZEICHNETVarianz und Standardabweichung der Stichprobe. Wir berechnen auch die Varianz einer Zufallsvariablen, wenn ihre Verteilung bekannt ist.

Erst überlegen Streuung, dann Standardabweichung.

Stichprobenabweichung

Stichprobenabweichung (Stichprobenvarianz,ProbeVarianz) charakterisiert die Streuung der Werte im Array relativ zu .

Alle 3 Formeln sind mathematisch äquivalent.

Das sieht man an der ersten Formel Stichprobenvarianz ist die Summe der quadrierten Abweichungen jedes Werts im Array vom Durchschnitt dividiert durch die Stichprobengröße minus 1.

Streuung Proben die Funktion DISP() wird verwendet, eng. der Name des VAR, d.h. VARIANTE. Seit MS EXCEL 2010 wird empfohlen, dessen analoges DISP.V() , engl. der Name VARS, d.h. Stichprobenvarianz. Zusätzlich gibt es ab der Version von MS EXCEL 2010 eine DISP.G()-Funktion, engl. VARP-Name, d.h. Population VARIance, die berechnet wird Streuung zum Population. Der ganze Unterschied liegt im Nenner: Anstelle von n-1 wie DISP.V() hat DISP.G() nur n im Nenner. Vor MS EXCEL 2010 wurde die VARP()-Funktion verwendet, um die Populationsvarianz zu berechnen.

Stichprobenabweichung
=QUADRAT(Stichprobe)/(ZAHL(Stichprobe)-1)
=(SUMSQ(Stichprobe)-ZAHL(Stichprobe)*MITTELWERT(Stichprobe)^2)/ (ZAHL(Stichprobe)-1)- die übliche Formel
= SUMME ((Stichprobe - MITTELWERT (Stichprobe)) ^ 2)/ (ZAHL (Stichprobe) - 1) –

Stichprobenabweichung ist nur dann gleich 0, wenn alle Werte gleich sind und dementsprechend gleich sind Mittelwert. Normalerweise, je größer der Wert Streuung, desto größer ist die Streuung der Werte im Array.

Stichprobenabweichung ist eine Punktschätzung Streuung Verteilung der Zufallsvariablen, aus der die Probe. Über das Bauen Vertrauensintervalle beim Auswerten Streuung ist im Artikel nachzulesen.

Varianz einer Zufallsvariablen

Berechnen Streuung Zufallsvariable, Sie müssen es wissen.

Zum Streuung Zufallsvariable X verwendet häufig die Notation Var(X). Streuung ist gleich dem Quadrat der Abweichung vom Mittelwert E(X): Var(X)=E[(X-E(X)) 2 ]

Streuung berechnet nach der Formel:

wobei x i der Wert ist, den die Zufallsvariable annehmen kann, und μ der Durchschnittswert (), р(x) die Wahrscheinlichkeit ist, dass die Zufallsvariable den Wert x annehmen wird.

Wenn die Zufallsvariable hat, dann Streuung berechnet nach der Formel:

Abmessungen Streuung entspricht dem Quadrat der Maßeinheit der Originalwerte. Wenn die Werte in der Stichprobe beispielsweise Messungen des Gewichts des Teils (in kg) sind, dann wäre die Dimension der Abweichung kg 2 . Dies kann daher schwierig zu interpretieren sein, um die Streuung von Werten zu charakterisieren, die einem Wert entsprechen, der der Quadratwurzel entspricht StreuungStandardabweichung.

Einige Eigenschaften Streuung:

Var(X+a)=Var(X), wobei X eine Zufallsvariable und a eine Konstante ist.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X))2=E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Diese Dispersionseigenschaft wird in genutzt Artikel über lineare Regression.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), wobei X und Y Zufallsvariablen sind, Cov(X;Y) ist die Kovarianz dieser Zufallsvariablen.

Wenn Zufallsvariablen unabhängig sind, dann ihre Kovarianz 0 ist, und daher Var(X+Y)=Var(X)+Var(Y). Diese Eigenschaft der Varianz wird in der Ausgabe verwendet.

Zeigen wir, dass für unabhängige Größen Var(X-Y)=Var(X+Y). Tatsächlich ist Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var(X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Diese Eigenschaft der Varianz wird zum Plotten verwendet.

Stichproben-Standardabweichung

Stichproben-Standardabweichung ist ein Maß dafür, wie weit die Werte in der Stichprobe relativ zu ihrem gestreut sind.

Per Definition, Standardabweichung gleich der Quadratwurzel von Streuung:

Standardabweichung berücksichtigt nicht die Größe der Werte in Probenahme, sondern nur der Grad der Streuung der Werte um sie herum Mitte. Nehmen wir ein Beispiel, um dies zu veranschaulichen.

Lassen Sie uns die Standardabweichung für 2 Stichproben berechnen: (1; 5; 9) und (1001; 1005; 1009). In beiden Fällen ist s=4. Es ist offensichtlich, dass das Verhältnis der Standardabweichung zu den Werten des Arrays für die Proben signifikant unterschiedlich ist. Verwenden Sie für solche Fälle Der Variationskoeffizient(Variationskoeffizient, CV) - Verhältnis Standardabweichung zum Durchschnitt Arithmetik, ausgedrückt in Prozent.

In MS EXCEL 2007 und früheren Versionen zur Berechnung Stichproben-Standardabweichung die Funktion =STDEV() wird verwendet, eng. der Name STDEV, d.h. Standardabweichung. Seit MS EXCEL 2010 wird empfohlen, dessen Analogon = STDEV.B () , engl. zu verwenden. Name STDEV.S, d.h. Beispiel STANDARDABWEICHUNG.

Zusätzlich gibt es ab der Version von MS EXCEL 2010 eine Funktion STDEV.G () , eng. Name STDEV.P, d.h. Population STandard DEViation, die berechnet wird Standardabweichung zum Population. Der ganze Unterschied liegt im Nenner: Statt n-1 wie bei STABW.V() hat STABW.G() nur n im Nenner.

Standardabweichung kann auch direkt aus den unten stehenden Formeln berechnet werden (siehe Beispieldatei)
=SQRT(SQUADROTIV(Probe)/(COUNT(Probe)-1))
=SQRT((SUMMEQ(Stichprobe)-ZAHL(Stichprobe)*MITTELWERT(Stichprobe)^2)/(ZAHL(Stichprobe)-1))

Andere Dispersionsmaßnahmen

Die Funktion SQUADRIVE() rechnet mit umm der quadratischen Abweichungen der Werte von ihren Mitte. Diese Funktion liefert dasselbe Ergebnis wie die Formel =VAR.G( Probe)*ÜBERPRÜFEN( Probe) , wo Probe- ein Verweis auf einen Bereich, der ein Array von Beispielwerten enthält (). Berechnungen in der Funktion QUADROTIV() erfolgen nach der Formel:

Die SROOT()-Funktion ist auch ein Maß für die Streuung eines Datensatzes. Die Funktion SIROTL() berechnet den Durchschnitt der Absolutwerte der Abweichungen von Werten aus Mitte. Diese Funktion gibt das gleiche Ergebnis wie die Formel zurück =SUMPRODUCT(ABS(Sample-AVERAGE(Sample)))/COUNT(Sample), wo Probe- ein Verweis auf einen Bereich, der ein Array von Beispielwerten enthält.

Berechnungen in der Funktion SROOTKL () erfolgen nach folgender Formel:

.

Umgekehrt, wenn ein nicht-negatives a.e. eine solche Funktion , dann gibt es ein absolut kontinuierliches Wahrscheinlichkeitsmaß für eine solche, nämlich ihre Dichte.

    Maßänderung im Lebesgue-Integral:

,

wobei jede Borel-Funktion bezüglich des Wahrscheinlichkeitsmaßes integrierbar ist.

Dispersion, Arten und Eigenschaften der Dispersion Das Konzept der Dispersion

Streuung in der Statistik ergibt sich als Standardabweichung der Einzelwerte des Merkmals zum Quadrat vom arithmetischen Mittel. Abhängig von den Ausgangsdaten wird sie durch die einfachen und gewichteten Varianzformeln bestimmt:

1. einfache Abweichung(für nicht gruppierte Daten) wird nach folgender Formel berechnet:

2. Gewichtete Varianz (für eine Variationsreihe):

wo n - Frequenz (Wiederholbarkeitsfaktor X)

Ein Beispiel zum Finden der Varianz

Diese Seite beschreibt ein Standardbeispiel zum Finden der Abweichung, Sie können sich auch andere Aufgaben ansehen, um sie zu finden

Beispiel 1. Bestimmung der Gruppe, des Gruppendurchschnitts, der Zwischengruppen- und der Gesamtvarianz

Beispiel 2. Finden der Varianz und des Variationskoeffizienten in einer Gruppierungstabelle

Beispiel 3. Finden der Varianz in einer diskreten Reihe

Beispiel 4. Wir haben die folgenden Daten für eine Gruppe von 20 Fernstudenten. Es ist notwendig, eine Intervallreihe der Merkmalsverteilung zu erstellen, den Mittelwert des Merkmals zu berechnen und seine Varianz zu untersuchen

Lassen Sie uns eine Intervallgruppierung erstellen. Lassen Sie uns den Bereich des Intervalls durch die Formel bestimmen:

wobei X max der Maximalwert des Gruppierungsmerkmals ist; X min ist der Mindestwert des Gruppierungsmerkmals; n ist die Anzahl der Intervalle:

Wir akzeptieren n=5. Der Schritt ist: h \u003d (192 - 159) / 5 \u003d 6,6

Machen wir eine Intervallgruppierung

Für weitere Berechnungen bauen wir eine Hilfstabelle auf:

X "i - die Mitte des Intervalls. (z. B. die Mitte des Intervalls 159 - 165,6 \u003d 162,3)

Das durchschnittliche Wachstum der Schüler wird durch die Formel des arithmetisch gewichteten Durchschnitts bestimmt:

Wir bestimmen die Dispersion nach der Formel:

Die Formel lässt sich wie folgt umrechnen:

Aus dieser Formel folgt das die Abweichung ist die Differenz zwischen dem Mittelwert der Quadrate der Optionen und dem Quadrat und dem Mittelwert.

Varianz in Variationsreihen mit gleichen Intervallen nach der Momentenmethode kann auf folgende Weise unter Verwendung der zweiten Streuungseigenschaft (Teilung aller Optionen durch den Wert des Intervalls) berechnet werden. Definition von Varianz, berechnet nach der Momentenmethode, nach folgender Formel ist weniger zeitaufwändig:

wobei i der Wert des Intervalls ist; A - bedingte Null, die praktisch ist, um die Mitte des Intervalls mit der höchsten Frequenz zu verwenden; m1 ist das Momentenquadrat erster Ordnung; m2 - Moment zweiter Ordnung

Feature-Varianz (Wenn sich in der statistischen Grundgesamtheit das Attribut so ändert, dass es nur zwei sich gegenseitig ausschließende Optionen gibt, dann wird diese Variabilität als Alternative bezeichnet) kann durch die Formel berechnet werden:

Setzen wir in diese Dispersionsformel q = 1- p ein, erhalten wir:

Arten der Dispersion

Totale Varianz misst die Variation eines Merkmals über die gesamte Population als Ganzes unter dem Einfluss aller Faktoren, die diese Variation verursachen. Sie ist gleich dem mittleren Quadrat der Abweichungen der Einzelwerte des Attributs x vom Gesamtmittelwert x und kann als einfache Varianz oder gewichtete Varianz definiert werden.

Varianz innerhalb der Gruppe charakterisiert zufällige Variation, d.h. Teil der Variation, der auf den Einfluss nicht berücksichtigter Faktoren zurückzuführen ist und nicht von dem der Gruppierung zugrunde liegenden Vorzeichenfaktor abhängt. Eine solche Varianz ist gleich dem mittleren Quadrat der Abweichungen der Einzelwerte eines Merkmals innerhalb der Gruppe X vom arithmetischen Mittel der Gruppe und kann als einfache Varianz oder als gewichtete Varianz berechnet werden.

Auf diese Weise, Varianzmaße innerhalb der Gruppe Variation eines Merkmals innerhalb einer Gruppe und wird durch die Formel bestimmt:

wo xi - Gruppendurchschnitt; ni ist die Anzahl der Einheiten in der Gruppe.

Zum Beispiel zeigen gruppeninterne Varianzen, die bei der Untersuchung des Einflusses der Qualifikationen von Arbeitern auf das Niveau der Arbeitsproduktivität in einem Geschäft bestimmt werden müssen, Variationen im Output in jeder Gruppe, die durch alle möglichen Faktoren verursacht werden (technischer Zustand der Ausrüstung, Verfügbarkeit von Werkzeugen und Materialien, Alter der Arbeiter, Arbeitsintensität usw.), bis auf Unterschiede in der Qualifikationskategorie (innerhalb der Gruppe haben alle Arbeiter die gleiche Qualifikation).

Der Durchschnitt der gruppeninternen Varianzen spiegelt die zufällige Variation wider, dh den Teil der Variation, der unter dem Einfluss aller anderen Faktoren mit Ausnahme des Gruppierungsfaktors aufgetreten ist. Es wird nach der Formel berechnet:

Intergruppenvarianz charakterisiert die systematische Variation des resultierenden Merkmals, die auf den Einfluss des der Gruppierung zugrunde liegenden Merkmalsfaktors zurückzuführen ist. Er ist gleich dem mittleren Quadrat der Abweichungen der Gruppenmittelwerte vom Gesamtmittelwert. Die Varianz zwischen den Gruppen wird nach folgender Formel berechnet: