Jede Variationsreihe besteht aus. Variationsreihe

Die Reihen gebaut nach Menge, werden genannt variabel.

Die Distributionsserie besteht aus Optionen(charakteristische Werte) und Frequenzen(Anzahl der Gruppen). Frequenzen ausgedrückt als relative Werte(Aktien, Prozent) aufgerufen werden Frequenzen. Die Summe aller Häufigkeiten wird als Volumen der Verteilungsreihe bezeichnet.

Nach Typ sind die Verteilungsserien unterteilt in diskret(aufgebaut auf diskontinuierlichen Werten des Merkmals) und Intervall(gebaut auf kontinuierliche Werte Schild).

Variationsreihe stellt zwei Spalten (oder Zeilen) dar; einer davon liefert einzelne Werte des variablen Attributs, Varianten genannt und mit X bezeichnet; und im anderen - absolute Zahlen, die anzeigt, wie oft (wie oft) jede Option vorkommt. Die Indikatoren der zweiten Spalte werden Frequenzen genannt und üblicherweise mit f bezeichnet. Beachten Sie erneut, dass die zweite Spalte auch verwendet werden kann relative Leistung charakterisieren den Anteil der Häufigkeit einzelner Varianten in Gesamtsumme Frequenzen. Diese relativen Indikatoren werden Häufigkeiten genannt und üblicherweise mit ω bezeichnet. Die Summe aller Häufigkeiten ist in diesem Fall gleich eins. Häufigkeiten können aber auch in Prozent ausgedrückt werden, dann ergibt die Summe aller Häufigkeiten 100 %.

Wenn die Varianten der Variationsreihe als diskrete Werte ausgedrückt werden, dann wird eine solche Variationsreihe genannt diskret.

Bei kontinuierlichen Merkmalen werden Variationsreihen als konstruiert Intervall, das heißt, die Werte des Attributs in ihnen werden „von ... bis ...“ ausgedrückt. In diesem Fall werden die Mindestwerte des Attributs in einem solchen Intervall als Untergrenze des Intervalls und das Maximum als Obergrenze bezeichnet.

Intervall-Variationsreihen werden auch für diskrete Merkmale erstellt, die über einen weiten Bereich variieren. Die Intervallreihe kann sein gleich und ungleich Intervalle.

Überlegen Sie, wie der Wert gleicher Intervalle bestimmt wird. Führen wir die folgende Notation ein:

ich– Intervallwert;

- höchster Wert ein Zeichen in Einheiten der Bevölkerung;

- der Mindestwert des Attributs für Bevölkerungseinheiten;

n- die Anzahl der zugewiesenen Gruppen.

wenn n bekannt ist.

Ist die Anzahl der zugeteilten Gruppen im Voraus schwer zu bestimmen, so kann die von Sturgess 1926 vorgeschlagene Formel empfohlen werden, um die optimale Größe des Intervalls bei ausreichender Populationsgröße zu berechnen:

n = 1+ 3,322 log N, wobei N die Anzahl der Einsen in der Population ist.

Der Wert ungleicher Intervalle wird im Einzelfall unter Berücksichtigung der Besonderheiten des Untersuchungsgegenstandes ermittelt.

Die statistische Verteilung der Stichprobe Rufen Sie die Liste der Optionen und ihre entsprechenden Häufigkeiten (oder relativen Häufigkeiten) auf.

Die statistische Verteilung der Stichprobe kann in Form einer Tabelle angegeben werden, in deren erster Spalte Optionen stehen und in der zweiten - die diesen Optionen entsprechenden Häufigkeiten. nein, oder relative Häufigkeiten Pi .

Statistische Verteilung der Stichprobe

Variationsreihen werden als Intervallreihen bezeichnet, in denen die Werte der ihrer Bildung zugrunde liegenden Merkmale innerhalb bestimmter Grenzen (Intervalle) ausgedrückt werden. Häufigkeiten beziehen sich in diesem Fall nicht auf einzelne Werte des Attributs, sondern auf das gesamte Intervall.

Intervallverteilungsreihen werden nach kontinuierlichen quantitativen Merkmalen sowie nach diskreten Merkmalen konstruiert, die innerhalb einer signifikanten Bandbreite variieren.

Eine Intervallreihe kann durch eine statistische Verteilung der Stichprobe dargestellt werden, die die Intervalle und ihre entsprechenden Häufigkeiten angibt. In diesem Fall wird die Summe der Häufigkeiten der Variante, die in dieses Intervall gefallen sind, als Häufigkeit des Intervalls genommen.

Bei der Gruppierung nach quantitativen kontinuierlichen Merkmalen ist es wichtig, die Größe des Intervalls zu bestimmen.

Neben dem Stichprobenmittelwert und der Stichprobenvarianz werden auch andere Merkmale der Variationsreihe verwendet.

Mode Nennen Sie die Variante mit der höchsten Häufigkeit.

Parametername Bedeutung
Betreff des Artikels: Variationsreihe
Rubrik (thematische Kategorie) Produktion

Beobachtete Werte zufällige Variable X 1 , X 2 , …, x k namens Optionen.

Frequenz Optionen X Ich werde eine Zahl genannt n ich (ich=1,…,k) zeigt, wie oft diese Variante in der Stichprobe vorkommt.

Frequenz(relative Häufigkeit, Anteile) Optionen x ich (ich=1,…,k) wird üblicherweise das Verhältnis seiner Frequenz genannt n ich zur Stichprobengröße n.

Frequenzen und Frequenzen werden genannt Waage.

Kumulierte Frequenz Es ist üblich, die Anzahl der Optionen zu nennen, deren Werte kleiner als vorgegeben sind X:

Kumulierte Frequenz Es ist üblich, das Verhältnis der akkumulierten Häufigkeit zur Stichprobengröße zu nennen:

Variationsreihe(Statistische Reihe) - Es ist üblich, eine Folge von Optionen in aufsteigender Reihenfolge und ihre entsprechenden Gewichte zu nennen.

Die Variationsreihe sollte sein diskret(Stichprobe von Werten einer diskreten Zufallsvariablen) und kontinuierlich (Intervall)(Auswahl von Werten einer kontinuierlichen Zufallsvariablen).

Die diskrete Variationsreihe hat die Form:

Wenn die Anzahl der Optionen groß ist oder das Merkmal kontinuierlich ist (eine Zufallsvariable kann in einem bestimmten Intervall jeden Wert annehmen), sind sie es Intervall Variationsreihe.

Um eine Intervallvariationsserie zu erstellen, führen Sie aus Gruppierung Option - sie sind in separate Intervalle unterteilt:

Die Anzahl der Intervalle wird manchmal mit bestimmt Sturges-Formeln:

Dann wird die Anzahl der Varianten berechnet, die in jedes Intervall fallen – Häufigkeiten n ich(oder Frequenz n ich/n). Befindet sich die Variante am Rand des Intervalls, wird sie an das rechte Intervall angehängt.

Die Intervallvariationsreihe hat die Form:

Optionen
Frequenzen

Empirische (statistische) Verteilungsfunktion Es ist üblich, eine Funktion aufzurufen, deren Wert an dem Punkt X gleich relative Frequenz die Tatsache, dass die Variante einen Wert kleiner als annehmen wird X(kumulierte Häufigkeit für X):

Frequenzpolygon heißt Polylinie, deren Segmente Punkte mit Koordinaten verbinden ( X 1 ; n 1), (X 2 ; n 2), …, (x k; nk). Das Frequenzpolygon, das ein statistisches Analogon des Verteilungspolygons ist.

Es ist erwähnenswert, dass für eine kontinuierliche Variationsreihe ein Polygon erstellt werden kann, wenn die Werte X 1 , X 2 , …, x k Nimm die Mittelpunkte der Intervalle.

Eine Intervall-Variationsserie wird üblicherweise mit grafisch dargestellt Histogramme.

Balkendiagramm- eine gestufte Figur, die aus Rechtecken besteht, deren Basen Teillängenintervalle sind h= x ich +1 – x ich, ich= 0,…,k-1, und die Höhen sind gleich den Frequenzen (oder Häufigkeiten) der Intervalle n ich (w ich).

Kumulieren(Summenkurve) - Kurve der akkumulierten Häufigkeiten (Frequenzen). Für diskrete Reihe die Kumulierung ist eine unterbrochene Linie, die die Punkte oder verbindet. Für Intervallserie kumulieren beginnt an einem Punkt, dessen Abszisse gleich dem Beginn des ersten Intervalls ist und dessen Ordinate die akkumulierte Frequenz (Frequenz) ist, Null. Andere Punkte dieser unterbrochenen Linie entsprechen den Enden der Intervalle.

Variationsserie - Konzept und Typen. Klassifizierung und Merkmale der Kategorie "Variationsserien" 2017, 2018.

  • - Variationsreihe der Verteilung

    Verteilung des Einzelhandelsumsatzes Russische Föderation 1995 nach Eigentumsart Millionen Rubel Arten von Vertriebsreihen Vorlesung VIII. Verteilungsreihen Als Ergebnis der Verarbeitung und Systematisierung primärstatistischer Daten erhalten sie ....


  • - Variationsreihe

    Die einfachste Transformation statistischer Daten besteht darin, sie nach Größe zu sortieren. Probenvolumen von Population, geordnet in nicht absteigender Reihenfolge der Elemente, d.h. , wird genannt Variationsreihe: . Für den Fall, dass das Volumen der Beobachtungen ... .


  • - Aufgabe 2. Intervallvariationsserie

    1. Erstellen Sie basierend auf einer gegebenen Stichprobe, die der Aufgabenvariante entspricht, eine Intervallvariationsserie; Erstellen Sie ein Histogramm und kumulieren Sie (verwenden Sie zwei Methoden: Einfügen eines Excel-Diagramms und den Modus "Histogramm" des Pakets "Datenanalyse"). 2. Analysieren Sie das resultierende Histogramm. ... .


  • - Erstellen Sie eine Variationsreihe der Variabilität des Merkmals von Bohnensamen oder Blättern einer beliebigen Pflanze gleichen Alters. Muster der Merkmalsvariabilität aufdecken.

    Bevölkerung - bauliche Einheit nett. Die Anzahl der Bevölkerungen. Ursachen von Bevölkerungsschwankungen. Die Beziehung von Individuen in Populationen und zwischen verschiedenen Populationen derselben und verschiedener Arten. 1. Ein wichtiges Merkmal einer Art ist ihre Verbreitung in Gruppen, Populationen in ...

  • (Definition einer Variationsreihe; Bestandteile einer Variationsreihe; drei Formen einer Variationsreihe; Zweckmäßigkeit der Konstruktion einer Intervallreihe; Schlussfolgerungen, die aus der konstruierten Reihe gezogen werden können)

    Eine Variationsreihe ist eine Folge aller Musterelemente, die in nicht absteigender Reihenfolge angeordnet sind. Identische Elemente werden wiederholt

    Variational – das sind Serien, die auf quantitativer Basis aufgebaut sind.

    Variationsreihe Verteilungen bestehen aus zwei Elementen: Varianten und Häufigkeiten:

    Optionen sind Zahlenwerte quantitative Eigenschaft in der Variationsverteilungsreihe. Sie können positiv oder negativ, absolut oder relativ sein. Also, wenn Unternehmen nach den Ergebnissen gruppiert werden Wirtschaftstätigkeit positive Optionen sind Gewinn, und negative Zahlen ist ein Verlust.

    Häufigkeiten sind die Anzahlen einzelner Varianten oder jeder Gruppe der Variantenreihe, d.h. dies sind Zahlen, die angeben, wie oft bestimmte Optionen in einer Verteilungsserie vorkommen. Die Summe aller Häufigkeiten wird als Populationsvolumen bezeichnet und wird durch die Anzahl der Elemente der Gesamtpopulation bestimmt.

    Häufigkeiten sind Häufigkeiten, die als relative Werte (Bruchteile von Einheiten oder Prozentangaben) ausgedrückt werden. Die Summe der Häufigkeiten ist gleich eins oder 100 %. Wenn Sie Frequenzen durch Frequenzen ersetzen, können Sie die Variationsreihe mit vergleichen andere Nummer Beobachtungen.

    Es gibt drei Formen von Variationsreihen: Rangreihen, diskrete Reihen und Intervallserie.

    Eine Rangfolge ist die Verteilung einzelner Bevölkerungseinheiten in aufsteigender oder absteigender Reihenfolge des untersuchten Merkmals. Ranking macht es einfach, quantitative Daten in Gruppen zu unterteilen, die kleinsten sofort zu erkennen und größten Wert markieren Sie die Werte, die am häufigsten wiederholt werden.

    Andere Formen der Variationsreihe sind Gruppentabellen, die nach der Art der Variation der Werte des untersuchten Merkmals zusammengestellt werden. Aufgrund der Art der Variation werden diskrete (diskontinuierliche) und kontinuierliche Zeichen unterschieden.

    Diskrete Serie- Dies ist eine solche Variationsreihe, deren Konstruktion auf Zeichen mit diskontinuierlicher Änderung (diskrete Zeichen) basiert. Zu letzteren gehören die Tarifklasse, die Anzahl der Kinder in der Familie, die Anzahl der Beschäftigten im Unternehmen etc. Diese Zeichen können nur eine endliche Anzahl bestimmter Werte annehmen.

    Eine diskrete Variationsreihe ist eine Tabelle, die aus zwei Spalten besteht. Die erste Spalte gibt den spezifischen Wert des Attributs an und die zweite - die Anzahl der Bevölkerungseinheiten mit bestimmter Wert Schild.

    Wenn ein Zeichen eine kontinuierliche Änderung aufweist (die Höhe des Einkommens, der Berufserfahrung, die Kosten des Anlagevermögens eines Unternehmens usw., die innerhalb bestimmter Grenzen jeden Wert annehmen können), muss für dieses Zeichen eine Intervallvariationsserie erstellt werden.



    Auch hier ist die Gruppentabelle zweispaltig. Der erste gibt den Wert des Merkmals im Intervall "von - bis" (Optionen) an, der zweite - die Anzahl der im Intervall enthaltenen Einheiten (Häufigkeit).

    Häufigkeit (Wiederholungshäufigkeit) – die Anzahl der Wiederholungen einer bestimmten Variante der Attributwerte, bezeichnet mit fi , und die Summe der Häufigkeiten gleich dem Volumen der untersuchten Population, bezeichnet

    Dabei ist k die Anzahl der Attributwertoptionen

    Sehr oft wird die Tabelle um eine Spalte ergänzt, in der die kumulierten Häufigkeiten S berechnet werden, die zeigen, wie viele Einheiten der Grundgesamtheit einen Merkmalswert von höchstens haben gegebenen Wert.

    Eine diskrete Variationsverteilungsreihe ist eine Reihe, in der Gruppen gemäß einem Merkmal zusammengesetzt werden, das diskret variiert und nur ganzzahlige Werte annimmt.

    Die Intervallvariationsreihe der Verteilung ist eine Reihe, in der das Gruppierungsattribut, das die Grundlage der Gruppierung bildet, in einem bestimmten Intervall beliebige Werte annehmen kann, einschließlich gebrochener.

    Eine Intervallvariationsreihe ist eine geordnete Menge von Variationsintervallen der Werte einer Zufallsvariablen mit den entsprechenden Häufigkeiten oder Häufigkeiten der Werte der Größe, die in jede von ihnen fallen.

    Es ist sinnvoll, eine Intervallverteilungsreihe zunächst bei einer kontinuierlichen Variation eines Merkmals zu bilden, und auch dann, wenn sich eine diskrete Variation über einen weiten Bereich manifestiert, d.h. Die Anzahl der Optionen für ein diskretes Merkmal ist ziemlich groß.

    Aus dieser Reihe lassen sich bereits einige Schlussfolgerungen ziehen. Beispielsweise kann das durchschnittliche Element einer Variationsreihe (Median) eine Schätzung des wahrscheinlichsten Ergebnisses einer Messung sein. Das erste und letzte Element der Variationsreihe (d. h. das minimale und maximale Element der Stichprobe) zeigen die Streuung der Elemente der Stichprobe. Wenn sich das erste oder letzte Element stark vom Rest der Probe unterscheidet, werden sie manchmal aus den Messergebnissen ausgeschlossen, da diese Werte aufgrund eines groben Fehlers, beispielsweise einer Technologie, erzielt wurden.

    Praxis 1

    VARIATIONALE REIHE DER VERTEILUNG

    Variationsreihe oder Nahverteilung genannt die geordnete Verteilung von Bevölkerungseinheiten nach zunehmenden (häufiger) oder abnehmenden (seltener) Werten des Attributs und Zählen der Anzahl der Einheiten mit dem einen oder anderen Wert des Attributs.

    Es gibt 3 nett Verbreitungsgebiet:

    1) Rangreihe- dies ist eine Liste der einzelnen Bevölkerungseinheiten in aufsteigender Reihenfolge des untersuchten Merkmals; Wenn die Anzahl der Bevölkerungseinheiten groß genug ist, wird die Rangfolge umständlich, und in solchen Fällen wird die Verteilungsreihe erstellt, indem die Bevölkerungseinheiten nach den Werten des untersuchten Merkmals gruppiert werden (wenn das Merkmal eine kleine Zahl annimmt von Werten, dann wird eine diskrete Reihe konstruiert, andernfalls eine Intervallreihe);

    2) diskrete Reihe- Dies ist eine Tabelle, die aus zwei Spalten (Zeilen) besteht - bestimmte Werte eines variierenden Attributs X ich und die Anzahl der Bevölkerungseinheiten mit dem gegebenen Wert des Merkmals f ich– Frequenzen; die Anzahl der Gruppen in einer diskreten Reihe wird durch die Anzahl der tatsächlich vorhandenen Werte des Variablenattributs bestimmt;

    3) Intervallserie- Dies ist eine Tabelle, die aus zwei Spalten (Zeilen) besteht - Intervalle mit unterschiedlichem Vorzeichen X ich und die Anzahl der Bevölkerungseinheiten, die in ein bestimmtes Intervall fallen (Häufigkeiten), oder der Anteil dieser Zahl an der Gesamtzahl der Bevölkerungen (Häufigkeiten).

    Es werden Zahlen aufgerufen, die angeben, wie oft einzelne Optionen in einer bestimmten Population vorkommen Frequenzen oder Waage Option und sind markiert Kleinbuchstaben Lateinisches Alphabet f. Die Gesamtsumme der Häufigkeiten der Variationsreihe ist gleich dem Volumen dieser Grundgesamtheit, d.h.

    wo k– Anzahl der Gruppen, nGesamtzahl Beobachtungen oder Bevölkerungsgröße.

    Häufigkeiten (Gewichte) werden nicht nur in absoluten, sondern auch in relativen Zahlen ausgedrückt - in Bruchteilen einer Einheit oder als Prozentsatz der Gesamtzahl der Varianten, aus denen dieser Satz besteht. In solchen Fällen werden die Gewichte aufgerufen relative Häufigkeiten oder Frequenzen. Die Gesamtsumme der Einzelheiten ist gleich eins

    oder
    ,

    wenn die Häufigkeiten als Prozentsatz der Gesamtzahl der Beobachtungen ausgedrückt werden P. Das Ersetzen von Frequenzen durch Frequenzen ist nicht obligatorisch, erweist sich aber manchmal als sinnvoll und sogar notwendig, wenn es darum geht, Variationsreihen, die sich in ihrer Lautstärke stark unterscheiden, miteinander zu vergleichen.

    Je nachdem, wie sich das Attribut verändert – diskret oder kontinuierlich, in einem breiten oder engen Bereich – verteilt sich die statistische Grundgesamtheit intervalllos oder Intervall Variationslinien. Im ersten Fall beziehen sich die Häufigkeiten direkt auf die Rangwerte des Merkmals, das die Position erfasst einzelne Gruppen oder Klassen der Variationsreihe, in der zweiten - werden die auf einzelne Intervalle oder Intervalle (von - bis) bezogenen Häufigkeiten berechnet, in die die allgemeine Variation des Merkmals im Bereich von den minimalen bis zu den maximalen Varianten dieser Population unterteilt wird . Diese Räume oder Klassenräume können gleich breit sein oder nicht. Ab hier unterscheiden sie Variationsreihen mit gleichen und ungleichen Intervallen. In ungleichen Intervallreihen ändert sich die Art der Häufigkeitsverteilung, wenn sich die Breite der Klassenintervalle ändert. Die Gruppierung mit ungleichen Intervallen wird in der Biologie relativ selten verwendet. In der Regel werden biometrische Daten in gleichen Intervallreihen verteilt, was nicht nur das Muster der Variation erkennen lässt, sondern auch die Berechnung von Summendaten erleichtert. numerische Merkmale Variationsreihen, Vergleich von Verteilungsreihen untereinander.

    Wenn Sie mit dem Aufbau einer Variationsreihe mit gleichen Intervallen beginnen, ist es wichtig, die Breite des Klassenintervalls korrekt zu skizzieren. Tatsache ist, dass eine grobe Gruppierung (wenn sehr weite Klassenintervalle eingestellt werden) die typischen Variationsmerkmale verzerrt und zu einer Verringerung der Genauigkeit der numerischen Merkmale der Reihe führt. Bei der Wahl zu enger Intervalle steigt zwar die Genauigkeit der verallgemeinernden numerischen Merkmale, aber die Reihe erweist sich als zu lang und gibt kein klares Bild der Streuung wieder.

    Um eine wohldefinierte Variationsreihe zu erhalten und Um eine ausreichende Genauigkeit der daraus berechneten numerischen Merkmale zu gewährleisten, ist es erforderlich, die Variation des Merkmals (im Bereich von den minimalen bis zu den maximalen Optionen) in so viele Gruppen oder Klassen zu unterteilen, dass beide Anforderungen erfüllt werden. Dieses Problem wird gelöst, indem die Variationsbreite eines Merkmals durch die Anzahl der Gruppen oder Klassen dividiert wird, die beim Aufbau einer Variationsreihe geplant werden:

    ,

    wo h– Intervallwert; X m ein x ich X min ist das Maximum und Mindestwert In Summe; k ist die Anzahl der Gruppen.

    Beim Erstellen einer Intervallverteilungsreihe ist es notwendig, die optimale Anzahl von Gruppen (Zeichenintervallen) zu wählen und die Länge (Bereich) des Intervalls festzulegen. Da die Analyse der Verteilungsreihen die Häufigkeiten in vergleicht verschiedene Intervalle, ist es notwendig, dass die Länge der Intervalle konstant ist. Wenn Sie es mit einer Intervallverteilungsreihe mit ungleichen Intervallen zu tun haben, müssen Sie zur Vergleichbarkeit die Häufigkeit oder Häufigkeit auf die Einheit des Intervalls bringen, der resultierende Wert wird aufgerufen Dichte ρ , also
    .

    Die optimale Anzahl der Gruppen wird so gewählt, dass die Wertevielfalt des Attributs im Aggregat ausreichend wiedergegeben wird und gleichzeitig die Regelmäßigkeit der Verteilung, ihre Form nicht durch zufällige Häufigkeitsschwankungen verzerrt wird. Wenn es zu wenige Gruppen gibt, gibt es kein Variationsmuster; wenn es zu viele Gruppen gibt, verzerren zufällige Frequenzsprünge die Form der Verteilung.

    Meistens wird die Anzahl der Gruppen in einer Verteilungsreihe durch die Sturgess-Formel bestimmt:

    wo n- die Größe der Bevölkerung.

    Eine grafische Darstellung ist eine wesentliche Hilfestellung bei der Analyse einer Verteilungsreihe und ihrer Eigenschaften. Die Intervallreihe wird durch ein Balkendiagramm dargestellt, in dem die Basen der Balken, die sich entlang der Abszissenachse befinden, die Intervalle der Werte des variierenden Attributs sind und die Höhen der Balken die Frequenzen sind, die der Skala entlang entsprechen die Ordinatenachse. Diese Art von Diagramm wird aufgerufen Histogramm.

    Wenn es sich um eine diskrete Verteilungsreihe handelt oder die mittleren Intervalle verwendet werden, dann wird die grafische Darstellung einer solchen Reihe genannt Polygon, die man erhält, indem man gerade Punkte mit Koordinaten verbindet X ich und f ich .

    Wenn die Klassenwerte entlang der Abszissenachse aufgetragen werden und die akkumulierten Häufigkeiten entlang der Ordinatenachse aufgetragen werden, gefolgt vom Verbinden der Punkte mit geraden Linien, wird ein Graph erhalten, der als bezeichnet wird kumulativ. Die akkumulierten Häufigkeiten werden durch sukzessive Summierung gefunden, oder Kumulation Frequenzen in Richtung von der ersten Klasse bis zum Ende der Variationsreihe.

    Beispiel. Es liegen Daten über die Eierproduktion von 50 Legehennen vor, die 1 Jahr lang in einem Geflügelbetrieb gehalten wurden (Tabelle 1.1).

    T a b e l 1.1

    Legehennen

    Anzahl Legehennen

    Eierproduktion, Stk.

    Anzahl Legehennen

    Eierproduktion, Stk.

    Anzahl Legehennen

    Eierproduktion, Stk.

    Anzahl Legehennen

    Eierproduktion, Stk.

    Anzahl Legehennen

    Eierproduktion, Stk.

    Es ist erforderlich, eine Intervallverteilungsreihe aufzubauen und diese grafisch in Form eines Histogramms, eines Polygons und einer Kumulierung darzustellen.

    Es ist ersichtlich, dass das Merkmal von 212 bis 245 Eiern variiert, die von einer Legehenne in einem Jahr erhalten wurden.

    In unserem Beispiel bestimmen wir mit der Sturgess-Formel die Anzahl der Gruppen:

    k = 1 + 3,322lg 50 = 6,643 ≈ 7.

    Berechnen Sie die Länge (Bereich) des Intervalls mit der Formel:

    .

    Bauen wir eine Intervallserie mit 7 Gruppen und einem Intervall von 5 Stück. Eier (Tabelle 1.2). Um Diagramme in der Tabelle zu erstellen, berechnen wir die Mitte der Intervalle und die kumulierte Häufigkeit.

    T a b e l 1.2

    Intervallreihe der Verteilung der Eierproduktion

    Gruppe von Legehennen nach der Größe der Eierproduktion

    X ich

    Anzahl Legehennen

    f ich

    Intervallmittelpunkt

    X ich'

    Kumulierte Frequenz

    f ich

    Lassen Sie uns ein Histogramm der Verteilung der Eierproduktion erstellen (Abb. 1.1).

    Reis. 1.1. Histogramm der Verteilung der Eierproduktion

    Diese Histogramme zeigen die für viele Merkmale charakteristische Verteilungsform: Die Werte der durchschnittlichen Intervalle des Merkmals sind häufiger und die extremen (kleinen und großen) Werte des Merkmals sind seltener. Die Form dieser Verteilung kommt dem Normalverteilungsgesetz nahe, das entsteht, wenn eine variable Variable von einer Vielzahl von Faktoren beeinflusst wird, von denen keiner einen vorherrschenden Wert hat.

    Das Polygon und Kumulat der Verteilung der Eierproduktion haben die Form (Abb. 1.2 und 1.3).

    Reis. 1.2. Eierverteilungspolygon

    Reis. 1.3. Kumulierte Verteilung der Eierproduktion

    Problemlösungstechnologie in Tabellenkalkulationsprozessor Microsoft übertreffen nächste.

    1. Geben Sie die Anfangsdaten gemäß Abb. 1.4.

    2. Ordnen Sie die Reihe.

    2.1. Markieren Sie die Zellen A2:A51.

    2.2. Klicken Sie mit der linken Maustaste in der Symbolleiste auf die Schaltfläche<Сортировка по возрастанию > .

    3. Bestimmen Sie die Größe des Intervalls zum Aufbau der Intervallreihe der Verteilung.

    3.1. Kopieren Sie Zelle A2 in Zelle E53.

    3.2. Kopieren Sie die Zelle A51 in die Zelle E54.

    3.3. Berechnen Sie die Variationsbreite. Geben Sie dazu die Formel in Zelle E55 ein =E54-E53.

    3.4. Berechnen Sie die Anzahl der Variationsgruppen. Geben Sie dazu die Formel in Zelle E56 ein =1+3.322*LOG10(50).

    3.5. Geben Sie in Zelle E57 die gerundete Anzahl der Gruppen ein.

    3.6. Berechnen Sie die Länge des Intervalls. Geben Sie dazu die Formel in Zelle E58 ein =E55/E57.

    3.7. Geben Sie in Zelle E59 die gerundete Länge des Intervalls ein.

    4. Erstellen Sie eine Intervallserie.

    4.1. Kopieren Sie die Zelle E53 in die Zelle B64.

    4.2. Geben Sie die Formel in Zelle B65 ein =B64+$E$59.

    4.3. Kopieren Sie die Zelle B65 in die Zellen B66:B70.

    4.4. Geben Sie die Formel in Zelle C64 ein =B65.

    4.5. Geben Sie die Formel in Zelle C65 ein =C64+$E$59.

    4.6. Kopieren Sie die Zelle C65 in die Zellen C66:C70.

    Die Ergebnisse der Lösung werden auf dem Bildschirm in folgender Form angezeigt (Abb. 1.5).

    5. Berechnen Sie die Intervallfrequenz.

    5.1. Führen Sie den Befehl aus Service,Datenanalyse durch abwechselndes Klicken mit der linken Maustaste.

    5.2. Im Dialogfeld Datenanalyse mit der linken Maustaste einstellen: Analysewerkzeuge <Гистограмма>(Abb. 1.6).

    5.3. Klicken Sie mit der linken Maustaste auf die Schaltfläche<ОК>.

    5.4. Auf der Registerkarte Balkendiagramm Stellen Sie die Parameter gemäß Abb. ein. 1.7.

    5.5. Klicken Sie mit der linken Maustaste auf die Schaltfläche<ОК>.

    Die Ergebnisse der Lösung werden auf dem Bildschirm in folgender Form angezeigt (Abb. 1.8).

    6. Füllen Sie die Tabelle "Intervallreihe der Verteilung" aus.

    6.1. Kopieren Sie die Zellen B74:B80 in die Zellen D64:D70.

    6.2. Berechne die Summe der Häufigkeiten. Wählen Sie dazu die Zellen D64:D70 aus und klicken Sie mit der linken Maustaste auf die Schaltfläche in der Symbolleiste<Автосумма > .

    6.3. Berechnen Sie die Mitte der Intervalle. Geben Sie dazu die Formel in die Zelle E64 ein =(B64+C64)/2 und in die Zellen E65:E70 kopieren.

    6.4. Berechnen Sie die akkumulierten Frequenzen. Kopieren Sie dazu die Zelle D64 in die Zelle F64. Geben Sie in Zelle F65 die Formel =F64+D65 ein und kopieren Sie sie in die Zellen F66:F70.

    Die Ergebnisse der Lösung werden auf dem Bildschirm in folgender Form angezeigt (Abb. 1.9).

    7. Bearbeiten Sie das Histogramm.

    7.1. Klicken Sie im Diagramm mit der rechten Maustaste auf den Namen "Tasche" und klicken Sie in der angezeigten Registerkarte auf die Schaltfläche<Очистить>.

    7.2. Klicken Sie mit der rechten Maustaste auf das Diagramm, und klicken Sie auf der angezeigten Registerkarte auf die Schaltfläche<Исходные данные>.

    7.3. Im Dialogfeld Ausgangsdaten x-Achsenbeschriftung ändern, dazu Zellen B64:C70 markieren (Abb. 1.10).

    7.5. drücken Sie die Taste .

    Die Ergebnisse werden auf dem Bildschirm in angezeigt folgendes Formular(Abb. 1.11).

    8. Erstellen Sie ein Eierverteilungspolygon.

    8.1. Klicken Sie mit der linken Maustaste in der Symbolleiste auf die Schaltfläche<Мастер диаграмм > .

    8.2. Im Dialogfeld Diagrammassistent (Schritt 1 von 4) mit linker Maustaste einstellen: Standard <График>(Abb. 1.12).

    8.3. Klicken Sie mit der linken Maustaste auf die Schaltfläche<Далее>.

    8.4. Im Dialogfeld Diagrammassistent (Schritt 2 von 4) Stellen Sie die Parameter gemäß Abb. ein. 1.13.

    8.5. Klicken Sie mit der linken Maustaste auf die Schaltfläche<Далее>.

    8.6. Im Dialogfeld Diagrammassistent (Schritt 3 von 4) Geben Sie die Namen des Diagramms und der Y-Achse ein (Abb. 1.14).

    8.7. Klicken Sie mit der linken Maustaste auf die Schaltfläche<Далее>.

    8.8. Im Dialogfeld Diagrammassistent (Schritt 4 von 4) Stellen Sie die Parameter gemäß Abb. ein. 1.15.

    8.9. Klicken Sie mit der linken Maustaste auf die Schaltfläche<Готово>.

    Die Ergebnisse werden auf dem Bildschirm in folgender Form angezeigt (Abb. 1.16).

    9. Fügen Sie Datenbeschriftungen in das Diagramm ein.

    9.1. Klicken Sie mit der rechten Maustaste auf das Diagramm, und klicken Sie auf der angezeigten Registerkarte auf die Schaltfläche<Исходные данные>.

    9.2. Im Dialogfeld Ausgangsdaten x-Achsenbeschriftung ändern, dazu Zellen E64:E70 markieren (Abb. 1.17).

    9.3. drücken Sie die Taste .

    Die Ergebnisse werden auf dem Bildschirm in folgender Form angezeigt (Abb. 1.18).

    Das Verteilungskumulat wird ähnlich wie das Verteilungspolygon basierend auf den akkumulierten Häufigkeiten konstruiert.

    Sie werden in Form von Vertriebsserien präsentiert und sind als .

    Eine Verteilungsserie ist eine Art der Gruppierung.

    Verbreitungsgebiet- stellt eine geordnete Verteilung von Einheiten der untersuchten Bevölkerung in Gruppen gemäß einem bestimmten variierenden Attribut dar.

    Je nach Merkmal, das der Bildung einer Verbreitungsreihe zugrunde liegt, gibt es attributiv und variabel Verteilungsränge:

    • attributiv- Rufen Sie die aus qualitativen Gründen aufgebaute Verteilungsreihe auf.
    • Verteilungsreihen, die in aufsteigender oder absteigender Reihenfolge der Werte eines quantitativen Attributs aufgebaut sind, werden genannt variabel.
    Die Variationsreihe der Distribution besteht aus zwei Spalten:

    Die erste Spalte enthält quantitative Werte variable Eigenschaft, die aufgerufen werden Optionen und gekennzeichnet sind. Diskrete Variante - ausgedrückt als ganze Zahl. Die Intervalloption liegt im Bereich von und bis. Je nach Art der Varianten ist es möglich, eine diskrete oder intervallartige Variationsreihe zu konstruieren.
    Die zweite Spalte enthält Menge spezifische Option , ausgedrückt in Frequenzen oder Häufigkeiten:

    Frequenzen- Dies sind absolute Zahlen, die angeben, wie oft der angegebene Wert des Merkmals insgesamt vorkommt, die angeben. Die Summe aller Häufigkeiten sollte gleich der Anzahl der Einheiten der gesamten Grundgesamtheit sein.

    Frequenzen() sind die als Prozentsatz der Gesamtzahl ausgedrückten Häufigkeiten. Die prozentuale Summe aller Häufigkeiten muss in Bruchteilen von eins gleich 100 % sein.

    Grafische Darstellung von Vertriebsserien

    Die Verbreitungsreihen werden mit grafischen Bildern visualisiert.

    Die Verteilungsserien werden wie folgt angezeigt:
    • Vieleck
    • Histogramme
    • Kumuliert
    • ogiven

    Vieleck

    Beim Konstruieren eines Polygons auf der horizontalen Achse (Abszissenachse) werden die Werte des variierenden Attributs aufgetragen und weiter vertikale Achse(y-Achse) - Frequenzen oder Frequenzen.

    Das Vieleck in Abb. 6.1 wurde nach der Mikrozählung der Bevölkerung Russlands im Jahr 1994 gebaut.

    6.1. Verteilung der Haushalte nach Größe

    Zustand: Es werden Daten zur Verteilung von 25 Mitarbeitern eines der Unternehmen nach Tarifkategorien angegeben:
    4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
    Aufgabe: Erstellen Sie eine diskrete Variationsreihe und stellen Sie sie grafisch als Verteilungspolygon dar.
    Entscheidung:
    BEIM dieses Beispiel Optionen ist die Lohnkategorie des Mitarbeiters. Zur Bestimmung der Häufigkeiten ist es notwendig, die Anzahl der Beschäftigten mit der entsprechenden Lohnklasse zu berechnen.

    Das Polygon wird für diskrete Variationsreihen verwendet.

    Um ein Verteilungspolygon (Abb. 1) zu erstellen, zeichnen wir entlang der Abszisse (X) die quantitativen Werte der unterschiedlichen Merkmalsvarianten und entlang der Ordinate - Häufigkeiten oder Häufigkeiten.

    Werden die Kennwerte als Intervalle ausgedrückt, so wird eine solche Reihe als Intervallreihe bezeichnet.
    Intervallserie Verteilungen werden grafisch als Histogramm, Kumulierung oder Ogive dargestellt.

    Statistische Tabelle

    Zustand: Daten über die Größe der Einlagen 20 werden angegeben Einzelpersonen in einer Bank (tausend Rubel) 60; 25; 12; zehn; 68; 35; 2; 17; 51; neun; 3; 130; 24; 85; 100; 152; 6; achtzehn; 7; 42.
    Aufgabe: Erstellen Sie eine Intervallvariationsserie mit gleichen Intervallen.
    Entscheidung:

    1. Die Anfangspopulation besteht aus 20 Einheiten (N = 20).
    2. Unter Verwendung der Sturgess-Formel definieren wir erforderliche Menge verwendete Gruppen: n=1+3.322*lg20=5
    3. Lassen Sie uns den Wert des gleichen Intervalls berechnen: i=(152 - 2) /5 = 30 Tausend Rubel
    4. Wir teilen die Anfangspopulation in 5 Gruppen mit einem Abstand von 30.000 Rubel auf.
    5. Die Gruppierungsergebnisse sind in der Tabelle dargestellt:

    Wenn bei einer solchen Aufzeichnung eines kontinuierlichen Merkmals derselbe Wert zweimal auftritt (als obere Grenze eines Intervalls und als untere Grenze eines anderen Intervalls), dann gehört dieser Wert zu der Gruppe, wo dieser Wert als obere Grenze wirkt.

    Balkendiagramm

    Um ein Histogramm entlang der Abszisse zu erstellen, geben Sie die Werte der Grenzen der Intervalle an und konstruieren Sie darauf basierend Rechtecke, deren Höhe proportional zu den Frequenzen (oder Frequenzen) ist.

    Auf Abb. 6.2. Vorgeführt ist das Histogramm der Verteilung der Bevölkerung Russlands im Jahr 1997 nach Altersgruppen.

    Reis. 6.2. Verteilung der Bevölkerung Russlands nach Altersgruppen

    Zustand: Gegeben ist die Verteilung von 30 Mitarbeitern des Unternehmens nach der Höhe des Monatsgehalts

    Aufgabe: Intervallvariationsreihe grafisch als Histogramm darstellen und kumulieren.
    Entscheidung:

    1. Die unbekannte Grenze des offenen (ersten) Intervalls wird durch den Wert des zweiten Intervalls bestimmt: 7000 - 5000 = 2000 Rubel. Mit dem gleichen Wert finden wir untere Grenze das erste Intervall: 5000 - 2000 = 3000 Rubel.
    2. Um ein Histogramm in einem rechteckigen Koordinatensystem zu erstellen, legen wir entlang der Abszissenachse Segmente beiseite, deren Werte den Intervallen der Variantenreihe entsprechen.
      Diese Segmente dienen als untere Basis, und die entsprechende Frequenz (Frequenz) dient als Höhe der gebildeten Rechtecke.
    3. Lassen Sie uns ein Histogramm erstellen:

    Um die Kumulierung zu konstruieren, ist es notwendig, die akkumulierten Häufigkeiten (Frequenzen) zu berechnen. Sie werden durch sukzessive Summierung der Häufigkeiten (Häufigkeiten) der vorangegangenen Intervalle ermittelt und mit S bezeichnet. Die kumulierten Häufigkeiten geben an, wie viele Einheiten der Grundgesamtheit einen Merkmalswert haben, der nicht größer ist als der betrachtete.

    Kumulieren

    Die Verteilung eines Merkmals in einer Variationsreihe nach den kumulierten Häufigkeiten (Häufigkeiten) wird anhand der Kumulierung dargestellt.

    Kumulieren oder die Summenkurve ist im Gegensatz zum Polygon auf den akkumulierten Häufigkeiten bzw. Frequenzen aufgebaut. Gleichzeitig werden die Werte des Merkmals auf der Abszissenachse und die akkumulierten Frequenzen oder Frequenzen auf der Ordinatenachse platziert (Abb. 6.3).

    Reis. 6.3. Kumulierte Verteilung der Haushalte nach Größe

    4. Berechnen Sie die akkumulierten Häufigkeiten:
    Die Kniefrequenz des ersten Intervalls berechnet sich wie folgt: 0 + 4 = 4, für das zweite: 4 + 12 = 16; für die dritte: 4 + 12 + 8 = 24 usw.

    Bei der Kumulierung wird die akkumulierte Häufigkeit (Häufigkeit) des entsprechenden Intervalls seiner Obergrenze zugeordnet:

    Ogiva

    Ogiva ist ähnlich aufgebaut wie das Kumulat, mit dem einzigen Unterschied, dass die akkumulierten Häufigkeiten auf der Abszissenachse und die Merkmalswerte auf der Ordinatenachse platziert sind.

    Eine Variation der Kumulierung ist die Konzentrationskurve oder das Lorenz-Diagramm. Auftragen der Konzentrationskurve auf beiden Achsen rechteckiges System Koordinaten wird eine Skalenskala in Prozent von 0 bis 100 angewendet. In diesem Fall geben die Abszissen die kumulierten Häufigkeiten und die Ordinaten die kumulierten Werte des Anteils (in Prozent) am Volumen des Merkmals an.

    Die gleichmäßige Verteilung des Vorzeichens entspricht der Diagonale des Quadrats in der Grafik (Abb. 6.4). Bei ungleichmäßiger Verteilung ist der Graph eine konkave Kurve, abhängig vom Konzentrationsgrad des Merkmals.

    6.4. Konzentrationskurve