Berechnen Sie das Konfidenzintervall. Quantitative Analysemethoden: Schätzung von Konfidenzintervallen

Das Konfidenzintervall kam aus der Statistik zu uns. Das bestimmten Bereich, die zur Schätzung des unbekannten Parameters mit dient ein hohes Maß Verlässlichkeit. Am einfachsten lässt sich dies anhand eines Beispiels erklären.

Angenommen, Sie müssen eine Zufallsvariable untersuchen, beispielsweise die Antwortgeschwindigkeit des Servers auf eine Client-Anfrage. Jedes Mal, wenn ein Benutzer die Adresse einer bestimmten Site eingibt, antwortet der Server mit einer anderen Geschwindigkeit. Die untersuchte Reaktionszeit hat somit Zufallscharakter. Also, Konfidenzintervall ermöglicht es Ihnen, die Grenzen dieses Parameters zu bestimmen, und dann kann behauptet werden, dass sich der Server mit einer Wahrscheinlichkeit von 95% in dem von uns berechneten Bereich befindet.

Oder Sie müssen herausfinden, wie viele Leute davon wissen Warenzeichen Firmen. Bei der Berechnung des Konfidenzintervalls lässt sich beispielsweise sagen, dass mit einer Wahrscheinlichkeit von 95 % der Anteil der Verbraucher, die davon wissen, im Bereich von 27 % bis 34 % liegt.

Eng verwandt mit diesem Begriff ist Vertrauensstufe. Es stellt die Wahrscheinlichkeit dar, dass der gewünschte Parameter im Konfidenzintervall enthalten ist. Dieser Wert bestimmt, wie groß unser gewünschter Bereich sein wird. Wie Größerer Wert es akzeptiert, desto schmaler wird das Konfidenzintervall und umgekehrt. Normalerweise ist es auf 90 %, 95 % oder 99 % eingestellt. Der Wert von 95 % ist am beliebtesten.

Dieser Indikator wird auch von der Varianz der Beobachtungen beeinflusst und seine Definition basiert auf der Annahme, dass das untersuchte Merkmal gehorcht.Diese Aussage ist auch als Gauß'sches Gesetz bekannt. Ihm zufolge ist eine solche Verteilung aller Wahrscheinlichkeiten ein stetiges zufällige Variable, die durch die Wahrscheinlichkeitsdichte beschrieben werden kann. Wenn die Annahme über Normalverteilung sich als falsch herausstellte, dann kann die Schätzung falsch sein.

Lassen Sie uns zunächst herausfinden, wie das Konfidenzintervall für berechnet wird. Hier sind zwei Fälle möglich. Streuung (der Streuungsgrad einer Zufallsvariablen) kann bekannt sein oder nicht. Wenn es bekannt ist, wird unser Konfidenzintervall mit der folgenden Formel berechnet:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - Zeichen,

t ist ein Parameter aus der Laplace-Verteilungstabelle,

σ ist die Quadratwurzel der Streuung.

Wenn die Varianz unbekannt ist, kann sie berechnet werden, wenn wir alle Werte des gewünschten Merkmals kennen. Dazu wird folgende Formel verwendet:

σ2 = х2ср - (хр)2, wobei

х2ср - der Durchschnittswert der Quadrate des untersuchten Merkmals,

(xsr)2 ist das Quadrat dieser Funktion.

Die Formel, nach der das Konfidenzintervall berechnet wird, ändert sich in diesem Fall leicht:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - Probenmittelwert,

α - Zeichen,

t ist ein Parameter, der unter Verwendung der Student-Verteilungstabelle t \u003d t (ɣ; n-1) gefunden wird.

sqrt(n) ist die Quadratwurzel der gesamten Stichprobengröße,

s ist die Quadratwurzel der Varianz.

Betrachten Sie dieses Beispiel. Angenommen, basierend auf den Ergebnissen von 7 Messungen wurde das untersuchte Merkmal mit 30 und die Stichprobenvarianz mit 36 ​​bestimmt. Es ist notwendig, mit einer Wahrscheinlichkeit von 99 % ein Konfidenzintervall zu finden, das den wahren Wert von enthält der gemessene Parameter.

Lassen Sie uns zunächst bestimmen, was t gleich ist: t \u003d t (0,99; 7-1) \u003d 3,71. Mit obiger Formel erhalten wir:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71 * 36 / (Quadrat (7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Das Konfidenzintervall für die Varianz wird sowohl bei bekanntem Mittelwert als auch dann berechnet, wenn keine Angaben zum mathematischen Erwartungswert vorliegen und nur der Wert der unverzerrten Punktschätzung der Varianz bekannt ist. Wir werden hier nicht die Formeln für seine Berechnung angeben, da sie ziemlich komplex sind und auf Wunsch immer im Netz zu finden sind.

Wir stellen nur fest, dass es bequem ist, das Konfidenzintervall mit dem Excel-Programm oder einem so genannten Netzwerkdienst zu bestimmen.

Eine der Methoden zur Lösung statistischer Probleme ist die Berechnung des Konfidenzintervalls. Es wird als bevorzugte Alternative zur Punktschätzung verwendet, wenn die Stichprobengröße klein ist. Es sollte beachtet werden, dass der Prozess der Berechnung des Konfidenzintervalls ziemlich kompliziert ist. Mit den Tools des Excel-Programms können Sie es jedoch etwas vereinfachen. Lassen Sie uns herausfinden, wie dies in der Praxis gemacht wird.

Dieses Verfahren wird bei der Intervallschätzung verschiedener statistischer Größen verwendet. Die Hauptaufgabe dieser Berechnung besteht darin, die Unsicherheiten der Punktschätzung zu beseitigen.

In Excel gibt es zwei Hauptoptionen für die Berechnung mit dieser Methode: wenn die Varianz bekannt ist und wenn sie unbekannt ist. Im ersten Fall wird die Funktion für Berechnungen verwendet VERTRAUEN NORM, und im zweiten VERTRAUEN.STUDENT.

Methode 1: CONFIDENCE NORM-Funktion

Operator VERTRAUEN NORM, das sich auf die statistische Gruppe von Funktionen bezieht, erschien erstmals in Excel 2010. Frühere Versionen dieses Programms verwenden sein Gegenstück VERTRAUEN. Die Aufgabe dieses Operators besteht darin, ein Konfidenzintervall mit einer Normalverteilung für den Mittelwert der Grundgesamtheit zu berechnen.

Seine Syntax ist wie folgt:

VERTRAUEN NORM(alpha, standard_dev, Größe)

"Alpha" ist ein Argument, das das Signifikanzniveau angibt, das zur Berechnung des Konfidenzniveaus verwendet wird. Das Konfidenzniveau entspricht dem folgenden Ausdruck:

(1-"Alpha")*100

"Standardabweichung" ist ein Argument, dessen Essenz aus dem Namen hervorgeht. Dies ist die Standardabweichung der vorgeschlagenen Stichprobe.

"Die Größe" ist ein Argument, das die Größe der Stichprobe bestimmt.

Alle Argumente für diesen Operator sind erforderlich.

Funktion VERTRAUEN hat genau die gleichen Argumente und Möglichkeiten wie die vorherige. Seine Syntax ist:

VERTRAUEN(alpha, standard_dev, größe)

Wie Sie sehen können, liegen die Unterschiede nur im Namen des Betreibers. Diese Funktion wurde aus Kompatibilitätsgründen in Excel 2010 und neueren Versionen in einer speziellen Kategorie beibehalten. "Kompatibilität". In Versionen von Excel 2007 und früher ist es in der Hauptgruppe der statistischen Operatoren vorhanden.

Die Grenze des Konfidenzintervalls wird mit der Formel der folgenden Form bestimmt:

X+(-) VERTRAUEN NORM

Woher X ist der Stichprobenmittelwert, der sich in der Mitte des ausgewählten Bereichs befindet.

Sehen wir uns nun anhand eines konkreten Beispiels an, wie das Konfidenzintervall berechnet wird. Es wurden 12 Tests durchgeführt, die zu unterschiedlichen Ergebnissen führten, die in der Tabelle aufgeführt sind. Das ist unsere Gesamtheit. Die Standardabweichung beträgt 8. Wir müssen das Konfidenzintervall auf dem Konfidenzniveau von 97 % berechnen.

  1. Wählen Sie die Zelle aus, in der das Ergebnis der Datenverarbeitung angezeigt werden soll. Klicken Sie auf die Schaltfläche "Funktion einfügen".
  2. Erscheint Funktionsassistent. Gehen Sie zur Kategorie "Statistik" und markieren Sie den Namen "VERTRAUEN.NORM". Danach klicken Sie auf die Schaltfläche OK.
  3. Das Argumente-Fenster öffnet sich. Seine Felder entsprechen natürlich den Namen der Argumente.
    Setzen Sie den Cursor auf das erste Feld - "Alpha". Hier sollten wir das Signifikanzniveau angeben. Wie wir uns erinnern, liegt unser Vertrauensgrad bei 97 %. Gleichzeitig haben wir gesagt, dass es so berechnet wird:

    (1-Vertrauensstufe)/100

    Das heißt, durch Ersetzen des Werts erhalten wir:

    Durch einfache Berechnungen finden wir heraus, dass das Argument "Alpha" gleich 0,03 . Geben Sie diesen Wert in das Feld ein.

    Wie Sie wissen, ist die Standardabweichung gleich 8 . Daher im Gelände "Standardabweichung" notieren Sie sich einfach diese Nummer.

    Auf dem Feld "Die Größe" Sie müssen die Anzahl der Elemente der durchgeführten Tests eingeben. Wie wir uns erinnern, sie 12 . Aber um die Formel zu automatisieren und sie nicht jedes Mal zu bearbeiten, wenn ein neuer Test durchgeführt wird, setzen wir diesen Wert nicht auf eine gewöhnliche Zahl, sondern mit dem Operator ÜBERPRÜFEN. Also setzen wir den Cursor in das Feld "Die Größe", und klicken Sie dann auf das Dreieck, das sich links neben der Bearbeitungsleiste befindet.

    Eine Liste der zuletzt verwendeten Funktionen wird angezeigt. Wenn der Betreiber ÜBERPRÜFEN kürzlich von Ihnen verwendet wurde, sollte es auf dieser Liste stehen. In diesem Fall müssen Sie nur auf den Namen klicken. Andernfalls, wenn Sie es nicht finden, gehen Sie zum Punkt "Mehr Funktionen...".

  4. Kommt uns schon bekannt vor Funktionsassistent. Zurück zur Gruppe "Statistik". Dort wählen wir den Namen aus "ÜBERPRÜFEN". Klicken Sie auf die Schaltfläche OK.
  5. Das Argumentfenster für den obigen Operator wird angezeigt. Diese Funktion wurde entwickelt, um die Anzahl der Zellen im angegebenen Bereich zu berechnen, die numerische Werte enthalten. Seine Syntax ist die folgende:

    COUNT(Wert1, Wert2,…)

    Argumentgruppe "Werte" ist ein Verweis auf den Bereich, in dem Sie die Anzahl der mit numerischen Daten gefüllten Zellen berechnen möchten. Insgesamt kann es bis zu 255 solcher Argumente geben, aber in unserem Fall brauchen wir nur eines.

    Setzen Sie den Cursor in das Feld "Wert1" und wählen Sie bei gedrückter linker Maustaste den Bereich auf dem Blatt aus, der unsere Bevölkerung enthält. Dann wird seine Adresse im Feld angezeigt. Klicken Sie auf die Schaltfläche OK.

  6. Danach führt die Anwendung die Berechnung durch und zeigt das Ergebnis in der Zelle an, in der es sich selbst befindet. In unserem speziellen Fall sah die Formel so aus:

    VERTRAUEN NORM(0.03,8,ZAHL(B2:B13))

    Das Gesamtergebnis der Berechnungen war 5,011609 .

  7. Aber das ist noch nicht alles. Wie wir uns erinnern, wird die Grenze des Konfidenzintervalls berechnet, indem der durchschnittliche Stichprobenwert des Berechnungsergebnisses addiert und subtrahiert wird VERTRAUEN NORM. Auf diese Weise werden jeweils die rechte und die linke Grenze des Konfidenzintervalls berechnet. Der Stichprobenmittelwert selbst kann mit dem Operator berechnet werden DURCHSCHNITT.

    Dieser Operator dient zur Berechnung des arithmetischen Mittels des ausgewählten Zahlenbereichs. Es hat die folgende ziemlich einfache Syntax:

    DURCHSCHNITT(Zahl1, Zahl2,…)

    Streit "Anzahl" kann entweder ein einzelner numerischer Wert oder ein Verweis auf Zellen oder sogar ganze Bereiche sein, die sie enthalten.

    Wählen Sie also die Zelle aus, in der die Berechnung des Durchschnittswerts angezeigt werden soll, und klicken Sie auf die Schaltfläche "Funktion einfügen".

  8. öffnet Funktionsassistent. Zurück zur Kategorie "Statistik" und wählen Sie einen Namen aus der Liste aus "DURCHSCHNITT". Klicken Sie wie immer auf den Button OK.
  9. Das Argumente-Fenster wird gestartet. Setzen Sie den Cursor in das Feld "Nummer 1" und mit gedrückter linker Maustaste den gesamten Wertebereich auswählen. Nachdem die Koordinaten im Feld angezeigt werden, klicken Sie auf die Schaltfläche OK.
  10. Danach DURCHSCHNITT gibt das Ergebnis der Berechnung an ein Blattelement aus.
  11. Wir berechnen die rechte Grenze des Konfidenzintervalls. Wählen Sie dazu eine separate Zelle aus und setzen Sie das Zeichen «=» und fügen Sie den Inhalt der Blattelemente hinzu, in denen sich die Ergebnisse der Berechnung von Funktionen befinden DURCHSCHNITT und VERTRAUEN NORM. Um die Berechnung durchzuführen, drücken Sie die Taste Eingeben. In unserem Fall haben wir die folgende Formel erhalten:

    Berechnungsergebnis: 6,953276

  12. Auf die gleiche Weise berechnen wir die linke Grenze des Konfidenzintervalls, nur diesmal aus dem Ergebnis der Berechnung DURCHSCHNITT Subtrahieren Sie das Ergebnis der Berechnung des Operators VERTRAUEN NORM. Es stellt sich die Formel für unser Beispiel folgender Art heraus:

    Berechnungsergebnis: -3,06994

  13. Wir haben versucht, alle Schritte zur Berechnung des Konfidenzintervalls im Detail zu beschreiben, also haben wir jede Formel im Detail beschrieben. Aber Sie können alle Aktionen in einer Formel kombinieren. Die Berechnung der rechten Grenze des Konfidenzintervalls kann wie folgt geschrieben werden:

    DURCHSCHNITT(B2:B13)+VERTRAUEN(0.03,8,ZAHL(B2:B13))

  14. Eine ähnliche Berechnung des linken Randes würde wie folgt aussehen:

    AVERAGE(B2:B13)-CONFIDENCE.NORM(0.03,8,COUNT(B2:B13))

Methode 2: TRUST.STUDENT-Funktion

Darüber hinaus gibt es in Excel eine weitere Funktion, die mit der Berechnung des Konfidenzintervalls zusammenhängt - VERTRAUEN.STUDENT. Er erscheint erst seit Excel 2010. Dieser Operator führt die Berechnung des Konfidenzintervalls der Grundgesamtheit anhand der Student-Verteilung durch. Es ist sehr praktisch, es in dem Fall zu verwenden, wenn die Varianz und dementsprechend die Standardabweichung unbekannt sind. Die Operatorsyntax lautet:

VERTRAUEN.STUDENT(alpha,standard_dev,größe)

Wie Sie sehen können, blieben die Namen der Operatoren in diesem Fall unverändert.

Sehen wir uns an, wie die Grenzen des Konfidenzintervalls mit einer unbekannten Standardabweichung am Beispiel derselben Population berechnet werden, die wir in der vorherigen Methode betrachtet haben. Das Vertrauensniveau, wie beim letzten Mal, werden wir 97% nehmen.

  1. Wählen Sie die Zelle aus, in der die Berechnung durchgeführt werden soll. Klicken Sie auf die Schaltfläche "Funktion einfügen".
  2. Im geöffneten Funktionsassistent gehe zur Kategorie "Statistik". Wähle einen Namen "VERTRAUEN.STUDENT". Klicken Sie auf die Schaltfläche OK.
  3. Das Argumentfenster für den angegebenen Operator wird gestartet.

    Auf dem Feld "Alpha", da das Konfidenzniveau 97 % beträgt, schreiben wir die Zahl auf 0,03 . Beim zweiten Mal werden wir nicht auf die Prinzipien der Berechnung dieses Parameters eingehen.

    Setzen Sie danach den Cursor in das Feld "Standardabweichung". Diesmal ist uns dieser Indikator unbekannt und muss berechnet werden. Dies geschieht mit einer speziellen Funktion - STABW.B. Um das Fenster dieses Operators aufzurufen, klicken Sie auf das Dreieck links neben der Bearbeitungsleiste. Wenn wir den gewünschten Namen nicht in der sich öffnenden Liste finden, gehen Sie zum Artikel "Mehr Funktionen...".

  4. läuft Funktionsassistent. Wechsel zur Kategorie "Statistik" und markieren Sie den Namen "STABW.B". Klicken Sie dann auf die Schaltfläche OK.
  5. Das Argumente-Fenster öffnet sich. Bedieneraufgabe STABW.B ist die Definition der Standardabweichung bei der Stichprobenziehung. Seine Syntax sieht so aus:

    STABW.V(Zahl1,Zahl2,…)

    Es ist leicht zu erraten, dass das Argument "Anzahl" ist die Adresse des Auswahlelements. Wenn die Auswahl in einem einzelnen Array platziert wird, können Sie mit nur einem Argument einen Link zu diesem Bereich angeben.

    Setzen Sie den Cursor in das Feld "Nummer 1" und wie immer mit gedrückter linker Maustaste das Set auswählen. Nachdem die Koordinaten im Feld sind, beeilen Sie sich nicht, die Taste zu drücken OK denn das Ergebnis wird falsch sein. Zuerst müssen wir zum Fenster mit den Operatorargumenten zurückkehren VERTRAUEN.STUDENT um das letzte Argument zu machen. Klicken Sie dazu in der Bearbeitungsleiste auf den entsprechenden Namen.

  6. Das Argumentfenster der bereits bekannten Funktion öffnet sich wieder. Setzen Sie den Cursor in das Feld "Die Größe". Klicken Sie erneut auf das uns bereits bekannte Dreieck, um zur Auswahl der Operatoren zu gelangen. Wie Sie verstehen, brauchen wir einen Namen "ÜBERPRÜFEN". Da wir diese Funktion in den Berechnungen der vorherigen Methode verwendet haben, ist sie in dieser Liste vorhanden, also klicken Sie einfach darauf. Wenn Sie es nicht finden, folgen Sie dem in der ersten Methode beschriebenen Algorithmus.
  7. Einstieg in das Argumente-Fenster ÜBERPRÜFEN, setzen Sie den Cursor in das Feld "Nummer 1" und mit gedrückter Maustaste die Sammlung auswählen. Klicken Sie dann auf die Schaltfläche OK.
  8. Danach berechnet das Programm den Wert des Konfidenzintervalls und zeigt ihn an.
  9. Um die Grenzen zu bestimmen, müssen wir erneut den Stichprobenmittelwert berechnen. Aber angesichts dessen, dass der Berechnungsalgorithmus die Formel verwendet DURCHSCHNITT die gleiche wie bei der vorherigen Methode, und selbst das Ergebnis hat sich nicht geändert, werden wir darauf nicht ein zweites Mal im Detail eingehen.
  10. Aufsummieren der Ergebnisse der Berechnung DURCHSCHNITT und VERTRAUEN.STUDENT erhalten wir die rechte Grenze des Konfidenzintervalls.
  11. Subtrahieren von den Berechnungsergebnissen des Operators DURCHSCHNITT Berechnungsergebnis VERTRAUEN.STUDENT, haben wir die linke Grenze des Konfidenzintervalls.
  12. Wenn die Berechnung in einer Formel geschrieben ist, sieht die Berechnung der rechten Grenze in unserem Fall folgendermaßen aus:

    DURCHSCHNITT(B2:B13)+STUDENTENVERTRAUEN(0.03,STDV(B2:B13),COUNT(B2:B13))

  13. Dementsprechend sieht die Formel zur Berechnung des linken Randes folgendermaßen aus:

    DURCHSCHNITT(B2:B13)-STUDENTENVERTRAUEN(0.03,STDV(B2:B13),COUNT(B2:B13))

Wie Sie sehen können, ermöglichen die Tools des Excel-Programms, die Berechnung des Konfidenzintervalls und seiner Grenzen erheblich zu vereinfachen. Für diese Zwecke werden getrennte Operatoren für Stichproben verwendet, deren Varianz bekannt und unbekannt ist.

Und andere.Alle von ihnen sind Schätzungen ihrer theoretischen Gegenstücke, die erhalten werden könnten, wenn es keine Stichprobe, sondern die allgemeine Bevölkerung gäbe. Aber leider ist die allgemeine Bevölkerung sehr teuer und oft nicht verfügbar.

Das Konzept der Intervallschätzung

Jede Beispielschätzung hat eine gewisse Streuung, weil ist eine Zufallsvariable, die von den Werten in einer bestimmten Probe abhängt. Daher sollte man für zuverlässigere statistische Rückschlüsse nicht nur die Punktschätzung kennen, sondern auch das Intervall, was mit hoher Wahrscheinlichkeit der Fall ist γ (Gamma) deckt den geschätzten Indikator ab θ (Theta).

Formal sind das zwei solche Werte (Statistik) T1(X) und T2(X), was T1< T 2 , für die bei einer bestimmten Wahrscheinlichkeit γ Bedingung ist erfüllt:

Kurz gesagt, es ist wahrscheinlich γ oder mehr liegt der wahre Wert zwischen den Punkten T1(X) und T2(X), die als untere und obere Grenze bezeichnet werden Konfidenzintervall.

Eine der Bedingungen für die Konstruktion von Konfidenzintervallen ist ihre maximale Enge, d.h. es sollte so kurz wie möglich sein. Verlangen ist ganz natürlich, weil. der Forscher versucht, den Befund des gewünschten Parameters genauer zu lokalisieren.

Daraus folgt, dass das Konfidenzintervall die maximalen Wahrscheinlichkeiten der Verteilung abdecken sollte. und die Partitur selbst im Mittelpunkt stehen.

Das heißt, die Wahrscheinlichkeit der Abweichung (des wahren Indikators von der Schätzung) nach oben ist gleich der Wahrscheinlichkeit der Abweichung nach unten. Zu beachten ist auch, dass bei schiefen Verteilungen das rechte Intervall ungleich dem linken Intervall ist.

Die obige Abbildung zeigt deutlich, dass das Intervall umso größer ist, je größer das Konfidenzniveau ist – eine direkte Beziehung.

Dies war eine kleine Einführung in die Theorie der Intervallschätzung unbekannter Parameter. Lassen Sie uns weitergehen, um Konfidenzgrenzen für die mathematische Erwartung zu finden.

Konfidenzintervall für mathematische Erwartung

Wenn die Originaldaten über verteilt sind, dann ist der Durchschnitt ein normaler Wert. Dies folgt aus der Regel, dass eine Linearkombination von Normalwerten auch eine Normalverteilung hat. Daher könnten wir zur Berechnung der Wahrscheinlichkeiten den mathematischen Apparat des Normalverteilungsgesetzes verwenden.

Dies erfordert jedoch die Kenntnis von zwei Parametern – dem Erwartungswert und der Varianz, die normalerweise nicht bekannt sind. Anstelle von Parametern (arithmetisches Mittel und ) können Sie natürlich auch Schätzwerte verwenden, aber dann ist die Verteilung des Mittelwerts nicht ganz normal, sondern etwas abgeflacht. Der Bürger William Gosset aus Irland bemerkte diese Tatsache geschickt, als er seine Entdeckung in der Märzausgabe 1908 von Biometrica veröffentlichte. Aus Geheimhaltungsgründen unterschrieb Gosset mit Student. So erschien die Student-t-Verteilung.

Die von K. Gauss bei der Analyse von Fehlern in astronomischen Beobachtungen verwendete Normalverteilung von Daten ist jedoch im irdischen Leben äußerst selten und es ist ziemlich schwierig, dies festzustellen (für eine hohe Genauigkeit werden etwa 2.000 Beobachtungen benötigt). Daher ist es am besten, die Normalitätsannahme fallen zu lassen und Methoden zu verwenden, die nicht von der Verteilung der Originaldaten abhängen.

Es stellt sich die Frage: Wie ist die Verteilung des arithmetischen Mittels, wenn es aus den Daten einer unbekannten Verteilung berechnet wird? Die Antwort gibt die in der Wahrscheinlichkeitstheorie bekannte Zentraler Grenzwertsatz(CPT). In der Mathematik gibt es mehrere Versionen davon (die Formulierungen wurden im Laufe der Jahre verfeinert), aber alle laufen grob gesagt auf die Aussage hinaus, dass die Summe einer großen Anzahl unabhängiger Zufallsvariablen dem Gesetz der Normalverteilung gehorcht.

Bei der Berechnung des arithmetischen Mittels wird die Summe der Zufallsvariablen verwendet. Daraus ergibt sich, dass das arithmetische Mittel eine Normalverteilung hat, bei der der Erwartungswert der Erwartungswert der Originaldaten ist und die Varianz .

Kluge Leute wissen, wie man das CLT beweist, aber wir werden dies mit Hilfe eines in Excel durchgeführten Experiments überprüfen. Lassen Sie uns eine Stichprobe von 50 gleichmäßig verteilten Zufallsvariablen simulieren (unter Verwendung der Excel-Funktion RANDOMBETWEEN). Dann machen wir 1000 solcher Stichproben und berechnen für jede das arithmetische Mittel. Schauen wir uns ihre Verteilung an.

Es ist ersichtlich, dass die Verteilung des Durchschnitts dem normalen Gesetz nahe kommt. Wenn das Volumen der Proben und ihre Anzahl noch größer gemacht werden, wird die Ähnlichkeit noch besser.

Nachdem wir uns nun von der Gültigkeit des CLT überzeugt haben, können wir mit Hilfe die Konfidenzintervalle für den arithmetischen Mittelwert berechnen, die mit einer gegebenen Wahrscheinlichkeit den wahren Mittelwert bzw. mathematischen Erwartungswert abdecken.

Um die Ober- und Untergrenze festzulegen, ist es erforderlich, die Parameter der Normalverteilung zu kennen. In der Regel sind sie es nicht, daher werden Schätzungen verwendet: arithmetisches Mittel und Stichprobenvarianz. Auch dieses Verfahren liefert nur für große Stichproben eine gute Annäherung. Bei kleinen Stichproben wird oft empfohlen, die Student-Verteilung zu verwenden. Glauben Sie nicht! Die Student-Verteilung für den Mittelwert tritt nur auf, wenn die Originaldaten eine Normalverteilung aufweisen, d. h. fast nie. Daher ist es besser, gleich die Mindestmesslatte für die benötigte Datenmenge zu setzen und asymptotisch korrekte Methoden einzusetzen. Sie sagen, 30 Beobachtungen sind genug. Nehmen Sie 50 - Sie können nichts falsch machen.

T 1.2 sind die unteren und oberen Grenzen des Konfidenzintervalls

– arithmetisches Mittel der Stichprobe

s0– Stichprobenstandardabweichung (unverzerrt)

n – Stichprobengröße

γ – Konfidenzniveau (normalerweise gleich 0,9, 0,95 oder 0,99)

cγ =Φ -1 ((1+γ)/2) ist der Kehrwert der Standardnormalverteilungsfunktion. Vereinfacht ausgedrückt ist dies die Anzahl der Standardfehler vom arithmetischen Mittel zur Unter- bzw. Obergrenze (die angegebenen drei Wahrscheinlichkeiten entsprechen den Werten 1,64, 1,96 und 2,58).

Die Essenz der Formel besteht darin, dass das arithmetische Mittel genommen wird und dann ein bestimmter Betrag davon beiseite gelegt wird ( mit γ) Standardfehler ( s 0 /√n). Alles ist bekannt, nimm es und zähle.

Vor dem Masseneinsatz von PCs verwendeten sie . Sie werden immer noch verwendet, aber es ist effizienter, auf vorgefertigte Excel-Formeln zurückzugreifen. Alle Elemente aus der obigen Formel ( , und ) können einfach in Excel berechnet werden. Es gibt aber auch eine fertige Formel zur Berechnung des Konfidenzintervalls - VERTRAUEN NORM. Seine Syntax ist die folgende.

VERTRAUEN NORM(alpha, standard_dev, Größe)

Alpha– Signifikanzniveau oder Konfidenzniveau, das in der obigen Notation gleich 1-γ ist, d.h. die Wahrscheinlichkeit, dass die mathematischedie Erwartung liegt außerhalb des Konfidenzintervalls. Bei einem Konfidenzniveau von 0,95 beträgt Alpha 0,05 und so weiter.

standard_aus ist die Standardabweichung der Stichprobendaten. Sie müssen den Standardfehler nicht berechnen, Excel dividiert durch die Wurzel von n.

die Größe– Stichprobenumfang (n).

Das Ergebnis der Funktion CONFIDENCE.NORM ist der zweite Term aus der Formel zur Berechnung des Konfidenzintervalls, d. h. Halbzeit. Dementsprechend sind die unteren und oberen Punkte der Durchschnitt ± der erhaltene Wert.

Somit ist es möglich, einen universellen Algorithmus zur Berechnung von Konfidenzintervallen für den arithmetischen Mittelwert aufzubauen, der nicht von der Verteilung der Ausgangsdaten abhängt. Der Preis für Universalität ist ihre asymptotische Natur, d.h. die Notwendigkeit, relativ große Stichproben zu verwenden. Im Zeitalter der modernen Technologie ist es jedoch normalerweise nicht schwierig, die richtige Menge an Daten zu sammeln.

Testen statistischer Hypothesen mit einem Konfidenzintervall

(Modul 111)

Eines der Hauptprobleme, die in der Statistik gelöst werden, ist. Kurz gesagt, seine Essenz ist dies. Beispielsweise wird angenommen, dass die Erwartung der allgemeinen Bevölkerung einem bestimmten Wert entspricht. Dann wird die Verteilung der Stichprobenmittelwerte konstruiert, die mit einer gegebenen Erwartung beobachtet werden kann. Als nächstes schauen wir uns an, wo in dieser bedingten Verteilung der echte Durchschnitt liegt. Wenn es die zulässigen Grenzen überschreitet, ist das Auftreten eines solchen Durchschnitts sehr unwahrscheinlich, und bei einer einzigen Wiederholung des Experiments ist es fast unmöglich, was der aufgestellten Hypothese widerspricht, die erfolgreich abgelehnt wird. Wenn der Durchschnitt das kritische Niveau nicht überschreitet, wird die Hypothese nicht verworfen (aber auch nicht bewiesen!).

Mit Hilfe von Konfidenzintervallen, in unserem Fall für den Erwartungswert, können Sie also auch einige Hypothesen testen. Es ist sehr einfach zu tun. Angenommen, das arithmetische Mittel einer Stichprobe ist 100. Es wird die Hypothese getestet, dass der erwartete Wert beispielsweise 90 beträgt. Das heißt, wenn wir die Frage primitiv stellen, klingt es so: Kann es das mit dem wahren Wert des sein? Durchschnitt gleich 90, der beobachtete Durchschnitt war 100?

Zur Beantwortung dieser Frage sind zusätzliche Informationen zur Standardabweichung und zum Stichprobenumfang erforderlich. Nehmen wir an, die Standardabweichung beträgt 30 und die Anzahl der Beobachtungen 64 (um die Wurzel einfach zu ziehen). Dann beträgt der Standardfehler des Mittelwerts 30/8 oder 3,75. Um das 95-%-Konfidenzintervall zu berechnen, müssen Sie zwei Standardfehler auf beiden Seiten des Mittelwerts (genauer 1,96) beiseite legen. Das Konfidenzintervall beträgt ungefähr 100 ± 7,5 oder 92,5 bis 107,5.

Weitere Argumentation ist wie folgt. Wenn der getestete Wert in das Konfidenzintervall fällt, dann widerspricht er nicht der Hypothese, da innerhalb der Grenzen zufälliger Schwankungen (mit einer Wahrscheinlichkeit von 95 %). Wenn der getestete Punkt außerhalb des Konfidenzintervalls liegt, ist die Wahrscheinlichkeit eines solchen Ereignisses sehr gering, in jedem Fall unter dem akzeptablen Niveau. Daher wird die Hypothese als widersprüchlich zu den beobachteten Daten zurückgewiesen. In unserem Fall liegt die Erwartungshypothese außerhalb des Konfidenzintervalls (der getestete Wert von 90 ist nicht im Intervall von 100 ± 7,5 enthalten), daher sollte sie verworfen werden. Zur Beantwortung der obigen primitiven Frage sollte man sagen: Nein, das kann es jedenfalls nicht, das kommt äußerst selten vor. Oft deutet dies auf eine bestimmte Wahrscheinlichkeit einer fehlerhaften Ablehnung der Hypothese hin (p-Niveau) und nicht auf ein bestimmtes Niveau, nach dem das Konfidenzintervall gebildet wurde, aber dazu ein anderes Mal mehr.

Wie Sie sehen können, ist es nicht schwierig, ein Konfidenzintervall für den Mittelwert (oder die mathematische Erwartung) zu erstellen. Die Hauptsache ist, die Essenz zu fangen, und dann wird es gehen. In der Praxis verwenden die meisten das 95-%-Konfidenzintervall, das auf beiden Seiten des Mittelwerts etwa zwei Standardfehler breit ist.

Das ist alles für jetzt. Alles Gute!

Aus diesem Artikel erfahren Sie:

    Was Konfidenzintervall?

    Was ist der Sinn 3-Sigma-Regeln?

    Wie kann dieses Wissen in die Praxis umgesetzt werden?

Heutzutage, aufgrund einer Fülle von Informationen, die mit einem großen Sortiment an Produkten, Verkaufsrichtungen, Mitarbeitern, Aktivitäten usw. Es ist schwer, das Wichtigste herauszupicken, die es vor allem wert ist, beachtet und bewältigt zu werden. Definition Konfidenzintervall und Analyse, über die Grenzen der tatsächlichen Werte hinauszugehen - eine Technik, die helfen Ihnen, Situationen zu erkennen, Trends beeinflussen. Sie werden in der Lage sein, positive Faktoren zu entwickeln und den Einfluss negativer zu reduzieren. Diese Technologie wird in vielen namhaften Weltunternehmen eingesetzt.

Es gibt sog Warnungen", welche Manager informieren besagt, dass der nächste Wert in eine bestimmte Richtung geht ging darüber hinaus Konfidenzintervall. Was bedeutet das? Dies ist ein Signal dafür, dass ein nicht standardmäßiges Ereignis aufgetreten ist, das den bestehenden Trend in diese Richtung ändern kann. Das ist das Zeichen dazu um es zu sortieren in der Situation und verstehen, was sie beeinflusst hat.

Betrachten Sie beispielsweise mehrere Situationen. Wir haben die Verkaufsprognose mit Prognosegrenzen für 100 Warenartikel für 2011 nach Monaten und tatsächlichen Verkäufen im März berechnet:

  1. Für „Sonnenblumenöl“ durchbrachen sie die obere Grenze der Prognose und fielen nicht in das Konfidenzintervall.
  2. Für „Trockenhefe“ wurde die untere Grenze der Prognose überschritten.
  3. Bei „Oatmeal Porridge“ wurde die Obergrenze durchbrochen.

Bei den restlichen Waren lagen die tatsächlichen Verkäufe innerhalb der vorgegebenen Prognosegrenzen. Jene. ihre Verkäufe entsprachen den Erwartungen. Also identifizierten wir 3 Produkte, die über die Grenzen hinausgingen, und begannen herauszufinden, was das Überschreiten der Grenzen beeinflusste:

  1. Mit Sonnenblumenöl sind wir in ein neues Handelsnetz eingetreten, was uns zusätzliches Verkaufsvolumen beschert hat, was dazu geführt hat, dass wir die Obergrenze überschritten haben. Für dieses Produkt lohnt es sich, die Prognose bis Ende des Jahres unter Berücksichtigung der Prognose für den Verkauf an diese Kette neu zu berechnen.
  2. Bei Dry Yeast blieb das Auto beim Zoll hängen, und es gab innerhalb von 5 Tagen einen Mangel, der sich auf den Umsatzrückgang und das Überschreiten der unteren Grenze auswirkte. Es kann sich lohnen, herauszufinden, was die Ursache verursacht hat, und zu versuchen, diese Situation nicht zu wiederholen.
  3. Für Oatmeal wurde eine Verkaufsaktion gestartet, die zu einer deutlichen Umsatzsteigerung und zu einer Überschreitung der Prognose führte.

Wir haben 3 Faktoren identifiziert, die das Überschießen der Prognose beeinflusst haben. Davon kann es im Leben noch viel mehr geben.Um die Genauigkeit von Prognosen und Planungen zu verbessern, die Faktoren, die dazu führen, dass die tatsächlichen Verkäufe über die Prognose hinausgehen können, lohnt es sich, Prognosen und Pläne für sie gesondert hervorzuheben und zu erstellen. Berücksichtigen Sie dann deren Auswirkungen auf die Hauptumsatzprognose. Sie können auch regelmäßig die Auswirkungen dieser Faktoren bewerten und die Situation zum Besseren verändern durch Verringerung des Einflusses negativer und Erhöhung des Einflusses positiver Faktoren.

Mit einem Konfidenzintervall können wir:

  1. Ziele hervorheben, die es wert sind, beachtet zu werden, weil In diesen Bereichen sind Ereignisse eingetreten, die Auswirkungen haben können Trendwende.
  2. Faktoren bestimmen das macht tatsächlich einen unterschied.
  3. Akzeptieren gewichtete Entscheidung(z.B. über die Beschaffung, bei der Planung etc.).

Schauen wir uns nun anhand eines Beispiels an, was ein Konfidenzintervall ist und wie man es in Excel berechnet.

Was ist ein Konfidenzintervall?

Das Konfidenzintervall sind die prognostizierten Grenzen (obere und untere), innerhalb derer mit einer gegebenen Wahrscheinlichkeit (Sigma) erhalten Sie die tatsächlichen Werte.

Jene. Wir berechnen die Prognose - dies ist unser Hauptmaßstab, aber wir verstehen, dass die tatsächlichen Werte unserer Prognose wahrscheinlich nicht zu 100% entsprechen. Und die Frage stellt sich inwieweit kann tatsächliche Werte erhalten, wenn der aktuelle Trend anhält? Und diese Frage wird uns helfen, sie zu beantworten Berechnung des Konfidenzintervalls, d.h. - Ober- und Untergrenze der Prognose.

Was ist ein gegebenes Wahrscheinlichkeits-Sigma?

Beim Rechnen Konfidenzintervall können wir Wahrscheinlichkeit einstellen trifft tatsächliche Werte innerhalb der vorgegebenen Prognosegrenzen. Wie kann man es machen? Dazu setzen wir den Wert von Sigma und, wenn Sigma gleich ist:

    3 Sigma- Dann beträgt die Wahrscheinlichkeit, den nächsten tatsächlichen Wert im Konfidenzintervall zu erreichen, 99,7 % oder 300 zu 1, oder es besteht eine Wahrscheinlichkeit von 0,3 %, die Grenzen zu überschreiten.

    2 Sigma- dann ist die Wahrscheinlichkeit, den nächsten Wert innerhalb der Grenzen zu treffen, ≈ 95,5 %, d.h. Die Quoten liegen bei etwa 20 zu 1, oder es besteht eine 4,5-prozentige Chance, die Grenzen zu überschreiten.

    1 Sigma- dann ist die Wahrscheinlichkeit ≈ 68,3%, d.h. die Wahrscheinlichkeit liegt bei etwa 2 zu 1, oder es besteht eine Wahrscheinlichkeit von 31,7 %, dass der nächste Wert außerhalb des Konfidenzintervalls liegt.

Wir haben formuliert 3-Sigma-Regel,was das sagt Trefferwahrscheinlichkeit ein weiterer zufälliger Wert in das Konfidenzintervall mit einem bestimmten Wert drei Sigma ist 99,7%.

Der große russische Mathematiker Tschebyschew hat ein Theorem bewiesen, dass es eine 10-prozentige Chance gibt, die Grenzen einer Prognose mit einem gegebenen Wert von drei Sigma zu überschreiten. Jene. Die Wahrscheinlichkeit, in das 3-Sigma-Konfidenzintervall zu fallen, beträgt mindestens 90%, während der Versuch, die Prognose und ihre Grenzen „mit dem Auge“ zu berechnen, mit viel größeren Fehlern behaftet ist.

Wie kann man das Konfidenzintervall in Excel unabhängig berechnen?

Betrachten wir die Berechnung des Konfidenzintervalls in Excel (also der Ober- und Untergrenze der Prognose) anhand eines Beispiels. Wir haben eine Zeitreihe - Verkäufe nach Monaten für 5 Jahre. Siehe angehängte Datei.

Um die Grenzen der Prognose zu berechnen, berechnen wir:

  1. Verkaufsprognose().
  2. Sigma - Standardabweichung Prognosemodelle aus tatsächlichen Werten.
  3. Drei Sigma.
  4. Konfidenzintervall.

1. Verkaufsprognose.

=(RC[-14] (Daten in Zeitreihen)-RC[-1] (Modellwert))^2(Quadrat)


3. Summiere für jeden Monat die Abweichungswerte aus Stufe 8 Sum((Xi-Ximod)^2), d.h. Lassen Sie uns Januar, Februar... für jedes Jahr zusammenzählen.

Verwenden Sie dazu die Formel =SUMMEWENN()

SUMIF(Array mit Anzahl der Perioden innerhalb des Zyklus (für Monate von 1 bis 12); Verweis auf die Nummer der Periode im Zyklus; Verweis auf ein Array mit Quadraten der Differenz zwischen den Anfangsdaten und den Werten der Perioden)


4. Berechnen Sie die Standardabweichung für jede Periode im Zyklus von 1 bis 12 (Stufe 10 in der angehängten Datei).

Dazu ziehen wir aus dem in Stufe 9 berechneten Wert die Wurzel und dividieren durch die Anzahl der Perioden in diesem Zyklus minus 1 = ROOT((Sum(Xi-Ximod)^2/(n-1))

Lassen Sie uns Formeln in Excel verwenden =ROOT(R8 (Verweis auf (Summe(Xi-Ximod)^2)/(ZÄHLENWENN($O$8:$O$67 (Referenz auf ein Array mit Zyklusnummern); O8 (Verweis auf eine bestimmte Zyklusnummer, die wir im Array berücksichtigen))-1))

Mit der Excel-Formel = ZÄHLENWENN Wir zählen die Zahl n


Durch die Berechnung der Standardabweichung der tatsächlichen Daten aus dem Prognosemodell haben wir den Sigma-Wert für jeden Monat erhalten - Stufe 10 in der angehängten Datei .

3. Berechnen Sie 3 Sigma.

Auf Stufe 11 stellen wir die Anzahl der Sigmas ein – in unserem Beispiel „3“ (Stufe 11 in der angehängten Datei):

Auch praktische Sigma-Werte:

1,64 Sigma – 10 % Chance, das Limit zu überschreiten (1 Chance von 10);

1,96 Sigma – 5 % Chance, die Grenzen zu überschreiten (1 Chance von 20);

2,6 Sigma – 1 % Chance, die Grenzen zu überschreiten (1 zu 100 Chance).

5) Wir berechnen drei Sigma, dazu multiplizieren wir die „Sigma“-Werte für jeden Monat mit „3“.

3. Bestimmen Sie das Konfidenzintervall.

  1. Obere Prognosegrenze- Umsatzprognose unter Berücksichtigung von Wachstum und Saisonalität + (plus) 3 Sigma;
  2. Untere Prognosegrenze- Umsatzprognose unter Berücksichtigung von Wachstum und Saisonalität - (minus) 3 Sigma;

Zur bequemen Berechnung des Konfidenzintervalls für einen langen Zeitraum (siehe angehängte Datei) verwenden wir die Excel-Formel =Y8+SVERWEIS(W8;$U$8:$V$19;2;0), wo

Y8- Verkaufsprognose;

W8- die Nummer des Monats, für den wir den Wert von 3 Sigma nehmen;

Jene. Obere Prognosegrenze= "Verkaufsprognose" + "3 Sigma" (im Beispiel SVERWEIS(Monatsnummer; Tabelle mit 3 Sigmawerten; Spalte, aus der wir den Sigmawert extrahieren, der der Monatsnummer in der entsprechenden Zeile entspricht; 0)).

Untere Prognosegrenze= "Umsatzprognose" minus "3 Sigma".

Also haben wir das Konfidenzintervall in Excel berechnet.

Jetzt haben wir eine Prognose und einen Bereich mit Grenzen, innerhalb dessen die tatsächlichen Werte mit einer bestimmten Wahrscheinlichkeit sigma liegen werden.

In diesem Artikel haben wir uns angesehen, was Sigma und die Drei-Sigma-Regel sind, wie man ein Konfidenzintervall bestimmt und wofür Sie diese Technik in der Praxis verwenden können.

Genaue Prognosen und Erfolg für Sie!

Wie Forecast4AC PRO kann Ihnen dabei helfenbei der Berechnung des Konfidenzintervalls?:

    Forecast4AC PRO berechnet automatisch die oberen oder unteren Prognosegrenzen für mehr als 1000 Zeitreihen gleichzeitig;

    Die Fähigkeit, die Grenzen der Prognose im Vergleich zu Prognose, Trend und tatsächlichen Verkäufen auf dem Diagramm mit einem Tastendruck zu analysieren;

Im Programm Forcast4AC PRO ist es möglich, den Sigma-Wert von 1 bis 3 einzustellen.

Begleiten Sie uns!

Laden Sie kostenlose Prognose- und Business-Intelligence-Apps herunter:


  • Novo Prognose Lite- automatisch Prognoseberechnung in übertreffen.
  • 4 Analytik- ABC-XYZ-Analyse und Analyse der Emissionen in Excel.
  • QlikSense Schreibtisch und QlikViewPersonal Edition - BI-Systeme zur Datenanalyse und Visualisierung.

Testen Sie die Funktionen kostenpflichtiger Lösungen:

  • Novo Prognose PRO- Prognosen in Excel für große Datenfelder.

Häufig muss der Gutachter den Immobilienmarkt des Segments analysieren, in dem sich das Bewertungsobjekt befindet. Wenn der Markt entwickelt ist, kann es schwierig sein, den gesamten Satz präsentierter Objekte zu analysieren, daher wird eine Stichprobe von Objekten zur Analyse verwendet. Diese Stichprobe ist nicht immer homogen, manchmal ist es erforderlich, sie von Extremen zu befreien - zu hohe oder zu niedrige Marktangebote. Zu diesem Zweck wird es angewendet Konfidenzintervall. Der Zweck dieser Studie ist es, eine vergleichende Analyse zweier Methoden zur Berechnung des Konfidenzintervalls durchzuführen und die beste Berechnungsoption auszuwählen, wenn mit verschiedenen Stichproben im estimatica.pro-System gearbeitet wird.

Konfidenzintervall - berechnet auf der Grundlage der Stichprobe, das Werteintervall des Attributs, das mit bekannter Wahrscheinlichkeit den geschätzten Parameter der Allgemeinbevölkerung enthält.

Die Bedeutung der Berechnung des Konfidenzintervalls besteht darin, ein solches Intervall basierend auf den Stichprobendaten zu bilden, so dass mit einer gegebenen Wahrscheinlichkeit behauptet werden kann, dass der Wert des geschätzten Parameters in diesem Intervall liegt. Mit anderen Worten enthält das Konfidenzintervall mit einer gewissen Wahrscheinlichkeit den unbekannten Wert der geschätzten Größe. Je größer das Intervall, desto größer die Ungenauigkeit.

Zur Bestimmung des Konfidenzintervalls gibt es verschiedene Methoden. In diesem Artikel werden wir 2 Möglichkeiten betrachten:

  • durch Median und Standardabweichung;
  • durch den kritischen Wert der t-Statistik (Studenten-Koeffizient).

Phasen einer vergleichenden Analyse verschiedener Methoden zur Berechnung des KI:

1. eine Datenstichprobe bilden;

2. Wir verarbeiten es mit statistischen Methoden: Wir berechnen den Mittelwert, den Median, die Varianz usw.;

3. Wir berechnen das Konfidenzintervall auf zwei Arten;

4. Analysieren Sie die gereinigten Proben und die erhaltenen Konfidenzintervalle.

Stufe 1. Datenprobenahme

Die Stichprobe wurde mit dem System estimatica.pro gebildet. Die Stichprobe umfasste 91 Angebote zum Verkauf von 1-Zimmer-Wohnungen in der 3. Preiszone mit der Planungsart „Chruschtschow“.

Tabelle 1. Erstmuster

Der Preis von 1 qm, c.u.

Abb.1. Erstexemplar



Stufe 2. Bearbeitung des Erstmusters

Die Probenverarbeitung durch statistische Methoden erfordert die Berechnung der folgenden Werte:

1. Arithmetisches Mittel

2. Median – eine Zahl, die die Stichprobe charakterisiert: Genau die Hälfte der Stichprobenelemente ist größer als der Median, die andere Hälfte ist kleiner als der Median

(für eine Stichprobe mit einer ungeraden Anzahl von Werten)

3. Bereich - die Differenz zwischen den Höchst- und Mindestwerten in der Probe

4. Varianz – wird verwendet, um die Variation der Daten genauer abzuschätzen

5. Die Standardabweichung für die Stichprobe (im Folgenden als RMS bezeichnet) ist der häufigste Indikator für die Streuung von Anpassungswerten um das arithmetische Mittel.

6. Variationskoeffizient – ​​spiegelt den Streuungsgrad der Anpassungswerte wider

7. Oszillationskoeffizient - spiegelt die relative Schwankung der Extremwerte der Preise in der Stichprobe um den Durchschnitt wider

Tabelle 2. Statistische Indikatoren der ursprünglichen Stichprobe

Der Variationskoeffizient, der die Homogenität der Daten charakterisiert, beträgt 12,29 %, aber der Oszillationskoeffizient ist zu groß. Wir können also feststellen, dass die ursprüngliche Stichprobe nicht homogen ist, also fahren wir mit der Berechnung des Konfidenzintervalls fort.

Stufe 3. Berechnung des Konfidenzintervalls

Methode 1. Berechnung durch Median und Standardabweichung.

Das Konfidenzintervall wird wie folgt bestimmt: der Mindestwert - die Standardabweichung wird vom Median abgezogen; der Maximalwert - die Standardabweichung wird zum Median addiert.

Somit ist das Konfidenzintervall (47179 CU; 60689 CU)

Reis. 2. Werte im Konfidenzintervall 1.



Methode 2. Erstellen eines Konfidenzintervalls durch den kritischen Wert der t-Statistik (Schülerkoeffizient)

S.V. Gribovsky beschreibt in dem Buch "Mathematische Methoden zur Bewertung des Immobilienwerts" eine Methode zur Berechnung des Konfidenzintervalls durch den Student-Koeffizienten. Bei der Berechnung nach dieser Methode muss der Schätzer selbst das Signifikanzniveau ∝ festlegen, das die Wahrscheinlichkeit bestimmt, mit der das Konfidenzintervall gebildet wird. Üblicherweise werden Signifikanzniveaus von 0,1 verwendet; 0,05 und 0,01. Sie entsprechen Konfidenzwahrscheinlichkeiten von 0,9; 0,95 und 0,99. Bei dieser Methode gelten die wahren Werte des mathematischen Erwartungswerts und der Varianz als praktisch unbekannt (was bei der Lösung praktischer Bewertungsprobleme fast immer der Fall ist).

Konfidenzintervallformel:

n - Stichprobengröße;

Der kritische Wert der t-Statistik (Schülerverteilungen) mit einem Signifikanzniveau ∝, die Anzahl der Freiheitsgrade n-1, die durch spezielle Statistiktabellen oder mit MS Excel ermittelt wird (→"Statistik"→ STUDRASPOBR);

∝ - Signifikanzniveau, wir nehmen ∝=0,01.

Reis. 2. Werte innerhalb des Konfidenzintervalls 2.

Schritt 4. Analyse verschiedener Möglichkeiten zur Berechnung des Konfidenzintervalls

Zwei Methoden zur Berechnung des Konfidenzintervalls - durch den Median und den Student-Koeffizienten - führten zu unterschiedlichen Werten der Intervalle. Dementsprechend wurden zwei verschiedene gereinigte Proben erhalten.

Tabelle 3. Statistische Indikatoren für drei Proben.

Indikator

Erstexemplar

1 Möglichkeit

Option 2

Mittlere Bedeutung

Streuung

Coef. Variationen

Coef. Schwingungen

Anzahl ausgesonderter Objekte, Stk.

Basierend auf den durchgeführten Berechnungen können wir sagen, dass sich die Werte der Konfidenzintervalle, die mit verschiedenen Methoden erhalten wurden, überschneiden, sodass Sie nach Ermessen des Gutachters jede der Berechnungsmethoden verwenden können.

Wir glauben jedoch, dass es bei der Arbeit im estimatica.pro-System ratsam ist, je nach Grad der Marktentwicklung eine Methode zur Berechnung des Konfidenzintervalls zu wählen:

  • Wenn der Markt nicht entwickelt ist, wenden Sie die Berechnungsmethode über den Median und die Standardabweichung an, da die Anzahl der ausgemusterten Objekte in diesem Fall gering ist.
  • Wenn der Markt entwickelt ist, wenden Sie die Berechnung über den kritischen Wert der t-Statistik (Studentenkoeffizient) an, da es möglich ist, eine große Anfangsstichprobe zu bilden.

Bei der Erstellung des Artikels wurden verwendet:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Mathematische Verfahren zur Ermittlung des Wertes von Immobilien. Moskau, 2014

2. Daten aus dem System estimatica.pro