Entwicklung einer Prognose nach der Methode des gleitenden Durchschnitts. Beispiel Problemlösung

Mechanische Glättung basierend auf gleitenden Durchschnitten

Methoden zur Glättung von Zeitreihen

Sehr oft schwanken die Niveaus ökonomischer Zeitreihen. Gleichzeitig wird der Trend in der zeitlichen Entwicklung eines wirtschaftlichen Phänomens durch zufällige Abweichungen der Werte der Reihe in die eine oder andere Richtung verdeckt. Um Trends besser erkennen zu können Entwicklung des untersuchten Prozesses Glättung (Ausrichtung) durchführen Zeitreihen wirtschaftlicher Indikatoren. Die Essenz verschiedener Glättungsmethoden darauf hinaus, die tatsächlichen Niveaus der Zeitreihen durch errechnete Werte zu ersetzen, die weniger Schwankungen unterliegen. Dies trägt zu einer klaren Manifestation des Trends bei.

Glättungsmethoden für Zeitreihen werden unterteilt in zwei Hauptgruppen:

1) Analytische Ausrichtung Verwenden einer Kurve, die zwischen bestimmten Ebenen der Reihe gezogen wird, um den der Reihe innewohnenden Trend widerzuspiegeln und sie gleichzeitig von geringfügigen Schwankungen zu befreien;

2) mechanische Ausrichtung einzelnen Ebenen der Zeitreihe anhand der Ist-Werte benachbarter Ebenen.

Das Wesen der analytischen Glättungsmethoden basierend auf der mathematischen Regel, dass durch alle n Punkte, die auf der Ebene liegen, ist es möglich, ein Polynomminimum zu zeichnen (n - 1) Grad, so dass er alle bezeichneten Punkte passiert.

Die Essenz der mechanischen Glättungsmethoden liegt darin, dass mehrere Ebenen einer Reihe von Dynamiken genommen werden, die ein Glättungsintervall bilden. Für sie wird ein Polynom ausgewählt, dessen Grad kleiner sein sollte als die Anzahl der im Glättungsintervall enthaltenen Stufen. Mittels eines Polynoms werden die geglätteten Werte der Reihenpegel in der Mitte des Glättungsintervalls ermittelt. Als nächstes wird das Glättungsintervall um eine Beobachtung nach vorne verschoben, der nächste geglättete Wert wird berechnet und so weiter.

Mechanische Glättung basierend auf gleitenden Durchschnitten

Die einfachste Methode der mechanischen Glättung ist einfache Glättung des gleitenden Durchschnitts. Die Methode wird so genannt, weil sie auf der Berechnung eines einfachen Durchschnitts mehrerer Stufen der Reihe basiert. Der einfache Durchschnitt gleitet entlang der Zeitreihe mit einem Schritt, der dem Beobachtungszeitraum entspricht.

Zuerst für die Zeitreihen und t Glättungsintervall bestimmt m, Außerdem m< n . Wenn kleine zufällige Schwankungen geglättet werden müssen, wird das Glättungsintervall so groß wie möglich gewählt; das Glättungsintervall wird reduziert, wenn es notwendig ist, kleinere Schwankungen zu erhalten. Je breiter das Glättungsintervall ist, desto mehr heben sich die Schwankungen auf und der Entwicklungsverlauf ist glatter. Je stärker die Schwankungen sind, desto größer sollte das Glättungsintervall sein. Unter den gleichen Bedingungen wird empfohlen, ein Glättungsintervall mit ungerader Länge zu verwenden. Zum ersten m Zeitreihenniveaus, ihr arithmetisches Mittel wird berechnet; dies ist der geglättete Wert des Pegels der Reihe, der sich in der Mitte des Glättungsintervalls befindet.

Zur Berechnung geglätteter Werte wird die Formel verwendet:

wo m = 2 p + 1– Glättungsintervall der Zeitreihen ungerader Länge. Als Ergebnis dieses Verfahrens (n - m + 1)

Das Glättungsverfahren kann auch auf ein Glättungsintervall gleicher Länge angewendet werden. Dies gilt insbesondere für die Analyse und Vorhersage von Phänomenen, die saisonalen Schwankungen unterliegen. Bei der Glättung saisonaler Prozesse muss das Glättungsintervall unbedingt gleich der Länge der saisonalen Welle sein. Andernfalls kommt es zu einer Verzerrung der Zeitreihenkomponenten, insbesondere der Komponenten v t. In dem Fall, in dem ein Glättungsintervall gleicher Länge verwendet wird, d. h. m = 2p, gilt die Formel:

(4.2).

Als Ergebnis dieses Verfahrens (n-m) geglättete Ebenen der Serie.

Auf jeden Fall Erstes und Letztes p Serienwerte werden nicht geglättet. Die verlorenen geglätteten Werte der Zeitreihenpegel werden gefunden, indem die durchschnittliche absolute Verstärkung verwendet wird, die für das erste und letzte Glättungsintervall gefunden wurde. Um verlorene Beobachtungen wiederherzustellen zu Beginn der Zeitreihe wird von dem ersten geglätteten Wert der für das erste Glättungsintervall gefundene Wert des mittleren absoluten Anstiegs subtrahiert. Es stellt sich der geglättete Wert des Pegels der Reihe heraus jap ja 1. Um verlorene Beobachtungen am Ende der Zeitreihe wiederherzustellen, wird der für das letzte Glättungsintervall gefundene Wert des durchschnittlichen absoluten Anstiegs zum letzten geglätteten Wert addiert. Es stellt sich der geglättete Wert des Pegels der Reihe heraus yn – p + 1. Dann wird der Algorithmus wiederholt, bis ein geglätteter Wert erhalten wird. ja n.

Ein weiterer Nachteil der einfachen Methode des gleitenden Durchschnitts ist, dass es nur für Reihen mit linearem Trend verwendet werden kann. Wenn der Prozess durch eine nichtlineare Entwicklung gekennzeichnet ist und es notwendig ist, die Kurven des Trends zu halten, dann ist die Verwendung eines einfachen gleitenden Durchschnitts unangemessen, weil. dies kann zu erheblichen Verzerrungen führen. In solchen Fällen wird die Methode des gewichteten gleitenden Durchschnitts verwendet.

Methode des gewichteten gleitenden Durchschnitts unterscheidet sich von der einfachen Methode des gleitenden Durchschnitts dadurch, dass die im Glättungsintervall enthaltenen Pegel mit unterschiedlichen Gewichten aufsummiert werden. Dies liegt daran, dass die Approximation der Originalreihe innerhalb des Glättungsintervalls nicht wie beim einfachen gleitenden Mittelwertverfahren mit einem Polynom ersten Grades, sondern ausgehend vom zweiten Grad erfolgt. Es wird die gewichtete arithmetische Mittelformel verwendet.

Eine vertiefte Analyse von Zeitreihen erfordert den Einsatz komplexerer Methoden der mathematischen Statistik. Wenn die Zeitreihe einen signifikanten zufälligen Fehler (Rauschen) aufweist, wird eine von zwei einfachen Methoden verwendet – Glätten oder Nivellieren durch Vergrößern der Intervalle und Berechnen von Gruppendurchschnitten. Mit dieser Methode können Sie die Sichtbarkeit der Reihe erhöhen, wenn die meisten "Rausch"-Komponenten innerhalb der Intervalle liegen. Wenn das "Rauschen" jedoch nicht mit der Periodizität übereinstimmt, wird die Verteilung der Indikatorpegel grob, was die Möglichkeit einer detaillierten Analyse der Änderung des Phänomens im Laufe der Zeit einschränkt.

Genauere Eigenschaften werden erhalten, wenn gleitende Durchschnitte verwendet werden - eine weit verbreitete Methode zum Glätten der Indikatoren der Durchschnittsreihe. Es basiert auf dem Übergang von den Anfangswerten der Reihe zu den Durchschnittswerten in einem bestimmten Zeitintervall. In diesem Fall gleitet das Zeitintervall bei der Berechnung jedes nachfolgenden Indikators sozusagen entlang der Zeitreihe.

Die Verwendung eines gleitenden Durchschnitts ist nützlich, wenn Zeitreihentrends ungewiss sind oder wenn zyklische Ausreißer (Ausreißer oder Interventionen) stark beeinflusst werden.

Je größer das Glättungsintervall, desto glatter sieht das gleitende Durchschnittsdiagramm aus. Bei der Wahl des Wertes des Glättungsintervalls muss vom Wert der Dynamikreihe und der sinnvollen Bedeutung der reflektierten Dynamik ausgegangen werden. Eine große Zeitreihe mit vielen Anfangspunkten ermöglicht die Verwendung größerer Glättungszeitintervalle (5, 7, 10 usw.). Wenn das Verfahren des gleitenden Durchschnitts verwendet wird, um eine nicht saisonale Reihe zu glätten, wird das Glättungsintervall meistens gleich 3 oder 5 genommen. https://tvoipolet.ru/iz-moskvi-v-nyu-jork/ - a großartige Gelegenheit, eine Fluggesellschaft für einen Flug von Moskau nach New York auszuwählen

Lassen Sie uns ein Beispiel für die Berechnung der gleitenden durchschnittlichen Anzahl von Betrieben mit hohen Erträgen (mehr als 30 kg / ha) geben (Tabelle 10.3).

Tabelle 10.3 Glättung der Zeitreihe durch Vergröberung der Intervalle und des gleitenden Durchschnitts

Rechnungsjahr

Anzahl der Betriebe mit hohen Erträgen

Beträge für drei Jahre

Rolling über drei Jahre

Gleitende Mittelwerte

90,0

89,7

1984

88,7

87,3

87,3

87,0

86,7

83,0

83,0

82,3

82,3

82,6

82,7

82,7

Beispiele für die Berechnung des gleitenden Durchschnitts:

1982 (84 + 94 + 92) / 3 = 90,0;

1983 (94 + 92 + 83) / 3 = 89,7;

1984 (92 + 83 + 91) / 3 = 88,7;

1985 (83 + 91 + 88) / 3 = 87,3.

Ein Zeitplan wird erstellt. Auf der Abszissenachse sind Jahre angegeben, und auf der Ordinatenachse ist die Anzahl der Betriebe mit hohen Erträgen angegeben. Die Koordinaten der Anzahl der Betriebe sind in der Grafik angegeben und die erhaltenen Punkte sind durch eine unterbrochene Linie verbunden. Dann werden die Koordinaten des gleitenden Durchschnitts über die Jahre auf dem Diagramm angezeigt und die Punkte werden durch eine glatte fette Linie verbunden.

Eine aufwendigere und effizientere Methode ist die Glättung (Nivellierung) der Zeitreihen mit verschiedenen Näherungsfunktionen. Sie ermöglichen es Ihnen, eine glatte Ebene des allgemeinen Trends und der Hauptachse der Dynamik zu bilden.

Die effektivste Methode zum Glätten mit mathematischen Funktionen ist die einfache exponentielle Glättung. Diese Methode berücksichtigt alle bisherigen Beobachtungen der Reihe nach der Formel:

S t = α∙X t + (1 - α ) ∙S t - 1 ,

wobei S t jede neue Glättung zum Zeitpunkt t ist; S t – 1 – geglätteter Wert zum vorherigen Zeitpunkt t – 1; X t ist der tatsächliche Wert der Reihe zum Zeitpunkt t ; α - Glättungsparameter.

Wenn α = 1, werden vorherige Beobachtungen vollständig ignoriert; wenn α = 0, werden aktuelle Beobachtungen ignoriert; Werte von α zwischen 0 und 1 ergeben Zwischenergebnisse. Durch Ändern der Werte dieses Parameters können Sie die akzeptabelste Ausrichtungsoption auswählen. Die Wahl des optimalen Werts von α erfolgt durch Analyse der erhaltenen grafischen Bilder der ursprünglichen und nivellierten Kurven oder durch Berücksichtigung der Summe der quadratischen Fehler (Fehler) der berechneten Punkte. Die praktische Anwendung dieser Methode sollte mit einem Computer im Programm MS Excel erfolgen. Der mathematische Ausdruck der Muster der Datendynamik kann unter Verwendung der exponentiellen Glättungsfunktion erhalten werden.

16.02.15 Viktor Gawrilow

38133 0

Eine Zeitreihe ist eine Folge von Werten, die sich im Laufe der Zeit ändern. Ich werde versuchen, in diesem Artikel über einige einfache, aber effektive Ansätze für die Arbeit mit solchen Sequenzen zu sprechen. Es gibt viele Beispiele für solche Daten – Währungskurse, Verkaufsvolumen, Kundenanfragen, Daten in verschiedenen angewandten Wissenschaften (Soziologie, Meteorologie, Geologie, Beobachtungen in der Physik) und vieles mehr.

Reihen sind eine gängige und wichtige Form der Datenbeschreibung, da sie uns erlauben, den gesamten Verlauf der uns interessierenden Wertänderung zu beobachten. Dies gibt uns die Möglichkeit, das "typische" Verhalten der Menge und die Abweichungen davon zu beurteilen.

Ich stand vor der Aufgabe, einen Datensatz zu wählen, an dem sich die Merkmale der Zeitreihen eindeutig darstellen lassen. Ich habe mich für die Verwendung internationaler Passagierverkehrsstatistiken entschieden, da dieser Datensatz ziemlich beschreibend ist und zu einer Art Standard geworden ist (http://robjhyndman.com/tsdldata/data/airpass.dat , Quelle Time Series Data Library, R. J. Hyndman). Die Serie beschreibt die Zahl der internationalen Flugpassagiere pro Monat (in Tausend) von 1949 bis 1960.

Da ich immer ein interessantes Tool "" für die Arbeit mit Zeilen zur Hand habe, werde ich es verwenden. Bevor Sie die Daten in die Datei importieren, müssen Sie eine Spalte mit einem Datum hinzufügen, damit die Werte an die Zeit gebunden sind, und eine Spalte mit dem Namen der Serie für jede Beobachtung. Unten sehen Sie, wie meine Quelldatei aussieht, die ich mit dem Importassistenten direkt aus dem Zeitreihenanalyse-Tool in die Prognoz-Plattform importiert habe.

Das erste, was wir normalerweise mit einer Zeitreihe tun, ist, sie in einem Diagramm darzustellen. Mit der Prognoz-Plattform können Sie ein Diagramm erstellen, indem Sie einfach eine Reihe per Drag-and-Drop in eine Arbeitsmappe ziehen.

Zeitreihen im Diagramm

Das Symbol „M“ am Ende des Seriennamens bedeutet, dass die Serie eine monatliche Dynamik hat (das Intervall zwischen den Beobachtungen beträgt einen Monat).

Bereits aus der Grafik können wir erkennen, dass die Serie zwei Besonderheiten aufweist:

  • Trend- In unserem Diagramm ist dies ein langfristiger Anstieg der beobachteten Werte. Es ist ersichtlich, dass der Trend nahezu linear ist.
  • Saisonalität- In der Grafik handelt es sich um periodische Schwankungen des Werts. Im nächsten Artikel zum Thema Zeitreihen erfahren wir, wie man die Periode berechnet.

Unsere Serie ist ziemlich „ordentlich“, aber es gibt oft Serien, die zusätzlich zu den beiden oben beschriebenen Eigenschaften eine weitere Sache aufweisen - das Vorhandensein von „Rauschen“, d.h. zufällige Variationen in der einen oder anderen Form. Ein Beispiel für eine solche Serie ist in der folgenden Grafik zu sehen. Dies ist ein sinusförmiges Signal gemischt mit einer Zufallsvariablen.

Bei der Analyse der Reihen sind wir daran interessiert, ihre Struktur zu identifizieren und alle Hauptkomponenten zu bewerten - Trend, Saisonalität, Rauschen und andere Merkmale sowie die Fähigkeit, Prognosen über Änderungen in der Größenordnung in zukünftigen Perioden zu erstellen.

Bei der Arbeit mit Reihen erschwert das Vorhandensein von Rauschen oft die Analyse der Struktur der Reihe. Um seinen Einfluss auszuschließen und die Struktur der Reihe besser zu sehen, können Sie die Methoden zum Glätten der Reihe verwenden.

Die einfachste Methode zum Glätten von Reihen ist der gleitende Durchschnitt. Die Idee ist, dass für jede ungerade Anzahl von Punkten in einer Reihenfolge der zentrale Punkt durch das arithmetische Mittel der verbleibenden Punkte ersetzt wird:

wo x ich- ursprüngliche Reihe ich- geglättete Reihe.

Unten sehen Sie das Ergebnis der Anwendung dieses Algorithmus auf unsere beiden Serien. Standardmäßig schlägt die Prognoz-Plattform die Verwendung von Anti-Aliasing mit einer Fenstergröße von 5 Punkt vor ( k in unserer obigen Formel gleich 2). Bitte beachten Sie, dass das geglättete Signal nicht mehr durch Rauschen beeinflusst wird, aber mit dem Rauschen verschwinden natürlich auch einige nützliche Informationen über die Dynamik der Serie. Es ist auch zu sehen, dass der geglätteten Reihe der erste (und auch der letzte) k Punkte. Dies liegt daran, dass für den zentralen Punkt des Fensters (in unserem Fall für den dritten Punkt) eine Glättung durchgeführt wird, wonach das Fenster um einen Punkt verschoben wird und die Berechnungen wiederholt werden. Für die zweite zufällige Serie habe ich eine Glättung mit einem Fenster von 30 verwendet, um die Struktur der Serie besser sichtbar zu machen, da die Serie „hochfrequent“ ist und viele Punkte enthält.

Die Methode des gleitenden Durchschnitts hat einige Nachteile:

  • Der gleitende Durchschnitt ist bei der Berechnung ineffizient. Für jeden Punkt muss der Durchschnitt neu berechnet werden. Wir können das für den vorherigen Punkt berechnete Ergebnis nicht wiederverwenden.
  • Der gleitende Durchschnitt kann nicht auf den ersten und letzten Punkt der Reihe ausgedehnt werden. Dies kann zu einem Problem führen, wenn uns genau diese Punkte interessieren.
  • Der gleitende Durchschnitt wird außerhalb der Reihe nicht definiert und kann daher nicht für Prognosen verwendet werden.

Exponentielle Glättung

Eine fortgeschrittenere Glättungsmethode, die auch für Vorhersagen verwendet werden kann, ist die exponentielle Glättung, manchmal auch Holt-Winters-Methode nach den Namen ihrer Schöpfer genannt.

Es gibt mehrere Varianten dieser Methode:

  • einmalige Glättung für Reihen ohne Trend und Saisonalität;
  • doppelte Glättung für Reihen, die einen Trend, aber keine Saisonabhängigkeit haben;
  • dreifache Glättung für Zeitreihen, die sowohl Trend als auch Saisonabhängigkeit aufweisen.

Die Methode der exponentiellen Glättung berechnet die Werte der geglätteten Reihe, indem sie die im vorherigen Schritt berechneten Werte mit Informationen aus dem aktuellen Schritt aktualisiert. Informationen aus den vorherigen und aktuellen Schritten werden mit unterschiedlichen Gewichtungen erfasst, die kontrolliert werden können.

In der einfachsten Version der Einzelglättung ist das Verhältnis:

Parameter α definiert das Verhältnis zwischen dem ungeglätteten Wert des aktuellen Schritts und dem geglätteten Wert des vorherigen Schritts. Beim α =1 nehmen wir nur die Punkte der ursprünglichen Serie, d.h. es findet keine Glättung statt. Beim α =0 Reihe nehmen wir nur die geglätteten Werte aus den vorherigen Schritten, d.h. die Reihe wird zu einer Konstante.

Um zu verstehen, warum die Glättung als exponentiell bezeichnet wird, müssen wir die Beziehung rekursiv erweitern:

Aus der Beziehung ist ersichtlich, dass alle vorherigen Werte der Reihe zum aktuellen geglätteten Wert beitragen, ihr Beitrag jedoch aufgrund des Wachstums des Grads des Parameters exponentiell abnimmt α .

Wenn es jedoch einen Trend in den Daten gibt, wird eine einfache Glättung diesem „hinterherhinken“ (oder Sie müssen Werte nehmen α nahe 1, aber dann reicht die Glättung nicht aus). Sie müssen die doppelte exponentielle Glättung verwenden.

Die doppelte Glättung verwendet bereits zwei Gleichungen – eine Gleichung wertet den Trend als Differenz zwischen den aktuellen und vorherigen geglätteten Werten aus und glättet dann den Trend mit einfacher Glättung. Die zweite Gleichung führt eine Glättung wie im einfachen Fall durch, aber der zweite Term verwendet die Summe des vorherigen geglätteten Werts und des Trends.

Die dreifache Glättung umfasst eine weitere Komponente, die Saisonabhängigkeit, und verwendet eine andere Gleichung. Gleichzeitig werden zwei Varianten der saisonalen Komponente unterschieden - additiv und multiplikativ. Im ersten Fall ist die Amplitude der saisonalen Komponente konstant und hängt nicht von der Basisamplitude der Zeitreihe ab. Im zweiten Fall ändert sich die Amplitude zusammen mit der Änderung der Basisamplitude der Reihe. Dies ist nur unser Fall, wie aus der Grafik ersichtlich ist. Wenn die Reihe wächst, nimmt die Amplitude der saisonalen Schwankungen zu.

Da unsere erste Serie sowohl Trend als auch Saisonabhängigkeit aufweist, habe ich mich entschieden, die dreifachen Glättungsparameter dafür anzupassen. In der Prognoz-Plattform ist dies ganz einfach, denn wenn der Parameterwert aktualisiert wird, zeichnet die Plattform den Graphen der geglätteten Reihe sofort neu, und visuell können Sie sofort sehen, wie gut er unsere ursprüngliche Reihe beschreibt. Ich habe mich für folgende Werte entschieden:

Wie ich den Zeitraum berechnet habe, schauen wir uns im nächsten Artikel über Zeitreihen an.

Typischerweise können Werte zwischen 0,2 und 0,4 als erste Näherung angesehen werden. Die Prognoz-Plattform verwendet auch ein Modell mit einem zusätzlichen Parameter ɸ , was den Trend dämpft, sodass er sich in der Zukunft einer Konstante nähert. Für ɸ Ich habe den Wert 1 genommen, was dem üblichen Modell entspricht.

Ich habe auch eine Prognose der Werte der Reihe nach dieser Methode für die letzten 2 Jahre erstellt. In der Abbildung unten habe ich den Startpunkt der Prognose markiert, indem ich ihn durchgezogen habe. Wie Sie sehen, stimmen die ursprüngliche Reihe und die geglättete ziemlich gut überein, auch im Prognosezeitraum - nicht schlecht für eine so einfache Methode!

Die Prognoz-Plattform ermöglicht Ihnen auch die automatische Auswahl der optimalen Parameterwerte durch eine systematische Suche im Raum der Parameterwerte und die Minimierung der Summe der quadratischen Abweichungen der geglätteten Reihe vom Original.

Die beschriebenen Methoden sind recht einfach, leicht anzuwenden und ein guter Ausgangspunkt für Strukturanalysen und Zeitreihenprognosen.

Lesen Sie mehr über Zeitreihen im nächsten Artikel.

Sehr oft schwanken die Niveaus der Dynamikreihen, während der Trend in der zeitlichen Entwicklung des Phänomens durch zufällige Abweichungen der Niveaus in die eine oder andere Richtung verdeckt wird. Um den Entwicklungstrend des untersuchten Prozesses, auch für die weitere Anwendung von Prognoseverfahren auf der Grundlage von Trendmodellen, klarer zu erkennen, Glättung(Ausrichtung) Zeitfolgen.

Methoden zur Glättung von Zeitreihen werden in zwei Hauptgruppen unterteilt:

1. Analytischer Abgleich anhand einer Kurve, die zwischen bestimmten Stufen der Reihe gezogen wird, um den der Reihe innewohnenden Trend widerzuspiegeln und sie gleichzeitig von geringfügigen Schwankungen zu befreien;

2. Mechanischer Abgleich einzelner Ebenen der Zeitreihe anhand der Ist-Werte benachbarter Ebenen.

Das Wesen der mechanischen Glättungsmethoden ist wie folgt. Es werden mehrere Ebenen der Zeitreihen genommen, die sich bilden Glättungsintervall. Für sie wird ein Polynom ausgewählt, dessen Grad kleiner sein sollte als die Anzahl der im Glättungsintervall enthaltenen Stufen; unter Verwendung eines Polynoms werden neue, ausgerichtete Werte der Pegel in der Mitte des Glättungsintervalls bestimmt. Als nächstes wird das Glättungsintervall um eine Ebene der Reihe nach rechts verschoben, der nächste geglättete Wert wird berechnet und so weiter.

Die einfachste Methode der mechanischen Glättung ist einfache Methode des gleitenden Durchschnitts.

2.4.1.Die einfache Methode des gleitenden Durchschnitts.

Zuerst für die Zeitreihe: Das Glättungsintervall wird bestimmt. Wenn kleine zufällige Schwankungen geglättet werden müssen, wird das Glättungsintervall so groß wie möglich gewählt; das Glättungsintervall wird reduziert, wenn es notwendig ist, kleinere Schwankungen zu bewahren.

Für die ersten Stufen der Reihe wird ihr arithmetisches Mittel berechnet. Dies ist der geglättete Wert des Pegels der Reihe, der sich in der Mitte des Glättungsintervalls befindet. Dann wird das Glättungsintervall um eine Stufe nach rechts verschoben, die Berechnung des arithmetischen Mittels wiederholt und so weiter. Zur Berechnung der geglätteten Pegel der Reihe wird folgende Formel verwendet:

wo (für ungerade); für gerade Zahlen wird die Formel komplizierter.

Als Ergebnis eines solchen Verfahrens werden geglättete Werte der Pegel der Reihe erhalten; in diesem Fall gehen die erste und letzte Stufe der Reihe verloren (nicht geglättet). Ein weiterer Nachteil der Methode besteht darin, dass sie nur auf Reihen mit linearem Trend anwendbar ist.

2.4.2.Methode des gewichteten gleitenden Durchschnitts.

Die Methode des gewichteten gleitenden Durchschnitts unterscheidet sich von der bisherigen Glättungsmethode dadurch, dass die im Glättungsintervall enthaltenen Pegel mit unterschiedlichen Gewichtungen addiert werden. Dies liegt daran, dass die Approximation der Reihe innerhalb des Glättungsintervalls nicht wie im vorigen Fall mit einem Polynom ersten Grades, sondern mit einem vom zweiten Grad ausgehenden erfolgt.

Es wird die gewichtete arithmetische Mittelformel verwendet:

,

wobei die Gewichte nach der Methode der kleinsten Quadrate ermittelt werden. Diese Gewichte werden für verschiedene Grade des Näherungspolynoms und verschiedene Glättungsintervalle berechnet.

1. Für Polynome zweiter und dritter Ordnung hat die Zahlenfolge der Gewichte für das Glättungsintervall die Form: , und at hat die Form: ;

2. für Polynome vierten und fünften Grades und mit Glättungsintervall ist die Reihenfolge der Gewichte wie folgt: .

Die Verteilung der Gewichte über das Glättungsintervall, ermittelt nach der Methode der kleinsten Quadrate, siehe Diagramm 1.



2.4.3.Exponentielles Glättungsverfahren.

Das Verfahren der exponentiellen Glättung gehört zur gleichen Gruppe von Verfahren.

Seine Besonderheit liegt darin, dass bei dem Verfahren zum Auffinden des geglätteten Niveaus nur die Werte der vorherigen Niveaus der Reihe verwendet werden, die mit einem bestimmten Gewicht genommen werden, und das Gewicht der Beobachtung abnimmt, wenn es sich von dem entfernt Zeitpunkt, für den der geglättete Wert des Niveaus der Reihe bestimmt wird.

Wenn für die ursprüngliche Zeitreihe

die entsprechenden geglätteten Werte sind mit bezeichnet , dann erfolgt die exponentielle Glättung nach der Formel:

wo Glättungsparameter ; Menge heißt Diskontfaktor.

Unter Verwendung der gegebenen Wiederholungsbeziehung für alle Stufen der Reihe, beginnend mit der ersten und endend mit dem Zeitpunkt , kann man erhalten, dass der exponentielle Durchschnitt, d. h. der Wert der Stufe der Reihe, der durch diese Methode geglättet wird, ist ein gewichteter Durchschnitt aller vorherigen Stufen.

Zeitreihenglättung

Zeitreihenglättung, jene. Das Ersetzen tatsächlicher Niveaus durch berechnete Werte, die eine geringere Volatilität als die ursprünglichen Daten aufweisen, ist eine einfache Methode, um Trends zu identifizieren. Die entsprechende Transformation heißt Filterung.

Eine Zeitreihenglättung wird in folgenden Fällen durchgeführt:

· In der grafischen Darstellung der Zeitreihen ist der Trend nicht deutlich erkennbar. Daher wird die Reihe geglättet, die geglätteten Werte werden in der Grafik dargestellt und der Trend erscheint in der Regel deutlicher;

· Analyse- und Prognosemethoden werden angewendet, die eine Glättung der Zeitreihen als Voraussetzung erfordern;

Beim Eliminieren anomaler Beobachtungen;

· Mit direkter Vorhersage von Wirtschaftskennzahlen und Prognose einer Trendwende – „Wendepunkte“.

Die bestehenden Glättungsmethoden werden in zwei Gruppen unterteilt:

1) Analytische Methoden. Zur Glättung wird eine Kurve verwendet, die relativ zu den tatsächlichen Werten der Reihe so gezeichnet wird, dass sie den der Reihe innewohnenden Trend widerspiegelt und sie gleichzeitig von kleinen unbedeutenden Schwankungen befreit. Solche Kurven werden auch als Wachstumskurven bezeichnet, sie werden hauptsächlich zur Vorhersage von Wirtschaftsindikatoren verwendet;

2) Methoden der mechanischen Glättung. Jede einzelne Ebene der Reihe wird mit den tatsächlichen Werten der angrenzenden Ebenen geglättet. Um Zeitreihen zu glätten, werden häufig die Methoden des einfachen und gewichteten gleitenden Durchschnitts sowie die exponentielle Glättung verwendet.

Einfache Methode des gleitenden Durchschnitts umfasst die folgenden Schritte:

1. Die Anzahl der im Glättungsintervall enthaltenen Beobachtungen wird bestimmt. In diesem Fall gilt die Regel: Wenn kleine, chaotische Schwankungen geglättet werden müssen, wird das Glättungsintervall so groß wie möglich gewählt und umgekehrt das Glättungsintervall verringert, wenn kleinere Wellen erhalten und erhalten werden müssen Befreien Sie sich von periodisch wiederkehrenden Schwankungen, die beispielsweise durch Pegelautokorrelationen entstehen .

2. Der Mittelwert der Beobachtungen, die das Glättungsintervall bilden, wird berechnet, was auch der Glättungswert des Pegels ist, der sich in der Mitte des Glättungsintervalls befindet, vorausgesetzt, dass m gemäß der Formel eine ungerade Zahl ist

wobei m die Anzahl der im Glättungsintervall enthaltenen Beobachtungen ist; p ist die Anzahl der Beobachtungen, die sich auf gegenüberliegenden Seiten der geglätteten befinden.

Für ungerades m wird der Wert des Parameters p wie folgt berechnet:

Die erste geglättete Beobachtung ist t, wobei t = p+1.

3. Das Glättungsintervall wird um einen Term nach rechts verschoben, und der geglättete Wert für die (t + 1)-te Beobachtung wird unter Verwendung von Formel (1) gefunden. Dann wird die Verschiebung erneut durchgeführt und so weiter.

Das Verfahren wird fortgesetzt, bis die letzte Beobachtung der Zeitreihe in das Glättungsintervall eintritt.

Die Methode des einfachen gleitenden Durchschnitts kann verwendet werden, wenn die grafische Darstellung der Reihe einer geraden Linie ähnelt.

In diesem Fall wird die Entwicklungsdynamik des untersuchten Prozesses nicht verzerrt. Wenn der Trend der zu nivellierenden Reihe jedoch Krümmungen aufweist und außerdem kleine Wellen beibehalten werden sollen, ist es nicht ratsam, die einfache Methode des gleitenden Durchschnitts zu verwenden, um die Reihe zu glätten, denn in diesem Fall:

sowohl konvexe als auch konkave Linien sind ausgerichtet;

· es gibt eine Verschiebung der Welle entlang der Reihe;

· das Vorzeichen der Welle wechselt, d.h. Auf der Kurve, die die geglätteten Punkte verbindet, wird anstelle eines konvexen Abschnitts ein konkaver Abschnitt gebildet und umgekehrt. Letzteres findet statt, wenn das Glättungsintervall das Anderthalbfache der Wellenlänge beträgt.

Wenn also die Entwicklung des Prozesses nicht linear ist, dann kann die Anwendung der einfachen Methode des gleitenden Durchschnitts zu erheblichen Verzerrungen des untersuchten Prozesses führen.

In solchen Fällen ist es zuverlässiger, andere Glättungsmethoden zu verwenden, beispielsweise die Methode des gewichteten gleitenden Durchschnitts.

Methode des gewichteten gleitenden Durchschnitts unterscheidet sich von der vorherigen dadurch, dass die Glättung innerhalb des Intervalls nicht entlang einer Geraden, sondern entlang einer Kurve höherer Ordnung erfolgt. Dies liegt daran, dass die Summierung der im Glättungsintervall enthaltenen Reihenglieder mit bestimmten, nach der Methode der kleinsten Quadrate berechneten Gewichten erfolgt.

Wenn die Glättung mit einem Polynom (Polynom) zweiter und dritter Ordnung durchgeführt wird, werden die folgenden Gewichte genommen

(-3; 12; 17; 12; - 3) für m=5;

(-2; 3; 6; 7; 3; -2) für m=7.

Scale-Features:

1) sind in Bezug auf das zentrale Element symmetrisch;

2) die Summe der Gewichte unter Berücksichtigung des gemeinsamen Faktors gleich eins ist.

Nachteil der Methode: Die ersten und letzten p Beobachtungen der Serie bleiben ungeglättet.

Berechnung von Indikatoren für die Dynamik wirtschaftlicher Prozesse

Die Berechnung von Indikatoren für die Dynamik wirtschaftlicher Prozesse ist die letzte Phase der vorläufigen Datenanalyse.

Um die Dynamik von Änderungen in Wirtschaftsindikatoren zu charakterisieren, wird häufig das Konzept der Autokorrelation verwendet, das nicht nur die gegenseitige Abhängigkeit der Niveaus derselben Reihe in Bezug auf verschiedene Beobachtungspunkte charakterisiert, sondern auch den Grad der Stabilität der Entwicklung des Prozesses in der Zeit, der Wert des optimalen Prognosezeitraums usw.

Der Grad der Enge des statistischen Zusammenhangs zwischen den um f Zeiteinheiten verschobenen Niveaus der Zeitreihen wird durch den Wert des Korrelationskoeffizienten r(f) bestimmt. Da r(φ) die Nähe der Verbindung zwischen den Pegeln derselben Zeitreihe misst, wird es allgemein als Autokorrelationskoeffizient bezeichnet. In diesem Fall wird f - die Länge der zeitlichen Verschiebung - normalerweise als Verzögerung bezeichnet.

Der Autokorrelationskoeffizient wird durch die Formel berechnet

Bei einer großen Länge der untersuchten Reihe kann die Berechnung der Autokorrelationskoeffizienten vereinfacht werden. Dabei werden Abweichungen nicht vom Mittelwert der korrelierten Reihe, sondern vom Gesamtmittelwert der gesamten Reihe gefunden. In diesem Fall

Die Reihenfolge der Autokorrelationskoeffizienten wird durch die zeitliche Verzögerung bestimmt: erste Ordnung (bei φ = 1), zweite Ordnung (bei φ = 2) usw.

Die Folge von Autokorrelationskoeffizienten der Stufen erster, zweiter und nachfolgender Ordnung wird als Autokorrelationsfunktion bezeichnet. Deren Werte können von -1 bis +1 variieren, aber aus der Stationarität folgt, dass r(f) = - r(f). Der Graph einer Autokorrelationsfunktion wird Korrelogramm genannt.

Die Analyse der Autokorrelationsfunktion und des Korrelogramms ermöglicht es, die Verzögerung zu bestimmen, bei der die Autokorrelation am höchsten ist, d. h. Anhand der Analyse der Autokorrelationsfunktion und des Korrelogramms kann man die Struktur der Reihe aufdecken.

Fällt der Autokorrelationskoeffizient 1. Ordnung am höchsten aus, enthält die untersuchte Reihe nur einen Trend. Wenn der Autokorrelationskoeffizient der Ordnung φ am höchsten ausgefallen ist, enthält die Reihe zyklische Oszillationen mit einer Periodizität von φ Zeitpunkten. Wenn keiner der Autokorrelationskoeffizienten signifikant ist, kann eine von zwei Annahmen über die Struktur dieser Reihe getroffen werden: Entweder enthält die Reihe keinen Trend und keine saisonalen Schwankungen, oder die Reihe enthält einen starken nichtlinearen Trend, der zusätzliche erfordert Analyse zu identifizieren. Daher ist es ratsam, den Level-Autokorrelationskoeffizienten und die Autokorrelationsfunktion zu verwenden, um das Vorhandensein oder Fehlen der Trendkomponente f(t) und der saisonalen Komponente S(t) in der Zeitreihe zu identifizieren.