Dafür wird die Methode der kleinsten Quadrate verwendet. Lineare paarweise Regressionsanalyse

Wir approximieren die Funktion durch ein Polynom 2. Grades. Dazu berechnen wir die Koeffizienten des normalen Gleichungssystems:

, ,

Lassen Sie uns ein normales System der kleinsten Quadrate zusammenstellen, das die Form hat:

Die Lösung des Systems ist leicht zu finden: , , .

Damit ist das Polynom 2. Grades gefunden: .

Theoretischer Hintergrund

Zurück zur Seite<Введение в вычислительную математику. Примеры>

Beispiel 2. Den optimalen Grad eines Polynoms finden.

Zurück zur Seite<Введение в вычислительную математику. Примеры>

Beispiel 3. Ableitung eines normalen Gleichungssystems zur Ermittlung der Parameter einer empirischen Abhängigkeit.

Lassen Sie uns ein Gleichungssystem zur Bestimmung der Koeffizienten und Funktionen herleiten , die die Root-Mean-Square-Approximation der gegebenen Funktion in Bezug auf Punkte durchführt. Verfassen Sie eine Funktion und schreiben Sie die dafür notwendige Extremumsbedingung:

Dann nimmt das normale System die Form an:

Wir haben ein lineares Gleichungssystem für unbekannte Parameter und erhalten, das leicht zu lösen ist.

Theoretischer Hintergrund

Zurück zur Seite<Введение в вычислительную математику. Примеры>

Beispiel.

Experimentelle Daten zu den Werten von Variablen X und bei sind in der Tabelle angegeben.

Durch ihre Ausrichtung wird die Funktion

Verwenden Methode der kleinsten Quadrate, approximieren diese Daten mit einer linearen Abhängigkeit y=ax+b(Parameter suchen a und b). Finden Sie heraus, welche der beiden Linien besser (im Sinne der Methode der kleinsten Quadrate) die experimentellen Daten ausrichtet. Fertige eine Zeichnung an.

Die Essenz der Methode der kleinsten Quadrate (LSM).

Das Problem besteht darin, die linearen Abhängigkeitskoeffizienten zu finden, für die die Funktion zweier Variablen gilt a und bnimmt den kleinsten Wert an. Das heißt, angesichts der Daten a und b die Summe der quadrierten Abweichungen der experimentellen Daten von der gefundenen geraden Linie wird am kleinsten sein. Das ist der springende Punkt bei der Methode der kleinsten Quadrate.

Somit reduziert sich die Lösung des Beispiels darauf, das Extremum einer Funktion zweier Variablen zu finden.

Herleitung von Formeln zum Finden von Koeffizienten.

Ein System aus zwei Gleichungen mit zwei Unbekannten wird erstellt und gelöst. Partielle Ableitungen von Funktionen finden durch Variablen a und b, setzen wir diese Ableitungen mit Null gleich.

Wir lösen das resultierende Gleichungssystem mit einer beliebigen Methode (z Substitutionsmethode oder Cramer-Methode) und erhalten Sie Formeln zum Finden von Koeffizienten mit der Methode der kleinsten Quadrate (LSM).

Mit Daten a und b Funktion nimmt den kleinsten Wert an. Der Beweis dieser Tatsache wird unten im Text am Ende der Seite gegeben.

Das ist die ganze Methode der kleinsten Quadrate. Formel zum Finden des Parameters a enthält die Summen , , , und den Parameter n ist die Menge an experimentellen Daten. Es wird empfohlen, die Werte dieser Summen separat zu berechnen.

Koeffizient b nach Berechnung gefunden a.

Es ist Zeit, sich an das ursprüngliche Beispiel zu erinnern.

Lösung.

In unserem Beispiel n=5. Wir füllen die Tabelle aus, um die Beträge zu berechnen, die in den Formeln der erforderlichen Koeffizienten enthalten sind.

Die Werte in der vierten Zeile der Tabelle erhält man, indem man für jede Zahl die Werte der 2. Zeile mit den Werten der 3. Zeile multipliziert ich.

Die Werte in der fünften Zeile der Tabelle erhält man durch Quadrieren der Werte der 2. Zeile für jede Zahl ich.

Die Werte der letzten Spalte der Tabelle sind die Summen der Werte über die Zeilen hinweg.

Wir verwenden die Formeln der Methode der kleinsten Quadrate, um die Koeffizienten zu finden a und b. Wir ersetzen in ihnen die entsprechenden Werte aus der letzten Spalte der Tabelle:

Folglich, y=0,165x+2,184 die gesuchte Näherungsgerade ist.

Es bleibt herauszufinden, welche der Linien y=0,165x+2,184 oder nähert sich den Originaldaten besser an, d.h. um eine Schätzung nach der Methode der kleinsten Quadrate vorzunehmen.

Abschätzung des Fehlers der Methode der kleinsten Quadrate.

Dazu müssen Sie die Summen der quadrierten Abweichungen der Originaldaten von diesen Linien berechnen und , entspricht ein kleinerer Wert einer Linie, die die ursprünglichen Daten im Sinne der Methode der kleinsten Quadrate besser annähert.

Da , dann die Linie y=0,165x+2,184 nähert sich den Originaldaten besser an.

Grafische Darstellung der Methode der kleinsten Quadrate (LSM).

In den Charts sieht alles super aus. Die rote Linie ist die gefundene Linie y=0,165x+2,184, die blaue Linie ist , die rosa Punkte sind die Originaldaten.

Wozu dient es, wozu all diese Annäherungen?

Ich persönlich verwende, um Datenglättungsprobleme, Interpolations- und Extrapolationsprobleme zu lösen (im ursprünglichen Beispiel könnten Sie aufgefordert werden, den Wert des beobachteten Werts zu finden j bei x=3 oder wann x=6 nach der MNC-Methode). Aber wir werden später in einem anderen Abschnitt der Website mehr darüber sprechen.

Seitenanfang

Nachweisen.

Also wenn gefunden a und b Funktion den kleinsten Wert annimmt, ist es notwendig, dass an dieser Stelle die Matrix der quadratischen Form des Differentials zweiter Ordnung für die Funktion war positiv bestimmt. Zeigen wir es.

Das Differential zweiter Ordnung hat die Form:

Also

Daher hat die Matrix der quadratischen Form die Form

und die Werte der Elemente hängen nicht davon ab a und b.

Zeigen wir, dass die Matrix positiv definit ist. Dies erfordert, dass die Nebenwinkel positiv sind.

Eckiges Moll erster Ordnung . Die Ungleichung ist streng, da die Punkte nicht zusammenfallen. Dies wird im Folgenden impliziert.

Winkelminor zweiter Ordnung

Lassen Sie uns das beweisen Methode der mathematischen Induktion.

Fazit: Gefundene Werte a und b entsprechen dem kleinsten Wert der Funktion sind daher die gewünschten Parameter für die Methode der kleinsten Quadrate.

Schon mal verstanden?
Bestellen Sie eine Lösung

Seitenanfang

Entwicklung einer Prognose nach der Methode der kleinsten Quadrate. Beispiel Problemlösung

Extrapolation - Dies ist eine Methode der wissenschaftlichen Forschung, die auf der Verbreitung vergangener und gegenwärtiger Trends, Muster und Beziehungen zur zukünftigen Entwicklung des Prognoseobjekts basiert. Zu den Extrapolationsmethoden gehören Methode des gleitenden Durchschnitts, Methode der exponentiellen Glättung, Methode der kleinsten Quadrate.

Wesen Methode der kleinsten Quadrate besteht darin, die Summe der quadratischen Abweichungen zwischen den beobachteten und berechneten Werten zu minimieren. Die berechneten Werte werden gemäß der ausgewählten Gleichung gefunden - der Regressionsgleichung. Je geringer der Abstand zwischen den tatsächlichen Werten und den berechneten ist, desto genauer ist die Prognose anhand der Regressionsgleichung.

Als Grundlage für die Auswahl einer Kurve dient die theoretische Analyse des Wesens des untersuchten Phänomens, dessen Veränderung durch eine Zeitreihe dargestellt wird. Überlegungen zur Art des Wachstums der Ebenen der Reihe werden manchmal berücksichtigt. Wenn also das Produktionswachstum in einer arithmetischen Progression erwartet wird, wird die Glättung in einer geraden Linie durchgeführt. Wenn sich herausstellt, dass das Wachstum exponentiell ist, sollte die Glättung gemäß der Exponentialfunktion erfolgen.

Die Arbeitsformel der Methode der kleinsten Quadrate : Yt+1 = a*X + b, wobei t + 1 der Prognosezeitraum ist; Уt+1 – vorhergesagter Indikator; a und b sind Koeffizienten; X ist ein Zeitsymbol.

Die Koeffizienten a und b werden nach folgenden Formeln berechnet:

wo, Uf - die tatsächlichen Werte der Dynamikreihe; n ist die Anzahl der Ebenen in der Zeitreihe;

Die Glättung von Zeitreihen nach der Methode der kleinsten Quadrate dient dazu, die Muster der Entwicklung des untersuchten Phänomens widerzuspiegeln. Beim analytischen Ausdruck eines Trends wird die Zeit als unabhängige Variable betrachtet, und die Niveaus der Zeitreihe agieren als Funktion dieser unabhängigen Variablen.

Die Entwicklung eines Phänomens hängt nicht davon ab, wie viele Jahre seit dem Ausgangspunkt vergangen sind, sondern davon, welche Faktoren seine Entwicklung in welche Richtung und mit welcher Intensität beeinflusst haben. Daraus wird deutlich, dass die zeitliche Entwicklung eines Phänomens das Ergebnis der Wirkung dieser Faktoren ist.

Die Art der Kurve, die Art der analytischen Zeitabhängigkeit richtig einzustellen, ist eine der schwierigsten Aufgaben der präprädiktiven Analyse. .

Die Auswahl des den Trend beschreibenden Funktionstyps, dessen Parameter nach der Methode der kleinsten Quadrate bestimmt werden, erfolgt in den meisten Fällen empirisch, indem mehrere Funktionen konstruiert und über den Wert des Wurzelmittelwerts miteinander verglichen werden -Quadratfehler berechnet nach der Formel:

wo Uf - die tatsächlichen Werte der Dynamikreihe; Ur – berechnete (geglättete) Werte der Zeitreihe; n ist die Anzahl der Ebenen in der Zeitreihe; p ist die Anzahl der Parameter, die in den Formeln definiert sind, die den Trend (Entwicklungstrend) beschreiben.

Nachteile der Methode der kleinsten Quadrate :

  • wenn versucht wird, das untersuchte wirtschaftliche Phänomen mit einer mathematischen Gleichung zu beschreiben, wird die Prognose für einen kurzen Zeitraum genau sein und die Regressionsgleichung sollte neu berechnet werden, sobald neue Informationen verfügbar sind;
  • die Komplexität der Auswahl der Regressionsgleichung, die mit Standard-Computerprogrammen lösbar ist.

Ein Beispiel für die Verwendung der Methode der kleinsten Quadrate zur Entwicklung einer Prognose

Eine Aufgabe . Es gibt Daten, die das Niveau der Arbeitslosigkeit in der Region charakterisieren, %

  • Erstellen Sie eine Prognose der Arbeitslosenquote in der Region für die Monate November, Dezember, Januar mit den Methoden: gleitender Durchschnitt, exponentielle Glättung, kleinste Quadrate.
  • Berechnen Sie die Fehler in den resultierenden Prognosen mit jeder Methode.
  • Vergleichen Sie die erzielten Ergebnisse, ziehen Sie Schlussfolgerungen.

Lösung der kleinsten Quadrate

Für die Lösung stellen wir eine Tabelle zusammen, in der wir die notwendigen Berechnungen durchführen:

ε = 28,63/10 = 2,86 % Prognosegenauigkeit hoch.

Fazit : Vergleich der in den Berechnungen erhaltenen Ergebnisse Methode des gleitenden Durchschnitts , exponentielle Glättung und der Methode der kleinsten Quadrate können wir sagen, dass der durchschnittliche relative Fehler bei Berechnungen nach der Methode der exponentiellen Glättung zwischen 20 und 50 % liegt. Dies bedeutet, dass die Vorhersagegenauigkeit in diesem Fall nur zufriedenstellend ist.

Im ersten und dritten Fall ist die Prognosegenauigkeit hoch, da der durchschnittliche relative Fehler weniger als 10 % beträgt. Die Methode des gleitenden Durchschnitts ermöglichte es jedoch, zuverlässigere Ergebnisse zu erhalten (Prognose für November - 1,52 %, Prognose für Dezember - 1,53 %, Prognose für Januar - 1,49 %), da der durchschnittliche relative Fehler bei Verwendung dieser Methode am kleinsten ist - 1 ,13%.

Methode der kleinsten Quadrate

Weitere verwandte Artikel:

Liste der verwendeten Quellen

  1. Wissenschaftliche und methodische Empfehlungen zu den Fragen der Diagnose sozialer Risiken und der Prognose von Herausforderungen, Bedrohungen und sozialen Folgen. Russische Staatliche Sozialuniversität. Moskau. 2010;
  2. Vladimirova L.P. Prognose und Planung unter Marktbedingungen: Proc. Beihilfe. M .: Verlag "Dashkov and Co", 2001;
  3. Novikova N.V., Pozdeeva O.G. Prognose der Volkswirtschaft: Pädagogischer und methodischer Leitfaden. Jekaterinburg: Verlag Ural. Zustand Wirtschaft Universität, 2007;
  4. Slutskin L.N. MBA-Kurs in Business Forecasting. Moskau: Alpina Business Books, 2006.

MNE-Programm

Daten eingeben

Daten und Annäherung y = a + bx

ich- Nummer des Versuchspunktes;
x ich- der Wert des festen Parameters an diesem Punkt ich;
y ich- der Wert des gemessenen Parameters an diesem Punkt ich;
ω ich- Messgewicht am Punkt ich;
y i, ber.- die Differenz zwischen dem gemessenen Wert und dem aus der Regression berechneten Wert j am Punkt ich;
S x ich (x ich)- Fehlerschätzung x ich beim Messen j am Punkt ich.

Daten und Annäherung y = kx

ich x ich y ich ω ich y i, ber. Δy i S x ich (x ich)

Klicken Sie auf das Diagramm

Benutzerhandbuch für das MNC-Online-Programm.

Geben Sie im Datenfeld in jeder einzelnen Zeile die Werte von „x“ und „y“ an einem Versuchspunkt ein. Werte müssen durch Whitespace (Leerzeichen oder Tabulator) getrennt werden.

Der dritte Wert kann das Punktgewicht von "w" sein. Wenn das Punktgewicht nicht angegeben ist, ist es gleich eins. In den allermeisten Fällen sind die Gewichte der Versuchspunkte unbekannt oder nicht berechnet; alle experimentellen Daten gelten als gleichwertig. Manchmal sind die Gewichte im untersuchten Wertebereich definitiv nicht gleichwertig und können sogar theoretisch berechnet werden. In der Spektrophotometrie beispielsweise lassen sich Gewichte mit einfachen Formeln berechnen, obwohl dies im Grunde jeder vernachlässigt, um die Arbeitskosten zu senken.

Daten können über die Zwischenablage aus einer Tabellenkalkulation der Office-Suite eingefügt werden, z. B. Excel von Microsoft Office oder Calc von Open Office. Wählen Sie dazu in der Tabelle den zu kopierenden Datenbereich aus, kopieren Sie ihn in die Zwischenablage und fügen Sie die Daten in das Datenfeld auf dieser Seite ein.

Zur Berechnung nach der Methode der kleinsten Quadrate sind mindestens zwei Punkte erforderlich, um zwei Koeffizienten „b“ – den Tangens des Neigungswinkels der Geraden und „a“ – den von der Geraden auf „y“ abgeschnittenen Wert zu bestimmen ` Achse.

Um den Fehler der berechneten Regressionskoeffizienten abzuschätzen, ist es notwendig, die Anzahl der experimentellen Punkte auf mehr als zwei einzustellen.

Methode der kleinsten Quadrate (LSM).

Je größer die Anzahl der Versuchspunkte, desto genauer die statistische Schätzung der Koeffizienten (aufgrund der Abnahme des Student-Koeffizienten) und desto näher die Schätzung an der Schätzung der allgemeinen Stichprobe.

Das Erhalten von Werten an jedem Versuchspunkt ist oft mit erheblichen Arbeitskosten verbunden, daher wird oft eine Kompromisszahl von Experimenten durchgeführt, die eine verdauliche Schätzung ergibt und nicht zu übermäßigen Arbeitskosten führt. In der Regel wird die Zahl der Versuchspunkte für eine lineare Kleinste-Quadrate-Abhängigkeit mit zwei Koeffizienten im Bereich von 5-7 Punkten gewählt.

Eine kurze Theorie der kleinsten Quadrate für lineare Abhängigkeit

Angenommen, wir haben einen Satz experimenteller Daten in Form von Wertepaaren [`y_i`, `x_i`], wobei `i` die Nummer einer experimentellen Messung von 1 bis `n` ist; `y_i` - der Wert des gemessenen Wertes am Punkt `i`; `x_i` - der Wert des Parameters, den wir am Punkt `i` setzen.

Ein Beispiel ist die Wirkungsweise des Ohmschen Gesetzes. Indem wir die Spannung (Potenzialdifferenz) zwischen Abschnitten des Stromkreises ändern, messen wir die Strommenge, die durch diesen Abschnitt fließt. Die Physik gibt uns die experimentell gefundene Abhängigkeit:

`I=U/R`,
wo "I" - Stromstärke; "R" - Widerstand; `U` - Spannung.

Dabei ist „y_i“ der gemessene Stromwert und „x_i“ der Spannungswert.

Betrachten Sie als weiteres Beispiel die Absorption von Licht durch eine Lösung einer Substanz in Lösung. Die Chemie gibt uns die Formel:

`A = εl C`,
wobei "A" die optische Dichte der Lösung ist; "ε" - Durchlässigkeit für gelöste Stoffe; `l` - Weglänge, wenn Licht durch eine Küvette mit einer Lösung geht; "C" ist die Konzentration des gelösten Stoffes.

In diesem Fall ist „y_i“ die gemessene optische Dichte „A“ und „x_i“ ist die von uns eingestellte Konzentration der Substanz.

Wir betrachten den Fall, wenn der relative Fehler beim Setzen von „x_i“ viel kleiner ist als der relative Fehler beim Messen von „y_i“. Wir gehen außerdem davon aus, dass alle Messwerte von `y_i` zufällig und normalverteilt sind, d.h. dem Normalverteilungsgesetz gehorchen.

Im Falle einer linearen Abhängigkeit von `y` von `x` können wir die theoretische Abhängigkeit schreiben:
`y = a + bx`.

Aus geometrischer Sicht bezeichnet der Koeffizient „b“ die Tangente des Neigungswinkels der Linie an die „x“-Achse und der Koeffizient „a“ den Wert von „y“ am Schnittpunkt der Linie mit der 'y'-Achse (für 'x = 0').

Ermitteln der Parameter der Regressionsgerade.

In einem Experiment können die gemessenen Werte von `y_i` aufgrund von Messfehlern, die der Realität immer innewohnen, nicht genau auf der theoretischen Linie liegen. Daher muss eine lineare Gleichung durch ein Gleichungssystem dargestellt werden:
`y_i = a + b x_i + ε_i` (1),
wobei „ε_i“ der unbekannte Messfehler von „y“ im „i“-ten Experiment ist.

Abhängigkeit (1) wird auch genannt Rückschritt, d.h. die Abhängigkeit der beiden Größen voneinander mit statistischer Signifikanz.

Die Aufgabe der Wiederherstellung der Abhängigkeit besteht darin, die Koeffizienten 'a' und 'b' aus den experimentellen Punkten ['y_i', 'x_i'] zu finden.

Um die Koeffizienten zu finden, werden normalerweise "a" und "b" verwendet Methode der kleinsten Quadrate(MNK). Es handelt sich um einen Sonderfall des Maximum-Likelihood-Prinzips.

Schreiben wir (1) um als `ε_i = y_i - a - b x_i`.

Dann wird die Summe der quadrierten Fehler sein
`Φ = sum_(i=1)^(n) ε_i^2 = sum_(i=1)^(n) (y_i - a - b x_i)^2`. (2)

Das Prinzip der Methode der kleinsten Quadrate besteht darin, die Summe (2) bezüglich der Parameter "a" und "b" zu minimieren.

Das Minimum ist erreicht, wenn die partiellen Ableitungen der Summe (2) nach den Koeffizienten "a" und "b" gleich Null sind:
`frac(partial Φ)(partial a) = frac(partial sum_(i=1)^(n) (y_i - a - b x_i)^2)(partial a) = 0`
`frac(partial Φ)(partial b) = frac(partial sum_(i=1)^(n) (y_i - a - b x_i)^2)(partial b) = 0`

Durch Erweiterung der Ableitungen erhalten wir ein System aus zwei Gleichungen mit zwei Unbekannten:
`sum_(i=1)^(n) (2a + 2bx_i - 2y_i) = sum_(i=1)^(n) (a + bx_i - y_i) = 0`
`sum_(i=1)^(n) (2bx_i^2 + 2ax_i - 2x_iy_i) = sum_(i=1)^(n) (bx_i^2 + ax_i - x_iy_i) = 0'

Wir öffnen die Klammern und übertragen die Summen unabhängig von den gewünschten Koeffizienten auf die andere Hälfte, wir erhalten ein lineares Gleichungssystem:
`sum_(i=1)^(n) y_i = a n + b sum_(i=1)^(n) bx_i`
`sum_(i=1)^(n) x_iy_i = a sum_(i=1)^(n) x_i + b sum_(i=1)^(n) x_i^2`

Beim Lösen des resultierenden Systems finden wir Formeln für die Koeffizienten `a` und `b`:

`a = frac(sum_(i=1)^(n) y_i sum_(i=1)^(n) x_i^2 - sum_(i=1)^(n) x_i sum_(i=1)^(n ) x_iy_i) (n summe_(i=1)^(n) x_i^2 — (summe_(i=1)^(n) x_i)^2)` (3.1)

`b = frac(n sum_(i=1)^(n) x_iy_i - sum_(i=1)^(n) x_i sum_(i=1)^(n) y_i) (n sum_(i=1)^ (n) x_i^2 - (sum_(i=1)^(n) x_i)^2)` (3.2)

Diese Formeln haben Lösungen, wenn `n > 1` (die Linie kann mit mindestens 2 Punkten gezogen werden) und wenn die Determinante `D = n sum_(i=1)^(n) x_i^2 — (sum_(i= 1 )^(n) x_i)^2 != 0`, d.h. wenn die "x_i"-Punkte im Experiment unterschiedlich sind (d. h. wenn die Linie nicht vertikal ist).

Schätzung von Fehlern in den Koeffizienten der Regressionslinie

Für eine genauere Schätzung des Fehlers bei der Berechnung der Koeffizienten "a" und "b" ist eine große Anzahl experimenteller Punkte wünschenswert. Wenn "n = 2" ist, ist es unmöglich, den Fehler der Koeffizienten abzuschätzen, weil die Annäherungslinie wird eindeutig durch zwei Punkte verlaufen.

Der Fehler der Zufallsvariablen "V" wird bestimmt Fehlerakkumulationsgesetz
`S_V^2 = sum_(i=1)^p (frac(partial f)(partial z_i))^2 S_(z_i)^2`,
wobei „p“ die Anzahl der „z_i“-Parameter mit dem „S_(z_i)“-Fehler ist, die den „S_V“-Fehler beeinflussen;
„f“ ist eine Abhängigkeitsfunktion von „V“ auf „z_i“.

Lassen Sie uns das Fehlerakkumulationsgesetz für den Fehler der Koeffizienten "a" und "b" schreiben
`S_a^2 = sum_(i=1)^(n)(frac(partial a)(partial y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(partial a )(Teil x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(Teil a)(Teil y_i))^2 `,
`S_b^2 = sum_(i=1)^(n)(frac(partial b)(partial y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(partial b )(partial x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(partial b)(partial y_i))^2 `,
Weil `S_(x_i)^2 = 0` (wir haben vorher reserviert, dass der Fehler von `x` vernachlässigbar ist).

„S_y^2 = S_(y_i)^2“ – der Fehler (Varianz, quadrierte Standardabweichung) in der „y“-Dimension, unter der Annahme, dass der Fehler für alle „y“-Werte einheitlich ist.

Durch Einsetzen von Formeln zur Berechnung von „a“ und „b“ in die resultierenden Ausdrücke erhalten wir

`S_a^2 = S_y^2 frac(sum_(i=1)^(n) (sum_(i=1)^(n) x_i^2 - x_i sum_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n sum_(i=1)^(n) x_i^2 - (sum_(i=1)^(n) x_i)^2) sum_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(sum_(i=1)^(n) x_i^2) (D)` (4.1)

`S_b^2 = S_y^2 frac(sum_(i=1)^(n) (n x_i - sum_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n Summe_(i=1)^(n) x_i^2 - (Summe_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 Frac(n) (D) ` (4.2)

In den meisten realen Experimenten wird der Wert von "Sy" nicht gemessen. Dazu ist es notwendig, mehrere parallele Messungen (Experimente) an einem oder mehreren Punkten des Plans durchzuführen, was die Zeit (und möglicherweise Kosten) des Experiments erhöht. Daher wird üblicherweise angenommen, dass die Abweichung von "y" von der Regressionsgeraden als zufällig betrachtet werden kann. Die Varianzschätzung "y" wird in diesem Fall durch die Formel berechnet.

`S_y^2 = S_(y, rest)^2 = frac(sum_(i=1)^n (y_i - a - b x_i)^2) (n-2)`.

Der Divisor „n-2“ erscheint, weil wir die Anzahl der Freiheitsgrade aufgrund der Berechnung von zwei Koeffizienten für dieselbe Probe von experimentellen Daten reduziert haben.

Diese Schätzung wird auch als Restvarianz relativ zur Regressionslinie „S_(y, rest)^2“ bezeichnet.

Die Bewertung der Signifikanz der Koeffizienten erfolgt nach dem Student-Kriterium

`t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)`

Wenn die berechneten Kriterien „t_a“, „t_b“ kleiner als die Tabellenkriterien „t(P, n – 2)“ sind, wird davon ausgegangen, dass der entsprechende Koeffizient mit einer gegebenen Wahrscheinlichkeit „P“ nicht signifikant von Null abweicht.

Um die Qualität der Beschreibung einer linearen Beziehung zu beurteilen, können Sie `S_(y, rest)^2` und `S_(bar y)` mit dem Fisher-Kriterium relativ zum Mittelwert vergleichen.

`S_(bar y) = frac(sum_(i=1)^n (y_i - bar y)^2) (n-1) = frac(sum_(i=1)^n (y_i - (sum_(i= 1)^n y_i) /n)^2) (n-1)` - Stichprobenschätzung der Varianz von `y` relativ zum Mittelwert.

Um die Wirksamkeit der Regressionsgleichung zur Beschreibung der Abhängigkeit zu bewerten, wird der Fisher-Koeffizient berechnet
`F = S_(bar y) / S_(y, rest)^2`,
der mit dem tabellarischen Fisher-Koeffizienten "F(p, n-1, n-2)" verglichen wird.

Wenn „F > F(P, n-1, n-2)“ ist, wird die Differenz zwischen der Beschreibung der Abhängigkeit „y = f(x)“ unter Verwendung der Regressionsgleichung und der Beschreibung unter Verwendung des Mittelwerts mit Wahrscheinlichkeit als statistisch signifikant angesehen "P". Diese. die Regression beschreibt die Abhängigkeit besser als die Streuung von 'y' um den Mittelwert.

Klicken Sie auf das Diagramm
Werte zur Tabelle hinzufügen

Methode der kleinsten Quadrate. Die Methode der kleinsten Quadrate bedeutet die Bestimmung unbekannter Parameter a, b, c, die akzeptierte funktionale Abhängigkeit

Die Methode der kleinsten Quadrate bedeutet die Bestimmung unbekannter Parameter a, b, c, … akzeptierte funktionelle Abhängigkeit

y = f(x,a,b,c,…),

was ein Minimum des mittleren Quadrats (Varianz) des Fehlers liefern würde

, (24)

wobei x i , y i - Satz von Zahlenpaaren, die aus dem Experiment erhalten wurden.

Da die Bedingung für das Extremum einer Funktion mehrerer Variablen die Bedingung ist, dass ihre partiellen Ableitungen gleich Null sind, dann die Parameter a, b, c, … werden aus dem Gleichungssystem bestimmt:

; ; ; … (25)

Es muss daran erinnert werden, dass die Methode der kleinsten Quadrate verwendet wird, um Parameter nach der Form der Funktion auszuwählen y = f(x) definiert.

Wenn aus theoretischen Überlegungen keine Rückschlüsse auf die empirische Formel gezogen werden können, muss man sich an visuellen Darstellungen orientieren, in erster Linie an einer grafischen Darstellung der beobachteten Daten.

In der Praxis meist auf folgende Arten von Funktionen beschränkt:

1) linear ;

2) quadratisch a .

Methode der kleinsten Quadrate

In der letzten Lektion des Themas lernen wir die bekannteste Anwendung kennen FNP, die in verschiedenen Bereichen der Wissenschaft und Praxis die breiteste Anwendung findet. Das können Physik, Chemie, Biologie, Wirtschaftswissenschaften, Soziologie, Psychologie und so weiter und so weiter sein. Durch den Willen des Schicksals muss ich mich oft mit der Wirtschaft auseinandersetzen, und deshalb arrangiere ich heute für Sie ein Ticket in ein erstaunliches Land namens Ökonometrie=) … Wie willst du das nicht?! Es ist sehr gut dort - Sie müssen sich nur entscheiden! …Aber was Sie wahrscheinlich auf jeden Fall wollen, ist zu lernen, wie man Probleme löst kleinsten Quadrate. Und besonders fleißige Leser werden lernen, sie nicht nur genau, sondern auch SEHR SCHNELL zu lösen ;-) Aber zuerst allgemeine Problemstellung+ zugehöriges Beispiel:

Lassen Sie Indikatoren in einigen Fachgebieten untersuchen, die einen quantitativen Ausdruck haben. Gleichzeitig gibt es allen Grund zu der Annahme, dass der Indikator vom Indikator abhängt. Diese Annahme kann sowohl eine wissenschaftliche Hypothese sein als auch auf elementarem gesunden Menschenverstand beruhen. Lassen wir die Wissenschaft jedoch beiseite und erkunden appetitlichere Bereiche – nämlich Lebensmittelgeschäfte. Bezeichnen durch:

– Verkaufsfläche eines Lebensmittelgeschäfts, qm,
- Jahresumsatz eines Lebensmittelgeschäfts, Millionen Rubel.

Es ist ganz klar, dass je größer die Fläche des Ladens ist, desto größer ist in den meisten Fällen der Umsatz.

Angenommen, wir haben nach Beobachtungen / Experimenten / Berechnungen / Tanzen mit einem Tamburin numerische Daten zur Verfügung:

Bei Lebensmittelgeschäften ist meines Erachtens alles klar: - das ist die Fläche des 1. Ladens, - sein Jahresumsatz, - die Fläche des 2. Ladens, - sein Jahresumsatz usw. Übrigens ist es überhaupt nicht erforderlich, Zugang zu Verschlusssachen zu haben - eine ziemlich genaue Einschätzung des Umsatzes kann mit erhalten werden mathematische Statistik. Lassen Sie sich jedoch nicht ablenken, der Kurs der Wirtschaftsspionage ist bereits bezahlt =)

Auch tabellarische Daten können in Form von Punkten geschrieben und wie bei uns gewohnt dargestellt werden. Kartesisches System .

Lassen Sie uns eine wichtige Frage beantworten: Wie viele Punkte braucht man für eine qualitative Studie?

Je mehr desto besser. Der minimal zulässige Satz besteht aus 5-6 Punkten. Darüber hinaus sollten bei einer geringen Datenmenge „auffällige“ Ergebnisse nicht in die Stichprobe aufgenommen werden. So kann beispielsweise ein kleiner Elite-Laden um Größenordnungen mehr aushelfen als „ihre Kollegen“, wodurch das allgemeine Muster, das gefunden werden muss, verzerrt wird!



Wenn es ganz einfach ist, müssen wir eine Funktion auswählen, zeitlicher Ablauf die so nah wie möglich an den Punkten vorbeigeht . Eine solche Funktion wird aufgerufen Annäherung (Annäherung - Annäherung) oder theoretische Funktion . Im Allgemeinen erscheint hier sofort ein offensichtlicher "Anwärter" - ein Polynom hohen Grades, dessen Graph ALLE Punkte durchläuft. Aber diese Option ist kompliziert und oft einfach falsch. (weil sich der Chart die ganze Zeit „windet“ und den Haupttrend schlecht widerspiegelt).

Die gewünschte Funktion muss also hinreichend einfach sein und gleichzeitig die Abhängigkeit adäquat widerspiegeln. Wie Sie sich vorstellen können, wird eine der Methoden zum Auffinden solcher Funktionen aufgerufen kleinsten Quadrate. Lassen Sie uns zuerst seine Essenz auf allgemeine Weise analysieren. Lassen Sie eine Funktion die experimentellen Daten approximieren:


Wie ist die Genauigkeit dieser Annäherung zu bewerten? Lassen Sie uns auch die Unterschiede (Abweichungen) zwischen den experimentellen und funktionalen Werten berechnen (wir studieren die Zeichnung). Der erste Gedanke, der mir in den Sinn kommt, ist zu schätzen, wie groß die Summe ist, aber das Problem ist, dass die Unterschiede negativ sein können. (zum Beispiel, ) und Abweichungen als Ergebnis einer solchen Summierung heben sich gegenseitig auf. Als Abschätzung der Genauigkeit der Näherung bietet es sich daher an, die Summe zu nehmen Module Abweichungen:

oder in gefalteter Form: (für die die es nicht wissen: ist das Summensymbol und - Hilfsvariable - "Zähler", der Werte von 1 bis annimmt ) .

Wenn wir die experimentellen Punkte mit unterschiedlichen Funktionen annähern, erhalten wir unterschiedliche Werte, und es ist offensichtlich, wo diese Summe kleiner ist - diese Funktion ist genauer.

Eine solche Methode existiert und wird aufgerufen Methode des kleinsten Moduls. In der Praxis ist es jedoch viel weiter verbreitet. Methode der kleinsten Quadrate, bei dem mögliche negative Werte nicht durch den Modul, sondern durch Quadrieren der Abweichungen eliminiert werden:



, wonach sich die Bemühungen auf die Auswahl einer solchen Funktion richten, die die Summe der quadrierten Abweichungen ist war so klein wie möglich. Daher der Name der Methode.

Und jetzt kehren wir zu einem weiteren wichtigen Punkt zurück: Wie oben angemerkt, sollte die ausgewählte Funktion recht einfach sein - aber es gibt auch viele solcher Funktionen: linear , hyperbolisch , exponentiell , logarithmisch , quadratisch usw. Und natürlich möchte ich hier sofort "das Betätigungsfeld reduzieren". Welche Klasse von Funktionen für die Forschung wählen? Primitive, aber effektive Technik:

- Der einfachste Weg, Punkte zu zeichnen auf der Zeichnung und analysieren Sie ihre Position. Wenn sie dazu neigen, in einer geraden Linie zu sein, dann sollten Sie suchen Gerade Gleichung mit optimalen Werten und . Mit anderen Worten, die Aufgabe besteht darin, SOLCHE Koeffizienten zu finden - damit die Summe der quadrierten Abweichungen am kleinsten ist.

Wenn sich die Punkte beispielsweise entlang befinden Hyperbel, dann ist klar, dass die lineare Funktion eine schlechte Annäherung ergibt. In diesem Fall suchen wir nach den „günstigsten“ Koeffizienten für die Hyperbelgleichung - diejenigen, die die kleinste Quadratsumme ergeben .

Beachten Sie nun, dass wir in beiden Fällen darüber sprechen Funktionen zweier Variablen, deren Argumente sind gesuchte Abhängigkeitsoptionen:

Und im Wesentlichen müssen wir ein Standardproblem lösen - zu finden Minimum einer Funktion von zwei Variablen.

Erinnern Sie sich an unser Beispiel: Angenommen, die "Shop"-Punkte befinden sich tendenziell in einer geraden Linie und es gibt allen Grund, an das Vorhandensein zu glauben lineare Abhängigkeit Umsätze aus dem Handelsbereich. Lassen Sie uns SOLCHE Koeffizienten "a" und "be" finden, damit die Summe der quadrierten Abweichungen war der kleinste. Alles wie gewohnt - zuerst partielle Ableitungen 1. Ordnung. Entsprechend Linearitätsregel Sie können direkt unter dem Summensymbol unterscheiden:

Falls Sie diese Informationen für eine Hausarbeit oder eine Hausarbeit verwenden möchten, bin ich für den Link im Quellenverzeichnis sehr dankbar, solche ausführlichen Berechnungen finden Sie nirgendwo:

Lassen Sie uns ein Standardsystem erstellen:

Wir kürzen jede Gleichung um eine „Zwei“ und „zerlegen“ zusätzlich die Summen:

Notiz : Analysieren Sie selbstständig, warum "a" und "be" aus dem Summensymbol herausgenommen werden können. Formal geht das übrigens mit der Summe

Lassen Sie uns das System in einer "angewendeten" Form umschreiben:

Danach beginnt der Algorithmus zur Lösung unseres Problems zu zeichnen:

Kennen wir die Koordinaten der Punkte? Wir wissen. Summen können wir finden? Leicht. Wir komponieren die einfachsten System aus zwei linearen Gleichungen mit zwei Unbekannten("a" und "beh"). Wir lösen das System zum Beispiel Cramers Methode, was zu einem stationären Punkt führt . Überprüfung hinreichende Bedingung für ein Extremum, können wir an dieser Stelle die Funktion verifizieren erreicht genau Minimum. Die Überprüfung ist mit zusätzlichen Berechnungen verbunden und wird daher hinter den Kulissen gelassen. (ggf. kann der fehlende Frame angeschaut werdenhier ) . Wir ziehen das abschließende Fazit:

Funktion der beste Weg (zumindest im Vergleich zu jeder anderen linearen Funktion) bringt experimentelle Punkte näher . Grob gesagt verläuft sein Graph so nah wie möglich an diesen Punkten. Traditionell Ökonometrie die resultierende Näherungsfunktion wird auch aufgerufen gepaarte lineare Regressionsgleichung .

Das betrachtete Problem ist von großer praktischer Bedeutung. In der Situation mit unserem Beispiel ist die Gleichung ermöglicht es Ihnen, vorherzusagen, welche Art von Umsatz ("yig") wird im Laden mit dem einen oder anderen Wert der Verkaufsfläche sein (die eine oder andere Bedeutung von "x"). Ja, die resultierende Prognose wird nur eine Prognose sein, aber in vielen Fällen wird sie sich als ziemlich genau herausstellen.

Ich werde nur ein Problem mit "echten" Zahlen analysieren, da es keine Schwierigkeiten gibt - alle Berechnungen befinden sich auf dem Niveau des Schullehrplans in den Klassen 7-8. In 95 Prozent der Fälle werden Sie gebeten, nur eine lineare Funktion zu finden, aber ganz am Ende des Artikels werde ich zeigen, dass es nicht mehr schwierig ist, die Gleichungen für die optimale Hyperbel, den Exponenten und einige andere Funktionen zu finden.

Tatsächlich bleibt es, die versprochenen Leckereien zu verteilen - damit Sie lernen, solche Beispiele nicht nur genau, sondern auch schnell zu lösen. Wir studieren den Standard sorgfältig:

Eine Aufgabe

Als Ergebnis der Untersuchung der Beziehung zwischen zwei Indikatoren wurden die folgenden Zahlenpaare erhalten:

Finden Sie mit der Methode der kleinsten Quadrate die lineare Funktion, die die empirische Funktion am besten annähert (erfahren) Daten. Fertigen Sie eine Zeichnung an, auf der Sie in einem rechtwinkligen kartesischen Koordinatensystem experimentelle Punkte und einen Graphen der Annäherungsfunktion darstellen . Ermitteln Sie die Summe der quadrierten Abweichungen zwischen empirischen und theoretischen Werten. Finden Sie heraus, ob die Funktion besser ist (nach der Methode der kleinsten Quadrate) ungefähre experimentelle Punkte.

Beachten Sie, dass „x“-Werte natürliche Werte sind und dies eine charakteristische bedeutungsvolle Bedeutung hat, auf die ich später noch eingehen werde. aber sie können natürlich gebrochen sein. Darüber hinaus können je nach Inhalt einer bestimmten Aufgabe sowohl die „X“- als auch die „G“-Werte ganz oder teilweise negativ sein. Nun, wir haben eine „gesichtslose“ Aufgabe bekommen, und wir beginnen damit Lösung:

Wir finden die Koeffizienten der optimalen Funktion als Lösung des Systems:

Im Sinne einer kompakteren Schreibweise kann die Variable „Zähler“ weggelassen werden, da bereits klar ist, dass von 1 bis summiert wird.

Bequemer ist es, die benötigten Mengen tabellarisch zu berechnen:


Berechnungen können auf einem Mikrorechner durchgeführt werden, aber es ist viel besser, Excel zu verwenden - sowohl schneller als auch fehlerfrei. Sehen Sie sich ein kurzes Video an:

Somit erhalten wir folgendes System:

Hier kannst du die zweite Gleichung mit 3 multiplizieren und die 2. von der 1. Gleichung Term für Term subtrahieren. Aber das ist Glück - in der Praxis sind Systeme oft nicht begabt, und in solchen Fällen spart es Cramers Methode:
, also hat das System eine eindeutige Lösung.

Lassen Sie uns einen Check machen. Ich verstehe, dass ich das nicht möchte, aber warum Fehler überspringen, wo man sie absolut nicht übersehen kann? Setzen Sie die gefundene Lösung in die linke Seite jeder Gleichung des Systems ein:

Es werden die richtigen Teile der entsprechenden Gleichungen erhalten, was bedeutet, dass das System richtig gelöst ist.

Damit ist die gesuchte Näherungsfunktion: – von alle linearen Funktionen experimentelle Daten werden dadurch am besten angenähert.

Im Gegensatz zu gerade Abhängigkeit des Umsatzes des Ladens von seiner Fläche, die gefundene Abhängigkeit ist umkehren (Prinzip "je mehr - desto weniger"), und diese Tatsache wird sofort durch das Negativ offenbart Winkelkoeffizient. Funktion teilt uns mit, dass bei einer Erhöhung eines bestimmten Indikators um 1 Einheit der Wert des abhängigen Indikators abnimmt im mittleren um 0,65 Einheiten. Wie sie sagen, je höher der Buchweizenpreis, desto weniger wird verkauft.

Um die Näherungsfunktion darzustellen, finden wir zwei ihrer Werte:

und führe die Zeichnung aus:

Die konstruierte Linie wird aufgerufen Trendlinie (nämlich eine lineare Trendlinie, d.h. im allgemeinen Fall ist ein Trend nicht unbedingt eine gerade Linie). Jeder kennt den Ausdruck „im Trend sein“, und ich denke, dass dieser Begriff keiner weiteren Erläuterung bedarf.

Berechnen Sie die Summe der quadrierten Abweichungen zwischen empirischen und theoretischen Werten. Geometrisch ist dies die Summe der Quadrate der Längen der „roten“ Segmente (zwei davon sind so klein, dass man sie nicht einmal sehen kann).

Fassen wir die Berechnungen in einer Tabelle zusammen:


Sie können wieder manuell ausgeführt werden, nur für den Fall, dass ich ein Beispiel für den 1. Punkt gebe:

aber es ist viel effizienter, den bereits bekannten Weg zu gehen:

Wiederholen wir: was bedeutet das Ergebnis? Aus alle linearen Funktionen Funktion der Exponent ist der kleinste, das heißt, er ist die beste Annäherung in seiner Familie. Und hier ist übrigens die letzte Frage des Problems nicht zufällig: Was wäre, wenn die vorgeschlagene Exponentialfunktion Ist es besser, die experimentellen Punkte anzunähern?

Lassen Sie uns die entsprechende Summe der quadratischen Abweichungen finden - um sie zu unterscheiden, werde ich sie mit dem Buchstaben "Epsilon" bezeichnen. Die Technik ist genau die gleiche:


Und nochmal für jede Brandberechnung für den 1. Punkt:

In Excel verwenden wir die Standardfunktion EXP (Syntax finden Sie in der Excel-Hilfe).

Fazit: , also approximiert die Exponentialfunktion die experimentellen Punkte schlechter als die Gerade .

Aber es sollte hier angemerkt werden, dass "schlimmer" ist heißt noch nicht, Was ist falsch. Jetzt habe ich einen Graphen dieser Exponentialfunktion gebaut - und sie geht auch nahe an den Punkten vorbei - so sehr, dass es ohne eine analytische Studie schwierig ist zu sagen, welche Funktion genauer ist.

Damit ist die Lösung abgeschlossen, und ich komme auf die Frage nach den natürlichen Werten des Arguments zurück. In diversen Studien werden in der Regel wirtschafts- oder soziologische Monate, Jahre oder andere gleiche Zeitintervalle mit natürlichen „X“ nummeriert. Betrachten Sie beispielsweise das folgende Problem:

Für das erste Halbjahr liegen uns folgende Daten zum Einzelhandelsumsatz des Ladens vor:

Ermitteln Sie mithilfe der geradlinigen analytischen Ausrichtung das Verkaufsvolumen für Juli.

Ja, kein Problem: Wir nummerieren die Monate 1, 2, 3, 4, 5, 6 und verwenden den üblichen Algorithmus, wodurch wir eine Gleichung erhalten - das einzige, was in Bezug auf die Zeit der Fall ist, ist normalerweise der Buchstabe "te " (obwohl es nicht kritisch ist). Die resultierende Gleichung zeigt, dass der Umsatz im ersten Halbjahr um durchschnittlich 27,74 WE gestiegen ist. pro Monat. Holen Sie sich eine Prognose für Juli (Monat #7): EU.

Und ähnliche Aufgaben - die Dunkelheit ist dunkel. Wer möchte, kann einen zusätzlichen Service nutzen, nämlich my Excel-Rechner (Demoversion), was die löst das Problem fast sofort! Die Arbeitsversion des Programms ist verfügbar im Austausch oder für symbolische Zahlung.

Am Ende der Lektion eine kurze Information über das Finden von Abhängigkeiten einiger anderer Typen. Eigentlich gibt es nichts Besonderes zu sagen, da der grundsätzliche Ansatz und der Lösungsalgorithmus gleich bleiben.

Nehmen wir an, die Lage der Versuchspunkte gleicht einer Hyperbel. Um dann die Koeffizienten der besten Hyperbel zu finden, müssen Sie das Minimum der Funktion finden - wer möchte, kann detaillierte Berechnungen durchführen und zu einem ähnlichen System kommen:

Formaltechnisch ergibt es sich aus dem „linearen“ System (Markieren wir es mit einem Sternchen)"x" durch ersetzen. Nun, die Mengen berechnen, danach zu den optimalen Koeffizienten "a" und "be" zur Hand.

Wenn es allen Grund zu der Annahme gibt, dass die Punkte entlang einer logarithmischen Kurve angeordnet sind, um dann nach den optimalen Werten zu suchen und das Minimum der Funktion zu finden . Formal sollte im System (*) ersetzt werden durch:

Verwenden Sie beim Rechnen in Excel die Funktion LN. Ich gestehe, dass es mir nicht schwer fallen wird, für jeden der betrachteten Fälle Rechner zu erstellen, aber es wird immer noch besser sein, wenn Sie die Berechnungen selbst „programmieren“. Video-Tutorials helfen dabei.

Bei der exponentiellen Abhängigkeit ist die Situation etwas komplizierter. Um die Angelegenheit auf den linearen Fall zu reduzieren, nehmen wir den Logarithmus der Funktion und verwenden Eigenschaften des Logarithmus:

Wenn wir nun die erhaltene Funktion mit der linearen Funktion vergleichen, kommen wir zu dem Schluss, dass im System (*) durch , und - durch ersetzt werden muss. Der Einfachheit halber bezeichnen wir:

Bitte beachten Sie, dass das System in Bezug auf und aufgelöst wird, und deshalb dürfen Sie nach dem Finden der Wurzeln nicht vergessen, den Koeffizienten selbst zu finden.

Experimentelle Punkte annähern optimale Parabel , sollte gefunden werden Minimum einer Funktion von drei Variablen . Nach dem Ausführen von Standardaktionen erhalten wir das folgende "funktionieren" System:

Ja, natürlich gibt es hier mehr Beträge, aber es gibt überhaupt keine Schwierigkeiten, wenn Sie Ihre Lieblingsanwendung verwenden. Und zum Schluss erkläre ich Ihnen, wie Sie schnell mit Excel überprüfen und die gewünschte Trendlinie erstellen: Erstellen Sie ein Streudiagramm, wählen Sie einen der Punkte mit der Maus aus und Rechtsklick Option auswählen "Trendlinie hinzufügen". Wählen Sie als Nächstes den Diagrammtyp und auf der Registerkarte aus "Optionen" Option aktivieren "Gleichung im Diagramm anzeigen". OK

Wie immer möchte ich den Artikel mit einem schönen Satz beenden, und ich hätte fast „Be in trend!“ getippt. Aber mit der Zeit änderte er seine Meinung. Und nicht, weil es formelhaft ist. Ich weiß nicht, wie jemand, aber ich möchte überhaupt nicht dem geförderten amerikanischen und vor allem europäischen Trend folgen =) Daher wünsche ich jedem von euch, dass er seiner eigenen Linie treu bleibt!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

Die Methode der kleinsten Quadrate ist aufgrund ihrer Eigenschaften eine der gebräuchlichsten und am weitesten entwickelten Einfachheit und Effizienz von Methoden zur Schätzung der Parameter linearer ökonometrischer Modelle. Gleichzeitig ist bei der Verwendung eine gewisse Vorsicht geboten, da die damit erstellten Modelle möglicherweise eine Reihe von Anforderungen an die Qualität ihrer Parameter nicht erfüllen und daher die Muster der Prozessentwicklung nicht „gut“ widerspiegeln.

Betrachten wir das Verfahren zur Schätzung der Parameter eines linearen ökonometrischen Modells nach der Methode der kleinsten Quadrate genauer. Ein solches Modell in allgemeiner Form lässt sich durch Gleichung (1.2) darstellen:

y t = ein 0 + ein 1 x 1t +...+ ein n x nt + ε t .

Die Anfangsdaten beim Schätzen der Parameter a 0 , a 1 ,..., a n sind der Vektor der Werte der abhängigen Variablen j= (y 1 , y 2 , ... , y T)" und die Matrix der Werte unabhängiger Variablen

wobei die erste Spalte, bestehend aus Einsen, dem Koeffizienten des Modells entspricht.

Die Methode der kleinsten Quadrate erhielt ihren Namen aufgrund des Grundprinzips, das die auf ihrer Grundlage erhaltenen Parameterschätzungen erfüllen sollten: die Summe der Quadrate des Modellfehlers sollte minimal sein.

Beispiele für die Lösung von Problemen nach der Methode der kleinsten Quadrate

Beispiel 2.1. Das Handelsunternehmen verfügt über ein Netz, das aus 12 Geschäften besteht, deren Aktivitäten in der Tabelle dargestellt sind. 2.1.

Die Unternehmensleitung möchte wissen, wie die Höhe des Jahresumsatzes von der Verkaufsfläche des Ladens abhängt.

Tabelle 2.1

Geschäftsnummer Jahresumsatz, Millionen Rubel Handelsfläche, tausend m 2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

Lösung der kleinsten Quadrate. Bestimmen wir - den Jahresumsatz des -ten Geschäfts, Millionen Rubel; - Verkaufsfläche des Geschäfts, Tausend m 2.

Abb.2.1. Streudiagramm für Beispiel 2.1

Bestimmung der Form des funktionalen Zusammenhangs zwischen den Variablen und Erstellung eines Streudiagramms (Abb. 2.1).

Anhand des Streudiagramms können wir schließen, dass der Jahresumsatz positiv von der Verkaufsfläche abhängt (d. h. y wird mit dem Wachstum von zunehmen). Die geeignetste Form der funktionalen Verbindung ist linear.

Informationen für weitere Berechnungen sind in der Tabelle dargestellt. 2.2. Mit der Methode der kleinsten Quadrate schätzen wir die Parameter des linearen ökonometrischen Ein-Faktor-Modells

Tabelle 2.2

t und t x 1t ja t 2 x1t2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
Durchschnitt 68,29 0,89

Auf diese Weise,

Bei einer Vergrößerung der Handelsfläche um 1.000 m 2 steigt der durchschnittliche Jahresumsatz unter sonst gleichen Bedingungen also um 67,8871 Mio. Rubel.

Beispiel 2.2. Der Unternehmensleitung ist aufgefallen, dass der Jahresumsatz nicht nur von der Verkaufsfläche des Ladens abhängt (siehe Beispiel 2.1), sondern auch von der durchschnittlichen Besucherzahl. Die relevanten Informationen sind in der Tabelle dargestellt. 2.3.

Tabelle 2.3

Lösung. Bezeichnen Sie - die durchschnittliche Anzahl der Besucher des Geschäfts pro Tag, tausend Personen.

Bestimmung der Form des funktionalen Zusammenhangs zwischen den Variablen und Erstellung eines Streudiagramms (Abb. 2.2).

Anhand des Streudiagramms können wir schließen, dass der Jahresumsatz positiv mit der durchschnittlichen Besucherzahl pro Tag zusammenhängt (d. h. y wird mit dem Wachstum von zunehmen). Die Form der funktionalen Abhängigkeit ist linear.

Reis. 2.2. Streudiagramm zum Beispiel 2.2

Tabelle 2.4

t x 2t x 2t 2 yt x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
Durchschnitt 10,65

Im Allgemeinen ist es notwendig, die Parameter des zweifaktoriellen ökonometrischen Modells zu bestimmen

y t \u003d ein 0 + ein 1 x 1t + ein 2 x 2t + ε t

Die für weitere Berechnungen erforderlichen Informationen sind in der Tabelle dargestellt. 2.4.

Lassen Sie uns die Parameter eines linearen ökonometrischen Zwei-Faktoren-Modells mit der Methode der kleinsten Quadrate schätzen.

Auf diese Weise,

Die Auswertung des Koeffizienten = 61,6583 zeigt, dass bei sonst gleichen Bedingungen bei einer Vergrößerung der Handelsfläche um 1 Tausend m 2 der Jahresumsatz um durchschnittlich 61,6583 Millionen Rubel steigen wird.

Die Schätzung des Koeffizienten = 2,2748 zeigt, dass unter sonst gleichen Bedingungen die durchschnittliche Besucherzahl pro 1.000 Einwohner zunimmt. pro Tag wird der Jahresumsatz um durchschnittlich 2,2748 Millionen Rubel steigen.

Beispiel 2.3. Verwenden Sie die Informationen in der Tabelle. 2.2 und 2.4, schätzen den Parameter eines einfaktoriellen ökonometrischen Modells

wo ist der zentrierte Wert des Jahresumsatzes des -ten Geschäfts, Millionen Rubel; - zentrierter Wert der durchschnittlichen täglichen Besucherzahl des t-ten Geschäfts, Tausend Personen. (siehe Beispiele 2.1-2.2).

Lösung. Zusätzliche Informationen, die für Berechnungen erforderlich sind, sind in der Tabelle aufgeführt. 2.5.

Tabelle 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Summe 48,4344 431,0566

Mit Formel (2.35) erhalten wir

Auf diese Weise,

http://www.cleverstudents.ru/articles/mnk.html

Beispiel.

Experimentelle Daten zu den Werten von Variablen X und bei sind in der Tabelle angegeben.

Durch ihre Ausrichtung wird die Funktion

Verwenden Methode der kleinsten Quadrate, approximieren diese Daten mit einer linearen Abhängigkeit y=ax+b(Parameter suchen a und b). Finden Sie heraus, welche der beiden Linien besser (im Sinne der Methode der kleinsten Quadrate) die experimentellen Daten ausrichtet. Fertige eine Zeichnung an.

Lösung.

In unserem Beispiel n=5. Wir füllen die Tabelle aus, um die Beträge zu berechnen, die in den Formeln der erforderlichen Koeffizienten enthalten sind.

Die Werte in der vierten Zeile der Tabelle erhält man, indem man für jede Zahl die Werte der 2. Zeile mit den Werten der 3. Zeile multipliziert ich.

Die Werte in der fünften Zeile der Tabelle erhält man durch Quadrieren der Werte der 2. Zeile für jede Zahl ich.

Die Werte der letzten Spalte der Tabelle sind die Summen der Werte über die Zeilen hinweg.

Wir verwenden die Formeln der Methode der kleinsten Quadrate, um die Koeffizienten zu finden a und b. Wir ersetzen in ihnen die entsprechenden Werte aus der letzten Spalte der Tabelle:

Folglich, y=0,165x+2,184 die gesuchte Näherungsgerade ist.

Es bleibt herauszufinden, welche der Linien y=0,165x+2,184 oder nähert sich den Originaldaten besser an, d.h. um eine Schätzung nach der Methode der kleinsten Quadrate vorzunehmen.

Nachweisen.

Also wenn gefunden a und b Funktion den kleinsten Wert annimmt, ist es notwendig, dass an dieser Stelle die Matrix der quadratischen Form des Differentials zweiter Ordnung für die Funktion war positiv bestimmt. Zeigen wir es.

Das Differential zweiter Ordnung hat die Form:

Also

Daher hat die Matrix der quadratischen Form die Form

und die Werte der Elemente hängen nicht davon ab a und b.

Zeigen wir, dass die Matrix positiv definit ist. Dies erfordert, dass die Nebenwinkel positiv sind.

Eckiges Moll erster Ordnung . Die Ungleichheit ist streng, da die Punkte

  • Einführungsstunde ist gratis;
  • Eine große Anzahl erfahrener Lehrer (muttersprachlich und russischsprachig);
  • Kurse NICHT für einen bestimmten Zeitraum (Monat, Halbjahr, Jahr), sondern für eine bestimmte Anzahl von Unterrichtsstunden (5, 10, 20, 50);
  • Über 10.000 zufriedene Kunden.
  • Die Kosten für eine Unterrichtsstunde mit einem russischsprachigen Lehrer - ab 600 Rubel, mit einem Muttersprachler - ab 1500 Rubel

Die Essenz der Methode der kleinsten Quadrate ist beim Finden der Parameter eines Trendmodells, das den Entwicklungstrend eines zufälligen Phänomens in Zeit oder Raum am besten beschreibt (ein Trend ist eine Linie, die den Trend dieser Entwicklung charakterisiert). Die Aufgabe der Methode der kleinsten Quadrate (OLS) besteht darin, nicht nur irgendein Trendmodell zu finden, sondern das beste oder optimale Modell zu finden. Dieses Modell ist optimal, wenn die Summe der quadrierten Abweichungen zwischen den beobachteten Ist-Werten und den entsprechenden berechneten Trendwerten minimal (am kleinsten) ist:

wo ist die Standardabweichung zwischen den beobachteten tatsächlichen Werten

und dem entsprechenden berechneten Trendwert,

Der tatsächliche (beobachtete) Wert des untersuchten Phänomens,

Geschätzter Wert des Trendmodells,

Die Anzahl der Beobachtungen des untersuchten Phänomens.

MNC wird selten allein verwendet. In der Regel wird es meistens nur als notwendige Technik in Korrelationsstudien verwendet. Dabei ist zu beachten, dass die Informationsgrundlage der LSM nur eine verlässliche statistische Reihe sein kann und die Anzahl der Beobachtungen nicht kleiner als 4 sein sollte, da sonst die Glättungsverfahren der LSM ihren Sinn verlieren könnten.

Das OLS-Toolkit ist auf folgende Verfahren reduziert:

Erstes Verfahren. Es stellt sich heraus, ob es überhaupt eine Tendenz gibt, das resultierende Attribut zu ändern, wenn sich das gewählte Faktor-Argument ändert, oder anders gesagt, ob es einen Zusammenhang gibt zwischen " bei " und " X ».

Zweites Verfahren. Es wird bestimmt, welche Linie (Trajektorie) diesen Trend am besten beschreiben bzw. charakterisieren kann.

Drittes Verfahren.

Beispiel. Angenommen, wir haben Informationen über den durchschnittlichen Sonnenblumenertrag für den untersuchten Betrieb (Tabelle 9.1).

Tabelle 9.1

Beobachtungsnummer

Produktivität, c/ha

Da sich der technologische Stand der Sonnenblumenproduktion in unserem Land in den letzten 10 Jahren nicht wesentlich verändert hat, bedeutet dies, dass die Ertragsschwankungen im analysierten Zeitraum höchstwahrscheinlich sehr stark von Schwankungen der Wetter- und Klimabedingungen abhingen. Ist es wahr?

Erstes MNC-Verfahren. Die Hypothese über die Existenz eines Trends in der Änderung des Sonnenblumenertrags in Abhängigkeit von Änderungen der Wetter- und Klimabedingungen über die analysierten 10 Jahre wird getestet.

In diesem Beispiel für " j » Es ist ratsam, den Ertrag von Sonnenblumen zu nehmen, und für « x » ist die Nummer des beobachteten Jahres im analysierten Zeitraum. Testen der Hypothese über die Existenz einer Beziehung zwischen " x " und " j » kann auf zwei Arten erfolgen: manuell und mit Hilfe von Computerprogrammen. Mit der Verfügbarkeit von Computertechnologie wird dieses Problem natürlich von selbst gelöst. Um das OLS-Toolkit besser zu verstehen, ist es jedoch ratsam, die Hypothese über die Existenz einer Beziehung zwischen " x " und " j » manuell, wenn nur ein Stift und ein gewöhnlicher Taschenrechner zur Hand sind. In solchen Fällen wird die Hypothese des Vorhandenseins eines Trends am besten visuell durch die Position des grafischen Bildes der analysierten Zeitreihe - dem Korrelationsfeld - überprüft:

Das Korrelationsfeld liegt in unserem Beispiel um eine langsam ansteigende Linie herum. Dies allein weist auf das Vorhandensein eines bestimmten Trends bei der Änderung des Sonnenblumenertrags hin. Es ist unmöglich, nur dann über das Vorhandensein eines Trends zu sprechen, wenn das Korrelationsfeld wie ein Kreis, ein Kreis, eine streng vertikale oder streng horizontale Wolke aussieht oder aus zufällig verstreuten Punkten besteht. In allen anderen Fällen ist es notwendig, die Hypothese des Bestehens einer Beziehung zwischen " x " und " j und forsche weiter.

Zweites MNC-Verfahren. Es wird bestimmt, welche Linie (Trajektorie) den Trend der Sonnenblumenertragsänderungen für den analysierten Zeitraum am besten beschreiben oder charakterisieren kann.

Mit der Verfügbarkeit von Computertechnologie erfolgt die Auswahl des optimalen Trends automatisch. Bei der "manuellen" Verarbeitung erfolgt die Auswahl der optimalen Funktion in der Regel visuell - durch die Lage des Korrelationsfeldes. Das heißt, je nach Diagrammtyp wird die Liniengleichung gewählt, die am besten zum empirischen Trend (zur tatsächlichen Trajektorie) passt.

Wie Sie wissen, gibt es in der Natur eine Vielzahl funktionaler Abhängigkeiten, daher ist es äußerst schwierig, auch nur einen kleinen Teil davon visuell zu analysieren. Glücklicherweise können in der realen Wirtschaftspraxis die meisten Beziehungen entweder durch eine Parabel, eine Hyperbel oder eine gerade Linie genau beschrieben werden. Dabei können Sie sich mit der Option „manuell“ zur Auswahl der besten Funktion auf diese drei Modelle beschränken.

Hyperbel:

Parabel zweiter Ordnung: :

Es ist leicht zu erkennen, dass in unserem Beispiel der Trend der Sonnenblumenertragsänderungen über die analysierten 10 Jahre am besten durch eine gerade Linie charakterisiert wird, sodass die Regressionsgleichung eine gerade Linie sein wird.

Drittes Verfahren. Die Parameter der Regressionsgleichung, die diese Linie charakterisieren, werden berechnet, oder anders ausgedrückt, es wird eine analytische Formel bestimmt, die das beste Trendmodell beschreibt.

Das Finden der Werte der Parameter der Regressionsgleichung, in unserem Fall der Parameter und , ist der Kern des LSM. Dieser Prozess reduziert sich auf das Lösen eines Systems von Normalgleichungen.

(9.2)

Dieses Gleichungssystem lässt sich recht einfach mit der Gauß-Methode lösen. Denken Sie daran, dass als Ergebnis der Lösung in unserem Beispiel die Werte der Parameter und gefunden werden. Somit hat die gefundene Regressionsgleichung die folgende Form:

Auswahl der Art der Regressionsfunktion, d.h. die Art des betrachteten Modells der Abhängigkeit von Y von X (oder X von Y), zum Beispiel ein lineares Modell y x = a + bx, ist es notwendig, die spezifischen Werte der Koeffizienten des Modells zu bestimmen.

Für unterschiedliche Werte von a und b ist es möglich, unendlich viele Abhängigkeiten der Form y x = a+bx zu konstruieren, d. H. Es gibt unendlich viele Linien auf der Koordinatenebene, aber wir brauchen eine solche Abhängigkeit, dass entspricht am besten den beobachteten Werten. Somit reduziert sich das Problem auf die Auswahl der besten Koeffizienten.

Wir suchen eine lineare Funktion a + bx, die nur auf einer bestimmten Anzahl verfügbarer Beobachtungen basiert. Um die Funktion mit der besten Anpassung an die beobachteten Werte zu finden, verwenden wir die Methode der kleinsten Quadrate.

Bezeichne: Y i - der durch die Gleichung berechnete Wert Y i = a + bx i . y i - gemessener Wert, ε i = y i - Y i - Differenz zwischen den gemessenen und berechneten Werten, ε i = y i - a-bx i .

Die Methode der kleinsten Quadrate erfordert, dass ε i , die Differenz zwischen dem gemessenen y i und den aus der Gleichung berechneten Werten von Y i , minimal ist. Daher finden wir die Koeffizienten a und b so, dass die Summe der quadrierten Abweichungen der beobachteten Werte von den Werten auf der geraden Regressionslinie am kleinsten ist:

Durch Untersuchung dieser Funktion der Argumente a und mit Hilfe von Ableitungen nach einem Extremum können wir beweisen, dass die Funktion einen minimalen Wert annimmt, wenn die Koeffizienten a und b Lösungen des Systems sind:

(2)

Wenn wir beide Seiten der Normalgleichungen durch n dividieren, erhalten wir:

Angesichts dessen (3)

Erhalten , von hier aus, indem wir den Wert von a in die erste Gleichung einsetzen, erhalten wir:

In diesem Fall wird b als Regressionskoeffizient bezeichnet; a heißt das freie Mitglied der Regressionsgleichung und wird nach folgender Formel berechnet:

Die resultierende Gerade ist ein Schätzwert für die theoretische Regressionsgerade. Wir haben:

So, ist eine lineare Regressionsgleichung.

Die Regression kann direkt (b>0) und invers (b Beispiel 1) sein. Die Ergebnisse der Messung der X- und Y-Werte sind in der Tabelle angegeben:

x ich -2 0 1 2 4
y ich 0.5 1 1.5 2 3

Unter der Annahme, dass es eine lineare Beziehung zwischen X und Y y=a+bx gibt, bestimmen Sie die Koeffizienten a und b mit der Methode der kleinsten Quadrate.

Lösung. Hier ist n = 5
x i = –2 + 0 + 1 + 2 + 4 = 5;
x ich 2 = 4 + 0 + 1 + 4 + 16 = 25
x ich y ich =-2 0,5 + 0 1 + 1 1,5 + 2 2 + 4 3 = 16,5
yi = 0,5 + 1 + 1,5 + 2 + 3 = 8

und das normale System (2) hat die Form

Wenn wir dieses System lösen, erhalten wir: b=0,425, a=1,175. Daher y=1,175+0,425x.

Beispiel 2. Es gibt eine Stichprobe von 10 Beobachtungen der Wirtschaftsindikatoren (X) und (Y).

x ich 180 172 173 169 175 170 179 170 167 174
y ich 186 180 176 171 182 166 182 172 169 177

Es ist erforderlich, eine Beispiel-Regressionsgleichung Y auf X zu finden. Konstruieren Sie eine Beispiel-Regressionslinie Y auf X.

Lösung. 1. Sortieren wir die Daten nach den Werten x i und y i . Wir bekommen eine neue Tabelle:

x ich 167 169 170 170 172 173 174 175 179 180
y ich 169 171 166 172 180 176 177 182 182 186

Zur Vereinfachung der Berechnungen erstellen wir eine Berechnungstabelle, in die wir die notwendigen Zahlenwerte eintragen.

x ich y ich x ich 2 x ich y ich
167 169 27889 28223
169 171 28561 28899
170 166 28900 28220
170 172 28900 29240
172 180 29584 30960
173 176 29929 30448
174 177 30276 30798
175 182 30625 31850
179 182 32041 32578
180 186 32400 33480
∑x i =1729 ∑y i =1761 ∑x ich 2 299105 ∑x ich y ich =304696
x = 172,9 y = 176,1 x i 2 = 29910,5 xy=30469,6

Nach Formel (4) berechnen wir den Regressionskoeffizienten

und nach Formel (5)

Daher sieht die Beispiel-Regressionsgleichung wie folgt aus: y=-59,34+1,3804x.
Lassen Sie uns die Punkte (x i ; y i) auf der Koordinatenebene darstellen und die Regressionsgerade markieren.


Abb. 4

Abbildung 4 zeigt, wie sich die beobachteten Werte relativ zur Regressionslinie befinden. Um die Abweichungen von y i von Y i numerisch zu schätzen, wobei y i beobachtete Werte und Y i durch Regression bestimmte Werte sind, erstellen wir eine Tabelle:

x ich y ich Y ich Y ich -y ich
167 169 168.055 -0.945
169 171 170.778 -0.222
170 166 172.140 6.140
170 172 172.140 0.140
172 180 174.863 -5.137
173 176 176.225 0.225
174 177 177.587 0.587
175 182 178.949 -3.051
179 182 184.395 2.395
180 186 185.757 -0.243

Y i -Werte werden gemäß der Regressionsgleichung berechnet.

Die auffällige Abweichung einiger beobachteter Werte von der Regressionslinie erklärt sich durch die geringe Anzahl von Beobachtungen. Bei der Untersuchung des Grades der linearen Abhängigkeit von Y von X wird die Anzahl der Beobachtungen berücksichtigt. Die Stärke der Abhängigkeit wird durch den Wert des Korrelationskoeffizienten bestimmt.

Beispiel.

Experimentelle Daten zu den Werten von Variablen X und bei sind in der Tabelle angegeben.

Durch ihre Ausrichtung wird die Funktion

Verwenden Methode der kleinsten Quadrate, approximieren diese Daten mit einer linearen Abhängigkeit y=ax+b(Parameter suchen a und b). Finden Sie heraus, welche der beiden Linien besser (im Sinne der Methode der kleinsten Quadrate) die experimentellen Daten ausrichtet. Fertige eine Zeichnung an.

Die Essenz der Methode der kleinsten Quadrate (LSM).

Das Problem besteht darin, die linearen Abhängigkeitskoeffizienten zu finden, für die die Funktion zweier Variablen gilt a und b nimmt den kleinsten Wert an. Das heißt, angesichts der Daten a und b die Summe der quadrierten Abweichungen der experimentellen Daten von der gefundenen geraden Linie wird am kleinsten sein. Das ist der springende Punkt bei der Methode der kleinsten Quadrate.

Somit reduziert sich die Lösung des Beispiels darauf, das Extremum einer Funktion zweier Variablen zu finden.

Herleitung von Formeln zum Finden von Koeffizienten.

Ein System aus zwei Gleichungen mit zwei Unbekannten wird erstellt und gelöst. Finden partieller Ableitungen einer Funktion in Bezug auf Variablen a und b, setzen wir diese Ableitungen mit Null gleich.

Wir lösen das resultierende Gleichungssystem mit einer beliebigen Methode (z Substitutionsmethode oder ) und erhalten Sie Formeln zum Finden von Koeffizienten mit der Methode der kleinsten Quadrate (LSM).

Mit Daten a und b Funktion nimmt den kleinsten Wert an. Der Beweis dieser Tatsache ist erbracht.

Das ist die ganze Methode der kleinsten Quadrate. Formel zum Finden des Parameters a enthält die Summen , , , und den Parameter n- Umfang der experimentellen Daten. Es wird empfohlen, die Werte dieser Summen separat zu berechnen. Koeffizient b nach Berechnung gefunden a.

Es ist Zeit, sich an das ursprüngliche Beispiel zu erinnern.

Lösung.

In unserem Beispiel n=5. Wir füllen die Tabelle aus, um die Beträge zu berechnen, die in den Formeln der erforderlichen Koeffizienten enthalten sind.

Die Werte in der vierten Zeile der Tabelle erhält man, indem man für jede Zahl die Werte der 2. Zeile mit den Werten der 3. Zeile multipliziert ich.

Die Werte in der fünften Zeile der Tabelle erhält man durch Quadrieren der Werte der 2. Zeile für jede Zahl ich.

Die Werte der letzten Spalte der Tabelle sind die Summen der Werte über die Zeilen hinweg.

Wir verwenden die Formeln der Methode der kleinsten Quadrate, um die Koeffizienten zu finden a und b. Wir ersetzen in ihnen die entsprechenden Werte aus der letzten Spalte der Tabelle:

Folglich, y=0,165x+2,184 die gesuchte Näherungsgerade ist.

Es bleibt herauszufinden, welche der Linien y=0,165x+2,184 oder nähert sich den Originaldaten besser an, d.h. um eine Schätzung nach der Methode der kleinsten Quadrate vorzunehmen.

Abschätzung des Fehlers der Methode der kleinsten Quadrate.

Dazu müssen Sie die Summen der quadrierten Abweichungen der Originaldaten von diesen Linien berechnen und , entspricht ein kleinerer Wert einer Linie, die die ursprünglichen Daten im Sinne der Methode der kleinsten Quadrate besser annähert.

Da , dann die Linie y=0,165x+2,184 nähert sich den Originaldaten besser an.

Grafische Darstellung der Methode der kleinsten Quadrate (LSM).

In den Charts sieht alles super aus. Die rote Linie ist die gefundene Linie y=0,165x+2,184, die blaue Linie ist , die rosa Punkte sind die Originaldaten.

Wozu dient es, wozu all diese Annäherungen?

Ich persönlich verwende, um Datenglättungsprobleme, Interpolations- und Extrapolationsprobleme zu lösen (im ursprünglichen Beispiel könnten Sie aufgefordert werden, den Wert des beobachteten Werts zu finden j bei x=3 oder wann x=6 nach der MNC-Methode). Aber wir werden später in einem anderen Abschnitt der Website mehr darüber sprechen.

Nachweisen.

Also wenn gefunden a und b Funktion den kleinsten Wert annimmt, ist es notwendig, dass an dieser Stelle die Matrix der quadratischen Form des Differentials zweiter Ordnung für die Funktion war positiv bestimmt. Zeigen wir es.

Das Differential zweiter Ordnung hat die Form:

Also

Daher hat die Matrix der quadratischen Form die Form

und die Werte der Elemente hängen nicht davon ab a und b.

Zeigen wir, dass die Matrix positiv definit ist. Dies erfordert, dass die Nebenwinkel positiv sind.

Eckiges Moll erster Ordnung . Die Ungleichung ist streng, da die Punkte nicht zusammenfallen. Dies wird im Folgenden impliziert.

Winkelminor zweiter Ordnung

Lassen Sie uns das beweisen nach der Methode der mathematischen Induktion.

Fazit: Gefundene Werte a und b entsprechen dem kleinsten Wert der Funktion sind daher die gewünschten Parameter für die Methode der kleinsten Quadrate.