Tradičná metóda najmenších štvorcov. Metóda najmenších štvorcov

Má veľa aplikácií, keďže umožňuje približnú reprezentáciu danej funkcie inými jednoduchšími. LSM môže byť mimoriadne užitočný pri spracovaní pozorovaní a aktívne sa používa na odhadovanie niektorých veličín z výsledkov meraní iných, ktoré obsahujú náhodné chyby. V tomto článku sa dozviete, ako implementovať výpočty najmenších štvorcov v Exceli.

Vyjadrenie problému na konkrétnom príklade

Predpokladajme, že existujú dva ukazovatele X a Y. Navyše Y závisí od X. Keďže OLS je pre nás zaujímavý z hľadiska regresnej analýzy (v Exceli sú jeho metódy implementované pomocou vstavaných funkcií), mali by sme okamžite pokračovať zvážiť konkrétny problém.

Nech teda X je predajná plocha obchodu s potravinami meraná v metroch štvorcových a Y je ročný obrat definovaný v miliónoch rubľov.

Je potrebné urobiť prognózu, aký obrat (Y) bude mať obchod, ak má jednu alebo druhú maloobchodnú plochu. Je zrejmé, že funkcia Y = f (X) rastie, keďže hypermarket predáva viac tovaru ako stánok.

Niekoľko slov o správnosti počiatočných údajov použitých na predikciu

Povedzme, že máme zostavenú tabuľku s údajmi pre n obchodov.

Podľa matematických štatistík budú výsledky viac-menej správne, ak sa preskúmajú údaje aspoň o 5-6 objektoch. Taktiež nemožno použiť „anomálne“ výsledky. Najmä elitný malý butik môže mať obrat mnohonásobne väčší ako obrat veľkých predajní triedy „masmarket“.

Podstata metódy

Údaje tabuľky je možné zobraziť v karteziánskej rovine ako body M 1 (x 1, y 1), ... M n (x n, y n). Teraz sa riešenie úlohy zredukuje na výber aproximačnej funkcie y = f (x), ktorej graf prechádzajúci čo najbližšie k bodom M 1, M 2, .. M n .

Samozrejme, môžete použiť polynóm vysokého stupňa, ale táto možnosť je nielen náročná na implementáciu, ale je jednoducho nesprávna, pretože nebude odrážať hlavný trend, ktorý je potrebné zistiť. Najrozumnejším riešením je hľadať priamku y = ax + b, ktorá najlepšie aproximuje experimentálne údaje, presnejšie koeficienty - a a b.

Skóre presnosti

Pre akúkoľvek aproximáciu je mimoriadne dôležité posúdenie jej presnosti. Označme e i rozdiel (odchýlku) medzi funkčnou a experimentálnou hodnotou pre bod x i, t.j. e i = y i - f (x i).

Je zrejmé, že na posúdenie presnosti aproximácie môžete použiť súčet odchýlok, t.j. pri výbere priamky na približné znázornenie závislosti X na Y by sa mala uprednostniť tá, ktorá má najmenšiu hodnotu súčet e i vo všetkých posudzovaných bodoch. Nie všetko je však také jednoduché, pretože spolu s pozitívnymi odchýlkami budú prakticky existovať aj negatívne.

Problém môžete vyriešiť pomocou modulov odchýlky alebo ich štvorcov. Posledná uvedená metóda je najpoužívanejšia. Používa sa v mnohých oblastiach vrátane regresnej analýzy (v Exceli sa jej implementácia vykonáva pomocou dvoch vstavaných funkcií) a dlho sa osvedčila ako efektívna.

Metóda najmenších štvorcov

V Exceli, ako viete, je zabudovaná funkcia automatického súčtu, ktorá vám umožňuje vypočítať hodnoty všetkých hodnôt nachádzajúcich sa vo vybranom rozsahu. Nič nám teda nebude brániť vypočítať hodnotu výrazu (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

V matematickom zápise to vyzerá takto:

Keďže sa pôvodne rozhodlo o aproximácii pomocou priamky, máme:

Úloha nájsť priamku, ktorá najlepšie popisuje špecifický vzťah medzi X a Y, teda znamená výpočet minima funkcie dvoch premenných:

To si vyžaduje rovnanie nulovým parciálnym deriváciám vzhľadom na nové premenné a a b a riešenie primitívneho systému pozostávajúceho z dvoch rovníc s 2 neznámymi tvaru:

Po jednoduchých transformáciách, vrátane delenia 2 a manipulácie so súčtami, dostaneme:

Riešením napríklad Cramerovou metódou dostaneme stacionárny bod s určitými koeficientmi a * a b * . Toto je minimum, teda na predpovedanie, aký obrat bude mať obchod pre určitú oblasť, je vhodná priamka y = a * x + b *, čo je regresný model pre daný príklad. Samozrejme, že vám to nedovolí nájsť presný výsledok, ale pomôže vám to získať predstavu o tom, či sa nákup obchodu na úver pre konkrétnu oblasť oplatí.

Ako implementovať metódu najmenších štvorcov v Exceli

Excel má funkciu na výpočet hodnoty najmenších štvorcov. Má nasledujúci tvar: TREND (známe hodnoty Y; známe hodnoty X; nové hodnoty X; konštanta). Aplikujme vzorec na výpočet OLS v Exceli na našu tabuľku.

Ak to chcete urobiť, v bunke, v ktorej by sa mal zobraziť výsledok výpočtu metódou najmenších štvorcov v programe Excel, zadajte znak „=“ a vyberte funkciu „TREND“. V okne, ktoré sa otvorí, vyplňte príslušné polia a zvýraznite:

  • rozsah známych hodnôt pre Y (v tomto prípade údaje pre obrat);
  • rozsah x 1 , …x n , t. j. veľkosť predajnej plochy;
  • a známe a neznáme hodnoty x, pre ktoré musíte zistiť veľkosť obratu (informácie o ich umiestnení na pracovnom hárku nájdete nižšie).

Okrem toho je vo vzorci logická premenná "Const". Ak do príslušného poľa zadáte 1, bude to znamenať, že by sa mali vykonať výpočty za predpokladu, že b \u003d 0.

Ak potrebujete poznať predpoveď pre viac ako jednu hodnotu x, potom po zadaní vzorca by ste nemali stlačiť kláves Enter, ale musíte zadať kombináciu „Shift“ + „Control“ + „Enter“ („Enter“ ) na klávesnici.

Niektoré funkcie

Regresná analýza môže byť prístupná aj pre figuríny. Excelovský vzorec na predpovedanie hodnoty poľa neznámych premenných – „TREND“ – môže použiť aj ten, kto o metóde najmenších štvorcov nikdy nepočul. Stačí poznať niektoré črty jeho práce. Najmä:

  • Ak usporiadate rozsah známych hodnôt premennej y do jedného riadku alebo stĺpca, potom každý riadok (stĺpec) so známymi hodnotami x bude programom vnímaný ako samostatná premenná.
  • Ak nie je v okne TRENDU zadaný rozsah so známym x, tak v prípade použitia funkcie v Exceli ho program bude považovať za pole pozostávajúce z celých čísel, ktorých počet zodpovedá rozsahu s danými hodnotami ​premennej y.
  • Na výstup poľa „predpovedaných“ hodnôt je potrebné zadať výraz trendu ako vzorec poľa.
  • Ak nie sú zadané žiadne nové hodnoty x, funkcia TREND ich považuje za rovnaké ako tie známe. Ak nie sú špecifikované, potom sa pole 1 berie ako argument; 2; 3; 4;…, ktorý je primeraný rozsahu s už danými parametrami y.
  • Rozsah obsahujúci nové hodnoty x musí mať rovnaký alebo viac riadkov alebo stĺpcov ako rozsah s danými hodnotami y. Inými slovami, musí byť úmerná nezávislým premenným.
  • Pole so známymi hodnotami x môže obsahovať viacero premenných. Ak však hovoríme len o jednom, potom je potrebné, aby rozsahy s danými hodnotami x a y boli úmerné. V prípade viacerých premenných je potrebné, aby sa rozsah s danými hodnotami y zmestil do jedného stĺpca alebo jedného riadku.

Funkcia FORECAST

Realizuje sa pomocou niekoľkých funkcií. Jeden z nich sa volá „PREDICTION“. Je podobný TRENDU, teda dáva výsledok výpočtov metódou najmenších štvorcov. Avšak len pre jedno X, pre ktoré je hodnota Y neznáma.

Teraz poznáte vzorce Excel pre figuríny, ktoré vám umožňujú predpovedať hodnotu budúcej hodnoty ukazovateľa podľa lineárneho trendu.

Aproximácia experimentálnych údajov je metóda založená na nahradení experimentálne získaných údajov analytickou funkciou, ktorá sa v uzlových bodoch najviac zhoduje s počiatočnými hodnotami (údaje získané počas experimentu alebo experimentu). V súčasnosti existujú dva spôsoby, ako definovať analytickú funkciu:

Zostrojením n-stupňového interpolačného polynómu, ktorý prejde priamo cez všetky body dané pole údajov. V tomto prípade je aproximačná funkcia reprezentovaná ako: interpolačný polynóm v Lagrangeovom tvare alebo interpolačný polynóm v Newtonovom tvare.

Zostrojením n-stupňového aproximačného polynómu, ktorý prejde blízko k bodom z daného dátového poľa. Aproximačná funkcia teda vyhladzuje všetok náhodný šum (alebo chyby), ktoré sa môžu vyskytnúť počas experimentu: namerané hodnoty počas experimentu závisia od náhodných faktorov, ktoré kolíšu podľa vlastných náhodných zákonov (chyby merania alebo prístroja, nepresnosť alebo experimentálne chyby). V tomto prípade je aproximačná funkcia určená metódou najmenších štvorcov.

Metóda najmenších štvorcov(v anglickej literatúre Ordinary Least Squares, OLS) je matematická metóda založená na definícii aproximačnej funkcie, ktorá je postavená v tesnej blízkosti bodov z daného poľa experimentálnych údajov. Blízkosť začiatočnej a aproximačnej funkcie F(x) je určená numerickou mierou, a to: súčet kvadrátov odchýlok experimentálnych dát od aproximačnej krivky F(x) by mal byť najmenší.

Fitovacia krivka vytvorená metódou najmenších štvorcov

Používa sa metóda najmenších štvorcov:

Riešiť preurčené sústavy rovníc, keď počet rovníc presahuje počet neznámych;

Hľadať riešenie v prípade obyčajných (nie preurčených) nelineárnych sústav rovníc;

Na aproximáciu bodových hodnôt pomocou nejakej aproximačnej funkcie.

Aproximačná funkcia metódou najmenších štvorcov je určená z podmienky minimálneho súčtu štvorcových odchýlok vypočítanej aproximačnej funkcie z daného poľa experimentálnych dát. Toto kritérium metódy najmenších štvorcov je napísané ako nasledujúci výraz:

Hodnoty vypočítanej aproximačnej funkcie v uzlových bodoch,

Špecifikované pole experimentálnych údajov v uzlových bodoch.

Kvadratické kritérium má množstvo „dobrých“ vlastností, ako je diferencovateľnosť, ktorá poskytuje jedinečné riešenie aproximačného problému s polynomiálnymi aproximačnými funkciami.

V závislosti od podmienok úlohy je aproximačná funkcia polynóm stupňa m

Stupeň aproximačnej funkcie nezávisí od počtu uzlových bodov, ale jej rozmer musí byť vždy menší ako rozmer (počet bodov) daného poľa experimentálnych dát.

∙ Ak je stupeň aproximačnej funkcie m=1, tak tabuľkovú funkciu aproximujeme priamkou (lineárna regresia).

∙ Ak je stupeň aproximačnej funkcie m=2, potom aproximujeme tabuľkovú funkciu kvadratickou parabolou (kvadratická aproximácia).

∙ Ak je stupeň aproximačnej funkcie m=3, tak tabuľkovú funkciu aproximujeme kubickou parabolou (kubickou aproximáciou).

Vo všeobecnom prípade, keď je potrebné zostrojiť aproximačný polynóm stupňa m pre dané tabuľkové hodnoty, podmienka pre minimálny súčet štvorcových odchýlok nad všetkými uzlovými bodmi sa prepíše do nasledujúceho tvaru:

- neznáme koeficienty aproximačného polynómu stupňa m;

Počet špecifikovaných hodnôt tabuľky.

Nevyhnutnou podmienkou existencie minima funkcie je nulová rovnosť jej parciálnych derivácií vzhľadom na neznáme premenné . Výsledkom je nasledujúci systém rovníc:

Transformujme výsledný lineárny systém rovníc: otvorte zátvorky a presuňte voľné členy na pravú stranu výrazu. Výsledkom je, že výsledný systém lineárnych algebraických výrazov bude napísaný v tejto forme:

Tento systém lineárnych algebraických výrazov možno prepísať do maticovej formy:

Výsledkom bola sústava lineárnych rovníc rozmeru m + 1, ktorá pozostáva z m + 1 neznámych. Tento systém je možné riešiť pomocou ľubovoľnej metódy na riešenie lineárnych algebraických rovníc (napríklad Gaussova metóda). V dôsledku riešenia sa nájdu neznáme parametre aproximačnej funkcie, ktoré poskytujú minimálny súčet kvadrátov odchýlok aproximačnej funkcie od pôvodných údajov, t.j. najlepšia možná kvadratická aproximácia. Malo by sa pamätať na to, že ak sa zmení čo i len jedna hodnota počiatočných údajov, všetky koeficienty zmenia svoje hodnoty, pretože sú úplne určené počiatočnými údajmi.

Aproximácia počiatočných údajov lineárnou závislosťou

(lineárna regresia)

Ako príklad uveďme metódu na určenie aproximačnej funkcie, ktorá je uvedená ako lineárny vzťah. V súlade s metódou najmenších štvorcov sa podmienka pre minimálny súčet odchýlok štvorcových zapíše takto:

Súradnice uzlových bodov tabuľky;

Neznáme koeficienty aproximačnej funkcie, ktorá je špecifikovaná ako lineárny vzťah.

Nevyhnutnou podmienkou existencie minima funkcie je nulová rovnosť jej parciálnych derivácií vzhľadom na neznáme premenné. Výsledkom je nasledujúci systém rovníc:

Transformujme výsledný lineárny systém rovníc.

Výslednú sústavu lineárnych rovníc riešime. Koeficienty aproximačnej funkcie v analytickej forme sa určia nasledovne (Cramerova metóda):

Tieto koeficienty poskytujú konštrukciu lineárnej aproximačnej funkcie v súlade s kritériom pre minimalizáciu súčtu štvorcov aproximačnej funkcie z daných tabuľkových hodnôt (experimentálne dáta).

Algoritmus na implementáciu metódy najmenších štvorcov

1. Počiatočné údaje:

Vzhľadom na množstvo experimentálnych údajov s počtom meraní N

Udáva sa stupeň aproximačného polynómu (m).

2. Algoritmus výpočtu:

2.1. Pre zostavenie sústavy rovníc s dimenziou sa určujú koeficienty

Koeficienty sústavy rovníc (ľavá strana rovnice)

- index čísla stĺpca štvorcovej matice sústavy rovníc

Voľné členy sústavy lineárnych rovníc (pravá strana rovnice)

- index čísla riadku štvorcovej matice sústavy rovníc

2.2. Zostavenie sústavy lineárnych rovníc s dimenziou .

2.3. Riešenie sústavy lineárnych rovníc na určenie neznámych koeficientov aproximačného polynómu stupňa m.

2.4 Určenie súčtu štvorcových odchýlok aproximačného polynómu od počiatočných hodnôt cez všetky uzlové body

Nájdená hodnota súčtu kvadrátov odchýlok je minimálna možná hodnota.

Aproximácia s inými funkciami

Treba poznamenať, že pri aproximácii počiatočných údajov v súlade s metódou najmenších štvorcov sa ako aproximačná funkcia niekedy používa logaritmická funkcia, exponenciálna funkcia a výkonová funkcia.

Aproximácia denníka

Zvážte prípad, keď je aproximačná funkcia daná logaritmickou funkciou tvaru:

Podstatou metódy najmenších štvorcov je pri hľadaní parametrov trendového modelu, ktorý najlepšie vystihuje trend vývoja akéhokoľvek náhodného javu v čase alebo priestore (trend je čiara, ktorá charakterizuje trend tohto vývoja). Úlohou metódy najmenších štvorcov (OLS) je nájsť nielen nejaký trendový model, ale nájsť najlepší alebo optimálny model. Tento model bude optimálny, ak súčet štvorcových odchýlok medzi pozorovanými skutočnými hodnotami a zodpovedajúcimi vypočítanými trendovými hodnotami je minimálny (najmenší):

kde je štandardná odchýlka medzi pozorovanou skutočnou hodnotou

a zodpovedajúcu vypočítanú trendovú hodnotu,

skutočná (pozorovaná) hodnota skúmaného javu,

Odhadovaná hodnota trendového modelu,

Počet pozorovaní skúmaného javu.

MNC sa zriedka používa samostatne. Spravidla sa najčastejšie používa len ako nevyhnutná technika v korelačných štúdiách. Malo by sa pamätať na to, že informačnou základňou LSM môže byť iba spoľahlivý štatistický rad a počet pozorovaní by nemal byť menší ako 4, inak môžu vyhladzovacie postupy LSM stratiť svoj zdravý rozum.

Sada nástrojov OLS je zredukovaná na tieto postupy:

Prvý postup. Ukazuje sa, či vôbec existuje tendencia meniť výsledný atribút pri zmene zvoleného faktora-argumentu, alebo inými slovami, či existuje súvislosť medzi „ pri " a " X ».

Druhý postup. Určuje sa, ktorá línia (trajektória) najlepšie dokáže opísať alebo charakterizovať tento trend.

Tretí postup.

Príklad. Predpokladajme, že máme informácie o priemernej úrode slnečnice pre skúmanú farmu (tabuľka 9.1).

Tabuľka 9.1

Číslo pozorovania

Produktivita, c/ha

Keďže úroveň technológie výroby slnečnice sa u nás za posledných 10 rokov príliš nezmenila, znamená to, že kolísanie úrody v analyzovanom období s najväčšou pravdepodobnosťou veľmi záviselo od výkyvov počasia a klimatických podmienok. Je to pravda?

Prvý postup MNC. Testuje sa hypotéza o existencii trendu zmeny úrody slnečnice v závislosti od zmien počasia a klimatických podmienok za analyzovaných 10 rokov.

V tomto príklade pre " r » je vhodné vziať úrodu slnečnice a pre « X » je číslo sledovaného roka v analyzovanom období. Testovanie hypotézy o existencii akéhokoľvek vzťahu medzi „ X " a " r » možno vykonať dvoma spôsobmi: ručne a pomocou počítačových programov. Samozrejme, s dostupnosťou výpočtovej techniky sa tento problém rieši sám. Aby sme však lepšie porozumeli nástrojom OLS, je vhodné otestovať hypotézu o existencii vzťahu medzi „ X " a " r » manuálne, keď máte po ruke iba pero a obyčajnú kalkulačku. V takýchto prípadoch je hypotéza o existencii trendu najlepšie overená vizuálne umiestnením grafického obrazu analyzovaného časového radu - korelačným poľom:

Korelačné pole v našom príklade sa nachádza okolo pomaly stúpajúcej čiary. To samo o sebe naznačuje existenciu určitého trendu v zmene úrody slnečnice. O prítomnosti akéhokoľvek trendu nemožno hovoriť iba vtedy, keď korelačné pole vyzerá ako kruh, kruh, striktne vertikálny alebo striktne horizontálny oblak alebo pozostáva z náhodne rozptýlených bodov. Vo všetkých ostatných prípadoch je potrebné potvrdiť hypotézu o existencii vzťahu medzi „ X " a " r a pokračovať vo výskume.

Druhý postup MNC. Určuje sa, ktorá línia (trajektória) najlepšie popíše alebo charakterizuje trend zmien úrod slnečnice za analyzované obdobie.

S dostupnosťou výpočtovej techniky dochádza k výberu optimálneho trendu automaticky. Pri „ručnom“ spracovaní sa voľba optimálnej funkcie spravidla uskutočňuje vizuálnym spôsobom - umiestnením korelačného poľa. To znamená, že podľa typu grafu sa vyberie rovnica priamky, ktorá sa najlepšie hodí k empirickému trendu (k skutočnej trajektórii).

Ako viete, v prírode existuje veľké množstvo funkčných závislostí, takže je mimoriadne ťažké vizuálne analyzovať aj malú časť z nich. Našťastie v reálnej ekonomickej praxi možno väčšinu vzťahov presne opísať buď parabolou, alebo hyperbolou, alebo priamkou. V tomto smere sa pri „manuálnej“ možnosti výberu najlepšej funkcie môžete obmedziť len na tieto tri modely.

Hyperbola:

Parabola druhého rádu: :

Je ľahké vidieť, že v našom príklade trend zmien úrody slnečnice za analyzovaných 10 rokov najlepšie charakterizuje priamka, takže regresná rovnica bude priamka.

Tretí postup. Vypočítajú sa parametre regresnej rovnice, ktorá charakterizuje túto čiaru, alebo inými slovami, určí sa analytický vzorec, ktorý popisuje najlepší trendový model.

Hľadanie hodnôt parametrov regresnej rovnice, v našom prípade parametrov a , je jadrom LSM. Tento proces sa redukuje na riešenie systému normálnych rovníc.

(9.2)

Tento systém rovníc je celkom jednoducho vyriešený Gaussovou metódou. Pripomeňme, že v dôsledku riešenia sa v našom príklade nájdu hodnoty parametrov a. Nájdená regresná rovnica teda bude mať nasledujúci tvar:

Po zarovnaní dostaneme funkciu v nasledujúcom tvare: g (x) = x + 1 3 + 1 .

Tieto údaje môžeme aproximovať lineárnym vzťahom y = a x + b výpočtom príslušných parametrov. Aby sme to dosiahli, budeme musieť použiť takzvanú metódu najmenších štvorcov. Budete tiež musieť urobiť nákres, aby ste skontrolovali, ktorá čiara najlepšie zarovná experimentálne údaje.

Yandex.RTB R-A-339285-1

Čo presne je OLS (metóda najmenších štvorcov)

Hlavná vec, ktorú musíme urobiť, je nájsť také lineárne koeficienty závislosti, pri ktorých bude hodnota funkcie dvoch premenných F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 najmenšia. . Inými slovami, pre určité hodnoty a a b bude mať súčet štvorcových odchýlok prezentovaných údajov od výslednej priamky minimálnu hodnotu. Toto je význam metódy najmenších štvorcov. Na vyriešenie príkladu nám stačí nájsť extrém funkcie dvoch premenných.

Ako odvodiť vzorce na výpočet koeficientov

Na odvodenie vzorcov na výpočet koeficientov je potrebné zostaviť a vyriešiť sústavu rovníc s dvoma premennými. Na tento účel vypočítame parciálne derivácie výrazu F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 vzhľadom na a a b a prirovnáme ich k 0 .

δ F (a, b) δ a = 0 δ F (a, b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0 - 2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∇ y i = ∇ y i = ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

Na vyriešenie sústavy rovníc môžete použiť ľubovoľné metódy, napríklad substitúciu alebo Cramerovu metódu. V dôsledku toho by sme mali dostať vzorce, ktoré vypočítajú koeficienty pomocou metódy najmenších štvorcov.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ x i = 1 n

Vypočítali sme hodnoty premenných, pre ktoré je funkcia
F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 nadobudne minimálnu hodnotu. V treťom odseku si ukážeme, prečo je to tak.

Ide o aplikáciu metódy najmenších štvorcov v praxi. Jeho vzorec, ktorý sa používa na nájdenie parametra a, obsahuje ∑ i = 1 n x i , ∑ i = 1 n y i , ∑ i = 1 n x i y i , ∑ i = 1 n x i 2 a parameter
n - označuje množstvo experimentálnych údajov. Odporúčame vám vypočítať každú sumu samostatne. Hodnota koeficientu b sa vypočíta bezprostredne po a .

Vráťme sa k pôvodnému príkladu.

Príklad 1

Tu máme n rovné päť. Aby sme uľahčili výpočet požadovaných súm zahrnutých vo vzorcoch koeficientov, vyplníme tabuľku.

i = 1 i = 2 i = 3 i = 4 i = 5 ∑ i = 1 5
x i 0 1 2 4 5 12
y i 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x i y i 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x i 2 0 1 4 16 25 46

rozhodnutie

Štvrtý riadok obsahuje údaje získané vynásobením hodnôt z druhého riadku hodnotami tretieho pre každú jednotlivú i . Piaty riadok obsahuje údaje z druhého štvorca. Posledný stĺpec zobrazuje súčty hodnôt jednotlivých riadkov.

Na výpočet koeficientov a a b, ktoré potrebujeme, použijeme metódu najmenších štvorcov. Za týmto účelom nahraďte požadované hodnoty z posledného stĺpca a vypočítajte súčty:

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i 3 a = 1 n8 - 12 12, 9 5 46 - 12 2 b = 12, 9 - a 12 5 ⇒ a ≈ 0, 165 b ≈ 2, 184

Dostali sme, že požadovaná približná priamka bude vyzerať ako y = 0, 165 x + 2, 184. Teraz musíme určiť, ktorá čiara bude najlepšie aproximovať údaje - g (x) = x + 1 3 + 1 alebo 0 , 165 x + 2 , 184 . Urobme odhad pomocou metódy najmenších štvorcov.

Na výpočet chyby potrebujeme nájsť súčty druhých mocnín odchýlok údajov od priamok σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 a σ 2 = ∑ i = 1 n (y i - g (x i)) 2, minimálna hodnota bude zodpovedať vhodnejšej čiare.

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0, 165 x i + 2, 184)) 2 ≈ 0, 019 σ 2 = ∑ i = 1 n (y i - g (x i)) 2 = = ∑ i = 1 5 (y i - (x i + 1 3 + 1)) 2 ≈ 0 , 096

odpoveď: keďže σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0,165 x + 2,184.

Metóda najmenších štvorcov je jasne znázornená na grafickom znázornení. Červená čiara označuje priamku g (x) = x + 1 3 + 1, modrá čiara označuje y = 0, 165 x + 2, 184. Nespracované údaje sú označené ružovými bodkami.

Vysvetlime, prečo sú potrebné práve aproximácie tohto typu.

Môžu byť použité v problémoch, ktoré vyžadujú vyhladzovanie údajov, ako aj v tých, kde je potrebné údaje interpolovať alebo extrapolovať. Napríklad v probléme diskutovanom vyššie je možné nájsť hodnotu pozorovanej veličiny y pri x = 3 alebo pri x = 6 . Takýmto príkladom sme venovali samostatný článok.

Dôkaz metódy LSM

Aby funkcia nadobudla minimálnu hodnotu pre vypočítané a a b, je potrebné, aby v danom bode matica kvadratického tvaru diferenciálu funkcie tvaru F (a, b) = ∑ i = 1 n ( y i - (a x i + b)) 2 byť kladne určité. Poďme si ukázať, ako by to malo vyzerať.

Príklad 2

Máme diferenciál druhého rádu v nasledujúcom tvare:

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; b) δ a δ b d a d b + δ 2 F (a ; b) δ b 2 d 2b

rozhodnutie

δ 2 F (a ; b) δ a 2 = δ δ F (a ; b) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a ; b) δ a δ b = δ δ F (a ; b) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; b) δ b 2 = δ δ F (a ; b) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + b)) δ b = 2 ∑ i = 1 n (1) = 2 n

Inými slovami, možno to zapísať takto: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b .

Získali sme maticu kvadratickej formy M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n .

V tomto prípade sa hodnoty jednotlivých prvkov nezmenia v závislosti od a a b . Je táto matica pozitívna definitívna? Aby sme odpovedali na túto otázku, skontrolujme, či sú jeho uhlové minory kladné.

Vypočítajte uhlovú minor prvého rádu: 2 ∑ i = 1 n (x i) 2 > 0 . Keďže body x i sa nezhodujú, nerovnosť je prísna. To budeme mať na pamäti pri ďalších výpočtoch.

Vypočítame uhlovú minor druhého rádu:

d e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2

Potom pristúpime k dôkazu nerovnosti n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 pomocou matematickej indukcie.

  1. Pozrime sa, či táto nerovnosť platí pre ľubovoľné n . Vezmime si 2 a vypočítame:

2 ∑ i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

Dostali sme správnu rovnosť (ak sa hodnoty x 1 a x 2 nezhodujú).

  1. Predpokladajme, že táto nerovnosť bude platiť pre n , t.j. n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 – pravda.
  2. Teraz dokážme platnosť pre n + 1 , t.j. že (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 > 0, ak n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 .

Vypočítame:

(n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - ∑ i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - ∑ i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = 1 n x i + 1 ∑ i n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 x 2 + x 2 2 + . . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1 - x 2) 2 + . . . + (x n - 1 - x n) 2 > 0

Výraz uzavretý v zložených zátvorkách bude väčší ako 0 (na základe toho, čo sme predpokladali v kroku 2) a ostatné výrazy budú väčšie ako 0, pretože sú to všetky druhé mocniny čísel. Dokázali sme nerovnosť.

odpoveď: nájdené a a b budú zodpovedať najmenšej hodnote funkcie F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2, čo znamená, že sú to požadované parametre metódy najmenších štvorcov (LSM).

Ak si všimnete chybu v texte, zvýraznite ju a stlačte Ctrl+Enter

Má široké využitie v ekonometrii vo forme prehľadnej ekonomickej interpretácie jej parametrov.

Lineárna regresia sa redukuje na nájdenie rovnice tvaru

alebo

Typ rovnice umožňuje zadať hodnoty daného parametra X mať teoretické hodnoty efektívnej funkcie, pričom do nej nahrádzajú skutočné hodnoty faktora X.

Vytvorenie lineárnej regresie spočíva v odhade jej parametrov − a a v. Odhady parametrov lineárnej regresie možno nájsť rôznymi metódami.

Klasický prístup k odhadu parametrov lineárnej regresie je založený na najmenších štvorcov(MNK).

LSM umožňuje získať takéto odhady parametrov a a v, pod ktorým súčet druhých mocnín odchýlok skutočných hodnôt výsledného znaku (y) z vypočítaného (teoretického) mini-minimum:

Na nájdenie minima funkcie je potrebné vypočítať parciálne derivácie vzhľadom na každý z parametrov a a b a prirovnať ich k nule.

Označiť cez S, potom:

Transformáciou vzorca získame nasledujúci systém normálnych rovníc na odhad parametrov a a v:

Riešením sústavy normálnych rovníc (3.5) buď metódou postupnej eliminácie premenných alebo metódou determinantov nájdeme požadované odhady parametrov. a a v.

Parameter v nazývaný regresný koeficient. Jeho hodnota zobrazuje priemernú zmenu výsledku so zmenou faktora o jednu jednotku.

Regresná rovnica je vždy doplnená o indikátor tesnosti spoja. Pri použití lineárnej regresie ako taký indikátor pôsobí lineárny korelačný koeficient. Existujú rôzne modifikácie vzorca koeficientu lineárnej korelácie. Niektoré z nich sú uvedené nižšie:

Ako viete, koeficient lineárnej korelácie je v medziach: -1 1.

Na posúdenie kvality výberu lineárnej funkcie sa vypočíta štvorec

Lineárny korelačný koeficient tzv determinačný koeficient . Koeficient determinácie charakterizuje podiel rozptylu efektívneho znaku y, vysvetlené regresiou v celkovom rozptyle výsledného znaku:

V súlade s tým hodnota 1 - charakterizuje podiel disperzie y, spôsobené vplyvom iných faktorov nezohľadnených v modeli.

Otázky na sebaovládanie

1. Podstata metódy najmenších štvorcov?

2. Koľko premenných poskytuje párovú regresiu?

3. Aký koeficient určuje tesnosť spojenia medzi zmenami?

4. V akých medziach sa určuje koeficient determinácie?

5. Odhad parametra b v korelačno-regresnej analýze?

1. Christopher Dougherty. Úvod do ekonometrie. - M.: INFRA - M, 2001 - 402 s.

2. S.A. Borodich. Ekonometria. Minsk LLC "Nové poznatky" 2001.


3. R.U. Rakhmetova Krátky kurz ekonometrie. Návod. Almaty. 2004. -78 rokov.

4. I.I. Eliseeva. Ekonometria. - M.: "Financie a štatistika", 2002

5. Mesačný informačný a analytický časopis.

Nelineárne ekonomické modely. Nelineárne regresné modely. Variabilná konverzia.

Nelineárne ekonomické modely..

Variabilná konverzia.

koeficient pružnosti.

Ak existujú nelineárne vzťahy medzi ekonomickými javmi, potom sú vyjadrené pomocou zodpovedajúcich nelineárnych funkcií: napríklad rovnostranná hyperbola , paraboly druhého stupňa atď.

Existujú dve triedy nelineárnych regresií:

1. Regresie, ktoré sú nelineárne vzhľadom na vysvetľujúce premenné zahrnuté v analýze, ale lineárne vzhľadom na odhadované parametre, napríklad:

Polynómy rôznych stupňov - , ;

Rovnostranná hyperbola - ;

Semilogaritmická funkcia - .

2. Regresie, ktoré sú nelineárne v odhadovaných parametroch, napríklad:

Moc - ;

Demonštratívne -;

Exponenciálny - .

Celkový súčet druhých mocnín odchýlok jednotlivých hodnôt výsledného atribútu pri z priemernej hodnoty je spôsobené vplyvom mnohých faktorov. Celý súbor dôvodov podmienečne rozdeľujeme do dvoch skupín: skúmaný faktor x a iné faktory.

Ak faktor neovplyvňuje výsledok, potom je regresná čiara na grafe rovnobežná s osou oh a

Potom je celý rozptyl výsledného atribútu spôsobený vplyvom iných faktorov a celkový súčet štvorcových odchýlok sa bude zhodovať so zvyškom. Ak iné faktory neovplyvnia výsledok, potom u viazaný s X funkčne a zvyškový súčet štvorcov je nula. V tomto prípade je súčet štvorcových odchýlok vysvetlených regresiou rovnaký ako celkový súčet druhých mocnín.

Keďže nie všetky body korelačného poľa ležia na regresnej priamke, dochádza vždy k ich rozptylu vplyvom faktora X, teda regresia pri na X, a spôsobené pôsobením iných príčin (nevysvetliteľná variácia). Vhodnosť regresnej priamky pre prognózu závisí od toho, aká časť celkovej variácie znaku je pri zodpovedá vysvetlenej variácii

Je zrejmé, že ak súčet štvorcových odchýlok v dôsledku regresie je väčší ako zvyškový súčet štvorcov, potom je regresná rovnica štatisticky významná a faktor X má významný vplyv na výsledok. r.

, teda s počtom voľnosti nezávislej variácie znaku. Počet stupňov voľnosti súvisí s počtom jednotiek populácie n a počtom konštánt z neho určených. Vo vzťahu k skúmanému problému by počet stupňov voľnosti mal ukazovať od koľkých nezávislých odchýlok P

Posúdenie významnosti regresnej rovnice ako celku je uvedené pomocou F- Fisherovo kritérium. V tomto prípade je predložená nulová hypotéza, že regresný koeficient sa rovná nule, t.j. b= 0, a teda faktor X neovplyvňuje výsledok r.

Priamemu výpočtu F-kritéria predchádza analýza rozptylu. Ústredným prvkom je rozšírenie celkového súčtu kvadratických odchýlok premennej pri z priemernej hodnoty pri na dve časti - "vysvetlené" a "nevysvetlené":

- celkový súčet štvorcových odchýlok;

- súčet štvorcových odchýlok vysvetlených regresiou;

je zvyškový súčet druhých mocnín odchýlky.

Akýkoľvek súčet štvorcových odchýlok súvisí s počtom stupňov voľnosti , teda s počtom voľnosti nezávislej variácie znaku. Počet stupňov voľnosti súvisí s počtom populačných jednotiek n a s počtom konštánt z nej určeným. Vo vzťahu k skúmanému problému by počet stupňov voľnosti mal ukazovať od koľkých nezávislých odchýlok P na vytvorenie daného súčtu štvorcov.

Rozptyl na stupeň voľnostiD.

F-pomery (F-kritérium):

Ak je nulová hypotéza pravdivá, potom sa faktor a reziduálne rozptyly navzájom nelíšia. Pre H 0 je potrebné vyvrátenie, aby rozptyl faktora niekoľkonásobne prevyšoval rezíduum. Anglický štatistik Snedecor vypracoval tabuľky kritických hodnôt F-vzťahy na rôznych úrovniach významnosti nulovej hypotézy a rôznom počte stupňov voľnosti. Tabuľková hodnota F-kritérium je maximálna hodnota pomeru rozptylov, ktoré môžu nastať, ak sa náhodne rozchádzajú pre danú úroveň pravdepodobnosti prítomnosti nulovej hypotézy. Vypočítaná hodnota F-vzťah sa považuje za spoľahlivý, ak o je väčšie ako tabuľkové.

V tomto prípade sa zamietne nulová hypotéza o absencii vzťahu znakov a urobí sa záver o význame tohto vzťahu: F fakt > F tabuľka H 0 sa zamietne.

Ak je hodnota menšia ako tabuľka F fakt ‹, F tabuľka, potom je pravdepodobnosť nulovej hypotézy vyššia ako daná úroveň a nemožno ju zamietnuť bez vážneho rizika vyvodenia nesprávneho záveru o prítomnosti vzťahu. V tomto prípade sa regresná rovnica považuje za štatisticky nevýznamnú. N o nevybočuje.

Smerodajná chyba regresného koeficientu

Na posúdenie významnosti regresného koeficientu sa jeho hodnota porovnáva s jeho štandardnou chybou, t.j. určí sa skutočná hodnota t- Študentské kritérium: ktorá sa potom porovnáva s tabuľkovou hodnotou na určitej hladine významnosti a počte stupňov voľnosti ( n- 2).

Štandardná chyba parametra a:

Významnosť koeficientu lineárnej korelácie sa kontroluje na základe veľkosti chyby korelačný koeficient r:

Celková odchýlka funkcie X:

Viacnásobná lineárna regresia

Stavba modelu

Viacnásobná regresia je regresia efektívneho znaku s dvoma alebo viacerými faktormi, t. j. model formy

Regresia môže poskytnúť dobrý výsledok v modelovaní, ak možno zanedbať vplyv iných faktorov ovplyvňujúcich predmet štúdia. Správanie jednotlivých ekonomických premenných nie je možné kontrolovať, to znamená, že nie je možné zabezpečiť rovnosť všetkých ostatných podmienok na posúdenie vplyvu jedného skúmaného faktora. V tomto prípade by ste sa mali pokúsiť identifikovať vplyv iných faktorov tak, že ich zavediete do modelu, t. j. zostavte viacnásobnú regresnú rovnicu: y = a+b 1 x 1 +b 2 +…+b p x p + .

Hlavným cieľom viacnásobnej regresie je zostaviť model s veľkým množstvom faktorov, pričom sa určí vplyv každého z nich jednotlivo, ako aj ich kumulatívny vplyv na modelovaný ukazovateľ. Špecifikácia modelu zahŕňa dve oblasti otázok: výber faktorov a výber typu regresnej rovnice