Vypracovanie prognózy metódou kĺzavého priemeru. Príklad riešenia problému

Mechanické vyhladzovanie založené na kĺzavých priemeroch

Metódy vyhladzovania časových radov

Úrovne ekonomických časových radov veľmi často kolíšu. Zároveň je trend vývoja ekonomického javu v čase skrytý náhodnými odchýlkami hodnôt série v jednom alebo druhom smere. Aby bolo možné lepšie identifikovať trendy vývoj skúmaného procesu vykonať vyhladenie (zarovnanie)časové rady ekonomických ukazovateľov. Podstata rôznych metód vyhladzovania dochádza k nahradeniu skutočných úrovní časového radu vypočítanými hodnotami, ktoré v menšej miere podliehajú výkyvom. To prispieva k jasnému prejavu trendu.

Metódy vyhladzovania časových radov sa delia na dve hlavné skupiny:

1) analytické zarovnanie použitie krivky nakreslenej medzi konkrétnymi úrovňami série tak, aby odrážala trend vlastný sérii a zároveň ju oslobodila od menších výkyvov;

2) mechanické vyrovnanie jednotlivých úrovní časového radu pomocou skutočných hodnôt susedných úrovní.

Podstata metód analytického vyhladzovania na základe matematického pravidla, že prostredníctvom ľubovoľného n bodov ležiacich na rovine je možné nakresliť polynomické minimum (n - 1) stupňa tak, že bude prechádzať všetkými určenými bodmi.

Podstata metód mechanického vyhladzovania spočíva v tom, že sa odoberá niekoľko úrovní série dynamiky, ktoré tvoria vyhladzovací interval. Pre nich je vybraný polynóm, ktorého stupeň by mal byť menší ako počet úrovní zahrnutých v intervale vyhladzovania. Pomocou polynómu sa určia vyhladené hodnoty úrovní série v strede intervalu vyhladenia. Ďalej sa interval vyhladzovania posunie dopredu o jedno pozorovanie, vypočíta sa ďalšia vyhladená hodnota atď.

Mechanické vyhladzovanie založené na kĺzavých priemeroch

Najjednoduchší spôsob mechanického vyhladzovania je jednoduché vyhladenie kĺzavého priemeru. Metóda sa tak nazýva, pretože je založená na výpočte jednoduchého priemeru niekoľkých úrovní série. Jednoduchý priemer sa posúva pozdĺž časového radu s krokom rovným obdobiu pozorovania.

Najprv pre časový rad y t je určený interval vyhladzovania m, navyše m< n . Ak je potrebné vyhladiť malé náhodné výkyvy, potom sa interval vyhladenia berie čo najväčší; interval vyhladzovania sa zníži, ak je potrebné zachovať menšie výkyvy. Čím širší je interval vyhladzovania, tým viac sa výkyvy navzájom rušia a trend vývoja je plynulejší. Čím silnejšie sú výkyvy, tým širší by mal byť interval vyhladzovania. Za rovnakých podmienok sa odporúča použiť interval vyhladzovania nepárnej dĺžky. Po prvýkrát múrovne časových radov, vypočíta sa ich aritmetický priemer; toto bude vyhladená hodnota úrovne série, ktorá je v strede intervalu vyhladzovania.

Na výpočet vyhladených hodnôt sa používa vzorec:

kde m = 2 p + 1– interval vyhladzovania časového radu nepárnej dĺžky. V dôsledku tohto postupu (n - m + 1)

Postup vyhladzovania možno použiť aj na interval vyhladzovania rovnomernej dĺžky. To platí najmä pre analýzu a predpovedanie javov, ktoré majú sezónne výkyvy. Pri vyhladzovaní sezónnych procesov sa musí interval vyhladzovania nevyhnutne rovnať dĺžke sezónnej vlny. V opačnom prípade dôjde k skresleniu zložiek časového radu, najmä zložiek v t. V prípade, že sa použije interval vyhladzovania párnej dĺžky, t.j. m = 2 p, použije sa vzorec:

(4.2).

V dôsledku tohto postupu (n-m) vyhladené úrovne série.

V každom prípade prvý a posledný p sériové hodnoty nie sú vyhladené. Stratené vyhladené hodnoty úrovní časových radov sa nájdu pomocou priemerného absolútneho zisku zisteného pre prvý a posledný interval vyhladzovania. Na obnovenie stratených pozorovaní na začiatku časového radu sa hodnota priemerného absolútneho nárastu zistená pre prvý interval vyhladzovania odpočíta od prvej vyhladenej hodnoty. Ukazuje sa vyhladená hodnota úrovne série pre yp y 1. Na obnovenie stratených pozorovaní na konci časového radu sa k poslednej vyhladenej hodnote pripočíta hodnota priemerného absolútneho nárastu zisteného pre posledný interval vyhladzovania. Ukazuje sa vyhladená hodnota úrovne série pre yn – p + 1. Potom sa algoritmus opakuje, kým sa nedosiahne vyhladená hodnota. y n.

Ďalšou nevýhodou jednoduchej metódy kĺzavého priemeru je, že ho možno použiť len pre série s lineárnym trendom. Ak je proces charakterizovaný nelineárnym vývojom a je potrebné dodržať ohyby trendu, potom je použitie jednoduchého kĺzavého priemeru nevhodné, pretože. to môže viesť k značným deformáciám. V takýchto prípadoch sa používa metóda váženého kĺzavého priemeru.

Metóda váženého kĺzavého priemeru sa líši od metódy jednoduchého kĺzavého priemeru v tom, že úrovne zahrnuté v intervale vyhladzovania sú sčítané s rôznymi váhami. Je to spôsobené skutočnosťou, že aproximácia pôvodného radu v rámci intervalu vyhladzovania sa vykonáva pomocou polynómu nie prvého stupňa, ako v metóde jednoduchého kĺzavého priemeru, ale polynómu od druhého stupňa. Používa sa vzorec váženého aritmetického priemeru.

Hĺbková analýza časových radov si vyžaduje použitie zložitejších metód matematickej štatistiky. Ak je v časovom rade významná náhodná chyba (šum), použije sa jedna z dvoch jednoduchých metód - vyhladenie alebo vyrovnanie zväčšením intervalov a výpočtom skupinových priemerov. Táto metóda vám umožňuje zvýšiť viditeľnosť série, ak je väčšina zložiek "hluku" vo vnútri intervalov. Ak však „šum“ nie je v súlade s periodicitou, rozdelenie úrovní indikátorov sa stáva hrubým, čo obmedzuje možnosť podrobnej analýzy zmeny javu v čase.

Presnejšie charakteristiky sa získajú, ak sa použijú kĺzavé priemery - široko používaná metóda na vyhladenie ukazovateľov série priemerov. Je založená na prechode z počiatočných hodnôt série na priemerné hodnoty v určitom časovom intervale. V tomto prípade sa časový interval počas výpočtu každého nasledujúceho ukazovateľa akoby posúval pozdĺž časového radu.

Použitie kĺzavého priemeru je užitočné, keď sú trendy časových radov neisté, alebo keď sú výrazne ovplyvnené cyklické odľahlé hodnoty (odľahlé hodnoty alebo intervencie).

Čím väčší je interval vyhladzovania, tým hladšie vyzerá graf kĺzavého priemeru. Pri výbere hodnoty intervalu vyhladzovania je potrebné vychádzať z hodnoty dynamického radu a zmysluplného významu odrazenej dynamiky. Veľký časový rad s veľkým počtom počiatočných bodov umožňuje použiť väčšie časové intervaly vyhladzovania (5, 7, 10 atď.). Ak sa postup kĺzavého priemeru používa na vyhladenie nesezónnych sérií, najčastejšie sa interval vyhladzovania považuje za rovný 3 alebo 5. https://tvoipolet.ru/iz-moskvi-v-nyu-jork/ - a skvelá príležitosť vybrať si leteckú spoločnosť na let z Moskvy do New Yorku

Uveďme príklad výpočtu kĺzavého priemeru počtu fariem s vysokými výnosmi (viac ako 30 kg / ha) (tabuľka 10.3).

Tabuľka 10.3 Vyhladenie časového radu zhrubnutím intervalov a kĺzavým priemerom

Účtovný rok

Počet fariem s vysokými výnosmi

Čiastky na tri roky

Rolovanie počas troch rokov

kĺzavých priemerov

90,0

89,7

1984

88,7

87,3

87,3

87,0

86,7

83,0

83,0

82,3

82,3

82,6

82,7

82,7

Príklady výpočtu kĺzavého priemeru:

1982 (84 + 94 + 92) / 3 = 90,0;

1983 (94 + 92 + 83) / 3 = 89,7;

1984 (92 + 83 + 91) / 3 = 88,7;

1985 (83 + 91 + 88) / 3 = 87,3.

Pripravuje sa harmonogram. Na vodorovnej osi sú uvedené roky a na zvislej osi počet fariem s vysokými výnosmi. Súradnice počtu fariem sú uvedené na grafe a získané body sú spojené prerušovanou čiarou. Potom sú na grafe vyznačené súradnice kĺzavého priemeru za roky a body sú spojené hladkou hrubou čiarou.

Zložitejšou a efektívnejšou metódou je vyhladzovanie (nivelizácia) časového radu pomocou rôznych aproximačných funkcií. Umožňujú vám vytvoriť plynulú úroveň všeobecného trendu a hlavnej osi dynamiky.

Najúčinnejšou metódou vyhladzovania pomocou matematických funkcií je jednoduché exponenciálne vyhladzovanie. Táto metóda zohľadňuje všetky predchádzajúce pozorovania série podľa vzorca:

St = α∙Xt + (1 - α) ∙St - 1,

kde S t je každé nové vyhladenie v čase t; S t - 1 - vyhladená hodnota v predchádzajúcom čase t -1; Xt je skutočná hodnota série v čase t; α - parameter vyhladzovania.

Ak α = 1, potom sa predchádzajúce pozorovania úplne ignorujú; keď α = 0, súčasné pozorovania sa ignorujú; hodnoty α medzi 0 a 1 poskytujú medzivýsledky. Zmenou hodnôt tohto parametra si môžete vybrať najprijateľnejšiu možnosť zarovnania. Voľba optimálnej hodnoty α sa vykonáva analýzou získaných grafických obrazov pôvodných a vyrovnaných kriviek alebo zohľadnením súčtu štvorcových chýb (chýb) vypočítaných bodov. Praktické využitie tejto metódy by malo byť realizované pomocou počítača v programe MS Excel. Matematické vyjadrenie vzorcov dynamiky údajov možno získať pomocou funkcie exponenciálneho vyhladzovania.

16.02.15 Viktor Gavrilov

38133 0

Časový rad je postupnosť hodnôt, ktoré sa časom menia. V tomto článku sa pokúsim porozprávať o niektorých jednoduchých, ale účinných prístupoch k práci s takýmito sekvenciami. Existuje množstvo príkladov takýchto údajov – kotácie mien, objemy predaja, požiadavky zákazníkov, údaje z rôznych aplikovaných vied (sociológia, meteorológia, geológia, pozorovania vo fyzike) a mnohé ďalšie.

Séria je bežnou a dôležitou formou popisu údajov, pretože nám umožňuje sledovať celú históriu zmeny hodnoty, ktorá nás zaujíma. To nám dáva možnosť posúdiť „typické“ správanie veličiny a odchýlky od takéhoto správania.

Stál som pred úlohou vybrať súbor údajov, na ktorom by bolo možné vizuálne demonštrovať vlastnosti časového radu. Rozhodol som sa použiť štatistiku medzinárodnej osobnej dopravy, pretože tento súbor údajov je dosť popisný a stal sa akýmsi štandardom (http://robjhyndman.com/tsdldata/data/airpass.dat, zdroj Time Series Data Library, R. J. Hyndman). Séria popisuje počet cestujúcich medzinárodných leteckých spoločností za mesiac (v tisícoch) od roku 1949 do roku 1960.

Keďže mám vždy po ruke zaujímavý nástroj "" na prácu s riadkami, využijem ho. Pred importovaním údajov do súboru musíte pridať stĺpec dátumu, aby boli hodnoty viazané na čas, a stĺpec s názvom série pre každé pozorovanie. Nižšie môžete vidieť, ako vyzerá môj zdrojový súbor, ktorý som importoval do platformy Prognoz pomocou sprievodcu importom priamo z nástroja na analýzu časových radov.

Prvá vec, ktorú zvyčajne robíme s časovým radom, je vykresliť ho do grafu. Platforma Prognoz vám umožňuje zostaviť graf jednoduchým pretiahnutím série do zošita.

Časové rady na grafe

Symbol „M“ na konci názvu série znamená, že séria má mesačnú dynamiku (interval medzi pozorovaniami je jeden mesiac).

Už z grafu vidíme, že séria demonštruje dve funkcie:

  • trend- na našom grafe ide o dlhodobý nárast pozorovaných hodnôt. Je vidieť, že trend je takmer lineárny.
  • sezónnosť- na grafe sú to periodické výkyvy hodnoty. V ďalšom článku na tému časových radov sa naučíme vypočítať obdobie.

Naša séria je celkom „úhľadná“, ale často existujú série, ktoré okrem dvoch vyššie opísaných charakteristík demonštrujú ešte jednu vec - prítomnosť „hluku“, t.j. náhodné variácie v tej či onej forme. Príklad takejto série je možné vidieť v tabuľke nižšie. Ide o sínusový signál zmiešaný s náhodnou premennou.

Pri analýze seriálov nás zaujíma identifikácia ich štruktúry a vyhodnotenie všetkých hlavných komponentov – trendu, sezónnosti, hluku a ďalších vlastností, ako aj schopnosť predpovedať zmeny veľkosti v budúcich obdobiach.

Pri práci so sériami prítomnosť šumu často sťažuje analýzu štruktúry série. Ak chcete vylúčiť jeho vplyv a lepšie vidieť štruktúru série, môžete použiť metódy vyhladzovania série.

Najjednoduchšou metódou na vyhladenie série je kĺzavý priemer. Ide o to, že pre akýkoľvek nepárny počet bodov v sériovej sekvencii nahraďte stredný bod aritmetickým priemerom zostávajúcich bodov:

kde x i- pôvodný riadok s i- vyhladený rad.

Nižšie môžete vidieť výsledok aplikácie tohto algoritmu na naše dve série. Platforma Prognoz štandardne navrhuje používať anti-aliasing s veľkosťou okna 5 bodov ( k v našom vzorci vyššie sa bude rovnať 2). Upozorňujeme, že vyhladený signál už nie je ovplyvnený šumom, spolu so šumom však samozrejme miznú aj niektoré užitočné informácie o dynamike série. Tiež je vidieť, že vyhladenej sérii chýba prvý (a aj posledný) k bodov. Je to spôsobené tým, že pre stredný bod okna (v našom prípade pre tretí bod) sa vykoná vyhladenie, po ktorom sa okno posunie o jeden bod a výpočty sa zopakujú. Pri druhej, náhodnej sérii som použil vyhladzovanie s oknom 30, aby som lepšie odhalil štruktúru série, keďže séria je „vysokofrekvenčná“, je tam veľa bodov.

Metóda kĺzavého priemeru má určité nevýhody:

  • Kĺzavý priemer je pri výpočte neefektívny. Pre každý bod je potrebné priemer prepočítať novým spôsobom. Výsledok vypočítaný pre predchádzajúci bod nemôžeme znova použiť.
  • Kĺzavý priemer nemožno rozšíriť na prvý a posledný bod série. To môže spôsobiť problém, ak nás zaujímajú presne tieto body.
  • Kĺzavý priemer nie je definovaný mimo série, a preto ho nemožno použiť na prognózovanie.

Exponenciálne vyhladzovanie

Pokročilejšou metódou vyhladzovania, ktorú možno použiť aj na predikciu, je exponenciálne vyhladzovanie, niekedy nazývané aj Holt-Wintersova metóda podľa mien jej tvorcov.

Existuje niekoľko variantov tejto metódy:

  • jednoduché vyhladenie pre série, ktoré nemajú trend a sezónnosť;
  • dvojité vyhladenie pre série, ktoré majú trend, ale nemajú sezónnosť;
  • trojité vyhladenie pre série, ktoré majú trend aj sezónnosť.

Metóda exponenciálneho vyhladzovania vypočítava hodnoty vyhladených sérií aktualizáciou hodnôt vypočítaných v predchádzajúcom kroku pomocou informácií z aktuálneho kroku. Informácie z predchádzajúcich a aktuálnych krokov sa berú s rôznymi váhami, ktoré je možné ovládať.

V najjednoduchšej verzii jednoduchého vyhladzovania je pomer:

Parameter α definuje pomer medzi nevyhladenou hodnotou v aktuálnom kroku a vyhladenou hodnotou z predchádzajúceho kroku. o α =1 zoberieme len body pôvodnej série, t.j. nebude žiadne vyhladzovanie. o α =0 séria, vezmeme len vyhladené hodnoty z predchádzajúcich krokov, t.j. séria sa stane konštantou.

Aby sme pochopili, prečo sa vyhladzovanie nazýva exponenciálne, musíme rekurzívne rozšíriť vzťah:

Zo vzťahu je vidieť, že všetky predchádzajúce hodnoty radu prispievajú k aktuálnej vyhladenej hodnote, ale ich príspevok exponenciálne klesá v dôsledku rastu stupňa parametra α .

Ak však existuje trend v údajoch, jednoduché vyhladenie ho „zaostane“ (alebo budete musieť vziať hodnoty α blízko 1, ale potom bude vyhladenie nedostatočné). Musíte použiť dvojité exponenciálne vyhladzovanie.

Dvojité vyhladzovanie už používa dve rovnice – jedna rovnica vyhodnocuje trend ako rozdiel medzi aktuálnou a predošlou vyhladenou hodnotou, následne trend vyhladzuje jednoduchým vyhladzovaním. Druhá rovnica vykonáva vyhladenie ako v jednoduchom prípade, ale druhý člen používa súčet predchádzajúcej vyhladenej hodnoty a trendu.

Trojité vyhladzovanie zahŕňa ďalšiu zložku, sezónnosť a používa inú rovnicu. Zároveň sa rozlišujú dva varianty sezónnej zložky - aditívna a multiplikatívna. V prvom prípade je amplitúda sezónnej zložky konštantná a nezávisí od základnej amplitúdy série v čase. V druhom prípade sa amplitúda mení spolu so zmenou základnej amplitúdy série. Toto je len náš prípad, ako vidno z grafu. Ako séria rastie, zvyšuje sa amplitúda sezónnych výkyvov.

Keďže naša prvá séria má trend aj sezónnosť, rozhodol som sa jej upraviť parametre trojitého vyhladzovania. V platforme Prognoz je to celkom jednoduché, pretože pri aktualizácii hodnoty parametra platforma okamžite prekreslí graf vyhladenej série a vizuálne hneď vidíte, ako dobre popisuje našu pôvodnú sériu. Rozhodol som sa pre nasledujúce hodnoty:

Ako som vypočítal obdobie, na to sa pozrieme v ďalšom článku o časových radoch.

Hodnoty medzi 0,2 a 0,4 možno zvyčajne považovať za prvé aproximácie. Platforma Prognoz využíva aj model s dodatočným parametrom ɸ , čo tlmí trend tak, že sa v budúcnosti približuje ku konštante. Pre ɸ Zobral som hodnotu 1, ktorá zodpovedá bežnému modelu.

Touto metódou som tiež urobil prognózu hodnôt série za posledné 2 roky. Na obrázku nižšie som označil začiatočný bod predpovede tak, že som ho nakreslil čiarou. Ako vidíte, pôvodná séria a vyhladená séria sa celkom dobre zhodujú, a to aj v období prognózy - nie je to zlé pre takú jednoduchú metódu!

Platforma Prognoz vám tiež umožňuje automaticky vybrať optimálne hodnoty parametrov pomocou systematického vyhľadávania v priestore hodnôt parametrov a minimalizovať súčet štvorcových odchýlok vyhladených sérií od originálu.

Popísané metódy sú veľmi jednoduché, ľahko použiteľné a sú dobrým východiskovým bodom pre štruktúrnu analýzu a predpovedanie časových radov.

Prečítajte si viac o časových radoch v ďalšom článku.

Veľmi často hladiny dynamických radov kolíšu, pričom trend vývoja javu v čase je skrytý náhodnými odchýlkami hladín jedným alebo druhým smerom. S cieľom jasnejšie identifikovať vývojový trend skúmaného procesu, a to aj pre ďalšiu aplikáciu prognostických metód založených na trendových modeloch, vyhladzovanie(zarovnanie) časové rady.

Metódy vyhladzovania časových radov sú rozdelené do dvoch hlavných skupín:

1. analytické zoradenie pomocou krivky nakreslenej medzi konkrétnymi úrovňami série tak, aby odrážala trend vlastný sérii a zároveň ju oslobodila od menších výkyvov;

2. mechanické vyrovnanie jednotlivých úrovní časového radu pomocou skutočných hodnôt susedných úrovní.

Podstata metód mechanického vyhladzovania je nasledovná. Preberá sa niekoľko úrovní časových radov, ktoré sa tvoria interval vyhladzovania. Pre nich sa vyberie polynóm, ktorého stupeň by mal byť menší ako počet úrovní zahrnutých do intervalu vyhladzovania; pomocou polynómu sa určia nové, zarovnané hodnoty úrovní v strede intervalu vyhladzovania. Ďalej sa interval vyhladzovania posunie o jednu úroveň série doprava, vypočíta sa ďalšia vyhladená hodnota atď.

Najjednoduchší spôsob mechanického vyhladzovania je jednoduchá metóda kĺzavého priemeru.

2.4.1.Jednoduchá metóda kĺzavého priemeru.

Najprv pre časový rad: určí sa interval vyhladzovania. Ak je potrebné vyhladiť malé náhodné výkyvy, potom sa interval vyhladenia berie čo najväčší; interval vyhladzovania sa zníži, ak je potrebné zachovať menšie výkyvy.

Pre prvé úrovne série sa vypočíta ich aritmetický priemer. Toto bude vyhladená hodnota úrovne série, ktorá je v strede intervalu vyhladzovania. Potom sa interval vyhladzovania posunie o jednu úroveň doprava, výpočet aritmetického priemeru sa zopakuje atď. Na výpočet vyhladených úrovní série sa používa nasledujúci vzorec:

kde (pre nepárne); pre párne čísla sa vzorec skomplikuje.

V dôsledku takéhoto postupu sa získajú vyhladené hodnoty úrovní série; v tomto prípade sa prvá a posledná úroveň série stratia (nevyhladia). Ďalšou nevýhodou metódy je, že je použiteľná len pre série s lineárnym trendom.

2.4.2.Metóda váženého kĺzavého priemeru.

Metóda váženého kĺzavého priemeru sa líši od predchádzajúcej metódy vyhladzovania tým, že úrovne zahrnuté do intervalu vyhladzovania sa pridávajú s rôznymi váhami. Je to spôsobené tým, že aproximácia radu v rámci intervalu vyhladzovania sa vykonáva pomocou polynómu nie prvého stupňa, ako v predchádzajúcom prípade, ale stupňa od druhého.

Používa sa vzorec váženého aritmetického priemeru:

,

kde sa váhy určujú metódou najmenších štvorcov. Tieto váhy sú vypočítané pre rôzne stupne aproximačného polynómu a rôzne intervaly vyhladzovania.

1. pre polynómy druhého a tretieho rádu má číselná postupnosť váh pre interval vyhladzovania tvar: , a má tvar: ;

2. pre polynómy štvrtého a piateho stupňa a s intervalom vyhladzovania je postupnosť váh nasledovná: .

Rozdelenie váh cez interval vyhladzovania, získané na základe metódy najmenších štvorcov, pozri diagram 1.



2.4.3.Metóda exponenciálneho vyhladzovania.

Do rovnakej skupiny metód patrí aj metóda exponenciálneho vyhladzovania.

Jeho zvláštnosť spočíva v tom, že v postupe hľadania vyhladenej úrovne sa používajú iba hodnoty predchádzajúcich úrovní série, brané s určitou váhou, a váha pozorovania klesá, keď sa vzďaľuje od časový bod, pre ktorý sa určuje vyhladená hodnota úrovne série.

Ak pre pôvodný časový rad

zodpovedajúce vyhladené hodnoty sú označené potom sa exponenciálne vyhladenie vykoná podľa vzorca:

kde parameter vyhladzovania ; množstvo sa nazýva diskontný faktor.

Použitím daného rekurentného vzťahu pre všetky úrovne radu, počnúc prvou a končiac časovým okamihom , možno získať, že exponenciálny priemer, teda hodnota úrovne radu vyhladeného touto metódou, je vážený priemer všetkých predchádzajúcich úrovní.

Vyhladzovanie časových radov

vyhladzovanie časových radov, tie. Nahradenie skutočných úrovní vypočítanými hodnotami, ktoré majú menšiu volatilitu ako pôvodné údaje, je jednoduchý spôsob identifikácie trendov. Zodpovedajúca transformácia sa nazýva filtrovanie.

Vyhladenie časových radov sa vykonáva v týchto prípadoch:

· V grafickom znázornení časového radu nie je trend jasne viditeľný. Preto sa séria vyhladí, vyhladené hodnoty sa vynesú do grafu a trend sa spravidla objaví jasnejšie;

· Používajú sa metódy analýzy a prognózovania, ktoré si vyžadujú vyhladenie časových radov ako predpoklad;

Pri odstraňovaní anomálnych pozorovaní;

· S priamym predpovedaním ekonomických ukazovateľov a predpovedaním zmeny trendu – „bodov obratu“.

Existujúce metódy vyhladzovania sú rozdelené do dvoch skupín:

1) Analytické metódy. Na vyhladenie sa používa krivka, ktorá je nakreslená vzhľadom na skutočné hodnoty série tak, aby odrážala trend vlastný sérii a zároveň ju oslobodila od malých nevýznamných výkyvov. Takéto krivky sa nazývajú aj rastové krivky, používajú sa najmä na predpovedanie ekonomických ukazovateľov;

2) Metódy mechanického hladenia. Každá jednotlivá úroveň série je vyhladená pomocou skutočných hodnôt susediacich úrovní. Na vyhladenie časových radov sa často používajú metódy jednoduchého a váženého kĺzavého priemeru, exponenciálneho vyhladzovania.

Jednoduchá metóda kĺzavého priemeru zahŕňa nasledujúce kroky:

1. Určí sa počet pozorovaní zahrnutých do intervalu vyhladzovania. V tomto prípade sa používa pravidlo: ak je potrebné vyhladiť malé, chaotické výkyvy, potom sa interval vyhladenia vezme čo najväčší a naopak sa interval vyhladenia zníži, keď je potrebné zachovať menšie vlny a získať zbaviť sa periodicky sa opakujúcich výkyvov vznikajúcich napríklad v dôsledku autokorelácií úrovní .

2. Vypočíta sa priemerná hodnota pozorovaní tvoriacich interval vyhladenia, ktorá je zároveň hodnotou vyhladenia úrovne umiestnenej v strede intervalu vyhladenia, za predpokladu, že m je nepárne číslo, podľa vzorca

kde m je počet pozorovaní zahrnutých do intervalu vyhladzovania; p je počet pozorovaní umiestnených na opačných stranách vyhladeného.

Pre nepárne m sa hodnota parametra p vypočíta takto:

Prvé vyhladené pozorovanie bude t, kde t = p+1.

3. Interval vyhladzovania sa posunie o jeden člen doprava a vyhladená hodnota pre (t + 1) -té pozorovanie sa zistí pomocou vzorca (1). Potom sa posun znova vykoná atď.

Postup pokračuje dovtedy, kým posledné pozorovanie časového radu nevstúpi do vyhladzovacieho intervalu.

Metódu jednoduchého kĺzavého priemeru možno použiť, ak grafické znázornenie série pripomína priamku.

V tomto prípade nie je skreslená dynamika vývoja skúmaného procesu. Keď sa však trend série, ktorá sa má vyrovnať, ohýba a navyše je žiaduce udržiavať malé vlny, nie je vhodné použiť na vyhladenie série jednoduchú metódu kĺzavého priemeru, pretože v tomto prípade:

konvexné aj konkávne čiary sú zarovnané;

· dochádza k posunu vlny pozdĺž radu;

· sa mení znamienko vlny, t.j. na krivke spájajúcej vyhladené body sa namiesto konvexného úseku vytvorí konkávny a naopak. Posledné nastáva, keď je interval vyhladzovania jeden a pol násobok vlnovej dĺžky.

Ak je teda vývoj procesu nelineárny, potom aplikácia metódy jednoduchého kĺzavého priemeru môže viesť k významným deformáciám skúmaného procesu.

V takýchto prípadoch je spoľahlivejšie použiť iné metódy vyhladzovania, napríklad metódu váženého kĺzavého priemeru.

Metóda váženého kĺzavého priemeru sa líši od predchádzajúceho v tom, že vyhladzovanie v rámci intervalu sa vykonáva nie pozdĺž priamky, ale pozdĺž krivky vyššieho rádu. Je to spôsobené tým, že sčítanie členov série zahrnutých do intervalu vyhladzovania sa vykonáva s určitými váhami vypočítanými pomocou metódy najmenších štvorcov.

Ak sa vyhladenie vykonáva pomocou polynómu (polynómu) druhého a tretieho rádu, potom sa berú tieto váhy

(-3; 12; 17; 12; -3) pre m=5;

(-2; 3; 6; 7; 3; -2) pre m=7.

Vlastnosti mierky:

1) sú symetrické vzhľadom na stredový člen;

2) súčet váh, berúc do úvahy spoločný faktor, sa rovná jednej.

Nevýhoda metódy: prvé a posledné p pozorovania série zostávajú nevyhladené.

Výpočet ukazovateľov dynamiky ekonomických procesov

Výpočet ukazovateľov dynamiky ekonomických procesov je záverečnou fázou predbežnej analýzy údajov.

Na charakterizáciu dynamiky zmien ekonomických ukazovateľov sa často používa koncept autokorelácie, ktorý charakterizuje nielen vzájomnú závislosť úrovní rovnakého radu súvisiacich s rôznymi bodmi pozorovania, ale aj stupeň stability vývoja procesu. v čase, hodnota optimálneho predpovedného obdobia a pod.

Mieru tesnosti štatistického vzťahu medzi úrovňami časového radu, posunutých o f jednotiek času, určuje hodnota korelačného koeficientu r(f). Keďže r(φ) meria tesnosť spojenia medzi úrovňami rovnakého časového radu, bežne sa nazýva autokorelačný koeficient. V tomto prípade sa f - dĺžka časového posunu - zvyčajne nazýva oneskorenie.

Koeficient autokorelácie sa vypočíta podľa vzorca

Pri veľkej dĺžke skúmaného radu je možné zjednodušiť výpočet autokorelačných koeficientov. Na tento účel sa nezistia odchýlky od priemerného korelovaného radu, ale od celkového priemeru celého radu. V tomto prípade

Poradie autokorelačných koeficientov je určené časovým oneskorením: prvý rád (pri φ = 1), druhý rád (pri φ = 2) atď.

Postupnosť autokorelačných koeficientov úrovní prvého, druhého a nasledujúcich rádov sa nazýva autokorelačná funkcia. Ich hodnoty sa môžu meniť od -1 do +1, ale zo stacionárnosti vyplýva, že r(f) = - r(f). Graf autokorelačnej funkcie sa nazýva korelogram.

Rozbor autokorelačnej funkcie a korelogramu umožňuje určiť oneskorenie, pri ktorom je autokorelácia najvyššia, t.j. pomocou analýzy autokorelačnej funkcie a korelogramu je možné odhaliť štruktúru série.

Ak sa autokorelačný koeficient 1. rádu ukázal ako najvyšší, skúmaný rad obsahuje iba trend. Ak sa autokorelačný koeficient rádu φ ukázal ako najvyšší, potom séria obsahuje cyklické oscilácie s periodicitou φ časových bodov. Ak žiadny z autokorelačných koeficientov nie je významný, potom je možné urobiť jeden z dvoch predpokladov o štruktúre tohto radu: buď rad neobsahuje trend a sezónne výkyvy, alebo rad obsahuje silný nelineárny trend, ktorý si vyžaduje dodatočné analýza na identifikáciu. Preto je vhodné použiť úrovňový autokorelačný koeficient a autokorelačnú funkciu na identifikáciu prítomnosti alebo neprítomnosti trendovej zložky f(t) a sezónnej zložky S(t) v časovom rade.