Pagbuo ng isang pagtataya gamit ang moving average na pamamaraan. Halimbawa ng solusyon sa problema

Mechanical smoothing batay sa moving averages

Mga pamamaraan ng pagpapakinis ng serye ng oras

Kadalasan ang mga antas ng pang-ekonomiyang serye ng oras ay nagbabago. Kasabay nito, ang takbo sa pag-unlad ng isang pang-ekonomiyang kababalaghan sa oras ay nakatago sa pamamagitan ng mga random na paglihis ng mga halaga ng serye sa isang direksyon o iba pa. Upang mas mahusay na makilala ang mga uso pagbuo ng prosesong pinag-aaralan magsagawa ng pagpapakinis (alignment) serye ng oras ng mga tagapagpahiwatig ng ekonomiya. Ang kakanyahan ng iba't ibang mga pamamaraan ng smoothing bumababa sa pagpapalit ng mga aktwal na antas ng serye ng oras ng mga kinakalkula na halaga, na napapailalim sa mga pagbabago sa mas mababang lawak. Nag-aambag ito sa isang malinaw na pagpapakita ng kalakaran.

Ang mga pamamaraan ng pagpapakinis ng serye ng oras ay nahahati sa dalawang pangunahing grupo:

1) analytical alignment gamit ang isang curve na iginuhit sa pagitan ng mga partikular na antas ng serye upang ito ay sumasalamin sa trend na likas sa serye, at sa parehong oras ay nagpapalaya nito mula sa maliliit na pagbabago;

2) mekanikal na pagkakahanay mga indibidwal na antas ng serye ng oras gamit ang aktwal na mga halaga ng mga kalapit na antas.

Ang kakanyahan ng analytical smoothing pamamaraan batay sa mathematical rule na sa pamamagitan ng alinman n mga puntos na nakahiga sa eroplano, posible na gumuhit ng polynomial minimum (n - 1) degree upang ito ay dumaan sa lahat ng mga itinalagang punto.

Ang kakanyahan ng mga mekanikal na pamamaraan ng smoothing namamalagi sa katotohanan na ang ilang mga antas ng isang serye ng mga dinamika ay kinuha, na bumubuo ng isang smoothing interval. Para sa kanila, ang isang polynomial ay pinili, ang antas ng kung saan ay dapat na mas mababa kaysa sa bilang ng mga antas na kasama sa smoothing interval. Gamit ang isang polynomial, ang mga pinakinis na halaga ng mga antas ng serye sa gitna ng pagitan ng pagpapakinis ay tinutukoy. Susunod, ang agwat ng smoothing ay inililipat pasulong sa pamamagitan ng isang obserbasyon, ang susunod na smoothed na halaga ay kinakalkula, at iba pa.

Mechanical smoothing batay sa moving averages

Ang pinakasimpleng paraan ng mechanical smoothing ay simpleng moving average smoothing. Ang pamamaraan ay tinatawag na gayon dahil ito ay batay sa pagkalkula ng isang simpleng average ng ilang mga antas ng serye. Ang simpleng average na mga slide sa kahabaan ng serye ng oras na may isang hakbang na katumbas ng panahon ng pagmamasid.

Una para sa time series y t natutukoy ang pagitan ng pagpapakinis m, saka m< n . Kung kinakailangan upang pakinisin ang mga maliliit na random na pagbabagu-bago, kung gayon ang agwat ng pag-smoothing ay kinuha nang malaki hangga't maaari; ang agwat ng pagpapakinis ay nababawasan kung kinakailangan upang mapanatili ang mas maliliit na pagbabago-bago. Kung mas malawak ang agwat ng pagpapakinis, mas magkakansela ang mga pagbabago sa isa't isa, at mas maayos ang trend ng pag-unlad. Kung mas malakas ang pagbabagu-bago, mas malawak ang dapat na pagitan ng smoothing. Sa ilalim ng parehong mga kondisyon, inirerekumenda na gumamit ng isang kakaibang haba ng smoothing interval. Para sa una m mga antas ng serye ng oras, ang kanilang arithmetic mean ay kinakalkula; ito ang magiging smoothed value ng level ng series na nasa gitna ng smoothing interval.

Upang kalkulahin ang mga smoothed value, ginagamit ang formula:

saan m = 2 p + 1– pagpapakinis ng pagitan ng serye ng oras ng kakaibang haba. Bilang resulta ng pamamaraang ito, (n - m + 1)

Ang smoothing procedure ay maaari ding ilapat sa isang smoothing interval ng pantay na haba. Ito ay totoo lalo na para sa pagsusuri at pagtataya ng mga phenomena na may pana-panahong pagbabagu-bago. Kapag pinapakinis ang mga pana-panahong proseso, ang agwat ng pagpapakinis ay dapat na katumbas ng haba ng pana-panahong alon. Kung hindi, magkakaroon ng pagbaluktot ng mga bahagi ng serye ng oras, lalo na, ang mga bahagi v t. Sa kaso kapag ang isang pantay na haba ng smoothing interval ay ginagamit, i.e. m = 2p, inilapat ang formula:

(4.2).

Bilang resulta ng pamamaraang ito, (n-m) makinis na antas ng serye.

Anyway una at huli p ang mga halaga ng serye ay hindi pinapakinis. Ang mga nawawalang smoothed value ng mga antas ng time series ay matatagpuan sa pamamagitan ng paggamit ng average na absolute gain na natagpuan para sa una at huling smoothing interval. Upang mabawi ang mga nawalang obserbasyon sa simula ng serye ng oras, ang halaga ng average na ganap na pagtaas na natagpuan para sa unang agwat ng pagpapakinis ay ibinabawas mula sa unang pinakinis na halaga. Ito ay lumiliko ang smoothed na halaga ng antas ng serye para sa yp y 1. Upang maibalik ang mga nawalang obserbasyon sa pagtatapos ng serye ng oras, ang halaga ng average na ganap na pagtaas na natagpuan para sa huling agwat ng pag-smoothing ay idinaragdag sa huling na-smooth na halaga. Ito ay lumiliko ang smoothed na halaga ng antas ng serye para sa yn – p + 1. Pagkatapos ang algorithm ay paulit-ulit hanggang sa makuha ang isang smoothed value. y n.

Isa pang kawalan ng simpleng moving average na paraan ay maaari lamang itong gamitin para sa mga serye na may linear na trend. Kung ang proseso ay nailalarawan sa pamamagitan ng isang di-linear na pag-unlad at ito ay kinakailangan upang panatilihin ang mga bends ng trend, at pagkatapos ay ang paggamit ng isang simpleng moving average ay hindi naaangkop, dahil. ito ay maaaring humantong sa mga makabuluhang pagbaluktot. Sa ganitong mga kaso, ginagamit ang weighted moving average na paraan.

Weighted moving average na paraan ay naiiba sa simpleng moving average na paraan na ang mga antas na kasama sa smoothing interval ay summed up sa iba't ibang timbang. Ito ay dahil sa ang katunayan na ang approximation ng orihinal na serye sa loob ng smoothing interval ay isinasagawa gamit ang isang polynomial hindi sa unang degree, tulad ng sa simpleng moving average na paraan, ngunit ng degree, simula sa pangalawa. Ginagamit ang weighted arithmetic mean formula.

Ang isang malalim na pagsusuri ng mga serye ng oras ay nangangailangan ng paggamit ng mas kumplikadong mga pamamaraan ng mga istatistika ng matematika. Kung mayroong isang makabuluhang random na error (ingay) sa serye ng oras, isa sa dalawang simpleng pamamaraan ang ginagamit - pagpapakinis o pag-level sa pamamagitan ng pagpapalaki ng mga pagitan at pagkalkula ng mga average ng grupo. Ang pamamaraang ito ay nagbibigay-daan sa iyo upang mapataas ang visibility ng serye, kung ang karamihan sa mga bahagi ng "ingay" ay nasa loob ng mga pagitan. Gayunpaman, kung ang "ingay" ay hindi pare-pareho sa periodicity, ang distribusyon ng mga antas ng indicator ay nagiging magaspang, na naglilimita sa posibilidad ng isang detalyadong pagsusuri ng pagbabago sa phenomenon sa paglipas ng panahon.

Nakukuha ang mas tumpak na mga katangian kung ginagamit ang mga moving average - isang malawakang ginagamit na paraan para sa pagpapakinis ng mga indicator ng average na serye. Ito ay batay sa paglipat mula sa mga paunang halaga ng serye hanggang sa mga average na halaga sa isang tiyak na agwat ng oras. Sa kasong ito, ang agwat ng oras sa panahon ng pagkalkula ng bawat kasunod na tagapagpahiwatig, kumbaga, ay dumudulas sa serye ng oras.

Ang paggamit ng moving average ay kapaki-pakinabang kapag ang mga trend sa time series ay hindi sigurado o kapag ang mga cyclical outlier (outlier o intervention) ay labis na naapektuhan.

Kung mas malaki ang pagitan ng pagpapakinis, mas maayos ang hitsura ng moving average na tsart. Kapag pumipili ng halaga ng agwat ng pagpapakinis, kinakailangang magpatuloy mula sa halaga ng dynamic na serye at ang makabuluhang kahulugan ng sinasalamin na dinamika. Ang isang malaking serye ng oras na may malaking bilang ng mga paunang puntos ay nagbibigay-daan sa paggamit ng mas malalaking agwat ng oras ng pagpapakinis (5, 7, 10, atbp.). Kung ang moving average na pamamaraan ay ginagamit upang pakinisin ang isang di-pana-panahong serye, kung gayon kadalasan ang pagitan ng smoothing ay kinuha katumbas ng 3 o 5. https://tvoipolet.ru/iz-moskvi-v-nyu-jork/ - a magandang pagkakataon na pumili ng airline para sa flight mula Moscow papuntang New York

Magbigay tayo ng isang halimbawa ng pagkalkula ng moving average na bilang ng mga sakahan na may mataas na ani (higit sa 30 kg / ha) (Talahanayan 10.3).

Talahanayan 10.3 Pakinisin ang serye ng oras sa pamamagitan ng mga coarsening interval at moving average

Taon ng accounting

Bilang ng mga sakahan na may mataas na ani

Mga halaga para sa tatlong taon

Gumulong sa loob ng tatlong taon

gumagalaw na average

90,0

89,7

1984

88,7

87,3

87,3

87,0

86,7

83,0

83,0

82,3

82,3

82,6

82,7

82,7

Mga halimbawa ng moving average na kalkulasyon:

1982 (84 + 94 + 92) / 3 = 90.0;

1983 (94 + 92 + 83) / 3 = 89.7;

1984 (92 + 83 + 91) / 3 = 88.7;

1985 (83 + 91 + 88) / 3 = 87.3.

Isang iskedyul ang ginagawa. Ang mga taon ay ipinahiwatig sa abscissa axis, at ang bilang ng mga sakahan na may mataas na ani ay ipinahiwatig sa ordinate axis. Ang mga coordinate ng bilang ng mga sakahan ay ipinahiwatig sa graph at ang mga nakuha na puntos ay konektado sa pamamagitan ng isang putol na linya. Pagkatapos ay ang mga coordinate ng moving average sa paglipas ng mga taon ay ipinahiwatig sa tsart at ang mga puntos ay konektado sa pamamagitan ng isang makinis na bold na linya.

Ang isang mas kumplikado at mahusay na paraan ay ang pagpapakinis (leveling) ng serye ng oras gamit ang iba't ibang mga approximation function. Pinapayagan ka nitong bumuo ng isang maayos na antas ng pangkalahatang trend at ang pangunahing axis ng dinamika.

Ang pinaka-epektibong paraan ng pag-smoothing gamit ang math function ay ang simpleng exponential smoothing. Isinasaalang-alang ng pamamaraang ito ang lahat ng nakaraang mga obserbasyon ng serye ayon sa pormula:

S t = α∙X t + (1 - α ) ∙S t - 1 ,

kung saan ang S t ay ang bawat bagong pagpapakinis sa oras t ; S t - 1 - smoothed na halaga sa nakaraang oras t -1; Ang X t ay ang aktwal na halaga ng serye sa oras na t ; α - smoothing parameter.

Kung α = 1, ang mga nakaraang obserbasyon ay ganap na hindi pinansin; kapag α = 0, binabalewala ang kasalukuyang mga obserbasyon; ang mga halaga ng α sa pagitan ng 0 at 1 ay nagbibigay ng mga intermediate na resulta. Sa pamamagitan ng pagbabago ng mga halaga ng parameter na ito, maaari mong piliin ang pinakakatanggap-tanggap na opsyon sa pag-align. Ang pagpili ng pinakamainam na halaga ng α ay isinasagawa sa pamamagitan ng pagsusuri sa nakuhang mga graphic na larawan ng orihinal at leveled na mga kurba, o sa pamamagitan ng pagsasaalang-alang sa kabuuan ng mga squared error (error) ng mga kinakalkula na puntos. Ang praktikal na paggamit ng pamamaraang ito ay dapat isagawa gamit ang isang computer sa programa ng MS Excel. Ang mathematical expression ng mga pattern ng data dynamics ay maaaring makuha gamit ang exponential smoothing function.

16.02.15 Viktor Gavrilov

38133 0

Ang isang serye ng oras ay isang pagkakasunud-sunod ng mga halaga na nagbabago sa paglipas ng panahon. Susubukan kong pag-usapan ang ilang simple ngunit epektibong diskarte sa pagtatrabaho sa mga ganitong pagkakasunud-sunod sa artikulong ito. Mayroong maraming mga halimbawa ng naturang data - mga quote ng pera, dami ng mga benta, mga kahilingan ng customer, data sa iba't ibang mga inilapat na agham (sosyolohiya, meteorolohiya, geology, mga obserbasyon sa pisika) at marami pa.

Ang mga serye ay isang pangkaraniwan at mahalagang anyo ng paglalarawan ng data, dahil pinapayagan kami ng mga ito na obserbahan ang buong kasaysayan ng halaga kung saan kami interesado. Nagbibigay ito sa atin ng pagkakataong hatulan ang "karaniwang" pag-uugali ng dami at ang mga paglihis mula sa gayong pag-uugali.

Ako ay nahaharap sa gawain ng pagpili ng isang set ng data kung saan posible na malinaw na ipakita ang mga tampok ng serye ng oras. Nagpasya akong gumamit ng mga internasyonal na istatistika ng trapiko ng pasahero dahil ang set ng data na ito ay medyo naglalarawan at naging medyo isang pamantayan (http://robjhyndman.com/tsdldata/data/airpass.dat , source Time Series Data Library, R. J. Hyndman). Inilalarawan ng serye ang bilang ng mga internasyonal na pasahero ng eroplano bawat buwan (sa libu-libo) mula 1949 hanggang 1960.

Dahil palagi akong nasa kamay, na mayroong isang kawili-wiling tool "" para sa pagtatrabaho sa mga hilera, gagamitin ko ito. Bago i-import ang data sa file, kailangan mong magdagdag ng isang haligi na may petsa upang ang mga halaga ay nakasalalay sa oras, at isang haligi na may pangalan ng serye para sa bawat pagmamasid. Sa ibaba makikita mo kung ano ang hitsura ng aking source file, na na-import ko sa Prognoz Platform gamit ang import wizard nang direkta mula sa tool sa pagsusuri ng serye ng oras.

Ang unang bagay na karaniwang ginagawa namin sa isang serye ng oras ay i-plot ito sa isang tsart. Binibigyang-daan ka ng Prognoz Platform na bumuo ng isang graph sa pamamagitan lamang ng pag-drag at pag-drop ng isang serye sa isang workbook.

Serye ng oras sa tsart

Ang simbolo na 'M' sa dulo ng pangalan ng serye ay nangangahulugan na ang serye ay may buwanang dinamika (ang pagitan sa pagitan ng mga obserbasyon ay isang buwan).

Mula na sa graph, makikita natin na ang serye ay nagpapakita ng dalawang tampok:

  • uso- sa aming tsart, ito ay isang pangmatagalang pagtaas sa mga naobserbahang halaga. Ito ay makikita na ang trend ay halos linear.
  • seasonality- sa graph, ito ay mga pana-panahong pagbabagu-bago sa halaga. Sa susunod na artikulo sa paksa ng serye ng oras, malalaman natin kung paano kalkulahin ang panahon.

Ang aming serye ay medyo "maayos", gayunpaman, madalas na may mga serye na, bilang karagdagan sa dalawang katangian na inilarawan sa itaas, ay nagpapakita ng isa pang bagay - ang pagkakaroon ng "ingay", i.e. random na mga pagkakaiba-iba sa isang anyo o iba pa. Ang isang halimbawa ng naturang serye ay makikita sa tsart sa ibaba. Ito ay isang sinusoidal signal na may halong random na variable.

Kapag sinusuri ang mga serye, interesado kaming tukuyin ang kanilang istraktura at suriin ang lahat ng pangunahing bahagi - trend, seasonality, ingay, at iba pang mga feature, pati na rin ang kakayahang gumawa ng mga pagtataya ng mga pagbabago sa magnitude sa mga hinaharap na panahon.

Kapag nagtatrabaho sa serye, ang pagkakaroon ng ingay ay kadalasang nagpapahirap sa pag-aralan ang istraktura ng serye. Upang ibukod ang impluwensya nito at mas mahusay na makita ang istraktura ng serye, maaari mong gamitin ang mga paraan ng pagpapakinis ng serye.

Ang pinakasimpleng paraan para sa smoothing series ay ang moving average. Ang ideya ay para sa anumang kakaibang bilang ng mga puntos sa isang serye ng pagkakasunud-sunod, palitan ang gitnang punto ng arithmetic mean ng natitirang mga puntos:

saan x i- orihinal na hilera s i- makinis na hilera.

Sa ibaba makikita mo ang resulta ng paglalapat ng algorithm na ito sa aming dalawang serye. Bilang default, iminumungkahi ng Prognoz Platform ang paggamit ng anti-aliasing na may sukat ng window na 5 puntos ( k sa aming formula sa itaas ay magiging katumbas ng 2). Mangyaring tandaan na ang smoothed signal ay hindi na apektado ng ingay, ngunit kasama ng ingay, siyempre, ang ilang mga kapaki-pakinabang na impormasyon tungkol sa dynamics ng serye ay nawawala din. Makikita rin na ang pinakinis na serye ay kulang sa una (at gayundin sa huli) k puntos. Ito ay dahil sa ang katunayan na ang smoothing ay ginanap para sa gitnang punto ng window (sa aming kaso, para sa ikatlong punto), pagkatapos kung saan ang window ay inilipat ng isang punto, at ang mga kalkulasyon ay paulit-ulit. Para sa pangalawa, random na serye, gumamit ako ng smoothing na may window na katumbas ng 30 upang mas maipakita ang istraktura ng serye, dahil ang serye ay "high-frequency", mayroong maraming mga puntos.

Ang moving average na paraan ay may ilang mga disadvantages:

  • Ang moving average ay hindi mahusay sa pagkalkula. Para sa bawat punto, ang average ay dapat na muling kalkulahin sa isang bagong paraan. Hindi namin magagamit muli ang resulta na kinakalkula para sa nakaraang punto.
  • Ang moving average ay hindi maaaring palawigin sa una at huling mga punto ng serye. Maaari itong magdulot ng problema kung interesado tayo sa eksaktong mga puntong ito.
  • Ang moving average ay hindi tinukoy sa labas ng serye at, bilang resulta, ay hindi magagamit para sa pagtataya.

Exponential Smoothing

Ang isang mas advanced na paraan ng smoothing na maaari ding gamitin para sa paghula ay exponential smoothing, tinatawag din minsan na Holt-Winters method pagkatapos ng mga pangalan ng mga lumikha nito.

Mayroong ilang mga variant ng pamamaraang ito:

  • single smoothing para sa mga serye na walang uso at seasonality;
  • double smoothing para sa mga serye na may uso ngunit walang seasonality;
  • triple smoothing para sa mga serye na parehong may trend at seasonality.

Kinakalkula ng exponential smoothing method ang mga value ng smoothed series sa pamamagitan ng pag-update ng mga value na kinakalkula sa nakaraang hakbang gamit ang impormasyon mula sa kasalukuyang hakbang. Ang impormasyon mula sa nakaraan at kasalukuyang mga hakbang ay kinuha gamit ang iba't ibang mga timbang na maaaring kontrolin.

Sa pinakasimpleng bersyon ng single smoothing, ang ratio ay:

Parameter α tinutukoy ang ratio sa pagitan ng hindi na-smooth na halaga sa kasalukuyang hakbang at ang pinakinis na halaga mula sa nakaraang hakbang. Sa α =1 kukunin lang natin ang mga puntos ng orihinal na serye, i.e. walang magiging smoothing. Sa α =0 series, kukuha lang kami ng mga smoothed value mula sa mga nakaraang hakbang, i.e. ang serye ay magiging pare-pareho.

Upang maunawaan kung bakit tinatawag na exponential ang smoothing, kailangan nating palawakin ang ugnayan nang recursively:

Ito ay makikita mula sa kaugnayan na ang lahat ng nakaraang mga halaga ng serye ay nag-aambag sa kasalukuyang smoothed na halaga, gayunpaman, ang kanilang kontribusyon ay kumukupas nang malaki dahil sa paglaki ng antas ng parameter. α .

Gayunpaman, kung mayroong isang trend sa data, ang isang simpleng smoothing ay "mahuhuli" nito (o kailangan mong kumuha ng mga halaga α malapit sa 1, ngunit pagkatapos ay hindi sapat ang pagpapakinis). Kailangan mong gumamit ng double exponential smoothing.

Gumagamit na ng dalawang equation ang double smoothing - sinusuri ng isang equation ang trend bilang pagkakaiba sa pagitan ng kasalukuyan at dating smoothed na value, pagkatapos ay pinapakinis ang trend gamit ang simpleng smoothing. Ang pangalawang equation ay nagsasagawa ng pagpapakinis tulad ng sa simpleng kaso, ngunit ang pangalawang termino ay gumagamit ng kabuuan ng nakaraang pinakinis na halaga at ang trend.

Kasama sa triple smoothing ang isa pang bahagi, seasonality, at gumagamit ng isa pang equation. Kasabay nito, ang dalawang variant ng seasonal component ay nakikilala - additive at multiplicative. Sa unang kaso, ang amplitude ng seasonal na bahagi ay pare-pareho at hindi nakadepende sa base amplitude ng serye sa paglipas ng panahon. Sa pangalawang kaso, nagbabago ang amplitude kasama ang pagbabago sa base amplitude ng serye. Ito lamang ang aming kaso, tulad ng makikita mula sa graph. Habang lumalaki ang serye, tumataas ang amplitude ng mga seasonal fluctuation.

Dahil ang aming unang serye ay may parehong trend at seasonality, nagpasya akong ayusin ang triple smoothing parameter para dito. Sa Prognoz Platform, ito ay medyo madaling gawin, dahil kapag ang halaga ng parameter ay na-update, ang platform ay agad na nagre-redraw ng graph ng smoothed na serye, at makikita mo kaagad kung gaano kahusay ang paglalarawan sa aming orihinal na serye. Nanirahan ako sa mga sumusunod na halaga:

Kung paano ko kinakalkula ang panahon, titingnan natin sa susunod na artikulo sa serye ng oras.

Karaniwan, ang mga halaga sa pagitan ng 0.2 at 0.4 ay maaaring ituring bilang mga unang pagtatantya. Gumagamit din ang Prognoz Platform ng isang modelo na may karagdagang parameter ɸ , na nagpapahina sa trend upang ito ay lumalapit sa isang pare-pareho sa hinaharap. Para sa ɸ Kinuha ko ang halaga 1, na tumutugma sa karaniwang modelo.

Gumawa din ako ng isang pagtataya ng mga halaga ng serye sa pamamagitan ng pamamaraang ito para sa huling 2 taon. Sa figure sa ibaba, minarkahan ko ang panimulang punto ng forecast sa pamamagitan ng pagguhit ng isang linya sa pamamagitan nito. Tulad ng nakikita mo, ang orihinal na serye at ang pinakinis ay nag-tutugma nang maayos, kasama ang panahon ng pagtataya - hindi masama para sa gayong simpleng pamamaraan!

Pinapayagan ka rin ng Prognoz Platform na awtomatikong piliin ang pinakamainam na mga halaga ng parameter gamit ang isang sistematikong paghahanap sa espasyo ng mga halaga ng parameter at pagliit ng kabuuan ng mga squared deviations ng smoothed series mula sa orihinal.

Ang mga pamamaraan na inilarawan ay medyo simple, madaling ilapat, at isang magandang panimulang punto para sa pagsusuri ng istraktura at pagtataya ng serye ng oras.

Magbasa pa tungkol sa time series sa susunod na artikulo.

Kadalasan, ang mga antas ng serye ng dinamika ay nagbabago, habang ang kalakaran sa pag-unlad ng kababalaghan sa oras ay nakatago sa pamamagitan ng mga random na paglihis ng mga antas sa isang direksyon o iba pa. Upang mas malinaw na matukoy ang trend ng pag-unlad ng prosesong pinag-aaralan, kabilang ang para sa karagdagang aplikasyon ng mga pamamaraan ng pagtataya batay sa mga modelo ng trend, pagpapakinis(pagkakahanay) serye ng oras.

Ang mga paraan ng pag-smoothing ng serye ng oras ay nahahati sa dalawang pangunahing grupo:

1. analytical alignment gamit ang isang curve na iginuhit sa pagitan ng mga partikular na antas ng serye upang ito ay sumasalamin sa trend na likas sa serye, at sa parehong oras ay nagpapalaya nito mula sa mga maliliit na pagbabago;

2. mekanikal na pagkakahanay ng mga indibidwal na antas ng serye ng oras gamit ang aktwal na mga halaga ng mga kalapit na antas.

Ang kakanyahan ng mga pamamaraan ng mekanikal na smoothing ay ang mga sumusunod. Ang ilang mga antas ng serye ng oras ay kinuha, bumubuo agwat ng pagpapakinis. Para sa kanila, ang isang polynomial ay pinili, ang antas ng kung saan ay dapat na mas mababa kaysa sa bilang ng mga antas na kasama sa smoothing interval; gamit ang isang polynomial, bago, nakahanay na mga halaga ng mga antas sa gitna ng smoothing interval ay tinutukoy. Susunod, ang pagitan ng smoothing ay inilipat sa isang antas ng serye sa kanan, ang susunod na smoothed na halaga ay kinakalkula, at iba pa.

Ang pinakasimpleng paraan ng mechanical smoothing ay simpleng paraan ng moving average.

2.4.1.Ang simpleng moving average na paraan.

Una para sa serye ng oras: tinutukoy ang pagitan ng pagpapakinis. Kung kinakailangan upang pakinisin ang mga maliliit na random na pagbabagu-bago, kung gayon ang agwat ng pag-smoothing ay kinuha nang malaki hangga't maaari; ang agwat ng pagpapakinis ay nababawasan kung kinakailangan upang mapanatili ang mas maliliit na pagbabago-bago.

Para sa mga unang antas ng serye, ang kanilang arithmetic mean ay kinakalkula. Ito ang magiging smoothed value ng level ng series na nasa gitna ng smoothing interval. Pagkatapos ang agwat ng smoothing ay inililipat ng isang antas sa kanan, ang pagkalkula ng ibig sabihin ng aritmetika ay paulit-ulit, at iba pa. Ang sumusunod na formula ay ginagamit upang kalkulahin ang smoothed na antas ng serye:

kung saan (para sa kakaiba); para sa kahit na mga numero, ang formula ay nagiging mas kumplikado.

Bilang isang resulta ng naturang pamamaraan, ang mga smoothed na halaga ng mga antas ng serye ay nakuha; sa kasong ito, ang una at huling mga antas ng serye ay nawala (hindi smoothed). Ang isa pang disbentaha ng pamamaraan ay na ito ay naaangkop lamang sa mga serye na may linear na kalakaran.

2.4.2.Weighted moving average na paraan.

Ang weighted moving average na paraan ay naiiba sa nakaraang paraan ng smoothing dahil ang mga antas na kasama sa smoothing interval ay idinagdag na may iba't ibang mga timbang. Ito ay dahil sa ang katunayan na ang approximation ng serye sa loob ng smoothing interval ay isinasagawa gamit ang isang polynomial hindi ng unang degree, tulad ng sa nakaraang kaso, ngunit ng degree na nagsisimula mula sa pangalawa.

Ginagamit ang weighted arithmetic mean formula:

,

kung saan ang mga timbang ay tinutukoy gamit ang least squares method. Ang mga timbang na ito ay kinakalkula para sa iba't ibang antas ng tinatayang polynomial at iba't ibang mga pagitan ng pagpapakinis.

1. para sa mga polynomial ng ikalawa at ikatlong order, ang numerical sequence ng mga timbang para sa smoothing interval ay may anyo: , at may anyo ang sa: ;

2. para sa mga polynomial ng ikaapat at ikalimang digri at may pagitan ng pagpapakinis, ang pagkakasunod-sunod ng mga timbang ay ang mga sumusunod: .

Ang pamamahagi ng mga timbang sa pagitan ng pagpapakinis, na nakuha batay sa pinakamababang paraan ng mga parisukat, tingnan ang diagram 1.



2.4.3.Exponential smoothing na paraan.

Ang exponential smoothing method ay nabibilang sa parehong pangkat ng mga pamamaraan.

Ang kakaiba nito ay nakasalalay sa katotohanan na sa pamamaraan para sa paghahanap ng makinis na antas, ang mga halaga lamang ng mga nakaraang antas ng serye ang ginagamit, na kinuha na may isang tiyak na timbang, at ang bigat ng pagmamasid ay bumababa habang ito ay lumalayo sa time point kung saan tinutukoy ang smoothed value ng level ng series.

Kung para sa orihinal na serye ng oras

ang kaukulang mga smoothed value ay tinutukoy ng , pagkatapos ay isinasagawa ang exponential smoothing ayon sa formula:

saan smoothing parameter ; dami ay tinatawag kadahilanan ng diskwento.

Gamit ang ibinigay na kaugnayan sa pag-ulit para sa lahat ng antas ng serye, simula sa una at nagtatapos sa sandali ng oras , maaaring makuha na ang exponential average, iyon ay, ang halaga ng antas ng serye na pinakinis ng pamamaraang ito, ay isang weighted average ng lahat ng nakaraang antas.

Time series smoothing

Pagpapakinis ng serye ng oras, mga. Ang pagpapalit ng mga aktwal na antas ng mga kinakalkula na halaga na may mas kaunting pagkasumpungin kaysa sa orihinal na data ay isang simpleng paraan ng pagtukoy ng mga uso. Ang kaukulang pagbabago ay tinatawag na pagsasala.

Ang time series smoothing ay isinasagawa sa mga sumusunod na kaso:

· Sa graphical na representasyon ng serye ng oras, ang trend ay hindi malinaw na nakikita. Samakatuwid, ang serye ay pinakinis, ang mga pinakinis na halaga ay naka-plot sa graph, at, bilang panuntunan, ang trend ay lumilitaw nang mas malinaw;

· Ang mga paraan ng pagsusuri at pagtataya ay inilapat, na nangangailangan ng pagpapakinis ng serye ng oras bilang isang paunang kondisyon;

Kapag inaalis ang mga maanomalyang obserbasyon;

· Sa direktang pagtataya ng mga tagapagpahiwatig ng ekonomiya at pagtataya ng pagbabago sa trend - "mga punto ng pagliko".

Ang mga umiiral na pamamaraan ng smoothing ay nahahati sa dalawang grupo:

1) Mga pamamaraan ng pagsusuri. Para sa pagpapakinis, ginagamit ang isang kurba na iginuhit na nauugnay sa aktwal na mga halaga ng serye upang ito ay sumasalamin sa kalakaran na likas sa serye, at sa parehong oras ay nagpapalaya nito mula sa maliliit na hindi gaanong pagbabago. Ang ganitong mga kurba ay tinatawag ding mga kurba ng paglago, ang mga ito ay pangunahing ginagamit para sa pagtataya ng mga tagapagpahiwatig ng ekonomiya;

2) Mga paraan ng mechanical smoothing. Ang bawat indibidwal na antas ng serye ay pinapakinis gamit ang aktwal na mga halaga ng mga antas na katabi nito. Upang pakinisin ang serye ng oras, ang mga paraan ng simple at weighted moving average, exponential smoothing ay kadalasang ginagamit.

Simpleng moving average na paraan kasama ang mga sumusunod na hakbang:

1. Natutukoy ang bilang ng mga obserbasyon na kasama sa pagitan ng smoothing. Sa kasong ito, ginagamit ang panuntunan: kung kinakailangan upang pakinisin ang maliliit, magulong pagbabagu-bago, kung gayon ang agwat ng pagpapakinis ay kukunin nang mas malaki hangga't maaari at, sa kabaligtaran, ang agwat ng pagpapakinis ay nabawasan kapag kinakailangan upang mapanatili ang mas maliliit na alon at makakuha ng alisin ang panaka-nakang paulit-ulit na pagbabagu-bago na nagmumula, halimbawa, dahil sa mga antas ng autocorrelations .

2. Ang average na halaga ng mga obserbasyon na bumubuo ng smoothing interval ay kinakalkula, na kung saan ay din ang smoothing value ng antas na matatagpuan sa gitna ng smoothing interval, sa kondisyon na ang m ay isang kakaibang numero, ayon sa formula

kung saan ang m ay ang bilang ng mga obserbasyon na kasama sa pagitan ng smoothing; p ay ang bilang ng mga obserbasyon na matatagpuan sa magkabilang panig ng pinakinis.

Para sa kakaibang m, ang halaga ng parameter na p ay kinakalkula bilang mga sumusunod:

Ang unang pinakinis na obserbasyon ay magiging t, kung saan t = p+1.

3. Ang smoothing interval ay inililipat ng isang termino sa kanan, at ang smoothing value para sa (t + 1) -th na obserbasyon ay makikita gamit ang formula (1). Pagkatapos ang paglilipat ay ginanap muli, at iba pa.

Ang pamamaraan ay nagpapatuloy hanggang ang huling pagmamasid sa serye ng oras ay pumasok sa agwat ng pagpapakinis.

Maaaring gamitin ang simpleng moving average kung ang graphical na representasyon ng serye ay kahawig ng isang tuwid na linya.

Sa kasong ito, ang dynamics ng pag-unlad ng prosesong pinag-aaralan ay hindi nabaluktot. Gayunpaman, kapag ang takbo ng serye na i-level ay may mga baluktot at, bukod dito, ito ay kanais-nais na panatilihin ang maliliit na alon, hindi ipinapayong gamitin ang simpleng moving average na paraan upang pakinisin ang serye, dahil sa kasong ito:

parehong matambok at malukong mga linya ay nakahanay;

· mayroong pagbabago ng alon sa hilera;

· nagbabago ang tanda ng alon, ibig sabihin. sa kurba na nagkokonekta sa mga makinis na punto, sa halip na isang matambok na seksyon, isang malukong isa ay nabuo at kabaliktaran. Ang huli ay nangyayari kapag ang smoothing interval ay isa at kalahating beses ang wavelength.

Kaya, kung ang pag-unlad ng proseso ay hindi linear, kung gayon ang aplikasyon ng simpleng moving average na pamamaraan ay maaaring humantong sa mga makabuluhang pagbaluktot ng prosesong pinag-aaralan.

Sa ganitong mga kaso, mas maaasahan na gumamit ng iba pang mga paraan ng pagpapakinis, tulad ng weighted moving average na paraan.

Weighted moving average na paraan naiiba mula sa nauna sa ang pagpapakinis sa loob ng pagitan ay ginaganap hindi sa isang tuwid na linya, ngunit sa isang kurba ng isang mas mataas na pagkakasunud-sunod. Ito ay dahil sa ang katunayan na ang pagsasama-sama ng mga miyembro ng serye na kasama sa agwat ng pagpapakinis ay isinasagawa sa ilang mga timbang na kinakalkula gamit ang pinakamababang paraan ng mga parisukat.

Kung ang pagpapakinis ay isinasagawa gamit ang polynomial (polynomial) ng ikalawa at ikatlong pagkakasunud-sunod, kung gayon ang mga sumusunod na timbang ay kukunin

(-3; 12; 17; 12; - 3) para sa m=5;

(-2; 3; 6; 7; 3; - 2) para sa m=7.

Mga tampok ng scale:

1) ay simetriko na may paggalang sa gitnang miyembro;

2) ang kabuuan ng mga timbang, na isinasaalang-alang ang karaniwang kadahilanan, ay katumbas ng isa.

Disadvantage ng pamamaraan: ang una at huling p obserbasyon ng serye ay nananatiling unsmoothed.

Pagkalkula ng mga tagapagpahiwatig ng dinamika ng mga prosesong pang-ekonomiya

Ang pagkalkula ng mga tagapagpahiwatig ng dinamika ng mga prosesong pang-ekonomiya ay ang huling yugto ng paunang pagsusuri ng data.

Upang makilala ang dinamika ng mga pagbabago sa mga tagapagpahiwatig ng ekonomiya, ang konsepto ng autocorrelation ay madalas na ginagamit, na nagpapakilala hindi lamang sa pagkakaisa ng mga antas ng parehong serye na nauugnay sa iba't ibang mga punto ng pagmamasid, kundi pati na rin ang antas ng katatagan ng pag-unlad ng proseso. sa oras, ang halaga ng pinakamainam na panahon ng pagtataya, atbp.

Ang antas ng higpit ng istatistikal na relasyon sa pagitan ng mga antas ng serye ng oras, na inilipat ng f unit ng oras, ay tinutukoy ng halaga ng koepisyent ng ugnayan r(f). Dahil sinusukat ng r(φ) ang lapit ng koneksyon sa pagitan ng mga antas ng parehong serye ng oras, karaniwang tinatawag itong autocorrelation coefficient. Sa kasong ito, f - ang haba ng temporal displacement - ay karaniwang tinatawag na lag.

Ang koepisyent ng autocorrelation ay kinakalkula ng formula

Sa malaking haba ng seryeng pinag-aaralan, ang pagkalkula ng mga autocorrelation coefficient ay maaaring gawing simple. Para dito, ang mga paglihis ay matatagpuan hindi mula sa average na magkakaugnay na serye, ngunit mula sa kabuuang average ng buong serye. Sa kasong ito

Ang pagkakasunud-sunod ng mga autocorrelation coefficient ay tinutukoy ng time lag: unang order (sa φ = 1), pangalawang order (sa φ = 2), atbp.

Ang pagkakasunud-sunod ng mga autocorrelation coefficient ng mga antas ng una, pangalawa at kasunod na mga order ay tinatawag na autocorrelation function. Ang mga halaga nito ay maaaring mag-iba mula -1 hanggang +1, ngunit mula sa stationarity ito ay sumusunod na r(f) = - r(f). Ang graph ng isang autocorrelation function ay tinatawag na correlogram.

Ang pagsusuri ng autocorrelation function at ang correlogram ay ginagawang posible upang matukoy ang lag kung saan ang autocorrelation ang pinakamataas, i.e. gamit ang pagsusuri ng autocorrelation function at ang correlogram, maaaring ihayag ng isa ang istruktura ng serye.

Kung ang autocorrelation coefficient ng 1st order ay naging pinakamataas, ang seryeng pinag-aaralan ay naglalaman lamang ng isang trend. Kung ang autocorrelation coefficient ng order φ ay naging pinakamataas, kung gayon ang serye ay naglalaman ng mga cyclic oscillations na may periodicity ng φ time point. Kung wala sa mga autocorrelation coefficient ang makabuluhan, kung gayon ang isa sa dalawang pagpapalagay ay maaaring gawin tungkol sa istruktura ng seryeng ito: alinman sa serye ay hindi naglalaman ng trend at pana-panahong pagbabago, o ang serye ay naglalaman ng malakas na non-linear na trend, na nangangailangan ng karagdagang pagsusuri upang matukoy. Samakatuwid, ipinapayong gamitin ang antas na autocorrelation coefficient at ang autocorrelation function upang matukoy ang presensya o kawalan ng trend component f(t) at ang seasonal component na S(t) sa time series.