Autocorrelation function. Mga halimbawa ng kalkulasyon

Ang periodic dependence ay isang pangkalahatang uri ng bahagi ng time series. Madaling makita na ang bawat obserbasyon ay halos kapareho sa kapitbahay nito; Bukod pa rito, mayroong paulit-ulit na periodic component, na nangangahulugan na ang bawat obserbasyon ay katulad din ng isang obserbasyon na naganap sa parehong oras noong nakalipas na panahon. Sa pangkalahatan, ang periodic dependence ay maaaring pormal na tukuyin bilang isang correlation dependence ng order k sa pagitan ng bawat i-th na elemento ng serye at ng (i-k)-th na elemento. Maaari itong masukat gamit ang autocorrelation (ibig sabihin, ang ugnayan sa pagitan ng mga termino ng serye mismo); k ay karaniwang tinatawag na lag (kung minsan ay ginagamit ang mga katumbas na termino: shift, delay). Kung ang error sa pagsukat ay hindi masyadong malaki, kung gayon ang periodicity ay maaaring matukoy nang biswal sa pamamagitan ng pagsusuri sa pag-uugali ng mga miyembro ng serye sa bawat k time unit.

Ang mga pana-panahong bahagi ng isang serye ng oras ay matatagpuan gamit ang isang correlogram. Ipinapakita ng correlogram (autocorrelogram) ayon sa numero at graphical ang autocorrelation function (ACF), sa madaling salita, ang mga autocorrelation coefficient para sa isang sequence ng mga lags mula sa isang partikular na range. Ang isang correlogram ay karaniwang nagpapakita ng isang hanay ng dalawang karaniwang mga error sa bawat lag, ngunit kadalasan ang magnitude ng autocorrelation ay mas kawili-wili kaysa sa pagiging maaasahan nito dahil ito ay halos napakalakas na autocorrelations na interesado.

Kapag nag-aaral ng correlograms, dapat tandaan na ang mga autocorrelations ng sunud-sunod na mga lags ay pormal na umaasa sa isa't isa. Isaalang-alang ang sumusunod na halimbawa. Kung ang unang miyembro ng isang serye ay malapit na nauugnay sa pangalawa, at ang pangalawa hanggang sa pangatlo, kung gayon ang unang elemento ay dapat ding nakadepende sa pangatlo, atbp. Ito ay humahantong sa katotohanan na ang panaka-nakang pag-asa ay maaaring magbago nang malaki pagkatapos alisin ang mga first-order na autocorrelations (ibig sabihin, pagkatapos kunin ang pagkakaiba sa lag 1).

Layunin ng gawain:

1. Magbigay ng pangunahing teoretikal na impormasyon

2. Magbigay ng mga halimbawa ng pagkalkula ng ACF

Kabanata 1. Teoretikal na impormasyon

Autocorrelation coefficient at ang pagtatasa nito

Upang ganap na makilala ang isang random na proseso, hindi sapat ang inaasahan at pagkakaiba-iba nito sa matematika. Noong 1927, ipinakilala ni E.E. Slutsky ang konsepto ng isang "naka-link na serye" para sa mga umaasa na obserbasyon: ang posibilidad ng paglitaw ng ilang partikular na halaga sa isang tiyak na lugar ay depende sa kung anong mga halaga ang natanggap na ng random variable nang mas maaga o matatanggap sa ibang pagkakataon. . Sa madaling salita, mayroong isang scattering field ng mga pares ng mga halaga x(t), x(t+k) ng time series, kung saan ang k ay isang pare-parehong agwat o pagkaantala, na nagpapakilala sa pagkakaugnay ng mga kasunod na pagpapatupad ng proseso mula sa mga nauna. Ang lapit ng relasyon na ito ay tinasa ng mga autocovariance coefficients -

g (k) = E[(x(t) - m)(x(t + k) - m)] –

at autocorrelation

r (k) = E[(x(t) - m)(x(t + k) - m)] / D ,

kung saan ang m at D ay ang mathematical na inaasahan at pagkakaiba ng random na proseso. Upang kalkulahin ang autocovariance at autocorrelation ng mga tunay na proseso, kailangan ang impormasyon sa pinagsamang probability distribution ng mga antas ng seryeng p(x(t 1),x(t 2)). Gayunpaman, para sa mga nakatigil na proseso na nasa isang tiyak na istatistikal na ekwilibriyo, ang probability distribution na ito ay pareho para sa lahat ng oras t 1, t 2 na pinaghihiwalay ng parehong pagitan. Dahil ang pagkakaiba ng isang nakatigil na proseso sa anumang oras (kapwa sa t at t + k) ay katumbas ng D = g(0), kung gayon ang autocorrelation na may lag k ay maaaring ipahayag bilang

r(k) = g(k)/g(0),

mula sa kung saan ito ay sumusunod na r (0) = 1. Sa ilalim ng parehong mga kondisyon ng stationarity, ang koepisyent ng ugnayan r (k) sa pagitan ng dalawang halaga ng isang serye ng oras ay nakasalalay lamang sa halaga ng agwat ng oras k at hindi nakasalalay sa mga sandali ng pagmamasid t kanilang sarili.

Sa mga istatistika, mayroong ilang mga sample na pagtatantya ng mga teoretikal na halaga ng autocorrelation r(k) ng isang proseso sa isang may hangganang serye ng oras ng n obserbasyon. Ang pinakasikat na pagtatantya ay ang non-cyclical autocorrelation coefficient na may lag k (Anderson, 1976; Vainu, 1977):

Ang pinakamahalaga sa iba't ibang autocorrelation coefficient ay ang una - r 1, na sumusukat sa lapit ng koneksyon sa pagitan ng mga antas x(1), x(2),..., x(n -1) at x(2) , x(3), .. ., x(n).

Ang pamamahagi ng mga autocorrelation coefficients ay hindi alam; samakatuwid, upang masuri ang kanilang pagiging maaasahan, ang nonparametric na teorya ni Anderson (1976), na nagmungkahi ng mga istatistika, ay minsan ginagamit

t = r 1 (n -1) 0.5 ,

na, na may sapat na malaking sample, ay karaniwang ipinamamahagi, ay may mean na zero at isang pagkakaiba-iba na katumbas ng isa (Tintner, 1965).

Mga function ng autocorrelation

Ang pagkakasunud-sunod ng mga coefficient ng ugnayan r k, kung saan ang k = 1, 2, ..., n, bilang isang function ng interval k sa pagitan ng mga obserbasyon ay tinatawag na autocorrelation function (ACF).

Ang uri ng sample na autocorrelation function ay malapit na nauugnay sa istraktura ng serye.

· Ang autocorrelation function r k para sa "white noise", para sa k >0, ay bumubuo rin ng isang nakatigil na serye ng oras na may average na halaga na 0.

· Para sa isang nakatigil na serye, ang ACF ay mabilis na bumababa sa pagtaas ng k. Kung mayroong isang malinaw na trend, ang autocorrelation function ay tumatagal sa katangian na hitsura ng isang napakabagal na pagbagsak ng curve.

· Sa kaso ng binibigkas na seasonality, ang ACF graph ay naglalaman din ng mga outlier para sa mga lags na multiple ng seasonality period, ngunit ang mga outlier na ito ay maaaring matakpan ng pagkakaroon ng trend o isang malaking dispersion ng random na bahagi.

Tingnan natin ang mga halimbawa ng autocorrelation function:

· sa Fig. Ipinapakita ng Figure 1 ang isang graph ng ACF, na nailalarawan sa pamamagitan ng katamtamang trend at hindi malinaw na seasonality;

· bigas. Ipinapakita ng 2 ang ACF ng isang serye na nailalarawan sa pamamagitan ng isang kahanga-hangang seasonal determinant;

· ang halos walang basang graph ng ACF ng serye (Fig. 3) ay nagpapahiwatig ng pagkakaroon ng isang malinaw na trend.




Sa pangkalahatan, maaari nating ipagpalagay na walang autocorrelation sa serye na binubuo ng mga deviations mula sa trend. Halimbawa, sa Fig. Ipinapakita ng Figure 4 ang plot ng ACF para sa mga residual na nakuha mula sa pagpapakinis ng serye, na napaka-reminiscent ng proseso ng "white noise". Gayunpaman, madalas na may mga kaso kapag ang mga nalalabi (random na bahagi h) ay maaaring maging autocorrelated, halimbawa, para sa mga sumusunod na dahilan:

· hindi isinasaalang-alang ang isang mahalagang salik sa mga modelo ng deterministiko o stochastic na dinamika

· hindi isinasaalang-alang ng modelo ang ilang hindi mahalagang mga kadahilanan, ang impluwensya ng isa't isa na nagiging makabuluhan dahil sa pagkakaisa ng mga yugto at direksyon ng kanilang pagbabago;

· ang maling uri ng modelo ay napili (ang prinsipyo ng counterintuitiveness ay nilabag);

· ang random na bahagi ay may isang tiyak na istraktura.


Pagsubok sa Durbin-Watson

Ang pagsubok ng Durbin-Watson (Durbin, 1969) ay isang pangkaraniwang istatistika na idinisenyo upang subukan para sa unang-order na autocorrelation ng mga nalalabi pagkatapos ng series smoothing o sa mga modelo ng regression.

Ang numerical value ng coefficient ay

d = [(e(2)-e(1)) 2 + ... + (e(n)-e(n -1)) 2 ]/,

kung saan ang e(t) ay ang mga natitira.

Ang mga posibleng halaga ng criterion ay nasa hanay mula 0 hanggang 4, at ang mga naka-tabulate na halaga ng threshold nito para sa iba't ibang antas ng kahalagahan ay naka-tabulate (Lizer, 1971).

Ang value ng d ay malapit sa value na 2*(1 - r 1), kung saan ang r ay ang sample na autocorrelation coefficient para sa mga residual. Alinsunod dito, ang perpektong halaga ng istatistika ay 2 (walang autocorrelation). Ang mas maliit na mga halaga ay tumutugma sa positibong autocorrelation ng mga nalalabi, mas malaki - negatibo.

Halimbawa, pagkatapos i-smooth ang serye, ang serye ng mga residual ay may criterion na d = 1.912. Ang mga katulad na istatistika pagkatapos ng pagpapakinis ng serye - d = 1.638 - ay nagpapahiwatig ng ilang autocorrelation ng mga nalalabi.

Kabanata 2. Mga halimbawa ng mga praktikal na kalkulasyon gamit ang Excel macro "Autocorrelation function"

Ang lahat ng data ay kinuha mula sa site http://e3.prime-tass.ru/macro/

Halimbawa 1. GDP ng Russia

Narito ang data sa GDP ng Russian Federation

taon quarter GDP unang pagkakaiba
2001 ako 1900,9
II 2105,0 204,1
III 2487,9 382,9
IV 2449,8 -38,1
2002 ako 2259,5 -190,3
II 2525,7 266,2
III 3009,2 483,5
IV 3023,1 13,9
2003 ako 2850,7 -172,4
II 3107,8 257,1
III 3629,8 522,0
IV 3655,0 25,2
2004 ako 3516,8 -138,2
II 3969,8 453,0
III 4615,2 645,4
IV 4946,4 331,2
2005 ako 4479,2 -467,2
II 5172,9 693,7
III 5871,7 698,8
IV 6096,2 224,5
2006 ako 5661,8 -434,4
II 6325,8 664,0
III 7248,1 922,3
IV 7545,4 297,3
2007 ako 6566,2 -979,2
II 7647,5 1081,3
Tulad ng nabanggit kanina, ang bahagyang autocorrelation function ay ipinakilala upang matukoy ang pagkakasunud-sunod ng proseso ng autoregressive. Ang katotohanan ay na sa panahon ng paglipat ng average na proseso, ang pagkakasunud-sunod ng modelo ay medyo simple upang matukoy, dahil pagkatapos nito ang pag-andar ng autocorrelation ay may posibilidad na maging zero. Gayunpaman...
(Econometrics)
  • Ang nakatigil na serye ng oras, ang mga probabilistikong katangian na hindi nagbabago sa paglipas ng panahon, ay mahalaga sa pagsusuri ng serye ng oras. Ang nakatigil na serye ng oras ay ginagamit, sa partikular, kapag inilalarawan ang mga random na bahagi ng nasuri na serye. Serye ng oras yt(t= 1,2,..., P) tinawag...
    (ECONOMETRICS)
  • Upang gawing simple ang pagsusuri, ipagpalagay natin na ang base ng signal ng huni ay sapat na malaki, at samakatuwid ang spectrum ng enerhiya nito ay pare-pareho at matatagpuan lamang sa banda (co0 - co d/2, co0 + cod/2) sa paligid ng dalas ng carrier co0. Pagkatapos, ayon sa expression (2.61), ang ACF ng signal ng huni ay katumbas ng kanin. 2.44. Normalized na ACF graph...
    (TEORYANG TELEKOMUNIKASYON)
  • Pagbubunyag ng istruktura ng isang serye ng oras. Autocorrelation function
    Kung mayroong isang trend at cyclical fluctuations sa isang time series, ang mga halaga ng bawat kasunod na antas ng serye ay nakasalalay sa mga halaga ng mga nakaraang antas. Ang antas ng pagiging malapit ng koneksyon sa pagitan ng mga pagkakasunud-sunod ng mga obserbasyon ng isang serye ng oras (nilipat na may kaugnayan sa bawat isa sa pamamagitan ng L mga unit, o, gaya ng sinasabi nila, na may lag...
    (ECONOMETRICS)
  • Mga pangunahing modelo ng serye ng oras at pagsusuri ng autocorrelation
    1. Ang pinakasimpleng kaso ng isang additive na modelo ng serye ng oras ay random na pagbabago ng modelo: Ipinapalagay ng modelo na ang mga halaga ng indicator na pinag-aaralan ay nagbabago kaugnay sa isang pare-parehong average na halaga q (walang pataas o pababang trend) na may patuloy na pagpapakalat at hindi umaasa sa isa't isa....
    (PUNDAMENTAL NG MATHEMATICAL MODELING NG SOCIO-ECONOMIC PROCESSES)
  • Autocorrelation function (ACF) ng isang huni signal.
    Upang gawing simple ang pagsusuri, ipagpalagay natin na ang base ng signal ng huni ay sapat na malaki, at samakatuwid ang spectrum ng enerhiya nito ay pare-pareho at matatagpuan lamang sa banda (co0 - cod/2, co0 + sol/2) sa paligid ng carrier frequency co0 . Pagkatapos, ayon sa expression (2.61), ang ACF ng chirp signal ay katumbas ng Graph ng normalized ACF ng chirp pulse R( T)...
    (PANGKALAHATANG TEORYANG KOMUNIKASYON)
  • Nakatigil na serye ng oras at ang kanilang mga katangian. Autocorrelation function
    Ang mga nakatigil ay mahalaga sa pagsusuri ng mga serye ng oras.Ang konsepto ng isang nakatigil na serye ng oras ay malapit na nauugnay sa konsepto ng nakatigil na random na proseso na bumubuo nito (seksyon 7.2). time series na ang probabilistic properties ay hindi nagbabago sa paglipas ng panahon. Ginagamit ang mga nakatigil na serye ng oras...
    (TEORYA NG PROBABILIDAD AT MATHEMATICAL STATISTICS)
  • Panimula

    Ang periodic dependence ay isang pangkalahatang uri ng bahagi ng time series. Madaling makita na ang bawat obserbasyon ay halos kapareho sa kapitbahay nito; Bukod pa rito, mayroong paulit-ulit na periodic component, na nangangahulugan na ang bawat obserbasyon ay katulad din ng isang obserbasyon na naganap sa parehong oras noong nakalipas na panahon. Sa pangkalahatan, ang periodic dependence ay maaaring pormal na tukuyin bilang isang correlation dependence ng order k sa pagitan ng bawat i-th na elemento ng serye at ng (i-k)-th na elemento. Maaari itong masukat gamit ang autocorrelation (ibig sabihin, ang ugnayan sa pagitan ng mga termino ng serye mismo); k ay karaniwang tinatawag na lag (kung minsan ay ginagamit ang mga katumbas na termino: shift, delay). Kung ang error sa pagsukat ay hindi masyadong malaki, kung gayon ang periodicity ay maaaring matukoy nang biswal sa pamamagitan ng pagsusuri sa pag-uugali ng mga miyembro ng serye sa bawat k time unit.

    Ang mga pana-panahong bahagi ng isang serye ng oras ay matatagpuan gamit ang isang correlogram. Ipinapakita ng correlogram (autocorrelogram) ayon sa numero at graphical ang autocorrelation function (ACF), sa madaling salita, ang mga autocorrelation coefficient para sa isang sequence ng mga lags mula sa isang partikular na range. Ang correlogram ay karaniwang nagpapakita ng isang hanay ng dalawang karaniwang error sa bawat lag, ngunit kadalasan ang magnitude ng autocorrelation ay mas kawili-wili kaysa sa pagiging maaasahan nito, dahil sa pangkalahatan ito ay ang napakalakas at samakatuwid ay lubos na makabuluhang autocorrelations na interesado.

    Kapag nag-aaral ng correlograms, dapat tandaan na ang mga autocorrelations ng sunud-sunod na mga lags ay pormal na umaasa sa isa't isa. Isaalang-alang ang sumusunod na halimbawa. Kung ang unang miyembro ng isang serye ay malapit na nauugnay sa pangalawa, at ang pangalawa hanggang sa pangatlo, kung gayon ang unang elemento ay dapat ding nakadepende sa pangatlo, atbp. Ito ay humahantong sa katotohanan na ang panaka-nakang pag-asa ay maaaring magbago nang malaki pagkatapos alisin ang mga first-order na autocorrelations (ibig sabihin, pagkatapos kunin ang pagkakaiba sa lag 1).

    Layunin ng gawain:

    1. Magbigay ng pangunahing teoretikal na impormasyon

    2. Magbigay ng mga halimbawa ng pagkalkula ng ACF

    Autocorrelation function

    Autocorrelation coefficient at ang pagtatasa nito

    Upang ganap na makilala ang isang random na proseso, hindi sapat ang inaasahan at pagkakaiba-iba nito sa matematika. Noong 1927, ipinakilala ni E.E. Slutsky ang konsepto ng isang "naka-link na serye" para sa mga umaasa na obserbasyon: ang posibilidad ng paglitaw ng ilang partikular na halaga sa isang tiyak na lugar ay depende sa kung anong mga halaga ang natanggap na ng random variable nang mas maaga o matatanggap sa ibang pagkakataon. . Sa madaling salita, mayroong isang scattering field ng mga pares ng mga halaga x(t), x(t+k) ng time series, kung saan ang k ay isang pare-parehong agwat o pagkaantala, na nagpapakilala sa pagkakaugnay ng mga kasunod na pagpapatupad ng proseso mula sa mga nauna. Ang lapit ng relasyon na ito ay tinasa ng mga autocovariance coefficient -

    g (k) = E[(x(t) - m)(x(t + k) - m)] -

    at autocorrelation

    r (k) = E[(x(t) - m)(x(t + k) - m)] / D ,

    kung saan ang m at D ay ang mathematical na inaasahan at pagkakaiba ng random na proseso. Upang kalkulahin ang autocovariance at autocorrelation ng mga tunay na proseso, kailangan ang impormasyon sa pinagsamang probability distribution ng mga antas ng seryeng p(x(t 1),x(t 2)). Gayunpaman, para sa mga nakatigil na proseso na nasa isang tiyak na istatistikal na ekwilibriyo, ang probability distribution na ito ay pareho para sa lahat ng oras t 1, t 2 na pinaghihiwalay ng parehong pagitan. Dahil ang pagkakaiba ng isang nakatigil na proseso sa anumang oras (kapwa sa t at t + k) ay katumbas ng D = g(0), kung gayon ang autocorrelation na may lag k ay maaaring ipahayag bilang

    r(k) = g(k)/g(0),

    mula sa kung saan ito ay sumusunod na r (0) = 1. Sa ilalim ng parehong mga kondisyon ng stationarity, ang koepisyent ng ugnayan r (k) sa pagitan ng dalawang halaga ng isang serye ng oras ay nakasalalay lamang sa halaga ng agwat ng oras k at hindi nakasalalay sa mga sandali ng pagmamasid t kanilang sarili. Ang koepisyent ng autocorrelation ay maaari ding matantya para sa isang hindi nakatigil na serye, ngunit sa kasong ito ay nawala ang probabilistikong interpretasyon nito.

    Sa mga istatistika, mayroong ilang mga sample na pagtatantya ng mga teoretikal na halaga ng autocorrelation r(k) ng isang proseso sa isang may hangganang serye ng oras ng n obserbasyon. Ang pinakasikat na pagtatantya ay ang non-cyclical autocorrelation coefficient na may lag k (Anderson, 1976; Vainu, 1977):

    Ang pinakamahalaga sa iba't ibang autocorrelation coefficient ay ang una - r 1, na sumusukat sa lapit ng koneksyon sa pagitan ng mga antas x(1), x(2),..., x(n -1) at x(2) , x(3), .. ., x(n).

    Ang pamamahagi ng mga autocorrelation coefficients ay hindi alam; samakatuwid, upang masuri ang kanilang pagiging maaasahan, ang nonparametric na teorya ni Anderson (1976), na nagmungkahi ng mga istatistika, ay minsan ginagamit

    t = r 1 (n -1) 0.5 ,

    na, na may sapat na malaking sample, ay karaniwang ipinamamahagi, ay may mean na zero at isang pagkakaiba-iba na katumbas ng isa (Tintner, 1965).

    Maikling teorya

    Kung mayroong trend at cyclical fluctuation sa isang time series, ang mga value ng bawat kasunod na level ng series ay nakadepende sa mga nauna. Ang pag-asa sa ugnayan sa pagitan ng magkakasunod na antas ng isang serye ng oras ay tinatawag na autocorrelation ng mga antas ng serye. Maaari itong masukat sa dami gamit ang isang linear na koepisyent ng ugnayan sa pagitan ng mga antas ng orihinal na serye ng oras at ang mga antas ng seryeng ito na inilipat ng ilang hakbang sa oras.

    Ang bilang ng mga panahon kung saan kinakalkula ang autocorrelation coefficient ay tinatawag na lag. Habang tumataas ang lag, bumababa ang bilang ng mga pares ng mga halaga kung saan kinakalkula ang autocorrelation coefficient. Isinasaalang-alang ng ilang mga may-akda na ipinapayong gamitin ang panuntunan upang matiyak ang pagiging maaasahan ng istatistika ng mga koepisyent ng autocorrelation - ang pinakamataas na lag ay hindi dapat mas malaki kaysa sa .

    Tandaan natin ang dalawang mahalagang katangian ng koepisyent ng autocorrelation. Una, ito ay itinayo sa pamamagitan ng pagkakatulad sa linear correlation coefficient at sa gayon ay nailalarawan ang pagiging malapit lamang ng linear na relasyon sa pagitan ng kasalukuyan at nakaraang mga antas ng serye. Samakatuwid, sa pamamagitan ng koepisyent ng autocorrelation ay maaaring hatulan ng isa ang pagkakaroon ng isang linear (o malapit sa linear) na takbo. Para sa ilang time series na may malakas na nonlinear na trend (halimbawa, isang second-order na parabola o exponential), ang koepisyent ng autocorrelation ng mga antas ng orihinal na serye ay maaaring malapit sa zero.

    Pangalawa, batay sa pag-sign ng koepisyent ng autocorrelation, hindi maaaring tapusin ng isa na mayroong pagtaas o pagbaba ng trend sa mga antas ng serye. Karamihan sa mga time series ng economic data ay naglalaman ng mga positibong antas ng autocorrelation, ngunit maaaring may pababang trend.

    Ang pagkakasunud-sunod ng mga autocorrelation coefficient ng mga antas ng una, pangalawa, atbp. na mga order ay tinatawag na autocorrelation function ng time rad. Ang isang graph ng pag-asa ng mga halaga nito sa halaga ng lag (ang pagkakasunud-sunod ng koepisyent ng autocorrelation) ay tinatawag na isang correlogram.

    Ang pagsusuri sa autocorrelation function at correlogram ay nagpapahintulot sa amin na matukoy ang lag kung saan ang autocorrelation ay pinakamataas, at samakatuwid ang lag kung saan ang koneksyon sa pagitan ng kasalukuyan at nakaraang mga antas ng serye ay ang pinakamalapit, ibig sabihin, sa pamamagitan ng pagsusuri sa autocorrelation function at correlogram , matutukoy ang istruktura ng serye.

    Kung ang first-order na autocorrelation coefficient ay lumabas na ang pinakamataas, ang seryeng pinag-aaralan ay naglalaman lamang ng isang trend. Kung ang koepisyent ng autocorrelation ay maayos , ang serye ay naglalaman ng mga cyclic fluctuation na may periodicity sa mga punto sa oras. Kung wala sa mga autocorrelation coefficient ang makabuluhan, isa sa dalawang pagpapalagay ang maaaring gawin tungkol sa istruktura ng serye: alinman sa serye ay hindi naglalaman ng trend o cyclical fluctuation, o ang serye ay naglalaman ng malakas na nonlinear na trend na nangangailangan ng karagdagang pagsusuri upang matukoy. Samakatuwid, ipinapayong gamitin ang antas ng autocorrelation coefficient at ang autocorrelation function upang matukoy ang presensya o kawalan ng isang trend component () at isang cyclical (seasonal) component () sa isang time series.

    Mayroong ilang mga diskarte sa pagsusuri sa istraktura ng serye ng oras na naglalaman ng mga pana-panahon o paikot na pagbabago. Ang pinakasimpleng diskarte ay upang kalkulahin ang mga halaga ng seasonal na bahagi gamit ang moving average na paraan at bumuo ng isang additive o multiplicative na modelo ng serye ng oras. Ang pangkalahatang view ng additive model ay ang mga sumusunod:

    Ipinapalagay ng modelong ito na ang bawat antas ng isang serye ng oras ay maaaring katawanin bilang kabuuan ng trend, seasonal at random na mga bahagi. Ang pangkalahatang view ng multiplicative na modelo ay ganito ang hitsura:

    Ipinapalagay ng modelong ito na ang bawat antas ng isang serye ng oras ay maaaring katawanin bilang isang produkto ng trend, seasonal at random na mga bahagi. Ang pagpili ng isa sa dalawang modelo ay batay sa isang pagsusuri ng istraktura ng mga pana-panahong pagbabagu-bago. Kung ang amplitude ng mga oscillations ay humigit-kumulang pare-pareho, ang isang additive na modelo ng serye ng oras ay itinayo kung saan ang mga halaga ng seasonal na bahagi ay ipinapalagay na pare-pareho para sa iba't ibang mga cycle. Kung ang amplitude ng mga seasonal fluctuation ay tumataas o bumababa, isang multiplicative na time series na modelo, na ginagawang ang mga antas ng serye ay nakadepende sa mga halaga ng seasonal na bahagi.

    Ang pagbuo ng mga additive at multiplicative na mga modelo ay bumababa sa pagkalkula ng mga halaga ng at para sa bawat antas ng serye.

    Kasama sa proseso ng pagbuo ng modelo ang mga sumusunod na hakbang.

    1. Pag-align ng orihinal na serye gamit ang moving average na paraan.

    2. Pagkalkula ng mga seasonal component value.

    3. Pag-aalis ng seasonal component mula sa mga unang antas ng serye at pagkuha ng equalized na data sa isang additive o multiplicative na modelo.

    4. Analytical leveling ng mga level o pagkalkula ng mga value gamit ang resultang trend equation.

    5. Pagkalkula ng mga halaga na nakuha mula sa modelo o .

    6. Pagkalkula ng ganap at/o kamag-anak na mga error.

    Kung ang nakuhang mga halaga ng error ay walang autocorrelation, maaari nilang palitan ang orihinal na mga antas ng serye at pagkatapos ay gamitin ang serye ng oras ng error upang suriin ang kaugnayan sa pagitan ng orihinal na serye at iba pang serye ng oras.

    Halimbawa ng solusyon sa problema

    Ang gawain

    Mayroong conditional data sa dami ng konsumo ng kuryente ng mga residente ng rehiyon sa loob ng 16 quarters.

    Kailangan:

    1. Bumuo ng autocorrelation function at gumuhit ng konklusyon tungkol sa pagkakaroon ng mga seasonal fluctuations.

    2. Bumuo ng isang additive na time series na modelo (para sa mga kakaibang opsyon) o isang multiplicative na time series na modelo (para sa even na mga opsyon).

    3. Gumawa ng pagtataya para sa 2 quarters sa unahan.

    Upang matiyak na ang solusyon sa isang problema sa ekonometric ay tumpak at tama hangga't maaari, maraming mura ang nag-uutos ng pagsubok na trabaho sa site na ito. Ang mga detalye (kung paano magsumite ng aplikasyon, mga presyo, mga deadline, mga paraan ng pagbabayad) ay mababasa sa page na Bumili ng test paper sa econometrics...

    1 5.5 9 8.2 2 4.8 10 5.5 3 5.1 11 6.5 4 9.0 12 11.0 5 7.1 13 8.9 6 4.9 14 6.5 7 6.1 15 7.3 8 10.0 16 11.2

    Ang solusyon sa problema

    1) Bumuo tayo ng field ng ugnayan:

    Batay na sa graph, malinaw na ang mga halaga ay bumubuo ng isang hugis ng ngipin. Kalkulahin natin ang ilang magkakasunod na autocorrelation coefficient. Upang gawin ito, lumikha kami ng unang auxiliary table:

    1 5.5 --- --- --- --- --- --- 2 4.8 5.5 -2.673 -1.593 4.260 7.147 2.539 3 5.1 4.8 -2.373 -2.293 5.443 5.633 5.259 4 9 5.1 1.527 -1.993 -3.043 2.331 3.973 5 7.1 9 -0.373 1.907 -0.712 0.139 3.635 6 4.9 7.1 -2.573 0.007 -0.017 6.622 0.000 7 6.1 4.9 -1.373 -2.193 3.012 1.886 4.811 8 10 6.1 2.527 -0.993 -2.510 6.384 0.987 9 8.2 10 0.727 2.907 2.112 0.528 8.449 10 5.5 8.2 -1.973 1.107 -2.184 3.894 1.225 11 6.5 5.5 -0.973 -1.593 1.551 0.947 2.539 12 11 6.5 3.527 -0.593 -2.092 12.437 0.352 13 8.9 11 1.427 3.907 5.574 2.035 15.262 14 6.5 8.9 -0.973 1.807 -1.758 0.947 3.264 15 7.3 6.5 -0.173 -0.593 0.103 0.030 0.352 16 11.2 7.3 3.727 0.207 0.770 13.888 0.043 Sum 112.1 106.4 0 0 10.507 64.849 52.689 Average na halaga 7.473 7.093

    Dapat itong tandaan. na ang average na halaga ay nakuha sa pamamagitan ng hindi paghahati sa 16, ngunit sa 15, dahil mayroon na tayong mas kaunting obserbasyon.

    Unang order na autocorrelation coefficient:

    Lumilikha kami ng isang auxiliary table para sa pagkalkula ng pangalawang-order na autocorrelation coefficient:

    1 5.5 --- --- --- --- --- --- 2 4.8 --- --- --- --- --- --- 3 5.1 5.5 -2.564 -1.579 4.048 6.576 2.492 4 9 4.8 1.336 -2.279 -3.044 1.784 5.192 5 7.1 5.1 -0.564 -1.979 1.116 0.318 3.915 6 4.9 9 -2.764 1.921 -5.311 7.641 3.692 7 6.1 7.1 -1.564 0.021 -0.034 2.447 0.000 8 10 4.9 2.336 -2.179 -5.089 5.456 4.746 9 8.2 6.1 0.536 -0.979 -0.524 0.287 0.958 10 5.5 10 -2.164 2.921 -6.323 4.684 8.535 11 6.5 8.2 -1.164 1.121 -1.306 1.356 1.258 12 11 5.5 3.336 -1.579 -5.266 11.127 2.492 13 8.9 6.5 1.236 -0.579 -0.715 1.527 0.335 14 6.5 11 -1.164 3.921 -4.566 1.356 15.378 15 7.3 8.9 -0.364 1.821 -0.664 0.133 3.318 16 11.2 6.5 3.536 -0.579 -2.046 12.501 0.335 Sum 107.3 99.1 0 0 -29.721 57.192 52.644 Average na halaga 7.664 7.079

    Kaya naman:

    Katulad nito, nakakahanap kami ng mga autocorrelation coefficient ng mas mataas na mga order, at ipasok ang lahat ng nakuha na mga halaga sa isang talahanayan ng buod:

    Lag Mga antas ng koepisyent ng autocorrelation 1 0.180 2 -0.542 3 0.129 4 0.980 5 0.987 6 -0.686 7 0.019 8 0.958 9 0.117 10 -0.707 11 -0.086 12 0.937

    Correlogram:

    Ang pagsusuri sa correlogram at graph ng mga paunang antas ng serye ng oras ay nagbibigay-daan sa amin upang makagawa ng mga konklusyon tungkol sa pagkakaroon ng mga pana-panahong pagbabagu-bago na may periodicity ng apat na quarter sa serye ng oras na pinag-aaralan.

    2) Ihanay natin ang mga unang antas ng serye gamit ang moving average na paraan. Para dito:

    Isama natin ang mga antas ng serye nang sunud-sunod para sa bawat apat na quarter na may pagbabago ng isang punto sa oras at tukuyin ang may kondisyong taunang dami ng pagkonsumo ng kuryente.

    Hinahati ang mga resultang halaga sa 4, makikita natin ang mga moving average. Ang mga nakahanay na halaga na nakuha sa ganitong paraan ay hindi na naglalaman ng isang napapanahong bahagi.

    Dalhin natin ang mga halagang ito sa sulat na may aktwal na mga sandali sa oras, kung saan makikita natin ang mga average na halaga ng dalawang magkasunod na moving average - centered moving averages.

    Kabuuan para sa apat na quarter Apat na quarter moving average Nakasentro sa moving average Pagtataya ng seasonal na bahagi 1 5.5 -- -- -- -- 2 4.8 24.4 6.1 -- -- 3 5.1 26 6.5 6.300 -1.200 4 9 26.1 6.525 6.513 2.488 5 7.1 27.1 6.775 6.650 0.450 6 4.9 28.1 7.025 6.900 -2.000 7 6.1 29.2 7.3 7.163 -1.063 8 10 29.8 7.45 7.375 2.625 9 8.2 30.2 7.55 7.500 0.700 10 5.5 31.2 7.8 7.675 -2.175 11 6.5 31.9 7.975 7.888 -1.388 12 11 32.9 8.225 8.100 2.900 13 8.9 33.7 8.425 8.325 0.575 14 6.5 33.9 8.475 8.450 -1.950 15 7.3 --- --- --- --- 16 11.2 --- --- --- ---

    Maghanap tayo ng mga pagtatantya ng seasonal na bahagi bilang pagkakaiba sa pagitan ng mga aktwal na antas ng serye at ng mga nakasentro na moving average. Ginagamit namin ang mga pagtatantya na ito upang kalkulahin ang mga halaga ng seasonal na bahagi. Upang gawin ito, nakita namin ang average na mga pagtatantya ng seasonal na bahagi para sa bawat quarter (sa lahat ng taon):

    Mga tagapagpahiwatig taon Quarter number, ako II III IV 1 --- --- -1.2 2.488 2 0.45 -2 -1.063 2.625 3 0.7 -2.175 -1.388 2.9 4 0.575 -1.95 --- --- Kabuuan para sa i-th quarter 1.725 -6.125 -3.651 8.013 Average na pagtatantya ng seasonal na bahagi para sa ika-kuwarter, 0.575 -2.042 -1.217 2.671 Inayos ang seasonal na bahagi, 0.578 -2.039 -1.213 2.674

    Ang mga modelong may seasonal na bahagi ay karaniwang ipinapalagay na ang mga seasonal na epekto ay kanselahin sa loob ng isang panahon. Sa additive model, ito ay ipinahayag sa katotohanan na ang kabuuan ng mga halaga ng seasonal component para sa lahat ng quarters ay dapat na katumbas ng zero.

    Para sa modelong ito mayroon kaming:

    Salik sa pagwawasto:

    Kinakalkula namin ang nababagay na mga halaga ng pana-panahong bahagi at ipinasok ang nakuha na data sa talahanayan.

    Suriin natin kung ang kabuuan ng mga seasonal na halaga ng bahagi ay katumbas ng zero:

    Ibukod natin ang impluwensya ng seasonal na bahagi sa pamamagitan ng pagbabawas ng mga halaga nito mula sa bawat antas ng orihinal na serye ng oras. Kunin natin ang mga halaga. Ang mga halagang ito ay kinakalkula para sa bawat punto sa oras at naglalaman lamang ng isang trend at isang random na bahagi.

    1 5.5 0.578 4.922 5.853 6.431 -0.931 0.867 3.423 2 4.8 -2.039 6.839 6.053 4.014 0.786 0.618 6.503 3 5.1 -1.213 6.313 6.253 5.040 0.060 0.004 5.063 4 9 2.674 6.326 6.453 9.127 -0.127 0.016 2.723 5 7.1 0.578 6.522 6.653 7.231 -0.131 0.017 0.063 6 4.9 -2.039 6.939 6.853 4.814 0.086 0.007 6.003 7 6.1 -1.213 7.313 7.053 5.840 0.260 0.068 1.563 8 10 2.674 7.326 7.253 9.927 0.073 0.005 7.023 9 8.2 0.578 7.622 7.453 8.031 0.169 0.029 0.722 10 5.5 -2.039 7.539 7.653 5.614 -0.114 0.013 3.423 11 6.5 -1.213 7.713 7.853 6.640 -0.140 0.020 0.723 12 11 2.674 8.326 8.053 10.727 0.273 0.075 13.323 13 8.9 0.578 8.322 8.253 8.831 0.069 0.005 2.403 14 6.5 -2.039 8.539 8.453 6.414 0.086 0.007 0.723 15 7.3 -1.213 8.513 8.653 7.440 -0.140 0.020 0.003 16 11.2 2.674 8.526 8.853 11.527 -0.327 0.107 14.823 Kabuuan 1.876 68.500

    Tukuyin natin ang isang bahagi ng modelong ito. Para magawa ito, magsasagawa kami ng analytical alignment ng serye gamit ang linear trend. Ang mga resulta ng analytical alignment ay ang mga sumusunod:

    Ang pagpapalit ng mga halaga sa equation na ito, hinahanap namin ang mga antas para sa bawat sandali sa oras

    Hanapin natin ang mga halaga ng mga antas ng serye na nakuha gamit ang additive model. Upang gawin ito, idinaragdag namin sa mga antas ang mga halaga ng pana-panahong bahagi para sa kaukulang mga quarter.

    Sa isang graph ay i-plot namin ang aktwal na mga halaga ng mga antas ng serye ng oras at ang mga teoretikal na nakuha gamit ang additive model.

    Upang masuri ang kalidad ng itinayong modelo, inilalapat namin ang kabuuan ng mga parisukat ng nakuhang ganap na mga error:

    Samakatuwid, masasabi nating ang additive model ay nagpapaliwanag ng 99.3% ng kabuuang variation sa mga antas ng time series.

    3) Ang forecast value ng antas ng time series sa additive model ay ang kabuuan ng trend at seasonal na bahagi. Upang matukoy ang bahagi ng trend, ginagamit namin ang equation ng trend:

    Ang mga halaga ng mga seasonal na bahagi para sa kaukulang quarter ay katumbas ng:

    kaya:

    Kung nahihirapan kang lutasin ang mga problema, nagbibigay ang site ng online na tulong sa mga mag-aaral sa econometrics na may mga pagsusulit o pagsusulit.

    Katamtaman ang halaga ng paglutas ng isang pagsubok ay 700 - 1200 rubles (ngunit hindi bababa sa 300 rubles para sa buong order). Ang presyo ay lubos na naiimpluwensyahan ng madaliang pagdedesisyon (mula sa isang araw hanggang ilang oras). Ang halaga ng online na tulong para sa isang pagsusulit/pagsusulit ay mula sa 1000 rubles. para sa paglutas ng tiket.

    Maaari kang mag-iwan ng isang kahilingan nang direkta sa chat, na naipadala na dati ang mga kondisyon ng mga gawain at ipinaalam sa iyo ang mga deadline para sa solusyon na kailangan mo. Ang oras ng pagtugon ay ilang minuto.

    Mga halimbawa ng mga kaugnay na problema

    Modelo ng linear pairwise regression
    Ang problema sa pagkalkula ng isang linear na modelo ng ipinares na regression. Sa panahon ng solusyon, ang pagkalkula ng mga coefficient ng regression ay ibinibigay, ang kanilang kahalagahan ay tinasa, ang average na error ng approximation ay kinakalkula at ang pagkalkula ng agwat ng kumpiyansa ng forecast ay ipinapakita.

    Multiple linear regression model
    Ang pahina ay naglalaman ng pare-pareho at sistematikong solusyon sa problema sa paksa ng pagsusuri ng ugnayan. Ang linear na modelo ng multiple regression ay isinasaalang-alang - ang pagkalkula ng mga coefficient ng regression at coefficient ng standardized regression equation. Ang pagkalkula ng paired, partial at multiple correlation coefficients at elasticity coefficients ay ibinigay.

    Ang periodic dependence ay isang pangkalahatang uri ng bahagi ng time series. Madaling makita na ang bawat obserbasyon ay halos kapareho sa kapitbahay nito; Bukod pa rito, mayroong paulit-ulit na periodic component, na nangangahulugan na ang bawat obserbasyon ay katulad din ng isang obserbasyon na naganap sa parehong oras noong nakalipas na panahon. Sa pangkalahatan, ang periodic dependence ay maaaring pormal na tukuyin bilang isang correlation dependence ng order k sa pagitan ng bawat i-th na elemento ng serye at ng (i-k)-th na elemento. Maaari itong masukat gamit ang autocorrelation (ibig sabihin, ang ugnayan sa pagitan ng mga termino ng serye mismo); k ay karaniwang tinatawag na lag (kung minsan ay ginagamit ang mga katumbas na termino: shift, delay). Kung ang error sa pagsukat ay hindi masyadong malaki, kung gayon ang periodicity ay maaaring matukoy nang biswal sa pamamagitan ng pagsusuri sa pag-uugali ng mga miyembro ng serye sa bawat k time unit.

    Ang mga pana-panahong bahagi ng isang serye ng oras ay matatagpuan gamit ang isang correlogram. Ipinapakita ng correlogram (autocorrelogram) ayon sa numero at graphical ang autocorrelation function (ACF), sa madaling salita, ang mga autocorrelation coefficient para sa isang sequence ng mga lags mula sa isang partikular na range. Ang isang correlogram ay karaniwang nagpapakita ng isang hanay ng dalawang karaniwang mga error sa bawat lag, ngunit kadalasan ang magnitude ng autocorrelation ay mas kawili-wili kaysa sa pagiging maaasahan nito dahil ito ay halos napakalakas na autocorrelations na interesado.

    Kapag nag-aaral ng correlograms, dapat tandaan na ang mga autocorrelations ng sunud-sunod na mga lags ay pormal na umaasa sa isa't isa. Isaalang-alang ang sumusunod na halimbawa. Kung ang unang miyembro ng isang serye ay malapit na nauugnay sa pangalawa, at ang pangalawa hanggang sa pangatlo, kung gayon ang unang elemento ay dapat ding nakadepende sa pangatlo, atbp. Ito ay humahantong sa katotohanan na ang panaka-nakang pag-asa ay maaaring magbago nang malaki pagkatapos alisin ang mga first-order na autocorrelations (ibig sabihin, pagkatapos kunin ang pagkakaiba sa lag 1).

    Layunin ng gawain:

    1. Magbigay ng pangunahing teoretikal na impormasyon

    2. Magbigay ng mga halimbawa ng pagkalkula ng ACF

    Kabanata 1. Teoretikal na impormasyon

    Autocorrelation coefficient at ang pagtatasa nito

    Upang ganap na makilala ang isang random na proseso, hindi sapat ang inaasahan at pagkakaiba-iba nito sa matematika. Noong 1927, ipinakilala ni E.E. Slutsky ang konsepto ng isang "naka-link na serye" para sa mga umaasa na obserbasyon: ang posibilidad ng paglitaw ng ilang partikular na halaga sa isang tiyak na lugar ay depende sa kung anong mga halaga ang natanggap na ng random variable nang mas maaga o matatanggap sa ibang pagkakataon. . Sa madaling salita, mayroong isang scattering field ng mga pares ng mga halaga x(t), x(t+k) ng time series, kung saan ang k ay isang pare-parehong agwat o pagkaantala, na nagpapakilala sa pagkakaugnay ng mga kasunod na pagpapatupad ng proseso mula sa mga nauna. Ang lapit ng relasyon na ito ay tinasa ng mga autocovariance coefficients -

    g (k) = E[(x(t) - m)(x(t + k) - m)] –

    at autocorrelation

    r (k) = E[(x(t) - m)(x(t + k) - m)] / D ,

    kung saan ang m at D ay ang mathematical na inaasahan at pagkakaiba ng random na proseso. Upang kalkulahin ang autocovariance at autocorrelation ng mga tunay na proseso, kailangan ang impormasyon sa pinagsamang probability distribution ng mga antas ng seryeng p(x(t 1),x(t 2)). Gayunpaman, para sa mga nakatigil na proseso na nasa isang tiyak na istatistikal na ekwilibriyo, ang probability distribution na ito ay pareho para sa lahat ng oras t 1, t 2 na pinaghihiwalay ng parehong pagitan. Dahil ang pagkakaiba ng isang nakatigil na proseso sa anumang oras (kapwa sa t at t + k) ay katumbas ng D = g(0), kung gayon ang autocorrelation na may lag k ay maaaring ipahayag bilang

    r(k) = g(k)/g(0),

    mula sa kung saan ito ay sumusunod na r (0) = 1. Sa ilalim ng parehong mga kondisyon ng stationarity, ang koepisyent ng ugnayan r (k) sa pagitan ng dalawang halaga ng isang serye ng oras ay nakasalalay lamang sa halaga ng agwat ng oras k at hindi nakasalalay sa mga sandali ng pagmamasid t kanilang sarili.

    Sa mga istatistika, mayroong ilang mga sample na pagtatantya ng mga teoretikal na halaga ng autocorrelation r(k) ng isang proseso sa isang may hangganang serye ng oras ng n obserbasyon. Ang pinakasikat na pagtatantya ay ang non-cyclical autocorrelation coefficient na may lag k (Anderson, 1976; Vainu, 1977):

    Ang pinakamahalaga sa iba't ibang autocorrelation coefficient ay ang una - r 1, na sumusukat sa lapit ng koneksyon sa pagitan ng mga antas x(1), x(2),..., x(n -1) at x(2) , x(3), .. ., x(n).

    Ang pamamahagi ng mga autocorrelation coefficients ay hindi alam; samakatuwid, upang masuri ang kanilang pagiging maaasahan, ang nonparametric na teorya ni Anderson (1976), na nagmungkahi ng mga istatistika, ay minsan ginagamit

    t = r 1 (n -1) 0.5 ,

    na, na may sapat na malaking sample, ay karaniwang ipinamamahagi, ay may mean na zero at isang pagkakaiba-iba na katumbas ng isa (Tintner, 1965).

    Mga function ng autocorrelation

    Ang pagkakasunud-sunod ng mga coefficient ng ugnayan r k, kung saan ang k = 1, 2, ..., n, bilang isang function ng interval k sa pagitan ng mga obserbasyon ay tinatawag na autocorrelation function (ACF).

    Ang uri ng sample na autocorrelation function ay malapit na nauugnay sa istraktura ng serye.

    · Ang autocorrelation function r k para sa "white noise", para sa k >0, ay bumubuo rin ng isang nakatigil na serye ng oras na may average na halaga na 0.

    · Para sa isang nakatigil na serye, ang ACF ay mabilis na bumababa sa pagtaas ng k. Kung mayroong isang malinaw na trend, ang autocorrelation function ay tumatagal sa katangian na hitsura ng isang napakabagal na pagbagsak ng curve.

    · Sa kaso ng binibigkas na seasonality, ang ACF graph ay naglalaman din ng mga outlier para sa mga lags na multiple ng seasonality period, ngunit ang mga outlier na ito ay maaaring matakpan ng pagkakaroon ng trend o isang malaking dispersion ng random na bahagi.

    Tingnan natin ang mga halimbawa ng autocorrelation function:

    · sa Fig. Ipinapakita ng Figure 1 ang isang graph ng ACF, na nailalarawan sa pamamagitan ng katamtamang trend at hindi malinaw na seasonality;

    · bigas. Ipinapakita ng 2 ang ACF ng isang serye na nailalarawan sa pamamagitan ng isang kahanga-hangang seasonal determinant;

    · ang halos walang basang graph ng ACF ng serye (Fig. 3) ay nagpapahiwatig ng pagkakaroon ng isang malinaw na trend.

    Sa pangkalahatan, maaari nating ipagpalagay na walang autocorrelation sa serye na binubuo ng mga deviations mula sa trend. Halimbawa, sa Fig. Ipinapakita ng Figure 4 ang plot ng ACF para sa mga residual na nakuha mula sa pagpapakinis ng serye, na napaka-reminiscent ng proseso ng "white noise". Gayunpaman, madalas na may mga kaso kapag ang mga nalalabi (random na bahagi h) ay maaaring maging autocorrelated, halimbawa, para sa mga sumusunod na dahilan:

    · hindi isinasaalang-alang ang isang mahalagang salik sa mga modelo ng deterministiko o stochastic na dinamika

    · hindi isinasaalang-alang ng modelo ang ilang hindi mahalagang mga kadahilanan, ang impluwensya ng isa't isa na nagiging makabuluhan dahil sa pagkakaisa ng mga yugto at direksyon ng kanilang pagbabago;

    · ang maling uri ng modelo ay napili (ang prinsipyo ng counterintuitiveness ay nilabag);

    · ang random na bahagi ay may isang tiyak na istraktura.

    Pagsubok sa Durbin-Watson

    Ang pagsubok ng Durbin-Watson (Durbin, 1969) ay isang pangkaraniwang istatistika na idinisenyo upang subukan para sa unang-order na autocorrelation ng mga nalalabi pagkatapos ng series smoothing o sa mga modelo ng regression.

    Ang numerical value ng coefficient ay

    d = [(e(2)-e(1)) 2 + ... + (e(n)-e(n -1)) 2 ]/,

    kung saan ang e(t) ay ang mga natitira.

    Ang mga posibleng halaga ng criterion ay nasa hanay mula 0 hanggang 4, at ang mga naka-tabulate na halaga ng threshold nito para sa iba't ibang antas ng kahalagahan ay naka-tabulate (Lizer, 1971).

    Ang value ng d ay malapit sa value na 2*(1 - r 1), kung saan ang r ay ang sample na autocorrelation coefficient para sa mga residual. Alinsunod dito, ang perpektong halaga ng istatistika ay 2 (walang autocorrelation). Ang mas maliit na mga halaga ay tumutugma sa positibong autocorrelation ng mga nalalabi, mas malaki - negatibo.

    Halimbawa, pagkatapos i-smooth ang serye, ang serye ng mga residual ay may criterion na d = 1.912. Ang mga katulad na istatistika pagkatapos ng pagpapakinis ng serye - d = 1.638 - ay nagpapahiwatig ng ilang autocorrelation ng mga nalalabi.

    Kabanata 2. Mga halimbawa ng mga praktikal na kalkulasyon gamit ang Excel macro "Autocorrelation function"

    Ang lahat ng data ay kinuha mula sa site http://e3.prime-tass.ru/macro/

    Halimbawa 1. GDP ng Russia

    Narito ang data sa GDP ng Russian Federation

    unang pagkakaiba

    Tuklasin natin ang serye

    Ang mga diagram ay nagpapakita ng: ang orihinal na serye (itaas) at ang autocorrelation function hanggang lag 9 (ibaba). Sa ilalim na diagram, ang putol-putol na linya ay nagpapahiwatig ng antas ng "puting ingay" - ang limitasyon ng istatistikal na kahalagahan ng mga coefficient ng ugnayan. Ito ay makikita na mayroong isang malakas na ugnayan ng 1st at 2nd order, mga kalapit na miyembro ng serye, ngunit inalis din ng 1 yunit ng oras sa bawat isa. Ang mga koepisyent ng ugnayan ay makabuluhang lumampas sa antas ng "puting ingay". Ayon sa autocorrelation graph, nakikita natin ang pagkakaroon ng isang malinaw na trend.

    Nasa ibaba ang mga halaga ng autocorrelation function at ang white noise level

    Error sa ACF

    Kung interesado tayo sa panloob na dinamika ng isang serye, kailangan nating hanapin ang unang pagkakaiba ng mga termino nito, i.e. Para sa bawat quarter, hanapin ang pagbabago sa halaga kumpara sa nakaraang quarter. Para sa unang pagkakaiba, bumuo kami ng isang autocorrelation function.

    Halimbawa 2: Mag-import

    ibig sabihin

    pagkakaiba

    Bumuo tayo ng autocorrelation function

    Error sa ACF

    Nakikita namin na mayroong autocorrelation ng 1st at 2nd order. Ipinapakita ng graph ang pagkakaroon ng isang trend. Ang positibong autocorrelation ay ipinaliwanag sa pamamagitan ng isang maling napiling detalye, dahil Ang isang linear na trend ay hindi angkop dito; ito ay sa halip exponential. Samakatuwid, ginagawa naming nakatigil ang serye sa pamamagitan ng pagkuha ng unang pagkakaiba.

    Error sa ACF

    Nakikita namin ang pagkakaroon ng 4th order autocorrelation, na tumutugma sa ugnayan ng data na pinaghihiwalay ng isang taon. Wala kaming first-order na autocorrelation.

    Istatistika ng Durbin-Watson (DW) =2.023

    Halimbawa 3: I-export

    Ibigay natin ang datos

    ibig sabihin

    pagkakaiba


    Para sa orihinal na serye mayroon kaming:

    Error sa ACF

    Malinaw na mayroong malinaw na kalakaran; ang mga autocorrelation coefficient ng 1st at 2nd order ay makabuluhan. Para sa unang pagkakaiba

    Error sa ACF

    Hindi na namin nakikita ang autocorrelation; ang mga nalalabi ay ipinamamahagi bilang "white noise".

    Konklusyon

    Ang isa pang kapaki-pakinabang na paraan para sa pag-aaral ng periodicity ay ang pagsusuri sa partial autocorrelation function (PACF), na isang extension ng konsepto ng ordinaryong autocorrelation function. Sa PACF, ang pagtitiwala sa pagitan ng mga intermediate na obserbasyon (mga obserbasyon sa loob ng isang lag) ay inaalis. Sa madaling salita, ang bahagyang autocorrelation sa isang naibigay na lag ay katulad ng ordinaryong autocorrelation, maliban na ang pagkalkula ay nag-aalis ng impluwensya ng mga autocorrelations na may mas maikling mga lags. Sa lag 1 (kapag walang mga intermediate na elemento sa loob ng lag), ang bahagyang autocorrelation ay malinaw na katumbas ng ordinaryong autocorrelation. Sa katunayan, ang bahagyang autocorrelation ay nagbibigay ng mas malinis na larawan ng mga pana-panahong dependencies.

    Tulad ng nabanggit sa itaas, ang pana-panahong bahagi para sa isang naibigay na lag k ay maaaring alisin sa pamamagitan ng pagkuha ng pagkakaiba sa naaangkop na pagkakasunud-sunod. Nangangahulugan ito na ang (i-k)th na elemento ay ibinabawas sa bawat i-th na elemento ng serye. Mayroong dalawang argumento na pabor sa gayong mga pagbabago. Una, sa ganitong paraan posibleng matukoy ang mga nakatagong pana-panahong bahagi ng serye. Alalahanin na ang mga autocorrelations sa sunud-sunod na mga lag ay nakasalalay. Samakatuwid, ang pag-alis ng ilang autocorrelations ay magbabago sa iba pang autocorrelations na maaaring napigilan ang mga ito at gawing mas kitang-kita ang ilang iba pang seasonal na bahagi. Pangalawa, ang pag-alis ng mga pana-panahong bahagi ay ginagawang nakatigil ang serye, na kinakailangan para sa aplikasyon ng ilang mga pamamaraan ng pagsusuri.

    Panitikan

    1. Gmurman V.E. Teorya ng Probability at Mathematical Statistics. M.: Higher School, 1977.

    2. Gmurman V.E. Isang gabay sa paglutas ng mga problema sa probability theory at mathematical statistics. M.: Higher School, 1997.

    3. Kalinina V.N., Pankin V.F. Mga istatistika sa matematika. M.: Mas Mataas na Paaralan, 1994.

    4. Matskevich I.P., Svirid G.P., Buldyk G.M. Koleksyon ng mga problema at pagsasanay sa mas mataas na matematika (Probability theory at mathematical statistics). Minsk: Mas Mataas na Paaralan, 1996.

    5. Timofeeva L.K., Sukhanova E.I., Safiulin G.G. Koleksyon ng mga problema sa probability theory at mathematical statistics / Samarsk. econ. int. Samara, 1992.

    6. Timofeeva L.K., Sukhanova E.I., Safiulin G.G. Probability theory at mathematical statistics / Samarsk. estado econ. acad. Samara, 1994.

    7. Timofeeva L.K., Sukhanova E.I. Matematika para sa mga ekonomista. Koleksyon ng mga problema sa probability theory at mathematical statistics. –M.: UMIIC “Educational Literature”, 1998.


    At, samakatuwid, lubos na makabuluhan

    Ang koepisyent ng autocorrelation ay maaari ding matantya para sa isang hindi nakatigil na serye, ngunit sa kasong ito ay nawala ang probabilistikong interpretasyon nito.

    Sa katunayan, ang prinsipyo ng omnipotency ay nilabag