Halimbawa ng istatistika ng linear trend equation. Pagbuo ng Linear Trend

HALIMBAWA. Pag-aaral ng istatistika ng dinamika ng populasyon.

    Sa tulong ng chain, basic, average indicators ng dynamics, suriin ang pagbabago sa numero, isulat ang mga konklusyon.

    Gamit ang paraan ng analytical alignment (kasama ang isang tuwid na linya at isang parabola, na natukoy ang mga coefficient gamit ang hindi bababa sa mga parisukat), kilalanin ang pangunahing trend sa pag-unlad ng phenomenon (ang populasyon ng Komi Republic). Suriin ang kalidad ng mga resultang modelo gamit ang mga error at approximation factor.

    Tukuyin ang linear at parabolic trend coefficients gamit ang Chart Wizard. Magbigay ng punto at pagitan ng mga pagtataya ng populasyon para sa 2010. Isulat ang mga konklusyon.

Analytical alignment method a) Ang linear trend equation ay y = bt + a 1. Hanapin ang mga parameter ng equation sa pamamagitan ng least squares method. Ginagamit namin ang paraan ng pagbibilang ng oras mula sa kondisyonal na simula. Ang sistema ng mga equation ng least squares para sa isang linear na trend ay may anyo: a 0 n + a 1 ∑t = ∑y a 0 ∑t + a 1 ∑t 2 = ∑y t

Para sa aming data, ang sistema ng mga equation ay kukuha ng anyo: 10a 0 + 0a 1 = 10400 0a 0 + 330a 1 = -4038 -12.236t+1040

Suriin natin ang kalidad ng trend equation gamit ang absolute approximation error. Ang error sa pagtatantya sa loob ng 5%-7% ay nagpapahiwatig ng isang mahusay na pagpili ng equation ng trend sa orihinal na data.

b) parabolic alignment Ang trend equation ay may anyo na y = sa 2 + bt + c 1. Hinahanap namin ang mga parameter ng equation gamit ang least squares method. Ang sistema ng mga equation ng hindi bababa sa mga parisukat: a 0 n + a 1 ∑t + a 2 ∑t 2 = ∑y a 0 ∑t + a 1 ∑t 2 + a 2 ∑t 3 = ∑yt a 0 ∑t 2 + a 1 ∑t 3 + a 2 ∑t 4 = ∑yt 2

Para sa aming data, ang sistema ng mga equation ay may anyo a 2 = 998.5 Trend equation: y = 1.258t 2 -12.236t+998.5

Error sa pagtatantya para sa parabolic trend equation. Dahil ang error ay mas mababa sa 7%, ang equation na ito ay maaaring gamitin bilang isang trend.

Minimum na error sa pagtatantya para sa parabolic alignment. Bilang karagdagan, ang koepisyent ng pagpapasiya R 2 ay mas mataas kaysa sa isang linear. Samakatuwid, para sa pagtataya ay kinakailangan na gamitin ang parabolic equation.

Pagtataya ng pagitan. Alamin natin ang mean square error ng hinulaang indicator. m = 1 - ang bilang ng mga salik na nakakaimpluwensya sa equation ng trend. Uy = y n+L ± K kung saan L - lead time; n+L - point forecast ayon sa modelo sa (n + L)-th point sa oras; n ay ang bilang ng mga obserbasyon sa serye ng oras; Sy ang karaniwang error ng hinulaang indicator; T table - tabular na halaga ng criterion ng Mag-aaral para sa antas ng kahalagahan α at para sa bilang ng mga antas ng kalayaan na katumbas ng n-2. Ayon sa talahanayan ng Mag-aaral, makikita natin ang Ttable Ttable (n-m-1;α/2) = (8;0.025) = 2.306 Point forecast, t = 10: y(10) = 1.26*10 2 -12.24*10 + 998.5 = 1001.89 libong tao 1001.89 - 71.13 = 930.76; 1001.89 + 71.13 = 1073.02 Pagtataya ng pagitan: t = 9+1 = 10: (930.76;1073.02)

Ayon sa formula (9.29), ang mga parameter ng linear trend ay a = 1894/11 = 172.2 q/ha; b= 486/110 = 4.418 q/ha. Ang linear trend equation ay:

û = 172,2 + 4,418t, saan t = 0 noong 1987 Nangangahulugan ito na ang average na aktwal at inangkop na antas, na tinutukoy sa gitna ng panahon, i.e. pagsapit ng 1991, katumbas ng 172 centners kada 1 ra ang average na taunang pagtaas ay 4.418 centners/ha kada taon

Parabolic trend parameter ayon sa (9.23) ay b= 4,418; a = 177,75; c =-0.5571. Ang parabolic trend equation ay may anyo ũ = 177,75 + 4,418t - 0.5571t2; t= 0 noong 1991. Nangangahulugan ito na ang ganap na pagtaas ng ani ay bumabagal sa average ng 2·0.56 c/ha kada taon kada taon. Ang ganap na paglago mismo ay hindi na pare-pareho ng parabolic trend, ngunit ang average na halaga para sa panahon. Sa taong kinuha bilang reference point, i.e. 1991, ang trend ay dumaan sa punto na may ordinate na 77.75 c/ha; Ang libreng termino ng parabolic trend ay hindi ang average na antas para sa panahon. Ang mga parameter ng exponential trend ay kinakalkula ng mga formula (9.32) at (9.33) ln a= 56.5658/11 = 5.1423; potentiating, nakukuha namin a= 171.1; ln k= 2.853:110 = 0.025936; potentiating, nakukuha namin k = 1,02628.

Ang exponential trend equation ay: y = 171.1 1.02628 t .

Nangangahulugan ito na ang average na taunang post yield rate para sa panahon ay 102.63%. Sa puntong dinala sa pinanggalingan, ang trend ay pumasa sa punto na may ordinate na 171.1 q/ha.

Ang mga antas na kinakalkula ayon sa mga equation ng trend ay naitala sa huling tatlong column ng Table. 9.5. Tulad ng makikita mula sa mga datos na ito. ang mga kinakalkula na halaga ng mga antas para sa lahat ng tatlong uri ng mga uso ay hindi gaanong nagkakaiba, dahil ang parehong acceleration ng parabola at ang rate ng paglago ng exponent ay maliit. Ang isang parabola ay may makabuluhang pagkakaiba - ang paglaki ng mga antas ay huminto mula noong 1995, habang sa isang linear na trend, ang mga antas ay patuloy na lumalaki, at sa isang exponential, ang kanilang OST ay bumibilis. Samakatuwid, para sa mga pagtataya para sa hinaharap, ang tatlong trend na ito ay hindi pantay-pantay: kapag i-extrapolate ang parabola para sa mga darating na taon, ang mga antas ay mag-iiba nang husto mula sa tuwid na linya at ang exponent, tulad ng makikita mula sa Talahanayan. 9.6. Ang talahanayang ito ay nagpapakita ng printout ng solusyon sa isang PC gamit ang Statgraphics program para sa parehong tatlong trend. Ang pagkakaiba sa pagitan ng kanilang mga libreng termino at mga ibinigay sa itaas ay ipinaliwanag sa pamamagitan ng katotohanan na ang programa ay binibilang ang mga taon hindi mula sa gitna, ngunit mula sa simula, upang ang mga libreng tuntunin ng mga uso ay tumutukoy sa 1986, kung saan t = 0. Ang Ang exponential equation sa printout ay naiwan sa logarithmic form. Ang pagtataya ay ginawa para sa 5 taon sa hinaharap, i.е. hanggang 2001. Kapag ang pinagmulan ng mga coordinate (sanggunian sa oras) ay nagbago sa parabola equation, ang average na ganap na pagtaas, ang parameter b. dahil, bilang isang resulta ng negatibong acceleration, ang paglago ay bumababa sa lahat ng oras, at ang maximum nito ay nasa simula ng panahon. Ang pare-pareho ng parabola ay ang acceleration lamang.


Ang linyang "Data" ay naglalaman ng mga antas ng orihinal na serye; Ang ibig sabihin ng "buod ng forecast" ay buod ng data para sa hula. Sa mga sumusunod na linya - mga equation ng isang tuwid na linya, parabola, exponent - sa logarithmic form. Ang column na ME ay nangangahulugang ang average na pagkakaiba sa pagitan ng mga antas ng orihinal na serye at mga antas ng trend (naayos). Para sa isang tuwid na linya at isang parabola, palaging zero ang pagkakaibang ito. Ang mga antas ng exponent ay nasa average na 0.48852 na mas mababa kaysa sa mga antas ng orihinal na serye. Posible ang eksaktong tugma kung exponential ang totoong trend; sa kasong ito walang pagkakataon, ngunit ang pagkakaiba ay maliit. Ang column ng MAE ay ang pagkakaiba s2- isang sukatan ng pagkasumpungin ng mga aktwal na antas na nauugnay sa trend, tulad ng inilarawan sa talata 9.7. Column MAE - average na linear deviation ng mga antas mula sa trend modulo (tingnan ang talata 5.8); column MARE - relatibong linear deviation sa porsyento. Narito ang mga ito ay ibinigay bilang mga tagapagpahiwatig ng pagiging angkop ng napiling uri ng trend. Ang isang parabola ay may mas maliit na variance at deviation modulus: ito ay para sa panahon ng 1986 - 1996. mas malapit sa aktwal na mga antas. Ngunit ang pagpili ng uri ng trend ay hindi maaaring bawasan sa criterion na ito lamang. Sa katunayan, ang pagbagal sa paglago ay resulta ng isang malaking negatibong paglihis, ibig sabihin, isang pagkabigo sa pananim noong 1996.

Ang ikalawang kalahati ng talahanayan ay isang pagtataya ng mga antas ng ani para sa tatlong uri ng mga uso para sa mga taon; t = 12, 13, 14, 15 at 16 mula sa pinanggalingan (1986). Ang mga antas ng pagtataya na exponentially hanggang sa taong 16 ay hindi mas mataas kaysa sa isang tuwid na linya. Ang mga antas ng trend-parabola ay bumababa, higit pa at higit na diverging mula sa iba pang mga trend.

Tulad ng makikita sa Talahanayan. 9.4, kapag kinakalkula ang mga parameter ng trend, ang mga antas ng paunang serye ay pumapasok na may iba't ibang mga timbang - mga halaga tp at ang kanilang mga parisukat. Samakatuwid, ang impluwensya ng pagbabagu-bago ng antas sa mga parameter ng trend ay nakasalalay sa kung aling bilang ng taon ang nahuhulog sa isang produktibo o lean na taon. Kung ang isang matalim na paglihis ay nangyari sa isang taon na may zero na numero ( ti = 0), pagkatapos ay hindi ito magkakaroon ng anumang epekto sa mga parameter ng trend, at kung ito ay tumama sa simula at pagtatapos ng serye, ito ay magkakaroon ng malakas na epekto. Dahil dito, ang isang solong analytical alignment ay hindi ganap na nagpapalaya sa mga parameter ng trend mula sa impluwensya ng pagkasumpungin, at sa malakas na pagbabagu-bago ay maaari silang maging malakas, na nangyari sa parabola sa aming halimbawa. Upang higit pang maalis ang distorting na epekto ng mga pagbabagu-bago sa mga parameter ng trend, dapat mag-apply ang isa maramihang paraan ng pag-align ng sliding.

Ang diskarteng ito ay binubuo sa katotohanan na ang mga parameter ng trend ay kinakalkula hindi kaagad sa buong serye, ngunit sa pamamagitan ng isang paraan ng pag-slide, una para sa una t mga yugto ng panahon o mga sandali, pagkatapos ay para sa panahon mula sa ika-2 hanggang t+ 1, 3rd hanggang (t + 2)-ika antas, atbp. Kung ang bilang ng mga paunang antas ng serye ay P, at ang haba ng bawat base ng pagkalkula ng sliding parameter ay katumbas ng t, kung gayon ang bilang ng mga gumagalaw na base t o mga indibidwal na halaga ng mga parameter na matutukoy mula sa kanila ay:

L = n+ 1 - t.

Ang paggamit ng pamamaraan ng pag-slide ng maraming pagkakahanay ay maaaring isaalang-alang, tulad ng makikita mula sa mga kalkulasyon sa itaas, kung ang bilang ng mga antas sa serye ay sapat na malaki, karaniwang 15 o higit pa. Isaalang-alang ang pamamaraang ito sa halimbawa ng data sa Talahanayan. Ipinapakita ng 9.4 ang dynamics ng presyo ng mga produktong hindi panggatong sa mga umuunlad na bansa, na muling nagbibigay ng pagkakataon sa mambabasa na lumahok sa isang maliit na siyentipikong pag-aaral. Sa parehong halimbawa, ipagpapatuloy namin ang pamamaraan ng pagtataya sa Seksyon 9.10.

Kung kalkulahin namin ang mga parameter sa aming serye para sa 11 taon (para sa 11 na antas), kung gayon t= 17 + 1 - 11 = 7. Ang kahulugan ng multiple sliding leveling ay na may sunud-sunod na paglilipat ng base ng pagkalkula ng parameter, sa mga dulo nito at sa gitna ay magkakaroon ng iba't ibang mga antas na may iba't ibang mga palatandaan at magnitude ng mga deviations mula sa trend. Samakatuwid, sa ilang mga paglilipat sa base, ang mga parameter ay labis na matantya, sa iba ay minamaliit ang mga ito, at sa kasunod na pag-average ng mga halaga ng parameter sa lahat ng mga pagbabago sa base ng pagkalkula, ang mga pagbaluktot ng mga parameter ng trend ay higit pa. offset sa pamamagitan ng pagbabagu-bago ng antas.

Ang multiple sliding alignment ay hindi lamang nagbibigay-daan upang makakuha ng mas tumpak at maaasahang pagtatantya ng mga parameter ng trend, ngunit upang makontrol din ang tamang pagpili ng uri ng trend equation. Kung lumalabas na ang nangungunang trend parameter, ang pare-pareho nito, kapag kinakalkula sa pamamagitan ng paglipat ng mga base, ay hindi random na nagbabago, ngunit sistematikong nagbabago ang halaga nito sa isang makabuluhang paraan, kung gayon ang uri ng trend ay napili nang hindi tama, ang parameter na ito ay hindi pare-pareho.

Tulad ng para sa libreng termino na may maraming pagkakahanay, hindi na kailangan at, bukod dito, ito ay hindi tama na kalkulahin ang halaga nito bilang isang average sa lahat ng mga paglilipat ng base, dahil sa pamamaraang ito, ang mga indibidwal na antas ng orihinal na serye ay isasama sa ang pagkalkula ng average na may iba't ibang mga timbang, at ang kabuuan ng mga nakahanay na antas ay magkakaiba ay sa kabuuan ng mga tuntunin ng orihinal na serye. Ang libreng termino ng trend ay ang average na halaga ng antas para sa panahon, sa kondisyon na ang oras ay binibilang mula sa gitna ng panahon. Kapag nagbibilang mula sa simula, kung ang unang antas t i= 1, ang libreng termino ay magiging katumbas ng: a 0 = у̅ - b((N-1)/2). Inirerekomenda na piliin ang haba ng gumagalaw na base para sa pagkalkula ng mga parameter ng trend ng hindi bababa sa 9-11 na antas upang sapat na mapahina ang mga pagbabago sa antas. Kung ang orihinal na hilera ay napakahaba, ang base ay maaaring hanggang sa 0.7 - 0.8 ng haba nito. Upang maalis ang impluwensya ng mahabang panahon (cyclical) na mga pagbabago sa mga parameter ng trend, ang bilang ng mga base shift ay dapat na katumbas ng o isang multiple ng haba ng ikot ng pagbabago. Pagkatapos ang simula at dulo ng base ay sunud-sunod na "tatakbo sa" lahat ng mga yugto ng cycle, at kapag ang parameter ay na-average sa lahat ng mga shift, ang mga distortion nito mula sa cyclic fluctuations ay magkakansela sa isa't isa. Ang isa pang paraan ay kunin ang haba ng sliding base na katumbas ng haba ng cycle, upang ang simula ng base at dulo ng base ay laging nahuhulog sa parehong yugto ng oscillation cycle.

Dahil ayon sa Talahanayan. 9.4, naitatag na na ang trend ay may linear na anyo, kinakalkula namin ang average na taunang ganap na pagtaas, ibig sabihin, ang parameter b linear trend equation sa isang sliding na paraan sa paglipas ng 11-taong base (tingnan ang Talahanayan 9.7). Naglalaman din ito ng pagkalkula ng data na kinakailangan para sa kasunod na pag-aaral ng pagkasumpungin sa talata 9.7. Isaalang-alang natin nang mas detalyado ang paraan ng maramihang pag-align sa pamamagitan ng mga sliding base. Kalkulahin ang parameter b para sa lahat ng mga base:


Ang isang linya ng trend ay ginagamit upang biswal na ilarawan ang mga trend ng presyo. Ang elemento ng teknikal na pagsusuri ay isang geometric na representasyon ng mga average na halaga ng nasuri na tagapagpahiwatig.

Tingnan natin kung paano magdagdag ng trend line sa isang chart sa Excel.

Pagdaragdag ng trendline sa isang chart

Halimbawa, kunin natin ang karaniwang presyo ng langis mula noong 2000 mula sa mga open source. Ipapasok namin ang data para sa pagsusuri sa talahanayan:



Ang isang trend line sa Excel ay isang graph ng isang approximating function. Bakit ito kailangan - upang gumawa ng mga pagtataya batay sa istatistikal na data. Sa layuning ito, kinakailangan upang pahabain ang linya at matukoy ang mga halaga nito.

Kung R2 = 1, ang error sa approximation ay zero. Sa aming halimbawa, ang pagpili ng linear approximation ay nagbigay ng mababang kumpiyansa at hindi magandang resulta. Magiging hindi tumpak ang hula.

Pansin!!! Hindi maaaring maidagdag ang isang trend line sa mga sumusunod na uri ng mga graph at chart:

  • talulot;
  • pabilog;
  • ibabaw;
  • annular;
  • dami;
  • may akumulasyon.


Trendline Equation sa Excel

Sa halimbawa sa itaas, ang isang linear approximation ay pinili lamang upang ilarawan ang algorithm. Tulad ng ipinakita ng halaga ng pagiging maaasahan, ang pagpili ay hindi ganap na matagumpay.

Dapat mong piliin ang uri ng display na pinakatumpak na naglalarawan ng trend sa input ng user. Tingnan natin ang mga pagpipilian.

Linear approximation

Ang geometric na representasyon nito ay isang tuwid na linya. Samakatuwid, ang isang linear approximation ay ginagamit upang ilarawan ang isang indicator na tumataas o bumababa sa isang pare-parehong rate.

Isaalang-alang ang kondisyonal na bilang ng mga kontrata na natapos ng manager sa loob ng 10 buwan:

Batay sa data sa talahanayan ng Excel, bubuo kami ng isang scatter plot (makakatulong ito na ilarawan ang linear na uri):


Piliin ang tsart - "magdagdag ng linya ng trend". Sa mga parameter, piliin ang linear na uri. Idinaragdag namin ang halaga ng pagiging maaasahan ng approximation at ang equation ng trend line sa Excel (lagyan lang ng check ang mga kahon sa ibaba ng window ng "Mga Parameter").


Nakukuha namin ang resulta:


Tandaan! Gamit ang linear na uri ng approximation, ang mga punto ng data ay matatagpuan nang mas malapit hangga't maaari sa isang tuwid na linya. Ginagamit ng view na ito ang sumusunod na equation:

y = 4.503x + 6.1333

  • kung saan 4.503 ang slope indicator;
  • 6.1333 - mga offset;
  • y ay isang pagkakasunod-sunod ng mga halaga,
  • x ay ang period number.

Ang tuwid na linya sa graph ay nagpapakita ng tuluy-tuloy na pagtaas sa kalidad ng trabaho ng manager. Ang approximation reliability value ay 0.9929, na nagpapahiwatig ng magandang kasunduan sa pagitan ng kinakalkula na tuwid na linya at ng paunang data. Dapat na tumpak ang mga hula.

Upang mahulaan ang bilang ng mga kontratang natapos, halimbawa, sa ika-11 na yugto, kailangan mong palitan ang numerong 11 sa halip na x sa equation. Sa kurso ng mga kalkulasyon, nalaman namin na sa ika-11 na panahon ang manager na ito ay magtatapos ng 55-56 na kontrata.

Exponential trend line

Magiging kapaki-pakinabang ang ganitong uri kung nagbabago ang mga halaga ng input sa patuloy na pagtaas ng rate. Ang exponential approximation ay hindi inilalapat sa pagkakaroon ng zero o negatibong katangian.

Bumuo tayo ng exponential trend line sa Excel. Kunin natin halimbawa ang mga conditional value ng kapaki-pakinabang na supply ng kuryente sa rehiyon X:

Bumubuo kami ng isang tsart. Magdagdag ng exponential line.


Ang equation ay may sumusunod na anyo:

y = 7.6403е^-0.084x

  • kung saan ang 7.6403 at -0.084 ay mga constant;
  • e ang batayan ng natural na logarithm.

Ang index ng pagiging maaasahan ng approximation ay 0.938 - ang curve ay tumutugma sa data, ang error ay minimal, ang mga pagtataya ay magiging tumpak.

Mag-log Trendline sa Excel

Ginagamit ito para sa mga sumusunod na pagbabago sa indicator: una, isang mabilis na pagtaas o pagbaba, pagkatapos ay kamag-anak na katatagan. Ang na-optimize na curve ay mahusay na umaangkop sa "pag-uugali" na ito ng dami. Ang logarithmic trend ay angkop para sa paghula ng mga benta ng isang bagong produkto na ipinakilala pa lamang sa merkado.

Sa paunang yugto, ang gawain ng tagagawa ay dagdagan ang base ng customer. Kapag ang produkto ay may sariling mamimili, dapat itong panatilihin, ihain.

Bumuo tayo ng graph at magdagdag ng logarithmic trend line para mahulaan ang mga benta ng isang conditional na produkto:


Ang R2 ay malapit sa halaga sa 1 (0.9633), na nagpapahiwatig ng pinakamababang error sa pagtatantya. Magtataya kami ng dami ng benta sa mga susunod na panahon. Upang gawin ito, kailangan mong palitan ang bilang ng panahon sa equation sa halip na x.

Halimbawa:

Panahon14 15 16 17 18 19 20
Pagtataya1005,4 1024,18 1041,74 1058,24 1073,8 1088,51 1102,47

Upang kalkulahin ang mga taya ng hula, ginamit ang sumusunod na formula: =272.14*LN(B18)+287.21. Kung saan ang B18 ay ang period number.

Polynomial Trendline sa Excel

Ang curve na ito ay may pataas at pababang mga variable. Para sa mga polynomial (polynomial), ang antas ay tinutukoy (sa bilang ng maximum at minimum na mga halaga). Halimbawa, ang isang extremum (minimum at maximum) ay ang pangalawang degree, dalawang extremum ang ikatlong degree, tatlo ang ikaapat.

Ang polynomial trend sa Excel ay ginagamit upang pag-aralan ang isang malaking set ng data tungkol sa isang hindi matatag na halaga. Tingnan natin ang halimbawa ng unang hanay ng mga halaga (presyo ng langis).


Upang makakuha ng ganoong halaga ng pagiging maaasahan ng pagtatantya (0.9256), kinailangan kong ilagay ang ika-6 na antas.

Ngunit ang ganitong kalakaran ay nagpapahintulot sa iyo na gumawa ng higit pa o hindi gaanong tumpak na mga pagtataya.

  • 6. Statistical summary at pagpapangkat. Mga uri ng pagpapangkat.
  • 7. Mga ganap na istatistikal na halaga: mga konsepto, mga uri.
  • 8. Mga kaugnay na istatistikal na halaga: mga konsepto, uri.
  • 9. Average na mga halaga: mga konsepto, mga uri. (kapangyarihan, istruktura) Average na mga halaga.
  • Power Average
  • Mga katamtamang istruktura
  • 10. Arithmetic mean at harmonic mean. Ang ibig sabihin ng aritmetika
  • Average na harmonic.
  • 11.Basic properties ng arithmetic mean.
  • 12.Mga tagapagpahiwatig ng pagkakaiba-iba ng isang katangian at mga pamamaraan para sa kanilang pagkalkula.
  • Ganap at karaniwang mga tagapagpahiwatig ng pagkakaiba-iba at mga pamamaraan para sa kanilang pagkalkula.
  • 13.Mga indeks ng ekonomiya: mga konsepto, uri. Mga indibidwal na indeks ng mga presyo, pisikal na dami ng mga benta, turnover. Ang konsepto ng mga indeks
  • Indibidwal na mga indeks
  • Composite Index
  • Price index ng trade turnover Index ng pisikal na dami ng kalakalan Ang problema sa pagpili ng mga timbang
  • Naka-chain at pangunahing mga indeks na may pare-pareho at variable na timbang
  • Mga indeks ng pare-parehong komposisyon, variable na komposisyon at mga pagbabago sa istruktura
  • Mga indeks ng teritoryo
  • 14. Pinagsama-samang mga indeks ng mga presyo, pisikal na dami, turnover, ang kanilang relasyon. pinagsama-samang mga index.
  • 15. Arithmetic mean at mean harmonic index ng pisikal na dami ng produksyon. Average na mga index.
  • 16. Selective observation, mga uri ng produksyon (paulit-ulit, hindi paulit-ulit).
  • 17. Average at marginal sampling error. Pagkalkula ng agwat ng kumpiyansa.
  • 18. Pagkalkula ng kinakailangang laki ng sample, na nagbibigay ng ibinigay na katumpakan ng pagmamasid na may tiyak na posibilidad.
  • 19. Ryady dynamics: mga konsepto, uri (sandali, agwat). Mga tagapagpahiwatig ng hilera
  • 20. Average na mga tagapagpahiwatig ng isang serye ng mga dinamika. Pagtukoy sa average na antas ng isang serye ng dynamics.
  • 21. Mga paraan ng pagpapakinis ng serye ng dynamics.
  • 22. Mga uri ng ugnayan sa pagitan ng phenomena (functional, correlation). Pag-uuri ng mga relasyon sa ugnayan.
  • 23. Pagkalkula ng mga linear na parameter ng trend.
  • 24. Linear correlation coefficient.
  • 25. Pagkalkula ng mga parameter ng linear pair regression.
  • 26. Konsepto at pagbuo ng SNS.
  • 27. System of National Accounts: isang karaniwang hanay ng mga account para sa mga sektor ng ekonomiya.
  • 28. Pangunahing macroeconomic indicator ng SNS.
  • 29. Mga pamamaraan para sa pagkalkula ng gross domestic product.
  • 30.Mga tagapagpahiwatig ng natural na paggalaw ng populasyon at mga paraan ng kanilang pagkalkula.
  • 31.Mga tagapagpahiwatig ng paglipat ng populasyon at mga paraan ng kanilang pagkalkula.
  • 32. Pagkalkula ng inaasahang populasyon.
  • 33. Sistema ng mga tagapagpahiwatig ng pamantayan ng pamumuhay. Human Development Index.
  • 34.Kategorya ng mga taong may kaugnayan sa may trabaho. Pagkalkula ng rate ng trabaho at ang pasanin dito na nagtatrabaho sa ekonomiya.
  • 35.Kategorya ng mga taong may kaugnayan sa mga walang trabaho. Pagkalkula ng rate ng kawalan ng trabaho.
  • 36. Mga istatistika ng bilang ng mga empleyado ng negosyo.
  • 37.Mga pondo ng oras ng pagtatrabaho at mga paraan ng kanilang pagkalkula.
  • 38Mga coefficient para sa paggamit ng mga pondo sa oras ng pagtatrabaho at mga pamamaraan para sa kanilang pagkalkula.
  • 39. Mga istatistika ng pambansang kayamanan: komposisyon ng mga hindi-pinansyal na produktibong asset.
  • 40. Mga istatistika ng pambansang kayamanan: komposisyon ng mga di-pinansyal na hindi produktibong mga ari-arian.
  • 41. Mga istatistika ng pambansang kayamanan: ang komposisyon ng mga pinansiyal na asset.
  • Ang istraktura ng pambansang kayamanan. Mga elemento ng pambansang kayamanan* (sa simula ng taon, hindi kasama ang halaga ng lupa, subsoil at kagubatan)
  • 42. Mga istatistika ng internasyonal na kalakalan.
  • 43. Mga istatistika ng badyet ng estado.
  • 44. Mga istatistika ng mga fixed asset.
  • 45. Mga istatistika ng umiikot na pondo.
  • 46. ​​Mga istatistika ng produktibidad ng paggawa.
  • 47. Mga istatistika ng sahod.
  • 48. Mga istatistika ng halaga ng produksyon.
  • 49. Pagkalkula ng mga indeks na ginamit upang pag-aralan ang dinamika ng mga average na presyo, indeks ng pare-parehong komposisyon, indeks ng mga pagbabago sa istruktura, indeks ng variable na komposisyon.
  • 50. Pinagsama-samang mga indeks ng presyo ng Laspeyres, Paasche, Fisher, Marshall.
  • Paasche, Laspeyres at Fisher's "ideal index"
  • 23. Pagkalkula ng mga linear na parameter ng trend.

    Ang pangunahing trend ng pag-unlad (trend) ay isang maayos at matatag na pagbabago sa antas ng phenomenon sa oras, na libre mula sa mga random na pagbabagu-bago.

    Ang gawain ay upang matukoy ang pangkalahatang kalakaran sa pagbabago sa mga antas ng serye, na napalaya mula sa pagkilos ng iba't ibang mga random na kadahilanan. Para sa layuning ito, ang serye ng oras ay pinoproseso ng mga pamamaraan ng pagpapalaki ng pagitan, average na paglipat at pagkakahanay ng analytical.

    *Isa sa pinakasimpleng paraan para sa pag-aaral ng pangunahing trend sa time series ay ang pagpapalaki ng mga agwat. Ito ay batay sa pagpapalaki ng mga yugto ng panahon, na kinabibilangan ng mga antas ng serye ng mga dinamika (kasabay nito, ang bilang ng mga agwat ay bumababa). Halimbawa, ang pang-araw-araw na serye ng output ay pinapalitan ng buwanang serye ng output, at iba pa. Ang average, na kinakalkula sa mga pinalaki na pagitan, ay ginagawang posible upang matukoy ang direksyon at kalikasan (pagpabilis o pagbagal ng paglago) ng pangunahing trend ng pag-unlad.

    * Ang pagkilala sa pangunahing kalakaran ay maaari ding isagawa gamit ang moving (moving) average na paraan. Ang kakanyahan nito ay nakasalalay sa katotohanan na ang average na antas ay kinakalkula mula sa isang tiyak na numero, kadalasang kakaiba (3, 5, 7, atbp.), ng mga unang antas sa isang hilera, pagkatapos ay mula sa parehong bilang ng mga antas, ngunit nagsisimula mula sa pangalawa sa isang hilera, pagkatapos - simula sa pangatlo, atbp. Kaya, ang average, bilang ito ay, "slide" kasama ang serye ng mga dinamika, gumagalaw para sa isang panahon.

    sa dalawang miyembro sa simula at dulo ng row. Mas mababa ito kaysa sa aktwal na napapailalim sa pagbabagu-bago dahil sa mga random na dahilan, at mas malinaw, sa anyo ng isang makinis na linya sa graph, ito ay nagpapahayag ng pangunahing trend sa paglago ng mga ani sa panahon ng pag-aaral, na nauugnay sa aksyon ng pangmatagalang umiiral na mga sanhi at kondisyon ng pag-unlad.

    Ang kawalan ng pagpapakinis ng isang serye ay ang "pagikli" ng pinakinis na serye kumpara sa aktwal, at, dahil dito, ang pagkawala ng impormasyon.

    Ang isinasaalang-alang na mga pamamaraan ng pagpapakinis ng mga dynamic na serye (mga magaspang na agwat at ang moving average na paraan) ay ginagawang posible upang matukoy lamang ang pangkalahatang kalakaran sa pag-unlad ng kababalaghan, higit pa o mas kaunti napalaya mula sa random at undulating fluctuations. Gayunpaman, imposibleng makakuha ng pangkalahatang istatistikal na modelo ng trend gamit ang mga pamamaraang ito.

    *Upang makapagbigay ng quantitative model na nagpapahayag ng pangunahing trend ng pagbabago sa mga antas ng serye ng oras sa paglipas ng panahon, ginagamit ang analytical alignment ng time series.

    kung saan ang yt ay ang mga antas ng dynamic na serye na kinakalkula ayon sa kaukulang analytical equation sa oras na t.

    Ang teoretikal (kinakalkula) na mga antas ng yt ay tinutukoy batay sa tinatawag na sapat na modelo ng matematika, na pinakamahusay na sumasalamin (tinatayang) ang pangunahing takbo ng serye ng oras. Ang pagpili ng uri ng modelo ay nakasalalay sa layunin ng pag-aaral at dapat ay batay sa isang teoretikal na pagsusuri na nagpapakita ng likas na katangian ng pag-unlad ng kababalaghan, gayundin sa isang graphical na representasyon ng isang serye ng mga dinamika (linear diagram).

    Halimbawa, ang pinakasimpleng mga modelo (mga formula) na nagpapahayag ng trend ng pag-unlad ay:

    linear function - direktang yt = a0 + a1t,

    kung saan ang a0,a1 ay ang mga parameter ng equation; t - oras;

    exponential function yt = A0A1t

    power function - second order curve (parabola)

    Sa mga kaso kung saan kinakailangan ang isang partikular na tumpak na pag-aaral ng trend ng pag-unlad (halimbawa, isang modelo ng trend para sa pagtataya), kapag pumipili ng uri ng isang sapat na function, maaaring gamitin ang mga espesyal na pamantayan ng mga istatistika ng matematika.

    Ang mga parameter ng function ay karaniwang kinakalkula gamit ang least squares method, kung saan ang pinakamababang punto ng kabuuan ng squared deviations sa pagitan ng theoretical at empirical na antas ay kinukuha bilang solusyon:

    kung saan yt - nakahanay (kinakalkula) mga antas; yt - aktwal na mga antas.

    Ang mga parameter ng equation a, - na nagbibigay-kasiyahan sa kondisyong ito ay matatagpuan sa pamamagitan ng paglutas ng sistema ng mga normal na equation. Batay sa nahanap na equation ng trend, ang mga leveled na antas ay kinakalkula. Kaya, ang pagkakahanay ng serye ng oras ay binubuo sa pagpapalit sa aktwal na mga antas y, - na may maayos na pag-iiba-iba ng mga antas Y(, pinakamahusay na tinatantya ang istatistikal na data.

    Ang pagkakahanay sa isang tuwid na linya ay ginagamit, bilang panuntunan, sa mga kaso kung saan ang mga ganap na nadagdag ay halos pare-pareho, ibig sabihin, kapag ang mga antas ay nagbabago sa isang pag-unlad ng aritmetika (o malapit dito).

    Ang alignment sa pamamagitan ng exponential function ay ginagamit sa mga kaso kung saan ang serye ay sumasalamin sa pag-unlad sa isang geometric na pag-unlad, ibig sabihin, kapag ang chain growth factor ay halos pare-pareho.

    Isaalang-alang ang "pamamaraan" para sa pag-align ng serye ng oras sa isang tuwid na linya: yt=a0+a1t

    Ang mga parameter a0, a1 ayon sa paraan ng least squares ay matatagpuan sa pamamagitan ng paglutas ng sumusunod na sistema ng mga normal na equation na nakuha ng algebraic transformation ng kondisyon

    kung saan y - aktwal (empirical) na antas ng serye; t - oras (serial number ng panahon o punto sa oras).

    Magpapakita kami ng isang halimbawa ng isang detalyadong pagkalkula ng mga parameter ng equation ng trend batay sa sumusunod na data (tingnan ang talahanayan) gamit ang isang calculator.

    Ang linear trend equation ay y = sa + b.
    1. Hanapin ang mga parameter ng equation sa pamamagitan ng least squares method.
    Ang sistema ng mga equation ng least squares:
    a 0 n + a 1 ∑t = ∑y
    a 0 ∑t + a 1 ∑t 2 = ∑yt

    t y t2 y2 t y y(t) (y-y cp) 2 (y-y(t)) 2 (t-t p) 2 (y-y(t)): y
    1 17.4 1 302.76 17.4 12.26 895.01 26.47 30.25 0.3
    2 26.9 4 723.61 53.8 18.63 416.84 68.39 20.25 0.31
    3 23 9 529 69 25 591.3 4.02 12.25 0.0872
    4 23.7 16 561.69 94.8 31.38 557.75 58.98 6.25 0.32
    5 27.2 25 739.84 136 37.75 404.68 111.4 2.25 0.39
    6 34.5 36 1190.25 207 44.13 164.27 92.72 0.25 0.28
    7 50.7 49 2570.49 354.9 50.5 11.45 0.0383 0.25 0.0039
    8 61.4 64 3769.96 491.2 56.88 198.34 20.44 2.25 0.0736
    9 69.3 81 4802.49 623.7 63.25 483.27 36.56 6.25 0.0872
    10 94.4 100 8911.36 944 69.63 2216.84 613.62 12.25 0.26
    11 61.1 121 3733.21 672.1 76 189.98 222.11 20.25 0.24
    12 78.2 144 6115.24 938.4 82.38 953.78 17.46 30.25 0.0534
    78 567.8 650 33949.9 4602.3 567.8 7083.5 1272.21 143 2.41

    Para sa aming data, ang sistema ng mga equation ay may anyo:
    12a 0 + 78a 1 = 567.8
    78a 0 + 650a 1 = 4602.3
    Mula sa unang equation ay nagpapahayag kami ng 0 at pinapalitan ang pangalawang equation
    Nakukuha namin ang isang 0 = 6.37, isang 1 = 5.88

    Tandaan: Ang mga halaga ng Column #6 y(t) ay kinakalkula batay sa nagmula na equation ng trend. Halimbawa, t = 1: y(1) = 6.37*1 + 5.88 = 12.26

    equation ng trend

    y = 6.37 t + 5.88

    Suriin natin ang kalidad ng trend equation gamit ang absolute approximation error.


    Dahil ang error ay mas malaki sa 15%, ang equation na ito ay hindi kanais-nais na gamitin bilang isang trend.

    Average na mga halaga:


    Pagpapakalat

    karaniwang lihis

    Koepisyent ng pagkalastiko


    Ang elasticity coefficient ay mas mababa sa 1. Samakatuwid, kung ang X ay magbabago ng 1%, ang Y ay magbabago ng mas mababa sa 1%. Sa madaling salita, ang impluwensya ng X sa Y ay hindi makabuluhan.

    Koepisyent ng determinasyon

    mga. sa 82.04% ng mga kaso nakakaapekto ito sa mga pagbabago sa data. Sa madaling salita, mataas ang katumpakan ng pagpili ng trend equation

    2. Pagsusuri ng katumpakan ng pagtukoy sa mga pagtatantya ng mga parameter ng trend equation.
    Pagkakaiba-iba ng error sa equation.

    kung saan ang m = 1 ay ang bilang ng mga salik na nakakaimpluwensya sa modelo ng trend.

    Ang karaniwang error ng equation.



    3. Pagsubok ng mga hypotheses tungkol sa mga coefficient ng linear trend equation.
    1) t-istatistika. Pamantayan ng mag-aaral.
    Ayon sa talahanayan ng Mag-aaral, nakita namin ang Ttable
    T talahanayan (n-m-1; α / 2) \u003d (10; 0.025) \u003d 2.228

    >
    Ang istatistikal na kahalagahan ng koepisyent a 0 ay nakumpirma. Ang pagtatantya ng parameter na a 0 ay makabuluhan at ang serye ng oras ay may trend.


    Ang istatistikal na kahalagahan ng koepisyent a 1 ay hindi nakumpirma.

    Confidence interval para sa trend equation coefficients.
    Tukuyin natin ang mga pagitan ng kumpiyansa ng mga koepisyent ng trend, na, na may 95% na pagiging maaasahan, ay magiging ang mga sumusunod:
    (a 1 - t obs S a 1 ;a 1 + t obs S a 1)
    (6.375 - 2.228*0.943; 6.375 + 2.228*0.943)
    (4.27;8.48)
    (a 0 - t obs S a 0 ;a 0 + t obs S a 0)
    (5.88 - 2.228*6.942; 5.88 + 2.228*6.942)
    (-9.59;21.35)
    Dahil ang puntong 0 (zero) ay nasa loob ng agwat ng kumpiyansa, ang pagtatantya ng agwat ng koepisyent a 0 ay hindi gaanong mahalaga sa istatistika.
    2) F-statistics. Ang pamantayan ni Fisher.


    fkp = 4.84
    Dahil ang F > Fkp, ang koepisyent ng determinasyon ay makabuluhan ayon sa istatistika

    Suriin ang Autocorrelation of Residuals.
    Ang isang mahalagang kinakailangan para sa pagbuo ng isang qualitative regression model gamit ang LSM ay ang kalayaan ng mga halaga ng random deviations mula sa mga halaga ng deviations sa lahat ng iba pang mga obserbasyon. Tinitiyak nito na walang ugnayan sa pagitan ng anumang mga paglihis at, sa partikular, sa pagitan ng mga katabing paglihis.
    Autocorrelation (serial correlation) tinukoy bilang ang ugnayan sa pagitan ng naobserbahang mga hakbang na inayos sa oras (time series) o espasyo (cross series). Ang autocorrelation ng mga nalalabi (outlier) ay karaniwang nakikita sa pagsusuri ng regression kapag gumagamit ng data ng time series at napakabihirang kapag gumagamit ng cross-sectional na data.
    Sa mga gawaing pang-ekonomiya, ito ay mas karaniwan positibong autocorrelation kaysa sa negatibong autocorrelation. Sa karamihan ng mga kaso, ang positibong autocorrelation ay sanhi ng isang direksyon na patuloy na impluwensya ng ilang mga kadahilanan na hindi isinasaalang-alang sa modelo.
    Negatibong autocorrelation aktwal na nangangahulugan na ang isang positibong paglihis ay sinusundan ng isang negatibo at vice versa. Ang ganitong sitwasyon ay maaaring maganap kung ang parehong ugnayan sa pagitan ng demand para sa mga soft drink at kita ay isasaalang-alang ayon sa pana-panahong data (winter-summer).
    Among pangunahing sanhi na nagdudulot ng autocorrelation, ang mga sumusunod ay maaaring makilala:
    1. Mga error sa pagtutukoy. Ang pagkabigong isaalang-alang ang anumang mahalagang paliwanag na variable sa modelo o ang maling pagpili ng anyo ng pag-asa ay kadalasang humahantong sa mga sistematikong paglihis ng mga punto ng pagmamasid mula sa linya ng regression, na maaaring humantong sa autocorrelation.
    2. Inertia. Maraming mga pang-ekonomiyang tagapagpahiwatig (inflation, kawalan ng trabaho, GNP, atbp.) ay may isang tiyak na cyclicality na nauugnay sa undulation ng aktibidad ng negosyo. Samakatuwid, ang pagbabago sa mga tagapagpahiwatig ay hindi nangyayari kaagad, ngunit may isang tiyak na pagkawalang-galaw.
    3. Epekto sa web. Sa maraming pang-industriya at iba pang mga lugar, ang mga tagapagpahiwatig ng ekonomiya ay tumutugon sa mga pagbabago sa mga kondisyon ng ekonomiya na may pagkaantala (time lag).
    4. Pag-smoothing ng data. Kadalasan, ang data para sa isang tiyak na mahabang panahon ay nakukuha sa pamamagitan ng pag-average ng data sa mga agwat ng bumubuo nito. Ito ay maaaring humantong sa isang tiyak na pagpapakinis ng mga pagbabago na umiral sa loob ng panahong isinasaalang-alang, na maaaring magdulot ng autocorrelation.
    Ang mga epekto ng autocorrelation ay katulad sa mga iyon heteroscedasticity: ang mga konklusyon sa t- at F-statistics na tumutukoy sa kahalagahan ng regression coefficient at ang coefficient ng determination ay maaaring hindi tama.

    Autocorrelation detection
    1. Paraang graphic
    Mayroong ilang mga opsyon para sa graphical na kahulugan ng autocorrelation. Ang isa sa kanila ay nag-uugnay ng mga paglihis e i sa mga sandali ng kanilang pagtanggap i. Kasabay nito, ang alinman sa oras ng pagkuha ng istatistikal na data o ang serial number ng obserbasyon ay naka-plot kasama ang abscissa axis, at ang mga deviations e i (o mga pagtatantya ng deviations) ay naka-plot kasama ang ordinate axis.
    Ito ay natural na ipagpalagay na kung mayroong isang tiyak na kaugnayan sa pagitan ng mga paglihis, pagkatapos ay magaganap ang autocorrelation. Ang kawalan ng pag-asa ay malamang na magpahiwatig ng kawalan ng autocorrelation.
    Nagiging mas malinaw ang autocorrelation kung mag-plot ka ng e i versus e i-1
    Pagsusulit sa Durbin-Watson.
    Ang pamantayang ito ay ang pinakamahusay na kilala para sa pag-detect ng autocorrelation.
    Sa panahon ng istatistikal na pagsusuri ng mga equation ng regression, sa unang yugto, ang isa ay madalas na sinusuri ang pagiging posible ng isang premise: ang mga kondisyon para sa istatistikal na kalayaan ng mga paglihis mula sa bawat isa. Sa kasong ito, sinusuri ang hindi pagkakaugnay ng mga kalapit na halaga e i.

    y y(x) e i = y-y(x) e 2 (e i - e i-1) 2
    17.4 12.26 5.14 26.47 0
    26.9 18.63 8.27 68.39 9.77
    23 25 -2 4.02 105.57
    23.7 31.38 -7.68 58.98 32.2
    27.2 37.75 -10.55 111.4 8.26
    34.5 44.13 -9.63 92.72 0.86
    50.7 50.5 0.2 0.0384 96.53
    61.4 56.88 4.52 20.44 18.71
    69.3 63.25 6.05 36.56 2.33
    94.4 69.63 24.77 613.62 350.63
    61.1 76 -14.9 222.11 1574.09
    78.2 82.38 -4.18 17.46 115.03
    1272.21 2313.98

    Upang pag-aralan ang ugnayan ng mga paglihis, gamitin Mga istatistika ng Durbin-Watson:


    Ang mga kritikal na halaga d 1 at d 2 ay tinutukoy batay sa mga espesyal na talahanayan para sa kinakailangang antas ng kahalagahan α, ang bilang ng mga obserbasyon n = 12 at ang bilang ng mga paliwanag na variable m=1.
    Walang autocorrelation kung totoo ang sumusunod na kundisyon:
    d1< DW и d 2 < DW < 4 - d 2 .
    Nang walang pagtukoy sa mga talahanayan, maaari nating gamitin ang tinatayang panuntunan at ipagpalagay na walang autocorrelation ng mga nalalabi kung 1.5< DW < 2.5. Поскольку 1.5 < 1.82 < 2.5, то автокорреляция остатков ay wala.
    Para sa isang mas maaasahang konklusyon, ipinapayong sumangguni sa mga halaga ng tabular.
    Ayon sa talahanayan ng Durbin-Watson para sa n=12 at k=1 (antas ng kahalagahan 5%) makikita natin ang: d 1 = 1.08; d2 = 1.36.
    Mula noong 1.08< 1.82 и 1.36 < 1.82 < 4 - 1.36, то автокорреляция остатков ay wala.

    Sinusuri ang heteroscedasticity.
    1) Sa pamamagitan ng paraan ng graphical na pagsusuri ng mga nalalabi.
    Sa kasong ito, ang mga halaga ng paliwanag na variable X ay naka-plot sa kahabaan ng abscissa, at alinman sa mga deviations e i o ang kanilang mga parisukat e 2 i ay naka-plot kasama ang ordinate.
    Kung mayroong isang tiyak na relasyon sa pagitan ng mga paglihis, pagkatapos ay magaganap ang heteroscedasticity. Ang kawalan ng pag-asa ay malamang na magpahiwatig ng kawalan ng heteroscedasticity.
    2) Gamit ang pagsusulit sa ugnayan ng ranggo ng Spearman.
    Koepisyent ng ugnayan ng ranggo ng Spearman.
    Magtalaga ng mga ranggo sa tampok na Y at sa kadahilanan X. Hanapin ang kabuuan ng pagkakaiba ng mga parisukat d 2 .
    Gamit ang formula, kinakalkula namin ang koepisyent ng ugnayan ng ranggo ng Spearman.

    t talahanayan (n-m-1; α / 2) \u003d (10; 0.05 / 2) \u003d 2.228
    Since Tobl< tтабл, то принимаем гипотезу о равенстве 0 коэффициента ранговой корреляции. Другими словами, коэффициент ранговой корреляции статистически - не значим.
    Suriin natin ang hypothesis H 0: walang heteroscedasticity.
    Dahil 2.228 > 0.45, tinatanggap ang hypothesis ng kawalan ng heteroscedasticity.
    t e i ranggo X, dx ranggo e i , d y (dx - dy) 2
    1 -5.14 1 4 9
    2 -8.27 2 2 0
    3 2 3 7 16
    4 7.68 4 9 25
    5 10.55 5 11 36
    6 9.63 6 10 16
    7 -0.2 7 6 1
    8 -4.52 8 5 9