Abstract: Spurs sa econometrics. Multiple regression model specification Detalye ng modelo regression equation selection

Depende sa bilang ng mga salik na kasama sa equation ng regression, nakikilala ang paired at multiple regressions.

Equation ng relasyon sa pagitan ng dalawang variable at x tinawag pairwise regression , at ang pagtitiwala y mula sa ilang mga paliwanag na variable = ( x 1 ,x 2 ,... x n)– maramihang pagbabalik .

Ang pairwise regression equation ay:

saan - malayang variable na nakakaapekto sa; - mga koepisyent ng modelo.

Tulad ng nabanggit na, sa unang yugto ng econometric na pananaliksik, ang pagpili ng anyo ng relasyon sa pagitan ng mga variable ay ginawa, i.e. ang espesipikasyon ng regression equation ay isinasagawa. Para sa layuning ito, ang kanilang hanay ng mga kadahilanan na nakakaimpluwensya sa nagresultang variable sa, ang pinaka makabuluhang nakakaimpluwensyang mga salik ay naka-highlight. Ang pairwise regression ay itinuturing na sapat kung posible na ihiwalay ang nangingibabaw na salik, na ginagamit bilang isang paliwanag (independiyente) na variable. Ang laki ng mga random na error ay nakasalalay sa tamang pagpili ng detalye ng modelo: mas malapit ang aktwal na data, mas maliit ang mga ito. sa sa mga halagang kinakalkula gamit ang itinayong equation.

Kasama sa mga error sa detalye ng modelo hindi lamang ang maling pagpili ng isang partikular na function ng matematika f relasyon sa pagitan ng mga variable sa at , ngunit ang pagmamaliit ng anumang makabuluhang salik sa equation ng regression, i.e. gamit ang pairwise regression sa halip na multiple regression.

Sa pairwise regression, ang pagpili ng mathematical function ay maaaring gawin sa graphically, analytically at experimentally.

Kadalasan, para piliin ang uri ng ipinares na equation ng regression, ginagamit ito graphic na pamamaraan , batay sa pagbuo ng isang larangan ng ugnayan. Ang mga pangunahing uri ng mga kurba na ginagamit sa pagtatasa ng mga ugnayan sa pagitan ng mga variable ay ipinakita sa Figure 1:




a) b) V)

Paraan ng analitikal Ang pagpili ng uri ng regression equation ay binubuo ng pag-aaral sa materyal na katangian ng ugnayan sa pagitan ng mga salik na pinag-aaralan at isinasaalang-alang ang mga antas ng kanilang impluwensya sa isa't isa sa regression equation.

Gamit eksperimental na paraan Ang mga equation ng iba't ibang uri ay itinayo, at pagkatapos ay ang pinakamahusay na isa ay pinili mula sa kanila sa mga tuntunin ng magnitude ng pagkakaiba-iba ng error:

.

Kung mas maliit ang pagkakaiba-iba ng error, mas mahusay ang itinayong equation ng regression na umaangkop sa orihinal na data.

Ang pagbuo ng isang multiple regression equation ay nagsisimula sa pagpapasya sa detalye ng modelo. Kabilang dito ang dalawang hanay ng mga isyu: pagpili ng mga salik at pagpili ng uri ng regression equation.

Ang pagsasama ng isang partikular na hanay ng mga salik sa isang multiple regression equation ay pangunahing nauugnay sa pag-unawa ng mananaliksik sa likas na katangian ng relasyon sa pagitan ng modelong tagapagpahiwatig at iba pang pang-ekonomiyang phenomena. Ang mga salik na kasama sa maraming regression ay dapat matugunan ang mga sumusunod na kinakailangan.

    Sila ay dapat na quantifiable. Kung kinakailangang magsama ng qualitative factor sa modelo na walang quantitative measurement, dapat itong bigyan ng quantitative certainty.

    Ang mga salik ay hindi dapat magkakaugnay, lalo na sa isang eksaktong functional na relasyon.

Ang pagpili ng mga kadahilanan ay ginawa batay sa qualitative theoretical at economic analysis. Gayunpaman, ang teoretikal na pagsusuri ay madalas na hindi nagpapahintulot sa amin na hindi malabo na sagutin ang tanong tungkol sa dami ng relasyon ng mga katangian na isinasaalang-alang at ang pagpapayo ng pagsasama ng kadahilanan sa modelo. Samakatuwid, ang pagpili ng mga kadahilanan ay karaniwang isinasagawa sa dalawang yugto: sa una, ang mga kadahilanan ay pinili batay sa kakanyahan ng problema; sa pangalawa, ang mga istatistika para sa mga parameter ng regression ay tinutukoy batay sa matrix ng mga tagapagpahiwatig ng ugnayan.

Ang mga intercorrelation coefficient (i.e., mga ugnayan sa pagitan ng mga paliwanag na variable) ay nagpapahintulot sa mga redundant na salik na maibukod mula sa modelo. Ito ay pinaniniwalaan na ang dalawang variable ay tahasang collinear, ibig sabihin. ay nasa isang linear na relasyon sa isa't isa kung. Kung ang mga kadahilanan ay malinaw na collinear, pagkatapos ay duplicate nila ang bawat isa at inirerekomenda na ibukod ang isa sa mga ito mula sa regression. Sa kasong ito, ang kagustuhan ay ibinibigay hindi sa kadahilanan na mas malapit na nauugnay sa resulta, ngunit sa kadahilanan na, sa kabila ng isang sapat na malapit na koneksyon sa resulta, ay may hindi bababa sa malapit na koneksyon sa iba pang mga kadahilanan. Ang pangangailangang ito ay nagpapakita ng pagtitiyak ng maramihang pagbabalik bilang isang paraan para sa pag-aaral ng masalimuot na epekto ng mga salik sa mga kondisyon ng kanilang kalayaan sa isa't isa.

Ang magnitude ng pairwise correlation coefficients ay nagpapakita lamang ng malinaw na collinearity ng mga salik. Ang pinakamalaking kahirapan sa paggamit ng maramihang regression apparatus ay lumitaw sa pagkakaroon ng multicollinearity ng mga kadahilanan, kapag higit sa dalawang mga kadahilanan ay nauugnay sa bawat isa sa pamamagitan ng isang linear na relasyon, i.e. mayroong pinagsama-samang impluwensya ng mga salik sa bawat isa.

Upang masuri ang multicollinearity ng mga kadahilanan, ang determinant ng matrix ng mga ipinares na coefficient ng ugnayan sa pagitan ng mga kadahilanan ay maaaring gamitin.

Ang mas malapit sa zero ang determinant ng interfactor correlation matrix ay, mas malakas ang multicollinearity ng mga salik at mas hindi mapagkakatiwalaan ang mga resulta ng multiple regression. At, sa kabaligtaran, mas malapit ang determinant ng interfactor correlation matrix sa isa, mas mababa ang multicollinearity ng mga salik.

Mayroong ilang mga diskarte upang malampasan ang malakas na ugnayan ng interfactor. Ang pinakasimpleng paraan upang maalis ang multicollinearity ay ang pagbubukod ng isa o higit pang mga kadahilanan mula sa modelo. Ang isa pang diskarte ay nagsasangkot ng pagbabago ng mga kadahilanan, na binabawasan ang ugnayan sa pagitan nila.

Kapag pumipili ng mga salik, inirerekomenda rin na gamitin ang sumusunod na panuntunan: ang bilang ng mga salik na kasama ay karaniwang 6-7 beses na mas mababa kaysa sa dami ng populasyon kung saan itinayo ang regression. Kung ang relasyon na ito ay nilabag, kung gayon ang bilang ng mga antas ng kalayaan ng natitirang pagpapakalat ay napakaliit. Ito ay humahantong sa katotohanan na ang mga parameter ng equation ng regression ay lumalabas na hindi gaanong mahalaga sa istatistika, at ang -criterion ay mas mababa sa halaga ng talahanayan.

Ang batayan ng econometrics ay ang pagbuo ng isang econometric na modelo at ang pagpapasiya ng mga posibilidad ng paggamit ng modelong ito upang ilarawan ang pagsusuri at pagtataya ng mga tunay na proseso ng ekonomiya. Ang mga layunin ng proyekto ng kurso ay pagbuo ng mga solusyon sa disenyo para sa impormasyon at metodolohikal na suporta para sa pananaliksik sa larangan ng econometric modeling, pati na rin ang pagkuha ng mga praktikal na kasanayan sa pagbuo at pagsasaliksik ng mga econometric na modelo. Ang sukdulang inilapat na layunin ng econometric modeling ng mga tunay na proseso ng socio-economic sa isang naibigay na...


Ibahagi ang iyong trabaho sa mga social network

Kung ang gawaing ito ay hindi angkop sa iyo, sa ibaba ng pahina ay may isang listahan ng mga katulad na gawa. Maaari mo ring gamitin ang pindutan ng paghahanap


MINISTERYO NG EDUKASYON AT AGHAM NG RUSSIA

Institusyon ng Pang-edukasyon na Pambadyet ng Pederal na Estado

mas mataas na propesyonal na edukasyon

"Tver State Technical University"

(TvSTU)

Institute ng Karagdagang Propesyonal na Edukasyon

Kagawaran ng Accounting, Pagsusuri at Pag-audit

Proyekto ng kurso

Disiplina: Econometrics

Sa paksa: "Paghahambing na pagsusuri ng mga modelo ng econometric regression"

KUMPLETO: 3rd year student

Institute ng Karagdagang Edukasyon at Pagsasanay

Mga Pangkat RBAiA-37-12

Zamyatin

Kristina Dmitrievna

(Buong pangalan ng mag-aaral)

NA-CHECK:

Konovalova A. S.

(buong pangalan ng guro)

Rzhev 2015

PANIMULA

KABANATA 1. ANALYTICAL BAHAGI

Mga batayan ng econometric na pananaliksik ng mga modelo ng regression.

Teknolohiya ng econometric na pananaliksik ng mga modelo ng regression.

KABANATA 2. BAHAGI NG DISENYO

2.1 Impormasyon at metodolohikal na suporta

pananaliksik sa ekonomiya

Ipinares at maramihang pagbabalik.

KONGKLUSYON

Listahan ng MGA GINAMIT NA PINAGMULAN

PANIMULA

Ang Econometrics ay isang agham na ang paksa ng pag-aaral ay quantitative patterns at interdependencies sa ekonomiya batay sa mga pamamaraan ng mathematical statistics. Ang batayan ng econometrics ay ang pagbuo ng isang econometric na modelo at ang pagpapasiya ng mga posibilidad ng paggamit ng modelong ito upang ilarawan, pag-aralan at hulaan ang mga tunay na proseso ng ekonomiya.

Sa pamamagitan ng paglikha ng kakayahang gumawa ng matalinong mga desisyon sa ekonomiya, ang pagsusuri sa ekonomiya ay ang batayan ng pagsusuri at pagtataya ng ekonomiya.

Sa anumang larangan ng ekonomiya, ang aktibidad ng isang espesyalista ay nangangailangan ng paggamit ng mga modernong pamamaraan ng pagtatrabaho batay sa mga modelo, konsepto at pamamaraan ng ekonometric.

Ang bilang ng mga taong dumarating sa mga bansa ng EU para sa permanenteng paninirahan ay pinili bilang paksa ng econometric na pananaliksik sa proyekto ng kurso. Ang mga proseso ng paglilipat ay isang napakahalagang kadahilanan para sa pagtatasa ng mga prospect para sa pag-unlad ng lipunan, samakatuwid ang kaugnayan ng paksa ng pananaliksik ay tumutukoy sa lumalaking panlipunang kahalagahan ng mga prosesong ito sa modernong mundo.

Ang pananaliksik sa ekonomiya ng mga proseso ng migrasyon ay isang mahalagang salik sa pagtaas ng kahusayan ng pag-unlad ng mga bansa. Ang kasaysayan ng pag-unlad ng tao ay hindi mapaghihiwalay na nauugnay sa mga pagbabago sa dinamika ng populasyon. Sa Europa, ang mabilis na paglaki ng populasyon ay pangunahing dahil sa mga pagbabago sa sosyo-ekonomiko, i.e. sumusunod sa paglago ng ekonomiya at pagbabago sa lipunan.

Ang mga layunin ng proyekto ng kurso ay pagbuo ng mga solusyon sa disenyo para sa impormasyon at metodolohikal na suporta para sa pananaliksik sa larangan ng econometric modeling, pati na rin ang pagkuha ng mga praktikal na kasanayan sa pagbuo at pagsasaliksik ng mga econometric na modelo.

Ang layunin ng proyekto ng kurso ay gamitin sa pagsasanay ang kaalaman at kasanayan sa pagbuo at pagsasaliksik ng mga modelong ekonomiko para sa pagsasagawa ng pagsusuri ng data ng ekonometric.

Ang pinakahuling inilapat na layunin ng econometric na pagmomodelo ng mga tunay na proseso ng socio-economic sa proyektong ito ng kurso ay ang pagtataya ng mga pang-ekonomiya at sosyo-ekonomikong tagapagpahiwatig na nagpapakilala sa estado at pag-unlad ng nasuri na sistema, iyon ay, ang pagpapasiya ng mga uso sa mga proseso ng paglilipat sa EU mga bansa at ang kanilang pag-asa sa mga umiiral na salik na isinasaalang-alang kapag gumagawa ng mga modelong pang-ekonomiya.

KABANATA 1. ANALYTICAL BAHAGI

1.1. Mga batayan ng econometric na pananaliksik ng mga modelo ng regression.

Ang disiplinang pang-ekonomiya na may kinalaman sa pag-unlad at aplikasyon ng mga istatistikal na pamamaraan upang masukat ang mga ugnayan sa pagitan ng mga ekonometric na variable ay econometrics, na isang kumbinasyon ng teoryang pang-ekonomiya, istatistika, at matematika.

Ang data ng ekonomiko ay hindi mga resulta ng isang kinokontrol na eksperimento. Ang Econometrics ay tumatalakay sa partikular na pang-ekonomiyang data at nababahala sa dami ng paglalarawan ng mga partikular na relasyon, iyon ay, pinapalitan nito ang mga coefficient na ipinakita sa isang pangkalahatang anyo ng mga tiyak na halaga ng numero. Sa econometrics, ang mga espesyal na pamamaraan ng pagsusuri ay binuo upang mabawasan ang epekto ng mga error sa pagsukat sa mga resultang nakuha.

Ang pangunahing tool ng econometrics ay isang econometric na modelo, iyon ay, isang pormal na paglalarawan ng dami ng mga ugnayan sa pagitan ng mga variable. Ang pamamaraan ng pagmomolde ay naglalaman ng magagandang pagkakataon para sa pagpapaunlad ng sarili, dahil ang pagmomodelo ay isang cyclical na proseso, ang bawat cycle ay maaaring sundan ng susunod, at ang kaalaman tungkol sa bagay na pinag-aaralan ay pinalawak at pino, ang orihinal na modelo ay unti-unting napabuti. Ang mga kakulangan na natuklasan pagkatapos ng nakaraang ikot ng pagmomolde, dahil sa mahinang kaalaman sa bagay at mga pagkakamali sa pagbuo ng modelo, ay maaaring itama sa mga susunod na siklo.

Tatlong klase ng mga modelong ekonomiko ay maaaring makilala:

Temporal na modelo ng data;

Single equation regression model;

Sistema ng sabay-sabay na mga equation.

Pag-uuri ng mga problemang nalutas gamit ang isang econometric na modelo: 1) ayon sa panghuling inilapat na mga layunin:

Pagtataya ng mga econometric at socio-economic indicator na nagpapakilala sa estado at pag-unlad ng nasuri na sistema;

Paggaya ng mga posibleng senaryo para sa sosyo-ekonomikong pag-unlad ng sistema.

2) ayon sa antas ng hierarchy:

Mga gawain sa antas ng macro (bansa sa kabuuan);

Mga gawain sa antas ng Meso (rehiyon, industriya, korporasyon);

Micro level (pamilya, enterprise, firm).

3) ayon sa profile ng econometric system, na naglalayong pag-aralan:

Merkado;

Pamumuhunan, patakarang pinansyal o panlipunan;

Pagpepresyo;

Mga relasyon sa pamamahagi;

Demand at pagkonsumo;

Isang hanay ng mga problema.

Pangunahing yugto ng pagmomolde ng ekonometric:

Stage 1 - pagtatanghal ng dula. Pagpapasiya ng mga pangwakas na layunin ng modelo, ang hanay ng mga kadahilanan at tagapagpahiwatig na kasangkot dito, at ang kanilang papel. Ang mga pangunahing layunin ng pananaliksik: pagsusuri ng estado at pag-uugali ng isang bagay na pang-ekonomiya, pagtataya ng mga tagapagpahiwatig ng ekonomiya nito, imitasyon ng pag-unlad ng bagay, pagbuo ng mga desisyon sa pamamahala.

Stage 2 - isang priori. Pagsusuri ng kakanyahan ng bagay na pinag-aaralan, pagbuo at pormalisasyon ng impormasyon na kilala bago ang simula ng pagmomolde.

Stage 3 - parameterization. Ang pagpili ng pangkalahatang anyo ng modelo, ang komposisyon at anyo ng mga koneksyon na kasama dito. Ang pangunahing gawain ng yugtong ito ay piliin ang function na f(X).

Stage 4 - impormasyon. Koleksyon ng kinakailangang istatistikal na impormasyon.

Stage 5 - pagkakakilanlan ng modelo. Pagsusuri ng istatistika ng modelo at pagtatantya ng mga parameter nito. Ang bulk ng econometric na pananaliksik.

Stage 6 - pag-verify ng modelo. Sinusuri ang kasapatan ng modelo, tinatasa ang katumpakan ng data ng modelo. Lumalabas kung gaano matagumpay na nalutas ang mga problema ng pagtutukoy at pagkakakilanlan, at kung ano ang katumpakan ng mga kalkulasyon gamit ang modelong ito. Sinusuri kung gaano kahusay ang itinayong modelo ay tumutugma sa kunwa ng tunay na bagay o proseso ng ekonomiya.

Kapag nagmomodelo ng mga prosesong pang-ekonomiya sa mga modelong ekonomiko, ginagamit ang sumusunod:

1. Spatial data - isang set ng impormasyon sa iba't ibang bagay na kinuha sa parehong yugto ng panahon.

2. Pansamantalang data - isang set ng impormasyon na nagpapakilala sa parehong bagay, ngunit para sa iba't ibang yugto ng panahon.

Ang isang hanay ng impormasyon ay kumakatawan sa isang hanay ng mga tampok na nagpapakilala sa bagay ng pag-aaral. Ang mga palatandaan ay maaaring kumilos sa isa sa dalawang tungkulin: ang papel ng isang epektibong tanda at ang papel ng isang factor sign.

Ang mga variable ay nahahati sa:

Exogenous, ang mga halaga nito ay itinakda mula sa labas;

Endogenous, ang mga halaga nito ay tinutukoy sa loob ng modelo;

Lagged - endogenous o exogenous na mga variable ng econometric model, na napetsahan sa nakaraang mga punto sa oras at matatagpuan sa equation na may kasalukuyang mga variable;

Predetermined - mga exogenous na variable na nakatali sa nakaraan, kasalukuyan at hinaharap na mga punto sa oras at mga lagged na endogenous na variable na alam na sa isang partikular na punto ng oras.

Pangunahing tinitingnan ng Econometrics ang mga error sa detalye ng modelo sa pamamagitan ng pag-aakala na ang mga error sa pagsukat ay pinananatiling minimum.

Pagtutukoy ng modelo - pagpili ng uri ng functional dependence (regression equation). Ang laki ng mga random na error ay hindi magiging pareho sa mga detalye ng modelo, at ang pagliit sa natitirang termino ay nagbibigay-daan sa pinakamahusay na detalye na mapili.

Bilang karagdagan sa pagpili ng detalye ng modelo, ang tamang paglalarawan ng istraktura ng modelo ay mahalaga din. Ang halaga ng nagreresultang katangian ay maaaring hindi nakadepende sa aktwal na halaga ng nagpapaliwanag na variable, ngunit sa halaga na inaasahan sa nakaraang panahon.

Ang pinakasimpleng modelo ng regression na may dalawang variable lamang ay bahagi ng klase ng mga modelo ng single-equation regression, kung saan ang isang ipinaliwanag na variable ay kinakatawan bilang isang function ng ilang independiyenteng (nagpapaliwanag) na mga variable at parameter. Kasama sa klase na ito ang maraming modelo ng regression.

Mas simple ang mga modelo ng time series na nagpapaliwanag sa gawi ng isang time series batay lamang sa mga dating value nito, ito ang mga modelo:

Uso,

seasonality,

Aangkop na hula,

Moving average, atbp.

Ang mas pangkalahatan ay mga sistema ng sabay-sabay na mga equation kung saan, bilang karagdagan sa mga paliwanag na variable, ang kanang bahagi ay maaari ring maglaman ng mga ipinaliwanag na variable mula sa iba pang mga equation, i.e. iba sa ipinaliwanag na variable sa kaliwang bahagi ng equation na ito.

Kapag gumagamit ng hiwalay na mga equation ng regression, ipinapalagay na ang mga kadahilanan ay maaaring mabago nang nakapag-iisa sa isa't isa, bagaman sa katotohanan ang kanilang mga pagbabago ay hindi independyente, at ang isang pagbabago sa isang variable ay kadalasang nangangailangan ng mga pagbabago sa buong sistema ng mga katangian, dahil sila ay magkakaugnay. Ito ay kinakailangan upang mailarawan ang istraktura ng mga relasyon sa pagitan ng mga variable gamit ang isang sistema ng sabay-sabay (structural) equation.

Ang mga modelo ng istatistika at matematika ng mga pang-ekonomiyang phenomena at proseso ay tinutukoy ng mga detalye ng isang partikular na lugar ng pananaliksik sa ekonomiya. Ang teorya at praktika ng mga pagtatasa ng dalubhasa ay isang mahalagang seksyon ng ekonometrika, dahil ang mga pagtatasa ng eksperto ay ginagamit upang malutas ang ilang mga problema sa ekonomiya.

Higit na kilala sa teoretikal at pang-edukasyon na mga publikasyon ang iba't ibang mga modelong ekonomiko na idinisenyo upang mahulaan ang mga macroeconomic indicator. Ito ay karaniwang mga modelo na naglalayong hulaan ang isang multivariate na serye ng oras. Kinakatawan nila ang isang sistema ng mga linear na dependency sa pagitan ng nakaraan at kasalukuyang mga halaga ng mga variable. Sa ganitong mga gawain, ang parehong istraktura ng modelo ay tinasa, i.e. ang uri ng pag-asa sa pagitan ng mga halaga ng kilalang mga coordinate ng vector sa mga nakaraang panahon at ang kanilang mga halaga sa hinulaang sandali, pati na rin ang mga coefficient na kasama sa pag-asa na ito. Ang istraktura ng naturang modelo ay isang bagay na hindi pang-numero. Ang bawat lugar ng pananaliksik sa ekonomiya ay may sariling mga modelong pang-ekonomiya.

1.2. Teknolohiya ng econometric na pananaliksik ng mga modelo ng regression.

Ang pananaliksik at quantitative na pagtatasa ng obhetibong umiiral na mga ugnayan at dependencies sa pagitan ng mga pang-ekonomiyang phenomena ay ang pangunahing gawain ng econometrics.

Ang ugnayang sanhi-at-bunga ay isang relasyon sa pagitan ng mga phenomena kung saan ang pagbabago sa isa sa mga ito, na tinatawag na sanhi, ay humahantong sa pagbabago sa isa, na tinatawag na epekto. Samakatuwid, ang sanhi ay palaging nauuna sa epekto.

Ang mga ugnayang sanhi-at-epekto sa pagitan ng mga phenomena ay ang pinakamalaking interes sa mananaliksik, na ginagawang posible upang matukoy ang mga salik na may malaking impluwensya sa pagkakaiba-iba ng mga phenomena at mga prosesong pinag-aaralan.

Ang mga ugnayang sanhi-at-epekto sa sosyo-ekonomikong phenomena ay may mga sumusunod na katangian:

1. sanhi X at epekto Y ay hindi direktang nakikipag-ugnayan, ngunit sa pamamagitan ng mga intermediate na salik, na inalis sa pagsusuri.

2. nabubuo at nabuo ang mga socio-economic phenomena bilang resulta ng sabay-sabay na impluwensya ng malaking bilang ng mga salik. Ang isa sa mga pangunahing problema sa pag-aaral ng mga phenomena na ito ay ang gawain ng pagkilala sa mga pangunahing sanhi at pag-abstract mula sa mga pangalawang.

Ayon sa direksyon ng pagbabago, ang mga koneksyon ay nahahati sa:

1. direkta (mga pagbabago sa resulta at mga katangian ng salik ay nangyayari sa parehong direksyon),

2. baligtad (ang mga pagbabago sa resulta at mga katangian ng salik ay nangyayari sa magkasalungat na direksyon).

Batay sa likas na katangian ng pagpapakita, sila ay nakikilala:

1. functional connection - isang koneksyon kung saan ang isang tiyak na halaga ng isang factor na katangian ay tumutugma sa isa at isa lamang na halaga ng resultang katangian, na nagpapakita ng sarili sa lahat ng mga kaso ng pagmamasid at para sa bawat partikular na yunit ng populasyon na pinag-aaralan, at pinag-aaralan higit sa lahat sa mga natural na agham.

2. stochastic dependence - isang sanhi ng pag-asa na hindi nagpapakita ng sarili sa bawat indibidwal na kaso, ngunit sa pangkalahatan, na may isang malaking bilang ng mga obserbasyon, at ang parehong mga halaga ng mga katangian ng kadahilanan, bilang isang panuntunan, ay tumutugma sa iba't ibang mga halaga ng ang nagresultang katangian, ngunit, isinasaalang-alang ang buong hanay ng mga obserbasyon, posibleng tandaan ang pagkakaroon ng isang tiyak na relasyon sa pagitan ng mga halaga ng mga katangian. Ang isang espesyal na kaso ng isang stochastic na relasyon ay isang relasyon sa ugnayan, kung saan ang isang pagbabago sa average na halaga ng isang epektibong katangian ay dahil sa isang pagbabago sa mga katangian ng kadahilanan.

Ayon sa analytical expression, ang mga koneksyon ay nakikilala:

1. linear: ang pagbabago sa nagresultang katangian ay direktang proporsyonal sa pagbabago sa mga katangian ng salik.

2. nonlinear.

Sa analitiko, ang isang linear na stochastic na relasyon sa pagitan ng mga phenomena ay maaaring katawanin ng isang equation ng isang tuwid na linya sa isang eroplano, o isang equation ng isang hyperplane sa n-dimensional na espasyo (kung mayroong n factor variable).

Ang pagbuo ng isang econometric na modelo ay ang batayan ng econometric na pananaliksik. Ang antas ng pagiging maaasahan ng mga resulta ng pagsusuri at ang kanilang kakayahang magamit ay depende sa kung gaano kahusay ang resultang modelo ay naglalarawan sa mga pinag-aralan na pattern sa pagitan ng mga prosesong pang-ekonomiya.

Ang pagtatayo ng isang econometric na modelo ay nagsisimula sa detalye ng modelo, na binubuo sa pagkuha ng sagot sa dalawang tanong:

1) kung anong mga tagapagpahiwatig ng ekonomiya ang dapat isama sa modelo;

2) anong uri ng analytical na relasyon sa pagitan ng mga napiling katangian.

Sa mga pag-aaral na nakatuon sa pagbuo ng mga pamamaraan para sa pagtataya ng mga naturang tagapagpahiwatig ng pananalapi tulad ng mga rate ng palitan, mga seguridad, at mga indeks, ang mga modelo ay malawakang ginagamit batay sa pag-aakalang ang dinamika ng mga prosesong ito ay ganap na tinutukoy ng mga panloob na kondisyon.

Pagkatapos matukoy ang hanay ng mga variable na isinasaalang-alang, ang susunod na hakbang ay upang matukoy ang partikular na uri ng modelo na pinakamahusay na tumutugma sa phenomenon na pinag-aaralan.

Batay sa likas na katangian ng mga ugnayan sa pagitan ng mga kadahilanan at mga variable, ang modelo ay nahahati sa linear at nonlinear. Batay sa mga katangian ng kanilang mga parameter, ang mga modelo ay nahahati sa mga modelo na may pare-pareho at variable na istraktura.

Ang isang espesyal na uri ng mga modelo ay binubuo ng mga sistema ng magkakaugnay na mga equation sa ekonomiya.

Kung, sa batayan ng isang paunang pagsusuri ng husay ng hindi pangkaraniwang bagay na isinasaalang-alang, hindi posible na malinaw na piliin ang pinaka-angkop na uri ng modelo, kung gayon ang ilang mga alternatibong modelo ay isinasaalang-alang, kung saan, sa panahon ng proseso ng pananaliksik, ang isa na pinakamahusay na tumutugma. sa kababalaghan na pinag-aaralan ay napili.

Sa pangkalahatan, ang pamamaraan para sa pagbuo ng isang econometric na modelo ay maaaring katawanin sa mga sumusunod na hakbang:

1. Pagtukoy ng modelo, ibig sabihin, pagpili ng isang klase ng mga modelo na pinakaangkop para sa paglalarawan ng mga phenomena at prosesong pinag-aaralan.

Ang yugtong ito ay nagsasangkot ng paglutas ng dalawang problema:

a) pagpili ng mga makabuluhang kadahilanan para sa kanilang kasunod na pagsasama sa modelo;

b) pagpili ng uri ng modelo, ibig sabihin, pagpili ng uri ng analytical na relasyon na nagkokonekta sa mga variable na kasama sa modelo.

2. Pagsusuri ng mga parameter ng modelo, ibig sabihin, pagkuha ng mga numerical na halaga ng mga constant ng modelo. Sa kasong ito, ginagamit ang dati nang nakuhang hanay ng pinagmumulan ng data.

3. Sinusuri ang kalidad ng itinayong modelo at binibigyang-katwiran ang posibilidad ng karagdagang paggamit nito. Ang pinaka-kumplikado at matagal na bahagi ng econometric na pananaliksik ay ang yugto ng pagtatantya ng mga parameter ng modelo, kung saan ginagamit ang mga pamamaraan ng probability theory at mathematical statistics.

Kapag nilutas ang problema sa pagpili ng uri ng analytical dependence, maaaring gamitin ang iba't ibang mga pagsasaalang-alang:

Mga konklusyon mula sa analytical na pag-aaral sa katangian ng husay ng pagtitiwala,

Paglalarawan ng mga katangian ng iba't ibang mga dependency ng analitikal,

Mga layunin ng pagbuo ng modelo.

Ang pagpili ng uri ng modelo ng ekonometric ay batay, una sa lahat, sa mga resulta ng paunang husay o substantibong pagsusuri na isinagawa gamit ang mga pamamaraan ng teoryang pang-ekonomiya. Ang kalikasan ng inaasahang pag-asa ay nabibigyang katwiran batay sa mga teoretikal na pagpapalagay tungkol sa likas na katangian ng pattern ng pag-unlad ng phenomenon o prosesong pinag-aaralan.

Ang isa pang diskarte ay batay sa pagsusuri ng isang hanay ng paunang data, na nagbibigay-daan sa amin upang matukoy ang ilang mga katangian ng mga inaasahang dependency at, sa batayan na ito, bumalangkas, bilang isang panuntunan, ilang mga pagpapalagay tungkol sa uri ng analytical na koneksyon. Ang itinayong modelo ay ginagamit upang bumalangkas ng mga pagpapalagay tungkol sa likas na katangian ng pattern sa pagbuo ng phenomenon na pinag-aaralan, na sinusuri sa karagdagang pananaliksik.

Ang mga linear na modelo ay pinakamalawak na ginagamit sa econometrics.

Ito ay dahil sa ilang kadahilanan:

May mga epektibong pamamaraan para sa pagbuo ng mga naturang modelo.

Sa isang maliit na hanay ng mga halaga ng mga katangian ng salik, maaaring tantiyahin ng mga linear na modelo ang mga tunay na nonlinear na dependency na may sapat na katumpakan.

Ang mga parameter ng modelo ay may malinaw na interpretasyong pang-ekonomiya.

Ang mga pagtataya batay sa mga linear na modelo ay nailalarawan sa pamamagitan ng mas mababang panganib ng makabuluhang error sa pagtataya.

Ang isang mahalagang bahagi ng proseso ng pagbuo ng isang econometric na modelo ay ang pagpili ng mga salik na makabuluhang nakakaimpluwensya sa indicator na pinag-aaralan at dapat isama sa modelong binuo. Ang pinakamainam na hanay ng mga kadahilanan ay tinutukoy batay sa pagsusuri ng husay at dami.

Sa yugto ng pagbubuo ng problema at makabuluhang pagsusuri sa ekonomiya ng modelong pang-ekonomiya, ang mga kadahilanan ay pinili na ang impluwensya ay dapat isaalang-alang kapag nagtatayo ng modelo. Sa ilang mga kaso, ang isang hanay ng mga salik ay tinutukoy nang hindi malabo o may mataas na antas ng kumpiyansa. Sa mas kumplikadong mga kaso, ang susunod na yugto ay gumagamit ng mga pormal na istatistikal na pamamaraan upang suriin ang pagiging posible ng pagsasama ng bawat salik sa modelo. Una sa lahat, ang mga kadahilanan ay sinuri para sa pagkakaroon ng isang malapit na linear na ugnayan sa pagitan nila, ang pagkakaroon nito ay humahantong sa hindi mapagkakatiwalaang mga pagtatantya ng mga parameter ng modelo.

Upang malampasan ang malakas na ugnayan ng interfactor, ginagamit ang mga sumusunod:

pagbubukod ng isa o higit pang mga kadahilanan mula sa modelo. Sa dalawang magkaugnay na salik, ang isa na higit na nakakaugnay sa iba pang mga salik ay inalis;

pagbabago ng mga kadahilanan, na binabawasan ang ugnayan sa pagitan nila.

Ang isa sa mga pamantayan para sa pagsasama ng mga kadahilanan sa modelo ay ang antas ng kanilang nakahiwalay na impluwensya sa nagresultang katangian.

Dalawang pamamaraan para sa pagtukoy ng pinakamainam na hanay ng mga kadahilanan:

1. paraan ng pagsasama. Ang isang equation ng regression ay binuo na may isang pinaka-maimpluwensyang salik, pagkatapos ay ang mga sumusunod na salik ay sunud-sunod na ipinapasok dito at ang pares ng pinaka-maimpluwensyang salik ay tinutukoy, pagkatapos ay isa pang salik ay idinagdag sa unang dalawa at ang pinakamahusay na tatlong mga kadahilanan ay tinutukoy, atbp. Sa bawat hakbang, ang isang modelo ng regression ay binuo at sinubok ang kahalagahan ng mga salik. Ang mga makabuluhang salik lamang ang kasama sa modelo. Upang subukan ang kahalagahan ng isang salik, maaaring gamitin ang t test ng Estudyante o ang bahagyang pagsusulit ni Fisher. Nagtatapos ang proseso kapag wala nang mga salik na isasama sa modelo.

2. paraan ng pagbubukod. Ang isang equation ng regression ay binubuo ng isang buong hanay ng mga salik, kung saan ang mga hindi gaanong mahalaga o hindi gaanong makabuluhang mga salik ay sunod-sunod na ibinubukod. Sa bawat hakbang, isang salik lamang ang hindi kasama, dahil pagkatapos na maalis ang isang salik, ang isa pang salik, na dati ay hindi gaanong mahalaga, ay maaaring maging makabuluhan. Matatapos ang proseso kapag wala nang mga salik na ibubukod.

Ang mga pamamaraan ng pagsasama at pagbubukod ay hindi ginagarantiyahan ang pagpapasiya ng pinakamainam na hanay ng mga salik, ngunit sa karamihan ng mga kaso, nagbibigay ang mga ito ng mga resulta na alinman sa pinakamainam o malapit sa kanila. Hindi inirerekomenda na magsama ng napakalaking bilang ng mga salik sa modelo, dahil maaaring maging mahirap itong tukuyin ang mga pattern ng husay at pinatataas ang panganib na maisama ang mga hindi mahalagang random na salik sa modelo. Upang makakuha ng maaasahang mga pagtatantya ng parameter, kanais-nais na ang bilang ng mga obserbasyon ay lumampas sa bilang ng mga parameter na matutukoy ng hindi bababa sa 6-7 beses.

Pagkatapos pumili ng mga kadahilanan at piliin ang uri ng analytical dependence, ang mga parameter ng modelo ay tinasa. Kapag tinatantya ang mga parameter ng modelo, isang naunang inihandang hanay ng mga obserbasyon ang ginagamit bilang paunang data. Ang kalidad ng mga pagtatantya ay natutukoy sa pamamagitan ng pagkakaroon ng mga katangian tulad ng walang kinikilingan, pagkakapare-pareho at kahusayan. Ang pagtatantya ng parameter ay tinatawag na walang kinikilingan kung ang inaasahan sa matematika nito ay katumbas ng tinantyang parameter. Ang pagtatantya ng isang parameter ay tinatawag na pare-pareho kung ito ay nagtatagpo sa probabilidad sa tinantyang parameter habang ang bilang ng mga obserbasyon ay tumataas. Ang isang pagtatantya ng parameter ay sinasabing mahusay kung ito ay may pinakamaliit na pagkakaiba sa mga posibleng walang pinapanigan na mga pagtatantya ng parameter na kinakalkula mula sa mga sample na may parehong laki n.

KABANATA 2. BAHAGI NG DISENYO

2.1 Impormasyon at metodolohikal na suporta para sa econometric na pananaliksik.

Kasama sa pamamaraang pananaliksik ng ekonometric ang mga sumusunod na yugto: espesipikasyon; parameterization, verification, karagdagang pananaliksik.

1. Ang pagtutukoy ng mga modelo ng ipares at multiple regression equation ay may kasamang pagsusuri ng pagdepende sa ugnayan ng dependent variable sa bawat variable na nagpapaliwanag. Batay sa mga resulta ng pagsusuri, isang konklusyon ang ginawa tungkol sa regression equation model. Bilang resulta ng yugtong ito, tinutukoy ang modelo ng equation ng regression.

2. Ang parameterization ng isang pairwise regression equation ay kinabibilangan ng pagtatantya ng mga parameter ng regression at ang kanilang socio-economic na interpretasyon. Para sa parameterization, inirerekomendang gamitin ang tool na "Regression" bilang bahagi ng mga add-on ng MsExcel "Data Analysis". Batay sa mga resulta ng automated regression analysis, ang mga parameter ng regression ay tinutukoy at ang kanilang interpretasyon ay ibinibigay din.

Kaya, ang isang econometric na pag-aaral ng paired regression ay kinabibilangan ng pagkalkula ng mga parameter ng regression equation, pagtatasa ng error variances at variances ng mga parameter ng modelo, pagtatasa ng lakas ng relasyon sa pagitan ng isang factor at ng resulta gamit ang elasticity coefficient, pagtatasa ng lapit ng relasyon, pagtatasa ang kalidad ng equation gamit ang average na error ng approximation, tinatasa ang statistical reliability ng regression equation gamit ang Fisher's F test.

Upang bumuo at magsuri ng paired regression, isang listahan ng dalawampung pinakamalaking bansa ng European Union ang pinili mula sa statistical yearbook, katulad ng bilang ng mga taong dumarating sa bansa para sa permanenteng paninirahan at ang nominal na taunang sahod ng mga empleyado.

Ang koepisyent ng ugnayan ay kinakalkula gamit ang formula:

saan

Ang koepisyent ng ugnayan ay nagpapakita ng malapit na kaugnayan sa pagitan ng mga phenomena na pinag-aaralan.

Upang makabuo ng isang ipinares na equation ng regression, kinakailangang isaalang-alang ang mga posibleng equation ng regression:

  1. linear dependence
  2. exponential na relasyon
  3. parisukat na pag-asa
  4. cubic dependence

Para matantya ang mga parameter ng regression, inilalapat namin ang least squares method (OLS) sa lahat ng modelong ito.

Ang ideya ng pamamaraan ay upang makuha ang pinakamahusay na pagtatantya ng isang hanay ng mga obserbasyon x i , y i , i = 1,…, n linear function sa kahulugan ng pagliit ng functional:

Upang kalkulahin ang mga parameter a at b nilulutas ng linear regression ang isang sistema ng mga equation na may kinalaman sa a at b.

kung saan matutukoy ang mga pagtatantya ng parameter a at b.

t Pagsusulit ng mag-aaral.

Isang hypothesis ang iniharap H 0 tungkol sa random na katangian ng indicator, i.e. ang hindi gaanong pagkakaiba nito mula sa zero. H 0 : =0

Ang pagtatayo ng exponential curve equation ay nauuna sa pamamaraan ng linearization ng mga variable sa pamamagitan ng pagkuha ng logarithm ng magkabilang panig ng equation:

Ang mga parameter ng equation ng modelo ay matatagpuan gamit ang mga sumusunod na formula:

Ang isang linear equation ay nakuha.

X , maaaring makuha ang mga resulta ng teoretikal na halaga. Batay sa kanila, ang isang tagapagpahiwatig ng pagiging malapit ng index ng ugnayan ng koneksyon ay kinakalkula.

Ang koepisyent na ito ay sinusuri para sa kahalagahan gamit t Pagsusulit ng mag-aaral.

Ang pagkalkula ng mga pagtatantya ng mga pagkakaiba-iba ng error at pagkakaiba-iba ng mga parameter ng modelo ay isinasagawa gamit ang mga sumusunod na formula:

Ang equation ng isang quadratic curve ay binuo sa pamamagitan ng paggawa ng kapalit

Ang pagpapalit ng mga aktwal na halaga sa equation X

Ang koepisyent na ito ay sinusuri para sa kahalagahan gamit t Pagsusulit ng mag-aaral.

Ang pagkalkula ng mga pagtatantya ng mga pagkakaiba-iba ng error at pagkakaiba-iba ng mga parameter ng modelo ay isinasagawa gamit ang mga sumusunod na formula:

Ang equation ng isang cubic curve ay itinayo sa pamamagitan ng paggawa ng kapalit

Nagreresulta ito sa isang linear equation

Ang pagpapalit ng mga aktwal na halaga sa equation na ito X , maaaring makuha ang mga resulta ng teoretikal na halaga. Gamit ang mga ito, kakalkulahin namin ang tagapagpahiwatig ng index ng ugnayan ng pagkakalapit ng koneksyon.

Ang koepisyent na ito ay sinusuri para sa kahalagahan gamit t Pagsusulit ng mag-aaral.

Ang pagkalkula ng mga pagtatantya ng mga pagkakaiba-iba ng error at pagkakaiba-iba ng mga parameter ng modelo ay isinasagawa gamit ang mga sumusunod na formula:

Ang average na elasticity coefficient ay nagpapakita sa kung anong porsyento sa average ang resulta y ay magbabago mula sa average na halaga nito kapag ang factor x ay nagbago ng 1% mula sa average na halaga nito:

Ang koepisyent ng pagpapasiya ay nagbibigay ng pagtatasa ng kalidad ng itinayong modelo. Ang koepisyent ng determinasyon ay nagpapakilala sa proporsyon ng pagkakaiba-iba ng nagresultang katangian y, ipinaliwanag sa pamamagitan ng pagbabalik, sa kabuuang pagkakaiba ng nagresultang katangian.

Ang koepisyent ng determinasyon ay katumbas ng parisukat ng index ng ugnayan. Ang mas malapit sa pagkakaisa, mas mahusay ang kalidad ng fit, i.e. tinatayang y mas tumpak.

Average na error ng approximation average deviation ng mga kinakalkula na halaga mula sa mga aktwal:

Ang pinahihintulutang limitasyon ng mga halaga ay hindi hihigit sa 8-10%.

Ang kahalagahan ng regression equation ay tinasa gamit ang F - Pamantayan ng mangingisda. Sa kasong ito, ang isang null hypothesis ay iniharap tungkol sa pagkakapantay-pantay ng aktwal at natitirang mga pagkakaiba-iba, at samakatuwid ang kadahilanan x walang epekto sa y, ibig sabihin.

H 0 : D aktwal = D pahinga

Upang gawin ito, isang paghahambing ang ginawa sa pagitan ng aktwal at kritikal (tabular) na mga halaga F - Pamantayan ng mangingisda. tinutukoy mula sa ratio ng mga halaga ng kadahilanan at natitirang mga pagkakaiba-iba:

Ang pinakamataas na posibleng halaga ng criterion sa ilalim ng impluwensya ng mga random na kadahilanan na may ibinigay na antas ng kalayaan at antas ng kahalagahan. Ang antas ng kahalagahan ay ang posibilidad na tanggihan ang isang tamang hypothesis dahil ito ay totoo.

Kung<, то отклоняется и признается статистическая значимость и надежность уравнения регрессии, иначе - принимается и делается вывод о не значимости уравнения регрессии.

3. Ang parameterization ng isang multiple regression equation ay kinabibilangan ng pagtatantya ng mga parameter ng regression at ang kanilang socio-economic na interpretasyon. Para sa parameterization, inirerekomendang gamitin ang tool na "Regression" bilang bahagi ng mga add-on ng MsExcel "Data Analysis". Batay sa mga resulta ng automated regression analysis, ang mga parameter ng regression ay tinutukoy at ang kanilang interpretasyon ay ibinibigay din.

Ang equation ng regression ay napatunayan batay sa mga resulta ng automated regression analysis.

Kaya, ang isang econometric na pag-aaral ng multiple regression ay kinabibilangan ng pagbuo ng isang multiple regression equation, ang pagkalkula ng elasticity coefficients para sa bawat factor at isang comparative assessment ng lakas ng relasyon ng bawat factor sa resulta, ang economic interpretation ng itinayong modelo, ang pagbuo ng isang matrix ng ugnayan, ang pagkalkula ng maramihang koepisyent ng ugnayan, ang pagkalkula ng mga pagtatantya ng mga pagkakaiba-iba ng error ng modelo at mga pagtatantya ng mga parameter ng modelo, pagbuo ng mga pagitan ng kumpiyansa para sa mga koepisyent ng modelo na may napiling antas ng kahalagahan, pagsuri sa kahalagahan ng bawat koepisyent, pagtatasa ng pagiging malapit ng relasyon, tinatasa ang statistical reliability ng regression equation gamit ang Fisher's F test.

Upang bumuo at magsuri ng maramihang regression, marami pang indicator ang ipinapasok sa modelo upang isaalang-alang ang ilang salik na nakakaimpluwensya sa bilang ng mga taong dumarating sa bansa para sa permanenteng paninirahan. Ibig sabihin, ang mga kadahilanan tulad ng bilang ng mga walang trabaho at GDP ng bansa.

Multiple regression relationship equation na may ilang hindi kilalang variable:

saan y dependent variable (resultang katangian),

Mga independiyenteng variable (mga kadahilanan).

Upang makabuo ng isang multiple regression equation, isang linear function na nakasulat sa matrix form ay ginagamit:

saan,

Upang matantya ang mga parameter ng multiple regression equation, ginagamit ang least squares method:

Ang sumusunod na sistema ng mga equation ay itinayo, ang solusyon kung saan ay nagbibigay-daan sa amin upang makakuha ng mga pagtatantya ng mga parameter ng regression:

Ang tahasang solusyon nito ay karaniwang nakasulat sa matrix form, kung hindi man ito ay nagiging masyadong masalimuot.

Ang mga pagtatantya ng mga parameter ng modelo sa matrix form ay tinutukoy ng expression:

X matrix ng mga halaga ng mga paliwanag na variable;

Y vector ng mga halaga ng dependent variable.

Upang matukoy ang pag-asa ng bilang ng mga taong dumarating para sa permanenteng paninirahan sa nominal na taunang suweldo ng mga upahang manggagawa, ang bilang ng mga walang trabaho at ang antas ng GDP, gagawa kami ng multiple regression equation sa anyo:

Upang makilala ang kamag-anak na lakas ng impluwensya ng mga kadahilanan sa y Kalkulahin natin ang average na elasticity coefficients. Ang mga average na elasticity coefficient para sa linear regression ay kinakalkula gamit ang mga formula:

Sa isang linear na dependence, ang multiple correlation coefficient ay maaaring matukoy sa pamamagitan ng matrix ng mga paired correlation coefficient:

saan ang determinant ng matrix ng mga paired correlation coefficients;

Determinant ng interfactor correlation matrix.

Matrix ng mga coefficient ng ugnayan ng pares:

Interfactor correlation matrix:

Ang pagkalkula ng mga pagtatantya ng mga pagkakaiba-iba ng error at pagkakaiba-iba ng mga parameter ng modelo ay isinasagawa gamit ang mga sumusunod na formula:

Upang masuri ang istatistikal na kahalagahan ng mga coefficient ng regression, kinakalkula namin t -Mga agwat ng pagsusulit at kumpiyansa ng mag-aaral para sa bawat parameter. Ang isang hypothesis ay iniharap tungkol sa random na katangian ng mga tagapagpahiwatig, i.e. tungkol sa kanilang hindi gaanong pagkakaiba mula sa zero. Kumuha kami ng isang hanay ng mga hypotheses:

: b 0 =0; b 1 =0; b 2 =0; b 3 =0

t -Ang t-test ng mag-aaral ay isinasagawa sa pamamagitan ng paghahambing ng kanilang mga halaga sa halaga ng talahanayan, na kinakalkula bilang isang dami ng pamamahagi ng Estudyante, kung saan ang antas ng kahalagahan ay ang posibilidad na tanggihan ang tamang hypothesis, sa kondisyon na ito ay totoo.

Upang kalkulahin ang mga agwat ng kumpiyansa, gamitin ang sumusunod na formula:

Ang kalidad ng itinayong modelo sa kabuuan ay tinasa ng koepisyent ng pagpapasiya. Ang koepisyent ng maramihang pagpapasiya ay kinakalkula bilang parisukat ng index ng maramihang ugnayan: .

Ang adjusted index ng maramihang pagpapasiya ay naglalaman ng pagwawasto para sa bilang ng mga antas ng kalayaan at kinakalkula gamit ang formula:

saan n bilang ng mga obserbasyon;

m bilang ng mga kadahilanan.

Ang kahalagahan ng maramihang regression equation sa kabuuan, gayundin sa paired regression, ay tinasa gamit ang F- Fisher test:

Sa kasong ito, ang isang hypothesis ay iniharap tungkol sa kawalang-halaga ng equation ng regression:

Sa wakas, nabuo ang isang paghatol tungkol sa kalidad ng equation ng regression.

4. Ang isang paghahambing na pagsusuri ng mga modelo ng regression ay isinasagawa.

2.2. Isang halimbawa ng pag-aaral sa ekonomiya.

Batay sa istatistikal na datos, ang ekonometric na pananaliksik ay isinasagawa alinsunod sa pamamaraan ng sugnay 2.1.

Ang lahat ng kinakailangang mga kalkulasyon ay isinasagawa gamit ang MS Excel, ang mga manu-manong kalkulasyon ay isinasagawa, at ang mga resulta na nakuha ay sinuri gamit ang mga function ng data analysis package na "Regression".

Ang linear pair correlation coefficient ay:

0,504652547

Ang koepisyent ng ugnayan ay may positibong halaga at katumbas ng isang katamtamang direktang ugnayan sa pagitan ng tagapagpahiwatig y at salik x : sa pagtaas ng karaniwang taunang suweldo ng mga manggagawa sa isang bansa, ang bilang ng mga taong dumarating sa bansa ay tumataas.

2. Ang paired regression ay binuo at sinusuri. Ang paunang data ay ipinakita sa Talahanayan 1.

Talahanayan 1. Paunang data para sa pagbuo at pagsusuri ng paired regression

y - bilang ng mga tao na dumating sa bansa para sa permanenteng paninirahan, libong tao;

Bilang resulta ng pagsusuri, kinakailangang matukoy kung magkano ang impluwensya ng sahod ng mga upahang manggagawa sa bansa sa bilang ng mga taong dumating sa bansa para sa permanenteng paninirahan.

Pagtatantya ng Parameter a at b.

Regression equation:

Coefficient ng regression b =4.279 nagpapakita ng average na pagbabago sa resulta na may pagbabago sa kadahilanan ng isang yunit: na may pagtaas sa taunang suweldo ng mga upahang manggagawa ng 1 libong euro. ang bilang ng mga darating para sa permanenteng paninirahan ay tataas ng average na 4.279 libong tao. Ang isang positibong halaga ng coefficient ng regression ay nagpapahiwatig ng direktang direksyon ng relasyon.

Ang linear pair correlation coefficient ay:

0,504652547

Direkta at katamtaman ang koneksyon.

2.47 T talahanayan (0.05;18) = 2.101

> T talahanayan , ang koepisyent ay makabuluhan.

Ang pagkalkula ng mga pagtatantya ng mga pagkakaiba-iba ng error at mga pagkakaiba-iba ng mga parameter ng modelo ay isinasagawa. Ang mga pansamantalang kalkulasyon ay ipinakita sa Talahanayan 2.

10765,218 = 1477,566815 = 2,976774696

Konstruksyon ng exponential curve equation.

Ang mga halaga ng parameter ng regression ay

0,068027 = 1,68049

Ang linear equation na nakuha ay: .

Pagkatapos ng potentiation:

Index ng ugnayan.

Ang koepisyent na ito ay sinuri para sa kahalagahan.

2.15 T tab (0.05;18) = 2.101

> T talahanayan , ang koepisyent ay makabuluhan.

Ang pagkalkula ng mga pagtatantya ng mga pagkakaiba-iba ng error at mga pagkakaiba-iba ng mga parameter ng modelo ay isinasagawa. Ang mga pansamantalang kalkulasyon ay ipinakita sa Talahanayan 3.

Bilang isang resulta, ang mga sumusunod na halaga ay nakuha:

11483,75 = 452,87517 = 3,1754617

Talahanayan 2. Pagkalkula ng mga halaga para sa linear na modelo

Talahanayan 3. Pagkalkula ng mga halaga para sa exponential model

Ang equation ng isang quadratic curve ay binuo.

Mga parameter ng equation:

Index ng ugnayan.

Ang koepisyent na ito ay sinuri para sa kahalagahan.

3.41 T tab (0.05;18) = 2.101

> T talahanayan , ang koepisyent ay makabuluhan.

Ang pagkalkula ng mga pagtatantya ng mga pagkakaiba-iba ng error at mga pagkakaiba-iba ng mga parameter ng modelo ay isinasagawa. Ang mga pansamantalang kalkulasyon ay ipinakita sa Talahanayan 4.

Bilang isang resulta, ang mga sumusunod na halaga ay nakuha:

8760,35808 = 743,283328 = 0,00123901

Ang equation ng isang cubic curve ay binuo.

Mga parameter ng equation:

Ang equation ng regression ay tumatagal sa anyo:

Index ng ugnayan.

Ang koepisyent na ito ay sinuri para sa kahalagahan.

4.38 T tab (0.05;18) = 2.101

> T talahanayan , ang koepisyent ay makabuluhan.

Ang pagkalkula ng mga pagtatantya ng mga pagkakaiba-iba ng error at mga pagkakaiba-iba ng mga parameter ng modelo ay isinasagawa. Ang mga pansamantalang kalkulasyon ay ipinakita sa Talahanayan 5.

Bilang isang resulta, ang mga sumusunod na halaga ay nakuha:

6978.45007 = 514.7649432 = 5.9851E-07

Ang pinakamataas na antas ng koneksyon sa pagitan ng mga variable ay nasa modelo na may cubic dependence, dahil ang koepisyent ng ugnayan sa kubiko na modelo ay pinakamalapit sa pagkakaisa, at ang pinakamababa sa modelong exponential. Ang mga pagkakaiba-iba ng mga error at mga parameter ng modelo ay tumatagal ng mga minimum na halaga ng kubiko.

Talahanayan 4. Pagkalkula ng mga halaga para sa quadratic na modelo

Talahanayan 5. Pagkalkula ng mga halaga para sa kubiko na modelo

Ang average na koepisyent ng pagkalastiko ay matatagpuan.

Linear na pag-asa

1,250028395 %.

Exponential dependence

1,2083965

Sa pagtaas ng taunang sahod ng mga upahang manggagawa ng 1%, ang bilang ng mga taong dumarating sa bansa para sa permanenteng paninirahan ay tataas ng 1,2083965 % .

Quadratic na pag-asa

Sa pagtaas ng taunang sahod ng mga upahang manggagawa ng 1%, ang bilang ng mga taong dumarating sa bansa para sa permanenteng paninirahan ay tataas ng 1,24843054 % .

Kubiko na pag-asa

0,938829224

Sa pagtaas ng taunang sahod ng mga upahang manggagawa ng 1%, ang bilang ng mga taong dumarating sa bansa para sa permanenteng paninirahan ay tataas ng 0,938829224 % .

Ang mga koepisyent ng pagkalastiko ay ipinapakita sa Talahanayan 6.

Lahat ng mga itinayong modelo ay nagpapatunay na ang sahod ng mga upahang manggagawa ay isang salik sa pagtaas ng bilang ng mga taong dumarating sa bansa para sa permanenteng paninirahan. Ang elasticity coefficient ay nagpapakita na ang taunang sahod ng mga upahang manggagawa ay may mas malaking impluwensya sa bilang ng mga taong dumarating sa bansa para sa permanenteng paninirahan na may mga linear at quadratic na dependencies. Sa isang mas mababang lawak, ang relasyon na ito ay maaaring masubaybayan sa cubic dependence.

Ang koepisyent ng pagpapasiya ay matatagpuan.

Linear na pag-asa

Ipinapaliwanag ng equation ng regression ang 25% ng pagkakaiba-iba ng epektibong katangian, at ang natitirang mga kadahilanan ay bumubuo ng 75% ng pagkakaiba nito.

Ang modelo ng linear dependence ay hindi tinatayang maayos ang orihinal na data.

Exponential dependence =

Ang relasyon sa pagitan ng mga tagapagpahiwatig ay kasing mahina ng sa linear na modelo. pagkakaiba-iba 20% lang ipinaliwanag sa pamamagitan ng pagkakaiba-iba X , at ang natitirang mga kadahilanan ay nagkakahalaga ng 80%. Ang koneksyon sa modelong ito ay ang pinakamahina. Samakatuwid, ang kalidad ng modelo ay hindi kasiya-siya.

Quadratic na pag-asa

Ang relasyon sa pagitan ng mga tagapagpahiwatig ay bahagyang mas mahusay kaysa sa exponential at linear na mga modelo. Ang pagkakaiba-iba sa y ay 40% lamang na ipinaliwanag ng pagkakaiba-iba sa x. Hindi rin ipinapayong gamitin ang modelong ito para sa pagtataya.

Kubiko na pag-asa

Ang relasyon sa pagitan ng mga tagapagpahiwatig ay mas mahusay kaysa sa mga nakaraang modelo. 52% ng variation sa y ay ipinaliwanag ng variation sa x.

Ang mga halaga ng mga koepisyent ng pagpapasiya ay ipinakita sa Talahanayan 6.

Talahanayan 6. Pagkalkula ng mga parameter at katangian ng mga modelo.

Ang kalidad ng mga binuo na modelo ay mababa, Ang modelong may cubic dependence ay may pinakamataas na marka ng kalidad, dahil ang bahagi ng ipinaliwanag na pagkakaiba-iba ay 52%.

Ang average na error ng approximation ay tinutukoy ang average na paglihis ng mga kinakalkula na halaga mula sa mga aktwal:

Linear na modelo = 1153,261 %

Sa karaniwan, ang mga kinakalkula na halaga ay lumihis mula sa aktwal na mga halaga sa pamamagitan ng 1153,261 %, na nagpapahiwatig ng napakalaking error sa pagtatantya.

Exponential dependence = 396,93259

Ang error sa pagtatantya ay bahagyang mas mababa kaysa sa iba pang mga modelo, ngunit hindi rin katanggap-tanggap.

Quadratic dependence = 656,415018

Ang isang mataas na error sa pagtatantya ay sinusunod, na nagpapahiwatig ng mababang kalidad ng angkop ng equation

Cubic dependence = 409,3804652

Ang error sa pagtatantya ay makabuluhang lumampas din sa mga katanggap-tanggap na halaga.Sa lahat ng mga modelong isinasaalang-alang, ang average na error ng approximation ay makabuluhang lumampas sa mga pinahihintulutang halaga, at ang kalidad ng pag-angkop ng mga modelo sa orihinal na data ay napakababa.

3. Isinasagawa ang pagbuo at pagsusuri ng maramihang regression.

Ang paunang data para sa pagbuo ng maramihang regression ay ibinibigay sa Talahanayan 7.

Talahanayan 7. Paunang data para sa pagbuo ng maramihang regression.

y - bilang ng mga tao na dumating sa bansa para sa permanenteng paninirahan, libong tao:

x 1 - nominal na taunang sahod ng mga empleyado, libong euro.

x 2 - bilang ng mga walang trabaho, libong tao.

x 3 - GDP, bilyong euro.

Mga pagtatantya ng mga parameter ng equation ng regression:

Multiple regression equation:

Average na elasticity coefficients.

0,12026241 = -0,06319176 = 0,86930458

Ang pagkalkula ng mga halagang ito ay ibinibigay sa Talahanayan 8.

Sa pagtaas ng taunang sahod ng mga upahang manggagawa ng 1% ng karaniwang antas, na may iba pang mga salik na nananatiling hindi nagbabago, ang bilang ng mga taong dumarating para sa permanenteng paninirahan ay tumataas ng 0,12 %.

Sa pagtaas ng bilang ng mga walang trabaho ng 1% ng karaniwan, na may iba pang mga salik na nananatiling hindi nagbabago, ang bilang ng mga taong dumarating para sa permanenteng paninirahan ay bumababa ng 0,06 %

Sa pagtaas ng GDP ng 1% ng average, na may iba pang mga salik na nananatiling hindi nagbabago, ang bilang ng mga dumating para sa permanenteng paninirahan ay tataas ng 0,87 %

Ang pagbabago sa bilang ng mga taong dumarating sa bansa para sa permanenteng paninirahan ay direktang nakadepende sa taunang sahod ng mga upahang manggagawa at sa antas ng GDP ng bansa at baligtad na nakadepende sa bilang ng mga walang trabaho, na hindi sumasalungat sa mga lohikal na pagpapalagay. Ang elasticity coefficients, bilang mga tagapagpahiwatig ng lakas ng koneksyon, ay nagpapakita na ang pinakamalaking pagbabago sa bilang ng mga pagdating sa bansa ay sanhi ng halaga ng GDP, at ang pinakamaliit ay sa bilang ng mga walang trabaho.

Ang multiple correlation coefficient ay kinakalkula:

Ang halaga ng index ng maramihang ugnayan ay mula 0 hanggang 1.

Ang average na error sa pagtatantya ay kinakalkula:

372,353247%

Ang halaga ng average na error ng approximation ay nagpapahiwatig ng hindi magandang akma ng modelo sa orihinal na data.

Talahanayan 8. Pagkalkula ng mga halaga ng mga katangian ng multiple regression model

Ang pinagsamang impluwensya ng lahat ng mga kadahilanan sa bilang ng mga taong dumarating sa bansa para sa permanenteng paninirahan ay medyo malaki. SAang ugnayan sa pagitan ng indicator na isinasaalang-alang at ang mga salik na nakakaimpluwensya dito ay lumakas kumpara sa ipinares na regression ( r yx =0.506). Mayroong medyo malakas na koneksyon.

Kinakailangang isaalang-alang na mayroong isang bahagyang multicollinearity sa modelo, na maaaring magpahiwatig ng kawalang-tatag nito, dahil ang determinant ng interfactor correlation matrix ay medyo malayo sa 1. Ang maximum na coefficient ng correlation ng pares ay sinusunod sa pagitan ng mga kadahilanan x 1 at x 3 (r x 1 x 3 =0.595), na naiintindihan, dahil Ang karaniwang taunang suweldo sa bansa ay dapat na direktang nakadepende sa GDP ng bansa.

Pagkalkula ng mga pagtatantya ng mga pagkakaiba-iba ng error at pagkakaiba-iba ng mga parameter ng modelo:

n = 20 bilang ng mga obserbasyon, m =4 na bilang ng mga parameter.

Para sa itinayong modelo, ang pagtatantya ng pagkakaiba-iba ng error ay:

6674,02207

Mga pagtatantya ng mga pagkakaiba-iba ng mga parameter ng modelo:

Mga karaniwang error ng mga parameter ng modelo:

Ang mga pansamantalang kalkulasyon ng nakuhang data ay ipinakita sa Appendix 8.

Pagtatasa ng kahalagahan ng regression coefficients gamit ang t -T-test ng mag-aaral.

Mga kahulugan,<, значит коэффициенты являются статистически незначимыми и случайно отличаются от 0.

>, samakatuwid ito ay makabuluhan ayon sa istatistika

Para sa binuong modelo, ang mga pagitan ng kumpiyansa ng mga koepisyent ng regression:

Lahat ng nakuhang regression coefficient, maliban, ay hindi gaanong mahalaga sa istatistika, ang agwat ng kumpiyansa para sa kanila ay medyo malaki, na maaaring magpahiwatig ng hindi sapat na kalidad ng modelo.

Coefficient of multiple determination para sa itinayong modelo

Ang coefficient of determination na ito ay nagpapakita na ang kalidad ng modelo ay kasiya-siya.

Sa pagdaragdag ng isa pang variable kadalasan itong tumataas. Upang maiwasan ang posibleng pagmamalabis ng pagkakalapit ng koneksyon, ginagamit ang isang nababagay na koepisyent ng pagpapasiya. Para sa isang naibigay na dami ng mga obserbasyon, lahat ng iba pang bagay ay pantay-pantay, na may pagtaas sa bilang ng mga independiyenteng variable (mga parameter), ang inayos na koepisyent ng maramihang determinasyon ay bumababa. Para sa itinayong modelo, ang mga halaga ng nababagay at hindi nababagay na koepisyent ng pagpapasiya ay hindi gaanong naiiba sa bawat isa, ngunit dahil bahagyang bumaba ang adjusted coefficient of determination, na nagmumungkahi na ang pagtaas sa proporsyon ng ipinaliwanag na regression kapag nagdaragdag ng bagong variable ay hindi gaanong mahalaga, at ang pagdaragdag ng variable ay hindi ipinapayong.

Pagtatasa ng kahalagahan ng regression equation gamit ang F - Pamantayan ng mangingisda.

F (0.05, m -1, n - m )= F (0.05,1,18)= 4.413873

Linear na modelo = 6,150512218

Exponential dependence = 4,6394274

Quadratic dependence = 11,6775003

Cubic dependence = 19,25548322

Sa lahat ng itinuturing na mga modelo<, гипотеза отвергается.

Ang kahalagahan ng multiple regression equation sa kabuuan gamit F- Fisher test:

Since F table< F факт tapos hindi tinatanggap

4. Bilang resulta ng pag-aaral, mabubuo natin ang sumusunod na konklusyon: Lahat ng nakuhang regression equation ay makabuluhan. Ayon sa mga resulta F -test at ang mga indicator ng coefficient of determination at ang average na error ng approximation, maaari nating tapusin na kabilang sa mga itinuturing na paired regression models ay walang modelo na may magandang kalidad na maaaring gamitin para sa mga layunin ng pagtataya. Gayunpaman, ang pinakamahusay na modelo na naglalarawan sa ugnayan sa pagitan ng taunang suweldo ng mga sahod na manggagawa sa isang bansa at ang bilang ng mga taong dumarating sa bansa para sa permanenteng paninirahan ay isang modelo na may cubic dependence, dahil ito ay makabuluhan, ang koepisyent ng determinasyon ay tumatagal ng pinakamalaking halaga at ang average na error ng approximation ay hindi masyadong malaki kumpara sa iba pang mga modelo, bagama't hindi ito tumatanggap ng isang katanggap-tanggap na halaga.

Ang lahat ng apat na ipinares na mga modelo ng regression ay makabuluhan sa istatistika, gayunpaman, sa halip, maliit na mga halaga ng koepisyent ng pagpapasiya at malalaking error sa average na pagtatantya ay nagpapahiwatig ng mahinang kalidad ng mga modelong ito.

Ang pagkakaroon ng paghahambing ng mga parameter at katangian ng mga equation na ito, napagpasyahan na ang modelo na may isang cubic dependence ay may pinakamalaking pagiging maaasahan at katumpakan. Ito ay pinatunayan ng pinakamataas na halaga ng index ng ugnayan at, nang naaayon, ang koepisyent ng pagpapasiya, na pinakamalapit sa 1 at kinukumpirma ang pinakamahusay na kalidad ng modelo sa mga tuntunin ng pagtatantya ng data, ang mga resulta ng F-test, na kinikilala ang modelo bilang makabuluhan, pati na rin ang average na error sa pagtatantya, na mas maliit kaysa sa iba pang mga modelo. Ang mga karaniwang error ng mga parameter ng regression at ang karaniwang error ng forecast para sa modelong ito ay tumatagal din ng mas maliliit na halaga.

Ang multiple regression equation ay makabuluhan, i.e. ang hypothesis tungkol sa random na katangian ng mga tinasa na katangian ay tinanggihan. Ang resultang modelo ay maaasahan ayon sa istatistika.

KONGKLUSYON

Bilang resulta ng econometric research at data analysis, apat na paired regression equation ang isinaalang-alang, na nagtatatag ng ugnayan sa pagitan ng average na taunang sahod ng mga upahang manggagawa sa bansa at ang bilang ng mga taong dumating sa bansa para sa permanenteng paninirahan. Ito ay isang linear na modelo, exponential model, mga modelong may quadratic at cubic dependence. Lahat ng mga itinayong modelo ay nagpapatunay na ang pagtaas ng sahod ng mga upahang manggagawa ay isang salik sa pagtaas ng bilang ng mga taong dumarating sa bansa para sa permanenteng paninirahan.

Ang pinakamataas na tagapagpahiwatig ng pagiging malapit ng relasyon sa pagitan ng mga variable ay nasa modelo na may cubic dependence, dahil ang koepisyent ng determinasyon sa kubiko na modelo ay tumatagal ng pinakamalaking halaga, na nagpapahiwatig ng pinakamalaking pagiging maaasahan ng natagpuang equation ng regression. Ang isang modelo sa anyo ng isang cubic na relasyon ay pinakamahusay na naglalarawan sa kaugnayan sa pagitan ng bilang ng mga taong dumarating sa bansa para sa permanenteng paninirahan at ang taunang sahod ng mga upahang manggagawa.Sa lahat ng isinasaalang-alang na mga modelo, ang average na error ng approximation ay makabuluhang lumampas sa mga katanggap-tanggap na halaga, na nagpapahiwatig ng mababang kalidad ng fit ng mga modelo. Gayunpaman, ang modelo na may cubic dependence ay ang pinakamahusay sa mga tuntunin ng pagtatantya ng data at pagtatasa ng lapit ng relasyon, dahil ito ang may pinakamalaking bahagi ng ipinaliwanag na pagkakaiba-iba kumpara sa iba pang mga modelo - 52% (ang koepisyent ng pagpapasiya ay pinakamalapit sa 1) .

Para sa lahat ng mga parameter na isinasaalang-alang, ang regression equation na may cubic dependence ay ang pinakamahusay sa mga isinasaalang-alang. Ngunit hindi ito pinakamainam para sa praktikal na paggamit at pagtataya, na ipinaliwanag ng malaking scatter ng data, pati na rin ang katotohanan na ang bilang ng mga imigrante ay nakasalalay sa maraming mga kadahilanan na hindi maaaring isaalang-alang sa ipinares na regression.

Ang hindi sapat na magandang katangian ng modelo ay maaaring sanhi ng pagkakaroon sa source data ng mga unit na may mga maanomalyang halaga ng mga katangiang pinag-aaralan: sa UK, ang bilang ng mga pagdating para sa permanenteng paninirahan ay mas mataas kaysa sa tagapagpahiwatig na ito para sa ibang mga bansa. . Marahil ang bansang ito ay dapat na hindi kasama sa sample upang makakuha ng mas tumpak at maaasahang resulta.

Bilang resulta ng pagbuo ng multiple regression, ang impluwensya sa bilang ng mga taong dumarating sa bansa para sa permanenteng paninirahan ng mga salik tulad ng GDP ng bansa, ang bilang ng mga walang trabaho at ang average na taunang sahod ng mga upahang manggagawa ay inimbestigahan.

Ang pagbabago sa bilang ng mga taong dumarating sa bansa para sa permanenteng paninirahan ay direktang nakadepende sa taunang sahod ng mga upahang manggagawa at sa antas ng GDP ng bansa at kabaligtaran na nauugnay sa bilang ng mga walang trabaho. Ang pinakamalaking pagbabago sa bilang ng mga dumating sa bansa ay sanhi ng halaga ng GDP, at ang pinakamaliit ay sa bilang ng mga walang trabaho.

Ang pinagsamang impluwensya ng lahat ng mga kadahilanan sa bilang ng mga tao na dumarating sa bansa para sa permanenteng paninirahan ay medyo malaki, dahil ang maramihang index ng ugnayantumatagal ng mataas na halaga. Gayunpaman, ito ay maaaring dahil sa pagkakaroon ng multicollinearity.

Ang lahat ng nakuhang coefficient ng multiple regression equation maliban sa coefficient para sa factor na antas ng GDP ay hindi gaanong mahalaga sa istatistika, ang agwat ng kumpiyansa para sa kanila ay medyo malaki.

Sa kabila nito, ang coefficient of determination ay nagpapakita na ang kalidad ng modelo ay kasiya-siya. Ang multiple regression equation ay makabuluhan, i.e. ang hypothesis tungkol sa random na katangian ng mga tinasa na katangian ay tinanggihan.

Gayunpaman, maaaring maobserbahan ang heteroscedasticity sa modelo, i.e. Maaaring kailangang itama ang modelo.

Ang mga resulta na ito ay maaaring ipaliwanag sa pamamagitan ng medyo maliit na sukat ng sample, lalo na isinasaalang-alang ang pandaigdigang kalikasan ng pag-aaral, ang pagkakaroon ng isang maanomalyang halaga ng pinag-aralan na katangian, ang kabiguang isaalang-alang ang anumang makabuluhang mga kadahilanan, pati na rin ang katotohanan na ang bilang ng mga emigrante sa bansa ay nakasalalay sa isang malaking bilang ng mga non-quantitative, personal na mga kadahilanan, mga indibidwal na kagustuhan.

Sa kabila ng kakulangan ng eksaktong resulta at isang qualitative regression equation na angkop para sa pagtataya at karagdagang pananaliksik, ang pag-aaral ay nagsiwalat na ang sahod ng mga upahang manggagawa sa bansa, ang unemployment rate at GDP ay may mahalagang epekto sa bilang ng mga taong dumarating sa bansa. para sa permanenteng paninirahan.

Listahan ng mga mapagkukunang ginamit

1. Gerasimov, A.N. Econometrics: teorya at kasanayan [Electronic na mapagkukunan]: electronic textbook / Gerasimov, A.N., Gladilin, A.V., Gromov, E.I. - M.: KnoRus, 2011. - CD. - (82803-2) (U; G 37)

2. Yakovleva, A. Order. Econometrics: kurso ng mga lecture - M.: Eksmo, 2010. - (83407-1)

3. Valentinov, V.A. Econometrics [Text]: workshop - M.: Dashkov i K, 2010. - 435 p. - (84265-12) (U; V 15)

4. Valentinov, V.A. Econometrics [Text]: aklat-aralin para sa mga unibersidad sa mga espesyal na paksa. "Mga pamamaraan ng matematika sa ekonomiya" at iba pang ekonomiya. espesyalista. - M.: Dashkov at K, 2010. - 448 p. - (84266-30) (U; V 15)

5. Novikov, A.I. Econometrics [Text]: aklat-aralin. manual para sa mga unibersidad sa direksyon 521600 "Economics" at economics. mga espesyalidad - M.: INFRA-M, 2011. - 143, p. - (86112-10) (U; N 73)

6. Kolemaev, V.A. Econometrics [Text]: aklat-aralin para sa mga unibersidad sa espesyalidad 061800 "Mga pamamaraan sa matematika sa ekonomiya" / Estado. Unibersidad ng Hal. - M.: INFRA-M, 2010. - 160 p. - (86113-10) (U; K 60)

7. Gladilin, A.V. Econometrics [Text]: aklat-aralin. manwal para sa mga unibersidad sa ekonomiya. mga specialty / Gladilin, A.V., Gerasimov, A.N., Gromov, E.I. - M.: KnoRus, 2011. - 227 p. - (86160-10) (U; G 52)

8. Novikov, A.I. Econometrics [Text]: aklat-aralin. mga benepisyo halimbawa "Pananalapi at Kredito", "Ekonomya" - M.: Dashkov at K, 2013. - 223 p. - (93895-1) (U; N 73)

9. Timofeev, V.S. Econometrics [Text]: aklat-aralin para sa mga bachelor sa economics. hal at espesyal / Timofeev, V.S., Faddeenkov, A.V., Shchekoldin, V.Yu. - M.: Yurayt, 2013. - 328 p. - (94305-3) (U; T 41)

10. Econometrics [Text]: textbook para sa mga masters, para sa mga unibersidad sa economics. direksyon at espesyal / Eliseeva, I.I., Kurysheva, S.V., Neradovskaya, Yu.V., [atbp.] ; inedit ni I.I. Eliseeva; St. Petersburg State Unibersidad ng Economics at Pananalapi - M.: Yurayt, 2012. - 449 p. - (95469-2) (U; E 40)

11. Novikov, A.I. Econometrics [Electronic na mapagkukunan]: textbook. manual - M.: Dashkov at K, 2013. - EBS Lan. - (104974-1) (U; N 73)

12. Varyukhin, A.M. Econometrics [Text]: mga tala sa panayam / Varyukhin, A.M., Pankina, O.Yu., Yakovleva, A.V. - M.: Yurayt, 2007. - 191 p. - (105626-1) (U; V 18)

13. Econometrics [Electronic na mapagkukunan]: textbook / Baldin, K.V., Bashlykov, V.N., Bryzgalov, N.A., [etc.]; inedit ni V.B. Utkina - Moscow: Dashkov at K, 2013. - EBS Lan. - (107123-1) (U; E 40)

14. Perepelitsa, N.M. *Econometrics: workshop (direksyon 100700.62 Trading business) [Electronic resource]: bilang bahagi ng educational and methodological complex / Tver State. tech. Unibersidad, Dept. LALAKI - Tver: TvSTU, 2012. - Server. - (107926-1)

EMBED Equation.3

Iba pang katulad na mga gawa na maaaring interesante sa iyo.vshm>

1589. Comparative analysis ng mga antivirus program 79.33 KB
Sinusuri ng huling gawaing kwalipikadong ito ang problema ng paglaban sa mga virus sa computer, na tinatalakay ng mga programang anti-virus. Kabilang sa hanay ng mga program na ginagamit ng karamihan ng mga gumagamit ng personal na computer araw-araw, ang mga antivirus program ay tradisyonal na sumasakop sa isang espesyal na lugar.
19100. Comparative analysis ng intuitive at logical na pag-iisip 22.37 KB
Comparative analysis ng intuitive at logical na pag-iisip. Mga pangunahing teorya ng pag-iisip at mga diskarte sa pag-aaral nito sa dayuhan at domestic na sikolohiya. Sa proseso ng pag-iisip, ang isang tao ay sumasalamin sa layunin ng mundo nang iba kaysa sa mga proseso ng pang-unawa at imahinasyon. Sa panahon ng independiyenteng trabaho, ang mga pangunahing teorya ng pag-iisip at mga diskarte sa pag-aaral nito sa sikolohiya ay isasaalang-alang.
18483. TALES OF THE INDIANS OF NORTH AMERICA: COMPARATIVE ANALYSIS 8.39 KB
Ang kababalaghan ng mga fairy tale ay isang napaka misteryosong paksa ng pananaliksik, dahil ang oral folk art, higit sa iba pang mga uri ng sining, ay napapailalim sa mga pagbabago at pagbaluktot ng kahulugan sa ilalim ng impluwensya ng pagbabago ng mga kadahilanan sa sosyokultural na kapaligiran.
18490. 115.79 KB
Responsibilidad ng isang pampublikong notaryo kapag nagsasagawa ng mga kilos na notaryo. Legal na batayan para sa mga aktibidad ng pribadong pagsasanay ng mga notaryo sa teritoryo ng Republika ng Kazakhstan. Responsibilidad ng isang notaryo na nakikibahagi sa pribadong pagsasanay. Comparative analysis ng pampubliko at pribadong notaryo na institusyon sa teritoryo ng Republika ng Kazakhstan. Pagsasagawa ng hudisyal sa pagsasaalang-alang ng mga kaso na humahamon sa mga aksyon ng mga notaryo kapag nagsasagawa sila ng notaryo...
9809. Comparative analysis at development prospect para sa mga laptop computer 343.85 KB
Ang problema ng pag-aaral na ito ay may kaugnayan sa modernong mga kondisyon. Ito ay pinatunayan ng madalas na pag-aaral ng mga isyung itinaas, at sa kabila ng kasaganaan ng impormasyon tungkol sa mga portable na computer, ang kanilang mga functional na tampok, pangunahing pagkakaiba at pangmatagalang prospect ng pag-unlad ay nananatiling hindi maliwanag.
14351. ANINO EKONOMIYA SA MODERN INTERPRETASYON: PAGHAHAMBING PAGSUSURI 186.56 KB
Upang makamit ang nakabalangkas na layunin, ang mga sumusunod na gawain ay itinakda. Una, kinakailangang isaalang-alang ang mga pangunahing dahilan at mga kinakailangan para sa paglitaw ng ekonomiya ng anino. Pangalawa, upang magbigay ng pangkalahatang paglalarawan ng konsepto ng shadow economy phenomenon at ang pang-ekonomiyang katangian nito. Pangatlo, may pangangailangang magsagawa ng makabuluhan at istruktural na pagsusuri sa economic phenomenon na ito
14398. COMPARATIVE ANALYSIS NG GAS FIELDS NG AMUDARYA REGION OF TURKMENISTAN 5.97 MB
Mga paghahambing na katangian ng mga patlang ng gas batay sa Upper at Middle Jurassic na deposito. Ngayon, ang mga pangunahing bagay para sa paghahanap ng mga deposito ng langis at gas ay mga deposito ng Jurassic at Cretaceous. Ang iba pang mga bagay ng rehiyon ng Amudarya, sa kabila ng kanilang mga prospect, ay nananatiling naghihintay ng pagbabarena at pagtuklas ng mga patlang ng langis at gas sa Cenozoic...
20554. Comparative analysis ng mga diskarte sa pagtukoy ng mga kinakailangan sa margin para sa mga derivatives na portfolio 275.48 KB
Ang mga central counterparty ay nagsisilbi sa mga merkado na kadalasang naiiba nang malaki sa parehong microstructure at hanay ng mga instrumentong pinansyal na may iba't ibang profile ng panganib: mga spot market na may T+ execution mode, mga instrumento sa money market (halimbawa, mga repo), exchange-traded at over-the-counter derivatives
19049. COMPARATIVE ANALYSIS AT ASSESSMENT NG MGA KATANGIAN NG PAGGANAP NG PC POWER SUPPLY units 1.04 MB
Ang modernong power supply ay isang switching unit, hindi isang power unit. Ang yunit ng pulso ay naglalaman ng higit pang mga electronics at may mga pakinabang at disadvantage nito. Kasama sa mga pakinabang ang magaan na timbang at ang posibilidad ng tuluy-tuloy na supply ng kuryente sa panahon ng pagbaba ng boltahe. Ang mga disadvantages ay wala silang masyadong mahabang buhay ng serbisyo kumpara sa mga power unit dahil sa pagkakaroon ng electronics.
16100. Demand para sa mga serbisyo sa edukasyon sa Russia: comparative econometric analysis 228.72 KB
Data at mga variable na ginamit Upang pag-aralan ang mga paggasta ng mga sambahayan ng Russia sa mga serbisyong pang-edukasyon, ginamit ang data mula sa isang regular na sample micro survey ng mga badyet ng sambahayan ng Federal State Statistics Service ng Russian Federation para sa 2007. Binago ang variable upang maalis ang mga outlier sa sample at makakuha ng mas matatag na resulta ng pagtatantya. Mga modelo at resulta Heckman model Upang matantya ang pangangailangan ng sambahayan para sa edukasyon, pinili ang modelong Heckman, ang mga variable na may mga asterisk ay hindi mapapansin...

Ang pangunahing layunin ng multiple regression ay ang bumuo ng isang modelo na may malaking bilang ng mga salik at tukuyin ang impluwensya ng bawat salik nang hiwalay sa resulta, pati na rin matukoy ang kabuuang epekto ng mga salik sa nakamodelong indicator.

Kasama sa detalye ng isang multiple regression model ang pagpili ng isang factor at ang pagpili ng uri ng mathematical function (pagpipilian ng uri ng regression equation). Ang mga salik na kasama sa maramihang regression ay dapat na masusukat sa dami at hindi dapat magkakaugnay, higit na hindi nasa isang eksaktong functional na koneksyon (ibig sabihin, dapat nilang impluwensyahan ang isa't isa sa mas maliit na lawak, at sa mas malaking lawak ay nakakaimpluwensya sa resultang katangian).

Ang mga salik na kasama sa maramihang pagbabalik ay dapat ipaliwanag ang pagkakaiba-iba sa independiyenteng baryabol. Halimbawa, kung ang isang modelo ay binuo na may isang hanay ng mga - mga kadahilanan, pagkatapos ay ang halaga ng tagapagpahiwatig ng pagpapasiya ay matatagpuan para dito, na nag-aayos ng bahagi ng ipinaliwanag na pagkakaiba-iba ng nagresultang katangian dahil sa - mga kadahilanan.

Ang impluwensya ng iba pang hindi nabilang na mga kadahilanan sa modelo ay tinatantya bilang katumbas na natitirang pagkakaiba.

Kapag ang isang karagdagang kadahilanan ay kasama sa modelo, ang halaga ng tagapagpahiwatig ng pagpapasiya ay dapat tumaas, at ang halaga ng natitirang pagkakaiba ay dapat bumaba. Kung hindi ito mangyayari, kung gayon ang karagdagang kadahilanan ay hindi nagpapabuti sa modelo at halos hindi kailangan, at ang pagpapakilala ng naturang kadahilanan ay maaaring humantong sa hindi gaanong kahalagahan ng istatistika ng mga parameter ng regression ayon sa t-test ng Estudyante.

Ang pagpili ng mga kadahilanan para sa maramihang pagbabalik ay isinasagawa sa dalawang yugto:

1. Pinipili ang mga salik batay sa kakanyahan ng problema.

2. Batay sa matrix ng mga tagapagpahiwatig ng ugnayan, ang mga istatistika para sa mga parameter ng regression ay tinutukoy.

Ang mga coefficient ng ugnayan sa pagitan ng mga paliwanag na variable, na tinatawag ding mga intercorrelation coefficient, ay ginagawang posible na ibukod ang mga duplicate na salik mula sa modelo.

Ang dalawang variable ay sinasabing malinaw na collinear kung ang coefficient ng ugnayan ay .

Kung ang mga variable ay malinaw na collinear, kung gayon sila ay nasa isang malakas na linear na relasyon.



Sa pagkakaroon ng malinaw na mga variable na collinear, ang kagustuhan ay ibinibigay hindi sa kadahilanan na mas malapit na nauugnay sa resulta, ngunit sa kadahilanan na may hindi bababa sa malapit na kaugnayan sa iba pang mga kadahilanan.

Batay sa magnitude ng pairwise correlation coefficients, ang malinaw na collinearity ng mga salik lamang ang ipinahayag.

Kapag gumagamit ng maraming regression, maaaring lumitaw ang multicollaterality ng mga katotohanan, i.e. higit sa dalawang salik ang nauugnay sa isa't isa sa pamamagitan ng isang linear na relasyon. Sa ganitong mga kaso, nagiging hindi gaanong maaasahan ang OLS kapag tinatantya ang mga indibidwal na salik, na nagreresulta sa kahirapan sa pagbibigay kahulugan sa maramihang mga parameter ng regression bilang mga katangian ng pagkilos ng isang salik sa purong anyo nito. Ang mga parameter ng linear regression ay nawawalan ng pang-ekonomiyang kahulugan, ang mga pagtatantya ng parameter ay hindi mapagkakatiwalaan, ang malalaking karaniwang mga error ay lumitaw, na maaaring magbago sa mga pagbabago sa dami ng mga obserbasyon, i.e. nagiging hindi angkop ang modelo para sa pagsusuri at pagtataya ng sitwasyong pang-ekonomiya. Upang masuri ang multicollaterality ng isang kadahilanan, ang mga sumusunod na pamamaraan ay ginagamit:

1. Pagpapasiya ng matrix ng mga ipinares na coefficient ng ugnayan sa pagitan ng mga salik, halimbawa, kung ang isang linear na multiple regression na modelo ay tinukoy, ang determinant ng matrix ng mga ipinares na coefficient ay kukuha ng anyo:

Kung ang halaga ng determinant na ito ay 1

,

pagkatapos ay ang mga kadahilanan ay hindi collinear sa bawat isa.

Kung mayroong isang kumpletong linear na relasyon sa pagitan ng mga kadahilanan, kung gayon ang lahat ng mga coefficient ng ugnayan ng pares ay katumbas ng 1, na nagreresulta sa

.

2. Paraan para sa pagsubok ng hypothesis ng pagsasarili ng mga variable. Sa kasong ito, ang null hypothesis ay pinatunayan na ang halaga ay may tinatayang distribusyon na may bilang ng mga antas ng kalayaan.

Kung , pagkatapos ay tinanggihan ang null hypothesis.

Sa pamamagitan ng pagtukoy at paghahambing ng mga coefficient ng maramihang pagpapasiya ng isang salik, gamit ang sunud-sunod na bawat isa sa mga salik bilang isang dependent variable, posibleng matukoy ang mga salik na responsable para sa multicollaterality, i.e. salik na may pinakamalaking halaga.

Mayroong mga sumusunod na paraan upang malampasan ang malakas na ugnayan ng interfactor:

1) pagbubukod ng isa o higit pang data mula sa modelo;

2) pagbabago ng mga kadahilanan upang mabawasan ang ugnayan;

3) pagsasama-sama ng mga equation ng regression na magpapakita hindi lamang sa mga salik, kundi pati na rin sa kanilang pakikipag-ugnayan;

4) paglipat ng pinababang form na equation, atbp.

Kapag gumagawa ng multiple regression equation, isa sa pinakamahalagang hakbang ay ang pagpili ng mga salik na kasama sa modelo. Iba't ibang mga diskarte sa pagpili ng mga kadahilanan batay sa mga tagapagpahiwatig ng ugnayan sa iba't ibang mga pamamaraan, kung saan ang pinaka naaangkop:

1) Paraan ng pagbubukod - ang data ay sinasala;

2) Paraan ng pagsasama - isang karagdagang kadahilanan ay ipinakilala;

3) Stepwise regression analysis - ibukod ang naunang ipinakilala na salik.

Kapag pumipili ng mga kadahilanan, ginagamit ang sumusunod na panuntunan: ang bilang ng mga kadahilanan na kasama ay karaniwang 6-7 beses na mas mababa kaysa sa dami ng populasyon kung saan binuo ang modelo.

Ang parameter ay hindi napapailalim sa pang-ekonomiyang interpretasyon. Sa isang modelo ng power-law, isang nonlinear na multiple regression equation, ang mga coefficient , ,..., ay mga elasticity coefficient na nagpapakita kung gaano, sa karaniwan, ang resulta ay magbabago kapag ang katumbas na salik ay nagbago ng 1%, na may impluwensya ng iba mga kadahilanan na nananatiling hindi nagbabago.

Ang isa sa mga pangunahing pagpapalagay para sa pagbuo ng isang modelo ng husay ay ang wastong (magandang) detalye ng equation ng regression. Ang wastong espesipikasyon ng isang equation ng regression ay nangangahulugan na sa pangkalahatan ay wastong sinasalamin nito ang kaugnayan sa pagitan ng variable ng interes at ng mga paliwanag na salik na kasangkot sa modelo. Ito ay isang kinakailangang paunang kinakailangan para sa karagdagang pagtatasa ng husay ng modelo ng regression.

Ang maling pagpili ng isang functional form o set ng mga variable na nagpapaliwanag ay tinatawag mga error sa pagtutukoy, ang mga pangunahing uri nito ay.

  • 1. Pag-drop ng isang makabuluhang variable. Ang kakanyahan ng pagkakamaling ito at ang mga kahihinatnan nito ay malinaw na inilalarawan ng sumusunod na halimbawa. Hayaan ang teoretikal na modelo na sumasalamin sa pag-asa sa ekonomiya na isinasaalang-alang na magkaroon ng anyo

Ang modelong ito ay tumutugma sa sumusunod na empirical regression equation:

Ang mananaliksik, sa ilang kadahilanan (kakulangan ng impormasyon, mababaw na kaalaman tungkol sa paksa ng pananaliksik, atbp.) ay naniniwala na ang variable Y ay talagang apektado lamang ng variable X y Ito ay limitado sa pagsasaalang-alang sa modelo

Kasabay nito, hindi niya isinasaalang-alang ang X2 variable bilang isang paliwanag na variable, na nagkakamali sa pagtatapon ng isang mahalagang variable.

Hayaang magkaroon ng anyo ang empirical regression equation na tumutugma sa theoretical equation (9.28).

Ang mga kahihinatnan ng error na ito ay medyo seryoso. Ang mga pagtatantya na nakuha gamit ang OLS gamit ang equation (9.29) ay biased (M[y* 0 ] F b 0 , M[y*] F b g) at hindi kapani-paniwala kahit na may walang katapusang malaking bilang ng mga pagsubok. Dahil dito, ang mga posibleng pagtatantya ng agwat at ang mga resulta ng pagsubok sa kaukulang hypotheses ay magiging hindi mapagkakatiwalaan.

Ang mga kahihinatnan ng error na ito ay hindi magiging seryoso tulad ng sa nakaraang kaso. Mga pagtatantya ng 0, ang mga coefficient na natagpuan para sa modelo (9.30) ay nananatiling, bilang panuntunan, walang kinikilingan (M = b 0, M[y* 1 ] = b 1) at mayaman. Gayunpaman, bababa ang kanilang katumpakan, habang tataas ang mga karaniwang error, ibig sabihin, ang mga pagtatantya ay magiging hindi mabisa, na makakaapekto sa kanilang katatagan. Ang konklusyong ito ay lohikal na sumusunod mula sa pagkalkula ng mga pagkakaiba-iba ng mga pagtatantya ng coefficient ng regression para sa mga equation na ito:

Dito rXiX2- koepisyent ng ugnayan sa pagitan ng mga paliwanag na variable X 1 at X 2.

Samakatuwid, at ang pantay na tanda ay posible

kailan lang

Ang isang pagtaas sa pagpapakalat ng mga pagtatantya ay maaaring humantong sa mga maling resulta ng pagsubok ng mga hypotheses tungkol sa mga halaga ng mga coefficient ng regression at isang pagpapalawak ng mga pagtatantya ng agwat.

3. Pagpili ng maling functional form. Inilalarawan namin ang kakanyahan ng error sa sumusunod na halimbawa. Hayaang may form ang tamang regression model

Anumang iba pang dependence na may parehong mga variable, ngunit ang pagkakaroon ng ibang functional form, ay humahantong sa isang pagbaluktot ng tunay na dependence. Halimbawa, sa mga sumusunod na equation

nagkamali sa pagpili ng maling functional form ng regression equation. Ang mga kahihinatnan ng error na ito ay magiging napakaseryoso. Karaniwan, ang ganitong error ay humahantong sa alinman sa mga bias na pagtatantya o sa pagkasira ng mga istatistikal na katangian ng mga pagtatantya ng mga coefficient ng regression at iba pang mga tagapagpahiwatig ng kalidad ng equation. Pangunahing sanhi ito ng paglabag sa mga kondisyon ng Gauss-Markov para sa mga paglihis. Ang mga predictive na katangian ng modelo sa kasong ito ay napakababa.

Kapag gumagawa ng mga equation ng regression, lalo na sa mga unang yugto, ang mga error sa espesipikasyon ay kadalasang ginagawa dahil sa mababaw na kaalaman tungkol sa mga prosesong pang-ekonomiya na pinag-aaralan, o dahil sa hindi sapat na binuong teorya, o dahil sa mga pagkakamali sa pangongolekta at pagproseso ng istatistikal na datos kapag bumubuo ng isang empirical regression equation. Mahalagang matukoy at maitama ang mga error na ito. Ang pagiging kumplikado ng pamamaraan ng pagtuklas ay tinutukoy ng uri ng error at ang aming kaalaman sa bagay na pinag-aaralan.

Kung mayroong isang hindi gaanong variable sa isang equation ng regression, ito ay lalabas na may mababang t-statistic. Sa hinaharap, ang variable na ito ay hindi kasama sa pagsasaalang-alang.

Kung mayroong ilang hindi gaanong istatistikal na nagpapaliwanag na mga variable sa equation, kung gayon ang isa pang regression equation ay dapat na bumuo nang walang mga hindi gaanong kabuluhan na mga variable na ito. Pagkatapos, gamit ang F-statistics, ang mga coefficient ng determinasyon para sa paunang at karagdagang mga equation ng regression ay inihahambing.

kung saan ang n ay ang bilang ng mga obserbasyon;

ha - ang bilang ng mga paliwanag na variable sa orihinal na equation;

Upang-- ang bilang ng mga paliwanag na variable na itinapon mula sa orihinal na equation.

Ang mga posibleng pangangatwiran at konklusyon para sa sitwasyong ito ay ibinibigay sa talata 6.7.2.

Gayunpaman, ang pagsasagawa ng mga pagsusuring ito ay makatuwiran lamang sa tamang pagpili ng uri (functional form) ng equation ng regression, na maaaring gawin kung ito ay naaayon sa teorya. Halimbawa, kapag gumagawa ng kurba ng Phillips na nagtatatag ng ugnayan sa pagitan ng sahod Y at kawalan ng trabaho X, ay ang kabaligtaran. Posible ang mga sumusunod na modelo:

Tandaan na ang pagpili ng modelo ay hindi palaging isinasagawa nang hindi malabo at sa hinaharap ay kinakailangan na ihambing ang modelo sa parehong teoretikal at empirikal na data at pagbutihin ito. Alalahanin natin na kapag tinutukoy ang kalidad ng isang modelo, ang mga sumusunod na parameter ay karaniwang sinusuri:

  • a) nababagay na koepisyent ng pagpapasiya I;
  • b) t-istatistika;
  • c) Mga istatistika ng Durbin-Watson DW;
  • d) pagkakapare-pareho ng mga palatandaan ng mga coefficient sa teorya;
  • e) mga predictive na katangian (mga error) ng modelo.

Kung ang lahat ng mga tagapagpahiwatig na ito ay kasiya-siya, kung gayon ang modelong ito ay maaaring imungkahi upang ilarawan ang tunay na prosesong pinag-aaralan. Kung ang alinman sa mga katangian na inilarawan sa itaas ay hindi kasiya-siya, iyon ay, may dahilan upang pagdudahan ang kalidad ng modelong ito (ang functional form ng equation ay hindi wastong napili; isang mahalagang paliwanag na variable ay hindi isinasaalang-alang; mayroong isang paliwanag na variable. na walang makabuluhang epekto sa dependent variable).

  • Pagdaragdag ng isang hindi makabuluhang variable. Sa ilang mga kaso, masyadong maraming mga paliwanag na variable ang kasama sa mga equation ng regression, at hindi palaging makatwiran. Halimbawa, ang teoretikal na modelo ay may sumusunod na anyo. Hayaang palitan ito ng mananaliksik ng isang mas kumplikadong modelo: sabay na pagdaragdag ng paliwanag na variable na X2 na walang tunay na epekto sa Y. Sa kasong ito, ang error sa pagdaragdag ng isang hindi mahalagang variable ay ginawa.