Matricea coeficienților de corelație în econometrie. Având în vedere o matrice de coeficienți de corelație perechi

Factorii coliniari sunt...

Decizie:

Se presupune că două variabile sunt clar coliniare, adică. sunt liniar legate între ele dacă . În modelul nostru, doar coeficientul de regresie liniară pereche între factori este mai mare de 0,7. , de unde factorii și sunt coliniari.

4. În modelul de regresie multiplă, determinantul matricei coeficienților de corelație perechi între factorii , și este aproape de zero. Aceasta înseamnă că factorii și...

multicoliniare

independent

cuantificabile

Decizie:

Pentru a evalua multicoliniaritatea factorilor se poate folosi determinantul matricei coeficienților de corelație perechi între factori. Dacă factorii nu sunt corelați între ei, atunci matricea coeficienților de corelație perechi între factori ar fi unică. Deoarece toate elementele off-diagonale ar fi egal cu zero.
, deoarece = = și = = =0.
Dacă există o dependență liniară completă între factori și toți coeficienții de corelație de pereche sunt egali cu unu, atunci determinantul unei astfel de matrice este egal cu zero.


Cu cât determinantul matricei de corelație interfactorială este mai aproape de zero, cu atât multicoliniaritatea factorilor este mai puternică și rezultatele regresiei multiple sunt mai nesigure. În schimb, cu cât determinantul matricei de corelație interfactorială este mai aproape de unul, cu atât multicoliniaritatea factorilor este mai mică.

5. Pentru modelul econometric al unei ecuații de regresie multiplă liniară, o matrice de coeficienți de corelație liniară perechi ( y este variabila dependentă; x (1),x (2), x (3), x(4)- variabile independente):


Variabile independente (explicative) coliniare (strâns legate). nu sunt

x(2)și x(3)

x(1)și x(3)

x(1)și x(4)

x(2)și x(4)

Decizie:

La construirea unui model de regresie multiplă, este necesar să se excludă posibilitatea unei relații liniare strânse între variabile independente (explicative), ceea ce duce la problema multicoliniarității. În același timp, se verifică coeficienții de corelație liniară pentru fiecare pereche de variabile independente (explicative). Aceste valori sunt reflectate în matricea coeficienților de corelație liniară pe perechi. Se crede că prezența coeficienților de corelație de pereche între variabilele explicative care depășesc 0,7 în valoare absolută reflectă o relație strânsă între aceste variabile (apropierea relației cu variabila y nefiind luate în considerare în acest caz). Astfel de variabile independente se numesc coliniare. Dacă valoarea coeficientului de corelație de pereche între variabilele explicative nu depășește 0,7 în valoare absolută, atunci astfel de variabile explicative nu sunt coliniare. Să luăm în considerare valorile coeficienților de pereche de corelație interfactorială: între x(1)și x(2) valoarea este 0,45; între x(1)și x(3)- egal cu 0,82; între x(1)și x(4)- egal cu 0,94; între x(2)și x(3)– egal cu 0,3; între x(2)și x(4)- egal cu 0,7; între x(3)și x(4) este egal cu 0,12. Astfel, valorile, , , nu depășesc 0,7. Prin urmare, coliniar nu sunt factori x(1)și x(2), x(2)și x(3), x(3)și x(4). Dintre ultimele perechi enumerate, există o pereche în opțiunile de răspuns x(2)și x(3) este raspunsul corect. Pentru alte cupluri: x(1și x(3), x(1)și x(4), x(2)și x(4)- valorile coeficienților de pereche de corelație interfactorială depășesc 0,7, iar acești factori sunt coliniari.

Subiectul 3: Variabile fictive

1. Având în vedere un tabel de date inițiale pentru construirea unui model de regresie econometrică:

variabile fictive nu sunt

experiență de muncă

productivitatea muncii

nivelul de educație

nivelul de calificare al angajatului

Decizie:

La construirea unui model de regresie poate apărea o situație când este necesară includerea în ecuație, pe lângă variabilele cantitative, a unor variabile care reflectă unele trăsături atributive (sex, educație, regiune etc.). Asemenea variabile calitative sunt numite variabile „dummy”. Pentru a construi modelul specificat în enunțul sarcinii, se folosesc variabile fictive: nivelul de educație și nivelul de calificare al angajatului. Alte variabile nu sunt fictiv, dintre opțiunile propuse este vechimea în muncă și productivitatea muncii.

2. Atunci când studiem dependența consumului de carne de nivelul veniturilor și genul consumatorului, putem recomanda...

utilizați o variabilă inactivă - sexul consumatorului

împărțiți populația în două: pentru consumatorii de sex feminin și pentru consumatorii bărbați

utilizați o variabilă inactivă - nivelul venitului

exclude din considerare sexul consumatorului, deoarece acest factor nu poate fi măsurat cantitativ

Decizie:

La construirea unui model de regresie poate apărea o situație când este necesară includerea în ecuație, pe lângă variabilele cantitative, a unor variabile care reflectă unele trăsături atributive (sex, educație, regiune etc.). Asemenea variabile calitative sunt numite variabile „dummy”. Ele reflectă eterogenitatea populației statistice studiate și sunt utilizate pentru o mai bună modelare a dependențelor în astfel de obiecte de observație eterogene. Atunci când modelați dependențe individuale de date eterogene, puteți utiliza și metoda de împărțire a întregii colecții de date eterogene în mai multe colecții separate, al căror număr este egal cu numărul de stări ale variabilei fictive. Astfel, răspunsurile corecte sunt: ​​„folosește o variabilă inactivă – genul consumatorului” și „împarte populația în două: pentru consumatorii de sex feminin și pentru consumatorii bărbați”.

3. Studiem dependența prețului apartamentului ( la) din zona ei de locuit ( X) și tipul casei. Modelul include variabile fictive care reflectă tipurile de case considerate: monolit, panou, cărămidă. Se obține ecuația de regresie: ,
Unde ,
Ecuații particulare de regresie pentru cărămidă și monolitic sunt ...

pentru caramida tip casa

pentru casa tip monolitic

pentru caramida tip casa

pentru casa tip monolitic

Decizie:

Este necesar să se afle ecuația de regresie privată pentru cărămidă și case monolitice. Pentru o casă din cărămidă, valorile variabilelor fictive sunt după cum urmează , . Ecuația va lua forma: sau pentru tipul de casă din cărămidă.
Pentru o casă monolitică, valorile variabilelor fictive sunt după cum urmează , . Ecuația va lua forma
sau pentru tipul de casă monolitică.

Coeficientul de corelație reflectă gradul de relație dintre doi indicatori. Ia întotdeauna o valoare de la -1 la 1. Dacă coeficientul este situat lângă 0, atunci se spune că nu există nicio legătură între variabile.

Dacă valoarea este aproape de unu (de la 0,9, de exemplu), atunci există o relație directă puternică între obiectele observate. Dacă coeficientul este aproape de celălalt punct extrem al intervalului (-1), atunci există o relație inversă puternică între variabile. Când valoarea este undeva la mijloc de la 0 la 1 sau de la 0 la -1, atunci vorbim de o relație slabă (înainte sau inversă). Această relație de obicei nu este luată în considerare: se consideră că nu există.

Calculul coeficientului de corelare în Excel

Luați în considerare, de exemplu, metode de calcul al coeficientului de corelație, caracteristici ale relației directe și inverse dintre variabile.

Valorile indicatorilor x și y:

Y este variabila independentă, x este variabila dependentă. Este necesar să se găsească puterea (puternic / slab) și direcția (înainte / invers) a relației dintre ele. Formula pentru coeficientul de corelare arată astfel:


Pentru a-i simplifica înțelegerea, îl vom împărți în câteva elemente simple.

Există o relație directă puternică între variabile.

Funcția CORREL încorporată evită calculele complicate. Să calculăm coeficientul de corelație de pereche în Excel folosindu-l. Numim maestru al funcțiilor. Găsim ceea ce ne trebuie. Argumentele funcției sunt o matrice de valori y și o matrice de valori x:

Să arătăm valorile variabilelor pe diagramă:


Există o relație puternică între y și x, deoarece Liniile sunt aproape paralele între ele. Relația este directă: creșterea y - creșterea x, descreșterea y - descreșterea x.



Matricea coeficienților de corelație pe perechi în Excel

Matricea de corelație este un tabel, la intersecția rândurilor și coloanelor cărora se află coeficienții de corelație între valorile corespunzătoare. Este logic să-l construiți pentru mai multe variabile.

Matricea coeficienților de corelație în Excel este construită folosind instrumentul „Corelation” din pachetul „Data Analysis”.


S-a găsit o relație directă puternică între valorile lui y și x1. Există un feedback puternic între x1 și x2. Practic nu există nicio legătură cu valorile din coloana x3.

y X (1) X (2) X (3) X (4) X (5)
y 1.00 0.43 0.37 0.40 0.58 0.33
X (1) 0.43 1.00 0.85 0.98 0.11 0.34
X (2) 0.37 0.85 1.00 0.88 0.03 0.46
X (3) 0.40 0.98 0.88 1.00 0.03 0.28
X (4) 0.58 0.11 0.03 0.03 1.00 0.57
X (5) 0.33 0.34 0.46 0.28 0.57 1.00

O analiză a matricei coeficienților de corelație perechi arată că indicatorul de performanță este cel mai strâns legat de indicator X(4) - cantitatea de îngrășăminte utilizată la 1 ha ().

În același timp, relația dintre trăsături-argumente este destul de strânsă. Deci, există practic o relație funcțională între numărul de tractoare cu roți ( X(1)) și numărul de instrumente de prelucrare a solului de suprafață .

Prezența multicoliniarității este evidențiată și de coeficienții de corelație și . Având în vedere relația strânsă a indicatorilor X (1) , X(2) și X(3) , doar unul dintre ei poate intra în modelul de regresie a randamentului.

Pentru a demonstra impactul negativ al multicolinearității, luați în considerare un model de regresie a randamentului care include toate intrările:

Fobs = 121.

În paranteză sunt valorile estimărilor corectate ale abaterilor standard ale estimărilor coeficienților ecuației .

Sub ecuația de regresie sunt prezentați următorii parametri de adecvare: coeficientul de determinare multiplu; estimarea corectată a varianței reziduale, eroarea medie de aproximare relativă și valoarea calculată a criteriului Fobs = 121.

Ecuația de regresie este semnificativă deoarece F obl = 121 > F kp = 2,85 găsit din tabel F- distributii la a=0,05; n 1 =6 și n 2 =14.

De aici rezultă că Q¹0, adică și cel puțin unul dintre coeficienții ecuației q j (j= 0, 1, 2, ..., 5) nu este egal cu zero.

Pentru a testa ipoteza despre semnificația coeficienților individuali de regresie H0: q j =0, unde j=1,2,3,4,5, comparați valoarea critică t kp = 2,14, găsit din tabel t-distribuţii la nivelul de semnificaţie a=2 Q=0,05 și numărul de grade de libertate n=14, cu valoarea calculată . Din ecuație rezultă că coeficientul de regresie este semnificativ statistic doar atunci când X(4) din ½ t 4½=2,90 > t kp=2,14.



Semnele negative ale coeficienților de regresie la X(1) și X(5) . Din valorile negative ale coeficienților rezultă că o creștere a saturației agriculturii cu tractoare cu roți ( X(1)) și produse fitosanitare ( X(5)) afectează negativ randamentul. Astfel, ecuația de regresie rezultată este inacceptabilă.

Pentru a obține o ecuație de regresie cu coeficienți semnificativi, folosim un algoritm de analiză de regresie pas cu pas. Inițial, folosim un algoritm pas cu pas cu eliminarea variabilelor.

Excludeți o variabilă din model X(1) , care corespunde valorii minime absolute de ½ t 1½=0,01. Pentru variabilele rămase, vom construi din nou ecuația de regresie:

Ecuația rezultată este semnificativă, deoarece F obs = 155 > F kp = 2,90, găsit la un nivel de semnificație a=0,05 și numere de grade de libertate n 1 =5 și n 2 =15 conform tabelului F-distributii, i.e. vector q¹0. Cu toate acestea, doar coeficientul de regresie este semnificativ în ecuația la X(4) . Valori calculate ½ t j ½ pentru alți coeficienți mai mici decât t kr = 2,131 găsite în tabel t-distributii pentru a=2 Q=0,05 și n=15.

Excluderea unei variabile din model X(3) , care corespunde valorii minime t 3 =0,35 și obțineți ecuația de regresie:

(2.9)

În ecuația rezultată, nu este semnificativă statistic și nu putem interpreta economic coeficientul la X(5) . Excluzând X(5) obținem ecuația de regresie:

(2.10)

Am obținut o ecuație de regresie semnificativă cu coeficienți semnificativi și interpretabili.

Cu toate acestea, ecuația rezultată nu este singurul model de randament „bun” sau „cel mai bun” din exemplul nostru.

Să arătăm asta în condiţia multicoliniarităţii, algoritmul pas cu pas cu includerea variabilelor este mai eficient. Primul pas în modelul de randament y include o variabilă X(4) , care are cel mai mare coeficient de corelație cu y, explicat prin variabila - r(y,X(4))=0,58. În a doua etapă, inclusiv ecuația împreună cu X(4) variabile X(1) sau X(3) , vom obține modele superioare (2.10) din motive economice și caracteristici statistice:

(2.11)

(2.12)

Includerea oricăreia dintre cele trei variabile rămase în ecuație își înrăutățește proprietățile. Vezi, de exemplu, ecuația (2.9).

Astfel, avem trei modele de randament „bun”, dintre care unul trebuie ales din motive economice și statistice.

Conform criteriilor statistice, modelul (2.11) este cel mai adecvat. Ea corespunde valorilor minime ale varianței reziduale = 2,26 și erorii relative medii de aproximare și celor mai mari valori și Fobs = 273.

Modelul (2.12) are indicatori de adecvare ceva mai răi, iar apoi modelul (2.10).

Vom alege acum cel mai bun dintre modele (2.11) și (2.12). Aceste modele diferă unele de altele în variabile X(1) și X(3) . Cu toate acestea, în modelele de randament, variabila X(1) (număr de tractoare cu roți la 100 ha) este de preferat variabilă X(3) (număr de instrumente de prelucrare a solului la 100 ha), care este oarecum secundar (sau derivat din X (1)).

În acest sens, din motive economice, ar trebui să se acorde preferință modelului (2.12). Astfel, după implementarea algoritmului de analiză a regresiei în trepte cu includerea variabilelor și ținând cont de faptul că doar una dintre cele trei variabile aferente ar trebui să intre în ecuație ( X (1) , X(2) sau X(3)) alegeți ecuația finală de regresie:

Ecuația este semnificativă la a=0,05, deoarece F obl = 266 > F kp = 3,20 găsit din tabel F-distribuţii pentru a= Q=0,05; n 1 =3 și n 2 =17. Toți coeficienții de regresie sunt de asemenea semnificativi în ecuația ½ t j½> t kp (a=2 Q=0,05; n=17)=2,11. Coeficientul de regresie q 1 ar trebui recunoscut ca fiind semnificativ (q 1 ¹0) din motive economice, în timp ce t 1 = 2,09 doar puțin mai puțin t kp = 2,11.

Din ecuația de regresie rezultă că o creștere pe unitate a numărului de tractoare la 100 de hectare de teren arabil (cu valoare fixă X(4)) conduce la o creștere a randamentelor de cereale cu o medie de 0,345 c/ha.

Un calcul aproximativ al coeficienților de elasticitate e 1 „0,068 și e 2” 0,161 arată că odată cu creșterea indicatorilor X(1) și X(4) cu 1%, randamentul cerealelor crește în medie cu 0,068%, respectiv 0,161%.

Coeficientul multiplu de determinare indică faptul că doar 46,9% din variația randamentului este explicată de indicatorii incluși în model ( X(1) și X(4)), adică saturarea producției vegetale cu tractoare și îngrășăminte. Restul variației se datorează acțiunii unor factori necontabiliați ( X (2) , X (3) , X(5), condițiile meteorologice etc.). Eroarea medie de aproximare relativă caracterizează adecvarea modelului, precum și valoarea varianței reziduale. La interpretarea ecuației de regresie sunt de interes valorile erorilor relative de aproximare . Reamintim că - valoarea modelului indicatorului efectiv caracterizează valoarea medie a productivității pentru totalitatea zonelor luate în considerare, cu condiția ca valorile variabilelor explicative X(1) și X(4) fixat la același nivel și anume X (1) = x i(1) și X (4) = x i(4) . Apoi, pentru valorile lui d i randamentele pot fi comparate. Zonele care corespund valorilor d i>0, au un randament peste medie și d i<0 - ниже среднего.

În exemplul nostru, producția de culturi este cea mai eficientă în zona corespunzătoare lui d 7 \u003d 28%, unde randamentul este cu 28% mai mare decât media pentru regiune și cel mai puțin eficient - în zona cu d 20 =-27,3%.


Sarcini și exerciții

2.1. Din populația generală ( y, X (1) , ..., X(p)), unde y are o lege de distribuție normală cu așteptări matematice condiționate și varianță s 2 , un eșantion aleatoriu de volum n, lăsați-l să plece ( y eu, x i (1) , ..., x i(p)) - rezultat i a-a observație ( i=1, 2, ..., n). Determinați: a) așteptarea matematică a estimării celor mai mici pătrate ale vectorului q; b) matricea de covarianță a estimării celor mai mici pătrate ale vectorului q; c) așteptarea matematică a devizului.

2.2. Conform condiției problemei 2.1, găsiți așteptarea matematică a sumei abaterilor pătrate datorate regresiei, i.e. EQ R, Unde

.

2.3. Conform condiției problemei 2.1, se determină așteptarea matematică a sumei abaterilor pătrate datorate variației reziduale în raport cu dreptele de regresie, i.e. EQ ost unde

2.4. Demonstrați că sub ipoteza Н 0: q=0 statisticile

are o distribuție F cu grade de libertate n 1 =p+1 și n 2 =n-p-1.

2.5. Demonstrați că atunci când ipoteza H 0: q j =0 este îndeplinită, statistica are o distribuție t cu numărul de grade de libertate n=n-p-1.

2.6. Pe baza datelor (Tabelul 2.3) privind dependența de contracția pâinii furajere ( y) cu privire la durata depozitării ( X) găsiți o estimare punctuală a așteptării matematice condiționate în ipoteza că ecuația de regresie generală este liniară.

Tabelul 2.3.

Este necesar: a) să se găsească estimări și varianță reziduală s 2 sub ipoteza că ecuația de regresie generală are forma ; b) verificați pentru a=0,05 semnificația ecuației de regresie, i.e. ipoteza H 0: q=0; c) cu fiabilitate g=0,9 se determină estimările de interval ale parametrilor q 0 , q 1 ; d) cu fiabilitatea g=0,95 se determină intervalul estimat al așteptării condiționate pentru X 0=6; e) determinați la g=0,95 intervalul de încredere al predicției la punctul X=12.

2.7. Pe baza datelor privind dinamica ritmului de creștere a prețului acțiunilor pe 5 luni, prezentate în tabel. 2.4.

Tabelul 2.4.

luni ( X)
y (%)

iar ipoteza că ecuaţia de regresie generală are forma , se cere: a) să se determine estimările şi parametrii ecuaţiei de regresie şi varianţa reziduală s 2 ; b) se verifică la a=0,01 semnificația coeficientului de regresie, i.e. ipotezele H 0: q 1 =0;

c) cu fiabilitatea g=0,95 găsiți estimări de interval ale parametrilor q 0 și q 1 ; d) cu fiabilitatea g = 0,9, stabiliți o estimare pe intervale a așteptărilor matematice condiționate pentru X 0=4; e) determinați la g=0,9 intervalul de încredere al predicției la punctul X=5.

2.8. Rezultatele studiului dinamicii creșterii în greutate la animalele tinere sunt prezentate în Tabelul 2.5.

Tabelul 2.5.

Presupunând că ecuația generală de regresie este liniară, se cere: a) să se determine estimări și parametri ai ecuației de regresie și a varianței reziduale s 2 ; b) verificați pentru a=0,05 semnificația ecuației de regresie, i.e. ipotezele H 0: q=0;

c) cu fiabilitatea g=0,8 pentru a găsi estimări de interval ale parametrilor q 0 și q 1 ; d) cu fiabilitatea g=0,98 determinați și comparați estimările de interval ale așteptării matematice condiționate pentru X 0 =3 și X 1 =6;

e) determinați la g=0,98 intervalul de încredere al predicției la punctul X=8.

2.9. Pretul ( y) un exemplar al cărții, în funcție de tiraj ( X) (mii de exemplare) se caracterizează prin datele culese de editură (Tabelul 2.6). Determinați estimările celor mai mici pătrate și parametrii ecuației de regresie hiperbolice , cu fiabilitatea g=0,9 construiți intervale de încredere pentru parametrii q 0 și q 1 , precum și așteptarea matematică condiționată la X=10.

Tabelul 2.6.

Determinați estimări și parametri ai ecuației de regresie a tipului X=20.

2.11. În tabel. 2,8 au raportat rate de creștere (%) ale următorilor indicatori macroeconomici n\u003d 10 țări dezvoltate ale lumii pentru 1992: PNB - X(1) , producție industrială - X(2) , indicele prețurilor - X (3) .

Tabelul 2.8.

Țări x și parametrii ecuației de regresie, estimarea varianței reziduale; b) verificati la a=0,05 semnificatia coeficientului de regresie, i.e. H0: q1 =0; c) cu fiabilitatea g=0,9 găsiți estimările de interval q 0 și q 1 ; d) găsiți la g=0,95 intervalul de încredere pentru la punctul X 0 =x i, Unde i=5; e) comparați caracteristicile statistice ale ecuațiilor de regresie: 1, 2 și 3.

2.12. Rezolvați problema 2.11, luând în considerare valoarea de explicat ( la) indicator X(1) , iar pentru motive explicative ( X) variabil X (3) .

1. Ayvazyan S.A., Mkhitaryan V.S. Statistica Aplicată și Fundamentele Econometriei: Manual. M., UNITI, 1998 (ediția a II-a 2001);

2. Ayvazyan S.A., Mkhitaryan V.S. Statistica aplicată în probleme și exerciții: manual. M. UNITATE - DANA, 2001;

3. Aivazyan S.A., Enyukov I.S., Meshalkin L.D. Statistici aplicate. Cercetarea dependenței. M., Finanţe şi statistică, 1985, 487p.;

4. Aivazyan S.A., Buchstaber V.M., Enyukov I.S., Meshalkin L.D. Statistici aplicate. Clasificare și reducerea dimensionalității. M., Finanţe şi statistică, 1989, 607p.;

5. Johnston J. Econometric Methods, Moscova: Statistică, 1980, 446 p.;

6. Dubrov A.V., Mkhitaryan V.S., Troshin L.I. Metode statistice multivariate. M., Finanţe şi statistică, 2000;

7. Mkhitaryan V.S., Troshin L.I. Cercetarea dependențelor prin metode de corelare și regresie. M., MESI, 1995, 120 p.;

8. Mkhitaryan V.S., Dubrov A.M., Troshin L.I. Metode statistice multidimensionale în economie. M., MESI, 1995, 149p.;

9. Dubrov A.M., Mkhitaryan V.S., Troshin L.I. Statistici matematice pentru oameni de afaceri și manageri. M., MESI, 2000, 140s.;

10. Lukashin Yu.I. Metode de regresie și previziune adaptivă: Manual, M., MESI, 1997.

11. Lukashin Yu.I. Metode adaptative de prognoză pe termen scurt. - M., Statistică, 1979.


APLICAȚII


Anexa 1. Opțiuni pentru sarcini pentru cercetare independentă pe computer.

1. Calculați matricea coeficienților de corelație perechi; analizați etanșeitatea și direcția relației caracteristicii rezultate Y cu fiecare dintre factori. X; evaluează semnificația statistică a coeficienților de corelație r(Y,X i); alege factorul cel mai informativ.

2. Construiți un model de regresie pereche cu cel mai informativ factor; dați o interpretare economică a coeficientului de regresie.

3. Evaluați calitatea modelului folosind eroarea relativă medie de aproximare, coeficientul de determinare și criteriul F - Fisher (luați nivelul de semnificație α = 0,05).

4. Cu o probabilitate de încredere γ=80% pentru a prezice valoarea medie a indicatorului Y(valorile de prognoză ale factorilor sunt date în Anexa 6). Prezentați grafic valorile reale și de model Y, rezultatele predicției.

5. Folosind metoda includerii, construiți modele cu doi factori, păstrând în ele cel mai informativ factor; construiți un model cu trei factori cu o listă completă de factori.

6. Alegeți cel mai bun dintre modelele multiple construite. Oferiți o interpretare economică a coeficienților săi.

7. Verificați semnificația coeficienților de regresie multiplă folosind t–Testul elevului (se acceptă nivelul de semnificație α=0,05). S-a îmbunătățit calitatea modelului multiplu în comparație cu modelul pereche?

8. Evaluați influența factorilor asupra rezultatului folosind coeficienți de elasticitate, coeficienți beta și delta.

Sarcina 2. Modelarea unei serii temporale unidimensionale

Anexa 7 prezintă seria temporală YT) indicatori socio-economici pentru teritoriul Altai pentru perioada 2000-2011. Este necesar să se studieze dinamica indicatorului corespunzător variantei de sarcină.

Opțiune Denumirea, denumirea, unitatea de măsură a indicatorului
Y1 Cheltuielile medii de consum pe cap de locuitor (pe lună), frecare.
Y2 Emisii de poluanți în aerul atmosferic, mii de tone
Y3 Prețurile medii pe piața secundară a locuințelor (la sfârșitul anului, pe metru pătrat de suprafață totală), frecați
Y4 Volumul serviciilor plătite pe cap de locuitor, rub
Y5 Numărul mediu anual de persoane angajate în economie, mii de persoane
Y6 Număr de mașini proprii la 1000 de persoane (la sfârșitul anului), unități
Y7 Venitul mediu în numerar pe cap de locuitor (pe lună), rub
Y8 Indicele prețurilor de consum (decembrie până în decembrie a anului precedent), %
Y9 Investiții în active fixe (în prețuri reale), milioane de ruble
Y10 Cifra de afaceri în comerțul cu amănuntul pe cap de locuitor (în prețuri reale), rub


Comandă de lucru

1. Construiți un model liniar al seriei de timp, ai cărui parametri sunt estimați prin cele mai mici pătrate. Explicați semnificația coeficientului de regresie.

2. Evaluați caracterul adecvat al modelului construit folosind proprietățile aleatoriei, independenței și corespondența componentei reziduale cu legea distribuției normale.

3. Evaluați acuratețea modelului pe baza utilizării erorii relative medii de aproximare.

4. Prognoza indicatorul luat în considerare pentru un an viitor (calculați intervalul de prognoză cu un nivel de încredere de 70%).

5. Prezentați grafic valorile reale ale indicatorului, rezultatele modelării și previziunii.

6. Calculați parametrii tendințelor logaritmice, polinom (polinom de gradul II), putere, exponențial și hiperbolic. Pe baza imaginii grafice și a valorii indicelui de determinare, selectați cel mai potrivit tip de tendință.

7. Cu ajutorul celui mai bun model neliniar, efectuați prognoza punctuală a indicatorului considerat pentru anul următor. Comparați rezultatul obținut cu intervalul de încredere predictiv construit folosind modelul liniar.

EXEMPLU

Efectuarea lucrărilor de control

Sarcina 1

Compania vinde masini second hand. Denumirile indicatorilor și datele inițiale pentru modelarea econometrică sunt prezentate în tabel:

Pret de realizare, mii uc. ( Y) Prețul unei mașini noi, mii uc. ( X1) Durata de viata, ani ( x2) Volant pe stanga - 1, volan pe dreapta - 0, ( X3)
8,33 13,99 3,8
10,40 19,05 2,4
10,60 17,36 4,5
16,58 25,00 3,5
20,94 25,45 3,0
19,13 31,81 3,5
13,88 22,53 3,0
8,80 16,24 5,0
13,89 16,54 2,0
11,03 19,04 4,5
14,88 22,61 4,6
20,43 27,56 4,0
14,80 22,51 3,3
26,05 31,75 2,3

Necesar:

1. Calculați matricea coeficienților de corelație perechi; analizați etanșeitatea și direcția relației caracteristicii rezultate Y cu fiecare dintre factorii X; se evaluează semnificația statistică a coeficienților de corelație r(Y, X i); alege factorul cel mai informativ.

Folosind Excel (Date / Analiza datelor / CORELARE):

Să obținem o matrice de coeficienți de corelație de pereche între toate variabilele disponibile:

La X1 x2 X3
La
X1 0,910987
x2 -0,4156 -0,2603
X3 0,190785 0,221927 -0,30308

Să analizăm coeficienții de corelație dintre caracteristica rezultată Yși fiecare dintre factori X j:

> 0, prin urmare, între variabile Yși X 1 există o corelație directă: cu cât prețul unei mașini noi este mai mare, cu atât este mai mare prețul de vânzare.

> 0,7 - această dependență este apropiată.

< 0, значит, между переменными Yși X 2 observat

corelație inversă: prețul de vânzare este mai mic pentru auto-

telefoane mobile cu o durată lungă de viață.

– această dependență este moderată, mai aproape de slabă.

> 0, deci între variabile Yși X 3 arată o corelație directă: prețul de vânzare este mai mare pentru mașinile cu volan pe stânga.

< 0,4 – эта зависимость слабая.

Pentru a verifica semnificația coeficienților de corelație găsiți, folosim testul Student.

Pentru fiecare coeficient de corelare calcula t-statistici prin formula și introduceți rezultatele calculului într-o coloană suplimentară a tabelului de corelare:

La X1 x2 X3 t-statistici
La
X1 0,910987 7,651524603
x2 -0,4156 -0,2603 1,582847988
X3 0,190785 0,221927 -0,30308 0,673265587

Conform tabelului punctelor critice ale distribuţiei Student la nivel de semnificaţie și numărul de grade de libertate, determinăm valoarea critică (Anexa 1, sau funcția STUDRASP).Y și durata de viață X 2 este de încredere.

< , следовательно, коэффициент не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой реализации Y si pozitia volanului X 3 este de încredere.

Astfel, cea mai apropiată și semnificativă relație se observă între prețul de vânzare Yși prețul unei mașini noi X unu ; factor X 1 este cel mai informativ.

Regresia multiplă nu este rezultatul unei transformări a ecuației:

-
;

-
.

Linearizarea presupune o procedură...

- aducerea ecuației regresiei multiple în baia de aburi;

+ aducerea unei ecuații neliniare într-o formă liniară;

- reducerea unei ecuaţii liniare la o formă neliniară;

- reducerea unei ecuații neliniare în raport cu parametrii la o ecuație care este liniară în raport cu rezultatul.

Rămășițele nu se schimbă;

Numărul de observații scade

Într-o ecuație de regresie multiplă standardizată, variabilele sunt:

Variabile inițiale;

Parametri standardizați;

Valorile medii ale variabilelor inițiale;

variabile standardizate.

O metodă de atribuire a valorilor numerice variabilelor fictive este. . .

+– clasament;

Alinierea valorilor numerice în ordine crescătoare;

Alinierea valorilor numerice în ordine descrescătoare;

Găsirea mediei.

Matricea coeficienților de corelație perechi afișează valorile coeficienților de corelație liniară între perechi. . . .

Variabile;

parametrii;

Parametri și variabile;

Factori variabili și aleatori.

Metoda de estimare a parametrilor modelelor cu reziduuri heteroscedastice se numește metoda ____________ celor mai mici pătrate:

Comun;

Indirect;

generalizat;

Minim.

Este dată ecuația de regresie. Definiți specificația modelului.

Ecuația de regresie a perechilor polinomiale;

Ecuație de regresie liniară simplă;

Ecuația polinomială a regresiei multiple;

Ecuație de regresie multiplă liniară.

Într-o ecuație standardizată, termenul liber este ….

este egal cu 1;

Egal cu coeficientul de determinare multiplă;

Egal cu coeficientul de corelație multiplă;

Este absent.

Factorii sunt incluși ca variabile fictive în modelul de regresie multiplă.

Avand valori probabilistice;

Avand valori cantitative;

Neavând valori calitative;

Neavând valori cantitative.

Factorii modelului econometric sunt coliniari dacă coeficientul ...

Corelații între ele modulo mai mult de 0,7;

Determinările dintre ele sunt mai mari de 0,7 în valoare absolută;

Determinările dintre ele sunt mai mici de 0,7 în valoare absolută;

Metoda generalizată a celor mai mici pătrate diferă de metoda obișnuită a celor mai mici pătrate prin aceea că, atunci când se utilizează GLS...

Nivelurile originale ale variabilelor sunt convertite;

Rămășițele nu se schimbă;

Restul este egal cu zero;

Numărul de observații scade.

Mărimea eșantionului este determinată...

Valoarea numerică a variabilelor selectate în eșantion;

Volumul populației generale;

Numărul de parametri pentru variabile independente;

Numărul de variabile rezultat.

11. Regresia multiplă nu este rezultatul unei transformări a ecuației:

+-
;

-
;

-
.

Valorile inițiale ale variabilelor fictive presupun valorile...

calitate;

Măsurabil cantitativ;

Aceeași;

Valori.

Metoda generalizată a celor mai mici pătrate implică...

Conversie variabilă;

Tranziția de la regresia multiplă la regresia perechilor;

Linearizarea ecuației de regresie;

Aplicarea în două etape a metodei celor mai mici pătrate.

Ecuația liniară a regresiei multiple are forma . Stabiliți care factor sau :

+- , deoarece 3,7>2,5;

Au același efect;

- , deoarece 2,5>-3,7;

Conform acestei ecuații, este imposibil să se răspundă la întrebarea pusă, deoarece coeficienții de regresie sunt incomparabili între ei.

Includerea unui factor în model este recomandabilă dacă coeficientul de regresie pentru acest factor este...

Zero;

nesemnificativ;

esenţial;

Nesemnificativ.

Ce se transformă atunci când se aplică metoda generalizată a celor mai mici pătrate?

Coeficienți de regresie standardizați;

Dispersia caracteristicii eficiente;

Nivelurile inițiale ale variabilelor;

Dispersia unui semn de factor.

Se face un studiu al dependenței producției unui angajat al întreprinderii de o serie de factori. Un exemplu de variabilă inactivă în acest model ar fi ______ angajat.

Vârstă;

Nivelul de educație;

Salariu.

Tranziția de la estimarea punctuală la estimarea pe interval este posibilă dacă estimările sunt:

Eficient și insolvabil;

Ineficient și bogat;

Eficient și imparțial;

Bogat și strămutat.

O matrice de coeficienți de corelație perechi este construită pentru a identifica coliniari și multicoliniari...

parametrii;

Factori aleatori;

factori semnificativi;

rezultate.

Pe baza transformării variabilelor folosind metoda celor mai mici pătrate generalizate, obținem o nouă ecuație de regresie, care este:

Regresie ponderată în care variabilele sunt luate cu ponderi
;

;

Regresia neliniară în care variabilele sunt luate cu ponderi
;

Regresie ponderată în care variabilele sunt luate cu ponderi .

Dacă valoarea calculată a criteriului Fisher este mai mică decât valoarea tabelară, atunci ipoteza nesemnificației statistice a ecuației ...

Respins;

nesemnificativ;

admis;

Neesențial.

Dacă factorii sunt incluși în model ca produs, atunci modelul se numește:

total;

derivat;

Aditiv;

Multiplicativ.

Ecuația de regresie care raportează caracteristica rezultată la unul dintre factorii cu valoarea altor variabile fixate la nivel mediu se numește:

Multiplu;

esenţial;

Privat;

Nesemnificativ.

În ceea ce privește numărul de factori incluși în ecuația de regresie, există...

Regresie liniară și neliniară;

Regresia directă și indirectă;

Regresie simplă și multiplă;

Regresie multiplă și multivariată.

Cerința pentru ecuațiile de regresie, ai căror parametri pot fi găsiți folosind metoda celor mai mici pătrate, este:

Egalitatea la zero a valorilor atributului factor4

Neliniaritatea parametrilor;

Egalitatea la zero a valorilor medii ale variabilei rezultate;

Linearitatea parametrilor.

Metoda celor mai mici pătrate nu este aplicabilă pentru...

Ecuații liniare ale regresiei perechilor;

Ecuații polinomiale de regresie multiplă;

Ecuații care sunt neliniare în ceea ce privește parametrii estimați;

Ecuații liniare de regresie multiplă.

Când variabilele fictive sunt incluse în model, acestea sunt atribuite...

Valori nule;

Etichete numerice;

Aceleași valori;

Etichete de calitate.

Dacă există o relație neliniară între indicatorii economici, atunci ...

Nu este practic să folosiți specificația unei ecuații de regresie neliniară;

Este recomandabil să folosiți specificația unei ecuații de regresie neliniară;

Este recomandabil să folosiți specificația unei ecuații de regresie liniară pereche;

Este necesar să includeți alți factori în model și să utilizați o ecuație de regresie multiplă liniară.

Rezultatul liniarizării ecuațiilor polinomiale este...

Ecuații de regresie perechi neliniare;

Ecuații liniare ale regresiei perechilor;

Ecuații de regresie multiplă neliniare;

Ecuații liniare de regresie multiplă.

În ecuația de regresie multiplă standardizată
0,3;
-2.1. Stabiliți care factor sau are un efect mai puternic asupra :

+- , deoarece 2,1>0,3;

Conform acestei ecuații, este imposibil să se răspundă la întrebarea pusă, deoarece valorile coeficienților de regresie „puri” sunt necunoscute;

- , deoarece 0,3>-2,1;

Conform acestei ecuații, este imposibil să se răspundă la întrebarea pusă, deoarece coeficienții standardizați nu sunt comparabili între ei.

Variabilele factoriale ale unei ecuații de regresie multiplă convertite din calitativ în cantitativ se numesc...

anormal;

Multiplu;

Pereche;

Fictiv.

Estimările parametrilor ecuației liniare a regresiei multiple pot fi găsite folosind metoda:

pătrate medii;

Cele mai mari pătrate;

Pătrate normale;

Cele mai mici pătrate.

Principala cerință pentru factorii incluși în modelul de regresie multiplă este:

Lipsa relației dintre rezultat și factor;

Lipsa relației dintre factori;

Lipsa relației liniare între factori;

Prezența unei relații strânse între factori.

Variabilele fictive sunt incluse în ecuația de regresie multiplă pentru a ține cont de efectul caracteristicilor asupra rezultatului...

caracter de calitate;

natura cantitativă;

de natură neesențială;

Personaj aleatoriu.

Dintr-o pereche de factori coliniari, modelul econometric include factorul

Care, având o legătură destul de strânsă cu rezultatul, are cea mai mare legătură cu alți factori;

Care, în absența legăturii cu rezultatul, are legătura maximă cu alți factori;

Care, în lipsa unei legături cu rezultatul, are cea mai mică legătură cu alți factori;

Care, cu o relație destul de strânsă cu rezultatul, are o relație mai mică cu alți factori.

Heteroskedasticitatea se referă la...

Constanța varianței reziduurilor, indiferent de valoarea factorului;

Dependența așteptării matematice a reziduurilor de valoarea factorului;

Dependența varianței reziduurilor de valoarea factorului;

Independența așteptării matematice a reziduurilor față de valoarea factorului.

Valoarea varianței reziduale atunci când un factor semnificativ este inclus în model:

Nu se va schimba;

va creste;

va fi zero;

Va scădea.

Dacă specificația modelului afișează o formă neliniară de dependență între indicatorii economici, atunci ecuația neliniară ...

regresii;

determinări;

Corelații;

Aproximații.

Este investigată dependența, care este caracterizată printr-o ecuație de regresie multiplă liniară. Pentru ecuație se calculează valoarea strângerii relației dintre variabila rezultată și un set de factori. Ca acest indicator, a fost utilizat un coeficient multiplu...

Corelații;

elasticitate;

regresii;

Determinări.

Se construiește un model de dependență a cererii de o serie de factori. Variabila inactivă din această ecuație de regresie multiplă nu este _________consumator.

Statusul familiei;

Nivelul de educație;

Pentru un parametru esențial, valoarea calculată a criteriului Studentului...

Mai mult decât valoarea tabelului a criteriului;

Egal cu zero;

Nu mai mult decât valoarea tabelară a criteriului Studentului;

Mai mică decât valoarea tabelului a criteriului.

Un sistem LSM construit pentru a estima parametrii unei ecuații de regresie multiplă liniară poate fi rezolvat...

Metoda mediei mobile;

Metoda determinanților;

Metoda primelor diferențe;

Metoda simplex.

Un indicator care caracterizează câte sigma se va schimba rezultatul în medie atunci când factorul corespunzător se modifică cu o sigma, cu nivelul altor factori neschimbat, se numește coeficient de regresie ____________

standardizat;

Normalizat;

Aliniat;

Centrat.

Multicoliniaritatea factorilor modelului econometric presupune...

Prezența unei relații neliniare între cei doi factori;

Prezența unei relații liniare între mai mult de doi factori;

Lipsa dependenței între factori;

Prezența unei relații liniare între cei doi factori.

Cele mai mici pătrate generalizate nu sunt utilizate pentru modelele cu _______ reziduuri.

Autocorelate și heteroscedastice;

homoscedastic;

heteroschedastic;

Autocorelate.

Metoda de atribuire a valorilor numerice variabilelor fictive nu este:

Gaming;

Atribuire etichete digitale;

Găsirea valorii medii;

Atribuirea valorilor cantitative.

reziduuri distribuite normal;

reziduuri homocedastice;

reziduuri de autocorelare;

Autocorelații ale trăsăturii rezultate.

Selecția factorilor într-un model de regresie multiplă folosind metoda includerii se bazează pe o comparație a valorilor...

Varianța totală înainte și după includerea factorului în model;

Varianța reziduală înainte și după includerea factorilor aleatori în model;

Variante înainte și după includerea rezultatului în model;

Varianța reziduală înainte și după includerea modelului factorilor.

Metoda celor mai mici pătrate generalizate este folosită pentru a corecta...

Parametrii ecuației de regresie neliniară;

Precizia determinării coeficientului de corelație multiplă;

Autocorelații între variabile independente;

Heteroschedasticitatea reziduurilor în ecuația de regresie.

După aplicarea metodei celor mai mici pătrate generalizate, este posibil să se evite reziduurile de _________

heteroschedasticitate;

Distributie normala;

Sume egale cu zero;

Personaj aleatoriu.

Variabilele fictive sunt incluse în ecuațiile de regresie ____________

Aleatoriu;

baie de aburi;

Indirect;

Multiplu.

Interacțiunea factorilor modelului econometric înseamnă că...

Influența factorilor asupra caracteristicii rezultate depinde de valorile altui factor necoliniar;

Influența factorilor asupra atributului rezultat crește, pornind de la un anumit nivel al valorilor factorilor;

Factorii dublează influența celuilalt asupra rezultatului;

Influența unuia dintre factori asupra atributului rezultat nu depinde de valorile celuilalt factor.

Subiect Regresie multiplă (Probleme)

Ecuația de regresie, construită pe 15 observații, are forma:

Valori lipsă precum și intervalul de încredere pentru

cu o probabilitate de 0,99 sunt:

Ecuația de regresie, construită pe 20 de observații, are forma:

cu o probabilitate de 0,9 sunt:

Ecuația de regresie, construită pe 16 observații, are forma:

Valori lipsă precum și intervalul de încredere pentru cu o probabilitate de 0,99 sunt:

Ecuația de regresie într-o formă standardizată este:

Coeficienții de elasticitate parțială sunt egali cu:

Ecuația de regresie standardizată este:

Coeficienții de elasticitate parțială sunt egali cu:

Ecuația de regresie standardizată este:

Coeficienții de elasticitate parțială sunt egali cu:

Ecuația de regresie standardizată este:

Coeficienții de elasticitate parțială sunt egali cu:

Ecuația de regresie standardizată este:

Coeficienții de elasticitate parțială sunt egali cu:

Pe baza a 18 observații, s-au obținut următoarele date:

;
;
;
;

sunt egale:

Pe baza a 17 observații, s-au obținut următoarele date:

;
;
;
;

Valorile coeficientului de determinare ajustat, coeficienții parțiali de elasticitate și parametrul sunt egale:

Pe baza a 22 de observații, s-au obținut următoarele date:

;
;
;
;

Valorile coeficientului de determinare ajustat, coeficienții parțiali de elasticitate și parametrul sunt egale:

Pe baza a 25 de observații, s-au obținut următoarele date:

;
;
;
;

Valorile coeficientului de determinare ajustat, coeficienții parțiali de elasticitate și parametrul sunt egale:

Pe baza a 24 de observații, s-au obținut următoarele date:

;
;
;
;

Valorile coeficientului de determinare ajustat, coeficienții parțiali de elasticitate și parametrul sunt egale:

Pe baza a 28 de observații, s-au obținut următoarele date:

;
;
;
;

Valorile coeficientului de determinare ajustat, coeficienții parțiali de elasticitate și parametrul sunt egale:

Pe baza a 26 de observații, s-au obținut următoarele date:

;
;
;
;

Valorile coeficientului de determinare ajustat, coeficienții parțiali de elasticitate și parametrul sunt egale:

În ecuația de regresie:

Restabiliți caracteristicile lipsă; construi un interval de încredere pentru cu o probabilitate de 0,95 dacă n=12