Matriks koefisien korelasi dalam ekonometrika. Diberikan matriks koefisien korelasi berpasangan

faktor kolinear adalah...

Keputusan:

Diasumsikan bahwa dua variabel jelas kolinear, yaitu berhubungan linier satu sama lain jika . Dalam model kami, hanya koefisien regresi linier berpasangan antara faktor dan lebih besar dari 0,7. , maka faktor-faktornya dan kolinear.

4. Pada model regresi berganda, determinan matriks koefisien korelasi berpasangan antar faktor , dan mendekati nol. Ini berarti bahwa faktor , dan ...

multikolinear

mandiri

terukur

Keputusan:

Untuk menilai multikolinearitas faktor, determinan matriks koefisien korelasi berpasangan antar faktor dapat digunakan. Jika faktor-faktor tersebut tidak berkorelasi satu sama lain, maka matriks koefisien korelasi berpasangan antara faktor-faktor tersebut akan tunggal. Karena semua elemen di luar diagonal akan sama dengan nol.
, karena = = dan = = =0.
Jika ada ketergantungan linier lengkap antara faktor-faktor dan semua koefisien korelasi pasangan sama dengan satu, maka determinan matriks tersebut sama dengan nol.


Semakin mendekati nol determinan dari matriks korelasi interfaktorial, semakin kuat multikolinearitas faktor-faktor tersebut dan semakin tidak reliabelnya hasil regresi berganda. Sebaliknya, semakin dekat determinan matriks korelasi interfaktorial dengan satu, maka semakin rendah multikolinieritas faktor tersebut.

5. Untuk model ekonometrika bentuk persamaan regresi linier berganda, matriks koefisien korelasi linier berpasangan ( kamu adalah variabel terikat; x (1),x (2), x (3), x(4)- Variabel independen):


Variabel kolinear (berhubungan erat) independen (penjelas) tidak

x(2) dan x(3)

x(1) dan x(3)

x(1) dan x(4)

x(2) dan x(4)

Keputusan:

Ketika membangun model regresi berganda, perlu untuk mengecualikan kemungkinan hubungan linier yang erat antara variabel independen (penjelas), yang mengarah pada masalah multikolinearitas. Pada saat yang sama, koefisien korelasi linier diperiksa untuk setiap pasangan variabel independen (penjelas). Nilai-nilai ini tercermin dalam matriks koefisien korelasi linier berpasangan. Diyakini bahwa adanya koefisien korelasi pasangan antara variabel penjelas melebihi 0,7 dalam nilai absolut mencerminkan hubungan yang erat antara variabel-variabel tersebut (kedekatan hubungan dengan variabel kamu tidak dipertimbangkan dalam kasus ini). Variabel bebas seperti itu disebut collinear. Jika nilai koefisien korelasi pasangan antara variabel penjelas tidak melebihi 0,7 nilai absolut, maka variabel penjelas tersebut tidak kolinear. Mari kita perhatikan nilai koefisien pasangan dari korelasi interfaktorial: antara x(1) dan x(2) nilainya 0,45; di antara x(1) dan x(3)- sama dengan 0,82; di antara x(1) dan x(4)- sama dengan 0,94; di antara x(2) dan x(3)– sama dengan 0,3; di antara x(2) dan x(4)- sama dengan 0,7; di antara x(3) dan x(4) sama dengan 0,12. Dengan demikian, nilai , , , tidak melebihi 0,7. Oleh karena itu, kolinear tidak faktor x(1) dan x(2), x(2) dan x(3), x(3) dan x(4). Dari pasangan yang terdaftar terakhir, ada pasangan di opsi jawaban x(2) dan x(3) adalah jawaban yang benar. Untuk pasangan lain: x(1 dan x(3), x(1) dan x(4), x(2) dan x(4)- nilai koefisien pasangan korelasi interfaktorial melebihi 0,7, dan faktor-faktor ini kolinear.

Topik 3: Variabel dummy

1. Diberikan tabel data awal untuk membangun model regresi ekonometrik:

variabel dummy tidak

pengalaman kerja

produktivitas tenaga kerja

tingkat pendidikan

tingkat keterampilan karyawan

Keputusan:

Saat membangun model regresi, situasi mungkin muncul ketika perlu untuk memasukkan dalam persamaan, selain variabel kuantitatif, variabel yang mencerminkan beberapa fitur atributif (gender, pendidikan, wilayah, dll.). Variabel kualitatif semacam itu disebut variabel "dummy". Untuk membangun model yang ditentukan dalam pernyataan tugas, variabel dummy digunakan: tingkat pendidikan dan tingkat kualifikasi karyawan. Variabel lain tidak fiktif, dari opsi yang diajukan adalah masa kerja dan produktivitas tenaga kerja.

2. Saat mempelajari ketergantungan konsumsi daging terhadap tingkat pendapatan dan jenis kelamin konsumen, kami dapat merekomendasikan ...

gunakan variabel dummy - jenis kelamin konsumen

membagi populasi menjadi dua: untuk konsumen perempuan dan untuk konsumen laki-laki

gunakan variabel dummy - tingkat pendapatan

mengecualikan dari pertimbangan jenis kelamin konsumen, karena faktor ini tidak dapat diukur secara kuantitatif

Keputusan:

Saat membangun model regresi, situasi mungkin muncul ketika perlu untuk memasukkan dalam persamaan, selain variabel kuantitatif, variabel yang mencerminkan beberapa fitur atributif (gender, pendidikan, wilayah, dll.). Variabel kualitatif semacam itu disebut variabel "dummy". Mereka mencerminkan heterogenitas populasi statistik yang diteliti dan digunakan untuk pemodelan ketergantungan yang lebih baik dalam objek pengamatan yang heterogen tersebut. Saat memodelkan dependensi individu pada data heterogen, Anda juga dapat menggunakan metode membagi seluruh koleksi data heterogen menjadi beberapa koleksi terpisah, yang jumlahnya sama dengan jumlah status variabel dummy. Jadi, jawaban yang benar adalah: "gunakan variabel dummy - jenis kelamin konsumen" dan "bagi populasi menjadi dua: untuk konsumen wanita dan untuk konsumen pria."

3. Kami mempelajari ketergantungan harga apartemen ( pada) dari tempat tinggalnya ( X) dan tipe rumah. Model tersebut mencakup variabel dummy yang mencerminkan jenis rumah yang dipertimbangkan: monolitik, panel, bata. Persamaan regresi diperoleh: ,
di mana ,
Persamaan regresi khusus untuk bata dan monolitik adalah ...

untuk bata tipe rumah

untuk rumah tipe monolitik

untuk bata tipe rumah

untuk rumah tipe monolitik

Keputusan:

Diperlukan untuk mengetahui persamaan regresi pribadi untuk rumah bata dan monolitik. Untuk rumah bata, nilai variabel dummy adalah sebagai berikut , . Persamaannya akan berbentuk: atau untuk tipe rumah bata.
Untuk rumah monolitik, nilai variabel dummy adalah sebagai berikut , . Persamaannya akan berbentuk
atau untuk tipe rumah monolitik.

Koefisien korelasi mencerminkan derajat hubungan antara dua indikator. Selalu mengambil nilai dari -1 hingga 1. Jika koefisien terletak di dekat 0, maka mereka mengatakan bahwa tidak ada hubungan antara variabel.

Jika nilainya mendekati satu (dari 0,9, misalnya), maka ada hubungan langsung yang kuat antara objek yang diamati. Jika koefisien dekat dengan titik ekstrim lain dari rentang (-1), maka ada hubungan terbalik yang kuat antara variabel. Ketika nilainya berada di suatu tempat di tengah dari 0 hingga 1 atau dari 0 hingga -1, maka kita berbicara tentang hubungan yang lemah (maju atau mundur). Hubungan ini biasanya tidak diperhitungkan: dianggap tidak ada.

Perhitungan koefisien korelasi di Excel

Pertimbangkan, misalnya, metode untuk menghitung koefisien korelasi, fitur hubungan langsung dan terbalik antara variabel.

Nilai indikator x dan y:

Y adalah variabel bebas, x adalah variabel terikat. Penting untuk menemukan kekuatan (kuat / lemah) dan arah (maju / mundur) dari hubungan di antara mereka. Rumus untuk koefisien korelasi terlihat seperti ini:


Untuk menyederhanakan pemahamannya, kami akan memecahnya menjadi beberapa elemen sederhana.

Ada hubungan langsung yang kuat antara variabel.

Fungsi CORREL bawaan menghindari perhitungan yang rumit. Mari kita hitung koefisien korelasi pasangan di Excel dengan menggunakannya. Kami memanggil master fungsi. Kami menemukan apa yang kami butuhkan. Argumen fungsi adalah larik nilai y dan larik nilai x:

Mari kita tunjukkan nilai variabel pada grafik:


Ada hubungan yang kuat antara y dan x, karena Garis berjalan hampir sejajar satu sama lain. Hubungannya searah: bertambah y - bertambah x, berkurang y - berkurang x.



Matriks Koefisien Korelasi Berpasangan di Excel

Matriks korelasi adalah sebuah tabel, di persimpangan baris dan kolom di mana ada koefisien korelasi antara nilai-nilai yang sesuai. Masuk akal untuk membangunnya untuk beberapa variabel.

Matriks koefisien korelasi di Excel dibangun menggunakan alat "Korelasi" dari paket "Analisis Data".


Hubungan langsung yang kuat ditemukan antara nilai y dan x1. Ada umpan balik yang kuat antara x1 dan x2. Praktis tidak ada hubungan dengan nilai di kolom x3.

kamu x (1) x (2) x (3) x (4) x (5)
kamu 1.00 0.43 0.37 0.40 0.58 0.33
x (1) 0.43 1.00 0.85 0.98 0.11 0.34
x (2) 0.37 0.85 1.00 0.88 0.03 0.46
x (3) 0.40 0.98 0.88 1.00 0.03 0.28
x (4) 0.58 0.11 0.03 0.03 1.00 0.57
x (5) 0.33 0.34 0.46 0.28 0.57 1.00

Analisis matriks koefisien korelasi berpasangan menunjukkan bahwa indikator kinerja paling erat hubungannya dengan indikator x(4) - jumlah pupuk yang digunakan per 1 ha ().

Pada saat yang sama, hubungan antara fitur-argumen cukup dekat. Jadi, praktis ada hubungan fungsional antara jumlah traktor beroda ( x(1)) dan jumlah alat pengolahan permukaan .

Adanya multikolinearitas juga dibuktikan dengan koefisien korelasi dan . Mengingat hubungan yang erat dari indikator x (1) , x(2) dan x(3) , hanya satu dari mereka yang bisa masuk ke model regresi hasil.

Untuk mendemonstrasikan dampak negatif multikolinearitas, pertimbangkan model regresi hasil yang mencakup semua input:

Fob = 121.

Dalam tanda kurung adalah nilai perkiraan yang dikoreksi dari standar deviasi dari perkiraan koefisien persamaan .

Di bawah persamaan regresi, parameter kecukupan berikut disajikan: koefisien determinasi berganda; estimasi yang dikoreksi dari varians residual , kesalahan perkiraan relatif rata-rata dan nilai yang dihitung dari -kriteria Fobs = 121.

Persamaan regresi signifikan karena F obl = 121 > F kp = 2,85 ditemukan dari tabel F- distribusi pada a=0,05; n 1 =6 dan n2 =14.

Dari sini dapat disimpulkan bahwa Q¹0, yaitu, dan setidaknya satu dari koefisien persamaan q j (j= 0, 1, 2, ..., 5) tidak sama dengan nol.

Untuk menguji hipotesis tentang signifikansi koefisien regresi individu H0 : q j =0, dimana j= 1,2,3,4,5, bandingkan nilai kritis t kp = 2,14, ditemukan dari tabel t-distribusi pada tingkat signifikansi a=2 Q=0,05 dan jumlah derajat kebebasan n=14, dengan nilai yang dihitung . Dari persamaan tersebut dapat disimpulkan bahwa koefisien regresi signifikan secara statistik hanya jika x(4) sejak t 4½=2,90 > t kp=2,14.



Tanda-tanda negatif dari koefisien regresi pada x(1) dan x(5) . Dari nilai koefisien negatif, berikut peningkatan kejenuhan pertanian dengan traktor beroda ( x(1)) dan produk kesehatan tanaman ( x(5)) berpengaruh negatif terhadap hasil. Dengan demikian, persamaan regresi yang dihasilkan tidak dapat diterima.

Untuk mendapatkan persamaan regresi dengan koefisien signifikan, kami menggunakan algoritma analisis regresi bertahap. Awalnya, kami menggunakan algoritma langkah-demi-langkah dengan penghapusan variabel.

Kecualikan variabel dari model x(1) , yang sesuai dengan nilai absolut minimum t 1½ = 0,01. Untuk variabel yang tersisa, kita akan membuat persamaan regresi lagi:

Persamaan yang dihasilkan signifikan, karena F obs = 155 > F kp = 2,90, ditemukan pada taraf signifikansi a=0,05 dan jumlah derajat kebebasan n 1 =5 dan n 2 =15 sesuai tabel F-distribusi, mis. vektor q¹0. Namun, hanya koefisien regresi yang signifikan dalam persamaan di x(4) . Nilai yang dihitung t j untuk koefisien lain yang kurang dari t kr = 2.131 ditemukan dalam tabel t-distribusi untuk a=2 Q=0,05 dan n=15.

Mengecualikan variabel dari model x(3) , yang sesuai dengan nilai minimum t 3 =0,35 dan dapatkan persamaan regresinya:

(2.9)

Dalam persamaan yang dihasilkan, itu tidak signifikan secara statistik dan kita tidak dapat secara ekonomis menginterpretasikan koefisien pada x(5) . tidak termasuk x(5) kita mendapatkan persamaan regresi:

(2.10)

Kami telah memperoleh persamaan regresi yang bermakna dengan koefisien yang bermakna dan dapat ditafsirkan.

Namun, persamaan yang dihasilkan bukan satu-satunya model hasil "baik" atau "terbaik" dalam contoh kita.

Mari kita tunjukkan itu dalam kondisi multikolinearitas, algoritma step-by-step dengan memasukkan variabel lebih efisien. Langkah pertama dalam model hasil kamu termasuk variabel x(4) , yang memiliki koefisien korelasi tertinggi dengan kamu, dijelaskan oleh variabel - r(kamu,x(4))=0,58. Pada langkah kedua, sertakan persamaan beserta x(4) variabel x(1) atau x(3) , kita akan mendapatkan model yang lebih unggul dari (2.10) karena alasan ekonomi dan karakteristik statistik:

(2.11)

(2.12)

Dimasukkannya salah satu dari tiga variabel yang tersisa dalam persamaan memperburuk sifat-sifatnya. Lihat, misalnya, persamaan (2.9).

Jadi, kami memiliki tiga model hasil yang "baik", dari mana salah satunya harus dipilih karena alasan ekonomi dan statistik.

Menurut kriteria statistik, model (2.11) adalah yang paling memadai. Ini sesuai dengan nilai minimum varians residual = 2,26 dan kesalahan perkiraan relatif rata-rata dan nilai terbesar dan Fobs = 273.

Model (2.12) memiliki indikator kecukupan yang lebih buruk, dan kemudian model (2.10).

Sekarang kita akan memilih model terbaik (2.11) dan (2.12). Model-model ini berbeda satu sama lain dalam variabel x(1) dan x(3) . Namun, dalam model hasil, variabel x(1) (jumlah traktor beroda per 100 ha) lebih disukai daripada variabel x(3) (jumlah alat pengolahan permukaan per 100 ha), yang agak sekunder (atau berasal dari x (1)).

Dalam hubungan ini, untuk alasan ekonomi, preferensi harus diberikan pada model (2.12). Jadi, setelah menerapkan algoritma analisis regresi bertahap dengan memasukkan variabel dan dengan mempertimbangkan fakta bahwa hanya satu dari tiga variabel terkait yang harus dimasukkan ke dalam persamaan ( x (1) , x(2) atau x(3)) pilih persamaan regresi akhir:

Persamaan tersebut signifikan pada a=0,05, karena F obl = 266 > F kp = 3,20 ditemukan dari tabel F-distribusi untuk a= Q= 0,05; n 1 =3 dan n 2 =17. Semua koefisien regresi juga signifikan dalam persamaan t j½> t kp (a=2 Q= 0,05; n=17)=2,11. Koefisien regresi q 1 harus diakui sebagai signifikan (q 1 0) karena alasan ekonomi, sedangkan t 1 = 2,09 hanya sedikit lebih sedikit t kp = 2.11.

Dari persamaan regresi dapat disimpulkan bahwa peningkatan per unit dalam jumlah traktor per 100 hektar lahan garapan (dengan nilai tetap x(4)) menyebabkan peningkatan hasil biji-bijian dengan rata-rata 0,345 c/ha.

Perhitungan perkiraan koefisien elastisitas e 1 "0,068 dan e 2" 0,161 menunjukkan bahwa dengan peningkatan indikator x(1) dan x(4) sebesar 1%, hasil gabah meningkat rata-rata masing-masing 0,068% dan 0,161%.

Koefisien determinasi berganda menunjukkan bahwa hanya 46,9% variasi hasil yang dijelaskan oleh indikator-indikator yang termasuk dalam model ( x(1) dan x(4)), yaitu kejenuhan produksi tanaman dengan traktor dan pupuk. Sisa variasi ini disebabkan oleh tindakan faktor yang tidak terhitung ( x (2) , x (3) , x(5) , kondisi cuaca, dll.). Rata-rata kesalahan aproksimasi relatif mencirikan kecukupan model, serta nilai varians residual . Saat menafsirkan persamaan regresi, nilai kesalahan aproksimasi relatif menarik . Ingatlah bahwa - nilai model indikator efektif mencirikan nilai rata-rata produktivitas untuk totalitas area yang dipertimbangkan, asalkan nilai variabel penjelas x(1) dan x(4) tetap pada tingkat yang sama, yaitu x (1) = x saya(1) dan x (4) = x i(4) . Kemudian untuk nilai d saya hasil dapat dibandingkan. Area yang sesuai dengan nilai d saya>0, memiliki hasil di atas rata-rata, dan d saya<0 - ниже среднего.

Dalam contoh kami, produksi tanaman paling efisien di area yang sesuai dengan d 7 \u003d 28%, di mana hasil 28% lebih tinggi dari rata-rata untuk wilayah tersebut, dan yang paling tidak efisien - di area dengan d 20 =-27,3%.


Tugas dan latihan

2.1. Dari masyarakat umum ( kamu, x (1) , ..., x(p)), dimana kamu memiliki hukum distribusi normal dengan harapan matematis bersyarat dan varians s 2 , sampel acak volume n, biarkan saja ( aku, x saya (1) , ..., x saya(p)) - hasil saya pengamatan ( saya=1, 2, ..., n). Tentukan: a) ekspektasi matematis dari taksiran kuadrat terkecil dari vektor q; b) matriks kovarians dari estimasi kuadrat terkecil dari vektor q; c) ekspektasi matematis dari estimasi.

2.2. Sesuai dengan kondisi masalah 2.1, temukan ekspektasi matematis dari jumlah deviasi kuadrat akibat regresi, yaitu. EQ R, di mana

.

2.3. Sesuai dengan kondisi masalah 2.1, tentukan ekspektasi matematis dari jumlah deviasi kuadrat karena variasi residual relatif terhadap garis regresi, yaitu. persamaan ost dimana

2.4. Buktikan bahwa di bawah hipotesis 0: q=0 statistik

memiliki distribusi-F dengan derajat kebebasan n 1 =p+1 dan n2 =n-p-1.

2.5. Buktikan bahwa ketika hipotesis H 0: q j =0 terpenuhi, statistik memiliki distribusi-t dengan jumlah derajat kebebasan n=n-p-1.

2.6. Berdasarkan data (Tabel 2.3) ketergantungan susut roti pakan ternak ( kamu) pada lama penyimpanan ( x) temukan estimasi titik dari ekspektasi matematis bersyarat dengan asumsi bahwa persamaan regresi umum adalah linier.

Tabel 2.3.

Diperlukan: a) untuk menemukan estimasi dan varians residual s 2 dengan asumsi bahwa persamaan regresi umum berbentuk ; b) periksa a=0,05 signifikansi persamaan regresi, yaitu. hipotesis H 0: q=0; c) dengan reliabilitas g=0,9 tentukan estimasi interval dari parameter q 0 , q 1 ; d) dengan reliabilitas g=0,95 tentukan estimasi interval dari ekspektasi bersyarat untuk X 0=6; e) tentukan pada g=0,95 selang kepercayaan prediksi di titik X=12.

2.7. Berdasarkan data dinamika laju pertumbuhan harga saham selama 5 bulan, disajikan pada Tabel. 2.4.

Tabel 2.4.

bulan ( x)
kamu (%)

dan asumsi persamaan regresi umum berbentuk , diperlukan: a) untuk menentukan estimasi dan parameter persamaan regresi dan varians residual s 2 ; b) periksa pada a=0,01 signifikansi koefisien regresi, yaitu. hipotesis H 0: q 1 =0;

c) dengan reliabilitas g=0,95 temukan estimasi interval dari parameter q 0 dan q 1 ; d) dengan reliabilitas g = 0,9, buat estimasi interval dari ekspektasi matematis bersyarat untuk x 0=4; e) tentukan pada g=0,9 selang kepercayaan prediksi di titik x=5.

2.8. Hasil kajian dinamika pertambahan berat badan pada hewan muda disajikan pada Tabel 2.5.

Tabel 2.5.

Dengan asumsi bahwa persamaan regresi umum adalah linier, diperlukan: a) untuk menentukan estimasi dan parameter persamaan regresi dan varians residual s 2 ; b) periksa a=0,05 signifikansi persamaan regresi, yaitu. hipotesis H 0: q=0;

c) dengan reliabilitas g=0,8 untuk menemukan estimasi interval dari parameter q 0 dan q 1 ; d) dengan reliabilitas g=0,98 tentukan dan bandingkan estimasi interval dari ekspektasi matematis bersyarat untuk x 0 = 3 dan x 1 =6;

e) tentukan pada g=0,98 selang kepercayaan prediksi di titik x=8.

2.9. Harga biaya ( kamu) satu eksemplar buku, tergantung peredarannya ( x) (ribuan eksemplar) dicirikan oleh data yang dikumpulkan oleh penerbit (Tabel 2.6). Tentukan estimasi kuadrat terkecil dan parameter persamaan regresi hiperbolik , dengan reliabilitas g=0.9 membangun interval kepercayaan untuk parameter q 0 dan q 1 , serta ekspektasi matematis bersyarat pada x=10.

Tabel 2.6.

Tentukan estimasi dan parameter persamaan regresi tipe x=20.

2.11. Di meja. 2.8 melaporkan tingkat pertumbuhan (%) dari indikator ekonomi makro berikut n\u003d 10 negara maju di dunia untuk tahun 1992: GNP - x(1) , produksi industri - x(2) , indeks harga - x (3) .

Tabel 2.8.

negara x dan parameter persamaan regresi, estimasi varians residual; b) periksa pada a=0,05 signifikansi koefisien regresi, yaitu. H 0: q 1 = 0; c) dengan reliabilitas g=0,9 temukan estimasi interval q 0 dan q 1 ; d) temukan di g=0,95 selang kepercayaan untuk di titik X 0 =x saya, di mana saya=5; e) membandingkan karakteristik statistik dari persamaan regresi: 1, 2 dan 3.

2.12. Memecahkan masalah 2.11, mengambil nilai yang akan dijelaskan ( pada) indikator x(1) , dan untuk penjelasan ( X) variabel x (3) .

1. Ayvazyan S.A., Mkhitaryan V.S. Statistika Terapan dan Dasar-dasar Ekonometrika: Buku Ajar. M., UNITI, 1998 (edisi ke-2 2001);

2. Ayvazyan S.A., Mkhitaryan V.S. Statistika Terapan dalam Soal dan Latihan: Buku Ajar. M.UNITY - DANA, 2001;

3. Aivazyan S.A., Enyukov I.S., Meshalkin L.D. Statistik yang diterapkan. Penelitian ketergantungan. M., Keuangan dan statistik, 1985, 487p.;

4. Aivazyan S.A., Buchstaber V.M., Enyukov I.S., Meshalkin L.D. Statistik yang diterapkan. Klasifikasi dan pengurangan dimensi. M., Keuangan dan statistik, 1989, 607 hal.;

5. Metode Ekonometrika Johnston J., Moskow: Statistika, 1980, 446 hlm.;

6. Dubrov A.V., Mkhitaryan V.S., Troshin L.I. Metode statistik multivariat. M., Keuangan dan statistik, 2000;

7. Mkhitaryan V.S., Troshin L.I. Penelitian ketergantungan dengan metode korelasi dan regresi. M., MESI, 1995, 120 hlm;

8. Mkhitaryan V.S., Dubrov A.M., Troshin L.I. Metode statistik multidimensi dalam ekonomi. M., MESI, 1995, 149 hal.;

9. Dubrov A.M., Mkhitaryan V.S., Troshin L.I. Statistik matematika untuk pengusaha dan manajer. M., MESI, 2000, 140s.;

10. Lukashin Yu.I. Metode peramalan regresi dan adaptif: Textbook, M., MESI, 1997.

11. Lukashin Yu.I. Metode adaptif peramalan jangka pendek. - M., Statistika, 1979.


APLIKASI


Lampiran 1. Pilihan untuk tugas-tugas untuk penelitian komputer independen.

1. Hitung matriks koefisien korelasi berpasangan; menganalisis keketatan dan arah hubungan fitur yang dihasilkan kamu dengan masing-masing faktor. X; mengevaluasi signifikansi statistik dari koefisien korelasi r(kamu,X saya); memilih faktor yang paling informatif.

2. Membangun model regresi berpasangan dengan faktor yang paling informatif; memberikan interpretasi ekonomi dari koefisien regresi.

3. Evaluasi kualitas model menggunakan rata-rata kesalahan relatif aproksimasi, koefisien determinasi dan kriteria F - Fisher (ambil tingkat signifikansi = 0,05).

4. Dengan probabilitas keyakinan =80% untuk memprediksi nilai rata-rata indikator kamu(nilai perkiraan faktor diberikan dalam Lampiran 6). Menyajikan nilai aktual dan model secara grafis kamu, hasil prediksi.

5. Dengan menggunakan metode inklusi, buat model dua faktor, pertahankan faktor yang paling informatif di dalamnya; membangun model tiga faktor dengan daftar lengkap faktor.

6. Pilih yang terbaik dari beberapa model yang dibangun. Berikan interpretasi ekonomi dari koefisiennya.

7. Periksa signifikansi koefisien regresi berganda menggunakan t–Uji siswa (menerima tingkat signifikansi =0,05). Apakah kualitas model ganda lebih baik dibandingkan dengan model berpasangan?

8. Menilai pengaruh faktor terhadap hasil dengan menggunakan koefisien elastisitas, koefisien beta dan delta.

Tugas 2. Memodelkan deret waktu satu dimensi

Lampiran 7 menunjukkan deret waktu Y(t) indikator sosial-ekonomi untuk Wilayah Altai untuk periode 2000 hingga 2011. Diperlukan untuk mempelajari dinamika indikator yang sesuai dengan varian tugas.

Pilihan Penunjukan, nama, unit pengukuran indikator
Y1 Rata-rata pengeluaran konsumen per kapita (per bulan), gosok.
Y2 Emisi polutan ke udara atmosfer, ribuan ton
Y3 Harga rata-rata di pasar perumahan sekunder (pada akhir tahun, per meter persegi luas total), gosok
Y4 Volume layanan berbayar per kapita, gosok
Y5 Jumlah tahunan rata-rata orang yang dipekerjakan dalam perekonomian, ribu orang
Y6 Jumlah mobil sendiri per 1000 orang (pada akhir tahun), buah
Y7 Rata-rata pendapatan tunai per kapita (per bulan), gosok
Y8 Indeks harga konsumen (Desember hingga Desember tahun sebelumnya), %
Y9 Investasi dalam aset tetap (dalam harga aktual), juta rubel
Y10 Omset perdagangan eceran per kapita (dalam harga sebenarnya), gosok


Perintah kerja

1. Bangun model linier deret waktu, yang parameternya diestimasi dengan kuadrat terkecil. Jelaskan pengertian dari koefisien regresi.

2. Menilai kecukupan model yang dibangun menggunakan sifat keacakan, kemandirian, dan korespondensi komponen residual dengan hukum distribusi normal.

3. Mengevaluasi akurasi model berdasarkan penggunaan rata-rata kesalahan aproksimasi relatif.

4. Prakiraan indikator yang sedang dipertimbangkan untuk satu tahun ke depan (hitung interval prakiraan dengan tingkat kepercayaan 70%).

5. Menyajikan secara grafis nilai aktual dari indikator, hasil pemodelan dan peramalan.

6. Hitung parameter logaritmik, polinomial (polinomial derajat 2), pangkat, tren eksponensial dan hiperbolik. Berdasarkan gambar grafik dan nilai indeks penentuan, pilih jenis tren yang paling sesuai.

7. Dengan bantuan model non-linier terbaik, lakukan peramalan titik dari indikator yang dipertimbangkan untuk tahun depan. Bandingkan hasil yang diperoleh dengan interval kepercayaan prediktif yang dibangun menggunakan model linier.

CONTOH

Melakukan pekerjaan kontrol

Tugas 1

Perusahaan menjual mobil bekas. Nama-nama indikator dan data awal untuk pemodelan ekonometrika disajikan dalam tabel:

Harga realisasi, ribu c.u. ( kamu) Harga mobil baru, ribu c.u. ( X1) Kehidupan pelayanan, tahun ( x2) Drive tangan kiri - 1, drive tangan kanan - 0, ( x3)
8,33 13,99 3,8
10,40 19,05 2,4
10,60 17,36 4,5
16,58 25,00 3,5
20,94 25,45 3,0
19,13 31,81 3,5
13,88 22,53 3,0
8,80 16,24 5,0
13,89 16,54 2,0
11,03 19,04 4,5
14,88 22,61 4,6
20,43 27,56 4,0
14,80 22,51 3,3
26,05 31,75 2,3

Diperlukan:

1. Hitung matriks koefisien korelasi berpasangan; menganalisis keketatan dan arah hubungan fitur Y yang dihasilkan dengan masing-masing faktor X; mengevaluasi signifikansi statistik dari koefisien korelasi r(Y, Xi); memilih faktor yang paling informatif.

Menggunakan Excel (Data / Analisis Data / KORELASI):

Mari kita dapatkan matriks koefisien korelasi pasangan antara semua variabel yang tersedia:

Pada X1 x2 x3
Pada
X1 0,910987
x2 -0,4156 -0,2603
x3 0,190785 0,221927 -0,30308

Mari kita menganalisis koefisien korelasi antara fitur yang dihasilkan kamu dan masing-masing faktor X j:

> 0, oleh karena itu, antar variabel kamu dan X 1 ada korelasi langsung: semakin tinggi harga mobil baru, semakin tinggi harga jualnya.

> 0,7 - ketergantungan ini dekat.

< 0, значит, между переменными kamu dan X 2 diamati

korelasi terbalik: harga jual lebih rendah untuk auto-

ponsel dengan masa pakai yang lama.

– ketergantungan ini sedang, mendekati lemah.

> 0, jadi antar variabel kamu dan X 3 menunjukkan korelasi langsung: harga jual lebih tinggi untuk mobil setir kiri.

< 0,4 – эта зависимость слабая.

Untuk memeriksa signifikansi koefisien korelasi yang ditemukan, kami menggunakan uji Student.

Untuk setiap koefisien korelasi menghitung t-statistik dengan rumus dan masukkan hasil perhitungan di kolom tambahan tabel korelasi:

Pada X1 x2 x3 t-statistik
Pada
X1 0,910987 7,651524603
x2 -0,4156 -0,2603 1,582847988
x3 0,190785 0,221927 -0,30308 0,673265587

Berdasarkan tabel titik kritis sebaran Siswa pada tingkat signifikansi dan jumlah derajat kebebasan, kami menentukan nilai kritis (Lampiran 1, atau fungsi STUDRASP).Y dan umur layanan X 2 dapat diandalkan.

< , следовательно, коэффициент не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой реализации kamu dan posisi roda kemudi X 3 dapat diandalkan.

Dengan demikian, hubungan terdekat dan paling signifikan diamati antara harga jual kamu dan harga mobil baru X satu ; faktor X 1 adalah yang paling informatif.

Regresi berganda bukan hasil transformasi persamaan:

-
;

-
.

Linierisasi menyiratkan prosedur ...

- membawa persamaan regresi berganda ke ruang uap;

+ membawa persamaan nonlinier ke bentuk linier;

- pengurangan persamaan linier ke bentuk non-linier;

- pengurangan persamaan nonlinier sehubungan dengan parameter ke persamaan yang linier terhadap hasil.

Tetap tidak berubah;

Jumlah pengamatan berkurang

Dalam persamaan regresi berganda standar, variabelnya adalah:

variabel awal;

Parameter standar;

Nilai rata-rata variabel awal;

variabel standar.

Salah satu metode untuk menetapkan nilai numerik ke variabel dummy adalah. . .

+– peringkat;

Penjajaran nilai numerik dalam urutan menaik;

Penjajaran nilai numerik dalam urutan menurun;

Menemukan artinya.

Matriks koefisien korelasi berpasangan menampilkan nilai-nilai koefisien korelasi linier berpasangan antara. . . .

Variabel;

parameter;

Parameter dan variabel;

Variabel dan faktor acak.

Metode untuk mengestimasi parameter model dengan residual heteroskedastis disebut metode kuadrat terkecil ____________:

Biasa;

tidak langsung;

digeneralisasikan;

Minimum.

Persamaan regresi diberikan. Tentukan spesifikasi model.

Persamaan Regresi Pasangan Polinomial;

persamaan regresi linier sederhana;

Persamaan polinomial regresi berganda;

Persamaan regresi linier berganda.

Dalam persamaan standar, suku bebasnya adalah ….

Sama dengan 1;

Sama dengan koefisien determinasi ganda;

Sama dengan koefisien korelasi berganda;

Tidak hadir.

Faktor-faktor tersebut dimasukkan sebagai variabel dummy dalam model regresi berganda.

Memiliki nilai probabilistik;

Memiliki nilai kuantitatif;

Tidak memiliki nilai kualitatif;

Tidak memiliki nilai kuantitatif.

Faktor-faktor dari model ekonometrika adalah kolinear jika koefisien ...

Korelasi antara modulo lebih dari 0,7;

Penentuan di antara mereka lebih besar dari 0,7 dalam nilai absolut;

Penentuan di antara mereka kurang dari 0,7 dalam nilai absolut;

Metode kuadrat terkecil umum berbeda dari metode kuadrat terkecil biasa dalam hal, saat menggunakan GLS ...

Level asli dari variabel dikonversi;

Tetap tidak berubah;

Sisanya sama dengan nol;

Jumlah pengamatan berkurang.

Ukuran sampel ditentukan ...

Nilai numerik dari variabel yang dipilih dalam sampel;

Volume populasi umum;

Jumlah parameter untuk variabel independen;

Jumlah variabel hasil.

11. Regresi berganda bukan hasil transformasi persamaan:

+-
;

-
;

-
.

Nilai awal variabel dummy mengasumsikan nilai ...

kualitas;

Terukur secara kuantitatif;

Sama;

Nilai.

Metode kuadrat terkecil umum menyiratkan ...

Konversi variabel;

Transisi dari regresi berganda ke regresi berpasangan;

Linearisasi persamaan regresi;

Aplikasi dua tahap dari metode kuadrat terkecil.

Persamaan linier dari regresi berganda berbentuk . Tentukan faktor yang atau :

+- , sejak 3,7>2,5;

Mereka memiliki efek yang sama;

- , karena 2.5>-3.7;

Menurut persamaan ini, tidak mungkin untuk menjawab pertanyaan yang diajukan, karena koefisien regresi tidak dapat dibandingkan di antara mereka sendiri.

Disarankan untuk memasukkan suatu faktor ke dalam model jika koefisien regresi untuk faktor ini adalah ...

Nol;

tidak signifikan;

penting;

tidak signifikan.

Apa yang ditransformasikan ketika menerapkan metode kuadrat terkecil umum?

Koefisien regresi standar;

Dispersi fitur efektif;

Tingkat awal variabel;

Dispersi tanda faktor.

Sebuah studi sedang dilakukan tentang ketergantungan produksi seorang karyawan perusahaan pada sejumlah faktor. Contoh variabel dummy dalam model ini adalah ______ karyawan.

Usia;

Tingkat pendidikan;

Upah.

Transisi dari estimasi titik ke estimasi interval dimungkinkan jika estimasinya adalah:

Efektif dan pailit;

Tidak efisien dan kaya;

Efisien dan tidak bias;

Kaya dan terlantar.

Matriks koefisien korelasi berpasangan dibangun untuk mengidentifikasi kolinear dan multikolinier …

parameter;

faktor acak;

faktor signifikan;

hasil.

Berdasarkan transformasi variabel menggunakan metode kuadrat terkecil diperoleh persamaan regresi baru, yaitu:

Regresi berbobot dimana variabel diambil dengan bobot
;

;

Regresi nonlinier dimana variabel diambil dengan bobot
;

Regresi berbobot dimana variabel diambil dengan bobot .

Jika nilai yang dihitung dari kriteria Fisher lebih kecil dari nilai tabel, maka hipotesis ketidaksignifikanan statistik dari persamaan ...

Ditolak;

tidak signifikan;

diterima;

Tidak penting.

Jika faktor-faktor tersebut dimasukkan dalam model sebagai produk, maka model tersebut disebut:

total;

turunan;

Aditif;

Multiplikasi.

Persamaan regresi yang menghubungkan fitur yang dihasilkan dengan salah satu faktor dengan nilai variabel lain yang tetap pada tingkat rata-rata disebut:

Beberapa;

penting;

Pribadi;

tidak signifikan.

Mengenai jumlah faktor yang termasuk dalam persamaan regresi, ada ...

Regresi linier dan nonlinier;

Regresi langsung dan tidak langsung;

Regresi sederhana dan berganda;

Regresi berganda dan multivariat.

Syarat persamaan regresi yang parameternya dapat dicari dengan menggunakan metode kuadrat terkecil adalah:

Kesetaraan dengan nol dari nilai atribut faktor4

Non-linearitas parameter;

Kesetaraan dengan nol dari nilai rata-rata variabel yang dihasilkan;

Linearitas parameter.

Metode kuadrat terkecil tidak berlaku untuk ...

Persamaan linier regresi berpasangan;

persamaan regresi berganda polinomial;

Persamaan yang tidak linier dalam hal parameter yang diestimasi;

Persamaan linier regresi berganda.

Ketika variabel dummy dimasukkan dalam model, mereka ditugaskan ...

Nilai nol;

Label numerik;

Nilai yang sama;

Label berkualitas.

Jika terdapat hubungan nonlinier antar indikator ekonomi, maka ...

Tidak praktis untuk menggunakan spesifikasi persamaan regresi non-linier;

Disarankan untuk menggunakan spesifikasi persamaan regresi nonlinier;

Disarankan untuk menggunakan spesifikasi persamaan regresi linier berpasangan;

Hal ini diperlukan untuk memasukkan faktor-faktor lain dalam model dan menggunakan persamaan regresi linier berganda.

Hasil linearisasi persamaan polinomial adalah ...

Persamaan Regresi Pasangan Nonlinier;

Persamaan linier regresi berpasangan;

persamaan regresi berganda nonlinier;

Persamaan linier regresi berganda.

Dalam persamaan regresi berganda standar
0,3;
-2.1. Tentukan faktor yang atau memiliki efek yang lebih kuat pada :

+- , sejak 2.1>0.3;

Menurut persamaan ini, tidak mungkin untuk menjawab pertanyaan yang diajukan, karena nilai koefisien regresi "murni" tidak diketahui;

- , sejak 0,3>-2.1;

Menurut persamaan ini, tidak mungkin untuk menjawab pertanyaan yang diajukan, karena koefisien standar tidak dapat dibandingkan satu sama lain.

Variabel faktor dari persamaan regresi berganda yang diubah dari kualitatif ke kuantitatif disebut ...

ganjil;

Beberapa;

berpasangan;

Samaran.

Estimasi parameter persamaan linier regresi berganda dapat dicari dengan menggunakan metode:

Kotak sedang;

Kotak terbesar;

Kotak biasa;

kuadrat terkecil.

Syarat utama faktor-faktor yang termasuk dalam model regresi berganda adalah:

Kurangnya hubungan antara hasil dan faktor;

Kurangnya hubungan antar faktor;

Kurangnya hubungan linier antar faktor;

Adanya hubungan yang erat antar faktor.

Variabel dummy dimasukkan dalam persamaan regresi berganda untuk memperhitungkan efek fitur pada hasil ...

karakter berkualitas;

sifat kuantitatif;

bersifat non-esensial;

karakter acak.

Dari sepasang faktor kolinear, model ekonometrika memasukkan faktor

Yang, dengan hubungan yang cukup dekat dengan hasil, memiliki hubungan terbesar dengan faktor-faktor lain;

Yang, jika tidak ada hubungan dengan hasil, memiliki hubungan maksimum dengan faktor-faktor lain;

Yang, jika tidak ada hubungan dengan hasil, memiliki hubungan paling sedikit dengan faktor-faktor lain;

Yang mana dengan hubungan yang cukup erat dengan hasil, memiliki hubungan yang lebih kecil dengan faktor lainnya.

Heteroskedastisitas mengacu pada...

Keteguhan varians residu, terlepas dari nilai faktornya;

Ketergantungan ekspektasi matematis dari residual pada nilai faktor;

Ketergantungan varians residual pada nilai faktor;

Independensi ekspektasi matematis dari residual dari nilai faktor.

Nilai varians residual ketika faktor signifikan dimasukkan dalam model:

Tidak akan berubah;

akan meningkat;

akan menjadi nol;

Akan berkurang.

Jika spesifikasi model menampilkan bentuk hubungan non-linier antar indikator ekonomi, maka persamaan nonlinier tersebut ...

regresi;

penentuan;

korelasi;

Perkiraan.

Ketergantungan diselidiki, yang ditandai dengan persamaan regresi linier berganda. Untuk persamaan, nilai keketatan hubungan antara variabel yang dihasilkan dan sekumpulan faktor dihitung. Sebagai indikator ini, koefisien berganda digunakan ...

korelasi;

elastisitas;

regresi;

Penentuan.

Sebuah model ketergantungan permintaan pada sejumlah faktor sedang dibangun. Variabel dummy dalam persamaan regresi berganda ini bukan _________konsumen.

Status keluarga;

Tingkat pendidikan;

Untuk parameter penting, nilai yang dihitung dari kriteria Siswa ...

Lebih dari nilai tabel kriteria;

Sama dengan nol;

Tidak lebih dari nilai tabular kriteria Siswa;

Kurang dari nilai tabel kriteria.

Sistem LSM yang dibangun untuk mengestimasi parameter persamaan regresi linier berganda dapat diselesaikan...

Metode rata-rata bergerak;

Metode determinan;

Metode perbedaan pertama;

Metode simpleks.

Indikator yang mencirikan berapa banyak sigma yang hasilnya akan berubah rata-rata ketika faktor yang sesuai berubah satu sigma, dengan tingkat faktor lain tidak berubah, disebut koefisien regresi ____________

standar;

Dinormalisasi;

sejajar;

Terpusat.

Multikolinearitas dari faktor-faktor model ekonometrik menyiratkan…

Adanya hubungan nonlinier antara kedua faktor tersebut;

Adanya hubungan linier antara lebih dari dua faktor;

Kurangnya ketergantungan antar faktor;

Adanya hubungan linier antara kedua faktor tersebut.

Kuadrat terkecil yang digeneralisasi tidak digunakan untuk model dengan _______ residual.

Autokorelasi dan heteroskedastis;

homoskedastis;

heteroskedastis;

Autokorelasi.

Metode untuk menetapkan nilai numerik ke variabel dummy bukanlah:

mulai;

Penugasan label digital;

Menemukan nilai rata-rata;

Penetapan nilai kuantitatif.

Residu yang terdistribusi secara normal;

Residu homoskedastis;

residu autokorelasi;

Autokorelasi dari sifat yang dihasilkan.

Pemilihan faktor dalam model regresi berganda menggunakan metode inklusi didasarkan pada perbandingan nilai ...

Total varians sebelum dan sesudah memasukkan faktor ke dalam model;

Varians residual sebelum dan sesudah memasukkan faktor acak dalam model;

Varians sebelum dan sesudah dimasukkannya hasil ke dalam model;

Varians residual sebelum dan sesudah dimasukkannya model faktor.

Metode kuadrat terkecil umum digunakan untuk mengoreksi...

Parameter persamaan regresi nonlinier;

Ketepatan penentuan koefisien korelasi berganda;

Autokorelasi antar variabel independen;

Heteroskedastisitas residual dalam persamaan regresi.

Setelah menerapkan metode kuadrat terkecil umum, dimungkinkan untuk menghindari _________ residu

heteroskedastisitas;

Distribusi normal;

Sama dengan jumlah nol;

karakter acak.

Variabel dummy termasuk dalam persamaan regresi ____________

Acak;

ruang uap;

tidak langsung;

Banyak.

Interaksi faktor-faktor model ekonometrika berarti bahwa…

Pengaruh faktor pada fitur yang dihasilkan tergantung pada nilai faktor non-kolinier lainnya;

Pengaruh faktor terhadap atribut yang dihasilkan meningkat, dimulai dari tingkat nilai faktor tertentu;

Faktor menduplikasi pengaruh satu sama lain pada hasil;

Pengaruh salah satu faktor pada atribut yang dihasilkan tidak bergantung pada nilai faktor lainnya.

Regresi Berganda Topik (Masalah)

Persamaan regresi, dibangun di atas 15 pengamatan, memiliki bentuk:

Nilai yang hilang serta interval kepercayaan untuk

dengan probabilitas 0,99 adalah:

Persamaan regresi, dibangun di atas 20 pengamatan, memiliki bentuk:

dengan probabilitas 0,9 adalah:

Persamaan regresi, dibangun di atas 16 pengamatan, memiliki bentuk:

Nilai yang hilang serta interval kepercayaan untuk dengan probabilitas 0,99 adalah:

Persamaan regresi dalam bentuk standar adalah:

Koefisien elastisitas parsial sama dengan:

Persamaan regresi standar adalah:

Koefisien elastisitas parsial sama dengan:

Persamaan regresi standar adalah:

Koefisien elastisitas parsial sama dengan:

Persamaan regresi standar adalah:

Koefisien elastisitas parsial sama dengan:

Persamaan regresi standar adalah:

Koefisien elastisitas parsial sama dengan:

Berdasarkan 18 observasi, diperoleh data sebagai berikut:

;
;
;
;

adalah sama:

Berdasarkan 17 pengamatan, diperoleh data sebagai berikut:

;
;
;
;

Nilai koefisien determinasi yang disesuaikan, koefisien parsial elastisitas dan parameter adalah sama:

Berdasarkan 22 observasi, diperoleh data sebagai berikut:

;
;
;
;

Nilai koefisien determinasi yang disesuaikan, koefisien parsial elastisitas dan parameter adalah sama:

Berdasarkan 25 observasi, diperoleh data sebagai berikut:

;
;
;
;

Nilai koefisien determinasi yang disesuaikan, koefisien parsial elastisitas dan parameter adalah sama:

Berdasarkan 24 observasi, diperoleh data sebagai berikut:

;
;
;
;

Nilai koefisien determinasi yang disesuaikan, koefisien parsial elastisitas dan parameter adalah sama:

Berdasarkan 28 observasi, diperoleh data sebagai berikut:

;
;
;
;

Nilai koefisien determinasi yang disesuaikan, koefisien parsial elastisitas dan parameter adalah sama:

Berdasarkan 26 observasi, diperoleh data sebagai berikut:

;
;
;
;

Nilai koefisien determinasi yang disesuaikan, koefisien parsial elastisitas dan parameter adalah sama:

Dalam persamaan regresi:

Kembalikan karakteristik yang hilang; Buatlah selang kepercayaan untuk dengan probabilitas 0,95 jika n=12