Penentuan signifikansi persamaan regresi. Penilaian signifikansi statistik dari persamaan regresi parameternya

Untuk koefisien persamaan regresi, tingkat signifikansinya diperiksa menurut t -Kriteria siswa dan dengan kriteria F Nelayan. Di bawah ini kami mempertimbangkan penilaian keandalan indikator regresi hanya untuk persamaan linier (12.1) dan (12.2).

Y=a 0+ a 1 X(12.1)

X=b 0+b 1 kamu(12.2)

Untuk jenis persamaan ini, mereka dievaluasi oleh t-Kriteria siswa hanya nilai koefisien sebuah 1i b 1 menggunakan perhitungan nilai tf menurut rumus berikut:

Di mana r yx koefisien korelasi, dan nilai sebuah 1 dapat dihitung menggunakan rumus 12,5 atau 12,7.

Rumus (12,27) digunakan untuk menghitung kuantitas tf, sebuah 1 persamaan regresi kamu pada x.

nilai b 1 dapat dihitung menggunakan rumus (12.6) atau (12.8).

Rumus (12.29) digunakan untuk menghitung besaran tf, yang memungkinkan memperkirakan tingkat signifikansi koefisien b 1 persamaan regresi X pada kamu

Contoh. Mari kita perkirakan tingkat signifikansi koefisien regresi sebuah 1i b 1 persamaan (12.17), dan (12.18) diperoleh dalam menyelesaikan masalah 12.1. Mari kita gunakan rumus (12.27), (12.28), (12.29) dan (12.30) untuk ini.

Ingat kembali bentuk persamaan regresi yang diperoleh:

Y x = 3 + 0,06 X(12.17)

X y = 9+ 1 kamu(12.19)

Nilai sebuah 1 dalam persamaan (12.17) sama dengan 0,06. Oleh karena itu, untuk menghitung sesuai dengan rumus (12.27), Anda perlu menghitung nilainya Sb y x. Sesuai dengan kondisi masalah, kuantitas P= 8. Koefisien korelasi juga telah kami hitung dengan menggunakan rumus 12.9: rxy = 0,06 0,997 = 0,244 .

Tetap menghitung jumlahnya Σ (di v- kamu) 2 dan Σ (X ι -x) 2 , yang belum kita hitung. Cara terbaik untuk melakukan perhitungan ini pada tabel 12.2:

Tabel 12.2

Jumlah peserta ujian p / p x saya x –x (x –x) 2 di v- kamu (di v- kamu) 2
-4,75 22,56 - 1,75 3,06
-4,75 22,56 -0,75 0,56
-2,75 7,56 0,25 0,06
-2,75 7,56 1,25 15,62
1,25 1,56 1,25 15,62
3,25 10,56 0,25 0,06
5,25 27,56 -0,75 0,56
5,25 27,56 0,25 0,06
jumlah 127,48 35,6
Medium 12,75 3,75

Kami mengganti nilai yang diperoleh ke dalam rumus (12,28), kami mendapatkan:

Sekarang mari kita hitung nilainya tf menurut rumus (12.27):

Nilai tf diperiksa untuk tingkat signifikansi menurut Tabel 16 dari Lampiran 1 untuk t- Kriteria siswa. Jumlah derajat kebebasan dalam hal ini akan sama dengan 8-2 = 6, sehingga nilai kritisnya masing-masing sama untuk P 0,05 t cr= 2,45 dan untuk 0,01 t cr= 3,71. Dalam bentuk yang diterima, terlihat seperti ini:

Kami membangun "poros signifikansi":

Nilai yang diterima tf Tetapi bahwa nilai koefisien regresi persamaan (12.17) tidak dapat dibedakan dari nol. Dengan kata lain, persamaan regresi yang dihasilkan tidak sesuai dengan data eksperimen asli.



Sekarang mari kita hitung tingkat signifikansi dari koefisien b 1. Untuk ini, perlu untuk menghitung nilainya sbxy sesuai dengan rumus (12.30), di mana semua jumlah yang diperlukan telah dihitung:

Sekarang mari kita hitung nilainya tf menurut rumus (12.27):

Kita dapat segera membangun "sumbu signifikansi", karena semua operasi pendahuluan telah dilakukan di atas:

Nilai yang diterima tf jatuh ke zona tidak penting, oleh karena itu kita harus menerima hipotesis H tentang fakta bahwa nilai koefisien regresi persamaan (12.19) tidak dapat dibedakan dari nol. Dengan kata lain, persamaan regresi yang dihasilkan tidak sesuai dengan data eksperimen asli.

Regresi Nonlinier

Hasil yang diperoleh di bagian sebelumnya agak mengecewakan: kami telah menemukan bahwa kedua persamaan regresi (12.15) dan (12.17) tidak memadai untuk data eksperimen. Yang terakhir terjadi karena kedua persamaan ini mencirikan hubungan linier antara fitur, dan kami menunjukkan di Bagian 11.9 bahwa antara variabel X dan kamu ada ketergantungan lengkung yang signifikan. Dengan kata lain, antar variabel X dan kamu dalam masalah ini perlu untuk mencari bukan linier, tetapi untuk koneksi lengkung. Kami akan melakukan ini menggunakan paket "Tahap 6.0" (dikembangkan oleh A.P. Kulaichev, nomor registrasi 1205).

Tugas 12.2. Psikolog ingin memilih model regresi yang sesuai dengan data eksperimen yang diperoleh pada soal 11.9.

Keputusan. Masalah ini diselesaikan dengan enumerasi sederhana model regresi lengkung yang ditawarkan dalam paket statistik Stadiya. Paket diatur sedemikian rupa sehingga data eksperimen dimasukkan ke dalam spreadsheet, yang merupakan sumber untuk pekerjaan lebih lanjut, dalam bentuk kolom pertama untuk variabel X dan kolom kedua untuk variabel Y. Kemudian, di menu utama, bagian Statistik dipilih, di dalamnya ada subbagian - analisis regresi, di subbagian ini lagi subbagian - regresi lengkung. Menu terakhir berisi rumus (model) dari berbagai jenis regresi lengkung, yang dengannya Anda dapat menghitung koefisien regresi yang sesuai dan segera memeriksa signifikansinya. Di bawah ini kami hanya mempertimbangkan beberapa contoh bekerja dengan model (rumus) regresi lengkung yang sudah jadi.



1. Model pertama - eksponen . Formulanya adalah:

Saat menghitung menggunakan paket stat, kami mendapatkan sebuah 0 = 1 dan sebuah 1 = 0,022.

Perhitungan tingkat signifikansi untuk a memberikan nilai R= 0,535. Jelas bahwa nilai yang diperoleh tidak signifikan. Oleh karena itu, model regresi ini tidak memadai untuk data eksperimen.

2. Model kedua - kekuatan . Formulanya adalah:

Saat menghitung dan o = - 5,29, a, = 7,02 dan sebuah 1 = 0,0987.

Tingkat signifikansi untuk sebuah 1 - R= 7,02 dan untuk sebuah 2 - P = 0.991. Jelas, tidak ada koefisien yang signifikan.

3. Model ketiga - polinomial . Formulanya adalah:

kamu= sebuah 0 + sebuah 1 X + a 2 X 2+ sebuah 3 X 3

Saat menghitung sebuah 0= - 29,8, sebuah 1 = 7,28, sebuah 2 = - 0,488 dan sebuah 3 = 0,0103. Tingkat signifikansi untuk a, - P = 0,143, untuk 2 - P = 0,2 dan untuk a, - P = 0,272

Kesimpulan - model ini tidak memadai untuk data eksperimen.

4. Model keempat - parabola .

Formulanya adalah: Y \u003d a o + a l -X 1 + a 2 X 2

Saat menghitung sebuah 0 \u003d - 9,88, a, \u003d 2,24 dan sebuah 1 = - 0,0839 Tingkat signifikansi untuk sebuah 1 - P = 0,0186, untuk sebuah 2 - P = 0,0201. Kedua koefisien regresi tersebut signifikan. Oleh karena itu, masalahnya terpecahkan - kami telah mengidentifikasi bentuk hubungan lengkung antara keberhasilan menyelesaikan subtes ketiga Veksler dan tingkat pengetahuan dalam aljabar - ini adalah ketergantungan tipe parabola. Hasil ini menegaskan kesimpulan yang diperoleh dalam pemecahan masalah 11.9 tentang adanya hubungan lengkung antara variabel. Kami menekankan bahwa dengan bantuan regresi lengkung diperoleh bentuk yang tepat dari hubungan antara variabel yang diteliti.


Bab 13 ANALISIS FAKTOR

Konsep dasar analisis faktor

Analisis faktor adalah metode statistik yang digunakan saat memproses sejumlah besar data eksperimen. Tugas analisis faktor adalah: mereduksi jumlah variabel (reduksi data) dan menentukan struktur hubungan antar variabel, yaitu klasifikasi variabel, maka analisis faktor digunakan sebagai metode reduksi data atau sebagai metode klasifikasi struktural.

Perbedaan penting antara analisis faktor dan semua metode yang dijelaskan di atas adalah bahwa itu tidak dapat digunakan untuk memproses data primer, atau, seperti yang mereka katakan, data eksperimen "mentah", yaitu. diperoleh langsung dari pemeriksaan mata pelajaran. Bahan untuk analisis faktor adalah korelasi, atau lebih tepatnya, koefisien korelasi Pearson, yang dihitung antara variabel (yaitu, karakteristik psikologis) yang termasuk dalam survei. Dengan kata lain, matriks korelasi, atau, sebagaimana mereka disebut, matriks interkorelasi, dikenai analisis faktor. Nama kolom dan baris dalam matriks ini adalah sama, karena mewakili daftar variabel yang termasuk dalam analisis. Untuk alasan ini, matriks interkorelasi selalu persegi, yaitu. jumlah baris di dalamnya sama dengan jumlah kolom, dan simetris, mis. tempat simetris terhadap diagonal utama memiliki koefisien korelasi yang sama.

Harus ditekankan bahwa tabel data asli dari mana matriks korelasi diperoleh tidak harus persegi. Misalnya, seorang psikolog mengukur tiga indikator kecerdasan (verbal, non-verbal dan umum) dan nilai sekolah dalam tiga mata pelajaran akademik (sastra, matematika, fisika) dalam 100 mata pelajaran - siswa kelas sembilan. Matriks data asli akan menjadi 100 x 6 dan matriks interkorelasi akan menjadi 6 x 6 karena hanya memiliki 6 variabel. Dengan begitu banyak variabel, matriks interkorelasi akan mencakup 15 koefisien dan tidak akan sulit untuk menganalisisnya.

Namun, bayangkan apa yang terjadi jika psikolog menerima bukan 6, tetapi 100 indikator dari setiap mata pelajaran. Dalam hal ini, ia harus menganalisis 4950 koefisien korelasi. Jumlah koefisien dalam matriks dihitung dengan rumus n (n + 1) / 2 dan dalam kasus kami masing-masing sama dengan (100 × 99) / 2 = 4950.

Jelas, untuk melakukan analisis visual dari matriks semacam itu adalah tugas yang sulit. Sebagai gantinya, seorang psikolog dapat melakukan prosedur matematis analisis faktor dari matriks korelasi 100 × 100 (100 subjek dan 100 variabel) dan dengan cara ini mendapatkan materi yang lebih mudah untuk menafsirkan hasil eksperimen.

Konsep utama dari analisis faktor adalah faktor. Ini adalah indikator statistik buatan yang dihasilkan dari transformasi khusus dari tabel koefisien korelasi antara karakteristik psikologis yang dipelajari, atau matriks interkorelasi. Prosedur untuk mengekstrak faktor dari matriks interkorelasi disebut faktorisasi matriks. Sebagai hasil dari faktorisasi, sejumlah faktor yang berbeda dapat diekstraksi dari matriks korelasi hingga sejumlah yang sama dengan jumlah variabel asli. Namun, faktor-faktor yang diidentifikasi sebagai hasil dari faktorisasi, sebagai suatu peraturan, tidak sama nilainya.

Unsur-unsur matriks faktor disebut atau timbangan"; dan mereka adalah koefisien korelasi dari faktor tertentu dengan semua indikator yang digunakan dalam penelitian. Matriks faktor sangat penting karena menunjukkan bagaimana indikator yang dipelajari terkait dengan setiap faktor yang dipilih. Pada saat yang sama, bobot faktor menunjukkan ukuran, atau kedekatan, dari hubungan ini.

Karena setiap kolom matriks faktor (faktor) adalah sejenis variabel, faktor-faktor itu sendiri juga dapat berkorelasi satu sama lain. Dua kasus dimungkinkan di sini: korelasi antara faktor-faktornya adalah nol, dalam hal ini faktor-faktornya independen (ortogonal). Jika korelasi antar faktor lebih besar dari nol, maka dalam hal ini faktor-faktor tersebut dianggap dependen (jelas). Kami menekankan bahwa faktor ortogonal, berbeda dengan yang miring, memberikan varian interaksi yang lebih sederhana dalam matriks faktor.

Sebagai ilustrasi faktor ortogonal, masalah L. Thurstone sering dikutip, yang, setelah mengambil sejumlah kotak dengan ukuran dan bentuk yang berbeda, mengukur lebih dari 20 indikator yang berbeda di masing-masing kotak dan menghitung korelasi di antara mereka. Setelah memfaktorkan matriks interkorelasi yang diperoleh, ia memperoleh tiga faktor, korelasi di antaranya sama dengan nol. Faktor-faktor tersebut adalah "panjang", "lebar" dan "tinggi".

Untuk lebih memahami esensi analisis faktor, mari kita analisis contoh berikut secara lebih rinci.

Misalkan seorang psikolog menerima data berikut dari sampel acak siswa:

V 1- berat badan (dalam kg);

V2 - jumlah kehadiran pada kuliah dan seminar tentang mata pelajaran tersebut;

V 3- panjang kaki (dalam cm);

V 4- jumlah buku yang dibaca tentang masalah ini;

V 5- panjang lengan (dalam cm);

V 6 - nilai ujian dalam mata pelajaran ( V- dari kata bahasa Inggris variabel - variabel).

Saat menganalisis fitur-fitur ini, tidak masuk akal untuk mengasumsikan bahwa variabel V1, K 3 dan V 5- akan saling berhubungan, karena semakin besar orangnya, semakin beratnya dan semakin panjang anggota tubuhnya. Ini berarti bahwa harus ada koefisien korelasi yang signifikan secara statistik antara variabel-variabel ini, karena ketiga variabel ini mengukur beberapa sifat dasar individu dalam sampel, yaitu ukurannya. Demikian pula, kemungkinan ketika menghitung korelasi antara V2, V4 dan V 6 koefisien korelasi yang cukup tinggi juga akan diperoleh, karena menghadiri kuliah dan belajar mandiri akan berkontribusi untuk memperoleh nilai yang lebih tinggi dalam mata pelajaran yang dipelajari.

Jadi, dari seluruh kemungkinan susunan koefisien, yang diperoleh dengan enumerasi pasangan fitur yang berkorelasi V 1 dan V 2 , V t dan V 3 dll., dua blok korelasi yang signifikan secara statistik mungkin akan menonjol. Korelasi lainnya - antara fitur yang termasuk dalam blok yang berbeda, tidak mungkin memiliki koefisien yang signifikan secara statistik, karena hubungan antara fitur seperti ukuran tungkai dan kinerja akademik kemungkinan besar bersifat acak. Jadi, analisis yang berarti dari 6 variabel kami menunjukkan bahwa mereka, pada kenyataannya, hanya mengukur dua karakteristik umum, yaitu: ukuran tubuh dan tingkat kesiapan subjek.

Untuk matriks interkorelasi yang dihasilkan, mis. koefisien korelasi yang dihitung berpasangan antara keenam variabel V 1 - V 6, diperbolehkan untuk menerapkan analisis faktor. Ini juga dapat dilakukan secara manual, menggunakan kalkulator, tetapi prosedur pemrosesan statistik semacam itu sangat melelahkan. Untuk alasan ini, analisis faktor saat ini dilakukan di komputer, biasanya menggunakan paket statistik standar. Semua paket statistik modern memiliki program untuk korelasi dan analisis faktor. Program komputer analisis faktor pada dasarnya mencoba untuk "menjelaskan" korelasi antar variabel dalam kaitannya dengan sejumlah kecil faktor (dua dalam contoh kita).

Misalkan, dengan menggunakan program komputer, kita telah memperoleh matriks interkorelasi dari keenam variabel dan memasukkannya ke dalam analisis faktor. Sebagai hasil dari analisis faktor, diperoleh tabel 13.1, yang disebut "matriks faktor", atau "matriks struktural faktorial".

Tabel 13.1

Variabel Faktor 1 Faktor 2
V 1 0,91 0,01
V2 0,20 0,96
V 3 0,94 -0,15
V 4 0,11 0,85
V 5 0,89 0,07
V 6 -0,13 0,93

Secara tradisional, faktor direpresentasikan dalam tabel sebagai kolom, dan variabel sebagai baris. Judul kolom pada Tabel 13.1 sesuai dengan jumlah faktor yang dipilih, tetapi akan lebih akurat untuk menyebutnya "pembebanan faktor", atau "bobot", untuk faktor 1, sama untuk faktor 2. Seperti disebutkan di atas, beban faktor, atau bobot, adalah korelasi antara variabel masing-masing dan faktor yang diberikan. Misalnya, angka pertama 0,91 pada faktor pertama berarti korelasi antara faktor pertama dan variabel V 1 sama dengan 0,91. Semakin tinggi beban faktor dalam nilai absolut, semakin besar hubungannya dengan faktor tersebut.

Tabel 13.1 menunjukkan bahwa variabel V 1 V 3 dan V 5 memiliki korelasi yang besar dengan faktor 1 (pada kenyataannya, variabel 3 memiliki korelasi yang mendekati 1 dengan faktor 1). Pada saat yang sama, variabel V 2 ,V 3 dan 5 memiliki korelasi mendekati 0 dengan faktor 2. Demikian pula, faktor 2 sangat berkorelasi dengan variabel V2, V4 dan V 6 dan tidak benar-benar berkorelasi dengan variabel V 1,V 3 dan V 5

Dalam contoh ini, jelas bahwa ada dua struktur korelasi, dan oleh karena itu semua informasi dalam Tabel 13.1 ditentukan oleh dua faktor. Sekarang tahap akhir pekerjaan dimulai - interpretasi data yang diperoleh. Saat menganalisis matriks faktor, sangat penting untuk memperhitungkan tanda-tanda pemuatan faktor di setiap faktor. Jika beban dengan tanda yang berlawanan terjadi pada faktor yang sama, berarti terdapat hubungan yang berbanding terbalik antara variabel yang berlawanan tanda.

Perhatikan bahwa ketika menafsirkan faktor, untuk kenyamanan, adalah mungkin untuk membalikkan tanda-tanda semua beban untuk faktor ini.

Matriks faktor juga menunjukkan variabel mana yang membentuk setiap faktor. Hal ini terutama disebabkan oleh tingkat signifikansi bobot faktor. Secara tradisional, tingkat signifikansi minimum dari koefisien korelasi dalam analisis faktor diambil sama dengan 0,4 atau bahkan 0,3 (dalam nilai absolut), karena tidak ada tabel khusus yang dapat digunakan untuk menentukan nilai kritis untuk tingkat signifikansi dalam matriks faktor. . Oleh karena itu, cara termudah untuk melihat variabel mana yang "milik" dari suatu faktor adalah dengan menandai variabel yang memiliki beban lebih besar dari 0,4 (atau kurang dari -0,4). Kami menunjukkan bahwa dalam paket komputer, terkadang tingkat signifikansi dari bobot faktor ditentukan oleh program itu sendiri dan ditetapkan pada tingkat yang lebih tinggi, misalnya, 0,7.

Jadi, dari tabel 13.1, maka faktor 1 merupakan kombinasi dari variabel V 1 K 3 dan V 5(tapi tidak V1, K 4 dan V 6 , karena modulo pemuatan faktornya kurang dari 0,4). Demikian juga, faktor 2 adalah kombinasi dari variabel V2, V4 dan V6.

Faktor yang dipilih sebagai hasil pemfaktoran adalah sekumpulan variabel yang termasuk dalam analisis yang mempunyai beban signifikan. Akan tetapi, sering terjadi bahwa suatu faktor hanya memuat satu variabel dengan bobot faktor yang signifikan, sedangkan sisanya memiliki beban faktor yang tidak signifikan. Dalam hal ini, faktor akan ditentukan dengan nama satu-satunya variabel yang signifikan.

Intinya, faktor dapat dianggap sebagai "satuan" buatan dari pengelompokan variabel (fitur) berdasarkan tautan di antara mereka. Unit ini bersyarat, karena dengan mengubah kondisi tertentu dari prosedur faktorisasi untuk matriks interkorelasi, Anda bisa mendapatkan matriks faktor (struktur) yang berbeda. Dalam matriks baru, distribusi variabel berdasarkan faktor dan beban faktornya mungkin berbeda.

Berkaitan dengan hal tersebut, dalam analisis faktor terdapat konsep “struktur sederhana”. Sederhana adalah struktur matriks faktor, di mana setiap variabel memiliki beban signifikan hanya pada salah satu faktor, dan faktor-faktor itu sendiri ortogonal, yaitu. tidak saling bergantung. Dalam contoh kita, dua faktor umum adalah independen. Matriks faktor dengan struktur sederhana memungkinkan Anda untuk menginterpretasikan hasil dan memberi nama untuk setiap faktor. Dalam kasus kami, faktor pertama adalah "ukuran tubuh", faktor kedua adalah "tingkat kebugaran".

Hal di atas tidak menghilangkan kemungkinan yang berarti dari matriks faktor. Karakteristik tambahan dapat diekstraksi darinya, memungkinkan studi yang lebih rinci tentang hubungan antara variabel dan faktor. Karakteristik ini disebut "kesamaan" dan "nilai eigen" dari faktor tersebut.

Namun, sebelum menyajikan deskripsinya, kami menunjukkan satu sifat penting yang mendasar dari koefisien korelasi, yang dengannya karakteristik ini diperoleh. Koefisien korelasi, kuadrat (yaitu, dikalikan dengan dirinya sendiri), menunjukkan berapa banyak varians (varians) fitur yang umum untuk dua variabel, atau, lebih sederhana, berapa banyak variabel ini tumpang tindih. Jadi, misalnya, dua variabel dengan korelasi 0,9 tumpang tindih dengan kekuatan 0,9 x 0,9 = 0,81. Ini berarti bahwa 81% varians kedua variabel adalah sama, yaitu. cocok. Ingatlah bahwa pemuatan faktor dalam matriks faktor adalah koefisien korelasi antara faktor dan variabel, oleh karena itu, pemuatan faktor kuadrat mencirikan tingkat kesamaan (atau tumpang tindih) varians variabel tertentu dan faktor tertentu.

Jika faktor-faktor yang diperoleh tidak bergantung satu sama lain (solusi "ortogonal"), dimungkinkan untuk menentukan dari bobot matriks faktor bagian mana dari varians yang umum untuk variabel dan faktornya. Untuk menghitung berapa banyak varians setiap variabel bertepatan dengan varians faktor, Anda cukup menjumlahkan kuadrat dari beban faktor atas semua faktor. Dari tabel 13.1, misalnya, diperoleh bahwa 0,91 × 0,91 + + 0,01 × 0,01 = 0,8282, yaitu. sekitar 82% variabilitas variabel pertama "dijelaskan" oleh dua faktor pertama. Nilai yang dihasilkan disebut kesamaan variabel, dalam hal ini variabel V 1

Variabel dapat memiliki derajat kesamaan yang berbeda dengan faktor. Sebuah variabel dengan lebih umum memiliki tingkat signifikan tumpang tindih (sebagian besar varians) dengan satu atau lebih faktor. Generalitas rendah menyiratkan bahwa semua korelasi antara variabel dan faktor kecil. Ini berarti bahwa tidak ada faktor yang memiliki pangsa varians yang tumpang tindih dengan variabel ini. Generalitas yang rendah dapat menunjukkan bahwa suatu variabel mengukur sesuatu yang secara kualitatif berbeda dari variabel lain yang termasuk dalam analisis. Misalnya, satu variabel yang terkait dengan penilaian motivasi di antara tugas-tugas yang menilai kemampuan akan memiliki kesamaan yang mendekati nol dengan faktor-faktor kemampuan.

Keumuman yang rendah juga dapat berarti bahwa item tertentu sangat dipengaruhi oleh kesalahan pengukuran atau sangat sulit bagi subjek. Mungkin juga, sebaliknya, bahwa tugas itu begitu sederhana sehingga setiap subjek memberikan jawaban yang benar untuknya, atau tugas itu begitu kabur isinya sehingga subjek tidak memahami inti dari pertanyaan itu. Dengan demikian, generalitas rendah menyiratkan bahwa variabel ini tidak sesuai dengan faktor-faktor karena salah satu alasan berikut: apakah variabel mengukur konsep yang berbeda, atau variabel memiliki kesalahan pengukuran yang besar, atau ada perbedaan antara subjek dalam opsi respons untuk ini. tugas yang mendistorsi varians fitur.

Akhirnya, dengan bantuan karakteristik seperti nilai eigen suatu faktor, seseorang dapat menentukan kepentingan relatif dari masing-masing faktor yang dipilih. Untuk melakukan ini, Anda perlu menghitung berapa banyak varians (varians) yang dijelaskan oleh setiap faktor. Faktor yang menjelaskan 45% varians (tumpang tindih) antar variabel dalam matriks korelasi asli jelas lebih signifikan daripada faktor yang hanya menjelaskan 25% varians. Argumen-argumen ini, bagaimanapun, dapat diterima jika faktor-faktornya ortogonal, dengan kata lain, tidak bergantung satu sama lain.

Untuk menghitung nilai eigen faktor, Anda perlu mengkuadratkan beban faktor dan menambahkannya ke dalam kolom. Dengan menggunakan data pada Tabel 13.1, kita dapat memverifikasi bahwa nilai eigen dari faktor 1 adalah (0,91 × 0,91 + 0,20 × 0,20 + 0,94 × 0,94 + 0,11 × 0,11 + 0,84 × 0,84 + (- 0,13) ×

× (-0,13)) = 2,4863. Jika nilai eigen faktor dibagi dengan jumlah variabel (6 dalam contoh kita), maka angka yang dihasilkan akan menunjukkan proporsi varians yang dijelaskan oleh faktor ini. Dalam kasus kami, kami mendapatkan 2,4863∙100%/6 = 41,4%. Dengan kata lain, faktor 1 menjelaskan sekitar 41% informasi (dispersi) dalam matriks korelasi asli. Perhitungan serupa untuk faktor kedua akan memberikan 41,5%. Secara total, ini akan menjadi 82,9%.

Jadi, dua faktor umum, bila digabungkan, hanya menjelaskan 82,9% varians dalam indikator matriks korelasi asli. Apa yang terjadi dengan "sisa" 17,1%? Faktanya adalah bahwa, dengan mempertimbangkan korelasi antara 6 variabel, kami mencatat bahwa korelasi jatuh ke dalam dua blok terpisah, dan oleh karena itu memutuskan bahwa logis untuk menganalisis materi dalam hal dua faktor, dan bukan 6, serta jumlah variabel awal. Dengan kata lain, jumlah konstruksi yang diperlukan untuk menggambarkan data telah berkurang dari 6 (jumlah variabel) menjadi 2 (jumlah faktor umum). Sebagai hasil dari faktorisasi, bagian dari informasi dalam matriks korelasi asli dikorbankan untuk pembangunan model dua faktor. Satu-satunya kondisi di mana informasi tidak hilang adalah dengan mempertimbangkan model enam faktor.

Tes akhir dalam ekonometrik

1. Penilaian signifikansi parameter persamaan regresi dilakukan atas dasar:

A) t - Kriteria siswa;

b) F-kriteria Fisher - Snedekor;

c) kesalahan kuadrat rata-rata;

d) kesalahan perkiraan rata-rata.

2. Koefisien regresi dalam persamaan yang mencirikan hubungan antara volume penjualan (juta rubel) dan laba perusahaan di industri otomotif untuk tahun ini (juta rubel) berarti bahwa dengan peningkatan volume penjualan sebesar 1 juta rubel keuntungan meningkat sebesar:

d) 0,5 juta menggosok.;

c.500 ribu. menggosok.;

D) 1,5 juta rubel

3. Rasio korelasi (indeks korelasi) mengukur derajat keeratan hubungan antara X dankamu:

a) hanya dengan bentuk ketergantungan non-linier;

B) dengan segala bentuk kecanduan;

c) hanya dengan hubungan linier.

4. Dalam arah komunikasi terdapat :

a) sedang;

B) lurus;

c. berbentuk bujursangkar.

5. Berdasarkan 17 pengamatan, dibangun persamaan regresi:
.
Untuk memeriksa signifikansi persamaan, kami menghitungnilai yang diamatit- statistik: 3.9. Kesimpulan:

A) Persamaan signifikan untuk a = 0,05;

b) Persamaan tidak signifikan pada a = 0,01;

c) Persamaan tidak signifikan pada a = 0,05.

6. Apa konsekuensi dari pelanggaran asumsi OLS “ekspektasi residual regresi adalah nol”?

A) Estimasi bias dari koefisien regresi;

b) Estimasi koefisien regresi yang efisien tetapi tidak konsisten;

c) Estimasi koefisien regresi yang tidak efisien;

d) Estimasi koefisien regresi yang tidak konsisten.

7. Manakah dari pernyataan berikut yang benar dalam kasus heteroskedastisitas residual?

A) Kesimpulan pada t dan F-statistik tidak dapat diandalkan;

d) Estimasi parameter persamaan regresi bias.

8. Berdasarkan apa uji korelasi peringkat Spearman?

A) Pada penggunaan t - statistik;

c) Saat digunakan ;

9. Berdasarkan apa tes Putih?

b) Tentang penggunaan F-statistik;

B) sedang digunakan ;

d) Pada analisis grafis dari residu.

10. Metode apa yang dapat digunakan untuk menghilangkan autokorelasi?

11. Apa yang disebut pelanggaran asumsi keteguhan varians residual?

a) Multikolinearitas;

b) Autokorelasi;

B) Heteroskedastisitas;

d) Homoskedastisitas.

12. Variabel dummy dimasukkan ke dalam:

a) hanya dalam model linier;

b) hanya pada regresi nonlinier berganda;

c) hanya dalam model nonlinier;

D) model linier dan non-linier direduksi menjadi bentuk linier.

13. Jika dalam matriks koefisien korelasi berpasangan terdapat
, maka ini menunjukkan:

A) Tentang adanya multikolinearitas;

b) Tentang tidak adanya multikolinearitas;

c) Tentang adanya autokorelasi;

d) Tentang tidak adanya heteroskedastisitas.

14. Ukuran apa yang tidak mungkin untuk menghilangkan multikolinearitas?

a) Meningkatkan ukuran sampel;

D) Transformasi komponen acak.

15. Jika
dan rank matriks A lebih kecil dari (K-1) maka persamaannya:

a) terlalu diidentifikasi;

B) tidak teridentifikasi;

c) diidentifikasi secara akurat.

16. Persamaan regresi terlihat seperti:

TETAPI)
;

b)
;

di)
.

17. Apa masalah identifikasi model?

A) memperoleh parameter yang didefinisikan secara unik dari model yang diberikan oleh sistem persamaan simultan;

b) pemilihan dan penerapan metode untuk estimasi statistik dari parameter model yang tidak diketahui menurut data statistik awal;

c) memeriksa kecukupan model.

18. Metode apa yang digunakan untuk mengestimasi parameter dari persamaan over-identified?

C) DMNK, KMNK;

19. Jika variabel kualitatif memilikiknilai alternatif, maka simulasi menggunakan:

A) (k-1) variabel dummy;

b) variabel kdummy;

c) (k+1) variabel dummy.

20. Analisis kedekatan dan arah mata rantai dua tanda dilakukan atas dasar:

A) koefisien korelasi pasangan;

b) koefisien determinasi;

c) koefisien korelasi berganda.

21. Dalam persamaan linier x = sebuah 0 +a 1 x koefisien regresi menunjukkan:

a) kedekatan sambungan;

b) proporsi varians "Y" tergantung pada "X";

C) berapa banyak "Y" akan berubah rata-rata ketika "X" berubah satu unit;

d) kesalahan koefisien korelasi.

22. Indikator apa yang digunakan untuk menentukan bagian dari variasi akibat perubahan nilai faktor yang diteliti?

a) koefisien variasi;

b) koefisien korelasi;

C) koefisien determinasi;

d) koefisien elastisitas.

23. Koefisien elastisitas menunjukkan:

A) berapa% nilai y akan berubah ketika x berubah sebesar 1%;

b) dengan berapa unit pengukurannya nilai y akan berubah ketika x berubah sebesar 1%;

c) berapa % nilai y akan berubah jika x berubah per satuan. pengukuran Anda.

24. Metode apa yang dapat diterapkan untuk mendeteksi heteroskedastisitas??

A) uji Golfeld-Quandt;

B) uji korelasi rank spearman;

c) Uji Durbin-Watson.

25. Apa dasar dari tes Golfeld-Quandt?

a) Penggunaan t-statistik;

B) Pada penggunaan F - statistik;

c) Saat digunakan ;

d) Pada analisis grafis dari residu.

26. Metode apa yang tidak dapat digunakan untuk menghilangkan autokorelasi residu?

a) Metode umum kuadrat terkecil;

B) Metode kuadrat terkecil tertimbang;

C) metode kemungkinan maksimum;

D) Metode dua langkah kuadrat terkecil.

27. Pelanggaran asumsi independensi residual disebut?

a) Multikolinearitas;

B) Autokorelasi;

c) Heteroskedastisitas;

d) Homoskedastisitas.

28. Metode apa yang dapat digunakan untuk menghilangkan heteroskedastisitas?

A) Metode umum kuadrat terkecil;

b) Metode kuadrat terkecil tertimbang;

c) Metode kemungkinan maksimum;

d) Metode kuadrat terkecil dua langkah.

30. Jika menurutt-kriteria, sebagian besar koefisien regresi signifikan secara statistik, dan model secara keseluruhanF- kriteria tidak signifikan, maka ini dapat menunjukkan:

a) Multikolinearitas;

B) Pada autokorelasi residu;

c) Pada heteroskedastisitas residu;

d) Opsi ini tidak memungkinkan.

31. Apakah mungkin untuk menghilangkan multikolinearitas dengan mentransformasikan variabel?

a) Ukuran ini hanya efektif jika ukuran sampel ditingkatkan;

32. Metode apa yang dapat digunakan untuk mencari estimasi parameter persamaan regresi linier:

A) metode kuadrat terkecil;

b) analisis korelasi dan regresi;

c) analisis varians.

33. Persamaan regresi linier berganda dengan variabel dummy dibangun. Untuk memeriksa signifikansi koefisien individu, kami menggunakan distribusi:

a) Biasa;

b) Siswa;

c) Pearson;

d) Fischer-Snedekor.

34. Jika
dan rank matriks A lebih besar dari (K-1) maka persamaannya:

A) terlalu diidentifikasi;

b) tidak teridentifikasi;

c) diidentifikasi secara akurat.

35. Untuk memperkirakan parameter sistem persamaan yang dapat diidentifikasi secara tepat, berikut ini digunakan:

a) DMNK, KMNK;

b) DMNK, MNK, KMNK;

36. Kriteria Chow didasarkan pada penerapan:

A) F - statistik;

b) t - statistik;

c) Kriteria Durbin-Watson.

37. Variabel dummy dapat mengambil nilai berikut:

d) nilai apa pun.

39. Berdasarkan 20 pengamatan, persamaan regresi dibangun:
.
Untuk memeriksa signifikansi persamaan, nilai statistik dihitung:4.2. Temuan:

a) Persamaan signifikan pada a=0,05;

b) Persamaan tidak signifikan pada a=0,05;

c) Persamaan tidak signifikan pada a=0,01.

40. Manakah dari pernyataan berikut yang tidak benar jika residualnya heteroskedastis?

a) Kesimpulan pada statistik t dan F tidak reliabel;

b) Heteroskedastisitas memanifestasikan dirinya melalui rendahnya nilai statistik Durbin-Watson;

c) Dengan heteroskedastisitas, estimasi tetap efektif;

d) Estimasi bias.

41. Tes Chow didasarkan pada perbandingan:

A) dispersi;

b) koefisien determinasi;

c) ekspektasi matematis;

d) sedang.

42. Jika dalam tes Chow
maka dianggap:

A) bahwa pembagian menjadi subinterval berguna dari sudut pandang peningkatan kualitas model;

b) model secara statistik tidak signifikan;

c) model signifikan secara statistik;

d) bahwa tidak masuk akal untuk membagi sampel menjadi beberapa bagian.

43. Variabel dummy adalah variabel:

kualitas;

b) acak;

B) kuantitatif;

d.logis.

44. Manakah dari metode berikut ini yang tidak dapat digunakan untuk mendeteksi autokorelasi?

a) metode seri;

b) uji Durbin-Watson;

c) uji korelasi rank spearman;

D. Tes Putih.

45. Bentuk struktural paling sederhana dari model adalah:

TETAPI)

b)

di)

G)
.

46. ​​Tindakan apa yang dapat dilakukan untuk menghilangkan multikolinearitas?

a) Meningkatkan ukuran sampel;

b) Pengecualian variabel yang sangat berkorelasi dengan yang lain;

c) Perubahan spesifikasi model;

d) Transformasi komponen acak.

47. Jika
dan rank matriks A adalah (K-1) maka persamaannya:

a) terlalu diidentifikasi;

b) tidak teridentifikasi;

B) diidentifikasi secara akurat;

48. Sebuah model dianggap teridentifikasi jika:

a) di antara persamaan model setidaknya ada satu yang normal;

B) setiap persamaan sistem dapat diidentifikasi;

c) di antara persamaan model setidaknya ada satu persamaan yang tidak teridentifikasi;

d) di antara persamaan model setidaknya ada satu overidentified.

49. Metode apa yang digunakan untuk mengestimasi parameter persamaan tak dikenal?

a) DMNK, KMNK;

b) DMNC, MNC;

C) parameter persamaan seperti itu tidak dapat diperkirakan.

50. Di persimpangan bidang pengetahuan apa ekonometrika muncul:

A) teori ekonomi; statistik ekonomi dan matematika;

b) teori ekonomi, statistik matematika dan teori probabilitas;

c) statistik ekonomi dan matematika, teori probabilitas.

51. Dalam persamaan regresi linier berganda, interval kepercayaan dibangun untuk koefisien regresi menggunakan distribusi:

a) Biasa;

B) Siswa;

c) Pearson;

d) Fischer-Snedekor.

52. Berdasarkan 16 pengamatan, persamaan regresi linier berpasangan dibangun. Untukpemeriksaan signifikansi koefisien regresi dihitungt untuk 6l =2.5.

a) Koefisien tidak signifikan pada a=0,05;

b) Koefisien signifikan pada a=0,05;

c) Koefisien signifikan pada a=0,01.

53. Diketahui bahwa antara besaranXdankamuadakoneksi positif. Sejauh manaadalah koefisien korelasi berpasangan?

a) dari -1 hingga 0;

b) dari 0 sampai 1;

C. dari -1 sampai 1.

54. Koefisien korelasi ganda adalah 0,9. Persentase apadispersi atribut yang dihasilkan dijelaskan oleh pengaruh semuafaktor sifat?

55. Manakah dari metode berikut ini yang tidak dapat digunakan untuk mendeteksi heteroskedastisitas??

A) uji Golfeld-Quandt;

b) uji korelasi rank spearman;

c) metode seri.

56. Bentuk model yang diberikan adalah:

a) sistem fungsi nonlinier variabel eksogen dari variabel endogen;

B) sistem fungsi linier variabel endogen dari variabel eksogen;

c) sistem fungsi linier variabel eksogen dari variabel endogen;

d) sistem persamaan normal.

57. Dalam batas apa koefisien korelasi parsial yang dihitung dengan rumus rekursif berubah?

a) dari - untuk + ;

b) dari 0 sampai 1;

c) dari 0 sampai + ;

D) dari -1 sampai +1.

58. Dalam batas berapa koefisien korelasi parsial yang dihitung melalui koefisien determinasi berubah?

a) dari - untuk + ;

B) dari 0 sampai 1;

c) dari 0 sampai + ;

d) dari -1 sampai +1.

59. Variabel eksogen:

a) variabel terikat;

B) variabel bebas;

61. Saat menambahkan faktor penjelas lain ke persamaan regresi, koefisien korelasi berganda:

a) akan berkurang

b) akan meningkat;

c) mempertahankan nilainya.

62. Persamaan regresi hiperbolik dibangun:kamu= sebuah+ b/ X. UntukUji signifikansi persamaan menggunakan distribusi:

a) Biasa;

B) Siswa;

c) Pearson;

d) Fischer-Snedekor.

63. Untuk jenis sistem apa parameter persamaan ekonometrik individual dapat ditemukan dengan menggunakan metode kuadrat terkecil tradisional?

a) sistem persamaan normal;

B) sistem persamaan independen;

C) sistem persamaan rekursif;

D) sistem persamaan yang saling bergantung.

64. Variabel endogen:

A) variabel dependen;

b) variabel bebas;

c) tanggal dari titik waktu sebelumnya.

65. Dalam batas apa koefisien determinasi berubah?

a) dari 0 sampai + ;

b) dari - untuk + ;

C) dari 0 hingga +1;

d) dari -l ke +1.

66. Persamaan regresi linier berganda telah dibangun. Untuk memeriksa signifikansi koefisien individu, kami menggunakan distribusi:

a) Biasa;

b) Siswa;

c) Pearson;

D) Fischer-Snedekor.

67. Saat menambahkan faktor penjelas lain ke persamaan regresi, koefisien determinasi:

a) akan berkurang

B) akan meningkat;

c) mempertahankan nilainya;

d) tidak akan berkurang.

68. Inti dari metode kuadrat terkecil adalah:

A) estimasi ditentukan dari kondisi meminimalkan jumlah deviasi kuadrat dari data sampel dari estimasi yang ditentukan;

b) perkiraan ditentukan dari kondisi meminimalkan jumlah penyimpangan data sampel dari perkiraan yang ditentukan;

c) estimasi ditentukan dari kondisi meminimalkan jumlah simpangan kuadrat rata-rata sampel dari varians sampel.

69. Apa kelas regresi non-linier yang dimiliki parabola:

73. Apa kelas regresi non-linier yang dimiliki kurva eksponensial:

74. Apa kelas regresi non-linier yang dimiliki oleh fungsi bentuk ?
:

A) regresi yang non-linier terhadap variabel yang termasuk dalam analisis, tetapi linier terhadap parameter yang diestimasi;

b) regresi non-linier pada parameter yang diestimasi.

78. Apa kelas regresi non-linier yang dimiliki oleh fungsi bentuk ?
:

a) regresi yang non-linier terhadap variabel yang dimasukkan dalam analisis, tetapi linier terhadap parameter yang diestimasi;

B) regresi non-linier pada parameter yang diestimasi.

79. Pada persamaan regresi berbentuk hiperbola
jika nilainya
b >0 , kemudian:

A) dengan peningkatan sifat faktor X nilai atribut yang dihasilkan pada turun perlahan, dan x→ nilai rata-rata pada akan sama dengan sebuah;

b) nilai fitur efektif pada meningkat dengan pertumbuhan lambat dengan peningkatan sifat faktor X, dan di x→

81. Koefisien elastisitas ditentukan oleh rumus

A) fungsi linier;

b) Parabola;

c) hiperbola;

d) kurva eksponensial;

e) Kekuasaan.

82. Koefisien elastisitas ditentukan oleh rumus
untuk model regresi berupa:

a) fungsi linier;

B) Parabola;

c) hiperbola;

d) kurva eksponensial;

e) Kekuasaan.

86. Persamaan
ditelepon:

A) tren linier

b) tren parabola;

c) tren hiperbolik;

d) tren eksponensial.

89. Persamaan
ditelepon:

a) tren linier;

b) tren parabola;

c) tren hiperbolik;

D) tren eksponensial.

90. Tampilan sistem ditelepon:

A) sistem persamaan independen;

b) sistem persamaan rekursif;

c) sistem persamaan yang saling bergantung (simultan, simultan).

93. Ekonometrika dapat didefinisikan sebagai:

A) itu adalah disiplin ilmu independen yang menggabungkan serangkaian hasil teoretis, teknik, metode dan model yang dirancang untuk, atas dasar teori ekonomi, statistik ekonomi dan alat matematika dan statistik, memberikan ekspresi kuantitatif khusus untuk pola umum (kualitatif). karena teori ekonomi;

B) ilmu pengukuran ekonomi;

C) analisis statistik data ekonomi.

94. Tugas ekonometrika meliputi:

A) perkiraan indikator ekonomi dan sosial-ekonomi yang mencirikan keadaan dan perkembangan sistem yang dianalisis;

B) simulasi skenario yang mungkin untuk pengembangan sosio-ekonomi sistem untuk mengidentifikasi bagaimana perubahan yang direncanakan dalam parameter tertentu yang dapat dikelola akan mempengaruhi karakteristik keluaran;

c) pengujian hipotesis menurut data statistik.

95. Hubungan dibedakan berdasarkan sifatnya:

A) fungsional dan korelasi;

b) fungsional, lengkung dan bujursangkar;

c) korelasi dan invers;

d) statistik dan langsung.

96. Dengan hubungan langsung dengan peningkatan sifat faktor:

a) tanda efektif berkurang;

b) atribut efektif tidak berubah;

C) indikator kinerja meningkat.

97. Metode apa yang digunakan untuk mengidentifikasi keberadaan, sifat dan arah asosiasi dalam statistik?

a) nilai rata-rata;

B) perbandingan baris sejajar;

C) metode pengelompokan analitis;

d) nilai relatif;

D) metode grafis.

98. Metode apa yang digunakan untuk mengidentifikasi bentuk-bentuk pengaruh beberapa faktor terhadap faktor lain?

a) analisis korelasi;

B) analisis regresi;

c) analisis indeks;

d) analisis varians.

99. Metode apa yang digunakan untuk mengukur kekuatan dampak beberapa faktor terhadap faktor lain:

A) analisis korelasi;

b) analisis regresi;

c) metode rata-rata;

d) analisis varians.

100. Indikator apa yang besarnya ada dalam kisaran dari minus hingga plus satu:

a) koefisien determinasi;

b) rasio korelasi;

C) koefisien korelasi linier.

101. Koefisien regresi untuk model satu faktor menunjukkan:

A) berapa banyak unit fungsi berubah ketika argumen berubah satu unit;

b) berapa persen perubahan fungsi per unit perubahan dalam argumen.

102. Koefisien elastisitas menunjukkan:

a) berapa persen fungsi berubah dengan perubahan argumen sebesar satu unit pengukurannya;

B) berapa persen fungsi berubah dengan perubahan argumen sebesar 1%;

c) dengan berapa unit pengukurannya, fungsi berubah dengan perubahan argumen sebesar 1%.

105. Nilai indeks korelasi sebesar 0,087 menunjukkan:

A) tentang ketergantungan mereka yang lemah;

b) hubungan yang kuat;

c) kesalahan dalam perhitungan.

107. Nilai koefisien korelasi pasangan, sebesar 1,12, menunjukkan:

a) tentang ketergantungan mereka yang lemah;

b) hubungan yang kuat;

C) tentang kesalahan dalam perhitungan.

109. Manakah dari angka-angka yang diberikan yang dapat menjadi nilai koefisien korelasi pasangan:

111. Manakah dari angka-angka yang diberikan yang dapat menjadi nilai dari koefisien korelasi berganda:

115. Tandai bentuk persamaan regresi linier yang benar:

sebagai
;

oleh
;

c)
;

D)
.

Setelah mengevaluasi parameter sebuah dan b, kami telah memperoleh persamaan regresi yang dengannya kami dapat memperkirakan nilai kamu dengan nilai yang ditetapkan x. Wajar untuk mengasumsikan bahwa nilai yang dihitung dari variabel dependen tidak akan sesuai dengan nilai sebenarnya, karena garis regresi hanya menggambarkan hubungan rata-rata secara umum. Makna yang terpisah tersebar di sekitarnya. Dengan demikian, keandalan nilai-nilai yang dihitung yang diperoleh dari persamaan regresi sangat ditentukan oleh penyebaran nilai-nilai yang diamati di sekitar garis regresi. Dalam prakteknya, sebagai aturan, varians kesalahan tidak diketahui dan diperkirakan dari pengamatan secara bersamaan dengan parameter regresi. sebuah dan b. Cukup logis untuk mengasumsikan bahwa estimasi terkait dengan jumlah kuadrat dari residual regresi. Kuantitas adalah perkiraan sampel dari varians gangguan yang terkandung dalam model teoritis . Dapat ditunjukkan bahwa untuk model regresi berpasangan

di mana adalah deviasi nilai sebenarnya dari variabel dependen dari nilai yang dihitung.

Jika sebuah , maka untuk semua pengamatan, nilai sebenarnya dari variabel terikat bertepatan dengan nilai yang dihitung (teoretis) . Secara grafis, ini berarti bahwa garis regresi teoretis (garis yang dibangun dari fungsi ) melewati semua titik bidang korelasi, yang hanya mungkin dengan koneksi fungsional yang ketat. Oleh karena itu, tanda efektif pada sepenuhnya karena pengaruh faktor X.

Biasanya, dalam praktiknya, ada beberapa dispersi titik-titik bidang korelasi relatif terhadap garis regresi teoritis, yaitu penyimpangan data empiris dari yang teoritis. Hamburan ini disebabkan oleh kedua pengaruh faktor X, yaitu regresi kamu pada X, (varians seperti itu disebut dijelaskan, karena dijelaskan oleh persamaan regresi), dan tindakan penyebab lain (variasi yang tidak dapat dijelaskan, acak). Besarnya penyimpangan tersebut mendasari perhitungan indikator kualitas persamaan.

Menurut prinsip dasar analisis varians, jumlah total deviasi kuadrat dari variabel dependen kamu dari nilai rata-rata dapat diuraikan menjadi dua komponen: dijelaskan oleh persamaan regresi dan tidak dijelaskan:

,

dimana - nilai kamu, dihitung dengan persamaan .

Mari kita cari rasio jumlah deviasi kuadrat, dijelaskan oleh persamaan regresi, dengan jumlah total kuadrat:

, di mana

. (7.6)

Rasio bagian varians yang dijelaskan oleh persamaan regresi dengan varians total fitur yang dihasilkan disebut koefisien determinasi. Nilai tidak boleh melebihi satu dan nilai maksimum ini hanya akan dicapai pada , yaitu. ketika setiap penyimpangan adalah nol dan oleh karena itu semua titik sebar terletak tepat pada garis lurus.

Koefisien determinasi mencirikan bagian varians yang dijelaskan oleh regresi dalam nilai total varians variabel dependen . Dengan demikian, nilai mencirikan proporsi variasi (dispersi) y, dijelaskan oleh persamaan regresi, dan karena itu disebabkan oleh pengaruh faktor lain yang tidak diperhitungkan dalam model. Semakin mendekati satu, semakin tinggi kualitas modelnya.



Dengan regresi linier berpasangan, koefisien determinasi sama dengan kuadrat dari koefisien korelasi linier berpasangan: .

Akar dari koefisien determinasi ini adalah koefisien (indeks) korelasi berganda, atau rasio korelasi teoritis.

Untuk mengetahui apakah nilai koefisien determinasi yang diperoleh selama evaluasi regresi benar-benar mencerminkan hubungan yang sebenarnya antara kamu dan x periksa signifikansi persamaan yang dibangun secara keseluruhan dan parameter individu. Pengujian signifikansi persamaan regresi memungkinkan Anda untuk mengetahui apakah persamaan regresi cocok untuk penggunaan praktis, misalnya untuk peramalan atau tidak.

Pada saat yang sama, hipotesis utama diajukan tentang ketidakpentingan persamaan secara keseluruhan, yang secara formal direduksi menjadi hipotesis bahwa parameter regresi sama dengan nol, atau, yang sama, bahwa koefisien determinasi sama ke nol: . Hipotesis alternatif tentang signifikansi persamaan adalah hipotesis bahwa parameter regresi tidak sama dengan nol atau bahwa koefisien determinasi tidak sama dengan nol: .

Untuk menguji signifikansi model regresi, gunakan F- Kriteria Fisher, dihitung sebagai rasio jumlah kuadrat (per satu variabel independen) dengan jumlah sisa kuadrat (per satu derajat kebebasan):

, (7.7)

di mana k adalah jumlah variabel bebas.

Setelah membagi pembilang dan penyebut hubungan (7.7) dengan jumlah total deviasi kuadrat dari variabel dependen, F- Kriteria dapat secara ekuivalen dinyatakan dalam koefisien :

.

Jika hipotesis nol benar, maka varians yang dijelaskan oleh persamaan regresi dan varians yang tidak dapat dijelaskan (residual) tidak berbeda satu sama lain.

Nilai perkiraan F- kriteria dibandingkan dengan nilai kritis yang bergantung pada jumlah variabel bebas k, dan pada jumlah derajat kebebasan (n-k-1). Tabel (kritis) nilai F- kriteria - ini adalah nilai maksimum rasio varians, yang dapat terjadi jika mereka menyimpang secara acak untuk tingkat probabilitas tertentu dari keberadaan hipotesis nol. Jika dihitung nilai F- kriteria lebih besar dari yang tabel pada tingkat signifikansi tertentu, maka hipotesis nol tentang tidak adanya koneksi ditolak dan kesimpulan dibuat tentang signifikansi koneksi ini, yaitu. model dianggap signifikan.

Untuk model regresi berpasangan

.

Dalam regresi linier, signifikansi tidak hanya persamaan secara keseluruhan, tetapi juga koefisien individualnya biasanya dievaluasi. Untuk melakukan ini, kesalahan standar dari masing-masing parameter ditentukan. Kesalahan standar koefisien regresi parameter ditentukan oleh rumus:

, (7.8)

(7.9)

Kesalahan standar koefisien regresi atau standar deviasi yang dihitung dengan rumus (7.8,7.9), sebagai aturan, diberikan dalam hasil perhitungan model regresi dalam paket statistik.

Berdasarkan kesalahan kuadrat rata-rata dari koefisien regresi, signifikansi koefisien ini diperiksa menggunakan skema biasa untuk menguji hipotesis statistik.

Sebagai hipotesis utama, diajukan suatu hipotesis tentang perbedaan tidak signifikan dari nol pada koefisien regresi yang “sebenarnya”. Hipotesis alternatif dalam hal ini adalah hipotesis terbalik, yaitu tentang ketidaksamaan parameter regresi “benar” menjadi nol. Hipotesis ini diuji dengan menggunakan t- statistik yang memiliki t-Distribusi siswa:

Kemudian nilai yang dihitung t- statistik dibandingkan dengan nilai kritis t- statistik ditentukan dari tabel distribusi Student. Nilai kritis ditentukan tergantung pada tingkat signifikansi α dan jumlah derajat kebebasan, yaitu (n-k-1), n ​​- jumlah pengamatan k- jumlah variabel bebas. Dalam kasus regresi linier berpasangan, jumlah derajat kebebasannya adalah (P- 2). Nilai kritis juga dapat dihitung di komputer menggunakan fungsi STUDISP bawaan Excel.

Jika dihitung nilai t- statistik lebih besar dari kritis, maka hipotesis utama ditolak dan diyakini bahwa dengan probabilitas (1-α) Koefisien regresi "benar" secara signifikan berbeda dari nol, yang merupakan konfirmasi statistik tentang adanya ketergantungan linier dari variabel yang sesuai.

Jika dihitung nilai t- statistik kurang dari kritis, maka tidak ada alasan untuk menolak hipotesis utama, yaitu koefisien regresi “benar” tidak berbeda nyata dengan nol pada tingkat signifikansi α . Dalam hal ini, faktor yang sesuai dengan koefisien ini harus dikeluarkan dari model.

Signifikansi koefisien regresi dapat ditentukan dengan membangun interval kepercayaan. Interval kepercayaan untuk parameter regresi sebuah dan b didefinisikan sebagai berikut:

,

,

dimana ditentukan dari tabel distribusi Student untuk tingkat signifikansi α dan jumlah derajat kebebasan (P- 2) untuk regresi berpasangan.

Karena koefisien regresi dalam studi ekonometrik memiliki interpretasi ekonomi yang jelas, interval kepercayaan tidak boleh mengandung nol. Nilai sebenarnya dari koefisien regresi tidak dapat secara bersamaan berisi nilai positif dan negatif, termasuk nol, jika tidak, kita mendapatkan hasil yang kontradiktif dalam interpretasi ekonomi dari koefisien, yang tidak mungkin. Dengan demikian, koefisien tersebut signifikan jika selang kepercayaan yang diperoleh tidak menutupi nol.

Contoh 7.4. Menurut contoh 7.1:

a) Membangun model regresi linier berpasangan ketergantungan laba dari penjualan terhadap harga jual menggunakan perangkat lunak pengolah data.

b) Nilai signifikansi persamaan regresi secara keseluruhan, dengan menggunakan F- Kriteria Fisher pada = 0,05.

c) Nilai signifikansi koefisien model regresi menggunakan t-Kriteria siswa untuk =0,05 dan = 0,1.

Untuk analisis regresi kami menggunakan program perkantoran standar EXCEL. Kami akan membangun model regresi menggunakan alat REGRESSION dari pengaturan ANALYSIS PACKAGE (Gbr. 7.5), yang diluncurkan sebagai berikut:

Analisis ServiceDataREGRESSIONOK.

Gambar 7.5. Menggunakan alat REGRESI

Di kotak dialog REGRESSION, di bidang Input interval Y, masukkan alamat rentang sel yang berisi variabel dependen. Di bidang Input interval X, masukkan alamat dari satu atau lebih rentang yang berisi nilai variabel independen. Label di kotak centang baris pertama disetel ke status aktif jika judul kolom juga dipilih. pada gambar. 7.6. bentuk layar penghitungan model regresi menggunakan alat REGRESSION ditampilkan.

Beras. 7.6. Membangun model regresi berpasangan menggunakan

Alat REGRESI

Sebagai hasil dari pengoperasian alat REGRESSION, protokol analisis regresi berikut terbentuk (Gbr. 7.7).

Beras. 7.7. Protokol analisis regresi

Persamaan ketergantungan laba dari penjualan pada harga jual memiliki bentuk:

Kami akan memperkirakan signifikansi persamaan regresi menggunakan F- kriteria Fisher. Berarti F- Kriteria Fisher diambil dari tabel "Analisis varians" dari protokol EXCEL (Gbr. 7.7.). Nilai perkiraan F- kriteria 53.372. Nilai tabel F- kriteria pada tingkat signifikansi =0,05 dan jumlah derajat kebebasan adalah 4,964. Sebagai , maka persamaan tersebut dianggap signifikan.

Nilai perkiraan t-Kriteria siswa untuk koefisien persamaan regresi diberikan dalam tabel yang dihasilkan (Gbr. 7.7). Nilai tabel t-Tes siswa pada tingkat signifikansi =0,05 dan 10 derajat kebebasan adalah 2.228. Untuk koefisien regresi sebuah, maka koefisien sebuah tidak signifikan. Untuk koefisien regresi b, oleh karena itu, koefisien b penting.

Estimasi signifikansi parameter persamaan regresi

Signifikansi parameter persamaan regresi linier diestimasi menggunakan uji-t Student:

jika t kal. > t cr, maka hipotesis utama diterima ( Ho), menunjukkan signifikansi statistik dari parameter regresi;

jika t kal.< t cr, maka hipotesis alternatif diterima ( H1), menunjukkan statistik tidak signifikan dari parameter regresi.

di mana saya , m b adalah kesalahan standar dari parameter sebuah dan b:

(2.19)

(2.20)

Nilai kritis (tabel) dari kriteria ditemukan dengan menggunakan tabel statistik distribusi Siswa (Lampiran B) atau menurut tabel unggul(bagian dari wizard fungsi "Statistik"):

t cr = STEUDRASP( =1-P; k=n-2), (2.21)

di mana k=n-2 juga mewakili jumlah derajat kebebasan .

Estimasi signifikansi statistik juga dapat diterapkan pada koefisien korelasi linier

di mana Pak adalah kesalahan standar dalam menentukan nilai koefisien korelasi r yx

(2.23)

Di bawah ini adalah pilihan tugas untuk pekerjaan praktis dan laboratorium pada topik bagian kedua.

Pertanyaan untuk pemeriksaan diri di bagian 2

1. Tentukan komponen utama model ekonometrika dan esensinya.

2. Isi utama dari tahapan penelitian ekonometrika.

3. Esensi pendekatan untuk menentukan parameter regresi linier.

4. Esensi dan kekhasan penerapan metode kuadrat terkecil dalam menentukan parameter persamaan regresi.

5. Indikator apa yang digunakan untuk menilai keeratan hubungan faktor-faktor yang diteliti?

6. Esensi dari koefisien korelasi linier.

7. Esensi dari koefisien determinasi.

8. Esensi dan fitur utama dari prosedur untuk menilai kecukupan (signifikansi statistik) model regresi.

9. Penilaian kecukupan model regresi linier dengan koefisien aproksimasi.

10. Esensi pendekatan untuk menilai kecukupan model regresi dengan kriteria Fisher. Penentuan nilai empiris dan kritis kriteria.

11. Inti dari konsep "analisis dispersi" dalam kaitannya dengan studi ekonometrik.

12. Esensi dan fitur utama dari prosedur untuk menilai signifikansi parameter persamaan regresi linier.

13. Ciri-ciri penerapan distribusi Student dalam menilai signifikansi parameter-parameter persamaan regresi linier.

14. Apa tugas meramalkan nilai-nilai tunggal dari fenomena sosial-ekonomi yang dipelajari?

1. Membangun medan korelasi dan merumuskan asumsi tentang bentuk persamaan hubungan faktor-faktor yang diteliti;

2. Tuliskan persamaan dasar dari metode kuadrat terkecil, buat transformasi yang diperlukan, susun tabel untuk perhitungan antara dan tentukan parameter persamaan regresi linier;

3. Verifikasi kebenaran perhitungan yang dilakukan dengan menggunakan prosedur standar dan fungsi spreadsheet Excel.

4. Menganalisis hasil, merumuskan kesimpulan dan rekomendasi.

1. Perhitungan nilai koefisien korelasi linier;

2. Pembuatan tabel analisis dispersi;

3. Penilaian koefisien determinasi;

4. Verifikasi kebenaran perhitungan yang dilakukan dengan menggunakan prosedur standar dan fungsi spreadsheet Excel.

5. Menganalisis hasil, merumuskan kesimpulan dan rekomendasi.

4. Melakukan penilaian umum kecukupan persamaan regresi yang dipilih;

1. Penilaian kecukupan persamaan dengan nilai koefisien aproksimasi;

2. Penilaian kecukupan persamaan dengan nilai koefisien determinasi;

3. Penilaian kecukupan persamaan dengan kriteria Fisher;

4. Melakukan penilaian umum kecukupan parameter persamaan regresi;

5. Verifikasi kebenaran perhitungan yang dilakukan dengan menggunakan prosedur standar dan fungsi spreadsheet Excel.

6. Menganalisis hasil, merumuskan kesimpulan dan rekomendasi.

1. Menggunakan prosedur standar Wizard Fungsi Spreadsheet Excel (dari bagian "Matematika" dan "Statistik");

2. Persiapan data dan fitur menggunakan fungsi "LINEST";

3. Persiapan data dan fitur menggunakan fungsi "PREDIKSI".

1. Menggunakan prosedur standar paket analisis data spreadsheet Excel;

2. Penyiapan data dan fitur penerapan prosedur "REGRESI";

3. Interpretasi dan generalisasi data dari tabel analisis regresi;

4. Interpretasi dan generalisasi data dari tabel analisis dispersi;

5. Interpretasi dan generalisasi data tabel untuk menilai signifikansi parameter persamaan regresi;

Saat melakukan pekerjaan laboratorium sesuai dengan salah satu opsi, perlu untuk melakukan tugas-tugas khusus berikut:

1. Tentukan pilihan bentuk persamaan hubungan faktor-faktor yang dipelajari;

2. Menentukan parameter persamaan regresi;

3. Untuk menilai ketatnya hubungan faktor-faktor yang diteliti;

4. Menilai kecukupan persamaan regresi yang dipilih;

5. Mengevaluasi signifikansi statistik dari parameter persamaan regresi.

6. Verifikasi kebenaran perhitungan yang dilakukan dengan menggunakan prosedur standar dan fungsi spreadsheet Excel.

7. Menganalisis hasil, merumuskan kesimpulan dan rekomendasi.

Tugas untuk pekerjaan praktis dan laboratorium dengan topik "Regresi linier berpasangan dan korelasi dalam studi ekonometrik."

Pilihan 1 pilihan 2 Opsi 3 Opsi 4 Opsi 5
x kamu x kamu x kamu x kamu x kamu
Opsi 6 Opsi 7 Opsi 8 Opsi 9 Opsi 10
x kamu x kamu x kamu x kamu x kamu

Regresi Pasangan adalah regresi antara dua variabel

-y dan x, mis. lihat model + E

Di mana pada- tanda efektif, yaitu variabel terikat; X- faktor tanda.

Regresi linier direduksi menjadi persamaan bentuk atau

Persamaan bentuk memungkinkan nilai faktor x yang diberikan memiliki nilai teoretis dari fitur efektif, menggantikan nilai sebenarnya dari faktor x ke dalamnya.

Konstruksi regresi linier direduksi menjadi pendugaan parameter a dan b.

Estimasi parameter regresi linier dapat ditemukan dengan metode yang berbeda.

1.

2.

Parameter b ditelepon koefisien regresi. Nilainya menunjukkan

rata-rata perubahan hasil dengan perubahan faktor sebesar satu satuan.

Secara formal sebuah- berarti pada di x = 0. Jika faktor tanda

tidak dan tidak dapat memiliki nilai nol, maka di atas

interpretasi istilah bebas, sebuah tidak masuk akal. Parameter, sebuah mungkin

tidak memiliki kandungan ekonomi. Upaya ekonomi

menafsirkan parameter, sebuah dapat menyebabkan absurditas, terutama ketika sebuah < 0.

Hanya tanda parameter yang dapat ditafsirkan sebuah. Jika sebuah sebuah > 0,

maka perubahan relatif pada hasil lebih lambat dari perubahan

memeriksa kualitas parameter yang ditemukan dan seluruh model secara keseluruhan:

-Penilaian signifikansi koefisien regresi (b) dan koefisien korelasi

-Menilai signifikansi seluruh persamaan regresi. Koefisien determinasi

Persamaan regresi selalu dilengkapi dengan indikator keketatan hubungan. Pada

menggunakan regresi linier sebagai indikatornya adalah

koefisien korelasi linier r xy . Ada yang berbeda

modifikasi rumus koefisien korelasi linier.

Koefisien korelasi linier dalam batas: -1≤ .rxy

1. Apalagi semakin dekat r ke 0 semakin lemah korelasinya dan sebaliknya

semakin dekat r ke 1 atau -1, semakin kuat korelasinya, yaitu. ketergantungan x dan y mendekati

linier. Jika sebuah r tepat =1 atau -1 semua titik terletak pada garis lurus yang sama.

Jika koefisien regresi b>0 maka 0 . rxy 1 dan

sebaliknya untuk b<0 -1≤.rxy 0. koefisien

korelasi mencerminkan tingkat ketergantungan linier nilai m / y dengan adanya

ketergantungan yang nyata dari spesies lain.

Untuk menilai kualitas pemilihan fungsi linier, kuadrat dari linear

koefisien korelasi

Ditelepon koefisien determinasi. Koefisien determinasi

mencirikan proporsi varians dari fitur yang dihasilkan y, dijelaskan oleh

regresi. Nilai yang sesuai

mencirikan bagian dispersi y, disebabkan oleh pengaruh pihak lain yang tidak terhitung

dalam model faktor.

OLS memungkinkan dapatkan perkiraan parameter seperti itu sebuah dan b, yang

jumlah deviasi kuadrat dari nilai aktual dari atribut yang dihasilkan

(y) dari terhitung (teoritis)

minimum:

Dengan kata lain, dari

dari seluruh rangkaian garis, garis regresi pada grafik dipilih sehingga jumlah

kuadrat jarak vertikal antara titik dan garis ini adalah

minimum.

Sistem persamaan normal diselesaikan

ESTIMASI SIGNIFIKANSI PARAMETER REGRESI LINIER.

Penilaian signifikansi persamaan regresi secara keseluruhan diberikan dengan menggunakan kriteria-F

Nelayan. Dalam hal ini diajukan hipotesis nol bahwa koefisien regresi sama dengan

nol, yaitu b= 0, dan karenanya faktor X tidak tersedia

mempengaruhi hasil y.

Perhitungan langsung dari kriteria-F didahului dengan analisis varians.

Pusatnya adalah perluasan jumlah total deviasi kuadrat

variabel pada dari nilai rata-rata pada menjadi dua bagian-

"dijelaskan" dan "tidak dijelaskan":

Jumlah total deviasi kuadrat

Jumlah kuadrat

penyimpangan dijelaskan oleh regresi

Jumlah sisa deviasi kuadrat.

Setiap jumlah deviasi kuadrat terkait dengan jumlah derajat kebebasan , t.

e.dengan jumlah kebebasan variasi independen fitur. Jumlah derajat kebebasan terkait dengan jumlah unit populasi n dan jumlah konstanta yang ditentukan darinya. Berkenaan dengan masalah yang diteliti, jumlah derajat kebebasan harus menunjukkan berapa banyak penyimpangan independen dari P mungkin diperlukan untuk

pembentukan jumlah kuadrat tertentu.

Dispersi per derajat kebebasan D.

F-rasio (F-kriteria):

Jika hipotesis nol benar, maka faktor dan varians residual tidak

berbeda satu sama lain. Untuk H 0, sanggahan diperlukan sehingga

varians faktor melebihi residual satu kali beberapa kali. Bahasa inggris

ahli statistik Snedecor mengembangkan tabel nilai kritis rasio-F

pada tingkat signifikansi yang berbeda dari hipotesis nol dan jumlah derajat yang berbeda

kebebasan. Nilai tabel uji-F adalah nilai maksimum rasio

varians, yang dapat terjadi jika terjadi divergensi acak untuk suatu

tingkat probabilitas kehadiran hipotesis nol. Nilai rasio-F yang dihitung

diakui andal jika o lebih besar dari nilai tabel. Dalam hal ini, nol

hipotesis tentang tidak adanya hubungan tanda-tanda ditolak dan kesimpulan dibuat tentang

signifikansi hubungan ini: F fakta > F tabel H 0

ditolak.

Jika nilainya lebih kecil dari fakta F tabular ‹, tabel F

Maka probabilitas hipotesis nol berada di atas tingkat tertentu dan tidak mungkin

ditolak tanpa risiko serius menyesatkan koneksi. PADA

Dalam hal ini, persamaan regresi dianggap tidak signifikan secara statistik. Tetapi

tidak ditolak.


Informasi serupa.