Bidang korelasi dan penggunaannya dalam analisis awal korelasi.

Bidang korelasi berfungsi sebagai representasi visual dari tabel korelasi. Ini adalah grafik di mana nilai X diplot pada sumbu absis, nilai Y diplotkan di sepanjang sumbu ordinat, dan kombinasi X dan Y ditunjukkan dengan titik. titik.

Menggunakan metode grafik.

Metode ini digunakan untuk memvisualisasikan bentuk komunikasi antar indikator ekonomi yang diteliti. Untuk melakukan ini, grafik dibangun dalam sistem koordinat persegi panjang, nilai individu dari atribut yang dihasilkan Y diplot di sepanjang sumbu ordinat, dan nilai individu dari atribut faktor X diplot di sepanjang sumbu absis.

Himpunan titik-titik karakteristik efektif dan faktor disebut medan korelasi.

Berdasarkan bidang korelasi, seseorang dapat berhipotesis (untuk populasi umum) bahwa hubungan antara semua kemungkinan nilai X dan Y adalah linier.

Persamaan regresi liniernya adalah y = bx + a +

Di sini adalah kesalahan acak (deviasi, gangguan).

Alasan adanya kesalahan acak:

1. Tidak memasukkan variabel penjelas yang signifikan dalam model regresi;

2. Agregasi variabel. Misalnya, fungsi konsumsi total adalah upaya ekspresi umum dari totalitas keputusan pengeluaran individu individu. Ini hanya perkiraan hubungan individu yang memiliki parameter berbeda.

3. Deskripsi struktur model yang salah;

4. Spesifikasi fungsional yang salah;

21. Analisis korelasi dan regresi.

Analisis korelasi-regresi sebagai konsep umum mencakup pengukuran keketatan dan arah sambungan dan penetapan ekspresi analitis (bentuk) sambungan (analisis regresi).

Tujuan dari analisis regresi adalah untuk mengevaluasi ketergantungan fungsional dari nilai rata-rata bersyarat atribut efektif (Y) pada faktorial (x1, x2, ..., xk).

Persamaan regresi, atau model statistik hubungan fenomena sosial ekonomi, dinyatakan dengan fungsi:

Yx = f(x1, x2, …, xn),

di mana "n" adalah jumlah faktor yang termasuk dalam model;

Xi - faktor yang mempengaruhi hasil Y.

Tahapan analisis korelasi dan regresi:

Analisis awal (apriori). Ini memberikan hasil yang baik jika dilakukan oleh peneliti yang cukup berkualitas.

Pengumpulan informasi dan pemrosesan utamanya.

Membangun model (persamaan regresi). Sebagai aturan, prosedur ini dilakukan pada PC menggunakan program standar.

Evaluasi keketatan hubungan fitur, evaluasi persamaan regresi dan analisis model.

Peramalan pengembangan sistem yang dianalisis sesuai dengan persamaan regresi.

Pada tahap pertama, tugas studi dirumuskan, metodologi untuk mengukur indikator atau mengumpulkan informasi ditentukan, jumlah faktor ditentukan, faktor duplikat dikeluarkan atau dihubungkan ke dalam sistem deterministik yang kaku.

Pada tahap kedua, volume unit dianalisis: populasi harus cukup besar dalam hal jumlah unit dan pengamatan (N>>50), jumlah faktor "n" harus sesuai dengan jumlah pengamatan "N ”. Data harus homogen secara kuantitatif dan kualitatif.

Pada tahap ketiga, bentuk koneksi dan jenis fungsi analitik (parabola, hiperbola, garis lurus) ditentukan dan parameternya ditemukan.

Pada tahap keempat, keandalan semua karakteristik hubungan korelasi dan persamaan regresi dinilai menggunakan kriteria keandalan Fisher atau Student, dan analisis ekonomi dan teknologi dari parameter dilakukan.

Pada tahap kelima, peramalan nilai hasil yang mungkin dilakukan sesuai dengan nilai terbaik dari fitur faktor yang disertakan dalam model. Di sini, nilai terbaik dan terburuk dari faktor dan hasilnya dipilih.

22. Jenis persamaan regresi.

Untuk deskripsi kuantitatif hubungan antara variabel ekonomi dalam statistik, digunakan metode regresi dan korelasi.

Regresi adalah nilai yang menyatakan ketergantungan nilai rata-rata variabel acak y pada nilai variabel acak x.

Persamaan regresi mengungkapkan nilai rata-rata dari satu fitur sebagai fungsi yang lain.

Fungsi regresi adalah model dari bentuk y \u003d l ”, di mana y adalah variabel terikat (tanda hasil); x adalah variabel independen, atau penjelas, (faktor tanda).

Garis regresi adalah grafik fungsi y \u003d f (x).

2 jenis hubungan antara x dan y:

1) tidak dapat diketahui mana dari kedua variabel tersebut yang bebas dan mana yang terikat, variabel-variabelnya sama besar, ini merupakan hubungan tipe korelasi;

2) jika x dan y tidak sama dan salah satunya dianggap sebagai variabel penjelas (independen), dan yang lainnya sebagai variabel dependen, maka ini adalah hubungan tipe regresi.

Jenis regresi:

1) hiperbolik - regresi hiperbola sama sisi: y \u003d a + b / x + E;

2) linier - regresi yang digunakan dalam statistik dalam bentuk interpretasi ekonomi yang jelas dari parameternya: y \u003d a + b * x + E;

3) linier logaritmik - regresi dalam bentuk: Dalam y \u003d Dalam a + b * Dalam x + Dalam E

4) berganda - regresi antara variabel y dan x1, x2 ... xm, yaitu model dalam bentuk: y \u003d f (x1, x2 ... xm) + E, di mana y adalah variabel terikat (tanda hasil), x1 , 2 ...xm - variabel independen, penjelas (faktor-tanda), - variabel gangguan atau stokastik, termasuk pengaruh faktor-faktor yang tidak diperhitungkan dalam model;

5) non-linier - regresi, non-linier sehubungan dengan variabel penjelas yang termasuk dalam analisis, tetapi linier sehubungan dengan parameter yang diestimasi; atau regresi yang nonlinier dalam parameter yang diestimasi.

6) terbalik - regresi direduksi menjadi bentuk linier, diimplementasikan dalam paket aplikasi standar dalam bentuk: y \u003d 1 / a + b * x + E;

    berpasangan - regresi antara dua variabel y dan x, yaitu, model dari bentuk: y \u003d f (x) + E, di mana y adalah variabel dependen (fitur efektif), x adalah variabel penjelas independen (fitur - faktor ), E - gangguan, atau variabel stokastik yang mencakup pengaruh faktor-faktor yang tidak diperhitungkan dalam model.

    Rangkaian dinamika dan jenisnya

Deret waktu selalu terdiri dari 2 elemen: 1) titik waktu atau periode waktu yang terkait dengan data statistik yang diberikan, 2) indikator statistik, yang disebut tingkat deret waktu.

Tergantung pada isi indikator waktu, rangkaian dinamika bersifat sesaat atau interval

Tergantung pada jenis indikator statistik, deret dinamis dibagi menjadi deret nilai absolut, relatif, dan rata-rata

Absolut menunjukkan nilai yang tepat

Yang relatif menunjukkan perubahan proporsi indikator dalam total populasi

Nilai rata-rata berisi tentang perubahan waktu indikator, yang merupakan tingkat rata-rata fenomena

    Indikator dari serangkaian dinamika. Tingkat tengah rentang dinamika.

Indikator: 1) rata-rata deret dinamis, 2) pertumbuhan absolut, rantai dan dasar, pertumbuhan absolut rata-rata, 3) laju pertumbuhan dan pertumbuhan, rantai dan dasar, pertumbuhan dan laju pertumbuhan rata-rata, 4) nilai fmcjk.nyst 1 % meningkat

Dinamika rata-rata

Karakteristik umum dari serangkaian dinamika, dengan bantuan mereka, membandingkan intensitas perkembangan fenomena dalam kaitannya dengan objek yang berbeda, misalnya, menurut negara, industri, perusahaan

Level rata-rata saat ini yi. Metode untuk menghitung level rata-rata tergantung pada jenis seri (sesaat / interval) (dengan interval yang sama / berbeda). Jika rangkaian interval dinamika nilai absolut atau rata-rata diberikan dengan interval waktu yang sama, maka rumus untuk menghitung rata-rata sederhana digunakan untuk menghitung tingkat rata-rata. Jika interval waktu dari deret interval tidak sama, maka tingkat rata-rata ditemukan oleh rata-rata tertimbang aritmatika. Usr=smmUi*Ti/smmTi

25. Pertumbuhan mutlak(delta dan) adalah selisih antara dua level deret dinamis, yang menunjukkan seberapa besar level deret ini melebihi level yang diambil sebagai dasar perbandingan. Delta U=Ui-U0

Delta U=Ui-Ui-1

Percepatan mutlak- perbedaan antara pertumbuhan absolut untuk periode tertentu dan pertumbuhan absolut untuk periode sebelumnya dengan durasi yang sama: Delta dan dengan bar=delta dan - delta dan-1. Percepatan mutlak menunjukkan seberapa besar laju perubahan indikator mengalami kenaikan (penurunan). Indikator akselerasi digunakan untuk keuntungan absolut rantai. Nilai percepatan negatif menunjukkan perlambatan pertumbuhan atau percepatan penurunan tingkat seri.

    Indikator perubahan relatif pada tingkatan-tingkatan rangkaian dinamika.

Faktor pertumbuhan (tingkat pertumbuhan)- ini adalah rasio dua level yang dibandingkan, yang menunjukkan berapa kali level ini melebihi level periode dasar. Ini mencerminkan intensitas perubahan tingkat dari serangkaian dinamika dan menunjukkan berapa kali tingkat telah meningkat dibandingkan dengan tingkat dasar, dan dalam kasus penurunan, bagian mana dari tingkat dasar yang dibandingkan.

Rumus Faktor Pertumbuhan: Jika Dibandingkan dengan Basa Konstan: K i .=y i /y 0 , jika dibandingkan dengan basis variabel: K i .=y i /y i -1 .

Tingkat pertumbuhan adalah tingkat pertumbuhan, dinyatakan sebagai persentase:

T R = Ke 100 %.

Tingkat pertumbuhan untuk setiap deret waktu adalah indikator interval, mis. mencirikan periode (interval) waktu tertentu.

Tingkat kenaikan- nilai relatif kenaikan, yaitu rasio kenaikan absolut ke tingkat sebelumnya atau dasar. Ini mencirikan berapa persentase tingkat periode yang diberikan lebih (atau kurang) dari tingkat dasar.

Tingkat kenaikan- rasio pertumbuhan absolut ke tingkat yang diambil sebagai dasar perbandingan:

Tpr \u003d Ui-U0 / U0 * 100%

Tingkat kenaikan- perbedaan antara tingkat pertumbuhan (dalam persen) dan 100,

Anda akan perlu

  • - deret distribusi variabel terikat dan variabel bebas;
  • - kertas, pensil;
  • - Perangkat lunak komputer dan spreadsheet.

Petunjuk

Pilih dua yang menurut Anda memiliki hubungan, biasanya mengambil , yang berubah seiring waktu. Perhatikan bahwa salah satu variabel harus independen, itu akan bertindak sebagai penyebab. Yang kedua harus berubah dengannya - berkurang, bertambah, atau berubah secara acak.

Ukur nilai variabel dependen untuk setiap variabel independen. Catat hasilnya dalam sebuah tabel, dalam dua baris atau dua kolom. Diperlukan setidaknya 30 pembacaan untuk mendeteksi koneksi, tetapi untuk hasil yang lebih akurat, berhati-hatilah agar memiliki setidaknya 100 poin.

Bangun bidang koordinat, sambil memplot nilai variabel dependen pada sumbu ordinat, dan variabel independen pada sumbu absis. Tanda tangani sumbu dan tunjukkan unit pengukuran untuk setiap indikator.

Tandai titik-titik bidang korelasi pada grafik. Pada sumbu x, cari nilai pertama dari variabel bebas, dan pada sumbu y, cari nilai yang sesuai dari variabel terikat. Bangun tegak lurus terhadap proyeksi ini dan temukan titik pertama. Tandai, lingkari dengan pensil atau pena yang lembut. Bangun semua titik lainnya dengan cara yang sama.

Himpunan poin yang dihasilkan disebut korelasi bidang. Analisis grafik yang dihasilkan, buat kesimpulan tentang ada tidaknya hubungan sebab akibat yang kuat atau lemah, atau ketidakhadirannya.

Perhatikan penyimpangan acak dari jadwal. Jika, secara umum, ketergantungan linier atau lainnya dilacak, tetapi seluruh "gambar" dirusak oleh satu atau dua titik yang berada di sela-sela populasi total, mereka dapat menjadi kesalahan acak dan tidak diperhitungkan saat menafsirkan grafik .

Jika Anda perlu membangun dan menganalisis bidang korelasi Untuk data dalam jumlah besar, gunakan program spreadsheet seperti Excel, atau beli perangkat lunak khusus.

Hubungan beberapa besaran, di mana perubahan satu besaran menyebabkan perubahan besaran lainnya, disebut korelasi. Itu bisa sederhana, banyak atau sebagian. Konsep ini diterima tidak hanya dalam matematika, tetapi juga dalam biologi.

Kata korelasi Berasal dari bahasa Latin correlatio, hubungan. Semua fenomena, peristiwa, dan objek, serta kuantitas yang mencirikannya, saling berhubungan. Ketergantungan korelasi berbeda dari ketergantungan fungsional dalam jenis ketergantungan ini, semua hanya dapat diukur rata-rata, kira-kira.Ketergantungan korelasi mengasumsikan bahwa nilai variabel sesuai dengan perubahan nilai independen hanya dengan tingkat probabilitas tertentu. Derajat ketergantungan disebut koefisien korelasi.Konsep korelasi adalah rasio struktur dan fungsi masing-masing bagian tubuh.Cukup sering, konsepnya korelasi menggunakan statistik. Dalam statistika, ini adalah hubungan antara besaran statistik, deret, dan golongan. Untuk menentukan ada tidaknya atau ada tidaknya suatu korelasi digunakan suatu metode khusus. Metode korelasi digunakan untuk menentukan langsung atau kebalikan dari perubahan bilangan pada deret yang dibandingkan. Bila ditemukan, maka ukuran itu sendiri atau derajat paralelisme. Tetapi faktor penyebab internal tidak ditemukan dengan cara ini. Tugas utama statistika sebagai ilmu adalah menemukan ketergantungan kausal yang demikian bagi ilmu-ilmu lain, dalam bentuk korelasinya bisa linier atau nonlinier, positif atau negatif. Ketika salah satu variabel meningkat atau menurun, yang lain juga meningkat atau menurun, maka hubungan tersebut linier. Jika, ketika mengubah satu kuantitas, sifat perubahan yang lain adalah nonlinier, maka ini korelasi non-linier. Positif korelasi dianggap ketika peningkatan tingkat satu kuantitas disertai dengan peningkatan tingkat yang lain. Misalnya, ketika peningkatan suara disertai dengan perasaan peningkatan nadanya.Korelasi, ketika peningkatan tingkat satu variabel disertai dengan penurunan tingkat variabel lain, disebut negatif. Dalam masyarakat, peningkatan tingkat kecemasan individu mengarah pada penurunan kemungkinan individu ini akan menempati ceruk dominan di antara sesama.Bila tidak ada hubungan antar variabel, korelasi disebut nol.

Video Terkait

Sumber:

  • Korelasi Nonlinier di 2019

Korelasi adalah ketergantungan timbal balik dari dua variabel acak (lebih sering - dua kelompok variabel), di mana perubahan di salah satu dari mereka mengarah ke perubahan yang lain. Koefisien korelasi menunjukkan seberapa besar kemungkinan perubahan nilai kedua ketika nilai-nilai pertama berubah, yaitu. derajat ketergantungan. Cara termudah untuk menghitung nilai ini adalah dengan menggunakan fungsi terkait yang ada di dalam editor spreadsheet Microsoft Office Excel.

Anda akan perlu

  • Editor lembar kerja Microsoft Office Excel.

Petunjuk

Mulai Excel dan buka dokumen yang berisi grup data yang koefisien korelasinya ingin Anda hitung. Jika dokumen seperti itu belum dibuat, maka masukkan data ke dalam - editor spreadsheet membuatnya secara otomatis saat program dimulai. Masukkan masing-masing kelompok nilai, korelasi antara yang Anda minati, masukkan di kolom terpisah. Ini tidak harus berupa kolom yang berdekatan, Anda bebas mengatur tabel dengan cara yang paling nyaman - tambahkan kolom tambahan dengan penjelasan ke data, judul kolom, sel total dengan nilai total atau rata-rata, dll. Anda bahkan dapat menyusun data tidak dalam arah vertikal (dalam kolom), tetapi dalam arah horizontal (dalam baris). Satu-satunya persyaratan yang harus diperhatikan adalah bahwa sel dengan data setiap grup harus ditempatkan secara berurutan satu demi satu, sehingga array kontinu dibuat dengan cara ini.

Masuk ke sel yang akan berisi nilai korelasi data kedua array, dan klik tab "Rumus" di menu Excel. Di grup perintah "Perpustakaan Fungsi", klik ikon terbaru - "Fungsi Lainnya". Daftar drop-down akan terbuka, di mana Anda harus pergi ke bagian "Statistik" dan pilih fungsi CORREL. Akibatnya, jendela wizard fungsi akan terbuka dengan formulir untuk diisi. Jendela yang sama juga dapat dipanggil tanpa tab "Rumus", cukup dengan mengklik ikon sisipkan fungsi yang terletak di sebelah kiri bilah rumus.

Tentukan grup pertama dari data berkorelasi di bidang Array1 dari Formula Wizard. Untuk memasukkan rentang sel secara manual, ketik alamat sel pertama dan terakhir, pisahkan dengan titik dua (tanpa spasi). Pilihan lain adalah dengan memilih rentang yang diinginkan dengan mouse, dan Excel akan menempatkan entri yang diinginkan di bidang formulir ini sendiri. Operasi yang sama harus dilakukan dengan kelompok data kedua di bidang "Array2".

Klik tombol OK. Editor spreadsheet akan menghitung dan menampilkan nilai korelasi dalam sel dengan rumus. Jika perlu, Anda dapat menyimpan dokumen ini untuk digunakan di masa mendatang (pintasan Ctrl + S).

Korelasi dipelajari berdasarkan data eksperimen, yang merupakan nilai terukur (xi, yi) dari dua fitur. Jika ada sedikit data eksperimen, maka distribusi empiris dua dimensi direpresentasikan sebagai deret ganda nilai xi dan yi. Dalam hal ini, korelasi antara fitur dapat dijelaskan dengan cara yang berbeda. Korespondensi antara argumen dan fungsi dapat diberikan oleh tabel, rumus, grafik, dll.

Analisis korelasi, seperti metode statistik lainnya, didasarkan pada penggunaan model probabilistik yang menggambarkan perilaku fitur yang dipelajari dalam populasi umum tertentu, dari mana nilai eksperimental xi dan yi diperoleh. Ketika korelasi antara karakteristik kuantitatif, yang nilainya dapat diukur secara akurat dalam satuan skala metrik (meter, detik, kilogram, dll.), diselidiki, model populasi umum berdistribusi normal dua dimensi sangat sering diadopsi. Model tersebut menampilkan hubungan antara variabel xi dan yi secara grafis sebagai tempat kedudukan titik-titik dalam sistem koordinat persegi panjang. Ketergantungan grafis ini juga disebut scatterplot atau bidang korelasi.

Model distribusi normal dua dimensi (bidang korelasi) ini memungkinkan Anda untuk memberikan interpretasi grafis visual dari koefisien korelasi, karena distribusi agregat tergantung pada lima parameter: x, y – nilai rata-rata (harapan matematis); x,σy adalah simpangan baku variabel acak X dan Y, dan p adalah koefisien korelasi, yang merupakan ukuran hubungan antara variabel acak X dan Y.

Jika p \u003d 0, maka nilai, xi, yi, yang diperoleh dari populasi normal dua dimensi, terletak pada grafik di koordinat x, y di dalam area yang dibatasi oleh lingkaran (Gambar 5, a). Dalam hal ini, tidak ada korelasi antara variabel acak X dan Y dan mereka disebut tidak berkorelasi. Untuk distribusi normal dua dimensi, tidak ada korelasi berarti pada saat yang sama independensi variabel acak X dan Y.

Jika p = 1 atau p = -1, maka terdapat hubungan fungsional linier antara variabel acak X dan Y (Y = c + dX). Dalam hal ini, seseorang berbicara tentang korelasi yang lengkap. Pada p = 1, nilai xi, yi menentukan titik-titik yang terletak pada garis lurus dengan kemiringan positif (dengan peningkatan xi, nilai yi juga meningkat), pada p = -1, garis lurus memiliki kemiringan negatif (Gambar 5, b). Dalam kasus menengah (-1< p < 1) точки, соответствующие значениям xi, yi, попадают в область, ограниченную некоторым эллипсом (рисунок 5, в, г), причем при p >0, ada korelasi positif (dengan meningkatnya xi, nilai yi cenderung meningkat), pada p< 0 корреляция отрицательная. Чем ближе р к, тем уже эллипс и тем теснее экспериментальные значения группируются около прямой линии. Здесь же следует обратить внимание на то, что линия, вдоль которой группируются точки, может быть не только прямой, а иметь любую другую форму: парабола, гипербола и т. д. В этих случаях мы рассматривали бы так называемую, нелинейную (или криволинейную) корреляцию.



Dengan demikian, analisis visual bidang korelasi membantu mengidentifikasi tidak hanya keberadaan hubungan statistik (linier atau non-linier) antara fitur yang dipelajari, tetapi juga keketatan dan bentuknya. Hal ini penting untuk langkah selanjutnya dalam analisis, pemilihan dan perhitungan koefisien korelasi yang sesuai.

Ketergantungan korelasi antara fitur dapat dijelaskan dengan cara yang berbeda. Secara khusus, setiap bentuk hubungan dapat dinyatakan dengan persamaan umum Y = f(X), di mana Y adalah variabel dependen, atau fungsi dari variabel independen X, yang disebut argumen. Korespondensi antara argumen dan fungsi dapat diberikan oleh tabel, rumus, grafik, dll.

Secara grafis, hubungan dua fitur digambarkan menggunakan bidang korelasi. Dalam sistem koordinat, nilai atribut faktor diplot pada sumbu absis, dan atribut yang dihasilkan diplot pada sumbu ordinat. Setiap perpotongan garis yang ditarik melalui sumbu-sumbu ini ditandai dengan sebuah titik. Dengan tidak adanya hubungan dekat, terdapat susunan titik-titik yang acak pada grafik (Gbr. 11.1).


Mari kita gambarkan ketergantungan yang diperoleh secara grafis dengan titik-titik bidang koordinat (Gbr. 3.1). Gambar hubungan statistik seperti itu disebut bidang korelasi.

Membangun bidang korelasi dan merumuskan hipotesis tentang bentuk koneksi.

Saat mempelajari hubungan antara dua fitur, metode grafis untuk memilih jenis persamaan regresi cukup jelas. Hal ini didasarkan pada bidang korelasi. Jenis utama kurva yang digunakan dalam penilaian kuantitatif hubungan ditunjukkan pada gambar. 2.1.

Karena tidak semua titik dalam bidang korelasi terletak pada garis regresi, maka selalu ada sebaran baik yang disebabkan oleh pengaruh faktor x, yaitu regresi y untuk x, maupun yang disebabkan oleh sebab lain (variasi yang tidak dapat dijelaskan). Kesesuaian garis regresi untuk prediksi tergantung pada seberapa banyak variasi total dari sifat y yang diperhitungkan oleh variasi yang dijelaskan. Jelas, jika jumlah deviasi kuadrat karena regresi lebih besar dari jumlah sisa kuadrat , maka persamaan regresi signifikan secara statistik dan faktor x memiliki pengaruh yang signifikan terhadap hasil. Ini ekuivalen dengan fakta bahwa koefisien determinasi r2 akan mendekati satu.

Dengan demikian, untuk ketergantungan yang digambarkan dalam bidang korelasi Gambar. 3.5 b) dan c), heteroskedastisitas residu ditunjukkan pada gambar. 3.9 dan 3.10.

Jika nilainya independen, maka "bidang korelasi" atau

Jika bidang korelasi dapat didekati dengan garis lurus, yang disebut garis regresi, maka lanjutkan ke perhitungan koefisien korelasi pasangan r. Nilai numeriknya berada dalam interval [-1, 1]. Jika r sama dengan 1 atau -1, maka ada umpan fungsional atau umpan balik. Ketika r mendekati nol, tidak ada hubungan antara fenomena, dan pada r 0,7 hubungan dianggap signifikan. Koefisien korelasi dihitung dengan rumus

Setelah mengidentifikasi kelompok fasilitas perkeretaapian di atas, metode perkiraan lain dari analisis awal homogenitas populasi untuk setiap kelompok fasilitas perkeretaapian digunakan - konstruksi bidang korelasi untuk masing-masing faktor yang termasuk dalam penelitian dengan biaya transportasi. Tanda utama homogenitas atau heterogenitas populasi terpilih adalah tidak adanya atau adanya celah dan lompatan pada letak titik-titik pada bidang korelasi.

Untuk penelitian ini, semua faktor yang mungkin dipilih terlebih dahulu oleh analisis logis profesional, data tentang perubahan di mana untuk perusahaan tersedia dalam pelaporan kementerian. Faktor-faktor tersebut harus mempertimbangkan total volume transportasi, produktivitas rata-rata gerbong dan lokomotif armada kerja, intensitas pengangkutan, intensitas modal unit transportasi dan produktivitas tenaga kerja, dll. (Total 11 faktor). Dengan demikian, 44 bidang korelasi dibangun untuk empat kelompok perusahaan.

Setelah menentukan nilai yang ditunjukkan, persamaan ketergantungan pasangan diperoleh, representasi grafis yang dalam sumbu koordinat disebut garis regresi teoretis. Jika semua pengukuran diterapkan pada bidang seperti itu, dan bukan hanya garis regresi teoretis, maka kita akan mendapatkan bidang korelasi.

Kami mensistematisasikan materi sumber di bidang korelasi dan dalam tabel korelasi. Dalam contoh kita, faktornya adalah biaya mesin Cm, dan fungsinya adalah jumlah pekerja tahunan rata-rata P.

Sebagai hasil dari pemecahan menjadi interval, seluruh bidang di mana pengukuran diplot untuk kedua tanda k dan y, yang disebut bidang korelasi, akan menjadi sel, dan setiap pengukuran dicirikan bukan oleh nilai koordinat yang tepat, tetapi hanya dengan nilai interval di mana ia ditetapkan.

pada gambar. 16 menunjukkan bidang korelasi, di mana interval untuk nilai argumen diberikan sepanjang sumbu absis, dan interval untuk nilai fungsi P diberikan sepanjang sumbu ordinat. Bidang korelasi dibangun dengan cara ini disebut sekunder.

Bidang korelasi primer juga dapat dibangun untuk memilih interval. Semua titik di bidang ini ditandai dengan mempertimbangkan nilai koordinatnya. Menurut kepadatan poin, interval diuraikan.

Seiring dengan konstruksi bidang korelasi, seperti yang ditunjukkan di atas, tabel korelasi disusun di mana semua perhitungan yang berkaitan dengan penentuan rata-rata, konstruksi garis regresi empiris dan data awal untuk menentukan parameter dalam sistem normal. persamaan dilakukan.

Di meja. 36 semua materi dibagi menjadi interval. Dengan menggunakannya, kami membangun bidang korelasi sekunder, di mana kami memplot semua nilai variabel, dan menentukan nilai rata-rata (/, //, ..., yn selama interval. Menghubungkan nilai rata-rata di setiap interval dengan segmen garis lurus, kami memperoleh garis regresi empiris (lihat Gambar 16).

Memulihkan dari pusat setiap interval tegak lurus terhadap sumbu absis, kami menyisihkan masing-masing nilai y yang sesuai tetapi interval r /, \u003d 1081, 1/2 \u003d 1774, dll. Kami menghubungkan titik yang diperoleh satu sama lain dengan segmen garis lurus. Garis putus-putus yang dihasilkan adalah garis regresi empiris untuk hubungan antara biaya mesin Cm dan jumlah pekerja P. Dengan analogi dengan perhitungan yang dilakukan, kita dapat membangun tabel korelasi dan bidang korelasi untuk mengidentifikasi hubungan antara jumlah pekerja P , volume pekerjaan O, jumlah beton prefabrikasi dan struktur beton bertulang / Izh.b.
Beras. 18. Tabel korelasi dan bidang sekunder korelasi ketergantungan jumlah pekerja dan volume penggunaan struktur beton pracetak /info/5440"> Persamaan regresi berpasangan dan regresi berganda yang diturunkan kemudian dapat diterapkan jika variabel berubah dalam batas berikut: jumlah pekerja - dari 850 hingga 7850 orang, biaya mesin - dari 0,15 hingga 3,15 juta rubel . , volume struktur prefabrikasi - dari 10 hingga 230 ribu m dan diplot di sepanjang sumbu vertikal, dalam nilai independen- di sepanjang horizontal.Bidang korelasi digunakan untuk menentukan bentuk hubungan antara variabel, Grafik memberi peneliti yang pertama

Premis OLS ketiga mensyaratkan bahwa varians dari residual menjadi homoskedastis. Artinya, untuk setiap nilai faktor Xj, residual e, - memiliki varians yang sama. Jika syarat penerapan LSM ini tidak terpenuhi, maka terjadi heteroskedastisitas. Adanya heteroskedastisitas terlihat jelas dari bidang korelasi (Gbr. 3.5).

Tugas penelitian khas lainnya - penilaian hubungan antara fenomena - diselesaikan dengan menggunakan peralatan yang dikembangkan dengan baik dari teori korelasi dalam statistik matematika. Untuk melakukan ini, perlu memiliki sampel untuk fenomena yang dibandingkan yang ditunjukkan pada peta subjek yang berbeda (misalnya, D dan C). Nilai a dan b diambil pada titik /-th yang sama, mis. dikoordinasikan secara ketat, dan kemudian plot bidang korelasi.

1. Topik pekerjaan.

2. Informasi teoritis singkat.

3. Urutan pekerjaan.

4. Data awal untuk pengembangan model matematika.

5. Hasil pengembangan model matematika.

6. Hasil studi model. Membangun ramalan.

7. Kesimpulan.

Dalam tugas 2-4, Anda dapat menggunakan Excel PPP untuk menghitung kinerja model.

Pekerjaan nomor 1.

Konstruksi model regresi berpasangan. Memeriksa residu untuk heteroskedastisitas.

Untuk 15 perusahaan yang memproduksi jenis produk yang sama, nilai dua fitur diketahui:

X - keluaran, ribu unit;

y - biaya produksi, juta rubel

x kamu
5,3 18,4
15,1 22,0
24,2 32,3
7,1 16,4
11,0 22,2
8,5 21,7
14,5 23,6
10,2 18,5
18,6 26,1
19,7 30,2
21,3 28,6
22,1 34,0
4,1 14,2
12,0 22,1
18,3 28,2

Diperlukan:

1. Membangun bidang korelasi dan merumuskan hipotesis tentang bentuk hubungan.

2. Membangun model:

Regresi Pasangan Linier.

Regresi berpasangan semi-log.

2.3 Regresi pasangan daya.
Untuk ini:


2. Evaluasi keketatan hubungan menggunakan koefisien (indeks)
korelasi.

3. Evaluasi kualitas model menggunakan koefisien (indeks)
penentuan dan kesalahan rata-rata aproksimasi
.

4. Tulislah dengan menggunakan koefisien elastisitas rata-rata
penilaian komparatif dari kekuatan hubungan antara faktor dan hasil
.

5. Menggunakan F- Kriteria Fisher untuk mengevaluasi reliabilitas statistik dari hasil pemodelan regresi.

Menurut nilai karakteristik yang dihitung dalam paragraf 2-5, pilih persamaan regresi terbaik.

Menggunakan metode Golfreld-Quandt, periksa residu untuk heteroskedastisitas.

Kami membangun bidang korelasi.

Menganalisis lokasi titik-titik bidang korelasi, kami mengasumsikan bahwa hubungan antara tanda-tanda X dan pada mungkin linier, mis. y=a+bx, atau bentuk non-linier: y=a+blnx, y=ax b.

Berdasarkan teori hubungan yang diteliti, diharapkan diperoleh ketergantungan pada dari X jenis y=a+bx, karena biaya produksi kamu dapat dibagi menjadi dua jenis: konstan, tidak tergantung pada volume produksi - sebuah seperti sewa, pemeliharaan administrasi, dll; dan variabel yang berubah sebanding dengan output bx, seperti konsumsi bahan, listrik, dll.


2.1.Model Regresi Pasangan Linier.

2.1.1. Mari kita hitung parameternya sebuah dan b regresi linier y=a+bx.

Kami membuat tabel perhitungan 1.

Tabel 1

Pilihan sebuah dan b persamaan

Yx = a + bx


Dibagi dengan n b:

Persamaan regresi:

=11.591+0.871x

Dengan peningkatan output sebesar 1.000 rubel. biaya produksi meningkat 0,871 juta rubel. rata-rata, biaya tetap adalah 11,591 juta rubel.

2.1.2. Kami memperkirakan kedekatan hubungan menggunakan koefisien linier korelasi pasangan.

Mari kita terlebih dahulu menentukan standar deviasi fitur.

Standar deviasi:

Koefisien korelasi:

Di antara tanda-tanda X dan kamu ada korelasi linier yang sangat kuat.

2.1.3. Mari kita mengevaluasi kualitas model yang dibangun.

yaitu model ini menjelaskan 90,5% dari total varians pada, pangsa varian yang tidak dapat dijelaskan menyumbang 9,5%.

Oleh karena itu, kualitas modelnya tinggi.

TETAPI saya .

Pertama, dari persamaan regresi, kami menentukan nilai teoritis untuk setiap nilai faktor.

Kesalahan perkiraan aku, aku=1…15:

Kesalahan perkiraan rata-rata:

2.1.4. Mari kita tentukan koefisien elastisitas rata-rata:

Hal ini menunjukkan bahwa dengan peningkatan output sebesar 1%, biaya produksi meningkat rata-rata sebesar 0,515%.

2.1.5. Mari kita perkirakan signifikansi statistik dari persamaan yang dihasilkan.
Mari kita uji hipotesis H0 bahwa ketergantungan yang terungkap pada dari X acak, yaitu, persamaan yang dihasilkan secara statistik tidak signifikan. Misalkan = 0,05. Mari kita cari nilai tabular (kritis) F- Kriteria Fisher:

Temukan nilai sebenarnya F- Kriteria Fisher:

maka hipotesis H0 H1 x dan kamu tidak disengaja.

Mari kita buat persamaan yang dihasilkan.

2.2. Model regresi semilog berpasangan.

2.2.1. Mari kita hitung parameternya sebuah dan b dalam regresi:

y x \u003d a + blnx.

Kami linierisasi persamaan ini, yang menunjukkan:

y=a + bz.

Pilihan sebuah dan b persamaan

= a+bz

ditentukan dengan metode kuadrat terkecil:


Kami menghitung tabel 2.

Meja 2

Dibagi dengan n dan penyelesaian dengan metode Cramer, kami memperoleh rumus untuk menentukan b:

Persamaan regresi:

= -1,136 + 9,902z

2.2.2. Mari kita perkirakan kedekatan koneksi antar fitur pada dan X.

Karena persamaan y = a + bln x linier sehubungan dengan parameter sebuah dan b dan linearisasinya tidak berhubungan dengan transformasi variabel terikat _ pada, maka ketatnya hubungan antar variabel pada dan X, diperkirakan menggunakan indeks korelasi pasangan Rxy, juga dapat ditentukan dengan menggunakan koefisien korelasi pasangan linier r yz

simpangan baku z:

Nilai indeks korelasi mendekati 1, oleh karena itu, antar variabel pada dan X ada korelasi yang sangat erat = a + bz.

2.2.3. Mari kita mengevaluasi kualitas model yang dibangun.

Mari kita tentukan koefisien determinasi:

yaitu model ini menjelaskan 83,8% dari total variasi hasil pada, pangsa variasi yang tidak dapat dijelaskan menyumbang 16,2%. Oleh karena itu, kualitas modelnya tinggi.

Mari kita cari nilai kesalahan aproksimasi rata-rata TETAPI saya .

Pertama, dari persamaan regresi, kami menentukan nilai teoritis untuk setiap nilai faktor. Kesalahan perkiraan Dan saya ,:

, saya=1…15.

Kesalahan perkiraan rata-rata:

.

Kesalahannya kecil, kualitas modelnya tinggi.

2.2.4 Mari kita tentukan koefisien elastisitas rata-rata:

Hal ini menunjukkan bahwa dengan peningkatan output sebesar 1%, biaya produksi meningkat rata-rata sebesar 0,414%.

2.2.5. Mari kita perkirakan signifikansi statistik dari persamaan yang dihasilkan.
Mari kita uji hipotesis H0 bahwa ketergantungan yang terungkap pada dari X adalah acak, yaitu persamaan yang dihasilkan secara statistik tidak signifikan. Misalkan = 0,05.

Mari kita cari nilai tabular (kritis) F- Kriteria Fisher:

Temukan nilai sebenarnya F- Kriteria Fisher:

maka hipotesis H0 ditolak, hipotesis alternatif diterima H1: dengan probabilitas 1-α=0,95 persamaan yang dihasilkan signifikan secara statistik, hubungan antar variabel x dan kamu tidak disengaja.

Mari kita membangun persamaan regresi pada bidang korelasi

2.3. Model Regresi Pasangan Daya.

2.3.1. Mari kita hitung parameternya sebuah dan b regresi kekuatan:

Perhitungan parameter didahului dengan prosedur linierisasi persamaan ini:

dan perubahan variabel:

Y=lny, X=lnx, A=lna

Parameter persamaan:

ditentukan dengan metode kuadrat terkecil:


Kami menghitung tabel 3.

Kami mendefinisikan b:

Persamaan regresi:

Mari kita membangun persamaan regresi pada bidang korelasi:

2.3.2. Mari kita perkirakan kedekatan koneksi antar fitur pada dan X menggunakan indeks korelasi pasangan R yx .

Sebelumnya hitung nilai teoretisnya untuk setiap nilai faktor x, lalu:

Nilai indeks korelasi Rxy mendekati 1, maka antara variabel pada dan X ada korelasi yang sangat dekat dari bentuk:

2.3.3. Mari kita mengevaluasi kualitas model yang dibangun.

Mari kita tentukan indeks determinasi:

R2=0,936 2 =0,878,

yaitu model ini menjelaskan 87,6% dari total variasi dalam hasil y, dan pangsa variasi yang tidak dapat dijelaskan menyumbang 12,4%.

Kualitas modelnya tinggi.

Mari kita cari nilai kesalahan aproksimasi rata-rata.

Kesalahan perkiraan aku, aku=1…15:

Kesalahan perkiraan rata-rata:

Kesalahannya kecil, kualitas modelnya tinggi.

2.3.4. Mari kita tentukan koefisien elastisitas rata-rata:

Hal ini menunjukkan bahwa dengan peningkatan output sebesar 1%, biaya produksi meningkat rata-rata sebesar 0,438%.

2.3.5 Mari kita evaluasi signifikansi statistik dari persamaan yang dihasilkan.

Mari kita uji hipotesis H0 bahwa ketergantungan yang terungkap pada dari X acak, yaitu, persamaan yang dihasilkan secara statistik tidak signifikan. Misalkan = 0,05.

nilai tabular (kritis) F- Kriteria Fisher:

nilai sesungguhnya F- Kriteria Fisher:

maka hipotesis H0 ditolak, hipotesis alternatif diterima H1: dengan probabilitas 1-α=0,95 persamaan yang dihasilkan signifikan secara statistik, hubungan antar variabel x dan kamu tidak disengaja.

Tabel 3

3. Memilih persamaan terbaik.

Mari kita buat tabel hasil penelitiannya.

Tabel 4

Kami menganalisis tabel dan menarik kesimpulan.

Ketiga persamaan tersebut ternyata signifikan dan andal secara statistik, memiliki koefisien korelasi (indeks) mendekati 1, koefisien determinasi (indeks) yang tinggi (mendekati 1), dan kesalahan aproksimasi dalam batas yang dapat diterima.

Pada saat yang sama, karakteristik model linier menunjukkan bahwa ia menggambarkan hubungan antara tanda-tanda x dan y.

Oleh karena itu, kami memilih model linier sebagai persamaan regresi.