Ketergantungan negatif dalam analisis korektif. Kursus: Analisis Korelasi

Setiap hukum alam atau perkembangan sosial dapat diwakili oleh deskripsi serangkaian hubungan. Jika dependensi ini stokastik, dan analisis dilakukan pada sampel dari populasi umum, maka bidang penelitian ini mengacu pada tugas studi statistik dependensi, yang meliputi korelasi, regresi, varians, analisis kovarians, dan analisis tabel kontingensi.

    Apakah ada hubungan antara variabel yang diteliti?

    Bagaimana mengukur kedekatan koneksi?

Skema umum hubungan antara parameter dalam studi statistik ditunjukkan pada gambar. satu.

Gambar S adalah model dari objek nyata yang diteliti.Variabel penjelas (independen, faktorial) menggambarkan kondisi untuk berfungsinya objek. Faktor acak adalah faktor yang pengaruhnya sulit diperhitungkan atau pengaruhnya saat ini diabaikan. Variabel yang dihasilkan (tergantung, dijelaskan) mencirikan hasil fungsi objek.

Pemilihan metode analisis hubungan dilakukan dengan mempertimbangkan sifat variabel yang dianalisis.

Analisis korelasi - metode pemrosesan data statistik, yang terdiri dari mempelajari hubungan antar variabel.

Tujuan dari analisis korelasi adalah untuk memberikan beberapa informasi tentang satu variabel dengan bantuan variabel lain. Dalam kasus di mana adalah mungkin untuk mencapai tujuan, variabel dikatakan berkorelasi. Korelasi hanya mencerminkan ketergantungan linier dari kuantitas, tetapi tidak mencerminkan konektivitas fungsionalnya. Misalnya, jika kita menghitung koefisien korelasi antara nilai A = sin(x) dan B = cos(x), maka akan mendekati nol, yaitu. tidak ada hubungan antara kuantitas.

Ketika mempelajari korelasi, pendekatan grafis dan analitis digunakan.

Analisis grafis dimulai dengan konstruksi bidang korelasi. Bidang korelasi (atau scatterplot) adalah hubungan grafis antara hasil pengukuran dua fitur. Untuk membangunnya, data awal diplot pada grafik, menampilkan setiap pasangan nilai (xi, yi) sebagai titik dengan koordinat xi dan yi dalam sistem koordinat persegi panjang.

Analisis visual bidang korelasi memungkinkan kita untuk membuat asumsi tentang bentuk dan arah hubungan antara dua indikator yang dipelajari. Menurut bentuk hubungannya, ketergantungan korelasi biasanya dibagi menjadi linier (lihat Gambar 1) dan non-linier (lihat Gambar 2). Dengan ketergantungan linier, amplop bidang korelasi dekat dengan elips. Hubungan linier dua variabel acak adalah bahwa ketika satu variabel acak meningkat, variabel acak lainnya cenderung meningkat (atau menurun) menurut hukum linier.

Arah hubungan positif jika peningkatan nilai salah satu atribut menyebabkan peningkatan nilai kedua (lihat Gambar 3) dan negatif jika peningkatan nilai salah satu atribut menyebabkan penurunan nilai yang kedua (lihat Gambar 4).

Dependensi yang hanya memiliki arah positif atau negatif saja disebut monoton.

ANALISIS KORELASI- seperangkat metode untuk menilai hubungan antara fenomena dan peristiwa acak berdasarkan teori korelasi matematis. Dalam hal ini, karakteristik paling sederhana digunakan yang memerlukan perhitungan minimum. Istilah "korelasi" biasanya diidentikkan dengan konsep "hubungan" dan "saling ketergantungan". Namun, mereka tidak memadai. Korelasi hanyalah salah satu jenis komunikasi antar tanda, yang dimanifestasikan secara rata-rata dan bersifat linier. Jika ada hubungan yang jelas antara dua kuantitas, maka hubungan seperti itu disebut fungsional, dan salah satu kuantitas (penyebab) dapat secara unik menentukan nilai kuantitas lainnya (konsekuensi). Funkts, ketergantungan adalah ekspresi tertentu dari ketergantungan acak (probabilistik, stokastik), ketika koneksi tidak muncul untuk setiap nilai dua kuantitas, tetapi hanya rata-rata.

K.a. digunakan dalam studi dua atau lebih variabel acak untuk mengidentifikasi dua karakteristik kuantitatif yang paling penting: persamaan matematis dari hubungan antara besaran-besaran ini dan penilaian kedekatan hubungan di antara mereka. Data awal untuk menentukan karakteristik ini adalah hasil pengamatan yang sinkron (pengukuran, percobaan), yaitu, secara bersamaan diperoleh dari pengalaman, data statistik tentang tanda-tanda, hubungan antara yang sedang dipelajari. Data awal dapat diberikan dalam bentuk tabel dengan catatan hasil pengamatan atau representasi yang setara pada pita magnetik, pita berlubang atau kartu berlubang.

K.a. menemukan aplikasi luas dalam kedokteran dan biologi untuk definisi kedekatan dan persamaan komunikasi antara berbagai tanda, napr, hasil analisis irisan, tanda atau pemeriksaan khusus yang dilakukan atas orang sehat atau sakit (lihat. Korelasi fungsi suatu organisme). Hasil Untuk. dan. digunakan untuk membuat peramalan penyakit yang objektif, menilai kondisi pasien, perjalanan penyakit (lihat Peramalan). Apriori, hanya dengan hasil biol teoritis, dan madu. studi, sulit atau tidak mungkin untuk memprediksi bagaimana sifat-sifat yang dipelajari terkait. Untuk menjawab pertanyaan ini, dilakukan pengamatan atau percobaan khusus.

Analisis korelasi dua dimensi digunakan dalam pengolahan data eksperimen pada manifestasi dari dua tanda.

TABEL KORELASI. Catatan. Tabel menunjukkan interval tanda X dan Y, serta frekuensi kemunculannya (di tengah tabel), dihitung dari hasil analisis morfometrik mikrovaskular area bulbokonjungtiva, di mana Y adalah diameter venula, dan X adalah diameter arteriol (dalam mmc).

Setiap hasil percobaan adalah variabel acak, dan pola objektif hanya muncul di seluruh rangkaian hasil pengukuran. Oleh karena itu, penarikan kesimpulan didasarkan pada hasil pengolahan seluruh kumpulan data eksperimen, dan bukan pada nilai individu yang bersifat acak. Untuk mengurangi pengaruh kejadian acak, data awal digabungkan ke dalam kelompok, yang dicapai dengan menyusun tabel korelasi (lihat tabel). Tabel semacam itu berisi interval (atau titik tengahnya) dari nilai dua fitur - Y dan X, serta frekuensi kemunculan nilai X dan Y dalam interval yang sesuai dari nilai-nilai ini. Frekuensi-frekuensi ini, yang dihitung dari hasil percobaan, merupakan perkiraan praktis dari probabilitas kemunculan bersama nilai-nilai X dan Y dari interval tertentu. Pembuatan tabel korelasi merupakan langkah awal dalam mengolah informasi awal. Konstruksi tabel korelasi dan pemrosesan lengkapnya lebih lanjut dilakukan dengan cepat pada komputer universal atau khusus (lihat. Komputer elektronik). Menurut data yang dikelompokkan dari tabel korelasi, karakteristik empiris persamaan dan keketatan koneksi dihitung. Untuk menentukan persamaan hubungan antara Y dan X, dihitung nilai rata-rata fitur Y pada setiap interval fitur X. dapatkan untuk setiap interval ke-i nilai Yxi, koneksi yang untuk semua interval-i memberikan garis regresi empiris yang mencirikan bentuk hubungan atribut Y dengan atribut X rata-rata - grafik fungsi Yx= f(x). Jika ada hubungan yang jelas antara fitur Y dan X, persamaan hubungan akan cukup untuk memecahkan masalah praktis dan teoritis, karena selalu dapat digunakan untuk menentukan nilai fitur Y jika nilai X diberikan. hubungan antara Y dan X tidak ambigu, hubungan ini acak dan satu nilai X sesuai dengan sejumlah nilai Y. Oleh karena itu, diperlukan satu lagi karakteristik yang mengukur kekuatan, kedekatan hubungan antara Y dan X. Karakteristik tersebut adalah rasio dispersi (korelasi) dan koefisien korelasi ryx. Yang pertama dari kuantitas ini mencirikan ketatnya hubungan antara Y dan X dalam fungsi arbitrer f, dan ryx hanya digunakan jika f adalah fungsi linier.

Nilai yx dan ryx juga ditentukan secara sederhana dari tabel korelasi. Perhitungan biasanya dilakukan dalam urutan berikut: nilai rata-rata dari kedua atribut X dan Y ditentukan, standar deviasinya x dan y, dan kemudian xy sesuai dengan rumus:

dan ryx sesuai dengan rumus:

di mana n adalah jumlah total eksperimen, Xcpi adalah nilai rata-rata X dari interval ke-i, Ycpj adalah nilai rata-rata Y dari interval ke-j, k, l adalah jumlah interval fitur X dan Y , masing-masing, mi(x) adalah frekuensi (angka) nilai Xcpi . Karakteristik kuantitatif akurasi penentuan yx dan ryx adalah simpangan bakunya, yang sama dengan

Nilai koefisien terletak antara nol dan satu (0=<ηyx=<1). Если ηyx= 0 (рис., а), то это свидетельствует о том, что признаки Y и X недисперсированы, т. е. регрессия Yx = f(x) не дает связи между признаками Y и X, а при ηyx = 1 существует однозначная связь между Y и X (рис., б, ж). Для ηyx<1 признак Y только частично определяется признаком X, и необходимо изучение дополнительных признаков для повышения достоверности определения Y (рис., г, д, е, и).

Nilai koefisien r terletak antara -1 dan +1 (-1=

Analisis korelasi multivariat - penentuan persamaan dan keketatan koneksi dalam kasus di mana jumlah fitur yang dipelajari lebih dari dua. Jadi, jika Y adalah fitur kompleks dan hasilnya tergantung pada kemunculan himpunan fitur X1, X2, ..., Xn, maka, menurut data eksperimen, yang berikut harus ditentukan: ., n, yaitu. Yx1x2...xn = F(x1, x2...,xn) ; b) kuatnya hubungan antara Y dan himpunan X1, X2,..., Xn.

Pengolahan awal hasil pengawasan pada K. dan multidimensi. adalah bahwa untuk setiap pasangan fitur, nilai hubungan dispersi yxi (i = 1,2,..., n) dan xixj (i!=j) dari koefisien korelasi ryxi dan rxixj ditentukan, serta sebagai regresi berpasangan Yxi = fi(xi ). Data tersebut kemudian digunakan untuk menentukan persamaan regresi berganda Yx1x2...xn = F (x1,x2,...,xn), rasio dispersi berganda yx1x2...xn, dan koefisien korelasi ganda Ryx1x2...xn . Persamaan regresi berganda memungkinkan untuk menentukan nilai fitur Y dengan himpunan nilai X1, X2, ..., Xn, yaitu, jika persamaan ini tersedia, dimungkinkan untuk memprediksi nilai Y berdasarkan hasil nilai spesifik dari himpunan yang dihasilkan (misalnya, hasil analisis oleh fitur X1, X2...Xn). Nilai yx1x2...xn digunakan sebagai karakteristik keketatan hubungan antara Y dan himpunan fitur X1, X2, ...Xn untuk fungsi arbitrer F, dan Ryx1x2...xn - untuk kasus ketika fungsi F linier. Koefisien yx1x2....xn dan Ryx1x2...xn mengambil nilai antara nol dan satu. Inklusi dalam pertimbangan untuk multidimensi K. a. fitur tambahan memungkinkan untuk mendapatkan nilai ηyx1x2...xn, Ryx1x2...xn lebih dekat ke kesatuan dan dengan demikian meningkatkan akurasi prediksi fitur Y menggunakan persamaan regresi berganda.

Sebagai contoh, perhatikan hasil K. a. berpasangan, serta persamaan regresi berganda dan koefisien korelasi ganda antara tanda-tanda: Y - pseudoparesis stabil, X1 - lateralisasi cacat motorik pada tungkai di sebelah kanan, X2 - sama di anggota badan di sebelah kiri, X3 - krisis vegetatif. Nilai rasio dispersi dan koefisien korelasi pasangannya masing-masing adalah yx1 = 0,429, yx2 = 0,616, yx3 = -0,334, dan ryx1 = 0,320, ryx2 = 0,586, ryx3 = -0,325. Berdasarkan persamaan regresi linier berganda Yх1х2х3 = 0,638 x1 + 0,839 x2 - 0,195 x3. Koefisien korelasi berganda akan dinyatakan sebagai Ryx1x2x3 =0,721. Dapat dilihat dari contoh bahwa, menurut data X1, X2 dan X3, pseudoparesis yang stabil dapat diprediksi dengan akurasi yang cukup untuk latihan.

Metode Untuk dan. juga memungkinkan untuk memperoleh karakteristik dinamis dan. Dalam hal ini, tanda-tanda yang dipelajari (misalnya, EKG, EEG, dll.) dianggap sebagai fungsi acak dari Y(t) dan X(t). Berdasarkan hasil pengamatan terhadap fungsi-fungsi tersebut, juga ditentukan dua karakteristik terpenting: a) evaluasi operator komunikasi (persamaan matematis) antara Y (t) dan X (t); b) penilaian kedekatan hubungan di antara mereka. Fungsi dispersi dan korelasi dari fungsi acak Y (t) dan X(t) diambil sebagai karakteristik keketatan sambungan. Fungsi-fungsi tersebut merupakan generalisasi dari hubungan dispersi dan koefisien korelasi. Jadi, fungsi dispersi timbal balik yang dinormalisasi yx(t) dari setiap nilai tetap t adalah hubungan dispersi antara nilai fitur Y(t) dan X(t). Demikian pula, fungsi korelasi silang yang dinormalisasi Ryx(t), untuk setiap nilai tetap dari t, adalah koefisien korelasi antara fitur Y(t) dan X(t). Sifat hubungan linier (ketergantungan) untuk besaran yang dipelajari sama pada titik waktu yang berbeda disebut autokorelasi.

K.a. adalah salah satu metode untuk memecahkan masalah identifikasi, yang banyak digunakan dalam memperoleh model matematika dan otomatisasi biol medis, penelitian dan pengobatan.

Bibliografi: Sistem komputasi dan diagnosa otomatis penyakit jantung, ed. C. Caceres dan L. Dreyfus, trans. dari bahasa Inggris, M., 1974; Gutman S. R. Pada dua model electroencephalogram yang konvergen ke proses acak normal, dalam: Upravlenie saya informasikan. proses dalam satwa liar, ed. V.V. Larina, hal. 205, M., 1971; Zaslavskaya R. M., Perepel-kin E. G. dan Akhmetov K. Zh. Korelasi antara indikator hemokoagulasi dan metabolisme lipid pada pasien dengan angina pektoris pada siang hari, Kardiologi, t. 111, 1977; K r a m e r G. Metode statistik matematika, trans. dari bahasa Inggris, M., 1975; Pasternak E. B. dkk Studi aktivitas listrik atrium pada fibrilasi atrium menggunakan analisis korelasi instrumental, Kardiologi, t.17, Xia 7, hal. 50, 1977; Sinitsyn B. S. Korelator otomatis dan aplikasinya, Novosibirsk, 1964, bibliogr.; Pada r-b dan x V. Yu Analisis statistik dalam penelitian biologi dan medis, M., 1975, bibliogr.

V.N. Reibman, N.S. Reibman.

Penggunaan metode statistik dalam pengolahan bahan penelitian psikologis memberikan peluang besar untuk mengekstrak informasi yang berguna dari data eksperimen. Salah satu metode statistik yang paling umum adalah analisis korelasi.

Istilah "korelasi" pertama kali digunakan oleh ahli paleontologi Prancis J. Cuvier, yang menyimpulkan "hukum korelasi bagian dan organ hewan" (hukum ini memungkinkan Anda untuk mengembalikan penampilan seluruh hewan dari bagian tubuh yang ditemukan ). Istilah ini diperkenalkan ke dalam statistik oleh ahli biologi dan statistik Inggris F. Galton (bukan hanya "koneksi" - hubungan, dan "seolah-olah koneksi" - hubungan).

Analisis korelasi adalah pengujian hipotesis tentang hubungan antar variabel dengan menggunakan koefisien korelasi, statistik deskriptif dua dimensi, ukuran kuantitatif hubungan (variabilitas bersama) dua variabel. Jadi, ini adalah seperangkat metode untuk mendeteksi korelasi antara variabel atau fitur acak.

Analisis korelasi untuk dua variabel acak meliputi:

  • membangun bidang korelasi dan menyusun tabel korelasi;
  • perhitungan koefisien korelasi sampel dan rasio korelasi;
  • menguji hipotesis statistik tentang signifikansi hubungan.

Tujuan utama dari analisis korelasi adalah untuk mengidentifikasi hubungan antara dua atau lebih variabel yang diteliti, yang dianggap sebagai perubahan terkoordinasi bersama dalam dua karakteristik yang diteliti. Variabilitas ini memiliki tiga karakteristik utama: bentuk, arah dan kekuatan.

Bentuk korelasinya bisa linier atau tidak linier. Bentuk linier lebih nyaman untuk mengidentifikasi dan menafsirkan korelasi. Untuk korelasi linier, dua arah utama dapat dibedakan: positif ("koneksi ke depan") dan negatif ("umpan balik").

Kekuatan hubungan secara langsung menunjukkan seberapa nyata variabilitas gabungan dari variabel-variabel yang diteliti. Dalam psikologi, interkoneksi fungsional fenomena dapat diungkapkan secara empiris hanya sebagai koneksi probabilistik dari fitur yang sesuai. Representasi visual dari sifat hubungan probabilistik diberikan oleh diagram pencar - grafik yang sumbunya sesuai dengan nilai dua variabel, dan setiap subjek adalah titik.

Koefisien korelasi digunakan sebagai karakteristik numerik dari hubungan probabilistik, yang nilainya bervariasi dalam kisaran dari -1 hingga +1. Setelah perhitungan, peneliti, sebagai suatu peraturan, hanya memilih korelasi terkuat, yang selanjutnya diinterpretasikan (Tabel 1).

Kriteria untuk memilih korelasi "cukup kuat" dapat berupa nilai absolut dari koefisien korelasi itu sendiri (dari 0,7 hingga 1) atau nilai relatif dari koefisien ini, yang ditentukan oleh tingkat signifikansi statistik (dari 0,01 hingga 0,1), tergantung pada ukuran sampel. Dalam sampel kecil, untuk interpretasi lebih lanjut, lebih tepat untuk memilih korelasi kuat berdasarkan tingkat signifikansi statistik. Untuk penelitian yang dilakukan pada sampel yang besar, sebaiknya menggunakan nilai absolut dari koefisien korelasi.

Dengan demikian, tugas analisis korelasi direduksi menjadi menetapkan arah (positif atau negatif) dan bentuk (linier, non-linier) hubungan antara berbagai fitur, mengukur keketatannya, dan, akhirnya, memeriksa tingkat signifikansi yang diperoleh. koefisien korelasi.

Saat ini, banyak koefisien korelasi yang berbeda telah dikembangkan. Yang paling banyak digunakan adalah r-Pearson, r-Spearman dan τ - Kendal. Program statistik komputer modern dalam menu "Korelasi" menawarkan tepat ketiga koefisien ini, dan untuk memecahkan masalah penelitian lainnya, metode untuk membandingkan kelompok ditawarkan.

Pilihan metode untuk menghitung koefisien korelasi tergantung pada jenis skala variabel yang dimiliki (Tabel 2).

Untuk variabel dengan interval dan skala nominal, digunakan koefisien korelasi Pearson (korelasi momen produk). Jika setidaknya salah satu dari dua variabel memiliki skala ordinal atau tidak berdistribusi normal, korelasi peringkat Spearman digunakan, atau

t-Kendall. Jika salah satu dari dua variabel tersebut dikotomis, korelasi deret dua titik dapat digunakan (dalam program komputer statistik SPSS, kemungkinan ini tidak tersedia; sebagai gantinya, perhitungan korelasi peringkat dapat digunakan). Dalam hal kedua variabel bersifat dikotomis, digunakan korelasi empat bidang (jenis korelasi ini dihitung dengan SPSS berdasarkan definisi ukuran jarak dan ukuran kesamaan). Perhitungan koefisien korelasi antara dua variabel nondikotomis hanya dimungkinkan jika hubungan antara keduanya bersifat linier (searah). Jika koneksi, misalnya, kamu berbentuk (ambigu), koefisien korelasi tidak cocok digunakan sebagai ukuran kekuatan hubungan: nilainya cenderung nol.

Dengan demikian, syarat untuk menerapkan koefisien korelasi adalah sebagai berikut:

  • variabel yang diukur dalam skala kuantitatif (peringkat, metrik) pada sampel objek yang sama;
  • hubungan antar variabel bersifat monoton.

Hipotesis statistik utama, yang diuji dengan analisis korelasi, bersifat non-directional dan berisi pernyataan bahwa korelasinya sama dengan nol pada populasi umum H 0: r xy= 0. Jika ditolak maka hipotesis alternatif diterima H 1: r xy 0 tentang adanya korelasi positif atau negatif - tergantung pada tanda koefisien korelasi yang dihitung.

Berdasarkan penerimaan atau penolakan hipotesis ditarik kesimpulan yang berarti. Jika, menurut hasil pengujian statistik H 0: r xy= 0 tidak menyimpang pada level a, maka kesimpulan yang bermakna adalah sebagai berikut: hubungan antara X dan kamu tidak ditemukan. Jika di H 0 r xy= 0 menyimpang pada level a, yang berarti telah ditemukan hubungan positif (negatif) antara X dan kamu. Namun, interpretasi korelasi yang terungkap harus didekati dengan hati-hati. Dari sudut pandang ilmiah, hanya membangun hubungan antara dua variabel tidak berarti adanya hubungan sebab akibat. Selain itu, adanya korelasi tidak membentuk hubungan urutan antara sebab dan akibat. Ini hanya menunjukkan bahwa dua variabel lebih terkait satu sama lain daripada yang diharapkan dari suatu kebetulan. Namun demikian, dengan hati-hati, penggunaan metode korelasi dalam studi hubungan kausal sepenuhnya dibenarkan. Frase kategoris seperti "variabel X adalah alasan kenaikan indikator" harus dihindari. kamu". Pernyataan tersebut harus dirumuskan sebagai asumsi, yang harus benar-benar dibuktikan secara teoritis.

Penjelasan rinci tentang prosedur matematika untuk setiap koefisien korelasi diberikan dalam buku teks tentang statistik matematika; ; ; dan lain-lain Kami akan membatasi diri untuk menggambarkan kemungkinan menggunakan koefisien ini tergantung pada jenis skala pengukuran.

Korelasi Variabel Metrik

Untuk mempelajari hubungan dua variabel metrik yang diukur pada sampel yang sama, kami menggunakan koefisien korelasi r-Pearson. Koefisien itu sendiri mencirikan adanya hanya hubungan linier antara fitur, biasanya dilambangkan dengan simbol X dan kamu. Koefisien korelasi linier adalah metode parametrik dan penerapannya yang benar hanya mungkin jika hasil pengukuran disajikan dalam skala interval, dan distribusi nilai dalam variabel yang dianalisis sangat berbeda dari normal hingga sebagian kecil. Ada banyak situasi di mana penggunaannya tepat. Misalnya: membangun hubungan antara kecerdasan siswa dan prestasi akademiknya; antara suasana hati dan keberhasilan dalam keluar dari situasi masalah; antara tingkat pendapatan dan temperamen, dll.

Koefisien Pearson banyak digunakan dalam psikologi dan pedagogi. Misalnya, dalam karya I. Ya. Kaplunovich dan P. D. Rabinovich, M. P. Nuzhdina, perhitungan koefisien korelasi linier Pearson digunakan untuk mengkonfirmasi hipotesis yang diajukan.

Saat memproses data "secara manual", perlu untuk menghitung koefisien korelasi, dan kemudian menentukan p- tingkat signifikansi (untuk menyederhanakan verifikasi data, tabel nilai kritis digunakan rxy, yang dikompilasi menggunakan kriteria ini). Nilai koefisien korelasi linier Pearson tidak boleh melebihi +1 dan kurang dari -1. Kedua bilangan +1 dan -1 ini merupakan batas koefisien korelasi. Ketika hasil perhitungan dalam nilai lebih besar dari +1 atau kurang dari -1, ini menunjukkan bahwa telah terjadi kesalahan perhitungan.

Saat menghitung di komputer, program statistik (SPSS, Statistica) menyertai koefisien korelasi yang dihitung dengan nilai yang lebih akurat p-tingkat.

Untuk keputusan statistik tentang penerimaan atau penolakan H0 biasanya diatur α = 0,05, dan untuk sejumlah besar pengamatan (100 atau lebih) α = 0,01. Jika sebuah p , H 0 ditolak dan kesimpulan yang berarti dibuat bahwa hubungan yang signifikan secara statistik (signifikan) telah ditemukan antara variabel-variabel yang diteliti (positif atau negatif, tergantung pada tanda korelasinya). Kapan p > , H0 tidak ditolak, kesimpulan yang bermakna terbatas pada pernyataan bahwa hubungan (signifikan secara statistik) tidak ditemukan.

Jika tidak ada koneksi yang ditemukan, tetapi ada alasan untuk meyakini bahwa koneksi tersebut benar-benar ada, Anda harus memeriksa kemungkinan alasan untuk tidak dapat diandalkannya koneksi tersebut.

Komunikasi non-linier– Untuk melakukan ini, analisis plot sebar dua dimensi. Jika hubungannya tidak linier, tetapi monoton, lanjutkan ke korelasi peringkat. Jika hubungannya tidak monoton, maka bagi sampel menjadi bagian-bagian yang hubungannya monoton, dan hitung korelasinya secara terpisah untuk setiap bagian sampel, atau bagi sampel menjadi kelompok-kelompok yang kontras dan kemudian bandingkan menurut tingkat ekspresinya. sifat itu.

Kehadiran outlier dan asimetri yang jelas dalam distribusi satu atau kedua fitur. Untuk melakukan ini, Anda perlu melihat histogram distribusi frekuensi kedua fitur. Jika ada outlier atau asimetri, kecualikan outlier atau beralih ke korelasi peringkat.

Heterogenitas sampel(menganalisis scatterplot 2D). Cobalah untuk membagi sampel menjadi bagian-bagian di mana hubungan mungkin memiliki arah yang berbeda.

Jika hubungan signifikan secara statistik, maka sebelum membuat kesimpulan yang berarti, perlu untuk mengecualikan kemungkinan korelasi yang salah:

  • koneksi karena outlier. Jika ada outlier, pergi ke korelasi peringkat atau mengecualikan outlier;
  • hubungan tersebut karena pengaruh variabel ketiga. Jika ada fenomena serupa, perlu dihitung korelasinya tidak hanya untuk seluruh sampel, tetapi juga untuk setiap kelompok secara terpisah. Jika variabel "ketiga" adalah metrik, hitung korelasi parsialnya.

Koefisien korelasi parsial rxy-z dihitung jika perlu untuk menguji asumsi bahwa hubungan antara dua variabel X dan kamu tidak tergantung pada pengaruh variabel ketiga Z. Sangat sering, dua variabel berkorelasi satu sama lain hanya karena fakta bahwa keduanya berubah secara bersamaan di bawah pengaruh variabel ketiga. Dengan kata lain, pada kenyataannya, tidak ada hubungan antara sifat-sifat yang sesuai, tetapi itu muncul dalam hubungan statistik di bawah pengaruh penyebab umum. Misalnya, penyebab umum variabilitas dalam dua variabel mungkin usia ketika mempelajari hubungan berbagai karakteristik psikologis dalam kelompok usia yang berbeda. Ketika menafsirkan korelasi parsial dalam hal kausalitas, seseorang harus berhati-hati, karena jika Z berkorelasi dengan X dan dengan kamu, dan korelasi parsial rxy-z mendekati nol, itu tidak selalu mengikuti itu Z adalah alasan umum untuk X dan kamu.

Korelasi variabel peringkat

Jika koefisien korelasi tidak dapat diterima untuk data kuantitatif r-Pearson, kemudian untuk menguji hipotesis tentang hubungan dua variabel setelah peringkat awal, korelasi dapat diterapkan r-pendekar tombak atau τ -Kendalla. Misalnya, dalam studi tentang karakteristik psikofisik remaja berbakat musik oleh I. A. Lavochkin, kriteria Spearman digunakan.

Untuk perhitungan yang benar dari kedua koefisien (Spearman dan Kendall), hasil pengukuran harus disajikan dalam skala pangkat atau interval. Tidak ada perbedaan mendasar antara kriteria ini, tetapi secara umum diterima bahwa koefisien Kendall lebih "bermakna", karena menganalisis hubungan antara variabel lebih lengkap dan rinci, memilah semua kemungkinan korespondensi antara pasangan nilai. Koefisien Spearman lebih akurat memperhitungkan derajat kuantitatif hubungan antar variabel.

Koefisien korelasi rank spearman adalah analog non-parametrik dari koefisien korelasi Pearson klasik, tetapi perhitungannya tidak memperhitungkan indikator terkait distribusi dari variabel yang dibandingkan (rata-rata aritmatika dan varians), tetapi peringkat. Misalnya, perlu untuk menentukan hubungan antara penilaian peringkat sifat-sifat kepribadian yang termasuk dalam gagasan seseorang tentang "Saya nyata" dan "Saya ideal".

Koefisien Spearman banyak digunakan dalam penelitian psikologi. Misalnya, dalam karya Yu. V. Bushov dan N. N. Nesmelova: dialah yang digunakan untuk mempelajari ketergantungan keakuratan memperkirakan dan mereproduksi durasi sinyal suara pada karakteristik individu seseorang.

Karena koefisien ini analog r-Pearson, kemudian menggunakannya untuk menguji hipotesis mirip dengan menggunakan koefisien r-Pearson. Artinya, hipotesis statistik yang diuji, prosedur pengambilan keputusan statistik, dan perumusan kesimpulan yang bermakna adalah sama. Dalam program komputer (SPSS, Statistica) tingkat signifikansi untuk koefisien yang sama r-Pearson dan r-Spearman selalu cocok.

Keuntungan rasio r-Spearman versus rasio r-Pearson - dalam kepekaan yang lebih besar terhadap komunikasi. Kami menggunakannya dalam kasus berikut:

  • adanya penyimpangan yang signifikan dalam distribusi setidaknya satu variabel dari bentuk normal (kecondongan, outlier);
  • munculnya koneksi lengkung (monoton).

Batasan untuk menerapkan koefisien r- Spearman adalah:

  • untuk setiap variabel minimal 5 observasi;
  • koefisien dengan sejumlah besar peringkat identik dalam satu atau kedua variabel memberikan nilai kasar.

Koefisien korelasi peringkat τ -Kendalla adalah metode orisinal independen berdasarkan perhitungan rasio pasangan nilai dari dua sampel yang memiliki tren yang sama atau berbeda (kenaikan atau penurunan nilai). Rasio ini juga disebut faktor kesesuaian. Jadi, ide utama dari metode ini adalah bahwa arah koneksi dapat dinilai dengan membandingkan subjek berpasangan: jika sepasang subjek memiliki perubahan dalam X searah dengan perubahan kamu, ini menunjukkan hubungan positif, jika tidak cocok, hubungan negatif, misalnya, dalam studi kualitas pribadi yang sangat penting bagi kesejahteraan keluarga. Dalam metode ini, satu variabel direpresentasikan sebagai urutan monoton (misalnya, data suami) dalam urutan besarnya; variabel lain (misalnya, data istri) diberikan tempat peringkat yang sesuai. Jumlah inversi (pelanggaran monotonisitas dibandingkan dengan baris pertama) digunakan dalam rumus untuk koefisien korelasi.

Saat menghitung τ- Data Kendall "secara manual" pertama diurutkan berdasarkan variabel X. Kemudian, untuk setiap mata pelajaran, dihitung berapa kali peringkatnya di kamu ternyata pangkatnya lebih rendah dari mata pelajaran di bawahnya. Hasilnya dicatat di kolom Cocok. Jumlah semua nilai pada kolom "Kebetulan" adalah P- jumlah total kecocokan, diganti ke dalam rumus untuk menghitung koefisien Kendall, yang lebih sederhana secara komputasi, tetapi dengan peningkatan sampel, berbeda dengan r- Spearman, volume perhitungan tidak meningkat secara proporsional, tetapi secara eksponensial. Jadi, misalnya, ketika N= 12 perlu untuk memilah-milah 66 pasang mata pelajaran, dan kapan N= 489 - sudah 1128 pasang, yaitu, jumlah perhitungan meningkat lebih dari 17 kali. Saat menghitung di komputer dalam program statistik (SPSS, Statistica), koefisien Kendall dihitung sama dengan koefisien r-Spearman dan r-Pearson. Koefisien korelasi yang dihitung τ -Kendall ditandai dengan nilai yang lebih akurat p-tingkat.

Menerapkan koefisien Kendall lebih disukai jika ada outlier dalam data asli.

Sebuah fitur dari koefisien korelasi peringkat adalah bahwa korelasi peringkat maksimum (+1, –1) tidak selalu sesuai dengan hubungan langsung atau berbanding terbalik yang ketat antara variabel asli X dan kamu: hanya koneksi fungsional monoton di antara mereka yang cukup. Korelasi peringkat mencapai nilai modulo maksimumnya jika nilai yang lebih besar dari satu variabel selalu sesuai dengan nilai yang lebih besar dari variabel lain (+1), atau nilai yang lebih besar dari satu variabel selalu sesuai dengan nilai yang lebih kecil dari variabel lain dan sebaliknya (-1 ).

Hipotesis statistik yang akan diuji, prosedur pengambilan keputusan statistik, dan perumusan kesimpulan yang bermakna adalah sama dengan kasus. r-Tombak atau r-Pearson.

Jika hubungan yang signifikan secara statistik tidak ditemukan, tetapi ada alasan untuk percaya bahwa memang ada hubungan, Anda harus terlebih dahulu beralih dari koefisien

r-Spearman untuk rasio τ -Kendall (atau sebaliknya), lalu periksa kemungkinan alasan koneksi yang tidak dapat diandalkan:

  • komunikasi non-linier: Untuk melakukannya, lihat plot pencar 2D. Jika hubungannya tidak monoton, maka bagi sampel menjadi bagian-bagian yang hubungannya monoton, atau bagi sampel menjadi kelompok-kelompok yang kontras kemudian bandingkan menurut tingkat ekspresi gejalanya;
  • heterogenitas sampel: lihatlah scatter plot dua dimensi, cobalah untuk membagi sampel menjadi bagian-bagian di mana hubungannya mungkin memiliki arah yang berbeda.

Jika hubungan signifikan secara statistik, maka sebelum membuat kesimpulan yang berarti, perlu untuk mengecualikan kemungkinan korelasi palsu (dengan analogi dengan koefisien korelasi metrik).

Korelasi variabel dikotomis

Ketika membandingkan dua variabel yang diukur pada skala dikotomis, ukuran korelasinya disebut koefisien j, yang merupakan koefisien korelasi untuk data dikotomis.

Nilai koefisien terletak antara +1 dan -1. Itu bisa positif dan negatif, mencirikan arah hubungan antara dua fitur yang diukur secara dikotomis. Namun, interpretasi dapat menimbulkan masalah tertentu. Data dikotomis yang termasuk dalam skema untuk menghitung koefisien tidak terlihat seperti permukaan normal dua dimensi, oleh karena itu, tidak benar untuk mengasumsikan bahwa nilai yang ditafsirkan rxy\u003d 0,60 dan \u003d 0,60 adalah sama. Koefisien dapat dihitung dengan metode pengkodean, serta menggunakan apa yang disebut tabel empat bidang atau tabel kontingensi.

Untuk menerapkan koefisien korelasi , kondisi berikut harus dipenuhi:

  • sifat-sifat yang dibandingkan harus diukur dalam skala dikotomis;
  • X dan kamu harus sama.

Jenis korelasi ini dihitung dalam program komputer SPSS berdasarkan definisi ukuran jarak dan ukuran kesamaan. Beberapa prosedur statistik, seperti analisis faktor, analisis klaster, penskalaan multivariat, didasarkan pada penerapan ukuran-ukuran ini, dan terkadang prosedur-prosedur itu sendiri memberikan kemungkinan tambahan untuk menghitung ukuran-ukuran kesamaan.

Ketika satu variabel diukur pada skala dikotomis (variabel X), dan yang lainnya dalam skala interval atau rasio (variabel kamu), digunakan koefisien korelasi biserial, misalnya, saat menguji hipotesis tentang pengaruh jenis kelamin anak terhadap tinggi dan berat badan. Koefisien ini bervariasi dalam rentang dari -1 hingga +1, tetapi tandanya tidak penting untuk interpretasi hasil. Untuk penggunaannya, kondisi berikut harus dipenuhi:

  • tanda-tanda yang dibandingkan harus diukur dalam skala yang berbeda: satu X- dalam skala dikotomis; lain kamu– dalam skala interval atau rasio;
  • variabel kamu memiliki hukum distribusi normal;
  • jumlah fitur yang bervariasi dalam variabel yang dibandingkan X dan kamu harus sama.

Jika variabel X diukur pada skala dikotomis, dan variabel kamu dalam skala peringkat (variabel kamu), dapat digunakan koefisien korelasi peringkat-biserial, yang terkait erat dengan Kendall dan menggunakan konsep kebetulan dan inversi dalam definisinya. Interpretasi hasilnya sama.

Melakukan analisis korelasi menggunakan program komputer SPSS dan Statistica adalah operasi yang sederhana dan nyaman. Untuk melakukan ini, setelah memanggil kotak dialog Korelasi Bivariat (Analyze>Correlate> Bivariate…), Anda perlu memindahkan variabel yang sedang dipelajari ke bidang Variabel dan memilih metode yang akan digunakan untuk mendeteksi korelasi antarvariabel. File keluaran hasil berisi tabel persegi (Korelasi) untuk setiap kriteria yang dihitung. Setiap sel tabel berisi: nilai koefisien korelasi (Koefisien Korelasi), signifikansi statistik dari koefisien yang dihitung Sig, jumlah subjek.

Judul dan kolom samping dari tabel korelasi yang dihasilkan berisi nama-nama variabel. Diagonal (kiri atas - sudut kanan bawah) tabel terdiri dari unit, karena korelasi variabel apa pun dengan dirinya sendiri adalah maksimum. Tabel simetris tentang diagonal ini. Jika kotak centang "Tandai korelasi yang signifikan" dicentang dalam program, maka koefisien yang signifikan secara statistik akan ditandai dalam tabel korelasi akhir: pada tingkat 0,05 dan kurang - dengan satu tanda bintang (*), dan pada tingkat 0,01 - dengan dua tanda bintang (**).

Jadi, untuk meringkas: tujuan utama dari analisis korelasi adalah untuk mengidentifikasi hubungan antar variabel. Ukuran hubungan adalah koefisien korelasi, pilihan yang secara langsung tergantung pada jenis skala di mana variabel diukur, jumlah fitur yang bervariasi dalam variabel yang dibandingkan, dan distribusi variabel. Adanya korelasi antara dua variabel tidak berarti adanya hubungan sebab akibat di antara keduanya. Meskipun korelasi tidak secara langsung menunjukkan kausalitas, itu bisa menjadi petunjuk penyebab. Atas dasar itu, hipotesis dapat dibentuk. Dalam beberapa kasus, kurangnya korelasi memiliki efek yang lebih dalam pada hipotesis sebab-akibat. Korelasi nol dari dua variabel dapat menunjukkan bahwa tidak ada pengaruh satu variabel terhadap variabel lainnya.

PEKERJAAN KURSUS

Topik: Analisis korelasi

pengantar

1. Analisis korelasi

1.1 Konsep korelasi

1.2 Klasifikasi umum korelasi

1.3 Bidang korelasi dan tujuan konstruksinya

1.4 Tahapan Analisis Korelasi

1.5 Koefisien korelasi

1.6 Koefisien korelasi Bravais-Pearson yang dinormalisasi

1.7 Koefisien korelasi peringkat Spearman

1.8 Sifat dasar koefisien korelasi

1.9 Memeriksa signifikansi koefisien korelasi

1.10 Nilai kritis dari koefisien korelasi pasangan

2. Merencanakan eksperimen multivariat

2.1 Kondisi masalah

2.2 Penentuan pusat rencana (tingkat utama) dan tingkat variasi faktor

2.3 Membangun matriks perencanaan

2.4 Memeriksa homogenitas dispersi dan akurasi pengukuran yang sama dalam seri yang berbeda

2.5 Koefisien persamaan regresi

2.6 Dispersi reproduktifitas

2.7 Memeriksa signifikansi koefisien persamaan regresi

2.8 Memeriksa kecukupan persamaan regresi

Kesimpulan

Bibliografi

PENGANTAR

Perencanaan eksperimen adalah disiplin matematika dan statistik yang mempelajari metode organisasi rasional penelitian eksperimental - dari pilihan optimal dari faktor-faktor yang dipelajari dan penentuan rencana eksperimen yang sebenarnya sesuai dengan tujuannya hingga metode untuk menganalisis hasil. Awal perencanaan eksperimen diletakkan oleh karya ahli statistik Inggris R. Fisher (1935), yang menekankan bahwa perencanaan eksperimen yang rasional memberikan keuntungan yang tidak kalah signifikan dalam akurasi perkiraan daripada pemrosesan hasil pengukuran yang optimal. Pada tahun 60-an abad ke-20, sebuah teori modern tentang perencanaan eksperimen muncul. Metodenya terkait erat dengan teori aproksimasi fungsi dan pemrograman matematika. Rencana optimal dibangun dan propertinya diselidiki untuk kelas model yang luas.

Perencanaan eksperimen adalah pilihan rencana eksperimen yang memenuhi persyaratan yang ditentukan, serangkaian tindakan yang ditujukan untuk mengembangkan strategi eksperimen (dari memperoleh informasi apriori hingga memperoleh model matematika yang dapat diterapkan atau menentukan kondisi optimal). Ini adalah kontrol percobaan yang disengaja, diimplementasikan dalam kondisi pengetahuan yang tidak lengkap tentang mekanisme fenomena yang diteliti.

Dalam proses pengukuran, pengolahan data selanjutnya, serta formalisasi hasil dalam bentuk model matematika, terjadi kesalahan dan sebagian informasi yang terkandung dalam data asli hilang. Penggunaan metode perencanaan eksperimen memungkinkan untuk menentukan kesalahan model matematika dan menilai kecukupannya. Jika akurasi model tidak mencukupi, maka penggunaan metode perencanaan eksperimen memungkinkan untuk memodernisasi model matematika dengan eksperimen tambahan tanpa kehilangan informasi sebelumnya dan dengan biaya minimal.

Tujuan perencanaan eksperimen adalah untuk menemukan kondisi dan aturan seperti itu untuk melakukan eksperimen di mana dimungkinkan untuk memperoleh informasi yang andal dan andal tentang objek dengan biaya tenaga kerja paling sedikit, serta menyajikan informasi ini dalam bentuk yang ringkas dan nyaman dengan kuantitatif penilaian akurasi.

Di antara metode perencanaan utama yang digunakan pada berbagai tahap studi, berikut ini digunakan:

Merencanakan percobaan penyaringan, yang arti utamanya adalah pemilihan sekelompok faktor penting dari totalitas faktor yang harus dipelajari lebih lanjut secara rinci;

Merancang percobaan untuk analisis varians, yaitu menyusun rencana objek dengan faktor kualitatif;

Merencanakan eksperimen regresi yang memungkinkan Anda memperoleh model regresi (polinomial dan lainnya);

Merencanakan eksperimen ekstrim, yang tugas utamanya adalah optimasi eksperimental objek penelitian;

Perencanaan dalam studi proses dinamis, dll.

Tujuan mempelajari disiplin ini adalah untuk mempersiapkan siswa untuk kegiatan produksi dan teknis dalam spesialisasi menggunakan metode teori perencanaan dan teknologi informasi modern.

Tujuan dari disiplin: studi tentang metode modern perencanaan, pengorganisasian dan mengoptimalkan eksperimen ilmiah dan industri, melakukan eksperimen dan memproses hasilnya.

1. ANALISIS KORELASI

1.1 Konsep korelasi

Peneliti sering tertarik pada bagaimana dua atau lebih variabel terkait satu sama lain dalam satu atau lebih sampel yang diteliti. Misalnya, dapatkah tinggi badan memengaruhi berat badan seseorang, atau dapatkah tekanan memengaruhi kualitas produk?

Hubungan antar variabel semacam ini disebut korelasi, atau korelasi. Korelasi adalah perubahan yang konsisten dalam dua fitur, yang mencerminkan fakta bahwa variabilitas satu fitur sejalan dengan variabilitas yang lain.

Diketahui, misalnya, bahwa rata-rata ada hubungan positif antara tinggi badan dan berat badan mereka, sehingga semakin tinggi tinggi badan, semakin besar berat badan seseorang. Namun, ada pengecualian untuk aturan ini ketika orang yang relatif pendek kelebihan berat badan, dan, sebaliknya, astenik, dengan pertumbuhan tinggi, ringan. Alasan pengecualian tersebut adalah bahwa setiap sifat biologis, fisiologis atau psikologis ditentukan oleh pengaruh banyak faktor: lingkungan, genetik, sosial, ekologi, dll.

Korelasi adalah perubahan probabilistik yang hanya dapat dipelajari pada sampel yang representatif dengan metode statistik matematika. Kedua istilah - korelasi dan ketergantungan korelasi - sering digunakan secara bergantian. Ketergantungan berarti pengaruh, koneksi - setiap perubahan terkoordinasi yang dapat dijelaskan dengan ratusan alasan. Korelasi tidak dapat dianggap sebagai bukti hubungan sebab akibat, mereka hanya menunjukkan bahwa perubahan dalam satu fitur, sebagai suatu peraturan, disertai dengan perubahan tertentu pada yang lain.

Ketergantungan korelasi - Ini adalah perubahan yang dilakukan oleh nilai satu fitur terhadap kemungkinan terjadinya nilai yang berbeda dari fitur lain.

Tugas analisis korelasi direduksi menjadi menetapkan arah (positif atau negatif) dan bentuk (linier, non-linier) hubungan antara berbagai fitur, mengukur keketatannya, dan, akhirnya, memeriksa tingkat signifikansi korelasi yang diperoleh. koefisien.

Korelasi berbeda dalam bentuk, arah dan derajat (kekuatan) .

Bentuk korelasinya bisa bujursangkar atau lengkung. Misalnya, hubungan antara jumlah sesi pelatihan pada simulator dan jumlah masalah yang diselesaikan dengan benar dalam sesi kontrol dapat menjadi jelas. Curvilinear dapat, misalnya, hubungan antara tingkat motivasi dan efektivitas tugas (Gambar 1). Dengan peningkatan motivasi, efisiensi tugas pertama meningkat, kemudian tingkat motivasi optimal tercapai, yang sesuai dengan efisiensi maksimum tugas; peningkatan lebih lanjut dalam motivasi disertai dengan penurunan efisiensi.

Gambar 1 - Hubungan antara efektivitas pemecahan masalah dan kekuatan kecenderungan motivasi

Dalam arah, korelasinya bisa positif ("langsung") dan negatif ("terbalik"). Dengan korelasi garis lurus positif, nilai yang lebih tinggi dari satu atribut sesuai dengan nilai yang lebih tinggi dari yang lain, dan nilai yang lebih rendah dari satu atribut sesuai dengan nilai yang lebih rendah dari yang lain (Gambar 2). Dengan korelasi negatif, rasio dibalik (Gambar 3). Dengan korelasi positif, koefisien korelasi memiliki tanda positif, dengan korelasi negatif - tanda negatif.

Gambar 2 - Korelasi langsung

Gambar 3 - Korelasi terbalik


Gambar 4 - Tidak ada korelasi

Derajat, kekuatan atau keketatan korelasi ditentukan oleh nilai koefisien korelasi. Kekuatan sambungan tidak bergantung pada arahnya dan ditentukan oleh nilai mutlak dari koefisien korelasi.

1.2 Klasifikasi umum korelasi

Tergantung pada koefisien korelasi, korelasi berikut dibedakan:

Kuat atau dekat dengan koefisien korelasi r>0,70;

Sedang (pada 0,50

Sedang (pada 0,30

Lemah (pada 0,20

Sangat lemah (pada r<0,19).

1.3 Bidang korelasi dan tujuan konstruksinya

Korelasi dipelajari berdasarkan data eksperimen, yang merupakan nilai terukur (x i , y i) dari dua fitur. Jika data eksperimen sedikit, maka distribusi empiris dua dimensi direpresentasikan sebagai deret ganda nilai xi dan y i. Dalam hal ini, korelasi antara fitur dapat dijelaskan dengan cara yang berbeda. Korespondensi antara argumen dan fungsi dapat diberikan oleh tabel, rumus, grafik, dll.

Analisis korelasi, seperti metode statistik lainnya, didasarkan pada penggunaan model probabilistik yang menggambarkan perilaku fitur yang dipelajari dalam populasi umum tertentu, dari mana nilai eksperimental xi dan y diperoleh. Ketika korelasi antara karakteristik kuantitatif, yang nilainya dapat diukur secara akurat dalam satuan skala metrik (meter, detik, kilogram, dll.), diselidiki, model populasi umum berdistribusi normal dua dimensi sangat sering diadopsi. Model tersebut menampilkan hubungan antara variabel xi dan y i secara grafis sebagai tempat kedudukan titik-titik dalam sistem koordinat persegi panjang. Ketergantungan grafis ini juga disebut scatterplot atau bidang korelasi.
Model distribusi normal dua dimensi (bidang korelasi) ini memungkinkan Anda untuk memberikan interpretasi grafis visual dari koefisien korelasi, karena distribusi agregat tergantung pada lima parameter: x , y – nilai rata-rata (harapan matematis); x ,σ y adalah simpangan baku variabel acak X dan Y dan p adalah koefisien korelasi, yang merupakan ukuran hubungan antara variabel acak X dan Y.
Jika p \u003d 0, maka nilai, x i , y i , yang diperoleh dari himpunan normal dua dimensi, terletak pada grafik di koordinat x, y di dalam area yang dibatasi oleh lingkaran (Gambar 5, a). Dalam hal ini, tidak ada korelasi antara variabel acak X dan Y dan mereka disebut tidak berkorelasi. Untuk distribusi normal dua dimensi, tidak berkorelasi berarti pada saat yang sama independensi variabel acak X dan Y.

Konsep hubungan cukup umum dalam penelitian psikologi. Seorang psikolog harus bekerja dengannya ketika menjadi perlu untuk membandingkan pengukuran dua atau lebih indikator tanda atau fenomena untuk menarik kesimpulan apa pun.

Sifat hubungan antara fenomena yang dipelajari bisa tidak ambigu, mis. seperti, ketika nilai tertentu dari satu atribut sesuai dengan nilai yang jelas dan pasti dari yang lain. Jadi, misalnya, dalam subtes untuk mencari pola tes fungsi mental, jumlah poin "mentah" yang dicetak ditentukan oleh rumus:
Xi \u003d Stz - Soz / Stz + Spz * Sbc,
di mana Xi adalah nilai varian, Sтз adalah jumlah pola (korespondensi) yang ditentukan apriori dalam subtes, Soz adalah jumlah kecocokan yang ditunjukkan secara keliru dengan subjek, Soz adalah jumlah kecocokan yang tidak ditentukan (hilang) pada subjek , Sbc adalah jumlah semua kata yang dilihat oleh subjek dalam tes.

Hubungan seperti itu disebut fungsional: di sini satu indikator adalah fungsi dari yang lain, yang merupakan argumen dalam kaitannya dengan yang pertama.

Namun, hubungan yang jelas tidak selalu ditemukan. Lebih sering seseorang harus menghadapi situasi di mana satu nilai fitur dapat sesuai dengan beberapa nilai lainnya. Nilai-nilai ini bervariasi dalam batas-batas yang kurang lebih ditentukan. Jenis hubungan ini disebut korelasi atau korelatif.

Beberapa jenis ekspresi korelasi digunakan. Jadi, untuk menyatakan hubungan antar fitur yang memiliki sifat kuantitatif variasi nilainya digunakan ukuran tendensi sentral: tabulasi diikuti dengan perhitungan koefisien korelasi pasangan, koefisien korelasi ganda dan parsial, koefisien korelasi penentuan ganda, rasio korelasi.

Jika perlu mempelajari hubungan antar ciri yang variasinya bersifat kualitatif (hasil penelitian dengan metode proyektif kepribadian, penelitian dengan metode Diferensial Semantik, penelitian menggunakan Skala Terbuka, dan lain-lain), maka digunakan metode kualitatif. koefisien korelasi alternatif (indikator tetrachoric), kriteria Pearson x2, indikator kontingensi (kontingensi) dari Pearson dan Chuprov.

Untuk menentukan korelasi kualitatif-kuantitatif, yaitu korelasi seperti itu, ketika satu tanda memiliki variasi kualitatif, dan yang lainnya - kuantitatif.Metode khusus digunakan.

Koefisien korelasi (istilah ini pertama kali diperkenalkan oleh F. Galton pada tahun 1888) merupakan indikator kekuatan hubungan antara dua pilihan sampel yang dibandingkan. Apa pun rumus yang digunakan untuk menghitung koefisien korelasi, nilainya berkisar dari -1 hingga +1. Dalam kasus korelasi positif lengkap, koefisien ini sama dengan plus 1, dan dalam kasus korelasi negatif lengkap, itu minus 1. Ini biasanya berupa garis lurus yang melewati titik-titik perpotongan nilai-nilai setiap pasangan data.

Jika nilai varian tidak berbaris pada garis lurus, tetapi membentuk "awan", maka nilai absolut dari koefisien korelasi menjadi kurang dari satu dan mendekati nol ketika "awan" dibulatkan. Jika koefisien korelasi adalah 0, kedua opsi benar-benar independen satu sama lain.

Setiap nilai (empiris) yang dihitung dari koefisien korelasi harus diperiksa validitasnya (signifikansi statistik) terhadap tabel nilai kritis koefisien korelasi yang sesuai. Jika nilai empiris lebih kecil atau sama dengan nilai tabulasi untuk tingkat 5 persen (P = 0,05), korelasinya tidak signifikan. Jika nilai koefisien korelasi hitung lebih besar dari nilai tabulasi untuk P = 0,01, maka korelasi tersebut signifikan secara statistik (signifikan).

Dalam kasus ketika nilai koefisien antara 0,05 > P > 0,01, dalam prakteknya kita berbicara tentang signifikansi korelasi untuk P = 0,05.

Koefisien korelasi Bravais-Pearson (r) adalah indikator parametrik yang diusulkan pada tahun 1896, untuk perhitungan yang membandingkan nilai rata-rata aritmatika dan kuadrat rata-rata dari varian. Untuk menghitung koefisien ini, rumus berikut digunakan (mungkin terlihat berbeda untuk penulis yang berbeda):
r= (E Xi Xi1) - NXap X1ap / N-1 Qx Qx1,

di mana E Xi Xi1 - jumlah produk dari nilai opsi sebanding berpasangan, n adalah jumlah pasangan yang dibandingkan, NXap, X1ap - opsi rata-rata aritmatika Xi, Xi; berturut-turut, Qx, Qx, - standar deviasi dari distribusi x dan x.

Koefisien korelasi peringkat Spearman Rs (koefisien korelasi peringkat, koefisien Spearman) adalah bentuk paling sederhana dari koefisien korelasi dan mengukur hubungan antara peringkat (tempat) varian tertentu dengan alasan yang berbeda, tanpa memperhitungkan nilainya sendiri. Di sini hubungannya lebih bersifat kualitatif daripada kuantitatif.

Biasanya tes non-parametrik ini digunakan dalam kasus-kasus di mana perlu untuk menarik kesimpulan tidak terlalu banyak tentang interval antara data seperti tentang peringkat mereka, dan juga ketika kurva distribusi sangat asimetris dan tidak memungkinkan penggunaan tes parametrik seperti itu. koefisien korelasi Bravais-Pearson (dalam beberapa kasus, mungkin perlu untuk mengubah data kuantitatif menjadi data ordinal). Jika koefisien Rs mendekati +1, maka ini berarti bahwa dua baris sampel yang diberi peringkat menurut karakteristik tertentu praktis bertepatan, dan jika koefisien ini mendekati - 1, kita dapat membicarakan hubungan terbalik yang lengkap.

Seperti perhitungan koefisien korelasi Bravais-Pearson, akan lebih mudah untuk menyajikan perhitungan koefisien Rs dalam bentuk tabel.

Regresi menggeneralisasi konsep hubungan fungsional dengan kasus sifat stokastik (probabilistik) hubungan antara nilai-nilai varian. Tujuan dari pemecahan masalah kategori regresi adalah untuk mengestimasi nilai varians keluaran kontinu dari nilai varian masukan.