Koefisien korelasi peringkat Spearman adalah contoh perbandingan. Analisis korelasi spearman

Dalam kasus di mana pengukuran karakteristik yang dipelajari dilakukan pada skala urutan, atau bentuk hubungan berbeda dari hubungan linier, studi tentang hubungan antara dua variabel acak dilakukan dengan menggunakan koefisien korelasi peringkat. Pertimbangkan koefisien korelasi peringkat Spearman. Saat menghitungnya, perlu untuk memberi peringkat (memesan) opsi sampel. Pemeringkatan adalah pengelompokan data eksperimen dalam urutan tertentu, baik menaik maupun menurun.

Operasi peringkat dilakukan sesuai dengan algoritma berikut:

1. Nilai yang lebih rendah diberikan peringkat yang lebih rendah. Nilai tertinggi diberi peringkat yang sesuai dengan jumlah nilai peringkat. Nilai terendah diberi peringkat sama dengan 1. Misalnya, jika n=7, maka nilai tertinggi akan menerima peringkat nomor 7, kecuali untuk kasus yang ditentukan oleh aturan kedua.

2. Jika beberapa nilai sama, maka mereka diberi peringkat, yang merupakan rata-rata peringkat yang akan mereka terima jika tidak sama. Sebagai contoh, pertimbangkan sampel menaik yang terdiri dari 7 elemen: 22, 23, 25, 25, 25, 28, 30. Nilai 22 dan 23 muncul satu kali, sehingga peringkatnya masing-masing sama dengan R22=1, dan R23 =2 . Nilai 25 muncul 3 kali. Jika nilai-nilai ini tidak berulang, maka peringkat mereka akan sama dengan 3, 4, 5. Oleh karena itu, peringkat mereka R25 sama dengan rata-rata aritmatika dari 3, 4 dan 5: . Nilai 28 dan 30 tidak berulang, sehingga rangkingnya berturut-turut adalah R28=6 dan R30=7. Akhirnya, kami memiliki korespondensi berikut:

3. Jumlah total rangking harus sesuai dengan yang dihitung, yang ditentukan dengan rumus:

di mana n adalah jumlah total nilai peringkat.

Perbedaan antara jumlah peringkat yang sebenarnya dan yang dihitung akan menunjukkan kesalahan yang dibuat dalam perhitungan peringkat atau penjumlahannya. Dalam hal ini, Anda perlu menemukan dan memperbaiki kesalahan.

Koefisien korelasi peringkat Spearman adalah metode yang memungkinkan Anda untuk menentukan kekuatan dan arah hubungan antara dua fitur atau dua hierarki fitur. Penggunaan koefisien korelasi peringkat memiliki sejumlah keterbatasan:

  • a) Korelasi yang diharapkan harus monoton.
  • b) Volume masing-masing sampel harus lebih besar atau sama dengan 5. Untuk menentukan batas atas sampel digunakan tabel nilai kritis (Tabel 3 Lampiran). Nilai maksimum n dalam tabel adalah 40.
  • c) Selama analisis, kemungkinan akan terjadi sejumlah besar peringkat yang identik. Dalam hal ini perlu dilakukan amandemen. Kasus yang paling menguntungkan adalah ketika kedua sampel yang dipelajari mewakili dua urutan nilai yang tidak cocok.

Untuk melakukan analisis korelasi, peneliti harus memiliki dua sampel yang dapat diurutkan, misalnya:

  • - dua tanda yang diukur dalam kelompok subjek yang sama;
  • - dua hierarki individu dari sifat yang diidentifikasi dalam dua subjek untuk kumpulan sifat yang sama;
  • - dua hierarki grup atribut;
  • - hierarki atribut individu dan grup.

Kami memulai perhitungan dengan memberi peringkat pada indikator yang dipelajari secara terpisah untuk masing-masing tanda.

Mari kita menganalisis kasus dengan dua fitur yang diukur dalam kelompok subjek yang sama. Pertama, nilai individu diurutkan berdasarkan fitur pertama yang diperoleh oleh subjek yang berbeda, dan kemudian nilai individu berdasarkan fitur kedua. Jika peringkat yang lebih rendah dari satu indikator sesuai dengan peringkat yang lebih rendah dari indikator lain, dan peringkat yang lebih tinggi dari satu indikator sesuai dengan peringkat yang lebih tinggi dari indikator lain, maka kedua fitur tersebut berhubungan positif. Jika peringkat yang lebih tinggi dari satu indikator sesuai dengan peringkat yang lebih rendah dari indikator lain, maka kedua tanda tersebut berhubungan negatif. Untuk mencari rs, kita menentukan perbedaan antara peringkat (d) untuk setiap mata pelajaran. Semakin kecil perbedaan antara peringkat, semakin dekat koefisien korelasi peringkat rs dengan "+1". Jika tidak ada hubungan, maka tidak akan ada korespondensi di antara mereka, maka rs akan mendekati nol. Semakin besar perbedaan antara peringkat subjek dalam dua variabel, semakin dekat ke "-1" akan nilai koefisien rs. Dengan demikian, koefisien korelasi peringkat Spearman adalah ukuran hubungan monoton antara dua karakteristik yang diteliti.

Pertimbangkan kasus dengan dua hierarki fitur individual yang diidentifikasi dalam dua subjek untuk kumpulan fitur yang sama. Dalam situasi ini, nilai individu yang diperoleh masing-masing dari dua subjek menurut serangkaian fitur tertentu diberi peringkat. Fitur dengan nilai terendah harus diberi peringkat pertama; atribut dengan nilai lebih tinggi - peringkat kedua, dll. Perawatan harus diambil untuk memastikan bahwa semua atribut diukur dalam unit yang sama. Misalnya, tidak mungkin untuk menentukan peringkat indikator jika dinyatakan dalam poin "harga" yang berbeda, karena tidak mungkin untuk menentukan faktor mana yang akan mengambil tempat pertama dalam hal tingkat keparahan sampai semua nilai dibawa ke satu skala. Jika fitur yang memiliki peringkat rendah di salah satu mata pelajaran juga memiliki peringkat rendah di mata pelajaran lain, dan sebaliknya, maka hierarki individu berhubungan positif.

Dalam kasus dua hierarki grup fitur, nilai grup rata-rata yang diperoleh dalam dua grup subjek diurutkan menurut kumpulan fitur yang sama untuk grup yang dipelajari. Selanjutnya, kami mengikuti algoritma yang diberikan dalam kasus sebelumnya.

Mari kita menganalisis kasus dengan hierarki fitur individu dan grup. Mereka mulai dengan memberi peringkat secara terpisah nilai individu subjek dan nilai kelompok rata-rata sesuai dengan set fitur yang sama yang diperoleh, dengan pengecualian subjek yang tidak berpartisipasi dalam hierarki kelompok rata-rata, karena individunya hierarki akan dibandingkan dengannya. Korelasi peringkat memungkinkan untuk menilai tingkat konsistensi antara hierarki fitur individu dan kelompok.

Mari kita pertimbangkan bagaimana signifikansi koefisien korelasi ditentukan dalam kasus-kasus yang tercantum di atas. Dalam kasus dua fitur, itu akan ditentukan oleh ukuran sampel. Dalam kasus dua hierarki fitur individual, signifikansinya bergantung pada jumlah fitur yang disertakan dalam hierarki. Dalam dua kasus terakhir, signifikansi ditentukan oleh jumlah sifat yang dipelajari, dan bukan oleh ukuran kelompok. Jadi, signifikansi rs dalam semua kasus ditentukan oleh banyaknya nilai rangking n.

Saat menguji signifikansi statistik rs, tabel nilai kritis dari koefisien korelasi peringkat digunakan, dikompilasi untuk jumlah nilai peringkat yang berbeda dan tingkat signifikansi yang berbeda. Jika nilai mutlak rs mencapai nilai kritis atau melebihinya, maka korelasi tersebut signifikan.

Saat mempertimbangkan opsi pertama (kasus dengan dua fitur yang diukur dalam kelompok subjek yang sama), hipotesis berikut dimungkinkan.

H0 : Korelasi antara variabel x dan y tidak berbeda dengan nol.

H1 : Korelasi antara variabel x dan y berbeda nyata dengan nol.

Jika kita bekerja dengan salah satu dari tiga kasus yang tersisa, maka kita perlu mengajukan sepasang hipotesis lain:

H0: Korelasi antara hierarki x dan y tidak nol.

H1: Korelasi antara hierarki x dan y berbeda nyata dari nol.

Urutan tindakan dalam menghitung koefisien korelasi rank Spearman rs adalah sebagai berikut.

  • - Tentukan dua fitur atau dua hierarki fitur mana yang akan berpartisipasi dalam pencocokan sebagai variabel x dan y.
  • - Beri peringkat nilai variabel x, berikan peringkat 1 ke nilai terkecil, sesuai dengan aturan peringkat. Tempatkan peringkat di kolom pertama tabel dalam urutan jumlah subjek atau tanda.
  • - Rangking nilai-nilai variabel y. Tempatkan peringkat di kolom kedua tabel dalam urutan jumlah subjek atau tanda.
  • - Hitung selisih d antara barisan x dan y untuk setiap baris tabel. Hasilnya ditempatkan di kolom tabel berikutnya.
  • - Hitung selisih kuadrat (d2). Tempatkan nilai yang diperoleh di kolom keempat tabel.
  • - Hitung jumlah kuadrat dari perbedaan? d2.
  • - Jika peringkat yang sama terjadi, hitung koreksinya:

di mana tx adalah volume setiap kelompok dengan peringkat yang sama dalam sampel x;

ty adalah ukuran setiap kelompok dengan peringkat yang sama dalam sampel y.

Hitung koefisien korelasi peringkat tergantung pada ada atau tidak adanya peringkat yang identik. Dengan tidak adanya peringkat yang identik, koefisien korelasi peringkat rs dihitung dengan menggunakan rumus:

Di hadapan peringkat yang sama, koefisien korelasi peringkat rs dihitung menggunakan rumus:

di mana?d2 adalah jumlah perbedaan kuadrat antara peringkat;

Tx dan Ty - koreksi untuk peringkat yang sama;

n adalah jumlah subjek atau fitur yang berpartisipasi dalam pemeringkatan.

Tentukan nilai kritis rs dari tabel 3 Lampiran, untuk sejumlah mata pelajaran n. Sebuah perbedaan yang signifikan dari nol dari koefisien korelasi akan diamati asalkan rs tidak kurang dari nilai kritis.

Analisis korelasi adalah metode yang memungkinkan Anda untuk mendeteksi hubungan antara sejumlah variabel acak. Tujuan dari analisis korelasi adalah untuk mengidentifikasi perkiraan kekuatan hubungan antara variabel acak atau fitur yang mencirikan proses nyata tertentu.

Hari ini kami mengusulkan untuk mempertimbangkan bagaimana analisis korelasi Spearman digunakan untuk menampilkan bentuk koneksi secara visual dalam perdagangan praktis.

Korelasi spearman atau dasar analisis korelasi

Untuk memahami apa itu analisis korelasi, pertama-tama kita harus memahami konsep korelasi.

Pada saat yang sama, jika harga mulai bergerak ke arah yang Anda butuhkan, perlu untuk membuka blokir posisi tepat waktu.


Untuk strategi ini, yang didasarkan pada analisis korelasi, instrumen perdagangan dengan tingkat korelasi tinggi (EUR/USD dan GBP/USD, EUR/AUD dan EUR/NZD, AUD/USD dan NZD/USD, kontrak CFD, dll.) .

Video: Menerapkan Korelasi Spearman ke Pasar Forex

37. Koefisien korelasi rank spearman.

S.56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Koefisien korelasi peringkat Spearman digunakan ketika:
- variabel memiliki skala peringkat pengukuran;
- distribusi data terlalu berbeda dari normal atau tidak diketahui sama sekali
- sampel kecil (N< 30).

Interpretasi koefisien korelasi rank Spearman tidak berbeda dengan koefisien Pearson, tetapi maknanya agak berbeda. Untuk memahami perbedaan antara metode ini dan secara logis mendukung area penerapannya, mari kita bandingkan rumusnya.

Koefisien korelasi Pearson:

Koefisien korelasi Spearman:

Seperti yang Anda lihat, rumusnya berbeda secara signifikan. Bandingkan Rumus

Rumus korelasi Pearson menggunakan mean aritmatika dan simpangan baku dari deret yang berkorelasi, sedangkan rumus Spearman tidak. Dengan demikian, untuk memperoleh hasil yang memadai menurut rumus Pearson, deret yang berkorelasi harus mendekati distribusi normal (rata-rata dan simpangan bakunya adalah parameter distribusi normal). Untuk rumus Spearman, ini tidak relevan.

Elemen rumus Pearson adalah standarisasi setiap deret dalam z-skor.

Seperti yang Anda lihat, konversi variabel ke skala Z ada dalam rumus koefisien korelasi Pearson. Dengan demikian, untuk koefisien Pearson, skala data sama sekali tidak relevan: misalnya, kita dapat mengkorelasikan dua variabel, salah satunya memiliki min. = 0 dan maks. = 1, dan menit kedua. = 100 dan maks. = 1000. Tidak peduli seberapa berbeda rentang nilainya, semuanya akan dikonversi ke nilai-z standar dengan skala yang sama.

Tidak ada normalisasi seperti itu dalam koefisien Spearman, jadi

SYARAT WAJIB MENGGUNAKAN KOEFISIEN SPEERMAN ADALAH KESETARAAN RANGE DUA VARIABEL.

Sebelum menggunakan koefisien Spearman untuk deret data dengan rentang yang berbeda, perlu terlebih dahulu pangkat. Peringkat mengarah pada fakta bahwa nilai-nilai dari seri ini memperoleh minimum yang sama = 1 (peringkat minimum) dan maksimum yang sama dengan jumlah nilai (maksimum, peringkat terakhir = N, yaitu jumlah maksimum kasus di Sampel).

Dalam kasus apa yang mungkin dilakukan tanpa peringkat

Ini adalah kasus di mana data awalnya skala peringkat. Misalnya, tes orientasi nilai Rokeach.

Juga, ini adalah kasus di mana jumlah opsi nilai kecil dan ada minimum dan maksimum tetap dalam sampel. Misalnya, dalam diferensial semantik, minimum = 1, maksimum = 7.

Contoh penghitungan koefisien korelasi rank spearman

Uji orientasi nilai Rokeach dilakukan pada dua sampel X dan Y. Tugas: untuk mengetahui seberapa dekat hierarki nilai sampel ini (secara harfiah, seberapa mirip).

Nilai yang dihasilkan r=0,747 diperiksa terhadap tabel nilai kritis. Berdasarkan tabel, pada N=18 nilai yang diperoleh reliabel pada tingkat p<=0,005

Koefisien korelasi peringkat menurut Spearman dan Kendal

Untuk variabel yang termasuk dalam skala ordinal atau untuk variabel yang tidak mengikuti distribusi normal, serta untuk variabel yang termasuk dalam skala interval, korelasi peringkat Spearman dihitung sebagai ganti koefisien Pearson. Untuk melakukan ini, nilai individu dari variabel diberikan tempat peringkat, yang selanjutnya diproses menggunakan formula yang sesuai. Untuk mengungkapkan korelasi peringkat, hapus centang pada kotak centang korelasi Pearson default di kotak dialog Korelasi Bivariat.... Sebagai gantinya, aktifkan perhitungan korelasi Spearman. Perhitungan ini akan memberikan hasil sebagai berikut. Koefisien korelasi peringkat sangat dekat dengan nilai yang sesuai dari koefisien Pearson (variabel asli memiliki distribusi normal).

titkova-matmetody.pdf hal. 45

Metode korelasi peringkat Spearman memungkinkan Anda untuk menentukan keketatan (kekuatan) dan arah

korelasi antara dua tanda atau dua profil (hierarki) tanda-tanda.

Untuk menghitung korelasi peringkat, perlu memiliki dua seri nilai,

yang dapat diurutkan. Rentang nilai ini dapat berupa:

1) dua tanda diukur sama kelompok subjek tes;

2) dua hierarki fitur individu, diidentifikasi dalam dua mata pelajaran untuk hal yang sama

satu set fitur;

3) dua hierarki grup fitur,

4) individu dan kelompok hierarki fitur.

Pertama, indikator diberi peringkat secara terpisah untuk masing-masing fitur.

Sebagai aturan, nilai fitur yang lebih rendah diberikan peringkat yang lebih rendah.

Dalam kasus pertama (dua fitur), nilai individu diberi peringkat sesuai dengan yang pertama

sifat yang diperoleh oleh subjek yang berbeda, dan kemudian nilai individu untuk yang kedua

tanda.

Jika dua tanda berhubungan positif, maka subjek dengan peringkat rendah dalam

salah satu dari mereka akan memiliki peringkat rendah di yang lain, dan subjek dengan peringkat tinggi di

salah satu sifat juga akan memiliki peringkat tinggi pada sifat lainnya. Untuk menghitung rs

perlu untuk menentukan perbedaan (d) antara peringkat yang diperoleh oleh mata pelajaran ini pada keduanya

tanda-tanda. Kemudian indikator d ini ditransformasikan dengan cara tertentu dan dikurangkan dari 1. Than

semakin kecil perbedaan antara peringkat, semakin besar rs, semakin dekat ke +1.

Jika tidak ada korelasi, maka semua peringkat akan tercampur dan tidak akan ada

tidak cocok. Rumus dirancang sedemikian rupa sehingga dalam hal ini rs akan mendekati 0.

Dalam kasus korelasi negatif peringkat rendah mata pelajaran pada satu dasar

akan sesuai dengan peringkat tinggi pada atribut lain, dan sebaliknya. Semakin tidak cocok

antara jajaran subjek dalam dua variabel, semakin dekat rs ke -1.

Dalam kasus kedua (dua profil individu), individu

nilai yang diperoleh masing-masing dari 2 mata pelajaran menurut tertentu (sama untuk mereka)

keduanya) satu set fitur. Peringkat pertama akan menerima sifat dengan nilai terendah; peringkat kedua -

tanda dengan nilai yang lebih tinggi, dll. Jelas, semua fitur harus diukur dalam

unit yang sama, jika tidak, peringkat tidak mungkin. Misalnya, tidak mungkin

urutkan indikator menurut Cattell Personality Questionnaire (16PF), jika dinyatakan dalam

skor "mentah", karena rentang nilai berbeda untuk berbagai faktor: dari 0 hingga 13, dari 0 hingga

20 dan dari 0 hingga 26. Kita tidak dapat mengatakan faktor mana yang akan menempati urutan pertama dalam hal

keparahan, sampai kami membawa semua nilai ke satu skala (paling sering ini adalah skala dinding).

Jika hierarki individu dari dua subjek berhubungan positif, maka tanda-tandanya

memiliki peringkat rendah di salah satu dari mereka akan memiliki peringkat rendah di yang lain, dan sebaliknya.

Misalnya, jika untuk satu mata pelajaran faktor E (dominasi) memiliki peringkat terendah, maka untuk

mata pelajaran lain, itu harus memiliki peringkat rendah jika satu mata pelajaran memiliki faktor C

(kestabilan emosi) memiliki peringkat tertinggi, maka subjek lain juga harus memiliki

faktor ini memiliki peringkat yang tinggi, dan seterusnya.

Dalam kasus ketiga (dua profil grup), nilai grup rata-rata diberi peringkat,

diterima dalam 2 kelompok mata pelajaran menurut tertentu, identik untuk dua kelompok, set

tanda-tanda. Berikut ini, alur penalarannya sama seperti dalam dua kasus sebelumnya.

Dalam kasus 4 (profil individu dan grup), mereka diberi peringkat secara terpisah

nilai individu dari subjek dan nilai rata-rata kelompok untuk set yang sama

tanda-tanda yang diperoleh, sebagai suatu peraturan, dengan mengecualikan subjek individu ini - he

tidak berpartisipasi dalam profil grup rata-rata, yang dengannya individunya akan dibandingkan

Profil. Korelasi peringkat akan memungkinkan Anda untuk memeriksa seberapa konsisten individu dan

profil grup.

Dalam keempat kasus, signifikansi koefisien korelasi yang diperoleh ditentukan oleh

dengan jumlah nilai peringkat N. Dalam kasus pertama, nomor ini akan bertepatan dengan

ukuran sampel n. Dalam kasus kedua, jumlah pengamatan akan menjadi jumlah fitur,

membentuk suatu hierarki. Dalam kasus ketiga dan keempat, N juga jumlah yang cocok

tanda, bukan jumlah subjek dalam kelompok. Penjelasan rinci diberikan dalam contoh. Jika sebuah

nilai absolut rs mencapai nilai kritis atau melebihinya, korelasinya

dapat diandalkan.

Hipotesis.

Ada dua kemungkinan hipotesis. Yang pertama mengacu pada kasus 1, yang kedua mengacu pada tiga lainnya

Versi pertama dari hipotesis

H0 : Korelasi antara variabel A dan B tidak berbeda dengan nol.

H2: Korelasi antara variabel A dan B berbeda nyata dengan nol.

Versi kedua dari hipotesis

H0: Korelasi antara hierarki A dan B tidak berbeda dengan nol.

H2: Korelasi antara hierarki A dan B berbeda nyata dari nol.

Batasan koefisien korelasi peringkat

1. Setidaknya 5 observasi harus disampaikan untuk setiap variabel. Atas

batas pengambilan sampel ditentukan oleh tabel nilai kritis yang tersedia .

2. Koefisien korelasi peringkat Spearman rs dengan sejumlah besar identik

peringkat untuk satu atau kedua variabel yang cocok memberikan nilai kasar. Idealnya

kedua seri yang berkorelasi harus dua urutan yang tidak cocok

nilai-nilai. Jika kondisi ini tidak terpenuhi, penyesuaian harus dilakukan untuk

peringkat yang sama.

Koefisien korelasi rank spearman dihitung dengan rumus:

Jika dalam kedua seri peringkat yang dibandingkan ada kelompok dengan peringkat yang sama,

sebelum menghitung koefisien korelasi peringkat, perlu untuk mengoreksi hal yang sama

peringkat Ta dan Tv:

Ta \u003d (a3 - a) / 12,

TV \u003d (v3 - c) / 12,

di mana sebuah - volume masing-masing kelompok peringkat identik dalam seri peringkat A, in volume masing-masing

kelompok yang sederajat pada deret pangkat B.

Untuk menghitung nilai empiris rs, gunakan rumus:

38. Koefisien korelasi biserial putus-putus.

Untuk korelasi secara umum, lihat pertanyaan no.36 dengan. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Biarkan variabel X diukur pada skala yang kuat, dan variabel Y pada skala dikotomis. Koefisien korelasi titik biserial rpb dihitung dengan rumus:

Disini x 1 adalah nilai rata-rata untuk objek X dengan nilai “satu” untuk Y;

x 0 - nilai rata-rata untuk objek X dengan nilai "nol" untuk Y;

s x - standar deviasi semua nilai untuk X;

n 1 - jumlah objek "satu" di Y, n 0 - jumlah objek "nol" di Y;

n = n 1 + n 0 adalah ukuran sampel.

Koefisien korelasi titik biserial juga dapat dihitung menggunakan ekspresi setara lainnya:

Disini x adalah nilai rata-rata keseluruhan untuk variabel X.

Koefisien Korelasi Biserial Titik rpb bervariasi dari -1 hingga +1. Nilainya sama dengan nol jika variabel dengan satuan untuk kamu memiliki rata-rata kamu, sama dengan rata-rata variabel dengan nol di atas kamu.

Penyelidikan hipotesis signifikansi titik koefisien korelasi biserial adalah untuk memeriksa hipotesis nolh 0 tentang persamaan koefisien korelasi umum dengan nol: = 0, yang dilakukan dengan menggunakan kriteria Student. Nilai empiris

dibandingkan dengan nilai kritis t sebuah (df) untuk jumlah derajat kebebasan df = n– 2

Jika kondisi | t| ≤ ta(df), hipotesis nol = 0 tidak ditolak. Koefisien korelasi titik biserial berbeda nyata dari nol jika nilai empiris | t| jatuh ke daerah kritis, yaitu jika kondisi | t| > ta(n– 2). Reliabilitas hubungan dihitung dengan menggunakan koefisien korelasi titik biserial rpb, juga dapat ditentukan dengan menggunakan kriteria χ 2 untuk jumlah derajat kebebasan df= 2.

Korelasi dot-biserial

Modifikasi selanjutnya dari koefisien korelasi dari produk momen tercermin dalam biserial bertitik r. Status ini. menunjukkan hubungan antara dua variabel, salah satunya diduga kontinu dan terdistribusi normal, dan yang lainnya diskrit dalam arti kata yang tepat. Koefisien korelasi dot-biserial dilambangkan dengan r pbis Karena di r pbis dikotomi mencerminkan sifat sebenarnya dari variabel diskrit, dan tidak artifisial, seperti dalam kasus r bis, tandanya ditentukan secara sewenang-wenang. Oleh karena itu, untuk semua praktik sasaran r pbis dipertimbangkan dalam kisaran dari 0,00 hingga +1,00.

Ada juga kasus seperti itu ketika dua variabel dianggap kontinu dan terdistribusi normal, tetapi keduanya secara artifisial dikotomiskan, seperti dalam kasus korelasi biserial. Untuk menilai hubungan antara variabel tersebut, koefisien korelasi tetrachoric digunakan r tet, yang juga dibiakkan oleh Pearson. Utama (tepat) rumus dan prosedur untuk menghitung r tet cukup kompleks. Oleh karena itu, dengan latihan. metode ini menggunakan pendekatan r tet diperoleh berdasarkan prosedur dan tabel yang dipersingkat.

/online/dictionary/dictionary.php?term=511

KOEFISIEN KORELASI BISERIAL BERtitik adalah koefisien korelasi antara dua variabel, salah satunya diukur pada skala dikotomis dan yang lainnya pada skala interval. Ini digunakan dalam testologi klasik dan modern sebagai indikator kualitas tugas tes - konsistensi reliabilitas dengan skor tes keseluruhan.

Untuk mengkorelasikan variabel yang diukur dalam skala dikotomis dan interval menggunakan koefisien korelasi dot-biserial.
Koefisien korelasi dot-biserial adalah metode analisis korelasi rasio variabel, yang salah satunya diukur dalam skala nama dan hanya mengambil 2 nilai (misalnya, pria / wanita, jawaban benar / jawaban tidak benar, ada tanda/tidak ada tanda), dan yang kedua dalam skala rasio atau skala interval. Rumus untuk menghitung koefisien korelasi point-biserial:

Di mana:
m1 dan m0 adalah nilai rata-rata dari X dengan nilai 1 atau 0 dalam Y.
x adalah simpangan baku semua nilai untuk X
n1, n0 – jumlah nilai X dari 1 atau 0 hingga Y.
n adalah jumlah total pasangan nilai

Paling sering, jenis koefisien korelasi ini digunakan untuk menghitung hubungan item tes dengan skala ringkasan. Ini adalah salah satu jenis pemeriksaan validasi.

39. Koefisien korelasi rank-biserial.

Untuk korelasi secara umum, lihat pertanyaan no.36 dengan. 56 (64) 063.JPG

harchenko-korranaliz.pdf hal. 28

Koefisien korelasi rank-biserial digunakan ketika salah satu variabel ( X) disajikan dalam skala ordinal, dan yang lainnya ( kamu) - dalam dikotomi, dihitung dengan rumus

.

Di sini, adalah peringkat rata-rata objek yang memiliki kesatuan dalam kamu; adalah peringkat rata-rata objek dengan nol di kamu, n adalah ukuran sampel.

Penyelidikan hipotesis signifikansi koefisien korelasi rank-biserial dilakukan dengan cara yang sama dengan koefisien korelasi titik-biserial menggunakan uji-t Student dengan penggantian dalam rumus rpb pada rrb.

Ketika satu variabel diukur pada skala dikotomis (variabel x), dan yang lainnya dalam skala peringkat (variabel Y), menggunakan koefisien korelasi peringkat-biserial. Kita ingat bahwa variabel x, diukur dalam skala dikotomis, hanya mengambil dua nilai (kode) 0 dan 1. Mari kita tekankan secara khusus: terlepas dari kenyataan bahwa koefisien ini bervariasi dalam kisaran dari -1 hingga +1, tandanya tidak masalah untuk menafsirkan hasil. Ini adalah pengecualian lain dari aturan umum.

Perhitungan koefisien ini dibuat sesuai dengan rumus:

dimana ` X 1 peringkat rata-rata di atas elemen-elemen variabel itu kamu, yang sesuai dengan kode (fitur) 1 dalam variabel X;

`X 0 – peringkat rata-rata untuk elemen-elemen variabel tersebut y, yang sesuai dengan kode (fitur) 0 dalam variabel X\

N- jumlah elemen dalam variabel x.

Untuk menerapkan koefisien korelasi rank-biserial, kondisi berikut harus dipenuhi:

1. Variabel yang dibandingkan harus diukur pada skala yang berbeda: satu X- dalam skala dikotomis; lain Y– dalam skala peringkat.

2. Jumlah fitur yang bervariasi dalam variabel yang dibandingkan X dan kamu harus sama.

3. Untuk menilai tingkat reliabilitas koefisien korelasi rank-biserial, seseorang harus menggunakan rumus (11.9) dan tabel nilai kritis untuk tes Siswa ketika k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Kasus di mana salah satu variabel hadir dalam skala dikotomis, dan yang lainnya di pangkat (ordinal), membutuhkan penggunaan koefisien korelasi peringkat-biserial:

rpb=2 / n * (m1 - m0)

di mana:
n adalah jumlah objek pengukuran
m1 dan m0 - peringkat rata-rata objek dengan 1 atau 0 pada variabel kedua.
Koefisien ini juga digunakan ketika memeriksa validitas tes.

40. Koefisien korelasi linier.

Tentang korelasi secara umum (dan tentang korelasi linier pada khususnya), lihat pertanyaan No. 36 dengan. 56 (64) 063.JPG

KOEFISIEN KORELASI Tn. PEARSON

r-Pearson (Pearson r) digunakan untuk mempelajari hubungan antara dua metrikvariabel lain yang diukur pada sampel yang sama. Ada banyak situasi di mana tepat untuk menggunakannya. Apakah kecerdasan mempengaruhi kinerja di tahun-tahun universitas senior? Apakah ukuran gaji karyawan terkait dengan niat baiknya terhadap rekan kerja? Apakah suasana hati seorang siswa mempengaruhi keberhasilan memecahkan masalah aritmatika yang kompleks? Untuk menjawab pertanyaan tersebut, peneliti harus mengukur dua indikator yang menarik bagi setiap anggota sampel. Data untuk mempelajari hubungan tersebut kemudian ditabulasi, seperti pada contoh di bawah ini.

CONTOH 6.1

Tabel tersebut menunjukkan contoh data pengukuran awal untuk dua indikator kecerdasan (verbal dan non-verbal) pada 20 siswa kelas 8.

Hubungan antara variabel-variabel ini dapat digambarkan dengan menggunakan diagram pencar (lihat Gambar 6.3). Diagram menunjukkan bahwa ada beberapa hubungan antara indikator yang diukur: semakin besar nilai kecerdasan verbal, maka (terutama) semakin besar nilai kecerdasan non-verbal.

Sebelum memberikan rumus koefisien korelasi, mari kita coba menelusuri logika kemunculannya, dengan menggunakan data Contoh 6.1. Posisi setiap /-titik (subjek dengan nomor /) pada diagram pencar relatif terhadap titik-titik lain (Gbr. 6.3) dapat diberikan oleh besaran dan tanda-tanda penyimpangan nilai yang sesuai dari variabel dari mereka nilai rata-rata: (xj - MJ dan (pikiran pada ). Jika tanda-tanda penyimpangan ini bertepatan, maka ini menunjukkan hubungan positif (nilai besar untuk X sesuai dengan nilai besar pada atau nilai yang lebih kecil untuk X sesuai dengan nilai yang lebih kecil y).

Untuk subjek No. 1, penyimpangan dari rata-rata X dan oleh pada positif, dan untuk subjek No. 3, kedua penyimpangannya negatif. Akibatnya, data keduanya menunjukkan hubungan positif antara sifat-sifat yang dipelajari. Sebaliknya, jika tanda-tanda penyimpangan dari rata-rata X dan oleh pada berbeda, ini akan menunjukkan hubungan negatif antara tanda-tanda. Jadi, untuk mata pelajaran No. 4, penyimpangan dari rata-rata X negatif, menurut y - positif, dan untuk subjek No. 9 - sebaliknya.

Jadi, jika hasil kali simpangan (x, - M X ) X (pikiran pada ) positif, maka data /-subjek menunjukkan hubungan langsung (positif), dan jika negatif, maka hubungan terbalik (negatif). Dengan demikian, jika Xwkamu sebagian besar berbanding lurus, maka sebagian besar hasil kali simpangannya akan bernilai positif, dan jika berbanding terbalik maka sebagian besar hasil kali simpangannya akan bernilai negatif. Oleh karena itu, jumlah semua produk penyimpangan untuk sampel yang diberikan dapat berfungsi sebagai indikator umum untuk kekuatan dan arah hubungan:

Dengan hubungan proporsional langsung antara variabel, nilai ini besar dan positif - untuk sebagian besar subjek, penyimpangan bertepatan dengan tanda (nilai besar satu variabel sesuai dengan nilai besar variabel lain dan sebaliknya). Jika X dan pada memiliki umpan balik, maka untuk sebagian besar subjek, nilai besar dari satu variabel akan sesuai dengan nilai yang lebih kecil dari variabel lain, yaitu, tanda-tanda produk akan negatif, dan jumlah produk secara keseluruhan juga akan besar dalam nilai mutlak, tetapi bertanda negatif. Jika tidak ada hubungan yang sistematis antara variabel, maka istilah positif (produk deviasi) akan diseimbangkan dengan istilah negatif, dan jumlah semua produk deviasi akan mendekati nol.

Agar jumlah produk tidak tergantung pada ukuran sampel, cukup dirata-rata. Tetapi kami tertarik pada ukuran hubungan bukan sebagai parameter umum, tetapi sebagai perkiraan yang dihitung - statistik. Oleh karena itu, untuk rumus dispersi, dalam hal ini kita akan melakukan hal yang sama, kita membagi jumlah hasil kali simpangan bukan dengan N, dan di TV - 1. Ternyata ukuran komunikasi, banyak digunakan dalam ilmu fisika dan teknik, yang disebut kovarians (kovahance):


PADA psikologi, tidak seperti fisika, sebagian besar variabel diukur pada skala yang sewenang-wenang, karena psikolog tidak tertarik pada nilai absolut dari sifat tersebut, tetapi pada posisi relatif subjek dalam kelompok. Selain itu, kovarians sangat sensitif terhadap skala (dispersi) di mana fitur diukur. Untuk membuat ukuran komunikasi tidak tergantung pada unit pengukuran dari salah satu atribut, cukup dengan membagi kovarians ke dalam standar deviasi yang sesuai. Dengan demikian, diperoleh untuk-Koefisien korelasi K. Pearson bagal:

atau, setelah mengganti ekspresi untuk o x dan


Jika nilai kedua variabel diubah menjadi nilai-r menggunakan rumus


maka rumus koefisien korelasi r-Pearson terlihat lebih sederhana (071.JPG):

/dict/sosiologi/artikel/soc/soc-0525.htm

LINEAR KORELASI- hubungan linier statistik non-kausal antara dua variabel kuantitatif X dan pada. Diukur dengan menggunakan "faktor K.L." Pearson, yang merupakan hasil pembagian kovarians dengan standar deviasi kedua variabel:

,

di mana s xy- kovarians antar variabel X dan pada;

s x , s kamu- simpangan baku untuk variabel X dan pada;

x saya , kamu saya- nilai variabel X dan pada untuk nomor objek saya;

x, kamu- rata-rata aritmatika untuk variabel X dan pada.

rasio Pearson r dapat mengambil nilai dari interval [-1; +1]. Berarti r = 0 berarti tidak ada hubungan linier antar variabel X dan pada(tetapi tidak mengesampingkan hubungan statistik non-linier). Nilai koefisien positif ( r> 0) menunjukkan hubungan linier langsung; semakin dekat nilainya dengan +1, semakin kuat hubungan langsung statistik. Nilai koefisien negatif ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 berarti adanya sambungan linier penuh, langsung atau sebaliknya. Dalam kasus koneksi lengkap, semua titik dengan koordinat ( x saya , kamu saya) terletak pada garis lurus kamu = sebuah + bx.

"Koefisien K.L." Pearson juga digunakan untuk mengukur keketatan hubungan dalam model regresi linier berpasangan.

41. Matriks korelasi dan grafik korelasi.

Untuk korelasi secara umum, lihat pertanyaan no.36 dengan. 56 (64) 063.JPG

matriks korelasi. Seringkali, analisis korelasi mencakup studi tentang hubungan bukan dari dua, tetapi dari banyak variabel yang diukur pada skala kuantitatif pada satu sampel. Dalam hal ini, korelasi dihitung untuk setiap pasangan dari himpunan variabel ini. Perhitungan biasanya dilakukan di komputer, dan hasilnya adalah matriks korelasi.

matriks korelasi(korelasi matriks) adalah hasil perhitungan korelasi tipe yang sama untuk setiap pasangan dari himpunan R variabel yang diukur dalam skala kuantitatif pada satu sampel.

CONTOH

Asumsikan bahwa kita sedang mempelajari hubungan antara 5 variabel (vl, v2,..., v5; P= 5), diukur pada sampel T=30 Manusia. Di bawah ini adalah tabel data awal dan matriks korelasi.

Dan
data terkait:

matriks korelasi:

Sangat mudah untuk melihat bahwa matriks korelasi adalah persegi, simetris terhadap diagonal utama (takkakg, y = /) y), dengan unit pada diagonal utama (sejak G dan = aku = 1).

Matriks korelasinya adalah kotak: jumlah baris dan kolom sama dengan jumlah variabel. Dia adalah simetris relatif terhadap diagonal utama, karena korelasi X dengan pada sama dengan korelasi pada dengan X. Unit terletak pada diagonal utamanya, karena korelasi suatu sifat dengan dirinya sendiri sama dengan satu. Akibatnya, tidak semua elemen matriks korelasi dapat dianalisis, tetapi elemen-elemen yang berada di atas atau di bawah diagonal utama.

Jumlah koefisien korelasi, P fitur yang akan dianalisis dalam studi hubungan ditentukan oleh rumus: P(P- 1)/2. Pada contoh di atas, jumlah koefisien korelasi tersebut adalah 5(5 - 1)/2 = 10.

Tugas utama menganalisis matriks korelasi adalah mengungkapkan struktur keterkaitan dari satu set fitur. Ini memungkinkan analisis visual permintaan korelasi- gambar grafis struktur secara statistikkoneksi signifikan jika tidak banyak koneksi seperti itu (hingga 10-15). Cara lain adalah dengan menggunakan metode multivariat: regresi berganda, analisis faktorial atau cluster (lihat bagian "Metode multivariat..."). Dengan menggunakan analisis faktorial atau cluster, dimungkinkan untuk mengidentifikasi pengelompokan variabel yang lebih erat hubungannya satu sama lain daripada variabel lain. Kombinasi cara-cara tersebut juga sangat efektif, misalnya jika tandanya banyak dan tidak homogen.

Perbandingan korelasi - tugas tambahan menganalisis matriks korelasi, yang memiliki dua pilihan. Jika perlu untuk membandingkan korelasi pada salah satu baris matriks korelasi (untuk salah satu variabel), metode perbandingan untuk sampel dependen diterapkan (hal. 148-149). Saat membandingkan korelasi dengan nama yang sama yang dihitung untuk sampel yang berbeda, metode perbandingan untuk sampel independen digunakan (hlm. 147-148).

Metode Perbandingan korelasi dalam diagonal matriks korelasi (untuk menilai stasioneritas dari proses acak) dan membandingkan beberapa matriks korelasi yang diperoleh untuk sampel yang berbeda (untuk homogenitasnya) memakan waktu dan di luar cakupan buku ini. Anda dapat berkenalan dengan metode ini dari buku oleh GV Sukhodolsky 1 .

Masalah signifikansi statistik dari korelasi. Masalahnya adalah bahwa prosedur pengujian hipotesis statistik melibatkan: satu-banyak pengujian yang dilakukan pada satu sampel. Jika metode yang sama diterapkan berkali-kali, bahkan jika dalam kaitannya dengan variabel yang berbeda, maka kemungkinan memperoleh hasil murni secara kebetulan meningkat. Secara umum, jika kita mengulangi metode pengujian hipotesis yang sama ke kali dalam kaitannya dengan variabel atau sampel yang berbeda, maka dengan nilai a yang ditetapkan, kami dijamin akan menerima konfirmasi hipotesis dalam ahk jumlah kasus.

Mari kita asumsikan bahwa matriks korelasi untuk 15 variabel dianalisis, yaitu, 15(15-1)/2 = 105 koefisien korelasi dihitung. Untuk menguji hipotesis, ditetapkan level a = 0,05. Dengan menguji hipotesis 105 kali, kita akan mendapatkan konfirmasinya lima kali (!) terlepas dari apakah koneksi itu benar-benar ada. Mengetahui hal ini dan setelah menerima, katakanlah, 15 koefisien korelasi "signifikan secara statistik", dapatkah kita membedakan mana yang diperoleh secara kebetulan, dan mana yang mencerminkan hubungan nyata?

Sebenarnya, untuk membuat keputusan statistik, perlu untuk mengurangi level a sebanyak jumlah hipotesis yang diuji. Tapi ini hampir tidak disarankan, karena kemungkinan mengabaikan koneksi kehidupan nyata (membuat kesalahan tipe II) meningkat dengan cara yang tidak terduga.

Matriks korelasi saja tidak cukup sebagai dasaruntuk kesimpulan statistik mengenai koefisien individu yang termasuk di dalamnyakorelasi!

Hanya ada satu cara yang benar-benar meyakinkan untuk memecahkan masalah ini: membagi sampel secara acak menjadi dua bagian dan memperhitungkan hanya korelasi yang signifikan secara statistik di kedua bagian sampel. Sebuah alternatif mungkin penggunaan metode multivariat (faktorial, cluster atau analisis regresi berganda) - untuk seleksi dan interpretasi selanjutnya dari kelompok variabel yang terkait secara statistik.

Masalah nilai yang hilang. Jika ada nilai yang hilang dalam data, maka dua opsi untuk menghitung matriks korelasi dimungkinkan: a) penghapusan nilai baris demi baris (mengecualikankasusmenurut daftar); b) penghapusan nilai secara berpasangan (mengecualikankasusberpasangan). Pada penghapusan baris demi baris pengamatan dengan celah, seluruh baris dihapus untuk objek (subjek) yang memiliki setidaknya satu nilai yang hilang untuk salah satu variabel. Metode ini mengarah ke matriks korelasi yang "benar" dalam arti bahwa semua koefisien dihitung dari kumpulan objek yang sama. Namun, jika nilai yang hilang didistribusikan secara acak dalam variabel, maka metode ini dapat mengarah pada fakta bahwa tidak akan ada objek yang tersisa dalam kumpulan data yang dipertimbangkan (setiap baris akan berisi setidaknya satu nilai yang hilang). Untuk menghindari situasi ini, gunakan metode lain yang disebut penghapusan berpasangan. Metode ini hanya memperhitungkan celah di setiap pasangan kolom variabel yang dipilih dan mengabaikan celah di variabel lain. Korelasi untuk sepasang variabel dihitung untuk objek-objek di mana tidak ada celah. Dalam banyak situasi, terutama ketika jumlah kesenjangan relatif kecil, katakanlah 10%, dan kesenjangan didistribusikan secara acak, metode ini tidak menyebabkan kesalahan serius. Namun, terkadang tidak demikian. Misalnya, dalam bias sistematis (pergeseran) dari perkiraan, lokasi sistematis celah dapat "tersembunyi", yang merupakan alasan perbedaan dalam koefisien korelasi yang dibangun pada himpunan bagian yang berbeda (misalnya, untuk subkelompok objek yang berbeda ). Masalah lain yang terkait dengan matriks korelasi dihitung dengan berpasangan penghilangan celah terjadi saat menggunakan matriks ini dalam jenis analisis lain (misalnya, dalam regresi berganda atau analisis faktor). Mereka berasumsi bahwa matriks korelasi yang "benar" digunakan dengan tingkat konsistensi dan "korespondensi" tertentu dari berbagai koefisien. Penggunaan matriks dengan perkiraan "buruk" (bias) mengarah pada fakta bahwa program tidak dapat menganalisis matriks seperti itu, atau hasilnya akan salah. Oleh karena itu, jika digunakan metode berpasangan untuk menghilangkan data yang hilang, perlu diperiksa apakah ada pola yang sistematis atau tidak dalam distribusi kesenjangan.

Jika penghapusan berpasangan dari data yang hilang tidak menyebabkan pergeseran sistematis dalam rata-rata dan varians (deviasi standar), maka statistik ini akan serupa dengan yang dihitung dengan metode garis bijaksana untuk menghilangkan kesenjangan. Jika ada perbedaan yang signifikan, maka ada alasan untuk mengasumsikan bahwa ada pergeseran estimasi. Misalnya, jika mean (atau standar deviasi) dari nilai-nilai variabel TETAPI, yang digunakan dalam menghitung korelasinya dengan variabel PADA, jauh lebih kecil dari rata-rata (atau standar deviasi) dari nilai variabel yang sama TETAPI, yang digunakan dalam menghitung korelasinya dengan variabel C, maka ada banyak alasan untuk mengharapkan kedua korelasi ini (A-Bkita) berdasarkan subset data yang berbeda. Akan terjadi pergeseran korelasi yang disebabkan oleh letak gap nilai variabel yang tidak acak.

Analisis permintaan korelasi. Setelah memecahkan masalah signifikansi statistik dari elemen-elemen matriks korelasi, korelasi signifikan secara statistik dapat direpresentasikan secara grafis dalam bentuk pleiad korelasi atau pleiades. galaksi korelasi - itu adalah sosok yang terdiri dari simpul dan garis yang menghubungkannya. Simpul sesuai dengan fitur dan biasanya dilambangkan dengan angka – angka variabel. Garis-garis tersebut berhubungan dengan hubungan yang signifikan secara statistik dan secara grafis mengekspresikan tanda, dan terkadang tingkat signifikansi /j dari hubungan tersebut.

Galaksi korelasi dapat mencerminkan semua hubungan yang signifikan secara statistik dari matriks korelasi (kadang-kadang disebut grafik korelasi ) atau hanya bagian yang dipilih secara bermakna (misalnya, sesuai dengan satu faktor menurut hasil analisis faktor).

CONTOH PEMBUATAN PLEIADI KORELASI


Persiapan untuk sertifikasi lulusan negara (final): pembentukan basis data USE (daftar umum peserta USE dari semua kategori, menunjukkan mata pelajaran) - dengan mempertimbangkan hari cadangan jika terjadi kebetulan mata pelajaran;

  • Rencana kerja (27)

    Keputusan

    2. Kegiatan lembaga pendidikan untuk meningkatkan konten dan menilai kualitas dalam mata pelajaran pendidikan alam dan matematika MOU sekolah menengah No. 4, Litvinovskaya, Chapaevskaya,

  • adalah penilaian kuantitatif dari studi statistik tentang hubungan antara fenomena, yang digunakan dalam metode non-parametrik.

    Indikator menunjukkan bagaimana jumlah perbedaan kuadrat yang diamati antara peringkat berbeda dari kasus tidak ada koneksi.

    tugas layanan. Dengan kalkulator online ini, Anda dapat:

    • perhitungan koefisien korelasi rank spearman;
    • perhitungan interval kepercayaan untuk koefisien dan evaluasi signifikansinya;

    Koefisien korelasi rank spearman mengacu pada indikator penilaian kedekatan komunikasi. Karakteristik kualitatif dari ketatnya hubungan koefisien korelasi peringkat, serta koefisien korelasi lainnya, dapat dinilai dengan menggunakan skala Chaddock.

    Perhitungan koefisien terdiri dari langkah-langkah berikut:

    Sifat koefisien korelasi peringkat Spearman

    Area aplikasi. Koefisien korelasi peringkat digunakan untuk mengevaluasi kualitas komunikasi antara dua set. Selain itu, signifikansi statistiknya digunakan ketika menganalisis data untuk heteroskedastisitas.

    Contoh. Pada sampel data variabel X dan Y yang diamati:

    1. membuat tabel peringkat;
    2. temukan koefisien korelasi rank Spearman dan uji signifikansinya pada level 2a
    3. menilai sifat kecanduan
    Keputusan. Tetapkan peringkat ke fitur Y dan faktor X .
    Xkamuperingkat X, dxperingkat Y, d y
    28 21 1 1
    30 25 2 2
    36 29 4 3
    40 31 5 4
    30 32 3 5
    46 34 6 6
    56 35 8 7
    54 38 7 8
    60 39 10 9
    56 41 9 10
    60 42 11 11
    68 44 12 12
    70 46 13 13
    76 50 14 14

    Matriks peringkat.
    peringkat X, dxperingkat Y, d y(dx - dy) 2
    1 1 0
    2 2 0
    4 3 1
    5 4 1
    3 5 4
    6 6 0
    8 7 1
    7 8 1
    10 9 1
    9 10 1
    11 11 0
    12 12 0
    13 13 0
    14 14 0
    105 105 10

    Memeriksa kebenaran kompilasi matriks berdasarkan perhitungan checksum:

    Jumlah kolom matriks sama satu sama lain dan checksum, yang berarti matriks disusun dengan benar.
    Dengan menggunakan rumus, kami menghitung koefisien korelasi peringkat Spearman.


    Hubungan antara sifat Y dan faktor X kuat dan searah
    Signifikansi koefisien korelasi peringkat Spearman
    Untuk menguji hipotesis nol pada tingkat signifikansi tentang persamaan koefisien korelasi peringkat Spearman umum menjadi nol di bawah hipotesis bersaing H i . p 0, maka perlu untuk menghitung titik kritis:

    di mana n adalah ukuran sampel; adalah koefisien korelasi pangkat sampel Spearman: t(α, k) adalah titik kritis daerah kritis dua sisi, yang diperoleh dari tabel titik kritis distribusi Student, menurut tingkat signifikansi dan jumlah derajat kebebasan k = n-2.
    Jika |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - hipotesis nol ditolak. Ada korelasi peringkat yang signifikan antara fitur kualitatif.
    Berdasarkan tabel Student kita menemukan t(α/2, k) = (0,1/2;12) = 1,782

    Sejak T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

    Dalam prakteknya, koefisien korelasi rank Spearman (P) sering digunakan untuk menentukan kedekatan hubungan antara dua fitur. Nilai setiap fitur diurutkan dalam urutan menaik (dari 1 hingga n), kemudian ditentukan perbedaan (d) antara peringkat yang sesuai dengan satu pengamatan.

    Contoh 1. Hubungan antara volume produksi industri dan investasi dalam modal tetap di 10 wilayah di salah satu distrik federal Federasi Rusia pada tahun 2003 ditandai oleh data berikut.
    Menghitung Koefisien korelasi rank spearman dan Kendala. Periksa signifikansinya pada =0,05. Merumuskan kesimpulan tentang hubungan antara volume produksi industri dan investasi dalam aset tetap di wilayah Federasi Rusia yang sedang dipertimbangkan.

    Tetapkan peringkat ke fitur Y dan faktor X . Tentukan jumlah selisih kuadrat d 2 .
    Dengan menggunakan kalkulator, kami menghitung koefisien korelasi peringkat Spearman:

    X kamu peringkat X, dx peringkat Y, d y (dx - dy) 2
    1.3 300 1 2 1
    1.8 1335 2 12 100
    2.4 250 3 1 4
    3.4 946 4 8 16
    4.8 670 5 7 4
    5.1 400 6 4 4
    6.3 380 7 3 16
    7.5 450 8 5 9
    7.8 500 9 6 9
    17.5 1582 10 16 36
    18.3 1216 11 9 4
    22.5 1435 12 14 4
    24.9 1445 13 15 4
    25.8 1820 14 19 25
    28.5 1246 15 10 25
    33.4 1435 16 14 4
    42.4 1800 17 18 1
    45 1360 18 13 25
    50.4 1256 19 11 64
    54.8 1700 20 17 9
    364

    Hubungan antara fitur Y faktor X kuat dan langsung.

    Estimasi Koefisien Korelasi Rank Spearman



    Menurut tabel Siswa, kami menemukan Ttabel.
    T tabel \u003d (18; 0,05) \u003d 1,734
    Karena Tobs > Ttabl, kami menolak hipotesis bahwa koefisien korelasi rank sama dengan nol. Dengan kata lain, koefisien korelasi peringkat Spearman signifikan secara statistik.

    Estimasi interval untuk koefisien korelasi peringkat (interval kepercayaan)
    Interval kepercayaan untuk koefisien korelasi peringkat Spearman: p(0.5431;0.9095).

    Contoh #2. data awal.

    5 4
    3 4
    1 3
    3 1
    6 6
    2 2
    Karena matriks memiliki peringkat terkait (nomor peringkat yang sama) dari baris ke-1, kami akan membentuknya kembali. Peringkat dibentuk kembali tanpa mengubah pentingnya peringkat, yaitu rasio yang sesuai (lebih besar dari, kurang dari atau sama dengan) harus dipertahankan di antara nomor peringkat. Juga tidak disarankan untuk mengatur peringkat di atas 1 dan di bawah nilai yang sama dengan jumlah parameter (dalam hal ini n = 6). Reformasi peringkat dilakukan dalam tabel.
    peringkat baru
    1 1 1
    2 2 2
    3 3 3.5
    4 3 3.5
    5 5 5
    6 6 6
    Karena ada barisan terikat dari baris ke-2 dalam matriks, kami akan membentuknya kembali. Reformasi peringkat dilakukan dalam tabel.
    Nomor kursi di baris yang dipesanLokasi faktor menurut penilaian ahliperingkat baru
    1 1 1
    2 2 2
    3 3 3
    4 4 4.5
    5 4 4.5
    6 6 6
    Matriks peringkat.
    peringkat X, dxperingkat Y, d y(dx - dy) 2
    5 4.5 0.25
    3.5 4.5 1
    1 3 4
    3.5 1 6.25
    6 6 0
    2 2 0
    21 21 11.5
    Karena di antara nilai fitur x dan y ada beberapa yang identik, mis. barisan terikat terbentuk, maka dalam hal ini koefisien Spearman dihitung sebagai:

    di mana


    j - jumlah tautan untuk fitur x;
    Dan j adalah jumlah rangking yang identik dalam bundel ke-j di x;
    k - jumlah berkas gandum untuk fitur y;
    Di k - jumlah peringkat identik dalam bundel ke-k di y.
    A = [(2 3 -2)]/12 = 0,5
    B = [(2 3 -2)]/12 = 0,5
    D = A + B = 0,5 + 0,5 = 1

    Hubungan antara fitur Y dan faktor X adalah sedang dan langsung.