Apa yang dimaksud dengan peringkat dalam statistik. Kasus peringkat yang identik

1 Cerita pendek munculnya analisis korelasi

Awal penggunaan teknik matematika dan statistik untuk mempelajari ketergantungan korelasi dimulai pada tahun 70-an abad kesembilan belas. Banyak sejarawan dan ahli statistik memperkirakan sejarah perkembangan korelasi sejak empat puluhan abad kesembilan belas - sejak saat itu Matematikawan Perancis O. Bravais mengajukan rumus distribusi dua variabel acak yang memenuhi persyaratan hukum distribusi normal.

Namun, pendiri sebenarnya dari teori korelasi adalah ahli matematika dan statistik Inggris K. Pearson, yang menciptakannya pada akhir abad kesembilan belas dan awal abad kedua puluh. teori ini. Di dalamnya, korelasi berperan sebagai bentuk hubungan dialektis yang di dalamnya terdapat banyak hal berbagai alasan, baik perlu maupun acak, keduanya umum untuk kedua besaran korelasi, dan hasil bagi, yang hanya mempengaruhi salah satu besaran tersebut. Selain itu, tidak semua hubungan alami bersifat sebab akibat.

Pengembangan teori dilakukan dengan bantuan penelitian-penelitian lain, ketika ketentuan-ketentuan pokok teori korelasi telah dibuat. Selain itu, dalam bidang studi korelasi, praktiknya sangat menyimpang dari teori, sehingga menempatkan peneliti pada kondisi yang tidak memenuhi persyaratannya.

Dasar pembentukan metode mempelajari korelasi dan regresi adalah data yang mengkarakterisasi setiap karakteristik yang dinyatakan secara kuantitatif. Oleh karena itu, pada langkah pertama, peneliti dihadapkan pada tugas untuk mengkorelasikan ciri-ciri kualitatif, misalnya hubungan warna mata pada ayah dan anak. Prinsip umum, yang menjadi dasar perancangan indikator korelasi karakteristik kualitatif, adalah bahwa dua karakteristik kualitatif dapat dianggap saling berhubungan jika pengaruh salah satunya A terhadap pengaruh atribut B sama dengan pengaruh atribut bukan B. Dalam pengembangan prinsip ini, dan ditawarkan berbagai desain indikator seperti, misalnya, koefisien kontingensi mean square Pearson atau koefisien kontingensi timbal balik Chuprov.

Kajian tentang korelasi karakteristik kualitatif memunculkan pengajaran umum tentang korelasi, yang disebut teori peringkat dan teori korelasi peringkat berdasarkan itu. Ahli matematika dan statistik Inggris M. Kendall, penulis monografi yang membahas masalah korelasi pangkat, menunjukkan bahwa teori pangkat pertama kali muncul sebagai cabang teori. proses acak. Pada tahap awal dalam peringkat mereka paling sering hanya melihat perangkat yang nyaman, berkat itu dimungkinkan untuk dilakukan tanpa mengukur nilai absolut variabel dan dengan demikian menghemat waktu dan tenaga. Belakangan, statistik peringkat bisa mendapatkan pengakuan karena mereka kelebihannya sendiri. Kendall membuat ukuran yang juga dapat diterapkan untuk mempelajari korelasi parsial antar peringkat. Teori modern Mustahil membayangkan korelasi peringkat tanpa studi paling komprehensif dari M. Kendall yang membahasnya.

Jadi, pada awal abad kedua puluh, matematika metode statistik Pengukuran korelasi dan regresi pada umumnya berkembang menjadi cukup koheren sistem keseluruhan, yang mencakup metode statistik nonparametrik dan metode peringkat nonparametrik.

2 Metode pemeringkatan nonparametrik

Metode pemeringkatan nonparametrik sedang booming daerah berkembang statistik matematika. Sejarah modern metode nonparametrik berdasarkan peringkat cukup singkat – hanya sekitar 40 tahun. Metode pemeringkatan telah muncul sebagai bidang khusus statistik nonparametrik tidak hanya karena sifat bahan sumbernya, tetapi juga karena gagasan untuk penggunaan lebih lanjut. Saat ini, metode ini memecahkan banyak masalah dalam menganalisis data ekonomi, statistik, teknik, ilmu pengetahuan alam, sosiologi, dan medis.

Pemeringkatan merupakan suatu tata cara penyusunan objek kajian yang dilakukan berdasarkan kesukaan. Peringkat adalah nomor seri nilai-nilai suatu ciri, disusun menurut urutan nilainya. Sebagaimana ditunjukkan oleh studi statistik yang dilakukan selama 10-15 tahun terakhir, metode pemeringkatan sebagian besar bebas dari sejumlah kelemahan dalam menangani sampel kecil, yang distribusinya tidak diketahui. Seperti diketahui, peralihan dari observasi itu sendiri ke peringkatnya disertai dengan hilangnya informasi tertentu. Namun kerugian tersebut tidak terlalu besar. Sayangnya, saat ini masih terdapat kekurangan literatur khusus tentang masalah ini.

DI DALAM Akhir-akhir ini dalam meramalkan dan memecahkan sejumlah masalah lain telah banyak digunakan penilaian ahli. Metode korelasi peringkat di bidang ini hampir sama satu-satunya jalan generalisasi penilaian ahli.

Teori peringkat pertama kali muncul sebagai cabang dari teori proses acak. Pada tahap awal, peringkat paling sering dilihat sebagai perangkat yang mudah digunakan, berkat itu dimungkinkan untuk dilakukan tanpa mengubah nilai absolut variabel dan dengan demikian menghemat waktu atau tenaga. Berkat penggunaan peringkat, kesulitan yang terkait dengan membangun skala obyektif dari nilai absolut dapat dihindari. Belakangan, statistik peringkat bisa mendapatkan pengakuan atas kemampuannya sendiri.

Di bawah ini kami akan mempertimbangkan cara paling umum untuk mengatur objek yang diteliti:

Tugasnya mungkin hanya mengorganisasikan objek-objek menurut tempatnya dalam ruang dan waktu. Misalnya, kartu-kartu disusun dalam satu tumpukan dalam urutan tertentu dan kemudian dikocok. Susunan kartu yang baru juga ditandai dengan urutan dan peringkat tertentu. Membandingkannya dengan yang lama, Anda dapat melihat betapa hati-hatinya kartu-kartu tersebut dikocok. Satu-satunya hal yang menarik tentang masalah ini adalah lokasi umum kartu-kartu dalam satu tumpukan, dan tidak perlu menyusun objek-objek sesuai dengan “peningkatan” atau “pengurangan” satu atau beberapa karakteristik yang melekat pada semuanya;

Objek juga dapat diurutkan menurut kualitas tertentu, yang tidak memiliki skala perubahan objektif yang absolut. Anda dapat, misalnya, memberi peringkat pada sampel batu berdasarkan kekerasan, berdasarkan kriteria sederhana berikut: A lebih keras dari B jika A meninggalkan goresan pada B saat bersentuhan. Jika A meninggalkan goresan pada B, dan B meninggalkan goresan pada C, maka A akan meninggalkan goresan pada C. Jadi, dengan menggunakan serangkaian perbandingan, objek yang dimaksud dapat diurutkan dengan akurasi yang wajar (kecuali jika himpunan tersebut mencakup dua benda yang mempunyai kekerasan yang sama). Namun metode serupa tidak memungkinkan pengukuran nilai absolut kekerasan batuan. Selalu mungkin untuk menetapkan bahwa A lebih sulit daripada B. Namun, sampai skala pengukuran tertentu dibuat nilai absolut, tidak dapat dikatakan bahwa A, katakanlah, dua kali lebih keras dari B;

Pengurutan dapat dilakukan sesuai dengan nilai yang diukur (atau dihitung secara teoritis) dari beberapa atribut. Misalnya, Anda dapat mengatur orang dalam satu urutan atau lainnya bergantung pada tinggi badan mereka, dan kota berdasarkan jumlah penduduk. Dalam hal ini, tidak selalu perlu menggunakan proses pengukuran itu sendiri: Anda dapat membentuk sekelompok siswa berdasarkan tinggi badan “dengan mata”; namun, dalam kasus seperti ini, kriteria pemeringkatan harus memungkinkan adanya perbandingan langsung.

Dimungkinkan untuk mengurutkan objek menurut beberapa atribut, yang nilainya, pada prinsipnya, dapat diukur, tetapi dalam praktiknya (atau bahkan secara teoritis) tidak mungkin untuk menggunakan pengukuran seperti itu karena satu dan lain alasan. Misalnya, Anda dapat mengurutkan serangkaian wajah berdasarkan wajahnya kemampuan intelektual, percaya bahwa kualitas seperti itu benar-benar ada dan bahwa orang dapat ditempatkan dalam satu urutan atau lainnya sesuai dengan intensitas karakteristik ini.

DI DALAM aplikasi praktis Metode berbasis pemeringkatan terkadang menghadapi kasus di mana dua atau lebih objek sangat mirip sehingga tidak mungkin untuk memberikan preferensi pada salah satunya. Ketika seorang ahli mengurutkan suatu objek berdasarkan penilaian subjektif, maka sifat ini (kurangnya preferensi) dikaitkan dengan kebenaran ketidakmungkinannya atau ketidakmampuan peneliti untuk menemukan perbedaan yang signifikan. Dalam hal ini dikatakan bahwa benda seperti itu disebut terikat.

Misalnya, siswa diberi peringkat berdasarkan prestasi atau nilai ujiannya. Metode yang diadopsi untuk resep nilai numerik peringkat objek terkait terdiri dari rata-rata peringkat objek yang akan mereka miliki jika objek tersebut dapat dibedakan. Misal, jika objek ketiga dan keempat terhubung, maka masing-masing diberi peringkat 3,5, tetapi jika objek kedua hingga ketujuh terhubung, maka peringkat yang dihasilkan adalah 4,5.

Pendekatan ini terkadang disebut “metode peringkat rata-rata”. Ketika tidak ada dasar untuk memilih antar objek, maka jelas bahwa dalam hal ini perlu atribut ke semua peringkat yang sama. Keuntungan metode ini adalah jumlah peringkat untuk semua objek tetap sama persis seperti saat memberi peringkat tanpa koneksi.

Dalam analisis secara sosial - fenomena ekonomi Seringkali kita perlu menggunakan berbagai perkiraan bersyarat menggunakan peringkat, dan hubungan antara karakteristik individu diukur menggunakan koefisien korelasi nonparametrik.

3 Koefisien konkordansi peringkat Kendall

Untuk menentukan kedekatan hubungan antara sejumlah fitur peringkat yang berubah-ubah, digunakan koefisien berganda korelasi (koefisien konkordansi).

Dalam praktek penelitian statistik Ada kasus ketika sekumpulan objek dicirikan bukan oleh dua, tetapi oleh beberapa urutan peringkat, maka perlu untuk membangun hubungan statistik antara beberapa variabel. Sebagai meteran, digunakan koefisien korelasi berganda (koefisien konkordansi) pangkat Kendall, yang ditentukan dengan rumus berikut:

Di mana W– koefisien konkordansi;

D– jumlah kuadrat pangkat dihitung berdasarkan rumus (2);

N– jumlah objek dengan karakteristik yang diperingkat (jumlah ahli);

M– jumlah variabel ordinal yang dianalisis.

Dalam arti tertentu, W berfungsi sebagai ukuran umum.

, (2)

Di mana r ij– peringkat penilaian kelompok ahli;

N– jumlah objek (jumlah ahli).

Nilai koefisien konkordansi terdapat pada segmen tersebut.

Peningkatan koefisien dari 0 menjadi 1 berarti konsistensi penilaian yang lebih baik. Jika semua penilaian ini bertepatan, maka W=1.

Pengujian signifikansi koefisien didasarkan pada kenyataan bahwa jika hipotesis nol tentang tidak adanya koneksi korelasi untuk n>7 statistik m(n-1)* W memiliki sekitar distribusi dengan k=n-1 derajat kebebasan. Oleh karena itu, koefisien konkordansi signifikan pada tingkat =0,05 jika m(n-1)W> .

Peristiwa C

ahli j = 1

ahli a ij

ahli j = 2

ahli j = 1

pentingnya a ij

ahli j = 2

Peringkat kepentingan total a i

Nilai rata-rata untuk total peringkat seri yang dipertimbangkan

Total deviasi kuadrat S dari total kejadian dari nilai rata-rata a adalah

disebut koefisien konkordansi. Nilai W bervariasi dari 0 hingga 1. Pada W = 0 sama sekali tidak ada konsistensi, yaitu Tidak ada hubungan antara penilaian para ahli yang berbeda. Sebaliknya pada W = 1 kesepakatan pendapat para ahli sudah lengkap.

Dalam hal barisan (5.2) mempunyai persamaan selain pertidaksamaan tegas, yaitu. terdapat kebetulan rangking, maka rumus menghitung koefisien konkordansi berbentuk

Bila rangking tersebut diulang, maka untuk memperoleh rangking normal mempunyai nilai rata-rata rangking sama dengan

peristiwa-peristiwa yang mempunyai peringkat yang sama perlu diberi peringkat yang sama dengan nilai rata-rata tempat-tempat di mana peristiwa-peristiwa ini dibagi di antara mereka sendiri.

Misalnya, diperoleh peringkat acara berikut:

Peringkat a i

Event 2 dan 5 berbagi tempat kedua dan ketiga. Artinya, mereka diberi peringkat

acara 3, 4 dan 6 berbagi tempat keempat, kelima, keenam di antara mereka sendiri, dan mereka diberi peringkat

Jadi, kami mendapatkan peringkat normal:

Peringkat a" i

Contoh. Misalkan rangking m = 10 kejadian p = 3 ahli; N, Q, R. Hasil perhitungan disajikan pada tabel. 5.3.

Untuk nilai ekstrim dari koefisien konkordansi, asumsi berikut dapat dibuat. Jika W = 0, maka tidak ada konsistensi penilaian, oleh karena itu untuk memperoleh penilaian yang andal perlu dilakukan klarifikasi data awal kejadian dan (atau) perubahan komposisi kelompok ahli. Ketika W = 1, penilaian yang diperoleh tidak selalu dapat dianggap obyektif, karena terkadang semua anggota kelompok ahli telah sepakat sebelumnya untuk melindungi kepentingan bersama.

Nilai W yang ditemukan harus lebih besar dari nilai W 3 yang ditentukan (W > W 3). Anda dapat mengambil W 3 = 0,5, mis. ketika W > 0,5, tindakan para ahli lebih terkoordinasi daripada tidak. Di W< 0,5 полученные оценки нельзя считать достоверными, и поэтому следует повторить опрос заново. Жесткость данного утверждения опреде­ляется важностью проводимого исследования и возможностью повторной экспертизы. Практика показывает, что очень часто этим требованием пренебрегают.

Perhitungan koefisien W dengan mempertimbangkan kompetensi ahli diberikan dalam pekerjaan.

Mendekati R.s. dengan cukup baik. T, dan perbedaannya dapat diabaikan ketika . Jika hipotesis H 0 benar, maka sesuai dengan komponen yang dipotong X 1 , ... , Xn vektor acak Xessence independen variabel acak, proyeksi R. s. Ditentukan oleh rumus

dimana (lihat).

Ada hubungan internal antara R. s. Dan . Seperti ditunjukkan pada , jika hipotesis H 0 benar, maka proyeksinya Koefisien korelasi Kendall ke dalam keluarga sistem linier linier. hingga faktor konstan bertepatan dengan koefisien korelasi rank spearman, yaitu:


Dari persamaan ini dapat disimpulkan bahwa koefisien korelasi antara dan sama dengan


yaitu pada umumnya pr. Dengan. dan setara secara asimtotik (lihat).

menyala.: G a ek Ya., Shi d ak Z., Teori kriteria pangkat, trans. dari bahasa Inggris, M., 1971; K e n d a l l M.G., Metode korelasi rank, 4ed., L., 1970. M.S.Niulin.


Ensiklopedia Matematika. - M.: Ensiklopedia Soviet. I.M.Vinogradov. 1977-1985.

Lihat apa itu "STATISTIK PERINGKAT" di kamus lain:

    statistik peringkat- - [AS Goldberg. Kamus energi Inggris-Rusia. 2006] Topik energi dalam statistik peringkat EN secara umum ... Panduan Penerjemah Teknis

    Istilah ini memiliki arti lain, lihat Statistik (arti). Statistik (dalam dalam arti sempit) dapat diukur fungsi numerik dari sampel, tidak bergantung pada parameter distribusi yang tidak diketahui. DI DALAM dalam arti luas istilah (matematis) ... ... Wikipedia

    - (statistik) 1. Totalitas data dan metode matematika, digunakan untuk mempelajari hubungan antara variabel yang berbeda. Ini mencakup metode seperti regresi linier(regresi linier) dan korelasi peringkat. 2. Nilai yang digunakan... ... Kamus ekonomi

    STATISTIK- 1. Suatu jenis kegiatan yang bertujuan untuk memperoleh, mengolah, dan menganalisis informasi yang mencirikan pola-pola kuantitatif kehidupan dengan segala keanekaragamannya, yang tidak dapat dipisahkan dengan kandungan kualitatifnya. Dalam arti sempitnya... ... Ensiklopedia Sosiologi Rusia

    - (statistik non parametrik) Statistik teknik, yang tidak mengizinkan khusus bentuk fungsional untuk hubungan antar variabel. Korelasi peringkat dua variabel adalah contohnya. Penggunaan teknis seperti itu...... Kamus ekonomi- K.m., yang menerima namanya. karena didasarkan pada variabel “korelasi”, maka ini adalah metode statistik, yang permulaannya dibuat dalam karya Karl Pearson sekitar akhir XIX V. Mereka berkerabat dekat dengan... ... Ensiklopedia Psikologi

    Pengembang Digital Illusions CE Publisher ... Wikipedia

    Karl Pearson Karl (Carl) Pearson Tanggal lahir ... Wikipedia

Dalam analisis fenomena sosial-ekonomi, seringkali perlu menggunakan berbagai perkiraan bersyarat dengan menggunakan peringkat, dan hubungan antara karakteristik individu diukur menggunakan koefisien korelasi non-parametrik.

Mulai adalah tata cara penataan objek kajian, yang dilakukan berdasarkan kesukaan.

Pangkat- ini adalah nomor urut nilai karakteristik, disusun dalam urutan nilainya menaik atau menurun. Jika nilai karakteristiknya sama hitungan, maka pangkat semua nilai ini dianggap sama dengan rata-rata aritmatika dari bilangan tempat yang sesuai yang ditentukannya. Peringkat ini disebut terhubung.

Diantara metode nonparametrik untuk memperkirakan kekuatan sambungan nilai tertinggi memiliki koefisien peringkat Korelasi Spearman (p1?/) dan korelasi Kendall (t^). Koefisien ini dapat digunakan untuk mengetahui keeratan hubungan antara kuantitatif dan tanda-tanda kualitatif.

Koefisien korelasi peringkat(Koefisien Spearman) dihitung menggunakan rumus

Di mana (11 - kotak perbedaan peringkat; P - jumlah observasi (jumlah pasangan peringkat).

Koefisien Spearman mengambil nilai berapa pun dalam interval [-1; 1].

Contoh. 11 tentang data pembelian dan penjualan oleh warga wilayah Volga Distrik Federal Mata uang RF melalui organisasi kredit pada tahun 2010, kita akan menentukan hubungan antara karakteristik tersebut dengan menggunakan koefisien Spearman (Tabel 7.14).

Tabel 7.14. Perhitungan koefisien Spearman

Subjek

Membeli mata uang X, juta rubel

Penjualan mata uang kamu, juta rubel

Pangkat

naik pangkat

Perbedaan peringkat kuadrat

$

KE

Ry

1. Republik Bashkortostan

2. Republik Mari El

3. Republik Mordovia

4. Republik Tatarstan

5. Republik Udmurt

6. Chuvash

Republik

7. Wilayah Perm

8. Wilayah Kirov

9. Wilayah Nizhny Novgorod

10. Wilayah Orenburg

11. Wilayah Penza

12. Wilayah Samara

13. Wilayah Saratov

14. Wilayah Ulyanovsk

Mari kita hitung koefisien korelasi peringkat Spearman:

Sebagai hasil perhitungan, kami menentukan bahwa hubungan antara pembelian dan penjualan mata uang oleh warga entitas konstituen Distrik Federal Volga Federasi Rusia melalui lembaga kredit pada tahun 2010 kuat, mendekati fungsional.

Koefisien korelasi peringkat Kendall juga digunakan untuk mengukur tingkat kekencangan dan arah hubungan antara kualitatif dan karakteristik kuantitatif, mengkarakterisasi objek yang homogen dan diberi peringkat menurut prinsip yang sama. Koefisien peringkat Kendall dihitung menggunakan rumus

dimana 5 adalah jumlah selisih jumlah barisan dan jumlah inversi menurut sifat kedua; P - sejumlah observasi.

Perhitungan koefisien yang diberikan dilakukan dalam urutan ini.

  • 1. Nilai X diurutkan dalam urutan menaik atau menurun.
  • 2. Nilai pada disusun sesuai dengan nilainya X.
  • 3. Untuk setiap peringkat pada ditentukan banyaknya nilai pangkat yang mengikutinya dan melebihi nilainya. Jadi, dengan menjumlahkan angka, nilainya ditentukan R sebagai ukuran korespondensi antara barisan rangking xx dan kamu, yang diperhitungkan dengan tanda "+".
  • 4. Untuk setiap peringkat pada banyaknya nilai pangkat yang mengikutinya dan lebih kecil dari nilainya yang ditentukan. Nilai total dilambangkan dengan (2 dan diberi tanda “-”.
  • 5. Jumlah poin untuk semua anggota seri ditentukan.

Hubungan antar karakteristik dianggap signifikan secara statistik jika koefisien korelasi peringkat Spearman dan Kendall lebih besar dari 0,5.

Menurut tabel. 7.14 diperoleh hasil yang disajikan pada tabel. 7.15.

Dengan demikian, koefisien korelasi peringkat Kendall akan menjadi

Tabel 7.15.

yang juga menunjukkan hubungan yang kuat antara pembelian dan penjualan mata uang oleh warga entitas konstituen Distrik Federal Volga Federasi Rusia melalui lembaga kredit pada tahun 2009.

Koefisien korelasi peringkat ganda (koefisien konkordansi) digunakan untuk menentukan kedekatan hubungan antara sejumlah fitur peringkat yang berubah-ubah. Itu dihitung menggunakan rumus

dimana 5 adalah deviasi jumlah kuadrat pangkat dari rata-rata kuadrat pangkat; T - sejumlah faktor; P - jumlah pengamatan.

Contoh. Mari kita tentukan tingkat kedekatan hubungan antara indikator dasar perdagangan teknologi dengan negara-negara CIS pada tahun 2010 seperti jumlah perjanjian ekspor, biaya pokok perjanjian dan aliran dana (Tabel 7.16).

Tabel 7.16. Perhitungan koefisien konkordansi

Negara

Jumlah perjanjian

X

Biaya pokok perjanjian kamu, juta dolar

Penerimaan dana untuk tahun ini, juta dolar.

KE

Jumlah baris

Kuadrat dari jumlah tersebut

1. Azerbaijan

2. Armenia

3. Belarusia

4. Kazakstan

5. Kirgistan

6. Republik Moldova

Koefisien keeratan hubungan antar ciri yang telah dibahas pada bagian sebelumnya dapat digunakan jika ciri yang diteliti bersifat kuantitatif. Dalam hal ini digunakan perhitungan parameter distribusi utama (nilai rata-rata, varians), yaitu. metode parametrik.

Dalam praktik statistik dalam mempelajari fenomena dan proses sosio-ekonomi, kita harus menghadapi masalah dalam mengukur hubungan antara karakteristik kualitatif, yang mana metode analisis parametrik dalam bentuk biasanya tidak dapat diterapkan. Dalam hal ini, gunakan apa yang disebut metode nonparametrik.

Dalam analisis fenomena sosial ekonomi, koefisien korelasi rangking (rank revolution coefisien) banyak digunakan bila nilai x dan tidak langsung kamu, dan mereka peringkat, itu. jumlah tempatnya yang ditempati di setiap baris nilai dalam urutan menaik atau menurun. Koefisien nonparametrik tersebut meliputi Koefisien peringkat Spearman Dan Kendall.

Jika P Pilihan-pilihan dalam deret tersebut disusun menurut kenaikan atau penurunan sifat x, kemudian benda-benda tersebut dikatakan diurutkan menurut sifat tersebut. Peringkat x menunjukkan tempat yang ditempatinya yaitu nilai atribut antara lain P nilai atribut x (/ = 1,2,___, P).

Misalnya, saat meneliti suatu pasar, Anda dapat menetapkan tujuan untuk mengetahui preferensi konsumen saat memilih suatu produk (saat membeli saham, es krim, mobil, dll) sedemikian rupa sehingga mereka mendistribusikan produk secara menaik ( atau menurun) urutan preferensi konsumennya. Jika ada dua kumpulan data yang diperingkat, maka Anda dapat mengatur derajatnya ketergantungan linier diantara mereka.

Contoh 6.7. Misalkan ada 5 produk (Tabel 6.7), yang diberi peringkat berdasarkan preferensi dari 1 sampai 5 sesuai dengan dua karakteristik Ah V.

Peringkat asli

Tabel 6.7

Penting untuk menyelidiki kedekatan hubungan statistik antar karakteristik.

Larutan. Penggunaan koefisien Pearson untuk menentukan intensitas hubungan antar karakteristik adalah salah, karena koefisien ini digunakan untuk karakteristik yang diukur secara kuantitatif. Jadi, misalnya, ketika menentukan hubungan antara tinggi dan berat badan, kita mengukur tinggi badan dalam sentimeter dan berat badan dalam kilogram, sementara pada skala pengukuran dimungkinkan untuk menentukan secara akurat perbedaan nilai karakteristik ini untuk setiap orang (dalam dengan kata lain, jarak antara keduanya pada skala pengukuran). Mari kita ambil karakteristik yang diukur pada skala peringkat - nilai ujian. Apakah ini berarti siswa yang mendapat nilai D mempunyai pengetahuan setengah dari siswa yang mendapat nilai B? Atau apakah dua siswa yang mendapat nilai C memiliki tingkat pengetahuan yang sama persis? Jawabannya tidak, guru mengorganisasikan tingkat pengetahuannya ke dalam urutan tertentu, sesuai dengan kriteria penilaian pengetahuan dalam subjek tertentu, tetapi jarak antara nilai fitur pada skala seperti itu tidak tetap.

Untuk mengetahui ada tidaknya hubungan antar skor rangking digunakan Koefisien korelasi peringkat Spearman. Perhitungannya didasarkan pada perbedaan antar peringkat.

Mari kita tunjukkan perbedaan peringkatnya d = pangkat SEBUAH~ pangkat DI DALAM.

Koefisien Spearman

Di mana P- jumlah pasangan observasi yang diperingkat.

DI DALAM Misalnya, kita mempunyai lima pasang rangking, oleh karena itu, P- 5. Jumlah ct sama dengan

Kemudian koefisien Spearman

Koefisien Spearman bervariasi pada interval [-1; 1] dan ditafsirkan dengan cara yang sama seperti koefisien Pearson. Bedanya, dihitung berdasarkan data yang diperingkat.

Nilai 0,6 memungkinkan kita menyimpulkan bahwa ada yang nyata koneksi linier antara dua karakteristik barang.

Signifikansi koefisien Spearman diperiksa berdasarkan T Uji t siswa menggunakan rumus

Nilai koefisien dianggap signifikan jika T calc > > 6fit;a (dan - 2) untuk tingkat signifikansi tertentu a.

Koefisien korelasi peringkat (asalkan peringkatnya tidak berulang) juga dapat dihitung dengan menggunakan rumus yang diusulkan ahli statistik Inggris M.Kendall:


Di mana S- perbedaan peringkat yang sebenarnya; ~n(n- l) - jumlah peringkat maksimum.

Koefisien ini bervariasi dalam kisaran [-1; 1] dan ditafsirkan dengan cara yang sama seperti koefisien Pearson, tetapi memberikan penjelasan yang lebih ketat

penilaian hubungan dibandingkan koefisien Spearman, dan p = - m Hubungan ini terpenuhi bila jumlah besar observasi (n> 30), dan koneksi yang lemah atau cukup dekat.

Saat menghitung koefisien Kendall, urutan tindakan berikut diperhatikan:

  • 1. Nilai x diurutkan dalam urutan menaik.
  • 2. Nilai pada disusun sesuai dengan nilainya X.
  • 3. Untuk setiap pangkat y ditentukan banyaknya nilai pangkat yang mengikutinya dan melebihi nilainya. Hasilnya ditulis pada kolom “+”.
  • 4. Untuk setiap peringkat pada jumlah nilai peringkat yang lebih kecil yang mengikutinya ditentukan. Hasilnya ditulis pada kolom “-”.
  • 5. Jumlahnya terletak di kolom “+” dan ditentukan R, di kolom “-” dan ditunjuk Q. Bertekad S = PQ.

Signifikansi koefisien korelasi peringkat Kendall diperiksa dengan menggunakan rumus


Di mana sch_ a/2 (hal- 2) - kuantil ditentukan dari tabel distribusi normal untuk tingkat signifikansi yang dipilih a dan a tertentu P.

Contoh 6.8. Mari kita hitung koefisien Kendall berdasarkan data pada Contoh 6.7.

Larutan. Mari kita lakukan perhitungan yang diperlukan di meja 6.8.

Memang, jika nilai m yang diperoleh dikalikan dengan 1,5, kita memperoleh 0,6 - nilai koefisien Spearman yang dihitung pada contoh 6.7.

Tabel perhitungan

Mari kita perhatikan korelasi fitur alternatif, yaitu fitur yang hanya membutuhkan dua fitur nilai yang mungkin. Studi tentang korelasinya didasarkan pada indikator yang dibangun di atas tabel empat sel, yang merangkum jumlah unitnya menetapkan nilai tanda-tanda:

Larutan. Untuk mengukur keeratan hubungan antar karakteristik, koefisien kontingen dihitung dengan menggunakan rumus

Koefisien kontingen mengambil nilai pada interval [-1; 1 ]. Interpretasinya mirip dengan koefisien korelasi. Kami mendapat koneksi negatif yang lemah.

Metode lain untuk mengukur asosiasi didasarkan pada penghitungan koefisien asosiasi:

„ aku 30x5-20x15 aku „

Kita mendapatkan: Q =-= -0,33

Tanda minus di depan koefisien menunjukkan bahwa semakin banyak siswa yang menerima vaksinasi influenza, maka semakin rendah angka kejadiannya.

Selalu ada faktor kontingen kurang dari koefisien asosiasi dan memberikan penilaian yang lebih tepat terhadap kedekatan koneksi.

Untuk menilai keeratan hubungan antar karakteristik yang mengambil sejumlah nilai varian (karakteristik kategoris, nominal), digunakan koefisien kontingensi timbal balik Pearson. Dasar untuk mempelajari hubungan antara karakteristik kategoris adalah tabel kontingensi - distribusi bivariat satuan populasi menurut ciri-cirinya. Semua informasi tentang ada tidaknya koneksi terkandung dalam frekuensi gabungan dari kombinasi fitur.

Informasi untuk menilai hubungan ini dikelompokkan dalam bentuk tabel (misalnya, untuk tiga nilai karakteristik pertama dan dua nilai kedua), tabel. 6.10.

Tabel 6.10

Contoh tabel kontingensi

Tanda

Total

bgpc

bjgpc

Sebutan: itu- frekuensi kombinasi timbal balik dari dua karakteristik atribut; P = Ya ampun- jumlah pengamatan.

Koefisien lintas kontingensi Pearson ditentukan oleh rumus

dimana cf adalah indeks konjugasi kuadrat rata-rata:

Koefisien kontingensi timbal balik mengambil nilai dalam interval dan diinterpretasikan serupa dengan koefisien pasangan korelasi linier Pearson.

Contoh 6.10. Untuk mempelajari pengaruh kondisi kerja terhadap hubungan dalam tim, dilakukan survei sampel terhadap 250 karyawan perusahaan, yang jawabannya didistribusikan seperti yang disajikan pada tabel. 6.11.

Tabel 6.11

Data awal tentang kondisi kerja dan hubungan dalam tim

Diperlukan untuk mengkarakterisasi hubungan antara indikator-indikator yang diteliti dengan menggunakan koefisien kontingensi timbal balik Pearson.

Larutan.

Nilai koefisien kontingensi yang diperoleh menunjukkan bahwa hubungan antara kondisi kerja dengan hubungan dalam tim adalah sedang.