Kriteria kesesuaian dalam teknologi inovasi statistik. Tes kesesuaian Pearson

Pada bagian ini, kami akan mempertimbangkan salah satu masalah yang terkait dengan pengujian kemungkinan hipotesis, yaitu masalah konsistensi antara distribusi teoritis dan statistik.

Asumsikan bahwa distribusi statistik yang diberikan diratakan oleh beberapa kurva teoritis f(x)(Gbr. 7.6.1). Tidak peduli seberapa baik kurva teoretis dipilih, beberapa perbedaan tidak dapat dihindari antara itu dan distribusi statistik. Pertanyaan yang muncul secara alami: apakah perbedaan ini hanya disebabkan oleh keadaan acak yang terkait dengan sejumlah pengamatan yang terbatas, atau apakah perbedaan tersebut signifikan dan terkait dengan fakta bahwa kurva yang kita pilih tidak menyamakan distribusi statistik ini dengan tepat. Untuk menjawab pertanyaan ini, apa yang disebut "kriteria persetujuan" digunakan.

HUKUM DISTRIBUSI VARIABEL RANDOM



Gagasan di balik penerapan kriteria kecocokan adalah sebagai berikut.

Berdasarkan materi statistik ini, kita harus menguji hipotesis H, terdiri dari fakta bahwa variabel acak X mematuhi beberapa hukum distribusi yang pasti. Hukum ini dapat diberikan dalam satu atau lain bentuk: misalnya, dalam bentuk fungsi distribusi F(x) atau dalam bentuk densitas distribusi f(x), atau dalam bentuk serangkaian probabilitas hal, di mana titik- probabilitas bahwa nilai X akan jatuh dalam aku sesuatu memulangkan.

Karena dari bentuk-bentuk ini fungsi distribusi F(x) adalah yang paling umum dan menentukan yang lain, kami akan merumuskan hipotesis H, sebagai terdiri dari fakta bahwa nilai X memiliki fungsi distribusi ^(d :).

Untuk menerima atau menolak hipotesis H, pertimbangkan beberapa kuantitas kamu, mencirikan tingkat perbedaan antara distribusi teoritis dan statistik. Nilai kamu dapat dipilih dengan berbagai cara; misalnya sebagai kamu seseorang dapat mengambil jumlah deviasi kuadrat dari probabilitas teoretis titik dari frekuensi yang sesuai R* atau jumlah kuadrat yang sama dengan beberapa koefisien ("bobot"), atau deviasi maksimum dari fungsi distribusi statistik F*(x) dari teori F(x) dll. Mari kita asumsikan bahwa kuantitas kamu dipilih dalam satu atau lain cara. Jelas, ada beberapa nilai acak. Hukum distribusi variabel acak ini tergantung pada hukum distribusi variabel acak x, di mana percobaan dilakukan, dan dari jumlah percobaan P. Jika hipotesis H benar, maka hukum distribusi kuantitas kamu ditentukan oleh hukum distribusi kuantitas X(fungsi F(x)) dan nomor P.

Mari kita asumsikan bahwa hukum distribusi ini diketahui oleh kita. Sebagai hasil dari rangkaian percobaan ini, ditemukan bahwa ukuran yang telah kita pilih



KRITERIA PERSETUJUAN


perbedaan kamu mengambil beberapa nilai sebuah. Pertanyaannya adalah apakah ini dapat dijelaskan oleh penyebab acak, atau apakah perbedaan ini terlalu besar dan menunjukkan adanya perbedaan yang signifikan antara distribusi teoritis dan statistik dan, oleh karena itu, ketidaksesuaian hipotesis H? Untuk menjawab pertanyaan ini, anggaplah hipotesis H benar, dan di bawah asumsi ini kami menghitung probabilitas bahwa, karena penyebab acak yang terkait dengan jumlah bahan eksperimen yang tidak mencukupi, ukuran perbedaan kamu tidak akan kurang dari nilai yang kami amati dalam percobaan dan, yaitu, kami menghitung probabilitas suatu peristiwa:

Jika probabilitas ini sangat kecil, maka hipotesis H harus ditolak karena tidak terlalu masuk akal; jika probabilitas ini signifikan, harus diakui bahwa data eksperimen tidak bertentangan dengan hipotesis N.

Timbul pertanyaan, dengan cara apa ukuran perbedaan £/ harus dipilih? Ternyata untuk beberapa cara memilihnya, hukum distribusi kuantitas kamu memiliki sifat yang sangat sederhana dan, untuk cukup besar P praktis tidak bergantung pada fungsi F(x). Justru ukuran perbedaan seperti itu yang digunakan dalam statistik matematika sebagai kriteria untuk kesepakatan.

Mari kita pertimbangkan salah satu kriteria kesepakatan yang paling umum digunakan - yang disebut "kriteria" pada?" Pearson.

Asumsikan bahwa ada ha percobaan independen, di mana masing-masing variabel acak X mengambil nilai tertentu. Hasil percobaan dirangkum dalam k digit dan disajikan dalam bentuk deret statistik.

Batal(dasar) sebut hipotesis yang diajukan tentang bentuk distribusi yang tidak diketahui, atau tentang parameter distribusi yang diketahui. bersaing (alternatif) disebut hipotesis yang bertentangan dengan nol.

Misalnya, jika hipotesis nol mengasumsikan bahwa variabel acak X didistribusikan menurut hukum , maka hipotesis bersaing dapat terdiri dari asumsi bahwa variabel acak X didistribusikan menurut hukum yang berbeda.

Kriteria statistik(atau sederhananya kriteria) disebut beberapa variabel acak Ke, yang berfungsi untuk menguji hipotesis nol.

Setelah memilih kriteria tertentu, misalnya kriteria , himpunan semua nilai yang mungkin dibagi menjadi dua himpunan bagian yang tidak tumpang tindih: salah satunya berisi nilai kriteria di mana hipotesis nol ditolak, dan yang lainnya - di bawah yang diterima.

Daerah kritis adalah himpunan nilai pengujian yang hipotesis nolnya ditolak. Area penerimaan hipotesis disebut himpunan nilai kriteria di mana hipotesis diterima. titik kritis titik-titik yang memisahkan daerah kritis dari daerah penerimaan hipotesis nol disebut.

Untuk contoh kita, dengan nilai , nilai yang dihitung dari sampel sesuai dengan area penerimaan hipotesis: variabel acak didistribusikan menurut hukum . Jika nilai yang dihitung , maka jatuh ke daerah kritis, yaitu hipotesis tentang distribusi variabel acak menurut hukum ditolak.

Dalam kasus distribusi, daerah kritis ditentukan oleh pertidaksamaan , daerah penerimaan hipotesis nol ditentukan oleh pertidaksamaan .

2.6.3. Kriteria Kebaikan Pearson.

Salah satu tugas zooteknik dan genetika veteriner adalah membiakkan breed dan spesies baru dengan karakteristik yang dibutuhkan. Misalnya, peningkatan kekebalan, ketahanan terhadap penyakit, atau perubahan warna bulu.

Dalam praktiknya, ketika menganalisis hasil, seringkali ternyata hasil aktual kurang lebih sesuai dengan beberapa hukum distribusi teoretis. Ada kebutuhan untuk menilai tingkat kesesuaian antara data aktual (empiris) dan data teoritis (hipotetis). Untuk melakukan ini, ajukan hipotesis nol: populasi yang dihasilkan didistribusikan sesuai dengan hukum "A". Verifikasi hipotesis tentang hukum distribusi yang diusulkan dilakukan dengan menggunakan variabel acak yang dipilih secara khusus - kriteria kecocokan.

Kriteria kesesuaian disebut kriteria untuk menguji hipotesis dugaan hukum distribusi yang tidak diketahui.

Ada beberapa kriteria kesesuaian: Pearson, Kolmogorov, Smirnov, dll. Uji kesesuaian Pearson adalah yang paling umum digunakan.

Pertimbangkan penerapan kriteria Pearson pada contoh pengujian hipotesis hukum normal distribusi populasi umum. Untuk tujuan ini, kami akan membandingkan frekuensi empiris dan teoritis (dihitung dalam kelanjutan distribusi normal).

Biasanya ada beberapa perbedaan antara frekuensi teoritis dan empiris. Sebagai contoh:

Frekuensi empiris 7 15 41 93 113 84 25 13 5

Frekuensi teoritis 5 13 36 89 114 91 29 14 6

Pertimbangkan dua kasus:

Perbedaan antara frekuensi teoritis dan empiris adalah acak (tidak signifikan), yaitu. adalah mungkin untuk membuat proposal tentang distribusi frekuensi empiris menurut hukum normal;

Perbedaan antara frekuensi teoritis dan empiris tidak disengaja (signifikan), yaitu. frekuensi teoritis dihitung berdasarkan hipotesis yang salah tentang distribusi normal dari populasi umum.

Dengan bantuan kriteria kecocokan Pearson, dimungkinkan untuk menentukan secara kebetulan atau tidak perbedaan antara frekuensi teoritis dan empiris, mis. dengan probabilitas kepercayaan yang diberikan untuk menentukan apakah populasi umum terdistribusi menurut hukum normal atau tidak.

Jadi, biarkan distribusi empiris diperoleh untuk sampel berukuran n:

Pilihan……

Frekuensi empiris …….

Mari kita asumsikan bahwa, di bawah asumsi distribusi normal, frekuensi teoritis dihitung. Pada tingkat signifikansi, diperlukan pengujian hipotesis nol: populasi berdistribusi normal.

Sebagai kriteria untuk menguji hipotesis nol, kami mengambil variabel acak

(*)

Nilai ini acak, karena dalam eksperimen yang berbeda dibutuhkan nilai yang berbeda yang sebelumnya tidak diketahui. Jelas bahwa semakin sedikit frekuensi empiris dan teoritis berbeda, semakin kecil nilai kriteria dan, akibatnya, mencirikan sampai batas tertentu kedekatan distribusi empiris dan teoritis.

Terbukti bahwa pada , hukum distribusi variabel acak (*), terlepas dari hukum distribusi mana yang tunduk pada populasi umum, cenderung ke hukum distribusi dengan derajat kebebasan. Oleh karena itu, variabel acak (*) dilambangkan dengan , dan kriteria itu sendiri disebut uji kecocokan “chi-kuadrat”.

Mari kita nyatakan nilai kriteria yang dihitung dari data pengamatan sebagai . Nilai kritis yang ditabulasikan dari kriteria untuk tingkat signifikansi tertentu dan jumlah derajat kebebasan menunjukkan . Dalam hal ini, jumlah derajat kebebasan ditentukan dari persamaan , dimana jumlah kelompok (interval parsial) dari sampel atau kelas; - jumlah parameter distribusi yang diusulkan. Distribusi normal memiliki dua parameter - ekspektasi matematis dan simpangan baku. Oleh karena itu, jumlah derajat kebebasan untuk distribusi normal ditemukan dari persamaan

Jika nilai yang dihitung dan nilai tabel memenuhi pertidaksamaan , hipotesis nol tentang distribusi normal dari populasi umum diterima. Jika , hipotesis nol ditolak dan alternatif hipotesis diterima (populasi umum tidak terdistribusi menurut hukum normal).

Komentar. Saat menggunakan uji kecocokan Pearson, ukuran sampel minimal harus 30. Setiap kelompok harus berisi minimal 5 opsi. Jika ada kurang dari 5 frekuensi dalam grup, mereka digabungkan dengan grup tetangga.

Secara umum, jumlah derajat kebebasan untuk distribusi chi-kuadrat didefinisikan sebagai jumlah total nilai dari mana ukuran yang sesuai dihitung, dikurangi jumlah kondisi yang menghubungkan nilai-nilai ini, mis. mengurangi kemungkinan variasi di antara mereka. Dalam kasus paling sederhana, saat menghitung, jumlah derajat kebebasan akan sama dengan jumlah kelas, dikurangi satu. Jadi, misalnya, dengan pemisahan dihibrida, diperoleh 4 kelas, tetapi hanya kelas pertama yang diperoleh tidak terkait, yang berikutnya sudah terkait dengan yang sebelumnya. Oleh karena itu, untuk pemisahan dihibrida, jumlah derajat kebebasannya adalah .

Contoh 1 Tentukan derajat kesesuaian antara distribusi aktual kelompok dalam hal jumlah sapi dengan tuberkulosis dan yang diharapkan secara teoritis, yang dihitung dengan mempertimbangkan distribusi normal. Data awal dirangkum dalam tabel:

Larutan.

Dengan tingkat signifikansi dan jumlah derajat kebebasan dari tabel titik distribusi kritis (lihat Lampiran 4), kami menemukan nilai . Karena , kita dapat menyimpulkan bahwa perbedaan antara frekuensi teoretis dan aktual adalah acak. Dengan demikian, sebenarnya sebaran kelompok menurut jumlah sapi penderita tuberkulosis sesuai dengan yang diharapkan secara teoritis.

Contoh 2 Distribusi teoritis berdasarkan fenotipe individu yang diperoleh pada generasi kedua dengan persilangan dihibrid kelinci menurut hukum Mendel adalah 9:3:3:1. Diperlukan untuk menghitung korespondensi distribusi empiris kelinci dari persilangan individu hitam dengan rambut normal dengan hewan berbulu halus - albino. Saat persilangan pada generasi kedua diperoleh 120 keturunan, antara lain 45 hitam berbulu pendek, 30 berbulu hitam, 25 putih berbulu pendek, 20 kelinci berbulu putih.

Larutan. Segregasi yang diharapkan secara teoritis pada keturunannya harus sesuai dengan rasio empat fenotipe (9:3:3:1). Hitung frekuensi teoritis (jumlah gol) untuk setiap kelas:

9+3+3+1=16, jadi kita bisa mengharapkan shorthair hitam menjadi ; bulu hitam - ; rambut pendek putih ; berbulu putih -.

Distribusi fenotip empiris (aktual) adalah sebagai berikut 45; tigapuluh; 25; dua puluh.

Mari kita rangkum semua data ini dalam tabel berikut:

Dengan menggunakan uji kecocokan Pearson, kami menghitung nilai dari :

Banyaknya derajat kebebasan pada persilangan dihibrida. Untuk tingkat signifikansi temukan nilai . Karena , kita dapat menyimpulkan bahwa perbedaan antara frekuensi teoretis dan aktual bukanlah kebetulan. Akibatnya, kelompok kelinci yang dihasilkan menyimpang dalam hal distribusi fenotipe dari hukum Mendel selama persilangan dihibrida dan mencerminkan pengaruh faktor-faktor tertentu yang mengubah jenis pemisahan fenotipe pada generasi kedua hibrida.

Uji kecocokan chi-kuadrat Pearson juga dapat digunakan untuk membandingkan dua distribusi empiris yang homogen satu sama lain, yaitu yang memiliki batas kelas yang sama. Hipotesis nol adalah hipotesis bahwa dua fungsi distribusi yang tidak diketahui adalah sama. Tes chi-kuadrat dalam kasus seperti itu ditentukan oleh rumus

(**)

di mana dan adalah volume dari distribusi yang dibandingkan; dan merupakan frekuensi dari kelas-kelas yang bersesuaian.

Pertimbangkan perbandingan dua distribusi empiris menggunakan contoh berikut.

Contoh 3 Panjang telur cuckoo diukur di dua zona teritorial. Di zona pertama, sampel 76 telur () diperiksa, di zona kedua 54 (). Hasil berikut diperoleh:

Panjang (mm)
frekuensi
frekuensi - - -

Pada tingkat signifikansi, diperlukan pengujian hipotesis nol bahwa kedua sampel telur termasuk dalam populasi kukuk yang sama.

pengantar

Relevansi topik ini adalah bahwa selama mempelajari dasar-dasar biostatistik, kami berasumsi bahwa hukum distribusi populasi umum diketahui. Tetapi bagaimana jika hukum distribusi tidak diketahui, tetapi ada alasan untuk mengasumsikan bahwa ia memiliki bentuk tertentu (sebut saja A), maka hipotesis nol diperiksa: populasi umum didistribusikan menurut hukum A. Hipotesis ini diuji menggunakan variabel acak yang dipilih secara khusus - kriteria persetujuan.

Uji kesesuaian adalah kriteria untuk menguji hipotesis tentang korespondensi distribusi empiris dengan distribusi probabilitas teoretis. Kriteria ini terbagi dalam dua kategori:

  • III Kriteria kecocokan umum berlaku untuk perumusan hipotesis yang paling umum, yaitu hipotesis bahwa hasil yang diamati sesuai dengan distribusi probabilitas yang diasumsikan secara apriori.
  • III Uji kecocokan khusus menyiratkan hipotesis nol khusus yang merumuskan kesepakatan dengan bentuk distribusi probabilitas tertentu.

Kriteria Kebaikan

Tes kesesuaian yang paling umum adalah omega-kuadrat, chi-kuadrat, Kolmogorov dan Kolmogorov-Smirnov.

Tes persetujuan non-parametrik Kolmogorov, Smirnov, omega square banyak digunakan. Namun, mereka juga terkait dengan kesalahan yang meluas dalam penerapan metode statistik.

Faktanya adalah bahwa kriteria yang terdaftar dikembangkan untuk menguji kesepakatan dengan distribusi teoretis yang diketahui sepenuhnya. Rumus perhitungan, tabel distribusi, dan nilai kritis banyak digunakan. Ide utama dari Kolmogorov, omega square dan kriteria serupa adalah untuk mengukur jarak antara fungsi distribusi empiris dan fungsi distribusi teoritis. Kriteria ini berbeda dalam bentuk jarak dalam ruang fungsi distribusi.

Uji kesesuaian p2 Pearson untuk hipotesis sederhana

Teorema K. Pearson mengacu pada percobaan independen dengan jumlah hasil yang terbatas, yaitu untuk percobaan Bernoulli (dalam arti agak diperpanjang). Hal ini memungkinkan seseorang untuk menilai apakah pengamatan dalam sejumlah besar percobaan frekuensi hasil ini konsisten dengan probabilitas yang diperkirakan.

Dalam banyak masalah praktis, hukum distribusi yang tepat tidak diketahui. Oleh karena itu, hipotesis diajukan tentang korespondensi hukum empiris yang ada, dibangun atas dasar pengamatan, dengan beberapa teori. Hipotesis ini memerlukan pengujian statistik, yang hasilnya akan dikonfirmasi atau disangkal.

Biarkan X menjadi variabel acak yang diteliti. Diperlukan untuk menguji hipotesis H0 bahwa variabel acak ini mematuhi hukum distribusi F(x). Untuk melakukan ini, perlu membuat sampel n pengamatan independen dan membangun hukum distribusi empiris F "(x) darinya. Untuk membandingkan hukum empiris dan hipotetis, digunakan aturan yang disebut kebaikan kecocokan. yang paling populer adalah kecocokan chi-kuadrat K. Pearson.Di dalamnya statistik chi-kuadrat dihitung:

di mana N adalah jumlah interval yang dengannya hukum distribusi empiris dibangun (jumlah kolom histogram yang sesuai), i adalah jumlah interval, pt i adalah probabilitas bahwa nilai variabel acak akan jatuh ke interval ke-i untuk hukum distribusi teoritis, pe i adalah probabilitas bahwa nilai variabel acak akan jatuh ke dalam interval ke-i untuk hukum distribusi empiris. Itu harus mematuhi distribusi chi-kuadrat.

Jika nilai statistik yang dihitung melebihi kuantil distribusi chi-kuadrat dengan derajat kebebasan k-p-1 untuk tingkat signifikansi tertentu, maka hipotesis H0 ditolak. Jika tidak, itu diterima pada tingkat signifikansi yang diberikan. Di sini k adalah jumlah pengamatan, p adalah jumlah parameter yang diperkirakan dari hukum distribusi.

Mari kita lihat statistiknya:

Statistik p2 disebut statistik chi-kuadrat Pearson untuk hipotesis sederhana.

Jelas bahwa p2 adalah kuadrat jarak antara dua vektor dimensi-r: vektor frekuensi relatif (mi /n, …, mr /n) dan vektor probabilitas (pi , …, pr). Jarak ini berbeda dari jarak Euclidean hanya dalam koordinat yang berbeda memasukkannya dengan bobot yang berbeda.

Mari kita bahas perilaku statistik h2 dalam kasus ketika hipotesis H benar dan dalam kasus ketika H salah. Jika H benar, maka perilaku asimtotik ch2 untuk n > ? menunjukkan teorema K. Pearson. Untuk memahami apa yang terjadi pada (2.2) jika H salah, perhatikan bahwa, menurut hukum bilangan besar, mi /n > pi untuk n > ?, untuk i = 1, …, r. Oleh karena itu, untuk n > ?:

Nilai ini sama dengan 0. Oleh karena itu, jika H salah, maka h2 >? (ketika n > ?).

Ini mengikuti dari apa yang telah dikatakan bahwa H harus ditolak jika nilai h2 yang diperoleh dalam percobaan terlalu besar. Di sini, seperti biasa, kata "terlalu besar" berarti bahwa nilai pengamatan n2 melebihi nilai kritis, yang dalam hal ini dapat diambil dari tabel distribusi chi-kuadrat. Dengan kata lain, probabilitas P(p2 npi p2) adalah nilai kecil dan, oleh karena itu, tidak mungkin secara tidak sengaja mendapatkan yang sama seperti dalam percobaan, atau perbedaan yang lebih besar antara vektor frekuensi dan vektor probabilitas.

Sifat asimtotik dari teorema K. Pearson, yang mendasari aturan ini, membutuhkan kehati-hatian dalam penggunaan praktisnya. Itu hanya bisa diandalkan untuk n besar. Untuk menilai apakah n cukup besar, perlu diperhitungkan probabilitas pi , …, pr . Oleh karena itu, tidak dapat dikatakan, misalnya, bahwa seratus pengamatan akan cukup, karena tidak hanya n harus besar, tetapi juga produk npi , …, npr (frekuensi yang diharapkan) juga tidak boleh kecil. Oleh karena itu, masalah pendekatan ch2 (distribusi kontinu) ke statistik ch2, yang distribusinya diskrit, ternyata sulit. Kombinasi argumen teoretis dan eksperimental mengarah pada keyakinan bahwa pendekatan ini berlaku jika semua frekuensi yang diharapkan adalah npi>10. jika jumlah r (jumlah hasil yang berbeda) meningkat, batas untuk diturunkan (menjadi 5 atau bahkan menjadi 3 jika r berada pada urutan beberapa puluhan). Untuk memenuhi persyaratan ini, dalam praktiknya terkadang perlu menggabungkan beberapa hasil, yaitu. pergi ke skema Bernoulli dengan r yang lebih kecil.

Metode yang dijelaskan untuk memeriksa persetujuan dapat diterapkan tidak hanya untuk tes Bernoulli, tetapi juga untuk sampel acak. Pengamatan mereka pertama-tama harus diubah menjadi tes Bernoulli dengan mengelompokkan. Mereka melakukannya dengan cara ini: ruang observasi dibagi menjadi sejumlah wilayah yang tidak tumpang tindih, dan kemudian frekuensi yang diamati dan probabilitas hipotetis dihitung untuk setiap wilayah.

Dalam hal ini, untuk kesulitan perkiraan yang terdaftar sebelumnya, satu lagi ditambahkan - pilihan partisi yang masuk akal dari ruang asli. Pada saat yang sama, harus diperhatikan bahwa, secara umum, aturan untuk menguji hipotesis tentang distribusi awal sampel cukup sensitif terhadap kemungkinan alternatif. Akhirnya, saya perhatikan bahwa kriteria statistik berdasarkan pengurangan skema Bernoulli, sebagai suatu peraturan, tidak berlaku terhadap semua alternatif. Jadi metode verifikasi persetujuan ini nilainya terbatas.

Uji kesesuaian Kolmogorov-Smirnov dalam bentuk klasiknya lebih kuat daripada uji h2 dan dapat digunakan untuk menguji hipotesis bahwa distribusi empiris sesuai dengan distribusi kontinu teoretis F(x) dengan parameter yang diketahui. Keadaan terakhir memberlakukan pembatasan pada kemungkinan penerapan praktis yang luas dari kriteria ini dalam analisis hasil pengujian mekanis, karena parameter fungsi distribusi karakteristik sifat mekanik, sebagai suatu peraturan, diperkirakan dari data sampel itu sendiri.

Kriteria Kolmogorov-Smirnov digunakan untuk data yang tidak dikelompokkan atau untuk data yang dikelompokkan dalam kasus lebar interval kecil (misalnya, sama dengan pembagian skala pengukur gaya, penghitung siklus beban, dll.). Misalkan hasil pengujian deret n sampel merupakan deret variasi sifat sifat mekanik

x1? x2? ... ? xi? ... ? xn. (3.93)

Hipotesis nol diperlukan untuk menguji bahwa distribusi sampel (3.93) termasuk dalam hukum teoretis F(x).

Kriteria Kolmogorov-Smirnov didasarkan pada distribusi deviasi maksimum dari akumulasi tertentu dari nilai fungsi distribusi. Saat menggunakannya, statistik dihitung

yang merupakan statistik dari uji Kolmogorov. Jika pertidaksamaan

Dnvn? dahi (3.97)

untuk ukuran sampel besar (n > 35) atau

Dn(vn + 0,12 + 0,11/vn) ? dahi (3,98)

untuk n? 35, hipotesis nol tidak ditolak.

Jika pertidaksamaan (3,97) dan (3,98) tidak terpenuhi, maka hipotesis alternatif diterima bahwa sampel (3,93) termasuk dalam distribusi yang tidak diketahui.

Nilai kritis lb adalah: 0.1 = 1.22; 10,05 = 1,36; l0,01 = 1,63.

Jika parameter fungsi F(x) tidak diketahui sebelumnya, tetapi diperkirakan dari data sampel, kriteria Kolmogorov-Smirnov kehilangan universalitasnya dan hanya dapat digunakan untuk memeriksa kesesuaian data eksperimen dengan hanya beberapa distribusi tertentu. fungsi.

Ketika digunakan sebagai hipotesis nol, apakah data eksperimen termasuk dalam distribusi normal atau log-normal, statistik dihitung:

di mana (zi) adalah nilai fungsi Laplace untuk

(zi) = (xi - xср)/s Kriteria Kolmogorov-Smirnov untuk setiap ukuran sampel n ditulis sebagai

Nilai kritis lb dalam hal ini adalah: 0.1 = 0.82; 10,05 = 0,89; l0,01 = 1,04.

Jika hipotesis diperiksa tentang kepatuhan sampel dengan distribusi eksponensial ***, yang parameternya diperkirakan dari data eksperimental, statistik serupa dihitung:

kriteria probabilitas empiris

dan membuat kriteria Kolmogorov-Smirnov.

Nilai kritis lb untuk kasus ini adalah: 0.1 = 0.99; 10,05 = 1,09; l0,01 = 1,31.

Untuk menguji hipotesis tentang korespondensi distribusi empiris dengan hukum teoretis distribusi, indikator statistik khusus digunakan - kriteria kecocokan (atau kriteria kepatuhan). Ini termasuk kriteria Pearson, Kolmogorov, Romanovsky, Yastremsky, dll. Sebagian besar kriteria goodness of fit didasarkan pada penggunaan penyimpangan frekuensi empiris dari frekuensi teoritis. Jelas, semakin kecil penyimpangan ini, semakin baik distribusi teoritis cocok (atau menggambarkan) yang empiris.

Kriteria Persetujuan- ini adalah kriteria untuk menguji hipotesis tentang korespondensi distribusi empiris dengan distribusi probabilitas teoritis. Kriteria tersebut dibagi menjadi dua kelas: umum dan khusus. Kriteria kecocokan umum berlaku untuk perumusan hipotesis yang paling umum, yaitu hipotesis bahwa hasil yang diamati sesuai dengan distribusi probabilitas yang diasumsikan secara apriori. Uji kecocokan khusus menyiratkan hipotesis nol khusus yang merumuskan kesepakatan dengan bentuk distribusi probabilitas tertentu.

Kriteria kesepakatan, berdasarkan hukum distribusi yang ditetapkan, memungkinkan untuk menetapkan kapan perbedaan antara frekuensi teoretis dan empiris harus diakui sebagai tidak signifikan (acak), dan kapan - signifikan (non-acak). Dari sini dapat disimpulkan bahwa kriteria kecocokan memungkinkan untuk menolak atau mengkonfirmasi kebenaran hipotesis yang diajukan ketika menyamakan deret tentang sifat distribusi dalam deret empiris dan untuk menjawab apakah mungkin untuk menerima suatu model yang diungkapkan oleh beberapa hukum distribusi teoretis untuk distribusi empiris yang diberikan.

Tes kesesuaian Pearson c 2 (chi-kuadrat) adalah salah satu kriteria kesesuaian utama. Diusulkan oleh ahli matematika Inggris Karl Pearson (1857-1936) untuk menilai keacakan (signifikansi) perbedaan antara frekuensi distribusi empiris dan teoritis:

Skema penerapan kriteria c 2 untuk menilai konsistensi distribusi teoritis dan empiris adalah sebagai berikut:

1. Ukuran perbedaan yang dihitung ditentukan.

2. Jumlah derajat kebebasan ditentukan.

3. Jumlah derajat kebebasan n ditentukan dengan menggunakan tabel khusus.

4. Jika , maka untuk tingkat signifikansi tertentu dan jumlah derajat kebebasan n, hipotesis perbedaan tidak signifikan (acak) ditolak. Jika tidak, hipotesis dapat diakui sebagai tidak bertentangan dengan data eksperimen yang diperoleh, dan dengan probabilitas (1 – ) dapat dikatakan bahwa perbedaan antara frekuensi teoritis dan empiris adalah acak.

Tingkat signifikansi adalah probabilitas penolakan yang salah dari hipotesis yang diajukan, mis. probabilitas bahwa hipotesis yang benar akan ditolak. Dalam studi statistik, tergantung pada kepentingan dan tanggung jawab tugas yang diselesaikan, tiga tingkat signifikansi berikut digunakan:

1) a = 0,1, maka R = 0,9;

2) a = 0,05, maka R = 0,95;

3) a = 0,01, maka R = 0,99.

Dengan menggunakan kriteria kecocokan c 2 , kondisi berikut harus diperhatikan:

1. Volume populasi yang diteliti harus cukup besar ( N 50), sedangkan frekuensi atau ukuran grup minimal 5. Jika kondisi ini dilanggar, maka perlu dilakukan penggabungan terlebih dahulu frekuensi-frekuensi kecil (kurang dari 5).

2. Distribusi empiris harus terdiri dari data yang diperoleh sebagai hasil seleksi acak, yaitu. mereka harus mandiri.

Kerugian dari kriteria kecocokan Pearson adalah hilangnya beberapa informasi awal yang terkait dengan kebutuhan untuk mengelompokkan hasil pengamatan ke dalam interval dan menggabungkan interval individu dengan sejumlah kecil pengamatan. Sehubungan dengan itu, disarankan untuk melengkapi verifikasi korespondensi distribusi menurut kriteria dengan 2 kriteria lainnya. Hal ini terutama diperlukan ketika ukuran sampel relatif kecil ( n ≈ 100).

Dalam statistik Tes kesesuaian Kolmogorov(juga dikenal sebagai uji kesesuaian Kolmogorov-Smirnov) digunakan untuk menentukan apakah dua distribusi empiris mematuhi hukum yang sama, atau untuk menentukan apakah distribusi yang dihasilkan mematuhi model yang diusulkan. Kriteria Kolmogorov didasarkan pada penentuan perbedaan maksimum antara frekuensi akumulasi atau frekuensi distribusi empiris atau teoritis. Kriteria Kolmogorov dihitung menurut rumus berikut:

di mana D dan d- masing-masing, perbedaan maksimum antara frekuensi akumulasi ( ff) dan antara frekuensi yang terakumulasi ( pp) deret distribusi empiris dan teoritis; N- jumlah unit dalam populasi.

Setelah menghitung nilai , tabel khusus menentukan probabilitas yang dengannya dapat dikatakan bahwa penyimpangan frekuensi empiris dari frekuensi teoritis adalah acak. Jika tanda mengambil nilai hingga 0,3, maka ini berarti ada kebetulan frekuensi yang lengkap. Dengan jumlah pengamatan yang banyak, uji Kolmogorov mampu mendeteksi adanya penyimpangan dari hipotesis. Artinya, setiap perbedaan antara distribusi sampel dan distribusi teoritis akan terdeteksi dengan bantuannya jika ada banyak pengamatan. Signifikansi praktis dari properti ini tidak signifikan, karena dalam banyak kasus sulit untuk mengandalkan memperoleh sejumlah besar pengamatan dalam kondisi konstan, gagasan teoritis tentang hukum distribusi yang harus dipatuhi sampel selalu mendekati, dan akurasi pemeriksaan statistik tidak boleh melebihi akurasi model yang dipilih.

Kriteria kesesuaian Romanovsky berdasarkan penggunaan kriteria Pearson, yaitu sudah ditemukan nilai c 2 , dan jumlah derajat kebebasannya:

di mana n adalah jumlah derajat kebebasan variasi.

Kriteria Romanovsky nyaman karena tidak adanya tabel untuk . Jika sebuah< 3, то расхождения распределений случайны, если же >3, maka mereka tidak acak dan distribusi teoritis tidak dapat berfungsi sebagai model untuk distribusi empiris yang diteliti.

B. S. Yastremsky menggunakan kriteria goodness of fit bukan jumlah derajat kebebasan, tetapi jumlah grup ( k), nilai khusus q tergantung pada jumlah grup, dan nilai chi-kuadrat. Kriteria persetujuan Yastremsky memiliki arti yang sama dengan kriteria Romanovsky dan dinyatakan dengan rumus

di mana c 2 - kriteria persetujuan Pearson; - jumlah kelompok; q - koefisien, untuk jumlah grup kurang dari 20 sama dengan 0,6.

Jika sebuah L fakta > 3, perbedaan antara distribusi teoritis dan empiris tidak acak, yaitu distribusi empiris tidak memenuhi persyaratan distribusi normal. Jika sebuah L fakta< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.

Dengan memproses pengukuran independen dari variabel acak , kita dapat membangun fungsi distribusi statistik F*(x). Dengan bentuk fungsi ini, seseorang dapat menerima hipotesis bahwa fungsi distribusi teoretis yang benar adalah F(x). Pengukuran independen itu sendiri (x 1 , x 2 ,…,x n) yang membentuk sampel dapat dianggap sebagai variabel acak terdistribusi identik dengan fungsi distribusi hipotetis F(x).

Jelas, akan ada beberapa perbedaan antara fungsi F * (x) dan F (x). Timbul pertanyaan apakah perbedaan ini merupakan konsekuensi dari ukuran sampel yang terbatas atau terkait dengan fakta bahwa hipotesis kami tidak benar, mis. fungsi distribusi sebenarnya bukan F(x), tetapi beberapa yang lain. Untuk mengatasi masalah ini, digunakan kriteria persetujuan, yang intinya adalah sebagai berikut. Nilai tertentu (F, F *) dipilih, yang mencirikan tingkat perbedaan antara fungsi F * (x) dan F(x). Misalnya, (F, F *)=Sup|F(x)-F * (x)|, mis. batas atas dalam x dari modulus perbedaan.

Dengan asumsi hipotesis benar, mis. mengetahui fungsi distribusi F(x), seseorang dapat menemukan hukum distribusi dari variabel acak (F, F *) (kita tidak akan menyentuh pertanyaan tentang bagaimana melakukan ini). Mari kita atur angka p 0 sangat kecil sehingga realisasi acara (Δ(F, F *)>Δ 0 ) dengan probabilitas ini akan dianggap praktis tidak mungkin. Dari kondisi

cari nilai 0 . Di sini f(x) adalah densitas distribusi (F,F *).

Sekarang mari kita hitung nilai (F, F *)= 1 dari hasil

sampel, yaitu temukan salah satu nilai yang mungkin dari variabel acak (F, F *). Jika 1 0 , maka ini berarti suatu peristiwa yang hampir mustahil telah terjadi. Ini dapat dijelaskan oleh fakta bahwa hipotesis kami tidak benar. Jadi, jika 1 0, maka hipotesis ditolak, dan bila 1<Δ 0 , гипотеза может оказаться неверной, но вероятность этого мала.

Sebagai ukuran perbedaan (F, F *) seseorang dapat mengambil berbagai nilai. Tergantung pada ini, kriteria kesepakatan yang berbeda diperoleh. Misalnya, uji kesesuaian Kolmogorov, Mises, Pearson, atau uji chi-kuadrat.

Biarkan hasil n pengukuran disajikan sebagai deret statistik berkelompok dengan k digit.

DISCHARGE (x 0,x 1) (sebenarnya, kami berasumsi bahwa kesalahan pengukuran didistribusikan secara merata pada segmen tertentu). Maka probabilitas memukul masing-masing dari tujuh digit akan sama dengan . Dengan menggunakan deret yang dikelompokkan dari 11, kita menghitung (F, F *)= 1 =dengan rumus (1). Pada kasus ini .

Karena hukum distribusi hipotetis mencakup dua parameter yang tidak diketahui, dan - awal dan akhir segmen, jumlah derajat kebebasannya adalah 7-1-2=4. Menurut tabel distribusi chi-kuadrat dengan probabilitas yang dipilih p 0 =10 -3 kita menemukan 0 =18. Karena 1 >Δ 0 , maka hipotesis kesalahan pengukuran distribusi seragam harus dibuang.