Cara menentukan tingkat signifikansi dalam uji Pearson. Memecahkan masalah untuk menguji hipotesis statistik

Tujuan kriteria 2 - kriteria Pearson Kriteria 2 digunakan untuk dua tujuan: 1) untuk membandingkan distribusi empiris suatu sifat dengan yang teoretis - seragam, normal atau lainnya; 2) untuk membandingkan dua, tiga atau lebih distribusi empiris dari fitur yang sama. Deskripsi kriteria Kriteria 2 menjawab pertanyaan apakah nilai yang berbeda dari suatu fitur terjadi dengan frekuensi yang sama dalam distribusi empiris dan teoritis atau dalam dua atau lebih distribusi empiris. Keuntungan dari metode ini adalah memungkinkan untuk membandingkan distribusi fitur yang disajikan dalam skala apa pun, mulai dari skala nama. Dalam kasus paling sederhana dari distribusi alternatif "ya - tidak", "menikah - tidak mengizinkan pernikahan", "memecahkan masalah - tidak menyelesaikan masalah", dll., kita sudah dapat menerapkan kriteria 2 . Semakin besar perbedaan antara dua distribusi yang sebanding, semakin besar nilai empiris 2 . Perhitungan otomatis 2 - kriteria Pearson Untuk menghitung 2 - kriteria Pearson secara otomatis, perlu dilakukan dua langkah: Langkah 1. Tentukan jumlah distribusi empiris (dari 1 hingga 10); Langkah 2. Masukkan frekuensi empiris dalam tabel; Langkah 3. Dapatkan jawaban.

Keuntungan dari kriteria Pearson adalah universalitasnya: dapat digunakan untuk menguji hipotesis tentang berbagai hukum distribusi.

1. Pengujian hipotesis distribusi normal.

Biarkan sampel dengan ukuran yang cukup besar diperoleh P dengan banyak nilai varian yang berbeda. Untuk kenyamanan pemrosesannya, kami membagi interval dari nilai varian terkecil hingga terbesar dengan s bagian yang sama dan kami akan menganggap bahwa nilai opsi yang termasuk dalam setiap interval kira-kira sama dengan angka yang menentukan tengah interval. Setelah menghitung jumlah opsi yang masuk ke setiap interval, kami akan membuat apa yang disebut sampel yang dikelompokkan:

pilihan……….. X 1 X 2 … x s

frekuensi…………. P 1 P 2 … n s ,

di mana x saya adalah nilai titik tengah interval, dan dan aku adalah jumlah opsi yang termasuk dalam saya interval ke-th (frekuensi empiris).



Berdasarkan data yang diperoleh, dimungkinkan untuk menghitung rata-rata sampel dan simpangan baku sampel B. Mari kita periksa asumsi bahwa populasi umum terdistribusi menurut hukum normal dengan parameter M(X) = , D(X) = . Kemudian Anda dapat menemukan jumlah angka dari sampel volume P, yang harus di setiap interval di bawah asumsi ini (yaitu, frekuensi teoritis). Untuk melakukan ini, menggunakan tabel nilai fungsi Laplace, kami menemukan probabilitas memukul saya-interval:

,

di mana aku dan b saya- perbatasan saya-interval. Mengalikan probabilitas yang dihasilkan dengan ukuran sampel n, kami menemukan frekuensi teoritis: p i = n p i.Tujuan kami adalah untuk membandingkan frekuensi empiris dan teoritis, yang, tentu saja, berbeda satu sama lain, dan untuk mengetahui apakah perbedaan ini tidak signifikan, tidak menyangkal hipotesis distribusi normal dari variabel acak yang diteliti, atau apakah mereka begitu besar sehingga mereka bertentangan dengan hipotesis ini. Untuk ini, kriteria digunakan dalam bentuk variabel acak

. (20.1)

Maknanya jelas: bagian-bagiannya diringkas, yang merupakan kuadrat dari penyimpangan frekuensi empiris dari frekuensi teoritis dari frekuensi teoretis yang sesuai. Dapat dibuktikan bahwa, terlepas dari hukum distribusi nyata dari populasi umum, hukum distribusi variabel acak (20.1) di cenderung ke hukum distribusi (lihat kuliah 12) dengan jumlah derajat kebebasan k = s - 1 – r, di mana r adalah jumlah parameter estimasi distribusi yang diestimasi dari data sampel. Distribusi normal dicirikan oleh dua parameter, jadi k = s - 3. Untuk kriteria yang dipilih, daerah kritis tangan kanan dibangun, ditentukan oleh kondisi

(20.2)

di mana α - tingkat signifikansi. Oleh karena itu, daerah kritis diberikan oleh pertidaksamaan dan daerah penerimaan hipotesis adalah .

Jadi, untuk menguji hipotesis nol H 0: populasi terdistribusi normal - Anda perlu menghitung nilai kriteria yang diamati dari sampel:

, (20.1`)

dan menurut tabel titik kritis dari distribusi 2 temukan titik kritis menggunakan nilai dan yang diketahui k = s - 3. Jika - hipotesis nol diterima, jika ditolak.

2. Pengujian hipotesis distribusi seragam.

Saat menggunakan uji Pearson untuk menguji hipotesis distribusi seragam dari populasi umum dengan kepadatan probabilitas yang diasumsikan

perlu, setelah menghitung nilai dari sampel yang tersedia, untuk memperkirakan parameter sebuah dan b menurut rumus:

di mana sebuah* dan b*- perkiraan sebuah dan b. Memang, untuk distribusi yang seragam M(X) = , , dari mana Anda bisa mendapatkan sistem untuk menentukan sebuah* dan b*: , yang solusinya adalah ekspresi (20.3).

Kemudian, dengan asumsi bahwa , Anda dapat menemukan frekuensi teoretis menggunakan rumus

Di Sini s adalah jumlah interval di mana sampel dibagi.

Nilai yang diamati dari kriteria Pearson dihitung dengan rumus (20.1`), dan nilai kritis dihitung dari tabel, dengan mempertimbangkan fakta bahwa jumlah derajat kebebasan k = s - 3. Setelah itu, batas-batas daerah kritis ditentukan dengan cara yang sama seperti untuk menguji hipotesis distribusi normal.

3. Menguji hipotesis tentang distribusi eksponensial.

Dalam hal ini, membagi sampel yang ada menjadi interval dengan panjang yang sama, kami mempertimbangkan urutan opsi yang berjarak sama satu sama lain (kami berasumsi bahwa semua opsi yang termasuk dalam saya interval -th, ambil nilai yang bertepatan dengan tengahnya), dan frekuensi yang sesuai dan aku(jumlah opsi sampel termasuk dalam saya– selang waktu). Kami menghitung dari data ini dan mengambil sebagai perkiraan parameter λ nilai . Kemudian frekuensi teoritis dihitung dengan rumus

Kemudian, nilai yang diamati dan kritis dari kriteria Pearson dibandingkan, dengan mempertimbangkan jumlah derajat kebebasan k = s - 2.

Pertimbangkan aplikasinya diNONAUNGGULUji chi-kuadrat Pearson untuk menguji hipotesis sederhana.

Setelah menerima data eksperimen (yaitu ketika ada beberapa Sampel) biasanya hukum distribusi dipilih yang paling menggambarkan variabel acak yang diwakili oleh yang diberikan contoh. Memeriksa seberapa baik data eksperimen dijelaskan oleh hukum distribusi teoretis yang dipilih dilakukan dengan menggunakan kriteria persetujuan. hipotesis nol, biasanya ada hipotesis bahwa distribusi variabel acak sama dengan beberapa hukum teoretis.

Mari kita lihat dulu aplikasinya Uji kesesuaian Pearson X 2 (chi-kuadrat) dalam kaitannya dengan hipotesis sederhana (parameter dari distribusi teoritis diasumsikan diketahui). Kemudian - , ketika hanya bentuk distribusi yang ditentukan, dan parameter dari distribusi ini dan nilainya statistik X 2 diperkirakan/dihitung atas dasar yang sama sampel.

Catatan: Dalam literatur berbahasa Inggris, prosedur aplikasi Tes kesesuaian Pearson X 2 punya nama Uji kesesuaian chi-kuadrat.

Ingat prosedur untuk menguji hipotesis:

  • berdasarkan sampel nilai dihitung statistik, yang sesuai dengan jenis hipotesis yang diuji. Misalnya, menggunakan t-statistik(jika tidak diketahui);
  • tunduk pada kebenaran hipotesis nol, distribusi ini statistik diketahui dan dapat digunakan untuk menghitung probabilitas (misalnya, untuk t- statistik Ini );
  • dihitung berdasarkan sampel berarti statistik dibandingkan dengan nilai kritis untuk nilai yang diberikan ();
  • hipotesis nol ditolak jika nilainya statistik lebih besar dari kritis (atau jika probabilitas mendapatkan nilai ini statistik() lebih kecil tingkat signifikansi, yang merupakan pendekatan yang setara).

Mari kita habiskan pengujian hipotesis untuk distribusi yang berbeda.

Kasus diskrit

Misalkan dua orang sedang bermain dadu. Setiap pemain memiliki set dadu mereka sendiri. Pemain bergiliran melempar 3 dadu sekaligus. Setiap putaran dimenangkan oleh orang yang menggulung lebih banyak angka enam sekaligus. Hasilnya dicatat. Salah satu pemain, setelah 100 putaran, memiliki kecurigaan bahwa tulang lawannya tidak simetris, karena. dia sering menang (sering melempar enam). Dia memutuskan untuk menganalisis seberapa besar kemungkinan hasil lawan seperti itu.

Catatan: Karena 3 dadu, maka Anda dapat melempar 0 sekaligus; satu; 2 atau 3 enam, mis. variabel acak dapat mengambil 4 nilai.

Dari teori probabilitas, kita mengetahui bahwa jika kubus-kubus tersebut simetris, maka probabilitas kejatuhan enam kubus memenuhi. Oleh karena itu, setelah 100 putaran, frekuensi enam dapat dihitung menggunakan rumus
=BINOM.DIST(A7,3,1/6,FALSE)*100

Rumus tersebut mengasumsikan bahwa sel A7 berisi jumlah yang sesuai dari enam yang dijatuhkan dalam satu putaran.

Catatan: Perhitungan diberikan dalam contoh file pada lembar Diskrit.

Untuk perbandingan diamati(Diamati) dan frekuensi teoritis(Diharapkan) nyaman digunakan.

Dengan penyimpangan yang signifikan dari frekuensi yang diamati dari distribusi teoritis, hipotesis nol tentang distribusi variabel acak menurut hukum teoritis, harus ditolak. Artinya, jika dadu lawan tidak simetris, maka frekuensi yang diamati akan “berbeda nyata” dari distribusi binomial.

Dalam kasus kami, pada pandangan pertama, frekuensinya cukup dekat dan sulit untuk menarik kesimpulan yang jelas tanpa perhitungan. Berlaku Uji kesesuaian Pearson X 2, sehingga alih-alih pernyataan subjektif "berbeda secara signifikan", yang dapat dibuat atas dasar perbandingan histogram, gunakan pernyataan yang benar secara matematis.

Mari kita gunakan fakta bahwa hukum bilangan besar frekuensi yang diamati (Diamati) dengan meningkatnya volume sampel n cenderung ke probabilitas yang sesuai dengan hukum teoretis (dalam kasus kami, hukum binomial). Dalam kasus kami, ukuran sampel n adalah 100.

Mari kita perkenalkan uji statistik, yang dilambangkan dengan X 2:

di mana O l adalah frekuensi kejadian yang diamati di mana variabel acak telah mengambil nilai tertentu yang dapat diterima, E l adalah frekuensi teoretis yang sesuai (Diharapkan). L adalah jumlah nilai yang dapat diambil oleh variabel acak (dalam kasus kami sama dengan 4).

Seperti yang dapat dilihat dari rumus, ini statistik adalah ukuran kedekatan frekuensi yang diamati dengan frekuensi teoretis, yaitu itu dapat digunakan untuk memperkirakan "jarak" antara frekuensi ini. Jika jumlah "jarak" ini "terlalu besar", maka frekuensi ini "berbeda secara substansial". Jelas bahwa jika kubus kita simetris (yaitu berlaku hukum binomial), maka kemungkinan jumlah "jarak" akan menjadi "terlalu besar" akan kecil. Untuk menghitung probabilitas ini, kita perlu mengetahui distribusinya statistik X2 ( statistik X2 dihitung berdasarkan random sampel, jadi itu adalah variabel acak dan, oleh karena itu, memiliki sendiri distribusi kemungkinan).

Dari analog multidimensi Teorema integral Moivre-Laplace diketahui bahwa untuk n->∞ variabel acak kita X 2 asimtotik dengan L - 1 derajat kebebasan.

Jadi jika dihitung nilai statistik X 2 (jumlah "jarak" antar frekuensi) akan lebih dari nilai batas tertentu, maka kita akan memiliki alasan untuk menolak hipotesis nol. Seperti dalam memeriksa hipotesis parametrik, nilai batas ditetapkan melalui tingkat signifikansi. Jika probabilitas bahwa statistik X 2 akan mengambil nilai kurang dari atau sama dengan yang dihitung ( p-berarti) akan lebih sedikit tingkat signifikansi, kemudian hipotesis nol dapat ditolak.

Dalam kasus kami, nilai statistiknya adalah 22,757. Probabilitas bahwa statistik X 2 akan mengambil nilai lebih besar atau sama dengan 22,757 sangat kecil (0,000045) dan dapat dihitung dengan menggunakan rumus
=XI2.DIST.PX(22,757;4-1) atau
=XI2.TEST(Diamati; Diharapkan)

Catatan: Fungsi CH2.TEST() dirancang khusus untuk menguji hubungan antara dua variabel kategori (lihat ).

Probabilitas 0,000045 secara signifikan lebih kecil dari biasanya tingkat signifikansi 0,05. Jadi, pemain memiliki banyak alasan untuk mencurigai lawannya tidak jujur ​​( hipotesis nol tentang kejujurannya ditolak).

Saat diterapkan kriteria X 2 perawatan harus diambil untuk memastikan bahwa volume sampel n cukup besar, jika tidak, perkiraan distribusi akan menjadi tidak valid statistik X 2. Biasanya dianggap bahwa untuk ini cukup bahwa frekuensi yang diamati (Diamati) lebih besar dari 5. Jika ini tidak terjadi, maka frekuensi rendah digabungkan menjadi satu atau digabungkan ke frekuensi lain, dan probabilitas total ditetapkan ke nilai gabungan dan, karenanya, jumlah derajat kebebasan menurun X 2 -distribusi.

Untuk meningkatkan kualitas aplikasi kriteria X 2(), perlu untuk mengurangi interval partisi (menaikkan L dan, karenanya, menambah jumlahnya derajat kebebasan), namun, hal ini dicegah dengan pembatasan jumlah pengamatan yang masuk ke dalam setiap interval (d.b.>5).

kasus terus menerus

Tes kesesuaian Pearson X 2 dapat diterapkan dengan cara yang sama dalam kasus .

Pertimbangkan beberapa contoh, terdiri dari 200 nilai. Hipotesis nol menyatakan bahwa Sampel terbuat dari .

Catatan: Variabel acak dalam file sampel pada lembar Terus Menerus dihasilkan menggunakan rumus =NORM.ST.INV(RAND()). Oleh karena itu, nilai-nilai baru sampel dihasilkan setiap kali lembar dihitung ulang.

Apakah kumpulan data yang tersedia memadai dapat dinilai secara visual.

Seperti yang Anda lihat dari diagram, nilai sampel cukup cocok di sepanjang garis lurus. Namun, seperti untuk pengujian hipotesis berlaku Uji kesesuaian Pearson X 2 .

Untuk melakukan ini, kami membagi rentang variasi variabel acak menjadi interval dengan langkah 0,5. Mari kita hitung frekuensi yang diamati dan frekuensi teoretis. Kami menghitung frekuensi yang diamati menggunakan fungsi FREQUENCY(), dan yang teoretis - menggunakan fungsi NORM.ST.DIST().

Catatan: Adapun kasus diskrit, perlu dipastikan bahwa Sampel cukup besar, dan lebih dari 5 nilai termasuk dalam interval.

Hitung statistik X 2 dan bandingkan dengan nilai kritis untuk yang diberikan tingkat signifikansi(0,05). Karena kita membagi rentang variasi variabel acak menjadi 10 interval, maka jumlah derajat kebebasannya adalah 9. Nilai kritis dapat dihitung dengan rumus
\u003d XI2.INV.RH (0,05; 9) atau
\u003d XI2.OBR (1-0,05; 9)

Grafik di atas menunjukkan bahwa nilai statistiknya adalah 8,19, yang jauh lebih tinggi kritishipotesis nol tidak ditolak.

Di bawah ini yang mana Sampel diasumsikan nilai yang tidak mungkin, dan atas dasar kriteria Persetujuan Pearson X 2 hipotesis nol ditolak (terlepas dari kenyataan bahwa nilai acak dihasilkan menggunakan rumus =NORM.ST.INV(RAND()) menyediakan contoh dari distribusi normal standar).

Hipotesis nol ditolak, meskipun secara visual datanya cukup mendekati garis lurus.

Sebagai contoh, mari kita ambil juga contoh dari U(-3; 3). Dalam hal ini, bahkan dari grafik jelas bahwa hipotesis nol harus ditolak.

Kriteria Persetujuan Pearson X 2 juga menegaskan bahwa hipotesis nol harus ditolak.

Dalam beberapa kasus, peneliti tidak mengetahui sebelumnya dengan hukum mana nilai-nilai yang diamati dari sifat yang diteliti didistribusikan. Tetapi dia mungkin memiliki alasan yang cukup baik untuk berasumsi bahwa distribusi tunduk pada satu atau lain hukum, misalnya, normal atau seragam. Dalam hal ini, hipotesis statistik utama dan alternatif dari bentuk berikut diajukan:

    H 0: distribusi fitur yang diamati tunduk pada hukum distribusi A,

    H 1: distribusi fitur yang diamati berbeda dari A;

sedangkan A satu atau lain hukum distribusi dapat bertindak: normal, seragam, eksponensial, dll.

Pengujian hipotesis tentang hukum distribusi yang diusulkan dilakukan dengan menggunakan apa yang disebut kriteria kecocokan. Ada beberapa kriteria penerimaan. Yang paling universal dari mereka adalah - kriteria Pearson, karena ini berlaku untuk semua jenis distribusi.

-Kriteria Pearson

Biasanya frekuensi empiris dan teoritis berbeda. Apakah perbedaan itu acak? Kriteria Pearson menjawab pertanyaan ini, namun, seperti kriteria statistik lainnya, kriteria ini tidak membuktikan validitas hipotesis dalam pengertian matematis yang ketat, tetapi hanya menetapkan persetujuan atau ketidaksetujuannya dengan data pengamatan pada tingkat signifikansi tertentu.

Jadi, biarkan distribusi statistik nilai fitur diperoleh dari sampel volume, di mana nilai fitur yang diamati, adalah frekuensi yang sesuai:

Inti dari kriteria Pearson adalah menghitung kriteria menurut rumus berikut:

di mana adalah jumlah digit dari nilai-nilai yang diamati, dan adalah frekuensi teoritis dari nilai-nilai yang sesuai.

Jelas bahwa semakin kecil perbedaannya, semakin dekat distribusi empiris dengan distribusi empiris, oleh karena itu, semakin kecil nilai kriteria, semakin andal dapat dikatakan bahwa distribusi empiris dan teoritis tunduk pada hukum yang sama.

Algoritma kriteria Pearson

Algoritma kriteria Pearson sederhana dan terdiri dari langkah-langkah berikut:

Jadi, satu-satunya tindakan non-sepele dalam algoritma ini adalah penentuan frekuensi teoritis. Mereka, tentu saja, bergantung pada hukum distribusi, oleh karena itu - untuk hukum yang berbeda didefinisikan secara berbeda.

Kriteria persetujuan untuk menguji hipotesis tentang hukum distribusi variabel acak yang diteliti. Dalam banyak masalah praktis, hukum distribusi yang tepat tidak diketahui. Oleh karena itu, hipotesis diajukan tentang korespondensi hukum empiris yang ada, dibangun di atas pengamatan, untuk beberapa teori.Hipotesis ini membutuhkan verifikasi statistik, yang hasilnya akan mengkonfirmasi, atau disangkal.

Biarkan X menjadi variabel acak yang diteliti. Diperlukan untuk menguji hipotesis H 0 bahwa variabel acak ini mematuhi hukum distribusi F(x). Untuk melakukan ini, Anda perlu membuat sampel n pengamatan independen dan menggunakannya untuk membangun hukum distribusi empiris F "(x). Untuk membandingkan hukum empiris dan hipotetis, digunakan aturan yang disebut kebaikan kecocokan. yang paling populer adalah kesesuaian chi-square K. Pearson.

Ini menghitung statistik chi-kuadrat:

,

di mana N adalah jumlah interval yang menurut hukum distribusi empiris dibangun (jumlah kolom histogram yang sesuai), i adalah jumlah interval, p t i adalah probabilitas bahwa nilai variabel acak jatuh ke dalam i Interval ke-th untuk hukum distribusi teoritis, p e i adalah probabilitas bahwa nilai variabel acak jatuh ke dalam interval ke-i untuk hukum distribusi empiris. Itu harus mematuhi distribusi chi-kuadrat.

Jika nilai statistik yang dihitung melebihi kuantil distribusi chi-kuadrat dengan derajat kebebasan k-p-1 untuk tingkat signifikansi tertentu, maka hipotesis H 0 ditolak, jika tidak, diterima pada tingkat signifikansi tertentu. jumlah pengamatan, p adalah jumlah parameter yang diperkirakan dari hukum distribusi .

Pearson memungkinkan Anda untuk menguji distribusi empiris dan teoritis (atau empiris lainnya) dari satu fitur. Kriteria ini terutama diterapkan dalam dua kasus:

Untuk membandingkan distribusi empiris suatu sifat dengan distribusi teoritis (normal, eksponensial, seragam, atau beberapa hukum lainnya);

Untuk membandingkan dua distribusi empiris dari sifat yang sama.

Ide dari metode ini adalah untuk menentukan tingkat divergensi dari frekuensi yang sesuai n i dan ; semakin besar perbedaan ini, semakin besar nilainya

Ukuran sampel harus minimal 50 dan jumlah frekuensi harus sama

Hipotesis nol H 0 = (dua distribusi praktis tidak berbeda satu sama lain); hipotesis alternatif - H 1 = (perbedaan antara distribusi signifikan).

Berikut adalah skema penerapan kriteria untuk membandingkan dua distribusi empiris:

Kriteria - kriteria statistik untuk menguji hipotesis bahwa variabel acak yang diamati mematuhi beberapa hukum distribusi teoretis.


Tergantung pada nilai kriteria , hipotesis dapat diterima atau ditolak:

§ , hipotesis terpenuhi.

(jatuh ke "ekor" kiri distribusi). Karena itu, nilai teoretis dan praktisnya sangat dekat. Jika, misalnya, sebuah generator bilangan acak diperiksa yang menghasilkan n angka dari suatu segmen dan hipotesisnya adalah: sampel terdistribusi secara merata pada , maka generator tersebut tidak dapat disebut acak (hipotesis keacakan tidak terpenuhi), karena sampel terlalu merata, tetapi hipotesis terpenuhi.

(jatuh ke "ekor" kanan distribusi) hipotesis ditolak.

Definisi: Biarkan variabel acak X diberikan.

Hipotesa: dengan. di. X mematuhi hukum distribusi.

Untuk menguji hipotesis, pertimbangkan sampel yang terdiri dari n pengamatan independen dari r.v. X: . Berdasarkan sampel, kami membuat distribusi empiris dari r.v. X. Perbandingan distribusi empiris dan teoritis (diasumsikan dalam hipotesis) dilakukan dengan menggunakan fungsi yang dipilih secara khusus - kriteria goodness-of-fit. Pertimbangkan uji kecocokan Pearson (kriteria):

Hipotesa: X n dihasilkan oleh fungsi .

Bagilah menjadi k interval yang tidak tumpang tindih ;

Membiarkan menjadi jumlah pengamatan dalam interval ke-j: ;

Probabilitas suatu pengamatan jatuh ke dalam interval ke-j ketika hipotesis terpenuhi;

- jumlah pukulan yang diharapkan dalam interval ke-j;

Statistik: - Distribusi khi-kuadrat dengan k-1 derajat kebebasan.

Kriteria salah pada sampel dengan kejadian frekuensi rendah (jarang). Masalah ini dapat diselesaikan dengan membuang kejadian frekuensi rendah, atau dengan menggabungkannya dengan kejadian lain. Metode ini disebut koreksi Yates.

Uji kecocokan Pearson (χ 2) digunakan untuk menguji hipotesis bahwa distribusi empiris sesuai dengan distribusi teoritis yang diharapkan F(x) dengan ukuran sampel yang besar (n 100). Kriteria ini berlaku untuk semua jenis fungsi F(x), bahkan dengan nilai parameter yang tidak diketahui, yang biasanya terjadi saat menganalisis hasil pengujian mekanis. Di sinilah letak keserbagunaannya.

Penggunaan kriteria 2 melibatkan pembagian rentang variasi sampel ke dalam interval dan menentukan jumlah pengamatan (frekuensi) nj untuk masing-masing e interval. Untuk kenyamanan memperkirakan parameter distribusi, interval dipilih menjadi panjang yang sama.

Jumlah interval tergantung pada ukuran sampel. Biasanya diterima: pada n = 100 e= 10 15, pada n = 200 e= 15 20, pada n = 400 e= 25 30, pada n = 1000 e= 35 40.

Interval yang berisi kurang dari lima pengamatan digabungkan dengan pengamatan yang berdekatan. Namun, jika jumlah interval tersebut kurang dari 20% dari jumlah totalnya, interval dengan frekuensi n j 2 diperbolehkan.

Statistik uji Pearson adalah nilai
, (3.91)
di mana p j adalah probabilitas bahwa variabel acak yang diteliti jatuh ke dalam interval ke-j, dihitung sesuai dengan hukum distribusi hipotetis F(x). Saat menghitung probabilitas p j, harus diingat bahwa batas kiri interval pertama dan batas kanan interval terakhir harus bertepatan dengan batas wilayah nilai yang mungkin dari variabel acak, misalnya dengan normal. distribusi, interval pertama meluas ke -∞, dan yang terakhir - ke +∞.

Hipotesis nol tentang kesesuaian distribusi sampel dengan hukum teoretis F(x) diperiksa dengan membandingkan nilai yang dihitung dengan rumus (3.91) dengan nilai kritis 2 yang ditemukan dari Tabel. Aplikasi VI untuk tingkat signifikansi dan jumlah derajat kebebasan k = e 1 - m - 1. Di sini e 1 - jumlah interval setelah penggabungan; m adalah jumlah parameter yang diestimasi dari sampel yang dipertimbangkan. Jika pertidaksamaan
2 2 (3.92)
maka hipotesis nol tidak ditolak.Jika ketidaksetaraan yang ditunjukkan tidak diamati, hipotesis alternatif diterima bahwa sampel termasuk dalam distribusi yang tidak diketahui.

Kerugian dari kriteria kecocokan Pearson adalah hilangnya beberapa informasi awal yang terkait dengan kebutuhan untuk mengelompokkan hasil pengamatan ke dalam interval dan menggabungkan interval individu dengan sejumlah kecil pengamatan. verifikasi korespondensi distribusi oleh kriteria 2 dengan kriteria lain, terutama diperlukan dengan sampel volume yang relatif kecil (n 100).

Tabel menunjukkan nilai kritis dari distribusi chi-kuadrat dengan jumlah derajat kebebasan tertentu Nilai yang diinginkan berada di persimpangan kolom dengan nilai probabilitas yang sesuai dan baris dengan jumlah derajat kebebasan. Sebagai contoh, nilai kritis dari distribusi chi-kuadrat dengan 4 derajat kebebasan untuk probabilitas 0,25 adalah 5,38527. Artinya luas daerah di bawah kurva densitas dari distribusi chi-kuadrat dengan 4 derajat kebebasan ke kanan dari nilai 5,38527 adalah 0,25.

Kriteria Pearson untuk menguji hipotesis tentang bentuk hukum distribusi variabel acak. Menguji hipotesis tentang distribusi normal, eksponensial dan seragam dengan kriteria Pearson. Kriteria Kolmogorov. Metode perkiraan untuk memeriksa normalitas distribusi, terkait dengan perkiraan koefisien skewness dan kurtosis.

Pada kuliah sebelumnya telah dibahas hipotesis dimana hukum distribusi populasi umum diasumsikan diketahui. Sekarang mari kita uji hipotesis tentang dugaan hukum distribusi yang tidak diketahui, yaitu, kita akan menguji hipotesis nol bahwa populasi didistribusikan menurut beberapa hukum yang diketahui. Biasanya, uji statistik untuk menguji hipotesis semacam itu disebut uji kecocokan.

Keuntungan dari kriteria Pearson adalah universalitasnya: dapat digunakan untuk menguji hipotesis tentang berbagai hukum distribusi.

1. Pengujian hipotesis distribusi normal.

Biarkan sampel dengan ukuran yang cukup besar diperoleh P dengan banyak pilihan arti yang berbeda. Untuk kenyamanan pemrosesannya, kami membagi interval dari nilai varian terkecil hingga terbesar dengan s bagian yang sama dan kami akan menganggap bahwa nilai-nilai vari

semut yang jatuh ke setiap interval kira-kira sama dengan jumlah yang menentukan tengah interval. Setelah menghitung jumlah opsi yang masuk ke setiap interval, kami akan membuat apa yang disebut sampel yang dikelompokkan:

pilihan X 1 X 2 x s

frekuensi P 1 P 2 n s ,

di mana x saya adalah nilai titik tengah interval, dan dan aku- jumlah opsi yang disertakan dalam saya interval ke-th (frekuensi empiris).

Berdasarkan data yang diperoleh, dimungkinkan untuk menghitung rata-rata sampel dan simpangan baku sampel B. Mari kita periksa asumsi bahwa populasi umum terdistribusi menurut hukum normal dengan parameter M(X) = , D(X) = . Kemudian Anda dapat menemukan jumlah angka dari sampel volume P, yang harus di setiap interval di bawah asumsi ini (yaitu, frekuensi teoritis). Untuk melakukan ini, menggunakan tabel nilai fungsi Laplace, kami menemukan probabilitas memukul saya-interval:

,

di mana aku dan b saya- perbatasan saya-interval. Mengalikan probabilitas yang dihasilkan dengan ukuran sampel n, kami menemukan frekuensi teoritis: p i \u003d n? p i. Tujuan kami adalah untuk membandingkan frekuensi empiris dan teoritis, yang, tentu saja, berbeda satu sama lain, dan mencari tahu apakah perbedaan ini tidak signifikan, tidak menyangkal hipotesis distribusi normal dari variabel acak yang diteliti, atau apakah mereka begitu besar bahwa mereka bertentangan dengan hipotesis ini. Untuk ini, kriteria digunakan dalam bentuk variabel acak

. (20.1)

Maknanya jelas: bagian-bagiannya diringkas, yang merupakan kuadrat dari penyimpangan frekuensi empiris dari frekuensi teoritis dari frekuensi teoretis yang sesuai. Dapat dibuktikan bahwa, terlepas dari hukum distribusi nyata dari populasi umum, hukum distribusi variabel acak (20.1) di cenderung ke hukum distribusi (lihat kuliah 12) dengan jumlah derajat kebebasan k = s- 1 - r, di mana r- jumlah parameter distribusi yang diperkirakan, diperkirakan dari data sampel. Distribusi normal dicirikan oleh dua parameter, jadi k = s- 3. Untuk kriteria yang dipilih, daerah kritis tangan kanan dibangun, ditentukan oleh kondisi


(20.2)

di mana α - tingkat signifikansi. Oleh karena itu, daerah kritis diberikan oleh pertidaksamaan dan daerah penerimaan hipotesis adalah .

Jadi, untuk menguji hipotesis nol H 0: populasi terdistribusi normal - Anda perlu menghitung nilai kriteria yang diamati dari sampel:

, (20.1`)

dan menurut tabel titik kritis dari distribusi 2 temukan titik kritis menggunakan nilai dan yang diketahui k = s- 3. Jika - hipotesis nol diterima, jika ditolak.

2. Pengujian hipotesis distribusi seragam.

Saat menggunakan kriteria Pearson untuk menguji hipotesis distribusi seragam dari populasi umum dengan kepadatan probabilitas yang diharapkan

perlu, setelah menghitung nilai dari sampel yang tersedia, untuk memperkirakan parameter sebuah dan b menurut rumus:

di mana sebuah* dan b*- perkiraan sebuah dan b. Memang, untuk distribusi yang seragam M(X) = , , dari mana Anda bisa mendapatkan sistem untuk menentukan sebuah* dan b*: , yang solusinya adalah ekspresi (20.3).

Kemudian, dengan asumsi bahwa , Anda dapat menemukan frekuensi teoretis menggunakan rumus

Di Sini s adalah jumlah interval di mana sampel dibagi.

Nilai yang diamati dari kriteria Pearson dihitung dengan rumus (20.1`), dan nilai kritis dihitung dari tabel, dengan mempertimbangkan fakta bahwa jumlah derajat kebebasan k = s- 3. Setelah itu, batas-batas daerah kritis ditentukan dengan cara yang sama seperti untuk menguji hipotesis distribusi normal.

3. Menguji hipotesis tentang distribusi eksponensial.

Dalam hal ini, membagi sampel yang ada menjadi interval dengan panjang yang sama, kami mempertimbangkan urutan opsi yang berjarak sama satu sama lain (kami berasumsi bahwa semua opsi yang termasuk dalam saya interval -th, ambil nilai yang bertepatan dengan tengahnya), dan frekuensi yang sesuai dan aku(jumlah opsi sampel termasuk dalam saya interval -th). Kami menghitung dari data ini dan mengambil sebagai perkiraan parameter λ nilai . Kemudian frekuensi teoritis dihitung dengan rumus

Kemudian, nilai yang diamati dan kritis dari kriteria Pearson dibandingkan, dengan mempertimbangkan jumlah derajat kebebasan k = s- 2.