Estimasi untuk ekspektasi matematis dan varians. Estimasi ekspektasi matematis dan varians untuk sampel

Biarkan ada variabel acak X dengan harapan matematis m dan dispersi D, sedangkan kedua parameter ini tidak diketahui. Lebih besar X diproduksi N eksperimen independen, yang menghasilkan serangkaian N hasil numerik x 1 , x 2 , …, x N. Sebagai perkiraan harapan matematis, wajar untuk mengusulkan rata-rata aritmatika dari nilai-nilai yang diamati

(1)

Di sini sebagai x saya nilai (angka) spesifik yang diperoleh sebagai hasil dari N eksperimen. Jika kita mengambil orang lain (terlepas dari yang sebelumnya) N percobaan, maka, jelas, kita akan mendapatkan nilai yang berbeda. Jika Anda mengambil lebih banyak N percobaan, kita akan mendapatkan satu nilai baru lagi. Dilambangkan dengan X saya variabel acak yang dihasilkan dari saya percobaan, maka realisasinya X saya akan menjadi angka yang diperoleh sebagai hasil dari percobaan ini. Jelas bahwa variabel acak X saya akan memiliki kepadatan distribusi probabilitas yang sama dengan variabel acak asli X. Kami juga mengasumsikan bahwa variabel acak X saya dan Xj mandiri di saya, tidak sama j(berbagai independen relatif terhadap satu sama lain percobaan). Oleh karena itu, kami menulis ulang rumus (1) dalam bentuk (statistik) yang berbeda:

(2)

Mari kita tunjukkan bahwa estimasi tidak bias:

Jadi, ekspektasi matematis dari mean sampel sama dengan ekspektasi matematis sebenarnya dari variabel acak m. Ini adalah fakta yang cukup dapat diprediksi dan dimengerti. Oleh karena itu, mean sampel (2) dapat diambil sebagai perkiraan ekspektasi matematis dari variabel acak. Sekarang muncul pertanyaan: apa yang terjadi pada varians dari estimasi ekspektasi ketika jumlah eksperimen meningkat? Perhitungan analitik menunjukkan bahwa

di mana adalah varians dari estimasi ekspektasi matematis (2), dan D- varians sebenarnya dari variabel acak X.

Dari uraian di atas, maka dengan bertambahnya N(jumlah percobaan) varians estimasi menurun, yaitu semakin kita meringkas implementasi independen, semakin dekat dengan nilai yang diharapkan kita mendapatkan perkiraan.


Estimasi varians matematis

Pada pandangan pertama, perkiraan paling alami tampaknya adalah

(3)

dimana dihitung dengan rumus (2). Mari kita periksa apakah perkiraannya tidak bias. Rumus (3) dapat ditulis sebagai berikut:

Kami mengganti ekspresi (2) ke dalam rumus ini:

Mari kita cari ekspektasi matematis dari estimasi varians:

(4)

Karena varians dari variabel acak tidak bergantung pada ekspektasi matematis dari variabel acak, kita akan mengambil ekspektasi matematis sama dengan 0, yaitu. m = 0.

(5)
pada .(6)

Kebutuhan untuk memperkirakan ekspektasi matematis berdasarkan hasil tes muncul dalam masalah di mana hasil eksperimen digambarkan oleh variabel acak dan indikator kualitas objek yang diteliti diambil sebagai ekspektasi matematis dari variabel acak ini. Misalnya, ekspektasi matematis dari waktu aktif suatu sistem dapat diambil sebagai indikator keandalan, dan ketika mengevaluasi efisiensi produksi, ekspektasi matematis dari jumlah produk bagus, dll.

Masalah pendugaan ekspektasi matematis dirumuskan sebagai berikut. Misalkan untuk menentukan nilai yang tidak diketahui dari variabel acak X, itu seharusnya membuat n independen dan bebas dari kesalahan sistematis pengukuran X v X 2 ,..., X hal. Hal ini diperlukan untuk memilih perkiraan terbaik dari harapan matematis.

Estimasi terbaik dan paling umum dari ekspektasi matematis dalam praktik adalah rata-rata aritmatika dari hasil tes

disebut juga statistik atau sampel berarti.

Mari kita tunjukkan bahwa perkiraan tx memenuhi semua persyaratan untuk evaluasi parameter apa pun.

1. Ini mengikuti dari ekspresi (5.10) bahwa

yaitu skor t "x- perkiraan tidak bias.

2. Menurut teorema Chebyshev, rata-rata aritmatika dari hasil tes konvergen dalam probabilitas dengan harapan matematis, yaitu.

Akibatnya, estimasi (5.10) adalah estimasi ekspektasi yang konsisten.

3. Estimasi varians tx, setara

Dengan bertambahnya ukuran sampel, n berkurang tanpa batas. Terbukti bahwa jika variabel acak X tunduk pada hukum distribusi normal, maka untuk sembarang P varians (5.11) akan seminimal mungkin, dan estimasi tx- Estimasi efektif dari ekspektasi matematis. Mengetahui varians dari estimasi memungkinkan untuk membuat penilaian tentang keakuratan penentuan nilai yang tidak diketahui dari ekspektasi matematis menggunakan estimasi ini.

Sebagai perkiraan ekspektasi matematis, mean aritmatika digunakan jika hasil pengukuran sama akuratnya (varians D, saya = 1, 2, ..., P sama di setiap dimensi). Namun, dalam praktiknya, seseorang harus berurusan dengan tugas-tugas di mana hasil pengukurannya tidak sama (misalnya, selama pengujian, pengukuran dilakukan dengan instrumen yang berbeda). Dalam hal ini, estimasi untuk ekspektasi matematis memiliki bentuk

di mana adalah bobot pengukuran ke-i.

Dalam rumus (5.12), hasil setiap pengukuran disertakan dengan bobotnya sendiri Dengan.. Oleh karena itu, evaluasi hasil pengukuran tx ditelepon rata-rata tertimbang.

Dapat ditunjukkan bahwa estimasi (5.12) merupakan estimasi ekspektasi yang tidak bias, konsisten, dan efisien. Varians minimum dari estimasi diberikan oleh


Saat melakukan eksperimen dengan model komputer, masalah serupa muncul ketika perkiraan ditemukan dari hasil beberapa rangkaian pengujian dan jumlah pengujian di setiap rangkaian berbeda. Misalnya, dua rangkaian pengujian dilakukan dengan volume hal 1 dan n 2 , sesuai dengan hasil estimasi t xi dan tx _. Untuk meningkatkan akurasi dan reliabilitas dalam menentukan ekspektasi matematis, hasil dari rangkaian tes ini digabungkan. Untuk melakukan ini, gunakan ekspresi (5.12)

Saat menghitung koefisien C, alih-alih varians D, perkiraannya yang diperoleh dari hasil pengujian di setiap seri diganti.

Pendekatan serupa juga digunakan dalam menentukan probabilitas kejadian acak yang terjadi berdasarkan hasil serangkaian tes.

Untuk memperkirakan ekspektasi matematis dari variabel acak X, selain mean sampel, statistik lain dapat digunakan. Paling sering, anggota deret variasi digunakan untuk tujuan ini, yaitu statistik pesanan, atas dasar perkiraan yang dibuat,

memenuhi syarat utama yaitu konsistensi dan tidak bias.

Asumsikan bahwa deret variasi berisi n = 2k anggota. Kemudian, rata-rata mana pun dapat diambil sebagai perkiraan ekspektasi matematis:

Di mana kaki rata-rata

tidak lain adalah median statistik dari distribusi variabel acak X, karena persamaan yang jelas terjadi

Keuntungan dari median statistik adalah bebas dari pengaruh pengamatan anomali, yang tidak dapat dihindari ketika menggunakan rata-rata pertama, yaitu rata-rata deret variasi jumlah terkecil dan terbesar.

Dengan ukuran sampel yang aneh P = 2k- 1 median statistik adalah elemen tengahnya, mis. ke-anggota seri variasi saya = xk

Ada distribusi yang rata-rata aritmatikanya bukan merupakan estimasi efektif dari ekspektasi matematis, misalnya, distribusi Laplace. Dapat ditunjukkan bahwa untuk distribusi Laplace, penduga efektif rata-rata adalah median sampel.

Terbukti bahwa jika variabel acak X berdistribusi normal, maka dengan ukuran sampel yang cukup besar, hukum distribusi median statistik mendekati normal dengan karakteristik numerik.

Dari perbandingan rumus (5.11) dan (5.14) dapat disimpulkan bahwa penyebaran median statistik adalah 1,57 kali lebih besar dari penyebaran rata-rata aritmatika. Oleh karena itu, rata-rata aritmatika sebagai perkiraan ekspektasi matematis jauh lebih efektif daripada median statistik. Namun, karena kesederhanaan perhitungan, ketidakpekaan terhadap hasil pengukuran anomali ("kontaminasi" sampel), dalam praktiknya, median statistik tetap digunakan sebagai perkiraan ekspektasi matematis.

Perlu diperhatikan bahwa untuk distribusi simetris kontinu, mean dan median adalah sama. Oleh karena itu, median statistik dapat berfungsi sebagai perkiraan yang baik dari ekspektasi matematis hanya untuk distribusi simetris dari variabel acak.

Untuk distribusi miring, median statistik Saya memiliki bias yang signifikan relatif terhadap ekspektasi matematis, oleh karena itu, tidak cocok untuk estimasinya.

Biarkan ada variabel acak X dengan harapan matematis m dan dispersi D, sedangkan kedua parameter ini tidak diketahui. Lebih besar X diproduksi N eksperimen independen, yang menghasilkan serangkaian N hasil numerik x 1 , x 2 , …, x N. Sebagai perkiraan harapan matematis, wajar untuk mengusulkan rata-rata aritmatika dari nilai-nilai yang diamati

(1)

Di sini sebagai x saya nilai (angka) spesifik yang diperoleh sebagai hasil dari N eksperimen. Jika kita mengambil orang lain (terlepas dari yang sebelumnya) N percobaan, maka, jelas, kita akan mendapatkan nilai yang berbeda. Jika Anda mengambil lebih banyak N percobaan, kita akan mendapatkan satu nilai baru lagi. Dilambangkan dengan X saya variabel acak yang dihasilkan dari saya percobaan, maka realisasinya X saya akan menjadi angka yang diperoleh sebagai hasil dari percobaan ini. Jelas bahwa variabel acak X saya akan memiliki kepadatan distribusi probabilitas yang sama dengan variabel acak asli X. Kami juga mengasumsikan bahwa variabel acak X saya dan Xj mandiri di saya, tidak sama j(berbagai independen relatif terhadap satu sama lain percobaan). Oleh karena itu, kami menulis ulang rumus (1) dalam bentuk (statistik) yang berbeda:

(2)

Mari kita tunjukkan bahwa estimasi tidak bias:

Jadi, ekspektasi matematis dari mean sampel sama dengan ekspektasi matematis sebenarnya dari variabel acak m. Ini adalah fakta yang cukup dapat diprediksi dan dimengerti. Oleh karena itu, mean sampel (2) dapat diambil sebagai perkiraan ekspektasi matematis dari variabel acak. Sekarang muncul pertanyaan: apa yang terjadi pada varians dari estimasi ekspektasi ketika jumlah eksperimen meningkat? Perhitungan analitik menunjukkan bahwa

di mana adalah varians dari estimasi ekspektasi matematis (2), dan D- varians sebenarnya dari variabel acak X.

Dari uraian di atas, maka dengan bertambahnya N(jumlah percobaan) varians estimasi menurun, yaitu semakin kita meringkas implementasi independen, semakin dekat dengan nilai yang diharapkan kita mendapatkan perkiraan.


Estimasi varians matematis

Pada pandangan pertama, perkiraan paling alami tampaknya adalah

(3)

dimana dihitung dengan rumus (2). Mari kita periksa apakah perkiraannya tidak bias. Rumus (3) dapat ditulis sebagai berikut:

Kami mengganti ekspresi (2) ke dalam rumus ini:

Mari kita cari ekspektasi matematis dari estimasi varians:

(4)

Karena varians dari variabel acak tidak bergantung pada ekspektasi matematis dari variabel acak, kita akan mengambil ekspektasi matematis sama dengan 0, yaitu. m = 0.

(5)
pada .(6)

Biarkan variabel acak dengan harapan dan varians matematis yang tidak diketahui menjadi sasaran eksperimen independen yang menghasilkan hasil - . Mari kita hitung perkiraan yang konsisten dan tidak bias untuk parameter dan .

Sebagai perkiraan untuk harapan matematis, kami mengambil rata-rata aritmatika dari nilai-nilai eksperimental

. (2.9.1)

Menurut hukum bilangan besar, perkiraan ini adalah kaya , dengan besaran probabilitas. Perkiraan yang sama adalah tidak bias , sejauh

. (2.9.2)

Varians dari taksiran ini adalah

. (2.9.3)

Dapat ditunjukkan bahwa untuk distribusi normal, perkiraan ini adalah efisien . Untuk undang-undang lain, ini mungkin tidak terjadi.

Mari kita sekarang memperkirakan varians. Mari kita pilih dulu rumus untuk menaksir dispersi statistik

. (2.9.4)

Mari kita periksa konsistensi estimasi varians. Mari kita buka tanda kurung dalam rumus (2.9.4)

.

Untuk , suku pertama konvergen dalam probabilitas ke kuantitas , di detik - ke . Dengan demikian, perkiraan kami konvergen dalam probabilitas ke varians

,

maka dia adalah kaya .

Mari kita periksa ketidakberpihakan perkiraan untuk kuantitas. Untuk melakukan ini, kami mengganti ekspresi (2.9.1) ke dalam rumus (2.9.4) dan memperhitungkan variabel acak mandiri

,

. (2.9.5)

Mari kita berikan rumus (2.9.5) ke fluktuasi variabel acak

Memperluas tanda kurung, kita dapatkan

,

. (2.9.6)

Mari kita hitung ekspektasi matematis dari nilai (2.9.6), dengan mempertimbangkan bahwa

. (2.9.7)

Relasi (2.9.7) menunjukkan bahwa nilai yang dihitung dengan rumus (2.9.4) bukan penduga tak bias untuk dispersi. Harapan matematisnya tidak sama, tetapi agak kurang. Perkiraan seperti itu menyebabkan kesalahan sistematis ke bawah. Untuk menghilangkan bias seperti itu, perlu untuk memperkenalkan koreksi dengan mengalikan bukan nilainya . Kemudian varians statistik yang dikoreksi seperti itu dapat berfungsi sebagai estimasi yang tidak bias untuk varians

. (2.9.8)

Estimasi ini sama konsistennya dengan estimasi , karena untuk .

Dalam praktiknya, daripada estimasi (2.9.8), terkadang lebih mudah menggunakan estimasi ekivalen yang terkait dengan momen statistik awal kedua

. (2.9.9)

Estimasi (2.9.8), (2.9.9) tidak efisien. Dapat ditunjukkan bahwa dalam kasus distribusi normal mereka akan efisien tanpa gejala (kapan akan cenderung ke nilai seminimal mungkin).

Dengan demikian, dimungkinkan untuk merumuskan aturan berikut untuk memproses materi statistik terbatas. Jika dalam percobaan independen variabel acak mengambil nilai dengan ekspektasi dan varians matematis yang tidak diketahui, maka untuk menentukan parameter ini, seseorang harus menggunakan perkiraan perkiraan

(2.9.10)

Akhir pekerjaan -

Topik ini milik:

Catatan kuliah tentang teori probabilitas matematika statistik matematika

Departemen Matematika Tinggi dan Informatika.. catatan kuliah.. dalam matematika..

Jika Anda memerlukan materi tambahan tentang topik ini, atau Anda tidak menemukan apa yang Anda cari, kami sarankan untuk menggunakan pencarian di database karya kami:

Apa yang akan kami lakukan dengan materi yang diterima:

Jika materi ini ternyata bermanfaat bagi Anda, Anda dapat menyimpannya ke halaman Anda di jejaring sosial:

Semua topik di bagian ini:

Teori probabilitas
Teori probabilitas adalah cabang matematika yang mempelajari pola fenomena massa acak. Acak adalah fenomena yang

Definisi statistik probabilitas
Peristiwa adalah fenomena acak yang, sebagai akibat dari pengalaman, mungkin atau mungkin tidak muncul (fenomena dua nilai). Sebutkan peristiwa dalam huruf latin kapital

Ruang acara dasar
Biarkan serangkaian peristiwa dikaitkan dengan beberapa pengalaman, dan: 1) sebagai hasil dari pengalaman, satu-satunya

Tindakan pada acara
Jumlah dua kejadian dan

Permutasi
Banyaknya permutasi elemen yang berbeda dilambangkan

Akomodasi
Penempatan elemen oleh

kombinasi
Kombinasi elemen

Rumus untuk menambahkan probabilitas untuk peristiwa yang tidak kompatibel
Dalil. Probabilitas jumlah dua kejadian yang tidak sesuai sama dengan jumlah peluang kejadian tersebut. (satu

Formula Penambahan Probabilitas untuk Peristiwa Sewenang-wenang
Dalil. Probabilitas jumlah dua kejadian sama dengan jumlah probabilitas kejadian-kejadian ini tanpa probabilitas produknya.

Rumus Perkalian Probabilitas
Biarkan dua peristiwa diberikan. Pertimbangkan sebuah acara

Rumus Probabilitas Total
Membiarkan menjadi kelompok lengkap peristiwa yang tidak kompatibel, mereka disebut hipotesis. Pertimbangkan beberapa acara

Rumus Probabilitas Hipotesis (Bayes)
Pertimbangkan lagi - kelompok lengkap hipotesis yang tidak sesuai dan kejadiannya

Rumus Poisson asimtotik
Dalam kasus di mana jumlah percobaan besar dan kemungkinan terjadinya suatu peristiwa

Variabel diskrit acak
Nilai acak adalah besaran yang, ketika percobaan diulang, dapat mengambil nilai numerik yang tidak sama. Variabel acak disebut diskrit,

Variabel kontinu acak
Jika, sebagai hasil dari percobaan, variabel acak dapat mengambil nilai apa pun dari segmen tertentu atau seluruh sumbu nyata, maka itu disebut kontinu. hukum

Fungsi kepadatan probabilitas dari variabel kontinu acak
Biarkan. Pertimbangkan satu poin dan berikan peningkatan

Karakteristik numerik dari variabel acak
Variabel diskrit atau kontinu acak dianggap terspesifikasi lengkap jika hukum distribusinya diketahui. Memang, mengetahui hukum distribusi, seseorang selalu dapat menghitung probabilitas memukul

Kuantitas variabel acak
Kuantil urutan variabel kontinu acak

Ekspektasi matematis dari variabel acak
Ekspektasi matematis dari variabel acak mencirikan nilai rata-ratanya. Semua nilai variabel acak dikelompokkan di sekitar nilai ini. Pertimbangkan terlebih dahulu variabel diskrit acak

Standar deviasi dan varians variabel acak
Pertimbangkan terlebih dahulu variabel diskrit acak. Karakteristik numerik dari modus, median, kuantil, dan ekspektasi matematis

Momen variabel acak
Selain ekspektasi matematis dan dispersi, teori probabilitas menggunakan karakteristik numerik dari orde yang lebih tinggi, yang disebut momen variabel acak.

Teorema tentang karakteristik numerik dari variabel acak
Teorema 1. Ekspektasi matematis dari variabel non-acak sama dengan nilai ini sendiri. Bukti: Mari

Hukum distribusi binomial

Hukum distribusi poisson
Biarkan variabel diskrit acak mengambil nilai

Hukum distribusi seragam
Hukum distribusi seragam dari variabel kontinu acak adalah hukum fungsi kerapatan probabilitas, yang

hukum distribusi normal
Hukum distribusi normal dari variabel kontinu acak adalah hukum fungsi kerapatan

hukum distribusi eksponensial
Distribusi eksponensial atau eksponensial dari variabel acak digunakan dalam aplikasi teori probabilitas seperti teori antrian, teori keandalan

Sistem variabel acak
Dalam prakteknya, dalam penerapan teori probabilitas, seringkali kita menjumpai masalah dimana hasil suatu eksperimen tidak dijelaskan oleh satu variabel acak, tetapi oleh beberapa variabel acak sekaligus.

Sistem dua variabel diskrit acak
Biarkan dua variabel diskrit acak membentuk suatu sistem. Nilai acak

Sistem dua variabel kontinu acak
Sekarang biarkan sistem dibentuk oleh dua variabel kontinu acak. Hukum distribusi sistem ini disebut mungkin

Hukum distribusi bersyarat
Membiarkan dan bergantung variabel kontinu acak

Karakteristik numerik dari sistem dua variabel acak
Momen awal orde sistem peubah acak

Sistem beberapa variabel acak
Hasil yang diperoleh untuk sistem dua variabel acak dapat digeneralisasikan untuk kasus sistem yang terdiri dari sejumlah variabel acak yang berubah-ubah. Biarkan sistem dibentuk oleh himpunan

Distribusi normal dari sistem dua variabel acak
Pertimbangkan sistem dua variabel kontinu acak. Hukum distribusi sistem ini adalah hukum distribusi normal

Batas teorema teori probabilitas
Tujuan utama dari disiplin teori probabilitas adalah untuk mempelajari pola fenomena massa acak. Praktek menunjukkan bahwa pengamatan massa fenomena acak homogen mengungkapkan

Pertidaksamaan Chebyshev
Pertimbangkan variabel acak dengan harapan matematis

teorema Chebyshev
Jika variabel acak bebas berpasangan dan memiliki varians terbatas yang dibatasi dalam populasi

teorema Bernoulli
Dengan peningkatan tak terbatas dalam jumlah eksperimen, frekuensi kemunculan suatu peristiwa konvergen dalam probabilitas dengan probabilitas suatu peristiwa

teorema limit pusat
Saat menambahkan variabel acak dengan hukum distribusi apa pun, tetapi dengan varians terbatas secara agregat, hukum distribusi

Tugas utama statistik matematika
Hukum-hukum teori peluang yang dibahas di atas merupakan ekspresi matematis dari pola-pola nyata yang benar-benar ada dalam berbagai fenomena massa acak. mempelajari

Sebuah statistik sederhana. Fungsi distribusi statistik
Pertimbangkan beberapa variabel acak yang hukum distribusinya tidak diketahui. Diperlukan berdasarkan pengalaman

Garis statistik. grafik batang
Dengan jumlah pengamatan yang banyak (berurutan ratusan), populasi umum menjadi tidak nyaman dan tidak praktis untuk merekam materi statistik. Untuk kejelasan dan kekompakan, materi statistik

Karakteristik numerik dari distribusi statistik
Dalam teori probabilitas, berbagai karakteristik numerik dari variabel acak dipertimbangkan: ekspektasi matematis, varians, momen awal dan pusat dari berbagai pesanan. Nomor serupa

Pilihan distribusi teoretis dengan metode momen
Dalam setiap distribusi statistik, pasti ada elemen keacakan yang terkait dengan jumlah pengamatan yang terbatas. Dengan sejumlah besar pengamatan, elemen keacakan ini dihaluskan,

Menguji keabsahan hipotesis tentang bentuk hukum distribusi
Biarkan distribusi statistik yang diberikan didekati oleh beberapa kurva teoretis atau

Kriteria Persetujuan
Pertimbangkan salah satu tes kesesuaian yang paling umum digunakan, yang disebut tes Pearson. Menganggap

Estimasi titik untuk parameter distribusi yang tidak diketahui
Dalam hal. 2.1. - 2.7 kami telah mempertimbangkan secara rinci cara memecahkan masalah utama pertama dan kedua statistik matematika. Ini adalah tugas menentukan hukum distribusi variabel acak menurut data eksperimen

Interval kepercayaan. Probabilitas keyakinan
Dalam praktiknya, dengan sejumlah kecil percobaan pada variabel acak, perkiraan penggantian parameter yang tidak diketahui

Misalkan ada variabel acak X, dan parameternya adalah ekspektasi matematis sebuah dan varian tidak diketahui. Atas nilai X, percobaan independen dilakukan, yang memberikan hasil x 1, x 2, x n.

Tanpa mengurangi keumuman penalaran, kami akan menganggap nilai-nilai variabel acak ini berbeda. Kami akan menganggap nilai x 1, x 2, x n sebagai variabel acak independen yang terdistribusi identik X 1, X 2, X n .

Metode estimasi statistik yang paling sederhana - metode substitusi dan analogi - terdiri dari fakta bahwa sebagai perkiraan satu atau lain karakteristik numerik (rata-rata, varians, dll.) dari populasi umum, karakteristik yang sesuai dari distribusi sampel diambil - karakteristik sampel.

Dengan metode substitusi sebagai perkiraan ekspektasi matematis sebuah perlu untuk mengambil ekspektasi matematis dari distribusi sampel - mean sampel. Dengan demikian, kita mendapatkan

Untuk menguji ketidakberpihakan dan konsistensi rata-rata sampel sebagai perkiraan sebuah, pertimbangkan statistik ini sebagai fungsi dari vektor yang dipilih (X 1, X 2, X n). Mempertimbangkan bahwa setiap nilai X 1, X 2, X n memiliki hukum distribusi yang sama dengan nilai X, kami menyimpulkan bahwa karakteristik numerik dari besaran ini dan nilai X adalah sama: M(X saya) = M(X) = sebuah, D(X saya) = D(X) = , saya = 1, 2, n , di mana X i adalah variabel acak bebas kolektif.

Karena itu,

Oleh karena itu, menurut definisi, kami memperoleh itu adalah perkiraan yang tidak bias sebuah, dan karena D()®0 sebagai n®¥, maka berdasarkan teorema paragraf sebelumnya adalah perkiraan yang konsisten dari harapan sebuah populasi umum.

Efisiensi atau inefisiensi penduga tergantung pada bentuk hukum distribusi peubah acak X. Dapat dibuktikan bahwa jika nilai X terdistribusi menurut hukum normal, maka penduga tersebut efisien. Untuk undang-undang distribusi lainnya, ini mungkin tidak terjadi.

Estimasi tak bias dari varians umum adalah varians sampel yang dikoreksi

,

Sebagai , di mana adalah varians umum. Betulkah,

Estimasi s -- 2 untuk varians umum juga konsisten, tetapi tidak efisien. Namun, dalam kasus distribusi normal, itu "efisien asimtotik," yaitu, ketika n meningkat, rasio variansnya terhadap satu minimum yang mungkin mendekati tanpa batas.

Jadi, diberikan sampel dari distribusi F( x) variabel acak X dengan ekspektasi matematis yang tidak diketahui sebuah dan dispersi , maka untuk menghitung nilai parameter ini, kami berhak menggunakan rumus perkiraan berikut:

sebuah ,

.

Disini x-i- - opsi pengambilan sampel, n- i - - opsi frekuensi x i , - - ukuran sampel.
Untuk menghitung varians sampel yang dikoreksi, rumusnya lebih mudah


.

Untuk menyederhanakan perhitungan, disarankan untuk beralih ke opsi bersyarat (menguntungkan untuk mengambil varian awal yang terletak di tengah deret variasi interval sebagai c). Kemudian

, .

estimasi interval

Di atas, kami mempertimbangkan pertanyaan memperkirakan parameter yang tidak diketahui sebuah satu nomor. Kami menyebutnya perkiraan titik perkiraan. Mereka memiliki kelemahan bahwa, dengan ukuran sampel yang kecil, mereka dapat berbeda secara signifikan dari parameter yang diestimasi. Oleh karena itu, untuk mendapatkan gambaran tentang kedekatan antara parameter dan estimasinya, apa yang disebut estimasi interval diperkenalkan dalam statistik matematika.

Biarkan estimasi titik q * ditemukan dalam sampel untuk parameter q. Biasanya, peneliti menetapkan sebelumnya beberapa probabilitas g yang cukup besar (misalnya, 0,95; 0,99 atau 0,999) sedemikian rupa sehingga suatu peristiwa dengan probabilitas g dapat dianggap secara praktis pasti, dan mengajukan pertanyaan untuk menemukan nilai seperti itu e > 0 yang

.

Memodifikasi persamaan ini, kita mendapatkan:

dan dalam hal ini kita akan mengatakan bahwa interval ]q * - e; q * + e[ mencakup estimasi parameter q dengan probabilitas g.

Interval ]q * -e; q * +e [ disebut selang kepercayaan .

Peluang g disebut keandalan (probabilitas kepercayaan) perkiraan interval.

Ujung selang kepercayaan, mis. titik q * -e dan q * +e disebut batas kepercayaan .

Angka e disebut akurasi penilaian .

Sebagai contoh masalah penentuan batas kepercayaan, perhatikan pertanyaan tentang penaksiran ekspektasi matematis dari variabel acak X, yang memiliki hukum distribusi normal dengan parameter sebuah dan s, yaitu X = N( sebuah, s). Harapan matematis dalam kasus ini sama dengan sebuah. Menurut pengamatan X 1 , X 2 , X n hitung rata-ratanya dan evaluasi dispersi s 2 .

Ternyata menurut data sampel, dimungkinkan untuk membangun variabel acak

yang memiliki distribusi Student (atau distribusi-t) dengan n = n -1 derajat kebebasan.

Mari kita gunakan Tabel A.1.3 dan mencari probabilitas yang diberikan g dan angka n angka t g sedemikian rupa sehingga probabilitas

P(|t(n)|< t g) = g,

.

Setelah membuat transformasi yang jelas, kita mendapatkan

Prosedur penerapan kriteria-F adalah sebagai berikut:

1. Sebuah asumsi dibuat tentang distribusi normal populasi. Pada tingkat signifikansi tertentu a, hipotesis nol H 0 dirumuskan: s x 2 = s y 2 tentang kesetaraan varians umum populasi normal di bawah hipotesis bersaing H 1: s x 2 > s y 2 .

2. Dua sampel independen diperoleh dari populasi X dan Y masing-masing n x dan n y.

3. Hitung nilai varians sampel terkoreksi s x 2 dan s y 2 (metode perhitungan dibahas pada 13.4). Semakin besar dispersi (s x 2 atau s y 2) disebut s 1 2, semakin kecil - s 2 2.

4. Nilai kriteria-F dihitung menurut rumus F obs = s 1 2 / s 2 2 .

5. Menurut tabel titik kritis distribusi Fisher - Snedecor, untuk tingkat signifikansi yang diberikan a dan jumlah derajat kebebasan n 1 \u003d n 1 - 1, n 2 \u003d n 2 - 1 (n 1 adalah jumlah derajat kebebasan varians terkoreksi yang lebih besar), titik kritis ditemukan F cr (a, n 1, n 2).

Perhatikan bahwa Tabel A.1.7 menunjukkan nilai kritis dari kriteria F satu arah. Oleh karena itu, jika diterapkan kriteria dua sisi (H 1: s x 2 s y 2), maka titik kritis kanan F cr (a / 2, n 1, n 2) dicari dengan tingkat signifikansi a / 2 (setengah dari yang ditentukan) dan jumlah derajat kebebasan n 1 dan n 2 (n 1 - jumlah derajat kebebasan dispersi yang lebih besar). Titik kritis tangan kiri mungkin tidak ditemukan.

6. Disimpulkan bahwa jika nilai hitung kriteria-F lebih besar atau sama dengan nilai kritis (F obs F cr), maka varians berbeda secara signifikan pada tingkat signifikansi tertentu. Jika tidak (F obs< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Tugas 15.1. Konsumsi bahan baku per unit produksi menurut teknologi lama adalah:

Teknologi baru:

Dengan asumsi bahwa populasi umum X dan Y yang bersesuaian memiliki distribusi normal, periksa apakah konsumsi bahan mentah untuk teknologi baru dan lama tidak berbeda dalam variabilitas, jika kita mengambil tingkat signifikansi a = 0,1.

Keputusan. Kami bertindak dalam urutan yang ditunjukkan di atas.

1. Kami akan menilai variabilitas konsumsi bahan baku untuk teknologi baru dan lama dalam hal nilai dispersi. Jadi, hipotesis nol berbentuk H 0: s x 2 = s y 2 . Sebagai hipotesis yang bersaing, kami menerima hipotesis H 1: s x 2 s y 2, karena kami tidak yakin sebelumnya bahwa salah satu varians umum lebih besar dari yang lain.

2-3. Temukan varians sampel. Untuk menyederhanakan perhitungan, mari beralih ke opsi bersyarat:

u i = x i - 307, v i = y i - 304.

Kami akan menyusun semua perhitungan dalam bentuk tabel berikut:

kamu saya saya aku kamu m saya u saya 2 m saya (u i +1) 2 v saya dan aku n saya v saya n i v i 2 n saya (v i +1) 2
-3 -3 -1 -2
å -
å -

Kontrol: m i u i 2 + 2å m i u i + m i = Kontrol: n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Temukan varians sampel yang dikoreksi:

4. Bandingkan variansnya. Temukan rasio varians terkoreksi yang lebih besar dengan yang lebih kecil:

.

5. Dengan syarat, hipotesis bersaing memiliki bentuk s x 2 s y 2 , oleh karena itu, daerah kritis adalah dua sisi, dan ketika menemukan titik kritis, seseorang harus mengambil tingkat signifikansi yang setengah dari yang diberikan.

Berdasarkan Tabel A.1.7, dengan tingkat signifikansi a/2 = 0,1/2 = 0,05 dan banyaknya derajat kebebasan n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8, kita peroleh titik kritis F cr ( 0,05; 12; 8) = 3,28.

6. Sejak F obl.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

Di atas, ketika menguji hipotesis, diasumsikan bahwa distribusi variabel acak yang diteliti adalah normal. Namun, studi khusus telah menunjukkan bahwa algoritma yang diusulkan sangat stabil (terutama dengan ukuran sampel yang besar) sehubungan dengan penyimpangan dari distribusi normal.