Biarkan ada variabel acak X dengan harapan matematis m dan dispersi D, sedangkan kedua parameter ini tidak diketahui. Lebih besar X diproduksi N eksperimen independen, yang menghasilkan serangkaian N hasil numerik x 1 , x 2 , …, x N. Sebagai perkiraan harapan matematis, wajar untuk mengusulkan rata-rata aritmatika dari nilai-nilai yang diamati
(1) |
Di sini sebagai x saya nilai (angka) spesifik yang diperoleh sebagai hasil dari N eksperimen. Jika kita mengambil orang lain (terlepas dari yang sebelumnya) N percobaan, maka, jelas, kita akan mendapatkan nilai yang berbeda. Jika Anda mengambil lebih banyak N percobaan, kita akan mendapatkan satu nilai baru lagi. Dilambangkan dengan X saya variabel acak yang dihasilkan dari saya percobaan, maka realisasinya X saya akan menjadi angka yang diperoleh sebagai hasil dari percobaan ini. Jelas bahwa variabel acak X saya akan memiliki kepadatan distribusi probabilitas yang sama dengan variabel acak asli X. Kami juga mengasumsikan bahwa variabel acak X saya dan Xj mandiri di saya, tidak sama j(berbagai independen relatif terhadap satu sama lain percobaan). Oleh karena itu, kami menulis ulang rumus (1) dalam bentuk (statistik) yang berbeda:
(2) |
Mari kita tunjukkan bahwa estimasi tidak bias:
Jadi, ekspektasi matematis dari mean sampel sama dengan ekspektasi matematis sebenarnya dari variabel acak m. Ini adalah fakta yang cukup dapat diprediksi dan dimengerti. Oleh karena itu, mean sampel (2) dapat diambil sebagai perkiraan ekspektasi matematis dari variabel acak. Sekarang muncul pertanyaan: apa yang terjadi pada varians dari estimasi ekspektasi ketika jumlah eksperimen meningkat? Perhitungan analitik menunjukkan bahwa
di mana adalah varians dari estimasi ekspektasi matematis (2), dan D- varians sebenarnya dari variabel acak X.
Dari uraian di atas, maka dengan bertambahnya N(jumlah percobaan) varians estimasi menurun, yaitu semakin kita meringkas implementasi independen, semakin dekat dengan nilai yang diharapkan kita mendapatkan perkiraan.
Estimasi varians matematis
Pada pandangan pertama, perkiraan paling alami tampaknya adalah
(3) |
dimana dihitung dengan rumus (2). Mari kita periksa apakah perkiraannya tidak bias. Rumus (3) dapat ditulis sebagai berikut:
Kami mengganti ekspresi (2) ke dalam rumus ini:
Mari kita cari ekspektasi matematis dari estimasi varians:
(4) |
Karena varians dari variabel acak tidak bergantung pada ekspektasi matematis dari variabel acak, kita akan mengambil ekspektasi matematis sama dengan 0, yaitu. m = 0.
(5) | |
pada . | (6) |
Kebutuhan untuk memperkirakan ekspektasi matematis berdasarkan hasil tes muncul dalam masalah di mana hasil eksperimen digambarkan oleh variabel acak dan indikator kualitas objek yang diteliti diambil sebagai ekspektasi matematis dari variabel acak ini. Misalnya, ekspektasi matematis dari waktu aktif suatu sistem dapat diambil sebagai indikator keandalan, dan ketika mengevaluasi efisiensi produksi, ekspektasi matematis dari jumlah produk bagus, dll.
Masalah pendugaan ekspektasi matematis dirumuskan sebagai berikut. Misalkan untuk menentukan nilai yang tidak diketahui dari variabel acak X, itu seharusnya membuat n independen dan bebas dari kesalahan sistematis pengukuran X v X 2 ,..., X hal. Hal ini diperlukan untuk memilih perkiraan terbaik dari harapan matematis.
Estimasi terbaik dan paling umum dari ekspektasi matematis dalam praktik adalah rata-rata aritmatika dari hasil tes
disebut juga statistik atau sampel berarti.
Mari kita tunjukkan bahwa perkiraan tx memenuhi semua persyaratan untuk evaluasi parameter apa pun.
1. Ini mengikuti dari ekspresi (5.10) bahwa
yaitu skor t "x- perkiraan tidak bias.
2. Menurut teorema Chebyshev, rata-rata aritmatika dari hasil tes konvergen dalam probabilitas dengan harapan matematis, yaitu.
Akibatnya, estimasi (5.10) adalah estimasi ekspektasi yang konsisten.
3. Estimasi varians tx, setara
Dengan bertambahnya ukuran sampel, n berkurang tanpa batas. Terbukti bahwa jika variabel acak X tunduk pada hukum distribusi normal, maka untuk sembarang P varians (5.11) akan seminimal mungkin, dan estimasi tx- Estimasi efektif dari ekspektasi matematis. Mengetahui varians dari estimasi memungkinkan untuk membuat penilaian tentang keakuratan penentuan nilai yang tidak diketahui dari ekspektasi matematis menggunakan estimasi ini.
Sebagai perkiraan ekspektasi matematis, mean aritmatika digunakan jika hasil pengukuran sama akuratnya (varians D, saya = 1, 2, ..., P sama di setiap dimensi). Namun, dalam praktiknya, seseorang harus berurusan dengan tugas-tugas di mana hasil pengukurannya tidak sama (misalnya, selama pengujian, pengukuran dilakukan dengan instrumen yang berbeda). Dalam hal ini, estimasi untuk ekspektasi matematis memiliki bentuk
di mana adalah bobot pengukuran ke-i.
Dalam rumus (5.12), hasil setiap pengukuran disertakan dengan bobotnya sendiri Dengan.. Oleh karena itu, evaluasi hasil pengukuran tx ditelepon rata-rata tertimbang.
Dapat ditunjukkan bahwa estimasi (5.12) merupakan estimasi ekspektasi yang tidak bias, konsisten, dan efisien. Varians minimum dari estimasi diberikan oleh
Saat melakukan eksperimen dengan model komputer, masalah serupa muncul ketika perkiraan ditemukan dari hasil beberapa rangkaian pengujian dan jumlah pengujian di setiap rangkaian berbeda. Misalnya, dua rangkaian pengujian dilakukan dengan volume hal 1 dan n 2 , sesuai dengan hasil estimasi t xi dan tx _. Untuk meningkatkan akurasi dan reliabilitas dalam menentukan ekspektasi matematis, hasil dari rangkaian tes ini digabungkan. Untuk melakukan ini, gunakan ekspresi (5.12)
Saat menghitung koefisien C, alih-alih varians D, perkiraannya yang diperoleh dari hasil pengujian di setiap seri diganti.
Pendekatan serupa juga digunakan dalam menentukan probabilitas kejadian acak yang terjadi berdasarkan hasil serangkaian tes.
Untuk memperkirakan ekspektasi matematis dari variabel acak X, selain mean sampel, statistik lain dapat digunakan. Paling sering, anggota deret variasi digunakan untuk tujuan ini, yaitu statistik pesanan, atas dasar perkiraan yang dibuat,
memenuhi syarat utama yaitu konsistensi dan tidak bias.
Asumsikan bahwa deret variasi berisi n = 2k anggota. Kemudian, rata-rata mana pun dapat diambil sebagai perkiraan ekspektasi matematis:
Di mana kaki rata-rata
tidak lain adalah median statistik dari distribusi variabel acak X, karena persamaan yang jelas terjadi
Keuntungan dari median statistik adalah bebas dari pengaruh pengamatan anomali, yang tidak dapat dihindari ketika menggunakan rata-rata pertama, yaitu rata-rata deret variasi jumlah terkecil dan terbesar.
Dengan ukuran sampel yang aneh P = 2k- 1 median statistik adalah elemen tengahnya, mis. ke-anggota seri variasi saya = xk
Ada distribusi yang rata-rata aritmatikanya bukan merupakan estimasi efektif dari ekspektasi matematis, misalnya, distribusi Laplace. Dapat ditunjukkan bahwa untuk distribusi Laplace, penduga efektif rata-rata adalah median sampel.
Terbukti bahwa jika variabel acak X berdistribusi normal, maka dengan ukuran sampel yang cukup besar, hukum distribusi median statistik mendekati normal dengan karakteristik numerik.
Dari perbandingan rumus (5.11) dan (5.14) dapat disimpulkan bahwa penyebaran median statistik adalah 1,57 kali lebih besar dari penyebaran rata-rata aritmatika. Oleh karena itu, rata-rata aritmatika sebagai perkiraan ekspektasi matematis jauh lebih efektif daripada median statistik. Namun, karena kesederhanaan perhitungan, ketidakpekaan terhadap hasil pengukuran anomali ("kontaminasi" sampel), dalam praktiknya, median statistik tetap digunakan sebagai perkiraan ekspektasi matematis.
Perlu diperhatikan bahwa untuk distribusi simetris kontinu, mean dan median adalah sama. Oleh karena itu, median statistik dapat berfungsi sebagai perkiraan yang baik dari ekspektasi matematis hanya untuk distribusi simetris dari variabel acak.
Untuk distribusi miring, median statistik Saya memiliki bias yang signifikan relatif terhadap ekspektasi matematis, oleh karena itu, tidak cocok untuk estimasinya.
Biarkan ada variabel acak X dengan harapan matematis m dan dispersi D, sedangkan kedua parameter ini tidak diketahui. Lebih besar X diproduksi N eksperimen independen, yang menghasilkan serangkaian N hasil numerik x 1 , x 2 , …, x N. Sebagai perkiraan harapan matematis, wajar untuk mengusulkan rata-rata aritmatika dari nilai-nilai yang diamati
(1) |
Di sini sebagai x saya nilai (angka) spesifik yang diperoleh sebagai hasil dari N eksperimen. Jika kita mengambil orang lain (terlepas dari yang sebelumnya) N percobaan, maka, jelas, kita akan mendapatkan nilai yang berbeda. Jika Anda mengambil lebih banyak N percobaan, kita akan mendapatkan satu nilai baru lagi. Dilambangkan dengan X saya variabel acak yang dihasilkan dari saya percobaan, maka realisasinya X saya akan menjadi angka yang diperoleh sebagai hasil dari percobaan ini. Jelas bahwa variabel acak X saya akan memiliki kepadatan distribusi probabilitas yang sama dengan variabel acak asli X. Kami juga mengasumsikan bahwa variabel acak X saya dan Xj mandiri di saya, tidak sama j(berbagai independen relatif terhadap satu sama lain percobaan). Oleh karena itu, kami menulis ulang rumus (1) dalam bentuk (statistik) yang berbeda:
(2) |
Mari kita tunjukkan bahwa estimasi tidak bias:
Jadi, ekspektasi matematis dari mean sampel sama dengan ekspektasi matematis sebenarnya dari variabel acak m. Ini adalah fakta yang cukup dapat diprediksi dan dimengerti. Oleh karena itu, mean sampel (2) dapat diambil sebagai perkiraan ekspektasi matematis dari variabel acak. Sekarang muncul pertanyaan: apa yang terjadi pada varians dari estimasi ekspektasi ketika jumlah eksperimen meningkat? Perhitungan analitik menunjukkan bahwa
di mana adalah varians dari estimasi ekspektasi matematis (2), dan D- varians sebenarnya dari variabel acak X.
Dari uraian di atas, maka dengan bertambahnya N(jumlah percobaan) varians estimasi menurun, yaitu semakin kita meringkas implementasi independen, semakin dekat dengan nilai yang diharapkan kita mendapatkan perkiraan.
Estimasi varians matematis
Pada pandangan pertama, perkiraan paling alami tampaknya adalah
(3) |
dimana dihitung dengan rumus (2). Mari kita periksa apakah perkiraannya tidak bias. Rumus (3) dapat ditulis sebagai berikut:
Kami mengganti ekspresi (2) ke dalam rumus ini:
Mari kita cari ekspektasi matematis dari estimasi varians:
(4) |
Karena varians dari variabel acak tidak bergantung pada ekspektasi matematis dari variabel acak, kita akan mengambil ekspektasi matematis sama dengan 0, yaitu. m = 0.
(5) | |
pada . | (6) |
Biarkan variabel acak dengan harapan dan varians matematis yang tidak diketahui menjadi sasaran eksperimen independen yang menghasilkan hasil - . Mari kita hitung perkiraan yang konsisten dan tidak bias untuk parameter dan .
Sebagai perkiraan untuk harapan matematis, kami mengambil rata-rata aritmatika dari nilai-nilai eksperimental
. (2.9.1)
Menurut hukum bilangan besar, perkiraan ini adalah kaya , dengan besaran probabilitas. Perkiraan yang sama adalah tidak bias , sejauh
. (2.9.2)
Varians dari taksiran ini adalah
. (2.9.3)
Dapat ditunjukkan bahwa untuk distribusi normal, perkiraan ini adalah efisien . Untuk undang-undang lain, ini mungkin tidak terjadi.
Mari kita sekarang memperkirakan varians. Mari kita pilih dulu rumus untuk menaksir dispersi statistik
. (2.9.4)
Mari kita periksa konsistensi estimasi varians. Mari kita buka tanda kurung dalam rumus (2.9.4)
.
Untuk , suku pertama konvergen dalam probabilitas ke kuantitas , di detik - ke . Dengan demikian, perkiraan kami konvergen dalam probabilitas ke varians
,
maka dia adalah kaya .
Mari kita periksa ketidakberpihakan perkiraan untuk kuantitas. Untuk melakukan ini, kami mengganti ekspresi (2.9.1) ke dalam rumus (2.9.4) dan memperhitungkan variabel acak mandiri
,
. (2.9.5)
Mari kita berikan rumus (2.9.5) ke fluktuasi variabel acak
Memperluas tanda kurung, kita dapatkan
,
. (2.9.6)
Mari kita hitung ekspektasi matematis dari nilai (2.9.6), dengan mempertimbangkan bahwa
. (2.9.7)
Relasi (2.9.7) menunjukkan bahwa nilai yang dihitung dengan rumus (2.9.4) bukan penduga tak bias untuk dispersi. Harapan matematisnya tidak sama, tetapi agak kurang. Perkiraan seperti itu menyebabkan kesalahan sistematis ke bawah. Untuk menghilangkan bias seperti itu, perlu untuk memperkenalkan koreksi dengan mengalikan bukan nilainya . Kemudian varians statistik yang dikoreksi seperti itu dapat berfungsi sebagai estimasi yang tidak bias untuk varians
. (2.9.8)
Estimasi ini sama konsistennya dengan estimasi , karena untuk .
Dalam praktiknya, daripada estimasi (2.9.8), terkadang lebih mudah menggunakan estimasi ekivalen yang terkait dengan momen statistik awal kedua
. (2.9.9)
Estimasi (2.9.8), (2.9.9) tidak efisien. Dapat ditunjukkan bahwa dalam kasus distribusi normal mereka akan efisien tanpa gejala (kapan akan cenderung ke nilai seminimal mungkin).
Dengan demikian, dimungkinkan untuk merumuskan aturan berikut untuk memproses materi statistik terbatas. Jika dalam percobaan independen variabel acak mengambil nilai dengan ekspektasi dan varians matematis yang tidak diketahui, maka untuk menentukan parameter ini, seseorang harus menggunakan perkiraan perkiraan
(2.9.10)
Akhir pekerjaan -
Topik ini milik:
Catatan kuliah tentang teori probabilitas matematika statistik matematika
Departemen Matematika Tinggi dan Informatika.. catatan kuliah.. dalam matematika..
Jika Anda memerlukan materi tambahan tentang topik ini, atau Anda tidak menemukan apa yang Anda cari, kami sarankan untuk menggunakan pencarian di database karya kami:
Apa yang akan kami lakukan dengan materi yang diterima:
Jika materi ini ternyata bermanfaat bagi Anda, Anda dapat menyimpannya ke halaman Anda di jejaring sosial:
menciak |
Semua topik di bagian ini:
Teori probabilitas
Teori probabilitas adalah cabang matematika yang mempelajari pola fenomena massa acak. Acak adalah fenomena yang
Definisi statistik probabilitas
Peristiwa adalah fenomena acak yang, sebagai akibat dari pengalaman, mungkin atau mungkin tidak muncul (fenomena dua nilai). Sebutkan peristiwa dalam huruf latin kapital
Ruang acara dasar
Biarkan serangkaian peristiwa dikaitkan dengan beberapa pengalaman, dan: 1) sebagai hasil dari pengalaman, satu-satunya
Tindakan pada acara
Jumlah dua kejadian dan
Permutasi
Banyaknya permutasi elemen yang berbeda dilambangkan
Akomodasi
Penempatan elemen oleh
kombinasi
Kombinasi elemen
Rumus untuk menambahkan probabilitas untuk peristiwa yang tidak kompatibel
Dalil. Probabilitas jumlah dua kejadian yang tidak sesuai sama dengan jumlah peluang kejadian tersebut. (satu
Formula Penambahan Probabilitas untuk Peristiwa Sewenang-wenang
Dalil. Probabilitas jumlah dua kejadian sama dengan jumlah probabilitas kejadian-kejadian ini tanpa probabilitas produknya.
Rumus Perkalian Probabilitas
Biarkan dua peristiwa diberikan. Pertimbangkan sebuah acara
Rumus Probabilitas Total
Membiarkan menjadi kelompok lengkap peristiwa yang tidak kompatibel, mereka disebut hipotesis. Pertimbangkan beberapa acara
Rumus Probabilitas Hipotesis (Bayes)
Pertimbangkan lagi - kelompok lengkap hipotesis yang tidak sesuai dan kejadiannya
Rumus Poisson asimtotik
Dalam kasus di mana jumlah percobaan besar dan kemungkinan terjadinya suatu peristiwa
Variabel diskrit acak
Nilai acak adalah besaran yang, ketika percobaan diulang, dapat mengambil nilai numerik yang tidak sama. Variabel acak disebut diskrit,
Variabel kontinu acak
Jika, sebagai hasil dari percobaan, variabel acak dapat mengambil nilai apa pun dari segmen tertentu atau seluruh sumbu nyata, maka itu disebut kontinu. hukum
Fungsi kepadatan probabilitas dari variabel kontinu acak
Biarkan. Pertimbangkan satu poin dan berikan peningkatan
Karakteristik numerik dari variabel acak
Variabel diskrit atau kontinu acak dianggap terspesifikasi lengkap jika hukum distribusinya diketahui. Memang, mengetahui hukum distribusi, seseorang selalu dapat menghitung probabilitas memukul
Kuantitas variabel acak
Kuantil urutan variabel kontinu acak
Ekspektasi matematis dari variabel acak
Ekspektasi matematis dari variabel acak mencirikan nilai rata-ratanya. Semua nilai variabel acak dikelompokkan di sekitar nilai ini. Pertimbangkan terlebih dahulu variabel diskrit acak
Standar deviasi dan varians variabel acak
Pertimbangkan terlebih dahulu variabel diskrit acak. Karakteristik numerik dari modus, median, kuantil, dan ekspektasi matematis
Momen variabel acak
Selain ekspektasi matematis dan dispersi, teori probabilitas menggunakan karakteristik numerik dari orde yang lebih tinggi, yang disebut momen variabel acak.
Teorema tentang karakteristik numerik dari variabel acak
Teorema 1. Ekspektasi matematis dari variabel non-acak sama dengan nilai ini sendiri. Bukti: Mari
Hukum distribusi binomial
Hukum distribusi poisson
Biarkan variabel diskrit acak mengambil nilai
Hukum distribusi seragam
Hukum distribusi seragam dari variabel kontinu acak adalah hukum fungsi kerapatan probabilitas, yang
hukum distribusi normal
Hukum distribusi normal dari variabel kontinu acak adalah hukum fungsi kerapatan
hukum distribusi eksponensial
Distribusi eksponensial atau eksponensial dari variabel acak digunakan dalam aplikasi teori probabilitas seperti teori antrian, teori keandalan
Sistem variabel acak
Dalam prakteknya, dalam penerapan teori probabilitas, seringkali kita menjumpai masalah dimana hasil suatu eksperimen tidak dijelaskan oleh satu variabel acak, tetapi oleh beberapa variabel acak sekaligus.
Sistem dua variabel diskrit acak
Biarkan dua variabel diskrit acak membentuk suatu sistem. Nilai acak
Sistem dua variabel kontinu acak
Sekarang biarkan sistem dibentuk oleh dua variabel kontinu acak. Hukum distribusi sistem ini disebut mungkin
Hukum distribusi bersyarat
Membiarkan dan bergantung variabel kontinu acak
Karakteristik numerik dari sistem dua variabel acak
Momen awal orde sistem peubah acak
Sistem beberapa variabel acak
Hasil yang diperoleh untuk sistem dua variabel acak dapat digeneralisasikan untuk kasus sistem yang terdiri dari sejumlah variabel acak yang berubah-ubah. Biarkan sistem dibentuk oleh himpunan
Distribusi normal dari sistem dua variabel acak
Pertimbangkan sistem dua variabel kontinu acak. Hukum distribusi sistem ini adalah hukum distribusi normal
Batas teorema teori probabilitas
Tujuan utama dari disiplin teori probabilitas adalah untuk mempelajari pola fenomena massa acak. Praktek menunjukkan bahwa pengamatan massa fenomena acak homogen mengungkapkan
Pertidaksamaan Chebyshev
Pertimbangkan variabel acak dengan harapan matematis
teorema Chebyshev
Jika variabel acak bebas berpasangan dan memiliki varians terbatas yang dibatasi dalam populasi
teorema Bernoulli
Dengan peningkatan tak terbatas dalam jumlah eksperimen, frekuensi kemunculan suatu peristiwa konvergen dalam probabilitas dengan probabilitas suatu peristiwa
teorema limit pusat
Saat menambahkan variabel acak dengan hukum distribusi apa pun, tetapi dengan varians terbatas secara agregat, hukum distribusi
Tugas utama statistik matematika
Hukum-hukum teori peluang yang dibahas di atas merupakan ekspresi matematis dari pola-pola nyata yang benar-benar ada dalam berbagai fenomena massa acak. mempelajari
Sebuah statistik sederhana. Fungsi distribusi statistik
Pertimbangkan beberapa variabel acak yang hukum distribusinya tidak diketahui. Diperlukan berdasarkan pengalaman
Garis statistik. grafik batang
Dengan jumlah pengamatan yang banyak (berurutan ratusan), populasi umum menjadi tidak nyaman dan tidak praktis untuk merekam materi statistik. Untuk kejelasan dan kekompakan, materi statistik
Karakteristik numerik dari distribusi statistik
Dalam teori probabilitas, berbagai karakteristik numerik dari variabel acak dipertimbangkan: ekspektasi matematis, varians, momen awal dan pusat dari berbagai pesanan. Nomor serupa
Pilihan distribusi teoretis dengan metode momen
Dalam setiap distribusi statistik, pasti ada elemen keacakan yang terkait dengan jumlah pengamatan yang terbatas. Dengan sejumlah besar pengamatan, elemen keacakan ini dihaluskan,
Menguji keabsahan hipotesis tentang bentuk hukum distribusi
Biarkan distribusi statistik yang diberikan didekati oleh beberapa kurva teoretis atau
Kriteria Persetujuan
Pertimbangkan salah satu tes kesesuaian yang paling umum digunakan, yang disebut tes Pearson. Menganggap
Estimasi titik untuk parameter distribusi yang tidak diketahui
Dalam hal. 2.1. - 2.7 kami telah mempertimbangkan secara rinci cara memecahkan masalah utama pertama dan kedua statistik matematika. Ini adalah tugas menentukan hukum distribusi variabel acak menurut data eksperimen
Interval kepercayaan. Probabilitas keyakinan
Dalam praktiknya, dengan sejumlah kecil percobaan pada variabel acak, perkiraan penggantian parameter yang tidak diketahui
Misalkan ada variabel acak X, dan parameternya adalah ekspektasi matematis sebuah dan varian tidak diketahui. Atas nilai X, percobaan independen dilakukan, yang memberikan hasil x 1, x 2, x n.
Tanpa mengurangi keumuman penalaran, kami akan menganggap nilai-nilai variabel acak ini berbeda. Kami akan menganggap nilai x 1, x 2, x n sebagai variabel acak independen yang terdistribusi identik X 1, X 2, X n .
Metode estimasi statistik yang paling sederhana - metode substitusi dan analogi - terdiri dari fakta bahwa sebagai perkiraan satu atau lain karakteristik numerik (rata-rata, varians, dll.) dari populasi umum, karakteristik yang sesuai dari distribusi sampel diambil - karakteristik sampel.
Dengan metode substitusi sebagai perkiraan ekspektasi matematis sebuah perlu untuk mengambil ekspektasi matematis dari distribusi sampel - mean sampel. Dengan demikian, kita mendapatkan
Untuk menguji ketidakberpihakan dan konsistensi rata-rata sampel sebagai perkiraan sebuah, pertimbangkan statistik ini sebagai fungsi dari vektor yang dipilih (X 1, X 2, X n). Mempertimbangkan bahwa setiap nilai X 1, X 2, X n memiliki hukum distribusi yang sama dengan nilai X, kami menyimpulkan bahwa karakteristik numerik dari besaran ini dan nilai X adalah sama: M(X saya) = M(X) = sebuah, D(X saya) = D(X) = , saya = 1, 2, n , di mana X i adalah variabel acak bebas kolektif.
Karena itu,
Oleh karena itu, menurut definisi, kami memperoleh itu adalah perkiraan yang tidak bias sebuah, dan karena D()®0 sebagai n®¥, maka berdasarkan teorema paragraf sebelumnya adalah perkiraan yang konsisten dari harapan sebuah populasi umum.
Efisiensi atau inefisiensi penduga tergantung pada bentuk hukum distribusi peubah acak X. Dapat dibuktikan bahwa jika nilai X terdistribusi menurut hukum normal, maka penduga tersebut efisien. Untuk undang-undang distribusi lainnya, ini mungkin tidak terjadi.
Estimasi tak bias dari varians umum adalah varians sampel yang dikoreksi
,
Sebagai , di mana adalah varians umum. Betulkah,
Estimasi s -- 2 untuk varians umum juga konsisten, tetapi tidak efisien. Namun, dalam kasus distribusi normal, itu "efisien asimtotik," yaitu, ketika n meningkat, rasio variansnya terhadap satu minimum yang mungkin mendekati tanpa batas.
Jadi, diberikan sampel dari distribusi F( x) variabel acak X dengan ekspektasi matematis yang tidak diketahui sebuah dan dispersi , maka untuk menghitung nilai parameter ini, kami berhak menggunakan rumus perkiraan berikut:
sebuah ,
.
Disini x-i- -
opsi pengambilan sampel, n- i - - opsi frekuensi x i , -
- ukuran sampel.
Untuk menghitung varians sampel yang dikoreksi, rumusnya lebih mudah
.
Untuk menyederhanakan perhitungan, disarankan untuk beralih ke opsi bersyarat (menguntungkan untuk mengambil varian awal yang terletak di tengah deret variasi interval sebagai c). Kemudian
, .
estimasi interval
Di atas, kami mempertimbangkan pertanyaan memperkirakan parameter yang tidak diketahui sebuah satu nomor. Kami menyebutnya perkiraan titik perkiraan. Mereka memiliki kelemahan bahwa, dengan ukuran sampel yang kecil, mereka dapat berbeda secara signifikan dari parameter yang diestimasi. Oleh karena itu, untuk mendapatkan gambaran tentang kedekatan antara parameter dan estimasinya, apa yang disebut estimasi interval diperkenalkan dalam statistik matematika.
Biarkan estimasi titik q * ditemukan dalam sampel untuk parameter q. Biasanya, peneliti menetapkan sebelumnya beberapa probabilitas g yang cukup besar (misalnya, 0,95; 0,99 atau 0,999) sedemikian rupa sehingga suatu peristiwa dengan probabilitas g dapat dianggap secara praktis pasti, dan mengajukan pertanyaan untuk menemukan nilai seperti itu e > 0 yang
.
Memodifikasi persamaan ini, kita mendapatkan:
dan dalam hal ini kita akan mengatakan bahwa interval ]q * - e; q * + e[ mencakup estimasi parameter q dengan probabilitas g.
Interval ]q * -e; q * +e [ disebut selang kepercayaan .
Peluang g disebut keandalan (probabilitas kepercayaan) perkiraan interval.
Ujung selang kepercayaan, mis. titik q * -e dan q * +e disebut batas kepercayaan .
Angka e disebut akurasi penilaian .
Sebagai contoh masalah penentuan batas kepercayaan, perhatikan pertanyaan tentang penaksiran ekspektasi matematis dari variabel acak X, yang memiliki hukum distribusi normal dengan parameter sebuah dan s, yaitu X = N( sebuah, s). Harapan matematis dalam kasus ini sama dengan sebuah. Menurut pengamatan X 1 , X 2 , X n hitung rata-ratanya dan evaluasi dispersi s 2 .
Ternyata menurut data sampel, dimungkinkan untuk membangun variabel acak
yang memiliki distribusi Student (atau distribusi-t) dengan n = n -1 derajat kebebasan.
Mari kita gunakan Tabel A.1.3 dan mencari probabilitas yang diberikan g dan angka n angka t g sedemikian rupa sehingga probabilitas
P(|t(n)|< t g) = g,
.
Setelah membuat transformasi yang jelas, kita mendapatkan
Prosedur penerapan kriteria-F adalah sebagai berikut:
1. Sebuah asumsi dibuat tentang distribusi normal populasi. Pada tingkat signifikansi tertentu a, hipotesis nol H 0 dirumuskan: s x 2 = s y 2 tentang kesetaraan varians umum populasi normal di bawah hipotesis bersaing H 1: s x 2 > s y 2 .
2. Dua sampel independen diperoleh dari populasi X dan Y masing-masing n x dan n y.
3. Hitung nilai varians sampel terkoreksi s x 2 dan s y 2 (metode perhitungan dibahas pada 13.4). Semakin besar dispersi (s x 2 atau s y 2) disebut s 1 2, semakin kecil - s 2 2.
4. Nilai kriteria-F dihitung menurut rumus F obs = s 1 2 / s 2 2 .
5. Menurut tabel titik kritis distribusi Fisher - Snedecor, untuk tingkat signifikansi yang diberikan a dan jumlah derajat kebebasan n 1 \u003d n 1 - 1, n 2 \u003d n 2 - 1 (n 1 adalah jumlah derajat kebebasan varians terkoreksi yang lebih besar), titik kritis ditemukan F cr (a, n 1, n 2).
Perhatikan bahwa Tabel A.1.7 menunjukkan nilai kritis dari kriteria F satu arah. Oleh karena itu, jika diterapkan kriteria dua sisi (H 1: s x 2 s y 2), maka titik kritis kanan F cr (a / 2, n 1, n 2) dicari dengan tingkat signifikansi a / 2 (setengah dari yang ditentukan) dan jumlah derajat kebebasan n 1 dan n 2 (n 1 - jumlah derajat kebebasan dispersi yang lebih besar). Titik kritis tangan kiri mungkin tidak ditemukan.
6. Disimpulkan bahwa jika nilai hitung kriteria-F lebih besar atau sama dengan nilai kritis (F obs F cr), maka varians berbeda secara signifikan pada tingkat signifikansi tertentu. Jika tidak (F obs< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.
Tugas 15.1. Konsumsi bahan baku per unit produksi menurut teknologi lama adalah:
Teknologi baru:
Dengan asumsi bahwa populasi umum X dan Y yang bersesuaian memiliki distribusi normal, periksa apakah konsumsi bahan mentah untuk teknologi baru dan lama tidak berbeda dalam variabilitas, jika kita mengambil tingkat signifikansi a = 0,1.
Keputusan. Kami bertindak dalam urutan yang ditunjukkan di atas.
1. Kami akan menilai variabilitas konsumsi bahan baku untuk teknologi baru dan lama dalam hal nilai dispersi. Jadi, hipotesis nol berbentuk H 0: s x 2 = s y 2 . Sebagai hipotesis yang bersaing, kami menerima hipotesis H 1: s x 2 s y 2, karena kami tidak yakin sebelumnya bahwa salah satu varians umum lebih besar dari yang lain.
2-3. Temukan varians sampel. Untuk menyederhanakan perhitungan, mari beralih ke opsi bersyarat:
u i = x i - 307, v i = y i - 304.
Kami akan menyusun semua perhitungan dalam bentuk tabel berikut:
kamu saya | saya | aku kamu | m saya u saya 2 | m saya (u i +1) 2 | v saya | dan aku | n saya v saya | n i v i 2 | n saya (v i +1) 2 | |
-3 | -3 | -1 | -2 | |||||||
å | - | |||||||||
å | - |
Kontrol: m i u i 2 + 2å m i u i + m i = Kontrol: n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67
Temukan varians sampel yang dikoreksi:
4. Bandingkan variansnya. Temukan rasio varians terkoreksi yang lebih besar dengan yang lebih kecil:
.
5. Dengan syarat, hipotesis bersaing memiliki bentuk s x 2 s y 2 , oleh karena itu, daerah kritis adalah dua sisi, dan ketika menemukan titik kritis, seseorang harus mengambil tingkat signifikansi yang setengah dari yang diberikan.
Berdasarkan Tabel A.1.7, dengan tingkat signifikansi a/2 = 0,1/2 = 0,05 dan banyaknya derajat kebebasan n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8, kita peroleh titik kritis F cr ( 0,05; 12; 8) = 3,28.
6. Sejak F obl.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.
Di atas, ketika menguji hipotesis, diasumsikan bahwa distribusi variabel acak yang diteliti adalah normal. Namun, studi khusus telah menunjukkan bahwa algoritma yang diusulkan sangat stabil (terutama dengan ukuran sampel yang besar) sehubungan dengan penyimpangan dari distribusi normal.