Interval kepercayaan standar. Interval kepercayaan

Target– untuk mengajarkan algoritma kepada siswa untuk menghitung interval kepercayaan dari parameter statistik.

Selama pemrosesan statistik data, rata-rata aritmatika yang dihitung, koefisien variasi, koefisien korelasi, kriteria perbedaan, dan statistik titik lainnya harus menerima batas kepercayaan kuantitatif, yang menunjukkan kemungkinan fluktuasi indikator naik dan turun dalam interval kepercayaan.

Contoh 3.1 . Distribusi kalsium dalam serum darah monyet, seperti yang telah ditetapkan sebelumnya, ditandai dengan indikator selektif berikut: = 11,94 mg%; = 0,127 mg%; n= 100. Diperlukan untuk menentukan selang kepercayaan untuk rata-rata umum ( ) dengan probabilitas keyakinan P = 0,95.

Rata-rata umum adalah dengan probabilitas tertentu dalam interval:

, di mana – sampel rata-rata aritmatika; t- Kriteria siswa; adalah kesalahan rata-rata aritmatika.

Menurut tabel "Nilai kriteria Siswa" kami menemukan nilainya dengan tingkat kepercayaan 0,95 dan jumlah derajat kebebasan k\u003d 100-1 \u003d 99. Sama dengan 1,982. Bersama dengan nilai rata-rata aritmatika dan kesalahan statistik, kami mensubstitusikannya ke dalam rumus:

atau 11.69
12,19

Jadi, dengan probabilitas 95%, dapat dikatakan bahwa rata-rata umum dari distribusi normal ini adalah antara 11,69 dan 12,19 mg%.

Contoh 3.2 . Tentukan batas interval kepercayaan 95% untuk varians umum ( ) distribusi kalsium dalam darah monyet, jika diketahui bahwa
= 1,60, dengan n = 100.

Untuk memecahkan masalah, Anda dapat menggunakan rumus berikut:

Di mana adalah kesalahan statistik varians.

Temukan kesalahan varians sampel menggunakan rumus:
. Itu sama dengan 0,11. Berarti t- kriteria dengan probabilitas kepercayaan 0,95 dan jumlah derajat kebebasan k= 100-1 = 99 diketahui dari contoh sebelumnya.

Mari gunakan rumus dan dapatkan:

atau 1.38
1,82

Interval kepercayaan yang lebih akurat untuk varians umum dapat dibangun menggunakan (chi-kuadrat) - Tes Pearson. Poin kritis untuk kriteria ini diberikan dalam tabel khusus. Saat menggunakan kriteria tingkat signifikansi dua sisi digunakan untuk membangun interval kepercayaan. Untuk batas bawah, tingkat signifikansi dihitung dengan rumus
, untuk bagian atas
. Misalnya, untuk tingkat kepercayaan = 0,99= 0,010,= 0,990. Dengan demikian, menurut tabel distribusi nilai kritis , dengan tingkat kepercayaan yang dihitung dan jumlah derajat kebebasan k= 100 – 1= 99, cari nilainya
dan
. Kita mendapatkan
sama dengan 135,80, dan
sama dengan 70,06.

Untuk menemukan batas kepercayaan dari varians umum menggunakan kami menggunakan rumus: untuk batas bawah
, untuk batas atas
. Gantikan data tugas dengan nilai yang ditemukan ke dalam rumus:
= 1,17;
= 2.26. Jadi, dengan tingkat kepercayaan P= 0,99 atau 99% varians umum akan terletak pada kisaran 1,17 hingga 2,26 mg% inklusif.

Contoh 3.3 . Di antara 1000 benih gandum dari lot yang tiba di lift, ditemukan 120 benih yang terinfeksi ergot. Penting untuk menentukan batas-batas yang mungkin dari proporsi total benih yang terinfeksi dalam batch gandum tertentu.

Batas kepercayaan untuk bagian umum untuk semua nilai yang mungkin harus ditentukan dengan rumus:

,

Di mana n adalah jumlah pengamatan; m adalah jumlah mutlak dari salah satu kelompok; t adalah deviasi ternormalisasi.

Fraksi sampel benih yang terinfeksi sama dengan
atau 12%. Dengan tingkat kepercayaan R= 95% deviasi ternormalisasi ( t-Kriteria siswa untuk k =
)t = 1,960.

Kami mengganti data yang tersedia ke dalam rumus:

Oleh karena itu, batas-batas selang kepercayaan adalah = 0,122–0,041 = 0,081, atau 8,1%; = 0,122 + 0,041 = 0,163, atau 16,3%.

Dengan demikian, dengan tingkat kepercayaan 95%, dapat dinyatakan bahwa proporsi total benih yang terinfeksi adalah antara 8,1 dan 16,3%.

Contoh 3.4 . Koefisien variasi, yang mencirikan variasi kalsium (mg%) dalam serum darah monyet, adalah sebesar 10,6%. Ukuran sampel n= 100. Perlu untuk menentukan batas-batas interval kepercayaan 95% untuk parameter umum CV.

Batas kepercayaan untuk koefisien variasi umum CV ditentukan dengan rumus berikut:

dan
, di mana K nilai antara dihitung dengan rumus
.

Mengetahui itu dengan tingkat kepercayaan R= 95% deviasi ternormalisasi (Uji-t siswa untuk k =
)t = 1,960, hitung dulu nilainya KE:

.

atau 9,3%

atau 12,3%

Dengan demikian, koefisien variasi umum dengan probabilitas kepercayaan 95% terletak pada kisaran 9,3 hingga 12,3%. Dengan sampel berulang, koefisien variasi tidak akan melebihi 12,3% dan tidak akan turun di bawah 9,3% dalam 95 kasus dari 100.

Pertanyaan untuk pengendalian diri:

Tugas untuk solusi independen.

1. Rata-rata persentase lemak dalam susu untuk laktasi sapi persilangan Kholmogory adalah sebagai berikut: 3,4; 3.6; 3.2; 3.1; 2.9; 3.7; 3.2; 3.6; 4.0; 3.4; 4.1; 3.8; 3.4; 4.0; 3.3; 3.7; 3.5; 3.6; 3.4; 3.8. Tetapkan interval kepercayaan untuk rata-rata keseluruhan pada tingkat kepercayaan 95% (20 poin).

2. Pada 400 tanaman gandum hitam hibrida, bunga pertama muncul rata-rata 70,5 hari setelah tanam. Standar deviasi adalah 6,9 hari. Tentukan kesalahan rata-rata dan interval kepercayaan untuk rata-rata populasi dan varians pada tingkat signifikansi W= 0,05 dan W= 0,01 (25 poin).

3. Saat mempelajari panjang daun dari 502 spesimen stroberi kebun, diperoleh data sebagai berikut: = 7,86 cm; = 1,32 cm, \u003d ± 0,06 cm Tentukan interval kepercayaan untuk rata-rata aritmatika populasi dengan tingkat signifikansi 0,01; 0,02; 0,05. (25 poin).

4. Saat memeriksa 150 pria dewasa, tinggi rata-rata adalah 167 cm, dan σ \u003d 6 cm Berapa batas rata-rata umum dan varians umum dengan probabilitas kepercayaan 0,99 dan 0,95? (25 poin).

5. Distribusi kalsium dalam serum darah monyet ditandai dengan indikator selektif berikut: = 11,94 mg%, σ = 1,27, n = 100. Plot selang kepercayaan 95% untuk rata-rata populasi dari distribusi ini. Hitung koefisien variasi (25 poin).

6. Telah dipelajari kandungan nitrogen total dalam plasma darah tikus albino umur 37 dan 180 hari. Hasil dinyatakan dalam gram per 100 cm3 plasma. Pada umur 37 hari, 9 ekor tikus memiliki: 0,98; 0,83; 0,99; 0,86; 0,90; 0,81; 0,94; 0,92; 0,87. Pada umur 180 hari, 8 ekor tikus memiliki: 1,20; 1.18; 1.33; 1.21; 1.20; 1,07; 1.13; 1.12. Tetapkan interval kepercayaan untuk perbedaan dengan tingkat kepercayaan 0,95 (50 poin).

7. Tentukan batas interval kepercayaan 95% untuk varians umum distribusi kalsium (mg%) dalam serum darah monyet, jika untuk distribusi ini ukuran sampel n = 100, kesalahan statistik varians sampel s σ 2 = 1,60 (40 poin).

8. Tentukan batas selang kepercayaan 95% untuk varians umum sebaran 40 bulir gandum sepanjang (σ 2 = 40,87 mm 2). (25 poin).

9. Merokok dianggap sebagai faktor utama predisposisi penyakit paru obstruktif. Perokok pasif tidak dianggap sebagai faktor seperti itu. Para ilmuwan mempertanyakan keamanan perokok pasif dan memeriksa jalan napas pada non-perokok, perokok pasif dan aktif. Untuk mengkarakterisasi keadaan saluran pernapasan, kami mengambil salah satu indikator fungsi pernapasan eksternal - kecepatan volumetrik maksimum dari tengah pernafasan. Penurunan indikator ini merupakan tanda gangguan patensi jalan napas. Data survei ditampilkan dalam tabel.

Jumlah yang diperiksa

Laju aliran pertengahan ekspirasi maksimum, l/s

Standar deviasi

Bukan perokok

bekerja di area bebas rokok

bekerja di ruangan yang dipenuhi asap

perokok

merokok sedikit

rata-rata jumlah perokok

merokok banyak rokok

Dari tabel, cari selang kepercayaan 95% untuk rata-rata umum dan varians umum untuk masing-masing kelompok. Apa perbedaan antara kelompok? Sajikan hasilnya secara grafis (25 poin).

10. Tentukan batas selang kepercayaan 95% dan 99% untuk varians umum jumlah anak babi dalam 64 peternakan, jika eror statistik varians sampel s σ 2 = 8,25 (30 poin).

11. Diketahui berat rata-rata kelinci adalah 2,1 kg. Tentukan batas interval kepercayaan 95% dan 99% untuk rata-rata dan varians umum ketika n= 30, = 0,56 kg (25 poin).

12. Dalam 100 tongkol diukur kandungan bulir tongkolnya ( X), panjang paku ( kamu) dan massa biji-bijian di telinga ( Z). Temukan interval kepercayaan untuk rata-rata umum dan varians untuk P 1 = 0,95, P 2 = 0,99, P 3 = 0,999 jika = 19, = 6,766 cm, = 0,554 gram; x 2 = 29,153, y 2 = 2,111, z 2 = 0,064 (25 poin).

13. Dalam 100 bulir gandum musim dingin yang dipilih secara acak, jumlah bulir dihitung. Kumpulan sampel dicirikan oleh indikator berikut: = 15 bulir dan = 2,28 buah. Tentukan akurasi dengan mana hasil rata-rata diperoleh ( ) dan plot interval kepercayaan untuk mean dan varians keseluruhan pada tingkat signifikansi 95% dan 99% (30 poin).

14. Jumlah tulang rusuk pada cangkang fosil moluska Orthambonit kaligram:

Diketahui bahwa n = 19, σ = 4.25. Tentukan batas interval kepercayaan untuk rata-rata umum dan varians umum pada tingkat signifikansi W = 0,01 (25 poin).

15. Untuk menentukan hasil susu di peternakan sapi perah komersial, produktivitas 15 ekor sapi ditentukan setiap hari. Menurut data untuk tahun tersebut, setiap sapi rata-rata memberikan jumlah susu sebagai berikut per hari (l): 22; sembilan belas; 25; 20; 27; 17; tigapuluh; 21; delapan belas; 24; 26; 23; 25; 20; 24. Plot interval kepercayaan untuk varians umum dan mean aritmatika. Bisakah kita mengharapkan rata-rata hasil susu tahunan per sapi menjadi 10.000 liter? (50 poin).

16. Untuk menentukan rata-rata hasil gandum untuk pertanian, pemotongan dilakukan pada petak contoh 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 dan 2 ha. Hasil (c/ha) dari plot adalah 39,4; 38; 35.8; 40; 35; 42,7; 39.3; 41.6; 33; 42; 29 masing-masing. Plot interval kepercayaan untuk varians umum dan mean aritmatika. Apakah mungkin untuk mengharapkan bahwa hasil rata-rata untuk usaha pertanian akan menjadi 42 c/ha? (50 poin).

Dalam statistik, ada dua jenis perkiraan: titik dan interval. Estimasi Poin adalah statistik sampel tunggal yang digunakan untuk memperkirakan parameter populasi. Misalnya, sampel berarti adalah estimasi titik dari rata-rata populasi, dan varians sampel S2- estimasi titik varians populasi 2. itu menunjukkan bahwa rata-rata sampel adalah perkiraan yang tidak bias dari harapan populasi. Rata-rata sampel disebut tidak bias karena rata-rata dari semua rata-rata sampel (dengan ukuran sampel yang sama) n) sama dengan ekspektasi matematis dari populasi umum.

Agar varians sampel S2 menjadi penduga tak bias dari varians populasi 2, penyebut varians sampel harus sama dengan n – 1 , tapi tidak n. Dengan kata lain, varians populasi adalah rata-rata dari semua varians sampel yang mungkin.

Ketika memperkirakan parameter populasi, harus diingat bahwa statistik sampel seperti: , tergantung pada sampel tertentu. Untuk mempertimbangkan fakta ini, untuk mendapatkan estimasi interval harapan matematis dari populasi umum menganalisis distribusi rata-rata sampel (untuk lebih jelasnya, lihat). Interval yang dibangun dicirikan oleh tingkat kepercayaan tertentu, yang merupakan probabilitas bahwa parameter sebenarnya dari populasi umum diperkirakan dengan benar. Interval kepercayaan serupa dapat digunakan untuk memperkirakan proporsi fitur R dan massa terdistribusi utama dari populasi umum.

Unduh catatan dalam atau format, contoh dalam format

Konstruksi interval kepercayaan untuk ekspektasi matematis dari populasi umum dengan standar deviasi yang diketahui

Membangun interval kepercayaan untuk proporsi suatu sifat dalam populasi umum

Pada bagian ini, konsep interval kepercayaan diperluas ke data kategorikal. Ini memungkinkan Anda untuk memperkirakan pangsa sifat dalam populasi umum R dengan sampel berbagi RS= X/n. Seperti yang disebutkan, jika nilai-nilai nR dan n(1 - hal) melebihi angka 5, distribusi binomial dapat didekati dengan distribusi normal. Oleh karena itu, untuk memperkirakan bagian suatu sifat dalam populasi umum R adalah mungkin untuk membangun interval yang tingkat kepercayaannya sama dengan (1 - )x100%.


di mana pS- sampel berbagi fitur, sama dengan X/n, yaitu jumlah keberhasilan dibagi dengan ukuran sampel, R- bagian dari sifat dalam populasi umum, Z adalah nilai kritis dari distribusi normal standar, n- ukuran sampel.

Contoh 3 Mari kita asumsikan bahwa sampel diambil dari sistem informasi, terdiri dari 100 faktur yang diselesaikan selama sebulan terakhir. Katakanlah 10 dari faktur ini salah. Dengan demikian, R= 10/100 = 0,1. Tingkat kepercayaan 95% sesuai dengan nilai kritis Z = 1,96.

Dengan demikian, ada kemungkinan 95% bahwa antara 4,12% dan 15,88% faktur berisi kesalahan.

Untuk ukuran sampel tertentu, interval kepercayaan yang mengandung proporsi sifat dalam populasi umum tampaknya lebih lebar daripada variabel acak kontinu. Ini karena pengukuran variabel acak kontinu mengandung lebih banyak informasi daripada pengukuran data kategorikal. Dengan kata lain, data kategorikal yang hanya mengambil dua nilai mengandung informasi yang tidak cukup untuk memperkirakan parameter distribusinya.

PADAperhitungan perkiraan yang diambil dari populasi yang terbatas

Estimasi ekspektasi matematis. Faktor koreksi untuk populasi akhir ( fpc) digunakan untuk mengurangi kesalahan standar dengan faktor . Saat menghitung interval kepercayaan untuk estimasi parameter populasi, faktor koreksi diterapkan dalam situasi di mana sampel diambil tanpa pengembalian. Jadi, selang kepercayaan untuk ekspektasi matematis, yang memiliki tingkat kepercayaan sama dengan (1 - )x100%, dihitung dengan rumus:

Contoh 4 Untuk mengilustrasikan penerapan faktor koreksi untuk populasi yang terbatas, mari kita kembali ke masalah menghitung interval kepercayaan untuk jumlah rata-rata faktur yang dibahas dalam Contoh 3 di atas Misalkan sebuah perusahaan menerbitkan 5.000 faktur per bulan, dan X=110,27 USD, S= $28,95 N = 5000, n = 100, α = 0,05, t99 = 1,9842. Menurut rumus (6) kita mendapatkan:

Estimasi pangsa fitur. Saat memilih no return, interval kepercayaan untuk proporsi fitur yang memiliki tingkat kepercayaan sama dengan (1 - )x100%, dihitung dengan rumus:

Interval kepercayaan dan masalah etika

Saat mengambil sampel populasi dan merumuskan kesimpulan statistik, masalah etika sering muncul. Yang utama adalah bagaimana interval kepercayaan dan estimasi titik dari statistik sampel setuju. Menerbitkan perkiraan titik tanpa menentukan interval kepercayaan yang sesuai (biasanya pada tingkat kepercayaan 95%) dan ukuran sampel dari mana mereka berasal dapat menyesatkan. Ini mungkin memberi kesan kepada pengguna bahwa perkiraan titik adalah persis apa yang dia butuhkan untuk memprediksi sifat-sifat seluruh populasi. Dengan demikian, perlu dipahami bahwa dalam penelitian apa pun, bukan titik, tetapi perkiraan interval harus diletakkan di garis depan. Selain itu, perhatian khusus harus diberikan pada pilihan ukuran sampel yang benar.

Paling sering, objek manipulasi statistik adalah hasil survei sosiologis penduduk tentang berbagai masalah politik. Pada saat yang sama, hasil survei ditempatkan di halaman depan surat kabar, dan kesalahan pengambilan sampel dan metodologi analisis statistik dicetak di suatu tempat di tengah. Untuk membuktikan validitas estimasi titik yang diperoleh, perlu untuk menunjukkan ukuran sampel berdasarkan mana mereka diperoleh, batas-batas interval kepercayaan dan tingkat signifikansinya.

Catatan berikutnya

Bahan dari buku Levin et al.Statistik untuk manajer digunakan. - M.: Williams, 2004. - hlm. 448–462

teorema limit pusat menyatakan bahwa, mengingat ukuran sampel yang cukup besar, distribusi sampel rata-rata dapat didekati dengan distribusi normal. Properti ini tidak tergantung pada jenis distribusi populasi.

Dalam subbagian sebelumnya, kami mempertimbangkan pertanyaan tentang memperkirakan parameter yang tidak diketahui sebuah satu nomor. Penilaian semacam itu disebut "titik". Dalam sejumlah tugas, diperlukan tidak hanya untuk menemukan parameter sebuah nilai numerik yang sesuai, tetapi juga mengevaluasi akurasi dan keandalannya. Diperlukan untuk mengetahui kesalahan apa yang dapat ditimbulkan oleh substitusi parameter sebuah perkiraan titiknya sebuah dan dengan tingkat kepercayaan apa kita dapat berharap bahwa kesalahan ini tidak akan melampaui batas yang diketahui?

Masalah semacam ini sangat relevan untuk sejumlah kecil pengamatan, ketika estimasi titik dan masuk sebagian besar acak dan perkiraan penggantian a dengan a dapat menyebabkan kesalahan serius.

Untuk memberikan gambaran tentang keakuratan dan keandalan perkiraan sebuah,

dalam statistik matematika, apa yang disebut interval kepercayaan dan probabilitas kepercayaan digunakan.

Biarkan untuk parameter sebuah berasal dari pengalaman perkiraan yang tidak bias sebuah. Kami ingin memperkirakan kemungkinan kesalahan dalam kasus ini. Mari kita tentukan beberapa probabilitas p yang cukup besar (misalnya, p = 0,9, 0,95, atau 0,99) sedemikian rupa sehingga suatu peristiwa dengan probabilitas p dapat dianggap secara praktis pasti, dan temukan nilai s yang

Kemudian kisaran nilai yang mungkin dari kesalahan yang terjadi saat mengganti sebuah pada sebuah, akan menjadi ± s; kesalahan absolut besar hanya akan muncul dengan probabilitas kecil a = 1 - p. Mari kita tulis ulang (14.3.1) sebagai:

Kesetaraan (14.3.2) berarti bahwa dengan probabilitas p nilai parameter yang tidak diketahui sebuah termasuk dalam interval

Dalam hal ini, satu keadaan harus diperhatikan. Sebelumnya, kami berulang kali mempertimbangkan probabilitas variabel acak jatuh ke dalam interval non-acak yang diberikan. Di sini situasinya berbeda: sebuah tidak acak, tetapi interval acak / r. Secara acak posisinya pada sumbu x, ditentukan oleh pusatnya sebuah; secara umum, panjang interval 2s juga acak, karena nilai s dihitung, sebagai aturan, dari data eksperimen. Oleh karena itu, dalam hal ini, akan lebih baik untuk menafsirkan nilai p bukan sebagai probabilitas "menekan" titik sebuah ke dalam interval / p, tetapi sebagai probabilitas bahwa interval acak / p akan mencakup titik sebuah(Gbr. 14.3.1).

Beras. 14.3.1

Peluang p disebut tingkat kepercayaan diri, dan interval / p - interval kepercayaan. Batas interval jika. a x \u003d a- pasir a2 = a + dan disebut batas kepercayaan.

Mari kita beri satu interpretasi lagi pada konsep interval kepercayaan: ini dapat dianggap sebagai interval nilai parameter sebuah, kompatibel dengan data eksperimen dan tidak bertentangan dengannya. Memang, jika kita setuju untuk menganggap suatu peristiwa dengan probabilitas a = 1-p praktis tidak mungkin, maka nilai-nilai parameter a yang A A> s harus diakui sebagai kontradiksi dengan data eksperimen, dan yang |a - sebuah a t na 2 .

Biarkan untuk parameter sebuah ada perkiraan yang tidak bias sebuah. Jika kita mengetahui hukum distribusi kuantitas sebuah, masalah menemukan interval kepercayaan akan cukup sederhana: itu akan cukup untuk menemukan nilai s yang

Kesulitannya terletak pada kenyataan bahwa hukum distribusi estimasi sebuah tergantung pada hukum distribusi kuantitas X dan, akibatnya, pada parameternya yang tidak diketahui (khususnya, pada parameter itu sendiri sebuah).

Untuk mengatasi kesulitan ini, seseorang dapat menerapkan trik perkiraan kasar berikut ini: ganti parameter yang tidak diketahui dalam ekspresi untuk s dengan perkiraan titiknya. Dengan jumlah eksperimen yang relatif besar P(sekitar 20…30) teknik ini biasanya memberikan hasil yang memuaskan dari segi akurasi.

Sebagai contoh, pertimbangkan masalah interval kepercayaan untuk ekspektasi matematis.

Biarkan diproduksi P x, yang karakteristiknya adalah ekspektasi matematis t dan varians D- tidak dikenal. Untuk parameter ini, perkiraan berikut diperoleh:

Diperlukan untuk membangun interval kepercayaan / , sesuai dengan probabilitas kepercayaan , untuk ekspektasi matematis t kuantitas x.

Dalam memecahkan masalah ini, kami menggunakan fakta bahwa kuantitas t adalah jumlah P variabel acak independen yang terdistribusi identik X h dan menurut teorema limit pusat untuk cukup besar P hukum distribusinya mendekati normal. Dalam praktiknya, bahkan dengan jumlah suku yang relatif kecil (dari urutan 10 ... 20), hukum distribusi dari jumlah tersebut dapat dianggap normal. Kami akan mengasumsikan bahwa nilai t didistribusikan menurut hukum normal. Karakteristik hukum ini - ekspektasi matematis dan varians - masing-masing sama t dan

(lihat bab 13 ayat 13.3). Mari kita asumsikan bahwa nilainya D diketahui oleh kami dan kami akan menemukan nilai Ep yang

Menerapkan rumus (6.3.5) dari Bab 6, kami menyatakan probabilitas di sisi kiri (14.3.5) dalam hal fungsi distribusi normal

di mana adalah standar deviasi dari perkiraan t.

Dari persamaan

temukan nilai Sp:

di mana arg * (x) adalah fungsi invers dari * (X), itu. nilai argumen yang fungsi distribusi normalnya sama dengan X.

Penyebaran D, melalui mana nilai dinyatakan sebuah 1P, kami tidak tahu persis; sebagai nilai perkiraannya, Anda dapat menggunakan perkiraan D(14.3.4) dan masukkan kira-kira:

Jadi, masalah membangun interval kepercayaan kira-kira diselesaikan, yang sama dengan:

di mana gp didefinisikan oleh rumus (14.3.7).

Untuk menghindari interpolasi terbalik dalam tabel fungsi * (l) saat menghitung s p, akan lebih mudah untuk menyusun tabel khusus (Tabel 14.3.1), yang mencantumkan nilai kuantitas

tergantung r Nilai (p menentukan hukum normal banyaknya simpangan baku yang harus disisihkan ke kanan dan kiri pusat dispersi sehingga peluang jatuh ke daerah yang dihasilkan sama dengan p.

Melalui nilai 7 p, interval kepercayaan dinyatakan sebagai:

Tabel 14.3.1

Contoh 1. 20 percobaan dilakukan pada nilai x; hasilnya ditampilkan dalam tabel. 14.3.2.

Tabel 14.3.2

Diperlukan untuk menemukan perkiraan untuk ekspektasi matematis dari kuantitas X dan membangun interval kepercayaan yang sesuai dengan tingkat kepercayaan p = 0,8.

Keputusan. Kita punya:

Memilih asal n: = 10, menurut rumus ketiga (14.2.14) kami menemukan taksiran yang tidak bias D :

Menurut tabel 14.3.1 kita menemukan

Batas keyakinan:

Interval kepercayaan:

Nilai parameter t, berbaring di interval ini kompatibel dengan data eksperimen yang diberikan dalam tabel. 14.3.2.

Dengan cara yang sama, interval kepercayaan dapat dibangun untuk varians.

Biarkan diproduksi P percobaan independen pada variabel acak X dengan parameter yang tidak diketahui dari dan A, dan untuk varians D taksiran tak bias diperoleh:

Diperlukan kira-kira untuk membangun interval kepercayaan untuk varians.

Dari rumus (14.3.11) dapat diketahui bahwa nilai D mewakili

jumlah P variabel acak dari bentuk. Nilai-nilai ini tidak

independen, karena salah satunya termasuk kuantitas t, tergantung pada orang lain. Namun, dapat ditunjukkan bahwa sebagai P hukum distribusi jumlah mereka juga mendekati normal. Hampir pukul P= 20...30 sudah bisa dibilang biasa saja.

Mari kita asumsikan demikian, dan temukan karakteristik hukum ini: ekspektasi dan varians matematis. Sejak skor D- tidak bias, maka M[D] = D

Perhitungan Varians DD dikaitkan dengan perhitungan yang relatif kompleks, jadi kami memberikan ekspresinya tanpa derivasi:

di mana c 4 - momen pusat keempat kuantitas x.

Untuk menggunakan ekspresi ini, Anda harus menggantinya dengan nilai 4 dan D(setidaknya perkiraan). Alih-alih D Anda dapat menggunakan evaluasi D. Pada prinsipnya, momen pusat keempat juga dapat diganti dengan perkiraannya, misalnya, dengan nilai dalam bentuk:

tetapi penggantian seperti itu akan memberikan akurasi yang sangat rendah, karena secara umum, dengan sejumlah percobaan terbatas, momen orde tinggi ditentukan dengan kesalahan besar. Namun dalam prakteknya sering terjadi bahwa bentuk hukum distribusi besaran X diketahui sebelumnya: hanya parameternya yang tidak diketahui. Kemudian kita dapat mencoba untuk menyatakan u4 dalam bentuk D.

Mari kita ambil kasus yang paling umum, ketika nilainya X didistribusikan menurut hukum normal. Kemudian momen pusat keempatnya dinyatakan dalam varians (lihat Bab 6 Subbab 6.2);

dan rumus (14.3.12) memberikan atau

Mengganti di (14.3.14) yang tidak diketahui D penilaiannya D, kita peroleh: dari mana

Momen u 4 dapat dinyatakan dalam D juga dalam beberapa kasus lain, ketika distribusi kuantitas X tidak normal, tetapi penampilannya diketahui. Misalnya, untuk hukum kerapatan seragam (lihat Bab 5), kita memiliki:

di mana (a, P) adalah interval di mana hukum diberikan.

Karena itu,

Menurut rumus (14.3.12) kita mendapatkan: dari mana kita menemukan kira-kira

Dalam hal bentuk hukum pembagian nilai 26 tidak diketahui, maka pada saat menaksir nilai a /) tetap disarankan menggunakan rumus (14.3.16), jika tidak ada alasan khusus untuk meyakini bahwa hukum ini sangat berbeda dari yang normal (memiliki kurtosis positif atau negatif yang nyata) .

Jika nilai perkiraan a /) diperoleh dengan satu atau lain cara, maka dimungkinkan untuk membangun interval kepercayaan untuk varians dengan cara yang sama seperti yang kita bangun untuk ekspektasi matematis:

di mana nilai tergantung pada probabilitas yang diberikan p ditemukan pada Tabel. 14.3.1.

Contoh 2. Temukan Interval Keyakinan Sekitar 80% untuk Varians Variabel Acak X di bawah kondisi contoh 1, jika diketahui bahwa nilai X didistribusikan menurut hukum yang mendekati normal.

Keputusan. Nilainya tetap sama seperti pada Tabel. 14.3.1:

Menurut rumus (14.3.16)

Menurut rumus (14.3.18) kami menemukan interval kepercayaan:

Kisaran nilai standar deviasi yang sesuai: (0,21; 0,29).

14.4. Metode yang tepat untuk membangun interval kepercayaan untuk parameter variabel acak yang didistribusikan menurut hukum normal

Dalam subbagian sebelumnya, kami mempertimbangkan metode perkiraan kasar untuk membangun interval kepercayaan untuk rata-rata dan varians. Di sini kami memberikan gambaran tentang metode yang tepat untuk memecahkan masalah yang sama. Kami menekankan bahwa untuk menemukan interval kepercayaan secara akurat, mutlak perlu diketahui terlebih dahulu bentuk hukum distribusi kuantitas x, sedangkan ini tidak diperlukan untuk penerapan metode perkiraan.

Gagasan metode yang tepat untuk membangun interval kepercayaan adalah sebagai berikut. Setiap interval kepercayaan ditemukan dari kondisi yang menyatakan probabilitas pemenuhan beberapa ketidaksetaraan, yang mencakup perkiraan yang menarik bagi kami sebuah. Hukum distribusi kelas sebuah dalam kasus umum tergantung pada parameter kuantitas yang tidak diketahui x. Namun, terkadang ada kemungkinan untuk melewatkan pertidaksamaan dari variabel acak sebuah ke beberapa fungsi lain dari nilai yang diamati X p X 2, ..., X hal. hukum distribusi yang tidak bergantung pada parameter yang tidak diketahui, tetapi hanya bergantung pada jumlah percobaan dan pada bentuk hukum distribusi kuantitas x. Variabel acak semacam ini memainkan peran besar dalam statistik matematika; mereka telah dipelajari secara paling rinci untuk kasus distribusi kuantitas yang normal x.

Sebagai contoh, telah dibuktikan bahwa di bawah distribusi normal kuantitas X nilai acak

tunduk pada apa yang disebut hukum distribusi siswa dengan P- 1 derajat kebebasan; kerapatan hukum ini memiliki bentuk

di mana G(x) adalah fungsi gamma yang diketahui:

Hal ini juga membuktikan bahwa variabel acak

memiliki "distribusi % 2" dengan P- 1 derajat kebebasan (lihat bab 7), kepadatannya dinyatakan dengan rumus

Tanpa memikirkan turunan dari distribusi (14.4.2) dan (14.4.4), kami akan menunjukkan bagaimana mereka dapat diterapkan ketika membangun interval kepercayaan untuk parameter Ty D .

Biarkan diproduksi P percobaan independen pada variabel acak x, didistribusikan menurut hukum normal dengan parameter yang tidak diketahui TIO. Untuk parameter ini, perkiraan

Diperlukan untuk membangun interval kepercayaan untuk kedua parameter yang sesuai dengan probabilitas kepercayaan p.

Mari kita buat dulu selang kepercayaan untuk ekspektasi matematis. Adalah wajar untuk mengambil interval ini simetris sehubungan dengan t; dilambangkan dengan s p setengah panjang interval. Nilai sp harus dipilih agar kondisi

Mari kita coba meneruskan sisi kiri persamaan (14.4.5) dari variabel acak t ke variabel acak T, didistribusikan menurut hukum Student. Untuk melakukannya, kita kalikan kedua bagian pertidaksamaan |m-w?|

ke nilai positif: atau, dengan menggunakan notasi (14.4.1),

Mari kita cari angka / p sedemikian rupa sehingga nilai / p dapat ditemukan dari kondisi

Dapat dilihat dari rumus (14.4.2) bahwa (1) adalah fungsi genap, sehingga (14.4.8) memberikan

Kesetaraan (14.4.9) menentukan nilai / p tergantung pada hal. Jika Anda memiliki tabel nilai integral

maka nilai / p dapat ditemukan dengan interpolasi terbalik pada tabel. Namun, lebih mudah untuk menyusun tabel nilai / p terlebih dahulu. Tabel tersebut diberikan dalam Lampiran (Tabel 5). Tabel ini menunjukkan nilai tergantung pada probabilitas kepercayaan p dan jumlah derajat kebebasan P- 1. Setelah ditentukan / p sesuai tabel. 5 dan asumsi

kami menemukan setengah lebar interval kepercayaan / p dan interval itu sendiri

Contoh 1. 5 percobaan independen dilakukan pada variabel acak x, terdistribusi normal dengan parameter yang tidak diketahui t dan tentang. Hasil percobaan diberikan dalam tabel. 14.4.1.

Tabel 14.4.1

Temukan perkiraan t untuk harapan matematis dan buat interval kepercayaan 90% / p untuk itu (yaitu, interval yang sesuai dengan probabilitas kepercayaan p \u003d 0,9).

Keputusan. Kita punya:

Menurut tabel 5 dari aplikasi untuk P - 1 = 4 dan p = 0,9 kita temukan di mana

Interval kepercayaan akan menjadi

Contoh 2. Untuk kondisi contoh 1 subbagian 14.3, dengan asumsi nilai X terdistribusi normal, tentukan selang kepercayaan yang tepat.

Keputusan. Menurut tabel 5 aplikasi, kami menemukan di P - 1 = 19ir =

0,8 / p = 1,328; dari sini

Dibandingkan dengan solusi contoh 1 subbagian 14.3 (e p = 0,072), kita melihat bahwa perbedaannya sangat kecil. Jika kita menjaga akurasi ke tempat desimal kedua, maka interval kepercayaan yang ditemukan oleh metode eksak dan perkiraan adalah sama:

Mari kita beralih ke membangun interval kepercayaan untuk varians. Pertimbangkan estimasi varians yang tidak bias

dan nyatakan variabel acak D melalui nilai V(14.4.3) berdistribusi x 2 (14.4.4):

Mengetahui hukum distribusi kuantitas V, adalah mungkin untuk menemukan interval / (1) di mana ia jatuh dengan probabilitas p yang diberikan.

hukum distribusi k n _ x (v) nilai I 7 memiliki bentuk yang ditunjukkan pada gambar. 14.4.1.

Beras. 14.4.1

Timbul pertanyaan: bagaimana memilih interval / p? Jika hukum distribusi kuantitas V simetris (seperti hukum normal atau distribusi Student), adalah wajar untuk mengambil interval /p simetris terhadap ekspektasi matematis. Dalam hal ini hukum k n _ x (v) asimetris. Mari kita sepakat untuk memilih interval /p sehingga probabilitas output kuantitas V di luar interval ke kanan dan kiri (area yang diarsir pada Gambar 14.4.1) adalah sama dan sama

Untuk membangun interval / p dengan properti ini, kami menggunakan Tabel. 4 aplikasi: berisi angka y) seperti yang

untuk kuantitas V, memiliki x 2 -distribusi dengan r derajat kebebasan. Dalam kasus kami r = n- 1. Perbaiki r = n- 1 dan temukan di baris tabel yang sesuai. 4 dua nilai x 2 - satu sesuai dengan probabilitas yang lain - probabilitas Mari kita tentukan ini

nilai-nilai pada 2 dan xl? Interval memiliki y 2 , dengan kirinya, dan y ~ ujung kanan.

Sekarang kita temukan selang kepercayaan yang diperlukan /| untuk varians dengan batas D, dan D2, yang mencakup intinya D dengan probabilitas p:

Mari kita buat interval seperti itu / (, = (?> b A), yang mencakup titik D jika dan hanya jika nilai V jatuh ke dalam interval / r. Mari kita tunjukkan bahwa intervalnya

memenuhi kondisi ini. Memang, ketidaksetaraan ekuivalen dengan pertidaksamaan

dan ketidaksetaraan ini berlaku dengan probabilitas p. Dengan demikian, interval kepercayaan untuk dispersi ditemukan dan dinyatakan dengan rumus (14.4.13).

Contoh 3. Carilah selang kepercayaan untuk varians pada kondisi contoh 2 subbab 14.3, jika diketahui bahwa nilai X didistribusikan secara normal.

Keputusan. Kita punya . Menurut tabel 4 aplikasi

kita temukan di r = n - 1 = 19

Menurut rumus (14.4.13) kami menemukan interval kepercayaan untuk dispersi

Interval yang sesuai untuk standar deviasi: (0,21; 0,32). Interval ini hanya sedikit melebihi interval (0.21; 0.29) yang diperoleh dalam Contoh 2 Subbagian 14.3 dengan metode perkiraan.

  • Gambar 14.3.1 mempertimbangkan selang kepercayaan yang simetris terhadap a. Secara umum, seperti yang akan kita lihat nanti, ini tidak perlu.

Estimasi interval kepercayaan

Tujuan Pembelajaran

Statistik mempertimbangkan hal berikut: dua tugas utama:

    Kami memiliki beberapa perkiraan berdasarkan data sampel dan kami ingin membuat beberapa pernyataan probabilistik tentang di mana nilai sebenarnya dari parameter yang diestimasi.

    Kami memiliki hipotesis khusus yang perlu diuji berdasarkan data sampel.

Dalam topik ini, kami mempertimbangkan masalah pertama. Kami juga memperkenalkan definisi interval kepercayaan.

Interval kepercayaan adalah interval yang dibangun di sekitar nilai estimasi suatu parameter dan menunjukkan di mana nilai sebenarnya dari parameter yang diestimasi terletak dengan probabilitas yang diberikan apriori.

Setelah mempelajari materi tentang topik ini, Anda:

    pelajari apa interval kepercayaan dari perkiraan;

    belajar mengklasifikasikan masalah statistik;

    menguasai teknik membangun interval kepercayaan, baik menggunakan rumus statistik maupun menggunakan perangkat lunak;

    belajar menentukan ukuran sampel yang diperlukan untuk mencapai parameter akurasi tertentu dari perkiraan statistik.

Distribusi karakteristik sampel

distribusi-T

Seperti dibahas di atas, distribusi variabel acak mendekati distribusi normal standar dengan parameter 0 dan 1. Karena kita tidak mengetahui nilai , kita menggantinya dengan beberapa perkiraan s . Besaran tersebut sudah memiliki distribusi yang berbeda, yaitu, atau distribusi siswa, yang ditentukan oleh parameter n -1 (jumlah derajat kebebasan). Distribusi ini mendekati distribusi normal (semakin besar n, semakin dekat distribusinya).

pada gambar. 95
Distribusi siswa dengan 30 derajat kebebasan disajikan. Seperti yang Anda lihat, itu sangat dekat dengan distribusi normal.

Mirip dengan fungsi untuk bekerja dengan distribusi normal NORMDIST dan NORMINV, ada fungsi untuk bekerja dengan distribusi-t - STUDIST (TDIST) dan STUDRASPBR (TINV). Contoh penggunaan fungsi ini dapat ditemukan di file STUDRIST.XLS (templat dan solusi) dan di gbr. 96
.

Distribusi karakteristik lainnya

Seperti yang telah kita ketahui, untuk menentukan keakuratan perkiraan harapan, kita membutuhkan distribusi-t. Untuk mengestimasi parameter lain, seperti varians, diperlukan distribusi lain. Dua di antaranya adalah distribusi-F dan x 2 -distribusi.

Interval kepercayaan untuk mean

Interval kepercayaan adalah interval yang dibangun di sekitar nilai estimasi parameter dan menunjukkan di mana nilai sebenarnya dari parameter yang diestimasi terletak dengan probabilitas yang diberikan secara apriori.

Konstruksi interval kepercayaan untuk nilai rata-rata terjadi dengan cara berikut:

Contoh

Restoran cepat saji berencana untuk memperluas jangkauannya dengan jenis sandwich baru. Untuk memperkirakan permintaannya, manajer berencana untuk memilih secara acak 40 pengunjung dari antara mereka yang telah mencobanya dan meminta mereka untuk menilai sikap mereka terhadap produk baru dalam skala dari 1 hingga 10. Manajer ingin memperkirakan jumlah poin yang diharapkan yang akan diterima produk baru dan membangun interval kepercayaan 95% untuk perkiraan ini. Bagaimana cara melakukannya? (lihat file SANDWICH1.XLS (templat dan solusi).

Keputusan

Untuk mengatasi masalah ini, Anda dapat menggunakan . Hasilnya disajikan pada gambar. 97
.

Interval kepercayaan untuk nilai total

Kadang-kadang, menurut data sampel, diperlukan untuk memperkirakan bukan harapan matematis, tetapi jumlah total nilai. Misalnya, dalam situasi dengan auditor, mungkin menarik untuk memperkirakan bukan nilai rata-rata dari sebuah faktur, tetapi jumlah dari semua faktur.

Misalkan N adalah jumlah total elemen, n adalah ukuran sampel, T 3 adalah jumlah dari nilai-nilai dalam sampel, T" adalah perkiraan untuk jumlah seluruh populasi, maka , dan interval kepercayaan dihitung dengan rumus , di mana s adalah perkiraan deviasi standar untuk sampel, adalah perkiraan rata-rata untuk sampel.

Contoh

Katakanlah kantor pajak ingin memperkirakan jumlah pengembalian pajak total untuk 10.000 wajib pajak. Wajib pajak menerima pengembalian uang atau membayar pajak tambahan. Temukan interval kepercayaan 95% untuk jumlah pengembalian dana, dengan asumsi ukuran sampel 500 orang (lihat file REFUND AMOUNT.XLS (templat dan solusi).

Keputusan

Tidak ada prosedur khusus di StatPro untuk kasus ini, namun Anda dapat melihat bahwa batas dapat diperoleh dari batas rata-rata menggunakan rumus di atas (Gbr. 98
).

Interval kepercayaan untuk proporsi

Misalkan p adalah ekspektasi dari bagian pelanggan, dan pv menjadi estimasi bagian ini, yang diperoleh dari sampel berukuran n. Dapat ditunjukkan bahwa untuk cukup besar distribusi estimasi akan mendekati normal dengan mean p dan standar deviasi . Kesalahan standar estimasi dalam kasus ini dinyatakan sebagai , dan selang kepercayaan sebagai .

Contoh

Restoran cepat saji berencana untuk memperluas jangkauannya dengan jenis sandwich baru. Untuk memperkirakan permintaannya, manajer secara acak memilih 40 pengunjung dari antara mereka yang sudah mencobanya dan meminta mereka untuk menilai sikap mereka terhadap produk baru dalam skala dari 1 hingga 10. Manajer ingin memperkirakan proporsi yang diharapkan pelanggan yang menilai produk baru setidaknya dari 6 poin (dia mengharapkan pelanggan ini menjadi konsumen produk baru).

Keputusan

Awalnya, kami membuat kolom baru berdasarkan 1 jika skor klien lebih dari 6 poin dan 0 sebaliknya (lihat file SANDWICH2.XLS (templat dan solusi).

Metode 1

Menghitung jumlah 1, kami memperkirakan bagiannya, dan kemudian kami menggunakan rumus.

Nilai z cr diambil dari tabel distribusi normal khusus (misalnya 1,96 untuk selang kepercayaan 95%).

Menggunakan pendekatan ini dan data spesifik untuk membangun interval 95%, kami memperoleh hasil berikut (Gbr. 99
). Nilai kritis dari parameter z cr adalah 1,96. Kesalahan standar estimasi adalah 0,077. Batas bawah selang kepercayaan adalah 0,475. Batas atas selang kepercayaan adalah 0,775. Dengan demikian, seorang manajer dapat mengasumsikan dengan kepastian 95% bahwa persentase pelanggan yang menilai produk baru 6 poin atau lebih akan berada di antara 47,5 dan 77,5.

Metode 2

Masalah ini dapat diselesaikan dengan menggunakan alat StatPro standar. Untuk melakukan ini, cukup untuk dicatat bahwa bagian dalam kasus ini bertepatan dengan nilai rata-rata kolom Jenis. Aplikasi selanjutnya StatPro/Inferensi Statistik/Analisis Satu Sampel untuk membangun interval kepercayaan untuk nilai rata-rata (estimasi harapan) untuk kolom Jenis. Hasil yang diperoleh dalam hal ini akan sangat mendekati hasil dari metode 1 (Gbr. 99).

Interval kepercayaan untuk standar deviasi

s digunakan sebagai perkiraan deviasi standar (rumus diberikan di Bagian 1). Fungsi densitas dari penduga s adalah fungsi chi-kuadrat, yang, seperti distribusi t, memiliki n-1 derajat kebebasan. Ada fungsi khusus untuk bekerja dengan distribusi ini CHI2DIST (CHIDIST) dan CHI2OBR (CHIINV) .

Interval kepercayaan dalam hal ini tidak lagi simetris. Skema bersyarat batas ditunjukkan pada gambar. 100 .

Contoh

Mesin harus menghasilkan suku cadang dengan diameter 10 cm, tetapi karena berbagai keadaan, kesalahan terjadi. Pengontrol kualitas memperhatikan dua hal: pertama, nilai rata-rata harus 10 cm; kedua, bahkan dalam kasus ini, jika penyimpangannya besar, maka banyak detail akan ditolak. Setiap hari dia membuat sampel 50 bagian (lihat file QUALITY CONTROL.XLS (templat dan solusi). Kesimpulan apa yang dapat diberikan oleh sampel seperti itu?

Keputusan

Kami membangun interval kepercayaan 95% untuk mean dan standar deviasi menggunakan StatPro/Inferensi Statistik/ Analisis Satu Sampel(Gbr. 101
).

Selanjutnya, dengan menggunakan asumsi distribusi diameter normal, kami menghitung proporsi produk cacat, menetapkan deviasi maksimum 0,065. Menggunakan kemampuan tabel pencarian (kasus dua parameter), kami membangun ketergantungan persentase penolakan pada nilai rata-rata dan deviasi standar (Gbr. 102
).

Interval kepercayaan untuk selisih dua rata-rata

Ini adalah salah satu aplikasi terpenting dari metode statistik. Contoh situasi.

    Seorang manajer toko pakaian ingin tahu berapa banyak pembelanja wanita rata-rata menghabiskan di toko daripada pria.

    Kedua maskapai terbang dengan rute yang sama. Organisasi konsumen ingin membandingkan perbedaan antara rata-rata waktu tunda penerbangan yang diharapkan untuk kedua maskapai.

    Perusahaan mengirimkan kupon untuk jenis barang tertentu di satu kota dan tidak mengirimkan di kota lain. Manajer ingin membandingkan rata-rata pembelian barang-barang ini selama dua bulan ke depan.

    Dealer mobil sering berurusan dengan pasangan yang sudah menikah di presentasi. Untuk memahami reaksi pribadi mereka terhadap presentasi, pasangan sering diwawancarai secara terpisah. Manajer ingin mengevaluasi perbedaan peringkat yang diberikan oleh pria dan wanita.

Kasus sampel independen

Perbedaan rata-rata akan memiliki distribusi-t dengan n 1 + n 2 - 2 derajat kebebasan. Interval kepercayaan untuk 1 - 2 dinyatakan dengan rasio:

Masalah ini dapat diselesaikan tidak hanya dengan rumus di atas, tetapi juga dengan alat StatPro standar. Untuk melakukan ini, cukup dengan melamar

Interval kepercayaan untuk perbedaan antara proporsi

Membiarkan menjadi ekspektasi matematis dari saham. Membiarkan menjadi perkiraan sampel mereka dibangun di atas sampel ukuran n 1 dan n 2, masing-masing. Kemudian adalah perkiraan untuk perbedaan . Oleh karena itu, interval kepercayaan untuk perbedaan ini dinyatakan sebagai:

Di sini z cr adalah nilai yang diperoleh dari distribusi normal tabel khusus (misalnya, 1,96 untuk interval kepercayaan 95%).

Kesalahan standar estimasi dinyatakan dalam kasus ini oleh hubungan:

.

Contoh

Toko, dalam persiapan untuk penjualan besar, melakukan riset pemasaran berikut. 300 pembeli teratas dipilih dan dibagi secara acak menjadi dua kelompok yang masing-masing terdiri dari 150 anggota. Semua pembeli terpilih dikirimi undangan untuk berpartisipasi dalam penjualan, tetapi hanya untuk anggota kelompok pertama yang dilampirkan kupon yang memberikan hak diskon 5%. Selama penjualan, pembelian semua 300 pembeli yang dipilih dicatat. Bagaimana seorang manajer dapat menginterpretasikan hasil dan membuat penilaian tentang efektivitas pemberian kupon? (Lihat file KUPON.XLS (templat dan solusi)).

Keputusan

Untuk kasus khusus kami, dari 150 pelanggan yang menerima kupon diskon, 55 melakukan pembelian saat obral, dan di antara 150 yang tidak menerima kupon, hanya 35 yang melakukan pembelian (Gbr. 103
). Maka nilai proporsi sampel masing-masing adalah 0,3667 dan 0,2333. Dan perbedaan sampel di antara mereka masing-masing sama dengan 0,1333. Dengan asumsi selang kepercayaan 95%, kita temukan dari tabel distribusi normal z cr = 1,96. Perhitungan standar error selisih sampel adalah 0,0524. Akhirnya, kami mendapatkan bahwa batas bawah interval kepercayaan 95% adalah 0,0307, ​​dan batas atas masing-masing adalah 0,2359. Hasil yang diperoleh dapat diinterpretasikan sedemikian rupa sehingga untuk setiap 100 pelanggan yang menerima kupon diskon, kita dapat mengharapkan 3 hingga 23 pelanggan baru. Namun, perlu diingat bahwa kesimpulan ini sendiri tidak berarti efisiensi penggunaan kupon (karena dengan memberikan diskon, kita kehilangan keuntungan!). Mari kita tunjukkan ini pada data konkret. Misalkan jumlah pembelian rata-rata adalah 400 rubel, di antaranya 50 rubel. ada keuntungan toko. Maka keuntungan yang diharapkan per 100 pelanggan yang tidak menerima kupon adalah sama dengan:

50 0,2333 100 \u003d 1166,50 rubel.

Perhitungan serupa untuk 100 pembeli yang menerima kupon memberikan:

30 0,3667 100 \u003d 1100,10 rubel.

Penurunan laba rata-rata menjadi 30 dijelaskan oleh fakta bahwa, dengan menggunakan diskon, pembeli yang menerima kupon rata-rata akan melakukan pembelian seharga 380 rubel.

Dengan demikian, kesimpulan akhir menunjukkan inefisiensi penggunaan kupon tersebut dalam situasi khusus ini.

Komentar. Masalah ini dapat diselesaikan dengan menggunakan alat StatPro standar. Untuk melakukan ini, cukup untuk mengurangi masalah ini menjadi masalah memperkirakan perbedaan dua rata-rata dengan metode, dan kemudian menerapkan StatPro/Inferensi Statistik/Analisis Dua Sampel untuk membangun interval kepercayaan untuk perbedaan antara dua nilai rata-rata.

Kontrol interval kepercayaan

Panjang selang kepercayaan bergantung pada kondisi berikut:

    data langsung (standar deviasi);

    tingkat signifikansi;

    ukuran sampel.

Ukuran sampel untuk memperkirakan mean

Mari kita pertimbangkan masalah dalam kasus umum. Mari kita nyatakan nilai setengah panjang interval kepercayaan yang diberikan kepada kita sebagai B (Gbr. 104
). Kita tahu bahwa selang kepercayaan untuk nilai rata-rata dari beberapa variabel acak X dinyatakan sebagai , di mana . Asumsi:

dan menyatakan n , kita dapatkan .

Sayangnya, kita tidak tahu persis nilai varians dari variabel acak X. Selain itu, kita tidak mengetahui nilai t cr karena bergantung pada n melalui jumlah derajat kebebasan. Dalam situasi ini, kita dapat melakukan hal berikut. Alih-alih varians s, kami menggunakan beberapa estimasi varians untuk beberapa realisasi yang tersedia dari variabel acak yang diteliti. Alih-alih nilai t cr, kami menggunakan nilai z cr untuk distribusi normal. Hal ini cukup dapat diterima, karena fungsi kerapatan untuk distribusi normal dan distribusi t sangat dekat (kecuali untuk kasus n kecil). Dengan demikian, rumus yang diinginkan berbentuk:

.

Karena rumus memberikan, secara umum, hasil non-bilangan bulat, pembulatan dengan kelebihan hasil diambil sebagai ukuran sampel yang diinginkan.

Contoh

Restoran cepat saji berencana untuk memperluas jangkauannya dengan jenis sandwich baru. Untuk memperkirakan permintaannya, manajer secara acak merencanakan untuk memilih sejumlah pengunjung dari antara mereka yang telah mencobanya, dan meminta mereka untuk menilai sikap mereka terhadap produk baru dalam skala dari 1 hingga 10. Manajer ingin untuk memperkirakan jumlah poin yang diharapkan yang akan diterima produk baru.produk dan plot interval kepercayaan 95% dari perkiraan itu. Namun, ia ingin setengah lebar interval kepercayaan tidak melebihi 0,3. Berapa banyak pengunjung yang dia butuhkan untuk polling?

sebagai berikut:

Di Sini r ots adalah perkiraan fraksi p, dan B adalah setengah dari panjang interval kepercayaan. Nilai yang meningkat untuk n dapat diperoleh dengan menggunakan nilai r ots= 0,5. Dalam hal ini, panjang interval kepercayaan tidak akan melebihi nilai B yang diberikan untuk setiap nilai sebenarnya dari p.

Contoh

Biarkan manajer dari contoh sebelumnya merencanakan untuk memperkirakan proporsi pelanggan yang lebih memilih jenis produk baru. Dia ingin membangun interval kepercayaan 90% yang panjang setengahnya kurang dari atau sama dengan 0,05. Berapa banyak klien yang harus diambil sampelnya secara acak?

Keputusan

Dalam kasus kami, nilai z cr = 1,645. Oleh karena itu, jumlah yang dibutuhkan dihitung sebagai .

Jika manajer memiliki alasan untuk percaya bahwa nilai p yang diinginkan, misalnya, sekitar 0,3, maka dengan mensubstitusi nilai ini ke dalam rumus di atas, kita akan mendapatkan nilai sampel acak yang lebih kecil, yaitu 228.

Rumus untuk menentukan ukuran sampel acak dalam kasus perbedaan antara dua cara ditulis sebagai:

.

Contoh

Beberapa perusahaan komputer memiliki pusat layanan pelanggan. Belakangan ini, jumlah keluhan pelanggan tentang buruknya kualitas layanan semakin meningkat. Pusat layanan terutama mempekerjakan dua jenis karyawan: mereka yang memiliki sedikit pengalaman, tetapi telah menyelesaikan kursus pelatihan khusus, dan mereka yang memiliki pengalaman praktis yang luas, tetapi belum menyelesaikan kursus khusus. Perusahaan ingin menganalisis keluhan pelanggan selama enam bulan terakhir dan membandingkan jumlah rata-rata mereka per masing-masing dari dua kelompok karyawan. Diasumsikan bahwa jumlah sampel untuk kedua kelompok akan sama. Berapa banyak karyawan yang harus dimasukkan dalam sampel untuk mendapatkan interval 95% dengan panjang setengah tidak lebih dari 2?

Keputusan

Di sini ots adalah perkiraan simpangan baku kedua variabel acak dengan asumsi bahwa mereka dekat. Jadi, dalam tugas kita, kita perlu mendapatkan perkiraan ini. Ini dapat dilakukan, misalnya, sebagai berikut. Melihat data keluhan pelanggan selama enam bulan terakhir, seorang manajer mungkin memperhatikan bahwa umumnya ada antara 6 dan 36 keluhan per karyawan. Mengetahui bahwa untuk distribusi normal, hampir semua nilai tidak lebih dari tiga standar deviasi dari mean, ia cukup percaya bahwa:

, dimana ots = 5.

Mengganti nilai ini ke dalam rumus, kita mendapatkan .

Rumus untuk menentukan ukuran sampel acak dalam hal memperkirakan perbedaan antara saham seperti:

Contoh

Beberapa perusahaan memiliki dua pabrik untuk memproduksi produk serupa. Manajer sebuah perusahaan ingin membandingkan tingkat kerusakan dari kedua pabrik tersebut. Menurut informasi yang tersedia, tingkat penolakan di kedua pabrik adalah dari 3 hingga 5%. Seharusnya membangun interval kepercayaan 99% dengan panjang setengah tidak lebih dari 0,005 (atau 0,5%). Berapa banyak produk yang harus dipilih dari setiap pabrik?

Keputusan

Di sini p 1ot dan p 2ot adalah perkiraan dari dua fraksi yang tidak diketahui dari barang yang ditolak di pabrik ke-1 dan ke-2. Jika kita menempatkan p 1ots \u003d p 2ots \u003d 0,5, maka kita akan mendapatkan nilai n yang terlalu tinggi. Tetapi karena dalam kasus kami, kami memiliki beberapa informasi apriori tentang saham-saham ini, kami mengambil perkiraan atas dari saham-saham ini, yaitu 0,05. Kita mendapatkan

Ketika mengestimasi beberapa parameter populasi dari data sampel, akan berguna untuk memberikan tidak hanya estimasi titik dari parameter, tetapi juga interval kepercayaan yang menunjukkan di mana letak nilai pasti dari parameter yang diestimasi.

Dalam bab ini, kita juga berkenalan dengan hubungan kuantitatif yang memungkinkan kita membangun interval semacam itu untuk berbagai parameter; mempelajari cara-cara untuk mengontrol panjang interval kepercayaan.

Kami juga mencatat bahwa masalah memperkirakan ukuran sampel (masalah perencanaan eksperimen) dapat diselesaikan dengan menggunakan alat StatPro standar, yaitu StatPro/Inferensi Statistik/Pilihan Ukuran Sampel.

Pikiran tidak hanya dalam pengetahuan, tetapi juga dalam kemampuan untuk menerapkan pengetahuan dalam praktik. (Aristoteles)

Interval kepercayaan

tinjauan umum

Mengambil sampel dari populasi, kita akan memperoleh estimasi titik dari parameter yang kita minati dan menghitung kesalahan standar untuk menunjukkan keakuratan estimasi.

Namun, untuk kebanyakan kasus, kesalahan standar seperti itu tidak dapat diterima. Jauh lebih berguna untuk menggabungkan ukuran presisi ini dengan perkiraan interval untuk parameter populasi.

Hal ini dapat dilakukan dengan menggunakan pengetahuan tentang distribusi probabilitas teoritis dari statistik sampel (parameter) untuk menghitung interval kepercayaan (CI - Interval Keyakinan, CI - Interval Keyakinan) untuk parameter.

Secara umum, interval kepercayaan memperluas perkiraan di kedua arah dengan beberapa kelipatan kesalahan standar (dari parameter yang diberikan); dua nilai (batas kepercayaan) yang menentukan interval biasanya dipisahkan dengan koma dan diapit dalam tanda kurung.

Interval kepercayaan untuk mean

Menggunakan distribusi normal

Rata-rata sampel memiliki distribusi normal jika ukuran sampel besar, sehingga pengetahuan tentang distribusi normal dapat diterapkan ketika mempertimbangkan rata-rata sampel.

Secara khusus, 95% dari distribusi rata-rata sampel berada dalam 1,96 standar deviasi (SD) dari rata-rata populasi.

Ketika kita hanya memiliki satu sampel, kita menyebutnya kesalahan standar mean (SEM) dan menghitung interval kepercayaan 95% untuk mean sebagai berikut:

Jika percobaan ini diulang beberapa kali, maka interval akan berisi rata-rata populasi sebenarnya 95% dari waktu.

Ini biasanya interval kepercayaan, seperti rentang nilai di mana rata-rata populasi sebenarnya (rata-rata umum) terletak dengan tingkat kepercayaan 95%.

Meskipun tidak cukup ketat (rata-rata populasi adalah nilai tetap dan karena itu tidak dapat memiliki probabilitas yang terkait dengannya) untuk menafsirkan interval kepercayaan dengan cara ini, secara konseptual lebih mudah untuk dipahami.

Penggunaan t- distribusi

Anda dapat menggunakan distribusi normal jika Anda mengetahui nilai varians dalam populasi. Juga, ketika ukuran sampel kecil, rata-rata sampel mengikuti distribusi normal jika data yang mendasari populasi terdistribusi normal.

Jika data yang mendasari populasi tidak terdistribusi normal dan/atau varians umum (varians populasi) tidak diketahui, mean sampel mematuhi distribusi-t siswa.

Hitung interval kepercayaan 95% untuk mean populasi sebagai berikut:

Dimana - poin persentase (persentil) t- Distribusi siswa dengan (n-1) derajat kebebasan, yang memberikan probabilitas dua sisi 0,05.

Secara umum, ini memberikan interval yang lebih luas daripada ketika menggunakan distribusi normal, karena memperhitungkan ketidakpastian tambahan yang diperkenalkan dengan memperkirakan deviasi standar populasi dan/atau karena ukuran sampel yang kecil.

Ketika ukuran sampel besar (orde 100 atau lebih), perbedaan antara dua distribusi ( t-mahasiswa dan normal) diabaikan. Namun, selalu gunakan t- distribusi ketika menghitung interval kepercayaan, bahkan jika ukuran sampel besar.

Biasanya 95% CI diindikasikan. Interval kepercayaan lainnya dapat dihitung, seperti 99% CI untuk mean.

Alih-alih produk dari kesalahan standar dan nilai tabel t- distribusi yang sesuai dengan probabilitas dua sisi 0,05 kalikan (kesalahan standar) dengan nilai yang sesuai dengan probabilitas dua sisi 0,01. Ini adalah interval kepercayaan yang lebih luas daripada kasus 95% karena mencerminkan peningkatan kepercayaan bahwa interval tersebut memang mencakup rata-rata populasi.

Interval kepercayaan untuk proporsi

Distribusi sampling proporsi memiliki distribusi binomial. Namun, jika ukuran sampel n cukup besar, maka proporsi distribusi sampel mendekati normal dengan mean .

Estimasi dengan rasio sampling p=r/n(di mana r- jumlah individu dalam sampel dengan karakteristik yang menarik bagi kami), dan kesalahan standar diperkirakan:

Interval kepercayaan 95% untuk proporsi diperkirakan:

Jika ukuran sampel kecil (biasanya ketika np atau n(1-p) lebih kecil 5 ), maka distribusi binomial harus digunakan untuk menghitung interval kepercayaan yang tepat.

Perhatikan bahwa jika p dinyatakan dalam persentase, maka (1-p) digantikan oleh (100p).

Interpretasi interval kepercayaan

Saat menafsirkan interval kepercayaan, kami tertarik pada pertanyaan berikut:

Berapa lebar selang kepercayaan?

Interval kepercayaan yang lebar menunjukkan bahwa estimasi tersebut tidak tepat; sempit menunjukkan perkiraan yang bagus.

Lebar interval kepercayaan tergantung pada ukuran kesalahan standar, yang pada gilirannya tergantung pada ukuran sampel, dan ketika mempertimbangkan variabel numerik dari variabilitas data, berikan interval kepercayaan yang lebih luas daripada studi kumpulan data besar yang terdiri dari beberapa orang. variabel.

Apakah CI menyertakan nilai minat tertentu?

Anda dapat memeriksa apakah kemungkinan nilai untuk parameter populasi berada dalam interval kepercayaan. Jika ya, maka hasilnya konsisten dengan kemungkinan nilai ini. Jika tidak, maka kecil kemungkinannya (untuk interval kepercayaan 95%, peluangnya hampir 5%) parameter memiliki nilai ini.