Buatlah selang kepercayaan untuk ekspektasi matematis. Interval kepercayaan untuk memperkirakan ekspektasi matematis

Dan lain-lain.Semuanya adalah perkiraan rekan teoretis mereka, yang dapat diperoleh jika tidak ada sampel, tetapi populasi umum. Namun sayang, populasi umum sangat mahal dan seringkali tidak tersedia.

Konsep estimasi interval

Setiap estimasi sampel memiliki beberapa pencar, karena adalah variabel acak tergantung pada nilai dalam sampel tertentu. Oleh karena itu, untuk inferensi statistik yang lebih andal, seseorang harus mengetahui tidak hanya perkiraan titik, tetapi juga intervalnya, yang dengan probabilitas tinggi γ (gamma) mencakup perkiraan indikator θ (theta).

Secara formal, ini adalah dua nilai seperti itu (statistik) T1(X) dan T2(X), Apa T1< T 2 , yang pada tingkat probabilitas tertentu γ kondisi terpenuhi:

Singkatnya, itu mungkin γ atau lebih nilai sebenarnya berada di antara titik-titik T1(X) dan T2(X), yang disebut batas bawah dan batas atas selang kepercayaan.

Salah satu syarat untuk membangun interval kepercayaan adalah kesempitan maksimumnya, yaitu itu harus sesingkat mungkin. Keinginan itu cukup alami, karena. peneliti mencoba untuk lebih akurat melokalisasi temuan parameter yang diinginkan.

Oleh karena itu, interval kepercayaan harus mencakup probabilitas distribusi maksimum. dan skor itu sendiri berada di tengah.

Artinya, probabilitas deviasi (dari indikator sebenarnya dari perkiraan) ke atas sama dengan probabilitas deviasi ke bawah. Perlu juga dicatat bahwa untuk distribusi miring, interval di sebelah kanan tidak sama dengan interval di sebelah kiri.

Gambar di atas dengan jelas menunjukkan bahwa semakin besar tingkat kepercayaan, semakin lebar interval - hubungan langsung.

Ini adalah pengantar kecil untuk teori estimasi interval dari parameter yang tidak diketahui. Mari kita beralih ke menemukan batas kepercayaan untuk ekspektasi matematis.

Interval kepercayaan untuk ekspektasi matematis

Jika data asli didistribusikan lebih , maka rata-rata akan menjadi nilai normal. Ini mengikuti dari aturan bahwa kombinasi linier dari nilai normal juga memiliki distribusi normal. Oleh karena itu, untuk menghitung probabilitas, kita dapat menggunakan perangkat matematika dari hukum distribusi normal.

Namun, ini akan membutuhkan pengetahuan tentang dua parameter - nilai yang diharapkan dan varians, yang biasanya tidak diketahui. Anda tentu saja dapat menggunakan perkiraan alih-alih parameter (rata-rata aritmatika dan ), tetapi kemudian distribusi rata-rata tidak akan terlalu normal, itu akan sedikit diratakan. Warga negara William Gosset dari Irlandia dengan cerdik mencatat fakta ini ketika ia mempublikasikan penemuannya dalam Biometrica edisi Maret 1908. Untuk tujuan kerahasiaan, Gosset menandatangani kontrak dengan Student. Ini adalah bagaimana distribusi-t Student muncul.

Namun, distribusi normal data, yang digunakan oleh K. Gauss dalam analisis kesalahan dalam pengamatan astronomi, sangat jarang dalam kehidupan terestrial dan cukup sulit untuk menetapkan ini (untuk akurasi tinggi, diperlukan sekitar 2 ribu pengamatan). Oleh karena itu, yang terbaik adalah membuang asumsi normalitas dan menggunakan metode yang tidak bergantung pada distribusi data asli.

Timbul pertanyaan: apa distribusi mean aritmatika jika dihitung dari data distribusi yang tidak diketahui? Jawabannya diberikan oleh teori probabilitas yang terkenal Teorema limit pusat(CPT). Dalam matematika, ada beberapa versi (formulasi telah disempurnakan selama bertahun-tahun), tetapi semuanya, secara kasar, sampai pada pernyataan bahwa jumlah sejumlah besar variabel acak independen mematuhi hukum distribusi normal.

Saat menghitung mean aritmatika, jumlah variabel acak digunakan. Dari sini ternyata rata-rata aritmatika memiliki distribusi normal, dimana nilai harapan adalah nilai harapan dari data asli, dan variansnya adalah .

Orang pintar tahu cara membuktikan CLT, tetapi kami akan memverifikasi ini dengan bantuan eksperimen yang dilakukan di Excel. Mari simulasikan sampel 50 variabel acak terdistribusi seragam (menggunakan fungsi RANDOMBETWEEN Excel). Kemudian kita akan membuat 1000 sampel seperti itu dan menghitung rata-rata aritmatika untuk masing-masing. Mari kita lihat distribusinya.

Terlihat bahwa distribusi rata-ratanya mendekati hukum normal. Jika volume sampel dan jumlahnya dibuat lebih besar, maka kemiripannya akan lebih baik.

Sekarang kita telah melihat sendiri validitas CLT, kita dapat, menggunakan , menghitung interval kepercayaan untuk mean aritmatika, yang mencakup mean sebenarnya atau ekspektasi matematis dengan probabilitas tertentu.

Untuk menentukan batas atas dan batas bawah, perlu diketahui parameter distribusi normal. Sebagai aturan, mereka tidak, oleh karena itu, perkiraan digunakan: rata-rata aritmatika dan varians sampel. Sekali lagi, metode ini memberikan perkiraan yang baik hanya untuk sampel besar. Jika sampelnya kecil, sering disarankan untuk menggunakan distribusi Student. Jangan percaya! Distribusi siswa untuk mean hanya terjadi jika data asli memiliki distribusi normal, yaitu hampir tidak pernah. Oleh karena itu, lebih baik segera mengatur bilah minimum untuk jumlah data yang diperlukan dan menggunakan metode yang benar secara asimtotik. Mereka mengatakan 30 pengamatan sudah cukup. Ambil 50 - Anda tidak bisa salah.

T 1.2 adalah batas bawah dan batas atas interval kepercayaan

– sampel rata-rata aritmatika

s0– simpangan baku sampel (tidak bias)

n - ukuran sampel

γ – tingkat kepercayaan (biasanya sama dengan 0,9, 0,95 atau 0,99)

c =Φ -1 ((1+γ)/2) adalah kebalikan dari fungsi distribusi normal standar. Secara sederhana, ini adalah jumlah kesalahan standar dari rata-rata aritmatika ke batas bawah atau atas (tiga probabilitas yang ditunjukkan sesuai dengan nilai 1,64, 1,96 dan 2,58).

Inti dari rumusnya adalah bahwa rata-rata aritmatika diambil dan kemudian sejumlah tertentu disisihkan darinya ( dengan) kesalahan standar ( s 0 /√n). Semuanya diketahui, ambil dan hitung.

Sebelum penggunaan PC secara massal, untuk mendapatkan nilai fungsi distribusi normal dan kebalikannya, mereka menggunakan . Mereka masih digunakan, tetapi lebih efisien untuk beralih ke formula Excel yang sudah jadi. Semua elemen dari rumus di atas ( , dan ) dapat dengan mudah dihitung di Excel. Tetapi ada juga formula siap pakai untuk menghitung interval kepercayaan - PERCAYA DIRI NORM. Sintaksnya adalah sebagai berikut.

NORM PERCAYA DIRI (alfa, standard_dev, ukuran)

alfa– tingkat signifikansi atau tingkat kepercayaan, yang dalam notasi di atas sama dengan 1-γ, yaitu. probabilitas bahwa matematisharapan akan berada di luar selang kepercayaan. Dengan tingkat kepercayaan 0,95, alpha 0,05, dan seterusnya.

standar_off adalah simpangan baku dari data sampel. Anda tidak perlu menghitung kesalahan standar, Excel akan membagi dengan akar n.

ukuran– ukuran sampel (n).

Hasil dari fungsi CONFIDENCE.NORM adalah suku kedua dari rumus untuk menghitung interval kepercayaan, yaitu. setengah interval. Dengan demikian, titik bawah dan atas adalah rata-rata ± nilai yang diperoleh.

Dengan demikian, dimungkinkan untuk membangun algoritma universal untuk menghitung interval kepercayaan untuk rata-rata aritmatika, yang tidak bergantung pada distribusi data awal. Harga untuk universalitas adalah sifatnya yang asimtotik, yaitu. kebutuhan untuk menggunakan sampel yang relatif besar. Namun, di era teknologi modern, mengumpulkan jumlah data yang tepat biasanya tidak sulit.

Menguji Hipotesis Statistik Menggunakan Interval Keyakinan

(modul 111)

Salah satu masalah utama yang dipecahkan dalam statistik adalah. Singkatnya, esensinya adalah ini. Sebuah asumsi dibuat, misalnya, bahwa harapan dari populasi umum sama dengan beberapa nilai. Kemudian distribusi sarana sampel dibangun, yang dapat diamati dengan harapan tertentu. Selanjutnya, kita melihat di mana dalam distribusi bersyarat ini rata-rata sebenarnya berada. Jika melampaui batas yang diizinkan, maka kemunculan rata-rata seperti itu sangat tidak mungkin, dan dengan satu pengulangan percobaan hampir tidak mungkin, yang bertentangan dengan hipotesis yang diajukan, yang berhasil ditolak. Jika rata-rata tidak melampaui tingkat kritis, maka hipotesis tidak ditolak (tetapi juga tidak terbukti!).

Jadi, dengan bantuan interval kepercayaan, dalam kasus kami untuk harapan, Anda juga dapat menguji beberapa hipotesis. Ini sangat mudah dilakukan. Misalkan rata-rata aritmatika untuk beberapa sampel adalah 100. Hipotesis sedang diuji bahwa nilai yang diharapkan adalah, katakanlah, 90. Artinya, jika kita mengajukan pertanyaan secara primitif, kedengarannya seperti ini: mungkinkah dengan nilai sebenarnya dari rata-rata sama dengan 90, rata-rata yang diamati adalah 100?

Untuk menjawab pertanyaan ini, informasi tambahan tentang standar deviasi dan ukuran sampel akan diperlukan. Katakanlah standar deviasi adalah 30, dan jumlah pengamatan adalah 64 (untuk mengekstrak akar dengan mudah). Maka standar error rata-ratanya adalah 30/8 atau 3,75. Untuk menghitung interval kepercayaan 95%, Anda perlu menyisihkan dua kesalahan standar di kedua sisi rata-rata (lebih tepatnya, 1,96). Interval kepercayaan akan menjadi sekitar 100 ± 7,5, atau dari 92,5 hingga 107,5.

Alasan selanjutnya adalah sebagai berikut. Jika nilai yang diuji berada dalam interval kepercayaan, maka itu tidak bertentangan dengan hipotesis, karena cocok dalam batas fluktuasi acak (dengan probabilitas 95%). Jika titik yang diuji berada di luar interval kepercayaan, maka probabilitas kejadian seperti itu sangat kecil, dalam hal apa pun di bawah tingkat yang dapat diterima. Oleh karena itu, hipotesis ditolak karena bertentangan dengan data yang diamati. Dalam kasus kami, hipotesis harapan berada di luar interval kepercayaan (nilai yang diuji dari 90 tidak termasuk dalam interval 100 ± 7,5), sehingga harus ditolak. Menjawab pertanyaan primitif di atas, orang harus mengatakan: tidak, tidak bisa, dalam hal apa pun, ini sangat jarang terjadi. Seringkali, ini menunjukkan probabilitas spesifik penolakan hipotesis yang salah (level-p), dan bukan level tertentu, yang dengannya interval kepercayaan dibangun, tetapi lebih pada itu di lain waktu.

Seperti yang Anda lihat, tidak sulit untuk membangun interval kepercayaan untuk mean (atau ekspektasi matematis). Hal utama adalah menangkap esensi, dan kemudian semuanya akan berjalan. Dalam praktiknya, sebagian besar menggunakan interval kepercayaan 95%, yaitu sekitar dua kesalahan standar yang lebar di kedua sisi rata-rata.

Itu saja untuk saat ini. Semua yang terbaik!

Biarkan sampel dibuat dari populasi umum yang tunduk pada hukum normal distribusi X N( m; ). Asumsi dasar statistik matematika ini didasarkan pada teorema limit pusat. Biarkan standar deviasi umum diketahui , tetapi ekspektasi matematis dari distribusi teoretis tidak diketahui m(berarti ).

Dalam hal ini, sampel berarti , diperoleh selama percobaan (bagian 3.4.2), juga akan menjadi variabel acak m;
). Kemudian deviasi "dinormalisasi"
N(0;1) adalah variabel acak normal standar.

Masalahnya adalah untuk menemukan perkiraan interval untuk m. Mari kita buat selang kepercayaan dua sisi untuk m sehingga harapan matematis yang sebenarnya menjadi miliknya dengan probabilitas (keandalan) yang diberikan. .

Tetapkan interval seperti itu untuk nilainya
berarti menemukan nilai maksimum dari kuantitas ini
dan minimal
, yang merupakan batas-batas daerah kritis:
.

Karena probabilitas ini adalah
, maka akar persamaan ini
dapat ditemukan menggunakan tabel fungsi Laplace (Tabel 3, Lampiran 1).

Kemudian dengan probabilitas dapat dikatakan bahwa variabel acak
, yaitu, rata-rata umum yang diinginkan milik interval
. (3.13)

nilai
(3.14)

ditelepon ketepatan perkiraan.

Nomor
kuantil distribusi normal - dapat ditemukan sebagai argumen dari fungsi Laplace (Tabel 3, Lampiran 1), dengan rasio 2Ф( kamu)=, yaitu F( kamu)=
.

Sebaliknya, sesuai dengan nilai deviasi yang ditentukan adalah mungkin untuk menemukan dengan probabilitas berapa rata-rata umum yang tidak diketahui milik interval
. Untuk melakukan ini, Anda perlu menghitung

. (3.15)

Biarkan sampel acak diambil dari populasi umum dengan metode pemilihan ulang. Dari persamaan
dapat ditemukan minimum volume sampel ulang n diperlukan untuk memastikan bahwa selang kepercayaan dengan keandalan yang diberikan tidak melebihi nilai preset . Ukuran sampel yang dibutuhkan diperkirakan menggunakan rumus:

. (3.16)

Menjelajahi akurasi estimasi
:

1) Dengan meningkatnya ukuran sampel n besarnya berkurang, dan karenanya keakuratan perkiraan meningkat.

2) C meningkat keandalan perkiraan nilai argumen bertambah kamu(karena F(kamu) meningkat secara monoton) dan karenanya meningkat . Dalam hal ini, peningkatan keandalan mengurangi akurasi penilaiannya .

Memperkirakan
(3.17)

ditelepon klasik(di mana t adalah parameter yang bergantung pada dan n), karena itu mencirikan hukum distribusi yang paling sering ditemui.

3.5.3 Interval kepercayaan untuk memperkirakan ekspektasi distribusi normal dengan standar deviasi yang tidak diketahui

Diketahui bahwa populasi umum tunduk pada hukum distribusi normal X N( m;), dimana nilai akar rata-rata kuadrat penyimpangan tidak dikenal.

Untuk membangun interval kepercayaan untuk memperkirakan rata-rata umum, dalam hal ini, statistik digunakan
, yang memiliki distribusi Student dengan k= n-1 derajat kebebasan. Ini mengikuti dari fakta bahwa N(0;1) (lihat butir 3.5.2), dan
(lihat klausa 3.5.3) dan dari definisi distribusi Student (bagian 1. klausa 2.11.2).

Mari kita cari akurasi pendugaan klasik dari distribusi Student: mis. Temukan t dari rumus (3.17). Biarkan probabilitas memenuhi pertidaksamaan
diberikan oleh keandalan :

. (3.18)

Sejauh T St( n-1), jelas bahwa t tergantung pada dan n, jadi kita biasanya menulis
.

(3.19)

di mana
adalah fungsi distribusi Student dengan n-1 derajat kebebasan.

Memecahkan persamaan ini untuk m, kita dapatkan intervalnya
yang dengan keandalan mencakup parameter yang tidak diketahui m.

Nilai t , n-1 , digunakan untuk menentukan interval kepercayaan dari variabel acak T(n-1), didistribusikan oleh Siswa dengan n-1 derajat kebebasan disebut Koefisien siswa. Itu harus ditemukan dengan nilai yang diberikan n dan dari tabel "Titik kritis distribusi Siswa". (Tabel 6, Lampiran 1), yang merupakan solusi dari persamaan (3.19).

Akibatnya, kita mendapatkan ekspresi berikut ketepatan interval kepercayaan untuk memperkirakan ekspektasi matematis (rata-rata umum), jika varians tidak diketahui:

(3.20)

Jadi, ada rumus umum untuk membangun interval kepercayaan untuk ekspektasi matematis dari populasi umum:

di mana akurasi interval kepercayaan tergantung pada varians diketahui atau tidak diketahui ditemukan sesuai dengan rumus masing-masing 3.16. dan 3.20.

Tugas 10. Beberapa tes dilakukan, yang hasilnya tercantum dalam tabel:

x saya

Diketahui bahwa mereka mematuhi hukum distribusi normal dengan
. Temukan perkiraan m* untuk ekspektasi matematis m, buat interval kepercayaan 90% untuknya.

Keputusan:

Jadi, m(2.53;5.47).

Tugas 11. Kedalaman laut diukur dengan instrumen yang kesalahan sistematiknya 0, dan kesalahan acak didistribusikan menurut hukum normal, dengan standar deviasi = 15m. Berapa banyak pengukuran independen yang harus dilakukan untuk menentukan kedalaman dengan kesalahan tidak lebih dari 5 m dengan tingkat kepercayaan 90%?

Keputusan:

Dengan kondisi masalah, kita memiliki X N( m; ), di mana = 15m, = 5m, =0.9. Mari kita cari volumenya n.

1) Dengan reliabilitas yang diberikan = 0,9, kami menemukan dari tabel 3 (Lampiran 1) argumen dari fungsi Laplace kamu = 1.65.

2) Mengetahui akurasi estimasi yang diberikan =kamu= 5, temukan
. Kita punya

. Oleh karena itu, jumlah percobaan n 25.

Tugas 12. Pengambilan sampel suhu t selama 6 hari pertama bulan Januari disajikan dalam tabel:

Temukan Interval Keyakinan untuk Harapan m populasi umum dengan probabilitas keyakinan
dan perkirakan simpangan baku umum s.

Keputusan:


dan
.

2) Estimasi tak bias temukan dengan rumus
:

=-175

=234.84

;
;

=-192

=116


.

3) Karena varians umum tidak diketahui, tetapi estimasinya diketahui, maka untuk memperkirakan ekspektasi matematisnya m kami menggunakan distribusi Student (Tabel 6, Lampiran 1) dan rumus (3.20).

Karena n 1 =n 2 =6, maka ,
, s 1 = 6,85 kita memiliki:
, maka -29.2-4.1<m 1 < -29.2+4.1.

Oleh karena itu -33.3<m 1 <-25.1.

Demikian pula, kami memiliki
, s 2 = 4,8, jadi

–34.9< m 2 < -29.1. Тогда доверительные интервалы примут вид: m 1 (-33,3;-25.1) dan m 2 (-34.9;-29.1).

Dalam ilmu terapan, misalnya, dalam disiplin konstruksi, tabel interval kepercayaan digunakan untuk menilai keakuratan objek, yang diberikan dalam literatur referensi yang relevan.

Seringkali penilai harus menganalisis pasar real estat dari segmen di mana objek penilaian berada. Jika pasar dikembangkan, mungkin sulit untuk menganalisis seluruh rangkaian objek yang disajikan, oleh karena itu, sampel objek digunakan untuk analisis. Sampel ini tidak selalu homogen, terkadang diperlukan untuk membersihkannya dari penawaran pasar yang terlalu tinggi atau terlalu rendah. Untuk tujuan ini, itu diterapkan selang kepercayaan. Tujuan dari penelitian ini adalah untuk melakukan analisis komparatif dari dua metode untuk menghitung interval kepercayaan dan memilih opsi perhitungan terbaik ketika bekerja dengan sampel yang berbeda dalam sistem estimatica.pro.

Interval kepercayaan - dihitung berdasarkan sampel, interval nilai atribut, yang dengan probabilitas yang diketahui berisi parameter yang diperkirakan dari populasi umum.

Arti menghitung interval kepercayaan adalah membangun interval seperti itu berdasarkan data sampel sehingga dapat ditegaskan dengan probabilitas tertentu bahwa nilai parameter yang diestimasi berada dalam interval ini. Dengan kata lain, selang kepercayaan dengan probabilitas tertentu mengandung nilai yang tidak diketahui dari besaran yang diperkirakan. Semakin lebar intervalnya, semakin tinggi ketidakakuratannya.

Ada berbagai metode untuk menentukan interval kepercayaan. Dalam artikel ini, kami akan mempertimbangkan 2 cara:

  • melalui median dan standar deviasi;
  • melalui nilai kritis t-statistik (koefisien siswa).

Tahapan analisis komparatif metode yang berbeda untuk menghitung CI:

1. membentuk sampel data;

2. kami mengolahnya dengan metode statistik: kami menghitung nilai rata-rata, median, varians, dll;

3. kita menghitung interval kepercayaan dengan dua cara;

4. Analisis sampel yang dibersihkan dan interval kepercayaan yang diperoleh.

Tahap 1. Pengambilan sampel data

Sampel dibentuk menggunakan sistem estimatica.pro. Sampel termasuk 91 penawaran untuk penjualan apartemen 1 kamar di zona harga ke-3 dengan jenis perencanaan "Khrushchev".

Tabel 1. Sampel awal

Harga 1 sq.m., c.u.

Gambar.1. sampel awal



Tahap 2. Pemrosesan sampel awal

Pengolahan sampel dengan metode statistik memerlukan perhitungan nilai sebagai berikut:

1. Rata-rata aritmatika

2. Median - angka yang mencirikan sampel: tepat setengah dari elemen sampel lebih besar dari median, setengah lainnya lebih kecil dari median

(untuk sampel dengan jumlah nilai ganjil)

3. Rentang - perbedaan antara nilai maksimum dan minimum dalam sampel

4. Varians - digunakan untuk memperkirakan variasi data secara lebih akurat

5. Standar deviasi untuk sampel (selanjutnya disebut RMS) adalah indikator paling umum dari dispersi nilai penyesuaian di sekitar mean aritmatika.

6. Koefisien variasi - mencerminkan tingkat penyebaran nilai penyesuaian

7. koefisien osilasi - mencerminkan fluktuasi relatif dari nilai ekstrim harga dalam sampel di sekitar rata-rata

Tabel 2. Indikator statistik sampel asli

Koefisien variasi, yang mencirikan homogenitas data, adalah 12,29%, tetapi koefisien osilasinya terlalu besar. Dengan demikian, kita dapat menyatakan bahwa sampel asli tidak homogen, jadi mari kita beralih ke menghitung interval kepercayaan.

Tahap 3. Perhitungan interval kepercayaan

Metode 1. Perhitungan melalui median dan standar deviasi.

Interval kepercayaan ditentukan sebagai berikut: nilai minimum - standar deviasi dikurangi dari median; nilai maksimum - standar deviasi ditambahkan ke median.

Jadi, selang kepercayaan (47179 CU; 60689 CU)

Beras. 2. Nilai dalam selang kepercayaan 1.



Metode 2. Membangun interval kepercayaan melalui nilai kritis t-statistik (koefisien siswa)

S.V. Gribovsky dalam buku "Metode matematika untuk menilai nilai properti" menjelaskan metode untuk menghitung interval kepercayaan melalui koefisien Student. Saat menghitung dengan metode ini, estimator sendiri harus menetapkan tingkat signifikansi , yang menentukan probabilitas dengan mana interval kepercayaan akan dibangun. Tingkat signifikansi 0,1 biasanya digunakan; 0,05 dan 0,01. Mereka sesuai dengan probabilitas kepercayaan 0,9; 0,95 dan 0,99. Dengan metode ini, nilai sebenarnya dari harapan dan varians matematika dianggap tidak diketahui secara praktis (yang hampir selalu benar ketika menyelesaikan masalah evaluasi praktis).

Rumus interval kepercayaan:

n - ukuran sampel;

Nilai kritis t-statistik (Distribusi Siswa) dengan tingkat signifikansi , jumlah derajat kebebasan n-1, yang ditentukan oleh tabel statistik khusus atau menggunakan MS Excel (→"Statistik"→ STUDRASPOBR);

- tingkat signifikansi, kita ambil =0,01.

Beras. 2. Nilai dalam selang kepercayaan 2.

Langkah 4. Analisis berbagai cara untuk menghitung interval kepercayaan

Dua metode menghitung interval kepercayaan - melalui median dan koefisien Student - menghasilkan nilai interval yang berbeda. Dengan demikian, dua sampel murni yang berbeda diperoleh.

Tabel 3. Indikator statistik untuk tiga sampel.

Indikator

sampel awal

1 pilihan

pilihan 2

Berarti

Penyebaran

koefisien variasi

koefisien osilasi

Jumlah benda pensiunan, pcs.

Berdasarkan perhitungan yang dilakukan, kita dapat mengatakan bahwa nilai interval kepercayaan yang diperoleh dengan metode yang berbeda berpotongan, sehingga Anda dapat menggunakan salah satu metode perhitungan atas kebijaksanaan penilai.

Namun, kami percaya bahwa ketika bekerja di sistem estimatica.pro, disarankan untuk memilih metode untuk menghitung interval kepercayaan, tergantung pada tingkat perkembangan pasar:

  • jika pasar tidak berkembang, gunakan metode perhitungan melalui median dan standar deviasi, karena jumlah objek pensiun dalam hal ini kecil;
  • jika pasar dikembangkan, terapkan perhitungan melalui nilai kritis t-statistik (koefisien siswa), karena dimungkinkan untuk membentuk sampel awal yang besar.

Dalam mempersiapkan artikel digunakan:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Metode matematika untuk menilai nilai properti. Moskow, 2014

2. Data dari sistem estimatica.pro

Biarkan variabel acak (kita dapat berbicara tentang populasi umum) didistribusikan menurut hukum normal, yang varians D = 2 (> 0) diketahui. Dari populasi umum (pada himpunan objek yang variabel acaknya ditentukan), sampel berukuran n dibuat. Sampel x 1 , x 2 ,..., x n dianggap sebagai kumpulan n variabel acak independen yang didistribusikan dengan cara yang sama seperti (pendekatan yang dijelaskan di atas dalam teks).

Sebelumnya, persamaan berikut juga telah dibahas dan dibuktikan:

Mx 1 = Mx 2 = ... = Mx n = M;

Dx 1 = Dx 2 = ... = Dx n = D;

Cukup dengan membuktikan (kami menghilangkan buktinya) bahwa variabel acak dalam kasus ini juga terdistribusi menurut hukum normal.

Mari kita nyatakan nilai M yang tidak diketahui dengan a dan pilih angka d > 0 sesuai dengan keandalan yang diberikan sehingga kondisi berikut terpenuhi:

P(- a< d) = (1)

Karena variabel acak terdistribusi menurut hukum normal dengan ekspektasi matematis M = M = a dan varians D = D /n = 2 /n, kita peroleh:

P(- a< d) =P(a - d < < a + d) =

Tetap memilih d sedemikian rupa sehingga persamaan

Untuk siapa pun, seseorang dapat menemukan angka t dari tabel sehingga (t) \u003d / 2. Angka t ini kadang-kadang disebut kuantil.

Sekarang dari kesetaraan

tentukan nilai d:

Kami memperoleh hasil akhir dengan menyajikan rumus (1) dalam bentuk:

Arti dari rumus terakhir adalah sebagai berikut: dengan reliabilitas, interval kepercayaan

mencakup parameter yang tidak diketahui a = M dari populasi. Bisa dikatakan berbeda: estimasi titik menentukan nilai parameter M dengan akurasi d= t / dan reliabilitas.

Tugas. Misalkan ada populasi umum dengan beberapa karakteristik yang didistribusikan menurut hukum normal dengan dispersi sebesar 6,25. Sampel berukuran n = 27 dibuat dan diperoleh nilai sampel rata-rata dari karakteristik = 12. Carilah selang kepercayaan yang mencakup ekspektasi matematis yang tidak diketahui dari karakteristik yang dipelajari dari populasi umum dengan reliabilitas = 0,99.

Keputusan. Pertama, menggunakan tabel untuk fungsi Laplace, kami menemukan nilai t dari persamaan (t) \u003d / 2 \u003d 0,495. Berdasarkan nilai yang diperoleh t = 2,58, kami menentukan keakuratan estimasi (atau setengah panjang interval kepercayaan) d: d = 2.52.58 / 1.24. Dari sini kita memperoleh selang kepercayaan yang diinginkan: (10,76; 13,24).

hipotesis statistik variasi umum

Interval kepercayaan untuk ekspektasi distribusi normal dengan varians yang tidak diketahui

Membiarkan menjadi variabel acak terdistribusi menurut hukum normal dengan harapan matematis M yang tidak diketahui, yang kami dilambangkan dengan huruf a . Mari kita buat sampel berukuran n. Mari kita tentukan sampel rata-rata dan varians sampel terkoreksi s 2 menggunakan rumus yang diketahui.

Nilai acak

didistribusikan menurut hukum Student dengan n - 1 derajat kebebasan.

Tugasnya adalah menemukan bilangan t seperti itu menurut keandalan yang diberikan dan jumlah derajat kebebasan n - 1 sehingga persamaan

atau persamaan setara

Di sini, dalam tanda kurung, kondisi ditulis bahwa nilai parameter yang tidak diketahui a termasuk dalam interval tertentu, yang merupakan interval kepercayaan. Batasannya tergantung pada keandalan, serta pada parameter pengambilan sampel dan s.

Untuk menentukan nilai t berdasarkan besaran, kita ubah persamaan (2) ke dalam bentuk:

Sekarang, menurut tabel untuk variabel acak t, didistribusikan menurut hukum Student, menurut probabilitas 1 - dan jumlah derajat kebebasan n - 1, kita menemukan t. Rumus (3) memberikan jawaban atas masalah tersebut.

Tugas. Pada uji kontrol 20 lampu listrik, durasi rata-rata pengoperasiannya sama dengan 2000 jam dengan standar deviasi (dihitung sebagai akar kuadrat dari varians sampel yang dikoreksi) sama dengan 11 jam. Diketahui bahwa durasi operasi lampu adalah variabel acak yang terdistribusi normal. Tentukan dengan reliabilitas 0,95 interval kepercayaan untuk ekspektasi matematis dari variabel acak ini.

Keputusan. Nilai 1 - dalam hal ini sama dengan 0,05. Menurut tabel distribusi Student, dengan jumlah derajat kebebasan sama dengan 19, kita menemukan: t = 2.093. Sekarang mari kita hitung akurasi perkiraan: 2.093121/ = 56,6. Dari sini kita mendapatkan interval kepercayaan yang diinginkan: (1943.4; 2056.6).

Mari kita membangun interval kepercayaan dalam MS EXCEL untuk memperkirakan nilai rata-rata dari distribusi dalam kasus nilai varians yang diketahui.

Tentu saja pilihannya tingkat kepercayaan sepenuhnya tergantung pada tugas yang ada. Dengan demikian, tingkat kepercayaan penumpang udara terhadap keandalan pesawat, tentu saja, harus lebih tinggi daripada tingkat kepercayaan pembeli terhadap keandalan bola lampu.

Rumusan Tugas

Mari kita asumsikan bahwa dari populasi setelah mengambil Sampel ukuran n. Ini diasumsikan bahwa simpangan baku distribusi ini diketahui. Diperlukan atas dasar ini sampel mengevaluasi yang tidak diketahui rata-rata distribusi(μ, ) dan bangun yang sesuai bilateral selang kepercayaan.

Estimasi Poin

Seperti diketahui dari statistik(sebut saja X cf) adalah estimasi tak bias dari mean ini populasi dan memiliki distribusi N(μ;σ 2 /n).

Catatan: Bagaimana jika Anda perlu membangun? selang kepercayaan dalam hal distribusi, yang tidak normal? Dalam hal ini, datang untuk menyelamatkan, yang mengatakan bahwa dengan ukuran yang cukup besar sampel n dari distribusi non- normal, distribusi sampling statistik av akan sekitar sesuai distribusi normal dengan parameter N(μ;σ 2 /n).

Jadi, perkiraan titik tengah nilai distribusi kita punya adalah sampel berarti, yaitu X cf. Sekarang mari kita sibuk interval kepercayaan.

Membangun interval kepercayaan

Biasanya, mengetahui distribusi dan parameternya, kita dapat menghitung probabilitas bahwa variabel acak akan mengambil nilai dari interval yang diberikan. Sekarang mari kita lakukan yang sebaliknya: temukan interval di mana variabel acak jatuh dengan probabilitas tertentu. Misalnya, dari properti distribusi normal diketahui bahwa dengan probabilitas 95%, sebuah variabel acak terdistribusi pada hukum biasa, akan berada dalam interval kira-kira +/- 2 dari nilai rata-rata(lihat artikel tentang). Interval ini akan berfungsi sebagai prototipe kami untuk selang kepercayaan.

Sekarang mari kita lihat apakah kita tahu distribusinya , menghitung interval ini? Untuk menjawab pertanyaan tersebut, kita harus menentukan bentuk distribusi dan parameternya.

Kita tahu bentuk distribusinya adalah distribusi normal(ingat bahwa kita sedang membicarakan distribusi sampel statistik X cf).

Parameter tidak kita ketahui (hanya perlu diestimasi menggunakan selang kepercayaan), tetapi kami memiliki perkiraannya X lih, dihitung berdasarkan Sampel, yang dapat digunakan.

Parameter kedua adalah sampel mean standar deviasi akan diketahui, sama dengan /√n.

Karena kita tidak tahu , maka kita akan membangun interval +/- 2 deviasi standar bukan dari nilai rata-rata, tetapi dari perkiraannya yang diketahui X cf. Itu. saat menghitung selang kepercayaan kami TIDAK akan berasumsi bahwa X cf akan jatuh dalam interval +/- 2 deviasi standar dari dengan probabilitas 95%, dan kita asumsikan intervalnya adalah +/- 2 deviasi standar dari X cf dengan probabilitas 95% akan mencakup - rata-rata populasi umum, dari mana Sampel. Kedua pernyataan ini setara, tetapi pernyataan kedua memungkinkan kita untuk mengkonstruksi selang kepercayaan.

Selain itu, kami memperbaiki intervalnya: variabel acak terdistribusi di atas hukum biasa, dengan probabilitas 95% berada dalam interval +/- 1,960 deviasi standar, bukan +/- 2 deviasi standar. Ini dapat dihitung dengan menggunakan rumus \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. contoh file Spasi Lembar.

Sekarang kita dapat merumuskan pernyataan probabilistik yang akan membantu kita membentuk selang kepercayaan:
"Kemungkinan bahwa populasi berarti terletak dari rata-rata sampel dalam 1,960" simpangan baku rata-rata sampel", sama dengan 95%.

Nilai probabilitas yang disebutkan dalam pernyataan memiliki nama khusus , yang berhubungan dengan tingkat signifikansi (alfa) dengan ekspresi sederhana tingkat kepercayaan =1 . Dalam kasus kami tingkat signifikansi α =1-0,95=0,05 .

Sekarang, berdasarkan pernyataan probabilistik ini, kami menulis ekspresi untuk menghitung selang kepercayaan:

dimana Zα/2 standar distribusi normal(nilai seperti itu dari variabel acak z, Apa P(z>=Zα/2 )=α/2).

Catatan: Atas /2-kuantil menentukan lebar selang kepercayaan di deviasi standar sampel berarti. Atas /2-kuantil standar distribusi normal selalu lebih besar dari 0, yang sangat nyaman.

Dalam kasus kami, pada = 0,05, atas /2-kuantil sama dengan 1,960. Untuk tingkat signifikansi lainnya (10%; 1%) atas /2-kuantil Zα/2 dapat dihitung menggunakan rumus \u003d NORM.ST.OBR (1-α / 2) atau, jika diketahui tingkat kepercayaan, =NORM.ST.OBR((1+tingkat kepercayaan)/2).

Biasanya saat membangun interval kepercayaan untuk memperkirakan mean gunakan saja atas/2-kuantil dan tidak menggunakan lebih rendah/2-kuantil. Hal ini dimungkinkan karena standar distribusi normal simetris terhadap sumbu x ( kepadatan distribusinya simetris tentang rata-rata, yaitu 0). Karena itu, tidak perlu menghitung lebih rendah /2-kuantil(ini hanya disebut /2-kuantil), karena itu sama atas/2-kuantil dengan tanda minus.

Ingatlah bahwa, terlepas dari bentuk distribusi x, variabel acak yang sesuai X cf didistribusikan sekitar bagus N(μ;σ 2 /n) (lihat artikel tentang). Oleh karena itu, secara umum, ekspresi di atas untuk selang kepercayaan hanya perkiraan. Jika x terdistribusi pada hukum biasa N(μ;σ 2 /n), maka ekspresi untuk selang kepercayaan akurat.

Perhitungan interval kepercayaan dalam MS EXCEL

Mari kita selesaikan masalahnya.
Waktu respons komponen elektronik terhadap sinyal input merupakan karakteristik penting dari perangkat. Seorang insinyur ingin memplot interval kepercayaan untuk waktu respons rata-rata pada tingkat kepercayaan 95%. Dari pengalaman sebelumnya, insinyur mengetahui bahwa standar deviasi dari waktu respon adalah 8 ms. Diketahui bahwa insinyur melakukan 25 pengukuran untuk memperkirakan waktu respons, nilai rata-rata adalah 78 ms.

Keputusan: Seorang insinyur ingin mengetahui waktu respons suatu perangkat elektronik, tetapi ia memahami bahwa waktu respons tidak tetap, melainkan variabel acak yang memiliki distribusinya sendiri. Jadi yang terbaik yang bisa dia harapkan adalah menentukan parameter dan bentuk distribusi ini.

Sayangnya dari kondisi permasalahan tersebut, kita tidak mengetahui bentuk distribusi response time (tidak harus normal). , distribusi ini juga tidak diketahui. Hanya dia yang dikenal simpangan baku= 8. Oleh karena itu, sementara kita tidak dapat menghitung probabilitas dan konstruksi selang kepercayaan.

Namun, meskipun kita tidak tahu distribusinya waktu tanggapan terpisah, kita tahu bahwa menurut CPT, distribusi sampel waktu respons rata-rata kira-kira normal(kita akan mengasumsikan bahwa kondisi CPT dilakukan, karena ukuran sampel cukup besar (n=25)) .

Lebih-lebih lagi, rata-rata distribusi ini sama dengan nilai rata-rata distribusi respons unit, mis. . TETAPI simpangan baku distribusi ini (σ/√n) dapat dihitung dengan menggunakan rumus =8/ROOT(25) .

Diketahui juga bahwa insinyur itu menerima perkiraan titik parameter sama dengan 78 ms (X cf). Oleh karena itu, sekarang kita dapat menghitung probabilitas, karena kita tahu bentuk distribusi ( normal) dan parameternya (Х dan /√n).

Insinyur ingin tahu nilai yang diharapkan dari distribusi waktu respon. Seperti yang dinyatakan di atas, ini sama dengan harapan distribusi sampel dari waktu respons rata-rata. Jika kita menggunakan distribusi normal N(X cf; /√n), maka yang diinginkan akan berada pada range +/-2*σ/√n dengan probabilitas sekitar 95%.

Tingkat signifikansi sama dengan 1-0,95=0,05.

Akhirnya, temukan batas kiri dan kanan selang kepercayaan.
Batas kiri: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / ROOT (25) = 74,864
Batas kanan: \u003d 78 + NORM.ST.OBR (1-0,05 / 2) * 8 / ROOT (25) \u003d 81,136

Batas kiri: =NORM.INV(0.05/2, 78, 8/SQRT(25))
Batas kanan: =NORM.INV(1-0.05/2, 78, 8/SQRT(25))

Menjawab: selang kepercayaan pada 95% tingkat kepercayaan dan=8mdtk sama dengan 78+/-3.136ms

PADA contoh file pada lembar Sigma diketahui membuat formulir untuk perhitungan dan konstruksi bilateral selang kepercayaan untuk sewenang-wenang sampel dengan dan yang diberikan tingkat signifikansi.

CONFIDENCE.NORM() fungsi

Jika nilai-nilai sampel berada dalam jangkauan B20:B79 , sebuah tingkat signifikansi sama dengan 0,05; kemudian rumus MS EXCEL:
=RATA-RATA(B20:B79)-PERCAYA DIRI(0.05,σ, COUNT(B20:B79))
akan mengembalikan batas kiri selang kepercayaan.

Batas yang sama dapat dihitung dengan menggunakan rumus:
=AVERAGE(B20:B79)-NORM.ST.INV(1-0.05/2)*σ/SQRT(COUNT(B20:B79))

Catatan: Fungsi TRUST.NORM() muncul di MS EXCEL 2010. Versi MS EXCEL sebelumnya menggunakan fungsi TRUST().