Hitung interval kepercayaan. Metode Analisis Kuantitatif: Memperkirakan Interval Keyakinan

Interval kepercayaan datang kepada kami dari bidang statistik. Ini rentang tertentu, yang berfungsi untuk memperkirakan parameter yang tidak diketahui dengan derajat tinggi keandalan. Cara termudah untuk menjelaskan ini adalah dengan sebuah contoh.

Misalkan Anda perlu menyelidiki beberapa variabel acak, misalnya, kecepatan respons server terhadap permintaan klien. Setiap kali pengguna mengetik alamat situs tertentu, server merespons dengan kecepatan yang berbeda. Dengan demikian, waktu respons yang diselidiki memiliki karakter acak. Jadi begini selang kepercayaan memungkinkan Anda untuk menentukan batas-batas parameter ini, dan kemudian dimungkinkan untuk menegaskan bahwa dengan probabilitas 95% server akan berada dalam kisaran yang dihitung oleh kami.

Atau Anda perlu mencari tahu berapa banyak orang yang tahu tentang merek dagang perusahaan. Ketika interval kepercayaan dihitung, akan mungkin, misalnya, untuk mengatakan bahwa dengan probabilitas 95%, pangsa konsumen yang mengetahui hal ini berkisar antara 27% hingga 34%.

Berhubungan erat dengan istilah ini adalah tingkat kepercayaan diri. Ini mewakili probabilitas bahwa parameter yang diinginkan termasuk dalam interval kepercayaan. Nilai ini menentukan seberapa besar jangkauan yang kita inginkan. Bagaimana nilai yang lebih besar diterima, semakin sempit interval kepercayaannya, dan sebaliknya. Biasanya diatur ke 90%, 95% atau 99%. Nilai 95% adalah yang paling populer.

Indikator ini juga dipengaruhi oleh varians pengamatan dan definisinya didasarkan pada asumsi bahwa fitur yang diteliti mematuhi Pernyataan ini juga dikenal sebagai Hukum Gauss. Menurutnya, distribusi seperti itu dari semua probabilitas kontinu variabel acak, yang dapat digambarkan dengan kepadatan probabilitas. Jika asumsi tentang distribusi normal ternyata salah, maka perkiraannya mungkin salah.

Pertama, mari kita cari tahu bagaimana menghitung interval kepercayaan untuk Di sini, dua kasus dimungkinkan. Dispersi (tingkat penyebaran variabel acak) mungkin atau mungkin tidak diketahui. Jika diketahui, maka selang kepercayaan kita dihitung dengan menggunakan rumus berikut:

xsr - t*σ / (persegi(n))<= α <= хср + t*σ / (sqrt(n)), где

- tanda,

t adalah parameter dari tabel distribusi Laplace,

adalah akar kuadrat dari dispersi.

Jika varians tidak diketahui, maka dapat dihitung jika kita mengetahui semua nilai fitur yang diinginkan. Untuk ini, rumus berikut digunakan:

2 = 2ср - (хр)2, di mana

2ср - nilai rata-rata kuadrat dari sifat yang diteliti,

(xsr)2 adalah kuadrat dari fitur ini.

Rumus yang digunakan untuk menghitung interval kepercayaan dalam kasus ini sedikit berubah:

xsr - t*s / (persegi(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - rata-rata sampel,

- tanda,

t adalah parameter yang ditemukan menggunakan tabel distribusi Siswa t \u003d t (ɣ; n-1),

sqrt(n) adalah akar kuadrat dari total ukuran sampel,

s adalah akar kuadrat dari varians.

Pertimbangkan contoh ini. Asumsikan bahwa, berdasarkan hasil 7 pengukuran, sifat yang diteliti ditentukan menjadi 30 dan varians sampel sama dengan 36. Perlu untuk menemukan, dengan probabilitas 99%, interval kepercayaan yang berisi nilai sebenarnya dari parameter yang diukur.

Pertama, mari kita tentukan apa t sama dengan: t \u003d t (0,99; 7-1) \u003d 3,71. Dengan menggunakan rumus di atas, kita peroleh:

xsr - t*s / (persegi(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (persegi(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Interval kepercayaan untuk varians dihitung baik dalam kasus mean yang diketahui dan ketika tidak ada data pada ekspektasi matematis, dan hanya nilai estimasi titik tak bias dari varians yang diketahui. Kami tidak akan memberikan rumus perhitungannya di sini, karena cukup rumit dan, jika diinginkan, selalu dapat ditemukan di internet.

Kami hanya mencatat bahwa lebih mudah untuk menentukan interval kepercayaan menggunakan program Excel atau layanan jaringan, yang disebut demikian.

Salah satu metode untuk memecahkan masalah statistik adalah dengan menghitung interval kepercayaan. Ini digunakan sebagai alternatif yang lebih disukai untuk estimasi titik ketika ukuran sampel kecil. Perlu dicatat bahwa proses menghitung interval kepercayaan agak rumit. Tetapi alat program Excel memungkinkan Anda untuk menyederhanakannya. Mari kita cari tahu bagaimana ini dilakukan dalam praktik.

Metode ini digunakan dalam estimasi interval berbagai besaran statistik. Tugas utama perhitungan ini adalah menghilangkan ketidakpastian estimasi titik.

Di Excel, ada dua opsi utama untuk menghitung menggunakan metode ini: ketika varians diketahui, dan ketika tidak diketahui. Dalam kasus pertama, fungsi tersebut digunakan untuk perhitungan PERCAYA DIRI NORM, dan yang kedua KEPERCAYAAN. SISWA.

Metode 1: Fungsi CONFIDENCE NORM

Operator PERCAYA DIRI NORM, yang mengacu pada kelompok fungsi statistik, pertama kali muncul di Excel 2010. Versi sebelumnya dari program ini menggunakan mitranya MEMERCAYAI. Tugas operator ini adalah menghitung selang kepercayaan dengan distribusi normal untuk rata-rata populasi.

Sintaksnya adalah sebagai berikut:

NORM PERCAYA DIRI (alfa, standard_dev, ukuran)

"Alfa" adalah argumen yang menunjukkan tingkat signifikansi yang digunakan untuk menghitung tingkat kepercayaan. Tingkat kepercayaan sama dengan ekspresi berikut:

(1-"Alfa")*100

"Standar deviasi" adalah argumen, yang esensinya jelas dari namanya. Ini adalah standar deviasi dari sampel yang diusulkan.

"Ukuran" adalah argumen yang menentukan ukuran sampel.

Semua argumen untuk operator ini diperlukan.

Fungsi MEMERCAYAI memiliki argumen dan kemungkinan yang sama persis dengan yang sebelumnya. Sintaksnya adalah:

KEPERCAYAAN(alfa, standar_dev, ukuran)

Seperti yang Anda lihat, perbedaannya hanya pada nama operator. Fitur ini telah dipertahankan di Excel 2010 dan versi yang lebih baru dalam kategori khusus untuk alasan kompatibilitas. "Kesesuaian". Di versi Excel 2007 dan sebelumnya, ini ada di grup utama operator statistik.

Batas interval kepercayaan ditentukan dengan menggunakan rumus bentuk berikut:

X+(-)PERCAYA DIRI NORM

Di mana X adalah mean sampel, yang terletak di tengah rentang yang dipilih.

Sekarang mari kita lihat bagaimana menghitung interval kepercayaan menggunakan contoh spesifik. 12 tes dilakukan, menghasilkan hasil yang berbeda, yang tercantum dalam tabel. Inilah totalitas kita. Standar deviasinya adalah 8. Kita perlu menghitung interval kepercayaan pada tingkat kepercayaan 97%.

  1. Pilih sel tempat hasil pemrosesan data akan ditampilkan. Mengklik tombol "Sisipkan Fungsi".
  2. muncul Fungsi Wizard. Masuk ke kategori "Statistik" dan sorot namanya "PERCAYA DIRI.NORM". Setelah itu klik tombol Oke.
  3. Jendela argumen terbuka. Bidangnya secara alami sesuai dengan nama argumen.
    Atur kursor ke bidang pertama - "Alfa". Di sini kita harus menentukan tingkat signifikansi. Seperti yang kita ingat, tingkat kepercayaan kita adalah 97%. Pada saat yang sama, kami mengatakan bahwa itu dihitung dengan cara ini:

    (1 tingkat kepercayaan)/100

    Artinya, dengan mengganti nilai, kita mendapatkan:

    Dengan perhitungan sederhana, kami menemukan bahwa argumen "Alfa" sama dengan 0,03 . Masukkan nilai ini di bidang.

    Seperti yang Anda ketahui, standar deviasi sama dengan 8 . Oleh karena itu, di lapangan "Standar deviasi" tulis saja nomor itu.

    di lapangan "Ukuran" Anda harus memasukkan jumlah elemen tes yang dilakukan. Seperti yang kita ingat, mereka 12 . Tetapi untuk mengotomatiskan rumus dan tidak mengeditnya setiap kali tes baru dilakukan, mari kita atur nilai ini bukan ke angka biasa, tetapi menggunakan operator MEMERIKSA. Jadi, kami mengatur kursor di lapangan "Ukuran", lalu klik segitiga yang terletak di sebelah kiri bilah rumus.

    Daftar fungsi yang baru saja digunakan akan muncul. Jika operator MEMERIKSA digunakan oleh Anda baru-baru ini, itu harus ada di daftar ini. Dalam hal ini, Anda hanya perlu mengklik namanya. Kalau tidak, jika Anda tidak menemukannya, lanjutkan ke intinya "Lebih banyak fitur...".

  4. Tampaknya sudah akrab bagi kita Fungsi Wizard. Pindah kembali ke grup "Statistik". Kami memilih nama di sana "MEMERIKSA". Klik pada tombol Oke.
  5. Jendela argumen untuk operator di atas muncul. Fungsi ini dirancang untuk menghitung jumlah sel dalam rentang tertentu yang berisi nilai numerik. Sintaksnya adalah sebagai berikut:

    COUNT(nilai1, nilai2,…)

    Grup argumen "Nilai" adalah referensi ke rentang di mana Anda ingin menghitung jumlah sel yang diisi dengan data numerik. Secara total, mungkin ada hingga 255 argumen seperti itu, tetapi dalam kasus kami, kami hanya membutuhkan satu.

    Atur kursor di lapangan "Nilai1" dan, dengan menahan tombol kiri mouse, pilih rentang pada lembar yang berisi populasi kita. Kemudian alamatnya akan ditampilkan di lapangan. Klik pada tombol Oke.

  6. Setelah itu, aplikasi akan melakukan perhitungan dan menampilkan hasilnya di sel tempatnya berada. Dalam kasus khusus kami, rumusnya ternyata seperti ini:

    NORM PERCAYA DIRI(0.03,8,COUNT(B2:B13))

    Hasil keseluruhan dari perhitungan adalah 5,011609 .

  7. Tapi itu tidak semua. Seperti yang kita ingat, batas interval kepercayaan dihitung dengan menjumlahkan dan mengurangkan dari nilai sampel rata-rata hasil perhitungan PERCAYA DIRI NORM. Dengan cara ini, batas kanan dan kiri interval kepercayaan dihitung, masing-masing. Rata-rata sampel itu sendiri dapat dihitung menggunakan operator RATA-RATA.

    Operator ini dirancang untuk menghitung rata-rata aritmatika dari rentang angka yang dipilih. Ini memiliki sintaks yang agak sederhana berikut:

    RATA-RATA(angka1, angka2,…)

    Argumen "Nomor" dapat berupa nilai numerik tunggal atau referensi ke sel atau bahkan seluruh rentang yang memuatnya.

    Jadi, pilih sel di mana perhitungan nilai rata-rata akan ditampilkan, dan klik tombol "Sisipkan Fungsi".

  8. terbuka Fungsi Wizard. Kembali ke kategori "Statistik" dan pilih nama dari daftar "RATA-RATA". Seperti biasa, klik tombol Oke.
  9. Jendela argumen diluncurkan. Atur kursor di lapangan "Nomor 1" dan dengan menekan tombol kiri mouse, pilih seluruh rentang nilai. Setelah koordinat ditampilkan di lapangan, klik tombol Oke.
  10. Setelah itu RATA-RATA menampilkan hasil perhitungan ke elemen lembar.
  11. Kami menghitung batas yang tepat dari interval kepercayaan. Untuk melakukan ini, pilih sel yang terpisah, beri tanda «=» dan tambahkan konten elemen lembar tempat hasil perhitungan fungsi berada RATA-RATA dan PERCAYA DIRI NORM. Untuk melakukan perhitungan, tekan tombol Memasuki. Dalam kasus kami, kami mendapatkan rumus berikut:

    Hasil perhitungan: 6,953276

  12. Dengan cara yang sama, kita menghitung batas kiri interval kepercayaan, hanya kali ini dari hasil perhitungan RATA-RATA kurangi hasil perhitungan operator PERCAYA DIRI NORM. Ternyata rumus untuk contoh kita jenis berikut ini:

    Hasil perhitungan: -3,06994

  13. Kami mencoba menjelaskan secara rinci semua langkah untuk menghitung interval kepercayaan, jadi kami menjelaskan setiap rumus secara rinci. Tapi Anda bisa menggabungkan semua tindakan dalam satu formula. Perhitungan batas kanan selang kepercayaan dapat ditulis sebagai berikut:

    RATA-RATA(B2:B13)+PERCAYA DIRI(0.03,8,JUMLAH(B2:B13))

  14. Perhitungan serupa dari batas kiri akan terlihat seperti ini:

    RATA-RATA(B2:B13)-PERCAYA DIRI.NORM(0.03,8,JUMLAH(B2:B13))

Metode 2: Fungsi TRUST.STUDENT

Selain itu, ada fungsi lain di Excel yang terkait dengan perhitungan interval kepercayaan - KEPERCAYAAN. SISWA. Itu baru muncul sejak Excel 2010. Operator ini melakukan perhitungan interval kepercayaan populasi menggunakan distribusi Student. Sangat mudah untuk menggunakannya dalam kasus ketika varians dan, karenanya, standar deviasi tidak diketahui. Sintaks operatornya adalah:

TRUST.SISWA(alfa,standard_dev,ukuran)

Seperti yang Anda lihat, nama-nama operator dalam kasus ini tetap tidak berubah.

Mari kita lihat bagaimana menghitung batas-batas interval kepercayaan dengan standar deviasi yang tidak diketahui menggunakan contoh populasi yang sama yang kita pertimbangkan pada metode sebelumnya. Tingkat kepercayaan, seperti terakhir kali, kami akan mengambil 97%.

  1. Pilih sel di mana perhitungan akan dilakukan. Klik pada tombol "Sisipkan Fungsi".
  2. Di buka Fungsi Wizard masuk ke kategori "Statistik". Pilih nama "PERCAYA. SISWA". Klik pada tombol Oke.
  3. Jendela argumen untuk operator tertentu diluncurkan.

    di lapangan "Alfa", mengingat tingkat kepercayaannya adalah 97%, kami menuliskan angkanya 0,03 . Kali kedua kita tidak akan memikirkan prinsip-prinsip penghitungan parameter ini.

    Setelah itu, atur kursor di bidang "Standar deviasi". Kali ini, indikator ini tidak kita ketahui dan perlu dihitung. Ini dilakukan dengan menggunakan fungsi khusus - STDEV.B. Untuk memanggil jendela operator ini, klik segitiga di sebelah kiri bilah rumus. Jika kami tidak menemukan nama yang diinginkan dalam daftar yang terbuka, buka item "Lebih banyak fitur...".

  4. sedang berlari Fungsi Wizard. Pindah ke kategori "Statistik" dan tandai namanya "STDEV.B". Kemudian klik tombol Oke.
  5. Jendela argumen terbuka. tugas operator STDEV.B adalah definisi simpangan baku dalam pengambilan sampel. Sintaksnya terlihat seperti ini:

    STDEV.V(nomor1,nomor2,…)

    Mudah ditebak bahwa argumennya "Nomor" adalah alamat dari elemen seleksi. Jika pilihan ditempatkan dalam satu larik, maka hanya menggunakan satu argumen, Anda dapat memberikan tautan ke rentang ini.

    Atur kursor di lapangan "Nomor 1" dan, seperti biasa, menahan tombol kiri mouse, pilih set. Setelah koordinat ada di lapangan, jangan buru-buru menekan tombol Oke karena hasilnya akan salah. Pertama kita perlu kembali ke jendela argumen operator KEPERCAYAAN. SISWA untuk membuat argumen terakhir. Untuk melakukan ini, klik nama yang sesuai di bilah rumus.

  6. Jendela argumen dari fungsi yang sudah dikenal terbuka lagi. Atur kursor di lapangan "Ukuran". Sekali lagi, klik pada segitiga yang sudah tidak asing lagi bagi kita untuk menuju ke pilihan operator. Seperti yang Anda pahami, kami membutuhkan nama "MEMERIKSA". Karena kami menggunakan fungsi ini dalam perhitungan di metode sebelumnya, fungsi ini ada dalam daftar ini, jadi klik saja. Jika Anda tidak menemukannya, ikuti algoritma yang dijelaskan dalam metode pertama.
  7. Masuk ke jendela argumen MEMERIKSA, letakkan kursor di bidang "Nomor 1" dan dengan menekan tombol mouse, pilih koleksi. Kemudian klik tombol Oke.
  8. Setelah itu, program menghitung dan menampilkan nilai interval kepercayaan.
  9. Untuk menentukan batas, kita perlu menghitung mean sampel lagi. Tapi, mengingat algoritma perhitungannya menggunakan rumus RATA-RATA sama seperti pada metode sebelumnya, dan bahkan hasilnya tidak berubah, kami tidak akan membahas ini secara mendetail untuk kedua kalinya.
  10. Menjumlahkan hasil perhitungan RATA-RATA dan KEPERCAYAAN. SISWA, kita memperoleh batas yang tepat dari selang kepercayaan.
  11. Dikurangi dari hasil perhitungan operator RATA-RATA hasil perhitungan KEPERCAYAAN. SISWA, kita memiliki batas kiri interval kepercayaan.
  12. Jika perhitungan ditulis dalam satu rumus, maka perhitungan batas kanan dalam kasus kami akan terlihat seperti ini:

    RATA-RATA(B2:B13)+PERCAYA DIRI SISWA(0.03,STDV(B2:B13),JUMLAH(B2:B13))

  13. Dengan demikian, rumus untuk menghitung batas kiri akan terlihat seperti ini:

    RATA-RATA(B2:B13)-PERCAYA DIRI SISWA(0.03,STDV(B2:B13),JUMLAH(B2:B13))

Seperti yang Anda lihat, alat program Excel memungkinkan untuk secara signifikan memfasilitasi perhitungan interval kepercayaan dan batas-batasnya. Untuk tujuan ini, operator terpisah digunakan untuk sampel yang variansnya diketahui dan tidak diketahui.

Dan lain-lain.Semuanya adalah perkiraan rekan teoretis mereka, yang dapat diperoleh jika tidak ada sampel, tetapi populasi umum. Namun sayang, populasi umum sangat mahal dan seringkali tidak tersedia.

Konsep estimasi interval

Setiap estimasi sampel memiliki beberapa pencar, karena adalah variabel acak tergantung pada nilai dalam sampel tertentu. Oleh karena itu, untuk inferensi statistik yang lebih andal, seseorang harus mengetahui tidak hanya perkiraan titik, tetapi juga intervalnya, yang dengan probabilitas tinggi γ (gamma) mencakup perkiraan indikator θ (theta).

Secara formal, ini adalah dua nilai seperti itu (statistik) T1(X) dan T2(X), Apa T1< T 2 , yang pada tingkat probabilitas tertentu γ kondisi terpenuhi:

Singkatnya, itu mungkin γ atau lebih nilai sebenarnya berada di antara titik-titik T1(X) dan T2(X), yang disebut batas bawah dan batas atas selang kepercayaan.

Salah satu syarat untuk membangun interval kepercayaan adalah kesempitan maksimumnya, yaitu itu harus sesingkat mungkin. Keinginan itu cukup alami, karena. peneliti mencoba untuk lebih akurat melokalisasi temuan parameter yang diinginkan.

Oleh karena itu, interval kepercayaan harus mencakup probabilitas distribusi maksimum. dan skor itu sendiri berada di tengah.

Artinya, probabilitas deviasi (indikator sebenarnya dari perkiraan) ke atas sama dengan probabilitas deviasi ke bawah. Perlu juga dicatat bahwa untuk distribusi miring, interval di sebelah kanan tidak sama dengan interval di sebelah kiri.

Gambar di atas dengan jelas menunjukkan bahwa semakin besar tingkat kepercayaan, semakin lebar interval - hubungan langsung.

Ini adalah pengantar kecil untuk teori estimasi interval parameter yang tidak diketahui. Mari kita beralih ke menemukan batas kepercayaan untuk ekspektasi matematis.

Interval kepercayaan untuk ekspektasi matematis

Jika data asli didistribusikan lebih , maka rata-rata akan menjadi nilai normal. Ini mengikuti dari aturan bahwa kombinasi linier dari nilai normal juga memiliki distribusi normal. Oleh karena itu, untuk menghitung probabilitas, kita dapat menggunakan perangkat matematika dari hukum distribusi normal.

Namun, ini akan membutuhkan pengetahuan tentang dua parameter - nilai yang diharapkan dan varians, yang biasanya tidak diketahui. Anda tentu saja dapat menggunakan perkiraan alih-alih parameter (rata-rata aritmatika dan ), tetapi kemudian distribusi rata-rata tidak akan terlalu normal, itu akan sedikit diratakan. Warga negara William Gosset dari Irlandia dengan cerdik mencatat fakta ini ketika ia mempublikasikan penemuannya dalam Biometrica edisi Maret 1908. Untuk tujuan kerahasiaan, Gosset menandatangani kontrak dengan Student. Ini adalah bagaimana distribusi-t Student muncul.

Namun, distribusi normal data, yang digunakan oleh K. Gauss dalam analisis kesalahan dalam pengamatan astronomi, sangat jarang dalam kehidupan terestrial dan cukup sulit untuk menetapkan ini (untuk akurasi tinggi, diperlukan sekitar 2 ribu pengamatan). Oleh karena itu, yang terbaik adalah membuang asumsi normalitas dan menggunakan metode yang tidak bergantung pada distribusi data asli.

Timbul pertanyaan: apa distribusi mean aritmatika jika dihitung dari data distribusi yang tidak diketahui? Jawabannya diberikan oleh teori probabilitas yang terkenal teorema limit pusat(CPT). Dalam matematika, ada beberapa versi (formulasi telah disempurnakan selama bertahun-tahun), tetapi semuanya, secara kasar, sampai pada pernyataan bahwa jumlah sejumlah besar variabel acak independen mematuhi hukum distribusi normal.

Saat menghitung mean aritmatika, jumlah variabel acak digunakan. Dari sini ternyata mean aritmatika berdistribusi normal, dimana nilai harapan adalah nilai harapan dari data awal, dan variansnya adalah .

Orang pintar tahu cara membuktikan CLT, tetapi kami akan memverifikasi ini dengan bantuan eksperimen yang dilakukan di Excel. Mari kita simulasikan sampel 50 variabel acak terdistribusi seragam (menggunakan fungsi Excel RANDOMBETWEEN). Kemudian kita akan membuat 1000 sampel seperti itu dan menghitung rata-rata aritmatika untuk masing-masing sampel. Mari kita lihat distribusinya.

Terlihat bahwa distribusi rata-ratanya mendekati hukum normal. Jika volume sampel dan jumlahnya dibuat lebih besar, maka kemiripannya akan lebih baik.

Sekarang kita telah melihat sendiri validitas CLT, kita dapat, menggunakan , menghitung interval kepercayaan untuk mean aritmatika, yang mencakup mean sebenarnya atau ekspektasi matematis dengan probabilitas tertentu.

Untuk menetapkan batas atas dan batas bawah, perlu diketahui parameter dari distribusi normal. Sebagai aturan, mereka tidak, oleh karena itu, perkiraan digunakan: rata-rata aritmatika dan varians sampel. Sekali lagi, metode ini memberikan perkiraan yang baik hanya untuk sampel besar. Jika sampelnya kecil, sering disarankan untuk menggunakan distribusi Student. Jangan percaya! Distribusi siswa untuk mean hanya terjadi jika data asli memiliki distribusi normal, yaitu hampir tidak pernah. Oleh karena itu, lebih baik segera mengatur bilah minimum untuk jumlah data yang diperlukan dan menggunakan metode yang benar secara asimtotik. Mereka mengatakan 30 pengamatan sudah cukup. Ambil 50 - Anda tidak bisa salah.

T 1.2 adalah batas bawah dan batas atas interval kepercayaan

– sampel rata-rata aritmatika

s0– simpangan baku sampel (tidak bias)

n - ukuran sampel

γ – tingkat kepercayaan (biasanya sama dengan 0,9, 0,95 atau 0,99)

c =Φ -1 ((1+γ)/2) adalah kebalikan dari fungsi distribusi normal standar. Secara sederhana, ini adalah jumlah kesalahan standar dari rata-rata aritmatika ke batas bawah atau atas (tiga probabilitas yang ditunjukkan sesuai dengan nilai 1,64, 1,96 dan 2,58).

Inti dari rumusnya adalah bahwa rata-rata aritmatika diambil dan kemudian sejumlah tertentu disisihkan darinya ( dengan) kesalahan standar ( s 0 /√n). Semuanya diketahui, ambil dan hitung.

Sebelum penggunaan PC secara massal, untuk mendapatkan nilai fungsi distribusi normal dan kebalikannya, digunakan . Mereka masih digunakan, tetapi lebih efisien untuk beralih ke formula Excel yang sudah jadi. Semua elemen dari rumus di atas ( , dan ) dapat dengan mudah dihitung di Excel. Tetapi ada juga formula siap pakai untuk menghitung interval kepercayaan - PERCAYA DIRI NORM. Sintaksnya adalah sebagai berikut.

NORM PERCAYA DIRI (alfa, standard_dev, ukuran)

alfa– tingkat signifikansi atau tingkat kepercayaan, yang dalam notasi di atas sama dengan 1-γ, yaitu. probabilitas bahwa matematisharapan akan berada di luar selang kepercayaan. Dengan tingkat kepercayaan 0,95, alpha 0,05, dan seterusnya.

standar_off adalah simpangan baku dari data sampel. Anda tidak perlu menghitung kesalahan standar, Excel akan membagi dengan akar n.

ukuran– ukuran sampel (n).

Hasil dari fungsi CONFIDENCE.NORM adalah suku kedua dari rumus untuk menghitung interval kepercayaan, yaitu. setengah interval. Dengan demikian, poin bawah dan atas adalah rata-rata ± nilai yang diperoleh.

Dengan demikian, dimungkinkan untuk membangun algoritma universal untuk menghitung interval kepercayaan untuk rata-rata aritmatika, yang tidak bergantung pada distribusi data awal. Harga untuk universalitas adalah sifatnya yang asimtotik, yaitu. kebutuhan untuk menggunakan sampel yang relatif besar. Namun, di era teknologi modern, mengumpulkan jumlah data yang tepat biasanya tidak sulit.

Menguji Hipotesis Statistik Menggunakan Interval Keyakinan

(modul 111)

Salah satu masalah utama yang dipecahkan dalam statistik adalah. Singkatnya, esensinya adalah ini. Sebuah asumsi dibuat, misalnya, bahwa harapan dari populasi umum sama dengan beberapa nilai. Kemudian distribusi sarana sampel dibangun, yang dapat diamati dengan harapan tertentu. Selanjutnya, kita melihat di mana dalam distribusi bersyarat ini rata-rata sebenarnya berada. Jika melampaui batas yang diizinkan, maka kemunculan rata-rata seperti itu sangat tidak mungkin, dan dengan satu pengulangan percobaan hampir tidak mungkin, yang bertentangan dengan hipotesis yang diajukan, yang berhasil ditolak. Jika rata-rata tidak melampaui tingkat kritis, maka hipotesis tidak ditolak (tetapi juga tidak terbukti!).

Jadi, dengan bantuan interval kepercayaan, dalam kasus kami untuk harapan, Anda juga dapat menguji beberapa hipotesis. Ini sangat mudah dilakukan. Misalkan rata-rata aritmatika untuk beberapa sampel adalah 100. Hipotesis sedang diuji bahwa nilai yang diharapkan adalah, katakanlah, 90. Artinya, jika kita mengajukan pertanyaan secara primitif, kedengarannya seperti ini: mungkinkah dengan nilai sebenarnya dari rata-rata sama dengan 90, rata-rata yang diamati adalah 100?

Untuk menjawab pertanyaan ini, informasi tambahan tentang standar deviasi dan ukuran sampel akan diperlukan. Katakanlah standar deviasi adalah 30, dan jumlah pengamatan adalah 64 (untuk mengekstrak akar dengan mudah). Maka standar error rata-ratanya adalah 30/8 atau 3,75. Untuk menghitung interval kepercayaan 95%, Anda perlu menyisihkan dua kesalahan standar di kedua sisi rata-rata (lebih tepatnya, 1,96). Interval kepercayaan akan menjadi sekitar 100 ± 7,5, atau dari 92,5 hingga 107,5.

Alasan selanjutnya adalah sebagai berikut. Jika nilai yang diuji berada dalam interval kepercayaan, maka itu tidak bertentangan dengan hipotesis, karena cocok dalam batas fluktuasi acak (dengan probabilitas 95%). Jika titik yang diuji berada di luar interval kepercayaan, maka kemungkinan kejadian seperti itu sangat kecil, dalam hal apa pun di bawah tingkat yang dapat diterima. Oleh karena itu, hipotesis ditolak karena bertentangan dengan data yang diamati. Dalam kasus kami, hipotesis harapan berada di luar interval kepercayaan (nilai yang diuji dari 90 tidak termasuk dalam interval 100 ± 7,5), sehingga harus ditolak. Menjawab pertanyaan primitif di atas, orang harus mengatakan: tidak, tidak bisa, dalam hal apa pun, ini sangat jarang terjadi. Seringkali, ini menunjukkan probabilitas spesifik penolakan hipotesis yang salah (level-p), dan bukan level tertentu, yang dengannya interval kepercayaan dibangun, tetapi lebih pada itu di lain waktu.

Seperti yang Anda lihat, tidak sulit untuk membangun interval kepercayaan untuk mean (atau ekspektasi matematis). Hal utama adalah menangkap esensi, dan kemudian semuanya akan berjalan. Dalam praktiknya, sebagian besar menggunakan interval kepercayaan 95%, yaitu sekitar dua kesalahan standar yang lebar di kedua sisi rata-rata.

Itu saja untuk saat ini. Semua yang terbaik!

Dari artikel ini Anda akan belajar:

    Apa selang kepercayaan?

    Apa intinya aturan 3 sigma?

    Bagaimana pengetahuan ini dapat dipraktekkan?

Saat ini, karena melimpahnya informasi yang terkait dengan berbagai macam produk, arahan penjualan, karyawan, aktivitas, dll., sulit untuk memilih yang utama, yang pertama-tama perlu diperhatikan dan diusahakan untuk dikelola. Definisi selang kepercayaan dan analisis untuk melampaui batas nilai aktualnya - sebuah teknik yang membantu Anda mengidentifikasi situasi, mempengaruhi tren. Anda akan dapat mengembangkan faktor-faktor positif dan mengurangi pengaruh faktor-faktor negatif. Teknologi ini digunakan di banyak perusahaan terkenal dunia.

Ada yang disebut peringatan", yang menginformasikan manajer menyatakan bahwa nilai berikutnya dalam arah tertentu melampaui selang kepercayaan. Apa artinya ini? Ini adalah sinyal bahwa beberapa peristiwa non-standar telah terjadi, yang dapat mengubah tren yang ada ke arah ini. Ini sinyalnya untuk itu untuk menyelesaikannya dalam situasi dan memahami apa yang mempengaruhinya.

Misalnya, pertimbangkan beberapa situasi. Kami telah menghitung perkiraan penjualan dengan batas perkiraan untuk 100 item komoditas untuk tahun 2011 berdasarkan bulan dan penjualan aktual pada bulan Maret:

  1. Untuk "minyak bunga matahari" mereka menembus batas atas perkiraan dan tidak jatuh ke dalam interval kepercayaan.
  2. Untuk "ragi kering" melampaui batas bawah perkiraan.
  3. Pada "Bubur Oatmeal" menembus batas atas.

Untuk sisa barang, penjualan aktual berada dalam batas perkiraan yang ditentukan. Itu. penjualan mereka sesuai dengan harapan. Jadi, kami mengidentifikasi 3 produk yang melampaui batas, dan mulai mencari tahu apa yang memengaruhi melampaui batas:

  1. Dengan Minyak Bunga Matahari, kami memasuki jaringan perdagangan baru, yang memberi kami volume penjualan tambahan, yang melampaui batas atas. Untuk produk ini, ada baiknya menghitung ulang perkiraan hingga akhir tahun, dengan mempertimbangkan perkiraan penjualan ke rantai ini.
  2. Untuk Ragi Kering, mobil terjebak di bea cukai, dan terjadi kekurangan dalam 5 hari, yang mempengaruhi penurunan penjualan dan melampaui batas bawah. Mungkin bermanfaat untuk mencari tahu apa yang menyebabkan penyebabnya dan mencoba untuk tidak mengulangi situasi ini.
  3. Untuk Oatmeal, promosi penjualan diluncurkan, yang menghasilkan peningkatan penjualan yang signifikan dan melampaui perkiraan.

Kami mengidentifikasi 3 faktor yang mempengaruhi overshoot dari perkiraan. Mungkin ada lebih banyak dari mereka dalam hidup.Untuk meningkatkan akurasi peramalan dan perencanaan, faktor-faktor yang mengarah pada fakta bahwa penjualan aktual dapat melampaui perkiraan, ada baiknya menyoroti dan membangun prakiraan dan rencana untuk mereka secara terpisah. Dan kemudian memperhitungkan dampaknya pada perkiraan penjualan utama. Anda juga dapat secara teratur mengevaluasi dampak dari faktor-faktor ini dan mengubah situasi menjadi lebih baik untuk dengan mengurangi pengaruh negatif dan meningkatkan pengaruh faktor positif.

Dengan selang kepercayaan, kita dapat:

  1. Sorot tujuan, yang patut diperhatikan, karena peristiwa telah terjadi di area ini yang dapat mempengaruhi perubahan tren.
  2. Tentukan Faktor yang benar-benar membuat perbedaan.
  3. Menerima keputusan berbobot(misalnya tentang pengadaan, saat perencanaan, dll).

Sekarang mari kita lihat apa itu interval kepercayaan dan bagaimana menghitungnya di Excel menggunakan sebuah contoh.

Apa itu interval kepercayaan?

Interval kepercayaan adalah batas perkiraan (atas dan bawah), di mana dengan probabilitas tertentu (sigma) mendapatkan nilai yang sebenarnya.

Itu. kami menghitung perkiraan - ini adalah tolok ukur utama kami, tetapi kami memahami bahwa nilai sebenarnya tidak mungkin 100% sama dengan perkiraan kami. Dan muncul pertanyaan sejauh mana bisa mendapatkan nilai sebenarnya, jika tren saat ini berlanjut? Dan pertanyaan ini akan membantu kami menjawab perhitungan interval kepercayaan, yaitu - batas atas dan bawah perkiraan.

Apa yang dimaksud dengan sigma probabilitas tertentu?

Saat menghitung selang kepercayaan kita bisa atur probabilitas hits nilai sebenarnya dalam batas perkiraan yang diberikan. Bagaimana cara melakukannya? Untuk melakukan ini, kami menetapkan nilai sigma dan, jika sigma sama dengan:

    3 sigma- kemudian, probabilitas memukul nilai aktual berikutnya dalam interval kepercayaan akan menjadi 99,7%, atau 300 banding 1, atau ada probabilitas 0,3% untuk melampaui batas.

    2 sigma- maka, probabilitas memukul nilai berikutnya dalam batas adalah 95,5%, yaitu. kemungkinannya sekitar 20 banding 1, atau ada kemungkinan 4,5% untuk keluar dari batas.

    1 sigma- maka, probabilitasnya adalah 68,3%, mis. peluangnya sekitar 2 banding 1, atau ada peluang 31,7% bahwa nilai berikutnya akan berada di luar interval kepercayaan.

Kami merumuskan 3 Aturan Sigma,yang mengatakan bahwa kemungkinan pukulan nilai acak lainnya ke dalam selang kepercayaan dengan nilai tertentu tiga sigma adalah 99,7%.

Matematikawan besar Rusia Chebyshev membuktikan teorema bahwa ada peluang 10% untuk melampaui batas perkiraan dengan nilai tiga sigma yang diberikan. Itu. kemungkinan jatuh ke dalam interval kepercayaan 3 sigma akan menjadi setidaknya 90%, sementara upaya untuk menghitung perkiraan dan batas-batasnya "dengan mata" penuh dengan kesalahan yang jauh lebih signifikan.

Bagaimana cara menghitung interval kepercayaan secara mandiri di Excel?

Mari kita pertimbangkan perhitungan interval kepercayaan di Excel (yaitu batas atas dan bawah perkiraan) menggunakan sebuah contoh. Kami memiliki deret waktu - penjualan per bulan selama 5 tahun. Lihat file terlampir.

Untuk menghitung batas ramalan, kami menghitung:

  1. Perkiraan penjualan().
  2. Sigma - simpangan baku model perkiraan dari nilai sebenarnya.
  3. Tiga sigma.
  4. Interval kepercayaan.

1. Perkiraan penjualan.

=(RC[-14] (data dalam deret waktu)-RC[-1] (nilai model))^2(kuadrat)


3. Jumlahkan untuk setiap bulan nilai penyimpangan dari tahap 8 Jumlah((Xi-Ximod)^2), mis. Mari kita jumlahkan Januari, Februari... untuk setiap tahun.

Untuk melakukannya, gunakan rumus =SUMIF()

SUMIF(array dengan jumlah periode di dalam siklus (untuk bulan dari 1 hingga 12); referensi ke jumlah periode dalam siklus; referensi ke array dengan kuadrat selisih antara data awal dan nilai periode)


4. Hitung simpangan baku untuk setiap periode dalam siklus dari 1 sampai 12 (tahap 10 dalam file terlampir).

Untuk melakukan ini, dari nilai yang dihitung pada tahap 9, kami mengekstrak akar dan membaginya dengan jumlah periode dalam siklus ini dikurangi 1 = ROOT((Jumlah(Xi-Ximod)^2/(n-1))

Mari kita gunakan rumus di Excel =ROOT(R8 (referensi ke (Jumlah(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (referensi ke array dengan nomor siklus); O8 (referensi ke nomor siklus tertentu, yang kami pertimbangkan dalam larik))-1))

Menggunakan rumus Excel = COUNTIF kita menghitung angka n


Dengan menghitung standar deviasi data aktual dari model ramalan, kami memperoleh nilai sigma untuk setiap bulan - tahap 10 dalam file terlampir.

3. Hitung 3 sigma.

Pada tahap 11, kami menetapkan jumlah sigma - dalam contoh kami, "3" (tahap 11 dalam file terlampir):

Juga nilai sigma praktis:

1,64 sigma - 10% kemungkinan melewati batas (1 peluang dalam 10);

1,96 sigma - 5% kemungkinan keluar batas (1 peluang dalam 20);

2,6 sigma - 1% kemungkinan keluar batas (peluang 1 dalam 100).

5) Kami menghitung tiga sigma, untuk ini kami mengalikan nilai "sigma" untuk setiap bulan dengan "3".

3. Tentukan selang kepercayaan.

  1. Batas perkiraan atas- perkiraan penjualan dengan mempertimbangkan pertumbuhan dan musiman + (plus) 3 sigma;
  2. Batas Prakiraan Bawah- perkiraan penjualan dengan mempertimbangkan pertumbuhan dan musim - (minus) 3 sigma;

Untuk kenyamanan menghitung interval kepercayaan untuk waktu yang lama (lihat file terlampir), kami menggunakan rumus Excel =Y8+VLOOKUP(W8;$U$8:$V$19;2;0), di mana

Y8- perkiraan penjualan;

W8- jumlah bulan di mana kami akan mengambil nilai 3 sigma;

Itu. Batas perkiraan atas= "perkiraan penjualan" + "3 sigma" (dalam contoh, VLOOKUP(nomor bulan; tabel dengan nilai 3 sigma; kolom tempat kami mengekstrak nilai sigma sama dengan nomor bulan di baris yang sesuai; 0)).

Batas Prakiraan Bawah= "perkiraan penjualan" dikurangi "3 sigma".

Jadi, kami telah menghitung interval kepercayaan di Excel.

Sekarang kami memiliki perkiraan dan rentang dengan batas-batas di mana nilai aktual akan jatuh dengan sigma probabilitas yang diberikan.

Dalam artikel ini, kita melihat apa itu sigma dan aturan tiga sigma, bagaimana menentukan interval kepercayaan, dan untuk apa Anda bisa menggunakan teknik ini dalam praktik.

Ramalan yang akurat dan sukses untuk Anda!

Bagaimana Forecast4AC PRO dapat membantu Andasaat menghitung interval kepercayaan?:

    Forecast4AC PRO akan secara otomatis menghitung batas perkiraan atas atau bawah untuk lebih dari 1000 deret waktu secara bersamaan;

    Kemampuan untuk menganalisis batas perkiraan dibandingkan dengan perkiraan, tren, dan penjualan aktual pada grafik dengan satu penekanan tombol;

Dalam program Forcast4AC PRO, dimungkinkan untuk mengatur nilai sigma dari 1 hingga 3.

Bergabunglah dengan kami!

Unduh Aplikasi Prakiraan dan Intelijen Bisnis Gratis:


  • Novo Prakiraan Lite- otomatis perhitungan perkiraan di unggul.
  • 4analitik- Analisis ABC-XYZ dan analisis emisi di Unggul.
  • Qlik Sense Desktop dan Tampilan QlikEdisi Pribadi - Sistem BI untuk analisis dan visualisasi data.

Uji fitur solusi berbayar:

  • Novo Prakiraan PRO- peramalan di Excel untuk array data besar.

Seringkali penilai harus menganalisis pasar real estat dari segmen di mana objek penilaian berada. Jika pasar dikembangkan, mungkin sulit untuk menganalisis seluruh rangkaian objek yang disajikan, oleh karena itu, sampel objek digunakan untuk analisis. Sampel ini tidak selalu homogen, terkadang diperlukan untuk membersihkannya dari penawaran pasar yang terlalu tinggi atau terlalu rendah. Untuk tujuan ini, itu diterapkan selang kepercayaan. Tujuan dari penelitian ini adalah untuk melakukan analisis komparatif dari dua metode untuk menghitung interval kepercayaan dan memilih opsi perhitungan terbaik ketika bekerja dengan sampel yang berbeda dalam sistem estimatica.pro.

Interval kepercayaan - dihitung berdasarkan sampel, interval nilai atribut, yang dengan probabilitas yang diketahui berisi parameter yang diperkirakan dari populasi umum.

Arti menghitung interval kepercayaan adalah membangun interval seperti itu berdasarkan data sampel sehingga dapat ditegaskan dengan probabilitas yang diberikan bahwa nilai parameter yang diestimasi berada dalam interval ini. Dengan kata lain, selang kepercayaan dengan probabilitas tertentu mengandung nilai yang tidak diketahui dari besaran yang diestimasi. Semakin lebar intervalnya, semakin tinggi ketidakakuratannya.

Ada berbagai metode untuk menentukan interval kepercayaan. Dalam artikel ini, kami akan mempertimbangkan 2 cara:

  • melalui median dan standar deviasi;
  • melalui nilai kritis t-statistik (koefisien siswa).

Tahapan analisis komparatif metode yang berbeda untuk menghitung CI:

1. membentuk sampel data;

2. kami mengolahnya dengan metode statistik: kami menghitung nilai rata-rata, median, varians, dll;

3. kita menghitung interval kepercayaan dengan dua cara;

4. Analisis sampel yang dibersihkan dan interval kepercayaan yang diperoleh.

Tahap 1. Pengambilan sampel data

Sampel dibentuk menggunakan sistem estimatica.pro. Sampel termasuk 91 penawaran untuk penjualan apartemen 1 kamar di zona harga ke-3 dengan jenis perencanaan "Khrushchev".

Tabel 1. Sampel awal

Harga 1 sq.m., c.u.

Gambar.1. sampel awal



Tahap 2. Pemrosesan sampel awal

Pengolahan sampel dengan metode statistik memerlukan perhitungan nilai sebagai berikut:

1. Rata-rata aritmatika

2. Median - angka yang menjadi ciri sampel: tepat setengah dari elemen sampel lebih besar dari median, setengah lainnya lebih kecil dari median

(untuk sampel dengan jumlah nilai ganjil)

3. Rentang - perbedaan antara nilai maksimum dan minimum dalam sampel

4. Varians - digunakan untuk memperkirakan variasi data secara lebih akurat

5. Standar deviasi untuk sampel (selanjutnya disebut RMS) adalah indikator paling umum dari dispersi nilai penyesuaian di sekitar mean aritmatika.

6. Koefisien variasi - mencerminkan tingkat penyebaran nilai penyesuaian

7. koefisien osilasi - mencerminkan fluktuasi relatif dari nilai ekstrim harga dalam sampel di sekitar rata-rata

Tabel 2. Indikator statistik sampel asli

Koefisien variasi, yang mencirikan homogenitas data, adalah 12,29%, tetapi koefisien osilasinya terlalu besar. Dengan demikian, kita dapat menyatakan bahwa sampel asli tidak homogen, jadi mari kita beralih ke menghitung interval kepercayaan.

Tahap 3. Perhitungan interval kepercayaan

Metode 1. Perhitungan melalui median dan standar deviasi.

Interval kepercayaan ditentukan sebagai berikut: nilai minimum - standar deviasi dikurangi dari median; nilai maksimum - standar deviasi ditambahkan ke median.

Jadi, selang kepercayaan (47179 CU; 60689 CU)

Beras. 2. Nilai dalam selang kepercayaan 1.



Metode 2. Membangun interval kepercayaan melalui nilai kritis t-statistik (koefisien siswa)

S.V. Gribovsky dalam buku "Metode matematika untuk menilai nilai properti" menjelaskan metode untuk menghitung interval kepercayaan melalui koefisien Student. Saat menghitung dengan metode ini, estimator sendiri harus menetapkan tingkat signifikansi , yang menentukan probabilitas dengan mana interval kepercayaan akan dibangun. Tingkat signifikansi 0,1 biasanya digunakan; 0,05 dan 0,01. Mereka sesuai dengan probabilitas kepercayaan 0,9; 0,95 dan 0,99. Dengan metode ini, nilai sebenarnya dari harapan dan varians matematika dianggap tidak diketahui secara praktis (yang hampir selalu benar ketika menyelesaikan masalah evaluasi praktis).

Rumus interval kepercayaan:

n - ukuran sampel;

Nilai kritis t-statistik (Distribusi Siswa) dengan tingkat signifikansi , jumlah derajat kebebasan n-1, yang ditentukan oleh tabel statistik khusus atau menggunakan MS Excel (→"Statistik"→ STUDRASPOBR);

- tingkat signifikansi, kita ambil =0,01.

Beras. 2. Nilai dalam selang kepercayaan 2.

Langkah 4. Analisis berbagai cara untuk menghitung interval kepercayaan

Dua metode menghitung interval kepercayaan - melalui median dan koefisien Student - menghasilkan nilai interval yang berbeda. Dengan demikian, dua sampel murni yang berbeda diperoleh.

Tabel 3. Indikator statistik untuk tiga sampel.

Indikator

sampel awal

1 pilihan

pilihan 2

Berarti

Penyebaran

koefisien variasi

koefisien osilasi

Jumlah benda pensiunan, pcs.

Berdasarkan perhitungan yang dilakukan, kita dapat mengatakan bahwa nilai interval kepercayaan yang diperoleh dengan metode yang berbeda berpotongan, sehingga Anda dapat menggunakan salah satu metode perhitungan atas kebijaksanaan penilai.

Namun, kami percaya bahwa ketika bekerja di sistem estimatica.pro, disarankan untuk memilih metode untuk menghitung interval kepercayaan, tergantung pada tingkat perkembangan pasar:

  • jika pasar tidak berkembang, gunakan metode perhitungan melalui median dan standar deviasi, karena jumlah objek pensiun dalam hal ini kecil;
  • jika pasar dikembangkan, terapkan perhitungan melalui nilai kritis t-statistik (koefisien siswa), karena dimungkinkan untuk membentuk sampel awal yang besar.

Dalam mempersiapkan artikel digunakan:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Metode matematika untuk menilai nilai properti. Moskow, 2014

2. Data dari sistem estimatica.pro