Interval kepercayaan standar. Metode Analisis Kuantitatif: Memperkirakan Interval Keyakinan

Dan lain-lain.Semuanya adalah perkiraan rekan teoretis mereka, yang dapat diperoleh jika tidak ada sampel, tetapi populasi umum. Namun sayang, populasi umum sangat mahal dan seringkali tidak tersedia.

Konsep estimasi interval

Setiap estimasi sampel memiliki beberapa pencar, karena adalah variabel acak tergantung pada nilai dalam sampel tertentu. Oleh karena itu, untuk inferensi statistik yang lebih andal, seseorang harus mengetahui tidak hanya perkiraan titik, tetapi juga intervalnya, yang dengan probabilitas tinggi γ (gamma) mencakup perkiraan indikator θ (theta).

Secara formal, ini adalah dua nilai seperti itu (statistik) T1(X) dan T2(X), Apa T1< T 2 , yang pada tingkat probabilitas tertentu γ kondisi terpenuhi:

Singkatnya, itu mungkin γ atau lebih nilai sebenarnya berada di antara titik-titik T1(X) dan T2(X), yang disebut batas bawah dan batas atas selang kepercayaan.

Salah satu syarat untuk membangun interval kepercayaan adalah kesempitan maksimumnya, yaitu. itu harus sesingkat mungkin. Keinginan itu cukup alami, karena. peneliti mencoba untuk lebih akurat melokalisasi temuan parameter yang diinginkan.

Oleh karena itu, interval kepercayaan harus mencakup probabilitas distribusi maksimum. dan skor itu sendiri berada di tengah.

Artinya, probabilitas deviasi (indikator sebenarnya dari perkiraan) ke atas sama dengan probabilitas deviasi ke bawah. Perlu juga dicatat bahwa untuk distribusi miring, interval di sebelah kanan tidak sama dengan interval di sebelah kiri.

Gambar di atas dengan jelas menunjukkan bahwa semakin besar tingkat kepercayaan, semakin lebar interval - hubungan langsung.

Ini adalah pengantar kecil untuk teori estimasi interval dari parameter yang tidak diketahui. Mari kita beralih ke menemukan batas kepercayaan untuk ekspektasi matematis.

Interval kepercayaan untuk ekspektasi matematis

Jika data asli didistribusikan lebih , maka rata-rata akan menjadi nilai normal. Ini mengikuti dari aturan bahwa kombinasi linier dari nilai normal juga memiliki distribusi normal. Oleh karena itu, untuk menghitung probabilitas, kita dapat menggunakan perangkat matematika dari hukum distribusi normal.

Namun, ini akan membutuhkan pengetahuan tentang dua parameter - nilai yang diharapkan dan varians, yang biasanya tidak diketahui. Anda tentu saja dapat menggunakan perkiraan alih-alih parameter (rata-rata aritmatika dan ), tetapi kemudian distribusi rata-rata tidak akan terlalu normal, itu akan sedikit diratakan. Warga negara William Gosset dari Irlandia dengan cerdik mencatat fakta ini ketika ia mempublikasikan penemuannya dalam Biometrica edisi Maret 1908. Untuk tujuan kerahasiaan, Gosset menandatangani kontrak dengan Student. Ini adalah bagaimana distribusi-t Student muncul.

Namun, distribusi normal data, yang digunakan oleh K. Gauss dalam analisis kesalahan dalam pengamatan astronomi, sangat jarang dalam kehidupan terestrial dan cukup sulit untuk menetapkan ini (untuk akurasi tinggi, diperlukan sekitar 2 ribu pengamatan). Oleh karena itu, yang terbaik adalah membuang asumsi normalitas dan menggunakan metode yang tidak bergantung pada distribusi data asli.

Timbul pertanyaan: apa distribusi mean aritmatika jika dihitung dari data distribusi yang tidak diketahui? Jawabannya diberikan oleh teori probabilitas yang terkenal Teorema limit pusat(CPT). Dalam matematika, ada beberapa versi (formulasi telah disempurnakan selama bertahun-tahun), tetapi semuanya, secara kasar, sampai pada pernyataan bahwa jumlah sejumlah besar variabel acak independen mematuhi hukum distribusi normal.

Saat menghitung mean aritmatika, jumlah variabel acak digunakan. Dari sini ternyata mean aritmatika berdistribusi normal, dimana nilai harapan adalah nilai harapan dari data awal, dan variansnya adalah .

Orang pintar tahu cara membuktikan CLT, tetapi kami akan memverifikasi ini dengan bantuan eksperimen yang dilakukan di Excel. Mari kita simulasikan sampel 50 variabel acak terdistribusi seragam (menggunakan fungsi Excel RANDOMBETWEEN). Kemudian kita akan membuat 1000 sampel seperti itu dan menghitung rata-rata aritmatika untuk masing-masing. Mari kita lihat distribusinya.

Terlihat bahwa distribusi rata-ratanya mendekati hukum normal. Jika volume sampel dan jumlahnya dibuat lebih besar, maka kemiripannya akan lebih baik.

Sekarang kita telah melihat sendiri validitas CLT, kita dapat, menggunakan , menghitung interval kepercayaan untuk mean aritmatika, yang mencakup mean sebenarnya atau ekspektasi matematis dengan probabilitas tertentu.

Untuk menentukan batas atas dan batas bawah, perlu diketahui parameter distribusi normal. Sebagai aturan, mereka tidak, oleh karena itu, perkiraan digunakan: rata-rata aritmatika dan varians sampel. Sekali lagi, metode ini memberikan perkiraan yang baik hanya untuk sampel besar. Jika sampelnya kecil, sering disarankan untuk menggunakan distribusi Student. Jangan percaya! Distribusi siswa untuk mean hanya terjadi jika data asli memiliki distribusi normal, yaitu hampir tidak pernah. Oleh karena itu, lebih baik segera mengatur bilah minimum untuk jumlah data yang diperlukan dan menggunakan metode yang benar secara asimtotik. Mereka mengatakan 30 pengamatan sudah cukup. Ambil 50 - Anda tidak bisa salah.

T 1.2 adalah batas bawah dan batas atas interval kepercayaan

– sampel rata-rata aritmatika

s0– simpangan baku sampel (tidak bias)

n - ukuran sampel

γ – tingkat kepercayaan (biasanya sama dengan 0,9, 0,95 atau 0,99)

c =Φ -1 ((1+γ)/2) adalah kebalikan dari fungsi distribusi normal standar. Secara sederhana, ini adalah jumlah kesalahan standar dari rata-rata aritmatika ke batas bawah atau atas (tiga probabilitas yang ditunjukkan sesuai dengan nilai 1,64, 1,96 dan 2,58).

Inti dari rumusnya adalah bahwa rata-rata aritmatika diambil dan kemudian sejumlah tertentu disisihkan darinya ( dengan) kesalahan standar ( s 0 /√n). Semuanya diketahui, ambil dan hitung.

Sebelum penggunaan PC secara massal, untuk mendapatkan nilai fungsi distribusi normal dan kebalikannya, mereka menggunakan . Mereka masih digunakan, tetapi lebih efisien untuk beralih ke formula Excel yang sudah jadi. Semua elemen dari rumus di atas ( , dan ) dapat dengan mudah dihitung di Excel. Tetapi ada juga formula siap pakai untuk menghitung interval kepercayaan - PERCAYA DIRI NORM. Sintaksnya adalah sebagai berikut.

NORM PERCAYA DIRI (alfa, standard_dev, ukuran)

alfa– tingkat signifikansi atau tingkat kepercayaan, yang dalam notasi di atas sama dengan 1-γ, yaitu. probabilitas bahwa matematisharapan akan berada di luar selang kepercayaan. Dengan tingkat kepercayaan 0,95, alpha 0,05, dan seterusnya.

standar_off adalah simpangan baku dari data sampel. Anda tidak perlu menghitung kesalahan standar, Excel akan membagi dengan akar n.

ukuran– ukuran sampel (n).

Hasil dari fungsi CONFIDENCE.NORM adalah suku kedua dari rumus untuk menghitung interval kepercayaan, yaitu. setengah interval. Dengan demikian, titik bawah dan atas adalah rata-rata ± nilai yang diperoleh.

Dengan demikian, dimungkinkan untuk membangun algoritma universal untuk menghitung interval kepercayaan untuk rata-rata aritmatika, yang tidak bergantung pada distribusi data awal. Harga untuk universalitas adalah sifatnya yang asimtotik, yaitu. kebutuhan untuk menggunakan sampel yang relatif besar. Namun, di era teknologi modern, mengumpulkan jumlah data yang tepat biasanya tidak sulit.

Menguji Hipotesis Statistik Menggunakan Interval Keyakinan

(modul 111)

Salah satu masalah utama yang dipecahkan dalam statistik adalah. Singkatnya, esensinya adalah ini. Sebuah asumsi dibuat, misalnya, bahwa harapan dari populasi umum sama dengan beberapa nilai. Kemudian distribusi sarana sampel dibangun, yang dapat diamati dengan harapan tertentu. Selanjutnya, kita melihat di mana dalam distribusi bersyarat ini rata-rata sebenarnya berada. Jika melampaui batas yang diizinkan, maka kemunculan rata-rata seperti itu sangat tidak mungkin, dan dengan satu pengulangan percobaan hampir tidak mungkin, yang bertentangan dengan hipotesis yang diajukan, yang berhasil ditolak. Jika rata-rata tidak melampaui tingkat kritis, maka hipotesis tidak ditolak (tetapi juga tidak terbukti!).

Jadi, dengan bantuan interval kepercayaan, dalam kasus kami untuk harapan, Anda juga dapat menguji beberapa hipotesis. Ini sangat mudah dilakukan. Misalkan rata-rata aritmatika untuk beberapa sampel adalah 100. Hipotesis sedang diuji bahwa nilai yang diharapkan adalah, katakanlah, 90. Artinya, jika kita mengajukan pertanyaan secara primitif, kedengarannya seperti ini: mungkinkah dengan nilai sebenarnya dari rata-rata sama dengan 90, rata-rata yang diamati adalah 100?

Untuk menjawab pertanyaan ini, informasi tambahan tentang standar deviasi dan ukuran sampel akan diperlukan. Katakanlah standar deviasi adalah 30, dan jumlah pengamatan adalah 64 (untuk mengekstrak akar dengan mudah). Maka galat baku rata-ratanya adalah 30/8 atau 3,75. Untuk menghitung interval kepercayaan 95%, Anda perlu menyisihkan dua kesalahan standar di kedua sisi rata-rata (lebih tepatnya, 1,96). Interval kepercayaan akan menjadi sekitar 100 ± 7,5, atau dari 92,5 hingga 107,5.

Alasan selanjutnya adalah sebagai berikut. Jika nilai yang diuji berada dalam interval kepercayaan, maka itu tidak bertentangan dengan hipotesis, karena cocok dalam batas fluktuasi acak (dengan probabilitas 95%). Jika titik yang diuji berada di luar interval kepercayaan, maka kemungkinan kejadian seperti itu sangat kecil, dalam hal apa pun di bawah tingkat yang dapat diterima. Oleh karena itu, hipotesis ditolak karena bertentangan dengan data yang diamati. Dalam kasus kami, hipotesis harapan berada di luar interval kepercayaan (nilai yang diuji dari 90 tidak termasuk dalam interval 100 ± 7,5), sehingga harus ditolak. Menjawab pertanyaan primitif di atas, orang harus mengatakan: tidak, tidak bisa, dalam hal apa pun, ini sangat jarang terjadi. Seringkali, ini menunjukkan probabilitas spesifik penolakan hipotesis yang salah (level-p), dan bukan level tertentu, yang dengannya interval kepercayaan dibangun, tetapi lebih pada itu di lain waktu.

Seperti yang Anda lihat, tidak sulit untuk membangun interval kepercayaan untuk mean (atau ekspektasi matematis). Hal utama adalah menangkap esensi, dan kemudian semuanya akan berjalan. Dalam praktiknya, sebagian besar menggunakan interval kepercayaan 95%, yaitu sekitar dua kesalahan standar yang lebar di kedua sisi rata-rata.

Itu saja untuk saat ini. Semua yang terbaik!

Petunjuk

Harap dicatat bahwa selang(l1 atau l2), area pusat yang akan menjadi perkiraan l*, dan juga di mana nilai sebenarnya dari parameter terkandung dengan probabilitas, hanya akan menjadi kepercayaan selang ohm atau nilai yang sesuai dari tingkat kepercayaan alpha. Dalam hal ini, l* sendiri akan mengacu pada estimasi titik. Misalnya, menurut hasil nilai sampel apa pun dari nilai acak X (x1, x2,..., xn), perlu untuk menghitung parameter indikator yang tidak diketahui l, di mana distribusi akan bergantung. Dalam hal ini, memperoleh perkiraan parameter yang diberikan l* akan berarti bahwa untuk setiap sampel akan perlu untuk menempatkan nilai parameter tertentu, yaitu, untuk membuat fungsi dari hasil pengamatan indikator Q, yang nilainya akan diambil sama dengan nilai taksiran parameter l* dalam bentuk rumus : l*=Q*(x1, x2,..., xn).

Perhatikan bahwa setiap fungsi pada hasil pengamatan disebut statistik. Apalagi jika itu sepenuhnya menggambarkan parameter (fenomena) yang sedang dipertimbangkan, maka itu disebut statistik yang cukup. Dan karena hasil observasi bersifat random, maka l* juga akan menjadi variabel random. Tugas menghitung statistik harus dilakukan dengan mempertimbangkan kriteria kualitasnya. Di sini perlu diperhitungkan bahwa hukum distribusi estimasi cukup pasti, distribusi densitas probabilitas W(x, l).

Anda dapat menghitung kepercayaan selang cukup mudah jika Anda mengetahui hukum tentang distribusi penilaian. Misalnya, kepercayaan selang estimasi dalam kaitannya dengan ekspektasi matematis (nilai rata-rata dari nilai acak) mx* =(1/n)*(x1+x2+ …+xn) . Estimasi ini tidak bias, yaitu ekspektasi matematis atau nilai rata-rata indikator akan sama dengan nilai sebenarnya dari parameter (M(mx*) = mx).

Anda dapat menetapkan bahwa varians estimasi dengan ekspektasi matematis adalah: bx*^2=Dx/n. Berdasarkan teorema pusat limit, kita dapat menarik kesimpulan yang sesuai bahwa hukum distribusi estimasi ini adalah Gaussian (normal). Oleh karena itu, untuk perhitungan, Anda dapat menggunakan indikator (z) - integral dari probabilitas. Dalam hal ini, pilih panjang kepercayaan selang dan 2ld, sehingga Anda mendapatkan: alpha \u003d P (mx-ld (menggunakan properti integral probabilitas menurut rumus: (-z) \u003d 1- (z)).

Membangun kepercayaan selang perkiraan ekspektasi matematis: - temukan nilai rumus (alpha + 1) / 2; - pilih nilai yang sama dengan ld / sqrt (Dx / n) dari tabel integral probabilitas; - ambil estimasi varians sebenarnya: Dx * = (1 / n) * ( (x1 - mx*)^2+(x2 - mx*)^2+…+(xn - mx*)^2); selang sesuai dengan rumus: (mx*-ld, mx*+ld).

Dalam statistik, ada dua jenis perkiraan: titik dan interval. Estimasi Poin adalah statistik sampel tunggal yang digunakan untuk memperkirakan parameter populasi. Misalnya, sampel berarti adalah estimasi titik dari rata-rata populasi, dan varians sampel S2- estimasi titik varians populasi 2. itu menunjukkan bahwa rata-rata sampel adalah perkiraan yang tidak bias dari harapan populasi. Rata-rata sampel disebut tidak bias karena rata-rata dari semua rata-rata sampel (dengan ukuran sampel yang sama) n) sama dengan ekspektasi matematis dari populasi umum.

Agar varians sampel S2 menjadi penduga tak bias dari varians populasi 2, penyebut varians sampel harus sama dengan n – 1 , tapi tidak n. Dengan kata lain, varians populasi adalah rata-rata dari semua varians sampel yang mungkin.

Ketika memperkirakan parameter populasi, harus diingat bahwa statistik sampel seperti: , tergantung pada sampel tertentu. Untuk mempertimbangkan fakta ini, untuk mendapatkan estimasi interval harapan matematis dari populasi umum menganalisis distribusi rata-rata sampel (untuk lebih jelasnya, lihat). Interval yang dibangun dicirikan oleh tingkat kepercayaan tertentu, yang merupakan probabilitas bahwa parameter sebenarnya dari populasi umum diperkirakan dengan benar. Interval kepercayaan serupa dapat digunakan untuk memperkirakan proporsi fitur R dan massa terdistribusi utama dari populasi umum.

Unduh catatan dalam atau format, contoh dalam format

Konstruksi interval kepercayaan untuk ekspektasi matematis dari populasi umum dengan standar deviasi yang diketahui

Membangun interval kepercayaan untuk proporsi suatu sifat dalam populasi umum

Pada bagian ini, konsep interval kepercayaan diperluas ke data kategorikal. Ini memungkinkan Anda untuk memperkirakan pangsa sifat dalam populasi umum R dengan sampel berbagi RS= X/n. Seperti yang disebutkan, jika nilai-nilai nR dan n(1 - hal) melebihi angka 5, distribusi binomial dapat didekati dengan distribusi normal. Oleh karena itu, untuk memperkirakan bagian suatu sifat dalam populasi umum R adalah mungkin untuk membangun interval yang tingkat kepercayaannya sama dengan (1 - )x100%.


di mana pS- sampel berbagi fitur, sama dengan X/n, yaitu jumlah keberhasilan dibagi dengan ukuran sampel, R- bagian dari sifat dalam populasi umum, Z adalah nilai kritis dari distribusi normal standar, n- ukuran sampel.

Contoh 3 Mari kita asumsikan bahwa sampel diambil dari sistem informasi, terdiri dari 100 faktur yang diselesaikan selama sebulan terakhir. Katakanlah 10 dari faktur ini salah. Dengan demikian, R= 10/100 = 0,1. Tingkat kepercayaan 95% sesuai dengan nilai kritis Z = 1,96.

Dengan demikian, ada kemungkinan 95% bahwa antara 4,12% dan 15,88% faktur berisi kesalahan.

Untuk ukuran sampel tertentu, interval kepercayaan yang mengandung proporsi sifat dalam populasi umum tampaknya lebih lebar daripada variabel acak kontinu. Ini karena pengukuran variabel acak kontinu mengandung lebih banyak informasi daripada pengukuran data kategorikal. Dengan kata lain, data kategorikal yang hanya mengambil dua nilai mengandung informasi yang tidak cukup untuk memperkirakan parameter distribusinya.

PADAperhitungan perkiraan yang diambil dari populasi yang terbatas

Estimasi ekspektasi matematis. Faktor koreksi untuk populasi akhir ( fpc) digunakan untuk mengurangi kesalahan standar dengan faktor . Saat menghitung interval kepercayaan untuk estimasi parameter populasi, faktor koreksi diterapkan dalam situasi di mana sampel diambil tanpa pengembalian. Jadi, selang kepercayaan untuk ekspektasi matematis, yang memiliki tingkat kepercayaan sama dengan (1 - )x100%, dihitung dengan rumus:

Contoh 4 Untuk mengilustrasikan penerapan faktor koreksi untuk populasi yang terbatas, mari kita kembali ke masalah menghitung interval kepercayaan untuk jumlah rata-rata faktur yang dibahas dalam Contoh 3 di atas Misalkan sebuah perusahaan menerbitkan 5.000 faktur per bulan, dan X=110,27 USD, S= $28,95 N = 5000, n = 100, α = 0,05, t99 = 1,9842. Menurut rumus (6) kita mendapatkan:

Estimasi pangsa fitur. Saat memilih no return, interval kepercayaan untuk proporsi fitur yang memiliki tingkat kepercayaan sama dengan (1 - )x100%, dihitung dengan rumus:

Interval kepercayaan dan masalah etika

Saat mengambil sampel populasi dan merumuskan kesimpulan statistik, masalah etika sering muncul. Yang utama adalah bagaimana interval kepercayaan dan estimasi titik dari statistik sampel setuju. Menerbitkan perkiraan titik tanpa menentukan interval kepercayaan yang sesuai (biasanya pada tingkat kepercayaan 95%) dan ukuran sampel dari mana mereka berasal dapat menyesatkan. Ini mungkin memberi kesan kepada pengguna bahwa perkiraan titik adalah persis apa yang dia butuhkan untuk memprediksi sifat-sifat seluruh populasi. Dengan demikian, perlu dipahami bahwa dalam penelitian apa pun, bukan titik, tetapi perkiraan interval harus diletakkan di garis depan. Selain itu, perhatian khusus harus diberikan pada pilihan ukuran sampel yang benar.

Paling sering, objek manipulasi statistik adalah hasil survei sosiologis penduduk tentang berbagai masalah politik. Pada saat yang sama, hasil survei ditempatkan di halaman depan surat kabar, dan kesalahan pengambilan sampel serta metodologi analisis statistik dicetak di tengah. Untuk membuktikan validitas estimasi titik yang diperoleh, perlu untuk menunjukkan ukuran sampel berdasarkan mana mereka diperoleh, batas-batas interval kepercayaan dan tingkat signifikansinya.

Catatan berikutnya

Bahan dari buku Levin et al.Statistik untuk manajer digunakan. - M.: Williams, 2004. - hal. 448–462

Teorema limit pusat menyatakan bahwa, mengingat ukuran sampel yang cukup besar, distribusi sampel rata-rata dapat didekati dengan distribusi normal. Properti ini tidak tergantung pada jenis distribusi populasi.

Interval kepercayaan(CI; dalam bahasa Inggris, confidence interval - CI) yang diperoleh dalam penelitian pada sampel memberikan ukuran akurasi (atau ketidakpastian) dari hasil penelitian, untuk menarik kesimpulan tentang populasi semua pasien tersebut (populasi umum ). Definisi yang benar dari 95% CI dapat dirumuskan sebagai berikut: 95% dari interval tersebut akan berisi nilai sebenarnya dalam populasi. Interpretasi ini agak kurang akurat: CI adalah rentang nilai di mana Anda dapat 95% yakin bahwa itu berisi nilai sebenarnya. Saat menggunakan CI, penekanannya adalah pada penentuan efek kuantitatif, berlawanan dengan nilai P, yang diperoleh sebagai hasil pengujian signifikansi statistik. Nilai P tidak mengevaluasi jumlah apa pun, melainkan berfungsi sebagai ukuran kekuatan bukti terhadap hipotesis nol "tidak ada efek". Nilai P dengan sendirinya tidak memberi tahu kita apa pun tentang besarnya perbedaan, atau bahkan tentang arahnya. Oleh karena itu, nilai independen P sama sekali tidak informatif dalam artikel atau abstrak. Sebaliknya, CI menunjukkan jumlah efek kepentingan langsung, seperti kegunaan pengobatan, dan kekuatan bukti. Oleh karena itu, DI berkaitan langsung dengan praktik DM.

Pendekatan estimasi untuk analisis statistik, yang diilustrasikan oleh CI, bertujuan untuk mengukur besarnya efek yang diinginkan (sensitivitas tes diagnostik, kejadian yang diprediksi, pengurangan risiko relatif dengan pengobatan, dll.) serta pengukuran ketidakpastian dalam hal itu. memengaruhi. Paling sering, CI adalah rentang nilai di kedua sisi perkiraan di mana nilai sebenarnya kemungkinan terletak, dan Anda bisa yakin 95% akan hal itu. Konvensi untuk menggunakan probabilitas 95% adalah arbitrer, begitu juga dengan nilai P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI didasarkan pada gagasan bahwa penelitian yang sama yang dilakukan pada kelompok pasien yang berbeda tidak akan menghasilkan hasil yang identik, tetapi hasil mereka akan didistribusikan di sekitar nilai yang benar tetapi tidak diketahui. Dengan kata lain, CI menggambarkan ini sebagai "variabilitas tergantung sampel". CI tidak mencerminkan ketidakpastian tambahan karena penyebab lain; khususnya, ini tidak termasuk dampak kehilangan selektif pasien pada pelacakan, kepatuhan yang buruk atau pengukuran hasil yang tidak akurat, kurangnya kebutaan, dll. CI dengan demikian selalu meremehkan jumlah total ketidakpastian.

Perhitungan Interval Keyakinan

Tabel A1.1. Kesalahan standar dan interval kepercayaan untuk beberapa pengukuran klinis

Biasanya, CI dihitung dari perkiraan yang diamati dari ukuran kuantitatif, seperti perbedaan (d) antara dua proporsi, dan kesalahan standar (SE) dalam perkiraan perbedaan itu. Perkiraan 95% CI yang diperoleh adalah d ± 1,96 SE. Rumus berubah sesuai dengan sifat ukuran hasil dan cakupan CI. Misalnya, dalam uji coba vaksin pertusis aseluler acak terkontrol plasebo, batuk rejan berkembang pada 72 dari 1670 (4,3%) bayi yang menerima vaksin dan 240 dari 1665 (14,4%) pada kelompok kontrol. Perbedaan persentase, yang dikenal sebagai pengurangan risiko absolut, adalah 10,1%. SE dari perbedaan ini adalah 0,99%. Dengan demikian, 95% CI adalah 10,1% + 1,96 x 0,99%, yaitu. dari 8.2 hingga 12.0.

Meskipun pendekatan filosofis yang berbeda, CI dan tes untuk signifikansi statistik terkait erat secara matematis.

Dengan demikian, nilai P adalah “signifikan”, yaitu R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Ketidakpastian (ketidakakuratan) estimasi, yang dinyatakan dalam CI, sebagian besar terkait dengan akar kuadrat dari ukuran sampel. Sampel kecil memberikan lebih sedikit informasi daripada sampel besar, dan CI juga lebih luas dalam sampel yang lebih kecil. Misalnya, sebuah artikel yang membandingkan kinerja tiga tes yang digunakan untuk mendiagnosis infeksi Helicobacter pylori melaporkan sensitivitas tes napas urea sebesar 95,8% (95% CI 75-100). Sementara angka 95,8% terlihat mengesankan, ukuran sampel kecil dari 24 pasien dewasa H. pylori berarti bahwa ada ketidakpastian yang signifikan dalam perkiraan ini, seperti yang ditunjukkan oleh CI yang luas. Memang, batas bawah 75% jauh lebih rendah dari perkiraan 95,8%. Jika sensitivitas yang sama diamati pada sampel 240 orang, maka 95% CI akan menjadi 92,5-98,0, memberikan lebih banyak jaminan bahwa tes tersebut sangat sensitif.

Dalam uji coba terkontrol secara acak (RCT), hasil yang tidak signifikan (yaitu, dengan P> 0,05) sangat rentan terhadap salah tafsir. CI sangat berguna di sini karena menunjukkan seberapa kompatibel hasilnya dengan efek nyata yang berguna secara klinis. Misalnya, dalam RCT yang membandingkan jahitan versus anastomosis stapel di usus besar, infeksi luka berkembang pada 10,9% dan 13,5% pasien, masing-masing (P = 0,30). 95% CI untuk perbedaan ini adalah 2,6% (-2 hingga +8). Bahkan dalam penelitian ini, yang melibatkan 652 pasien, masih ada kemungkinan bahwa ada sedikit perbedaan dalam insiden infeksi yang dihasilkan dari kedua prosedur tersebut. Semakin kecil penelitiannya, semakin besar ketidakpastiannya. Sung dkk. melakukan RCT membandingkan infus octreotide dengan skleroterapi darurat untuk perdarahan varises akut pada 100 pasien. Pada kelompok octreotide, tingkat henti perdarahan adalah 84%; pada kelompok skleroterapi - 90%, yang memberikan P = 0,56. Perhatikan bahwa tingkat perdarahan lanjutan serupa dengan infeksi luka dalam penelitian yang disebutkan. Dalam kasus ini, bagaimanapun, 95% CI untuk perbedaan intervensi adalah 6% (-7 sampai +19). Kisaran ini cukup lebar dibandingkan dengan perbedaan 5% yang akan menjadi kepentingan klinis. Jelas bahwa penelitian ini tidak mengesampingkan perbedaan yang signifikan dalam kemanjuran. Oleh karena itu, kesimpulan penulis "infus octreotide dan skleroterapi sama-sama efektif dalam pengobatan perdarahan dari varises" jelas tidak valid. Dalam kasus seperti ini di mana 95% CI untuk pengurangan risiko absolut (ARR) termasuk nol, seperti di sini, CI untuk NNT (angka yang diperlukan untuk mengobati) agak sulit untuk ditafsirkan. . NLP dan CI-nya diperoleh dari kebalikan dari ACP (kalikan dengan 100 jika nilai-nilai ini diberikan sebagai persentase). Di sini kita mendapatkan NPP = 100: 6 = 16,6 dengan CI 95% dari -14,3 hingga 5,3. Seperti dapat dilihat dari catatan kaki "d" pada Tabel. A1.1, CI ini mencakup nilai untuk NTPP dari 5,3 hingga tak terhingga dan NTLP dari 14,3 hingga tak terhingga.

CI dapat dibangun untuk perkiraan atau perbandingan statistik yang paling umum digunakan. Untuk RCT, ini mencakup perbedaan antara proporsi rata-rata, risiko relatif, rasio odds, dan NRR. Demikian pula, CI dapat diperoleh untuk semua perkiraan utama yang dibuat dalam studi akurasi tes diagnostik — sensitivitas, spesifisitas, nilai prediksi positif (semuanya adalah proporsi sederhana), dan rasio kemungkinan — perkiraan yang diperoleh dalam meta-analisis dan perbandingan-ke-kontrol studi. Program komputer pribadi yang mencakup banyak dari penggunaan DI ini tersedia dengan Statistik dengan Percaya Diri edisi kedua. Makro untuk menghitung CI untuk proporsi tersedia gratis untuk Excel dan program statistik SPSS dan Minitab di http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Beberapa evaluasi efek pengobatan

Sementara konstruksi CI diinginkan untuk hasil utama studi, mereka tidak diperlukan untuk semua hasil. CI menyangkut perbandingan penting secara klinis. Misalnya, ketika membandingkan dua grup, CI yang benar adalah yang dibangun untuk perbedaan antara grup, seperti yang ditunjukkan pada contoh di atas, dan bukan CI yang dapat dibangun untuk estimasi di setiap grup. Tidak hanya tidak berguna untuk memberikan CI terpisah untuk skor di setiap kelompok, presentasi ini bisa menyesatkan. Demikian pula, pendekatan yang benar ketika membandingkan kemanjuran pengobatan dalam subkelompok yang berbeda adalah dengan membandingkan dua (atau lebih) subkelompok secara langsung. Adalah tidak benar untuk berasumsi bahwa pengobatan hanya efektif dalam satu subkelompok jika CI-nya mengecualikan nilai yang sesuai dengan tidak ada efek, sementara yang lain tidak. CI juga berguna saat membandingkan hasil di beberapa subkelompok. pada gambar. A1.1 menunjukkan risiko relatif eklampsia pada wanita dengan preeklamsia pada subkelompok wanita dari RCT magnesium sulfat yang dikontrol plasebo.

Beras. A1.2. Forest Graph menunjukkan hasil dari 11 uji klinis acak vaksin rotavirus sapi untuk pencegahan diare versus plasebo. Interval kepercayaan 95% digunakan untuk memperkirakan risiko relatif diare. Ukuran kotak hitam sebanding dengan jumlah informasi. Selain itu, ringkasan perkiraan kemanjuran pengobatan dan interval kepercayaan 95% (ditunjukkan dengan berlian) ditampilkan. Meta-analisis menggunakan model efek acak yang melebihi beberapa model yang telah ditetapkan sebelumnya; misalnya, bisa jadi ukuran yang digunakan dalam menghitung ukuran sampel. Di bawah kriteria yang lebih ketat, seluruh rentang CI harus menunjukkan manfaat yang melebihi minimum yang telah ditentukan.

Kami telah membahas kekeliruan mengambil tidak adanya signifikansi statistik sebagai indikasi bahwa dua perawatan sama-sama efektif. Sama pentingnya untuk tidak menyamakan signifikansi statistik dengan signifikansi klinis. Kepentingan klinis dapat diasumsikan ketika hasilnya signifikan secara statistik dan besarnya respons pengobatan

Studi dapat menunjukkan apakah hasilnya signifikan secara statistik dan mana yang penting secara klinis dan mana yang tidak. pada gambar. A1.2 menunjukkan hasil dari empat percobaan dimana seluruh CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Dari artikel ini Anda akan belajar:

    Apa selang kepercayaan?

    Apa intinya aturan 3 sigma?

    Bagaimana pengetahuan ini dapat dipraktekkan?

Saat ini, karena melimpahnya informasi yang terkait dengan berbagai macam produk, arahan penjualan, karyawan, aktivitas, dll., sulit untuk memilih yang utama, yang pertama-tama perlu diperhatikan dan diusahakan untuk dikelola. Definisi selang kepercayaan dan analisis untuk melampaui batas nilai aktualnya - sebuah teknik yang membantu Anda mengidentifikasi situasi, mempengaruhi tren. Anda akan dapat mengembangkan faktor-faktor positif dan mengurangi pengaruh faktor-faktor negatif. Teknologi ini digunakan di banyak perusahaan terkenal dunia.

Ada yang disebut peringatan", yang menginformasikan manajer menyatakan bahwa nilai berikutnya dalam arah tertentu melampaui selang kepercayaan. Apa artinya ini? Ini adalah sinyal bahwa beberapa peristiwa non-standar telah terjadi, yang dapat mengubah tren yang ada ke arah ini. Ini sinyalnya untuk itu untuk menyelesaikannya dalam situasi dan memahami apa yang mempengaruhinya.

Misalnya, pertimbangkan beberapa situasi. Kami telah menghitung perkiraan penjualan dengan batas perkiraan untuk 100 item komoditas untuk tahun 2011 berdasarkan bulan dan penjualan aktual pada bulan Maret:

  1. Untuk "minyak bunga matahari" mereka menembus batas atas perkiraan dan tidak jatuh ke dalam interval kepercayaan.
  2. Untuk "ragi kering" melampaui batas bawah perkiraan.
  3. Pada "Bubur Oatmeal" menembus batas atas.

Untuk sisa barang, penjualan aktual berada dalam batas perkiraan yang ditentukan. Itu. penjualan mereka sesuai dengan harapan. Jadi, kami mengidentifikasi 3 produk yang melampaui batas, dan mulai mencari tahu apa yang memengaruhi melampaui batas:

  1. Dengan Minyak Bunga Matahari, kami memasuki jaringan perdagangan baru, yang memberi kami volume penjualan tambahan, yang melampaui batas atas. Untuk produk ini, ada baiknya menghitung ulang perkiraan hingga akhir tahun, dengan mempertimbangkan perkiraan penjualan ke rantai ini.
  2. Untuk Ragi Kering, mobil terjebak di bea cukai, dan terjadi kekurangan dalam waktu 5 hari, yang berdampak pada penurunan penjualan dan melampaui batas bawah. Mungkin bermanfaat untuk mencari tahu apa yang menyebabkan penyebabnya dan mencoba untuk tidak mengulangi situasi ini.
  3. Untuk Oatmeal, promosi penjualan diluncurkan, yang menghasilkan peningkatan penjualan yang signifikan dan melampaui perkiraan.

Kami mengidentifikasi 3 faktor yang mempengaruhi overshoot dari perkiraan. Mungkin ada lebih banyak dari mereka dalam hidup.Untuk meningkatkan akurasi peramalan dan perencanaan, faktor-faktor yang mengarah pada fakta bahwa penjualan aktual dapat melampaui perkiraan, ada baiknya menyoroti dan membangun prakiraan dan rencana untuk mereka secara terpisah. Dan kemudian memperhitungkan dampaknya pada perkiraan penjualan utama. Anda juga dapat secara teratur mengevaluasi dampak dari faktor-faktor ini dan mengubah situasi menjadi lebih baik untuk dengan mengurangi pengaruh negatif dan meningkatkan pengaruh faktor positif.

Dengan selang kepercayaan, kita dapat:

  1. Sorot tujuan, yang patut diperhatikan, karena peristiwa telah terjadi di area ini yang dapat mempengaruhi perubahan tren.
  2. Tentukan Faktor yang benar-benar membuat perbedaan.
  3. Menerima keputusan berbobot(misalnya tentang pengadaan, saat perencanaan, dll).

Sekarang mari kita lihat apa itu interval kepercayaan dan bagaimana menghitungnya di Excel menggunakan sebuah contoh.

Apa itu interval kepercayaan?

Interval kepercayaan adalah batas perkiraan (atas dan bawah), di mana dengan probabilitas tertentu (sigma) mendapatkan nilai yang sebenarnya.

Itu. kami menghitung perkiraan - ini adalah tolok ukur utama kami, tetapi kami memahami bahwa nilai sebenarnya tidak mungkin 100% sama dengan perkiraan kami. Dan muncul pertanyaan sejauh mana mungkin mendapatkan nilai aktual, jika tren saat ini berlanjut? Dan pertanyaan ini akan membantu kami menjawab perhitungan interval kepercayaan, yaitu - batas atas dan bawah perkiraan.

Apa yang dimaksud dengan sigma probabilitas tertentu?

Saat menghitung selang kepercayaan kita bisa atur probabilitas hits nilai sebenarnya dalam batas perkiraan yang diberikan. Bagaimana cara melakukannya? Untuk melakukan ini, kami menetapkan nilai sigma dan, jika sigma sama dengan:

    3 sigma- kemudian, probabilitas untuk mencapai nilai aktual berikutnya dalam interval kepercayaan adalah 99,7%, atau 300 banding 1, atau ada probabilitas 0,3% untuk melampaui batas.

    2 sigma- maka, probabilitas memukul nilai berikutnya dalam batas adalah 95,5%, yaitu. kemungkinannya sekitar 20 banding 1, atau ada kemungkinan 4,5% untuk keluar dari batas.

    1 sigma- maka, probabilitasnya adalah 68,3%, mis. peluangnya sekitar 2 banding 1, atau ada peluang 31,7% bahwa nilai berikutnya akan berada di luar interval kepercayaan.

Kami merumuskan 3 Aturan Sigma,yang mengatakan bahwa kemungkinan pukulan nilai acak lainnya ke dalam selang kepercayaan dengan nilai tertentu tiga sigma adalah 99,7%.

Matematikawan besar Rusia Chebyshev membuktikan teorema bahwa ada peluang 10% untuk melampaui batas perkiraan dengan nilai tiga sigma yang diberikan. Itu. kemungkinan jatuh ke dalam interval kepercayaan 3 sigma akan menjadi setidaknya 90%, sementara upaya untuk menghitung perkiraan dan batas-batasnya "dengan mata" penuh dengan kesalahan yang jauh lebih signifikan.

Bagaimana cara menghitung interval kepercayaan secara mandiri di Excel?

Mari kita pertimbangkan perhitungan interval kepercayaan di Excel (yaitu batas atas dan bawah perkiraan) menggunakan sebuah contoh. Kami memiliki deret waktu - penjualan per bulan selama 5 tahun. Lihat file terlampir.

Untuk menghitung batas ramalan, kami menghitung:

  1. Perkiraan penjualan().
  2. Sigma - simpangan baku model perkiraan dari nilai sebenarnya.
  3. Tiga sigma.
  4. Interval kepercayaan.

1. Perkiraan penjualan.

=(RC[-14] (data dalam deret waktu)-RC[-1] (nilai model))^2(kuadrat)


3. Jumlahkan untuk setiap bulan nilai penyimpangan dari tahap 8 Jumlah((Xi-Ximod)^2), mis. Mari kita jumlahkan Januari, Februari... untuk setiap tahun.

Untuk melakukannya, gunakan rumus =SUMIF()

SUMIF(array dengan jumlah periode di dalam siklus (untuk bulan dari 1 hingga 12); referensi ke jumlah periode dalam siklus; referensi ke array dengan kuadrat selisih antara data awal dan nilai periode)


4. Hitung simpangan baku untuk setiap periode dalam siklus dari 1 sampai 12 (tahap 10 dalam file terlampir).

Untuk melakukan ini, dari nilai yang dihitung pada tahap 9, kami mengekstrak akar dan membaginya dengan jumlah periode dalam siklus ini dikurangi 1 = ROOT((Jumlah(Xi-Ximod)^2/(n-1))

Mari kita gunakan rumus di Excel =ROOT(R8 (referensi ke (Jumlah(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (referensi ke array dengan nomor siklus); O8 (referensi ke nomor siklus tertentu, yang kami pertimbangkan dalam larik))-1))

Menggunakan rumus Excel = COUNTIF kita menghitung angka n


Dengan menghitung standar deviasi data aktual dari model ramalan, kami memperoleh nilai sigma untuk setiap bulan - tahap 10 dalam file terlampir.

3. Hitung 3 sigma.

Pada tahap 11, kami menetapkan jumlah sigma - dalam contoh kami, "3" (tahap 11 dalam file terlampir):

Juga nilai sigma praktis:

1,64 sigma - 10% kemungkinan melewati batas (1 peluang dalam 10);

1,96 sigma - 5% kemungkinan keluar batas (1 peluang dalam 20);

2,6 sigma - 1% kemungkinan keluar batas (peluang 1 dalam 100).

5) Kami menghitung tiga sigma, untuk ini kami mengalikan nilai "sigma" untuk setiap bulan dengan "3".

3. Tentukan selang kepercayaan.

  1. Batas perkiraan atas- perkiraan penjualan dengan mempertimbangkan pertumbuhan dan musiman + (plus) 3 sigma;
  2. Batas Prakiraan Bawah- perkiraan penjualan dengan mempertimbangkan pertumbuhan dan musim - (minus) 3 sigma;

Untuk kenyamanan menghitung interval kepercayaan untuk waktu yang lama (lihat file terlampir), kami menggunakan rumus Excel =Y8+VLOOKUP(W8;$U$8:$V$19;2;0), di mana

Y8- perkiraan penjualan;

W8- jumlah bulan di mana kami akan mengambil nilai 3 sigma;

Itu. Batas perkiraan atas= "perkiraan penjualan" + "3 sigma" (dalam contoh, VLOOKUP(nomor bulan; tabel dengan nilai 3 sigma; kolom tempat kami mengekstrak nilai sigma sama dengan nomor bulan di baris yang sesuai; 0)).

Batas Prakiraan Bawah= "perkiraan penjualan" dikurangi "3 sigma".

Jadi, kami telah menghitung interval kepercayaan di Excel.

Sekarang kami memiliki perkiraan dan rentang dengan batas-batas di mana nilai aktual akan jatuh dengan sigma probabilitas yang diberikan.

Dalam artikel ini, kita melihat apa itu sigma dan aturan tiga sigma, bagaimana menentukan interval kepercayaan, dan untuk apa Anda dapat menggunakan teknik ini dalam praktik.

Ramalan yang akurat dan sukses untuk Anda!

Bagaimana Forecast4AC PRO dapat membantu Andasaat menghitung interval kepercayaan?:

    Forecast4AC PRO akan secara otomatis menghitung batas perkiraan atas atau bawah untuk lebih dari 1000 deret waktu secara bersamaan;

    Kemampuan untuk menganalisis batas-batas perkiraan dibandingkan dengan perkiraan, tren dan penjualan aktual pada grafik dengan satu penekanan tombol;

Dalam program Forcast4AC PRO, dimungkinkan untuk mengatur nilai sigma dari 1 hingga 3.

Bergabunglah dengan kami!

Unduh Aplikasi Prakiraan dan Intelijen Bisnis Gratis:


  • Novo Prakiraan Lite- otomatis perhitungan perkiraan di unggul.
  • 4analitik- Analisis ABC-XYZ dan analisis emisi di Unggul.
  • Qlik Sense Desktop dan QlikViewEdisi Pribadi - Sistem BI untuk analisis dan visualisasi data.

Uji fitur solusi berbayar:

  • Novo Prakiraan PRO- peramalan di Excel untuk array data besar.