Distribusi binomial dan bentuk pembatasnya. Distribusi binomial dari variabel acak


Tentu saja, ketika menghitung fungsi distribusi kumulatif, seseorang harus menggunakan hubungan yang disebutkan antara distribusi binomial dan beta. Metode ini tentu lebih baik daripada penjumlahan langsung ketika n > 10.

Dalam buku teks klasik tentang statistika, untuk mendapatkan nilai distribusi binomial, sering disarankan untuk menggunakan rumus berdasarkan teorema limit (seperti rumus Moivre-Laplace). Perlu dicatat bahwa dari sudut pandang komputasi murni nilai teorema ini mendekati nol, terutama sekarang, ketika ada komputer yang kuat di hampir setiap meja. Kerugian utama dari perkiraan di atas adalah akurasinya yang sama sekali tidak memadai untuk nilai n khas untuk sebagian besar aplikasi. Kerugian yang tidak kalah pentingnya adalah tidak adanya rekomendasi yang jelas tentang penerapan satu atau pendekatan lain (dalam teks standar, hanya formulasi asimtotik yang diberikan, mereka tidak disertai dengan perkiraan akurasi dan, oleh karena itu, tidak banyak digunakan). Saya akan mengatakan bahwa kedua rumus hanya valid untuk n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Saya tidak mempertimbangkan di sini masalah menemukan kuantil: untuk distribusi diskrit, itu sepele, dan dalam masalah di mana distribusi seperti itu muncul, sebagai suatu peraturan, itu tidak relevan. Jika kuantil masih diperlukan, saya sarankan merumuskan ulang masalah sedemikian rupa untuk bekerja dengan nilai-p (signifikansi yang diamati). Berikut adalah contohnya: ketika menerapkan beberapa algoritma enumerasi, pada setiap langkah diperlukan untuk memeriksa hipotesis statistik tentang variabel acak binomial. Menurut pendekatan klasik, pada setiap langkah perlu untuk menghitung statistik kriteria dan membandingkan nilainya dengan batas himpunan kritis. Karena, bagaimanapun, algoritma ini enumeratif, perlu untuk menentukan batas dari himpunan kritis setiap kali lagi (setelah semua, ukuran sampel berubah dari langkah ke langkah), yang secara tidak produktif meningkatkan biaya waktu. Pendekatan modern merekomendasikan untuk menghitung signifikansi yang diamati dan membandingkannya dengan probabilitas kepercayaan, menghemat pencarian kuantil.

Oleh karena itu, kode-kode di bawah ini tidak menghitung fungsi invers, melainkan diberikan fungsi rev_binomialDF, yang menghitung probabilitas p keberhasilan dalam satu percobaan dengan jumlah n percobaan, jumlah m keberhasilan di dalamnya, dan nilai y dari probabilitas mendapatkan m keberhasilan ini. Ini menggunakan hubungan yang disebutkan di atas antara distribusi binomial dan beta.

Sebenarnya, fungsi ini memungkinkan Anda untuk mendapatkan batas interval kepercayaan. Memang, misalkan kita mendapatkan m keberhasilan dalam n percobaan binomial. Seperti diketahui, batas kiri interval kepercayaan dua sisi untuk parameter p dengan tingkat kepercayaan adalah 0 jika m = 0, dan untuk adalah solusi dari persamaan . Demikian pula, batas kanan adalah 1 jika m = n, dan untuk adalah solusi persamaan . Ini menyiratkan bahwa untuk menemukan batas kiri, kita harus menyelesaikan persamaan , dan untuk mencari yang benar - persamaan . Mereka diselesaikan dalam fungsi binom_leftCI dan binom_rightCI , yang masing-masing mengembalikan batas atas dan bawah interval kepercayaan dua sisi.

Saya ingin mencatat bahwa jika akurasi yang benar-benar luar biasa tidak diperlukan, maka untuk n yang cukup besar, Anda dapat menggunakan pendekatan berikut [B.L. van der Waerden, Statistik matematika. M: IL, 1960, Bab. 2, detik. 7]: , di mana g adalah kuantil dari distribusi normal. Nilai dari aproksimasi ini adalah bahwa ada aproksimasi yang sangat sederhana yang memungkinkan Anda menghitung kuantil dari distribusi normal (lihat teks tentang menghitung distribusi normal dan bagian yang sesuai dari referensi ini). Dalam praktik saya (terutama untuk n > 100), perkiraan ini menghasilkan sekitar 3-4 digit, yang biasanya cukup.

Perhitungan dengan kode berikut memerlukan file betaDF.h , betaDF.cpp (lihat bagian tentang distribusi beta), serta logGamma.h , logGamma.cpp (lihat lampiran A). Anda juga dapat melihat contoh penggunaan fungsi.

file binomialDF.h

#ifndef __BINOMIAL_H__ #include "betaDF.h" double binomialDF(uji coba ganda, keberhasilan ganda, p ganda); /* * Biarkan ada "percobaan" dari pengamatan independen * dengan probabilitas "p" keberhasilan di masing-masing. * Hitung probabilitas B(berhasil|percobaan,p) bahwa jumlah * keberhasilan adalah antara 0 dan "berhasil" (termasuk). */ double rev_binomialDF(percobaan ganda, keberhasilan ganda, y ganda); /* * Biarkan probabilitas y dari setidaknya m sukses * diketahui dalam uji coba skema Bernoulli. Fungsi tersebut menemukan probabilitas p * keberhasilan dalam satu percobaan. * * Relasi berikut digunakan dalam perhitungan * * 1 - p = rev_Beta(trials-successes| successes+1, y). */ double binom_leftCI(uji coba ganda, keberhasilan ganda, level ganda); /* Misalkan ada "percobaan" dari pengamatan independen * dengan probabilitas "p" keberhasilan di setiap * dan jumlah keberhasilan adalah "berhasil". * Batas kiri interval kepercayaan dua sisi * dihitung dengan tingkat tingkat signifikansi. */ double binom_rightCI(double n, double sukses, double level); /* Misalkan ada "percobaan" dari pengamatan independen * dengan probabilitas "p" keberhasilan di setiap * dan jumlah keberhasilan adalah "berhasil". * Batas kanan selang kepercayaan dua sisi * dihitung dengan tingkat tingkat signifikansi. */ #endif /* Berakhir #ifndef __BINOMIAL_H__ */

file binomialDF.cpp

/************************************************ **** **********/ /* Distribusi Binomial */ /**************************** **** ***************************/ #include #termasuk #include "betaDF.h" ENTRY double binomialDF(double n, double m, double p) /* * Biarkan ada "n" pengamatan independen * dengan probabilitas "p" keberhasilan di masing-masing. * Hitung probabilitas B(m|n,p) bahwa jumlah keberhasilan adalah * antara 0 dan "m" (inklusif), mis. * jumlah peluang binomial dari 0 hingga m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Perhitungan tidak menyiratkan penjumlahan bodoh - * digunakan hubungan berikut dengan distribusi beta pusat: * * B(m|n,p) = Beta(1-p|n-m,m+1). * * Argumen harus positif, dengan 0<= p <= 1. */ { assert((n >0) && (p >= 0) && (p<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) kembalikan 1; lain kembalikan BetaDF(n-m, m+1).nilai(1-p); )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * Biarkan probabilitas y dari setidaknya m sukses * diketahui dalam n percobaan skema Bernoulli. Fungsi tersebut menemukan probabilitas p * keberhasilan dalam satu percobaan. * * Relasi berikut digunakan dalam perhitungan * * 1 - p = rev_Beta(y|n-m,m+1). */ ( tegaskan((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

Pertimbangkan distribusi Binomial, hitung ekspektasi matematisnya, varians, modenya. Menggunakan fungsi MS EXCEL BINOM.DIST(), kita akan memplot fungsi distribusi dan grafik kepadatan probabilitas. Mari kita perkirakan parameter distribusi p, ekspektasi matematis dari distribusi, dan standar deviasi. Perhatikan juga distribusi Bernoulli.

Definisi. Biarkan mereka ditahan n tes, di mana masing-masing hanya 2 peristiwa yang dapat terjadi: peristiwa "berhasil" dengan probabilitas p atau acara "kegagalan" dengan probabilitas q =1-p (yang disebut skema Bernoulli,Bernoulliuji coba).

Peluang mendapatkan tepat x sukses dalam hal ini n percobaan sama dengan:

Jumlah keberhasilan dalam sampel x adalah peubah acak yang memiliki Distribusi Binomial(Bahasa inggris) Binomiumdistribusi) p dan n adalah parameter dari distribusi ini.

Ingat itu untuk melamar Skema Bernoulli dan sesuai distribusi binomial, kondisi berikut harus dipenuhi:

  • setiap percobaan harus memiliki tepat dua hasil, secara kondisional disebut "sukses" dan "gagal".
  • hasil setiap tes tidak boleh bergantung pada hasil tes sebelumnya (independensi tes).
  • tingkat kesuksesan p harus konstan untuk semua pengujian.

Distribusi Binomial di MS EXCEL

Di MS EXCEL, mulai dari versi 2010, untuk ada fungsi BINOM.DIST(), nama bahasa Inggrisnya adalah BINOM.DIST(), yang memungkinkan Anda menghitung probabilitas bahwa sampel akan memiliki persis X"sukses" (mis. fungsi kepadatan probabilitas p(x), lihat rumus di atas), dan fungsi distribusi integral(probabilitas bahwa sampel akan memiliki x atau kurang "berhasil", termasuk 0).

Sebelum MS EXCEL 2010, EXCEL memiliki fungsi BINOMDIST(), yang juga memungkinkan Anda menghitung fungsi distribusi dan kepadatan probabilitas p(x). BINOMDIST() dibiarkan di MS EXCEL 2010 untuk kompatibilitas.

File contoh berisi grafik kepadatan distribusi probabilitas dan .

Distribusi Binomial memiliki sebutan B (n ; p) .

Catatan: Untuk bangunan fungsi distribusi integral tipe bagan yang pas Jadwal, untuk kepadatan distribusiHistogram dengan pengelompokan. Untuk informasi lebih lanjut tentang membuat bagan, baca artikel Jenis bagan utama.

Catatan: Untuk kenyamanan menulis rumus dalam file contoh, Nama untuk parameter telah dibuat Distribusi Binomial: n dan hal.

File contoh menunjukkan berbagai perhitungan probabilitas menggunakan fungsi MS EXCEL:

Seperti terlihat pada gambar di atas, diasumsikan bahwa:

  • Populasi tak terbatas dari mana sampel dibuat mengandung 10% (atau 0,1) elemen baik (parameter p, argumen fungsi ketiga = BINOM.DIST() )
  • Untuk menghitung probabilitas bahwa dalam sampel 10 elemen (parameter n, argumen kedua dari fungsi) akan ada tepat 5 elemen yang valid (argumen pertama), Anda perlu menulis rumus: =BINOM.DIST(5, 10, 0.1, FALSE)
  • Terakhir, elemen keempat disetel = FALSE, mis. nilai fungsi dikembalikan kepadatan distribusi .

Jika nilai argumen keempat = TRUE, maka fungsi BINOM.DIST() mengembalikan nilai fungsi distribusi integral atau hanya fungsi distribusi. Dalam hal ini, Anda dapat menghitung probabilitas bahwa jumlah item yang baik dalam sampel akan berasal dari kisaran tertentu, misalnya, 2 atau kurang (termasuk 0).

Untuk melakukan ini, tulis rumusnya: = BINOM.DIST(2, 10, 0.1, TRUE)

Catatan: Untuk nilai bukan bilangan bulat dari x, . Misalnya, rumus berikut akan mengembalikan nilai yang sama: =BINOM.DIST( 2 ; sepuluh; 0,1; BENAR)=BINOM.DIST( 2,9 ; sepuluh; 0,1; BENAR)

Catatan: Dalam contoh file kepadatan probabilitas dan fungsi distribusi juga dihitung menggunakan definisi dan fungsi COMBIN().

Indikator distribusi

PADA contoh file pada lembar Contoh ada rumus untuk menghitung beberapa indikator distribusi:

  • =n*p;
  • (deviasi standar kuadrat) = n*p*(1-p);
  • = (n+1)*p;
  • =(1-2*p)*ROOT(n*p*(1-p)).

Kami menurunkan rumus harapan matematisDistribusi Binomial menggunakan Skema Bernoulli .

Menurut definisi, variabel acak X di Skema Bernoulli(Variabel acak Bernoulli) memiliki fungsi distribusi :

Distribusi ini disebut Distribusi Bernoulli .

Catatan : Distribusi Bernoulli- kasus spesial Distribusi Binomial dengan parameter n=1.

Mari kita buat 3 array dari 100 angka dengan probabilitas keberhasilan yang berbeda: 0,1; 0,5 dan 0,9. Untuk melakukan ini, di jendela Pembuatan angka acak atur parameter berikut untuk setiap probabilitas p:

Catatan: Jika Anda mengatur opsi hamburan acak (Benih acak), maka Anda dapat memilih serangkaian angka yang dihasilkan secara acak. Misalnya, dengan menyetel opsi ini =25, Anda dapat menghasilkan set angka acak yang sama di komputer yang berbeda (jika, tentu saja, parameter distribusi lainnya sama). Nilai opsi dapat mengambil nilai integer dari 1 hingga 32,767. Nama opsi hamburan acak bisa membingungkan. Akan lebih baik untuk menerjemahkannya sebagai Tetapkan nomor dengan nomor acak .

Akibatnya, kita akan memiliki 3 kolom berisi 100 angka, yang berdasarkan itu, misalnya, kita dapat memperkirakan probabilitas keberhasilan p menurut rumus: Jumlah keberhasilan/100(cm. contoh file sheet Menghasilkan Bernoulli).

Catatan: Untuk Distribusi Bernoulli dengan p=0.5, Anda dapat menggunakan rumus =RANDBETWEEN(0;1) , yang sesuai dengan .

Pembuatan angka acak. Distribusi binomial

Misalkan ada 7 item yang cacat dalam sampel. Ini berarti bahwa "sangat mungkin" proporsi produk cacat telah berubah. p, yang merupakan karakteristik dari proses produksi kami. Meskipun situasi ini "sangat mungkin", ada kemungkinan (risiko alfa, kesalahan tipe 1, "alarm palsu") bahwa p tetap tidak berubah, dan peningkatan jumlah produk cacat disebabkan oleh pengambilan sampel secara acak.

Seperti yang Anda lihat pada gambar di bawah, 7 adalah jumlah produk cacat yang dapat diterima untuk suatu proses dengan p=0,21 dengan nilai yang sama Alfa. Ini menggambarkan bahwa ketika ambang batas barang cacat dalam sampel terlampaui, p"mungkin" meningkat. Frasa "kemungkinan" berarti hanya ada kemungkinan 10% (100%-90%) bahwa penyimpangan persentase produk cacat di atas ambang batas hanya disebabkan oleh penyebab acak.

Jadi, melebihi ambang batas jumlah produk cacat dalam sampel dapat berfungsi sebagai sinyal bahwa proses telah menjadi kacau dan mulai menghasilkan b tentang persentase yang lebih tinggi dari produk cacat.

Catatan: Sebelum MS EXCEL 2010, EXCEL memiliki fungsi CRITBINOM() , yang setara dengan BINOM.INV() . CRITBINOM() dibiarkan di MS EXCEL 2010 dan lebih tinggi untuk kompatibilitas.

Hubungan distribusi Binomial dengan distribusi lainnya

Jika parameternya nDistribusi Binomial cenderung tak terhingga dan p cenderung 0, maka dalam hal ini Distribusi Binomial dapat didekati. Hal ini dimungkinkan untuk merumuskan kondisi ketika pendekatan distribusi racun bekerja dengan baik:

  • p(kurang p dan banyak lagi n, semakin akurat aproksimasinya);
  • p >0,9 (mengingat bahwa q =1- p, perhitungan dalam hal ini harus dilakukan dengan menggunakan q(sebuah X perlu diganti dengan n - x). Oleh karena itu, semakin sedikit q dan banyak lagi n, semakin akurat aproksimasinya).

Pada 0.110 Distribusi Binomial dapat didekati.

Pada gilirannya, Distribusi Binomial dapat berfungsi sebagai pendekatan yang baik ketika ukuran populasi adalah N Distribusi hipergeometrik jauh lebih besar dari ukuran sampel n (yaitu, N>>n atau n/N Anda dapat membaca lebih lanjut tentang hubungan distribusi di atas dalam artikel. Contoh pendekatan juga diberikan di sana, dan kondisi dijelaskan bila memungkinkan dan dengan akurasi apa.

NASIHAT: Anda dapat membaca tentang distribusi MS EXCEL lainnya di artikel.

Teori probabilitas hadir secara tak kasat mata dalam kehidupan kita. Kami tidak memperhatikannya, tetapi setiap peristiwa dalam hidup kami memiliki satu atau beberapa kemungkinan. Mengingat banyaknya kemungkinan skenario, menjadi penting bagi kita untuk menentukan yang paling mungkin dan yang paling kecil kemungkinannya. Paling mudah untuk menganalisis data probabilistik seperti itu secara grafis. Distribusi dapat membantu kami dalam hal ini. Binomial adalah salah satu yang termudah dan paling akurat.

Sebelum beralih langsung ke matematika dan teori probabilitas, mari kita cari tahu siapa yang pertama kali menemukan jenis distribusi ini dan bagaimana sejarah perkembangan peralatan matematika untuk konsep ini.

Cerita

Konsep probabilitas telah dikenal sejak zaman kuno. Namun, matematikawan kuno tidak terlalu mementingkannya dan hanya mampu meletakkan dasar bagi teori yang kemudian menjadi teori probabilitas. Mereka menciptakan beberapa metode kombinatorial yang sangat membantu mereka yang kemudian menciptakan dan mengembangkan teori itu sendiri.

Pada paruh kedua abad ketujuh belas, pembentukan konsep dasar dan metode teori probabilitas dimulai. Definisi variabel acak, metode untuk menghitung probabilitas sederhana dan beberapa peristiwa independen dan dependen yang kompleks diperkenalkan. Ketertarikan pada variabel dan probabilitas acak seperti itu ditentukan oleh perjudian: setiap orang ingin tahu apa peluangnya untuk memenangkan permainan.

Langkah selanjutnya adalah penerapan metode analisis matematis dalam teori probabilitas. Matematikawan terkemuka seperti Laplace, Gauss, Poisson dan Bernoulli mengambil tugas ini. Merekalah yang memajukan bidang matematika ini ke tingkat yang baru. James Bernoulli-lah yang menemukan hukum distribusi binomial. Omong-omong, seperti yang akan kita ketahui nanti, berdasarkan penemuan ini, beberapa lagi dibuat, yang memungkinkan untuk menciptakan hukum distribusi normal dan banyak lainnya.

Sekarang, sebelum kita mulai mendeskripsikan distribusi binomial, kita akan sedikit menyegarkan ingatan tentang konsep teori probabilitas, yang mungkin sudah terlupakan dari bangku sekolah.

Dasar-dasar Teori Probabilitas

Kami akan mempertimbangkan sistem seperti itu, sebagai akibatnya hanya dua hasil yang mungkin: "sukses" dan "gagal". Ini mudah dimengerti dengan sebuah contoh: kita melempar koin, menebak bahwa ekornya akan rontok. Probabilitas masing-masing peristiwa yang mungkin (ekor - "sukses", kepala - "tidak berhasil") sama dengan 50 persen dengan koin seimbang sempurna dan tidak ada faktor lain yang dapat memengaruhi eksperimen.

Itu adalah acara yang paling sederhana. Tetapi ada juga sistem yang kompleks di mana tindakan berurutan dilakukan, dan probabilitas hasil dari tindakan ini akan berbeda. Sebagai contoh, perhatikan sistem berikut: dalam sebuah kotak yang isinya tidak dapat kita lihat, ada enam bola yang benar-benar identik, tiga pasang warna biru, merah dan putih. Kita harus mendapatkan beberapa bola secara acak. Oleh karena itu, dengan menarik salah satu bola putih terlebih dahulu, kita akan mengurangi beberapa kali kemungkinan bahwa kita juga akan mendapatkan bola putih berikutnya. Ini terjadi karena jumlah objek dalam sistem berubah.

Pada bagian berikutnya, kita akan melihat konsep matematika yang lebih kompleks yang mendekatkan kita pada arti kata "distribusi normal", "distribusi binomial" dan sejenisnya.

Elemen statistik matematika

Dalam statistik, yang merupakan salah satu bidang penerapan teori probabilitas, ada banyak contoh di mana data untuk analisis tidak diberikan secara eksplisit. Artinya, bukan dalam jumlah, tetapi dalam bentuk pembagian menurut ciri-cirinya, misalnya menurut jenis kelamin. Untuk menerapkan perangkat matematika pada data tersebut dan menarik beberapa kesimpulan dari hasil yang diperoleh, diperlukan untuk mengubah data awal ke dalam format numerik. Sebagai aturan, untuk menerapkan ini, hasil positif diberi nilai 1, dan hasil negatif diberi nilai 0. Dengan demikian, kami memperoleh data statistik yang dapat dianalisis menggunakan metode matematika.

Langkah selanjutnya dalam memahami apa distribusi binomial dari variabel acak adalah menentukan varians dari variabel acak dan harapan matematis. Kita akan membicarakan ini di bagian selanjutnya.

Nilai yang diharapkan

Sebenarnya, memahami apa itu ekspektasi matematis tidaklah sulit. Pertimbangkan sistem di mana ada banyak peristiwa yang berbeda dengan probabilitas mereka sendiri yang berbeda. Harapan matematis akan disebut nilai yang sama dengan jumlah produk dari nilai-nilai peristiwa ini (dalam bentuk matematika yang kita bicarakan di bagian terakhir) dan probabilitas kemunculannya.

Ekspektasi matematis dari distribusi binomial dihitung sesuai dengan skema yang sama: kami mengambil nilai variabel acak, mengalikannya dengan probabilitas hasil positif, dan kemudian meringkas data yang diperoleh untuk semua variabel. Sangat nyaman untuk menyajikan data ini secara grafis - dengan cara ini perbedaan antara ekspektasi matematis dari nilai yang berbeda lebih dirasakan.

Di bagian selanjutnya, kami akan memberi tahu Anda sedikit tentang konsep yang berbeda - varians dari variabel acak. Ini juga terkait erat dengan konsep seperti distribusi probabilitas binomial, dan merupakan karakteristiknya.

Varians distribusi binomial

Nilai ini terkait erat dengan yang sebelumnya dan juga mencirikan distribusi data statistik. Ini mewakili kuadrat rata-rata penyimpangan nilai dari harapan matematis mereka. Artinya, varians dari variabel acak adalah jumlah selisih kuadrat antara nilai variabel acak dan ekspektasi matematisnya, dikalikan dengan peluang kejadian ini.

Secara umum, hanya ini yang perlu kita ketahui tentang varians untuk memahami apa itu distribusi probabilitas binomial. Sekarang mari kita beralih ke topik utama kita. Yaitu, apa yang ada di balik ungkapan yang tampaknya agak rumit "hukum distribusi binomial".

Distribusi Binomial

Mari kita pahami dulu mengapa distribusi ini binomial. Itu berasal dari kata "binom". Anda mungkin pernah mendengar tentang binomial Newton - rumus yang dapat digunakan untuk memperluas jumlah dua bilangan a dan b ke pangkat n yang tidak negatif.

Seperti yang mungkin sudah Anda duga, rumus binomial Newton dan rumus distribusi binomial adalah rumus yang hampir sama. Dengan satu-satunya pengecualian bahwa yang kedua memiliki nilai yang diterapkan untuk jumlah tertentu, dan yang pertama hanya alat matematika umum, yang penerapannya dalam praktik dapat berbeda.

Rumus distribusi

Fungsi distribusi binomial dapat ditulis sebagai jumlah dari suku-suku berikut:

(n!/(n-k)!k!)*p k *q n-k

Di sini n adalah jumlah percobaan acak independen, p adalah jumlah hasil yang berhasil, q adalah jumlah hasil yang gagal, k adalah jumlah percobaan (dapat mengambil nilai dari 0 hingga n),! - penunjukan faktorial, fungsi suatu bilangan, yang nilainya sama dengan produk dari semua bilangan yang naik ke atasnya (misalnya, untuk bilangan 4: 4!=1*2*3*4= 24).

Selain itu, fungsi distribusi binomial dapat ditulis sebagai fungsi beta tidak lengkap. Namun, ini sudah merupakan definisi yang lebih kompleks, yang hanya digunakan ketika memecahkan masalah statistik yang kompleks.

Distribusi binomial, contohnya yang telah kita bahas di atas, adalah salah satu jenis distribusi paling sederhana dalam teori probabilitas. Ada juga distribusi normal, yang merupakan jenis distribusi binomial. Ini adalah yang paling umum digunakan, dan paling mudah untuk dihitung. Ada juga distribusi Bernoulli, distribusi Poisson, distribusi bersyarat. Semuanya mencirikan secara grafis area probabilitas dari proses tertentu dalam kondisi yang berbeda.

Pada bagian selanjutnya, kita akan mempertimbangkan aspek-aspek yang terkait dengan penerapan peralatan matematika ini dalam kehidupan nyata. Sepintas, tentu saja, tampaknya ini adalah hal matematika lain, yang, seperti biasa, tidak menemukan aplikasi dalam kehidupan nyata, dan umumnya tidak diperlukan oleh siapa pun kecuali ahli matematika itu sendiri. Namun, ini tidak terjadi. Bagaimanapun, semua jenis distribusi dan representasi grafisnya dibuat semata-mata untuk tujuan praktis, dan bukan sebagai keinginan ilmuwan.

Aplikasi

Sejauh ini aplikasi distribusi yang paling penting adalah dalam statistik, di mana analisis kompleks dari banyak data diperlukan. Seperti yang diperlihatkan oleh praktik, sangat banyak larik data memiliki distribusi nilai yang kira-kira sama: daerah kritis dengan nilai yang sangat rendah dan sangat tinggi, sebagai aturan, mengandung lebih sedikit elemen daripada nilai rata-rata.

Analisis array data yang besar diperlukan tidak hanya dalam statistik. Ini sangat diperlukan, misalnya, dalam kimia fisik. Dalam ilmu ini, digunakan untuk menentukan banyak kuantitas yang terkait dengan getaran acak dan pergerakan atom dan molekul.

Pada bagian selanjutnya, kita akan memahami betapa pentingnya menerapkan konsep statistik seperti binomial distribusi variabel acak dalam kehidupan sehari-hari untuk Anda dan saya.

Mengapa saya membutuhkannya?

Banyak orang bertanya pada diri sendiri pertanyaan ini ketika datang ke matematika. Dan omong-omong, matematika tidak sia-sia disebut ratu sains. Ini adalah dasar fisika, kimia, biologi, ekonomi, dan dalam masing-masing ilmu ini, beberapa jenis distribusi juga digunakan: apakah itu distribusi binomial diskrit atau distribusi normal, itu tidak masalah. Dan jika kita melihat lebih dekat pada dunia di sekitar kita, kita akan melihat bahwa matematika digunakan di mana-mana: dalam kehidupan sehari-hari, di tempat kerja, dan bahkan hubungan manusia dapat disajikan dalam bentuk data statistik dan dianalisis (omong-omong, ini , dilakukan oleh mereka yang bekerja di organisasi khusus yang terlibat dalam pengumpulan informasi).

Sekarang mari kita bicara sedikit tentang apa yang harus dilakukan jika Anda perlu tahu lebih banyak tentang topik ini daripada apa yang telah kami uraikan dalam artikel ini.

Informasi yang kami berikan dalam artikel ini masih jauh dari lengkap. Ada banyak nuansa tentang bentuk distribusi yang mungkin diambil. Distribusi binomial, seperti yang telah kita ketahui, adalah salah satu jenis utama yang menjadi dasar semua statistik matematika dan teori probabilitas.

Jika Anda tertarik, atau sehubungan dengan pekerjaan Anda, Anda perlu tahu lebih banyak tentang topik ini, Anda perlu mempelajari literatur khusus. Anda harus mulai dengan kursus universitas dalam analisis matematika dan pergi ke sana ke bagian teori probabilitas. Pengetahuan di bidang deret juga akan bermanfaat, karena distribusi peluang binomial tidak lebih dari deret suku-suku yang berurutan.

Kesimpulan

Sebelum menyelesaikan artikel, kami ingin memberi tahu Anda satu hal lagi yang menarik. Ini menyangkut langsung topik artikel kami dan semua matematika secara umum.

Banyak orang mengatakan bahwa matematika adalah ilmu yang tidak berguna, dan tidak ada yang mereka pelajari di sekolah yang berguna bagi mereka. Tetapi pengetahuan tidak pernah berlebihan, dan jika sesuatu tidak berguna bagi Anda dalam hidup, itu berarti Anda tidak mengingatnya. Jika Anda memiliki pengetahuan, mereka dapat membantu Anda, tetapi jika Anda tidak memilikinya, maka Anda tidak dapat mengharapkan bantuan dari mereka.

Jadi, kami memeriksa konsep distribusi binomial dan semua definisi yang terkait dengannya dan berbicara tentang bagaimana itu diterapkan dalam kehidupan kita.

Bab 7

Hukum khusus distribusi variabel acak

Jenis hukum distribusi variabel acak diskrit

Biarkan variabel acak diskrit mengambil nilainya X 1 , X 2 , …, x n, … . Probabilitas dari nilai-nilai tersebut dapat dihitung dengan menggunakan berbagai rumus, misalnya menggunakan teorema dasar teori probabilitas, rumus Bernoulli, atau beberapa rumus lainnya. Untuk beberapa rumus ini, hukum distribusi memiliki namanya sendiri.

Hukum distribusi yang paling umum dari variabel acak diskrit adalah binomial, geometris, hipergeometrik, hukum distribusi Poisson.

Hukum distribusi binomial

Biarkan itu diproduksi n percobaan independen, di mana masing-masing peristiwa mungkin atau mungkin tidak terjadi TETAPI. Probabilitas terjadinya peristiwa ini dalam setiap percobaan tunggal adalah konstan, tidak bergantung pada nomor percobaan dan sama dengan R=R(TETAPI). Maka peluang kejadian tersebut tidak akan terjadi TETAPI dalam setiap pengujian juga konstan dan sama dengan q=1–R. Pertimbangkan variabel acak X sama dengan jumlah kemunculan peristiwa TETAPI di n tes. Jelas bahwa nilai kuantitas ini sama dengan

X 1 =0 - acara TETAPI di n tes tidak muncul;

X 2 = 1 – peristiwa TETAPI di n cobaan muncul sekali;

X 3 =2 - peristiwa TETAPI di n percobaan muncul dua kali;

…………………………………………………………..

x n +1 = n- peristiwa TETAPI di n tes muncul semuanya n sekali.

Probabilitas nilai-nilai ini dapat dihitung menggunakan rumus Bernoulli (4.1):

di mana ke=0, 1, 2, …,n .

Hukum distribusi binomial X sama dengan jumlah keberhasilan dalam n Percobaan Bernoulli, dengan kemungkinan sukses R.

Jadi, suatu peubah acak diskrit memiliki distribusi binomial (atau terdistribusi menurut hukum binomial) jika kemungkinan nilainya adalah 0, 1, 2, …, n, dan probabilitas yang sesuai dihitung dengan rumus (7.1).

Distribusi binomial bergantung pada dua parameter R dan n.

Deret distribusi variabel acak yang didistribusikan menurut hukum binomial memiliki bentuk:

X k n
R

Contoh 7.1 . Tiga tembakan independen ditembakkan ke sasaran. Probabilitas memukul setiap tembakan adalah 0,4. Nilai acak X- jumlah hit pada target. Bangun seri distribusinya.

Keputusan. Nilai yang mungkin dari variabel acak X adalah X 1 =0; X 2 =1; X 3 =2; X 4=3. Temukan probabilitas yang sesuai dengan menggunakan rumus Bernoulli. Sangat mudah untuk menunjukkan bahwa penerapan rumus ini di sini sepenuhnya dibenarkan. Perhatikan bahwa probabilitas tidak mengenai target dengan satu tembakan akan sama dengan 1-0.4=0.6. Mendapatkan

Seri distribusi memiliki bentuk sebagai berikut:

X
R 0,216 0,432 0,288 0,064

Sangat mudah untuk memeriksa bahwa jumlah semua probabilitas sama dengan 1. Variabel acak itu sendiri X didistribusikan menurut hukum binomial.

Mari kita cari ekspektasi matematis dan varians dari variabel acak yang terdistribusi menurut hukum binomial.

Saat menyelesaikan contoh 6.5, ditunjukkan bahwa ekspektasi matematis dari jumlah kemunculan suatu peristiwa TETAPI di n tes independen, jika probabilitas terjadinya TETAPI dalam setiap tes adalah konstan dan sama R, sama dengan n· R

Dalam contoh ini, variabel acak digunakan, didistribusikan menurut hukum binomial. Oleh karena itu, solusi Contoh 6.5 sebenarnya adalah bukti dari teorema berikut.

Teorema 7.1. Ekspektasi matematis dari variabel acak diskrit yang didistribusikan menurut hukum binomial sama dengan produk dari jumlah percobaan dan probabilitas "berhasil", yaitu. M(X)=n· R.

Teorema 7.2. Varians dari variabel acak diskrit yang didistribusikan menurut hukum binomial sama dengan produk dari jumlah percobaan dengan probabilitas "berhasil" dan probabilitas "gagal", yaitu D(X)=npq.

Kemiringan dan kurtosis dari variabel acak yang didistribusikan menurut hukum binomial ditentukan oleh rumus

Rumus ini dapat diperoleh dengan menggunakan konsep momen awal dan momen pusat.

Hukum distribusi binomial mendasari banyak situasi nyata. Untuk nilai besar n distribusi binomial dapat didekati dengan menggunakan distribusi lain, khususnya menggunakan distribusi Poisson.

distribusi racun

Biarkanlah terjadi begitu n Percobaan Bernoulli, dengan jumlah percobaan n cukup besar. Sebelumnya, ditunjukkan bahwa dalam kasus ini (jika, sebagai tambahan, probabilitas R acara TETAPI sangat kecil) untuk mencari peluang suatu kejadian TETAPI muncul t sekali dalam pengujian, Anda dapat menggunakan rumus Poisson (4.9). Jika variabel acak X berarti jumlah kemunculan peristiwa TETAPI di n percobaan Bernoulli, maka probabilitas bahwa X akan mengambil artinya k dapat dihitung dengan rumus

, (7.2)

di mana λ = tidak.

Hukum distribusi poisson disebut distribusi variabel acak diskrit X, di mana nilai yang mungkin adalah bilangan bulat non-negatif, dan probabilitas p t nilai-nilai ini ditemukan dengan rumus (7.2).

Nilai λ = tidak ditelepon parameter Distribusi racun.

Sebuah variabel acak yang didistribusikan menurut hukum Poisson dapat mengambil jumlah nilai yang tak terbatas. Karena untuk distribusi ini peluangnya R terjadinya suatu peristiwa dalam setiap percobaan kecil, maka distribusi ini kadang-kadang disebut hukum fenomena langka.

Deret distribusi variabel acak yang didistribusikan menurut hukum Poisson memiliki bentuk:

X t
R

Sangat mudah untuk memverifikasi bahwa jumlah dari peluang baris kedua sama dengan 1. Untuk melakukan ini, kita perlu mengingat bahwa fungsi dapat diperluas dalam deret Maclaurin, yang konvergen untuk sembarang X. Dalam hal ini kita memiliki

. (7.3)

Sebagaimana dicatat, hukum Poisson dalam kasus-kasus tertentu yang membatasi menggantikan hukum binomial. Contohnya adalah variabel acak X, yang nilainya sama dengan jumlah kegagalan untuk jangka waktu tertentu dengan penggunaan perangkat teknis berulang kali. Diasumsikan bahwa perangkat ini memiliki keandalan tinggi, mis. kemungkinan kegagalan dalam satu aplikasi sangat kecil.

Selain kasus pembatas seperti itu, dalam praktiknya ada variabel acak yang didistribusikan menurut hukum Poisson, tidak terkait dengan distribusi binomial. Sebagai contoh, distribusi Poisson sering digunakan ketika berhadapan dengan jumlah kejadian yang terjadi dalam suatu periode waktu (jumlah panggilan ke sentral telepon selama satu jam, jumlah mobil yang tiba di tempat pencucian mobil pada siang hari, jumlah mesin berhenti per minggu, dll.). Semua peristiwa ini harus membentuk apa yang disebut aliran peristiwa, yang merupakan salah satu konsep dasar teori antrian. Parameter λ mencirikan intensitas rata-rata aliran peristiwa.

Contoh 7.2 . Fakultas ini memiliki 500 mahasiswa. Berapa peluang bahwa tanggal 1 September adalah hari ulang tahun ketiga mahasiswa fakultas tersebut?

Keputusan . Karena banyaknya siswa n=500 cukup besar dan R– peluang lahir pada tanggal 1 September dari salah satu siswa adalah , mis. cukup kecil, maka kita dapat mengasumsikan bahwa variabel acak X– jumlah siswa yang lahir pada tanggal 1 September didistribusikan menurut hukum Poisson dengan parameter λ = np= = 1.36986. Kemudian, menurut rumus (7.2), kita peroleh

Teorema 7.3. Biarkan variabel acak X didistribusikan menurut hukum Poisson. Maka ekspektasi matematis dan variansnya sama satu sama lain dan sama dengan nilai parameter λ , yaitu M(X) = D(X) = λ = np.

Bukti. Dengan definisi ekspektasi matematis, dengan menggunakan rumus (7.3) dan deret distribusi variabel acak yang terdistribusi menurut hukum Poisson, kita peroleh

Sebelum menemukan varians, pertama-tama kita mencari ekspektasi matematis dari kuadrat dari variabel acak yang dipertimbangkan. Kita mendapatkan

Oleh karena itu, dengan definisi dispersi, kami memperoleh

Teorema telah terbukti.

Menerapkan konsep momen awal dan pusat, dapat ditunjukkan bahwa untuk variabel acak yang didistribusikan menurut hukum Poisson, koefisien skewness dan kurtosis ditentukan oleh rumus

Sangat mudah untuk memahami bahwa, karena konten semantik dari parameter λ = np positif, maka variabel acak yang terdistribusi menurut hukum Poisson selalu bernilai positif baik skewness maupun kurtosis.

Tidak semua fenomena diukur dalam skala kuantitatif seperti 1, 2, 3 ... 100500 ... Tidak selalu sebuah fenomena dapat mengambil keadaan yang berbeda tak terhingga atau dalam jumlah besar. Misalnya, jenis kelamin seseorang dapat berupa M atau F. Penembaknya mengenai sasaran atau meleset. Anda dapat memilih "Untuk" atau "Melawan", dll. dll. Dengan kata lain, data tersebut mencerminkan keadaan atribut alternatif - baik "ya" (peristiwa telah terjadi) atau "tidak" (peristiwa belum terjadi). Peristiwa yang akan datang (hasil positif) disebut juga "sukses".

Eksperimen dengan data seperti itu disebut Skema Bernoulli, untuk menghormati ahli matematika Swiss yang terkenal yang menemukan bahwa dengan sejumlah besar percobaan, rasio hasil positif terhadap jumlah percobaan cenderung terhadap kemungkinan terjadinya peristiwa ini.

Variabel Fitur Alternatif

Untuk menggunakan peralatan matematika dalam analisis, hasil pengamatan tersebut harus ditulis dalam bentuk numerik. Untuk melakukan ini, hasil positif diberi nomor 1, hasil negatif - 0. Dengan kata lain, kita berurusan dengan variabel yang hanya dapat mengambil dua nilai: 0 atau 1.

Manfaat apa yang bisa didapat dari ini? Bahkan, tidak kalah dari data biasa. Jadi, mudah untuk menghitung jumlah hasil positif - cukup untuk menjumlahkan semua nilai, mis. semua 1 (berhasil). Anda dapat melangkah lebih jauh, tetapi untuk ini Anda perlu memperkenalkan beberapa notasi.

Hal pertama yang perlu diperhatikan adalah bahwa hasil positif (yang sama dengan 1) memiliki beberapa kemungkinan untuk terjadi. Misalnya, mendapatkan kepala pada lemparan koin adalah atau 0,5. Probabilitas ini secara tradisional dilambangkan dengan huruf Latin p. Oleh karena itu, peluang terjadinya peristiwa alternatif adalah 1-p, yang juga dilambangkan dengan q, yaitu q = 1 – p. Penunjukan ini dapat disistematisasikan secara visual dalam bentuk pelat distribusi variabel X.

Kami mendapat daftar kemungkinan nilai dan probabilitasnya. bisa dihitung nilai yang diharapkan dan penyebaran. Harapannya adalah jumlah produk dari semua nilai yang mungkin dan probabilitas yang sesuai:

Mari kita hitung nilai yang diharapkan menggunakan notasi pada tabel di atas.

Ternyata harapan matematis dari tanda alternatif sama dengan probabilitas acara ini - p.

Sekarang mari kita definisikan apa varian dari fitur alternatif. Dispersi adalah kuadrat rata-rata deviasi dari ekspektasi matematis. Rumus umum (untuk data diskrit) adalah:

Oleh karena itu varians dari fitur alternatif:

Sangat mudah untuk melihat bahwa dispersi ini memiliki maksimum 0,25 (at p=0,5).

Standar deviasi - akar varians:

Nilai maksimum tidak melebihi 0,5.

Seperti yang Anda lihat, ekspektasi matematis dan varians dari tanda alternatif memiliki bentuk yang sangat kompak.

Distribusi binomial dari variabel acak

Mari kita lihat situasi dari sudut yang berbeda. Memang, siapa yang peduli bahwa rata-rata kehilangan kepala pada satu lemparan adalah 0,5? Bahkan tidak mungkin untuk dibayangkan. Lebih menarik untuk mengajukan pertanyaan tentang jumlah kepala yang muncul untuk sejumlah lemparan tertentu.

Dengan kata lain, peneliti sering tertarik pada probabilitas sejumlah peristiwa sukses yang terjadi. Ini dapat berupa jumlah produk cacat dalam lot yang diuji (1 - cacat, 0 - baik) atau jumlah pemulihan (1 - sehat, 0 - sakit), dll. Jumlah "keberhasilan" seperti itu akan sama dengan jumlah semua nilai variabel X, yaitu jumlah hasil tunggal.

Nilai acak B disebut binomial dan mengambil nilai dari 0 hingga n(pada B= 0 - semua bagian baik, dengan B = n- semua bagian rusak). Diasumsikan bahwa semua nilai x independen satu sama lain. Pertimbangkan karakteristik utama dari variabel binomial, yaitu, kami akan menetapkan ekspektasi matematis, varians, dan distribusinya.

Ekspektasi dari variabel binomial sangat mudah didapatkan. Ekspektasi matematis dari jumlah nilai adalah jumlah ekspektasi matematis dari setiap nilai tambah, dan sama untuk semua orang, oleh karena itu:

Misalnya, harapan jumlah kepala pada 100 pelemparan adalah 100 × 0,5 = 50.

Sekarang kita turunkan rumus untuk varians dari variabel binomial. Varians dari jumlah variabel acak independen adalah jumlah dari varians. Dari sini

Standar deviasi, masing-masing

Untuk 100 pelemparan koin, standar deviasi dari jumlah kepala adalah

Dan akhirnya, pertimbangkan distribusi kuantitas binomial, yaitu. peluang munculnya peubah acak B akan mengambil nilai yang berbeda k, di mana 0≤k≤n. Untuk sebuah koin, masalah ini mungkin terdengar seperti ini: berapa peluang mendapatkan 40 kepala dalam 100 kali pelemparan?

Untuk memahami cara perhitungannya, bayangkan saja sebuah koin dilempar hanya 4 kali. Kedua sisi bisa rontok setiap saat. Kami bertanya pada diri sendiri: berapa probabilitas mendapatkan 2 kepala dari 4 lemparan. Setiap lemparan tidak tergantung satu sama lain. Ini berarti bahwa probabilitas mendapatkan kombinasi apa pun akan sama dengan produk dari probabilitas hasil yang diberikan untuk setiap lemparan individu. Biarkan O menjadi kepala dan P menjadi ekor. Kemudian, misalnya, salah satu kombinasi yang cocok untuk kita mungkin terlihat seperti OOPP, yaitu:

Probabilitas kombinasi seperti itu sama dengan produk dari dua peluang muncul kepala dan dua lagi peluang tidak muncul kepala (kejadian sebaliknya dihitung sebagai 1-p), yaitu 0,5×0,5×(1-0,5)×(1-0,5)=0,0625. Ini adalah kemungkinan salah satu kombinasi yang cocok untuk kita. Tetapi pertanyaannya adalah tentang jumlah total elang, dan bukan tentang urutan tertentu. Maka Anda perlu menambahkan probabilitas semua kombinasi di mana tepat ada 2 elang. Jelas bahwa semuanya sama (produk tidak berubah dengan mengubah tempat faktor). Karena itu, Anda perlu menghitung jumlahnya, dan kemudian mengalikannya dengan probabilitas kombinasi tersebut. Mari kita hitung semua kombinasi 4 lemparan 2 elang: RROO, RORO, ROOR, ORRO, OROR, OORR. Hanya 6 pilihan.

Oleh karena itu, peluang yang diinginkan untuk mendapatkan 2 kepala setelah 4 lemparan adalah 6×0,0625=0,375.

Namun, menghitung dengan cara ini membosankan. Sudah untuk 10 koin, akan sangat sulit untuk mendapatkan jumlah total opsi dengan cara brute force. Oleh karena itu, orang pintar telah lama menemukan formula, yang dengannya mereka menghitung jumlah kombinasi yang berbeda dari n elemen oleh k, di mana n adalah jumlah elemen, k adalah jumlah elemen yang opsi pengaturannya dihitung. Rumus kombinasi dari n elemen oleh k adalah:

Hal serupa terjadi di bagian kombinatorik. Saya mengirim semua orang yang ingin meningkatkan pengetahuan mereka di sana. Oleh karena itu, omong-omong, nama distribusi binomial (rumus di atas adalah koefisien ekspansi binomial Newton).

Rumus untuk menentukan probabilitas dapat dengan mudah digeneralisasikan ke nomor berapa pun n dan k. Akibatnya, rumus distribusi binomial memiliki bentuk berikut.

Kalikan jumlah kombinasi yang cocok dengan probabilitas salah satunya.

Untuk penggunaan praktis, cukup mengetahui rumus distribusi binomial. Dan Anda mungkin tidak tahu - di bawah ini adalah cara menentukan probabilitas menggunakan Excel. Tapi lebih baik tahu.

Mari kita gunakan rumus ini untuk menghitung peluang mendapatkan 40 kepala dalam 100 kali lemparan:

Atau hanya 1,08%. Sebagai perbandingan, peluang ekspektasi matematis dari eksperimen ini, yaitu 50 kepala, adalah 7,96%. Probabilitas maksimum dari nilai binomial milik nilai yang sesuai dengan harapan matematis.

Menghitung probabilitas distribusi binomial di Excel

Jika Anda hanya menggunakan kertas dan kalkulator, maka perhitungan menggunakan rumus distribusi binomial, meskipun tidak ada integral, cukup sulit. Misalnya, nilai 100! - memiliki lebih dari 150 karakter. Sebelumnya, dan bahkan sekarang, rumus perkiraan digunakan untuk menghitung jumlah tersebut. Saat ini, disarankan untuk menggunakan perangkat lunak khusus, seperti MS Excel. Dengan demikian, setiap pengguna (bahkan seorang humanis oleh pendidikan) dapat dengan mudah menghitung probabilitas nilai variabel acak terdistribusi secara binomial.

Untuk mengkonsolidasikan materi, kami akan menggunakan Excel untuk sementara waktu sebagai kalkulator biasa, mis. Mari kita membuat perhitungan langkah demi langkah menggunakan rumus distribusi binomial. Mari kita hitung, misalnya, peluang mendapatkan 50 kepala. Di bawah ini adalah gambar dengan langkah-langkah perhitungan dan hasil akhir.

Seperti yang Anda lihat, hasil antara memiliki skala sedemikian rupa sehingga tidak sesuai dengan sel, meskipun fungsi sederhana dari jenis ini digunakan di mana-mana: FAKTOR (perhitungan faktorial), POWER (menaikkan angka ke pangkat), serta operator perkalian dan pembagian. Selain itu, perhitungan ini agak rumit, dalam hal apa pun itu tidak kompak, karena banyak sel yang terlibat. Dan ya, sulit untuk mengetahuinya.

Secara umum, Excel menyediakan fungsi siap pakai untuk menghitung probabilitas distribusi binomial. Fungsi tersebut disebut BINOM.DIST.

Jumlah keberhasilan adalah jumlah percobaan yang berhasil. Kami memiliki 50 dari mereka.

Jumlah percobaan - jumlah lemparan: 100 kali.

Kemungkinan Sukses – peluang mendapatkan kepala pada satu lemparan adalah 0,5.

Integral - baik 1 atau 0 ditunjukkan. Jika 0, maka probabilitas dihitung P(B=k); jika 1, maka fungsi distribusi binomial dihitung, yaitu jumlah semua peluang dari B=0 sebelum B=k inklusif.

Kami menekan OK dan kami mendapatkan hasil yang sama seperti di atas, hanya semuanya dihitung oleh satu fungsi.

Sangat nyaman. Demi percobaan, alih-alih parameter terakhir 0, kami menempatkan 1. Kami mendapatkan 0,5398. Ini berarti bahwa dalam 100 lemparan koin, kemungkinan mendapatkan kepala antara 0 dan 50 hampir 54%. Dan pada awalnya tampaknya itu harus 50%. Secara umum, perhitungan dilakukan dengan mudah dan cepat.

Seorang analis sejati harus memahami bagaimana fungsi berperilaku (apa distribusinya), jadi mari kita hitung probabilitas untuk semua nilai dari 0 hingga 100. Artinya, mari kita tanyakan pada diri kita sendiri: berapa probabilitas bahwa tidak ada seekor elang pun yang akan jatuh , bahwa 1 elang akan jatuh, 2, 3, 50, 90 atau 100. Perhitungannya ditunjukkan pada gambar berikut. Garis biru adalah distribusi binomial itu sendiri, titik merah adalah probabilitas untuk sejumlah keberhasilan tertentu k.

Mungkin ada yang bertanya, bukankah distribusi binomial mirip dengan... Ya, sangat mirip. Bahkan De Moivre (1733) mengatakan bahwa dengan sampel besar pendekatan distribusi binomial (saya tidak tahu apa namanya saat itu), tetapi tidak ada yang mendengarkannya. Hanya Gauss, dan kemudian Laplace, 60-70 tahun kemudian, yang menemukan kembali dan dengan cermat mempelajari hukum distribusi normal. Grafik di atas dengan jelas menunjukkan bahwa probabilitas maksimum jatuh pada ekspektasi matematis, dan ketika menyimpang darinya, itu menurun tajam. Sama seperti hukum biasa.

Distribusi binomial sangat penting secara praktis, cukup sering terjadi. Dengan menggunakan Excel, perhitungan dilakukan dengan mudah dan cepat.