Distribusi geometris. Distribusi diskrit di MS EXCEL

Statistik membantu kita dalam memecahkan banyak masalah, misalnya: ketika tidak mungkin membangun model deterministik, ketika ada terlalu banyak faktor, atau ketika kita perlu memperkirakan kemungkinan model yang dibangun dengan mempertimbangkan data yang tersedia. Hubungan dengan statistik adalah ambigu. Diyakini bahwa ada tiga jenis kebohongan: kebohongan, kebohongan terang-terangan, dan statistik. Di sisi lain, banyak "pengguna" statistik terlalu percaya, tidak sepenuhnya memahami cara kerjanya: menerapkan, misalnya, pengujian ke data apa pun tanpa memeriksa normalitasnya. Kelalaian semacam itu dapat menghasilkan kesalahan serius dan mengubah "penggemar" tes menjadi pembenci statistik. Mari kita coba menempatkan arus di atas i dan mencari tahu model variabel acak mana yang harus digunakan untuk menggambarkan fenomena tertentu dan jenis hubungan genetik apa yang ada di antara mereka.

Pertama-tama, materi ini akan menarik bagi siswa yang mempelajari teori probabilitas dan statistik, meskipun spesialis "dewasa" akan dapat menggunakannya sebagai referensi. Dalam salah satu karya berikut, saya akan menunjukkan contoh penggunaan statistik untuk membangun tes untuk menilai signifikansi indikator strategi perdagangan pertukaran.

Pekerjaan akan mempertimbangkan:


Di akhir artikel akan diberikan untuk refleksi. Saya akan membagikan pemikiran saya tentang ini di artikel saya berikutnya.

Beberapa distribusi kontinu yang diberikan adalah kasus khusus.

Distribusi diskrit

Distribusi diskrit digunakan untuk menggambarkan peristiwa dengan karakteristik yang tidak dapat dibedakan yang didefinisikan pada titik-titik yang terisolasi. Sederhananya, untuk acara yang hasilnya dapat dikaitkan dengan beberapa kategori terpisah: sukses atau gagal, bilangan bulat (misalnya, permainan roulette, dadu), kepala atau ekor, dll.

Distribusi diskrit digambarkan oleh probabilitas terjadinya masing-masing hasil yang mungkin dari suatu peristiwa. Adapun distribusi apapun (termasuk kontinu), konsep harapan dan varians didefinisikan untuk peristiwa diskrit. Namun, harus dipahami bahwa harapan untuk peristiwa acak diskrit umumnya tidak dapat direalisasikan sebagai hasil dari peristiwa acak tunggal, melainkan sebagai nilai di mana rata-rata aritmatika dari hasil peristiwa akan cenderung meningkat seiring dengan bertambahnya jumlah mereka.

Dalam pemodelan kejadian acak diskrit, kombinatorik memainkan peran penting, karena probabilitas hasil acara dapat didefinisikan sebagai rasio jumlah kombinasi yang memberikan hasil yang diinginkan dengan jumlah total kombinasi. Contoh: ada 3 bola putih dan 7 bola hitam di dalam keranjang. Ketika kita memilih 1 bola dari keranjang, kita dapat melakukannya dengan 10 cara berbeda (jumlah total kombinasi), tetapi hanya 3 cara di mana bola putih akan dipilih (3 kombinasi yang memberikan hasil yang diinginkan). Jadi, peluang terambilnya bola putih adalah: ().

Juga perlu dibedakan antara sampel dengan penggantian dan tanpa penggantian. Misalnya, untuk menggambarkan peluang terambilnya dua bola putih, penting untuk menentukan apakah bola pertama akan dikembalikan ke keranjang. Jika tidak, maka kita berurusan dengan sampel tanpa pengembalian () dan peluangnya adalah sebagai berikut: - peluang terambilnya bola putih dari sampel awal dikalikan peluang terambilnya bola putih lagi dari yang tersisa di keranjang . Jika bola pertama dikembalikan ke keranjang, maka ini adalah pengambilan kembali (). Dalam kasus ini, peluang terambilnya dua bola putih adalah .

Jika kita sedikit memformalkan contoh keranjang sebagai berikut: biarkan hasil dari suatu peristiwa mengambil salah satu dari dua nilai 0 atau 1 dengan probabilitas dan masing-masing, maka distribusi probabilitas untuk memperoleh masing-masing hasil yang diusulkan akan disebut distribusi Bernoulli :

Secara tradisional, hasil dengan nilai 1 disebut "sukses", dan hasil dengan nilai 0 disebut "kegagalan". Jelas bahwa memperoleh hasil "sukses atau gagal" terjadi dengan probabilitas .

Ekspektasi dan varians dari distribusi Bernoulli:


Jumlah keberhasilan dalam percobaan, yang hasilnya didistribusikan dengan probabilitas keberhasilan (contoh dengan mengembalikan bola ke keranjang), dijelaskan oleh distribusi binomial:


Dengan cara lain, kita dapat mengatakan bahwa distribusi binomial menggambarkan jumlah variabel acak independen yang dapat didistribusikan dengan probabilitas keberhasilan .
Harapan dan varians:



Distribusi binomial hanya berlaku untuk pengambilan sampel reentrant, yaitu ketika probabilitas keberhasilan tetap konstan untuk seluruh rangkaian percobaan.

Jika besaran dan memiliki distribusi binomial dengan parameter dan masing-masing, maka jumlah mereka juga akan didistribusikan secara binomial dengan parameter .

Bayangkan situasi di mana kita mengambil bola dari keranjang dan mengembalikannya kembali sampai bola putih diambil. Jumlah operasi tersebut dijelaskan oleh distribusi geometris. Dengan kata lain: distribusi geometrik menggambarkan jumlah percobaan ke keberhasilan pertama yang diberikan probabilitas keberhasilan dalam setiap percobaan. Jika jumlah percobaan di mana keberhasilan terjadi, maka distribusi geometrik akan dijelaskan dengan rumus berikut:


Harapan dan varians dari distribusi geometrik:

Distribusi geometrik secara genetik terkait dengan distribusi yang menggambarkan variabel acak kontinu: waktu sebelum suatu peristiwa, dengan intensitas peristiwa yang konstan. Distribusi geometrik juga merupakan kasus khusus.

Distribusi Pascal adalah generalisasi dari distribusi: ini menggambarkan distribusi jumlah kegagalan dalam percobaan independen, yang hasilnya didistribusikan di atas probabilitas keberhasilan sebelum jumlah keberhasilan. Untuk , kami memperoleh distribusi untuk kuantitas .


di mana adalah jumlah kombinasi dari ke .

Ekspektasi dan varians dari distribusi binomial negatif:



Jumlah variabel acak independen yang didistribusikan menurut Pascal juga didistribusikan menurut Pascal: biarkan memiliki distribusi , dan - . Biarkan juga independen, maka jumlah mereka akan memiliki distribusi

Sejauh ini, kita telah melihat contoh sampel reentrant, yaitu probabilitas hasil tidak berubah dari percobaan ke percobaan.

Sekarang pertimbangkan situasi tanpa pengembalian dan gambarkan probabilitas jumlah sampel yang berhasil dari populasi dengan jumlah keberhasilan dan kegagalan yang telah ditentukan sebelumnya (jumlah bola putih dan hitam yang telah ditentukan di keranjang, kartu truf di geladak, bagian yang rusak di permainan, dll).

Biarkan total koleksi berisi objek, yang diberi label sebagai "1" dan sebagai "0". Kami akan mempertimbangkan pemilihan objek dengan label "1" sebagai sukses, dan dengan label "0" sebagai kegagalan. Mari kita lakukan n tes, dan objek yang dipilih tidak akan lagi berpartisipasi dalam tes lebih lanjut. Probabilitas keberhasilan akan mengikuti distribusi hipergeometrik:


di mana adalah jumlah kombinasi dari ke .

Harapan dan varians:


distribusi racun


(diambil dari sini)

Distribusi Poisson berbeda secara signifikan dari distribusi yang dipertimbangkan di atas dalam area "subjeknya": sekarang bukan probabilitas hasil tes tertentu yang dipertimbangkan, tetapi intensitas kejadian, yaitu jumlah rata-rata kejadian per satuan waktu.

Distribusi Poisson menggambarkan probabilitas terjadinya peristiwa independen dari waktu ke waktu dengan intensitas rata-rata peristiwa:


Ekspektasi dan varians dari distribusi Poisson:

Varians dan mean dari distribusi Poisson identik sama.

Distribusi Poisson dalam kombinasi dengan , yang menggambarkan interval waktu antara permulaan peristiwa independen, membentuk dasar matematis dari teori keandalan.

Kerapatan probabilitas produk variabel acak x dan y () dengan distribusi dan dapat dihitung sebagai berikut:

Beberapa distribusi di bawah ini adalah kasus khusus dari distribusi Pearson, yang merupakan solusi dari persamaan:


dimana dan adalah parameter distribusi. Ada 12 jenis distribusi Pearson, tergantung pada nilai parameternya.

Distribusi yang akan dibahas pada bagian ini memiliki hubungan yang erat satu sama lain. Hubungan ini dinyatakan dalam kenyataan bahwa beberapa distribusi adalah kasus khusus dari distribusi lain, atau menggambarkan transformasi variabel acak dengan distribusi lain.

Diagram di bawah ini menunjukkan hubungan antara beberapa distribusi kontinu yang akan dibahas dalam makalah ini. Dalam diagram, panah padat menunjukkan transformasi variabel acak (awal panah menunjukkan distribusi awal, akhir panah - yang dihasilkan), dan panah putus-putus menunjukkan hubungan generalisasi (awal panah menunjukkan distribusi, yang merupakan kasus khusus dari yang ditunjukkan oleh akhir panah). Untuk kasus khusus dari distribusi Pearson di atas panah putus-putus, jenis yang sesuai dari distribusi Pearson ditunjukkan.


Gambaran distribusi yang ditawarkan di bawah ini mencakup banyak kasus yang terjadi dalam analisis data dan pemodelan proses, meskipun, tentu saja, tidak memuat secara mutlak semua distribusi yang diketahui sains.

Distribusi normal (distribusi Gaussian)


(diambil dari sini)

Kepadatan probabilitas dari distribusi normal dengan parameter dan dijelaskan oleh fungsi Gaussian:

Jika dan , maka distribusi seperti itu disebut standar.

Harapan dan varians dari distribusi normal:



Domain definisi distribusi normal adalah himpunan bilangan real.

Distribusi normal adalah distribusi tipe VI.

Jumlah kuadrat dari nilai normal independen , dan rasio nilai Gaussian independen didistribusikan .

Distribusi normal habis dibagi: jumlah jumlah terdistribusi normal dan dengan parameter dan masing-masing juga memiliki distribusi normal dengan parameter , Dimana dan .

Sumur distribusi normal memodelkan besaran yang menggambarkan fenomena alam, kebisingan yang bersifat termodinamika, dan kesalahan pengukuran.

Selain itu, menurut teorema limit pusat, jumlah dari sejumlah besar suku-suku bebas yang berorde sama konvergen ke distribusi normal, terlepas dari distribusi suku-sukunya. Karena sifat ini, distribusi normal populer dalam analisis statistik, banyak uji statistik dirancang untuk data terdistribusi normal.

Uji-z didasarkan pada pembagian tak terhingga dari distribusi normal. Tes ini digunakan untuk memeriksa apakah harapan sampel variabel terdistribusi normal sama dengan beberapa nilai. Nilai variansnya harus diketahui. Jika nilai varians tidak diketahui dan dihitung berdasarkan sampel yang dianalisis, maka dilakukan uji-t berdasarkan .

Mari kita memiliki sampel n nilai terdistribusi normal yang independen dari populasi umum dengan standar deviasi, mari kita berhipotesis bahwa . Maka nilai tersebut akan memiliki distribusi normal standar. Dengan membandingkan nilai z yang diperoleh dengan kuantil dari distribusi standar, seseorang dapat menerima atau menolak hipotesis dengan tingkat signifikansi yang diperlukan.

Karena prevalensi distribusi Gaussian, banyak peneliti yang tidak mengetahui statistik dengan baik lupa untuk memeriksa data untuk normalitas, atau mengevaluasi plot kepadatan distribusi "dengan mata", secara membabi buta percaya bahwa mereka berurusan dengan data Gaussian. Oleh karena itu, dengan berani menerapkan tes yang dirancang untuk distribusi normal dan mendapatkan hasil yang sepenuhnya salah. Mungkin, dari sinilah muncul rumor tentang statistik sebagai jenis kebohongan yang paling mengerikan.

Pertimbangkan sebuah contoh: kita perlu mengukur resistansi satu set resistor dengan nilai tertentu. Resistansi memiliki sifat fisik, maka logis untuk mengasumsikan bahwa distribusi penyimpangan resistansi dari nilai nominal akan normal. Kami mengukur, kami mendapatkan fungsi kepadatan probabilitas berbentuk lonceng untuk nilai yang diukur dengan mode di sekitar peringkat resistor. Apakah ini distribusi normal? Jika ya, maka kita akan mencari resistor yang rusak menggunakan , atau uji-z jika kita mengetahui varians distribusi terlebih dahulu. Saya pikir banyak yang akan melakukan hal itu.

Tapi mari kita lihat lebih dekat teknologi pengukuran resistansi: resistansi didefinisikan sebagai rasio tegangan yang diterapkan terhadap aliran arus. Kami mengukur arus dan tegangan dengan instrumen, yang, pada gilirannya, memiliki kesalahan terdistribusi normal. Artinya, nilai terukur arus dan tegangan adalah variabel acak terdistribusi normal dengan harapan matematis yang sesuai dengan nilai sebenarnya dari besaran yang diukur. Dan ini berarti bahwa nilai resistansi yang diperoleh didistribusikan bersama, dan tidak menurut Gauss.

Distribusi menggambarkan jumlah kuadrat dari variabel acak, yang masing-masing didistribusikan menurut hukum normal standar:

Dimana adalah jumlah derajat kebebasan, .

Harapan dan varians dari distribusi:



Domain definisi adalah himpunan bilangan asli non-negatif. adalah distribusi tak terhingga yang habis dibagi. Jika dan - masing-masing terdistribusi pada dan memiliki dan derajat kebebasan, maka jumlah mereka juga akan terdistribusi pada dan memiliki derajat kebebasan.

Ini adalah kasus khusus (dan karena itu distribusi tipe III) dan generalisasi. Rasio jumlah yang didistribusikan lebih didistribusikan.

Uji kecocokan Pearson didasarkan pada distribusi. Kriteria ini dapat digunakan untuk memeriksa apakah sampel variabel acak termasuk dalam distribusi teoretis tertentu.

Misalkan kita memiliki sampel dari beberapa variabel acak . Berdasarkan sampel ini, kami menghitung probabilitas bahwa nilai akan jatuh ke dalam interval (). Biarkan juga ada asumsi tentang ekspresi analitis dari distribusi, yang menurutnya, probabilitas jatuh ke dalam interval yang dipilih harus . Kemudian kuantitas akan didistribusikan sesuai dengan hukum normal.

Kami membawa ke distribusi normal standar: ,
dimana dan .

Kuantitas yang diperoleh memiliki distribusi normal dengan parameter (0, 1), dan oleh karena itu, jumlah kuadratnya didistribusikan dengan derajat kebebasan. Penurunan derajat kebebasan dikaitkan dengan pembatasan tambahan pada jumlah probabilitas nilai yang jatuh ke dalam interval: itu harus sama dengan 1.

Dengan membandingkan nilai dengan kuantil distribusi, seseorang dapat menerima atau menolak hipotesis tentang distribusi teoritis data dengan tingkat signifikansi yang diperlukan.

Distribusi Student digunakan untuk melakukan uji-t: uji kesetaraan nilai harapan sampel variabel acak terdistribusi dengan nilai tertentu, atau persamaan nilai harapan dua sampel dengan varians yang sama ( kesetaraan varians harus diperiksa). Distribusi-t Student menggambarkan rasio variabel acak terdistribusi dengan nilai yang terdistribusi di atas .

Membiarkan dan menjadi variabel acak independen dengan derajat kebebasan dan masing-masing. Maka kuantitas akan memiliki distribusi Fisher dengan derajat kebebasan, dan kuantitas akan memiliki distribusi Fisher dengan derajat kebebasan.
Distribusi Fisher didefinisikan untuk argumen non-negatif nyata dan memiliki kepadatan probabilitas:


Ekspektasi dan varians dari distribusi Fisher:



Harapan didefinisikan untuk dan varians didefinisikan untuk .

Sejumlah uji statistik didasarkan pada distribusi Fisher, seperti penilaian signifikansi parameter regresi, uji heteroskedastisitas, dan uji kesetaraan varians sampel (uji-f, untuk membedakan dari tepat tes nelayan).

Uji-F: biarkan ada dua sampel independen dan volume data terdistribusi dan masing-masing. Mari kita mengajukan hipotesis tentang kesetaraan varians sampel dan mengujinya secara statistik.

Mari kita hitung nilainya. Ini akan memiliki distribusi Fisher dengan derajat kebebasan.

Dengan membandingkan nilai dengan kuantil dari distribusi Fisher yang sesuai, kita dapat menerima atau menolak hipotesis bahwa varians sampel sama dengan tingkat signifikansi yang disyaratkan.

Distribusi eksponensial (eksponensial) dan distribusi Laplace (eksponensial ganda, eksponensial ganda)


(diambil dari sini)

Distribusi eksponensial menggambarkan interval waktu antara peristiwa independen yang terjadi pada intensitas rata-rata. Banyaknya kejadian seperti itu selama periode waktu tertentu digambarkan dengan diskrit. Distribusi eksponensial bersama-sama membentuk dasar matematis dari teori reliabilitas.

Selain teori keandalan, distribusi eksponensial digunakan dalam deskripsi fenomena sosial, dalam ekonomi, dalam teori antrian, dalam logistik transportasi - di mana pun diperlukan untuk memodelkan aliran peristiwa.

Distribusi eksponensial adalah kasus khusus (untuk n=2), dan karenanya . Karena besaran yang terdistribusi secara eksponensial adalah besaran chi-kuadrat dengan 2 derajat kebebasan, maka besaran tersebut dapat diinterpretasikan sebagai jumlah kuadrat dari dua besaran bebas yang terdistribusi normal.

Juga, distribusi eksponensial adalah kasus yang jujur

Biarkan target ditembakkan sebelum pukulan pertama, dengan kemungkinan p mengenai sasaran dalam setiap tembakan adalah sama dan tidak bergantung pada hasil tembakan sebelumnya. Dengan kata lain, skema Bernoulli diimplementasikan dalam eksperimen yang sedang dipertimbangkan. Sebagai variabel acak X kita akan mempertimbangkan jumlah tembakan yang ditembakkan. Jelas, nilai yang mungkin dari variabel acak X adalah bilangan asli: x 1 =1, x 2 = 2, ... maka peluang k tembakan akan sama dengan

Memasukkan ke dalam rumus ini k= 1,2, ... kita mendapatkan deret geometri dengan suku pertama p dan pengganda q:

Untuk alasan ini, distribusi yang ditentukan oleh rumus (6.11) disebut geometris .

Dengan menggunakan rumus untuk jumlah deret geometri yang menurun tak terhingga, mudah untuk memverifikasi bahwa

.

Mari kita cari karakteristik numerik dari distribusi geometrik.

Dengan definisi ekspektasi matematis untuk DSW, kita memiliki:

.

Kami menghitung dispersi dengan rumus

.

Untuk ini kami menemukan

.

Karena itu,

.

Jadi, ekspektasi matematis dan varians dari distribusi geometrik adalah

. (6.12)

6.4.* Fungsi pembangkit

Ketika memecahkan masalah yang berkaitan dengan DSV, metode kombinatorik sering digunakan. Salah satu metode teoretis analisis kombinatorial yang paling berkembang adalah metode pembangkitan fungsi, yang merupakan salah satu metode paling kuat dalam aplikasi. Mari kita mengenalnya secara singkat.

Jika variabel acak hanya mengambil nilai integer non-negatif, mis.

,

kemudian fungsi pembangkit distribusi probabilitas variabel acak disebut fungsi

, (6.13)

di mana z adalah variabel nyata atau kompleks. Perhatikan bahwa antara himpunan fungsi pembangkit  ( x)dan banyak distribusi(P(= k)} ada korespondensi satu-satu.

Biarkan variabel acak memiliki distribusi binomial

.

Kemudian, dengan menggunakan rumus binomial Newton, kita peroleh

,

itu. fungsi pembangkit dari distribusi binomial memiliki bentuk

. (6.14)

Tambahan. Fungsi pembangkit distribusi Poisson

memiliki bentuk

. (6.15)

Fungsi pembangkitan distribusi geometrik

memiliki bentuk

. (6.16)

Dengan bantuan fungsi pembangkit, akan lebih mudah untuk menemukan karakteristik numerik utama DSW. Misalnya, momen awal pertama dan kedua terkait dengan fungsi pembangkit dengan persamaan berikut:

, (6.17)

. (6.18)

Metoda fungsi pembangkit seringkali mudah karena dalam beberapa kasus fungsi distribusi DSW sangat sulit ditentukan, sedangkan fungsi pembangkit terkadang mudah ditemukan. Misalnya, pertimbangkan skema percobaan Bernoulli independen berturut-turut, tetapi kami akan membuat satu perubahan padanya. Misalkan peluang kejadian A bervariasi dari tes ke tes. Ini berarti bahwa rumus Bernoulli untuk skema seperti itu menjadi tidak dapat diterapkan. Tugas menemukan fungsi distribusi dalam kasus ini menghadirkan kesulitan yang cukup besar. Namun, untuk rangkaian tertentu, fungsi pembangkit mudah ditemukan, dan, akibatnya, karakteristik numerik yang sesuai juga mudah ditemukan.

Meluasnya penggunaan fungsi pembangkit didasarkan pada fakta bahwa studi jumlah variabel acak dapat digantikan oleh studi produk dari fungsi pembangkit yang sesuai. Jadi, jika 1 , 2 , …, n mandiri, maka

Biarlah p k =P k (A) adalah probabilitas "berhasil" dalam k-tes dalam skema Bernoulli (masing-masing, q k =1–p k- probabilitas "kegagalan" di k tes th). Kemudian, sesuai dengan rumus (6.19), fungsi pembangkit akan berbentuk

. (6.20)

Dengan menggunakan fungsi pembangkit ini, kita dapat menulis

.

Di sini diperhitungkan bahwa p k + q k=1. Sekarang, dengan menggunakan rumus (6.1), kita menemukan momen awal kedua. Untuk melakukan ini, pertama-tama kita menghitung

dan
.

Dalam kasus tertentu p 1 =p 2 =…=p n =p(yaitu dalam kasus distribusi binomial) diperoleh rumus bahwa M= np, D= npq.

Pada distribusi geometrik, percobaan dalam skema Bernoulli dilakukan sampai keberhasilan pertama, dengan probabilitas keberhasilan p dalam satu percobaan.
Contoh nilai tersebut dapat berupa:

  • jumlah tembakan sebelum pukulan pertama;
  • jumlah pengujian perangkat sebelum kegagalan pertama;
  • jumlah bola sebelum munculnya putih pertama. lihat solusi;
  • jumlah pelemparan koin sebelum ekor pertama, dll.
Deret distribusi geometrik DSW berbentuk:
X 1 2 3 m
p p qp q 2 p q m-1 p

Peluang membentuk barisan geometri dengan suku pertama p dan penyebut q.
Ekspektasi matematis dan varians dari variabel acak X, yang memiliki distribusi geometrik dengan parameter p, adalah sama dengan:

Distribusi hipergeometrik

Sebuah variabel acak diskrit memiliki distribusi hipergeometrik dengan parameter n, k, m jika mengambil nilai 0, 1, 2, ... dengan probabilitas .
Distribusi hipergeometrik memiliki variabel acak X sama dengan jumlah objek dengan properti tertentu di antara m objek yang diekstraksi secara acak (tanpa pengembalian) dari sekumpulan n objek, k di antaranya memiliki properti ini.
Sebagai contoh:
  • Dalam batch 10 bagian, 3 rusak. 4 item dihapus. X adalah jumlah bagian yang baik di antara yang diekstraksi. (m = 4, n = 10, k = 3). lihat solusi
Ekspektasi matematis dari variabel acak X, yang memiliki distribusi hipergeometrik, dan variansnya sama dengan:

Contoh 1. Sebuah guci berisi 2 bola putih dan 3 bola hitam. Bola diambil secara acak dari guci tanpa pengembalian sampai muncul bola putih. Begitu ini terjadi, prosesnya berhenti. Buatlah tabel distribusi variabel acak X - jumlah percobaan yang dilakukan, temukan F(x), P(X 2), M(X), D(X).
Keputusan: Dilambangkan dengan A - munculnya bola putih. Eksperimen hanya dapat dilakukan satu kali jika bola putih segera muncul: . Jika pertama kali bola putih tidak muncul, tetapi muncul pada ekstraksi kedua, maka X=2. Peluang kejadian seperti itu adalah . Demikian pula: , , . Mari kita menulis data ke tabel:


X

1

2

3

4

P

0,4

0,3

0,2

0,1

Temukan F(x):

Tentukan P(X 2) = P(X = 1 atau X = 2) = 0,4 + 0,3 = 0,7
M(X) = 1 0.4 + 2 0.3 + 3 0.2 + 4 0.1 = 2.
D(X) = (1-2) 2 0,4 + (2-2) 2 0,3 + (3-2) 2 0,2 ​​+ (4-2) 2 0,1 = 1 .

Contoh #2. Kotak itu berisi 11 bagian, 5 di antaranya rusak. Assembler mengambil 4 buah secara acak.
1. Temukan probabilitas bahwa di antara bagian yang diekstraksi: sebuah) 4 rusak; b) satu rusak; c) dua cacat; d) setidaknya satu rusak.
2. Buatlah hukum distribusi variabel acak X- jumlah bagian yang rusak di antara yang diekstraksi.
3. Temukan M(X), D(X), (X).
4. Hitung P(1
Keputusan:
1. Temukan probabilitas bahwa di antara bagian yang diekstraksi:
sebuah) 4 cacat;

b) satu rusak;
Jumlah total hasil unsur yang mungkin untuk percobaan ini sama dengan jumlah cara di mana 4 bagian dari 11 dapat diekstraksi:

Mari kita hitung jumlah hasil yang mendukung peristiwa ini (di antara 4 bagian, tepat 1 bagian rusak):

3 bagian yang tersisa dapat dipilih dari 7:

Oleh karena itu, jumlah hasil yang menguntungkan adalah: 5*20 = 100
Probabilitas yang diinginkan sama dengan rasio jumlah hasil yang mendukung peristiwa dengan jumlah semua hasil dasar: P(1) = 100/330 = 0,303
c) dua cacat;

d) setidaknya satu rusak.
Probabilitas bahwa tidak ada bagian yang rusak. X = 0.

Maka peluang paling sedikit satu cacat adalah:
P = 1 - P(0) = 1 - 0,0455 = 0,95

2. Tulis hukum distribusi P(x), X - jumlah bagian yang rusak di antara yang diekstraksi.
Tentukan peluang tiga produk cacat.


X

0

1

2

3

4

P

0,0455

0,303

0,4545

0,182

0,015

2. Temukan M(X), D(X),(X).
Harapan matematis ditemukan dengan rumus m = x i p i .
Ekspektasi matematis M[X].
M[x] = 0*0.0455 + 1*0.303 + 2*0.4545 + 3*0.182 + 4*0.015 = 1.818
Dispersi ditemukan dengan rumus d = x 2 i p i - M[x] 2 .
Dispersi D[X].
D[X] = 0 2 *0.0455 + 1 2 *0.303 + 2 2 *0.4545 + 3 2 *0.182 + 4 2 *0.015 - 1.818 2 = 0.694
Simpangan baku (x).

3. Hitung P(1 F(x≤0) = 0
F(0< x ≤1) = 0.0455
F(1< x ≤2) = 0.303 + 0.0455 = 0.349
F(2< x ≤3) = 0.455 + 0.349 = 0.803
P(3< x ≤4) = 0.182 + 0.803 = 0.985
F(x>4) = 1
Probabilitas SW jatuh ke dalam interval tertentu ditemukan dengan rumus:
P(a X< b) = F(b) - F(a)
Tentukan peluang SW berada pada selang 1 X< 4
P(1 X< 4) = F(4) - F(1) = 0.985 - 0.0455 = 0.9395

Contoh #3. Ada 7 bagian dalam lot, 3 rusak. Pengendali mengambil 4 bagian secara acak. Buat hukum distribusi untuk variabel acak X - jumlah bagian yang baik dalam sampel. Temukan ekspektasi matematis dan varians X. Gambarkan fungsi distribusinya.
Total bagian yang bagus: 7-3 = 4
1. Temukan probabilitas bahwa di antara 4 bagian yang dipilih, satu dapat diservis.
Jumlah total hasil elemen yang mungkin untuk percobaan ini sama dengan jumlah cara di mana 4 bagian dari 7 dapat diekstraksi:

Mari kita hitung jumlah hasil yang mendukung peristiwa ini.

Pertimbangkan distribusi Geometris, hitung ekspektasi matematis dan variansnya. Menggunakan fungsi MS EXCEL OTRBINOM.DIST(), kita akan memplot fungsi distribusi dan grafik kepadatan probabilitas.

Distribusi geometris(Bahasa inggris) Distribusi geometris) adalah kasus khusus (untuk r=1).

Biarkan tes dilakukan, di mana masing-masing hanya acara "sukses" yang dapat terjadi dengan probabilitas p atau acara "kegagalan" dengan probabilitas q =1-p().

Mari kita definisikan x sebagai nomor percobaan di mana itu terdaftar pertama kesuksesan. Dalam hal ini, variabel acak x akan memiliki Distribusi geometris:

Distribusi geometrik di MS EXCEL

Di MS EXCEL, mulai dari versi 2010, untuk Negatif Distribusi binomial ada fungsi NEGBINOM.DIST() , nama bahasa Inggris NEGBINOM.DIST(), yang memungkinkan Anda menghitung kemungkinan terjadinya jumlah kegagalan sampai diperoleh angka keberhasilan tertentu untuk probabilitas keberhasilan tertentu.

Untuk distribusi geometris argumen kedua untuk fungsi ini harus 1, karena kami hanya tertarik pada kesuksesan pertama.

Definisi ini agak berbeda dari yang di atas, yang menghitung probabilitas bahwa kesuksesan pertama terjadi setelah xtes. Perbedaannya bermuara pada kisaran perubahan jangkauan x: jika probabilitas didefinisikan dalam jumlah percobaan, maka X dapat mengambil nilai mulai dari 1, dan jika melalui jumlah kegagalan, maka mulai dari 0. Oleh karena itu, rumus berikut ini valid: p(x_ kegagalan)=p(x_ tes-satu). cm. contoh lembar file Contoh, di mana 2 metode perhitungan diberikan.

Pendekatan yang diambil dalam fungsi MS EXCEL digunakan di bawah ini: melalui jumlah kegagalan.

Menghitung fungsi kepadatan probabilitas p(x), lihat rumus di atas, Anda perlu mengatur argumen keempat dalam fungsi INTBINOM.DIST() menjadi FALSE. Menghitung , Anda harus menyetel argumen keempat ke TRUE.

Catatan : Sebelum MS EXCEL 2010, EXCEL memiliki fungsi INTERBINOMDIST() yang memungkinkan Anda menghitung saja kepadatan probabilitas. File sampel berisi rumus berdasarkan fungsi INTBINOMDIST() untuk menghitung fungsi distribusi integral. Ada juga rumus untuk menghitung probabilitas melalui definisi.

File contoh berisi grafik kepadatan distribusi probabilitas dan fungsi distribusi integral.

Catatan: Untuk kemudahan menulis rumus parameter p, a .

Catatan: Dalam fungsi DISTBINOM.DIST( ) dengan nilai bukan bilangan bulat X, . Misalnya, rumus berikut akan mengembalikan nilai yang sama:
DISTBINOM.DIST( 2 ; satu; 0.4; BENAR)=
DISTBINOM.DIST( 2,9 ; satu; 0.4; BENAR)

tugas

Solusi masalah diberikan dalam contoh file pada lembar Contoh.

Tugas 1. Sebuah perusahaan minyak mengebor sumur untuk mengekstraksi minyak. Peluang menemukan minyak di dalam sumur adalah 20%.
Berapa probabilitas bahwa minyak pertama akan diperoleh pada upaya ketiga?
Berapa peluang bahwa diperlukan tiga upaya untuk menemukan minyak pertama?
Solusi1:
=INTERBINOM.DIST(3-1, 1, 0.2, FALSE)
=INTERBINOM.DIST(3-1, 1, 0.2, TRUE)

Tugas2. Lembaga pemeringkat membuat survei acak orang yang lewat di kota tentang merek mobil favorit mereka. Perlu diketahui bahwa 1% warga memiliki mobil favorit Ladahibah. Berapa peluang Anda akan bertemu dengan pengagum pertama merek mobil ini setelah melakukan survei terhadap 10 orang?
Solusi2: \u003d OTRBINOM.DIST (10-1, 1, 0,01; BENAR)=9,56%

Kita dapat memilih hukum yang paling umum dari distribusi variabel acak diskrit:

  • Hukum distribusi binomial
  • hukum distribusi poisson
  • Hukum distribusi geometrik
  • Hukum distribusi hipergeometrik

Untuk distribusi variabel acak diskrit tertentu, perhitungan probabilitas nilainya, serta karakteristik numerik (harapan matematis, varians, dll.) dilakukan menurut "rumus" tertentu. Oleh karena itu, sangat penting untuk mengetahui jenis distribusi ini dan sifat dasarnya.


1. Hukum distribusi binomial.

Variabel acak diskrit $X$ tunduk pada distribusi probabilitas binomial jika mengambil nilai $0,\ 1,\ 2,\ \titik ,\ n$ dengan probabilitas $P\left(X=k\right)= C^k_n\cdot p^k\cdot (\left(1-p\right))^(n-k)$. Faktanya, variabel acak $X$ adalah jumlah kemunculan peristiwa $A$ dalam percobaan independen $n$. Hukum distribusi probabilitas untuk variabel acak $X$:

$\begin(array)(|c|c|)
\hline
X_i & 0 & 1 & \titik & n \\
\hline
p_i & P_n\kiri(0\kanan) & P_n\kiri(1\kanan) & \titik & P_n\kiri(n\kanan) \\
\hline
\end(array)$

Untuk variabel acak seperti itu, ekspektasinya adalah $M\left(X\right)=np$, variansnya adalah $D\left(X\right)=np\left(1-p\right)$.

Contoh . Ada dua anak dalam keluarga. Asumsikan peluang lahir seorang anak laki-laki dan perempuan sama dengan $0,5$, tentukan hukum distribusi variabel acak $\xi $ - jumlah anak laki-laki dalam keluarga.

Biarkan variabel acak $\xi $ menjadi jumlah anak laki-laki dalam keluarga. Nilai yang dapat diambil oleh $\xi:\ 0,\ ​​​​1,\ 2$. Probabilitas nilai-nilai ini dapat ditemukan dengan rumus $P\left(\xi =k\right)=C^k_n\cdot p^k\cdot (\left(1-p\right))^(n-k )$, di mana $n =2$ - jumlah percobaan independen, $p=0,5$ - probabilitas terjadinya suatu peristiwa dalam serangkaian percobaan $n$. Kita mendapatkan:

$P\left(\xi =0\right)=C^0_2\cdot (0.5)^0\cdot (\left(1-0.5\right))^(2-0)=(0, 5)^2 =0,25;$

$P\left(\xi =1\kanan)=C^1_2\cdot 0.5\cdot (\left(1-0.5\right))^(2-1)=2\cdot 0.5\ cdot 0.5=0.5;$

$P\left(\xi =2\right)=C^2_2\cdot (0,5)^2\cdot (\left(1-0,5\right))^(2-2)=(0, 5)^2=0,25.$

Maka hukum distribusi variabel acak $\xi $ adalah korespondensi antara nilai $0,\ 1,\ 2$ dan probabilitasnya, yaitu:

$\begin(array)(|c|c|)
\hline
\xi & 0 & 1 & 2 \\
\hline
P(\xi) & 0,25 & 0,5 & 0,25 \\
\hline
\end(array)$

Jumlah probabilitas dalam hukum distribusi harus sama dengan $1$, yaitu $\sum _(i=1)^(n)P(\xi _((\rm i)))=0.25+0.5+0, 25 = $1.

Ekspektasi $M\left(\xi \right)=np=2\cdot 0.5=1$, varians $D\left(\xi \right)=np\left(1-p\right)=2\ cdot 0.5\ cdot 0.5=0.5$, standar deviasi $\sigma \left(\xi \right)=\sqrt(D\left(\xi \right))=\sqrt(0.5 )\kira-kira $0.707.

2. Hukum distribusi Poisson.

Jika variabel acak diskrit $X$ hanya dapat mengambil nilai integer non-negatif $0,\ 1,\ 2,\ \titik ,\ n$ dengan probabilitas $P\left(X=k\right)=((( \lambda )^k )\over (k}\cdot e^{-\lambda }$, то говорят, что она подчинена закону распределения Пуассона с параметром $\lambda $. Для такой случайной величины математическое ожидание и дисперсия равны между собой и равны параметру $\lambda $, то есть $M\left(X\right)=D\left(X\right)=\lambda $.!}

Komentar. Keunikan dari distribusi ini adalah, berdasarkan data eksperimen, kita menemukan estimasi $M\left(X\right),\ D\left(X\right)$, jika estimasi yang diperoleh saling berdekatan, maka kita memiliki alasan untuk menyatakan bahwa variabel acak tunduk pada hukum distribusi Poisson.

Contoh . Contoh variabel acak yang tunduk pada hukum distribusi Poisson dapat berupa: jumlah mobil yang akan dilayani besok oleh pompa bensin; jumlah item yang cacat dalam produk yang diproduksi.

Contoh . Pabrik mengirim $500 produk ke pangkalan. Probabilitas kerusakan produk dalam perjalanan adalah $0,002$. Temukan hukum distribusi variabel acak $X$ sama dengan jumlah produk yang rusak; yang sama dengan $M\left(X\right),\ D\left(X\right)$.

Biarkan variabel acak diskrit $X$ menjadi jumlah produk yang rusak. Variabel acak seperti itu tunduk pada hukum distribusi Poisson dengan parameter $\lambda =np=500\cdot 0.002=1$. Probabilitas nilainya adalah $P\left(X=k\right)=(((\lambda )^k)\over (k}\cdot e^{-\lambda }$. Очевидно, что все вероятности всех значений $X=0,\ 1,\ \dots ,\ 500$ перечислить невозможно, поэтому мы ограничимся лишь первыми несколькими значениями.!}

$P\left(X=0\right)=((1^0)\over (0}\cdot e^{-1}=0,368;$!}

$P\left(X=1\right)=((1^1)\over (1}\cdot e^{-1}=0,368;$!}

$P\left(X=2\right)=((1^2)\over (2}\cdot e^{-1}=0,184;$!}

$P\left(X=3\right)=((1^3)\over (3}\cdot e^{-1}=0,061;$!}

$P\left(X=4\right)=((1^4)\over (4}\cdot e^{-1}=0,015;$!}

$P\left(X=5\right)=((1^5)\over (5}\cdot e^{-1}=0,003;$!}

$P\left(X=6\right)=((1^6)\over (6}\cdot e^{-1}=0,001;$!}

$P\left(X=k\right)=(((\lambda )^k)\over (k}\cdot e^{-\lambda }$!}

Hukum distribusi variabel acak $X$:

$\begin(array)(|c|c|)
\hline
X_i & 0 & 1 & 2 & 3 & 4 & 5 & 6 & ... & k \\
\hline
P_i & 0,368; & 0,368 & 0,184 & 0,061 & 0,015 & 0,003 & 0,001 & ... & (((\lambda )^k)\over (k}\cdot e^{-\lambda } \\!}
\hline
\end(array)$

Untuk variabel acak seperti itu, ekspektasi matematis dan variansnya sama satu sama lain dan sama dengan parameter $\lambda $, yaitu $M\left(X\right)=D\left(X\right)=\lambda =1 $.

3. Hukum distribusi geometrik.

Jika variabel acak diskrit $X$ hanya dapat mengambil nilai natural $1,\ 2,\ \titik ,\ n$ dengan probabilitas $P\left(X=k\right)=p(\left(1-p\ kanan)) ^(k-1),\ k=1,\ 2,\ 3,\ \titik $, maka kita katakan bahwa variabel acak $X$ tunduk pada hukum geometris distribusi probabilitas. Faktanya, distribusi geometrik tampaknya merupakan percobaan Bernoulli untuk keberhasilan pertama.

Contoh . Contoh variabel acak yang memiliki distribusi geometrik dapat berupa: jumlah tembakan sebelum pukulan pertama tepat mengenai sasaran; jumlah pengujian perangkat sebelum kegagalan pertama; jumlah lemparan koin sebelum kepala pertama ke atas, dan seterusnya.

Ekspektasi matematis dan varians dari variabel acak yang tunduk pada distribusi geometri berturut-turut adalah $M\left(X\right)=1/p$, $D\left(X\right)=\left(1-p\right) /p^ 2$.

Contoh . Di jalan pergerakan ikan ke tempat pemijahan ada kunci $4$. Peluang seekor ikan melewati setiap gembok adalah $p=3/5$. Buat deret distribusi variabel acak $X$ - jumlah gembok yang dilewati ikan sebelum pemberhentian pertama di gembok. Cari $M\left(X\right),\ D\left(X\right),\ \sigma \left(X\right)$.

Biarkan variabel acak $X$ menjadi jumlah pintu air yang dilewati ikan sebelum pemberhentian pertama di pintu air. Variabel acak seperti itu tunduk pada hukum geometris distribusi probabilitas. Nilai yang dapat diambil oleh variabel acak $X adalah: 1, 2, 3, 4. Probabilitas nilai-nilai ini dihitung dengan rumus: $P\left(X=k\right)=pq^( k-1)$, di mana: $ p=2/5$ - probabilitas ikan ditangkap melalui kunci, $q=1-p=3/5$ - probabilitas ikan melewati kunci, $k=1, \ 2,\ 3,\ 4$.

$P\left(X=1\right)=((2)\over (5))\cdot (\left(((3)\over (5))\right))^0=((2)\ lebih(5))=0.4;$

$P\left(X=2\right)=((2)\over (5))\cdot ((3)\over (5))=((6)\over (25))=0,24; $

$P\left(X=3\right)=((2)\over (5))\cdot (\left(((3)\over (5))\right))^2=((2)\ lebih (5))\cdot ((9)\lebih (25))=((18)\lebih (125))=0.144;$

$P\left(X=4\right)=((2)\over (5))\cdot (\left(((3)\over (5))\right))^3+(\left(( (3)\over (5))\right))^4=((27)\over (125))=0.216.$

$\begin(array)(|c|c|)
\hline
X_i & 1 & 2 & 3 & 4 \\
\hline
P\kiri(X_i\kanan) & 0,4 & 0,24 & 0,144 & 0,216 \\
\hline
\end(array)$

Nilai yang diharapkan:

$M\left(X\right)=\sum^n_(i=1)(x_ip_i)=1\cdot 0.4+2\cdot 0.24+3\cdot 0.144+4\cdot 0.216=2.176.$

Penyebaran:

$D\left(X\right)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\right)\right))^2=)0,4\cdot (\ kiri(1-2.176\kanan))^2+0,24\cdot (\kiri(2-2.176\kanan))^2+0,144\cdot (\kiri(3-2.176\kanan))^2+$

$+\ 0.216\cdot (\left(4-2.176\right))^2\kira-kira 1.377.$

Standar deviasi:

$\sigma \left(X\right)=\sqrt(D\left(X\right))=\sqrt(1,377)\kira-kira 1,173.$

4. Hukum distribusi hipergeometrik.

Jika ada objek $N$, di antaranya objek $m$ memiliki properti yang diberikan. Secara acak, tanpa pengembalian, objek $n$ diekstraksi, di antaranya ada objek $k$ yang memiliki properti tertentu. Distribusi hipergeometrik memungkinkan untuk memperkirakan probabilitas bahwa objek $k$ secara tepat dalam sampel memiliki properti tertentu. Biarkan variabel acak $X$ menjadi jumlah objek dalam sampel yang memiliki properti tertentu. Maka probabilitas nilai variabel acak $X$:

$P\left(X=k\right)=((C^k_mC^(n-k)_(N-m))\over (C^n_N))$

Komentar. Fungsi statistik HYPERGEOMET dari Wizard Fungsi $f_x$ Excel memungkinkan Anda untuk menentukan probabilitas bahwa sejumlah percobaan akan berhasil.

$f_x\ke $ statistik$\ke$ HIPERGEOMET$\ke$ Oke. Akan muncul kotak dialog yang perlu Anda isi. Dalam grafik Number_of_successes_in_sample tentukan nilai $k$. ukuran sampel sama dengan $n$. Dalam grafik Number_of_successes_in_population tentukan nilai $m$. Ukuran populasi sama dengan $N$.

Ekspektasi matematis dan varians dari variabel acak diskrit $X$ yang tunduk pada hukum distribusi geometrik adalah $M\left(X\right)=nm/N$, $D\left(X\right)=((nm\left (1 -((m)\atas (N))\kanan)\kiri(1-((n)\atas (N))\kanan))\atas (N-1))$.

Contoh . Bagian kredit bank mempekerjakan 5 spesialis dengan pendidikan keuangan yang lebih tinggi dan 3 spesialis dengan pendidikan hukum yang lebih tinggi. Manajemen bank memutuskan untuk mengirim 3 spesialis untuk pelatihan lanjutan, memilih mereka secara acak.

a) Membuat rangkaian distribusi jumlah tenaga ahli dengan pendidikan keuangan tinggi yang dapat diarahkan ke pelatihan lanjutan;

b) Temukan karakteristik numerik dari distribusi ini.

Biarkan variabel acak $X$ menjadi jumlah spesialis dengan pendidikan keuangan yang lebih tinggi di antara tiga yang dipilih. Nilai yang dapat diambil oleh $X:0,\ 1,\ 2,\ 3$. Variabel acak $X$ ini didistribusikan menurut distribusi hipergeometrik dengan parameter berikut: $N=8$ - ukuran populasi, $m=5$ - jumlah keberhasilan dalam populasi, $n=3$ - ukuran sampel, $ k=0,\ 1, \ 2,\ 3$ - jumlah keberhasilan dalam sampel. Maka probabilitas $P\left(X=k\right)$ dapat dihitung dengan menggunakan rumus: $P(X=k)=(C_(m)^(k) \cdot C_(N-m)^(n-k) \ lebih dari C_( N)^(n) ) $. Kita punya:

$P\left(X=0\right)=((C^0_5\cdot C^3_3)\over (C^3_8))=((1)\over (56))\kira-kira 0,018;$

$P\left(X=1\right)=((C^1_5\cdot C^2_3)\over (C^3_8))=((15)\over (56))\kira-kira 0,268;$

$P\left(X=2\right)=((C^2_5\cdot C^1_3)\over (C^3_8))=((15)\over (28))\kira-kira 0,536;$

$P\left(X=3\right)=((C^3_5\cdot C^0_3)\over (C^3_8))=((5)\over (28))\kira-kira 0,179.$

Kemudian deret distribusi variabel acak $X$:

$\begin(array)(|c|c|)
\hline
X_i & 0 & 1 & 2 & 3 \\
\hline
p_i & 0,018 & 0,268 & 0,536 & 0,179 \\
\hline
\end(array)$

Mari kita hitung karakteristik numerik dari variabel acak $X$ menggunakan rumus umum distribusi hipergeometrik.

$M\left(X\right)=((nm)\over (N))=((3\cdot 5)\over (8))=((15)\over (8))=1,875.$

$D\left(X\right)=((nm\left(1-((m)\over (N))\right)\left(1-((n)\over (N))\right)) \over (N-1))=((3\cdot 5\cdot \left(1-((5)\over (8))\right)\cdot \left(1-((3)\over (8 ))\kanan))\over (8-1))=((225)\over (448))\kira-kira 0,502.$

$\sigma \left(X\right)=\sqrt(D\left(X\right))=\sqrt(0.502)\kira-kira 0.7085.$