Binomial distribution at ang mga anyo ng paglilimita nito. Binomial distribution ng random variable


Siyempre, kapag kinakalkula ang pinagsama-samang pagpapaandar ng pamamahagi, dapat gamitin ng isa ang nabanggit na relasyon sa pagitan ng binomial at beta na mga pamamahagi. Ang pamamaraang ito ay tiyak na mas mahusay kaysa sa direktang pagsusuma kapag n > 10.

Sa mga klasikal na aklat-aralin sa mga istatistika, upang makuha ang mga halaga ng binomial na pamamahagi, kadalasang inirerekomenda na gumamit ng mga formula batay sa mga limit theorems (tulad ng Moivre-Laplace formula). Dapat ito ay nabanggit na mula sa isang purong computational point of view ang halaga ng mga theorems ay malapit sa zero, lalo na ngayon, kapag mayroong isang malakas na computer sa halos bawat talahanayan. Ang pangunahing kawalan ng mga pagtatantya sa itaas ay ang kanilang ganap na hindi sapat na katumpakan para sa mga halaga ng n tipikal para sa karamihan ng mga aplikasyon. Ang isang hindi gaanong disbentaha ay ang kawalan ng anumang malinaw na mga rekomendasyon sa applicability ng isa o isa pang approximation (sa mga karaniwang teksto, asymptotic formulation lamang ang ibinibigay, hindi sila sinamahan ng mga pagtatantya ng katumpakan at, samakatuwid, ay hindi gaanong ginagamit). Sasabihin ko na ang parehong mga formula ay may bisa lamang para sa n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Hindi ko isinasaalang-alang dito ang problema sa paghahanap ng mga dami: para sa mga hiwalay na pamamahagi, ito ay walang halaga, at sa mga problemang iyon kung saan lumitaw ang mga naturang pamamahagi, ito, bilang panuntunan, ay hindi nauugnay. Kung kailangan pa rin ng quantiles, inirerekumenda ko na baguhin ang problema sa paraang gumana sa mga p-values ​​​​(naobserbahang mga kahalagahan). Narito ang isang halimbawa: kapag nagpapatupad ng ilang enumeration algorithm, sa bawat hakbang ay kinakailangang suriin ang statistical hypothesis tungkol sa isang binomial random variable. Ayon sa klasikal na diskarte, sa bawat hakbang ay kinakailangan upang kalkulahin ang mga istatistika ng criterion at ihambing ang halaga nito sa hangganan ng kritikal na hanay. Dahil, gayunpaman, ang algorithm ay enumerative, kinakailangan upang matukoy ang hangganan ng kritikal na set sa bawat oras na muli (pagkatapos ng lahat, ang laki ng sample ay nagbabago mula sa bawat hakbang), na hindi produktibong nagpapataas ng mga gastos sa oras. Inirerekomenda ng modernong diskarte ang pagkalkula ng napansin na kahalagahan at paghahambing nito sa posibilidad ng kumpiyansa, na nagtitipid sa paghahanap para sa mga dami.

Samakatuwid, hindi kinakalkula ng mga sumusunod na code ang inverse function, sa halip, ibinigay ang function na rev_binomialDF, na kinakalkula ang probabilidad p ng tagumpay sa isang pagsubok na ibinigay ang bilang n ng mga pagsubok, ang bilang m ng mga tagumpay sa kanila, at ang halaga y ng posibilidad na makuha ang mga tagumpay na ito. Ginagamit nito ang nabanggit na relasyon sa pagitan ng binomial at beta distribution.

Sa katunayan, pinapayagan ka ng function na ito na makuha ang mga hangganan ng mga agwat ng kumpiyansa. Sa katunayan, ipagpalagay na nakakuha tayo ng mga tagumpay sa n binomial na pagsubok. Gaya ng nalalaman, ang left bound ng two-sided confidence interval para sa parameter na p na may antas ng kumpiyansa ay 0 kung m = 0, at para sa solusyon ng equation. . Katulad nito, ang kanang bound ay 1 kung m = n, at para ay isang solusyon sa equation . Ito ay nagpapahiwatig na upang mahanap ang kaliwang hangganan, dapat nating lutasin ang equation , at upang maghanap ng tama - ang equation . Nalutas ang mga ito sa mga function na binom_leftCI at binom_rightCI , na nagbabalik sa itaas at ibabang mga hangganan ng dalawang panig na pagitan ng kumpiyansa, ayon sa pagkakabanggit.

Nais kong tandaan na kung ang ganap na hindi kapani-paniwalang katumpakan ay hindi kailangan, kung gayon para sa sapat na malaking n, maaari mong gamitin ang sumusunod na pagtatantya [B.L. van der Waerden, Mga istatistika ng matematika. M: IL, 1960, Ch. 2, sec. 7]: , kung saan ang g ay ang dami ng normal na distribusyon. Ang halaga ng pagtatantya na ito ay mayroong napakasimpleng pagtatantya na nagbibigay-daan sa iyong kalkulahin ang mga dami ng normal na distribusyon (tingnan ang teksto tungkol sa pagkalkula ng normal na distribusyon at ang kaukulang seksyon ng sanggunian na ito). Sa aking pagsasanay (pangunahin para sa n> 100), ang pagtatantya na ito ay nagbigay ng mga 3-4 na numero, na, bilang panuntunan, ay sapat na.

Ang mga kalkulasyon na may mga sumusunod na code ay nangangailangan ng mga file betaDF.h , betaDF.cpp (tingnan ang seksyon sa beta distribution), pati na rin ang logGamma.h , logGamma.cpp (tingnan ang appendix A). Maaari ka ring makakita ng halimbawa ng paggamit ng mga function.

binomialDF.h file

#ifndef __BINOMIAL_H__ #include "betaDF.h" double binomialDF(dobleng pagsubok, dobleng tagumpay, doble p); /* * Hayaang magkaroon ng "mga pagsubok" ng mga independiyenteng obserbasyon * na may posibilidad na "p" ng tagumpay sa bawat isa. * Kalkulahin ang posibilidad na B(mga tagumpay|mga pagsubok,p) na ang bilang ng mga tagumpay ay nasa pagitan ng 0 at "mga tagumpay" (kasama). */ double rev_binomialDF(dobleng pagsubok, dobleng tagumpay, doble y); /* * Hayaang malaman ang probabilidad y ng hindi bababa sa m tagumpay * sa mga pagsubok ng Bernoulli scheme. Hinahanap ng function ang probabilidad p * ng tagumpay sa isang pagsubok. * * Ang sumusunod na kaugnayan ay ginagamit sa mga kalkulasyon * * 1 - p = rev_Beta(trials-successes| successes+1, y). */ double binom_leftCI(dobleng pagsubok, dobleng tagumpay, dobleng antas); /* Hayaang magkaroon ng "mga pagsubok" ng mga independiyenteng obserbasyon * na may posibilidad na "p" ng tagumpay sa bawat * at ang bilang ng mga tagumpay ay "mga tagumpay". * Ang left bound ng two-sided confidence interval * ay kinakalkula gamit ang significance level level. */ double binom_rightCI(double n, dobleng tagumpay, dobleng antas); /* Hayaang magkaroon ng "mga pagsubok" ng mga independiyenteng obserbasyon * na may posibilidad na "p" ng tagumpay sa bawat * at ang bilang ng mga tagumpay ay "mga tagumpay". * Ang kanang hangganan ng dalawang panig na pagitan ng kumpiyansa * ay kinakalkula gamit ang antas ng antas ng kahalagahan. */ #endif /* Ends #ifndef __BINOMIAL_H__ */

binomialDF.cpp file

/************************************************ **** **********/ /* Binomial Distribution */ /**************************** **** *****************************/ #isama #isama #include "betaDF.h" ENTRY double binomialDF(double n, double m, double p) /* * Hayaang magkaroon ng "n" independent observation * na may posibilidad na "p" ng tagumpay sa bawat isa. * Kalkulahin ang posibilidad na B(m|n,p) na ang bilang ng mga tagumpay ay * sa pagitan ng 0 at "m" (kabilang), i.e. * kabuuan ng binomial probabilities mula 0 hanggang m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Ang mga kalkulasyon ay hindi nagpapahiwatig ng piping pagsusuma - * ay ginagamit ang sumusunod na kaugnayan sa gitnang pamamahagi ng beta: * * B(m|n,p) = Beta(1-p|n-m,m+1). * * Dapat na positibo ang mga argumento, na may 0<= p <= 1. */ { assert((n >0) && (p >= 0) && (p<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) bumalik 1; kung hindi, ibalik ang BetaDF(n-m, m+1).value(1-p); )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * Hayaang malaman ang probabilidad y ng hindi bababa sa m tagumpay * sa n pagsubok ng Bernoulli scheme. Hinahanap ng function ang probabilidad p * ng tagumpay sa isang pagsubok. * * Ang sumusunod na kaugnayan ay ginagamit sa mga kalkulasyon * * 1 - p = rev_Beta(y|n-m,m+1). */ ( igiit((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0.5) at& (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0.5) at& (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

Isaalang-alang ang Binomial distribution, kalkulahin ang mathematical expectation, variance, mode nito. Gamit ang MS EXCEL function na BINOM.DIST(), ilalagay namin ang distribution function at probability density graphs. Tantyahin natin ang parameter ng pamamahagi p, ang inaasahan sa matematika ng distribusyon, at ang karaniwang paglihis. Isaalang-alang din ang pamamahagi ng Bernoulli.

Kahulugan. Hayaan silang gaganapin n mga pagsubok, sa bawat isa ay 2 kaganapan lamang ang maaaring mangyari: ang kaganapang "tagumpay" na may posibilidad p o ang kaganapang "pagkabigo" na may posibilidad q =1-p (ang tinatawag na Bernoulli scheme,Bernoullimga pagsubok).

Ang posibilidad na makakuha ng eksakto x tagumpay sa mga ito n ang mga pagsusulit ay katumbas ng:

Bilang ng mga tagumpay sa sample x ay isang random na variable na mayroong Binomial na pamamahagi(Ingles) Binomialpamamahagi) p at n ay mga parameter ng distribusyon na ito.

Tandaan na upang mag-apply Bernoulli scheme at naaayon binomial distribution, ang mga sumusunod na kondisyon ay dapat matugunan:

  • ang bawat pagsubok ay dapat na may eksaktong dalawang resulta, na may kondisyong tinatawag na "tagumpay" at "pagkabigo".
  • ang resulta ng bawat pagsusulit ay hindi dapat nakadepende sa mga resulta ng mga nakaraang pagsusulit (test independence).
  • rate ng tagumpay p dapat pare-pareho para sa lahat ng pagsubok.

Binomial na pamamahagi sa MS EXCEL

Sa MS EXCEL, simula sa bersyon 2010, para sa mayroong isang BINOM.DIST() function, ang English na pangalan ay BINOM.DIST(), na nagbibigay-daan sa iyong kalkulahin ang posibilidad na ang sample ay magkakaroon ng eksaktong X"mga tagumpay" (i.e. probability density function p(x), tingnan ang formula sa itaas), at integral distribution function(probability na magkakaroon ang sample x o mas kaunting "mga tagumpay", kabilang ang 0).

Bago ang MS EXCEL 2010, ang EXCEL ay may function na BINOMDIST(), na nagbibigay-daan din sa iyong kalkulahin function ng pamamahagi at density ng posibilidad p(x). BINOMDIST() ay naiwan sa MS EXCEL 2010 para sa compatibility.

Ang halimbawang file ay naglalaman ng mga graph probability distribution density at .

Binomial na pamamahagi may pagtatalaga B (n ; p) .

Tandaan: Para sa gusali integral distribution function perpektong akma na uri ng tsart Iskedyul, para sa density ng pamamahagiHistogram na may pagpapangkat. Para sa karagdagang impormasyon tungkol sa pagbuo ng mga tsart, basahin ang artikulong Ang mga pangunahing uri ng mga tsart.

Tandaan: Para sa kaginhawahan ng pagsusulat ng mga formula sa halimbawang file, ang mga pangalan para sa mga parameter ay nilikha Binomial na pamamahagi: n at p.

Ang halimbawang file ay nagpapakita ng iba't ibang mga kalkulasyon ng posibilidad gamit ang MS EXCEL functions:

Tulad ng nakikita sa larawan sa itaas, ipinapalagay na:

  • Ang walang katapusang populasyon kung saan ginawa ang sample ay naglalaman ng 10% (o 0.1) magagandang elemento (parameter p, argumento ng ikatlong function = BINOM.DIST() )
  • Upang kalkulahin ang posibilidad na sa isang sample ng 10 elemento (parameter n, ang pangalawang argumento ng function) magkakaroon ng eksaktong 5 wastong elemento (ang unang argumento), kailangan mong isulat ang formula: =BINOM.DIST(5, 10, 0.1, FALSE)
  • Ang huling, ikaapat na elemento ay nakatakda = FALSE, i.e. ibinalik ang halaga ng function density ng pamamahagi .

Kung ang halaga ng ikaapat na argumento = TRUE, ang BINOM.DIST() function ay nagbabalik ng halaga integral distribution function o simple lang function ng pamamahagi. Sa kasong ito, maaari mong kalkulahin ang posibilidad na ang bilang ng magagandang item sa sample ay magmumula sa isang partikular na hanay, halimbawa, 2 o mas kaunti (kabilang ang 0).

Upang gawin ito, isulat ang formula: = BINOM.DIST(2, 10, 0.1, TRUE)

Tandaan: Para sa isang hindi-integer na halaga ng x, . Halimbawa, ang mga sumusunod na formula ay magbabalik ng parehong halaga: =BINOM.DIST( 2 ; sampu; 0.1; TOTOO)=BINOM.DIST( 2,9 ; sampu; 0.1; TOTOO)

Tandaan: Sa halimbawang file density ng posibilidad at function ng pamamahagi din computed gamit ang kahulugan at ang COMBIN() function.

Mga tagapagpahiwatig ng pamamahagi

AT halimbawa ng file sa sheet Halimbawa may mga formula para sa pagkalkula ng ilang mga tagapagpahiwatig ng pamamahagi:

  • =n*p;
  • (squared standard deviation) = n*p*(1-p);
  • = (n+1)*p;
  • =(1-2*p)*ROOT(n*p*(1-p)).

Kinukuha namin ang formula inaasahan sa matematikaBinomial na pamamahagi gamit Bernoulli scheme .

Sa pamamagitan ng kahulugan, isang random variable X in Bernoulli scheme(Bernoulli random variable) ay may function ng pamamahagi :

Ang pamamahagi na ito ay tinatawag na Pamamahagi ng Bernoulli .

Tandaan : Pamamahagi ng Bernoulli- espesyal na kaso Binomial na pamamahagi na may parameter n=1.

Bumuo tayo ng 3 arrays ng 100 numero na may iba't ibang probabilidad ng tagumpay: 0.1; 0.5 at 0.9. Upang gawin ito, sa window Random na pagbuo ng numero itakda ang mga sumusunod na parameter para sa bawat posibilidad p:

Tandaan: Kung itinakda mo ang opsyon Random na pagkakalat (Random na binhi), pagkatapos ay maaari kang pumili ng isang tiyak na random na hanay ng mga nabuong numero. Halimbawa, sa pamamagitan ng pagtatakda ng opsyong ito =25, maaari kang bumuo ng parehong hanay ng mga random na numero sa iba't ibang mga computer (kung, siyempre, ang iba pang mga parameter ng pamamahagi ay pareho). Ang halaga ng opsyon ay maaaring tumagal ng mga halaga ng integer mula 1 hanggang 32,767. Pangalan ng opsyon Random na pagkakalat maaaring malito. Mas mainam na isalin ito bilang Itakda ang numero na may mga random na numero .

Bilang resulta, magkakaroon tayo ng 3 column ng 100 na numero, batay sa kung saan, halimbawa, maaari nating tantyahin ang posibilidad ng tagumpay. p ayon sa formula: Bilang ng mga tagumpay/100(cm. halimbawa ng file sheet Pagbuo ng Bernoulli).

Tandaan: Para sa Mga pamamahagi ng Bernoulli na may p=0.5, maaari mong gamitin ang formula =RANDBETWEEN(0;1) , na tumutugma sa .

Random na pagbuo ng numero. Binomial na pamamahagi

Ipagpalagay na mayroong 7 may sira na mga item sa sample. Nangangahulugan ito na "malamang" na ang proporsyon ng mga may sira na produkto ay nagbago. p, na isang katangian ng aming proseso ng produksyon. Bagama't ang sitwasyong ito ay "napaka-malamang", may posibilidad (alpha risk, type 1 error, "false alarm") na p nanatiling hindi nagbabago, at ang tumaas na bilang ng mga may sira na produkto ay dahil sa random sampling.

Tulad ng makikita sa figure sa ibaba, ang 7 ay ang bilang ng mga may sira na produkto na katanggap-tanggap para sa isang proseso na may p=0.21 sa parehong halaga Alpha. Inilalarawan nito na kapag nalampasan ang threshold ng mga may sira na item sa isang sample, p"malamang" nadagdagan. Ang pariralang "malamang" ay nangangahulugan na mayroon lamang 10% na pagkakataon (100%-90%) na ang paglihis ng porsyento ng mga may sira na produkto sa itaas ng threshold ay dahil lamang sa mga random na dahilan.

Kaya, ang paglampas sa bilang ng threshold ng mga may sira na produkto sa sample ay maaaring magsilbi bilang isang senyales na ang proseso ay nabalisa at nagsimulang gumawa ng b tungkol sa mas mataas na porsyento ng mga may sira na produkto.

Tandaan: Bago ang MS EXCEL 2010, ang EXCEL ay may function na CRITBINOM() , na katumbas ng BINOM.INV() . Ang CRITBINOM() ay naiwan sa MS EXCEL 2010 at mas mataas para sa pagiging tugma.

Kaugnayan ng Binomial distribution sa iba pang distribution

Kung ang parameter nBinomial na pamamahagi may posibilidad na infinity at p ay may posibilidad na 0, pagkatapos ay sa kasong ito Binomial na pamamahagi maaaring tantiyahin. Ito ay posible na magbalangkas ng mga kondisyon kapag ang approximation Pamamahagi ng Poisson gumagana nang mabuti:

  • p(mas kaunti p at iba pa n, mas tumpak ang approximation);
  • p >0,9 (isinasaalang-alang na q =1- p, ang mga kalkulasyon sa kasong ito ay dapat gawin gamit ang q(a X kailangang palitan ng n - x). Samakatuwid, ang mas kaunti q at iba pa n, mas tumpak ang approximation).

Sa 0.110 Binomial na pamamahagi maaaring tantiyahin.

Sa turn nito, Binomial na pamamahagi maaaring magsilbi bilang isang mahusay na pagtatantya kapag ang laki ng populasyon ay N Hypergeometric distribution mas malaki kaysa sa sample size n (i.e., N>>n o n/N Maaari mong basahin ang higit pa tungkol sa kaugnayan ng mga distribusyon sa itaas sa artikulo. Ang mga halimbawa ng approximation ay ibinibigay din doon, at ipinapaliwanag ang mga kundisyon kapag posible at sa anong katumpakan.

PAYO: Maaari mong basahin ang tungkol sa iba pang mga distribusyon ng MS EXCEL sa artikulo.

Ang teorya ng posibilidad ay hindi nakikita sa ating buhay. Hindi natin ito pinapansin, ngunit ang bawat kaganapan sa ating buhay ay may isa o isa pang posibilidad. Dahil sa napakalaking bilang ng mga posibleng senaryo, nagiging kinakailangan para sa atin na matukoy ang pinaka-malamang at pinaka-malamang sa mga ito. Ito ay pinaka-maginhawa upang pag-aralan ang naturang probabilistikong data nang grapiko. Ang pamamahagi ay makakatulong sa atin dito. Binomial ay isa sa pinakamadali at pinakatumpak.

Bago lumipat nang direkta sa matematika at teorya ng posibilidad, alamin natin kung sino ang unang nakabuo ng ganitong uri ng pamamahagi at kung ano ang kasaysayan ng pag-unlad ng mathematical apparatus para sa konseptong ito.

Kwento

Ang konsepto ng posibilidad ay kilala mula pa noong sinaunang panahon. Gayunpaman, ang mga sinaunang matematiko ay hindi nagbigay ng malaking kahalagahan dito at nagawa lamang nilang ilatag ang mga pundasyon para sa isang teorya na kalaunan ay naging teorya ng posibilidad. Gumawa sila ng ilang kombinatoryal na pamamaraan na malaki ang naitulong sa mga lumikha at bumuo ng teorya mismo.

Sa ikalawang kalahati ng ikalabimpitong siglo, nagsimula ang pagbuo ng mga pangunahing konsepto at pamamaraan ng teorya ng posibilidad. Ang mga kahulugan ng mga random na variable, mga pamamaraan para sa pagkalkula ng posibilidad ng simple at ilang kumplikadong independyente at umaasa na mga kaganapan ay ipinakilala. Ang ganitong interes sa mga random na variable at probabilities ay idinidikta ng pagsusugal: bawat tao ay gustong malaman kung ano ang kanyang mga pagkakataong manalo sa laro.

Ang susunod na hakbang ay ang aplikasyon ng mga pamamaraan ng mathematical analysis sa probability theory. Ang mga kilalang mathematician tulad nina Laplace, Gauss, Poisson at Bernoulli ay kinuha ang gawaing ito. Sila ang nagsulong sa larangang ito ng matematika sa isang bagong antas. Si James Bernoulli ang nakatuklas ng binomial distribution law. Sa pamamagitan ng paraan, tulad ng malalaman natin sa ibang pagkakataon, sa batayan ng pagtuklas na ito, marami pa ang ginawa, na naging posible upang lumikha ng batas ng normal na pamamahagi at marami pang iba.

Ngayon, bago natin simulan ang paglalarawan ng binomial distribution, ire-refresh natin ng kaunti sa memorya ang mga konsepto ng probability theory, marahil ay nakalimutan na mula sa school bench.

Mga Batayan ng Teorya ng Probability

Isasaalang-alang namin ang mga naturang sistema, bilang isang resulta kung saan posible lamang ang dalawang resulta: "tagumpay" at "kabiguan". Ito ay madaling maunawaan gamit ang isang halimbawa: naghahagis kami ng barya, sa paghula na ang mga buntot ay mahuhulog. Ang mga probabilidad ng bawat isa sa mga posibleng kaganapan (buntot - "tagumpay", ulo - "hindi tagumpay") ay katumbas ng 50 porsiyento na may perpektong balanseng barya at walang ibang mga salik na maaaring makaapekto sa eksperimento.

Ito ang pinakasimpleng kaganapan. Ngunit mayroon ding mga kumplikadong sistema kung saan isinagawa ang mga sunud-sunod na aksyon, at mag-iiba ang mga probabilidad ng mga resulta ng mga pagkilos na ito. Halimbawa, isaalang-alang ang sumusunod na sistema: sa isang kahon na ang mga nilalaman ay hindi natin nakikita, mayroong anim na ganap na magkaparehong mga bola, tatlong pares ng asul, pula at puting kulay. Kailangan nating makakuha ng ilang bola nang random. Alinsunod dito, sa pamamagitan ng paghila muna ng isa sa mga puting bola, mababawasan natin ng ilang beses ang posibilidad na sa susunod ay makakakuha din tayo ng puting bola. Nangyayari ito dahil nagbabago ang bilang ng mga bagay sa system.

Sa susunod na seksyon, titingnan natin ang mas kumplikadong mga konsepto ng matematika na naglalapit sa atin sa kung ano ang ibig sabihin ng mga salitang "normal distribution", "binomial distribution" at mga katulad nito.

Mga elemento ng istatistika ng matematika

Sa mga istatistika, na isa sa mga lugar ng aplikasyon ng teorya ng posibilidad, mayroong maraming mga halimbawa kung saan ang data para sa pagsusuri ay hindi malinaw na ibinigay. Iyon ay, hindi sa mga numero, ngunit sa anyo ng paghahati ayon sa mga katangian, halimbawa, ayon sa kasarian. Upang mailapat ang isang mathematical apparatus sa naturang data at makagawa ng ilang konklusyon mula sa mga resultang nakuha, kinakailangan na i-convert ang paunang data sa isang numerical na format. Bilang isang patakaran, upang maipatupad ito, ang isang positibong kinalabasan ay itinalaga ng isang halaga ng 1, at ang isang negatibo ay itinalaga ng isang halaga ng 0. Kaya, kami ay nakakuha ng istatistikal na data na maaaring masuri gamit ang mga pamamaraang matematika.

Ang susunod na hakbang sa pag-unawa kung ano ang binomial distribution ng isang random variable ay upang matukoy ang pagkakaiba ng random variable at ang mathematical na inaasahan. Pag-uusapan natin ito sa susunod na seksyon.

Inaasahang halaga

Sa katunayan, ang pag-unawa kung ano ang inaasahan sa matematika ay hindi mahirap. Isaalang-alang ang isang sistema kung saan mayroong maraming iba't ibang mga kaganapan na may sariling magkakaibang mga probabilidad. Ang pag-asa sa matematika ay tatawaging halaga na katumbas ng kabuuan ng mga produkto ng mga halaga ng mga kaganapang ito (sa pormang matematikal na napag-usapan natin sa huling seksyon) at ang posibilidad ng kanilang paglitaw.

Ang pag-asa sa matematika ng binomial distribution ay kinakalkula ayon sa parehong pamamaraan: kinukuha namin ang halaga ng isang random na variable, i-multiply ito sa posibilidad ng isang positibong resulta, at pagkatapos ay ibubuod ang nakuha na data para sa lahat ng mga variable. Ito ay napaka-maginhawa upang ipakita ang mga data na ito nang graphical - sa ganitong paraan ang pagkakaiba sa pagitan ng mga inaasahan sa matematika ng iba't ibang mga halaga ay mas mahusay na nakikita.

Sa susunod na seksyon, sasabihin namin sa iyo ng kaunti ang tungkol sa ibang konsepto - ang pagkakaiba-iba ng isang random na variable. Ito rin ay malapit na nauugnay sa isang konsepto tulad ng binomial probability distribution, at ang katangian nito.

Binomial na pagkakaiba-iba ng pamamahagi

Ang halagang ito ay malapit na nauugnay sa nauna at nailalarawan din ang pamamahagi ng istatistikal na data. Kinakatawan nito ang ibig sabihin ng parisukat ng mga paglihis ng mga halaga mula sa kanilang inaasahan sa matematika. Iyon ay, ang pagkakaiba ng isang random na variable ay ang kabuuan ng mga squared na pagkakaiba sa pagitan ng halaga ng isang random na variable at ang mathematical na inaasahan nito, na pinarami ng probabilidad ng kaganapang ito.

Sa pangkalahatan, ito lang ang kailangan nating malaman tungkol sa pagkakaiba-iba upang maunawaan kung ano ang binomial probability distribution. Ngayon ay lumipat tayo sa aming pangunahing paksa. Ibig sabihin, kung ano ang nasa likod ng isang tila kumplikadong pariralang "binomial distribution law".

Binomial na pamamahagi

Unawain muna natin kung bakit binomial ang distribution na ito. Galing ito sa salitang "binom". Maaaring narinig mo na ang binomial ng Newton - isang pormula na maaaring magamit upang palawakin ang kabuuan ng alinmang dalawang numero a at b sa anumang hindi negatibong kapangyarihan ng n.

Tulad ng malamang na nahulaan mo na, ang binomial na formula ng Newton at ang binomial na formula ng pamamahagi ay halos magkaparehong mga formula. Sa tanging pagbubukod na ang pangalawa ay may inilapat na halaga para sa mga tiyak na dami, at ang una ay isang pangkalahatang kasangkapang pangmatematika lamang, ang mga aplikasyon kung saan sa pagsasanay ay maaaring magkaiba.

Mga formula ng pamamahagi

Ang binomial distribution function ay maaaring isulat bilang kabuuan ng mga sumusunod na termino:

(n!/(n-k)!k!)*p k *q n-k

Narito ang n ay ang bilang ng mga independiyenteng random na mga eksperimento, ang p ay ang bilang ng mga matagumpay na kinalabasan, ang q ay ang bilang ng mga hindi matagumpay na kinalabasan, ang k ay ang bilang ng eksperimento (maaari itong tumagal ng mga halaga mula 0 hanggang n),! - pagtatalaga ng isang factorial, tulad ng isang function ng isang numero, ang halaga nito ay katumbas ng produkto ng lahat ng mga numero na umaakyat dito (halimbawa, para sa numero 4: 4!=1*2*3*4= 24).

Bilang karagdagan, ang binomial distribution function ay maaaring isulat bilang isang hindi kumpletong beta function. Gayunpaman, isa na itong mas kumplikadong kahulugan, na ginagamit lamang kapag nilulutas ang mga kumplikadong problema sa istatistika.

Ang binomial distribution, mga halimbawa kung saan napagmasdan namin sa itaas, ay isa sa mga pinakasimpleng uri ng distribution sa probability theory. Mayroon ding normal na distribusyon, na isang uri ng binomial distribution. Ito ang pinakakaraniwang ginagamit, at ang pinakamadaling kalkulahin. Mayroon ding pamamahagi ng Bernoulli, pamamahagi ng Poisson, pamamahagi ng kondisyonal. Lahat ng mga ito ay graphical na nagpapakilala sa mga lugar ng posibilidad ng isang partikular na proseso sa ilalim ng iba't ibang mga kondisyon.

Sa susunod na seksyon, isasaalang-alang natin ang mga aspeto na nauugnay sa aplikasyon ng mathematical apparatus na ito sa totoong buhay. Sa unang sulyap, siyempre, tila ito ay isa pang bagay sa matematika, na, gaya ng dati, ay hindi nakakahanap ng aplikasyon sa totoong buhay, at sa pangkalahatan ay hindi kailangan ng sinuman maliban sa mga mathematician mismo. Gayunpaman, hindi ito ang kaso. Pagkatapos ng lahat, ang lahat ng mga uri ng mga pamamahagi at ang kanilang mga graphical na representasyon ay nilikha lamang para sa mga praktikal na layunin, at hindi bilang isang kapritso ng mga siyentipiko.

Aplikasyon

Sa ngayon, ang pinakamahalagang aplikasyon ng mga pamamahagi ay matatagpuan sa mga istatistika, dahil nangangailangan sila ng kumplikadong pagsusuri ng maraming data. Tulad ng ipinapakita ng kasanayan, napakaraming mga array ng data ang may humigit-kumulang na parehong distribusyon ng mga halaga: ang mga kritikal na rehiyon ng napakababa at napakataas na mga halaga, bilang panuntunan, ay naglalaman ng mas kaunting elemento kaysa sa mga average na halaga.

Ang pagsusuri ng malalaking data array ay kinakailangan hindi lamang sa mga istatistika. Ito ay kailangang-kailangan, halimbawa, sa pisikal na kimika. Sa agham na ito, ginagamit ito upang matukoy ang maraming dami na nauugnay sa mga random na vibrations at paggalaw ng mga atomo at molekula.

Sa susunod na seksyon, mauunawaan natin kung gaano kahalaga ang paglalapat ng mga istatistikal na konsepto tulad ng binomial pamamahagi ng isang random na variable sa pang-araw-araw na buhay para sa iyo at sa akin.

Bakit kailangan ko ito?

Maraming tao ang nagtatanong sa kanilang sarili ng tanong na ito pagdating sa matematika. At sa pamamagitan ng paraan, ang matematika ay hindi walang kabuluhan na tinatawag na reyna ng mga agham. Ito ang batayan ng physics, chemistry, biology, economics, at sa bawat isa sa mga agham na ito, ang ilang uri ng pamamahagi ay ginagamit din: kung ito ay isang discrete binomial distribution o isang normal, hindi ito mahalaga. At kung susuriin natin ang mundo sa paligid natin, makikita natin na ang matematika ay ginagamit sa lahat ng dako: sa pang-araw-araw na buhay, sa trabaho, at kahit na ang mga relasyon ng tao ay maaaring iharap sa anyo ng istatistikal na data at masuri (ito, sa pamamagitan ng paraan , ay ginagawa ng mga nagtatrabaho sa mga espesyal na organisasyong kasangkot sa pangongolekta ng impormasyon).

Ngayon ay pag-usapan natin nang kaunti kung ano ang gagawin kung kailangan mong malaman ang higit pa sa paksang ito kaysa sa binalangkas namin sa artikulong ito.

Ang impormasyong ibinigay namin sa artikulong ito ay malayo sa kumpleto. Mayroong maraming mga nuances tungkol sa kung anong anyo ang maaaring gawin ng pamamahagi. Ang binomial distribution, gaya ng nalaman na natin, ay isa sa mga pangunahing uri kung saan nakabatay ang lahat ng matematikal na istatistika at teorya ng posibilidad.

Kung naging interesado ka, o may kaugnayan sa iyong trabaho, kailangan mong malaman ang higit pa sa paksang ito, kakailanganin mong pag-aralan ang dalubhasang panitikan. Dapat kang magsimula sa isang kurso sa unibersidad sa pagsusuri sa matematika at pumunta doon sa seksyon sa teorya ng posibilidad. Magiging kapaki-pakinabang din ang kaalaman sa larangan ng serye, dahil ang pamamahagi ng binomial na probabilidad ay walang iba kundi isang serye ng magkakasunod na termino.

Konklusyon

Bago tapusin ang artikulo, nais naming sabihin sa iyo ang isa pang kawili-wiling bagay. Ito ay direktang may kinalaman sa paksa ng aming artikulo at sa lahat ng matematika sa pangkalahatan.

Maraming tao ang nagsasabi na ang matematika ay isang walang kwentang agham, at walang natutunan sa paaralan ang kapaki-pakinabang sa kanila. Ngunit ang kaalaman ay hindi kailanman labis, at kung ang isang bagay ay hindi kapaki-pakinabang sa iyo sa buhay, nangangahulugan ito na hindi mo ito naaalala. Kung mayroon kang kaalaman, matutulungan ka nila, ngunit kung wala ka, hindi ka makakaasa ng tulong mula sa kanila.

Kaya, sinuri namin ang konsepto ng binomial distribution at lahat ng mga kahulugang nauugnay dito at pinag-usapan kung paano ito inilalapat sa ating buhay.

Kabanata 7

Mga partikular na batas ng pamamahagi ng mga random na variable

Mga uri ng mga batas ng pamamahagi ng mga discrete random variable

Hayaang kunin ng isang discrete random variable ang mga halaga X 1 , X 2 , …, x n, … . Ang mga probabilidad ng mga halagang ito ay maaaring kalkulahin gamit ang iba't ibang mga formula, halimbawa, gamit ang mga pangunahing theorems ng probability theory, Bernoulli's formula, o ilang iba pang mga formula. Para sa ilan sa mga formula na ito, ang batas sa pamamahagi ay may sariling pangalan.

Ang pinakakaraniwang batas ng pamamahagi ng isang discrete random variable ay binomial, geometric, hypergeometric, batas ng pamamahagi ng Poisson.

Batas sa pamamahagi ng binomial

Hayaan itong mabuo n mga independiyenteng pagsubok, kung saan ang bawat isa ay maaaring mangyari o hindi maaaring mangyari PERO. Ang posibilidad ng paglitaw ng kaganapang ito sa bawat solong pagsubok ay pare-pareho, hindi nakadepende sa numero ng pagsubok at katumbas ng R=R(PERO). Kaya ang posibilidad na ang kaganapan ay hindi mangyayari PERO sa bawat pagsubok ay pare-pareho din at katumbas ng q=1–R. Isaalang-alang ang isang random na variable X katumbas ng bilang ng mga paglitaw ng kaganapan PERO sa n mga pagsubok. Malinaw na ang mga halaga ng dami na ito ay katumbas ng

X 1 =0 - kaganapan PERO sa n hindi lumitaw ang mga pagsubok;

X 2 =1 – kaganapan PERO sa n isang beses lumitaw ang mga pagsubok;

X 3 =2 - kaganapan PERO sa n dalawang beses lumitaw ang mga pagsubok;

…………………………………………………………..

x n +1 = n- kaganapan PERO sa n pagsubok lumitaw ang lahat n minsan.

Ang mga probabilidad ng mga halagang ito ay maaaring kalkulahin gamit ang Bernoulli formula (4.1):

saan sa=0, 1, 2, …,n .

Binomial distribution law X katumbas ng bilang ng mga tagumpay sa n Mga pagsubok sa Bernoulli, na may posibilidad na magtagumpay R.

Kaya, ang isang discrete random variable ay may binomial distribution (o ipinamamahagi ayon sa binomial law) kung ang mga posibleng halaga nito ay 0, 1, 2, ..., n, at ang mga katumbas na probabilidad ay kinakalkula sa pamamagitan ng formula (7.1).

Ang binomial distribution ay nakasalalay sa dalawa mga parameter R at n.

Ang serye ng pamamahagi ng isang random na variable na ibinahagi ayon sa binomial na batas ay may anyo:

X k n
R

Halimbawa 7.1 . Tatlong independyenteng putok ang pinaputok sa target. Ang posibilidad na matamaan ang bawat shot ay 0.4. Random na halaga X- ang bilang ng mga hit sa target. Buuin ang serye ng pamamahagi nito.

Desisyon. Mga posibleng halaga ng isang random na variable X ay X 1 =0; X 2 =1; X 3 =2; X 4=3. Hanapin ang kaukulang probabilities gamit ang Bernoulli formula. Madaling ipakita na ang paggamit ng formula na ito dito ay ganap na makatwiran. Tandaan na ang posibilidad na hindi matamaan ang target sa isang shot ay magiging katumbas ng 1-0.4=0.6. Kunin

Ang serye ng pamamahagi ay may sumusunod na anyo:

X
R 0,216 0,432 0,288 0,064

Madaling suriin na ang kabuuan ng lahat ng probabilities ay katumbas ng 1. Ang random variable mismo X ibinahagi ayon sa binomial na batas. ■

Hanapin natin ang mathematical expectation at variance ng isang random variable na ibinahagi ayon sa binomial law.

Kapag nilulutas ang halimbawa 6.5, ipinakita na ang pag-asa sa matematika ng bilang ng mga paglitaw ng isang kaganapan PERO sa n independiyenteng mga pagsubok, kung ang posibilidad ng paglitaw PERO sa bawat pagsubok ay pare-pareho at pantay R, katumbas n· R

Sa halimbawang ito, ginamit ang isang random na variable, na ibinahagi ayon sa binomial na batas. Samakatuwid, ang solusyon ng Halimbawa 6.5 ay, sa katunayan, isang patunay ng sumusunod na teorama.

Teorama 7.1. Ang mathematical na inaasahan ng isang discrete random variable na ibinahagi ayon sa binomial na batas ay katumbas ng produkto ng bilang ng mga pagsubok at ang posibilidad ng "tagumpay", i.e. M(X)=n· R.

Teorama 7.2. Ang pagkakaiba-iba ng isang discrete random variable na ibinahagi ayon sa binomial na batas ay katumbas ng produkto ng bilang ng mga pagsubok sa pamamagitan ng posibilidad ng "tagumpay" at ang posibilidad ng "pagkabigo", i.e. D(X)=npq.

Ang skewness at kurtosis ng isang random variable na ibinahagi ayon sa binomial law ay tinutukoy ng mga formula

Ang mga formula na ito ay maaaring makuha gamit ang konsepto ng inisyal at gitnang mga sandali.

Ang binomial distribution law ay sumasailalim sa maraming totoong sitwasyon. Para sa malalaking halaga n ang binomial na distribusyon ay maaaring tantiyahin ng iba pang mga distribusyon, lalo na ang Poisson distribution.

Pamamahagi ng Poisson

Hayaan na n Mga pagsubok sa Bernoulli, kasama ang bilang ng mga pagsubok n sapat na malaki. Noong nakaraan, ipinakita na sa kasong ito (kung, bilang karagdagan, ang posibilidad R mga pangyayari PERO napakaliit) upang mahanap ang posibilidad na ang isang kaganapan PERO lumitaw t minsan sa mga pagsusulit, maaari mong gamitin ang Poisson formula (4.9). Kung ang random variable X nangangahulugang ang bilang ng mga paglitaw ng kaganapan PERO sa n Bernoulli pagsubok, pagkatapos ay ang posibilidad na X kukuha ng kahulugan k maaaring kalkulahin ng formula

, (7.2)

saan λ = np.

Batas sa pamamahagi ng Poisson ay tinatawag na pamamahagi ng isang discrete random variable X, kung saan ang mga posibleng halaga ay mga di-negatibong integer, at ang mga probabilidad p t ang mga halagang ito ay matatagpuan sa pamamagitan ng formula (7.2).

Halaga λ = np tinawag parameter Pamamahagi ng Poisson.

Ang isang random na variable na ibinahagi ayon sa batas ng Poisson ay maaaring tumagal sa isang walang katapusang bilang ng mga halaga. Dahil para sa pamamahagi na ito ang posibilidad R Ang paglitaw ng isang kaganapan sa bawat pagsubok ay maliit, kung gayon ang pamamahagi na ito ay tinatawag na batas ng mga bihirang phenomena.

Ang serye ng pamamahagi ng isang random na variable na ibinahagi ayon sa batas ng Poisson ay may anyo

X t
R

Madaling i-verify na ang kabuuan ng mga probabilidad ng pangalawang hilera ay katumbas ng 1. Upang gawin ito, kailangan nating tandaan na ang function ay maaaring palawakin sa isang serye ng Maclaurin, na nagtatagpo para sa anumang X. Sa kasong ito mayroon tayo

. (7.3)

Gaya ng nabanggit, ang batas ni Poisson sa ilang partikular na paglilimita ng mga kaso ay pumapalit sa binomial na batas. Ang isang halimbawa ay isang random variable X, ang mga halaga ay katumbas ng bilang ng mga pagkabigo para sa isang tiyak na tagal ng panahon na may paulit-ulit na paggamit ng isang teknikal na aparato. Ipinapalagay na ang aparatong ito ay may mataas na pagiging maaasahan, i.e. ang posibilidad ng pagkabigo sa isang aplikasyon ay napakaliit.

Bilang karagdagan sa mga naturang paglilimita ng mga kaso, sa pagsasanay mayroong mga random na variable na ipinamamahagi ayon sa batas ng Poisson, na hindi nauugnay sa binomial na pamamahagi. Halimbawa, ang pamamahagi ng Poisson ay kadalasang ginagamit kapag nakikitungo sa bilang ng mga kaganapan na nagaganap sa isang yugto ng panahon (ang bilang ng mga tawag sa palitan ng telepono sa oras, ang bilang ng mga sasakyan na dumating sa car wash sa araw, ang bilang ng paghinto ng makina bawat linggo, atbp.). Ang lahat ng mga kaganapang ito ay dapat bumuo ng tinatawag na daloy ng mga kaganapan, na isa sa mga pangunahing konsepto ng teorya ng pagpila. Parameter λ nailalarawan ang karaniwang intensity ng daloy ng mga pangyayari.

Halimbawa 7.2 . Ang faculty ay mayroong 500 estudyante. Ano ang posibilidad na ang Setyembre 1 ay ang kaarawan ng tatlong mag-aaral sa faculty na ito?

Desisyon . Dahil sa dami ng estudyante n=500 ay sapat na malaki at R– ang posibilidad na maipanganak sa una ng Setyembre sa sinuman sa mga mag-aaral ay , i.е. sapat na maliit, pagkatapos ay maaari naming ipagpalagay na ang random variable X– ang bilang ng mga mag-aaral na ipinanganak noong una ng Setyembre ay ibinahagi ayon sa batas ng Poisson na may parameter λ = np= =1.36986. Pagkatapos, ayon sa formula (7.2), nakukuha namin

Teorama 7.3. Hayaan ang random variable X ipinamahagi ayon sa batas ni Poisson. Pagkatapos ang mathematical expectation at variance nito ay katumbas ng bawat isa at katumbas ng value ng parameter λ , ibig sabihin. M(X) = D(X) = λ = np.

Patunay. Sa pamamagitan ng kahulugan ng inaasahan sa matematika, gamit ang formula (7.3) at ang serye ng pamamahagi ng isang random na variable na ibinahagi ayon sa batas ng Poisson, nakuha namin

Bago hanapin ang pagkakaiba, hanapin muna natin ang mathematical na inaasahan ng parisukat ng itinuturing na random variable. Nakukuha namin

Samakatuwid, sa pamamagitan ng kahulugan ng pagpapakalat, nakuha namin

Ang teorama ay napatunayan.

Ang paglalapat ng mga konsepto ng inisyal at sentral na mga sandali, maipapakita na para sa isang random na variable na ibinahagi ayon sa batas ng Poisson, ang skewness at kurtosis coefficients ay tinutukoy ng mga formula.

Madaling maunawaan iyon, dahil ang semantikong nilalaman ng parameter λ = np ay positibo, kung gayon ang isang random na variable na ibinahagi ayon sa batas ng Poisson ay palaging may positibong parehong skewness at kurtosis.

Hindi lahat ng phenomena ay sinusukat sa isang quantitative scale tulad ng 1, 2, 3 ... 100500 ... Hindi palaging ang isang phenomenon ay maaaring tumagal sa isang walang katapusan o isang malaking bilang ng iba't ibang mga estado. Halimbawa, ang kasarian ng isang tao ay maaaring M o F. Ang tagabaril ay maaaring tumama sa target o makaligtaan. Maaari kang bumoto alinman sa "Para sa" o "Laban", atbp. atbp. Sa madaling salita, ipinapakita ng naturang data ang estado ng isang alternatibong katangian - alinman sa "oo" (naganap ang kaganapan) o "hindi" (hindi nangyari ang kaganapan). Ang darating na kaganapan (positibong kinalabasan) ay tinatawag ding "tagumpay".

Ang mga eksperimento sa naturang data ay tinatawag Bernoulli scheme, bilang parangal sa sikat na Swiss mathematician na natagpuan na sa malaking bilang ng mga pagsubok, ang ratio ng mga positibong resulta sa kabuuang bilang ng mga pagsubok ay may posibilidad na mangyari ang kaganapang ito.

Kahaliling Variable ng Tampok

Upang magamit ang mathematical apparatus sa pagsusuri, ang mga resulta ng naturang mga obserbasyon ay dapat na isulat sa numerical form. Upang gawin ito, ang isang positibong resulta ay itinalaga ang numero 1, isang negatibo - 0. Sa madaling salita, nakikipag-usap tayo sa isang variable na maaari lamang tumagal ng dalawang halaga: 0 o 1.

Anong benepisyo ang makukuha rito? Sa katunayan, hindi bababa sa mula sa ordinaryong data. Kaya, madaling bilangin ang bilang ng mga positibong resulta - sapat na upang buod ang lahat ng mga halaga, i.e. lahat ng 1 (tagumpay). Maaari kang pumunta nang higit pa, ngunit para dito kailangan mong ipakilala ang ilang mga notasyon.

Ang unang bagay na dapat tandaan ay ang mga positibong resulta (na katumbas ng 1) ay may ilang posibilidad na mangyari. Halimbawa, ang pagkuha ng mga ulo sa isang coin toss ay ½ o 0.5. Ang posibilidad na ito ay tradisyonal na tinutukoy ng Latin na titik p. Samakatuwid, ang posibilidad ng isang alternatibong kaganapan na nagaganap ay 1-p, na tinutukoy din ng q, ibig sabihin q = 1 – p. Ang mga pagtatalaga na ito ay maaaring biswal na ma-systematize sa anyo ng isang variable distribution plate X.

Nakakuha kami ng isang listahan ng mga posibleng halaga at ang kanilang mga probabilidad. maaaring kalkulahin inaasahang halaga at pagpapakalat. Ang inaasahan ay ang kabuuan ng mga produkto ng lahat ng posibleng mga halaga at ang kanilang mga kaukulang probabilidad:

Kalkulahin natin ang inaasahang halaga gamit ang notasyon sa mga talahanayan sa itaas.

Lumalabas na ang pag-asa sa matematika ng isang alternatibong tanda ay katumbas ng posibilidad ng kaganapang ito - p.

Ngayon, tukuyin natin kung ano ang pagkakaiba ng isang alternatibong tampok. Ang dispersion ay ang average na parisukat ng mga paglihis mula sa inaasahan sa matematika. Ang pangkalahatang formula (para sa discrete data) ay:

Kaya ang pagkakaiba-iba ng alternatibong tampok:

Madaling makita na ang dispersion na ito ay may maximum na 0.25 (at p=0.5).

Standard deviation - ugat ng variance:

Ang maximum na halaga ay hindi lalampas sa 0.5.

Tulad ng makikita mo, ang parehong inaasahan sa matematika at ang pagkakaiba ng alternatibong pag-sign ay may isang napaka-compact na anyo.

Binomial distribution ng random variable

Tingnan natin ang sitwasyon sa ibang anggulo. Sa katunayan, sino ang nagmamalasakit na ang average na pagkawala ng mga ulo sa isang paghagis ay 0.5? Imposibleng isipin. Ito ay mas kawili-wiling upang itaas ang tanong ng bilang ng mga ulo na darating para sa isang naibigay na bilang ng mga throws.

Sa madaling salita, ang mananaliksik ay madalas na interesado sa posibilidad ng isang tiyak na bilang ng mga matagumpay na kaganapan na nagaganap. Ito ay maaaring ang bilang ng mga may sira na produkto sa nasubok na lote (1 - may sira, 0 - mabuti) o ang bilang ng mga gumaling (1 - malusog, 0 - may sakit), atbp. Ang bilang ng naturang "mga tagumpay" ay magiging katumbas ng kabuuan ng lahat ng mga halaga ng variable X, ibig sabihin. ang bilang ng mga solong kinalabasan.

Random na halaga B ay tinatawag na binomial at kumukuha ng mga halaga mula 0 hanggang n(sa B= 0 - lahat ng bahagi ay mabuti, may B = n- lahat ng bahagi ay may depekto). Ipinapalagay na ang lahat ng mga halaga x independyente sa isa't isa. Isaalang-alang ang mga pangunahing katangian ng binomial variable, ibig sabihin, itatatag natin ang inaasahan, pagkakaiba at distribusyon nito sa matematika.

Ang inaasahan ng isang binomial variable ay napakadaling makuha. Ang pag-asa sa matematika ng kabuuan ng mga halaga ay ang kabuuan ng mga inaasahan sa matematika ng bawat idinagdag na halaga, at pareho ito para sa lahat, samakatuwid:

Halimbawa, ang inaasahan ng bilang ng mga ulo sa 100 tosses ay 100 × 0.5 = 50.

Ngayon ay nakukuha namin ang formula para sa pagkakaiba ng binomial variable. Ang pagkakaiba ng kabuuan ng mga independiyenteng random na variable ay ang kabuuan ng mga pagkakaiba. Mula rito

Standard deviation, ayon sa pagkakabanggit

Para sa 100 coin tosses, ang karaniwang paglihis ng bilang ng mga ulo ay

At sa wakas, isaalang-alang ang pamamahagi ng binomial na dami, i.e. ang posibilidad na ang random variable B kukuha ng iba't ibang halaga k, saan 0≤k≤n. Para sa isang barya, maaaring ganito ang tunog ng problemang ito: ano ang posibilidad na makakuha ng 40 ulo sa 100 tosses?

Upang maunawaan ang paraan ng pagkalkula, isipin natin na ang barya ay inihagis lamang ng 4 na beses. Alinmang panig ay maaaring mahulog sa bawat oras. Tinatanong namin ang aming sarili: ano ang posibilidad na makakuha ng 2 ulo sa 4 na paghagis. Ang bawat paghagis ay independyente sa bawat isa. Nangangahulugan ito na ang posibilidad na makakuha ng anumang kumbinasyon ay magiging katumbas ng produkto ng mga probabilidad ng isang naibigay na resulta para sa bawat indibidwal na paghagis. Hayaan ang O ay mga ulo at ang P ay mga buntot. Pagkatapos, halimbawa, ang isa sa mga kumbinasyong nababagay sa amin ay maaaring magmukhang OOPP, iyon ay:

Ang posibilidad ng naturang kumbinasyon ay katumbas ng produkto ng dalawang probabilidad na magkaroon ng mga ulo at dalawa pang probabilidad ng hindi paglabas ng mga ulo (ang reverse event na kinakalkula bilang 1-p), ibig sabihin. 0.5×0.5×(1-0.5)×(1-0.5)=0.0625. Ito ang posibilidad ng isa sa mga kumbinasyong nababagay sa atin. Ngunit ang tanong ay tungkol sa kabuuang bilang ng mga agila, at hindi tungkol sa anumang partikular na pagkakasunud-sunod. Pagkatapos ay kailangan mong idagdag ang mga posibilidad ng lahat ng mga kumbinasyon kung saan mayroong eksaktong 2 agila. Malinaw na pareho silang lahat (ang produkto ay hindi nagbabago mula sa pagbabago ng mga lugar ng mga kadahilanan). Samakatuwid, kailangan mong kalkulahin ang kanilang numero, at pagkatapos ay i-multiply sa posibilidad ng anumang naturang kumbinasyon. Bilangin natin ang lahat ng kumbinasyon ng 4 na paghagis ng 2 agila: RROO, RORO, ROOR, ORRO, OROR, OORR. 6 na pagpipilian lamang.

Samakatuwid, ang nais na posibilidad na makakuha ng 2 ulo pagkatapos ng 4 na paghagis ay 6×0.0625=0.375.

Gayunpaman, ang pagbibilang sa ganitong paraan ay nakakapagod. Nasa 10 barya na, napakahirap makuha ang kabuuang bilang ng mga opsyon sa pamamagitan ng malupit na puwersa. Samakatuwid, ang mga matalinong tao ay nag-imbento ng isang pormula sa mahabang panahon, sa tulong kung saan kinakalkula nila ang bilang ng iba't ibang mga kumbinasyon ng n mga elemento sa pamamagitan ng k, saan n ay ang kabuuang bilang ng mga elemento, k ay ang bilang ng mga elemento na ang mga pagpipilian sa pagsasaayos ay kinakalkula. Combination formula ng n mga elemento sa pamamagitan ng k ay:

Nagaganap ang mga katulad na bagay sa seksyong combinatorics. Pinapadala ko ang lahat ng gustong umunlad ang kanilang kaalaman doon. Kaya naman, ang pangalan ng binomial distribution (ang formula sa itaas ay ang koepisyent sa pagpapalawak ng Newton binomial).

Ang formula para sa pagtukoy ng posibilidad ay madaling gawing pangkalahatan sa anumang numero n at k. Bilang resulta, ang binomial distribution formula ay may sumusunod na anyo.

I-multiply ang bilang ng magkatugmang kumbinasyon sa posibilidad ng isa sa mga ito.

Para sa praktikal na paggamit, sapat na malaman lamang ang formula para sa binomial distribution. At maaaring hindi mo rin alam - sa ibaba ay kung paano matukoy ang posibilidad gamit ang Excel. Pero mas mabuting malaman.

Gamitin natin ang formula na ito upang kalkulahin ang posibilidad na makakuha ng 40 ulo sa 100 tosses:

O 1.08% lang. Para sa paghahambing, ang posibilidad ng mathematical na inaasahan ng eksperimentong ito, iyon ay, 50 heads, ay 7.96%. Ang maximum na posibilidad ng isang binomial na halaga ay nabibilang sa halaga na tumutugma sa inaasahan sa matematika.

Kinakalkula ang mga probabilidad ng binomial distribution sa Excel

Kung gumagamit ka lamang ng papel at isang calculator, kung gayon ang mga kalkulasyon gamit ang binomial distribution formula, sa kabila ng kawalan ng mga integral, ay medyo mahirap. Halimbawa, isang halaga ng 100! - may higit sa 150 character. Noong nakaraan, at kahit ngayon, tinatayang mga formula ang ginamit upang kalkulahin ang mga naturang dami. Sa ngayon, ipinapayong gumamit ng espesyal na software, tulad ng MS Excel. Kaya, ang sinumang gumagamit (kahit na isang humanist sa pamamagitan ng edukasyon) ay madaling makalkula ang posibilidad ng halaga ng isang binomially distributed random variable.

Upang pagsama-samahin ang materyal, gagamitin namin ang Excel pansamantala bilang isang regular na calculator, i.e. Gumawa tayo ng step-by-step na pagkalkula gamit ang binomial distribution formula. Kalkulahin natin, halimbawa, ang posibilidad na makakuha ng 50 ulo. Nasa ibaba ang isang larawan na may mga hakbang sa pagkalkula at ang huling resulta.

Tulad ng makikita mo, ang mga intermediate na resulta ay may sukat na hindi sila magkasya sa isang cell, kahit na ang mga simpleng function ng uri ay ginagamit sa lahat ng dako: FACTOR (factorial kalkulasyon), POWER (pagtaas ng isang numero sa isang kapangyarihan), pati na rin ang mga operator ng multiplikasyon at paghahati. Bukod dito, ang pagkalkula na ito ay medyo mahirap, sa anumang kaso hindi ito compact, dahil maraming mga cell na kasangkot. At oo, mahirap malaman ito.

Sa pangkalahatan, ang Excel ay nagbibigay ng isang handa na function para sa pagkalkula ng mga probabilidad ng binomial distribution. Tinatawag ang function BINOM.DIST.

Bilang ng mga tagumpay ay ang bilang ng mga matagumpay na pagsubok. Mayroon kaming 50 sa kanila.

Bilang ng mga pagsubok - bilang ng mga throws: 100 beses.

Probability ng Tagumpay – ang posibilidad na makakuha ng mga ulo sa isang paghagis ay 0.5.

integral - alinman sa 1 o 0 ay ipinahiwatig. Kung 0, kung gayon ang posibilidad ay kinakalkula P(B=k); kung 1, kung gayon ang binomial distribution function ay kinakalkula, i.e. kabuuan ng lahat ng probabilidad mula sa B=0 dati B=k kasama.

Pinindot namin ang OK at nakuha namin ang parehong resulta tulad ng nasa itaas, tanging ang lahat ay kinakalkula ng isang function.

Napaka komportable. Para sa kapakanan ng eksperimento, sa halip na ang huling parameter 0, inilalagay namin ang 1. Nakukuha namin ang 0.5398. Nangangahulugan ito na sa 100 coin tosses, ang posibilidad na makakuha ng mga ulo sa pagitan ng 0 at 50 ay halos 54%. At first parang dapat 50%. Sa pangkalahatan, ang mga kalkulasyon ay ginagawa nang madali at mabilis.

Dapat na maunawaan ng isang tunay na analyst kung paano kumikilos ang function (ano ang pamamahagi nito), kaya kalkulahin natin ang mga probabilidad para sa lahat ng mga halaga mula 0 hanggang 100. Iyon ay, tanungin natin ang ating sarili: ano ang posibilidad na walang isang agila ang mahuhulog , na ang 1 agila ay mahuhulog, 2, 3, 50, 90 o 100. Ang pagkalkula ay ipinapakita sa sumusunod na larawan. Ang asul na linya ay ang binomial distribution mismo, ang pulang tuldok ay ang posibilidad para sa isang tiyak na bilang ng mga tagumpay k.

Maaaring magtanong, hindi ba ang binomial distribution ay katulad ng... Oo, halos kapareho. Kahit na si De Moivre (noong 1733) ay nagsabi na sa malalaking sample ay lumalapit ang binomial distribution (hindi ko alam kung ano ang tawag noon), ngunit walang nakinig sa kanya. Tanging si Gauss, at pagkatapos ay si Laplace, pagkalipas ng 60-70 taon, ang muling natuklasan at maingat na pinag-aralan ang normal na batas sa pamamahagi. Ang graph sa itaas ay malinaw na nagpapakita na ang pinakamataas na posibilidad ay bumaba sa matematikal na inaasahan, at habang ito ay lumilihis mula dito, ito ay bumababa nang husto. Katulad ng normal na batas.

Ang binomial distribution ay may malaking praktikal na kahalagahan, madalas itong nangyayari. Gamit ang Excel, ang mga kalkulasyon ay isinasagawa nang madali at mabilis.