Geometric na pamamahagi. Mga discrete distribution sa MS EXCEL

Tinutulungan tayo ng mga istatistika sa paglutas ng maraming problema, halimbawa: kapag hindi posible na bumuo ng deterministikong modelo, kapag napakaraming salik, o kapag kailangan nating tantiyahin ang posibilidad ng itinayong modelo na isinasaalang-alang ang magagamit na data. Ang kaugnayan sa mga istatistika ay hindi maliwanag. Ito ay pinaniniwalaan na mayroong tatlong uri ng kasinungalingan: kasinungalingan, lantarang kasinungalingan at istatistika. Sa kabilang banda, maraming "mga gumagamit" ng mga istatistika ang masyadong naniniwala dito, hindi lubos na nauunawaan kung paano ito gumagana: paglalapat, halimbawa, isang pagsubok sa anumang data nang hindi sinusuri ang normalidad nito. Ang gayong kapabayaan ay maaaring makabuo ng mga seryosong pagkakamali at gawing mga haters ng mga istatistika ang "mga tagahanga" ng pagsubok. Subukan nating ilagay ang mga alon sa ibabaw ng i at alamin kung aling mga modelo ng mga random na variable ang dapat gamitin upang ilarawan ang ilang partikular na phenomena at kung anong uri ng genetic na relasyon ang umiiral sa pagitan nila.

Una sa lahat, ang materyal na ito ay magiging kawili-wili sa mga mag-aaral na nag-aaral ng probability theory at statistics, kahit na ang mga "mature" na mga espesyalista ay magagamit ito bilang isang sanggunian. Sa isa sa mga sumusunod na gawa, magpapakita ako ng isang halimbawa ng paggamit ng mga istatistika upang bumuo ng isang pagsubok para sa pagtatasa ng kahalagahan ng mga tagapagpahiwatig ng mga diskarte sa exchange trading.

Isasaalang-alang ng gawain:


Sa dulo ng artikulo ay ibibigay para sa pagmuni-muni. Ibabahagi ko ang aking mga saloobin tungkol dito sa aking susunod na artikulo.

Ang ilan sa mga ibinigay na tuloy-tuloy na pamamahagi ay mga espesyal na kaso.

Mga hiwalay na pamamahagi

Ginagamit ang mga hiwalay na distribusyon upang ilarawan ang mga kaganapang may mga hindi nakikilalang katangian na tinukoy sa mga nakahiwalay na punto. Sa madaling salita, para sa mga kaganapan na ang kinalabasan ay maaaring maiugnay sa ilang discrete na kategorya: tagumpay o kabiguan, isang integer (halimbawa, isang laro ng roulette, dice), ulo o buntot, atbp.

Ang isang discrete distribution ay inilalarawan ng posibilidad ng paglitaw ng bawat isa sa mga posibleng resulta ng isang kaganapan. Tulad ng para sa anumang pamamahagi (kabilang ang tuluy-tuloy), ang mga konsepto ng inaasahan at pagkakaiba ay tinukoy para sa mga discrete na kaganapan. Gayunpaman, dapat itong maunawaan na ang pag-asa para sa isang discrete random na kaganapan ay karaniwang hindi maisasakatuparan bilang ang kinalabasan ng isang solong random na kaganapan, ngunit sa halip bilang isang halaga kung saan ang arithmetic mean ng mga kinalabasan ng mga kaganapan ay malamang na tumaas habang tumataas ang kanilang bilang.

Sa pagmomodelo ng mga discrete random na kaganapan, ang combinatorics ay gumaganap ng isang mahalagang papel, dahil ang posibilidad ng isang kaganapan ay maaaring tukuyin bilang ang ratio ng bilang ng mga kumbinasyon na nagbibigay ng nais na resulta sa kabuuang bilang ng mga kumbinasyon. Halimbawa: mayroong 3 puting bola at 7 itim sa basket. Kapag pumili kami ng 1 bola mula sa basket, magagawa namin ito sa 10 iba't ibang paraan (kabuuang bilang ng mga kumbinasyon), ngunit 3 paraan lamang kung saan napili ang puting bola (3 kumbinasyon na nagbibigay ng kinakailangang resulta). Kaya, ang posibilidad ng pagpili ng puting bola ay: ().

Kinakailangan din na makilala sa pagitan ng mga sample na may kapalit at walang kapalit. Halimbawa, upang ilarawan ang posibilidad ng pagpili ng dalawang puting bola, mahalagang matukoy kung ang unang bola ay ibabalik sa basket. Kung hindi, kung gayon kami ay nakikitungo sa isang sample na walang kapalit () at ang posibilidad ay ang mga sumusunod: - ang posibilidad ng pagpili ng isang puting bola mula sa unang sample na pinarami ng posibilidad ng pagpili ng isang puting bola muli mula sa mga natitira sa basket . Kung ang unang bola ay ibinalik sa basket, ito ay isang return fetch (). Sa kasong ito, ang posibilidad ng pagpili ng dalawang puting bola ay .

Kung bahagyang gawing pormal ang halimbawa ng basket tulad ng sumusunod: hayaan ang kinalabasan ng isang kaganapan na kumuha ng isa sa dalawang halaga 0 o 1 na may mga probabilidad at ayon sa pagkakabanggit, kung gayon ang pamamahagi ng posibilidad na makuha ang bawat isa sa mga iminungkahing resulta ay tatawaging pamamahagi ng Bernoulli :

Ayon sa kaugalian, ang isang kinalabasan na may halagang 1 ay tinatawag na "tagumpay", at ang isang kinalabasan na may halagang 0 ay tinatawag na "kabiguan". Malinaw na ang pagkuha ng resulta na "tagumpay o kabiguan" ay nangyayari nang may posibilidad .

Inaasahan at pagkakaiba-iba ng pamamahagi ng Bernoulli:


Ang bilang ng mga tagumpay sa mga pagsubok, ang kinalabasan nito ay ibinahagi sa posibilidad ng tagumpay (halimbawa sa pagbabalik ng mga bola sa basket), ay inilalarawan ng binomial distribution:


Sa ibang paraan, masasabi nating inilalarawan ng binomial distribution ang kabuuan ng mga independiyenteng random na variable na maaaring ipamahagi na may posibilidad na magtagumpay .
Inaasahan at pagkakaiba-iba:



Ang binomial distribution ay may bisa lamang para sa reentrant sampling, iyon ay, kapag ang posibilidad ng tagumpay ay nananatiling pare-pareho para sa buong serye ng mga pagsubok.

Kung ang mga dami at may binomial na distribusyon na may mga parameter at ayon sa pagkakabanggit, ang kanilang kabuuan ay ibabahagi din nang binomial na may mga parameter .

Isipin ang isang sitwasyon kung saan kumukuha tayo ng mga bola mula sa basket at ibabalik ang mga ito hanggang sa mabunot ang isang puting bola. Ang bilang ng mga naturang operasyon ay inilalarawan ng isang geometric na pamamahagi. Sa madaling salita: inilalarawan ng geometric distribution ang bilang ng mga pagsubok sa unang tagumpay na ibinigay ang posibilidad ng tagumpay sa bawat pagsubok. Kung ang bilang ng pagsubok kung saan naganap ang tagumpay ay ipinahiwatig, ang geometric distribution ay ilalarawan ng sumusunod na formula:


Inaasahan at pagkakaiba-iba ng geometric na pamamahagi:

Ang geometric distribution ay genetically na nauugnay sa isang distribution na naglalarawan ng tuluy-tuloy na random variable: ang oras bago ang isang kaganapan, na may pare-parehong intensity ng mga kaganapan. Ang geometric distribution ay isa ring espesyal na kaso.

Ang distribusyon ng Pascal ay isang generalization ng distribusyon: inilalarawan nito ang pamamahagi ng bilang ng mga pagkabigo sa mga independiyenteng pagsubok, ang kinalabasan nito ay ibinahagi sa posibilidad ng tagumpay bago ang kabuuan ng mga tagumpay. Para sa , nakakakuha kami ng distribusyon para sa dami .


saan ang bilang ng mga kumbinasyon mula sa .

Inaasahan at pagkakaiba-iba ng negatibong pamamahagi ng binomial:



Ang kabuuan ng mga independiyenteng random na variable na ibinahagi ayon sa Pascal ay ipinamahagi din ayon sa Pascal: hayaan itong magkaroon ng distribusyon , at - . Let also be independent, tapos yung sum nila may distribution

Sa ngayon, tiningnan namin ang mga halimbawa ng mga reentrant sample, iyon ay, ang posibilidad ng isang resulta ay hindi nagbabago mula sa pagsubok patungo sa pagsubok.

Ngayon isaalang-alang ang sitwasyon nang walang kapalit at ilarawan ang posibilidad ng bilang ng mga matagumpay na sample mula sa populasyon na may paunang natukoy na bilang ng mga tagumpay at pagkabigo (isang paunang natukoy na bilang ng mga puti at itim na bola sa basket, mga trump card sa deck, mga may sira na bahagi sa laro, atbp.).

Hayaang maglaman ang kabuuang koleksyon ng mga bagay, na may label na "1" at bilang "0". Isasaalang-alang namin ang pagpili ng isang bagay na may label na "1" bilang tagumpay, at may label na "0" bilang kabiguan. Magsagawa tayo ng n pagsubok, at ang mga napiling bagay ay hindi na lalahok sa mga karagdagang pagsubok. Ang posibilidad ng tagumpay ay susunod sa isang hypergeometric distribution:


saan ang bilang ng mga kumbinasyon mula sa .

Inaasahan at pagkakaiba-iba:


Pamamahagi ng Poisson


(kinuha mula dito)

Malaki ang pagkakaiba ng distribusyon ng Poisson sa mga pamamahagi na isinasaalang-alang sa itaas sa lugar na "paksa" nito: ngayon ay hindi ang posibilidad ng isang partikular na resulta ng pagsubok ang isinasaalang-alang, ngunit ang intensity ng mga kaganapan, iyon ay, ang average na bilang ng mga kaganapan sa bawat yunit ng oras.

Inilalarawan ng distribusyon ng Poisson ang posibilidad ng paglitaw ng mga independiyenteng kaganapan sa paglipas ng panahon na may average na intensity ng mga kaganapan :


Ang inaasahan at pagkakaiba-iba ng pamamahagi ng Poisson:

Ang pagkakaiba at mean ng distribusyon ng Poisson ay magkaparehong pantay.

Ang distribusyon ng Poisson kasama ng , na naglalarawan ng mga agwat ng oras sa pagitan ng pagsisimula ng mga independiyenteng kaganapan, ay bumubuo ng mathematical na batayan ng teorya ng pagiging maaasahan.

Ang probability density ng produkto ng mga random na variable x at y () na may mga distribusyon at maaaring kalkulahin tulad ng sumusunod:

Ang ilan sa mga distribusyon sa ibaba ay mga espesyal na kaso ng pamamahagi ng Pearson, na isa namang solusyon sa equation:


kung saan at ang mga parameter ng pamamahagi. Mayroong 12 uri ng pamamahagi ng Pearson, depende sa mga halaga ng mga parameter.

Ang mga pamamahagi na tatalakayin sa seksyong ito ay may malapit na ugnayan sa isa't isa. Ang mga koneksyon na ito ay ipinahayag sa katotohanan na ang ilang mga distribusyon ay mga espesyal na kaso ng iba pang mga distribusyon, o naglalarawan ng mga pagbabagong-anyo ng mga random na variable sa iba pang mga distribusyon.

Ang diagram sa ibaba ay nagpapakita ng mga ugnayan sa pagitan ng ilan sa mga patuloy na pamamahagi na tatalakayin sa papel na ito. Sa diagram, ang mga solidong arrow ay nagpapakita ng pagbabagong-anyo ng mga random na variable (ang simula ng arrow ay nagpapahiwatig ng paunang pamamahagi, ang dulo ng arrow - ang nagresultang isa), at ang mga tuldok na arrow ay nagpapakita ng generalization relation (ang simula ng arrow ay nagpapahiwatig ang pamamahagi, na isang espesyal na kaso ng isa na ipinahiwatig sa dulo ng arrow). Para sa mga espesyal na kaso ng pamamahagi ng Pearson sa itaas ng mga tuldok-tuldok na arrow, ipinapahiwatig ang kaukulang uri ng pamamahagi ng Pearson.


Ang pangkalahatang-ideya ng mga pamamahagi na inaalok sa ibaba ay sumasaklaw sa maraming mga kaso na nangyayari sa pagsusuri ng data at pagmomodelo ng proseso, bagaman, siyempre, hindi ito ganap na naglalaman ng lahat ng mga pamamahagi na kilala sa agham.

Normal na pamamahagi (Gaussian distribution)


(kinuha mula dito)

Ang probability density ng isang normal na distribution na may mga parameter at inilalarawan ng Gaussian function:

Kung at , kung gayon ang naturang pamamahagi ay tinatawag na pamantayan.

Inaasahan at pagkakaiba-iba ng normal na distribusyon:



Ang domain ng kahulugan ng isang normal na distribusyon ay ang hanay ng mga tunay na numero.

Ang normal na pamamahagi ay isang uri ng pamamahagi ng VI.

Ang kabuuan ng mga parisukat ng mga independiyenteng normal na halaga ay mayroong , at ang ratio ng mga independiyenteng halaga ng Gaussian ay ipinamamahagi sa ibabaw .

Ang normal na distribusyon ay walang hanggan na nahahati: ang kabuuan ng mga normal na ipinamamahagi na dami at may mga parameter at ayon sa pagkakabanggit ay mayroon ding normal na distribusyon na may mga parameter , kung saan at .

Ang normal na distribution well ay nagmomodelo ng mga dami na naglalarawan ng mga natural na phenomena, ingay ng isang thermodynamic na katangian, at mga error sa pagsukat.

Bilang karagdagan, ayon sa central limit theorem, ang kabuuan ng isang malaking bilang ng mga independiyenteng termino ng parehong pagkakasunud-sunod ay nagtatagpo sa isang normal na distribusyon, anuman ang mga distribusyon ng mga termino. Dahil sa property na ito, sikat ang normal na distribution sa statistical analysis, maraming statistical test ang idinisenyo para sa normal na distributed na data.

Ang z-test ay batay sa walang katapusang divisibility ng normal na distribution. Ang pagsubok na ito ay ginagamit upang suriin kung ang inaasahan ng isang sample ng mga normal na ipinamamahagi na mga variable ay katumbas ng ilang halaga. Ang halaga ng pagkakaiba ay dapat kilala. Kung ang halaga ng pagkakaiba ay hindi alam at kinakalkula batay sa nasuri na sample, pagkatapos ay isang t-test batay sa .

Magkaroon tayo ng sample ng n independiyenteng normally distributed values ​​mula sa pangkalahatang populasyon na may standard deviation, i-hypothesize natin na . Pagkatapos ang halaga ay magkakaroon ng karaniwang normal na distribusyon. Sa pamamagitan ng paghahambing ng nakuhang halaga ng z sa mga dami ng karaniwang pamamahagi, maaari mong tanggapin o tanggihan ang hypothesis na may kinakailangang antas ng kahalagahan.

Dahil sa paglaganap ng distribusyon ng Gaussian, maraming mga mananaliksik na hindi masyadong nakakaalam ng mga istatistika ay nakakalimutang suriin ang data para sa normalidad, o suriin ang plot ng density ng pamamahagi "sa pamamagitan ng mata", bulag na naniniwala na sila ay nakikitungo sa data ng Gaussian. Alinsunod dito, matapang na nag-aaplay ng mga pagsusulit na idinisenyo para sa isang normal na pamamahagi at makakuha ng ganap na hindi tamang mga resulta. Marahil, dito nagmula ang bulung-bulungan tungkol sa mga istatistika bilang ang pinaka-kahila-hilakbot na uri ng kasinungalingan.

Isaalang-alang ang isang halimbawa: kailangan nating sukatin ang paglaban ng isang hanay ng mga resistors ng isang tiyak na halaga. Ang paglaban ay may pisikal na kalikasan, lohikal na ipagpalagay na ang pamamahagi ng mga paglihis ng paglaban mula sa nominal na halaga ay magiging normal. Sinusukat namin, nakakakuha kami ng isang hugis ng kampanilya na probability density function para sa mga sinusukat na halaga na may mode sa paligid ng rating ng risistor. Normal distribution ba ito? Kung oo, pagkatapos ay hahanapin natin ang mga may sira na resistors gamit ang , o isang z-test kung alam natin nang maaga ang pagkakaiba-iba ng pamamahagi. Sa tingin ko marami ang gagawa niyan.

Ngunit tingnan natin ang teknolohiya ng pagsukat ng paglaban: ang paglaban ay tinukoy bilang ratio ng inilapat na boltahe sa kasalukuyang daloy. Sinusukat namin ang kasalukuyang at boltahe gamit ang mga instrumento, na, sa turn, ay karaniwang namamahagi ng mga error. Iyon ay, ang mga sinusukat na halaga ng kasalukuyang at boltahe ay mga random na variable na karaniwang ipinamamahagi na may mga inaasahan sa matematika na tumutugma sa mga tunay na halaga ng mga sinusukat na dami. At nangangahulugan ito na ang nakuha na mga halaga ng paglaban ay ipinamamahagi kasama, at hindi ayon kay Gauss.

Inilalarawan ng distribusyon ang kabuuan ng mga parisukat ng mga random na variable, na ang bawat isa ay ipinamamahagi ayon sa karaniwang normal na batas:

Nasaan ang bilang ng mga antas ng kalayaan, .

Ang inaasahan at pagkakaiba-iba ng pamamahagi:



Ang domain ng kahulugan ay ang hanay ng mga di-negatibong natural na numero. ay isang walang katapusang divisible distribution. Kung ang at - ay ibinahagi sa ibabaw at mayroon at mga antas ng kalayaan, ayon sa pagkakabanggit, ang kanilang kabuuan ay ibabahagi din at magkakaroon ng mga antas ng kalayaan.

Ito ay isang espesyal na kaso (at samakatuwid ay isang uri III na pamamahagi) at isang paglalahat. Ang ratio ng mga dami na ibinahagi sa ibinahagi sa .

Nakabatay sa pamamahagi ang goodness-of-fit test ni Pearson. Ang pamantayang ito ay maaaring gamitin upang suriin kung ang isang sample ng isang random na variable ay kabilang sa isang tiyak na teoretikal na pamamahagi.

Ipagpalagay na mayroon tayong sample ng ilang random variable . Batay sa sample na ito, kinakalkula namin ang mga posibilidad na ang mga halaga ay mahuhulog sa mga pagitan (). Hayaang magkaroon din ng isang pagpapalagay tungkol sa analytical expression ng distribusyon, ayon sa kung saan, ang mga probabilidad ng pagbagsak sa mga napiling agwat ay dapat na . Pagkatapos ang mga dami ay ipamahagi ayon sa normal na batas.

Dinadala namin sa karaniwang normal na pamamahagi: ,
saan at .

Ang mga nakuhang dami ay may normal na distribusyon na may mga parameter (0, 1), at samakatuwid, ang kabuuan ng kanilang mga parisukat ay ibinahagi nang may antas ng kalayaan. Ang pagbaba sa antas ng kalayaan ay nauugnay sa isang karagdagang paghihigpit sa kabuuan ng mga probabilidad ng mga halaga na bumabagsak sa mga pagitan: dapat itong katumbas ng 1.

Sa pamamagitan ng paghahambing ng halaga sa dami ng distribusyon, maaaring tanggapin o tanggihan ng isang tao ang hypothesis tungkol sa teoretikal na pamamahagi ng data na may kinakailangang antas ng kahalagahan.

Ang pamamahagi ng Mag-aaral ay ginagamit upang magsagawa ng t-test: isang pagsubok para sa pagkakapantay-pantay ng inaasahang halaga ng isang sample ng mga ibinahagi na random na mga variable sa isang tiyak na halaga, o ang pagkakapantay-pantay ng mga inaasahang halaga ng dalawang sample na may parehong pagkakaiba ( ang pagkakapantay-pantay ng mga pagkakaiba ay dapat suriin). Inilalarawan ng t-distribution ng mag-aaral ang ratio ng isang distributed random variable sa isang value na ibinahagi sa ibabaw .

Hayaan at maging independiyenteng mga random na variable na may mga antas ng kalayaan at ayon sa pagkakabanggit. Pagkatapos ang dami ay magkakaroon ng pamamahagi ng Fisher na may mga antas ng kalayaan, at ang dami ay magkakaroon ng pamamahagi ng Fisher na may mga antas ng kalayaan.
Ang pamamahagi ng Fisher ay tinukoy para sa mga tunay na hindi negatibong argumento at may probability density:


Inaasahan at pagkakaiba-iba ng pamamahagi ng Fisher:



Ang inaasahan ay tinukoy para sa at ang pagkakaiba ay tinukoy para sa .

Ang isang bilang ng mga istatistikal na pagsusulit ay batay sa pamamahagi ng Fisher, tulad ng pagtatasa ng kahalagahan ng mga parameter ng regression, ang pagsubok para sa heteroscedasticity, at ang pagsubok para sa pagkakapantay-pantay ng mga pagkakaiba-iba ng sample (f-test, upang makilala mula sa tumpak Fisher test).

F-test: hayaang mayroong dalawang independiyenteng sample at distributed na dami ng data at ayon sa pagkakabanggit. Maglagay tayo ng hypothesis tungkol sa pagkakapantay-pantay ng mga pagkakaiba-iba ng sample at subukan ito ayon sa istatistika.

Kalkulahin natin ang halaga. Magkakaroon ito ng pamamahagi ng Fisher na may mga antas ng kalayaan.

Sa pamamagitan ng paghahambing ng halaga sa mga dami ng kaukulang distribusyon ng Fisher, maaari nating tanggapin o tanggihan ang hypothesis na ang mga pagkakaiba-iba ng sample ay katumbas ng kinakailangang antas ng kahalagahan.

Exponential (exponential) distribution at Laplace distribution (double exponential, double exponential)


(kinuha mula dito)

Inilalarawan ng exponential distribution ang mga agwat ng oras sa pagitan ng mga independiyenteng kaganapan na nangyayari sa isang mean intensity. Ang bilang ng mga paglitaw ng naturang kaganapan sa isang tiyak na tagal ng panahon ay inilarawan sa pamamagitan ng discrete . Ang exponential distribution kasama ang bumubuo sa mathematical na batayan ng teorya ng pagiging maaasahan.

Bilang karagdagan sa teorya ng pagiging maaasahan, ang exponential distribution ay ginagamit sa paglalarawan ng mga social phenomena, sa economics, sa teorya ng queuing, sa transport logistics - kung saan man ito kinakailangan upang i-modelo ang daloy ng mga kaganapan.

Ang exponential distribution ay isang espesyal na kaso (para sa n=2), at samakatuwid . Dahil ang exponentially distributed quantity ay isang chi-square quantity na may 2 degrees ng kalayaan, maaari itong bigyang kahulugan bilang ang kabuuan ng mga parisukat ng dalawang independiyenteng normally distributed na dami.

Gayundin, ang exponential distribution ay isang matapat na kaso

Hayaang maputok ang target bago ang unang tama, na may posibilidad p ang pagtama sa target sa bawat shot ay pareho at hindi nakadepende sa resulta ng mga nakaraang shot. Sa madaling salita, ang Bernoulli scheme ay ipinatupad sa eksperimento na isinasaalang-alang. Bilang isang random na variable X isasaalang-alang namin ang bilang ng mga putok. Malinaw, ang mga posibleng halaga ng random variable X ay mga natural na numero: x 1 =1, x 2 = 2, ... pagkatapos ay ang posibilidad na k ang mga shot ay magiging katumbas ng

Paglalagay sa formula na ito k=1,2, ... nakakakuha tayo ng geometric progression sa unang termino p at multiplier q:

Para sa kadahilanang ito, ang distribusyon na tinukoy ng formula (6.11) ay tinatawag geometriko .

Gamit ang formula para sa kabuuan ng isang walang katapusang pagbaba ng geometric na pag-unlad, madaling i-verify iyon

.

Hanapin natin ang mga numerical na katangian ng geometric distribution.

Sa pamamagitan ng kahulugan ng mathematical na inaasahan para sa DSW, mayroon kami

.

Kinakalkula namin ang pagpapakalat sa pamamagitan ng formula

.

Para dito nahanap namin

.

Kaya naman,

.

Kaya, ang mathematical na inaasahan at pagkakaiba-iba ng geometric distribution ay

. (6.12)

6.4.* Pagbuo ng function

Kapag nilulutas ang mga problemang nauugnay sa DSV, kadalasang ginagamit ang mga pamamaraan ng combinatorics. Ang isa sa mga pinaka-binuo na teoretikal na pamamaraan ng combinatorial analysis ay ang paraan ng pagbuo ng mga function, na isa sa pinakamakapangyarihang pamamaraan sa mga aplikasyon. Kilalanin natin siya sandali.

Kung ang random variable  ay kumukuha lamang ng mga non-negative na integer na halaga, i.e.

,

pagkatapos pagbuo ng function ang probability distribution ng isang random variable  ay tinatawag na function

, (6.13)

saan z ay isang tunay o kumplikadong variable. Tandaan na sa pagitan ng hanay ng pagbuo ng mga function  ( x)at maraming distribusyon(P(= k)} mayroong isa-sa-isang sulat.

Hayaang magkaroon ang random variable na  binomial na pamamahagi

.

Pagkatapos, gamit ang binomial formula ng Newton, nakukuha namin

,

mga. pagbuo ng function ng binomial distribution may porma

. (6.14)

Addendum. Poisson distribution generating function

may porma

. (6.15)

Pagbuo ng function ng geometric distribution

may porma

. (6.16)

Sa tulong ng pagbuo ng mga function, ito ay maginhawa upang mahanap ang mga pangunahing numerical na katangian ng DSW. Halimbawa, ang una at pangalawang paunang sandali ay nauugnay sa pagbuo ng function sa pamamagitan ng mga sumusunod na pagkakapantay-pantay:

, (6.17)

. (6.18)

Ang paraan ng pagbuo ng mga function ay madalas na maginhawa dahil sa ilang mga kaso ang distribution function ng DSW ay napakahirap matukoy, habang ang pagbuo ng function ay minsan madaling mahanap. Halimbawa, isaalang-alang ang pamamaraan ng magkakasunod na independyenteng mga pagsubok sa Bernoulli, ngunit gumawa ng isang pagbabago dito. Hayaan ang posibilidad ng kaganapan A iba-iba sa bawat pagsubok. Nangangahulugan ito na ang Bernoulli formula para sa gayong pamamaraan ay nagiging hindi nalalapat. Ang gawain ng paghahanap ng function ng pamamahagi sa kasong ito ay nagpapakita ng malaking paghihirap. Gayunpaman, para sa isang naibigay na circuit, ang pagbuo ng function ay madaling mahanap, at, dahil dito, ang mga kaukulang numerical na katangian ay madaling mahanap.

Ang malawakang paggamit ng pagbuo ng mga function ay batay sa katotohanan na ang pag-aaral ng mga kabuuan ng mga random na variable ay maaaring mapalitan ng pag-aaral ng mga produkto ng kaukulang pagbuo ng mga function. Kaya, kung  1 ,  2 , …,  n independyente, kung gayon

Hayaan p k =P k (A) ay ang posibilidad ng "tagumpay" sa k-th test sa Bernoulli scheme (ayon sa pagkakabanggit, q k =1–p k- ang posibilidad ng "kabiguan" sa k ika pagsubok). Pagkatapos, alinsunod sa formula (6.19), ang pagbuo ng function ay magkakaroon ng form

. (6.20)

Gamit ang pagbuo ng function na ito, maaari tayong magsulat

.

Ito ay isinasaalang-alang dito na p k + q k=1. Ngayon, gamit ang formula (6.1), nakita namin ang pangalawang paunang sandali. Upang gawin ito, mag-compute muna kami

at
.

Sa isang partikular na kaso p 1 =p 2 =…=p n =p(i.e. sa kaso ng binomial distribution) ito ay sumusunod mula sa mga nakuhang formula na M= np, D= npq.

Sa geometric distribution, ang mga eksperimento sa Bernoulli scheme ay isinasagawa hanggang sa unang tagumpay, na may posibilidad na magtagumpay p sa isang eksperimento.
Ang mga halimbawa ng naturang mga halaga ay maaaring:

  • bilang ng mga shot bago ang unang hit;
  • bilang ng mga pagsubok ng aparato bago ang unang pagkabigo;
  • ang bilang ng mga bola bago ang unang paglitaw ng puti. tingnan ang solusyon;
  • ang bilang ng mga paghagis ng isang barya bago ang mga unang buntot, atbp.
Ang geometric distribution series ng DSW ay may anyo:
X 1 2 3 m
p p qp q 2 p q m-1 p

Ang mga probabilidad ay bumubuo ng isang geometric na pag-unlad na may unang termino na p at ang denominator na q.
Ang mathematical expectation at variance ng random variable X, na may geometric distribution na may parameter p, ay katumbas ng:

Hypergeometric distribution

Ang isang discrete random variable ay may hypergeometric distribution na may mga parameter n, k, m kung ito ay kukuha ng mga halaga 0, 1, 2, ... na may mga probabilidad. .
Ang hypergeometric distribution ay may random variable X na katumbas ng bilang ng mga object na may isang naibigay na property sa mga m object na random na nakuha (nang walang kapalit) mula sa isang set ng n object, k ng mga ito ay may ganitong property.
Halimbawa:
  • Sa isang batch ng 10 bahagi, 3 ay may depekto. 4 na item ang tinanggal. Ang X ay ang bilang ng mga magagandang bahagi sa mga nakuha. (m = 4, n = 10, k = 3). tingnan ang solusyon
Ang mathematical na inaasahan ng isang random na variable X, na mayroong hypergeometric distribution, at ang pagkakaiba nito ay katumbas ng:

Halimbawa #1. Ang isang urn ay naglalaman ng 2 puti at 3 itim na bola. Ang mga bola ay kinukuha nang random mula sa urn nang walang kapalit hanggang lumitaw ang isang puting bola. Sa sandaling mangyari ito, hihinto ang proseso. Gumawa ng talahanayan ng pamamahagi ng isang random na variable X - ang bilang ng mga eksperimento na isinagawa, hanapin ang F(x), P(X ≤ 2), M(X), D(X).
Desisyon: Ipahiwatig ng A - ang hitsura ng isang puting bola. Isang beses lang maisagawa ang isang eksperimento kung agad na lilitaw ang puting bola: . Kung sa unang pagkakataon ay hindi lumitaw ang puting bola, ngunit lumitaw sa ikalawang pagkuha, kung gayon X=2. Ang posibilidad ng naturang kaganapan ay . Katulad nito: , , . Isulat natin ang data sa talahanayan:


X

1

2

3

4

P

0,4

0,3

0,2

0,1

Hanapin ang F(x):

Hanapin ang P(X ≤ 2) = P(X = 1 o X = 2) = 0.4 + 0.3 = 0.7
M(X) = 1 0.4 + 2 0.3 + 3 0.2 + 4 0.1 = 2.
D(X) = (1-2) 2 0.4 + (2-2) 2 0.3 + (3-2) 2 0.2 + (4-2) 2 0.1 = 1 .

Halimbawa #2. Ang kahon ay naglalaman ng 11 bahagi, 5 sa mga ito ay may depekto. Ang assembler ay kumukuha ng 4 na piraso nang random.
1. Hanapin ang posibilidad na kabilang sa mga nakuhang bahagi: a) 4 may depekto; b) isang may depekto; c) dalawang may depekto; d) kahit isa ay may depekto.
2. Iguhit ang batas ng distribusyon ng isang random variable X- ang bilang ng mga may sira na bahagi sa mga nakuha.
3. Hanapin ang M(X), D(X), σ(X).
4. Kalkulahin P(1
Desisyon:
1. Hanapin ang posibilidad na kabilang sa mga nakuhang bahagi:
a) 4 may depekto;

b) isang may depekto;
Ang kabuuang bilang ng mga posibleng elemental na kinalabasan para sa mga pagsubok na ito ay katumbas ng bilang ng mga paraan kung saan maaaring makuha ang 4 na bahagi sa 11:

Kalkulahin natin ang bilang ng mga resulta na pabor sa kaganapang ito (sa 4 na bahagi, eksaktong 1 bahagi ang may depekto):

Ang natitirang 3 bahagi ay maaaring mapili mula sa 7:

Samakatuwid, ang bilang ng mga kanais-nais na resulta ay: 5*20 = 100
Ang gustong probabilidad ay katumbas ng ratio ng bilang ng mga kinalabasan na pumapabor sa kaganapan sa bilang ng lahat ng elementarya na kinalabasan: P(1) = 100/330 = 0.303
c) dalawang may depekto;

d) kahit isa ay may depekto.
Probability na walang mga defective parts. X = 0.

Kung gayon ang posibilidad na hindi bababa sa isang may depekto ay:
P = 1 - P(0) = 1 - 0.0455 = 0.95

2. Bumuo ng batas sa pamamahagi P(x), X - ang bilang ng mga may sira na bahagi sa mga nakuha.
Hanapin ang posibilidad ng tatlong may sira na produkto.


X

0

1

2

3

4

P

0,0455

0,303

0,4545

0,182

0,015

2. Hanapin M(X), D(X),σ(X).
Ang mathematical expectation ay matatagpuan sa pamamagitan ng formula m = ∑x i p i .
Pag-asa sa matematika M[X].
M[x] = 0*0.0455 + 1*0.303 + 2*0.4545 + 3*0.182 + 4*0.015 = 1.818
Ang dispersion ay matatagpuan sa pamamagitan ng formula d = ∑x 2 i p i - M[x] 2 .
Dispersion D[X].
D[X] = 0 2 *0.0455 + 1 2 *0.303 + 2 2 *0.4545 + 3 2 *0.182 + 4 2 *0.015 - 1.818 2 = 0.694
Standard deviation σ(x).

3. Kalkulahin ang P(1 F(x≤0) = 0
F(0< x ≤1) = 0.0455
F(1< x ≤2) = 0.303 + 0.0455 = 0.349
F(2< x ≤3) = 0.455 + 0.349 = 0.803
F(3< x ≤4) = 0.182 + 0.803 = 0.985
F(x>4) = 1
Ang posibilidad ng isang SW na mahulog sa isang partikular na pagitan ay matatagpuan sa pamamagitan ng formula:
P(a ≤ X< b) = F(b) - F(a)
Hanapin ang posibilidad na ang SW ay nasa pagitan 1 ≤ X< 4
P(1 ≤ X< 4) = F(4) - F(1) = 0.985 - 0.0455 = 0.9395

Halimbawa #3. Mayroong 7 bahagi sa lote, 3 ay may depekto. Ang controller ay kumukuha ng 4 na bahagi nang random. Gumawa ng batas sa pamamahagi para sa isang random na variable X - ang bilang ng magagandang bahagi sa sample. Hanapin ang mathematical expectation at variance X. I-plot ang distribution function.
Kabuuang magagandang bahagi: 7-3 = 4
1. Hanapin ang posibilidad na sa mga napiling 4 na bahagi ang isa ay magagamit.
Ang kabuuang bilang ng mga posibleng elemental na resulta para sa mga pagsubok na ito ay katumbas ng bilang ng mga paraan kung saan ang 4 na bahagi sa 7 ay maaaring makuha:

Kalkulahin natin ang bilang ng mga resulta na pumapabor sa kaganapang ito.

Isaalang-alang ang Geometric distribution, kalkulahin ang mathematical expectation at variance nito. Gamit ang MS EXCEL function na OTRBINOM.DIST(), ilalagay namin ang distribution function at probability density graphs.

Geometric na pamamahagi(Ingles) Geometric na pamamahagi) ay isang espesyal na kaso (para sa r=1).

Hayaang magsagawa ng mga pagsubok, sa bawat isa kung saan ang kaganapang "tagumpay" lamang ang maaaring mangyari nang may posibilidad p o ang kaganapang "pagkabigo" na may posibilidad q =1-p().

Tukuyin natin x bilang bilang ng pagsubok kung saan ito nakarehistro una tagumpay. Sa kasong ito, ang random variable x Magkakaroon Geometric distribution:

Geometric distribution sa MS EXCEL

Sa MS EXCEL, simula sa bersyon 2010, para sa Negatibo Binomial na pamamahagi mayroong isang function NEGBINOM.DIST() , ang Ingles na pangalan ay NEGBINOM.DIST(), na nagpapahintulot sa iyo na kalkulahin ang posibilidad ng paglitaw bilang ng mga pagkabigo hanggang sa makuha ang isang naibigay na bilang ng mga tagumpay para sa isang ibinigay na posibilidad ng tagumpay.

Para sa geometric na pamamahagi ang pangalawang argumento sa function na ito ay dapat na 1, dahil kami ay interesado lamang sa unang tagumpay.

Ang kahulugan na ito ay bahagyang naiiba mula sa isa sa itaas, na kinakalkula ang posibilidad na ang unang tagumpay ay magaganap pagkatapos xmga pagsubok. Ang pagkakaiba ay bumababa sa hanay ng pagbabago ng hanay x: kung ang posibilidad ay tinukoy sa mga tuntunin ng bilang ng mga pagsubok, kung gayon X ay maaaring tumagal ng mga halaga simula sa 1, at kung sa pamamagitan ng bilang ng mga pagkabigo, pagkatapos ay simula sa 0. Samakatuwid, ang sumusunod na formula ay wasto: p(x_ mga kabiguan)=p(x_ mga pagsubok-isa). Cm. halimbawa file sheet Halimbawa, kung saan 2 paraan ng pagkalkula ang ibinigay.

Ang diskarte na kinuha sa MS EXCEL function ay ginagamit sa ibaba: sa pamamagitan ng bilang ng mga pagkabigo.

Upang makalkula probability density function p(x), tingnan ang formula sa itaas, kailangan mong itakda ang pang-apat na argumento sa INTBINOM.DIST() function sa FALSE. Upang makalkula , dapat mong itakda ang ikaapat na argumento sa TRUE.

Tandaan : Bago ang MS EXCEL 2010, ang EXCEL ay may function na INTERBINOMDIST() na nagpapahintulot sa iyo na kalkulahin lamang density ng posibilidad. Ang sample na file ay naglalaman ng isang formula batay sa INTBINOMDIST() function upang kalkulahin integral distribution function. Mayroon ding formula para sa pagkalkula ng posibilidad sa pamamagitan ng kahulugan.

Ang halimbawang file ay naglalaman ng mga graph probability distribution density at integral distribution function.

Tandaan: Para sa kaginhawahan ng pagsulat ng mga formula para sa p parameter, a .

Tandaan: Sa pag-andar DISTBINOM.DIST( ) na may halagang hindi integer X, . Halimbawa, ang mga sumusunod na formula ay magbabalik ng parehong halaga:
DISTBINOM.DIST( 2 ; isa; 0.4; TOTOO)=
DISTBINOM.DIST( 2,9 ; isa; 0.4; TOTOO)

Mga gawain

Ang mga solusyon sa problema ay ibinigay sa halimbawa ng file sa sheet Halimbawa.

Gawain 1. Ang isang kumpanya ng langis ay nag-drill ng mga balon upang kumuha ng langis. Ang posibilidad na makahanap ng langis sa isang balon ay 20%.
Ano ang posibilidad na ang unang langis ay makukuha sa ikatlong pagtatangka?
Ano ang posibilidad na kukuha ng tatlong pagtatangka upang mahanap ang unang langis?
Solusyon1:
=INTERBINOM.DIST(3-1, 1, 0.2, FALSE)
=INTERBINOM.DIST(3-1, 1, 0.2, TRUE)

Gawain2. Ang ahensya ng rating ay gumagawa ng isang survey ng mga random na dumadaan sa lungsod tungkol sa kanilang paboritong tatak ng kotse. Ipaalam na ang 1% ng mga mamamayan ay may paboritong kotse LadaGranta. Ano ang posibilidad na makikilala mo ang unang humahanga sa tatak na ito ng kotse pagkatapos ng isang survey sa 10 tao?
Solusyon2: \u003d OTRBINOM.DIST (10-1, 1, 0.01; TOTOO)=9,56%

Maaari nating isa-isahin ang mga pinakakaraniwang batas ng pamamahagi ng mga discrete random variable:

  • Binomial distribution law
  • Batas sa pamamahagi ng Poisson
  • Batas sa pamamahagi ng geometriko
  • Batas sa pamamahagi ng hypergeometric

Para sa mga ibinigay na distribusyon ng mga discrete random variable, ang pagkalkula ng mga probabilidad ng kanilang mga halaga, pati na rin ang mga numerical na katangian (pang-matematika na inaasahan, pagkakaiba, atbp.) ay isinasagawa ayon sa ilang "mga formula". Samakatuwid, napakahalagang malaman ang mga ganitong uri ng pamamahagi at ang kanilang mga pangunahing katangian.


1. Binomial distribution law.

Ang isang discrete random variable na $X$ ay napapailalim sa binomial probability distribution kung kukuha ito ng mga value na $0,\ 1,\ 2,\ \dots ,\ n$ na may probabilities $P\left(X=k\right)= C^k_n\cdot p^k\cdot (\kaliwa(1-p\kanan))^(n-k)$. Sa katunayan, ang random na variable na $X$ ay ang bilang ng mga paglitaw ng kaganapang $A$ sa $n$ na mga independiyenteng pagsubok. Batas sa pamamahagi ng probabilidad para sa random variable na $X$:

$\begin(array)(|c|c|)
\hline
X_i & 0 & 1 & \dots & n \\
\hline
p_i & P_n\left(0\right) & P_n\left(1\right) & \dots & P_n\left(n\right) \\
\hline
\end(array)$

Para sa gayong random na variable, ang inaasahan ay $M\left(X\right)=np$, ang variance ay $D\left(X\right)=np\left(1-p\right)$.

Halimbawa . May dalawang anak sa pamilya. Ipagpalagay na ang mga probabilidad ng kapanganakan ng isang lalaki at isang babae ay katumbas ng $0.5$, hanapin ang batas ng pamamahagi ng random variable na $\xi $ - ang bilang ng mga lalaki sa pamilya.

Hayaang ang random variable na $\xi $ ang bilang ng mga lalaki sa pamilya. Ang mga halaga na maaaring kunin ng $\xi:\ 0,\ ​​​​1,\ 2$. Ang mga probabilidad ng mga halagang ito ay matatagpuan sa pamamagitan ng formula na $P\left(\xi =k\right)=C^k_n\cdot p^k\cdot (\left(1-p\right))^(n-k )$, kung saan $n =2$ - bilang ng mga independiyenteng pagsubok, $p=0.5$ - posibilidad ng paglitaw ng isang kaganapan sa isang serye ng $n$ na pagsubok. Nakukuha namin:

$P\left(\xi =0\right)=C^0_2\cdot (0.5)^0\cdot (\left(1-0.5\right))^(2-0)=(0, 5)^2 =0.25;$

$P\left(\xi =1\right)=C^1_2\cdot 0.5\cdot (\left(1-0.5\right))^(2-1)=2\cdot 0.5\ cdot 0.5=0.5;$

$P\left(\xi =2\right)=C^2_2\cdot (0,5)^2\cdot (\left(1-0,5\right))^(2-2)=(0, 5)^2=0.25.$

Kung gayon ang batas sa pamamahagi ng random variable na $\xi $ ay ang pagsusulatan sa pagitan ng mga halaga $0,\ 1,\ 2$ at ang kanilang mga probabilities, i.e.:

$\begin(array)(|c|c|)
\hline
\xi & 0 & 1 & 2 \\
\hline
P(\xi) & 0.25 & 0.5 & 0.25 \\
\hline
\end(array)$

Ang kabuuan ng mga probabilidad sa batas sa pamamahagi ay dapat na katumbas ng $1$, ibig sabihin, $\sum _(i=1)^(n)P(\xi _((\rm i)))=0.25+0.5+0, 25 =$1.

Inaasahan $M\left(\xi \right)=np=2\cdot 0.5=1$, variance $D\left(\xi \right)=np\left(1-p\right)=2\ cdot 0.5\ cdot 0.5=0.5$, karaniwang deviation $\sigma \left(\xi \right)=\sqrt(D\left(\xi \right))=\sqrt(0.5 )\approx $0.707.

2. Batas sa pamamahagi ng Poisson.

Kung ang isang discrete random variable na $X$ ay maaari lamang kumuha ng mga non-negative integer values ​​​​$0,\ 1,\ 2,\ \dots ,\ n$ na may probabilities na $P\left(X=k\right)=((( \lambda )^k )\over (k}\cdot e^{-\lambda }$, то говорят, что она подчинена закону распределения Пуассона с параметром $\lambda $. Для такой случайной величины математическое ожидание и дисперсия равны между собой и равны параметру $\lambda $, то есть $M\left(X\right)=D\left(X\right)=\lambda $.!}

Magkomento. Ang kakaiba ng distribusyon na ito ay, batay sa pang-eksperimentong data, makikita natin ang mga pagtatantya na $M\kaliwa(X\kanan),\ D\kaliwa(X\kanan)$, kung ang mga nakuhang pagtatantya ay malapit sa isa't isa, kung gayon kami may dahilan upang igiit na ang random variable ay napapailalim sa Poisson distribution law.

Halimbawa . Ang mga halimbawa ng mga random na variable na napapailalim sa batas sa pamamahagi ng Poisson ay maaaring: ang bilang ng mga sasakyan na serbisyuhan bukas ng isang gasolinahan; ang bilang ng mga may sira na bagay sa ginawang produkto.

Halimbawa . Nagpadala ang planta ng $500$ ng mga produkto sa base. Ang posibilidad ng pagkasira ng produkto sa pagpapadala ay $0.002$. Hanapin ang batas ng pamamahagi ng random variable na $X$ na katumbas ng bilang ng mga nasirang produkto; na katumbas ng $M\left(X\right),\ D\left(X\right)$.

Hayaan ang isang discrete random variable na $X$ ang bilang ng mga nasirang produkto. Ang nasabing random na variable ay napapailalim sa Poisson distribution law na may parameter na $\lambda =np=500\cdot 0.002=1$. Ang mga probabilidad ng mga halaga ay $P\left(X=k\right)=(((\lambda )^k)\over (k}\cdot e^{-\lambda }$. Очевидно, что все вероятности всех значений $X=0,\ 1,\ \dots ,\ 500$ перечислить невозможно, поэтому мы ограничимся лишь первыми несколькими значениями.!}

$P\left(X=0\right)=((1^0)\over (0}\cdot e^{-1}=0,368;$!}

$P\left(X=1\right)=((1^1)\over (1}\cdot e^{-1}=0,368;$!}

$P\left(X=2\right)=((1^2)\over (2}\cdot e^{-1}=0,184;$!}

$P\left(X=3\right)=((1^3)\over (3}\cdot e^{-1}=0,061;$!}

$P\left(X=4\right)=((1^4)\over (4}\cdot e^{-1}=0,015;$!}

$P\left(X=5\right)=((1^5)\over (5}\cdot e^{-1}=0,003;$!}

$P\left(X=6\right)=((1^6)\over (6}\cdot e^{-1}=0,001;$!}

$P\left(X=k\right)=(((\lambda )^k)\over (k}\cdot e^{-\lambda }$!}

Ang batas sa pamamahagi ng random variable na $X$:

$\begin(array)(|c|c|)
\hline
X_i & 0 & 1 & 2 & 3 & 4 & 5 & 6 & ... & k \\
\hline
P_i & 0.368; & 0.368 & 0.184 & 0.061 & 0.015 & 0.003 & 0.001 & ... & (((\lambda )^k)\over (k}\cdot e^{-\lambda } \\!}
\hline
\end(array)$

Para sa gayong random na variable, ang mathematical expectation at variance ay katumbas ng isa't isa at katumbas ng parameter na $\lambda $, ibig sabihin, $M\left(X\right)=D\left(X\right)=\lambda =1 $.

3. Geometric na batas ng pamamahagi.

Kung ang isang discrete random variable na $X$ ay maaari lamang kumuha ng mga natural na halaga $1,\ 2,\ \dots ,\ n$ na may probabilities $P\left(X=k\right)=p(\left(1-p\ kanan)) ^(k-1),\ k=1,\ 2,\ 3,\ \dots $, pagkatapos ay sasabihin namin na ang gayong random na variable na $X$ ay napapailalim sa geometric law ng probability distribution. Sa katunayan, ang geometric distribution ay lumilitaw na mga pagsubok ni Bernoulli sa unang tagumpay.

Halimbawa . Ang mga halimbawa ng mga random na variable na may geometric distribution ay maaaring: ang bilang ng mga shot bago ang unang hit sa target; bilang ng mga pagsubok ng aparato bago ang unang pagkabigo; ang bilang ng mga coin tosses bago ang unang heads up, at iba pa.

Ang mathematical na inaasahan at pagkakaiba ng isang random na variable na napapailalim sa isang geometric distribution ay ayon sa pagkakabanggit $M\left(X\right)=1/p$, $D\left(X\right)=\left(1-p\right) /p^ 2$.

Halimbawa . Sa paraan ng paggalaw ng isda patungo sa lugar ng pangingitlog ay mayroong $4$ lock. Ang posibilidad ng isang isda na dumaan sa bawat kandado ay $p=3/5$. Bumuo ng serye ng pamamahagi ng random variable na $X$ - ang bilang ng mga kandado na ipinasa ng isda bago ang unang paghinto sa lock. Hanapin ang $M\left(X\right),\ D\left(X\right),\ \sigma \left(X\right)$.

Hayaang ang random variable na $X$ ang bilang ng mga sluices na dinaanan ng isda bago ang unang stop sa sluice. Ang nasabing random variable ay napapailalim sa geometric law ng probability distribution. Ang mga halaga na maaaring kunin ng random variable na $X ay: 1, 2, 3, 4. Ang mga probabilidad ng mga halagang ito ay kinakalkula ng formula: $P\left(X=k\right)=pq^( k-1)$, kung saan: $ p=2/5$ - posibilidad na mahuli ang isda sa pamamagitan ng kandado, $q=1-p=3/5$ - posibilidad na dumaan ang isda sa kandado, $k=1, \ 2,\ 3,\ 4$.

$P\left(X=1\right)=((2)\over (5))\cdot (\left(((3)\over (5))\right))^0=((2)\ over(5))=0.4;$

$P\left(X=2\right)=((2)\over (5))\cdot ((3)\over (5))=((6)\over (25))=0.24; $

$P\left(X=3\right)=((2)\over (5))\cdot (\left(((3)\over (5))\right))^2=((2)\ mahigit (5))\cdot ((9)\over (25))=((18)\over (125))=0.144;$

$P\left(X=4\right)=((2)\over (5))\cdot (\left(((3)\over (5))\right))^3+(\left(( (3)\over (5))\right))^4=((27)\over (125))=0.216.$

$\begin(array)(|c|c|)
\hline
X_i & 1 & 2 & 3 & 4 \\
\hline
P\left(X_i\right) & 0.4 & 0.24 & 0.144 & 0.216 \\
\hline
\end(array)$

Inaasahang halaga:

$M\left(X\right)=\sum^n_(i=1)(x_ip_i)=1\cdot 0.4+2\cdot 0.24+3\cdot 0.144+4\cdot 0.216=2.176.$

pagpapakalat:

$D\left(X\right)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\right)\right))^2=)0,4\cdot (\ kaliwa(1-2,176\kanan))^2+0,24\cdot (\kaliwa(2-2,176\kanan))^2+0,144\cdot (\kaliwa(3-2,176\kanan))^2+$

$+\ 0.216\cdot (\kaliwa(4-2.176\kanan))^2\approx 1.377.$

Karaniwang lihis:

$\sigma \left(X\right)=\sqrt(D\left(X\right))=\sqrt(1,377)\approx 1,173.$

4. Batas sa pamamahagi ng hypergeometric.

Kung mayroong $N$ na mga bagay, kung saan ang $m$ na mga bagay ay may ibinigay na katangian. Random, nang walang kapalit, ang mga $n$ na bagay ay kinukuha, kung saan mayroong mga $k$ na bagay na may ibinigay na pag-aari. Ginagawang posible ng hypergeometric distribution na matantya ang posibilidad na ang eksaktong $k$ na mga bagay sa isang sample ay may ibinigay na katangian. Hayaang ang random variable na $X$ ay ang bilang ng mga bagay sa sample na may ibinigay na property. Pagkatapos ang mga probabilidad ng mga halaga ng random variable na $X$:

$P\left(X=k\right)=((C^k_mC^(n-k)_(N-m))\over (C^n_N))$

Magkomento. Ang HYPERGEOMET statistical function ng Excel $f_x$ Function Wizard ay nagpapahintulot sa iyo na matukoy ang posibilidad na ang isang tiyak na bilang ng mga pagsubok ay magiging matagumpay.

$f_x\to $ istatistika$\to$ HYPERGEOMET$\to$ OK. May lalabas na dialog box na kailangan mong punan. Sa graph Bilang_ng_mga_tagumpay_sa_sample tukuyin ang halaga ng $k$. sample_size katumbas ng $n$. Sa graph Bilang_ng_tagumpay_sa_populasyon tukuyin ang halaga ng $m$. Laki ng populasyon katumbas ng $N$.

Ang mathematical na inaasahan at pagkakaiba ng isang discrete random variable na $X$ na napapailalim sa isang geometric distribution law ay $M\left(X\right)=nm/N$, $D\left(X\right)=((nm\left) (1 -((m)\over (N))\right)\left(1-((n)\over (N))\right))\over (N-1))$.

Halimbawa . Ang departamento ng kredito ng bangko ay gumagamit ng 5 mga espesyalista na may mas mataas na edukasyon sa pananalapi at 3 mga espesyalista na may mas mataas na legal na edukasyon. Nagpasya ang pamamahala ng bangko na magpadala ng 3 mga espesyalista para sa advanced na pagsasanay, na pinipili sila nang random.

a) Gumawa ng serye ng pamamahagi ng bilang ng mga espesyalista na may mas mataas na edukasyon sa pananalapi na maaaring ituro sa advanced na pagsasanay;

b) Hanapin ang mga numerical na katangian ng distribusyon na ito.

Hayaang ang random variable na $X$ ay ang bilang ng mga espesyalista na may mas mataas na edukasyong pinansyal sa tatlong napili. Mga value na maaaring kunin ng $X:0,\ 1,\ 2,\ 3$. Ang random variable na ito na $X$ ay ipinamamahagi ayon sa hypergeometric distribution na may mga sumusunod na parameter: $N=8$ - laki ng populasyon, $m=5$ - bilang ng mga tagumpay sa populasyon, $n=3$ - laki ng sample, $ k=0,\ 1, \ 2,\ 3$ - bilang ng mga tagumpay sa sample. Pagkatapos ay ang mga probabilities na $P\left(X=k\right)$ ay maaaring kalkulahin gamit ang formula: $P(X=k)=(C_(m)^(k) \cdot C_(N-m)^(n-k) \ higit sa C_( N)^(n) ) $. Meron kami:

$P\left(X=0\right)=((C^0_5\cdot C^3_3)\over (C^3_8))=((1)\over (56))\approx 0.018;$

$P\left(X=1\right)=((C^1_5\cdot C^2_3)\over (C^3_8))=((15)\over (56))\approx 0.268;$

$P\left(X=2\right)=((C^2_5\cdot C^1_3)\over (C^3_8))=((15)\over (28))\approx 0.536;$

$P\left(X=3\right)=((C^3_5\cdot C^0_3)\over (C^3_8))=((5)\over (28))\approx 0.179.$

Pagkatapos ang serye ng pamamahagi ng random variable na $X$:

$\begin(array)(|c|c|)
\hline
X_i & 0 & 1 & 2 & 3 \\
\hline
p_i & 0.018 & 0.268 & 0.536 & 0.179 \\
\hline
\end(array)$

Kalkulahin natin ang mga numerical na katangian ng random variable na $X$ gamit ang mga pangkalahatang formula ng hypergeometric distribution.

$M\left(X\right)=((nm)\over (N))=((3\cdot 5)\over (8))=((15)\over (8))=1,875.$

$D\left(X\right)=((nm\left(1-((m)\over (N))\right)\left(1-((n)\over (N))\right)) \over (N-1))=((3\cdot 5\cdot \left(1-((5)\over (8))\right)\cdot \left(1-((3)\over (8) ))\kanan))\over (8-1))=((225)\over (448))\approx 0.502.$

$\sigma \left(X\right)=\sqrt(D\left(X\right))=\sqrt(0.502)\approx 0.7085.$