Continuous random variable, distribution function at probability density. Distribution function ng isang random variable

Inaasahang halaga

Pagpapakalat tuluy-tuloy na random na variable X, ang mga posibleng halaga na nabibilang sa buong axis na Ox, ay tinutukoy ng pagkakapantay-pantay:

Pagtatalaga ng serbisyo. Ang online na calculator ay idinisenyo upang malutas ang mga problema kung saan ang alinman density ng pamamahagi f(x) , o distribution function F(x) (tingnan ang halimbawa). Karaniwan sa ganitong mga gawain ay kinakailangan upang mahanap mathematical expectation, standard deviation, plot the functions f(x) and F(x).

Pagtuturo. Piliin ang uri ng input data: distribution density f(x) o distribution function F(x) .

Given the distribution density f(x) Given the distribution function F(x)

Ang density ng pamamahagi f(x) ay ibinibigay:

Ang distribution function na F(x) ay ibinigay:

Ang isang tuluy-tuloy na random na variable ay ibinibigay ng probability density
(Batas ng pamamahagi ni Rayleigh - ginagamit sa engineering ng radyo). Hanapin ang M(x) , D(x) .

Ang random variable X ay tinatawag tuloy-tuloy , kung ang function ng pamamahagi nito F(X)=P(X< x) непрерывна и имеет производную.
Ang distribution function ng isang tuluy-tuloy na random variable ay ginagamit upang kalkulahin ang mga probabilities ng isang random variable na nahuhulog sa isang naibigay na agwat:
P(α< X < β)=F(β) - F(α)
saka, para sa isang tuluy-tuloy na random na variable, hindi mahalaga kung ang mga hangganan nito ay kasama sa pagitan na ito o hindi:
P(α< X < β) = P(α ≤ X < β) = P(α ≤ X ≤ β)
Densidad ng pamamahagi Ang tuluy-tuloy na random variable ay tinatawag na function
f(x)=F'(x) , derivative ng distribution function.

Mga Katangian ng Densidad ng Distribusyon

1. Ang density ng pamamahagi ng isang random na variable ay hindi negatibo (f(x) ≥ 0) para sa lahat ng mga halaga ng x.
2. Kondisyon ng normalisasyon:

Ang geometric na kahulugan ng kondisyon ng normalisasyon: ang lugar sa ilalim ng curve ng density ng pamamahagi ay katumbas ng isa.
3. Ang posibilidad na matamaan ang isang random na variable X sa pagitan mula α hanggang β ay maaaring kalkulahin ng formula

Sa geometrically, ang posibilidad na ang isang tuluy-tuloy na random variable X ay nahuhulog sa pagitan (α, β) ay katumbas ng lugar ng curvilinear trapezoid sa ilalim ng distribution density curve batay sa interval na ito.
4. Ang distribution function ay ipinahayag sa mga tuntunin ng density tulad ng sumusunod:

Ang halaga ng density ng pamamahagi sa puntong x ay hindi katumbas ng posibilidad na kunin ang halagang ito; para sa isang tuluy-tuloy na random variable, maaari lamang nating pag-usapan ang posibilidad na mahulog sa isang naibigay na agwat. Hayaan (4)

saan a at b hindi naman may hangganan. Halimbawa, para sa modulus ng velocity vector ng isang molekula ng gas VО nakahiga sa loob ng buong hanay ng mga posibleng halaga, i.e. x O [ x,x+ D x] O [ a, b] (5)

Pagkatapos ang posibilidad D W(x, D x) mga hit x sa pagitan (5) ay katumbas ng

Dito N ay ang kabuuang bilang ng mga sukat x, at D n(x, D x) ay ang bilang ng mga resulta na nahuhulog sa pagitan (5).

Probability D W natural na nakasalalay sa dalawang argumento: x– mga posisyon ng pagitan sa loob [ a, b] at D x ay ang haba nito (pinapalagay, bagaman hindi kinakailangan, na ang D x> 0). Halimbawa, ang posibilidad na makuha ang eksaktong halaga x, sa madaling salita, ang posibilidad ng pagtama x sa pagitan ng zero na haba ay ang posibilidad ng isang imposibleng kaganapan at samakatuwid ay katumbas ng zero: D W(x, 0) = 0

Sa kabilang banda, ang posibilidad na makuha ang halaga x sa isang lugar (hindi mahalaga kung saan) sa loob ng buong pagitan [ a, b] ay ang posibilidad ng isang tiyak na kaganapan (may palaging nangyayari) at samakatuwid ay katumbas ng isa (pinapalagay na b > a):D W(a, ba) = 1.

Hayaan si D x kakaunti. Ang criterion ng sapat na liit ay nakasalalay sa mga partikular na katangian ng system na inilarawan ng probability distribution D W(x, D x). Kung si D x maliit, pagkatapos ay ang function D W(x, D x) ay maaaring mapalawak sa isang serye sa kapangyarihan ng D x:

Kung gumuhit tayo ng dependency graph D W(x, D x) mula sa pangalawang argumento D x, pagkatapos ay palitan ang eksaktong pag-asa sa tinatayang expression (7) ay nangangahulugang pagpapalit (sa isang maliit na lugar) ang eksaktong kurba ng isang piraso ng parabola (7).

Sa (7), ang unang termino ay eksaktong katumbas ng zero, ang pangatlo at kasunod na mga termino, kung ang D ay sapat na maliit, x maaaring tanggalin. Panimula ng notasyon

nagbibigay ng mahalagang resulta D W(x, D x) » r( x) D x (8)

Relation (8), na mas tumpak, mas maliit ang D x nangangahulugan na para sa isang maikling pagitan, ang posibilidad na mahulog sa pagitan na ito ay proporsyonal sa haba nito.

Maaari ka pa ring pumunta mula sa isang maliit ngunit huling D x sa pormal na infinitesimal dx, kasama ang sabay-sabay na pagpapalit ng D W(x, D x) sa dW(x). Pagkatapos ang tinatayang pagkakapantay-pantay (8) ay nagiging eksaktong isa dW(x) = r( xdx(9)

koepisyent ng proporsyonalidad r( x) ay may simpleng kahulugan. Tulad ng makikita mula sa (8) at (9), r( x) ay katumbas ng numero sa posibilidad ng pagtama x sa isang pagitan ng haba ng yunit. Samakatuwid, ang isa sa mga pangalan ng function r( x) ay ang probability distribution density para sa variable x.

Function r( x) ay naglalaman ng lahat ng impormasyon tungkol sa kung paano ang posibilidad dW(x) mga hit x sa pagitan ng isang ibinigay na haba dx depende sa lokasyon ng agwat na ito, i.e. ipinapakita nito kung paano ibinahagi ang probabilidad x. Samakatuwid, ang function r( x) ay karaniwang tinatawag na distribution function para sa variable x at, sa gayon, ang function ng pamamahagi para sa pisikal na sistemang iyon, para sa kapakanan ng paglalarawan ng spectrum ng mga estado kung saan ipinakilala ang variable. x. Ang mga terminong "probability density" at "distribution function" ay ginagamit nang palitan sa statistical physics.

Maaari naming isaalang-alang ang isang generalization ng kahulugan ng probabilidad (6) at distribution function (9) sa kaso, halimbawa, ng tatlong variable. Ang generalization sa kaso ng isang arbitraryong malaking bilang ng mga variable ay isinasagawa sa eksaktong parehong paraan.

Hayaang matukoy ang estado ng isang pisikal na sistema na random na nag-iiba-iba sa oras ng mga halaga ng tatlong variable x, y at z na may tuloy-tuloy na spectrum:

x O [ a, b]

y O [ c, d]

z O [ e, f] (10)

saan a, b,…, f, tulad ng dati, ay hindi kinakailangang may hangganan. Mga variable x, y at z maaaring, halimbawa, ang mga coordinate ng sentro ng masa ng isang molekula ng gas, ang mga bahagi ng vector ng bilis nito x YU Vx, y YU V y at z YU Vz o salpok, atbp. Ang isang kaganapan ay nauunawaan bilang ang sabay-sabay na paglitaw ng lahat ng tatlong mga variable sa pagitan ng haba D x, D y at D z ayon sa pagkakabanggit, i.e.:

x O [ x, x+ D x]

y O [ y, y+ D y]

z O [ z, z+ D z] (11)

Ang posibilidad ng isang kaganapan (11) ay maaaring matukoy nang katulad ng (6)

na may pagkakaiba na ngayon D n- bilang ng mga sukat x, y at z, na ang mga resulta ay sabay-sabay na nagbibigay-kasiyahan sa mga relasyon (11). Ang paggamit ng isang serye ng pagpapalawak na katulad ng (7) ay nagbibigay

dW(x, y, z) = r( x, y, zdx dy dz(13)

saan r( x, y, z) ay ang distribution function para sa tatlong variable nang sabay-sabay x, y at z.

Sa mathematical theory of probability, ang terminong "distribution function" ay ginagamit upang tukuyin ang isang quantity na naiiba sa r( x), ibig sabihin: hayaang ang x ay ilang halaga ng isang random na variable x. Ang function na Ф(x), na nagbibigay ng posibilidad na x tumatagal ng isang halaga na hindi hihigit sa x at tinatawag na distribution function. Ang mga function r at Ф ay may magkaibang kahulugan, ngunit magkaugnay ang mga ito. Gamit ang ibinibigay na probability addition theorem (dito a ay ang kaliwang dulo ng hanay ng mga posibleng halaga x (cm. TEORYANG PROBABILIDAD: , (14) kung saan

Ang paggamit ng tinatayang kaugnayan (8) ay nagbibigay ng D W(x, D x) » r( x) D x.

Ang paghahambing sa eksaktong expression (15) ay nagpapakita na ang paggamit ng (8) ay katumbas ng pagpapalit ng integral sa (16) ng produkto ng integrand r( x) sa haba ng integration interval D x:

Magiging eksakto ang kaugnayan (17) kung r = const, samakatuwid, ang error kapag pinapalitan ang (16) ng (17) ay magiging maliit kapag ang integrand ay bahagyang nagbabago sa haba ng integration interval D x.

Maaari mong ipasok ang D x eff ay ang haba ng pagitan kung saan ang distribution function r( x) malaki ang pagbabago, ibig sabihin. sa pamamagitan ng isang halaga ng pagkakasunud-sunod ng mismong function, o ang dami ni Dr eff modulo order r. Gamit ang Lagrange formula, maaari nating isulat ang:

kung saan sumusunod na D x eff para sa anumang function r

Ang function ng pamamahagi ay maaaring ituring na "halos pare-pareho" sa isang tiyak na pagitan ng pagbabago ng argumento kung ang pagtaas nito |Dr| sa interval na ito, ang absolute value ay mas mababa kaysa sa function mismo sa mga punto ng interval na ito. Kinakailangan |Dr| eff| ~ r (distribution function r і 0) ay nagbibigay

D x x eff (20)

ang haba ng integration interval ay dapat maliit kumpara sa isa kung saan malaki ang pagbabago ng integrand. Ang ilustrasyon ay fig. isa.

Ang integral sa kaliwang bahagi ng (17) ay katumbas ng lugar sa ilalim ng kurba. Ang produkto sa kanang bahagi ng (17) ay ang lugar ng may kulay sa Fig. 1 hanay. Ang criterion para sa liit ng pagkakaiba sa pagitan ng kaukulang mga lugar ay ang katuparan ng hindi pagkakapantay-pantay (20). Ito ay mapapatunayan sa pamamagitan ng pagpapalit sa integral (17) ng mga unang termino ng pagpapalawak ng function r( x) sa isang serye sa mga kapangyarihan

Ang pangangailangan na ang pagwawasto (ang pangalawang termino sa kanang bahagi ng (21) ay ihambing sa una ay maliit ay nagbibigay ng hindi pagkakapantay-pantay (20) sa D x eff mula sa (19).

Mga halimbawa ng isang bilang ng mga function ng pamamahagi na gumaganap ng isang mahalagang papel sa statistical physics.

Maxwell distribution para sa projection ng velocity vector ng isang molekula papunta sa isang partikular na direksyon (halimbawa, ito ang direksyon ng axis OX).

Dito m ay ang masa ng isang molekula ng gas, T- temperatura nito k ay ang Boltzmann constant.

Maxwell distribution para sa modulus ng velocity vector:

Maxwell distribution para sa enerhiya ng translational motion ng mga molekula e = mV 2/2

Ang pamamahagi ng Boltzmann, mas tiyak, ang tinatawag na barometric formula, na tumutukoy sa pamamahagi ng konsentrasyon ng mga molekula o presyon ng hangin sa taas h mula sa ilang "zero level" sa ilalim ng pagpapalagay na ang temperatura ng hangin ay hindi nakasalalay sa taas (modelo ng isothermal na kapaligiran). Sa katunayan, ang temperatura sa mas mababang mga layer ng atmospera ay kapansin-pansing bumababa sa pagtaas ng altitude.

Upang mahanap ang mga function ng pamamahagi ng mga random na variable at ang kanilang mga variable, kinakailangan na pag-aralan ang lahat ng mga tampok ng larangan ng kaalaman na ito. Mayroong ilang iba't ibang mga pamamaraan para sa paghahanap ng mga halaga na pinag-uusapan, kabilang ang pagbabago ng isang variable at pagbuo ng isang sandali. Ang pamamahagi ay isang konsepto batay sa mga elemento tulad ng pagpapakalat, mga pagkakaiba-iba. Gayunpaman, nailalarawan lamang nila ang antas ng saklaw ng scattering.

Ang mas mahalagang mga function ng random variable ay ang mga nauugnay at independiyente, at pantay na ipinamamahagi. Halimbawa, kung ang X1 ay ang bigat ng isang random na napiling indibidwal mula sa isang populasyon ng mga lalaki, ang X2 ay ang bigat ng isa pa, ..., at ang Xn ay ang bigat ng ibang tao mula sa populasyon ng lalaki, kung gayon kailangan nating malaman kung paano ang ibinahagi ang random function X. Sa kasong ito, nalalapat ang classical theorem na tinatawag na central limit theorem. Ito ay nagpapahintulot sa amin na ipakita na para sa malaking n ang function ay sumusunod sa mga karaniwang distribusyon.

Mga function ng isang random variable

Ang central limit theorem ay idinisenyo upang tantiyahin ang mga discrete value na pinag-uusapan, tulad ng binomial at Poisson. Ang mga function ng pamamahagi ng mga random na variable ay isinasaalang-alang, una sa lahat, sa mga simpleng halaga ng isang variable. Halimbawa, kung ang X ay isang tuluy-tuloy na random na variable na mayroong sariling probability distribution. Sa kasong ito, tinutuklasan namin kung paano hanapin ang density ng function ng Y gamit ang dalawang magkaibang diskarte, lalo na ang paraan ng pag-andar ng pamamahagi at ang pagbabago sa variable. Una, isa-sa-isang halaga lamang ang isinasaalang-alang. Pagkatapos ay kailangan mong baguhin ang pamamaraan ng pagbabago ng variable upang mahanap ang posibilidad nito. Sa wakas, kailangang matutunan ng isa kung paano makakatulong ang pinagsama-samang distribusyon na magmodelo ng mga random na numero na sumusunod sa ilang mga sequential pattern.

Paraan ng pamamahagi ng mga itinuturing na halaga

Ang paraan ng probability distribution function ng isang random variable ay naaangkop upang mahanap ang density nito. Kapag ginagamit ang pamamaraang ito, kinakalkula ang isang pinagsama-samang halaga. Pagkatapos, sa pamamagitan ng pag-iiba nito, maaari mong makuha ang probability density. Ngayon na mayroon na tayong paraan ng pagpapaandar ng pamamahagi, maaari tayong tumingin sa ilang higit pang mga halimbawa. Hayaang ang X ay isang tuluy-tuloy na random na variable na may tiyak na probability density.

Ano ang probability density function ng x2? Kung titingnan mo o i-graph ang function (itaas at kanan) y \u003d x2, maaari mong tandaan na ito ay isang pagtaas ng X at 0

Sa huling halimbawa, ginamit ang mahusay na pag-iingat upang i-index ang pinagsama-samang mga function at ang probability density sa alinman sa X o Y upang ipahiwatig kung saang random na variable sila kabilang. Halimbawa, kapag hinahanap ang pinagsama-samang function ng pamamahagi Y, nakuha namin ang X. Kung kailangan mong maghanap ng random na variable X at ang density nito, kailangan mo lang itong ibahin.

Pagbabago ng mga Variable Technique

Hayaang ang X ay isang tuluy-tuloy na random na variable na ibinigay ng isang distribution function na may common denominator f(x). Sa kasong ito, kung ilalagay mo ang halaga ng y sa X = v (Y), pagkatapos ay makukuha mo ang halaga ng x, halimbawa v (y). Ngayon, kailangan nating makuha ang distribution function ng isang tuluy-tuloy na random variable Y. Kung saan ang una at pangalawang pagkakapantay-pantay ay nagaganap mula sa kahulugan ng pinagsama-samang Y. Ang ikatlong pagkakapantay-pantay ay humahawak dahil ang bahagi ng function kung saan ang u (X) ≤ y ay totoo rin na X ≤ v (Y ). At ang huli ay ginagawa upang matukoy ang probabilidad sa isang tuluy-tuloy na random variable X. Ngayon ay kailangan nating kunin ang derivative ng FY (y), ang pinagsama-samang distribution function ng Y, upang makuha ang probability density ng Y.

Generalization para sa reduce function

Hayaang ang X ay isang tuluy-tuloy na random na variable na may karaniwang f(x) na tinukoy sa ibabaw ng c1

Upang matugunan ang isyung ito, maaaring mangolekta ng quantitative data at maaaring gumamit ng empirical cumulative distribution function. Gamit ang impormasyong ito at kaakit-akit dito, kailangan mong pagsamahin ang mga sample ng ibig sabihin, standard deviations, media data, at iba pa.

Katulad nito, kahit na ang isang medyo simpleng probabilistic na modelo ay maaaring magkaroon ng isang malaking bilang ng mga resulta. Halimbawa, kung pumitik ka ng barya nang 332 beses. Kung gayon ang bilang ng mga resultang nakuha mula sa mga flip ay mas malaki kaysa sa google (10100) - isang numero, ngunit hindi bababa sa 100 quintillion beses na mas mataas kaysa sa elementarya na mga particle sa kilalang uniberso. Hindi interesado sa isang pagsusuri na nagbibigay ng sagot sa bawat posibleng resulta. Ang isang mas simpleng konsepto ay kinakailangan, tulad ng bilang ng mga ulo, o ang pinakamahabang stroke ng mga buntot. Upang tumuon sa mga isyu ng interes, isang partikular na resulta ang tinatanggap. Ang kahulugan sa kasong ito ay ang mga sumusunod: ang random variable ay isang tunay na function na may probability space.

Ang hanay ng S ng isang random na variable ay tinatawag na puwang ng estado. Kaya, kung ang X ang value na pinag-uusapan, kung gayon ang N = X2, exp ↵X, X2 + 1, tan2 X, bXc, at iba pa. Ang huli sa mga ito, ang pag-round X sa pinakamalapit na buong numero, ay tinatawag na floor function.

Mga function ng pamamahagi

Kapag ang distribution function ng interes para sa random variable x ay natukoy, ang tanong ay karaniwang nagiging: "Ano ang mga pagkakataon na ang X ay nahuhulog sa ilang subset ng mga halaga ng B?". Halimbawa, B = (mga kakaibang numero), B = (mas malaki sa 1), o B = (sa pagitan ng 2 at 7) upang isaad ang mga resultang iyon na mayroong X, ang halaga ng random variable, sa subset A. Kaya sa itaas halimbawa, maaari mong ilarawan ang mga kaganapan tulad ng sumusunod.

(X ay isang kakaibang numero), (X ay mas malaki kaysa sa 1) = (X > 1), (X ay nasa pagitan ng 2 at 7) = (2

Mga random na variable at mga function ng pamamahagi

Kaya, posibleng kalkulahin ang posibilidad na ang distribution function ng isang random variable x ay kukuha ng mga halaga sa pagitan sa pamamagitan ng pagbabawas. Kailangang isaalang-alang ang pagsasama o pagbubukod ng mga endpoint.

Tatawagin namin ang isang random na variable na discrete kung ito ay may hangganan o countably infinite state space. Kaya, ang X ay ang bilang ng mga ulo sa tatlong independiyenteng pag-flip ng isang bias na barya na tumataas sa probabilidad p. Kailangan nating hanapin ang pinagsama-samang distribution function ng isang discrete random variable FX para sa X. Hayaang X ang bilang ng mga peak sa isang koleksyon ng tatlong card. Pagkatapos Y = X3 sa pamamagitan ng FX. Nagsisimula ang FX sa 0, nagtatapos sa 1, at hindi bumababa habang tumataas ang mga halaga ng x. Ang pinagsama-samang FX distribution function ng isang discrete random variable X ay pare-pareho, maliban sa mga jump. Kapag tumatalon ang FX ay tuloy-tuloy. Posibleng patunayan ang pahayag tungkol sa tamang pagpapatuloy ng distribution function mula sa probability property gamit ang definition. Parang ganito: ang pare-parehong random na variable ay may pinagsama-samang FX na naiba.

Upang ipakita kung paano ito mangyayari, maaari tayong magbigay ng isang halimbawa: isang target na may radius ng unit. Malamang. ang dart ay pantay na ipinamamahagi sa tinukoy na lugar. Para sa ilang λ> 0. Kaya, ang mga function ng pamamahagi ng tuluy-tuloy na random variable ay tumataas nang maayos. Ang FX ay may mga katangian ng isang function ng pamamahagi.

Isang lalaki ang naghihintay sa hintuan ng bus hanggang sa dumating ang bus. Napagpasyahan para sa kanyang sarili na tatanggi siya kapag umabot sa 20 minuto ang paghihintay. Dito kinakailangan upang mahanap ang pinagsama-samang function ng pamamahagi para sa T. Ang oras kung kailan ang isang tao ay nasa istasyon ng bus o hindi aalis. Sa kabila ng katotohanan na ang pinagsama-samang pagpapaandar ng pamamahagi ay tinukoy para sa bawat random na variable. Gayunpaman, ang iba pang mga katangian ay madalas na gagamitin: ang masa para sa isang discrete variable at ang distribution density function ng isang random variable. Karaniwan ang value ay output sa pamamagitan ng isa sa dalawang value na ito.

Bulk Function

Ang mga halagang ito ay isinasaalang-alang ng mga sumusunod na katangian, na may pangkalahatang (mass) na kalikasan. Ang una ay batay sa katotohanan na ang mga probabilidad ay hindi negatibo. Ang pangalawa ay sumusunod mula sa obserbasyon na ang set para sa lahat ng x=2S, ang state space para sa X, ay bumubuo ng partition ng probabilistikong kalayaan ng X. Halimbawa: paghagis ng isang bias na barya na ang mga kinalabasan ay independyente. Maaari kang magpatuloy na magsagawa ng ilang partikular na pagkilos hanggang sa makakuha ka ng mga ulo. Hayaang tukuyin ng X ang isang random na variable na nagbibigay ng bilang ng mga buntot sa harap ng unang ulo. At ang p ay nagsasaad ng posibilidad sa anumang naibigay na aksyon.

Kaya, ang mass probability function ay may mga sumusunod na katangiang katangian. Dahil ang mga termino ay bumubuo ng isang numerical sequence, ang X ay tinatawag na geometric random variable. Geometric scheme c, cr, cr2,. , may kabuuan ang crn. At, samakatuwid, ang sn ay may limitasyon bilang n 1. Sa kasong ito, ang walang katapusang kabuuan ay ang limitasyon.

Ang mass function sa itaas ay bumubuo ng geometric sequence na may ratio. Samakatuwid, natural na mga numero a at b. Ang pagkakaiba sa mga halaga sa function ng pamamahagi ay katumbas ng halaga ng mass function.

Ang mga halaga ng density na isinasaalang-alang ay may sumusunod na kahulugan: Ang X ay isang random na variable na ang pamamahagi ng FX ay may derivative. FX satisfying Z xFX (x) = fX (t) dt-1 ay tinatawag na probability density function. At ang X ay tinatawag na tuluy-tuloy na random variable. Sa pangunahing teorama ng calculus, ang density function ay ang derivative ng distribution. Maaari mong kalkulahin ang mga probabilidad sa pamamagitan ng pagkalkula ng mga tiyak na integral.

Dahil ang data ay kinokolekta mula sa maraming mga obserbasyon, higit sa isang random na variable sa isang pagkakataon ang dapat isaalang-alang upang mai-modelo ang mga eksperimentong pamamaraan. Samakatuwid, ang hanay ng mga halagang ito at ang kanilang magkasanib na pamamahagi para sa dalawang variable na X1 at X2 ay nangangahulugan ng pagtingin sa mga kaganapan. Para sa mga discrete random variable, ang magkasanib na probabilistic mass function ay tinukoy. Para sa mga tuloy-tuloy, ang fX1, X2 ay isinasaalang-alang, kung saan ang pinagsamang probability density ay nasiyahan.

Mga independiyenteng random na variable

Dalawang random na variable na X1 at X2 ang independyente kung magkapareho ang anumang dalawang kaganapang nauugnay sa kanila. Sa mga salita, ang posibilidad na ang dalawang kaganapan (X1 2 B1) at (X2 2 B2) ay nangyari sa parehong oras, y, ay katumbas ng produkto ng mga variable sa itaas, na ang bawat isa sa kanila ay nangyayari nang paisa-isa. Para sa mga independiyenteng discrete random variable, mayroong pinagsamang probabilistic mass function, na produkto ng paglilimita sa dami ng mga ion. Para sa tuluy-tuloy na random na mga variable na independyente, ang joint probability density function ay ang produkto ng mga marginal density values. Sa wakas, n independiyenteng mga obserbasyon x1, x2, ay isinasaalang-alang. , xn na nagmumula sa hindi kilalang density o mass function f. Halimbawa, ang isang hindi kilalang parameter sa mga function para sa isang exponential random variable na naglalarawan sa oras ng paghihintay para sa isang bus.

Simulation ng mga random na variable

Ang pangunahing layunin ng teoretikal na larangan na ito ay ang magbigay ng mga tool na kailangan upang bumuo ng mga inferential na pamamaraan batay sa mga mahuhusay na prinsipyo ng statistical science. Kaya, ang isang napakahalagang kaso ng paggamit para sa software ay ang kakayahang bumuo ng pseudo-data upang gayahin ang aktwal na impormasyon. Ginagawa nitong posible na subukan at pagbutihin ang mga pamamaraan ng pagsusuri bago kailangang gamitin ang mga ito sa mga totoong database. Ito ay kinakailangan upang galugarin ang mga katangian ng data sa pamamagitan ng pagmomodelo. Para sa maraming karaniwang ginagamit na pamilya ng mga random na variable, ang R ay nagbibigay ng mga utos para sa pagbuo ng mga ito. Para sa iba pang mga pangyayari, kakailanganin ang mga pamamaraan para sa pagmomodelo ng pagkakasunud-sunod ng mga independiyenteng random na variable na may karaniwang distribusyon.

Mga Discrete Random na Variable at Sample Command. Ang sample command ay ginagamit upang lumikha ng simple at stratified random sample. Bilang resulta, kung ang isang pagkakasunod-sunod na x ay ipinasok, ang sample(x, 40) ay pipili ng 40 mga tala mula sa x upang ang lahat ng mga pagpipilian na may sukat na 40 ay may parehong posibilidad. Ginagamit nito ang default na R command para sa pagkuha nang walang kapalit. Magagamit din para magmodelo ng mga discrete random variable. Upang gawin ito, kailangan mong magbigay ng puwang ng estado sa vector x at ang mass function na f. Ang isang tawag upang palitan = TRUE ay nagpapahiwatig na ang sampling ay nangyayari na may kapalit. Pagkatapos, para magbigay ng sample ng n independiyenteng random na variable na mayroong karaniwang mass function f, ang sample (x, n, replace = TRUE, prob = f) ay ginagamit.

Natukoy na ang 1 ang pinakamaliit na value na kinakatawan, at ang 4 ang pinakamalaki sa lahat. Kung ang command prob = f ay tinanggal, ang sample ay magsa-sample ng pantay mula sa mga halaga sa vector x. Maaari mong suriin ang simulation laban sa mass function na nakabuo ng data sa pamamagitan ng pagtingin sa double equals sign, ==. At muling pagkalkula ng mga obserbasyon na kumukuha ng bawat posibleng halaga para sa x. Maaari kang gumawa ng isang mesa. Ulitin ito para sa 1000 at ihambing ang simulation sa kaukulang mass function.

Naglalarawan ng Probability Transformation

Una, gayahin ang homogenous distribution function ng mga random na variable u1, u2,. , un sa pagitan . Humigit-kumulang 10% ng mga numero ay dapat nasa loob ng . Ito ay tumutugma sa 10% simulation sa agwat para sa isang random na variable na may ipinapakitang FX distribution function. Katulad nito, humigit-kumulang 10% ng mga random na numero ang dapat nasa pagitan . Ito ay tumutugma sa 10% simulation sa random variable interval na may distribution function na FX. Ang mga halagang ito sa x axis ay maaaring makuha sa pamamagitan ng pagkuha ng inverse mula sa FX. Kung ang X ay isang tuluy-tuloy na random na variable na may densidad na fX positibo sa lahat ng dako sa domain nito, kung gayon ang function ng pamamahagi ay mahigpit na tumataas. Sa kasong ito, ang FX ay may inverse FX-1 function na kilala bilang quantile function. FX (x) u lang kapag x FX-1 (u). Ang pagbabago ng posibilidad ay sumusunod mula sa pagsusuri ng random variable na U = FX(X).

Ang FX ay may saklaw mula 0 hanggang 1. Hindi ito maaaring tumagal ng mga halaga sa ibaba 0 o higit sa 1. Para sa mga halaga ng u sa pagitan ng 0 at 1. Kung ang U ay maaaring imodelo, kinakailangan na gayahin ang isang random na variable na may FX distribution sa pamamagitan ng quantile function. Kunin ang derivative upang makita na ang density u ay nag-iiba sa loob ng 1. Dahil ang random variable na U ay may pare-parehong density sa pagitan ng mga posibleng halaga nito, ito ay tinatawag na pare-pareho sa pagitan. Ito ay na-modelo sa R ​​gamit ang runif command. Ang pagkakakilanlan ay tinatawag na probabilistic transformation. Makikita mo kung paano ito gumagana sa halimbawa ng dart board. X sa pagitan ng 0 at 1, ang distribution function na u = FX(x) = x2, at samakatuwid ang quantile function x = FX-1(u). Posibleng magmodelo ng mga independiyenteng obserbasyon ng distansya mula sa gitna ng dart bar, habang bumubuo ng pare-parehong random na mga variable na U1, U2,. , Un. Ang distribution function at ang empirical distribution ay batay sa 100 simulation ng distribution ng isang dart board. Para sa isang exponential random variable, maaaring u = FX (x) = 1 - exp (- x), at samakatuwid x = - 1 ln (1 - u). Minsan ang lohika ay binubuo ng mga katumbas na pahayag. Sa kasong ito, kailangan mong pagsamahin ang dalawang bahagi ng argumento. Ang pagkakakilanlan ng intersection ay magkatulad para sa lahat ng 2 (S i) S, sa halip na ilang halaga. Ang unyon Ci ay katumbas ng state space S at ang bawat pares ay kapwa eksklusibo. Dahil Bi - ay nahahati sa tatlong axioms. Ang bawat tseke ay batay sa katumbas na probabilidad na P. Para sa anumang subset. Paggamit ng isang pagkakakilanlan upang matiyak na ang sagot ay hindi nakadepende sa kung ang mga endpoint ng pagitan ay kasama.

Exponential function at mga variable nito

Para sa bawat kinalabasan sa lahat ng mga kaganapan, ang pangalawang pag-aari ng pagpapatuloy ng mga probabilidad ay ginagamit sa huli, na itinuturing na axiomatic. Ang batas ng distribusyon ng function ng isang random variable dito ay nagpapakita na ang bawat isa ay may sariling solusyon at sagot.

Ang probability distribution function ng isang random variable at ang mga katangian nito.

Isaalang-alang ang function F(x), tinukoy sa buong numerical axis gaya ng sumusunod: para sa bawat isa X ibig sabihin F(x) ay katumbas ng posibilidad na ang isang discrete random variable ay kukuha ng halagang mas mababa sa X, ibig sabihin.

(18)

Ang function na ito ay tinatawag function ng pamamahagi ng posibilidad, o sa madaling sabi, function ng pamamahagi.

Halimbawa 1 Hanapin ang distribution function ng random variable na ibinigay sa halimbawa 1, aytem 1.

Desisyon: Malinaw na kung , kung gayon F(x)=0, dahil hindi ito kumukuha ng mga halagang mas mababa sa isa. Kung , kung gayon ; kung , kung gayon . Ngunit ang kaganapan<3 в данном случае является суммой двух несовместных событий: =1 и =2. Следовательно,

Kaya para mayroon kami F(x)=1/3. Ang mga halaga ng function sa mga pagitan , at kinakalkula nang katulad. Sa wakas, kung x>6 pagkatapos F(x)=1, dahil sa kasong ito anumang posibleng halaga (1, 2, 3, 4, 5, 6) mas mababa sa x. Function Graph F(x) ipinapakita sa fig. 4.

Halimbawa 2 Hanapin ang distribution function ng random variable na ibinigay sa halimbawa 2, aytem 1.

Desisyon: Obvious naman yun

Iskedyul F(x) ipinapakita sa fig. lima.

Pag-alam sa function ng pamamahagi F(x), madaling mahanap ang posibilidad na ang isang random na variable ay nakakatugon sa mga hindi pagkakapantay - pantay .
Isaalang-alang ang kaganapan na ang isang random na variable ay tumatagal ng isang halaga na mas mababa sa . Ang kaganapang ito ay nahahati sa kabuuan ng dalawang hindi magkatugmang kaganapan: 1) ang random na variable ay kumukuha ng mga halaga na mas mababa sa , i.e. ; 2) ang random na variable ay kumukuha ng mga halaga na nakakatugon sa mga hindi pagkakapantay-pantay. Gamit ang axiom ng karagdagan, nakukuha namin

Ngunit sa pamamagitan ng kahulugan ng function ng pamamahagi F(x)[cm. formula (18)], mayroon kami , ; samakatuwid,

(19)

kaya, ang posibilidad ng isang discrete random variable na bumagsak sa isang interval ay katumbas ng pagtaas ng distribution function sa interval na ito.

Isaalang-alang ang mga pangunahing katangian ng function ng pamamahagi.
1°. Ang function ng pamamahagi ay hindi bumababa.
Sa katunayan, hayaan< . Так как вероятность любого события неотрицательна, то . Samakatuwid, mula sa formula (19) ito ay sumusunod na , ibig sabihin. .

2°. Ang mga halaga ng function ng pamamahagi ay nakakatugon sa mga hindi pagkakapantay-pantay .
Ang ari-arian na ito ay nagmumula sa katotohanan na F(x) tinukoy bilang isang probabilidad [cf. formula (18)]. Malinaw na ang * at .

3°. Ang posibilidad na ang isang discrete random variable ay kukuha ng isa sa mga posibleng halaga xi ay katumbas ng pagtalon sa distribution function sa punto xi.
Sa katunayan, hayaan xi- ang halaga na kinuha ng discrete random variable, at . Ipagpalagay sa formula (19) , , makuha natin

Yung. ibig sabihin p(xi) katumbas ng function jump ** xi. Ang ari-arian na ito ay malinaw na inilalarawan sa Fig. 4 at fig. lima.

*Dito at sa mga sumusunod, ang mga sumusunod na notasyon ay ipinakilala: , .
** Maaari itong ipakita na F(xi)=F(xi-0), ibig sabihin. ano ang function F(x) naiwang tuloy-tuloy sa isang punto xi.

3. Patuloy na random na mga variable.

Bilang karagdagan sa mga discrete random variable, ang mga posibleng halaga na bumubuo ng isang may hangganan o walang katapusan na pagkakasunud-sunod ng mga numero na hindi ganap na pinupuno ang anumang agwat, madalas mayroong mga random na variable na ang mga posibleng halaga ay bumubuo ng isang tiyak na agwat. Ang isang halimbawa ng tulad ng isang random na variable ay ang paglihis mula sa nominal ng isang tiyak na sukat ng isang bahagi na may maayos na itinatag na teknolohikal na proseso. Ang ganitong uri ng mga random na variable ay hindi maaaring tukuyin gamit ang probability distribution law p(x). Gayunpaman, maaaring tukuyin ang mga ito gamit ang probability distribution function F(x). Ang function na ito ay tinukoy sa eksaktong parehong paraan tulad ng sa kaso ng isang discrete random variable:

Kaya, dito din ang function F(x) tinukoy sa buong axis ng numero, at ang halaga nito sa punto X ay katumbas ng posibilidad na ang random na variable ay kukuha ng halagang mas mababa sa X.
Ang formula (19) at mga katangian na 1° at 2° ay may bisa para sa distribution function ng anumang random variable. Ang patunay ay isinasagawa nang katulad sa kaso ng isang discrete na dami.
Ang random variable ay tinatawag tuloy-tuloy, kung para dito mayroong isang non-negatibong piecewise-continuous function* na nakakatugon sa anumang halaga x pagkakapantay-pantay

Batay sa geometric na kahulugan ng integral bilang isang lugar, maaari nating sabihin na ang posibilidad na matupad ang mga hindi pagkakapantay-pantay ay katumbas ng lugar ng isang curvilinear trapezoid na may base. bounded sa itaas ng isang curve (Larawan 6).

Mula noong , at batay sa formula (22)

Tandaan na para sa tuluy-tuloy na random variable, ang distribution function F(x) tuloy-tuloy sa anumang punto X, kung saan tuloy-tuloy ang function. Ito ay sumusunod mula sa katotohanan na F(x) ay naiba-iba sa mga puntong ito.
Batay sa formula (23), sa pag-aakalang x 1 =x, , meron kami

Dahil sa pagpapatuloy ng pag-andar F(x) nakukuha natin yan

Kaya naman

kaya, ang posibilidad na ang isang tuluy-tuloy na random na variable ay maaaring tumagal sa anumang solong halaga ng x ay zero.
Ito ay sumusunod mula dito na ang mga kaganapan na binubuo sa katuparan ng bawat isa sa mga hindi pagkakapantay-pantay

Pareho sila ng probability, i.e.

Sa katunayan, halimbawa,

Bilang

Magkomento. Tulad ng alam natin, kung imposible ang isang kaganapan, kung gayon ang posibilidad ng paglitaw nito ay zero. Sa klasikal na kahulugan ng probabilidad, kapag ang bilang ng mga resulta ng pagsubok ay may hangganan, ang baligtad na proposisyon ay nagaganap din: kung ang probabilidad ng isang kaganapan ay zero, kung gayon ang kaganapan ay imposible, dahil sa kasong ito, wala sa mga resulta ng pagsubok ang pumapabor dito. Sa kaso ng isang tuluy-tuloy na random na variable, ang bilang ng mga posibleng halaga nito ay walang hanggan. Ang posibilidad na ang halagang ito ay kukuha sa anumang partikular na halaga x 1 tulad ng nakita natin, ay katumbas ng zero. Gayunpaman, hindi sumusunod mula dito na ang kaganapang ito ay imposible, dahil bilang isang resulta ng pagsubok, ang random na variable ay maaaring, sa partikular, kumuha ng halaga. x 1. Samakatuwid, sa kaso ng isang tuluy-tuloy na random na variable, makatuwirang pag-usapan ang posibilidad na ang random variable ay nahuhulog sa pagitan, at hindi tungkol sa posibilidad na ito ay kukuha sa isang partikular na halaga.
Kaya, halimbawa, sa paggawa ng isang roller, hindi kami interesado sa posibilidad na ang diameter nito ay magiging katumbas ng nominal na halaga. Para sa amin, ang posibilidad na ang diameter ng roller ay hindi lumabas sa tolerance ay mahalaga.

Ang distribution function ng isang random variable X ay ang function F(x), na nagpapahayag para sa bawat x ng probabilidad na ang random variable X ay kumukuha ng value, mas maliit x

Halimbawa 2.5. Ibinigay ang isang serye ng pamamahagi ng isang random na variable

Hanapin at graphical na ilarawan ang function ng pamamahagi nito. Desisyon. Ayon sa kahulugan

F(jc) = 0 para sa X X

F(x) = 0.4 + 0.1 = 0.5 sa 4 F(x) = 0.5 + 0.5 = 1 sa X > 5.

Kaya (tingnan ang Fig. 2.1):


Mga katangian ng pagpapaandar ng pamamahagi:

1. Ang distribution function ng isang random variable ay isang non-negative na function na nakapaloob sa pagitan ng zero at isa:

2. Ang distribution function ng isang random variable ay isang non-decreasing function sa buong number axis, i.e. sa X 2 >x

3. Sa minus infinity, ang distribution function ay katumbas ng zero, at plus infinity, ito ay katumbas ng isa, i.e.

4. Probability ng pagpindot sa isang random variable X sa pagitan ay katumbas ng tiyak na integral ng probability density nito mula sa a dati b(tingnan ang Fig. 2.2), i.e.


kanin. 2.2

3. Ang distribution function ng isang tuluy-tuloy na random variable (tingnan ang Fig. 2.3) ay maaaring ipahayag sa mga tuntunin ng probability density gamit ang formula:

F(x)= Jp(*)*. (2.10)

4. Ang hindi wastong integral sa walang katapusang limitasyon ng probability density ng tuluy-tuloy na random variable ay katumbas ng isa:

Mga katangiang geometriko / at 4 probability density ay nangangahulugan na ang plot nito ay kurba ng pamamahagi - hindi namamalagi sa ibaba ng x-axis, at ang kabuuang lugar ng figure, limitadong kurba ng pamamahagi at x-axis, ay katumbas ng isa.

Para sa tuluy-tuloy na random variable X inaasahang halaga M(X) at pagkakaiba-iba D(X) ay tinutukoy ng mga formula:

(kung ang integral ay ganap na nagtatagpo); o

(kung ang mga pinababang integral ay nagtatagpo).

Kasama ng mga numerical na katangian na binanggit sa itaas, ang konsepto ng quantiles at percentage points ay ginagamit upang ilarawan ang isang random variable.

q antas ng dami(o q-quantile) ay ganoong halagax qrandom variable, kung saan kinukuha ng function ng pamamahagi nito ang halaga, katumbas ng q, i.e.

  • 100Ang q%-ou point ay ang quantile X~ q .
  • ? Halimbawa 2.8.

Ayon sa halimbawa 2.6 hanapin ang quantile xqj at 30% random variable point x.

Desisyon. Sa pamamagitan ng kahulugan (2.16) F(xo t3)= 0.3, i.e.

~Y~ = 0.3, kung saan ang dami x 0 3 = 0.6. 30% random variable point X, o dami Х)_о,з = xoj» ay matatagpuan katulad mula sa equation ^ = 0.7. saan *,= 1.4. ?

Kabilang sa mga numerical na katangian ng isang random na variable, mayroong inisyal v* at sentral R* k-th order moments, na tinutukoy para sa discrete at tuloy-tuloy na random variable ng mga formula: