Central limit theorem sa MS EXCEL. Encyclopedia of Marketing

Dahil maraming mga random na variable sa mga aplikasyon ang nabuo sa ilalim ng impluwensya ng ilang mahinang umaasa na random na mga kadahilanan, ang kanilang pamamahagi ay itinuturing na normal. Sa kasong ito, dapat na obserbahan ang kondisyon na wala sa mga salik ang nangingibabaw. Ang mga sentral na teorema ng limitasyon sa mga kasong ito ay nagbibigay-katwiran sa paggamit ng normal na pamamahagi.

Encyclopedic YouTube

  • 1 / 5

    Hayaang magkaroon ng isang walang katapusang pagkakasunod - sunod ng mga independiyenteng magkaparehong distributed na mga random na variable na may isang may hangganang inaasahan at pagkakaiba sa matematika . Tukuyin ang huli µ (\displaystyle \mu ) at σ 2 (\displaystyle \sigma ^(2)), ayon sa pagkakabanggit. Hayaan din

    . S n − μ n σ n → N (0 , 1) (\displaystyle (\frac (S_(n)-\mu n)(\sigma (\sqrt (n))))\to N(0,1) ) sa pamamagitan ng pamamahagi sa ,

    saan N (0 , 1) (\displaystyle N(0,1))- normal na distribusyon na may zero mathematical expectation at standard deviation na katumbas ng isa. Tinutukoy ang sample mean ng una n (\displaystyle n) dami, iyon ay X ¯ n = 1 n ∑ i = 1 n X i (\displaystyle (\bar (X))_(n)=(\frac (1)(n))\sum \limits _(i=1)^( n)X_(i)), maaari nating muling isulat ang resulta ng central limit theorem sa sumusunod na anyo:

    n X ¯ n − μ σ → N (0 , 1) (\displaystyle (\sqrt (n))(\frac ((\bar (X))_(n)-\mu )(\sigma ))\to N(0,1)) sa pamamagitan ng pamamahagi sa n → ∞ (\displaystyle n\to \infty ).

    Maaaring matantya ang rate ng convergence gamit ang Berry- Esseen inequality.

    Remarks

    • Sa impormal na pagsasalita, ang classical central limit theorem ay nagsasaad na ang sum n (\displaystyle n) Ang mga independent identically distributed random variable ay may distribusyon na malapit sa N (n μ , n σ 2) (\displaystyle N(n\mu ,n\sigma ^(2))). Katulad nito, X¯n (\displaystyle (\bar(X))_(n)) ay may malapit na pamamahagi N (μ , σ 2 / n) (\displaystyle N(\mu ,\sigma ^(2)/n)).
    • Dahil tuloy-tuloy ang distribution function ng standard normal distribution, ang convergence sa distribution na ito ay katumbas ng pointwise convergence ng distribution functions sa distribution function ng standard normal distribution. Paglalagay Z n = S n − μ n σ n (\displaystyle Z_(n)=(\frac (S_(n)-\mu n)(\sigma (\sqrt (n)))))), nakukuha namin F Z n (x) → Φ (x) , ∀ x ∈ R (\displaystyle F_(Z_(n))(x)\to \Phi (x),\;\forall x\in \mathbb (R) ), saan Φ (x) (\displaystyle \Phi (x)) ay ang distribution function ng karaniwang normal distribution.
    • Ang klasikal na pagbabalangkas ng central limit theorem ay pinatunayan ng paraan ng mga katangiang function (Levy's continuity theorem).
    • Sa pangkalahatan, ang convergence ng mga densidad ay hindi sumusunod mula sa convergence ng distribution functions. Gayunpaman, sa klasikal na kaso na ito, ito ang kaso.

    Lokal na C.P.T.

    Sa ilalim ng mga pagpapalagay ng klasikal na pagbabalangkas, ipagpalagay sa karagdagan na ang pamamahagi ng mga random na variable ( X i ) i = 1 ∞ (\displaystyle \(X_(i)\)_(i=1)^(\infty )) ganap na tuluy-tuloy, iyon ay, mayroon itong density. Kung gayon ang pamamahagi ay ganap na tuluy-tuloy, at higit pa rito,

    f Z n (x) → 1 2 π e − x 2 2 (\displaystyle f_(Z_(n))(x)\to (\frac (1)(\sqrt (2\pi )))\,e^ (-(\frac (x^(2))(2)))) sa n → ∞ (\displaystyle n\to \infty ),

    saan f Z n (x) (\displaystyle f_(Z_(n))(x))- density ng random variable Z n (\displaystyle Z_(n)), at sa kanang bahagi ay ang density ng karaniwang normal na pamamahagi.

    Paglalahat

    Ang resulta ng classical central limit theorem ay wasto para sa mga sitwasyong mas pangkalahatan kaysa sa kumpletong kasarinlan at pantay na pamamahagi.

    C. P. T. Lindeberg

    Hayaan ang mga independiyenteng random na variable X 1 , … , X n , … (\displaystyle X_(1),\ldots ,X_(n),\ldots ) ay tinukoy sa parehong puwang ng posibilidad at may hangganan na mga inaasahan at pagkakaiba sa matematika: E [ X i ] = μ i , D [ X i ] = σ i 2 (\displaystyle \mathbb (E) =\mu _(i),\;\mathrm (D) =\sigma _(i)^( 2)).

    Hayaan S n = ∑ i = 1 n X i (\displaystyle S_(n)=\sum \limits _(i=1)^(n)X_(i)).

    Pagkatapos E [ S n ] = m n = ∑ i = 1 n μ i , D [ S n ] = s n 2 = ∑ i = 1 n σ i 2 (\displaystyle \mathbb (E) =m_(n)=\sum \ mga limitasyon _(i=1)^(n)\mu _(i),\;\mathrm (D) =s_(n)^(2)=\sum \limits _(i=1)^(n)\ sigma _(i)^(2)).

    At hayaan itong tumakbo kalagayan ng Lindeberg:

    ∀ ε > 0 , lim n → ∞ ∑ i = 1 n E [ (X i − μ i) 2 s n 2 1 ( | X i − μ i | > ε s n ) ] = 0 , (\displaystyle \forall \varepsilon >0,\;\lim \limits _(n\to \infty )\sum \limits _(i=1)^(n)\mathbb (E) \left[(\frac ((X_(i)-\ mu _(i))^(2))(s_(n)^(2)))\,\mathbf (1) _(\(|X_(i)-\mu _(i)|>\varepsilon s_ (n)\))\kanan]=0,)

    saan 1 ( | X i − μ i | > ε s n ) (\displaystyle \mathbf (1) _(\(|X_(i)-\mu _(i)|>\varepsilon s_(n)\))) function - indikator.

    sa pamamagitan ng pamamahagi sa n → ∞ (\displaystyle n\to \infty ).

    Ts. P. T. Lyapunova

    Hayaang matupad ang mga pangunahing pagpapalagay ng Ts. P. T. Lindeberg. Hayaan ang mga random na variable ( X i ) (\displaystyle \(X_(i)\)) magkaroon ng may hangganang ikatlong sandali. Tapos yung sequence

    r n 3 = ∑ i = 1 n E [ | X i − μ i | 3 ] (\displaystyle r_(n)^(3)=\sum _(i=1)^(n)\mathbb (E) \left[|X_(i)-\mu _(i)|^(3 )\kanan]).

    Kung limitasyon

    lim n → ∞ r n s n = 0 (\displaystyle \lim \limits _(n\to \infty )(\frac (r_(n))(s_(n)))=0) (kondisyon ng Lyapunov), S n − m n s n → N (0 , 1) (\displaystyle (\frac (S_(n)-m_(n))(s_(n)))\to N(0,1)) sa pamamagitan ng pamamahagi sa n → ∞ (\displaystyle n\to \infty ).

    C.P.T. para sa martingale

    Hayaan ang proseso (X n) n ∈ N (\displaystyle (X_(n))_(n\in \mathbb (N) )) ay isang martingale na may bounded increments. Sa partikular, ipagpalagay natin iyon

    E [ X n + 1 − X n ∣ X 1 , … , X n ] = 0 , n ∈ N , X 0 ≡ 0 , (\displaystyle \mathbb (E) \left=0,\;n\in \mathbb (N) ,\;X_(0)\equiv 0,)

    at ang mga increment ay pare-parehong hangganan, ibig sabihin

    ∃ C > 0 ∀ n ∈ N | X n + 1 − X n | ≤ C (\displaystyle \umiiral C>0\,\para sa lahat n\sa \mathbb (N) \;|X_(n+1)-X_(n)|\leq C) τ n = min ( k | ∑ i = 1 k σ i 2 ≥ n ) (\displaystyle \tau _(n)=\min \left\(k\left\vert \;\sum _(i=1)^ (k)\sigma _(i)^(2)\geq n\right.\right\)). X τ n n → N (0 , 1) (\displaystyle (\frac (X_(\tau _(n)))(\sqrt (n)))\to N(0,1)) sa pamamagitan ng pamamahagi sa n → ∞ (\displaystyle n\to \infty ).

    Python para sa pagtuturo ng siyentipikong computer science: Pagmomodelo ng mga queuing system

    • Pagsasalin
    • pagtuturo

    anotasyon

    Sa papel na ito, ipinakita namin ang isang pamamaraan para sa pagsisimula sa siyentipikong impormasyon batay sa pagmomolde sa edukasyon. Nag-aalok kami ng mga multi-phase queuing system bilang batayan para sa mga bagay na pinag-aaralan. Gumagamit kami ng Python at parallel computing upang ipatupad ang mga modelo, na nagbibigay ng code at stochastic simulation na mga resulta.

    1. Panimula at background

    Sa aming pag-aaral, nauunawaan namin ang kahulugan ng terminong "scientific informatics" bilang paggamit ng mga computer upang pag-aralan at lutasin ang mga problemang pang-agham at engineering. Nakikilala namin ang mga ito mula sa mga simpleng kalkulasyon ng numero. Ang paggamit ng siyentipikong impormasyon sa pagtuturo ay palaging isang hamon para sa mag-aaral at guro. Ang ganitong proseso ng pag-aaral ay tumatalakay sa maraming teknikal at interdisciplinary na isyu, at nangangailangan din ng pag-synchronize ng kaalaman sa matematika sa computer science. Upang malampasan ang mga hamong ito, nagmumungkahi kami ng isang hanay ng mga prinsipyo at pamamaraan ng pagtuturo na bubuo sa isang constructivist na diskarte sa pag-aaral at nagbibigay ng naaangkop na istrukturang batayan para sa guro. Ang lahat ng ito ay nagbibigay-daan sa mga mag-aaral na magsagawa ng isang serye ng mga eksperimento sa computational na may mga modelo ng computer. Ang diskarte na ito ay nauugnay sa kaalaman sa matematika at programming, na, naman, ay itinuro sa kurso ng pangunahing kurikulum at malapit na nauugnay dito. Isasaalang-alang namin ang seksyon ng computational statistics bilang panimulang seksyon ng siyentipikong computer science at bilang posibleng larangan ng aplikasyon ng pag-aaral na ito. Ang background sa pamamaraang ito ay ipinakita sa ibaba.

    1.1. Scientific informatics

    Tinukoy nina Carniadax at Kirby II ang "Computer Informatics bilang `puso` ng simulation research." Ang mga may-akda ay nag-aalok ng "isang holistic na diskarte sa mga numerical algorithm, modernong mga pamamaraan ng programming at parallel computing... Kadalasan ang mga naturang konsepto at katulad na mga tool ay pana-panahong pinag-aaralan sa iba't ibang kaugnay na mga kurso at aklat-aralin, at ang relasyon sa pagitan ng mga ito ay nagiging malinaw kaagad. Ang pangangailangang pagsamahin ang mga konsepto at kasangkapan ay kadalasang nagiging maliwanag pagkatapos makumpleto ang kurso, halimbawa sa unang post-graduate na trabaho o kapag nagsusulat ng tesis ng disertasyon, sa gayo'y pinipilit ang mag-aaral na pagsamahin ang pag-unawa sa tatlong independiyenteng mga lugar sa isa, upang makakuha ng ang kinakailangang solusyon. Bagama't ang prosesong ito ay walang alinlangan na napakahalaga, ito ay nakakaubos ng oras at, sa maraming pagkakataon, ay maaaring hindi magresulta sa isang epektibong kumbinasyon ng mga konsepto at tool. Mula sa isang pedagogical na pananaw, upang mapahusay ang pag-unawa sa mga paksa ng siyentipikong computer science, ang isang holistic na pinagsama-samang diskarte ay maaaring pasiglahin ang mag-aaral sa ilang mga disiplina nang sabay-sabay. Ang Figure 1 ay nagpapakita ng kahulugan ng siyentipikong computer science bilang intersection ng numerical mathematics, computer science at modeling.


    kanin. isa. Scientific informatics.

    1.2. Constructivism sa pag-aaral

    Iminungkahi nina Kane at Kane, sa kanilang pangunahing pananaliksik, ang mga pangunahing prinsipyo ng konstruktibismo sa pag-aaral. Ang isa sa pinakamahalaga para sa atin ay ang mga sumusunod: "Ang utak ay nagpoproseso ng mga bahagi at ang kabuuan sa parehong oras."

    Kaya, ang isang maayos na proseso ng pag-aaral ay nagpapakita ng mga pinagbabatayan na mga detalye at ideya. Gamit ang simulation-based na diskarte, kapag nagawa na ang simulation model, magiging maliwanag ang mga layunin ng pag-aaral. Ito ay nagpapahintulot sa amin na obserbahan ang mga resulta at gumawa ng mga naaangkop na konklusyon.

    1.3. Simulation-Based Learning: Bakit Mga Modelo?

    Ipinakilala ng Gibbons ang isang simulation-based na programa sa pagsasanay noong 2001. I-highlight ang mga sumusunod na pangunahing prinsipyo:
    • Ang mag-aaral ay nakakakuha ng karanasan sa pamamagitan ng pakikipag-ugnayan sa mga modelo;
    • Nilulutas ng mag-aaral ang mga problemang pang-agham at inhinyero sa pamamagitan ng pag-eeksperimento sa isang modelo;
    • Pagsasaalang-alang at pagbabalangkas ng mga problema;
    • Kahulugan ng mga tiyak na layunin sa pag-aaral;
    • Paglalahad ng lahat ng kinakailangang impormasyon sa konteksto ng desisyon.
    Millard et al.nagmungkahi ng isang modelo ng pinadali na pag-aaral gamit ang "interactive simulation". Ang mga may-akda ay nagpapakita ng mga modernong teknolohiya sa computer batay sa isang "promising methodology" batay sa "system dynamics". "Kabilang sa praktikal na karanasan ang pagbuo ng mga interactive ... na mga modelo at paggamit ng mga ito upang subukan ang mga hypotheses at eksperimento."

    Nakatuon sina Lehrer at Schauble sa pag-eeksperimento na may iba't ibang representasyon ng modelo: "Napapahusay ang pagkatuto ng mag-aaral kapag may pagkakataon ang mag-aaral na gumawa at mag-rebisa ng ilang bersyon ng mga modelo, at pagkatapos ay ihambing ang kasapatan ng paglalarawan ng iba't ibang modelong ito."

    1.4. Scientific informatics sa gitna ng edukasyon: mga eksperimento sa mga modelo

    Iminungkahi ni Xue ang "pagtuturo ng mga reporma sa 'scientific informatics' na pag-aaral sa pamamagitan ng pagmomodelo at simulation." Pinapayuhan niya ang "... na gumamit ng pagmomodelo at mga simulation upang malutas ang mga aktwal na problema ng programming, pagmomodelo at pagsusuri ng data...". Ang pag-aaral na nakabatay sa modelo ay ginagamit sa edukasyon sa matematika. Maraming mga modelo ang binuo gamit ang Geogebra software. Malaki ang ginagampanan ng mga modelo sa Science Education.

    1.5. Stochastic modeling ng queuing system

    Iminumungkahi namin ang paggamit ng mga queuing system dahil sa pagiging simple ng kanilang mga paunang kahulugan at dahil sa malawak na posibilidad ng pagmomodelo at simulation. Ang teorya ng queuing ay kilala at ang pagmomodelo ng mga queuing system (QS) ay malawakang ginagamit sa agham at edukasyon. Ang mga multi-phase queuing system ay isang magandang platform para sa eksperimento ng mag-aaral, gayundin ang paggamit ng parallel computing. Mayroon ding ilang mga kawili-wiling teoretikal na resulta para sa pag-aaral at pananaliksik.

    1.6. Python sa edukasyon batay sa siyentipikong computer science

    Ang Python ay isa sa pinakasikat na programming language para sa mga siyentipiko at tagapagturo. Ang Python ay malawakang ginagamit sa pang-industriya na siyentipikong computing. Ang Langtangen ay nag-uulat sa pangmatagalang karanasan sa paggamit ng Python bilang pangunahing wika para sa pagtuturo ng Science Computing sa Unibersidad ng Oslo. Ang Python ay isinusulong bilang unang wika para sa pag-aaral ng programming, gayundin para sa advanced na pag-aaral ng mga pamamaraan ng pagkalkula.

    2. Mga Pangunahing Kaalaman

    Bago simulan ang pagmomodelo, tukuyin natin ang mga pangunahing diskarte na gagamitin natin sa proseso. Sa kabanatang ito, tatalakayin natin ang pagbuo ng mga random na numero at pamamahagi ng posibilidad, stochastic modeling. Isaalang-alang ang elementarya na teorya ng posibilidad. Ang pangunahing gawain ng mga eksperimentong ito ay ang pang-eksperimentong patunay ng Central Limit Theorem. Ang mga modelo at eksperimento sa mga modelong ito ay nililinaw ang prinsipyo ng pseudo- at quasi-random na mga generator ng numero, pati na rin ang pag-unawa sa exponential distribution. Maaari itong magbigay ng batayan para sa mas detalyadong mga eksperimento sa mga modelo ng QS.

    2.1. Random na mga variable at distribusyon

    Lahat ng elemento ng probability theory ay tradisyonal na itinuturing na mahirap unawain at palaging nasa larangan ng interes ng mga internasyonal na institusyong pang-edukasyon. Kasabay nito, ang mga tanong na ito ay may mahalagang papel sa siyentipikong pananaliksik. Ang diskarte sa pagmomodelo ay ginagawang mas madaling maunawaan ang materyal na ito. Ang modelong titingnan natin sa artikulong ito ay isang simpleng modelo ng pag-roll ng isa o higit pang dice, na nagsisimula sa isa at nagtatapos sa ilan.

    Ang gawain ng mga panimulang eksperimento na ito ay medyo kumplikado. Hindi lamang natin titingnan ang mga distribusyon ng probabilidad, ngunit hawakan din ang pagmomodelo at parallel computing. Magsasagawa rin kami ng isang hakbang pasulong sa siyentipikong pananaliksik: eksperimental naming patunayan ang Central Limit Theorem.

    Magsisimula tayo sa pagbuo ng mga random na numero (nang hindi naaapektuhan ang pamamahagi). Pagkatapos ay ipinapaliwanag namin ang pantay na ipinamamahagi na mga random na variable. Ang mga talakayan tungkol sa totoong randomness at quasi randomness ay ipinakita ng mga may-akda. Para sa mga advanced na mag-aaral, isang serye ng mga eksperimento na may Python pseudo-random generator ay ipapakita. Sa paunang yugto, para sa kalinawan ng pag-aaral, dadagdagan namin ang bilang ng mga pagsubok sa pamamagitan ng pagmamasid sa resulta ng simulation. Sa susunod na hakbang, magpapatuloy tayo sa mas kumplikadong mga eksperimento at parallel computing. Gagamitin namin ang Python random variables module para sa pagmomodelo, at ang mpi4py library para sa parallel computing. Ang Python Random Module ay batay sa isang pseudo-random number generator para sa iba't ibang mga distribusyon. Halimbawa: random.randint(a,b) nagbabalik ng random integer N kung saan ang a ≤ N ≤ b at random.expovariate(lambd) nagbabalik ng exponentially distributed random variables na may parameter na 'lambd'. Tingnan ang dokumentasyon ng Python para sa higit pang mga detalye. Ang programming ng dice tossing model ay ipinapakita sa Figure 2.

    Mag-import ng pylab import random number_of_trials =100 ## Dito ginagaya namin ang paulit-ulit na paghagis ng isang single six-sided die list_of_values ​​​​= para sa i in range(number_of_trials): list_of_values.append(random.randint(1,6)) print "Mga Pagsubok =" , bilang_ng_pagsubok, "beses." print "Mean =", pylab.mean(list_of_values) print "Standard deviation =", pylab.std(list_of_values) pylab.hist(list_of_values, bins=) pylab.xlabel("Value") pylab.ylabel("Bilang beses ") pylab.show()
    kanin. 2. Pagprograma ng Single Dice Roll Model sa Python

    Ang mga resulta ng simulation ng paghagis ng isang die ay ipinapakita sa Figure 3.


    kanin. 3. Mga Resulta ng Single Dice Simulation


    kanin. 4. Paghahambing ng probability density function

    Ang proseso ng pag-aaral ay nagpapatuloy sa pamamagitan ng pagbabago sa two-dice simulation code upang simulan ang pagsasaalang-alang sa multi-dice case. Ang code ay katulad ng iisang die code, maliban sa dalawang linya ng code sa ibaba:

    List_of_values.append(random.randint(1, 6) + random.randint(1, 6)) ... pylab.hist(list_of_values, pylab.arange(1.5, 13.5, 1.0)) ...
    Ang resulta ng mga kalkulasyon sa kaso ng dalawang cube ay ipinapakita sa Figure 5.


    kanin. 5. Kaso ng dalawang cube

    Ngayon ay maaari nating isaalang-alang ang normal na pamamahagi. Ang gawain, sa yugtong ito, ay ipakita kung paano nauugnay ang nakaraang kaso na may ilang mga cube sa normal na pamamahagi. Ang susunod na problema ay magpapakilala sa atin sa mean at ang standard deviation. Ang code ay nananatiling pareho sa kaso ng isang solong die, maliban sa mga tagubilin sa ibaba:

    List_of_values.append(random.normalvariate(7, 2.4)) ...
    Ang mga resulta ng simulation para sa normal na distribusyon ay ipinapakita sa Figure 6.


    kanin. 6. Resulta ng simulation para sa normal na pamamahagi

    Ang huling hakbang ay upang ipakita ang exponential distribution. Ginagamit ang exponential distribution upang imodelo ang distribution (tagal) ng mga agwat sa pagitan ng mga sandali ng pagdating ng mga kinakailangan sa mga system ng iba't ibang uri. Ang mga resulta ng kanilang pagmomodelo ay ipinakita sa Mga Figure 7 at 8.

    Mag-import ng pylab import random number_of_trials = 1000 number_of_customer_per_hour = 10 ## Dito ginagaya namin ang interarrival time ng mga customer list_of_values ​​​​= para sa i in range(bilang ng mga pagsubok): list_of_values.append(random.expovariate(number_of_customer mean=pylab). mean( list_of_values) std=pylab.std(list_of_values) print "Mga Pagsubok =", number_of_trials, "times" print "Mean =", mean print "Standard deviation =", std pylab.hist(list_of_values,20) pylab.xlabel( "Halaga ") pylab.ylabel("Bilang ng beses") pylab.show()
    kanin. 7. Python Model para sa Exponential Distribution


    kanin. walo. Resulta ng simulation para sa exponential distribution

    2.2. Stochastic simulation

    Ang Stochastic modeling ay isang mahalagang elemento ng scientific informatics. Pagtutuunan natin ng pansin ang pamamaraan ng Monte Carlo. Kapag naitayo na ang modelo, maaari tayong bumuo ng mga random na variable at mag-eksperimento sa iba't ibang mga parameter ng system. Sa loob ng balangkas ng artikulong ito, ang pangunahing punto ng mga eksperimento sa Monte Carlo ay ulitin ang mga pagsubok nang maraming beses upang maipon at maisama ang mga resulta. Ang pinakasimpleng application ay inilarawan sa nakaraang seksyon. Sa pamamagitan ng pagtaas ng bilang ng mga pagsubok, madadagdagan namin ang katumpakan ng mga resulta ng simulation.

    Dito ang mag-aaral ay kailangang magsagawa ng isang tiyak na bilang ng mga eksperimento gamit ang simpleng modelong ito sa pamamagitan ng pagtaas ng bilang ng mga pagsubok. Sa pamamagitan ng pagtaas ng bilang ng mga cube at bilang ng mga pagsubok, ang mag-aaral ay makakaranas ng medyo mahabang oras ng pagkalkula. Ito ay isang magandang dahilan para gumamit ng parallel computing. Ang isang modelo ng Python para sa ilang dice ay ipinapakita sa Figure 9. At ang mga resulta ng simulation ay ipinapakita sa Figure 10. Ang susunod na hakbang ay isaalang-alang ang mas pangkalahatang mga isyu na may kaugnayan sa iba't ibang mga sistema ng pagpila. Ang isang maikling panimula sa pag-uuri ng QS ay ipinakita sa susunod na bahagi ng artikulong ito. Magsimula tayo sa M/M/1 system at mas kumplikadong queuing system. Ang mga pangunahing konsepto ng stochastic na proseso ay tatalakayin nang detalyado sa bahaging ito ng artikulo. Bilang isang posibleng halimbawa, maaari naming imungkahi ang problema sa pag-aaral ng output stream. Patunayan natin na ang output M/M/1 ng system ay isang Poisson flow. Kaya, ang mga nakolektang datos ay ipapakita sa anyo ng isang nabuong output empirical histogram.

    Mag-import ng pylab import random number_of_trials = 150000 number_of_dice = 200 ## Dito ginagaya namin ang paulit-ulit na paghagis ## ng isang bilang ng single six-sided dice list_of_values ​​​​= para sa i sa range(number_of_trials): sum=0 para sa j sa range(number_of_dice ): sum+=random.randint(1,6) list_of_values.append(sum) mean=pylab.mean(list_of_values) std=pylab.std(list_of_values) print "Mga Pagsubok =", number_of_trials, "times" print "Mean =" , ibig sabihin print "Standard deviation =", std pylab.hist(list_of_values,20) pylab.xlabel("Value") pylab.ylabel("Bilang ng beses") pylab.show()
    kanin. siyam. Python Simulation Model para sa Augmented Normal Distribution


    kanin. sampu. Resulta ng simulation para sa pinalawig na normal na distribusyon

    3. Multiphase queuing system at stochastic modeling

    Nasa ibaba ang isang panimulang paglalarawan ng QS, na isinasaalang-alang ang mga nuances ng pagmomolde at stochastics.

    3.1. Mga Sistema ng Pagpila

    Ang isang simpleng queuing system ay binubuo ng isang server na nagpoproseso ng mga papasok na kahilingan. Ang pangkalahatang scheme ng isang simpleng queuing system ay ipinapakita sa Figure 11. Sa pangkalahatan, ang isang QS ay binubuo ng isa o higit pang mga server na nagpoproseso ng mga papasok na kahilingan. Posible rin na magkaroon ng isa o higit pang mga hakbang ng serbisyo sa isa o higit pang mga device ng serbisyo sa bawat yugto. Ang mga papasok na kliyente na natagpuang abala ang lahat ng server ay sumali sa isa o higit pang mga pila sa harap ng mga device na naghahatid. Mayroong maraming mga application na maaaring magamit upang i-modelo ang QS, tulad ng mga sistema ng produksyon, mga sistema ng komunikasyon, mga sistema ng pagpapanatili, at iba pa. Ang isang pangkalahatang QS ay maaaring katangian ng tatlong pangunahing bahagi: ang daloy ng mga kahilingan, ang proseso ng serbisyo, at ang paraan ng pagpila. Ang mga application ay maaaring magmula sa ilang limitado o walang limitasyong mga mapagkukunan.


    kanin. labing-isa. Simpleng CMO.

    Inilalarawan ng proseso ng ticketing kung paano pumapasok ang mga tiket sa system. Tukuyin natin
    bilang agwat ng oras sa pagitan ng pagdating ng mga claim sa pagitan ng at -th claim, ang inaasahang (average) na oras sa pagitan ng pagdating ng mga claim pati na rin ang dalas ng pagtanggap ng mga claim bilang

    Tinukoy din namin ang bilang ng mga device ng serbisyo. Ang mekanismo ng serbisyo ay tinutukoy ng numerong ito. Ang bawat server ay may sariling pila, pati na rin ang probabilistikong pamamahagi ng oras ng serbisyo ng kahilingan.

    Tukuyin natin bilang ang oras ng serbisyo ng -ika kahilingan, bilang ang average na oras para sa pagseserbisyo sa kahilingan, at bilang ang bilis ng paglilingkod sa kahilingan.

    Ang panuntunang ginagamit ng server upang piliin ang susunod na kahilingan mula sa pila ay tinatawag na disiplina ng QS queue. Ang pinakakaraniwang disiplina sa pagpila ay ang: Priyoridad - hinahain ang mga customer ayon sa kanilang kahalagahan. FIFO - first come first served; LIFO - stack, last come first serve. Ang pinalawig na pag-uuri ng mga system ayon kay Kendall ay gumagamit ng 6 na simbolo: A/B/s/q/c/p, kung saan ang A ay ang pamamahagi ng mga pagitan sa pagitan ng mga papasok na kahilingan, B ay ang pamamahagi ng mga agwat ng serbisyo, s ay ang bilang ng mga server, q ay ang mga disiplina ng serbisyo (inalis para sa FIFO) , c – kapasidad ng system (inaalis para sa walang katapusang pila), p – bilang ng mga posibleng kahilingan (inaalis para sa mga bukas na sistema) . Halimbawa, inilalarawan ng M/M/1 ang isang Poisson input stream, isang exponential server, isang infinite FIFO queue, at isang walang katapusang bilang ng mga customer.

    Ginagamit ang QS upang magmodelo at mag-aral ng iba't ibang larangan ng agham at teknolohiya. Halimbawa, maaari tayong magmodelo at mag-aral ng mga sistema ng produksyon o transportasyon gamit ang teorya ng queuing. Bukod dito, ang mga kahilingan sa serbisyo ay itinuturing na mga aplikasyon, at ang mga pamamaraan sa pagpapanatili bilang isang mekanismo ng serbisyo. Ang susunod na halimbawa ay: mga computer (mga kahilingan sa terminal at mga tugon ng server, ayon sa pagkakabanggit), mga sistema ng memorya ng multi-disk ng computer (mga kahilingan para sa pagsulat / pagbabasa ng data, isang karaniwang disk controller), mga trunked radio na komunikasyon (mga signal ng telepono, mga repeater), mga network ng computer (mga kahilingan , mga channel). Sa biology, ang teorya ng queuing ay maaaring gamitin upang magmodelo ng mga sistema ng enzyme (mga protina, pangkalahatang enzyme). Sa biochemistry, ang modelo ng queuing network ay maaaring gamitin upang pag-aralan ang regulatory chain ng LAK operon.

    3.2. Bakit multiphase?

    Isaalang-alang ang isang multi-phase na QS, na binubuo ng ilang mga service device na konektado sa serye at may walang limitasyong bilang ng mga kahilingan. Ang oras sa pagitan ng mga kahilingan at oras ng pagpoproseso ay independyente at exponentially distributed. Ang pila ay walang katapusan sa disiplina sa serbisyo ng FIFO. Ang multiphase QS ay natural na sumasalamin sa topology ng multicore computer system. Tulad ng makikita natin sa ibang pagkakataon, ang bawat modelo ay madaling maisulat sa isang programming language, natutunan at binago. Pinapayagan din ng modelo ang isang paghahambing na pag-aaral ng iba't ibang mga diskarte sa multiprocessing. Ang multiphase na modelo ng QS ay ipinapakita sa Figure 12.


    kanin. 12. Multiphase QS.

    3.3. Batayang teoretikal

    Sa kaso ng statistical modelling, palagi kaming nahaharap sa problema ng pag-verify ng computer code. Palaging may bukas na tanong ng mga error sa aming programa o algorithm. Ang modelo ay hindi ganap na analytical at sa bawat oras na patakbuhin namin ang programa mayroon kaming iba't ibang data ng input/output. Kaya, upang suriin ang kawastuhan ng isang code o algorithm, kailangan ang iba't ibang mga diskarte (mula sa ginagamit namin sa kaso ng ganap na deterministikong data ng pag-input). Upang malutas ang isyung ito, dapat nating ilapat ang mga teoretikal na resulta ng ilang pag-aaral na makikita sa siyentipikong panitikan. Ang mga resultang ito ay nagbibigay sa amin ng isang batayan para sa pag-verify at pagsusuri sa output data, pati na rin para sa paglutas ng problema sa kawastuhan ng mga resulta ng simulation.

    Sisiyasatin namin ang oras ng paninirahan ng isang claim sa isang multiphase QS. Ipahiwatig bilang ang oras ng pananatili ng kahilingan sa system, bilang ang oras ng serbisyo n-ika-aplikasyon j-th phase. Isaalang-alang kung paano k-th phase.

    Mayroong palaging ganoon

    Teorama. Kung ang mga kondisyon (1) at (2) ay natugunan, kung gayon

    3.4. Pagmomodelo ng istatistika

    Pagkatapos mabuo ang modelo, maaari kaming magpatakbo ng isang serye ng mga eksperimento sa modelong ito. Papayagan ka nitong pag-aralan ang ilan sa mga katangian ng system. Maaari tayong maglabas ng mga random na variable na may inaasahang mean at kalkulahin (gamit ang recursive equation sa ibaba) ang nais na mga halaga upang pag-aralan. Ang mga halagang ito ay magiging random din (mayroon kaming stochasticity ng input data ng aming modelo - isang random na oras sa pagitan ng pagdating ng mga kahilingan at isang random na oras ng serbisyo). Bilang resulta, maaari nating kalkulahin ang ilang mga parameter ng mga random na variable na ito (mga variable): ang mean value at ang probability distribution. Tinatawag namin ang pamamaraang ito na statistical modeling dahil sa randomness na naroroon sa modelo. Kung kailangan ng mas tumpak na mga resulta, dapat nating ulitin ang mga eksperimento sa ating modelo at pagkatapos ay isama ang mga resulta, pagkatapos ay kalkulahin ang mga integral na katangian: mean value o standard deviation. Ito ay tinatawag na Monte Carlo na pamamaraan at ito ay inilarawan sa artikulong mas mataas ng kaunti.

    3.5. Paulit-ulit na equation

    Upang bumuo ng isang algorithm para sa pagmomodelo ng naunang inilarawan na QS, kinakailangan upang pag-aralan ang ilang mga konstruksyon sa matematika. Ang pangunahing gawain ay pag-aralan at kalkulahin ang oras ng paninirahan ng kahilingan na may numero n sa isang multi-phase QS na binubuo ng mga phase. Maaari naming ibigay ang sumusunod na recursive equation , ipahiwatig: - oras ng pagdating ng -th order; bilang ang oras ng serbisyo ng -th claim ng -th phase; . Ang sumusunod na recursive equation ay wasto para sa oras ng paghihintay para sa -th order ng -th phase:

    Assumption. Recursive equation para sa pagkalkula ng oras ng paninirahan ng isang aplikasyon sa isang multiphase QS.

    Patunay. Totoo na kung ang oras ay , ang oras ng paghihintay sa -th phase ng -th order ay 0. Sa kasong ito, , ang waiting time sa -th phase ng -th order at . Isinasaalang-alang ang dalawang kaso sa itaas, sa wakas ay mayroon na tayong inaasahang resulta.

    Ngayon ay maaari na nating simulan ang pagpapatupad ng mga kinakailangang algorithm batay sa lahat ng teoretikal na resultang nakuha.

    4. Python para sa multiprocessing

    Ang Python bilang isang programming language ay napakasikat sa mga scientist at educator at maaaring maging talagang kaakit-akit para sa paglutas ng mga problemang nakatuon sa agham. Nagbibigay ang Python ng makapangyarihang platform para sa pagmomodelo at simulation, kabilang ang mga graphical na utility, malawak na iba't ibang math, statistics, at multiprocessing packages. Upang mabawasan ang oras ng pagpapatupad, kinakailangan na pagsamahin ang Python at C code. Ang lahat ng ito ay nagbibigay sa amin ng isang malakas na platform sa pagmomodelo para sa pagkuha ng istatistikal na data at pagproseso ng mga resulta. Ang mga pangunahing konsepto sa Python na mahalaga din sa pagmomodelo ay ang mga dekorador, coroutine, yield expression, multiprocessing, at queues. Ang mga puntong ito ay lubos na isinasaalang-alang ni Beasley sa kanyang aklat. Sa kabila nito, mayroong ilang mga paraan upang ayusin ang inter-process na komunikasyon, at magsisimula tayo sa paggamit ng mga pila, dahil ito ay napaka natural sa liwanag ng pag-aaral ng QS.

    Nasa ibaba ang isang simpleng halimbawa ng mga benepisyo ng paggamit ng multiprocessing upang mapataas ang kahusayan at pagiging epektibo ng code. Mapapabuti ng mag-aaral ang mga resulta ng simulation sa pamamagitan ng paggamit ng parallel computing sa mga supercomputer o cluster system. Sa isang banda, ang multiprocessing ay magbibigay-daan sa amin upang itugma ang multiphase model sa mga mapagkukunan ng isang multi-core processor, at sa kabilang banda, maaari naming gamitin ang multiprocessing upang magsagawa ng isang serye ng mga parallel na pagsubok sa Monte Carlo. Titingnan natin ang dalawang pamamaraang ito sa susunod na seksyon. Para sa mga motivated na mag-aaral, ang sumusunod ay isang maikling panimula sa multiprocessing gamit ang Python.

    Magsisimula tayo sa pamamagitan ng paggamit ng module na mpi4py. Ito ay mahalaga para sa paglalahad ng pangunahing ideya kung paano gumagana ang MPI. Kinokopya lang nito ang ibinigay na programa sa isa sa mga core ng processor na tinukoy ng user at isinasama ang mga resulta pagkatapos gamitin ang gather() na paraan. Ang isang halimbawa ng Python code (Larawan 13) at mga resulta ng simulation (Larawan 14) ay ipinakita sa ibaba.

    #!/usr/bin/python import pylab import random import numpy bilang np mula sa mpi4py import MPI dice=200 trials= 150000 rank = MPI.COMM_WORLD.Get_rank() size = MPI.COMM WORLD.Get_size() name = MPI.Get_processor_name () random.seed(ranggo) ## Ang bawat proseso - isang paghagis ng isang bilang ng anim na panig na dice values= np.zeros(trials) para sa i sa range(trials): sum=0 para sa j sa range(dice): sum+=random.randint(l,6) values[i]=sum data=np.array(MPI.COMM_WORLD.gather(values, root=0)) kung rank == 0: data=data.flatten() mean= pylab.mean(data) std=pylab.std(data) print "Bilang ng mga pagsubok =", laki*mga pagsubok, "beses." print "Mean =", mean print "Standard deviation =", std pylab.hist(data,20) pylab.xlabel("Value") pylab.ylabel("Bilang ng beses") pylab.savefig("multi_dice_mpi.png" )
    kanin. labintatlo. Modelo ng Python para sa pinalawig na normal na pamamahagi gamit ang MPI.


    kanin. labing-apat. Normal na pamamahagi gamit ang MPI.

    5. Pang-edukasyon na diskarte batay sa simulation

    Ang mga Multiphase QS ay nagbibigay sa amin ng isang pangunahing para sa pagbuo ng isang naaangkop na simulation-based na diskarte. Kasama sa diskarteng ito ang mga pangunahing konsepto na inilarawan sa mga nakaraang seksyon, pati na rin ang mas kumplikadong mga resulta at pamamaraan ng teoretikal. Ang mga pangunahing ideya ay stochastic sa kalikasan: random variable, random numerical distributions, random number generators, Central Limit Theorem; Mga konstruksyon ng Python programming:
    dekorador, coroutine, at yeild expression. Kasama sa mas kumplikadong mga resulta ang mga sumusunod na teoretikal na konsepto: ang oras na ginugol ng isang claim sa system, isang recursive equation para sa pagkalkula ng oras na ginugol ng isang claim sa QS, stochastic modeling method, at mga multiprocessor na teknolohiya. Ipinapakita ng Figure 15 ang pangunahing diagram na naglalarawan sa balangkas ng edukasyon.


    kanin. labinlima. Simulation-Based Educational Approach

    Ang lahat ng teoretikal at istrukturang programang ito ay nagpapahintulot sa mag-aaral na mag-eksperimento sa iba't ibang modelo ng multi-phase QS. Ang layunin ng mga eksperimentong ito ay dalawa. Una, pinapaunawa nito sa mga mag-aaral ang sumusunod na pagkakasunud-sunod, na mahalaga sa anumang siyentipikong pananaliksik: mga teoretikal na katotohanang kinakailangan para sa pag-aaral, mga modelo ng matematika, mga istruktura ng programa, mga modelo ng computer, mga modelong stochastic at pagmamasid sa mga resulta ng simulation. Ito ay magbibigay sa mag-aaral ng kumpletong larawan ng pangkalahatang siyentipikong pananaliksik (Larawan 16).


    kanin. labing-anim. Lugar ng pananaliksik

    Ang diskarte na ito ay magbibigay-daan sa isang mas malalim na pag-unawa sa stochastic na pagmomodelo at mga pangunahing konstruksyon ng software tulad ng multiprocessing at parallel programming. Ang mga probisyong ito ay pinakamahalaga sa larangan ng siyentipikong pag-compute.

    5.1. Mga Eksperimento sa Modelo

    Sa seksyong ito, isinasaalang-alang namin ang tatlong modelo ng computer ng multiphase QS. Ang lahat ng mga modelong ito ay naiiba sa kanilang pilosopiko at pangunahing mga tampok. Sa kabila ng katotohanan na ang layunin ng mga eksperimento ay lumikha ng isang istatistikal na modelo at pag-aralan ang mga pangunahing parameter ng mga sistema ng multiphase, ang mga konseptong ideya ng mga modelong ito ay ganap na naiiba. Ang paghahambing ng mga pangunahing ideyang ito ay makakatulong sa mag-aaral na maunawaan ang mga pangunahing konsepto na sumasailalim sa parallel computing, multiprocessor statistical at simulation modeling.

    Ang unang modelo na ipinakita sa amin ay batay sa real-time na pag-record at tinatawag namin itong modelo ng simulation. Gumagamit ito ng Python multiprocessor module. Ang katumpakan ng modelong ito ay nakasalalay sa katumpakan at resolusyon ng time() na pamamaraan. Ito ay maaaring medyo mababa sa kaso ng iba't ibang pangkalahatang layunin na operating system, at medyo mataas sa kaso ng mga real-time na system. Maaaring baguhin ng mag-aaral ang modelong ito gamit ang dating iminungkahing recursive equation (upang kalkulahin ang oras na ginugol ng isang entity sa system) at ihambing ang mga resulta sa parehong mga kaso.

    Kinakalkula ng sumusunod na modelo ang oras ng paninirahan ng isang order sa system at batay sa stochastic simulation. Ang modelo ay hindi direktang gumagamit ng multiprocessing. Ang multiprocessing ay ginagaya gamit ang yield sa mga expression ng Python.

    Ang pinakabagong modelo ay ipinakita dito gamit ang Python MPI mpi4py module. Dito ay gumagamit kami ng isang tunay na diskarte ng MPI (multiprocessor) para sa pagmomolde ng istatistika at maaari, dahil dito, dagdagan ang bilang ng mga pagsubok sa pamamaraan ng Monte Carlo.

    Sa pangkalahatan, ang gawain ng mag-aaral ay lumikha ng isang serye ng mga eksperimento kasama ang mga ibinigay na modelo at kumuha ng pang-eksperimentong patunay ng batas ng iterated logarithm para sa oras ng paninirahan ng aplikasyon sa multiphase QS.

    5.2. Simulation model gamit ang multiprocessor service

    Nasa ibaba ang isang modelo ng simulation. Ang pangunahing tanong na pag-aaralan ay ang pagkakaiba sa pagitan ng isang modelo ng simulation at isang modelo ng istatistika. Ang isa pang mahalagang isyu ay ang kawastuhan at katumpakan ng modelo ng simulation. Mahalaga rin ang tanong ng kawastuhan at katumpakan ng ipinakita na modelo. Maaaring suriin at ihambing ng mag-aaral ang mga resulta ng simulation depende sa iba't ibang mga parameter tulad ng agwat ng pagproseso at dalas, bilang ng mga kahilingan, at bilang ng mga node sa paghahatid. Ang pangkalahatang pamamaraan ng modelo ay ipinapakita sa Figure 17.


    kanin. 17. modelo ng simulation

    Program code Ang code ay binubuo ng dalawang pangunahing bahagi. Ang una ay direktang inilaan para sa mga kalkulasyon, at ang susunod ay para sa paglalagay ng mga resulta. Ang module ng pagkalkula ay naglalaman ng tatlong pangunahing function: producer() - para sa pagtanggap ng mga kahilingan at paglalagay sa kanila sa unang lugar; server() - para sa mga kahilingan sa serbisyo; consumer() - upang makakuha ng mga resulta. Ang modelo ng programming na ito ay batay sa isang tunay na simulation at hindi gumagamit ng mga mathematical expression para sa mga kalkulasyon. Ang katumpakan nito ay nakasalalay sa katumpakan ng pansamantalang module ng Python at sa pangkalahatan ay umaasa sa operating system. Ang pagkalkula ng gawain ng mga aparato ng serbisyo ay ipinamamahagi sa iba't ibang mga proseso sa loob ng multiprocessor system. Ang computer code para sa pagpapatupad ng modelo sa itaas ay ipinapakita sa Figure 18.

    Mag-import ng multiprocessing import time import random import numpy bilang np def server(input_q,next_q,i): while True: item = input_q.get() if i==0:item.st=time.time() ## start recording time ## (unang yugto) timc.sleep(random.expovariate(glambda|i])) ##stop recording time (huling phase) kung i==M-1:item.st=time.time()-item.st next_q.put(item) input_q.task_done() print("Server%d stop" % i) ##ay hindi kailanman ipi-print bakit? def producer(sequence,output_q): para sa item sa sequence: time.sleep(random.expovariate(glambda)) output_q.put(ilem) def consumer(input_q): "Finalizing procedures" ## start recording processing time ptime=time. time() in_seq= while True: item = input_q.get() in_scq+= input_q.task_done() if item.cid == N-1: break print_results(in_seq) print("END") print("Processing time sec. %d" %(time.time()-ptime)) ## stop recording processing time printf("CPU used %d" %(multiprocessing.cpu_count())) def print_resulls(in_seq): "Output rezults" f=open ("out.txt","w") f.write("%d\n" % N) para sa l sa range(M): f.write("%d%s" % (glambda[t]," ,")) f.write("%d\n" % glambda[M]) para sa t sa hanay(N-1): f.write("%f%s" % (in_seq[t].st," ,")) f.write("%f\n" % (in_seq.st)) f.close() class Client(object): "Class client" def __init__(self,cid,st): self.cid= cid ## customer id self.st=st ## sojourn time ng customer ###GLOBALS N=100 ## kabuuang bilang ng mga customer na dumating M=5 ## bilang ng mga server ### glambda - pagdating + dalas ng serbisyo ### = mga customer/bawat unit ng oras glambda=np.array(+) ###START kung __name__ == "__main__": all_clients= q= para sa i in range(M): serv = multiprocessing.Process(target=server,args=(q[i],q,i)) serv.daemon=True serv.start() cons = multiprocessing.Process(target=consumer,args=(q[M] ,)) cons.start() ### simulan ang "produsing" mga customer producer(all_clients,q) para sa i in q: i.join()
    kanin. labing-walo. Python code para sa isang simulation model gamit ang isang multiprocessor service.

    Mga tanong na pag-aaralan:

    • Paano ibinibigay at ibinabahagi ang mga pandaigdigang variable sa pagitan ng mga proseso?
    • Paano wakasan ang mga prosesong nauugnay sa iba't ibang device ng serbisyo?
    • Paano ipinapadala ang daloy ng impormasyon sa pagitan ng iba't ibang proseso?
    • Paano ang tungkol sa kawastuhan ng modelo?
    • Paano ang tungkol sa kahusayan ng modelo. Gaano katagal bago magpalitan ng impormasyon ang iba't ibang proseso?
    Maaari na naming i-print ang mga resulta gamit ang matplotlib module at biswal na masuri ang mga resulta pagkatapos ibigay ang chart. Makikita natin (Figure 19) na ang modelo ay nangangailangan ng karagdagang pagpapabuti. Kaya, maaari tayong lumipat sa isang mas makapangyarihang modelo.


    kanin. labinsiyam. Mga resulta ng simulation ng simulation model ng isang multiprocessor service.

    5.3. Modelo ng istatistikal na proseso ng unit

    Ang pangunahing tampok ng istatistikal na modelo ay ang mga sumusunod: ngayon ay gumagamit kami ng recursive equation upang tumpak na kalkulahin ang oras na ginugol ng isang order sa system; pinoproseso namin ang lahat ng data sa isang proseso gamit ang isang partikular na Python coroutine function; nagsasagawa kami ng isang tiyak na bilang ng mga simulation ng Monte Carlo para sa mas mahusay na pagiging maaasahan ng mga kalkulasyon. Ang modelong ito ay nagbibigay sa amin ng "eksaktong" mga kalkulasyon ng oras na ginugugol ng isang order sa system. Ang pangunahing diagram ng modelo ay ipinapakita sa Figure 20. Maaaring tuklasin ng mag-aaral ang mga pagkakaiba sa pagitan ng isang modelo ng simulation at isang modelo ng istatistika.


    kanin. 20. Modelo ng istatistikal na proseso ng unit

    Ang program code para sa pagpapatupad ng modelo sa itaas ay ipinapakita sa Figure 21. Ang mga resulta ng simulation ay ipinapakita sa Figure 22.

    #!/usr/bin/python import random import time import numpy bilang np mula sa numpy import linspace def coroutine(func): del start(*args,**kwargs): g = func(*args,**kwargs) g. next() return g return start def print_header(): "Mga resulta ng output - header" f=open("out.txt","w") f.write("%d\n" % N) ##bilang ng mga puntos sa template ng pag-print f.write("%d\n" % TMPN) para sa t sa range(M): f.write("%d%s" % (glambda[t],","")) f.write( "%d\n" % glambda[M]) f.close() def print_results(in_seq): "Mga resulta ng output" f=open("out.txt","a") k=() para sa i in range( N-2): kung in_seq[i].cid==template[k]: f.write("%f%s" % (in_seq[i].st,",")) k+=1 f.write( "%f\n" % (in_seq.st)) f.close() coroutine def server(i): ST=0 ##oras ng pamamalagi para sa nakaraang item ng kliyente=Wala habang True: item = (yield item) ## makakuha ng item kung item == Wala: ##new Monte Carlo iteration ST=0 continue waiting_time=max(0.0,ST-item.st-item.tau) item.st+=random.expovariate(glambda)+waiting_time ST=item. st def producer(): results= i=0 while True : kung i == N: break c=Client(i,0.,0.) if i!=0: c.tau=random.expovariate(glambda) i+= 1 para sa s sa p: c=s.send( c) resulta+=[c] para sa s sa p: c=s.send(Wala) ##final signal return results class Kliyente(object): def __init__(self,cid,st,tau): self.cid=cid self .st=st self.tau=tau def params(self): return (self.cid,self.st,self.tau) stt=time.time() N=1000000 ## Mga Kliyente M=5 ## Mga Server ## Input/sevice frequency glambda= + MKS=20 ## Monte Carlo simulation resulta ## Bilang ng mga puntos sa printing template TMPN=N/10000 ##printing template template= map(int,linspace(0,N-1,TMPN) ) print_header() p= para sa i sa range(M):p += para sa i sa range! MKS): print_results(producer()) print("Step=%d" % i) sys.stdout.write("Processing time:%d\n" % int(time.time()-stt))
    kanin. 21. Python code para sa unit process statistical model


    kanin. 22. Mga resulta ng simulation para sa unit process ng statistical model

    5.4. Modelo ng istatistika sa MPI

    Ang susunod na hakbang sa pagbuo ng aming modelo ay ang paggamit ng Python MPI module - mpi4py. Nagbibigay-daan ito sa amin na magpatakbo ng higit pang mga simulation ng Monte Carlo at gamitin ang cluster upang patakbuhin at subukan ang modelo. Ang susunod na hakbang ay dapat na higit pang pagpapabuti ng modelo batay sa paggamit ng C programming language, ang "totoong" MPI o SWIG (https://ru.wikipedia.org/wiki/SWIG) na teknolohiya para sa Python. Ang modelong ito ay halos magkapareho sa nakaraang modelo, na ang pagkakaiba lamang ay ang mpi4py ay ginagamit para sa multiprocessing at pagsasama ng mga resulta (Larawan 23).


    kanin. 23. Modelo ng istatistika ng MPI

    Bilang karagdagan sa nakaraang modelo, maraming karagdagang mga module ang dapat na ma-import. Ang print_results() function ay kailangan ding muling isulat dahil mayroon kaming higit pang pagsubok sa yugtong ito. Dapat din nating muling isulat ang pangunahing bahagi ng programa. Sa Figure 24, ibinigay lamang namin ang bahaging iyon ng code na naiiba sa code ng nakaraang modelo. Ang mga resulta ng simulation ay ipinapakita sa Figure 25.

    Mag-import ng mga sys mula sa mpi4py import MPI .................... def print_results(in_seq): "Mga resulta ng output" f=open("out.txt","a") para sa m sa hanay(int(laki)): para sa j sa hanay(MKS): para sa i sa hanay(TMPN-l): f.write("%f%s" % (in_seq[m].st,", ")) f.write("%f\n" % (in_seq[m][(TMPN-l)+j*TMPN].st)) f.close() ........... ......... stt=time.time() #start time para sa ranggo ng proseso = MPI.COMM_WORLD.Get_rank() size = MPI.COMM_WORLD.Get_size() name = MPI.Get_processor_name() N= 10 **3 ## Mga Kliyente M=5 ## Mga Server ## Input/sevice frequency glambda=+ ## Bilang ng Monte-Carlo simulation para sa partikular na prosesong ito MKS=20 TMPN=200 ## Bilang ng mga puntos sa pag-print ng template ng template= mapa (int,linspace(0,N-1,TMPN)) ## puntos para sa pag-print p= resulta= ## resulta ng prosesong ito total_results= ## pangkalahatang resulta para sa i in range(M):p += para sa i in range( MKS):results+=producer() total_results=MPI.COMM_WORLD.gather(results,0) random.seed(rank) kung rank == 0: print_header() print_results(total_results) sys.stdout.write("Processi ng oras: %d\n" % int(time.time()-stt))
    kanin. 24. Python code para sa istatistikal na modelo batay sa MPI


    kanin. 25. Mga resulta ng simulation ng modelo ng istatistika ng MPI

    6. Konklusyon

    Sa artikulong ito, ilang mga modelo para sa simulation-based na pag-aaral ang isinaalang-alang. Ang mga modelong ito ay nagbibigay-daan sa mag-aaral na magsagawa ng isang serye ng mga eksperimento at dagdagan ang pag-unawa sa disiplina ng Scientific Computer Science. Mayroong ilang mga antas ng pagiging kumplikado ng ipinakita na mga modelo at mga eksperimento sa mga naturang modelo. Ang unang antas ay basic. Dinadala tayo nito sa pag-unawa sa mga random na variable, at binibigyan din tayo ng pangunahing pag-unawa sa larangan ng siyentipikong pananaliksik. Ang susunod na antas ay mas advanced at nagbibigay ng mas malalim na pag-unawa sa parallel programming at stochastic simulation. Ang mga nauugnay na teoretikal na kaalaman ay ipinakita, at, kung kinakailangan, ay maaaring magamit bilang karagdagang materyal. Ang lahat ng ito ay nagbibigay ng pangunahing toolkit para sa isang panimula sa Scientific Computer Science. Sa wakas, gusto naming gumawa ng mga rekomendasyon para sa karagdagang pag-aaral at pagpapabuti ng mga modelo.

    6.1. Linearity ng Modelo at Statistical Parameter ng QS

    Ang multiphase QS model na ipinakita sa artikulong ito ay hindi linear. Ito ay nagiging maliwanag mula sa recursive equation, dahil naglalaman ito ng non-linear mathematical function max. Kung gusto nating makuha ang tamang mga resulta ng simulation, lalo na sa kaso ng pagkalkula ng mga istatistikal na parameter ng QS, dapat tayong gumamit ng bahagyang linear na modelo para sa pagkalkula. Ito ay lalong mahalaga para sa mga diskargadong sistema ng transportasyon, dahil kung hindi man ay makakakuha tayo ng isang medyo malaking maling pagkakaiba sa mga kalkulasyon.

    6.2. Mga Extension ng Python Module at Parallel C Programming

    Para sa mga dalubhasang mag-aaral, maaaring maging kawili-wiling ipagpatuloy ang pagpapabuti ng kahusayan ng code. Magagawa ito sa pamamagitan ng pagpapalawak ng mga module ng Python na may mga ipinatupad na C function gamit ang teknolohiyang SWING. Posibleng pagbutihin ang mga kalkulasyon ng code at pabilisin ang mga kalkulasyon gamit ang Cython, ang C programming language, "tunay" na mga teknolohiya ng MPI at HTC (high performance computing) sa mga cluster system.

    6.3. Kahusayan ng mga solusyon sa software at karagdagang pag-unlad

    Sa seksyong ito, maaaring tuklasin ng mag-aaral ang pagiging epektibo ng iba't ibang solusyon sa software. Ang paksang ito ay mahalaga para sa anumang mga modelo ng programming na nakabatay sa parallel computing. Maaaring pag-aralan ng mag-aaral ang pagiging epektibo ng iba't ibang mga modelo ng programming at subukang pagbutihin ang mga algorithm nang hakbang-hakbang. Ang pangunahing punto dito ay pag-aralan ang ratio ng bilang ng mga daloy ng impormasyon at mga kalkulasyon para sa iba't ibang proseso ng software. Kaya't ang ratio ay mahalaga sa pagbuo ng pinaka mahusay na pagbuo ng programa na may parallel computing. Ang isa pang kawili-wiling paksa ay ang pag-aaral ng posibilidad ng pag-convert ng isang algorithmic na istraktura sa isang clustered na istraktura ng HTC.

    Bilang karagdagang gawain para sa pananaliksik, isinasaalang-alang ng mga may-akda ang pagmomodelo ng QS, na dapat na mamodelo at masuri. Ang medyo kumplikadong katangian ng QS at ang kaukulang uri ng mga application ay nangangailangan ng paggamit ng mas malawak na mga diskarte sa programming. Nagbibigay ito ng magandang base platform para sa pagpapatupad ng mga karaniwang konsepto ng programming gaya ng inheritance, encapsulation, at polymorphism. Sa kabilang banda, kailangan ding saklawin ang mga pangunahing teoretikal na konsepto ng computer science. Higit sa lahat ng ito, ang QS statistical at simulation modeling ay nangangailangan ng mas advanced na kaalaman sa probability theory, ang paggamit ng mas maraming computing resources at ang pagkakaloob ng isang tunay na scientific computing environment, pati na rin ang magandang motibasyon para sa advanced na estudyante.

    Panitikan

    Buong listahan ng mga sanggunian

    A. Arazi, E. Ben-Jacob at U. Yechiali, Bridging genetic network-works and queuing theory, Physica A: Statistical Mechanics and Its Applications 332 (2004), 585–616.
    D.M. Beazley, Python Essential Reference, Addison-Wesley Professional, 2009.
    J. Bernard, Gumamit ng Python para sa scientific computing, Linux Journal 175 (2008), 7.
    U.N. Bhat, Isang Panimula sa Pagmomodelo at Pagsusuri ng Teorya ng Pagpila sa Mga Aplikasyon, Birkhäuser, Boston, MA, 2008.
    K.J. Bogacev, Mga Pangunahing Kaalaman ng Parallel Programming, Binom, Moscow, 2003.
    R.N. Caine at G. Caine, Making Connections: Teaching and the Human Brain, Association for Supervision and Curriculum Development, Alexandria, 1991.
    J. Clement at M.A. Rea, Model Based Learning and Instruction in Science, Springer, The Netherlands, 2008.
    N.A. Cookson, W.H. Mather, T. Danino, O. Mondragón- Palomino, R.J. Williams, L.S. Tsimring at J. Hasty, Pumila para sa enzymatic processing: correlated signaling through coupled degradation, Molecular Systems Biology 7 (2011), 1. A.S. Gibbons, Model-centered na pagtuturo, Journal of Structural Learning and Intelligent Systems 4 (2001), 511–540. M.T. Heath, Scientific Computing isang Panimulang Survey, McGraw-Hill, New York, 1997.
    A. Hellander, Stochastic Simulation at Monte Carlo Methods, 2009.
    G.I. Ivchenko, V.A. Kastanov at I.N. Kovalenko, Queuing System Theory, Visshaja Shkola, Moscow, 1982.
    Z.L. Joel, N.W. Wei, J. Louis at T.S. Chuan, Discrete-event
    simulation ng queuing system, sa: Sixth Youth Science Conference, Singapore Ministry of Education, Singapore, 2000, pp. 1–5.
    E. Jones, Introduction to scientific computing with Python, sa: SciPy, California Institute of Technology, Pasadena, CA, 2007, p. 333.
    M. Joubert at P. Andrews, Pananaliksik at mga pagpapaunlad sa probabilidad na edukasyon sa buong mundo, sa: British Congress for Mathematics Education, 2010, p. 41.
    G.E. Karniadakis at R.M. Kyrby, Parallel Scientific Computing sa C++ at MPI. Isang Seamless na Diskarte sa Parallel Algorithms at Ang Pagpapatupad Nito, Cambridge Univ. press, 2003.
    D.G. Kendall, Stochastic na mga proseso na nagaganap sa teorya ng mga pila at ang kanilang pagsusuri sa pamamagitan ng pamamaraan ng naka-embed na Markov chain, The Annals of Mathematical Statistics 1 (1953), 338–354.
    MS. Sina Khine at I.M. Saleh, Mga Modelo at pagmomodelo, mga kasangkapang nagbibigay-malay para sa siyentipikong pagtatanong, sa: Mga Modelo at Pagmomodelo sa Edukasyong Agham, Springer, 2011, p. 290.
    T. Kiesling at T. Krieger, Efficient parallel queuing system simulation, sa: The 38th Conference on Winter Simulation, Winter Simulation Conference, 2006, pp. 1020–1027.
    J. Kiusalaas, Numerical Methods in Engineering with Python, Cambridge Univ. Press, 2010.
    A. Kumar, Python para sa Edukasyon. Pag-aaral ng Maths & Science Gamit ang Python at Pagsulat ng mga Ito sa LATEX, Inter University Accelerator Center, New Delhi, 2010.
    H.P. Langtangen, Python Scripting para sa Computational Science, Springer-Verlag, Berlin, 2009.
    H.P. Langtangen, A Primer on Scientific Programming with Python, Springer-Verlag, Berlin, 2011.
    H.P. Langtangen, Karanasan sa paggamit ng Python bilang pangunahing wika para sa pagtuturo ng scientific computing sa University of Oslo, University of Oslo, 2012.
    R. Lehrer at L. Schauble, Paglinang ng batay sa modelong pangangatwiran sa edukasyon sa agham, sa: The Cambridge Handbook of the Learning Sciences, Cambridge Univ. Press, 2005, pp. 371–388.
    G. Levy, Isang panimula sa mga quasi-random na numero, sa: Numerical Algorithms, Group, 2012.
    J.S. Liu, Mga Istratehiya ng Monte Carlo sa Scientific Computing, Harvard Univ., 2001.
    V.E. Malishkin at V.D. Korneev, Parallel Programming of Multicomputers, Novosibirsk Technical Univ., Novosibirsk, 2006.
    N. Matloff, Programming on Parallel Machines: GPU, Multi-core, Clusters and More, University of California, 2012.
    M.Milrad, J.M. Spector at P.I. Davidsen, Model facilitated learning, sa: Instructional Design, Development and Evaluation, Syracuse Univ. press, 2003.
    S. Minkevicius, Sa batas ng iterated logarithm sa multiphase queuing system, Informatica II (1997), 367–376.
    S. Minkevicius at V. Dolgopolovas, Pagsusuri ng batas ng inuulit na logarithm para sa idle time ng isang customer sa multiphase queues, Int. J. Purong Appl. Math. 66 (2011), 183–190.
    Model-Centered Learning, Pathways to mathematical understanding using GeoGebra, in: Modelling and Simulations for Learning and Instruction, Sense Publishers, The Netherlands, 2011.
    C.R. Myers at J.P. Sethna, Python para sa edukasyon: Computational method para sa nonlinear system, Computing in Science & Engineering 9 (2007), 75–79.
    H. Niederreiter, Random Number Generation at Quasi-Monte Carlo Methods, SIAM, 1992.
    F.B. Nilsen, Queueing system: Pagmomodelo, pagsusuri at simulation, Department of Informatics, University of Oslo, Oslo, 1998.
    R.P. Sen, Operations Research: Algorithms and Applications, PHI Learning, 2010. Magdagdag ng mga tag

    Plano:

    1. Ang konsepto ng central limit theorem (Lyapunov's theorem)

    2. Batas ng malalaking numero, posibilidad at dalas (theorems ng Chebyshev at Bernoulli)

    1. Ang konsepto ng central limit theorem.

    Ang normal na pamamahagi ng posibilidad ay may malaking kahalagahan sa teorya ng posibilidad. Ang normal na batas ay sumusunod sa posibilidad kapag bumaril sa isang target, sa mga sukat, atbp. Sa partikular, lumalabas na ang batas sa pamamahagi para sa kabuuan ng isang sapat na malaking bilang ng mga independiyenteng random na variable na may mga arbitrary na batas sa pamamahagi ay malapit sa normal na pamamahagi. Ang katotohanang ito ay tinatawag na central limit theorem o Lyapunov's theorem.

    Ito ay kilala na ang karaniwang ipinamamahagi na mga random na variable ay malawakang ginagamit sa pagsasanay. Ano ang nagpapaliwanag nito? Ang tanong na ito ay nasagot na

    Central limit theorem. Kung ang isang random na variable na X ay ang kabuuan ng isang napakalaking bilang ng magkaparehong independiyenteng mga random na variable, ang impluwensya ng bawat isa sa kabuuan ay bale-wala, kung gayon ang X ay may distribusyon na malapit sa normal na distribusyon.

    Halimbawa. Hayaang sukatin ang ilang pisikal na dami. Ang anumang pagsukat ay nagbibigay lamang ng tinatayang halaga ng sinusukat na dami, dahil maraming independiyenteng random na salik (temperatura, pagbabagu-bago ng instrumento, halumigmig, atbp.) ang nakakaimpluwensya sa resulta ng pagsukat. Ang bawat isa sa mga salik na ito ay bumubuo ng isang bale-wala na "partial error". Gayunpaman, dahil ang bilang ng mga salik na ito ay napakalaki, ang kanilang pinagsama-samang epekto ay bumubuo ng kapansin-pansing "kabuuang error".

    Isinasaalang-alang ang kabuuang error bilang kabuuan ng isang napakalaking bilang ng magkahiwalay na independiyenteng bahagyang mga error, maaari nating tapusin na ang kabuuang error ay may distribusyon na malapit sa normal na distribusyon. Kinukumpirma ng karanasan ang bisa ng konklusyong ito.

    Isaalang-alang ang mga kondisyon kung saan nasiyahan ang "central limit theorem".

    x1,X2, ..., Xn ay isang pagkakasunud-sunod ng mga independiyenteng random na variable,

    M(X1),M(X2), ...,M(Xn) ay ang panghuling mga inaasahan sa matematika ng mga dami na ito, ayon sa pagkakabanggit ay katumbas ng M(Xk)= ak

    D (X1),D(X2), ...,D(Xn) - ang kanilang mga huling pagkakaiba, ayon sa pagkakabanggit ay katumbas ng D(X k)= bk2

    Ipinakilala namin ang notasyon: S= X1+X2 + ...+Xn;

    A k= X1+X2 + ...+Xn=; B2=D (X1)+D(X2)+ ...+D(Xn) =

    Isinulat namin ang function ng pamamahagi ng normalized sum:

    Sabi nila sa pagkakasunod-sunod x1,X2, ..., Xn ang central limit theorem ay naaangkop kung, para sa alinman x ang distribution function ng normalized sum bilang n ® ¥ ay may kaugaliang normal distribution function:

    Kanan "style="border-collapse:collapse;border:none;margin-left:6.75pt;margin-right: 6.75pt">

    Isaalang-alang ang isang discrete random variable X, ibinigay ng talahanayan ng pamamahagi:

    Itakda natin sa ating sarili ang gawain ng pagtantya ng posibilidad na ang paglihis ng isang random na variable mula sa inaasahan sa matematika nito ay hindi lalampas sa ganap na halaga sa isang positibong numero ε

    Kung ang ε sapat na maliit, kaya namin tantiyahin ang posibilidad na X ay kukuha ng mga halaga na malapit sa inaasahan sa matematika nito. pinatunayan ang isang hindi pagkakapantay-pantay na nagpapahintulot sa amin na magbigay ng pagtatantya ng interes sa amin.

    Lemma Chebyshev. Ibinigay ang isang random na variable X na kumukuha lamang ng mga di-negatibong halaga na may inaasahan na M(X). Para sa anumang bilang na α>0, nagaganap ang expression:

    Ang hindi pagkakapantay-pantay ni Chebyshev. Ang posibilidad na ang paglihis ng isang random na variable X mula sa kanyang inaasahan sa matematika sa ganap na halaga ay mas mababa sa isang positibong numero ε , hindi bababa sa 1 – D(X) / ε 2:

    P(|X-M(X)|< ε ) ³ 1 - D (X) / ε 2.

    Magkomento. Ang hindi pagkakapantay-pantay ni Chebyshev ay may limitadong praktikal na halaga, dahil madalas itong nagbibigay ng magaspang at kung minsan ay walang halaga (walang interes) na pagtatantya.

    Ang teoretikal na kahalagahan ng hindi pagkakapantay-pantay ng Chebyshev ay napakalaki. Sa ibaba ay gagamitin natin ang hindi pagkakapantay-pantay na ito upang makuha ang Chebyshev theorem.

    2.2. Ang teorama ni Chebyshev

    Kung ang X1, X2, ..., Xn.. ay magkapares na independiyenteng random na mga variable, at ang kanilang mga pagkakaiba ay pantay na limitado (hindi lalampas sa isang pare-parehong bilang C), kung gayon, gaano man kaliit ang positibong numero ε , ang posibilidad ng hindi pagkakapantay-pantay

    ÷ (X1+X2 + ...+Xn) / n - (M(X1)+M(X2)+ ...+M(Xn))/n |< ε

    ay arbitraryong malapit sa pagkakaisa kung ang bilang ng mga random na variable ay sapat na malaki.

    P (÷ (X1+X2 + ...+Xn) / n - (M(X1)+M(X2)+ ...+M(Xn))/n |< ε )=1.

    Ang teorama ni Chebyshev ay nagsasaad:

    1. Isinasaalang-alang namin ang isang sapat na malaking bilang ng mga independiyenteng random na variable na may limitadong mga pagkakaiba-iba,

    Kapag binabalangkas ang teorama ni Chebyshev, ipinapalagay namin na ang mga random na variable ay may iba't ibang mga inaasahan sa matematika. Sa pagsasagawa, madalas na nangyayari na ang mga random na variable ay may parehong inaasahan sa matematika. Malinaw, kung muli nating ipagpalagay na ang mga pagpapakalat ng mga dami na ito ay limitado, kung gayon ang teorama ni Chebyshev ay magiging angkop sa kanila.

    Tukuyin natin ang mathematical na inaasahan ng bawat isa sa mga random na variable sa pamamagitan ng a;

    Sa kasong isinasaalang-alang, ang arithmetic mean ng mga inaasahan sa matematika, dahil madaling makita, ay katumbas din ng a.

    Maaaring bumalangkas ng teorama ni Chebyshev para sa partikular na kaso na isinasaalang-alang.

    "Kung ang Х1, Х2, ..., Хn.. ay magkapares na independiyenteng random na mga variable na may parehong matematikal na inaasahan a, at kung ang mga dispersion ng mga variable na ito ay pantay na limitado, kung gayon, gaano man kaliit ang bilang ε > Oh, ang posibilidad ng hindi pagkakapantay-pantay

    ÷ (X1+X2 + ...+Xn) / n - a | < ε

    ay arbitraryong malapit sa pagkakaisa kung ang bilang ng mga random na variable ay sapat na malaki" .

    Sa madaling salita, sa ilalim ng mga kondisyon ng teorama

    P (÷ (X1+X2 + ...+Xn) / n - a |< ε ) = 1.

    2.3. Ang kakanyahan ng teorama ni Chebyshev

    Kahit na ang mga indibidwal na independiyenteng random na mga variable ay maaaring tumagal ng mga halaga na malayo sa kanilang mga inaasahan sa matematika, ang arithmetic mean ng isang sapat na malaking bilang ng mga random na variable na may mataas na posibilidad ay tumatagal ng mga halaga na malapit sa isang tiyak na pare-parehong numero, lalo na ang numero.

    (M(Xj) + M (X2)+... + M (Xn))/n o sa numero at sa partikular na kaso.

    Sa madaling salita, ang mga indibidwal na random na variable ay maaaring magkaroon ng isang makabuluhang spread, at ang kanilang arithmetic mean ay maliit na nakakalat.

    Kaya, ang isang tao ay hindi maaaring kumpiyansa na mahulaan kung anong posibleng halaga ang kukunin ng bawat isa sa mga random na variable, ngunit ang isa ay maaaring mahulaan kung ano ang halaga ng kanilang arithmetic mean.

    Kaya, ang arithmetic mean ng isang sapat na malaking bilang ng mga independiyenteng random na variable (ang mga pagkakaiba-iba nito ay pantay na limitado) ay nawawala ang katangian ng isang random na variable.

    Ito ay ipinaliwanag sa pamamagitan ng katotohanan na ang mga paglihis ng bawat isa sa mga dami mula sa kanilang mga inaasahan sa matematika ay maaaring parehong positibo at negatibo, at sa aritmetika ay nangangahulugang kinansela nila ang isa't isa.

    Ang teorama ni Chebyshev ay wasto hindi lamang para sa discrete, kundi pati na rin para sa tuluy-tuloy na random variable; ito ay isang halimbawa na nagpapatunay sa bisa ng doktrina ng koneksyon sa pagitan ng pagkakataon at pangangailangan.

    2.4. Kahalagahan ng teorama ni Chebyshev para sa pagsasanay

    Magbigay tayo ng mga halimbawa ng aplikasyon ng Chebyshev theorem sa solusyon ng mga praktikal na problema.

    Karaniwan, upang sukatin ang isang tiyak na pisikal na dami, ilang mga sukat ang ginawa at ang kanilang arithmetic mean ay kinuha bilang ang nais na laki. Sa ilalim ng anong mga kondisyon maituturing na tama ang paraan ng pagsukat na ito? Ang sagot sa tanong na ito ay ibinigay ng Chebyshev's theorem (partikular nitong kaso).

    Sa katunayan, isaalang-alang ang mga resulta ng bawat pagsukat bilang mga random na variable

    X1, X2, ..., Xn

    Sa mga dami na ito, maaaring ilapat ang Chebyshev theorem kung:

    1) Sila ay magkapares na independyente.

    2) may parehong inaasahan sa matematika,

    3) ang kanilang mga dispersion ay pantay na limitado.

    Ang unang kinakailangan ay nasiyahan kung ang resulta ng bawat pagsukat ay hindi nakasalalay sa mga resulta ng iba.

    Ang pangalawang kinakailangan ay natutugunan kung ang mga sukat ay ginawa nang walang sistematikong (isang tanda) na mga error. Sa kasong ito, ang mga inaasahan sa matematika ng lahat ng mga random na variable ay pareho at katumbas ng tunay na laki a.

    Ang pangatlong kinakailangan ay natutugunan kung ang aparato ay nagbibigay ng isang tiyak na katumpakan ng pagsukat. Bagama't iba ang mga resulta ng mga indibidwal na sukat, limitado ang kanilang pagkalat.

    Kung ang lahat ng tinukoy na mga kinakailangan ay natutugunan, kami ay may karapatang ilapat ang Chebyshev theorem sa mga resulta ng pagsukat: para sa isang sapat na laki P posibilidad ng hindi pagkakapantay-pantay

    | (X1 + Xa+...+Xn)/n - a |< ε arbitraryong malapit sa pagkakaisa.

    Sa madaling salita, na may sapat na malaking bilang ng mga sukat, halos tiyak na ang kanilang arithmetic mean ay bahagyang naiiba sa tunay na halaga ng sinusukat na dami.

    Ang theorem ni Chebyshev ay nagpapahiwatig ng mga kondisyon kung saan maaaring mailapat ang inilarawan na paraan ng pagsukat. Gayunpaman, ito ay isang pagkakamali na isipin na, sa pamamagitan ng pagtaas ng bilang ng mga sukat, ang isa ay maaaring makamit ang isang di-makatwirang mataas na katumpakan. Ang katotohanan ay ang aparato mismo ay nagbibigay ng mga pagbabasa lamang na may katumpakan na ± α, samakatuwid, ang bawat isa sa mga resulta ng pagsukat, at samakatuwid ang kanilang arithmetic mean, ay makukuha lamang sa isang katumpakan na hindi lalampas sa katumpakan ng aparato.

    Ang paraan ng sampling na malawakang ginagamit sa mga istatistika ay batay sa Chebyshev theorem, ang esensya nito ay ang isang medyo maliit na random na sample ay ginagamit upang hatulan ang buong populasyon (pangkalahatang populasyon) ng mga bagay na pinag-aaralan.

    Halimbawa, ang kalidad ng isang bale ng cotton ay hinuhulaan mula sa isang maliit na bundle na binubuo ng mga hibla na random na pinili mula sa iba't ibang bahagi ng bale. Kahit na ang bilang ng mga hibla sa isang bundle ay mas mababa kaysa sa isang bale, ang bundle mismo ay naglalaman ng medyo malaking bilang ng mga hibla, na may bilang na daan-daan.

    Bilang isa pang halimbawa, maaaring ituro ng isa ang pagpapasiya ng kalidad ng butil mula sa isang maliit na sample. At sa kasong ito, ang bilang ng mga random na napiling butil ay maliit kumpara sa buong masa ng butil, ngunit sa sarili nito ay medyo malaki.

    Mula na sa mga halimbawang binanggit, maaari nating tapusin na para sa pagsasanay ang teorama ni Chebyshev ay hindi matatawaran ang kahalagahan.

    2.5. TeoramaBernoulli

    Ginawa P mga independyenteng pagsusulit (hindi mga kaganapan, ngunit mga pagsubok). Sa bawat isa sa kanila, ang posibilidad ng paglitaw ng isang kaganapan A ay katumbas ng R.

    Ang tanong ay lumitaw, ano ang magiging relatibong dalas ng paglitaw ng kaganapan? Ang tanong na ito ay sinasagot ng teorama na pinatunayan ni Bernoulli, na tinawag na "batas ng malalaking numero" at inilatag ang pundasyon para sa teorya ng posibilidad bilang isang agham.

    Ang teorama ni Bernoulli. Kung sa bawat isa P independent test probability R paglitaw ng isang pangyayari PERO ay pare-pareho, pagkatapos ay ang posibilidad na ang paglihis ng relatibong dalas mula sa posibilidad R ay arbitraryong maliit sa ganap na halaga kung ang bilang ng mga pagsubok ay sapat na malaki.

    Sa madaling salita, kung ang ε >0 ay isang arbitraryong maliit na numero, kung gayon sa ilalim ng mga kondisyon ng theorem mayroon tayong pagkakapantay-pantay

    P(|m / n - p|< ε)= 1

    Magkomento. Magiging mali, sa batayan ng teorama ni Bernoulli, upang tapusin na sa pagtaas ng bilang ng mga pagsubok, ang relatibong dalas ay patuloy na nauukol sa posibilidad. R; sa madaling salita, ang teorama ni Bernoulli ay hindi nagpapahiwatig ng pagkakapantay-pantay (t/n) = p,

    AT Ang teorama ay tumatalakay lamang sa posibilidad na, na may sapat na malaking bilang ng mga pagsubok, ang relatibong dalas ay mag-iiba nang kaunti mula sa patuloy na posibilidad ng paglitaw ng isang kaganapan sa bawat pagsubok.

    Gawain 7-1.

    1. Tantyahin ang posibilidad na pagkatapos ng 3600 na paghagis ng die, ang bilang ng mga paglitaw ng 6 ay hindi bababa sa 900.

    Desisyon. Hayaang x ang bilang ng mga paglitaw ng 6 na puntos sa 3600 coin tosses. Ang posibilidad na makakuha ng 6 na puntos sa isang paghagis ay p=1/6, pagkatapos M(x)=3600 1/6=600. Ginagamit namin ang hindi pagkakapantay-pantay ng Chebyshev (lemma) para sa isang naibigay na α = 900

    = P(x³ 900) £ 600 / 900 =2 / 3

    Sagot 2 / 3.

    2. 1000 independiyenteng pagsusulit ang isinagawa, p=0.8. Hanapin ang posibilidad ng bilang ng mga paglitaw ng kaganapan A sa mga pagsubok na ito ay lumihis mula sa mathematical expectation modulo nito na mas mababa sa 50.

    Desisyon. Ang x ay ang bilang ng mga paglitaw ng kaganapan A sa n - 1000 na pagsubok.

    M (X) \u003d 1000 0.8 \u003d 800. D(x)=100 0.8 0.2=160

    Ginagamit namin ang hindi pagkakapantay-pantay ng Chebyshev para sa isang naibigay na ε = 50

    P(|x-M(x)|< ε) ³ 1 - D (x) / ε 2

    R(|x-800|< 50) ³ / 50 2 = 1-160 / 2500 = 0,936.

    Sagot. 0,936

    3. Gamit ang hindi pagkakapantay-pantay ng Chebyshev, tantyahin ang posibilidad na |X - M(X)|< 0,1, если D (X) = 0,001. Ответ Р³0,9.

    4. Ibinigay: P(|X- M(X)\< ε) ³ 0.9; D (X)= 0.004. Gamit ang hindi pagkakapantay-pantay ng Chebyshev, hanapin ang ε . Sagot. 0,2.

    Kontrolin ang mga tanong at gawain

    1. Layunin ng central limit theorem

    2. Mga kondisyon para sa applicability ng Lyapunov's theorem.

    3. Ang pagkakaiba sa pagitan ng lemma at Chebyshev's theorem.

    4. Mga kondisyon para sa applicability ng Chebyshev theorem.

    5. Mga kondisyon para sa applicability ng theorem ni Bernoulli (ang batas ng malalaking numero)

    Mga kinakailangan para sa kaalaman at kasanayan

    Dapat malaman ng mag-aaral ang pangkalahatang semantic formulation ng central limit theorem. Magagawang magbalangkas ng mga partial theorems para sa mga independiyenteng magkaparehong distributed na random variable. Unawain ang hindi pagkakapantay-pantay ng Chebyshev at ang batas ng malalaking numero sa anyo ng Chebyshev. Magkaroon ng ideya tungkol sa dalas ng isang kaganapan, ang kaugnayan sa pagitan ng mga konsepto ng "probability" at "frequency". Magkaroon ng pag-unawa sa batas ng malalaking numero sa anyo ng Bernoulli.

    (1857-1918), namumukod-tanging Russian mathematician

    Limitahan ang theorems ng probability theory

    Ang hindi pagkakapantay-pantay ni Chebyshev

    Isaalang-alang natin ang isang bilang ng mga pahayag at theorems mula sa isang malaking grupo ng mga tinatawag na limit theorems ng probability theory, na nagtatatag ng koneksyon sa pagitan ng teoretikal at pang-eksperimentong katangian ng mga random na variable na may malaking bilang ng mga pagsubok sa kanila. Binubuo nila ang batayan ng mga istatistika ng matematika. Ang mga teorema ng limitasyon ay karaniwang nahahati sa dalawang pangkat. Ang unang pangkat ng mga theorems, na tinatawag na batas ng malalaking numero, nagtatatag ng katatagan ng mga mean na halaga, i.e. na may malaking bilang ng mga pagsubok, ang kanilang average na resulta ay hindi na maging random at maaaring mahulaan nang may sapat na katumpakan. Ang pangalawang pangkat ng mga theorems, na tinatawag na gitnang limitasyon, ay nagtatatag ng mga kondisyon kung saan ang batas ng pamamahagi ng kabuuan ng isang malaking bilang ng mga random na variable ay lumalapit sa normal nang walang katiyakan.

    Una, isaalang-alang ang hindi pagkakapantay-pantay ng Chebyshev, na maaaring magamit upang: a) halos tantiyahin ang mga probabilidad ng mga kaganapang nauugnay sa mga random na variable na ang distribusyon ay hindi alam; b) mga patunay ng isang bilang ng mga theorems ng batas ng malalaking numero.

    Teorama 7.1. Kung ang random variable X may mathematical expectation at variance DX, pagkatapos ay ang hindi pagkakapantay-pantay ng Chebyshev

    . (7.1)

    Tandaan na ang hindi pagkakapantay-pantay ng Chebyshev ay maaaring isulat sa ibang anyo:

    para sa mga frequency o mga pangyayari sa n mga independiyenteng pagsubok, sa bawat isa ay maaaring mangyari ito nang may posibilidad , na ang pagkakaiba ay , ang hindi pagkakapantay-pantay ng Chebyshev ay may anyo

    Ang hindi pagkakapantay-pantay (7.5) ay maaaring muling isulat bilang

    . (7.6)

    Halimbawa 7.1. Gamit ang hindi pagkakapantay-pantay ng Chebyshev, tantyahin ang posibilidad na ang paglihis ng isang random na variable X mula sa inaasahan nitong matematikal ay magiging mas mababa sa tatlong karaniwang paglihis, i.e. mas maliit.

    Desisyon:

    Sa pag-aakalang sa formula (7.2), nakukuha natin

    Ang pagtatasa na ito ay tinatawag na tatlong sigma na panuntunan.

    Ang teorama ni Chebyshev

    Ang pangunahing pahayag ng batas ng malalaking numero ay nakapaloob sa teorama ni Chebyshev. Sa loob nito at iba pang mga theorems ng batas ng malalaking numero, ang konsepto ng "convergence ng mga random na variable sa posibilidad" ay ginagamit.

    mga random na variable nagtatagpo sa posibilidad sa halagang A (random o hindi random), kung para sa anuman ang posibilidad ng isang kaganapan ay may posibilidad sa pagkakaisa, i.e.

    (o ). Ang convergence sa probabilidad ay simbolikong nakasulat tulad ng sumusunod:

    Dapat ito ay nabanggit na convergence sa probabilidad nangangailangan na ang hindi pagkakapantay-pantay ay humawak para sa karamihan ng mga miyembro sequences (sa mathematical analysis - para sa lahat n > N, saan N- isang tiyak na numero), at para sa halos lahat ng mga miyembro ng sequence ay dapat mahulog sa ε- kapitbahayan PERO.

    Theorem 7.3 (Batas ng malalaking numero sa anyo ng P.L. Chebyshev). Kung random variables ay independyente at mayroong isang numero C> 0, na , pagkatapos ay para sa alinman

    , (7.7)

    mga. ang arithmetic mean ng mga random na variable na ito ay nagtatagpo sa probabilidad sa arithmetic mean ng kanilang mga inaasahan sa matematika:

    .

    Patunay. Simula noon

    .

    Pagkatapos, ang paglalapat ng hindi pagkakapantay-pantay ng Chebyshev (7.2) sa random variable, mayroon tayo

    mga. ang arithmetic mean ng mga random na variable ay nagtatagpo sa probabilidad sa mathematical na inaasahan a:

    Patunay. Bilang

    at ang mga pagkakaiba-iba ng mga random na variable , ibig sabihin, ay bounded, pagkatapos ay inilalapat ang Chebyshev theorem (7.7), nakuha namin ang assertion (7.9).

    Ang corollary ng theorem ni Chebyshev ay nagbibigay-katwiran sa prinsipyo ng "arithmetic mean" ng mga random variable. Х i patuloy na ginagamit sa pagsasanay. Oo, hayaan mo na n independiyenteng mga sukat ng ilang dami, ang tunay na halaga nito a(ito ay hindi kilala). Ang resulta ng bawat pagsukat ay isang random na variable Х i. Ayon sa corollary, bilang isang tinatayang halaga ng dami a maaari mong kunin ang arithmetic mean ng mga resulta ng pagsukat:

    .

    Ang pagkakapantay-pantay ay mas tumpak, mas marami n.

    Ang teorama ni Chebyshev ay batay din sa malawakang ginagamit sa mga istatistika paraan ng sampling, ang kakanyahan nito ay ang kalidad ng isang malaking halaga ng homogenous na materyal ay maaaring hatulan ng maliit na sample nito.

    Kinukumpirma ng theorem ni Chebyshev ang koneksyon sa pagitan ng randomness at necessity: ang average na halaga ng isang random variable ay halos hindi naiiba sa isang non-random variable.

    Ang teorama ni Bernoulli

    Ang teorama ni Bernoulli sa kasaysayan ay ang una at pinakasimpleng anyo ng batas ng malalaking numero. Ito ay theoretically substantiates ang katatagan ng ari-arian ng relatibong dalas.

    Theorem 7.4 (Batas ng malalaking numero sa anyo ng J. Bernoulli). Kung ang posibilidad ng isang kaganapan ay naganap PERO sa isang pagsubok ay R, ang bilang ng paglitaw ng kaganapang ito sa n ang mga independiyenteng pagsubok ay katumbas ng , pagkatapos ay para sa anumang numero mayroon kaming pagkakapantay-pantay

    , (7.10)

    ibig sabihin, ang relatibong dalas ng kaganapan PERO nagtatagpo sa probabilidad sa probabilidad R mga pangyayari PERO: .

    Patunay. Ipinakilala namin ang mga random na variable tulad ng sumusunod: kung nasa i-th trial isang kaganapan ang naganap PERO, at kung hindi ito lilitaw, kung gayon . Tapos yung number PERO(bilang ng mga tagumpay) ay maaaring katawanin bilang

    Ang mathematical na inaasahan at pagkakaiba ng mga random na variable ay: , . Ang batas ng pamamahagi ng mga random na variable X i ay may anyo

    Х i
    R R

    para sa anumang i. Kaya, ang mga random na variable X i independyente, ang kanilang mga pagkakaiba ay limitado sa parehong bilang , dahil

    .

    Samakatuwid, ang teorama ni Chebyshev ay maaaring ilapat sa mga random na variable na ito

    .

    ,

    Kaya naman, .

    Ang theorem ni Bernoulli ay theoretically nagpapatunay sa posibilidad ng isang tinatayang pagkalkula ng probabilidad ng isang kaganapan gamit ang relatibong dalas nito. Kaya, halimbawa, ang kamag-anak na dalas ng kaganapang ito ay maaaring kunin bilang ang posibilidad na magkaroon ng isang batang babae, na, ayon sa istatistikal na data, ay humigit-kumulang katumbas ng 0.485.

    Ang hindi pagkakapantay-pantay ni Chebyshev (7.2) para sa mga random na variable

    kumukuha ng form

    saan pi- posibilidad ng kaganapan PERO sa ako- m pagsubok.

    Halimbawa 7.2. Ang posibilidad ng isang typographical error sa isang pahina ng manuskrito ay 0.2. Tantyahin ang posibilidad na sa isang manuskrito na naglalaman ng 400 mga pahina, ang dalas ng paglitaw ng isang maling pagkaka-print ay naiiba sa kaukulang modulo ng posibilidad na mas mababa sa 0.05.

    Desisyon:

    Gumagamit kami ng formula (7.11). Sa kasong ito , , , . Mayroon kaming, i.e. .

    Central limit theorem

    Ang central limit theorem ay ang pangalawang pangkat ng limit theorems na nagtatatag ng koneksyon sa pagitan ng distribution law ng sum ng random variable at ang limiting form nito - ang normal distribution law.

    Bumuo tayo ng central limit theorem para sa kaso kapag ang mga tuntunin ng kabuuan ay may parehong distribusyon. Ang teorama na ito ay kadalasang ginagamit sa pagsasanay. Sa mga istatistika ng matematika, ang mga sample na random na variable ay may parehong mga distribusyon, dahil ang mga ito ay nakuha mula sa parehong pangkalahatang populasyon.

    Teorama 7.5. Hayaang ang mga random na variable ay independyente, pantay na ipinamahagi, may hangganang mathematical expectation at variance , . Pagkatapos ang distribution function ng nakasentro at normalized na kabuuan ng mga random na variable na ito ay may kaugaliang sa distribution function ng standard normal random variable.

    Ang pinakasimpleng bersyon ng Central Limit Theorem (CLT) ng probability theory ay ang mga sumusunod.

    (para sa magkatulad na pagkakabahagi ng mga termino). Hayaan X 1 , X 2 ,…, X n, … ay independiyenteng magkaparehong ipinamamahagi na mga random na variable na may mga inaasahan sa matematika M(X i) = m at pagpapakalat D(X i) = , i= 1, 2,…, n,… Pagkatapos para sa anumang totoong numero X may hangganan

    saan F(x) ay ang karaniwang normal na distribution function.

    Ang theorem na ito ay tinatawag minsan na Lindeberg-Levy theorem.

    Sa isang bilang ng mga inilapat na problema, ang kondisyon ng magkatulad na pamamahagi ay hindi natutupad. Sa ganitong mga kaso, ang central limit theorem ay karaniwang nananatiling wasto, ngunit ang ilang mga kundisyon ay dapat ipataw sa pagkakasunud-sunod ng mga random na variable. Ang kakanyahan ng mga kundisyong ito ay walang termino ang dapat na nangingibabaw, ang kontribusyon ng bawat termino sa arithmetic mean ay dapat na bale-wala kumpara sa huling kabuuan. Ang Lyapunov theorem ay kadalasang ginagamit.

    Central limit theorem(para sa magkakaibang mga termino) - Ang teorama ni Lyapunov. Hayaan X 1 , X 2 ,…, X n, … ay mga independiyenteng random na variable na may mga inaasahan sa matematika M(X i) = m i at pagpapakalat D(X i) = , i= 1, 2,…, n,… Hayaang, para sa ilang δ>0, ang lahat ng itinuturing na random na variable ay may mga sentral na sandali ng pagkakasunud-sunod 2+δ at ang “Lyapunov fraction” ay bumababa nang walang limitasyon:

    Pagkatapos ay para sa anumang tunay na numero X may hangganan

    saan F(x) ay ang karaniwang normal na distribution function.

    Sa kaso ng magkaparehong ibinahagi na mga random na termino

    at ang Lyapunov theorem ay nagiging Lindeberg-Levy theorem.

    Ang kasaysayan ng pagkuha ng mga sentral na teorema ng limitasyon para sa mga random na variable ay umabot sa loob ng dalawang siglo - mula sa mga unang gawa ni De Moivre noong 30s ng ika-18 siglo hanggang sa kinakailangan at sapat na kondisyon na nakuha nina Lindeberg at Feller noong 30s ng ika-20 siglo.

    Lindeberg-Feller theorem. Hayaan X 1 , X 2 ,…, X n, …, ay mga independiyenteng random na variable na may mga inaasahan sa matematika M(X i) = m i at pagpapakalat D(X i) = , i= 1, 2,…, n,… Limitahan ang kaugnayan (1), i.e. central limit theorem, ay nasiyahan kung at kung para lamang sa anumang τ>0

    saan Fk(x) ay tumutukoy sa distribution function ng random variable X k.

    Ang mga patunay ng mga nakalistang variant ng central limit theorem para sa mga random na variable ay matatagpuan sa classical na kurso sa probability theory.

    Para sa mga inilapat na istatistika at, sa partikular, para sa mga di-numerical na istatistika, ang multivariate central limit theorem ay napakahalaga. Ito ay hindi tungkol sa kabuuan ng mga random na variable, ngunit tungkol sa kabuuan ng mga random na vectors.

    Kailangan at sapat na kondisyon para sa multidimensional convergence. Hayaan F n nagsasaad ng joint distribution function k-dimensional na random na vector, n= 1,2,…, at Fλn . Kailangan at sapat na kondisyon para sa tagpo F n sa iba k-dimensional na pamamahagi ng function F iyan ba Fλn ay may limitasyon para sa anumang vector λ.

    Ang teorama sa itaas ay mahalaga dahil ang convergence ng mga vectors ay bumababa sa convergence ng mga linear na kumbinasyon ng kanilang mga coordinate, i.e. sa convergence ng karaniwang random variable na isinasaalang-alang nang mas maaga. Gayunpaman, hindi nito ginagawang posible na direktang ipahiwatig ang pamamahagi ng limitasyon. Magagawa ito gamit ang sumusunod na theorem.

    Theorem sa multidimensional convergence. Hayaan F n at Fλn ay pareho sa naunang teorama. Hayaan F- function ng magkasanib na pamamahagi k-dimensional na random na vector. Kung ang distribution function Fλn nagtatagpo sa pagtaas ng laki ng sample sa function ng pamamahagi F λ para sa anumang vector λ, kung saan F λ ay ang distribution function ng linear combination , pagkatapos F n nagtatagpo sa F.

    Dito ang convergence F n sa F nangangahulugan na para sa anumang k-dimensional vector tulad na ang distribution function F tuloy-tuloy sa , pagkakasunod-sunod ng numero F n nakikipag-ugnay sa paglago n sa numero F. Sa madaling salita, ang convergence ng distribution functions ay nauunawaan sa eksaktong parehong paraan tulad ng sa talakayan ng limit theorems para sa random variables sa itaas. Ipakita natin ang isang multidimensional na analogue ng mga theorems na ito.

    Multidimensional central limit theorem. Isaalang-alang ang independiyenteng magkaparehong distributed k-dimensional na random na mga vector

    kung saan ang prime ay nagsasaad ng vector transposition operation. Ipagpalagay natin ang mga random na vector U n magkaroon ng mga sandali ng una at pangalawang pagkakasunud-sunod, i.e.

    M(U n) = μ, D(U n) = Σ,

    saan μ ay ang vector ng mga inaasahan sa matematika ng mga coordinate ng random na vector, Σ ay ang covariance matrix nito. Ipinakilala namin ang isang sequence ng arithmetic mean random vectors:

    Pagkatapos ang random na vector ay may asymptotic k-dimensional na normal na distribusyon, i.e. ito ay asymptotically ibinahagi sa parehong paraan tulad ng k-dimensional na normal na may zero mean, covariance Σ, at density

    Dito |Σ| ay ang determinant ng matrix Σ. Sa madaling salita, ang pamamahagi ng random na vector ay nagtatagpo sa k-dimensional na normal na distribusyon na may zero mean at covariance matrix Σ.

    Alalahanin na ang isang multivariate na normal na distribution na may inaasahan μ at covariance matrix Σ ay isang distribution na may density

    Ang multivariate central limit theorem ay nagpapakita na ang mga distribusyon ng mga sums ng independiyenteng magkaparehong distributed na random vectors na may malaking bilang ng mga termino ay mahusay na tinatantya ng mga normal na distribusyon na may parehong unang dalawang sandali (ang expectation vector ng mga coordinate ng random vector at ang ugnayan nito matrix) bilang orihinal na mga vector. Ang parehong pamamahagi ay maaaring iwanan, ngunit ito ay mangangailangan ng ilang komplikasyon ng simbolismo. Sa kabuuan, ito ay sumusunod mula sa multidimensional convergence theorem na ang multidimensional na kaso ay hindi pangunahing naiiba mula sa isang-dimensional na isa.

    Halimbawa. Hayaan X 1 , … X n,… ay independiyenteng magkaparehong distributed na mga random na variable. Isipin mo k-dimensional na independiyenteng magkaparehong ibinahagi na mga random na vector

    Ang kanilang inaasahan sa matematika ay ang vector ng teoretikal na mga paunang sandali, at ang covariance matrix ay binubuo ng kaukulang mga sentral na sandali. Pagkatapos ay ang vector ng sample central moments. Sinasabi ng multivariate central limit theorem na mayroong asymptotically normal distribution. Tulad ng sumusunod mula sa convergence inheritance at linearization theorems (tingnan sa ibaba), ang mga distribusyon ng iba't ibang function ng sample na mga paunang sandali ay maaaring mahihinuha mula sa distribusyon. At dahil ang mga sentral na sandali ay ipinahayag sa mga tuntunin ng mga unang sandali, ang isang katulad na pahayag ay totoo rin para sa kanila.

    Nakaraang