Normal na pamamahagi. Bakit hindi normal ang lahat sa normal na distribusyon?

    Paano maayos na pamahalaan ang pananalapi ng iyong negosyo kung hindi ka eksperto sa larangan ng pagsusuri sa pananalapi - Ang pagsusuri sa pananalapi

    Pamamahala sa pananalapi - mga relasyon sa pananalapi sa pagitan ng mga paksa, pamamahala sa pananalapi sa iba't ibang antas, pamamahala ng portfolio, mga pamamaraan ng pamamahala ng paggalaw ng mga mapagkukunang pinansyal - hindi ito isang kumpletong listahan ng paksa " Pamamahala sa pananalapi"

    Pag-usapan natin kung ano pagtuturo? Ang ilan ay naniniwala na ito ay isang burges na tatak, ang iba ay isang pambihirang tagumpay sa modernong negosyo. Ang coaching ay isang hanay ng mga panuntunan para sa matagumpay na negosyo, pati na rin ang kakayahang maayos na pamahalaan ang mga panuntunang ito.

4.1. Kadalasan ba ay normal ang distribusyon ng mga obserbasyon?

Sa mga modelong pang-ekonomiya at pang-ekonomiya-matematika na ginamit, sa partikular, sa pag-aaral at pag-optimize ng mga proseso ng marketing at pamamahala, pamamahala ng negosyo at rehiyon, katumpakan at katatagan ng mga prosesong teknolohikal, sa mga problema sa pagiging maaasahan, kaligtasan, kabilang ang kaligtasan sa kapaligiran, ang paggana ng teknikal. mga device at bagay , ang pagbuo ng mga organizational chart ay kadalasang naglalapat ng mga konsepto at resulta ng probability theory at mathematical statistics. Sa kasong ito, kadalasang ginagamit ang ilang parametric na pamilya ng mga pamamahagi ng posibilidad. Ang pinakasikat ay ang normal na pamamahagi. Ginagamit din ang log-normal distribution, exponential distribution, gamma distribution, Weibull-Gnedenko distribution, atbp.

Malinaw, palaging kinakailangan upang suriin ang pagkakaayon ng mga modelo sa katotohanan. May dalawang tanong. Naiiba ba ang aktwal na mga distribusyon sa mga ginamit sa modelo? Gaano kalawak ang epekto ng pagkakaibang ito sa mga konklusyon?

Sa ibaba, gamit ang halimbawa ng normal na distribusyon at ang mga pamamaraan para sa pagtanggi sa iba't ibang mga obserbasyon (outlier) batay dito, ipinapakita na ang mga tunay na distribusyon ay halos palaging naiiba sa mga kasama sa mga klasikal na parametric na pamilya, at ang umiiral na mga paglihis mula sa mga ibinigay na pamilya. gumawa ng mga maling konklusyon, sa kasong isinasaalang-alang, tungkol sa pagtanggi batay sa paggamit ng mga pamilyang ito.

Mayroon bang anumang dahilan upang ipagpalagay na priori ang normalidad ng mga resulta ng pagsukat?

Minsan ay pinagtatalunan na sa kaso kapag ang error sa pagsukat (o iba pang random na variable) ay tinutukoy bilang resulta ng pinagsama-samang pagkilos ng maraming maliliit na salik, kung gayon, dahil sa Central Limit Theorem (CLT) ng probability theory, ang halagang ito ay mahusay na tinantiya (sa pamamagitan ng pamamahagi) ng isang normal na random na variable. Ang pahayag na ito ay totoo kung ang maliliit na salik ay kumikilos nang magkakasama at malaya sa isa't isa. Kung kumikilos sila nang multiplicative, kung gayon, dahil sa parehong CLT, kinakailangan na tantiyahin sa pamamagitan ng isang log-normal na pamamahagi. Sa mga inilapat na problema, kadalasan ay hindi posible na patunayan ang additivity kaysa sa multiplicativity ng pagkilos ng maliliit na salik. Kung ang pag-asa ay isang pangkalahatang kalikasan, ay hindi nabawasan sa isang additive o multiplicative form, at walang mga batayan upang tanggapin ang mga modelo na nagbibigay ng exponential, Weibull-Gnedenko, gamma o iba pang mga distribusyon, kung gayon halos walang nalalaman tungkol sa pamamahagi ng panghuling random na variable, maliban sa mga intra-mathematical na katangian tulad ng regularity .

Kapag nagpoproseso ng partikular na data, minsan ay pinaniniwalaan na ang mga error sa pagsukat ay may normal na distribusyon. Sa pagpapalagay ng normalidad, ang mga klasikal na modelo ng regression, dispersion, factor analysis, metrological na mga modelo ay itinayo, na patuloy pa ring matatagpuan sa domestic na regulasyon at teknikal na dokumentasyon at sa mga internasyonal na pamantayan. Ang mga modelo para sa pagkalkula ng pinakamataas na maaabot na antas ng ilang mga katangian na ginagamit sa disenyo ng mga sistema para sa pagtiyak ng kaligtasan ng paggana ng mga istrukturang pang-ekonomiya, mga teknikal na kagamitan at mga bagay ay batay sa parehong palagay. Gayunpaman, walang teoretikal na batayan para sa naturang pagpapalagay. Kinakailangang eksperimento na pag-aralan ang pamamahagi ng mga pagkakamali.

Ano ang ipinapakita ng mga eksperimentong resulta? Ang buod na ibinigay sa monograph ay nagbibigay-daan sa amin na sabihin na sa karamihan ng mga kaso ang distribusyon ng mga error sa pagsukat ay naiiba mula sa normal. Kaya, sa Machine-Electrotechnical Institute (Varna, Bulgaria), ang pamamahagi ng mga error sa pagkakalibrate para sa mga kaliskis ng mga analog na instrumento sa pagsukat ng elektrikal ay pinag-aralan. Ang mga device na ginawa sa Czechoslovakia, USSR at Bulgaria ay pinag-aralan. Ang batas sa pamamahagi ng error ay naging pareho. Ito ay may density

Sinuri namin ang data sa mga parameter ng 219 aktwal na distribusyon ng mga error, na pinag-aralan ng iba't ibang mga may-akda, kapag sinusukat ang parehong mga dami ng elektrikal at hindi de-kuryente na may malawak na iba't ibang (electrical) na mga device. Bilang resulta ng pag-aaral na ito, lumabas na 111 distribusyon, i.e. humigit-kumulang 50% ang nabibilang sa klase ng mga distribusyon na may density

nasaan ang degree na parameter; b - shift parameter; - parameter ng sukat; - gamma function ng argumento ;

(cm. ); 63 distribusyon, i.e. 30% ay may flat-top density na may mahaba, banayad na slope at hindi maaaring ilarawan bilang normal o, halimbawa, exponential. Ang natitirang 45 na pamamahagi ay naging bimodal.

Sa libro ng sikat na metroologist na si prof. Inilalahad ni PV Novitsky ang mga resulta ng isang pag-aaral ng mga batas ng pamamahagi ng iba't ibang uri ng mga error sa pagsukat. Pinag-aralan niya ang pamamahagi ng mga error ng mga electromechanical na instrumento sa mga core, mga elektronikong instrumento para sa pagsukat ng mga temperatura at pwersa, mga digital na instrumento na may manu-manong pagbabalanse. Ang dami ng mga sample ng pang-eksperimentong data para sa bawat ispesimen ay 100–400 na pagbabasa. Lumalabas na 46 sa 47 na mga distribusyon ay makabuluhang naiiba sa normal. Ang hugis ng pamamahagi ng mga error sa 25 na kopya ng Shch-1411 digital voltmeters sa 10 puntos ng saklaw ay pinag-aralan. Ang mga resulta ay magkatulad. Ang karagdagang impormasyon ay nakapaloob sa monograph.

Sinuri ng Applied Mathematics Laboratory ng Tartu State University ang 2,500 sample mula sa archive ng totoong istatistikal na data. Sa 92%, ang normality hypothesis ay kailangang tanggihan.

Ang mga paglalarawan sa itaas ng pang-eksperimentong data ay nagpapakita na ang mga error sa pagsukat sa karamihan ng mga kaso ay may mga distribusyon na naiiba sa mga normal. Nangangahulugan ito, sa partikular, na karamihan sa mga aplikasyon ng t-test ng Estudyante, pagsusuri ng klasikal na regression, at iba pang mga istatistikal na pamamaraan batay sa normal na teorya ay, mahigpit na pagsasalita, ay hindi makatwiran, dahil ang pinagbabatayan na axiom ng normalidad ng mga distribusyon ng kaukulang random ang mga variable ay hindi tama.

Malinaw, upang bigyang-katwiran o makatwirang baguhin ang kasalukuyang kasanayan sa pagsusuri ng istatistikal na data, kinakailangan na pag-aralan ang mga katangian ng mga pamamaraan ng pagsusuri ng data sa mga "ilegal" na aplikasyon. Ang pag-aaral ng mga pamamaraan ng pagtanggi ay nagpakita na ang mga ito ay lubhang hindi matatag sa mga paglihis mula sa normalidad, at samakatuwid ay hindi ipinapayong gamitin ang mga ito para sa pagproseso ng totoong data (tingnan sa ibaba); samakatuwid, hindi maaaring igiit ng isang tao na ang isang arbitraryong ginawang pamamaraan ay matatag laban sa mga paglihis mula sa normalidad.

Minsan iminumungkahi na bago mag-apply, halimbawa, ang pagsusulit ng Mag-aaral para sa homogeneity ng dalawang sample, suriin ang normalidad. Bagama't mayroong maraming pamantayan para dito, ang pagsubok para sa normalidad ay isang mas kumplikado at nakakaubos ng oras na istatistikal na pamamaraan kaysa sa pagsubok para sa homogeneity (parehong may mga istatistika ng uri ng Mag-aaral at may mga pagsubok na hindi parametric). Ang isang medyo malaking bilang ng mga obserbasyon ay kinakailangan upang maitatag ang normalidad na sapat na mapagkakatiwalaan. Kaya, upang matiyak na ang function ng pamamahagi ng mga resulta ng mga obserbasyon ay naiiba mula sa ilang normal na isa nang hindi hihigit sa 0.01 (para sa anumang halaga ng argumento), humigit-kumulang 2500 obserbasyon ang kinakailangan. Sa karamihan ng pang-ekonomiya, teknikal, biomedical at iba pang inilapat na pag-aaral, ang bilang ng mga obserbasyon ay makabuluhang mas kaunti. Ito ay totoo lalo na para sa data na ginamit sa pag-aaral ng mga problema na nauugnay sa pagtiyak ng kaligtasan ng paggana ng mga istrukturang pang-ekonomiya at mga teknikal na bagay.

Minsan sinusubukan nilang gamitin ang CCT upang tantiyahin ang pamamahagi ng error sa normal, kabilang ang mga espesyal na adder sa teknolohikal na pamamaraan ng pagsukat na aparato. Suriin natin ang pagiging kapaki-pakinabang ng panukalang ito. Hayaang ang Z1 , Z2 ,…, Zk ay independiyenteng magkaparehong ibinahagi sa mga random na variable na may function ng pamamahagi H = H(x) tulad na Isaalang-alang

Ang indicator ng proximity sa normality na ibinigay ng adder ay

Ang tamang hindi pagkakapantay-pantay sa huling kaugnayan ay sumusunod mula sa mga pagtatantya ng pare-pareho sa hindi pagkakapantay-pantay ng Berry-Esseen na nakuha sa aklat, at ang kaliwa, mula sa halimbawa sa monograph. Para sa isang normal na batas = 1.6, para sa isang pare-parehong batas = 1.3, para sa dalawang-puntong batas = 1 (ito ang lower bound para sa ). Samakatuwid, upang matiyak na ang distansya (sa sukatan ng Kolmogorov) sa normal na distribusyon ay hindi hihigit sa 0.01 para sa "hindi matagumpay" na mga pamamahagi, kailangan ng hindi bababa sa k0 na mga termino, kung saan

Sa karaniwang ginagamit na mga adder, ang mga termino ay mas maliit. Sa pamamagitan ng pagpapaliit sa klase ng mga posibleng distribusyon H, maaaring makuha ng isa, tulad ng ipinapakita sa monograp, ang mas mabilis na tagpo, ngunit dito ang teorya ay hindi pa sumasanib sa pagsasanay. Bilang karagdagan, hindi malinaw kung ang lapit ng distribusyon sa normal (sa isang tiyak na sukatan) ay nagsisiguro din sa kalapitan ng distribusyon ng mga istatistika na binuo mula sa mga random na variable na may ganitong distribusyon sa distribusyon ng mga istatistika na naaayon sa mga normal na obserbasyon. Tila, para sa bawat tiyak na istatistika, kailangan ang mga espesyal na teoretikal na pag-aaral. Sa mga outlier na problema sa pagtanggi, ang sagot ay: "Hindi nagbibigay" (tingnan sa ibaba).

Tandaan na ang resulta ng anumang tunay na pagsukat ay naitala gamit ang isang may hangganang bilang ng mga decimal na lugar, kadalasan ay maliit (2-5), kaya ipinapayong imodelo ang anumang tunay na data gamit lamang ang mga discrete random variable na kumukuha ng limitadong bilang ng mga value. Ang normal na distribusyon ay isang pagtatantya lamang ng tunay na distribusyon. Kaya, halimbawa, ang data ng isang tiyak na pag-aaral, na ibinigay sa trabaho, ay kumukuha ng mga halaga mula 1.0 hanggang 2.2, i.e. mayroong 13 posibleng mga halaga sa kabuuan. Ito ay sumusunod mula sa Dirichlet na prinsipyo na sa ilang mga punto ang distribution function na binuo ayon sa work data ay naiiba mula sa pinakamalapit na normal distribution function sa pamamagitan ng hindi bababa sa 1/26, i.e. sa pamamagitan ng 0.04. Bilang karagdagan, malinaw na para sa isang normal na distribusyon ng isang random na variable, ang posibilidad na mahulog sa isang discrete set ng mga decimal na numero na may ibinigay na bilang ng mga decimal na lugar ay 0.

Mula sa nasabi sa itaas, sumusunod na ang mga resulta ng mga sukat at, sa pangkalahatan, ang mga istatistikal na data ay may mga katangian na humahantong sa katotohanan na dapat silang i-modelo ng mga random na variable na may mga distribusyon na higit pa o mas kaunting naiiba sa mga normal. Sa karamihan ng mga kaso, malaki ang pagkakaiba ng mga distribusyon mula sa mga normal na distribusyon; sa iba, ang mga normal na distribusyon ay maaaring maituring na ilang uri ng pagtatantya, ngunit hindi kailanman isang kumpletong pagkakataon. Ipinahihiwatig nito ang parehong pangangailangang pag-aralan ang mga katangian ng mga klasikal na pamamaraan sa istatistika sa mga di-klasikal na probabilistikong modelo (katulad ng ginagawa sa ibaba para sa pamantayan ng Estudyante), at ang pangangailangang bumuo ng matatag (isinasaalang-alang ang pagkakaroon ng mga paglihis mula sa normalidad) at nonparametric, kabilang ang mga pamamaraan na walang distribusyon, ang kanilang malawak na pagpapakilala sa pagsasanay ng pagpoproseso ng istatistikal na data.

Ang mga pagsasaalang-alang na tinanggal dito para sa iba pang mga parametric na pamilya ay humantong sa mga katulad na konklusyon. Ang resulta ay maaaring formulated bilang mga sumusunod. Ang mga tunay na pamamahagi ng data ay halos hindi nabibilang sa anumang partikular na pamilya ng parametric. Ang mga tunay na pamamahagi ay palaging naiiba sa mga kasama sa mga pamilyang parametric. Ang mga pagkakaiba ay maaaring malaki o maliit, ngunit palagi silang umiiral. Subukan nating unawain kung gaano kahalaga ang mga pagkakaibang ito para sa pagsusuri sa ekonomiya.

Lahat ng karapatan ay nakalaan. Ang mga materyal sa site na ito ay maaari lamang gamitin sa isang link sa site na ito.

Ang normal na distribusyon (Gaussian distribution) ay palaging gumaganap ng isang sentral na papel sa probability theory, dahil ito ay madalas na lumitaw bilang isang resulta ng impluwensya ng maraming mga kadahilanan, ang kontribusyon ng alinman sa mga ito ay bale-wala. Ang Central Limit Theorem (CLT) ay nakakahanap ng aplikasyon sa halos lahat ng inilapat na agham, na ginagawang unibersal ang apparatus ng mga istatistika. Gayunpaman, may napakadalas na mga kaso kapag ang aplikasyon nito ay imposible, at sinusubukan ng mga mananaliksik sa lahat ng posibleng paraan upang ayusin ang pag-angkop ng mga resulta sa Gaussian. Iyan ay tungkol sa isang alternatibong diskarte sa kaso ng impluwensya sa pamamahagi ng maraming mga kadahilanan, sasabihin ko sa iyo ngayon.

Maikling kasaysayan ng CPT. Habang si Newton ay nabubuhay pa, pinatunayan ni Abraham de Moivre ang isang teorama sa convergence ng isang nakasentro at normalized na bilang ng mga obserbasyon ng isang kaganapan sa isang serye ng mga independiyenteng pagsubok sa isang normal na distribusyon. Sa buong ika-19 at unang bahagi ng ika-20 siglo, ang theorem na ito ay nagsilbing isang siyentipikong modelo para sa mga generalization. Pinatunayan ni Laplace ang kaso ng pare-parehong pamamahagi, Poisson - ang lokal na teorama para sa kaso na may iba't ibang probabilidad. Si Poincaré, Legendre at Gauss ay nakabuo ng isang mayamang teorya ng mga error sa pagmamasid at ang pinakamababang paraan ng mga parisukat batay sa convergence ng mga error sa isang normal na distribusyon. Pinatunayan ni Chebyshev ang isang mas malakas na teorama para sa kabuuan ng mga random na variable sa pamamagitan ng pagbuo ng paraan ng mga sandali. Si Lyapunov noong 1900, na umaasa sa Chebyshev at Markov, ay pinatunayan ang CLT sa kasalukuyang anyo nito, ngunit sa pagkakaroon lamang ng mga third-order na sandali. At noong 1934 lamang tinapos ito ni Feller, na nagpapakita na ang pagkakaroon ng mga sandali ng pangalawang pagkakasunud-sunod ay parehong kinakailangan at sapat na kondisyon.

Ang CLT ay maaaring buuin tulad ng sumusunod: kung ang mga random na variable ay independyente, pantay na ipinamahagi at may hangganan na pagkakaiba maliban sa zero, kung gayon ang mga kabuuan (nakasentro at normalized) ng mga variable na ito ay nagtatagpo sa normal na batas. Sa pormang ito itinuturo ang teorama na ito sa mga unibersidad at kadalasang ginagamit ng mga tagamasid at mananaliksik na hindi propesyonal sa matematika. Ano ang mali sa kanya? Sa katunayan, ang theorem ay may mahusay na mga aplikasyon sa mga larangan na ginawa ni Gauss, Poincaré, Chebyshev at iba pang mga henyo noong ika-19 na siglo, katulad: ang teorya ng mga pagkakamali sa pagmamasid, istatistikal na pisika, hindi bababa sa mga parisukat, demograpikong pag-aaral, at maaaring iba pa. Ngunit ang mga siyentipiko na kulang sa pagka-orihinal upang matuklasan, mag-generalize at nais na ilapat ang teorama na ito sa lahat, o i-drag lamang ang normal na pamamahagi sa pamamagitan ng mga tainga, kung saan hindi ito maaaring mangyari. Kung gusto mo ng mga halimbawa, mayroon ako.

Intelligence quotient IQ. Sa una, ipinahihiwatig nito na ang katalinuhan ng mga tao ay karaniwang ipinamamahagi. Nagsasagawa sila ng isang pagsubok na paunang pinagsama-sama sa isang paraan na hindi isinasaalang-alang ang mga natitirang kakayahan, ngunit isinasaalang-alang nang hiwalay na may parehong mga fractional na kadahilanan: lohikal na pag-iisip, disenyo ng kaisipan, mga kakayahan sa computational, abstract na pag-iisip at iba pa. Ang kakayahang malutas ang mga problema na hindi naaabot ng karamihan, o ang pagpasa sa pagsusulit sa napakabilis na oras ay hindi isinasaalang-alang sa anumang paraan, at ang pagpasa sa pagsusulit nang mas maaga ay nagpapataas ng resulta (ngunit hindi katalinuhan) sa hinaharap. At pagkatapos ay naniniwala ang mga philistine na "walang sinuman ang maaaring maging dalawang beses bilang matalino kaysa sa kanila", "alisin natin ito sa mga pantas at ibahagi ito."

Ang pangalawang halimbawa: mga pagbabago sa mga tagapagpahiwatig ng pananalapi. Ang pag-aaral ng mga pagbabago sa presyo ng stock, mga quote ng pera, mga pagpipilian sa kalakal ay nangangailangan ng paggamit ng kagamitan ng mga istatistika ng matematika, at lalo na dito mahalaga na huwag magkamali sa uri ng pamamahagi. Kaso sa punto: noong 1997, ang Nobel Prize sa Economics ay binayaran para sa panukala ng modelo ng Black-Scholes, batay sa pagpapalagay ng isang normal na pamamahagi ng paglago sa mga tagapagpahiwatig ng stock (ang tinatawag na puting ingay). Kasabay nito, tahasang sinabi ng mga may-akda na ang modelong ito ay kailangang pinuhin, ngunit ang lahat na napagpasyahan ng karamihan ng karagdagang mga mananaliksik ay ang pagdaragdag lamang ng pamamahagi ng Poisson sa normal na pamamahagi. Dito, malinaw naman, magkakaroon ng mga kamalian sa pag-aaral ng mahabang serye ng panahon, dahil ang pamamahagi ng Poisson ay natutugunan nang husto ang CLT, at kahit na may 20 termino ay hindi ito nakikilala mula sa normal na pamamahagi. Tingnan ang larawan sa ibaba (at ito ay mula sa isang napakaseryosong pang-ekonomiyang journal), ipinapakita nito na, sa kabila ng medyo malaking bilang ng mga obserbasyon at halatang pagbaluktot, ang pamamahagi ay ipinapalagay na normal.


Medyo halata na ang pamamahagi ng sahod sa populasyon ng lungsod, ang laki ng mga file sa disk, ang populasyon ng mga lungsod at bansa ay hindi magiging normal.

Ang mga distribusyon mula sa mga halimbawang ito ay may magkakatulad na pagkakaroon ng tinatawag na "mabigat na buntot", iyon ay, mga halagang malayo sa mean, at isang kapansin-pansing kawalaan ng simetrya, kadalasang tama. Isaalang-alang natin kung ano pa, bukod sa normal, ang mga naturang pamamahagi ay maaaring. Magsimula tayo sa Poisson na binanggit kanina: ito ay may buntot, ngunit nais naming ulitin ang batas para sa isang hanay ng mga grupo, sa bawat isa kung saan ito ay sinusunod (kalkulahin ang laki ng mga file para sa isang negosyo, suweldo para sa ilang mga lungsod) o scale. (arbitraryong taasan o bawasan ang pagitan ng modelong Black-Scholes), gaya ng ipinapakita ng mga obserbasyon, hindi nawawala ang mga buntot at kawalaan ng simetrya, ngunit ang pamamahagi ng Poisson, ayon sa CLT, ay dapat na maging normal. Para sa parehong mga kadahilanan, ang pamamahagi ng Erlang, beta, logonormal, at lahat ng iba pa na may dispersion ay hindi gagana. Ito ay nananatiling lamang upang putulin ang pamamahagi ng Pareto, ngunit hindi ito magkasya dahil sa pagkakataon ng fashion na may pinakamababang halaga, na halos hindi nangyayari sa pagsusuri ng sample na data.

Ang mga distribusyon na may mga kinakailangang katangian ay umiiral at tinatawag na mga matatag na pamamahagi. Ang kanilang kasaysayan ay lubhang kawili-wili din, at ang pangunahing teorama ay napatunayan isang taon pagkatapos ng gawain ni Feller, noong 1935, sa pamamagitan ng magkasanib na pagsisikap ng Pranses na matematiko na si Paul Levy at ng Sobyet na matematiko na si A.Ya. Khinchin. Ang CLT ay pangkalahatan, ang kondisyon para sa pagkakaroon ng pagpapakalat ay inalis mula dito. Hindi tulad ng normal, ang density o ang distribution function ng stable random variables ay hindi ipinahayag (na may isang pambihirang pagbubukod, na kung saan ay tinalakay sa ibaba), ang lahat ng alam tungkol sa mga ito ay ang katangian ng function (ang inverse Fourier transform ng distribution density, ngunit sa maunawaan ang kakanyahan, hindi ito maaaring malaman).
Kaya, ang theorem: kung ang mga random na variable ay independyente, pantay na ipinamamahagi, kung gayon ang mga kabuuan ng mga variable na ito ay nagtatagpo sa isang matatag na batas.

Ngayon ang kahulugan. Random na halaga X magiging stable kung at kung ang logarithm ng katangiang function nito ay maaaring katawanin bilang:

saan .

Sa katunayan, walang masyadong kumplikado dito, kailangan mo lamang ipaliwanag ang kahulugan ng apat na mga parameter. Ang mga parameter na sigma at mu ay ang karaniwang sukat at offset, tulad ng sa normal na distribusyon, ang mu ay magiging katumbas ng inaasahan kung ito ay, at ito ay kapag ang alpha ay mas malaki kaysa sa isa. Ang beta parameter ay kawalaan ng simetrya; kung ito ay katumbas ng zero, ang distribusyon ay simetriko. Ngunit ang alpha ay isang katangian na parameter, na nagpapahiwatig kung anong pagkakasunud-sunod ang mga sandali ng isang dami, mas malapit ito sa dalawa, mas mukhang normal ang distribusyon, kung ito ay katumbas ng dalawa, ang distribusyon ay nagiging normal, at tanging sa sa kasong ito, mayroon itong mga sandali ng malalaking order, sa kaso din ng normal na distribusyon, bumababa ang skewness. Sa kaso kapag ang alpha ay katumbas ng isa at beta sa zero, ang Cauchy distribution ay nakuha, at sa kaso kapag ang alpha ay katumbas ng kalahati at beta sa isa, ang Levy distribution, sa ibang mga kaso ay walang representasyon sa quadratures para sa density ng pamamahagi ng mga naturang dami.
Noong ika-20 siglo, nabuo ang isang mayamang teorya ng mga matatag na dami at proseso (tinatawag na mga proseso ng Levy), ipinakita ang kanilang koneksyon sa mga fractional integral, ipinakilala ang iba't ibang paraan ng parameterization at pagmomodelo, tinatantya ang mga parameter sa maraming paraan, at ang pagkakapare-pareho at katatagan. ng mga pagtatantya ay ipinakita. Tingnan ang larawan, ipinapakita nito ang simulate na tilapon ng proseso ng Levy na may isang fragment na pinalaki ng 15 beses.


Ito ay habang nakikitungo sa mga naturang proseso at ang kanilang aplikasyon sa pananalapi na si Benoit Mandelbrot ay nakabuo ng mga fractals. Gayunpaman, hindi lahat ng dako ay napakahusay. Ang ikalawang kalahati ng ika-20 siglo ay lumipas sa ilalim ng pangkalahatang kalakaran ng mga agham na inilapat at cybernetic, na nangangahulugang isang krisis ng purong matematika, lahat ay nais na makabuo, ngunit hindi nais na isipin, ang mga humanidades ay sinakop ang mga mathematical spheres sa kanilang pamamahayag. Halimbawa: ang aklat na "Limampung nakakaaliw na probabilistikong problema sa mga solusyon" ng American Mosteller, problema numero 11:


Ang solusyon ng may-akda sa problemang ito ay isang pagkatalo lamang ng sentido komun:

Ang parehong sitwasyon ay sa ika-25 na gawain, kung saan TATLONG magkasalungat na sagot ang ibinigay.

Ngunit bumalik sa matatag na pamamahagi. Sa natitirang bahagi ng artikulo, susubukan kong ipakita na hindi dapat magkaroon ng karagdagang mga paghihirap kapag nagtatrabaho sa kanila. Lalo na, mayroong mga numerical at statistical na pamamaraan na nagbibigay-daan sa iyo upang suriin ang mga parameter, kalkulahin ang function ng pamamahagi at gayahin ang mga ito, iyon ay, gumana sa parehong paraan tulad ng sa anumang iba pang pamamahagi.

Pagmomodelo ng mga stable na random variable. Dahil ang lahat ay kilala sa paghahambing, aalalahanin ko muna ang pinaka-maginhawa, mula sa punto ng view ng mga kalkulasyon, paraan para sa pagbuo ng isang normal na halaga (ang Box-Muller na paraan): kung - mga pangunahing random na variable (pantay na ipinamamahagi sa )