Mga pagtatantya para sa mathematical na inaasahan at pagkakaiba. Pagtataya ng mathematical na inaasahan at pagkakaiba para sa sample

Hayaang magkaroon ng random variable X na may inaasahan sa matematika m at pagpapakalat D, habang ang parehong mga parameter na ito ay hindi alam. Over magnitude X ginawa N mga independiyenteng eksperimento, na nagresulta sa isang set ng N mga resulta ng numero x 1 , x 2 , …, x N. Bilang pagtatantya ng inaasahan sa matematika, natural na imungkahi ang arithmetic mean ng mga naobserbahang halaga.

(1)

Dito bilang x i mga tiyak na halaga (mga numero) na nakuha bilang resulta ng N mga eksperimento. Kung kukuha tayo ng iba (independyente sa mga nauna) N mga eksperimento, kung gayon, malinaw naman, makakakuha tayo ng ibang halaga. Kung kukuha ka pa N mga eksperimento, makakakuha tayo ng isa pang bagong halaga . Tukuyin ng X i random variable na nagreresulta mula sa i ika-eksperimento, pagkatapos ay ang mga realisasyon X i ang mga numerong nakuha bilang resulta ng mga eksperimentong ito. Ito ay malinaw na ang random variable X i ay magkakaroon ng parehong probability distribution density gaya ng orihinal na random variable X. Ipinapalagay din namin na ang mga random na variable X i at Xj ay independyente sa i, hindi pantay j(iba't ibang independiyenteng kamag-anak sa bawat isa na mga eksperimento). Samakatuwid, muling isinusulat namin ang formula (1) sa ibang (statistikal) na anyo:

(2)

Ipakita natin na ang pagtatantya ay walang kinikilingan:

Kaya, ang mathematical expectation ng sample mean ay katumbas ng tunay na mathematical expectation ng random variable. m. Ito ay isang medyo predictable at naiintindihan na katotohanan. Samakatuwid, ang sample mean (2) ay maaaring kunin bilang isang pagtatantya ng inaasahan sa matematika ng isang random na variable. Ngayon lumitaw ang tanong: ano ang mangyayari sa pagkakaiba-iba ng pagtatantya ng inaasahan habang tumataas ang bilang ng mga eksperimento? Ipinapakita iyon ng mga analytical kalkulasyon

kung saan ang pagkakaiba ng pagtatantya ng inaasahan sa matematika (2), at D- tunay na pagkakaiba-iba ng random na variable X.

Mula sa itaas, ito ay sumusunod na sa pagtaas N(bilang ng mga eksperimento) bumababa ang pagkakaiba ng pagtatantya, ibig sabihin. kung mas ibubuod natin ang mga independiyenteng pagpapatupad, mas malapit sa inaasahang halaga na nakukuha natin ang pagtatantya.


Mga pagtatantya ng pagkakaiba-iba ng matematika

Sa unang sulyap, tila ang pinaka-natural na pagtatantya

(3)

kung saan kinakalkula ng formula (2). Suriin natin kung ang pagtatantya ay walang kinikilingan. Ang pormula (3) ay maaaring isulat tulad ng sumusunod:

Pinapalitan namin ang expression (2) sa formula na ito:

Hanapin natin ang mathematical na inaasahan ng variance estimate:

(4)

Dahil ang pagkakaiba-iba ng isang random na variable ay hindi nakasalalay sa kung ano ang inaasahan ng matematika ng random na variable, kukunin natin ang inaasahan sa matematika na katumbas ng 0, i.e. m = 0.

(5)
sa .(6)

Ang pangangailangang tantyahin ang inaasahan sa matematika batay sa mga resulta ng pagsubok ay lumilitaw sa mga problema kung saan ang resulta ng eksperimento ay inilalarawan ng isang random na variable at ang tagapagpahiwatig ng kalidad ng bagay na pinag-aaralan ay ipinapalagay na ang matematikal na inaasahan ng random variable na ito. Halimbawa, ang mathematical expectation ng uptime ng isang system ay maaaring kunin bilang reliability indicator, at kapag sinusuri ang kahusayan ng produksyon, ang mathematical expectation ng bilang ng magagandang produkto, atbp.

Ang problema sa pagtatantya ng inaasahan sa matematika ay nabuo bilang mga sumusunod. Ipagpalagay na upang matukoy ang hindi kilalang halaga ng random variable X, ito ay dapat na gumawa ng n independyente at libre mula sa mga sistematikong pagsukat ng mga error. X v X 2 ,..., X p. Kinakailangang piliin ang pinakamahusay na pagtatantya ng inaasahan sa matematika.

Ang pinakamahusay at pinakakaraniwang pagtatantya ng inaasahan sa matematika sa pagsasanay ay ang arithmetic mean ng mga resulta ng pagsusulit

tinatawag din istatistika o sample ibig sabihin.

Ipakita natin na ang pagtatantya t x natutugunan ang lahat ng mga kinakailangan para sa pagsusuri ng anumang parameter.

1. Ito ay sumusunod mula sa pagpapahayag (5.10) na

ibig sabihin, puntos t "x- walang pinapanigan na pagtatantya.

2. Ayon sa Chebyshev theorem, ang arithmetic mean ng mga resulta ng pagsubok ay nagtatagpo sa probabilidad sa mathematical expectation, i.e.

Dahil dito, ang pagtatantya (5.10) ay isang pare-parehong pagtatantya ng inaasahan.

3. Pagkakaiba-iba ng pagtatantya t x, pantay

Habang lumalaki ang laki ng sample, ang n ay bumababa nang walang katiyakan. Ito ay pinatunayan na kung ang isang random na variable X ay napapailalim sa normal na batas sa pamamahagi, kung gayon para sa alinman P ang pagkakaiba (5.11) ang magiging pinakamababang posible, at ang pagtatantya t x- epektibong pagtatantya ng inaasahan sa matematika. Ang pag-alam sa pagkakaiba-iba ng pagtatantya ay ginagawang posible na gumawa ng isang paghatol tungkol sa katumpakan ng pagtukoy sa hindi kilalang halaga ng inaasahan sa matematika gamit ang pagtatantyang ito.

Bilang pagtatantya ng inaasahan sa matematika, ang arithmetic mean ay ginagamit kung ang mga resulta ng pagsukat ay pantay na tumpak (variances D, i = 1, 2, ..., P ay pareho sa bawat dimensyon). Gayunpaman, sa pagsasanay, ang isa ay kailangang harapin ang mga gawain kung saan ang mga resulta ng pagsukat ay hindi pantay (halimbawa, sa panahon ng pagsubok, ang mga pagsukat ay ginawa ng iba't ibang mga instrumento). Sa kasong ito, ang pagtatantya para sa inaasahan sa matematika ay may anyo

saan ay ang bigat ng i-th na pagsukat.

Sa formula (5.12), ang resulta ng bawat pagsukat ay kasama sa sarili nitong timbang Sa.. Samakatuwid, ang pagsusuri ng mga resulta ng pagsukat t x tinawag weighted average.

Maaaring ipakita na ang pagtatantya (5.12) ay isang walang kinikilingan, pare-pareho, at mahusay na pagtatantya ng inaasahan. Ang pinakamababang pagkakaiba ng pagtatantya ay ibinibigay ng


Kapag nagsasagawa ng mga eksperimento sa mga modelo ng computer, ang mga katulad na problema ay lumitaw kapag ang mga pagtatantya ay natagpuan mula sa mga resulta ng ilang serye ng mga pagsubok at ang bilang ng mga pagsubok sa bawat serye ay naiiba. Halimbawa, dalawang serye ng mga pagsubok ang isinagawa na may dami p 1 at n 2 , ayon sa mga resulta kung saan ang mga pagtatantya t xi at t x _. Upang mapabuti ang katumpakan at pagiging maaasahan ng pagtukoy ng inaasahan sa matematika, ang mga resulta ng mga serye ng mga pagsubok na ito ay pinagsama. Upang gawin ito, gamitin ang expression (5.12)

Kapag kinakalkula ang mga coefficient C, sa halip na ang mga pagkakaiba-iba D, ang kanilang mga pagtatantya na nakuha mula sa mga resulta ng pagsubok sa bawat serye ay pinapalitan.

Ang isang katulad na diskarte ay ginagamit din sa pagtukoy ng posibilidad ng isang random na kaganapan na nagaganap batay sa mga resulta ng isang serye ng mga pagsubok.

Upang matantya ang mathematical na inaasahan ng isang random na variable X, bilang karagdagan sa sample mean, maaaring gumamit ng iba pang istatistika. Kadalasan, ginagamit ang mga miyembro ng variational series para sa mga layuning ito, ibig sabihin, mga istatistika ng order, batay sa kung aling mga pagtatantya ang binuo,

nagbibigay-kasiyahan sa pangunahing mga kinakailangan, lalo na ang pagkakapare-pareho at walang kinikilingan.

Ipagpalagay na naglalaman ang serye ng variation n = 2k mga miyembro. Pagkatapos, alinman sa mga average ay maaaring kunin bilang isang pagtatantya ng inaasahan sa matematika:

Kung saan sa-e ang karaniwan

ay walang iba kundi ang istatistikal na median ng distribusyon ng random variable X, dahil ang halatang pagkakapantay-pantay ay nagaganap

Ang bentahe ng statistical median ay na ito ay libre mula sa impluwensya ng mga maanomalyang obserbasyon, na hindi maiiwasan kapag ginagamit ang unang average, iyon ay, ang average ng pinakamaliit at pinakamalaking bilang ng mga serye ng variation.

Na may kakaibang laki ng sample P = 2k- 1 statistical median ang gitnang elemento nito, i.e. sa-ika-miyembro ng variation series Ako = x k.

May mga distribusyon kung saan ang arithmetic mean ay hindi isang epektibong pagtatantya ng inaasahan sa matematika, halimbawa, ang Laplace distribution. Maaaring ipakita na para sa pamamahagi ng Laplace, ang epektibong pagtatantya ng mean ay ang sample median.

Napatunayan na kung ang isang random na variable X ay may normal na distribusyon, kung gayon na may sapat na malaking sukat ng sample, ang batas ng pamamahagi ng statistical median ay malapit sa normal na may mga numerical na katangian.

Mula sa isang paghahambing ng mga formula (5.11) at (5.14) sumusunod na ang dispersion ng statistical median ay 1.57 beses na mas malaki kaysa sa dispersion ng arithmetic mean. Samakatuwid, ang arithmetic mean bilang isang pagtatantya ng inaasahan sa matematika ay mas epektibo kaysa sa statistical median. Gayunpaman, dahil sa pagiging simple ng mga kalkulasyon, insensitivity sa mga maanomalyang resulta ng pagsukat ("kontaminasyon" ng sample), sa pagsasagawa, ang statistical median ay gayunpaman ay ginagamit bilang isang pagtatantya ng inaasahan sa matematika.

Dapat pansinin na para sa tuluy-tuloy na simetriko na distribusyon, ang mean at ang median ay pareho. Samakatuwid, ang istatistikal na median ay maaaring magsilbi bilang isang mahusay na pagtatantya ng inaasahan sa matematika para lamang sa isang simetriko na pamamahagi ng random na variable.

Para sa mga skewed distribution, ang statistical median Ako ay may makabuluhang pagkiling na nauugnay sa inaasahan sa matematika, samakatuwid, ito ay hindi angkop para sa pagtatantya nito.

Hayaang magkaroon ng random variable X na may inaasahan sa matematika m at pagpapakalat D, habang ang parehong mga parameter na ito ay hindi alam. Over magnitude X ginawa N mga independiyenteng eksperimento, na nagresulta sa isang set ng N mga resulta ng numero x 1 , x 2 , …, x N. Bilang pagtatantya ng inaasahan sa matematika, natural na imungkahi ang arithmetic mean ng mga naobserbahang halaga.

(1)

Dito bilang x i mga tiyak na halaga (mga numero) na nakuha bilang resulta ng N mga eksperimento. Kung kukuha tayo ng iba (independyente sa mga nauna) N mga eksperimento, kung gayon, malinaw naman, makakakuha tayo ng ibang halaga. Kung kukuha ka pa N mga eksperimento, makakakuha tayo ng isa pang bagong halaga . Tukuyin ng X i random variable na nagreresulta mula sa i ika-eksperimento, pagkatapos ay ang mga realisasyon X i ang mga numerong nakuha bilang resulta ng mga eksperimentong ito. Ito ay malinaw na ang random variable X i ay magkakaroon ng parehong probability distribution density gaya ng orihinal na random variable X. Ipinapalagay din namin na ang mga random na variable X i at Xj ay independyente sa i, hindi pantay j(iba't ibang independiyenteng kamag-anak sa bawat isa na mga eksperimento). Samakatuwid, muling isinusulat namin ang formula (1) sa ibang (statistikal) na anyo:

(2)

Ipakita natin na ang pagtatantya ay walang kinikilingan:

Kaya, ang mathematical expectation ng sample mean ay katumbas ng tunay na mathematical expectation ng random variable. m. Ito ay isang medyo predictable at naiintindihan na katotohanan. Samakatuwid, ang sample mean (2) ay maaaring kunin bilang isang pagtatantya ng inaasahan sa matematika ng isang random na variable. Ngayon lumitaw ang tanong: ano ang mangyayari sa pagkakaiba-iba ng pagtatantya ng inaasahan habang tumataas ang bilang ng mga eksperimento? Ipinapakita iyon ng mga analytical kalkulasyon

kung saan ang pagkakaiba ng pagtatantya ng inaasahan sa matematika (2), at D- tunay na pagkakaiba-iba ng random na variable X.

Mula sa itaas, ito ay sumusunod na sa pagtaas N(bilang ng mga eksperimento) bumababa ang pagkakaiba ng pagtatantya, ibig sabihin. kung mas ibubuod natin ang mga independiyenteng pagpapatupad, mas malapit sa inaasahang halaga na nakukuha natin ang pagtatantya.


Mga pagtatantya ng pagkakaiba-iba ng matematika

Sa unang sulyap, tila ang pinaka-natural na pagtatantya

(3)

kung saan kinakalkula ng formula (2). Suriin natin kung ang pagtatantya ay walang kinikilingan. Ang pormula (3) ay maaaring isulat tulad ng sumusunod:

Pinapalitan namin ang expression (2) sa formula na ito:

Hanapin natin ang mathematical na inaasahan ng variance estimate:

(4)

Dahil ang pagkakaiba-iba ng isang random na variable ay hindi nakasalalay sa kung ano ang inaasahan ng matematika ng random na variable, kukunin natin ang inaasahan sa matematika na katumbas ng 0, i.e. m = 0.

(5)
sa .(6)

Hayaang ang isang random na variable na may hindi alam na mathematical na inaasahan at pagkakaiba ay sumailalim sa mga independiyenteng eksperimento na nagbunga ng mga resulta - . Kalkulahin natin ang pare-pareho at walang pinapanigan na mga pagtatantya para sa mga parameter at .

Bilang pagtatantya para sa mathematical na inaasahan, kinukuha namin ang arithmetic mean ng mga pang-eksperimentong halaga

. (2.9.1)

Ayon sa batas ng malalaking numero, ang pagtatantya na ito ay mayaman , na may magnitude sa posibilidad. Ang parehong pagtatantya ay walang pinapanigan , sa abot ng

. (2.9.2)

Ang pagkakaiba ng pagtatantya na ito ay

. (2.9.3)

Maaaring ipakita na para sa isang normal na distribusyon, ang pagtatantya na ito ay mabisa . Para sa ibang mga batas, maaaring hindi ito ang kaso.

Tantyahin natin ngayon ang pagkakaiba. Pumili muna tayo ng pormula para sa pagtatantya istatistikal na pagpapakalat

. (2.9.4)

Suriin natin ang pagkakapare-pareho ng pagtatantya ng pagkakaiba. Buksan natin ang mga bracket sa formula (2.9.4)

.

Para sa , ang unang termino ay nagtatagpo sa posibilidad sa dami , sa pangalawang - sa . Kaya, ang aming pagtatantya ay nagtatagpo sa posibilidad sa pagkakaiba

,

kaya siya ay mayaman .

Suriin natin walang kinikilingan mga pagtatantya para sa dami. Upang gawin ito, pinapalitan namin ang expression (2.9.1) sa formula (2.9.4) at isinasaalang-alang ang mga random na variable. malaya

,

. (2.9.5)

Ipasa natin ang formula (2.9.5) sa mga pagbabagu-bago ng mga random na variable

Ang pagpapalawak ng mga bracket, nakukuha namin

,

. (2.9.6)

Kalkulahin natin ang mathematical na inaasahan ng halaga (2.9.6), na isinasaalang-alang iyon

. (2.9.7)

Ang kaugnayan (2.9.7) ay nagpapakita na ang halaga na kinakalkula ng formula (2.9.4) ay hindi isang walang pinapanigan na estimator para sa pagpapakalat. Ang pag-asa sa matematika nito ay hindi pantay, ngunit medyo mas kaunti. Ang ganitong pagtatantya ay humahantong sa isang pababang sistematikong error. Upang maalis ang gayong pagkiling, kinakailangan na magpakilala ng pagwawasto sa pamamagitan ng pag-multiply hindi ng halaga . Kung gayon ang itinamang istatistikal na pagkakaiba-iba ay maaaring magsilbi bilang isang walang pinapanigan na pagtatantya para sa pagkakaiba

. (2.9.8)

Ang pagtatantya na ito ay pare-pareho lamang sa pagtatantya, dahil para sa .

Sa pagsasagawa, sa halip na pagtatantya (2.9.8), kung minsan ay mas maginhawang gumamit ng katumbas na pagtatantya na nauugnay sa pangalawang paunang istatistikal na sandali.

. (2.9.9)

Ang mga pagtatantya (2.9.8), (2.9.9) ay hindi mahusay. Maaari itong ipakita na sa kaso ng isang normal na distribusyon ay magiging sila asymptotically episyente (kailan ang magiging pinakamababang posibleng halaga).

Kaya, posible na bumalangkas ng mga sumusunod na patakaran para sa pagproseso ng limitadong istatistikal na materyal. Kung sa mga independiyenteng eksperimento, kinukuha ng random variable ang mga halaga na may hindi kilalang mathematical na inaasahan at pagkakaiba , pagkatapos ay upang matukoy ang mga parameter na ito, dapat gumamit ng tinatayang mga pagtatantya

(2.9.10)

Pagtatapos ng trabaho -

Ang paksang ito ay kabilang sa:

Mga tala ng panayam sa teorya ng probabilidad ng matematika mga istatistika ng matematika

Department of Higher Mathematics and Informatics.. lecture notes.. sa mathematics..

Kung kailangan mo ng karagdagang materyal sa paksang ito, o hindi mo nakita ang iyong hinahanap, inirerekumenda namin ang paggamit ng paghahanap sa aming database ng mga gawa:

Ano ang gagawin natin sa natanggap na materyal:

Kung ang materyal na ito ay naging kapaki-pakinabang para sa iyo, maaari mo itong i-save sa iyong pahina sa mga social network:

Lahat ng mga paksa sa seksyong ito:

Teorya ng posibilidad
Ang teorya ng probabilidad ay isang sangay ng matematika na nag-aaral ng mga pattern ng random na mass phenomena. Random ay isang phenomenon na

Istatistikong kahulugan ng posibilidad
Ang isang kaganapan ay isang random na phenomenon na, bilang resulta ng karanasan, ay maaaring lumitaw o hindi (two-valued phenomenon). Italaga ang mga kaganapan sa malaking letrang Latin

Puwang ng mga kaganapan sa elementarya
Hayaang maiugnay ang isang hanay ng mga kaganapan sa ilang karanasan, at: 1) bilang resulta ng karanasan, isa at isa lamang

Mga aksyon sa mga kaganapan
Ang kabuuan ng dalawang pangyayari at

Mga permutasyon
Ang bilang ng iba't ibang permutasyon ng mga elemento ay tinutukoy

Mga tirahan
Paglalagay ng mga elemento sa pamamagitan ng

Mga kumbinasyon
Isang kumbinasyon ng mga elemento

Ang formula para sa pagdaragdag ng mga probabilidad para sa mga hindi tugmang kaganapan
Teorama. Ang posibilidad ng kabuuan ng dalawang hindi magkatugma na mga kaganapan ay katumbas ng kabuuan ng mga posibilidad ng mga kaganapang ito. (isa

Formula ng Pagdaragdag ng Probability para sa Mga Arbitrary na Kaganapan
Teorama. Ang posibilidad ng kabuuan ng dalawang kaganapan ay katumbas ng kabuuan ng mga probabilidad ng mga kaganapang ito nang walang posibilidad ng kanilang produkto.

Formula ng Probability Multiplication
Hayaang magbigay ng dalawang pangyayari. Isaalang-alang ang isang kaganapan

Kabuuang Formula ng Probability
Hayaan ang isang kumpletong pangkat ng mga hindi magkatugma na mga kaganapan, ang mga ito ay tinatawag na hypotheses. Isaalang-alang ang ilang kaganapan

Formula ng mga probabilidad ng hypotheses (Bayes)
Isaalang-alang muli - ang kumpletong pangkat ng mga hindi tugmang hypotheses at ang kaganapan

Asymptotic Poisson formula
Sa mga kaso kung saan ang bilang ng mga pagsubok ay malaki at ang posibilidad ng paglitaw ng isang kaganapan

Mga random na discrete variable
Ang random na value ay isang dami na, kapag inulit ang eksperimento, ay maaaring tumagal sa hindi pantay na mga numerical na halaga. Ang random variable ay tinatawag na discrete,

Random na tuluy-tuloy na mga variable
Kung, bilang resulta ng isang eksperimento, ang isang random na variable ay maaaring kumuha ng anumang halaga mula sa isang partikular na segment o ang buong tunay na axis, kung gayon ito ay tinatawag na tuloy-tuloy. batas

Probability density function ng isang random na tuluy-tuloy na variable
Hayaan. Isaalang-alang ang isang punto at bigyan ito ng dagdag

Mga de-numerong katangian ng mga random na variable
Ang mga random na discrete o tuluy-tuloy na mga variable ay itinuturing na ganap na tinukoy kung alam ang kanilang mga batas sa pamamahagi. Sa katunayan, ang pag-alam sa mga batas ng pamamahagi, palaging makalkula ng isang tao ang posibilidad ng pagpindot

Dami ng mga random na variable
Dami ng pagkakasunud-sunod ng isang random na tuluy-tuloy na variable

Pag-asa sa matematika ng mga random na variable
Ang mathematical na inaasahan ng isang random na variable ay nagpapakilala sa average na halaga nito. Ang lahat ng mga halaga ng random na variable ay pinagsama-sama sa halagang ito. Isaalang-alang muna ang isang random na discrete variable

Standard deviation at pagkakaiba-iba ng mga random na variable
Isaalang-alang muna ang isang random na discrete variable. Mga numerical na katangian ng mode, median, quantiles at mathematical expectation

Mga sandali ng mga random na variable
Bilang karagdagan sa pag-asa at pagpapakalat ng matematika, ang teorya ng probabilidad ay gumagamit ng mga numerical na katangian ng mas mataas na mga order, na tinatawag na mga sandali ng mga random na variable.

Theorems sa mga numerical na katangian ng mga random na variable
Theorem 1. Ang mathematical expectation ng isang non-random variable ay katumbas ng value na ito mismo. Patunay: Hayaan

Binomial distribution law

Batas sa pamamahagi ng Poisson
Hayaan ang isang random na discrete variable na kumukuha ng mga halaga

Unipormeng pamamahagi ng batas
Ang pare-parehong batas ng pamamahagi ng isang random na tuluy-tuloy na variable ay ang batas ng probability density function, na

Normal na batas sa pamamahagi
Ang normal na batas ng pamamahagi ng isang random na tuluy-tuloy na variable ay ang batas ng density function

Batas ng exponential distribution
Ang exponential o exponential distribution ng isang random variable ay ginagamit sa mga aplikasyon ng probability theory gaya ng queuing theory, reliability theory.

Mga sistema ng mga random na variable
Sa pagsasagawa, sa mga aplikasyon ng probability theory, ang isa ay madalas na humarap sa mga problema kung saan ang mga resulta ng isang eksperimento ay inilalarawan hindi ng isang random variable, ngunit ng ilang random variable nang sabay-sabay.

Sistema ng dalawang random na discrete variable
Hayaang bumuo ng isang sistema ang dalawang random na discrete variable. Random na halaga

Sistema ng dalawang random na tuluy-tuloy na variable
Ngayon hayaan ang system na mabuo ng dalawang random na tuluy-tuloy na variable. Ang batas ng pamamahagi ng sistemang ito ay tinatawag na malamang

Mga kondisyong batas ng pamamahagi
Hayaan at umaasa sa random na tuluy-tuloy na mga variable

Mga numerical na katangian ng isang sistema ng dalawang random na variable
Ang unang sandali ng pagkakasunud-sunod ng sistema ng mga random na variable

Sistema ng ilang mga random na variable
Ang mga resultang nakuha para sa isang sistema ng dalawang random na variable ay maaaring gawing pangkalahatan sa kaso ng mga system na binubuo ng isang arbitrary na bilang ng mga random na variable. Hayaang mabuo ang sistema ng set

Normal na distribusyon ng isang sistema ng dalawang random na variable
Isaalang-alang ang isang sistema ng dalawang random na tuluy-tuloy na mga variable. Ang batas sa pamamahagi ng sistemang ito ay ang normal na batas sa pamamahagi

Limitahan ang theorems ng probability theory
Ang pangunahing layunin ng discipline of probability theory ay pag-aralan ang mga pattern ng random mass phenomena. Practice ay nagpapakita na ang pagmamasid ng isang mass ng homogenous random phenomena ay nagpapakita

Ang hindi pagkakapantay-pantay ni Chebyshev
Isaalang-alang ang isang random na variable na may inaasahan sa matematika

Ang teorama ni Chebyshev
Kung ang mga random na variable ay magkapares na independyente at may hangganan na mga pagkakaiba-iba na nakatali sa populasyon

Ang teorama ni Bernoulli
Sa isang walang limitasyong pagtaas sa bilang ng mga eksperimento, ang dalas ng paglitaw ng isang kaganapan ay nagtatagpo sa posibilidad sa posibilidad ng isang kaganapan

Central limit theorem
Kapag nagdaragdag ng mga random na variable sa anumang mga batas sa pamamahagi, ngunit may mga pagkakaiba-iba na limitado sa pinagsama-samang, ang batas sa pamamahagi

Pangunahing gawain ng mga istatistika ng matematika
Ang mga batas ng teorya ng posibilidad na tinalakay sa itaas ay isang mathematical na pagpapahayag ng mga tunay na pattern na aktwal na umiiral sa iba't ibang random na mass phenomena. nag-aaral

Isang simpleng istatistika. Statistical distribution function
Isaalang-alang ang ilang random na variable na ang batas sa pamamahagi ay hindi alam. Kinakailangan batay sa karanasan

Linya ng istatistika. bar graph
Sa isang malaking bilang ng mga obserbasyon (sa pagkakasunud-sunod ng daan-daan), ang pangkalahatang populasyon ay nagiging hindi maginhawa at mahirap para sa pagtatala ng istatistikal na materyal. Para sa kalinawan at pagiging compactness, istatistikal na materyal

Mga de-numerong katangian ng distribusyon ng istatistika
Sa probability theory, ang iba't ibang mga numerical na katangian ng mga random na variable ay isinasaalang-alang: mathematical expectation, variance, initial at central moments ng iba't ibang order. Katulad na mga numero

Pagpili ng teoretikal na pamamahagi sa pamamagitan ng paraan ng mga sandali
Sa anumang distribusyon ng istatistika, hindi maiiwasang may mga elemento ng randomness na nauugnay sa limitadong bilang ng mga obserbasyon. Sa isang malaking bilang ng mga obserbasyon, ang mga elementong ito ng randomness ay pinapawi,

Pagsubok sa pagiging totoo ng hypothesis tungkol sa anyo ng batas sa pamamahagi
Hayaang ang ibinigay na distribusyon ng istatistika ay tinantiya ng ilang teoretikal na kurba o

Pamantayan ng Pahintulot
Isaalang-alang ang isa sa mga pinakakaraniwang ginagamit na mga pagsubok sa goodness-of-fit, ang tinatawag na Pearson test. Ipagpalagay

Mga pagtatantya ng puntos para sa hindi kilalang mga parameter ng pamamahagi
Sa p.p. 2.1. - 2.7 isinasaalang-alang namin nang detalyado ang mga paraan ng paglutas ng una at pangalawang pangunahing problema ng mga istatistika ng matematika. Ito ang mga gawain ng pagtukoy sa mga batas ng pamamahagi ng mga random na variable ayon sa pang-eksperimentong data

Agwat ng kumpiyansa. Posibilidad ng kumpiyansa
Sa pagsasagawa, na may maliit na bilang ng mga eksperimento sa isang random na variable, isang tinatayang pagpapalit ng isang hindi kilalang parameter

Hayaang magkaroon ng random variable X, at ang mga parameter nito ay ang mathematical expectation a at ang pagkakaiba ay hindi alam. Sa halaga ng X, isinagawa ang mga independyenteng eksperimento, na nagbigay ng mga resulta ng x 1, x 2, x n.

Nang hindi binabawasan ang pangkalahatan ng pangangatwiran, isasaalang-alang namin ang mga halagang ito ng random variable na naiiba. Isasaalang-alang namin ang mga halaga x 1, x 2, x n bilang independiyente, magkaparehong ibinahagi na mga random na variable X 1, X 2, X n .

Ang pinakasimpleng paraan ng istatistikal na pagtatantya - ang paraan ng pagpapalit at pagkakatulad - ay binubuo sa katotohanan na bilang isang pagtatantya ng isa o isa pang numerical na katangian (average, variance, atbp.) ng pangkalahatang populasyon, ang kaukulang katangian ng sample distribution ay kinuha. - ang sample na katangian.

Sa pamamagitan ng paraan ng pagpapalit bilang isang pagtatantya ng inaasahan sa matematika a kinakailangang kunin ang mathematical expectation ng distribution ng sample - ang sample mean. Kaya, nakukuha namin

Upang subukan ang pagiging walang kinikilingan at pagkakapare-pareho ng ibig sabihin ng sample bilang mga pagtatantya a, isaalang-alang ang istatistikang ito bilang isang function ng napiling vector (X 1, X 2, X n). Isinasaalang-alang na ang bawat isa sa mga halaga ng X 1, X 2, X n ay may parehong batas sa pamamahagi tulad ng halaga X, napagpasyahan namin na ang mga numerical na katangian ng mga dami na ito at ang halaga ng X ay pareho: M(X i) = M(X) = a, D(X i) = D(X) = , i = 1, 2, n , kung saan ang X i ay sama-samang independiyenteng mga random na variable.

Kaya naman,

Samakatuwid, ayon sa kahulugan, nakuha namin iyon ay ang walang pinapanigan na pagtatantya a, at dahil ang D()®0 bilang n®¥, pagkatapos ay sa bisa ng theorem ng nakaraang talata ay isang pare-parehong pagtatantya ng inaasahan a pangkalahatang populasyon.

Ang kahusayan o inefficiency ng pagtatantya ay nakasalalay sa anyo ng batas ng pamamahagi ng random variable X. Mapapatunayan na kung ang halaga ng X ay ibinahagi ayon sa normal na batas, kung gayon ang pagtatantya ay mahusay. Para sa iba pang mga batas sa pamamahagi, maaaring hindi ito ang kaso.

Walang pinapanigan na pagtatantya ng pangkalahatang pagkakaiba ay ang naitama na sample variance

,

Bilang , nasaan ang pangkalahatang pagkakaiba. Talaga,

Ang pagtatantya na s -- 2 para sa pangkalahatang pagkakaiba ay pare-pareho din, ngunit hindi mahusay. Gayunpaman, sa kaso ng isang normal na distribusyon, ito ay "asymptotically efficient," ibig sabihin, habang tumataas ang n, ang ratio ng pagkakaiba nito sa pinakamababang posibleng isa ay lumalapit nang walang katiyakan.

Kaya, binigyan ng isang sample mula sa pamamahagi F( x) random variable X na may hindi alam na mathematical expectation a at dispersion , pagkatapos ay upang kalkulahin ang mga halaga ng mga parameter na ito, may karapatan kaming gamitin ang mga sumusunod na tinatayang formula:

a ,

.

Dito x-i- - mga opsyon sa sampling, n- i - - mga opsyon sa dalas x i , - - laki ng sample.
Upang kalkulahin ang naitama na pagkakaiba-iba ng sample, ang formula ay mas maginhawa


.

Upang gawing simple ang pagkalkula, ipinapayong lumipat sa mga opsyonal na kondisyon (kapaki-pakinabang na kunin ang paunang variant na matatagpuan sa gitna ng serye ng pagkakaiba-iba ng pagitan bilang c). Pagkatapos

, .

pagtatantya ng pagitan

Sa itaas, isinasaalang-alang namin ang tanong ng pagtantya ng hindi kilalang parameter a isang numero. Tinawag namin ang mga naturang pagtatantya na mga pagtatantya ng punto. Mayroon silang kawalan na, na may maliit na sukat ng sample, maaari silang mag-iba nang malaki mula sa mga tinantyang parameter. Samakatuwid, upang makakuha ng isang ideya ng kalapitan sa pagitan ng isang parameter at pagtatantya nito, ang tinatawag na mga pagtatantya ng agwat ay ipinakilala sa mga istatistika ng matematika.

Hayaang matagpuan ang isang point estimate q * sa sample para sa parameter q. Karaniwan, ang mga mananaliksik ay paunang nagtatalaga ng ilang sapat na malaking probabilidad g (halimbawa, 0.95; 0.99 o 0.999) upang ang isang kaganapang may probabilidad g ay maituturing na halos tiyak, at itinaas ang tanong ng paghahanap ng ganoong halaga na e > 0 kung saan

.

Ang pagbabago sa pagkakapantay-pantay na ito, makukuha natin:

at sa kasong ito ay sasabihin natin na ang pagitan ]q * - e; Sinasaklaw ng q * + e[ ang tinantyang parameter q na may posibilidad na g.

Pagitan ]q * -e; q * +e [ ay tinatawag agwat ng kumpiyansa .

Tinatawag ang probability g pagiging maaasahan (probalidad ng kumpiyansa) pagtatantya ng pagitan.

Ang mga dulo ng agwat ng kumpiyansa, i.e. Ang mga puntos na q * -e at q * +e ay tinatawag mga hangganan ng tiwala .

Ang numero e ay tinatawag katumpakan ng pagtatasa .

Bilang isang halimbawa ng problema sa pagtukoy ng mga limitasyon ng kumpiyansa, isaalang-alang ang tanong ng pagtatantya sa matematikal na inaasahan ng isang random na variable X, na may normal na batas sa pamamahagi na may mga parameter. a at s, i.e. X = N( a, s). Ang pag-asa sa matematika sa kasong ito ay katumbas ng a. Ayon sa mga obserbasyon X 1 , X 2 , X n kalkulahin ang average at pagsusuri pagpapakalat s 2 .

Ito ay lumalabas na ayon sa sample na data, posible na bumuo ng isang random na variable

na mayroong distribusyon ng Estudyante (o t-distribution) na may n = n -1 degrees ng kalayaan.

Gamitin natin ang Talahanayan A.1.3 at hanapin ang ibinigay na probabilidad g at ang numero n ang numerong t g upang ang probabilidad

P(|t(n)|< t g) = g,

.

Pagkatapos gumawa ng mga halatang pagbabago, nakukuha namin

Ang pamamaraan para sa paglalapat ng F-criterion ay ang mga sumusunod:

1. Ang isang pagpapalagay ay ginawa tungkol sa normal na distribusyon ng mga populasyon. Sa isang ibinigay na antas ng kahalagahan a, ang null hypothesis H 0 ay nabuo: s x 2 = s y 2 tungkol sa pagkakapantay-pantay ng mga pangkalahatang pagkakaiba-iba ng mga normal na populasyon sa ilalim ng nakikipagkumpitensyang hypothesis H 1: s x 2 > s y 2 .

2. Dalawang independiyenteng sample ang nakuha mula sa X at Y na populasyon ng n x at n y ayon sa pagkakabanggit.

3. Kalkulahin ang mga halaga ng itinamang sample na mga pagkakaiba-iba s x 2 at s y 2 (mga pamamaraan ng pagkalkula ay tinatalakay sa §13.4). Ang mas malaki sa mga dispersion (s x 2 o s y 2) ay itinalagang s 1 2, ang mas maliit - s 2 2.

4. Ang halaga ng F-criterion ay kinakalkula ayon sa formula F obs = s 1 2 / s 2 2 .

5. Ayon sa talahanayan ng mga kritikal na punto ng pamamahagi ng Fisher - Snedecor, para sa isang naibigay na antas ng kahalagahan a at ang bilang ng mga antas ng kalayaan n 1 \u003d n 1 - 1, n 2 \u003d n 2 - 1 (n 1 ay ang bilang ng mga antas ng kalayaan ng isang mas malaking naitama na pagkakaiba-iba), ang kritikal na punto ay matatagpuan F cr (a, n 1, n 2).

Tandaan na ang Talahanayan A.1.7 ay nagpapakita ng mga kritikal na halaga ng one-tailed F-criterion. Samakatuwid, kung ang isang dalawang panig na pamantayan ay inilapat (H 1: s x 2 ¹ s y 2), kung gayon ang kanang-kamay na kritikal na punto F cr (a / 2, n 1, n 2) ay hahanapin ayon sa antas ng kahalagahan a / 2 (kalahati ng tinukoy na isa) at ang bilang ng mga degree na kalayaan n 1 at n 2 (n 1 - ang bilang ng mga degree ng kalayaan ng higit na pagpapakalat). Ang kaliwang kamay na kritikal na punto ay maaaring hindi matagpuan.

6. Napagpasyahan na kung ang kinakalkula na halaga ng F-criterion ay mas malaki kaysa o katumbas ng kritikal (F obs ³ F cr), kung gayon ang mga pagkakaiba ay malaki ang pagkakaiba sa isang naibigay na antas ng kahalagahan. Kung hindi (F obs< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Gawain 15.1. Ang pagkonsumo ng mga hilaw na materyales sa bawat yunit ng produksyon ayon sa lumang teknolohiya ay:

Bagong teknolohiya:

Ipagpalagay na ang kaukulang pangkalahatang populasyon na X at Y ay may mga normal na distribusyon, suriin na ang pagkonsumo ng mga hilaw na materyales para sa bago at lumang mga teknolohiya ay hindi naiiba sa pagkakaiba-iba, kung kukunin natin ang antas ng kahalagahan a = 0.1.

Desisyon. Kumilos kami sa pagkakasunud-sunod na ipinahiwatig sa itaas.

1. Hahatulan natin ang pagkakaiba-iba ng pagkonsumo ng mga hilaw na materyales para sa bago at lumang mga teknolohiya sa mga tuntunin ng mga halaga ng pagpapakalat. Kaya, ang null hypothesis ay may anyong H 0: s x 2 = s y 2 . Bilang isang nakikipagkumpitensyang hypothesis, tinatanggap namin ang hypothesis H 1: s x 2 ¹ s y 2, dahil hindi kami sigurado nang maaga na ang alinman sa mga pangkalahatang pagkakaiba ay mas malaki kaysa sa iba.

2-3. Hanapin ang mga sample na pagkakaiba-iba. Upang gawing simple ang mga kalkulasyon, lumipat tayo sa mga opsyonal na kondisyon:

u i = x i - 307, v i = y i - 304.

Aayusin namin ang lahat ng mga kalkulasyon sa anyo ng mga sumusunod na talahanayan:

u i m i ako u i ako u ako 2 m i (u i +1) 2 v i n i n i v i n i v i 2 n i (v i +1) 2
-3 -3 -1 -2
å -
å -

Kontrol: å m i u i 2 + 2å m i u i + m i = Control: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Hanapin ang mga naitama na sample na pagkakaiba-iba:

4. Ihambing ang mga pagkakaiba. Hanapin ang ratio ng mas malaking corrected variance sa mas maliit:

.

5. Sa pamamagitan ng kundisyon, ang nakikipagkumpitensyang hypothesis ay may anyo na s x 2 ¹ s y 2 , samakatuwid, ang kritikal na rehiyon ay dalawang-panig, at kapag nahanap ang kritikal na punto, ang isa ay dapat kumuha ng mga antas ng kahalagahan na kalahati ng ibinigay na isa.

Ayon sa Talahanayan A.1.7, ayon sa antas ng kahalagahan a/2 = 0.1/2 = 0.05 at ang bilang ng mga antas ng kalayaan n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8, makikita natin ang kritikal na punto F cr ( 0.05; 12; 8) = 3.28.

6. Dahil si F obl.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

Sa itaas, kapag sinusuri ang mga hypotheses, ipinapalagay na ang distribusyon ng mga random na variable sa ilalim ng pag-aaral ay normal. Gayunpaman, ipinakita ng mga espesyal na pag-aaral na ang mga iminungkahing algorithm ay napaka-stable (lalo na sa malalaking sukat ng sample) na may paggalang sa paglihis mula sa normal na distribusyon.