Ang normal na distribusyon ng isang random variable x ay may function. Normal (Gaussian) na batas sa pamamahagi

Ang mga random na variable ay nauugnay sa mga random na kaganapan. Ang mga random na kaganapan ay binabanggit kapag imposibleng malinaw na mahulaan ang resulta na maaaring makuha sa ilalim ng ilang mga kundisyon.

Ipagpalagay na naghahagis tayo ng ordinaryong barya. Kadalasan ang resulta ng pamamaraang ito ay hindi katangi-tanging tiyak. Masasabi lamang ng isa nang may katiyakan na ang isa sa dalawang bagay ay mangyayari: alinman sa mga ulo o buntot ay mahuhulog. Ang alinman sa mga kaganapang ito ay magiging random. Maaari kang maglagay ng variable na maglalarawan sa kinalabasan ng random na kaganapang ito. Malinaw, ang variable na ito ay kukuha ng dalawang discrete na halaga: mga ulo at buntot. Dahil hindi namin tumpak na mahulaan nang maaga kung alin sa dalawang posibleng mga halaga ang kukuha ng variable na ito, maaari itong pagtalunan na sa kasong ito ay nakikitungo kami sa mga random na variable.

Ipagpalagay natin ngayon na sa eksperimento ay sinusuri natin ang oras ng reaksyon ng paksa sa pagpapakita ng ilang stimulus. Bilang isang patakaran, lumalabas na kahit na ginagawa ng eksperimento ang lahat ng mga hakbang upang i-standardize ang mga pang-eksperimentong kondisyon, pag-minimize o kahit na pag-aalis ng mga posibleng pagkakaiba-iba sa pagtatanghal ng stimulus, ang mga sinusukat na halaga ng oras ng reaksyon ng paksa ay magkakaiba pa rin. Sa kasong ito, sinasabi nila na ang oras ng reaksyon ng paksa ay inilarawan ng isang random na variable. Dahil, sa prinsipyo, sa eksperimento makakakuha tayo ng anumang halaga ng oras ng reaksyon - ang hanay ng mga posibleng halaga ng oras ng reaksyon na maaaring makuha bilang isang resulta ng mga sukat ay lumalabas na walang katapusan - sinasabi nila tungkol sa pagpapatuloy ang random variable na ito.

Ang tanong ay lumitaw: mayroon bang anumang mga regularidad sa pag-uugali ng mga random na variable? Ang sagot sa tanong na ito ay lumalabas na sumasang-ayon.

Kaya, kung ang isang tao ay nagsasagawa ng isang walang katapusang bilang ng mga paghagis ng parehong barya, makikita ng isa na ang bilang ng mga patak sa bawat isa sa dalawang gilid ng barya ay magiging halos pareho, maliban kung, siyempre, ang barya ay hindi totoo at hindi baluktot. . Upang bigyang-diin ang pattern na ito, ang konsepto ng posibilidad ng isang random na kaganapan ay ipinakilala. Ito ay malinaw na sa kaso ng isang coin toss, isa sa dalawang posibleng mga kaganapan ay magaganap nang walang pagkabigo. Ito ay dahil sa ang katunayan na ang kabuuang posibilidad ng dalawang kaganapang ito, kung hindi man ay tinatawag na kabuuang posibilidad, ay 100%. Kung ipagpalagay natin na ang parehong dalawang kaganapan na nauugnay sa pagsubok ng barya ay nangyayari na may pantay na posibilidad, kung gayon ang posibilidad ng bawat resulta nang hiwalay, malinaw naman, ay lumalabas na 50%. Kaya, pinahihintulutan tayo ng mga teoretikal na pagsasaalang-alang na ilarawan ang pag-uugali ng isang naibigay na random na variable. Ang nasabing paglalarawan sa mga istatistika ng matematika ay tinutukoy ng termino "pamamahagi ng isang random na variable".

Ang sitwasyon ay mas kumplikado sa isang random na variable na walang isang mahusay na tinukoy na hanay ng mga halaga, i.e. tuloy tuloy na pala. Ngunit kahit na sa kasong ito, ang ilang mahahalagang regularidad ng pag-uugali nito ay maaaring mapansin. Kaya, kapag nagsasagawa ng isang eksperimento sa pagsukat ng oras ng reaksyon ng paksa, mapapansin na ang iba't ibang mga pagitan ng tagal ng reaksyon ng paksa ay tinatantya na may iba't ibang antas ng posibilidad. Malamang na bihira na ang paksa ay masyadong mabilis mag-react. Halimbawa, sa mga gawain sa semantic na desisyon, halos hindi tumugon ang mga paksa sa mas marami o hindi gaanong tumpak na pagtugon sa bilis na mas mababa sa 500 ms (1/2 s). Sa katulad na paraan, hindi malamang na ang isang paksa na matapat na sumusunod sa mga tagubilin ng eksperimento ay lubos na maantala ang kanyang tugon. Sa mga problema sa semantic na desisyon, halimbawa, ang mga tugon na tinatayang higit sa 5 s ay karaniwang itinuturing na hindi mapagkakatiwalaan. Gayunpaman, na may 100% na katiyakan, maaaring ipagpalagay na ang oras ng reaksyon ng paksa ay nasa saklaw mula 0 hanggang + co. Ngunit ang posibilidad na ito ay ang kabuuan ng mga probabilidad ng bawat indibidwal na halaga ng random variable. Samakatuwid, ang pamamahagi ng isang tuluy-tuloy na random na variable ay maaaring ilarawan bilang isang tuluy-tuloy na function y = f (X ).

Kung tayo ay nakikitungo sa isang discrete random variable, kapag ang lahat ng posibleng mga halaga nito ay kilala nang maaga, tulad ng sa halimbawa ng isang barya, kadalasan ay hindi napakahirap na bumuo ng isang modelo para sa pamamahagi nito. Ito ay sapat na upang ipakilala lamang ang ilang mga makatwirang pagpapalagay, tulad ng ginawa natin sa halimbawang isinasaalang-alang. Ang sitwasyon ay mas kumplikado sa pamamahagi ng patuloy na mga magnitude na kumukuha ng hindi kilalang bilang ng mga halaga nang maaga. Siyempre, kung kami, halimbawa, ay bumuo ng isang teoretikal na modelo na naglalarawan sa pag-uugali ng isang paksa sa isang eksperimento sa pagsukat ng oras ng reaksyon kapag nilutas ang isang problema sa solusyon sa semantiko, maaari naming subukang ilarawan ang teoretikal na pamamahagi ng mga tiyak na halaga ng reaksyon. oras ng parehong paksa sa pagtatanghal ng isa at parehong pampasigla. Gayunpaman, hindi ito laging posible. Samakatuwid, ang eksperimento ay maaaring pilitin na ipalagay na ang pamamahagi ng random na variable ng interes sa kanya ay inilarawan ng ilang batas na pinag-aralan nang maaga. Kadalasan, kahit na hindi ito palaging magiging ganap na tama, ang tinatawag na normal na pamamahagi ay ginagamit para sa mga layuning ito, na nagsisilbing pamantayan para sa pamamahagi ng anumang random na variable, anuman ang kalikasan nito. Ang pamamahagi na ito ay unang inilarawan sa matematika noong unang kalahati ng ika-18 siglo. de Moivre.

Normal na pamamahagi nangyayari kapag ang phenomenon ng interes sa atin ay napapailalim sa impluwensya ng walang katapusang bilang ng mga random na salik na nagbabalanse sa isa't isa. Pormal, ang normal na distribusyon, tulad ng ipinakita ni de Moivre, ay maaaring ilarawan ng sumusunod na kaugnayan:

saan X kumakatawan sa isang random na variable ng interes sa amin, ang pag-uugali na aming pinag-aaralan; R ay ang probability value na nauugnay sa random variable na ito; π at e - kilalang mathematical constants na naglalarawan ayon sa pagkakabanggit ng ratio ng circumference sa diameter at ang base ng natural logarithm; Ang μ at σ2 ay ang mga parameter ng normal na distribusyon ng random variable, ayon sa pagkakabanggit, ang mathematical expectation at variance ng random variable. X.

Upang ilarawan ang normal na distribusyon, lumalabas na kinakailangan at sapat upang tukuyin lamang ang mga parameter na μ at σ2.

Samakatuwid, kung mayroon tayong isang random na variable na ang pag-uugali ay inilarawan sa pamamagitan ng equation (1.1) na may mga di-makatwirang halaga ng μ at σ2, maaari nating tukuyin ito bilang Ν (μ, σ2) nang hindi naaalala ang lahat ng mga detalye ng equation na ito.

kanin. 1.1.

Ang anumang distribusyon ay maaaring ipakita sa anyo ng isang graph. Sa graphically, ang normal na pamamahagi ay may anyo ng isang hugis ng kampanilya na kurba, ang eksaktong hugis nito ay tinutukoy ng mga parameter ng pamamahagi, i.e. inaasahan at pagkakaiba sa matematika. Ang mga parameter ng normal na distribusyon ay maaaring tumagal ng halos anumang mga halaga, na nalilimitahan lamang ng sukat ng pagsukat na ginagamit ng eksperimento. Sa teorya, ang halaga ng inaasahan sa matematika ay maaaring maging anumang numero mula sa hanay ng mga numero mula -∞ hanggang +∞, at ang pagkakaiba ay maaaring anumang hindi negatibong numero. Samakatuwid, mayroong isang walang katapusang bilang ng iba't ibang uri ng normal na distribusyon at, nang naaayon, isang walang katapusang bilang ng mga kurba na kumakatawan dito (gayunpaman, mayroong isang katulad na hugis ng kampana). Malinaw na imposibleng ilarawan ang lahat ng mga ito. Gayunpaman, kung ang mga parameter ng isang partikular na normal na pamamahagi ay kilala, maaari itong ma-convert sa tinatawag na normal na pamamahagi ng yunit, ang mathematical expectation na katumbas ng zero, at ang variance ay katumbas ng isa. Tinatawag din itong normal na distribusyon pamantayan o z-pamamahagi. Ang plot ng unit normal distribution ay ipinapakita sa fig. 1.1, kung saan malinaw na ang tuktok ng hugis ng kampana na kurba ng normal na pamamahagi ay nagpapakilala sa halaga ng inaasahan sa matematika. Ang isa pang parameter ng normal na pamamahagi - pagpapakalat - ay nagpapakilala sa antas ng "pagkalat" ng hugis ng kampanilya na may kaugnayan sa pahalang (abscissa axis).

kumpara sa iba pang uri ng distribusyon. Ang pangunahing tampok ng pamamahagi na ito ay ang lahat ng iba pang mga batas sa pamamahagi ay may posibilidad sa batas na ito na may walang katapusang pag-uulit ng bilang ng mga pagsubok. Paano nakukuha ang distribusyon na ito?

Isipin na, kumukuha ng isang hand dynamometer, ikaw ay matatagpuan sa pinaka-masikip na lugar sa iyong lungsod. At sa lahat ng dumadaan, nag-aalok ka na sukatin ang iyong lakas sa pamamagitan ng pagpisil sa dynamometer gamit ang iyong kanan o kaliwang kamay. Maingat mong itinatala ang mga pagbasa ng dinamometro. Pagkaraan ng ilang oras, na may sapat na malaking bilang ng mga pagsubok, inilalagay mo ang mga pagbabasa ng dynamometer sa abscissa axis, at ang bilang ng mga tao na "pinisil" ang pagbabasa na ito sa ordinate axis. Ang mga nakuha na puntos ay konektado sa pamamagitan ng isang makinis na linya. Ang resulta ay ang curve na ipinapakita sa Figure 9.8. Hindi gaanong magbabago ang hugis ng kurba na ito habang tumataas ang oras ng eksperimento. Bukod dito, mula sa ilang mga punto, ang mga bagong halaga ay magpapadalisay lamang sa kurba nang hindi binabago ang hugis nito.


kanin. 9.8.

Ngayon ay lumipat tayo gamit ang ating dynamometer sa athletic hall at ulitin ang eksperimento. Ngayon ang maximum ng curve ay lilipat sa kanan, ang kaliwang dulo ay medyo hihigpit, habang ang kanang dulo nito ay magiging steeper (Larawan 9.9).


kanin. 9.9.

Tandaan na ang maximum na dalas para sa pangalawang pamamahagi (punto B) ay magiging mas mababa kaysa sa pinakamataas na dalas para sa unang pamamahagi (punto A). Ito ay maaaring ipaliwanag sa pamamagitan ng katotohanan na ang kabuuang bilang ng mga taong bumibisita sa gym ay magiging mas kaunti kaysa sa bilang ng mga taong dumaan malapit sa eksperimento sa unang kaso (sa sentro ng lungsod sa isang medyo masikip na lugar). Ang maximum ay lumipat sa kanan, dahil ang mga athletic hall ay dinaluhan ng mas malakas na mga tao kumpara sa pangkalahatang background.

At sa wakas, bibisita tayo sa mga paaralan, kindergarten at nursing home na may parehong layunin: upang ipakita ang lakas ng mga kamay ng mga bisita sa mga lugar na ito. At muli, ang kurba ng pamamahagi ay magkakaroon ng katulad na hugis, ngunit ngayon, malinaw naman, ang kaliwang dulo nito ay magiging mas matarik, at ang kanang dulo ay mas hihigpitan. At tulad ng sa pangalawang kaso, ang maximum (point C) ay magiging mas mababa kaysa sa point A (Fig. 9.10).


kanin. 9.10.

Ang kahanga-hangang pag-aari na ito ng normal na distribusyon - upang mapanatili ang hugis ng probability density curve (Fig. 8 - 10) ay napansin at inilarawan noong 1733 ni Moivre, at pagkatapos ay sinisiyasat ni Gauss.

Sa siyentipikong pananaliksik, sa teknolohiya, sa mass phenomena o mga eksperimento, pagdating sa paulit-ulit na pag-uulit ng mga random na variable sa ilalim ng pare-parehong mga eksperimentong kondisyon, sinasabi nila na ang mga resulta ng pagsubok ay nakakaranas ng random na scattering, na sumusunod sa batas ng normal na distribution curve

(21)

Saan ang pinakamadalas na kaganapan. Bilang isang tuntunin, sa formula (21) sa halip na ang parameter, . Bukod dito, kapag mas mahaba ang seryeng pang-eksperimento, mas mababa ang parameter na mag-iiba mula sa inaasahan sa matematika. Ang lugar sa ilalim ng kurba (Larawan 9.11) ay ipinapalagay na katumbas ng isa. Ang lugar na naaayon sa anumang agwat ng x-axis ay katumbas ng bilang sa posibilidad ng isang random na resulta na nahuhulog sa pagitan na ito.


kanin. 9.11.

Ang normal na function ng pamamahagi ay may anyo


(22)

Tandaan na ang normal na curve (Larawan 9.11) ay simetriko na may paggalang sa tuwid na linya at asymptotically lumalapit sa OX axis sa .

Kalkulahin ang mathematical na inaasahan para sa normal na batas


(23)

Mga katangian ng normal na pamamahagi

Isaalang-alang natin ang mga pangunahing katangian ng pinakamahalagang pamamahagi na ito.

Ari-arian 1. Density function ng normal na distribution (21) na mga kahulugan sa buong x-axis.

Ari-arian 2. Ang density function ng normal na distribution (21) ay mas malaki sa zero para sa alinman sa domain ng definition ().

Ari-arian 3. Sa walang katapusang pagtaas (pagbaba), ang distribution function (21) ay nagiging zero .

Ari-arian 4. Kapag , ang distribution function na ibinigay ng (21) ay may pinakamalaking halaga na katumbas ng

(24)

Ari-arian 5. Ang graph ng function (Larawan 9.11) ay simetriko na may kinalaman sa isang tuwid na linya.

Ari-arian 6. Ang function graph (Fig. 9.11) ay may dalawang inflection point na simetriko tungkol sa isang tuwid na linya:

(25)

Ari-arian 7. Ang lahat ng kakaibang gitnang sandali ay katumbas ng zero. Tandaan na gamit ang property 7, ang asymmetry ng function ay tinutukoy ng formula . Kung , pagkatapos ay ipagpalagay nila na ang distribusyon sa ilalim ng pag - aaral ay simetriko na may kinalaman sa tuwid na linya . Kung , pagkatapos ay sinasabi nila na ang hilera ay inilipat sa kanan (mas malumanay na kiling sa kanang sangay ng graph o hinihigpitan). Kung , kung gayon ito ay isinasaalang-alang na ang hilera ay inilipat sa kaliwa (mas patag na kaliwang sangay ng graph sa Fig. 9.12).


kanin. 9.12.

Ari-arian 8. Ang kurtosis ng pamamahagi ay 3. Sa pagsasagawa, ito ay madalas na kinakalkula at ang antas ng "compression" o "paglalabo" ng graph ay tinutukoy ng lapit ng halagang ito sa zero (Fig. 9.13). At dahil nauugnay ito sa , sa huli ay nailalarawan nito ang antas ng pagpapakalat ng dalas ng data. At dahil ito ay tumutukoy

Ang pinakasikat at madalas na ginagamit na batas sa probability theory ay ang normal distribution law o Batas ng Gauss .

pangunahing tampok Ang normal na batas sa pamamahagi ay nakasalalay sa katotohanan na ito ang batas na naglilimita para sa iba pang mga batas sa pamamahagi.

Tandaan na para sa isang normal na distribusyon, ang integral function ay may anyo:

.

Ipakita natin ngayon na ang probabilistikong kahulugan ng mga parameter at ay ang mga sumusunod: a mayroong isang mathematical na inaasahan, - ang karaniwang paglihis (iyon ay, ) ng normal na distribusyon:

a) sa pamamagitan ng kahulugan ng mathematical na inaasahan ng isang tuluy-tuloy na random variable, mayroon kami

Talaga

,

dahil mayroong isang kakaibang function sa ilalim ng integral sign, at ang mga limitasyon ng pagsasama ay simetriko na may paggalang sa pinagmulan;

- integral ng Poisson .

Kaya, ang inaasahan ng matematika ng normal na pamamahagi ay katumbas ng parameter a .

b) sa pamamagitan ng kahulugan ng pagpapakalat ng isang tuluy-tuloy na random na variable at, isinasaalang-alang na , maaari tayong sumulat

.

Pagsasama ayon sa mga bahagi, setting , hanapin

Kaya naman .

Kaya, ang standard deviation ng normal distribution ay katumbas ng parameter .

Kung at normal na distribution ay tinatawag na normalized (o, standard normal) distribution. Pagkatapos, malinaw naman, ang normalized density (differential) at ang normalized integral distribution function ay isusulat ayon sa pagkakabanggit sa anyo:

(Ang function, tulad ng alam mo, ay tinatawag na Laplace function (tingnan ang LECTURE 5) o ang probability integral. Parehong function, iyon ay, , ay naka-tabulate at ang kanilang mga halaga ay naitala sa kaukulang mga talahanayan).

Mga normal na katangian ng pamamahagi (normal na mga katangian ng kurba):

1. Malinaw, isang function sa buong tunay na linya.

2. , ibig sabihin, ang normal na curve ay matatagpuan sa itaas ng axis Oh .

3. , iyon ay, ang axis Oh nagsisilbing pahalang na asymptote ng graph.

4. Ang normal na kurba ay simetriko tungkol sa isang tuwid na linya x = a (ayon dito, ang graph ng function ay simetriko tungkol sa axis OU ).

Samakatuwid, maaari tayong magsulat: .

5. .

6. Madaling ipakita na ang mga puntos at ay ang mga inflection point ng normal na curve (patunayan ang iyong sarili).

7.Obvious naman yun

ngunit mula noong , pagkatapos . Bukod sa , samakatuwid, ang lahat ng mga kakaibang sandali ay katumbas ng zero.

Para sa kahit na sandali, maaari tayong sumulat:

8. .

9. .

10. , saan .

11. Para sa mga negatibong halaga ng random variable: , kung saan .


13. Ang posibilidad na matamaan ang isang random na variable sa isang plot na simetriko tungkol sa sentro ng pamamahagi ay katumbas ng:

HALIMBAWA 3. Ipakita na ang isang normal na distributed random variable X lumihis sa inaasahan M(X) hindi hihigit sa .

Desisyon. Para sa isang normal na pamamahagi: .

Sa madaling salita, ang posibilidad na ang ganap na halaga ng paglihis ay lalampas triple ang standard deviation ay napakaliit, ibig sabihin ay 0.0027. Nangangahulugan ito na sa 0.27% lamang ng mga kaso ito ay maaaring mangyari. Ang ganitong mga kaganapan, batay sa prinsipyo ng imposibilidad ng hindi malamang na mga kaganapan, ay maaaring ituring na halos imposible.

Kaya, ang isang kaganapan na may posibilidad na 0.9973 ay maaaring ituring na halos tiyak, iyon ay, ang isang random na variable ay lumihis mula sa inaasahan ng matematika nang hindi hihigit sa .

HALIMBAWA 4. Pag-alam sa mga katangian ng normal na distribusyon ng isang random na variable X - lakas ng makunat ng bakal: kg / mm 2 at kg / mm 2, hanapin ang posibilidad na makakuha ng bakal na may lakas na makunat na 31 kg / mm 2 hanggang 35 kg / mm 2.

Desisyon.

3. Exponential distribution (batas ng exponential distribution)

Ang exponential (exponential) ay ang probability distribution ng isang tuluy-tuloy na random variable X , na inilalarawan ng isang differential function (densidad ng pamamahagi)

kung saan ay isang palaging positibong halaga.

Tinukoy ang exponential distribution isa parameter . Ang tampok na ito ng exponential distribution ay nagpapahiwatig ng kalamangan nito sa mga distribution na nakadepende sa mas malaking bilang ng mga parameter. Karaniwan, hindi alam ang mga parameter at kailangang hanapin ng isa ang kanilang mga pagtatantya (mga tinatayang halaga); siyempre, mas madaling suriin ang isang parameter kaysa dalawa, o tatlo, atbp.

Madaling isulat ang integral function ng exponential distribution:

Tinukoy namin ang exponential distribution gamit ang differential function; malinaw na matutukoy ito gamit ang integral function.

Magkomento: Isaalang-alang ang isang tuluy-tuloy na random na variable T - ang tagal ng uptime ng produkto. Tukuyin natin ang mga tinatanggap na halaga nito sa pamamagitan ng t , . Pinagsama-samang pagpapaandar ng pamamahagi tumutukoy posibilidad ng pagkabigo mga produkto sa loob ng isang yugto ng panahon t . Samakatuwid, ang posibilidad ng failure-free na operasyon para sa parehong tagal ng oras t , iyon ay, ang posibilidad ng kabaligtaran na kaganapan ay katumbas ng

Kahulugan. normal ay tinatawag na probability distribution ng isang tuluy-tuloy na random variable, na inilalarawan ng probability density

Ang normal na pamamahagi ay tinatawag din Batas ng Gauss.

Ang normal na batas sa pamamahagi ay sentro ng teorya ng posibilidad. Ito ay dahil sa ang katunayan na ang batas na ito ay nagpapakita ng sarili sa lahat ng mga kaso kapag ang isang random na variable ay ang resulta ng pagkilos ng isang malaking bilang ng iba't ibang mga kadahilanan. Ang lahat ng iba pang mga batas sa pamamahagi ay lumalapit sa normal na batas.

Madali itong maipakita na ang mga parameter at kasama sa density ng pamamahagi ay, ayon sa pagkakabanggit, ang inaasahan sa matematika at ang karaniwang paglihis ng random variable X.

Hanapin ang function ng pamamahagi F(x).

Tinatawag ang normal na plot ng density ng pamamahagi normal na kurba o Gaussian curve.

Ang isang normal na kurba ay may mga sumusunod na katangian:

1) Ang function ay tinukoy sa buong axis ng numero.

2) Para sa lahat X ang distribution function ay tumatagal lamang ng mga positibong halaga.

3) Ang OX axis ay ang pahalang na asymptote ng probability density graph, dahil na may walang limitasyong pagtaas sa ganap na halaga ng argumento X, ang halaga ng function ay may posibilidad na zero.

4) Hanapin ang extremum ng function.

kasi sa y' > 0 sa x< m at ikaw< 0 sa x > m, pagkatapos ay sa punto x = t ang function ay may pinakamataas na katumbas ng .

5) Ang function ay simetriko na may paggalang sa isang tuwid na linya x = a, dahil pagkakaiba

(x - a) pumapasok sa squared distribution density function.

6) Upang mahanap ang mga inflection point ng graph, hanapin natin ang pangalawang derivative ng density function.

Sa x = m+ s at x = m- s ang pangalawang derivative ay katumbas ng zero, at kapag dumadaan sa mga puntong ito ay nagbabago ito ng sign, i.e. sa mga puntong ito ang function ay may inflection.

Sa mga puntong ito, ang halaga ng function ay .

Bumuo tayo ng graph ng distribution density function.

Ang mga graph ay ginawa para sa t=0 at tatlong posibleng value ng standard deviation s = 1, s = 2 at s = 7. Gaya ng nakikita mo, habang tumataas ang value ng standard deviation, nagiging flatter ang graph, at bumababa ang maximum na value.

Kung ang a> 0, pagkatapos ay lilipat ang graph sa positibong direksyon kung a < 0 – в отрицательном.

Sa a= 0 at s = 1 ang kurba ay tinatawag na-normalize. Normalized Curve Equation:

Para sa kaiklian, sinasabi namin na ang CV X ay sumusunod sa batas N(m, s), i.e. X ~ N(m, s). Ang mga parameter m at s ay nag-tutugma sa mga pangunahing katangian ng pamamahagi: m = m X , s = s X = . Kung SV X ~ N(0, 1), kung gayon ito ay tinatawag standardized normal na halaga. Ang DF ay tinatawag na isang standardized normal na halaga Laplace function at tinutukoy bilang Ф(x). Maaari itong magamit upang kalkulahin ang mga probabilidad ng pagitan para sa normal na distribusyon N(m, s):

P(x 1 £ X< x 2) = Ф - Ф .

Kapag nilulutas ang mga problema sa isang normal na pamamahagi, madalas na kinakailangan na gumamit ng mga halaga ng tabular ng Laplace function. Dahil ang Laplace function ay nakakatugon sa kaugnayan F(-x) = 1 - F(x), pagkatapos ay sapat na magkaroon ng mga tabular na halaga ng function F(x) para lamang sa mga positibong halaga ng argumento.

Para sa posibilidad na matamaan ang isang pagitan na simetriko na may kinalaman sa inaasahan sa matematika, ang sumusunod na formula ay totoo: P(|X - m X |< e) = 2×F(e/s) - 1.

Ang mga gitnang sandali ng normal na distribusyon ay nakakatugon sa recursive na ugnayan: m n +2 = (n+1)s 2 m n , n = 1, 2, ... . Ito ay nagpapahiwatig na ang lahat ng mga sentral na sandali ng kakaibang pagkakasunud-sunod ay katumbas ng zero (dahil m 1 = 0).

Hanapin ang posibilidad na ang isang random na variable na ibinahagi ayon sa normal na batas ay nahuhulog sa isang ibinigay na pagitan.

Magpakilala

kasi integral ay hindi ipinahayag sa mga tuntunin ng elementarya function, pagkatapos ay ang function ay ipinakilala sa pagsasaalang-alang

,

na tinatawag na Laplace function o integral ng probabilidad.

Ang mga halaga ng function na ito para sa iba't ibang mga halaga X kinakalkula at ipinakita sa mga espesyal na talahanayan.

Nasa ibaba ang isang graph ng Laplace function.

Ang Laplace function ay may mga sumusunod na katangian:

2) F(- X) = - F( X);

Ang Laplace function ay tinatawag din pag-andar ng error at tukuyin ang erf x.

Ginagamit pa rin na-normalize ang Laplace function, na nauugnay sa Laplace function sa pamamagitan ng kaugnayan:

Nasa ibaba ang isang plot ng normalized na function ng Laplace.

Kapag isinasaalang-alang ang normal na pamamahagi, ang isang mahalagang espesyal na kaso ay nakikilala, na kilala bilang tatlong sigma na panuntunan.

Isulat natin ang posibilidad na ang paglihis ng isang normal na ibinahagi na random na variable mula sa inaasahan sa matematika ay mas mababa sa isang ibinigay na halaga D:

Kung tinatanggap namin ang D = 3s, pagkatapos ay makuha namin gamit ang mga talahanayan ng mga halaga ng function ng Laplace:

Yung. ang posibilidad na ang isang random na variable ay lumihis mula sa kanyang inaasahan sa matematika sa pamamagitan ng isang halaga na higit sa tatlong beses ang karaniwang paglihis ay halos zero.

Ang tuntuning ito ay tinatawag tatlong sigma na panuntunan.

Sa pagsasagawa, isinasaalang-alang na kung para sa anumang random na variable ang panuntunan ng tatlong sigma ay nasiyahan, kung gayon ang random na variable na ito ay may normal na distribusyon.

Halimbawa. Ang tren ay binubuo ng 100 bagon. Ang masa ng bawat bagon ay isang random na variable na ibinahagi ayon sa normal na batas na may inaasahan sa matematika a= 65 t at standard deviation s = 0.9 t. Ang lokomotibo ay maaaring magdala ng isang tren na tumitimbang ng hindi hihigit sa 6600 t, kung hindi, ito ay kinakailangan upang maglakip ng isang pangalawang lokomotibo. Hanapin ang posibilidad na ang pangalawang lokomotibo ay hindi kinakailangan.

Ang pangalawang lokomotibo ay hindi kinakailangan kung ang paglihis ng masa ng tren mula sa inaasahang isa (100 × 65 = 6500) ay hindi lalampas sa 6600 - 6500 = 100 tonelada.

kasi ang masa ng bawat kotse ay may normal na distribusyon, pagkatapos ay ang masa ng buong tren ay maipapamahagi din nang normal.

Nakukuha namin:

Halimbawa. Ang isang normal na distributed random variable X ay ibinibigay ng mga parameter nito - isang \u003d 2 - mathematical expectation at s = 1 – standard deviation. Kinakailangang isulat ang probability density at i-plot ito, hanapin ang posibilidad na ang X ay kukuha ng halaga mula sa pagitan (1; 3), hanapin ang probabilidad na ang X ay lumihis (modulo) mula sa mathematical na inaasahan ng hindi hihigit sa 2.

Ang density ng pamamahagi ay may anyo:

Bumuo tayo ng isang graph:

Hanapin natin ang posibilidad na matamaan ang isang random na variable sa pagitan (1; 3).

Hanapin ang posibilidad na ang random variable ay lumihis mula sa mathematical na inaasahan sa pamamagitan ng isang halaga na hindi hihigit sa 2.

Ang parehong resulta ay maaaring makuha gamit ang normalized Laplace function.

Lecture 8 Law of large numbers(Seksyon 2)

Plano ng lecture

Central limit theorem (pangkalahatang pagbabalangkas at partikular na pagbabalangkas para sa mga independiyenteng magkaparehong ipinamamahagi na mga random na variable).

Ang hindi pagkakapantay-pantay ni Chebyshev.

Ang batas ng malalaking numero sa anyo ng Chebyshev.

Ang konsepto ng dalas ng kaganapan.

Pag-unawa sa istatistika ng posibilidad.

Ang batas ng malalaking numero sa anyo ng Bernoulli.

Ang pag-aaral ng mga istatistikal na regularidad ay naging posible upang maitaguyod na, sa ilalim ng ilang mga kundisyon, ang kabuuang pag-uugali ng isang malaking bilang ng mga random na variable ay halos nawawala ang random na karakter nito at nagiging regular (sa madaling salita, ang mga random na paglihis mula sa ilang karaniwang pag-uugali ay kanselahin ang isa't isa) . Sa partikular, kung ang impluwensya sa kabuuan ng mga indibidwal na termino ay pantay na maliit, ang batas ng pamamahagi ng kabuuan ay lumalapit sa normal. Ang mathematical formulation ng pahayag na ito ay ibinibigay sa isang grupo ng mga theorems na tinatawag batas ng malalaking numero.

BATAS NG DAKILANG BILANG- isang pangkalahatang prinsipyo, dahil sa kung saan ang magkasanib na pagkilos ng mga random na salik ay humahantong, sa ilalim ng ilang napaka-pangkalahatang kondisyon, sa isang resulta na halos independyente sa pagkakataon. Ang unang halimbawa ng pagpapatakbo ng prinsipyong ito ay maaaring ang convergence ng dalas ng paglitaw ng isang random na kaganapan na may posibilidad nito na may pagtaas sa bilang ng mga pagsubok (madalas na ginagamit sa pagsasanay, halimbawa, kapag ginagamit ang dalas ng paglitaw ng anumang kalidad ng respondent sa sample bilang sample na pagtatantya ng kaukulang probabilidad).

Kakanyahan batas ng malalaking numero ay na sa isang malaking bilang ng mga independiyenteng eksperimento, ang dalas ng paglitaw ng ilang kaganapan ay malapit sa posibilidad nito.

Central limit theorem (CLT) (sa pagbabalangkas ng Lyapunov A.M. para sa magkatulad na distributed RVs). Kung magkapares na independiyenteng RVs X 1 , X 2 , ..., X n , ... ay may parehong batas sa pamamahagi na may finite numerical na katangian M = m at D = s 2 , kung gayon para sa n ® ¥ ang batas ng pamamahagi ng RV nang walang katiyakan lumalapit sa normal na batas N(n×m, ).

Bunga. Kung nasa kondisyon ng CB theorem , pagkatapos ay habang ang n ® ¥ ang batas ng pamamahagi ng SW Y ay lumalapit sa normal na batas N(m, s/ ) nang walang katiyakan.

De Moivre-Laplace theorem. Hayaang ang SV K ang bilang ng "mga tagumpay" sa n pagsubok ayon sa Bernoulli scheme. Pagkatapos, para sa n ® ¥ at isang nakapirming halaga ng probabilidad ng "tagumpay" sa isang pagsubok p, ang batas ng pamamahagi ng RV K ay lumalapit nang walang katiyakan sa normal na batas N(n×p, ).

Bunga. Kung sa kondisyon ng theorem, sa halip na SV K, isinasaalang-alang namin ang SV K/n - ang dalas ng "mga tagumpay" sa n pagsubok ayon sa Bernoulli scheme, kung gayon ang batas ng pamamahagi nito para sa n ® ¥ at isang nakapirming halaga ng p approach ang normal na batas N(p, ) nang walang katiyakan.

Magkomento. Hayaang ang SV K ang bilang ng "mga tagumpay" sa n pagsubok ayon sa Bernoulli scheme. Ang batas ng pamamahagi ng naturang TK ay ang binomial na batas. Pagkatapos, bilang n ® ¥, ang binomial na batas ay may dalawang pamamahagi ng limitasyon:

n pamamahagi Poisson(para sa n ® ¥ at l = n×p = const);

n pamamahagi Gaussian N(n×p, ) (para sa n ® ¥ at p = const).

Halimbawa. Ang posibilidad ng "tagumpay" sa isang pagsubok ay p = 0.8 lamang. Gaano karaming mga pagsubok ang dapat gawin upang may posibilidad na hindi bababa sa 0.9 maaari nating asahan na ang naobserbahang dalas ng "tagumpay" sa mga pagsubok ayon sa Bernoulli scheme ay lumihis mula sa probabilidad p ng hindi hihigit sa e = 0.01?

Desisyon. Para sa paghahambing, nilulutas namin ang problema sa dalawang paraan.

Sa teorya ng posibilidad, ang isang medyo malaking bilang ng iba't ibang mga batas sa pamamahagi ay isinasaalang-alang. Para sa paglutas ng mga problemang nauugnay sa pagbuo ng mga control chart, ilan lamang sa mga ito ang interesado. Ang pinakamahalaga sa kanila ay batas ng normal na pamamahagi, na ginagamit upang bumuo ng mga control chart na ginagamit sa quantitative control, ibig sabihin. kapag tayo ay nakikitungo sa isang tuluy-tuloy na random variable. Ang batas ng normal na pamamahagi ay sumasakop sa isang espesyal na posisyon sa iba pang mga batas sa pamamahagi. Ito ay ipinaliwanag sa pamamagitan ng ang katunayan na, una, ito ay pinaka-madalas na nakatagpo sa pagsasanay, at, pangalawa, ito ay ang limitasyon ng batas, kung saan ang iba pang mga batas ng pamamahagi ay lumalapit sa ilalim ng napakadalas na nakatagpo ng mga tipikal na kondisyon. Para sa pangalawang pangyayari, napatunayan sa teorya ng probabilidad na ang kabuuan ng isang sapat na malaking bilang ng mga independyente (o mahinang umaasa) na mga random na variable na napapailalim sa anumang mga batas sa pamamahagi (napapailalim sa ilang mga hindi mahigpit na paghihigpit) na tinatayang sumusunod sa normal na batas. , at ito ay natutupad nang mas tumpak, mas malaki ang bilang ng mga random na variable na naipon. Karamihan sa mga random na variable na nakatagpo sa pagsasanay, tulad ng, halimbawa, mga error sa pagsukat, ay maaaring kinakatawan bilang ang kabuuan ng isang napakalaking bilang ng mga medyo maliit na termino - elementarya na mga error, na ang bawat isa ay sanhi ng pagkilos ng isang hiwalay na dahilan na independyente ng iba. Ang normal na batas ay nangyayari kapag ang random variable X ay ang resulta ng isang malaking bilang ng iba't ibang mga kadahilanan. Ang bawat salik ay hiwalay sa halaga X bahagyang nakakaimpluwensya, at imposibleng tukuyin kung alin ang nakakaimpluwensya sa mas malaking lawak kaysa sa iba.

Normal na pamamahagi(Pamamahagi ng Laplace–Gauss) ay ang probability distribution ng isang tuluy-tuloy na random variable X na ang probability distribution density sa - ¥<х< + ¥ принимает действительное значение:

exp (3)

Iyon ay, ang normal na pamamahagi ay nailalarawan sa pamamagitan ng dalawang mga parameter m at s, kung saan ang m ay ang matematikal na inaasahan; s ay ang standard deviation ng normal distribution.

s halaga 2 ay ang pagkakaiba ng normal na distribusyon.

Ang mathematical expectation m ay nagpapakilala sa posisyon ng distribution center, at ang standard deviation s (RMS) ay isang dispersion na katangian (Fig. 3).

f(x) f(x)


Figure 3 - Mga function ng density ng normal na distribution na may:

a) iba't ibang mga inaasahan sa matematika m; b) magkaibang RMS s.

Kaya, ang halaga μ ay tinutukoy ng posisyon ng distribution curve sa x-axis. Dimensyon μ - kapareho ng sukat ng random variable X. Habang tumataas ang mathematical expectation, ang parehong function ay gumagalaw parallel sa kanan. Sa pagbaba ng pagkakaiba s 2 ang density ay nagiging higit at higit na puro sa paligid ng m, habang ang pamamahagi ng function ay nagiging mas at mas matarik.

Tinutukoy ng value ng σ ang hugis ng distribution curve. Dahil ang lugar sa ilalim ng kurba ng pamamahagi ay dapat palaging manatiling katumbas ng pagkakaisa, habang tumataas ang σ, ang kurba ng pamamahagi ay nagiging mas patag. Sa fig. Ang 3.1 ay nagpapakita ng tatlong kurba para sa magkaibang σ: σ1 = 0.5; σ2 = 1.0; σ3 = 2.0.

Figure 3.1 - Density function ng normal distribution na may magkaibang RMS s .

Ang distribution function (integral function) ay may anyo (Fig. 4):

(4)

Figure 4 - Integral (a) at differential (b) normal distribution function

Ang partikular na kahalagahan ay ang linear transformation ng isang normal na ibinahagi na random variable X, pagkatapos nito ay nakuha ang isang random na variable Z na may mathematical expectation 0 at variance 1. Ang ganitong pagbabago ay tinatawag na normalization:

Magagawa ito para sa bawat random na variable. Ang normalisasyon ay nagbibigay-daan sa lahat ng posibleng variant ng normal na distribusyon na bawasan sa isang kaso: m = 0, s = 1.

Ang normal na distribusyon na may m = 0, s = 1 ay tinatawag normalized normal distribution (standardized).

karaniwang normal na pamamahagi(standard Laplace-Gauss distribution o normalized normal distribution) ay ang probability distribution ng isang standardized normal random variable Z, ang density ng pamamahagi nito ay katumbas ng:

sa - ¥<z< + ¥

Mga halaga ng function Ф(z) ay tinutukoy ng formula:

(7)

Mga halaga ng function Ф(z) at densidad f(z) ang normalized na normal na distribusyon ay kinakalkula at ibinubuod sa mga talahanayan (tabulated). Ang talahanayan ay pinagsama-sama lamang para sa mga positibong halaga z kaya naman:

F (z) = 1Ф (z) (8)

Gamit ang mga talahanayan na ito, matutukoy ng isang tao hindi lamang ang mga halaga ng pag-andar at density ng normalized na normal na pamamahagi para sa isang naibigay na z, ngunit gayundin ang mga halaga ng pangkalahatang normal na pagpapaandar ng pamamahagi, dahil:

; (9)

. 10)

Sa maraming mga problema na may kaugnayan sa normal na ipinamamahagi na mga random na variable, ang isa ay kailangang matukoy ang posibilidad na matamaan ang isang random na variable. X, napapailalim sa normal na batas na may mga parameter na m at s, sa isang tiyak na lugar. Ang nasabing site ay maaaring, halimbawa, isang tolerance field para sa isang parameter mula sa itaas na halaga U hanggang sa ibaba L.

Ang posibilidad na mahulog sa pagitan mula sa X 1 hanggang X 2 ay maaaring matukoy ng formula:

Kaya, ang posibilidad na matamaan ang isang random na variable (parameter value) X sa tolerance field ay tinutukoy ng formula

Maaaring mahanap ng isa ang posibilidad na ang isang random na variable X ay nasa loob ng μ k s . Nakuha ang mga halaga para sa k=1,2 at 3 ay ang mga sumusunod (tingnan din ang Fig. 5):

Kaya, kung ang anumang halaga ay lilitaw sa labas ng tatlong-sigma na rehiyon, na naglalaman ng 99.73% ng lahat ng posibleng mga halaga, at ang posibilidad na mangyari ang naturang kaganapan ay napakaliit (1:270), dapat itong isaalang-alang na ang halaga na pinag-uusapan ay lumabas. upang maging masyadong maliit o masyadong malaki hindi dahil sa random na pagkakaiba-iba, ngunit dahil sa makabuluhang interference sa proseso mismo, na may kakayahang magdulot ng mga pagbabago sa likas na katangian ng pamamahagi.

Ang lugar na nakahiga sa loob ng tatlong-sigma na mga hangganan ay tinatawag din lugar ng pagpapaubaya sa istatistika kaugnay na makina o proseso.