Rozdelenia pravdepodobnosti. Binomické rozdelenie diskrétnej náhodnej premennej

Teória pravdepodobnosti je odvetvie matematiky, ktoré študuje vzorce náhodných javov: náhodné udalosti, náhodné premenné, ich vlastnosti a operácie s nimi.

Na dlhú dobu teória pravdepodobnosti nemala jasnú definíciu. Bol sformulovaný až v roku 1929. Vznik teórie pravdepodobnosti ako vedy sa pripisuje stredoveku a prvým pokusom matematická analýza hazardné hry (los, kocky, ruleta). Francúzski matematici Blaise Pascal a Pierre Fermat z 18. storočia skúmali predpoveď výhier v hazardných hier, objavil prvé pravdepodobnostné vzorce, ktoré vznikajú pri hádzaní kockou.

Teória pravdepodobnosti vznikla ako veda z presvedčenia, že určité zákonitosti sú základom masívnych náhodných udalostí. Teória pravdepodobnosti študuje tieto vzorce.

Teória pravdepodobnosti sa zaoberá štúdiom udalostí, ktorých výskyt nie je s určitosťou známy. Umožňuje posúdiť mieru pravdepodobnosti výskytu niektorých udalostí v porovnaní s inými.

Napríklad: nie je možné jednoznačne určiť výsledok straty „hlavy“ alebo „chvosta“ v dôsledku hodu mincou, ale pri viacnásobnom hodení približne rovnaké číslo hlavy a chvosty, čo znamená, že existuje 50% šanca, že dostanú hlavy alebo chvosty.

test v tomto prípade sa nazýva implementácia určitého súboru podmienok, to znamená v tento prípad hod mincou. Výzvu je možné hrať neobmedzený počet krát. V tomto prípade komplex podmienok zahŕňa náhodné faktory.

Výsledok testu je udalosť. Udalosť sa koná:

  1. Spoľahlivé (vždy sa vyskytuje ako výsledok testovania).
  2. Nemožné (nikdy sa to nestane).
  3. Náhodné (môže alebo nemusí nastať ako výsledok testu).

Napríklad pri hode mincou nemožné podujatie- minca bude na hrane, náhodná udalosť - strata "hlavy" alebo "chvosty". Konkrétny výsledok testu je tzv elementárna udalosť. Výsledkom testu sú iba elementárne udalosti. Nazýva sa súhrn všetkých možných, rôznych, špecifických výsledkov testov priestor elementárnych podujatí.

Základné pojmy teórie

Pravdepodobnosť- stupeň možnosti výskytu udalosti. Keď dôvody pre nejakú možnú udalosť skutočne nastanú prevažujú nad opačnými dôvodmi, potom sa táto udalosť nazýva pravdepodobná, inak - nepravdepodobná alebo nepravdepodobná.

Náhodná hodnota- ide o hodnotu, ktorá v dôsledku testu môže nadobudnúť jednu alebo druhú hodnotu, pričom sa vopred nevie, ktorá. Napríklad: počet hasičských staníc za deň, počet zásahov 10 výstrelmi atď.

Náhodné premenné možno rozdeliť do dvoch kategórií.

  1. Diskrétna náhodná premenná nazývaná taká hodnota, ktorá ako výsledok testu môže nadobudnúť určité hodnoty s určitou pravdepodobnosťou tvoriace spočítateľnú množinu (množinu, ktorej prvky možno očíslovať). Táto množina môže byť buď konečná alebo nekonečná. Napríklad počet výstrelov pred prvým zásahom do cieľa je diskrétna náhodná premenná, pretože táto hodnota môže nadobudnúť nekonečný, hoci spočítateľný počet hodnôt.
  2. Spojitá náhodná premenná je veličina, ktorá môže nadobudnúť akúkoľvek hodnotu z nejakého konečného alebo nekonečného intervalu. Je zrejmé, že počet možných hodnôt spojitej náhodnej premennej je nekonečný.

Priestor pravdepodobnosti- koncept zavedený A.N. Kolmogorov v 30-tych rokoch XX storočia formalizovať pojem pravdepodobnosti, ktorý viedol k vzniku rýchly rozvoj teória pravdepodobnosti ako rigorózna matematická disciplína.

Pravdepodobnostný priestor je trojitý (niekedy orámovaný v lomených zátvorkách: , kde

Ide o ľubovoľnú množinu, ktorej prvky sa nazývajú elementárne udalosti, výsledky alebo body;
- sigma-algebra podmnožín nazývaných (náhodné) udalosti;
- pravdepodobnostná miera alebo pravdepodobnosť, t.j. sigma-aditívna konečná miera taká, že .

De Moivre-Laplaceova veta- jedna z limitujúcich teorémov teórie pravdepodobnosti, ktorú v roku 1812 zaviedol Laplace. Uvádza, že počet úspechov pri opakovaní rovnakého náhodného experimentu s dvoma možnými výsledkami je približne normálne rozdelený. Umožňuje vám nájsť približnú hodnotu pravdepodobnosti.

Ak sa pre každý z nezávislých pokusov pravdepodobnosť výskytu nejakej náhodnej udalosti rovná () a je to počet pokusov, v ktorých k nej skutočne dôjde, potom je pravdepodobnosť platnosti nerovnosti blízka (pre veľké ) k hodnote Laplaceovho integrálu.

Distribučná funkcia v teórii pravdepodobnosti- funkcia charakterizujúca rozdelenie náhodnej premennej alebo náhodného vektora; pravdepodobnosť, že náhodná hodnota X nadobudne hodnotu menšiu alebo rovnú x, kde x je ľubovoľné Reálne číslo. Za určitých podmienok úplne určuje náhodnú premennú.

Očakávaná hodnota- priemerná hodnota náhodnej veličiny (ide o rozdelenie pravdepodobnosti náhodnej veličiny, uvažované v teórii pravdepodobnosti). V anglickej literatúre sa v ruštine označuje ako -. V štatistike sa často používa zápis.

Nech je daný pravdepodobnostný priestor a náhodná premenná na ňom definovaná. To je podľa definície merateľná funkcia. Potom, ak existuje Lebesgueov integrál nad priestorom , potom sa nazýva matematické očakávanie alebo stredná hodnota a označuje sa .

Rozptyl náhodnej premennej- miera šírenia danej náhodnej veličiny, teda jej odchýlky od matematického očakávania. Označené v ruskej literatúre a v zahraničí. V štatistike sa často používa označenie alebo. Odmocnina rozptylu sa nazýva štandardná odchýlka, smerodajná odchýlka alebo štandardné rozpätie.

Nech je náhodná premenná definovaná na niektorých pravdepodobnostný priestor. Potom

kde symbol znamená očakávaná hodnota.

V teórii pravdepodobnosti dva náhodné udalosti volal nezávislý ak výskyt jedného z nich nemení pravdepodobnosť výskytu druhého. Podobne sa nazývajú dve náhodné premenné závislý ak hodnota jednej z nich ovplyvňuje pravdepodobnosť hodnôt druhej.

Najjednoduchšia forma zákona veľké čísla- toto je Bernoulliho teorém, ktorý hovorí, že ak je pravdepodobnosť udalosti vo všetkých pokusoch rovnaká, potom s nárastom počtu pokusov sa frekvencia udalosti približuje k pravdepodobnosti udalosti a prestáva byť náhodná.

Zákon veľkých čísel v teórii pravdepodobnosti hovorí, že aritmetický priemer konečnej vzorky z pevného rozdelenia je blízky teoretickému priemeru tohto rozdelenia. Podľa typu konvergencie sa rozlišuje slabý zákon veľkých čísel, kedy dochádza ku konvergencii v pravdepodobnosti, a silný zákon veľkých čísel, kedy ku konvergencii takmer určite dochádza.

Všeobecný význam zákona veľkého počtu – spoločný postup Vysoké číslo identické a nezávislé náhodné faktory vedú k výsledku, ktorý nezávisí od prípadu v limite.

Na tejto vlastnosti sú založené metódy odhadu pravdepodobnosti založené na analýze konečnej vzorky. dobrý príklad je predikcia volebných výsledkov na základe prieskumu vzorky voličov.

Centrálne limitné vety- trieda viet v teórii pravdepodobnosti hovoriaca o tom, že súčet dostatočne veľkého počtu slabo závislých náhodných premenných, ktoré majú približne rovnakú stupnicu (žiadny z členov nedominuje, neprispieva k súčtu rozhodujúcim spôsobom) má rozdelenie blízke normálne.

Keďže mnohé náhodné premenné v aplikáciách vznikajú pod vplyvom niekoľkých slabo závislých náhodných faktorov, ich rozdelenie sa považuje za normálne. V tomto prípade treba dodržať podmienku, že žiadny z faktorov nie je dominantný. Centrálne limitné vety v týchto prípadoch oprávňujú použitie normálneho rozdelenia.

Časť 6. Typické distribučné zákony a číselné charakteristiky náhodných premenných

Tvar funkcií F(x), p(x) alebo enumerácia p(x i) sa nazýva distribučný zákon náhodnej premennej. Aj keď si možno predstaviť nekonečnú škálu náhodných premenných, existuje oveľa menej zákonov rozdelenia. Po prvé, rôzne náhodné premenné môžu mať presne rovnaké distribučné zákony. Napríklad: nech y má iba 2 hodnoty 1 a -1 s pravdepodobnosťou 0,5; hodnota z = -y má presne rovnaký distribučný zákon.
Po druhé, náhodné premenné majú veľmi často podobné zákony rozdelenia, t.j. napríklad p(x) je pre ne vyjadrené vzorcami rovnakého tvaru, ktoré sa líšia iba jednou alebo viacerými konštantami. Tieto konštanty sa nazývajú distribučné parametre.

Aj keď v zásade najviac rôzne zákony distribúcie, tu sa budú brať do úvahy niektoré z najtypickejších zákonov. Je dôležité venovať pozornosť podmienkam, za ktorých vznikajú, parametrom a vlastnostiam týchto rozvodov.

jeden . Rovnomerné rozdelenie
Toto je názov distribúcie náhodnej premennej, ktorá môže nadobúdať ľubovoľné hodnoty v intervale (a,b) a pravdepodobnosť pádu do ktoréhokoľvek segmentu vo vnútri (a,b) je úmerná dĺžke segmentu a nezávisí od jeho polohy a pravdepodobnosť hodnôt mimo (a,b) sa rovná 0.


Obr 6.1 Funkcia a hustota rovnomerného rozdelenia

Distribučné parametre: a , b

2. Normálne rozdelenie
Distribúcia s hustotou opísaná vzorcom

(6.1)

nazývaný normálny.
Distribučné parametre: a , σ


Obrázok 6.2 Typický pohľad na funkciu hustoty a normálneho rozdelenia

3. Bernoulliho distribúcia
Ak sa vykoná séria nezávislých pokusov, v ktorých sa každý jav A môže objaviť s rovnakou pravdepodobnosťou p, potom počet výskytov udalosti je náhodná premenná rozložená podľa Bernoulliho zákona alebo podľa binomického zákona. (iný distribučný názov).

Tu n je počet pokusov v sérii, m je náhodná premenná (počet výskytov udalosti A), P n (m) je pravdepodobnosť, že A sa stane presne m-krát, q \u003d 1 - p ( pravdepodobnosť, že sa A v teste neobjaví).

Príklad 1: Kockou sa hodí 5-krát, aká je pravdepodobnosť, že dvakrát padne 6?
n = 5, m = 2, p = 1/6, q = 5/6

Parametre distribúcie: n, s

štyri . Poissonovo rozdelenie
Poissonovo rozdelenie získame ako limitný prípad Bernoulliho rozdelenia, ak p smeruje k nule a n smeruje k nekonečnu, ale takým spôsobom, že ich súčin zostáva konštantný: np = a. Formálne také prechod na limit vedie k vzorcu

Distribučný parameter: a

Poissonovo rozdelenie podlieha mnohým náhodným premenným, s ktorými sa stretávame vo vede a praktickom živote.

Príklad 2: Počet hovorov prijatých na ambulancii za hodinu.
Rozdeľme časový interval T (1 hodina) na malé intervaly dt tak, že pravdepodobnosť prijatia dvoch alebo viacerých hovorov počas dt je zanedbateľná a pravdepodobnosť jedného hovoru p je úmerná dt: p = μdt ;
pozorovanie v momentoch dt budeme považovať za nezávislé pokusy, počet takýchto pokusov za čas T: n = T / dt;
ak predpokladáme, že pravdepodobnosti prijímania hovorov sa počas hodiny nemenia, tak celkový počet volá sa riadi Bernoulliho zákonom s parametrami: n = T / dt, p = μdt. Ak necháme dt smerovať k nule, dostaneme, že n smeruje k nekonečnu a súčin n × p zostáva konštantný: a = n × p = μT.

Príklad 3: počet molekúl ideálny plyn v nejakom pevnom zväzku V.
Rozdeľme objem V na malé objemy dV tak, že pravdepodobnosť nájdenia dvoch alebo viacerých molekúl v dV je zanedbateľná a pravdepodobnosť nájdenia jednej molekuly je úmerná dV: р = μdV; pozorovanie každého objemu dV budeme považovať za nezávislý test počet takýchto testov n=V/dV; ak predpokladáme, že pravdepodobnosti nájdenia molekuly kdekoľvek vo vnútri V sú rovnaké, celkový počet molekúl v objeme V sa riadi Bernoulliho zákonom s parametrami: n = V / dV, p = μdV. Ak necháme dV smerovať k nule, dostaneme, že n smeruje k nekonečnu a súčin n × p zostáva konštantný: a = n × p = μV.

Numerické charakteristiky náhodných premenných

jeden . matematické očakávania (priemerná hodnota)

Definícia:
Matematické očakávanie je
  (6.4)

Súčet preberá všetky hodnoty, ktoré náhodná premenná nadobúda. Séria musí byť absolútne konvergentná (inak sa hovorí, že náhodná premenná nemá žiadne matematické očakávania)

;   (6.5)

Integrál musí byť absolútne konvergentný (inak sa hovorí, že náhodná premenná nemá očakávanú hodnotu)


Vlastnosti matematického očakávania:

a. Ak s - konštantný potom MS = C
b. Mx = Smx
c. Matematické očakávanie súčtu náhodných premenných sa vždy rovná súčtu ich matematických očakávaní: М(х+y) = Мх + Мy d . Zavádza sa pojem podmieneného matematického očakávania. Ak náhodná premenná nadobúda svoje hodnoty x i s rôznymi pravdepodobnosťami p(x i /H j) at rozdielne podmienky H j , potom sa určí podmienené očakávanie

ako alebo ;   (6.6)

Ak sú známe pravdepodobnosti udalostí H j, úplná

očakávaná hodnota: ;   (6.7)

Príklad 4: Koľkokrát si v priemere musíte hodiť mincou, kým sa objaví prvý erb? Tento problém sa dá vyriešiť „na čelo“

x i 1 2 3 ... k..
p(x i):  ,

ale túto sumu je ešte potrebné vypočítať. Môžete to urobiť jednoduchšie pomocou konceptov podmieneného a úplného matematického očakávania. Uvažujme hypotézy H 1 - erb vypadol prvýkrát, H 2 - nevypadol prvýkrát. Je zrejmé, že p (H 1) \u003d p (H2) \u003d ½; Mx / H 1 \u003d 1;
Mx / H 2 je o 1 viac ako požadované úplné očakávanie, pretože po prvom hode mincou sa situácia nezmenila, ale raz už hodená bola. Pomocou vzorca úplného matematického očakávania máme Mx \u003d Mx / H 1 × p (H 1) + Mx / H 2 × p (H 2) \u003d 1 × 0,5 + (Mx + 1) × 0,5, riešenie rovnicu pre Mx, okamžite dostaneme Mx = 2.

e. Ak je f(x) funkciou náhodnej premennej x, potom je pojem matematického očakávania funkcie náhodnej premennej definovaný:

Pre diskrétnu náhodnú premennú: ;   (6.8)

Súčet preberá všetky hodnoty, ktoré náhodná premenná nadobúda. Séria musí byť absolútne konvergentná.

Pre spojitú náhodnú premennú: ;   (6.9)

Integrál musí byť absolútne konvergentný.

2. Rozptyl náhodnej premennej
Definícia:
Disperzia náhodnej premennej x je matematické očakávanie druhej mocniny odchýlky hodnoty veličiny od jej matematického očakávania: Dx = M(x-Mx) 2

Pre diskrétnu náhodnú premennú: ;   (6.10)

Súčet preberá všetky hodnoty, ktoré náhodná premenná nadobúda. Séria musí byť konvergentná (inak sa hovorí, že náhodná premenná nemá žiadny rozptyl)

Pre spojitú náhodnú premennú: ;   (6.11)

Integrál musí konvergovať (inak sa hovorí, že náhodná premenná nemá žiadny rozptyl)

Disperzné vlastnosti:
a. Ak je C konštantná hodnota, potom DC = 0
b. DСх = С 2 Dх
c. Rozptyl súčtu náhodných premenných sa vždy rovná súčtu ich rozptylov iba vtedy, ak sú tieto premenné nezávislé (definícia nezávislých premenných)
d. Na výpočet rozptylu je vhodné použiť vzorec:

Dx = Mx 2 - (Mx) 2 (6,12)

Vzťah číselných charakteristík
a parametre typických distribúcií

distribúciamožnostivzorecMxDx
uniformaa , b (b+a) / 2(b-a) 2/12
normálnea, σ aσ2
Bernoullin,p npnpq
jeda aa

V praxi je väčšina náhodných premenných ovplyvnená o veľké množstvo náhodné faktory, poslúchajte normálny zákon rozdelenia pravdepodobnosti. Preto v rôznych aplikáciách teórie pravdepodobnosti má tento zákon mimoriadny význam.

Náhodná premenná $X$ sa riadi zákonom normálneho rozdelenia pravdepodobnosti, ak má hustota rozdelenia pravdepodobnosti nasledujúci tvar

$$f\left(x\right)=((1)\over (\sigma \sqrt(2\pi )))e^(-(((\left(x-a\right))^2)\over ( 2(\sigma )^2)))$$

Schematicky je na obrázku znázornený graf funkcie $f\left(x\right)$ a má názov „Gaussova krivka“. Napravo od tohto obrázka je nemecká 10-marková bankovka, ktorá sa používala ešte pred zavedením eura. Ak sa pozriete pozorne, môžete na tejto bankovke vidieť Gaussovu krivku a jej objaviteľa najväčší matematik Carl Friedrich Gauss.

Vráťme sa k našej funkcii hustoty $f\left(x\right)$ a vysvetlime si parametre rozdelenia $a,\ (\sigma )^2$. Parameter $a$ charakterizuje stred rozptylu hodnôt náhodnej premennej, to znamená, že má význam matematického očakávania. Keď sa zmení parameter $a$ a parameter $(\sigma )^2$ zostane nezmenený, môžeme pozorovať posun grafu funkcie $f\left(x\right)$ po vodorovnej osi, pričom hustota samotný graf nemení svoj tvar.

Parameter $(\sigma )^2$ je rozptyl a charakterizuje tvar krivky hustoty $f\left(x\right)$. Pri zmene parametra $(\sigma )^2$ s nezmeneným parametrom $a$ môžeme pozorovať, ako graf hustoty mení svoj tvar, zmenšuje sa alebo naťahuje, pričom sa neposúva pozdĺž úsečky.

Pravdepodobnosť normálne rozloženej náhodnej premennej spadajúcej do daného intervalu

Ako je známe, pravdepodobnosť, že náhodná premenná $X$ spadá do intervalu $\left(\alpha ;\ \beta \right)$, sa dá vypočítať $P\left(\alpha< X < \beta \right)=\int^{\beta }_{\alpha }{f\left(x\right)dx}$. Для нормального распределения случайной величины $X$ с параметрами $a,\ \sigma $ справедлива следующая формула:

$$P\vľavo(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right)$$

Tu je funkcia $\Phi \left(x\right)=((1)\over (\sqrt(2\pi )))\int^x_0(e^(-t^2/2)dt)$ Laplaceova funkcia. Hodnoty tejto funkcie sú prevzaté z . Možno si všimnúť nasledujúce vlastnosti funkcie $\Phi \left(x\right)$.

1 . $\Phi \left(-x\right)=-\Phi \left(x\right)$, teda funkcia $\Phi \left(x\right)$ je nepárna.

2 . $\Phi \left(x\right)$ je monotónne rastúca funkcia.

3 . $(\mathop(lim)_(x\to +\infty ) \Phi \left(x\right)\ )=0,5$, $(\mathop(lim)_(x\to -\infty ) \ Phi \ vľavo(x\vpravo)\ )=-0,5 $.

Na výpočet hodnôt funkcie $\Phi \left(x\right)$ môžete použiť aj sprievodcu funkciou $f_x$ balíka Excel: $\Phi \left(x\right)=NORMDIST\left (x;0;1;1\vpravo )-0,5 $. Napríklad vypočítajme hodnoty funkcie $\Phi \left(x\right)$ pre $x=2$.

Pravdepodobnosť, že normálne rozdelená náhodná premenná $X\in N\left(a;\ (\sigma )^2\right)$ spadá do intervalu symetrického vzhľadom na očakávanie $a$, sa dá vypočítať pomocou vzorca

$$P\vľavo(\vľavo|X-a\vpravo|< \delta \right)=2\Phi \left({{\delta }\over {\sigma }}\right).$$

Pravidlo troch sigma. Je prakticky isté, že normálne rozdelená náhodná premenná $X$ spadá do intervalu $\left(a-3\sigma ;a+3\sigma \right)$.

Príklad 1 . Náhodná premenná $X$ podlieha zákonu normálneho rozdelenia pravdepodobnosti s parametrami $a=2,\ \sigma =3$. Nájdite pravdepodobnosť, že $X$ spadá do intervalu $\left(0,5;1\right)$ a pravdepodobnosť, že nerovnosť $\left|X-a\right|< 0,2$.

Pomocou vzorca

$$P\vľavo(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right),$$

nájsť $P\left(0,5;1\right)=\Phi \left(((1-2)\over (3))\right)-\Phi \left(((0,5-2)\ nad (3))\vpravo)=\Phi \vľavo(-0,33\vpravo)-\Phi \vľavo(-0,5\vpravo)=\Phi \ľavo(0,5\vpravo)-\Phi \ vľavo (0,33\vpravo) =0,191-0,129=0,062 USD.

$$P\vľavo(\vľavo|X-a\vpravo|< 0,2\right)=2\Phi \left({{\delta }\over {\sigma }}\right)=2\Phi \left({{0,2}\over {3}}\right)=2\Phi \left(0,07\right)=2\cdot 0,028=0,056.$$

Príklad 2 . Predpokladajme, že cena akcií určitej spoločnosti je v priebehu roka náhodnou premennou rozloženou podľa bežného zákona s matematickým očakávaním rovným 50 konvenčným peňažným jednotkám a štandardnou odchýlkou ​​rovnou 10. Aká je pravdepodobnosť, že pri náhodnom zvoleného dňa prejednávaného obdobia, cena za akciu bude:

a) viac ako 70 konvenčných peňažných jednotiek?

b) menej ako 50 na akciu?

c) medzi 45 a 58 podmienečným peňažných jednotiek na akciu?

Nech je náhodná premenná $X$ cena akcií nejakej spoločnosti. Podľa podmienky $X$ podlieha normálnemu rozdeleniu s parametrami $a=50$ - matematické očakávanie, $\sigma =10$ - smerodajná odchýlka. Pravdepodobnosť $P\left(\alpha< X < \beta \right)$ попадания $X$ в интервал $\left(\alpha ,\ \beta \right)$ будем находить по формуле:

$$P\vľavo(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right).$$

$$a)\ P\left(X>70\right)=\Phi \left(((\infty -50)\over (10))\right)-\Phi \left(((70-50)\ viac ako (10)\vpravo)=0,5-\Phi \ľavo(2\vpravo)=0,5-0,4772=0,0228,$$

$$b)\ P\left(X< 50\right)=\Phi \left({{50-50}\over {10}}\right)-\Phi \left({{-\infty -50}\over {10}}\right)=\Phi \left(0\right)+0,5=0+0,5=0,5.$$

$$c)\ P\vľavo(45< X < 58\right)=\Phi \left({{58-50}\over {10}}\right)-\Phi \left({{45-50}\over {10}}\right)=\Phi \left(0,8\right)-\Phi \left(-0,5\right)=\Phi \left(0,8\right)+\Phi \left(0,5\right)=$$

Napriek exotickým názvom sú bežné distribúcie navzájom prepojené celkom intuitívne a zaujímavé spôsoby vďaka ktorým je ľahké si ich zapamätať a hovoriť o nich sebavedomo. Niektoré prirodzene vyplývajú napríklad z Bernoulliho distribúcie. Je čas ukázať mapu týchto spojení.

Každá distribúcia je ilustrovaná príkladom funkcie hustoty distribúcie (DDF). Tento článok je len o tých distribúciách, ktorých výsledky sú - jednotlivé čísla. Preto, horizontálna os každý graf je súborom možných čísel-výsledkov. Vertikálne - pravdepodobnosť každého výsledku. Niektoré distribúcie sú diskrétne – ich výsledky musia byť celé čísla, napríklad 0 alebo 5. Sú označené riedkymi čiarami, jednou pre každý výsledok, s výškou zodpovedajúcou pravdepodobnosti tohto výsledku. Niektoré sú nepretržité, ich výsledky môžu trvať akékoľvek číselná hodnota ako napríklad -1,32 alebo 0,005. Tieto sú znázornené ako husté krivky s oblasťami pod časťami krivky, ktoré dávajú pravdepodobnosti. Súčet výšok čiar a plôch pod krivkami je vždy 1.

Vytlačte si ho, odrežte pozdĺž bodkovanej čiary a noste so sebou v peňaženke. Toto je váš sprievodca krajinou distribúcie a ich príbuznými.

Bernoulli a uniforma

Vyššie ste sa už stretli s Bernoulliho distribúciou s dvoma výsledkami – hlavami alebo chvostmi. Teraz si to predstavte ako rozdelenie cez 0 a 1, 0 sú hlavy a 1 sú chvosty. Ako je už jasné, oba výsledky sú rovnako pravdepodobné, a to sa odráža v diagrame. Bernoulliho PDF obsahuje dva riadky rovnakú výškučo predstavuje 2 rovnako pravdepodobné výsledky: 0 a 1, v tomto poradí.

Bernoulliho rozdelenie môže tiež predstavovať nerovnaké výsledky, ako napríklad hodenie nesprávnou mincou. Potom pravdepodobnosť hláv nebude 0,5, ale nejaká iná hodnota p, a pravdepodobnosť chvostov bude 1-p. Rovnako ako mnohé iné distribúcie, je to vlastne celá rodina distribúcií s určitými parametrami, ako napríklad p vyššie. Keď si myslíte "Bernoulli" - myslite na "hodenie (možno nesprávnej) mince."

Preto veľmi malý krok pred prezentovaním rozdelenia niekoľkých ekvipravdepodobných výsledkov: rovnomerné rozloženie charakterizované plochým PDF. Reprezentovať správne kocky. Jeho výsledky 1-6 sú rovnako pravdepodobné. Dá sa nastaviť pre ľubovoľný počet výsledkov n a dokonca aj ako spojité rozdelenie.

myslieť na Rovnomerné rozdelenie ako „správna kocka“.

Binomické a hypergeometrické

Binomické rozdelenie si možno predstaviť ako súčet výsledkov tých vecí, ktoré nasledujú po Bernoulliho rozdelení.

Hoďte si dvakrát poctivou mincou – koľkokrát to budú hlavy? Toto je číslo, ktoré sa riadi binomickým rozdelením. Jeho parametre sú n, počet pokusov a p je pravdepodobnosť „úspechu“ (v našom prípade hlavy alebo 1). Každý hod je Bernoulliho distribuovaný výsledok alebo test. Binomické rozdelenie použite pri počítaní počtu úspechov vo veciach, ako je hod mincou, kde je každý hod nezávislý od ostatných a má rovnakú pravdepodobnosť úspechu.

Alebo si predstavte urnu s rovnakým počtom bielych a čiernych guľôčok. Zatvorte oči, vytiahnite loptu, zapíšte si jej farbu a vráťte ju späť. Opakujte. Koľkokrát bola vytiahnutá čierna guľa? Toto číslo tiež sleduje binomické rozdelenie.

Toto zvláštna situácia sme zaviedli, aby sme uľahčili pochopenie významu hypergeometrického rozdelenia. Ide o rozdelenie rovnakého čísla, ale v situácii, ak by sme nie vrátiť loptičky. To určite sesternica binomické rozdelenie, ale nie rovnaké, keďže pravdepodobnosť úspechu sa mení s každou vytiahnutou loptičkou. Ak je počet loptičiek dostatočne veľký v porovnaní s počtom žrebov, potom sú tieto rozdelenia takmer rovnaké, pretože šanca na úspech sa pri každom žrebovaní veľmi málo mení.

Keď niekto hovorí o vyťahovaní loptičiek z urien bez toho, aby sa vrátili, je takmer vždy bezpečné povedať „áno, hypergeometrické rozloženie“, pretože v živote som ešte nestretol nikoho, kto by skutočne naplnil urny loptičkami a potom ich vybral a vrátil nimi, alebo naopak. Nemám ani kamarátov s urnami. Ešte častejšie by sa toto rozdelenie malo objaviť pri výbere významnej podskupiny nejakej všeobecnej populácie ako vzorky.

Poznámka. preklad.

Možno to tu nie je veľmi jasné, ale od tutoriálu a expresného kurzu pre začiatočníkov by to bolo potrebné vysvetliť. Populácia je niečo, čo chceme štatisticky vyhodnotiť. Pre odhad vyberieme určitú časť (podmnožinu) a urobíme na nej požadovaný odhad (vtedy sa táto podmnožina nazýva vzorka), pričom predpokladáme, že odhad bude podobný pre celú populáciu. Aby to však bola pravda, často sú potrebné ďalšie obmedzenia na definíciu podmnožiny vzorky (alebo naopak, zo známej vzorky musíme vyhodnotiť, či dostatočne presne opisuje populáciu).

Praktický príklad – na cestu na E3 potrebujeme vybrať zástupcov zo 100-člennej spoločnosti. Je známe, že minulý rok v ňom cestovalo už 10 ľudí (ale nikto nie je uznaný). Koľko minima treba vziať, aby v skupine bol pravdepodobne aspoň jeden skúsený súdruh? V tomto prípade populácia- 100, výber - 10, požiadavky na výber - aspoň jeden, ktorý už cestoval na E3.

Wikipedia má menej vtipný, ale praktickejší príklad chybných častí v dávke.

jed

Čo sa týka počtu volajúcich zákazníkov horúcu linku na technickú podporu každú minútu? Ide o výsledok, ktorého rozdelenie je na prvý pohľad binomické, ak každú sekundu považujeme za Bernoulliho pokus, počas ktorého zákazník buď nevolá (0), alebo volá (1). Ale energetické organizácie veľmi dobre vedia: keď je elektrina vypnutá, za sekundu môžu zavolať dvaja ľudia. alebo dokonca viac ako sto z ľudí. Nepomáha ani prezentovať to ako 60 000 milisekúnd pokusov – existuje viac pokusov, pravdepodobnosť hovoru za milisekundu je menšia, aj keď nepočítate dva alebo viac súčasne, ale technicky to stále nie je Bernoulliho test. Logické uvažovanie však pracuje s prechodom do nekonečna. Nech n ide do nekonečna a p ide do 0, takže np je konštantné. Je to ako delenie na menšie a menšie časti času s menšou a menšou šancou na zavolanie. V limite dostaneme Poissonovo rozdelenie.

Rovnako ako binomické rozdelenie, Poissonovo rozdelenie je rozdelenie množstva: koľkokrát sa niečo stalo. Nie je parametrizovaná pravdepodobnosťou p a počtom pokusov n, ale priemernou intenzitou λ, ktorá je analogicky s binomikou jednoducho konštantná hodnota n.p. Poissonova distribúcia je čo nevyhnutné pamätajte, keď príde na počítanie udalostí pre určitý čas pri konštantnej danej intenzite.

Keď príde niečo ako pakety prichádzajúce k smerovaču, zákazníci sa objavia v obchode alebo niečo čakajúce v rade, spomeňte si na Poissona.

Geometrická a záporná dvojčlenka

Od jednoduché testy Bernoulliho sa objavuje ďalšia distribúcia. Koľkokrát padne minca na chvost, kým sa dostane hore? Počet chvostov sleduje geometrické rozdelenie. Podobne ako Bernoulliho rozdelenie je parametrizované pravdepodobnosťou úspešného výsledku, s. Nie je parametrizovaný číslom n, počtom pokusov, pretože počet neúspešných pokusov je presne výsledkom.

Ak je binomické rozdelenie "koľko úspechov", potom geometrické rozdelenie je "Koľko zlyhaní pred úspechom?".

Záporné binomické rozdelenie je jednoduchým zovšeobecnením predchádzajúceho. Toto je počet zlyhaní pred r, nie 1 úspechmi. Preto sa dodatočne parametrizuje týmto r. Niekedy sa popisuje ako počet úspechov pred r zlyhaniami. Ale ako hovorí môj životný kouč: „Vy rozhodujete, čo je úspech a čo neúspech“, tak je to rovnaké, ak nezabudnete, že pravdepodobnosť p musí správna pravdepodobnosťúspech alebo neúspech, resp.

Ak potrebujete vtip na uvoľnenie napätia, môžete spomenúť, že binomické a hypergeometrické distribúcie sú očividný pár, ale geometrické a záporné binomické distribúcie sú tiež dosť podobné, a potom povedzte: „No, kto ich všetky tak nazýva, hej? “

Exponenciálna a Weibullova

Opäť o volaniach na technickú podporu: ako dlho bude trvať, kým bude ďalší hovor? Rozdelenie tohto čakacieho času sa zdá byť geometrické, pretože každá sekunda, kým nikto nezavolá, je ako zlyhanie, až do druhej, kým sa nakoniec hovor neuskutoční. Počet zlyhaní je ako počet sekúnd, kým nikto nezavolal, a toto je praktickyčas do ďalšieho hovoru, ale nám „prakticky“ nestačí. Pointa je, že tento čas bude súčtom celých sekúnd, a teda nebude možné vypočítať čakanie v rámci tejto sekundy až do samotného hovoru.

No, ako predtým, ideme do geometrické rozdelenie do limitu, pokiaľ ide o časové podiely - a voila. Získame exponenciálne rozdelenie, ktoré presne popisuje čas pred hovorom. to nepretržitá distribúcia, máme prvý, pretože výsledok nemusí byť nevyhnutne v celých sekundách. Podobne ako Poissonovo rozdelenie je parametrizované intenzitou λ.

Poissonovo „koľko udalostí za čas“ odráža spojenie medzi binomickým a geometrickým. súvisí s exponenciálnym „ako dlho pred udalosťou?“. Ak existujú udalosti, ktorých počet za jednotku času zodpovedá Poissonovmu rozdeleniu, potom čas medzi nimi podlieha exponenciálnemu rozdeleniu s rovnakým parametrom λ. Táto korešpondencia medzi týmito dvoma distribúciami musí byť zaznamenaná, keď sa diskutuje o ktorejkoľvek z nich.

Exponenciálne rozdelenie by malo prísť na myseľ pri premýšľaní o „čase do udalosti“, možno „čase do zlyhania“. V skutočnosti je to taká dôležitá situácia, že existujú zovšeobecnené distribúcie na opis MTBF, ako napríklad Weibullova distribúcia. Zatiaľ čo exponenciálna distribúcia je vhodná, keď je miera opotrebovania alebo porúch napríklad konštantná, Weibullova distribúcia môže modelovať rastúcu (alebo klesajúcu) mieru zlyhania v priebehu času. Exponenciálny, vo všeobecnosti špeciálny prípad.

Myslite na Weibulla, keď príde na MTBF.

Normálne, lognormálne, študentské a chí-kvadrát

Normálne alebo Gaussovo rozdelenie je pravdepodobne jedným z najdôležitejších. Jeho zvonovitý tvar je okamžite rozpoznateľný. Ako , toto je obzvlášť zvedavá entita, ktorá sa prejavuje všade, dokonca aj nanajvýš zvonka jednoduché zdroje. Vezmite súbor hodnôt, ktoré sa riadia rovnakým rozdelením - ľubovoľné! - a zložte ich. Rozdelenie ich súčtu podlieha (približne) normálne rozdelenie. Čím viac vecí je sčítaných, tým viac ich súčet zodpovedá normálnemu rozdeleniu (trik: rozdelenie členov musí byť predvídateľné, nezávislé, smeruje len k normálnemu). Že je to tak, napriek pôvodnej distribúcii, je úžasné.

Poznámka. preklad.

Prekvapilo ma, že autor nepíše o potrebe porovnateľnej škály sčítateľných rozdelení: ak jedno výrazne dominuje nad ostatnými, bude to mimoriadne zle konvergovať. A vo všeobecnosti nie je potrebná absolútna vzájomná nezávislosť, stačí slabá závislosť.

No asi je to na párty, ako napísal.


Toto sa nazýva „centrálna limitná veta“ a musíte vedieť, čo to je, prečo sa to tak volá a čo to znamená, inak sa tomu okamžite zasmejú.

Vo svojom kontexte normála súvisí so všetkými rozdeleniami. Aj keď je to v podstate spojené s rozdeľovaním všetkých súm. Súčet Bernoulliho pokusov sleduje binomické rozdelenie a so zvyšujúcim sa počtom pokusov sa toto binomické rozdelenie približuje a približuje k normálnemu rozdeleniu. Podobne je jeho príbuzným hypergeometrické rozdelenie. Poissonova distribúcia - limitná forma binomický - tiež sa približuje k normálu so zvýšením parametra intenzity.

Výsledky, ktoré nasledujú lognormálne rozdelenie, dávajú hodnoty, ktorých logaritmus je normálne rozdelený. Alebo iným spôsobom: exponent normálne rozloženej hodnoty je lognormálne rozdelený. Ak sú sumy rozdelené normálne, nezabudnite, že produkty sú rozdelené normálne.

Študentovo t-rozdelenie je základom t-testu, ktorý študuje mnoho neštatistikov v iných odboroch. Používa sa na vytvorenie predpokladov o strednej hodnote normálneho rozdelenia a tiež smeruje k normálnemu rozdeleniu, keď sa jeho parameter zvyšuje. Výrazná vlastnosť T-distribúcia je jeho chvosty, ktoré sú hrubšie ako tie pri normálnom rozdelení.

Ak anekdota s tučným chvostom vášho suseda dostatočne neotriasla, prejdite na celkom vtipnú rozprávku o pive. Pred viac ako 100 rokmi použil Guinness štatistiky na zlepšenie svojej sily. Potom William Seely Gosset vynašiel úplne nový štatistická teória na zlepšenie pestovania jačmeňa. Gosset presvedčil šéfa, že iní pivovarníci nebudú rozumieť tomu, ako použiť jeho nápady, a dostal povolenie na jeho zverejnenie, ale pod pseudonymom „Študent“. Väčšina slávny úspech Gosset je práve táto t-distribúcia, ktorá, dalo by sa povedať, je pomenovaná po ňom.

Nakoniec, chí-kvadrát rozdelenie je rozdelenie súčtov druhých mocnín normálne rozdelených veličín. Na tomto rozdelení je postavený test chí-kvadrát, ktorý je založený na súčte kvadrátov rozdielov, ktoré by mali byť normálne rozdelené.

Gamma a beta

V tomto bode, ak už hovoríte o niečom chí-kvadrát, konverzácia začína vážne. Pravdepodobne už hovoríte so skutočnými štatistikami a pravdepodobne sa už oplatí pokloniť sa, pretože sa môžu objaviť veci ako gama distribúcia. Toto je zovšeobecnenie a exponenciálny a chí-kvadrát rozdelenie. Podobne ako exponenciálne rozdelenie sa používa pre komplexné modely latencie. Napríklad gama rozdelenie sa objaví, keď sa simuluje čas do ďalších n udalostí. Objavuje sa v strojové učenie ako "konjugovaný pred" k niekoľkým iným distribúciám.

Nepúšťajte sa do konverzácie o týchto konjugovaných distribúciách, ale ak áno, nezabudnite spomenúť beta distribúciu, pretože je to konjugovaná predchádzajúca väčšina tu spomínaných distribúcií. Dátoví vedci sú si istí, že presne na to bol vyrobený. Nechtiac to spomeňte a choďte k dverám.

Počiatok múdrosti

Rozdelenie pravdepodobnosti je niečo, o čom nemôžete vedieť príliš veľa. Skutoční záujemcovia sa môžu pozrieť na túto super podrobnú mapu všetkých rozdelení pravdepodobnosti Pridať značky

Ako je známe, náhodná premenná volal premenlivý, ktorý môže nadobudnúť určité hodnoty v závislosti od prípadu. Náhodné premenné označujú veľké písmená latinská abeceda(X, Y, Z) a ich hodnoty v príslušných malých písmenách (x, y, z). Náhodné veličiny sa delia na nespojité (diskrétne) a spojité.

Diskrétna náhodná premenná sa nazýva náhodná premenná, ktorá má iba konečnú alebo nekonečnú (spočítateľnú) množinu hodnôt s určitými nenulovými pravdepodobnosťami.

Zákon rozdelenia diskrétnej náhodnej premennej je funkcia, ktorá spája hodnoty náhodnej premennej s ich zodpovedajúcimi pravdepodobnosťami. Distribučný zákon možno špecifikovať jedným z nasledujúcich spôsobov.

1 . Distribučný zákon môže byť daný tabuľkou:

kde λ>0, k = 0, 1, 2, ….

v) používaním distribučná funkcia F(x) , ktorý určuje pre každú hodnotu x pravdepodobnosť, že náhodná premenná X nadobudne hodnotu menšiu ako x, t.j. F(x) = P(X< x).

Vlastnosti funkcie F(x)

3 . Rozdeľovací zákon je možné nastaviť graficky – distribučný polygón (polygón) (pozri úlohu 3).

Upozorňujeme, že na vyriešenie niektorých problémov nie je potrebné poznať distribučný zákon. V niektorých prípadoch stačí poznať jedno alebo viac čísel, ktoré odrážajú najviac dôležité vlastnosti distribučný zákon. Môže to byť číslo, ktoré má význam „priemernej hodnoty“ náhodnej premennej, alebo číslo, ktoré ukazuje priemerná veľkosť odchýlka náhodnej veličiny od jej strednej hodnoty. Čísla tohto druhu sa nazývajú číselné charakteristiky náhodnej premennej.

Hlavné číselné charakteristiky diskrétna náhodná premenná :

  • Matematické očakávanie (stredná hodnota) diskrétnej náhodnej premennej M(X) = Σ x i p i.
    Pre binomické rozdelenie M(X)=np, pre Poissonovo rozdelenie M(X)=λ
  • Disperzia diskrétna náhodná premenná D(X)=M2 alebo D(X) = M(X2) -2. Rozdiel X–M(X) sa nazýva odchýlka náhodnej premennej od jej matematického očakávania.
    Pre binomické rozdelenie D(X)=npq, pre Poissonovo rozdelenie D(X)=λ
  • Smerodajná odchýlka (štandardná odchýlka) σ(X)=√D(X).

Príklady riešenia úloh na tému "Zákon rozdelenia diskrétnej náhodnej premennej"

Úloha 1.

Vydané 1000 lotériové lístky: 5 z nich získa výhru vo výške 500 rubľov, 10 - výhru 100 rubľov, 20 - výhru 50 rubľov, 50 - výhru 10 rubľov. Určte zákon rozdelenia pravdepodobnosti náhodnej premennej X - výhry na tikete.

Riešenie. Podľa stavu problému je to možné nasledujúce hodnoty náhodná premenná X: 0, 10, 50, 100 a 500.

Počet tiketov bez výhry je 1000 - (5+10+20+50) = 915, potom P(X=0) = 915/1000 = 0,915.

Podobne nájdeme všetky ostatné pravdepodobnosti: P(X=0) = 50/1000=0,05, P(X=50) = 20/1000=0,02, P(X=100) = 10/1000=0,01, P(X = 500) = 5/1000 = 0,005. Výsledný zákon uvádzame vo forme tabuľky:

Nájdite matematické očakávanie X: M(X) = 1*1/6 + 2*1/6 + 3*1/6 + 4*1/6 + 5*1/6 + 6*1/6 = (1 + 2+3+4+5+6)/6 = 21/6 = 3,5

Úloha 3.

Zariadenie sa skladá z troch samostatne fungujúcich prvkov. Pravdepodobnosť zlyhania každého prvku v jednom experimente je 0,1. Zostavte distribučný zákon pre počet neúspešných prvkov v jednom experimente, vytvorte distribučný polygón. Nájdite distribučnú funkciu F(x) a nakreslite ju. Nájdite matematické očakávanie, rozptyl a smerodajnú odchýlku diskrétnej náhodnej premennej.

Riešenie. 1. Diskrétna náhodná premenná X=(počet neúspešných prvkov v jednom experimente) má nasledovné možné hodnoty: x 1 \u003d 0 (zlyhal žiadny z prvkov zariadenia), x 2 \u003d 1 (zlyhal jeden prvok), x 3 \u003d 2 (zlyhali dva prvky) a x 4 \u003d 3 (zlyhali tri prvky).

Poruchy prvkov sú na sebe nezávislé, pravdepodobnosti zlyhania každého prvku sú navzájom rovnaké, preto platí Bernoulliho vzorec . Vzhľadom na to, že pomocou podmienky n=3, p=0,1, q=1-p=0,9 určíme pravdepodobnosti hodnôt:
P 3 (0) \u003d C 3 0 p 0 q 3-0 \u003d q 3 \u003d 0,9 3 \u003d 0,729;
P 3 (1) \u003d C 3 1 p 1 q 3-1 \u003d 3 * 0,1 * 0,9 2 \u003d 0,243;
P 3 (2) \u003d C 3 2 p 2 q 3-2 \u003d 3 * 0,1 2 * 0,9 \u003d 0,027;
P 3 (3) \u003d C 3 3 p 3 q 3-3 \u003d p 3 \u003d 0,1 3 \u003d 0,001;
Kontrola: ∑p i = 0,729 + 0,243 + 0,027 + 0,001 = 1.

Požadovaný zákon binomického rozdelenia X má teda tvar:

Na osi x vynesieme možné hodnoty x i a na zvislú os zodpovedajúce pravdepodobnosti р i. Zostrojme body M 1 (0; 0,729), M 2 (1; 0,243), M 3 (2; 0,027), M 4 (3; 0,001). Spojením týchto bodov s úsečkami získame požadovaný distribučný polygón.

3. Nájdite distribučnú funkciu F(x) = P(X

Pre x ≤ 0 máme F(x) = P(X<0) = 0;
za 0< x ≤1 имеем F(x) = Р(Х<1) = Р(Х = 0) = 0,729;
za 1< x ≤ 2 F(x) = Р(Х<2) = Р(Х=0) + Р(Х=1) =0,729+ 0,243 = 0,972;
za 2< x ≤ 3 F(x) = Р(Х<3) = Р(Х = 0) + Р(Х = 1) + Р(Х = 2) = 0,972+0,027 = 0,999;
pre x > 3 bude F(x) = 1, pretože udalosť je istá.

Graf funkcie F(x)

4. Pre binomické rozdelenie X:
- matematické očakávanie М(X) = np = 3*0,1 = 0,3;
- disperzia D(X) = npq = 3 x 0,1 x 0,9 = 0,27;
- priemerný smerodajná odchýlkaσ(X) = √D(X) = √0,27 ≈ 0,52.