Distribuția geometrică. Distribuții discrete în MS EXCEL

Statistica ne vine în ajutor în rezolvarea multor probleme, de exemplu: când nu este posibil să construim un model determinist, când sunt prea mulți factori sau când trebuie să estimăm probabilitatea unui model construit ținând cont de datele disponibile. Relația cu statistica este ambiguă. Se crede că există trei tipuri de minciuni: minciuni, minciuni flagrante și statistici. Pe de altă parte, mulți „utilizatori” de statistici o cred prea mult, neînțelegând pe deplin cum funcționează: aplicând, de exemplu, un test oricărei date fără a-i verifica normalitatea. O astfel de neglijență poate genera erori grave și poate transforma „fanii” testului în urătorii statisticilor. Să încercăm să punem curenți peste i și să ne dăm seama ce modele de variabile aleatorii ar trebui folosite pentru a descrie anumite fenomene și ce fel de relație genetică există între ele.

În primul rând, acest material va fi de interes pentru studenții care studiază teoria probabilităților și statistica, deși specialiștii „maturi” îl vor putea folosi ca referință. Într-una dintre lucrările următoare, voi arăta un exemplu de utilizare a statisticilor pentru a construi un test pentru evaluarea semnificației indicatorilor strategiilor de tranzacționare la bursă.

Lucrarea va avea în vedere:


La finalul articolului va fi dat spre reflecție. Îmi voi împărtăși gândurile despre asta în următorul meu articol.

Unele dintre distribuțiile continue date sunt cazuri speciale.

Distribuții discrete

Distribuțiile discrete sunt folosite pentru a descrie evenimente cu caracteristici nediferențiabile definite în puncte izolate. Mai simplu spus, pentru evenimentele al căror rezultat poate fi atribuit unei categorii discrete: succes sau eșec, un număr întreg (de exemplu, un joc de ruletă, zaruri), capete sau cozi etc.

O distribuție discretă este descrisă de probabilitatea de apariție a fiecăruia dintre rezultatele posibile ale unui eveniment. Ca și pentru orice distribuție (inclusiv continuă), conceptele de așteptare și varianță sunt definite pentru evenimente discrete. Cu toate acestea, trebuie înțeles că așteptarea pentru un eveniment aleator discret este în general irealizabilă ca rezultat al unui singur eveniment aleator, ci mai degrabă ca o valoare la care media aritmetică a rezultatelor evenimentelor va tinde să crească pe măsură ce numărul acestora crește.

În modelarea evenimentelor aleatoare discrete, combinatoria joacă un rol important, deoarece probabilitatea rezultatului unui eveniment poate fi definită ca raportul dintre numărul de combinații care dau rezultatul dorit și numărul total de combinații. De exemplu: în coș sunt 3 bile albe și 7 negre. Când alegem 1 minge din coș, o putem face în 10 moduri diferite (număr total de combinații), dar doar 3 moduri în care este aleasă bila albă (3 combinații care dau rezultatul cerut). Astfel, probabilitatea de a alege o minge albă este: ().

De asemenea, este necesar să se facă distincția între probele cu înlocuire și cele fără înlocuire. De exemplu, pentru a descrie probabilitatea de a alege două bile albe, este important să se determine dacă prima minge va fi returnată în coș. Dacă nu, atunci avem de-a face cu un eșantion fără înlocuire () și probabilitatea va fi următoarea: - probabilitatea de a alege o minge albă din proba inițială înmulțită cu probabilitatea de a alege din nou o minge albă dintre cele rămase în coș. . Dacă prima minge este returnată în coș, atunci aceasta este o retur (). În acest caz, probabilitatea de a alege două bile albe este .

Dacă formalizăm ușor exemplul de coș după cum urmează: fie rezultatul unui eveniment să ia una dintre cele două valori 0 sau 1 cu probabilități și respectiv, atunci distribuția probabilității de a obține fiecare dintre rezultatele propuse va fi numită distribuția Bernoulli. :

În mod tradițional, un rezultat cu valoarea 1 se numește „succes”, iar un rezultat cu valoarea 0 se numește „eșec”. Este evident că obținerea rezultatului „succes sau eșec” are loc cu probabilitate.

Așteptările și varianța distribuției Bernoulli:


Numărul de succese în încercări, al căror rezultat este distribuit cu probabilitatea de succes (exemplu cu întoarcerea mingilor în coș), este descris de distribuția binomială:


Într-un alt mod, putem spune că distribuția binomială descrie suma variabilelor aleatoare independente care pot fi distribuite cu probabilitatea de succes.
Așteptări și variații:



Distribuția binomială este valabilă doar pentru eșantionarea cu reintrare, adică atunci când probabilitatea de succes rămâne constantă pentru întreaga serie de încercări.

Dacă mărimile și au distribuții binomiale cu parametrii și respectiv, atunci suma lor va fi distribuită și binomial cu parametrii .

Imaginați-vă o situație în care tragem bile din coș și le întoarcem înapoi până când este extrasă o minge albă. Numărul de astfel de operații este descris printr-o distribuție geometrică. Cu alte cuvinte: distribuția geometrică descrie numărul de încercări până la primul succes având în vedere probabilitatea de succes în fiecare încercare. Dacă numărul probei în care a avut loc succesul este implicit, atunci distribuția geometrică va fi descrisă prin următoarea formulă:


Așteptările și varianța distribuției geometrice:

Distribuția geometrică este legată genetic de o distribuție care descrie o variabilă aleatoare continuă: timpul înainte de un eveniment, cu o intensitate constantă a evenimentelor. Distribuția geometrică este, de asemenea, un caz special.

Distribuția Pascal este o generalizare a distribuției: descrie distribuția numărului de eșecuri în încercările independente, al căror rezultat este distribuit pe probabilitatea de succes înainte de suma succeselor. Pentru , obținem o distribuție a cantității .


unde este numărul de combinații de la până la .

Așteptările și varianța distribuției binomiale negative:



Suma variabilelor aleatoare independente distribuite după Pascal este de asemenea distribuită după Pascal: să aibă distribuție , și - . Să fie și independenți, atunci suma lor va avea distribuție

Până acum, am analizat exemple de eșantioane reintrante, adică probabilitatea unui rezultat nu se schimbă de la un proces la altul.

Acum luați în considerare situația fără înlocuire și descrieți probabilitatea numărului de eșantioane de succes din populație cu un număr prestabilit de succese și eșecuri (un număr predeterminat de bile albe și negre în coș, atuuri în pachet, părți defecte în joc etc.).

Lăsați colecția totală să conțină obiecte, dintre care sunt etichetate ca „1” și ca „0”. Vom considera selecția unui obiect cu eticheta „1” drept succes și cu eticheta „0” ca eșec. Să efectuăm n teste, iar obiectele selectate nu vor mai participa la teste ulterioare. Probabilitatea de succes va urma o distribuție hipergeometrică:


unde este numărul de combinații de la până la .

Așteptări și variații:


Distribuția Poisson


(luat de aici)

Distribuția Poisson diferă semnificativ de distribuțiile considerate mai sus în domeniul său de „subiect”: acum nu este luată în considerare probabilitatea unui anumit rezultat al testului, ci intensitatea evenimentelor, adică numărul mediu de evenimente pe unitatea de timp.

Distribuția Poisson descrie probabilitatea de apariție a evenimentelor independente în timp cu o intensitate medie a evenimentelor:


Așteptările și varianța distribuției Poisson:

Varianta și media distribuției Poisson sunt identic egale.

Distribuția Poisson în combinație cu , care descrie intervalele de timp dintre debutul evenimentelor independente, formează baza matematică a teoriei fiabilității.

Densitatea de probabilitate a produsului variabilelor aleatoare x și y () cu distribuții și poate fi calculată după cum urmează:

Unele dintre distribuțiile de mai jos sunt cazuri speciale ale distribuției Pearson, care, la rândul său, este o soluție a ecuației:


unde și sunt parametrii de distribuție. Există 12 tipuri de distribuție Pearson, în funcție de valorile parametrilor.

Distribuțiile care vor fi discutate în această secțiune au relații strânse între ele. Aceste conexiuni sunt exprimate prin faptul că unele distribuții sunt cazuri speciale ale altor distribuții sau descriu transformări ale variabilelor aleatoare cu alte distribuții.

Diagrama de mai jos prezintă relațiile dintre unele dintre distribuțiile continue care vor fi discutate în această lucrare. În diagramă, săgețile solide arată transformarea variabilelor aleatoare (începutul săgeții indică distribuția inițială, sfârșitul săgeții - cea rezultată), iar săgețile punctate arată relația de generalizare (începutul săgeții indică distribuția, care este un caz special al celui indicat de capătul săgeții). Pentru cazurile speciale ale distribuției Pearson deasupra săgeților punctate, este indicat tipul corespunzător al distribuției Pearson.


Prezentarea generală a distribuțiilor oferite mai jos acoperă multe cazuri care apar în analiza datelor și modelarea proceselor, deși, desigur, nu conține absolut toate distribuțiile cunoscute științei.

Distribuție normală (distribuție Gauss)


(luat de aici)

Densitatea de probabilitate a unei distribuții normale cu parametri și este descrisă de funcția Gaussiană:

Dacă și , atunci o astfel de distribuție se numește standard.

Așteptările și varianța distribuției normale:



Domeniul de definire al unei distribuții normale este mulțimea numerelor reale.

Distribuția normală este o distribuție de tip VI.

Suma pătratelor valorilor normale independente are , iar raportul valorilor gaussiene independente este distribuit peste .

Distribuția normală este infinit divizibilă: suma cantităților distribuite normal și cu parametri și respectiv are și o distribuție normală cu parametrii , unde și .

Puțul de distribuție normală modelează cantități care descriu fenomene naturale, zgomot de natură termodinamică și erori de măsurare.

În plus, conform teoremei limitei centrale, suma unui număr mare de termeni independenți de același ordin converge către o distribuție normală, indiferent de distribuțiile termenilor. Datorită acestei proprietăți, distribuția normală este populară în analiza statistică, multe teste statistice sunt concepute pentru date distribuite normal.

Testul z se bazează pe divizibilitatea infinită a distribuției normale. Acest test este folosit pentru a verifica dacă așteptarea unui eșantion de variabile distribuite normal este egală cu o anumită valoare. Valoarea varianței ar trebui să fie cunoscut. Dacă valoarea varianței este necunoscută și este calculată pe baza eșantionului analizat, atunci un test t bazat pe .

Să avem un eșantion de n valori independente distribuite normal din populația generală cu o abatere standard, să presupunem că . Atunci valoarea va avea o distribuție normală standard. Comparând valoarea z obținută cu cuantilele distribuției standard, se poate accepta sau respinge ipoteza cu nivelul de semnificație cerut.

Datorită prevalenței distribuției gaussiene, mulți cercetători care nu cunosc foarte bine statistica uită să verifice datele pentru normalitate, sau să evalueze graficul densității distribuției „cu ochi”, crezând orbește că au de-a face cu date gaussiene. În consecință, aplicarea cu îndrăzneală a testelor concepute pentru o distribuție normală și obținerea unor rezultate complet incorecte. Probabil, de aici a venit zvonul despre statistici ca fiind cel mai teribil tip de minciună.

Luați în considerare un exemplu: trebuie să măsurăm rezistența unui set de rezistențe de o anumită valoare. Rezistența are o natură fizică, este logic să presupunem că distribuția abaterilor rezistenței de la valoarea nominală va fi normală. Măsurăm, obținem o funcție de densitate de probabilitate în formă de clopot pentru valorile măsurate cu un mod în apropierea ratingului rezistenței. Este aceasta o distribuție normală? Dacă da, atunci vom căuta rezistențe defecte folosind , sau un test z dacă cunoaștem în avans variația distribuției. Cred că mulți vor face exact asta.

Dar să aruncăm o privire mai atentă asupra tehnologiei de măsurare a rezistenței: rezistența este definită ca raportul dintre tensiunea aplicată și fluxul de curent. Am măsurat curentul și tensiunea cu instrumente, care, la rândul lor, au erori normal distribuite. Adică, valorile măsurate ale curentului și tensiunii sunt variabile aleatoare distribuite normal cu așteptări matematice corespunzătoare valorilor adevărate ale mărimilor măsurate. Și aceasta înseamnă că valorile rezistenței obținute sunt distribuite de-a lungul și nu conform lui Gauss.

Distribuția descrie suma pătratelor variabilelor aleatoare, fiecare dintre acestea fiind distribuită conform legii normale standard:

Unde este numărul de grade de libertate, .

Așteptările și variația distribuției:



Domeniul de definiție este mulțimea numerelor naturale nenegative. este o distribuție infinit divizibilă. Dacă și - sunt distribuite și, respectiv, au și grade de libertate, atunci suma lor va fi de asemenea distribuită și va avea grade de libertate.

Este un caz special (și deci o distribuție de tip III) și o generalizare. Raportul cantităților distribuite peste repartizate peste .

Testul de bunătate a potrivirii lui Pearson se bazează pe distribuție. Acest criteriu poate fi folosit pentru a verifica dacă un eșantion dintr-o variabilă aleatoare aparține unei anumite distribuții teoretice.

Să presupunem că avem un eșantion de o variabilă aleatoare. Pe baza acestui eșantion, calculăm probabilitățile ca valorile să se încadreze în intervalele (). Să existe și o presupunere despre expresia analitică a distribuției, conform căreia, probabilitățile de a se încadra în intervalele selectate ar trebui să fie . Apoi cantitățile vor fi distribuite conform legii normale.

Aducem la distribuția normală standard: ,
unde si .

Mărimile obținute au o distribuție normală cu parametrii (0, 1) și, prin urmare, suma pătratelor lor este distribuită cu un grad de libertate. Scăderea gradului de libertate este asociată cu o restricție suplimentară asupra sumei probabilităților ca valorile să se încadreze în intervale: trebuie să fie egală cu 1.

Comparând valoarea cu cuantilele distribuției, se poate accepta sau respinge ipoteza despre distribuția teoretică a datelor cu nivelul de semnificație cerut.

Distribuția Student este utilizată pentru a efectua un test t: un test pentru egalitatea valorii așteptate a unui eșantion de variabile aleatoare distribuite la o anumită valoare sau egalitatea valorilor așteptate a două eșantioane cu aceeași varianță ( trebuie verificată egalitatea varianţelor). Distribuția t a lui Student descrie raportul dintre o variabilă aleatoare distribuită și o valoare distribuită pe .

Fie și variabile aleatoare independente cu grade de libertate și respectiv. Atunci cantitatea va avea o distribuție Fisher cu grade de libertate, iar cantitatea va avea o distribuție Fisher cu grade de libertate.
Distribuția Fisher este definită pentru argumente reale nenegative și are o densitate de probabilitate:


Așteptările și variația distribuției Fisher:



Așteptarea este definită pentru și varianța este definită pentru .

Un număr de teste statistice se bazează pe distribuția Fisher, cum ar fi evaluarea semnificației parametrilor de regresie, testul pentru heteroscedasticitate și testul pentru egalitatea varianțelor eșantionului (testul f, care trebuie distins de precis testul Fisher).

F-test: să fie două mostre independente și volume de date distribuite și respectiv. Să propunem o ipoteză despre egalitatea varianțelor eșantionului și să o testăm statistic.

Să calculăm valoarea. Va avea o distribuție Fisher cu grade de libertate.

Comparând valoarea cu cuantilele distribuției Fisher corespunzătoare, putem accepta sau respinge ipoteza conform căreia varianțele eșantionului sunt egale cu nivelul necesar de semnificație.

Distribuție exponențială (exponențială) și distribuție Laplace (exponențială dublă, exponențială dublă)


(luat de aici)

Distribuția exponențială descrie intervalele de timp dintre evenimente independente care au loc la o intensitate medie. Numărul de apariții ale unui astfel de eveniment într-o anumită perioadă de timp este descris prin discret . Distribuția exponențială împreună cu formează baza matematică a teoriei fiabilității.

Pe lângă teoria fiabilității, distribuția exponențială este utilizată în descrierea fenomenelor sociale, în economie, în teoria cozilor, în logistica transporturilor - oriunde este necesară modelarea fluxului de evenimente.

Distribuția exponențială este un caz special (pentru n=2) și, prin urmare, . Deoarece mărimea distribuită exponențial este o mărime chi-pătrat cu 2 grade de libertate, ea poate fi interpretată ca suma pătratelor a două mărimi independente distribuite normal.

De asemenea, distribuția exponențială este un caz onest

Lasă ținta să fie trasă înainte de prima lovitură, cu probabilitatea p lovirea țintei în fiecare lovitură este aceeași și nu depinde de rezultatele loviturilor anterioare. Cu alte cuvinte, schema Bernoulli este implementată în experimentul luat în considerare. Ca variabilă aleatorie X vom lua în considerare numărul de focuri trase. Evident, valorile posibile ale variabilei aleatoare X sunt numere naturale: X 1 =1, X 2 = 2, ... atunci probabilitatea ca k loviturile vor fi egale cu

Introducerea acestei formule k=1,2, ... obținem o progresie geometrică cu primul termen pși multiplicator q:

Din acest motiv, se numește distribuția definită prin formula (6.11). geometric .

Folosind formula pentru suma unei progresii geometrice infinit descrescătoare, este ușor de verificat

.

Să găsim caracteristicile numerice ale distribuției geometrice.

După definiția așteptărilor matematice pentru DSW, avem

.

Calculăm dispersia prin formula

.

Pentru aceasta găsim

.

Prin urmare,

.

Deci, așteptarea și varianța matematică a distribuției geometrice este

. (6.12)

6.4.* Funcția generatoare

La rezolvarea problemelor legate de DSV se folosesc adesea metode combinatorii. Una dintre cele mai dezvoltate metode teoretice de analiză combinatorie este metoda de generare a funcțiilor, care este una dintre cele mai puternice metode din aplicații. Să-l cunoaștem pe scurt.

Dacă variabila aleatoare  ia numai valori întregi nenegative, i.e.

,

apoi functie generatoare distribuția de probabilitate a unei variabile aleatoare  se numește funcție

, (6.13)

Unde z este o variabilă reală sau complexă. Rețineți că între setul de funcţii generatoare  ( X)și multe distribuții(P(= k)} există o corespondență unu-la-unu.

Fie variabila aleatoare  să aibă distribuție binomială

.

Apoi, folosind formula binomială a lui Newton, obținem

,

acestea. funcţia generatoare a distribuţiei binomiale are forma

. (6.14)

Addendum. Funcția generatoare de distribuție Poisson

are forma

. (6.15)

Funcția generatoare a distribuției geometrice

are forma

. (6.16)

Cu ajutorul funcțiilor de generare, este convenabil să găsiți principalele caracteristici numerice ale DSW. De exemplu, primul și al doilea moment inițial sunt legate de funcția generatoare prin următoarele egalități:

, (6.17)

. (6.18)

Metoda de generare a funcțiilor este adesea convenabilă deoarece în unele cazuri funcția de distribuție a DSW este foarte greu de determinat, în timp ce funcția de generare este uneori ușor de găsit. De exemplu, luați în considerare schema încercărilor Bernoulli independente consecutive, dar faceți o schimbare la aceasta. Fie probabilitatea evenimentului A variază de la test la test. Aceasta înseamnă că formula Bernoulli pentru o astfel de schemă devine inaplicabilă. Sarcina de a găsi funcția de distribuție în acest caz prezintă dificultăți considerabile. Cu toate acestea, pentru un circuit dat, funcția generatoare este ușor de găsit și, în consecință, caracteristicile numerice corespunzătoare sunt de asemenea ușor de găsit.

Utilizarea pe scară largă a funcțiilor generatoare se bazează pe faptul că studiul sumelor variabilelor aleatoare poate fi înlocuit cu studiul produselor funcțiilor generatoare corespunzătoare. Deci, dacă  1 ,  2 , …,  n independent, atunci

Lăsa p k =P k (A) este probabilitatea de „succes” în k- al-lea test în schema Bernoulli (respectiv, q k =1–p k- probabilitatea de „eşec” în k al-lea test). Apoi, în conformitate cu formula (6.19), funcția generatoare va avea forma

. (6.20)

Folosind această funcție de generare, putem scrie

.

Se ia in calcul aici ca p k + q k=1. Acum, folosind formula (6.1), găsim al doilea moment inițial. Pentru a face acest lucru, mai întâi calculăm

și
.

Într-un caz anume p 1 =p 2 =…=p n =p(adică în cazul unei distribuții binomiale) din formulele obținute rezultă că M= np, D= npq.

În distribuția geometrică se desfășoară experimente în schema Bernoulli până la primul succes, cu o probabilitate de succes p într-un singur experiment.
Exemple de astfel de valori pot fi:

  • numărul de lovituri înainte de prima lovitură;
  • numărul de teste ale dispozitivului înainte de prima defecțiune;
  • numărul de bile înainte de prima apariție a albului. vezi solutia;
  • numărul de aruncări ale unei monede înaintea primelor cozi etc.
Seria de distribuție geometrică a DSW are forma:
X 1 2 3 m
p p qp q 2 p q m-1 p

Probabilitățile formează o progresie geometrică cu primul termen p și numitorul q.
Așteptările matematice și varianța unei variabile aleatoare X, care are o distribuție geometrică cu parametrul p, sunt egale cu:

Distribuție hipergeometrică

O variabilă aleatoare discretă are o distribuție hipergeometrică cu parametrii n, k, m dacă ia valorile 0, 1, 2, ... cu probabilități .
Distribuția hipergeometrică are o variabilă aleatoare X egală cu numărul de obiecte cu o proprietate dată dintre m obiecte extrase aleatoriu (fără înlocuire) dintr-o mulțime de n obiecte, din care k au această proprietate.
De exemplu:
  • Într-un lot de 10 piese, 3 sunt defecte. 4 articole sunt eliminate. X este numărul de părți bune dintre cele extrase. (m = 4, n = 10, k = 3). vezi solutia
Așteptările matematice ale unei variabile aleatoare X, care are o distribuție hipergeometrică, și varianța acesteia sunt egale cu:

Exemplul #1. O urna contine 2 bile albe si 3 negre. Bilele sunt extrase la întâmplare din urnă fără înlocuire până când apare o bilă albă. De îndată ce se întâmplă acest lucru, procesul se oprește. Realizați un tabel de distribuție a unei variabile aleatoare X - numărul de experimente efectuate, găsiți F(x), P(X ≤ 2), M(X), D(X).
Soluţie: Notați cu A - aspectul unei mingi albe. Un experiment poate fi efectuat o singură dată dacă mingea albă apare imediat: . Dacă prima dată bila albă nu a apărut, ci a apărut în timpul celei de-a doua extrageri, atunci X=2. Probabilitatea unui astfel de eveniment este de . În mod similar: , , . Să scriem datele în tabel:


X

1

2

3

4

P

0,4

0,3

0,2

0,1

Găsiți F(x):

Găsiți P(X ≤ 2) = P(X = 1 sau X = 2) = 0,4 + 0,3 = 0,7
M(X) = 1 0,4 + 2 0,3 + 3 0,2 + 4 0,1 = 2.
D(X) = (1-2) 2 0,4 + (2-2) 2 0,3 + (3-2) 2 0,2 ​​+ (4-2) 2 0,1 = 1 .

Exemplul #2. Cutia contine 11 piese, dintre care 5 sunt defecte. Asamblatorul trage 4 piese la întâmplare.
1. Găsiți probabilitatea ca dintre părțile extrase: A) 4 defecte; b) unul defect; c) două defecte; d) cel puțin unul este defect.
2. Întocmește legea distribuției unei variabile aleatoare X- numarul de piese defecte dintre cele extrase.
3. Găsiți M(X), D(X), σ(X).
4. Calculați P(1
Soluţie:
1. Găsiți probabilitatea ca dintre părțile extrase:
A) 4 defecte;

b) unul defect;
Numărul total de rezultate elementare posibile pentru aceste studii este egal cu numărul de moduri în care pot fi extrase 4 părți din 11:

Să calculăm numărul de rezultate care favorizează acest eveniment (dintre 4 părți, exact 1 parte este defectă):

Cele 3 părți rămase pot fi selectate dintre 7:

Prin urmare, numărul de rezultate favorabile este: 5*20 = 100
Probabilitatea dorită este egală cu raportul dintre numărul de rezultate care favorizează evenimentul și numărul tuturor rezultatelor elementare: P(1) = 100/330 = 0,303
c) două defecte;

d) cel puțin unul este defect.
Probabilitatea să nu existe piese defecte. X = 0.

Atunci probabilitatea ca cel puțin un defect este:
P = 1 - P(0) = 1 - 0,0455 = 0,95

2. Alcătuiţi legea de distribuţie P(x), X - numărul de piese defecte dintre cele extrase.
Aflați probabilitatea a trei produse defecte.


X

0

1

2

3

4

P

0,0455

0,303

0,4545

0,182

0,015

2. Găsiți M(X), D(X),σ(X).
Aşteptarea matematică se găseşte prin formula m = ∑x i p i .
Așteptări matematice M[X].
M[x] = 0*0,0455 + 1*0,303 + 2*0,4545 + 3*0,182 + 4*0,015 = 1,818
Dispersia se găsește prin formula d = ∑x 2 i p i - M[x] 2 .
Dispersia D[X].
D[X] = 0 2 *0,0455 + 1 2 *0,303 + 2 2 *0,4545 + 3 2 *0,182 + 4 2 *0,015 - 1,818 2 = 0,694
Abaterea standard σ(x).

3. Calculați P(1 F(x≤0) = 0
F(0< x ≤1) = 0.0455
F(1< x ≤2) = 0.303 + 0.0455 = 0.349
F(2< x ≤3) = 0.455 + 0.349 = 0.803
F(3< x ≤4) = 0.182 + 0.803 = 0.985
F(x>4) = 1
Probabilitatea ca un SW să cadă într-un anumit interval se găsește prin formula:
P(a ≤ X< b) = F(b) - F(a)
Aflați probabilitatea ca SW să fie în intervalul 1 ≤ X< 4
P(1 ≤ X< 4) = F(4) - F(1) = 0.985 - 0.0455 = 0.9395

Exemplul #3. Sunt 7 piese in lot, 3 sunt defecte. Controlerul desenează 4 părți la întâmplare. Faceți o lege de distribuție pentru o variabilă aleatoare X - numărul de părți bune din eșantion. Aflați așteptările matematice și varianța X. Reprezentați grafic funcția de distribuție.
Total părți bune: 7-3 = 4
1. Găsiți probabilitatea ca dintre cele 4 părți selectate una să fie reparabilă.
Numărul total de rezultate elementare posibile pentru aceste studii este egal cu numărul de moduri în care pot fi extrase 4 părți din 7:

Să calculăm numărul de rezultate care favorizează acest eveniment.

Luați în considerare distribuția geometrică, calculați așteptarea și varianța ei matematică. Folosind funcția MS EXCEL OTRBINOM.DIST(), vom reprezenta graficul funcției de distribuție și al densității probabilității.

Distribuția geometrică(Engleză) Distribuția geometrică) este un caz special (pentru r=1).

Să fie efectuate teste, în fiecare dintre ele doar evenimentul „succes” poate apărea cu probabilitate p sau evenimentul „eşec” cu probabilitatea q =1-p().

Să definim X ca numărul procesului în care a fost înregistrat primul succes. În acest caz, variabila aleatoare X vom avea Distribuție geometrică:

Distribuția geometrică în MS EXCEL

În MS EXCEL, începând cu versiunea 2010, pt Negativ Distribuție binomială există o funcție NEGBINOM.DIST() , numele în limba engleză este NEGBINOM.DIST(), care vă permite să calculați probabilitatea de apariție numărul de eșecuri până când se obține un număr dat de succese pentru o probabilitate dată de succes.

Pentru distribuție geometrică al doilea argument al acestei funcții trebuie să fie 1, deoarece ne interesează doar primul succes.

Această definiție este ușor diferită de cea de mai sus, care calculează probabilitatea ca primul succes să apară după Xteste. Diferența se reduce la intervalul de modificare a intervalului X: dacă probabilitatea este definită în funcție de numărul de încercări, atunci X poate lua valori începând de la 1, iar dacă prin numărul de eșecuri, atunci începând de la 0. Prin urmare, următoarea formulă este valabilă: p(x_ eșecuri)=p(x_ teste-unu). Cm. fișă de fișier exemplu Exemplu, unde sunt date 2 metode de calcul.

Abordarea luată în funcția MS EXCEL este utilizată mai jos: prin numărul de defecțiuni.

A calcula funcția de densitate de probabilitate p(x), vezi formula de mai sus, trebuie să setați al patrulea argument din funcția INTBINOM.DIST() la FALSE. A calcula , trebuie să setați al patrulea argument la TRUE.

Notă : Înainte de MS EXCEL 2010, EXCEL avea o funcție INTERBINOMDIST() care vă permite să calculați numai probabilitate densitate. Fișierul eșantion conține o formulă bazată pe funcția INTBINOMDIST() de calculat funcția de distribuție integrală. Există și o formulă pentru calcularea probabilității prin definiție.

Fișierul exemplu conține grafice densitatea distribuției de probabilitateși funcția de distribuție integrală.

Notă: Pentru comoditatea scrierii formulelor pentru parametrul p, a .

Notă: În funcțiune DISTBINOM.DIST( ) cu valoare non-întreg X, . De exemplu, următoarele formule vor returna aceeași valoare:
DISTBINOM.DIST( 2 ; unu; 0,4; ADEVĂRAT)=
DISTBINOM.DIST( 2,9 ; unu; 0,4; ADEVĂRAT)

Sarcini

Soluțiile problemelor sunt date în fișier exemplu pe foaie Exemplu.

Sarcina 1. O companie petrolieră forează puțuri pentru a extrage petrol. Probabilitatea de a găsi petrol într-o sondă este de 20%.
Care este probabilitatea ca primul ulei să fie obținut la a treia încercare?
Care este probabilitatea ca să fie nevoie de trei încercări pentru a găsi primul ulei?
Soluția 1:
=INTERBINOM.DIST(3-1, 1, 0,2, FALSE)
=INTERBINOM.DIST(3-1, 1, 0,2, TRUE)

Sarcina 2. Agenția de rating face un sondaj asupra trecătorilor întâmplători din oraș despre marca lor preferată de mașini. Să se știe că 1% dintre cetățeni au o mașină preferată LadaGranta. Care este probabilitatea să întâlnești primul admirator al acestei mărci de mașini după un sondaj de 10 persoane?
Soluția 2: \u003d OTRBINOM.DIST (10-1, 1, 0,01; ADEVĂRAT)=9,56%

Putem evidenția cele mai comune legi ale distribuției variabilelor aleatoare discrete:

  • Legea distribuției binomiale
  • Legea distribuției Poisson
  • Legea distribuției geometrice
  • Legea distribuției hipergeometrice

Pentru distribuții date de variabile aleatoare discrete, calculul probabilităților valorilor acestora, precum și al caracteristicilor numerice (așteptări matematice, varianță etc.) se efectuează conform anumitor „formule”. Prin urmare, este foarte important să cunoaștem aceste tipuri de distribuții și proprietățile lor de bază.


1. Legea distribuției binomiale.

O variabilă aleatoare discretă $X$ este supusă distribuției binomiale de probabilitate dacă ia valorile $0,\ 1,\ 2,\ \dots ,\ n$ cu probabilități $P\left(X=k\right)= C^k_n\cdot p^k\cdot (\left(1-p\right))^(n-k)$. De fapt, variabila aleatoare $X$ este numărul de apariții ale evenimentului $A$ în $n$ încercări independente. Legea distribuției probabilității pentru variabila aleatoare $X$:

$\begin(matrice)(|c|c|)
\hline
X_i & 0 & 1 & \dots & n \\
\hline
p_i și P_n\stanga(0\dreapta) și P_n\stanga(1\dreapta) și \dots și P_n\left(n\dreapta) \\
\hline
\end(matrice)$

Pentru o astfel de variabilă aleatorie, așteptarea este $M\left(X\right)=np$, varianța este $D\left(X\right)=np\left(1-p\right)$.

Exemplu . În familie sunt doi copii. Presupunând probabilitățile de naștere a unui băiat și a unei fete egale cu $0,5$, găsiți legea distribuției variabilei aleatoare $\xi $ - numărul de băieți din familie.

Fie variabila aleatoare $\xi $ numărul de băieți din familie. Valorile pe care $\xi:\ 0,\ ​​​​1,\ 2$ le poate lua. Probabilitățile acestor valori pot fi găsite prin formula $P\left(\xi =k\right)=C^k_n\cdot p^k\cdot (\left(1-p\right))^(n-k )$, unde $n =2$ - numărul de încercări independente, $p=0,5$ - probabilitatea de apariție a unui eveniment într-o serie de $n$ încercări. Primim:

$P\left(\xi =0\right)=C^0_2\cdot (0,5)^0\cdot (\left(1-0,5\right))^(2-0)=(0, 5)^2 =0,25;$

$P\left(\xi =1\right)=C^1_2\cdot 0,5\cdot (\left(1-0,5\right))^(2-1)=2\cdot 0,5\ cdot 0,5=0,5;$

$P\left(\xi =2\right)=C^2_2\cdot (0,5)^2\cdot (\left(1-0,5\right))^(2-2)=(0, 5)^2=0,25.$

Atunci legea de distribuție a variabilei aleatoare $\xi $ este corespondența dintre valorile $0,\ 1,\ 2$ și probabilitățile acestora, adică:

$\begin(matrice)(|c|c|)
\hline
\xi & 0 & 1 & 2 \\
\hline
P(\xi) & 0,25 & 0,5 & 0,25 \\
\hline
\end(matrice)$

Suma probabilităților din legea distribuției trebuie să fie egală cu $1$, adică $\sum _(i=1)^(n)P(\xi _((\rm i)))=0,25+0,5+0, 25 = 1 USD.

Așteptare $M\left(\xi \right)=np=2\cdot 0,5=1$, varianța $D\left(\xi \right)=np\left(1-p\right)=2\ cdot 0,5\ cdot 0,5=0,5$, abatere standard $\sigma \left(\xi \right)=\sqrt(D\left(\xi \right))=\sqrt(0,5 )\aproximativ 0,707 $.

2. Legea distribuției Poisson.

Dacă o variabilă aleatorie discretă $X$ poate lua numai valori întregi nenegative $0,\ 1,\ 2,\ \dots ,\ n$ cu probabilități $P\left(X=k\right)=((( \lambda )^k )\over (k}\cdot e^{-\lambda }$, то говорят, что она подчинена закону распределения Пуассона с параметром $\lambda $. Для такой случайной величины математическое ожидание и дисперсия равны между собой и равны параметру $\lambda $, то есть $M\left(X\right)=D\left(X\right)=\lambda $.!}

cometariu. Particularitatea acestei distribuții este că, pe baza datelor experimentale, găsim estimările $M\left(X\right),\D\left(X\right)$, dacă estimările obținute sunt apropiate unele de altele, atunci avem au motive să afirme că variabila aleatoare este supusă legii distribuției Poisson.

Exemplu . Exemple de variabile aleatoare supuse legii distribuției Poisson pot fi: numărul de mașini care vor fi deservite mâine de o benzinărie; numărul de articole defecte din produsul fabricat.

Exemplu . Fabrica a trimis 500$ de produse la bază. Probabilitatea de deteriorare a produsului în timpul transportului este de 0,002 USD. Aflați legea de distribuție a variabilei aleatoare $X$ egală cu numărul de produse deteriorate; care este egal cu $M\left(X\right),\D\left(X\right)$.

Fie o variabilă aleatorie discretă $X$ numărul de articole deteriorate. O astfel de variabilă aleatoare este supusă legii distribuției Poisson cu parametrul $\lambda =np=500\cdot 0,002=1$. Probabilitățile valorilor sunt $P\left(X=k\right)=(((\lambda )^k)\peste (k}\cdot e^{-\lambda }$. Очевидно, что все вероятности всех значений $X=0,\ 1,\ \dots ,\ 500$ перечислить невозможно, поэтому мы ограничимся лишь первыми несколькими значениями.!}

$P\left(X=0\right)=((1^0)\peste (0}\cdot e^{-1}=0,368;$!}

$P\left(X=1\right)=((1^1)\peste (1}\cdot e^{-1}=0,368;$!}

$P\left(X=2\right)=((1^2)\peste (2}\cdot e^{-1}=0,184;$!}

$P\left(X=3\right)=((1^3)\peste (3}\cdot e^{-1}=0,061;$!}

$P\left(X=4\right)=((1^4)\peste (4}\cdot e^{-1}=0,015;$!}

$P\left(X=5\right)=((1^5)\peste (5}\cdot e^{-1}=0,003;$!}

$P\left(X=6\right)=((1^6)\peste (6}\cdot e^{-1}=0,001;$!}

$P\left(X=k\right)=(((\lambda )^k)\peste (k}\cdot e^{-\lambda }$!}

Legea distribuției variabilei aleatoare $X$:

$\begin(matrice)(|c|c|)
\hline
X_i & 0 & 1 & 2 & 3 & 4 & 5 & 6 & ... & k \\
\hline
P_i & 0,368; & 0,368 & 0,184 & 0,061 & 0,015 & 0,003 & 0,001 & ... & (((\lambda )^k)\peste (k}\cdot e^{-\lambda } \\!}
\hline
\end(matrice)$

Pentru o astfel de variabilă aleatorie, așteptarea și varianța matematică sunt egale între ele și egale cu parametrul $\lambda $, adică $M\left(X\right)=D\left(X\right)=\lambda =1 $.

3. Legea geometrică a distribuției.

Dacă o variabilă aleatoare discretă $X$ poate lua numai valori naturale $1,\ 2,\ \dots ,\ n$ cu probabilități $P\left(X=k\right)=p(\left(1-p\ dreapta)) ^(k-1),\ k=1,\ 2,\ 3,\ \dots $, atunci spunem că o astfel de variabilă aleatoare $X$ este supusă legii geometrice a distribuției probabilităților. De fapt, distribuția geometrică pare a fi încercările lui Bernoulli la primul succes.

Exemplu . Exemple de variabile aleatoare care au o distribuție geometrică pot fi: numărul de lovituri înainte de prima lovitură asupra țintei; numărul de teste ale dispozitivului înainte de prima defecțiune; numărul de aruncări de monede înainte de primul heads up și așa mai departe.

Așteptările și varianța matematică a unei variabile aleatoare supuse unei distribuții geometrice sunt, respectiv, egale cu $M\left(X\right)=1/p$, $D\left(X\right)=\left(1-p\ dreapta)/p^ 2$.

Exemplu . Pe drumul deplasării peștilor către locul de depunere a icrelor există o blocare de $4$. Probabilitatea ca un pește să treacă prin fiecare ecluză este $p=3/5$. Construiți o serie de distribuție a variabilei aleatoare $X$ - numărul de ecluze trecute de pește înainte de prima oprire la ecluză. Găsiți $M\left(X\dreapta),\D\left(X\dreapta),\\sigma \left(X\right)$.

Fie variabila aleatoare $X$ numărul de ecluze trecute de pește înainte de prima oprire la ecluză. O astfel de variabilă aleatorie este supusă legii geometrice a distribuției probabilităților. Valorile pe care le poate lua variabila aleatoare $X sunt: ​​1, 2, 3, 4. Probabilitățile acestor valori sunt calculate prin formula: $P\left(X=k\right)=pq^( k-1)$, unde: $ p=2/5$ - probabilitatea ca peștele să fie prins prin ecluză, $q=1-p=3/5$ - probabilitatea ca peștele să treacă prin ecluză, $k=1, \ 2,\ 3,\ 4$.

$P\left(X=1\right)=((2)\peste (5))\cdot (\left(((3)\peste (5))\right))^0=((2)\ peste(5))=0,4;$

$P\left(X=2\right)=((2)\peste (5))\cdot ((3)\peste (5))=((6)\peste (25))=0,24; $

$P\left(X=3\right)=((2)\peste (5))\cdot (\left(((3)\peste (5))\right))^2=((2)\ peste (5))\cdot ((9)\peste (25))=((18)\peste (125))=0,144;$

$P\left(X=4\right)=((2)\peste (5))\cdot (\left(((3)\peste (5))\right))^3+(\left(( (3)\peste (5))\dreapta))^4=((27)\peste (125))=0,216.$

$\begin(matrice)(|c|c|)
\hline
X_i & 1 & 2 & 3 & 4 \\
\hline
P\stanga(X_i\dreapta) & 0,4 & 0,24 & 0,144 & 0,216 \\
\hline
\end(matrice)$

Valorea estimata:

$M\left(X\right)=\sum^n_(i=1)(x_ip_i)=1\cdot 0.4+2\cdot 0.24+3\cdot 0.144+4\cdot 0.216=2.176.$

Dispersie:

$D\left(X\right)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\right)\right))^2=)0,4\cdot (\ stânga(1-2.176\right))^2+0,24\cdot (\left(2-2.176\right))^2+0.144\cdot (\left(3-2.176\right))^2+$

$+\ 0,216\cdot (\left(4-2,176\right))^2\aproximativ 1,377.$

Deviație standard:

$\sigma \left(X\right)=\sqrt(D\left(X\right))=\sqrt(1.377)\aproximativ 1.173.$

4. Legea distribuției hipergeometrice.

Dacă există $N$ obiecte, printre care $m$ obiecte au proprietatea dată. În mod aleatoriu, fără înlocuire, sunt extrase $n$ obiecte, printre care se numără $k$ obiecte care au o proprietate dată. Distribuția hipergeometrică face posibilă estimarea probabilității ca exact $k$ obiecte dintr-o probă să aibă o proprietate dată. Fie variabila aleatoare $X$ numărul de obiecte din eșantion care au o proprietate dată. Apoi probabilitățile valorilor variabilei aleatoare $X$:

$P\stanga(X=k\dreapta)=((C^k_mC^(n-k)_(N-m))\peste (C^n_N))$

cometariu. Funcția statistică HYPERGEOMET a Excel $f_x$ Function Wizard vă permite să determinați probabilitatea ca un anumit număr de încercări să aibă succes.

$f_x\la $ statistic$\la $ HIPERGEOMETĂ$\la $ O.K. Va apărea o casetă de dialog pe care trebuie să o completați. În grafic Număr_de_reușite_în_eșantion specificați valoarea lui $k$. marime de mostra este egal cu $n$. În grafic Număr_de_succese_în_populație specificați valoarea lui $m$. Dimensiunea_populației este egal cu $N$.

Așteptările și varianța matematică a unei variabile aleatoare discrete $X$ supuse unei legi de distribuție geometrică sunt $M\left(X\right)=nm/N$, $D\left(X\right)=((nm\left) (1 -((m)\peste (N))\dreapta)\stanga(1-((n)\peste (N))\dreapta))\peste (N-1))$.

Exemplu . Departamentul credit al băncii angajează 5 specialişti cu studii superioare financiare şi 3 specialişti cu studii superioare juridice. Conducerea băncii a decis să trimită 3 specialiști pentru pregătire avansată, selectându-i aleatoriu.

a) Realizează o serie de repartizare a numărului de specialişti cu studii superioare financiare care pot fi direcţionaţi către formare avansată;

b) Aflați caracteristicile numerice ale acestei distribuții.

Fie variabila aleatoare $X$ numărul de specialiști cu studii financiare superioare dintre cei trei selectați. Valori pe care $X:0,\ 1,\ 2,\ 3$ le pot lua. Această variabilă aleatoare $X$ este distribuită în funcție de distribuția hipergeometrică cu următorii parametri: $N=8$ - mărimea populației, $m=5$ - numărul de succese în populație, $n=3$ - dimensiunea eșantionului, $ k=0,\ 1, \ 2,\ 3$ - numărul de succese din eșantion. Atunci probabilitățile $P\left(X=k\right)$ pot fi calculate folosind formula: $P(X=k)=(C_(m)^(k) \cdot C_(N-m)^(n-k) \ peste C_( N)^(n) ) $. Avem:

$P\left(X=0\right)=((C^0_5\cdot C^3_3)\peste (C^3_8))=((1)\peste (56))\aproximativ 0,018;$

$P\left(X=1\right)=((C^1_5\cdot C^2_3)\peste (C^3_8))=((15)\peste (56))\aproximativ 0,268;$

$P\left(X=2\right)=((C^2_5\cdot C^1_3)\peste (C^3_8))=((15)\peste (28))\aproximativ 0,536;$

$P\left(X=3\right)=((C^3_5\cdot C^0_3)\peste (C^3_8))=((5)\peste (28))\aproximativ 0,179.$

Apoi seria de distribuție a variabilei aleatoare $X$:

$\begin(matrice)(|c|c|)
\hline
X_i & 0 & 1 & 2 & 3 \\
\hline
p_i & 0,018 & 0,268 & 0,536 & 0,179 \\
\hline
\end(matrice)$

Să calculăm caracteristicile numerice ale variabilei aleatoare $X$ folosind formulele generale ale distribuției hipergeometrice.

$M\left(X\right)=((nm)\peste (N))=((3\cdot 5)\peste (8))=((15)\peste (8))=1.875.$

$D\left(X\right)=((nm\left(1-((m)\peste (N))\dreapta)\left(1-((n)\peste (N))\dreapta)) \over (N-1))=((3\cdot 5\cdot \left(1-((5)\over (8))\right)\cdot \left(1-((3)\over (8) ))\dreapta))\peste (8-1))=((225)\peste (448))\aproximativ 0,502.$

$\sigma \left(X\right)=\sqrt(D\left(X\right))=\sqrt(0,502)\aproximativ 0,7085.$