Distribuția binomială și formele sale limitative. Distribuția binomială a unei variabile aleatoare


Desigur, atunci când se calculează funcția de distribuție cumulativă, ar trebui să se folosească relația menționată între distribuțiile binomiale și beta. Această metodă este cu siguranță mai bună decât însumarea directă atunci când n > 10.

În manualele clasice de statistică, pentru a obține valorile distribuției binomiale, se recomandă adesea utilizarea formulelor bazate pe teoreme limită (cum ar fi formula Moivre-Laplace). Trebuie remarcat faptul că din punct de vedere pur computaţional valoarea acestor teoreme este aproape de zero, mai ales acum, când există un computer puternic pe aproape fiecare masă. Principalul dezavantaj al aproximărilor de mai sus este acuratețea lor complet insuficientă pentru valorile lui n tipice pentru majoritatea aplicațiilor. Un dezavantaj nu mai mic este absența oricăror recomandări clare cu privire la aplicabilitatea uneia sau alteia aproximări (în textele standard sunt date doar formulări asimptotice, nu sunt însoțite de estimări de acuratețe și, prin urmare, sunt de puțină folos). Aș spune că ambele formule sunt valabile doar pentru n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Nu iau în considerare aici problema găsirii cuantilelor: pentru distribuțiile discrete, este banală, iar în acele probleme în care apar astfel de distribuții, de regulă, nu este relevantă. Dacă mai sunt necesare cuantile, recomand reformularea problemei în așa fel încât să se lucreze cu valorile p (semnificații observate). Iată un exemplu: la implementarea unor algoritmi de enumerare, la fiecare pas este necesară verificarea ipotezei statistice despre variabila aleatoare binomială. Conform abordării clasice, la fiecare pas este necesar să se calculeze statisticile criteriului și să se compare valoarea acestuia cu limita mulțimii critice. Deoarece, totuși, algoritmul este enumerativ, este necesar să se determine de fiecare dată limita setului critic (la urma urmei, dimensiunea eșantionului se schimbă de la pas la pas), ceea ce crește neproductiv costurile de timp. Abordarea modernă recomandă calcularea semnificației observate și compararea acesteia cu probabilitatea de încredere, economisind la căutarea cuantilelor.

Prin urmare, codurile de mai jos nu calculează funcția inversă, în schimb, este dată funcția rev_binomialDF, care calculează probabilitatea p de succes într-o singură încercare având în vedere numărul n de încercări, numărul m de succese din acestea și valoarea y a probabilității de a obține aceste m succese. Aceasta folosește relația menționată mai sus dintre distribuțiile binomiale și beta.

De fapt, această funcție vă permite să obțineți limitele intervalelor de încredere. Într-adevăr, să presupunem că obținem m succese în n încercări binomiale. După cum se știe, limita din stânga a intervalului de încredere cu două fețe pentru parametrul p cu un nivel de încredere este 0 dacă m = 0 și for este soluția ecuației . În mod similar, limita dreaptă este 1 dacă m = n, iar pentru este o soluție a ecuației . Aceasta implică faptul că pentru a găsi limita stângă, trebuie să rezolvăm ecuația , și pentru a căuta cea potrivită - ecuația . Acestea sunt rezolvate în funcțiile binom_leftCI și binom_rightCI , care returnează limitele superioare și, respectiv, inferioare ale intervalului de încredere cu două fețe.

Vreau să observ că, dacă nu este necesară o precizie absolut incredibilă, atunci pentru n suficient de mare, puteți utiliza următoarea aproximare [B.L. van der Waerden, Statistica matematică. M: IL, 1960, cap. 2, sec. 7]: , unde g este cuantila distribuției normale. Valoarea acestei aproximări este că există aproximări foarte simple care vă permit să calculați cuantilele distribuției normale (vezi textul despre calcularea distribuției normale și secțiunea corespunzătoare a acestei referințe). În practica mea (în principal pentru n > 100), această aproximare a dat aproximativ 3-4 cifre, ceea ce, de regulă, este destul de suficient.

Calculele cu următoarele coduri necesită fișierele betaDF.h , betaDF.cpp (vezi secțiunea despre distribuția beta), precum și logGamma.h , logGamma.cpp (vezi anexa A). De asemenea, puteți vedea un exemplu de utilizare a funcțiilor.

fișier binomialDF.h

#ifndef __BINOMIAL_H__ #include "betaDF.h" binom dubluDF(încercări duble, succese duble, p dublu); /* * Să fie „încercări” de observații independente * cu probabilitatea „p” de succes în fiecare. * Calculați probabilitatea B(reușite|încercări,p) ca numărul * de succese să fie între 0 și „reușite” (inclusiv). */ double rev_binomialDF(încercări duble, succese duble, y dublu); /* * Fie cunoscută probabilitatea y a cel puțin m succese * în încercările schemei Bernoulli. Funcția găsește probabilitatea p * de succes într-o singură încercare. * * Următoarea relație este utilizată în calcule * * 1 - p = rev_Beta(încercări-reușite| succese+1, y). */ double binom_leftCI(double trials, double success, double level); /* Să fie „încercări” de observații independente * cu probabilitatea „p” de succes în fiecare * iar numărul de succese este „reușite”. * Limita stângă a intervalului de încredere cu două fețe * este calculată cu nivelul nivelului de semnificație. */ double binom_rightCI(double n, double succeses, double level); /* Să fie „încercări” de observații independente * cu probabilitatea „p” de succes în fiecare * iar numărul de succese este „reușite”. * Limita dreaptă a intervalului de încredere cu două fețe * este calculată cu nivelul nivelului de semnificație. */ #endif /* Se termină #ifndef __BINOMIAL_H__ */

fișier binomialDF.cpp

/************************************************ **** **********/ /* Distribuție binomială */ /**************************** **** ****************************/ #include #include #include "betaDF.h" ENTRY double binomDF(dublu n, dublu m, dublu p) /* * Să fie „n” observații independente * cu probabilitatea „p” de succes în fiecare. * Calculați probabilitatea B(m|n,p) ca numărul de reușite să fie * între 0 și „m” (inclusiv), adică. * suma probabilităților binomiale de la 0 la m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Calculele nu implică o însumare stupidă - * se folosește următoarea relație cu distribuția beta centrală: * * B(m|n,p) = Beta(1-p|n-m,m+1). * * Argumentele trebuie să fie pozitive, cu 0<= p <= 1. */ { assert((n >0) && (p >= 0) && (p<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) întoarcere 1; altfel returnează BetaDF(n-m, m+1).valoare(1-p); )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * Fie cunoscută probabilitatea y de cel puțin m succese * în n încercări ale schemei Bernoulli. Funcția găsește probabilitatea p * de succes într-o singură încercare. * * Următoarea relație este utilizată în calcule * * 1 - p = rev_Beta(y|n-m,m+1). */ ( afirmă ((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

Luați în considerare distribuția binomială, calculați așteptarea, varianța, modul ei matematic. Folosind funcția MS EXCEL BINOM.DIST(), vom reprezenta graficul funcției de distribuție și al densității probabilității. Să estimăm parametrul de distribuție p, așteptarea matematică a distribuției și abaterea standard. Luați în considerare și distribuția Bernoulli.

Definiție. Lasă-le să fie ținute n teste, în fiecare dintre ele pot apărea doar 2 evenimente: evenimentul „succes” cu o probabilitate p sau evenimentul „eşec” cu probabilitatea q =1-p (așa-numitul Schema Bernoulli,Bernoulliîncercări).

Probabilitatea de a obține exact X succes in acestea n teste este egal cu:

Numărul de succese din eșantion X este o variabilă aleatoare care are Distribuție binomială(Engleză) Binomdistributie) pși n sunt parametri ai acestei distribuţii.

Amintiți-vă că pentru a aplica scheme Bernoulliși în mod corespunzător distribuție binomială, trebuie îndeplinite următoarele condiții:

  • fiecare încercare trebuie să aibă exact două rezultate, numite condiționat „succes” și „eșec”.
  • rezultatul fiecărui test nu trebuie să depindă de rezultatele testelor anterioare (independența testului).
  • rata de succes p ar trebui să fie constantă pentru toate testele.

Distribuție binomială în MS EXCEL

În MS EXCEL, începând cu versiunea 2010, pt există o funcție BINOM.DIST(), numele englezesc este BINOM.DIST(), care vă permite să calculați probabilitatea ca eșantionul să aibă exact X„succesuri” (adică funcția de densitate de probabilitate p(x), vezi formula de mai sus) și funcția de distribuție integrală(probabilitatea ca eșantionul să aibă X sau mai puține „reușite”, inclusiv 0).

Înainte de MS EXCEL 2010, EXCEL avea funcția BINOMDIST(), care vă permite, de asemenea, să calculați functie de distributieși probabilitate densitate p(x). BINOMDIST() este lăsat în MS EXCEL 2010 pentru compatibilitate.

Fișierul exemplu conține grafice densitatea distribuției de probabilitateși .

Distribuție binomială are denumirea B (n ; p) .

Notă: Pentru constructii funcția de distribuție integrală tip grafic de potrivire perfectă Programa, pentru densitatea de distribuțieHistogramă cu grupare. Pentru mai multe informații despre construirea diagramelor, citiți articolul Principalele tipuri de diagrame.

Notă: Pentru comoditatea scrierii formulelor în fișierul exemplu, au fost create Nume pentru parametri Distribuție binomială: n și p.

Fișierul exemplu arată diferite calcule de probabilitate folosind funcțiile MS EXCEL:

După cum se vede în imaginea de mai sus, se presupune că:

  • Populația infinită din care este făcut eșantionul conține 10% (sau 0,1) elemente bune (parametrul p, al treilea argument al funcției = BINOM.DIST() )
  • Pentru a calcula probabilitatea ca într-un eșantion de 10 elemente (parametrul n, al doilea argument al funcției) vor fi exact 5 elemente valide (primul argument), trebuie să scrieți formula: =BINOM.DIST(5, 10, 0,1, FALSE)
  • Ultimul, al patrulea element este setat = FALSE, i.e. valoarea funcției este returnată densitatea de distribuție .

Dacă valoarea celui de-al patrulea argument = TRUE, atunci funcția BINOM.DIST() returnează valoarea funcția de distribuție integrală sau pur și simplu functie de distributie. În acest caz, puteți calcula probabilitatea ca numărul de articole bune din eșantion să fie dintr-un anumit interval, de exemplu, 2 sau mai puțin (inclusiv 0).

Pentru a face acest lucru, scrieți formula: = BINOM.DIST(2; 10; 0,1; TRUE)

Notă: Pentru o valoare neîntregătoare a lui x, . De exemplu, următoarele formule vor returna aceeași valoare: =BINOM.DIST( 2 ; zece; 0,1; ADEVĂRAT)=BINOM.DIST( 2,9 ; zece; 0,1; ADEVĂRAT)

Notă: În fișierul exemplu probabilitate densitateși functie de distributie de asemenea, calculat folosind definiția și funcția COMBIN().

Indicatori de distribuție

LA fișier exemplu pe foaie Exemplu există formule pentru calcularea unor indicatori de distribuție:

  • =n*p;
  • (abatere standard pătrată) = n*p*(1-p);
  • = (n+1)*p;
  • =(1-2*p)*ROOT(n*p*(1-p)).

Deducem formula așteptări matematiceDistribuție binomială folosind Schema Bernoulli .

Prin definiție, o variabilă aleatoare X în Schema Bernoulli(variabilă aleatoare Bernoulli) are functie de distributie :

Această distribuție se numește distribuția Bernoulli .

Notă : distribuția Bernoulli- caz special Distribuție binomială cu parametrul n=1.

Să generăm 3 matrice de 100 de numere cu diferite probabilități de succes: 0,1; 0,5 și 0,9. Pentru a face acest lucru, în fereastră Generarea numerelor aleatorii setați următorii parametri pentru fiecare probabilitate p:

Notă: Dacă setați opțiunea Imprăștire aleatorie (Sămânță aleatorie), apoi puteți alege un anumit set aleatoriu de numere generate. De exemplu, setând această opțiune =25, puteți genera aceleași seturi de numere aleatorii pe computere diferite (dacă, desigur, alți parametri de distribuție sunt aceiași). Valoarea opțiunii poate lua valori întregi de la 1 la 32 767. Numele opțiunii Imprăștire aleatorie poate deruta. Ar fi mai bine să o traducem ca Setați un număr cu numere aleatorii .

Ca urmare, vom avea 3 coloane de 100 de numere, pe baza cărora, de exemplu, putem estima probabilitatea de succes p dupa formula: Număr de succese/100(cm. exemplu de fișă de fișier Generarea lui Bernoulli).

Notă: Pentru distribuții Bernoulli cu p=0,5, puteți folosi formula =RANDBETWEEN(0;1) , care corespunde cu .

Generarea numerelor aleatorii. Distribuție binomială

Să presupunem că există 7 articole defecte în eșantion. Aceasta înseamnă că este „foarte probabil” ca proporția produselor defecte să se fi schimbat. p, care este o caracteristică a procesului nostru de producție. Deși această situație este „foarte probabilă”, există o posibilitate (risc alfa, eroare de tip 1, „alarma falsă”) ca p a rămas neschimbată, iar numărul crescut de produse defecte s-a datorat prelevării aleatorii.

După cum se poate observa în figura de mai jos, 7 este numărul de produse defecte care este acceptabil pentru un proces cu p=0,21 la aceeași valoare Alfa. Acest lucru ilustrează faptul că, atunci când pragul de articole defecte dintr-o probă este depășit, p„probabil” a crescut. Expresia „probabil” înseamnă că există doar o șansă de 10% (100%-90%) ca abaterea procentului de produse defecte peste prag să se datoreze doar unor cauze aleatorii.

Astfel, depășirea numărului prag de produse defecte din probă poate servi drept semnal că procesul a devenit deranjat și a început să producă b despre procent mai mare de produse defecte.

Notă: Înainte de MS EXCEL 2010, EXCEL avea o funcție CRITBINOM() , care este echivalentă cu BINOM.INV() . CRITBINOM() este lăsat în MS EXCEL 2010 și mai sus pentru compatibilitate.

Relația distribuției binomiale cu alte distribuții

Dacă parametrul nDistribuție binomială tinde spre infinit şi p tinde spre 0, atunci în acest caz Distribuție binomială poate fi aproximată. Este posibil să se formuleze condiții când aproximarea Distribuția Poisson functioneaza bine:

  • p(mai putin pși altele n, cu atât aproximarea este mai precisă);
  • p >0,9 (având în vedere că q =1- p, calculele în acest caz trebuie efectuate folosind q(A X trebuie inlocuit cu n - X). Prin urmare, cu atât mai puțin qși altele n, cu atât aproximarea este mai precisă).

La 0,110 Distribuție binomială poate fi aproximată.

La randul lui, Distribuție binomială poate servi ca o bună aproximare atunci când dimensiunea populației este N Distribuția hipergeometrică mult mai mare decât dimensiunea eșantionului n (adică, N>>n sau n/N Puteți citi mai multe despre relația dintre distribuțiile de mai sus în articol. Exemple de aproximare sunt, de asemenea, date acolo, iar condițiile sunt explicate atunci când este posibil și cu ce precizie.

SFAT: Puteți citi despre alte distribuții ale MS EXCEL în articol.

Teoria probabilității este prezentă invizibil în viața noastră. Nu îi acordăm atenție, dar fiecare eveniment din viața noastră are una sau alta probabilitate. Având în vedere numărul mare de scenarii posibile, devine necesar să stabilim cel mai probabil și cel mai puțin probabil dintre ele. Cel mai convenabil este să analizați astfel de date probabilistice grafic. Distribuția ne poate ajuta în acest sens. Binomul este unul dintre cele mai simple și mai precise.

Înainte de a trece direct la matematică și teoria probabilității, să ne dăm seama cine a fost primul care a venit cu acest tip de distribuție și care este istoria dezvoltării aparatului matematic pentru acest concept.

Poveste

Conceptul de probabilitate este cunoscut din cele mai vechi timpuri. Cu toate acestea, matematicienii antici nu i-au acordat prea multă importanță și au putut doar să pună bazele unei teorii care a devenit ulterior teoria probabilității. Au creat niște metode combinatorii care i-au ajutat foarte mult pe cei care au creat și dezvoltat ulterior teoria în sine.

În a doua jumătate a secolului al XVII-lea a început formarea conceptelor și metodelor de bază ale teoriei probabilităților. Au fost introduse definiții ale variabilelor aleatoare, metode de calcul a probabilității unor evenimente simple și complexe independente și dependente. Un astfel de interes pentru variabilele aleatoare și probabilitățile era dictat de jocurile de noroc: fiecare persoană dorea să știe care sunt șansele sale de a câștiga jocul.

Următorul pas a fost aplicarea metodelor de analiză matematică în teoria probabilităților. Eminenți matematicieni precum Laplace, Gauss, Poisson și Bernoulli au preluat această sarcină. Ei au fost cei care au avansat această zonă a matematicii la un nou nivel. James Bernoulli a fost cel care a descoperit legea distribuției binomiale. Apropo, după cum vom afla mai târziu, pe baza acestei descoperiri, s-au făcut mai multe, care au făcut posibilă crearea legii distribuției normale și multe altele.

Acum, înainte de a începe să descriem distribuția binomială, ne vom reîmprospăta puțin în memoria conceptelor de teoria probabilităților, probabil deja uitate de la banca școlii.

Fundamentele teoriei probabilităților

Vom lua în considerare astfel de sisteme, în urma cărora sunt posibile doar două rezultate: „succes” și „eșec”. Acest lucru este ușor de înțeles cu un exemplu: aruncăm o monedă, bănuind că vor cădea cozi. Probabilitățile fiecăruia dintre evenimentele posibile (căderea cozilor – „succes”, căderea capetelor – „nu succes”) sunt egale cu 50 la sută dacă moneda este perfect echilibrată și nu există alți factori care pot afecta experimentul.

A fost cel mai simplu eveniment. Dar există și sisteme complexe în care sunt efectuate acțiuni secvențiale, iar probabilitățile rezultatelor acestor acțiuni vor diferi. De exemplu, luați în considerare următorul sistem: într-o cutie al cărei conținut nu îl putem vedea, sunt șase bile absolut identice, trei perechi de culori albastru, roșu și alb. Trebuie să luăm câteva bile la întâmplare. Prin urmare, scoțând mai întâi una dintre bile albe, vom reduce de câteva ori probabilitatea ca în următoarea să obținem și o bilă albă. Acest lucru se întâmplă deoarece numărul de obiecte din sistem se modifică.

În secțiunea următoare, ne vom uita la concepte matematice mai complexe care ne apropie de ceea ce înseamnă cuvintele „distribuție normală”, „distribuție binomială” și altele asemenea.

Elemente de statistică matematică

În statistică, care este unul dintre domeniile de aplicare a teoriei probabilității, există multe exemple în care datele pentru analiză nu sunt date în mod explicit. Adică nu în numere, ci sub formă de împărțire în funcție de caracteristici, de exemplu, în funcție de gen. Pentru a aplica aparatul matematic la astfel de date și pentru a trage unele concluzii din rezultatele obținute, este necesară convertirea datelor inițiale într-un format numeric. De regulă, pentru a implementa acest lucru, unui rezultat pozitiv i se atribuie o valoare de 1, iar unui rezultat negativ i se atribuie o valoare de 0. Astfel, obținem date statistice care pot fi analizate folosind metode matematice.

Următorul pas în înțelegerea distribuției binomiale a unei variabile aleatoare este de a determina varianța variabilei aleatoare și așteptarea matematică. Vom vorbi despre asta în secțiunea următoare.

Valorea estimata

De fapt, înțelegerea a ceea ce este așteptarea matematică nu este dificilă. Luați în considerare un sistem în care există multe evenimente diferite cu propriile lor probabilități diferite. Așteptările matematice se vor numi o valoare egală cu suma produselor valorilor acestor evenimente (în forma matematică despre care am vorbit în ultima secțiune) și probabilitatea apariției lor.

Așteptările matematice ale distribuției binomiale se calculează după aceeași schemă: luăm valoarea unei variabile aleatoare, o înmulțim cu probabilitatea unui rezultat pozitiv și apoi rezumăm datele obținute pentru toate variabilele. Este foarte convenabil să prezentați aceste date grafic - în acest fel diferența dintre așteptările matematice ale diferitelor valori este mai bine percepută.

În secțiunea următoare, vă vom spune puțin despre un concept diferit - varianța unei variabile aleatoare. De asemenea, este strâns legat de un astfel de concept precum distribuția de probabilitate binomială și este caracteristica acestuia.

Varianta distributiei binomiale

Această valoare este strâns legată de cea anterioară și, de asemenea, caracterizează distribuția datelor statistice. Reprezintă pătratul mediu al abaterilor valorilor de la așteptările lor matematice. Adică, varianța unei variabile aleatoare este suma diferențelor pătrate dintre valoarea unei variabile aleatoare și așteptarea ei matematică, înmulțită cu probabilitatea acestui eveniment.

În general, acesta este tot ce trebuie să știm despre varianță pentru a înțelege care este distribuția de probabilitate binomială. Acum să trecem la subiectul nostru principal. Și anume, ce se află în spatele unei astfel de expresii aparent destul de complicate „legea distribuției binomiale”.

Distribuție binomială

Să înțelegem mai întâi de ce această distribuție este binomială. Provine de la cuvântul „binom”. Poate că ați auzit de binomul lui Newton - o formulă care poate fi folosită pentru a extinde suma oricăror două numere a și b la orice putere nenegativă a lui n.

După cum probabil ați ghicit deja, formula binomială a lui Newton și formula de distribuție binomială sunt aproape aceleași formule. Cu singura excepție că al doilea are o valoare aplicată pentru cantități specifice, iar primul este doar un instrument matematic general, ale cărui aplicații în practică pot fi diferite.

Formule de distribuție

Funcția de distribuție binomială poate fi scrisă ca suma următorilor termeni:

(n!/(n-k)!k!)*p k *q n-k

Aici n este numărul de experimente aleatoare independente, p este numărul de rezultate reușite, q este numărul de rezultate nereușite, k este numărul experimentului (poate lua valori de la 0 la n)! - desemnarea unui factorial, o astfel de funcție a unui număr, a cărui valoare este egală cu produsul tuturor numerelor care merg până la el (de exemplu, pentru numărul 4: 4!=1*2*3*4= 24).

În plus, funcția de distribuție binomială poate fi scrisă ca o funcție beta incompletă. Cu toate acestea, aceasta este deja o definiție mai complexă, care este utilizată numai atunci când se rezolvă probleme statistice complexe.

Distribuția binomială, exemple din care am examinat mai sus, este unul dintre cele mai simple tipuri de distribuții din teoria probabilității. Există și o distribuție normală, care este un tip de distribuție binomială. Este cel mai des folosit și cel mai ușor de calculat. Există, de asemenea, o distribuție Bernoulli, o distribuție Poisson, o distribuție condiționată. Toate acestea caracterizează grafic zonele de probabilitate ale unui anumit proces în diferite condiții.

În secțiunea următoare, vom lua în considerare aspecte legate de aplicarea acestui aparat matematic în viața reală. La prima vedere, desigur, se pare că acesta este un alt lucru matematic, care, ca de obicei, nu își găsește aplicație în viața reală și, în general, nu este nevoie de nimeni, cu excepția matematicienilor înșiși. Cu toate acestea, acesta nu este cazul. La urma urmei, toate tipurile de distribuții și reprezentările lor grafice au fost create exclusiv în scopuri practice și nu ca un capriciu al oamenilor de știință.

Aplicație

De departe, cea mai importantă aplicație a distribuțiilor este în statistică, unde este necesară o analiză complexă a unei multitudini de date. După cum arată practica, foarte multe matrice de date au aproximativ aceleași distribuții de valori: regiunile critice de valori foarte scăzute și foarte mari, de regulă, conțin mai puține elemente decât valorile medii.

Analiza matricelor mari de date este necesară nu numai în statistică. Este indispensabil, de exemplu, în chimia fizică. În această știință, este folosit pentru a determina multe cantități care sunt asociate cu vibrații aleatorii și mișcări ale atomilor și moleculelor.

În secțiunea următoare, vom înțelege cât de important este aplicarea unor concepte statistice precum binom distribuția unei variabile aleatoare în viața de zi cu zi pentru tine și pentru mine.

De ce am nevoie de el?

Mulți oameni își pun această întrebare când vine vorba de matematică. Și apropo, matematica nu este degeaba numită regina științelor. Este baza fizicii, chimiei, biologiei, economiei, iar în fiecare dintre aceste științe se folosește și un fel de distribuție: indiferent dacă este o distribuție binomială discretă sau una normală, nu contează. Și dacă aruncăm o privire mai atentă asupra lumii din jurul nostru, vom vedea că matematica este folosită peste tot: în viața de zi cu zi, la locul de muncă și chiar relațiile umane pot fi prezentate sub formă de date statistice și analizate (aceasta, de altfel , se realizeaza de catre cei care lucreaza in organizatii speciale implicate in colectarea informatiilor).

Acum haideți să vorbim puțin despre ce să faceți dacă aveți nevoie să știți mult mai multe despre acest subiect decât ceea ce am subliniat în acest articol.

Informațiile pe care le-am oferit în acest articol sunt departe de a fi complete. Există multe nuanțe cu privire la forma pe care o poate lua distribuția. Distribuția binomială, așa cum am aflat deja, este unul dintre principalele tipuri pe care se bazează toate statisticile matematice și teoria probabilității.

Dacă devii interesat, sau în legătură cu munca ta trebuie să știi mult mai multe pe această temă, va trebui să studiezi literatura de specialitate. Ar trebui să începi cu un curs universitar de analiză matematică și să mergi acolo la secțiunea despre teoria probabilității. De asemenea, cunoștințele în domeniul seriei vor fi utile, deoarece distribuția de probabilitate binomială nu este altceva decât o serie de termeni succesivi.

Concluzie

Înainte de a termina articolul, am dori să vă mai spunem un lucru interesant. Se referă direct la subiectul articolului nostru și la întreaga matematică în general.

Mulți oameni spun că matematica este o știință inutilă și nimic din ceea ce au învățat la școală nu le-a fost de folos. Dar cunoașterea nu este niciodată de prisos, iar dacă ceva nu îți este util în viață, înseamnă că pur și simplu nu-ți amintești. Dacă ai cunoștințe, ei te pot ajuta, dar dacă nu le ai, atunci nu te poți aștepta la ajutor de la ei.

Deci, am examinat conceptul de distribuție binomială și toate definițiile asociate cu acesta și am vorbit despre modul în care este aplicat în viața noastră.

Capitolul 7

Legile specifice de distribuție a variabilelor aleatoare

Tipuri de legi de distribuție a variabilelor aleatoare discrete

Fie ca o variabilă aleatorie discretă să ia valorile X 1 , X 2 , …, x n, … . Probabilitățile acestor valori pot fi calculate folosind diverse formule, de exemplu, folosind teoremele de bază ale teoriei probabilităților, formula lui Bernoulli sau alte formule. Pentru unele dintre aceste formule, legea distribuirii are propriul nume.

Cele mai comune legi ale distribuției unei variabile aleatoare discrete sunt binomiale, geometrice, hipergeometrice, legea distribuției lui Poisson.

Legea distribuției binomiale

Lasă-l să fie produs n studii independente, în fiecare dintre ele un eveniment poate sau nu să apară DAR. Probabilitatea de apariție a acestui eveniment în fiecare încercare este constantă, nu depinde de numărul procesului și este egală cu R=R(DAR). De aici probabilitatea ca evenimentul să nu se producă DARîn fiecare test este de asemenea constantă și egală cu q=1–R. Luați în considerare o variabilă aleatorie X egal cu numărul de apariţii ale evenimentului DARîn n teste. Este evident că valorile acestei cantități sunt egale cu

X 1 =0 - eveniment DARîn n testele nu au apărut;

X 2 =1 – eveniment DARîn n procesele au apărut o dată;

X 3 =2 - eveniment DARîn n procesele au apărut de două ori;

…………………………………………………………..

x n +1 = n- eveniment DARîn n testele au apărut totul n o singura data.

Probabilitățile acestor valori pot fi calculate folosind formula Bernoulli (4.1):

Unde la=0, 1, 2, …,n .

Legea distribuției binomiale X egal cu numărul de succese în nÎncercările Bernoulli, cu probabilitate de succes R.

Deci, o variabilă aleatorie discretă are o distribuție binomială (sau este distribuită conform legii binomiale) dacă valorile sale posibile sunt 0, 1, 2, …, n, iar probabilitățile corespunzătoare sunt calculate prin formula (7.1).

Distribuția binomială depinde de două parametrii Rși n.

Seria de distribuție a unei variabile aleatoare distribuite conform legii binomiale are forma:

X k n
R

Exemplu 7.1 . Trei focuri independente sunt trase în țintă. Probabilitatea de a lovi fiecare lovitură este de 0,4. Valoare aleatoare X- numărul de lovituri pe țintă. Construiți-i seria de distribuție.

Soluţie. Valori posibile ale unei variabile aleatorii X sunteți X 1 =0; X 2 =1; X 3 =2; X 4=3. Găsiți probabilitățile corespunzătoare folosind formula Bernoulli. Este ușor de demonstrat că aplicarea acestei formule aici este pe deplin justificată. Rețineți că probabilitatea de a nu lovi ținta cu o singură lovitură va fi egală cu 1-0,4=0,6. obține

Seria de distribuție are următoarea formă:

X
R 0,216 0,432 0,288 0,064

Este ușor de verificat dacă suma tuturor probabilităților este egală cu 1. Variabila aleatoare în sine X distribuite conform legii binomiale. ■

Să găsim așteptarea și varianța matematică a unei variabile aleatoare distribuite conform legii binomiale.

La rezolvarea exemplului 6.5, s-a arătat că așteptarea matematică a numărului de apariții ale unui eveniment DARîn n teste independente, dacă probabilitatea de apariție DARîn fiecare test este constantă și egală R, egal n· R

În acest exemplu, a fost folosită o variabilă aleatoare, distribuită conform legii binomiale. Prin urmare, soluția din Exemplul 6.5 este, de fapt, o demonstrație a următoarei teoreme.

Teorema 7.1. Așteptarea matematică a unei variabile aleatoare discrete distribuite conform legii binomiale este egală cu produsul dintre numărul de încercări și probabilitatea de „reușită”, i.e. M(X)=n· R.

Teorema 7.2. Varianta unei variabile aleatoare discrete distribuite conform legii binomiale este egală cu produsul dintre numărul de încercări cu probabilitatea de „reușit” și probabilitatea de „eșec”, i.e. D(X)=npq.

Deformarea și curtoza unei variabile aleatoare distribuite conform legii binomiale sunt determinate de formulele

Aceste formule pot fi obținute folosind conceptul de momente inițiale și centrale.

Legea distribuției binomiale stă la baza multor situații reale. Pentru valori mari n distribuția binomială poate fi aproximată folosind alte distribuții, în special folosind distribuția Poisson.

Distribuția Poisson

Să fie n Procesele Bernoulli, cu numărul de încercări n destul de mare. Anterior, s-a arătat că în acest caz (dacă, în plus, probabilitatea R evoluții DAR foarte mic) pentru a afla probabilitatea ca un eveniment DAR a aparea t odată ajuns la teste, puteți folosi formula Poisson (4.9). Dacă variabila aleatoare Xînseamnă numărul de apariții ale evenimentului DARîn nîncercări Bernoulli, apoi probabilitatea ca X va prelua sensul k poate fi calculată prin formula

, (7.2)

Unde λ = nr.

Legea distribuției Poisson se numește distribuția unei variabile aleatoare discrete X, pentru care valorile posibile sunt numere întregi nenegative și probabilitățile p t aceste valori se găsesc prin formula (7.2).

Valoare λ = nr numit parametru Distribuția Poisson.

O variabilă aleatoare distribuită conform legii lui Poisson poate lua un număr infinit de valori. Deoarece pentru această distribuţie probabilitatea R apariția unui eveniment în fiecare proces este mică, atunci această distribuție este uneori numită legea fenomenelor rare.

Seria de distribuție a unei variabile aleatoare distribuită conform legii Poisson are forma

X t
R

Este ușor de verificat că suma probabilităților celui de-al doilea rând este egală cu 1. Pentru a face acest lucru, trebuie să ne amintim că funcția poate fi extinsă într-o serie Maclaurin, care converge pentru orice X. În acest caz avem

. (7.3)

După cum sa menționat, legea lui Poisson în anumite cazuri limită înlocuiește legea binomială. Un exemplu este o variabilă aleatoare X, ale căror valori sunt egale cu numărul de defecțiuni pentru o anumită perioadă de timp cu utilizarea repetată a unui dispozitiv tehnic. Se presupune că acest dispozitiv este de înaltă fiabilitate, adică probabilitatea de eșec într-o singură aplicație este foarte mică.

Pe lângă astfel de cazuri limitative, în practică există variabile aleatoare distribuite conform legii Poisson, care nu au legătură cu distribuția binomială. De exemplu, distribuția Poisson este adesea folosită atunci când se tratează numărul de evenimente care au loc într-o perioadă de timp (numărul de apeluri către centrala telefonică în timpul orei, numărul de mașini care au ajuns la spălătorie în timpul zilei, numărul de opriri ale mașinii pe săptămână etc.). Toate aceste evenimente trebuie să formeze așa-numitul flux de evenimente, care este unul dintre conceptele de bază ale teoriei cozilor. Parametru λ caracterizează intensitatea medie a fluxului de evenimente.

Exemplu 7.2 . Facultatea are 500 de studenți. Care este probabilitatea ca 1 septembrie să fie ziua de naștere a trei studenți din această facultate?

Soluţie . De la numărul de elevi n=500 este suficient de mare și R– probabilitatea de a fi născut la 1 septembrie la oricare dintre elevi este de , i.е. suficient de mic, atunci putem presupune că variabila aleatoare X– numărul elevilor născuți la 1 septembrie se repartizează conform legii Poisson cu parametrul λ = np= =1,36986. Apoi, conform formulei (7.2), obținem

Teorema 7.3. Fie variabila aleatoare X distribuite conform legii lui Poisson. Atunci așteptarea și varianța sa matematică sunt egale între ele și egale cu valoarea parametrului λ , adică M(X) = D(X) = λ = np.

Dovada. Prin definirea așteptării matematice, folosind formula (7.3) și seria de distribuție a unei variabile aleatoare distribuite conform legii Poisson, obținem

Înainte de a găsi varianța, găsim mai întâi așteptarea matematică a pătratului variabilei aleatoare considerate. Primim

Prin urmare, prin definiția dispersiei, obținem

Teorema a fost demonstrată.

Aplicând conceptele de momente inițiale și centrale, se poate demonstra că pentru o variabilă aleatoare distribuită conform legii Poisson, coeficienții de asimetrie și curtoză sunt determinați de formulele

Este ușor de înțeles că, din moment ce conținutul semantic al parametrului λ = np este pozitivă, atunci o variabilă aleatoare distribuită conform legii lui Poisson are întotdeauna pozitive atât asimetrie, cât și curtoză.

Nu toate fenomenele sunt măsurate pe o scară cantitativă precum 1, 2, 3 ... 100500 ... Nu întotdeauna un fenomen poate lua un infinit sau un număr mare de stări diferite. De exemplu, genul unei persoane poate fi M sau F. trăgătorul fie lovește ținta, fie ratează. Puteți vota fie „pentru”, „împotrivă”, etc. etc. Cu alte cuvinte, astfel de date reflectă starea unui atribut alternativ - fie „da” (evenimentul a avut loc), fie „nu” (evenimentul nu a avut loc). Evenimentul care urmează (rezultat pozitiv) se mai numește și „succes”.

Sunt numite experimente cu astfel de date Schema Bernoulli, în onoarea celebrului matematician elvețian care a constatat că, cu un număr mare de încercări, raportul dintre rezultatele pozitive și numărul total de încercări tinde la probabilitatea ca acest eveniment să se producă.

Variabilă alternativă de caracteristică

Pentru a utiliza aparatul matematic în analiză, rezultatele unor astfel de observații trebuie notate în formă numerică. Pentru a face acest lucru, unui rezultat pozitiv i se atribuie numărul 1, unul negativ - 0. Cu alte cuvinte, avem de-a face cu o variabilă care poate lua doar două valori: 0 sau 1.

Ce beneficii se poate obține din asta? De fapt, nu mai puțin decât din date obișnuite. Deci, este ușor să numărăm numărul de rezultate pozitive - este suficient să însumăm toate valorile, de exemplu. toate 1 (succes). Puteți merge mai departe, dar pentru aceasta trebuie să introduceți câteva notații.

Primul lucru de remarcat este că rezultatele pozitive (care sunt egale cu 1) au o anumită probabilitate de a apărea. De exemplu, obținerea capetelor la aruncarea unei monede este ½ sau 0,5. Această probabilitate este indicată în mod tradițional de litera latină p. Prin urmare, probabilitatea ca un eveniment alternativ să se producă este 1-p, care se notează și prin q, acesta este q = 1 – p. Aceste denumiri pot fi sistematizate vizual sub forma unei plăci de distribuție variabilă X.

Avem o listă de valori posibile și probabilitățile acestora. poate fi calculat valorea estimatași dispersie. Așteptarea este suma produselor tuturor valorilor posibile și probabilitățile lor corespunzătoare:

Să calculăm valoarea așteptată folosind notația din tabelele de mai sus.

Se pare că așteptarea matematică a unui semn alternativ este egală cu probabilitatea acestui eveniment - p.

Acum să definim care este varianța unei caracteristici alternative. Dispersia este pătratul mediu al abaterilor de la așteptarea matematică. Formula generală (pentru date discrete) este:

De aici variația caracteristicii alternative:

Este ușor de observat că această dispersie are un maxim de 0,25 (at p=0,5).

Abaterea standard - rădăcina varianței:

Valoarea maximă nu depășește 0,5.

După cum puteți vedea, atât așteptarea matematică, cât și varianța semnului alternativ au o formă foarte compactă.

Distribuția binomială a unei variabile aleatoare

Să privim situația dintr-un unghi diferit. Într-adevăr, cui îi pasă că pierderea medie de capete la o aruncare este de 0,5? Este chiar imposibil de imaginat. Este mai interesant să punem problema numărului de capete care apar pentru un anumit număr de aruncări.

Cu alte cuvinte, cercetătorul este adesea interesat de probabilitatea ca un anumit număr de evenimente de succes să aibă loc. Acesta poate fi numărul de produse defecte din lotul testat (1 - defect, 0 - bun) sau numărul de recuperări (1 - sănătos, 0 - bolnav), etc. Numărul de astfel de „reușite” va fi egal cu suma tuturor valorilor variabilei X, adică numărul de rezultate unice.

Valoare aleatoare B se numește binom și ia valori de la 0 la n(la B= 0 - toate părțile sunt bune, cu B = n- toate piesele sunt defecte). Se presupune că toate valorile X independente unele de altele. Luați în considerare principalele caracteristici ale unei variabile binomiale, adică vom stabili așteptările matematice, varianța și distribuția acesteia.

Așteptarea unei variabile binomiale este foarte ușor de obținut. Așteptările matematice ale sumei valorilor este suma așteptărilor matematice ale fiecărei valori adăugate și este aceeași pentru toată lumea, prin urmare:

De exemplu, așteptarea numărului de capete la 100 de aruncări este 100 × 0,5 = 50.

Acum derivăm formula pentru varianța variabilei binomiale. Varianța sumei variabilelor aleatoare independente este suma varianțelor. De aici

Abaterea standard, respectiv

Pentru 100 de aruncări de monede, abaterea standard a numărului de capete este

Și, în final, luați în considerare distribuția mărimii binomiale, i.e. probabilitatea ca variabila aleatoare B va lua valori diferite k, Unde 0≤k≤n. Pentru o monedă, această problemă ar putea suna așa: care este probabilitatea de a obține 40 de capete în 100 de aruncări?

Pentru a înțelege metoda de calcul, să ne imaginăm că moneda este aruncată doar de 4 ori. Oricare parte poate cădea de fiecare dată. Ne întrebăm: care este probabilitatea de a obține 2 capete din 4 aruncări. Fiecare aruncare este independentă una de cealaltă. Aceasta înseamnă că probabilitatea de a obține orice combinație va fi egală cu produsul dintre probabilitățile unui rezultat dat pentru fiecare aruncare individuală. Fie O capete și P cozi. Atunci, de exemplu, una dintre combinațiile care ni se potrivesc poate arăta ca OOPP, adică:

Probabilitatea unei astfel de combinații este egală cu produsul dintre două probabilități de a ieși din cap și încă două probabilități de a nu se ridica (evenimentul invers calculat ca 1-p), adică 0,5×0,5×(1-0,5)×(1-0,5)=0,0625. Aceasta este probabilitatea uneia dintre combinațiile care ni se potrivesc. Dar întrebarea era despre numărul total de vulturi, și nu despre o anumită ordine. Apoi trebuie să adăugați probabilitățile tuturor combinațiilor în care există exact 2 vulturi. Este clar că toate sunt la fel (produsul nu se schimbă de la schimbarea locurilor factorilor). Prin urmare, trebuie să calculați numărul lor și apoi să înmulțiți cu probabilitatea unei astfel de combinații. Să numărăm toate combinațiile de 4 aruncări a 2 vulturi: RROO, RORO, ROOR, ORRO, OROR, OORR. Doar 6 variante.

Prin urmare, probabilitatea dorită de a obține 2 capete după 4 aruncări este 6×0,0625=0,375.

Cu toate acestea, numărarea în acest fel este plictisitoare. Deja pentru 10 monede, va fi foarte dificil să obțineți numărul total de opțiuni prin forță brută. Prin urmare, oamenii inteligenți au inventat cu mult timp în urmă o formulă, cu ajutorul căreia calculează numărul de combinații diferite de n elemente prin k, Unde n este numărul total de elemente, k este numărul de elemente ale căror opțiuni de aranjare sunt calculate. Formula combinată a n elemente prin k este:

Lucruri similare au loc în secțiunea de combinatorică. Trimit acolo pe toți cei care doresc să-și îmbunătățească cunoștințele. De aici, apropo, numele distribuției binomiale (formula de mai sus este coeficientul de expansiune al binomului Newton).

Formula de determinare a probabilității poate fi generalizată cu ușurință la orice număr nși k. Ca rezultat, formula de distribuție binomială are următoarea formă.

Înmulțiți numărul de combinații potrivite cu probabilitatea uneia dintre ele.

Pentru utilizare practică, este suficient să cunoașteți pur și simplu formula pentru distribuția binomială. Și poate nici nu știți - mai jos este cum să determinați probabilitatea folosind Excel. Dar e mai bine să știi.

Să folosim această formulă pentru a calcula probabilitatea de a obține 40 de capete în 100 de aruncări:

Sau doar 1,08%. Pentru comparație, probabilitatea așteptării matematice a acestui experiment, adică 50 de capete, este de 7,96%. Probabilitatea maximă a unei valori binomiale aparține valorii corespunzătoare așteptării matematice.

Calcularea probabilităților de distribuție binomială în Excel

Dacă utilizați doar hârtie și un calculator, atunci calculele folosind formula de distribuție binomială, în ciuda absenței integralelor, sunt destul de dificile. De exemplu, o valoare de 100! - are mai mult de 150 de caractere. Anterior, și chiar acum, se foloseau formule aproximative pentru a calcula astfel de cantități. În acest moment, este recomandabil să folosiți software special, precum MS Excel. Astfel, orice utilizator (chiar și un umanist de educație) poate calcula cu ușurință probabilitatea valorii unei variabile aleatoare distribuite binomial.

Pentru a consolida materialul, vom folosi Excel deocamdată ca un calculator obișnuit, adică. Să facem un calcul pas cu pas folosind formula de distribuție binomială. Să calculăm, de exemplu, probabilitatea de a obține 50 de capete. Mai jos este o poză cu pașii de calcul și rezultatul final.

După cum puteți vedea, rezultatele intermediare au o astfel de scară încât nu se potrivesc într-o celulă, deși peste tot sunt folosite funcții simple de tipul: FACTOR (calcul factorial), POWER (ridicarea unui număr la o putere), precum și operatori de înmulţire şi împărţire. Mai mult, acest calcul este destul de greoi, în orice caz nu este compact, deoarece multe celule implicate. Și da, este greu să-ți dai seama.

În general, Excel oferă o funcție gata făcută pentru calcularea probabilităților distribuției binomiale. Funcția este numită BINOM.DIST.

Numărul de succese este numărul de încercări reușite. Avem 50 dintre ele.

Numărul de încercări - număr de aruncări: de 100 de ori.

Probabilitatea de succes – probabilitatea de a obține capete la o aruncare este de 0,5.

Integral - este indicat fie 1, fie 0. Dacă 0, atunci probabilitatea este calculată P(B=k); dacă 1, atunci se calculează funcția de distribuție binomială, i.e. suma tuturor probabilităților de la B=0 inainte de B=k inclusiv.

Apăsăm OK și obținem același rezultat ca mai sus, doar totul a fost calculat de o singură funcție.

Foarte confortabil. De dragul experimentului, în loc de ultimul parametru 0, punem 1. Obținem 0,5398. Aceasta înseamnă că în 100 de aruncări de monede, probabilitatea de a obține capete între 0 și 50 este de aproape 54%. Și la început părea că ar trebui să fie de 50%. În general, calculele se fac ușor și rapid.

Un analist adevărat trebuie să înțeleagă cum se comportă funcția (care este distribuția ei), așa că haideți să calculăm probabilitățile pentru toate valorile de la 0 la 100. Adică să ne întrebăm: care este probabilitatea ca niciun vultur să nu cadă , acel 1 vultur va cădea, 2, 3 , 50, 90 sau 100. Calculul este prezentat în imaginea următoare. Linia albastră este distribuția binomială în sine, punctul roșu este probabilitatea pentru un anumit număr de succese k.

S-ar putea întreba, nu este distribuția binomială similară cu... Da, foarte asemănătoare. Chiar și De Moivre (în 1733) spunea că cu mostre mari se apropie distribuția binomială (nu știu cum se numea atunci), dar nimeni nu l-a ascultat. Doar Gauss, și apoi Laplace, 60-70 de ani mai târziu, au redescoperit și studiat cu atenție legea distribuției normale. Graficul de mai sus arată clar că probabilitatea maximă cade pe așteptările matematice și, pe măsură ce se abate de la aceasta, scade brusc. La fel ca legea normală.

Distribuția binomială este de mare importanță practică, apare destul de des. Folosind Excel, calculele sunt efectuate ușor și rapid.