Estimări pentru așteptarea și varianța matematică. Estimarea așteptărilor matematice și a varianței pentru eșantion

Să fie o variabilă aleatoare X cu așteptări matematice mși dispersie D, în timp ce ambii acești parametri sunt necunoscuți. Peste magnitudine X produs N experimente independente, care au dus la un set de N rezultate numerice x 1 , x 2 , …, x N. Ca o estimare a așteptărilor matematice, este firesc să propunem media aritmetică a valorilor observate

(1)

Aici ca x i valori specifice (numere) obținute ca urmare a N experimente. Daca luam altele (independente de cele anterioare) N experimente, atunci, evident, vom obține o altă valoare. Dacă iei mai mult N experimente, vom obține încă o valoare nouă. Notează prin X i variabilă aleatoare rezultată din i experimentul, apoi realizările X i vor fi numerele obţinute în urma acestor experimente. Este evident că variabila aleatoare X i va avea aceeași densitate de distribuție a probabilității ca variabila aleatoare inițială X. De asemenea, presupunem că variabilele aleatoare X iși Xj sunt independente la i, nu este egal j(diferite experimente independente unul față de celălalt). Prin urmare, rescriem formula (1) într-o formă diferită (statistică):

(2)

Să arătăm că estimarea este imparțială:

Astfel, așteptarea matematică a mediei eșantionului este egală cu așteptarea matematică adevărată a variabilei aleatoare m. Acesta este un fapt destul de previzibil și de înțeles. Prin urmare, media eșantionului (2) poate fi luată ca o estimare a așteptării matematice a unei variabile aleatoare. Acum apare întrebarea: ce se întâmplă cu varianța estimării așteptărilor pe măsură ce crește numărul de experimente? Calculele analitice arată că

unde este varianța estimării așteptării matematice (2) și D- varianţa adevărată a variabilei aleatoare X.

Din cele de mai sus rezultă că odată cu creșterea N(numărul de experimente) varianța estimării scade, i.e. cu cât rezumăm mai mult implementările independente, cu atât obținem estimarea mai aproape de valoarea așteptată.


Estimări ale varianței matematice

La prima vedere, cea mai firească estimare pare să fie

(3)

unde se calculează prin formula (2). Să verificăm dacă estimarea este imparțială. Formula (3) poate fi scrisă după cum urmează:

Inlocuim expresia (2) in aceasta formula:

Să găsim așteptările matematice ale estimării varianței:

(4)

Deoarece varianța unei variabile aleatoare nu depinde de care este așteptarea matematică a variabilei aleatoare, vom lua așteptarea matematică egală cu 0, i.e. m = 0.

(5)
la .(6)

Necesitatea estimării așteptării matematice pe baza rezultatelor testelor apare în problemele în care rezultatul experimentului este descris de o variabilă aleatoare și indicatorul de calitate al obiectului studiat este considerat așteptarea matematică a acestei variabile aleatoare. De exemplu, așteptarea matematică a timpului de funcționare al unui sistem poate fi luată ca indicator de fiabilitate, iar la evaluarea eficienței producției, așteptarea matematică a numărului de produse bune etc.

Problema estimării așteptării matematice se formulează după cum urmează. Să presupunem că pentru a determina valoarea necunoscută a variabilei aleatoare X, se presupune că se face n măsurători independente și lipsite de erori sistematice. X v X 2 ,..., X p. Este necesar să alegeți cea mai bună estimare a așteptărilor matematice.

Cea mai bună și mai comună estimare a așteptărilor matematice în practică este media aritmetică a rezultatelor testului

numit si statistic sau eșantion mediu.

Să arătăm că estimarea t xîndeplinește toate cerințele pentru evaluarea oricărui parametru.

1. Din expresia (5.10) rezultă că

adică scor t "x- estimare imparțială.

2. Conform teoremei Cebyshev, media aritmetică a rezultatelor testului converge în probabilitate la așteptarea matematică, i.e.

În consecință, estimarea (5.10) este o estimare consistentă a așteptării.

3. Varianta de estimare t x, egal

Pe măsură ce dimensiunea eșantionului crește, n scade la infinit. Se dovedește că dacă o variabilă aleatoare X este supusă legii distribuției normale, atunci pentru oricare P varianţa (5.11) va fi minim posibil, iar estimarea t x- estimarea eficientă a așteptărilor matematice. Cunoașterea varianței estimării face posibilă efectuarea unei judecăți cu privire la acuratețea determinării valorii necunoscute a așteptărilor matematice folosind această estimare.

Ca o estimare a așteptărilor matematice, se utilizează media aritmetică dacă rezultatele măsurătorilor sunt la fel de precise (varianțele D, i = 1, 2, ..., P sunt aceleași în fiecare dimensiune). Cu toate acestea, în practică, trebuie să se ocupe de sarcini în care rezultatele măsurătorilor nu sunt egale (de exemplu, în timpul testării, măsurătorile sunt efectuate cu diferite instrumente). În acest caz, estimarea pentru așteptarea matematică are forma

Unde este greutatea celei de-a i-a măsurători.

În formula (5.12), rezultatul fiecărei măsurători este inclus cu propria sa greutate Cu.. Prin urmare, evaluarea rezultatelor măsurătorilor t x numit medie ponderată.

Se poate demonstra că estimarea (5.12) este o estimare imparțială, consecventă și eficientă a așteptării. Varianta minimă a estimării este dată de


Atunci când se efectuează experimente cu modele computerizate, apar probleme similare atunci când se găsesc estimări din rezultatele mai multor serii de teste și numărul de teste din fiecare serie este diferit. De exemplu, două serii de teste au fost efectuate cu un volum p 1şi n 2 , conform rezultatelor cărora estimările t xi și t x _. Pentru a îmbunătăți acuratețea și fiabilitatea determinării așteptărilor matematice, rezultatele acestor serii de teste sunt combinate. Pentru a face acest lucru, utilizați expresia (5.12)

La calcularea coeficienților C, în locul variațiilor D, se înlocuiesc estimările acestora obținute din rezultatele testelor din fiecare serie.

O abordare similară este, de asemenea, utilizată pentru a determina probabilitatea ca un eveniment întâmplător să apară pe baza rezultatelor unei serii de teste.

Pentru a estima așteptările matematice ale unei variabile aleatoare X, pe lângă media eșantionului, pot fi utilizate și alte statistici. Cel mai adesea, membrii seriei variaționale sunt utilizați în aceste scopuri, adică statistici de ordine, pe baza cărora sunt construite estimări,

satisfacerea principalelor cerințe, și anume consistența și imparțialitatea.

Să presupunem că seria de variații conține n = 2k membrii. Apoi, oricare dintre medii poate fi luată ca o estimare a așteptărilor matematice:

în care la-e media

nu este altceva decât mediana statistică a distribuției variabilei aleatoare X, deoarece egalitatea evidentă are loc

Avantajul medianei statistice este că este liberă de influența observațiilor anormale, ceea ce este inevitabil atunci când se utilizează prima medie, adică media celui mai mic și cel mai mare număr de serie de variații.

Cu o dimensiune ciudată a eșantionului P = 2k- 1 mediană statistică este elementul său mijlociu, adică la-al-lea membru al seriei de variații Eu = x k.

Există distribuții pentru care media aritmetică nu este o estimare eficientă a așteptărilor matematice, de exemplu, distribuția Laplace. Se poate demonstra că pentru distribuția Laplace, estimarea efectivă a mediei este mediana eșantionului.

Se dovedește că dacă o variabilă aleatoare X are o distribuție normală, atunci cu o dimensiune a eșantionului suficient de mare, legea de distribuție a medianei statistice este apropiată de normal cu caracteristici numerice.

Dintr-o comparație a formulelor (5.11) și (5.14) rezultă că dispersia mediei statistice este de 1,57 ori mai mare decât dispersia mediei aritmetice. Prin urmare, media aritmetică ca estimare a așteptărilor matematice este la fel de mult mai eficientă decât mediana statistică. Cu toate acestea, datorită simplității calculelor, insensibilității la rezultatele anormale ale măsurătorilor („contaminarea” eșantionului), în practică, mediana statistică este totuși folosită ca estimare a așteptărilor matematice.

Trebuie remarcat faptul că pentru distribuțiile simetrice continue, media și mediana sunt aceleași. Prin urmare, mediana statistică poate servi ca o bună estimare a așteptărilor matematice numai pentru o distribuție simetrică a variabilei aleatoare.

Pentru distribuțiile neregulate, mediana statistică Pe mine are o părtinire semnificativă în raport cu așteptările matematice, prin urmare, este nepotrivit pentru estimarea acesteia.

Să fie o variabilă aleatoare X cu așteptări matematice mși dispersie D, în timp ce ambii acești parametri sunt necunoscuți. Peste magnitudine X produs N experimente independente, care au dus la un set de N rezultate numerice x 1 , x 2 , …, x N. Ca o estimare a așteptărilor matematice, este firesc să propunem media aritmetică a valorilor observate

(1)

Aici ca x i valori specifice (numere) obținute ca urmare a N experimente. Daca luam altele (independente de cele anterioare) N experimente, atunci, evident, vom obține o altă valoare. Dacă iei mai mult N experimente, vom obține încă o valoare nouă. Notează prin X i variabilă aleatoare rezultată din i experimentul, apoi realizările X i vor fi numerele obţinute în urma acestor experimente. Este evident că variabila aleatoare X i va avea aceeași densitate de distribuție a probabilității ca variabila aleatoare inițială X. De asemenea, presupunem că variabilele aleatoare X iși Xj sunt independente la i, nu este egal j(diferite experimente independente unul față de celălalt). Prin urmare, rescriem formula (1) într-o formă diferită (statistică):

(2)

Să arătăm că estimarea este imparțială:

Astfel, așteptarea matematică a mediei eșantionului este egală cu așteptarea matematică adevărată a variabilei aleatoare m. Acesta este un fapt destul de previzibil și de înțeles. Prin urmare, media eșantionului (2) poate fi luată ca o estimare a așteptării matematice a unei variabile aleatoare. Acum apare întrebarea: ce se întâmplă cu varianța estimării așteptărilor pe măsură ce crește numărul de experimente? Calculele analitice arată că

unde este varianța estimării așteptării matematice (2) și D- varianţa adevărată a variabilei aleatoare X.

Din cele de mai sus rezultă că odată cu creșterea N(numărul de experimente) varianța estimării scade, i.e. cu cât rezumăm mai mult implementările independente, cu atât obținem estimarea mai aproape de valoarea așteptată.


Estimări ale varianței matematice

La prima vedere, cea mai firească estimare pare să fie

(3)

unde se calculează prin formula (2). Să verificăm dacă estimarea este imparțială. Formula (3) poate fi scrisă după cum urmează:

Inlocuim expresia (2) in aceasta formula:

Să găsim așteptările matematice ale estimării varianței:

(4)

Deoarece varianța unei variabile aleatoare nu depinde de care este așteptarea matematică a variabilei aleatoare, vom lua așteptarea matematică egală cu 0, i.e. m = 0.

(5)
la .(6)

Să fie supusă o variabilă aleatorie cu așteptări matematice și varianță necunoscute unor experimente independente care au dat rezultate - . Să calculăm estimări consistente și nepărtinitoare pentru parametrii și .

Ca o estimare a așteptărilor matematice, luăm media aritmetică a valorilor experimentale

. (2.9.1)

Conform legii numerelor mari, această estimare este bogat , cu amploare în probabilitate. Aceeași estimare este imparțial , în măsura în care

. (2.9.2)

Varianta acestei estimări este

. (2.9.3)

Se poate demonstra că pentru o distribuție normală, această estimare este eficient . Pentru alte legi, acesta poate să nu fie cazul.

Să estimăm acum varianța. Să alegem mai întâi o formulă de estimare dispersie statistică

. (2.9.4)

Să verificăm consistența estimării varianței. Să deschidem parantezele din formula (2.9.4)

.

Pentru , primul termen converge în probabilitate către cantitate , în al doilea - la . Astfel, estimarea noastră converge în probabilitate către varianță

,

deci ea este bogat .

Sa verificam imparțialitatea estimări pentru cantitate. Pentru a face acest lucru, înlocuim expresia (2.9.1) în formula (2.9.4) și luăm în considerare că variabilele aleatoare independent

,

. (2.9.5)

Să trecem în formula (2.9.5) la fluctuațiile variabilelor aleatoare

Extindem parantezele, obținem

,

. (2.9.6)

Să calculăm așteptarea matematică a valorii (2.9.6), ținând cont de faptul că

. (2.9.7)

Relația (2.9.7) arată că valoarea calculată prin formula (2.9.4) nu este un estimator imparțial pentru dispersie. Așteptările sale matematice nu sunt egale, dar oarecum mai mici. O astfel de estimare duce la o eroare sistematică descendentă. Pentru a elimina o astfel de părtinire, este necesar să se introducă o corecție prin înmulțirea nu a valorii . Atunci o astfel de varianță statistică corectată poate servi ca o estimare imparțială a varianței

. (2.9.8)

Această estimare este la fel de consistentă ca și estimarea , deoarece pentru .

În practică, în loc de estimare (2.9.8), uneori este mai convenabil să se utilizeze o estimare echivalentă legată de al doilea moment statistic inițial

. (2.9.9)

Estimările (2.9.8), (2.9.9) nu sunt eficiente. Se poate arăta că în cazul unei distribuții normale acestea vor fi eficient asimptotic (când va tinde spre valoarea minimă posibilă).

Astfel, este posibil să se formuleze următoarele reguli pentru prelucrarea materialului statistic limitat. Dacă în experimente independente variabila aleatoare ia valorile cu așteptări și variații matematice necunoscute, atunci pentru a determina acești parametri, ar trebui să folosiți estimări aproximative

(2.9.10)

Sfârșitul lucrării -

Acest subiect aparține:

Note de curs despre matematică teoria probabilității statistică matematică

Departamentul Superior de Matematică și Informatică.. note de curs.. la matematică..

Dacă aveți nevoie de material suplimentar pe această temă, sau nu ați găsit ceea ce căutați, vă recomandăm să utilizați căutarea în baza noastră de date de lucrări:

Ce vom face cu materialul primit:

Dacă acest material s-a dovedit a fi util pentru dvs., îl puteți salva pe pagina dvs. de pe rețelele sociale:

Toate subiectele din această secțiune:

Teoria probabilității
Teoria probabilității este o ramură a matematicii care studiază tiparele fenomenelor de masă aleatoare. Aleatoriu este un fenomen care

Definiția statistică a probabilității
Un eveniment este un fenomen aleatoriu care, ca urmare a experienței, poate sau nu să apară (fenomen cu două valori). Desemnați evenimentele cu majuscule latine

Spațiul evenimentelor elementare
Să fie asociat un set de evenimente cu o anumită experiență și: 1) ca rezultat al experienței, unul și unul singur

Acțiuni pe evenimente
Suma a două evenimente și

Permutări
Se notează numărul de permutări diferite ale elementelor

Cazare
Amplasarea elementelor prin

Combinații
O combinație de elemente

Formula de adunare a probabilităților pentru evenimente incompatibile
Teorema. Probabilitatea sumei a două evenimente incompatibile este egală cu suma probabilităților acestor evenimente. (unu

Formula de adunare a probabilității pentru evenimente arbitrare
Teorema. Probabilitatea sumei a două evenimente este egală cu suma probabilităților acestor evenimente fără probabilitatea produsului lor.

Formula de înmulțire a probabilității
Să fie date două evenimente. Luați în considerare un eveniment

Formula probabilității totale
Fie un grup complet de evenimente incompatibile, ele se numesc ipoteze. Luați în considerare un eveniment

Formula probabilităților ipotezelor (Bayes)
Luați în considerare din nou - grupul complet de ipoteze incompatibile și evenimentul

Formula Poisson asimptotică
În cazurile în care numărul de încercări este mare și probabilitatea de apariție a unui eveniment

Variabile aleatorii discrete
O valoare aleatorie este o cantitate care, atunci când experimentul este repetat, poate lua valori numerice inegale. Variabila aleatoare se numește discretă,

Variabile aleatorii continue
Dacă, în urma experimentului, o variabilă aleatoare poate lua orice valoare dintr-un anumit segment sau din întreaga axă reală, atunci se numește continuă. lege

Funcția de densitate de probabilitate a unei variabile continue aleatoare
Lasa. Luați în considerare un punct și acordați-i o creștere

Caracteristicile numerice ale variabilelor aleatoare
Variabilele aleatoare discrete sau continue sunt considerate a fi complet specificate dacă legile lor de distribuție sunt cunoscute. Într-adevăr, cunoscând legile distribuției, se poate calcula întotdeauna probabilitatea de lovire

Cuantile de variabile aleatoare
Cuantila de ordinul unei variabile continue aleatoare

Așteptările matematice ale variabilelor aleatoare
Așteptările matematice ale unei variabile aleatoare caracterizează valoarea medie a acesteia. Toate valorile variabilei aleatoare sunt grupate în jurul acestei valori. Luați în considerare mai întâi o variabilă discretă aleatoare

Abaterea standard și varianța variabilelor aleatoare
Luați în considerare mai întâi o variabilă discretă aleatoare. Caracteristicile numerice ale modului, mediana, cuantilele și așteptările matematice

Momente de variabile aleatorii
Pe lângă așteptările și dispersia matematică, teoria probabilității folosește caracteristici numerice de ordine superioare, care sunt numite momente ale variabilelor aleatoare.

Teoreme privind caracteristicile numerice ale variabilelor aleatoare
Teorema 1. Aşteptarea matematică a unei variabile nealeatoare este egală cu această valoare însăşi. Dovada: lasa

Legea distribuției binomiale

Legea distribuției Poisson
Fie o variabilă discretă aleatoare care ia valorile

Legea distribuției uniforme
Legea uniformă de distribuție a unei variabile continue aleatoare este legea funcției de densitate de probabilitate, care

Legea distribuției normale
Legea normală de distribuție a unei variabile aleatoare continue este legea funcției de densitate

Legea distribuției exponențiale
Distribuția exponențială sau exponențială a unei variabile aleatoare este utilizată în astfel de aplicații ale teoriei probabilităților, cum ar fi teoria cozilor, teoria fiabilității

Sisteme de variabile aleatorii
În practică, în aplicațiile teoriei probabilităților, se întâlnesc adesea probleme în care rezultatele unui experiment sunt descrise nu de o variabilă aleatoare, ci de mai multe variabile aleatoare deodată.

Sistem de două variabile aleatoare discrete
Fie două variabile aleatoare discrete să formeze un sistem. Valoare aleatoare

Sistem de două variabile aleatoare continue
Acum lăsați sistemul să fie format din două variabile aleatorii continue. Legea distribuției acestui sistem se numește probabil

Legile condiționale ale distribuției
Fie și variabile aleatoare continue dependente

Caracteristicile numerice ale unui sistem de două variabile aleatoare
Momentul inițial al ordinii sistemului de variabile aleatoare

Sistem de mai multe variabile aleatoare
Rezultatele obţinute pentru un sistem de două variabile aleatoare pot fi generalizate în cazul sistemelor formate dintr-un număr arbitrar de variabile aleatoare. Lăsați sistemul să fie format din mulțime

Distribuția normală a unui sistem de două variabile aleatoare
Luați în considerare un sistem de două variabile aleatoare continue. Legea distribuției acestui sistem este legea distribuției normale

Teoreme limită ale teoriei probabilităților
Scopul principal al disciplinei teoriei probabilităților este de a studia tiparele fenomenelor de masă aleatoare. Practica arată că observarea unei mase de fenomene aleatorii omogene revelatoare

inegalitatea lui Cebyshev
Luați în considerare o variabilă aleatoare cu așteptări matematice

teorema lui Cebyshev
Dacă variabilele aleatoare sunt independente pe perechi și au varianțe finite mărginite în populație

teorema lui Bernoulli
Cu o creștere nelimitată a numărului de experimente, frecvența de apariție a unui eveniment converge în probabilitate cu probabilitatea unui eveniment

Teorema limitei centrale
Când se adaugă variabile aleatoare cu orice lege de distribuție, dar cu variații limitate în agregat, legea distribuției

Sarcinile principale ale statisticii matematice
Legile teoriei probabilităților discutate mai sus sunt o expresie matematică a tiparelor reale care există de fapt în diferite fenomene de masă aleatoare. studiu

O statistică simplă. Funcția de distribuție statistică
Luați în considerare o variabilă aleatoare a cărei lege de distribuție este necunoscută. Necesar pe baza experienței

Linie statistică. grafic de bare
Cu un număr mare de observații (de ordinul sutelor), populația generală devine incomodă și greoaie pentru înregistrarea materialului statistic. Pentru claritate și compactitate, material statistic

Caracteristicile numerice ale distribuţiei statistice
În teoria probabilităților au fost luate în considerare diverse caracteristici numerice ale variabilelor aleatoare: așteptarea matematică, varianța, momentele inițiale și centrale de diverse ordine. Cifre similare

Alegerea distribuției teoretice prin metoda momentelor
În orice distribuție statistică, există inevitabil elemente ale aleatoriei asociate cu numărul limitat de observații. Cu un număr mare de observații, aceste elemente ale aleatoriei sunt netezite,

Testarea plauzibilității ipotezei despre forma legii distribuției
Fie ca distribuția statistică dată să fie aproximată printr-o curbă teoretică sau

Criterii de consimțământ
Luați în considerare unul dintre cele mai frecvent utilizate teste de bunăstare a potrivirii, așa-numitul test Pearson. Să presupunem

Estimări punctuale pentru parametrii de distribuție necunoscuți
În p.p. 2.1. - 2.7 am analizat în detaliu modalităţile de rezolvare a primei şi a doua probleme principale de statistică matematică. Acestea sunt sarcinile de determinare a legilor de distribuție a variabilelor aleatoare în funcție de datele experimentale

Interval de încredere. Probabilitatea de încredere
În practică, cu un număr mic de experimente pe o variabilă aleatorie, o înlocuire aproximativă a unui parametru necunoscut

Să existe o variabilă aleatoare X, iar parametrii ei sunt așteptările matematice Ași varianța sunt necunoscute. Peste valoarea lui X, au fost efectuate experimente independente, care au dat rezultatele x 1, x 2, x n.

Fără a diminua generalitatea raționamentului, vom considera că aceste valori ale variabilei aleatoare sunt diferite. Vom considera valorile x 1, x 2, x n ca variabile aleatoare independente, distribuite identic X 1, X 2, X n .

Cea mai simplă metodă de estimare statistică - metoda substituției și analogiei - constă în faptul că, ca estimare a uneia sau alteia caracteristici numerice (medie, varianță etc.) a populației generale, se ia caracteristica corespunzătoare a distribuției eșantionului. - caracteristica probei.

Prin metoda substituției ca estimare a așteptării matematice A este necesar să se ia așteptarea matematică a distribuției eșantionului – media eșantionului. Astfel, primim

Pentru a testa imparțialitatea și consistența mediei eșantionului ca estimări A, considerați această statistică ca o funcție a vectorului ales (X 1, X 2, X n). Ținând cont că fiecare dintre valorile X 1, X 2, X n are aceeași lege de distribuție ca și valoarea X, concluzionăm că caracteristicile numerice ale acestor mărimi și valoarea lui X sunt aceleași: M(X i) = M(X) = A, D(X i) = D(X) = , i = 1, 2, n , unde X i sunt variabile aleatoare colectiv independente.

Prin urmare,

Prin urmare, prin definiție, obținem că aceasta este estimarea imparțială A, și deoarece D()®0 ca n®¥, atunci în virtutea teoremei paragrafului anterior este o estimare consistentă a așteptărilor A populatia generala.

Eficiența sau ineficiența estimării depinde de forma legii de distribuție a variabilei aleatoare X. Se poate demonstra că dacă valoarea X este distribuită conform legii normale, atunci estimarea este eficientă. Pentru alte legi de distribuție, acesta poate să nu fie cazul.

Estimare imparțială a varianței generale este varianța eșantionului corectată

,

La fel de , unde este varianța generală. Într-adevăr,

Estimarea s -- 2 pentru varianța generală este, de asemenea, consistentă, dar nu eficientă. Totuși, în cazul unei distribuții normale, aceasta este „eficientă asimptotic”, adică pe măsură ce n crește, raportul dintre variația sa și cel minim posibil se apropie la nesfârșit.

Deci, având în vedere un eșantion din distribuția F( X) variabilă aleatoare X cu așteptare matematică necunoscută Ași dispersie, apoi pentru a calcula valorile acestor parametri, avem dreptul de a folosi următoarele formule aproximative:

A ,

.

Aici x-i- - opțiuni de eșantionare, n- i - - opțiuni de frecvență x i , - - marime de mostra.
Pentru a calcula varianța eșantionului corectat, formula este mai convenabilă


.

Pentru a simplifica calculul, este recomandabil să treceți la opțiunile condiționate (este avantajos să luăm ca c varianta inițială situată la mijlocul seriei de variații de interval). Apoi

, .

estimarea intervalului

Mai sus, am luat în considerare problema estimării unui parametru necunoscut A un numar. Am numit astfel de estimări estimări punctuale. Au dezavantajul că, cu o dimensiune mică a eșantionului, pot diferi semnificativ de parametrii estimați. Prin urmare, pentru a ne face o idee despre apropierea dintre un parametru și estimarea acestuia, în statistica matematică sunt introduse așa-numitele estimări de interval.

Fie o estimare punctuală q * să fie găsită în eșantion pentru parametrul q. De obicei, cercetătorii prealează o probabilitate g suficient de mare (de exemplu, 0,95; 0,99 sau 0,999), astfel încât un eveniment cu probabilitatea g poate fi considerat practic sigur și ridică problema găsirii unei astfel de valori e > 0 pentru care

.

Modificând această egalitate, obținem:

iar în acest caz vom spune că intervalul ]q * - e; q * + e[ acoperă parametrul estimat q cu probabilitatea g.

Interval ]q * -e; q * +e [ se numește interval de încredere .

Probabilitatea g se numește fiabilitate (probabilitate de încredere) interval estimare.

Capetele intervalului de încredere, i.e. punctele q * -e și q * +e sunt numite limitele de încredere .

Se numește numărul e acuratețea evaluării .

Ca exemplu al problemei determinării limitelor de încredere, luați în considerare problema estimării așteptării matematice a unei variabile aleatoare X, care are o lege de distribuție normală cu parametri. Ași s, adică X = N( A, s). Așteptările matematice în acest caz sunt egale cu A. Conform observațiilor X 1 , X 2 , X n se calculează media si evaluare dispersia s 2 .

Se pare că, în funcție de datele eșantionului, este posibil să se construiască o variabilă aleatorie

care are o distribuție Student (sau t-distribuție) cu n = n -1 grade de libertate.

Să folosim tabelul A.1.3 și să găsim pentru probabilitatea dată g și numărul n numărul t g astfel încât probabilitatea

P(|t(n)|< t g) = g,

.

După ce facem transformări evidente, obținem

Procedura de aplicare a criteriului F este următoarea:

1. Se face o presupunere despre distribuția normală a populațiilor. La un nivel dat de semnificaţie a se formulează ipoteza nulă H 0: s x 2 = s y 2 despre egalitatea varianţelor generale ale populaţiilor normale sub ipoteza concurentă H 1: s x 2 > s y 2 .

2. Două eșantioane independente sunt obținute din populațiile X și Y ale lui n x și respectiv n y.

3. Calculați valorile variațiilor eșantionului corectat s x 2 și s y 2 (metodele de calcul sunt discutate în §13.4). Cu cât mai mare dintre dispersii (s x 2 sau s y 2) este desemnată s 1 2, cu atât mai mică - s 2 2.

4. Valoarea criteriului F se calculează după formula F obs = s 1 2 / s 2 2 .

5. Conform tabelului punctelor critice ale distribuției Fisher - Snedecor, în funcție de un anumit nivel de semnificație a și numărul de grade de libertate n 1 \u003d n 1 - 1, n 2 \u003d n 2 - 1 (n 1 este numărul de grade de libertate ale unei variații corectate mai mari), punctul critic se găsește F cr (a, n 1, n 2).

Rețineți că Tabelul A.1.7 arată valorile critice ale criteriului F cu o singură coadă. Prin urmare, dacă se aplică un criteriu cu două laturi (H 1: s x 2 ¹ s y 2), atunci punctul critic din dreapta F cr (a / 2, n 1, n 2) este căutat de nivelul de semnificație a / 2 (jumătate din cel specificat) și numărul de grade de libertate n 1 și n 2 (n 1 - numărul de grade de libertate de dispersie mai mare). Este posibil ca punctul critic pentru stânga să nu fie găsit.

6. Se concluzionează că dacă valoarea calculată a criteriului F este mai mare sau egală cu cea critică (F obs ³ F cr), atunci varianțele diferă semnificativ la un nivel de semnificație dat. În caz contrar (F obs< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Sarcina 15.1. Consumul de materii prime pe unitatea de producție conform tehnologiei veche a fost:

Tehnologie nouă:

Presupunând că populațiile generale corespunzătoare X și Y au distribuții normale, se verifică dacă consumul de materii prime pentru tehnologiile noi și cele vechi nu diferă ca variabilitate, dacă luăm nivelul de semnificație a = 0,1.

Decizie. Acționăm în ordinea indicată mai sus.

1. Vom judeca variabilitatea consumului de materii prime pentru tehnologii noi si vechi din punct de vedere al valorilor de dispersie. Astfel, ipoteza nulă are forma H 0: s x 2 = s y 2 . Ca ipoteză concurentă, acceptăm ipoteza H 1: s x 2 ¹ s y 2, deoarece nu suntem siguri în prealabil că oricare dintre variațiile generale este mai mare decât cealaltă.

2-3. Găsiți variațiile eșantionului. Pentru a simplifica calculele, să trecem la opțiunile condiționate:

u i = x i - 307, v i = y i - 304.

Vom aranja toate calculele sub forma următoarelor tabele:

tu i m i m i u i m i u i 2 m i (u i +1) 2 v i n i n i v i n i v i 2 n i (v i +1) 2
-3 -3 -1 -2
å -
å -

Control: å m i u i 2 + 2å m i u i + m i = Control: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Găsiți variațiile eșantionului corectate:

4. Comparați variațiile. Găsiți raportul dintre varianța corectată mai mare și cea mai mică:

.

5. Prin condiție, ipoteza concurentă are forma s x 2 ¹ s y 2 , prin urmare, regiunea critică este bifață, iar la găsirea punctului critic trebuie luate niveluri de semnificație care sunt jumătate din cea dată.

Conform tabelului A.1.7, prin nivelul de semnificație a/2 = 0,1/2 = 0,05 și numărul de grade de libertate n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8, găsim punctul critic F cr ( 0,05; 12; 8) = 3,28.

6. Deoarece F obl.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

Mai sus, la testarea ipotezelor, sa presupus că distribuția variabilelor aleatoare studiate a fost normală. Cu toate acestea, studii speciale au arătat că algoritmii propuși sunt foarte stabili (în special cu dimensiuni mari ale eșantionului) în ceea ce privește abaterea de la distribuția normală.