Interval de încredere standard. Metode de analiză cantitativă: Estimarea intervalelor de încredere

Și altele.Toate sunt estimări ale omologilor lor teoretici, care ar putea fi obținute dacă nu ar exista un eșantion, ci populația generală. Dar, din păcate, populația generală este foarte scumpă și adesea indisponibilă.

Conceptul de estimare a intervalului

Orice estimare de eșantion are o oarecare împrăștiere, deoarece este o variabilă aleatorie în funcție de valorile dintr-un anumit eșantion. Prin urmare, pentru inferențe statistice mai fiabile, ar trebui să se cunoască nu numai estimarea punctuală, ci și intervalul, care cu o probabilitate mare γ (gama) acoperă indicatorul estimat θ (theta).

Formal, acestea sunt două astfel de valori (statistici) T1(X)și T2(X), ce T1< T 2 , pentru care la un nivel dat de probabilitate γ condiția este îndeplinită:

Pe scurt, este probabil γ sau mai mult valoarea adevărată este între puncte T1(X)și T2(X), care sunt numite limite inferioare și superioare interval de încredere.

Una dintre condițiile pentru construirea intervalelor de încredere este îngustimea maximă a acestuia, adică. ar trebui să fie cât mai scurt posibil. Dorința este destul de firească, pentru că. cercetătorul încearcă să localizeze mai precis constatarea parametrului dorit.

Rezultă că intervalul de încredere ar trebui să acopere probabilitățile maxime ale distribuției. iar scorul în sine să fie în centru.

Adică, probabilitatea de abatere (a indicatorului adevărat de la estimare) în sus este egală cu probabilitatea de abatere în jos. De asemenea, trebuie remarcat faptul că, pentru distribuțiile înclinate, intervalul din dreapta nu este egal cu intervalul din stânga.

Figura de mai sus arată clar că cu cât nivelul de încredere este mai mare, cu atât intervalul este mai larg - o relație directă.

Aceasta a fost o mică introducere în teoria estimării pe intervale a parametrilor necunoscuți. Să trecem la găsirea limitelor de încredere pentru așteptarea matematică.

Interval de încredere pentru așteptările matematice

Dacă datele originale sunt distribuite peste , atunci media va fi o valoare normală. Aceasta rezultă din regula că o combinație liniară de valori normale are și o distribuție normală. Prin urmare, pentru a calcula probabilitățile, am putea folosi aparatul matematic al legii distribuției normale.

Cu toate acestea, acest lucru va necesita cunoașterea a doi parametri - valoarea așteptată și varianța, care de obicei nu sunt cunoscute. Desigur, puteți utiliza estimări în loc de parametri (media aritmetică și ), dar atunci distribuția mediei nu va fi destul de normală, va fi ușor aplatizată. Cetățeanul irlandez William Gosset a remarcat cu pricepere acest fapt când și-a publicat descoperirea în numărul din martie 1908 al revistei Biometrica. Din motive de secret, Gosset a semnat cu Student. Așa a apărut distribuția t a Studentului.

Cu toate acestea, distribuția normală a datelor, folosită de K. Gauss în analiza erorilor în observațiile astronomice, este extrem de rară în viața terestră și este destul de greu de stabilit acest lucru (pentru o acuratețe ridicată sunt necesare aproximativ 2 mii de observații). Prin urmare, cel mai bine este să renunțați la ipoteza normalității și să utilizați metode care nu depind de distribuția datelor originale.

Se pune întrebarea: care este distribuția mediei aritmetice dacă este calculată din datele unei distribuții necunoscute? Răspunsul este dat de binecunoscuta teoria probabilității Teorema limitei centrale(CPT). În matematică, există mai multe versiuni ale acesteia (formulările au fost rafinate de-a lungul anilor), dar toate, grosier vorbind, se reduc la afirmația că suma unui număr mare de variabile aleatoare independente se supune legii distribuției normale.

La calcularea mediei aritmetice se folosește suma variabilelor aleatoare. Din aceasta rezultă că media aritmetică are o distribuție normală, în care valoarea așteptată este valoarea așteptată a datelor originale, iar varianța este .

Oamenii inteligenți știu să demonstreze CLT, dar vom verifica acest lucru cu ajutorul unui experiment realizat în Excel. Să simulăm un eșantion de 50 de variabile aleatoare distribuite uniform (folosind funcția Excel RANDOMBETWEEN). Apoi vom face 1000 de astfel de mostre și vom calcula media aritmetică pentru fiecare. Să ne uităm la distribuția lor.

Se poate observa că distribuția mediei este apropiată de legea normală. Dacă volumul probelor și numărul lor sunt și mai mari, atunci asemănarea va fi și mai bună.

Acum că am văzut singuri validitatea CLT, putem, folosind , calcula intervalele de încredere pentru media aritmetică, care acoperă media adevărată sau așteptarea matematică cu o probabilitate dată.

Pentru a stabili limitele superioare și inferioare, este necesară cunoașterea parametrilor distribuției normale. De regulă, acestea nu sunt, prin urmare, se utilizează estimări: medie aritmeticăși varianța eșantionului. Din nou, această metodă oferă o aproximare bună numai pentru eșantioane mari. Când eșantioanele sunt mici, se recomandă adesea să folosiți distribuția Student. Nu crede! Distribuția lui Student pentru medie apare numai atunci când datele originale au o distribuție normală, adică aproape niciodată. Prin urmare, este mai bine să setați imediat bara minimă pentru cantitatea de date necesare și să utilizați metode corecte asimptotic. Se spune că 30 de observații sunt suficiente. Luați 50 - nu puteți greși.

T 1.2 sunt limitele inferioare și superioare ale intervalului de încredere

– medie aritmetică eșantionului

s0– abaterea standard a eșantionului (nepărtinitoare)

n - marime de mostra

γ – nivelul de încredere (de obicei egal cu 0,9, 0,95 sau 0,99)

c γ =Φ -1 ((1+γ)/2) este reciproca funcției de distribuție normală standard. În termeni simpli, acesta este numărul de erori standard de la media aritmetică la limita inferioară sau superioară (cele trei probabilități indicate corespund valorilor 1,64, 1,96 și 2,58).

Esența formulei este că se ia media aritmetică și apoi se pune deoparte o anumită sumă ( cu γ) erori standard ( s 0 /√n). Totul se știe, ia-l și numără.

Înainte de utilizarea în masă a PC-urilor, pentru a obține valorile funcției de distribuție normală și inversul acesteia, au folosit . Sunt încă folosite, dar este mai eficient să apelezi la formule Excel gata făcute. Toate elementele din formula de mai sus ( , și ) pot fi calculate cu ușurință în Excel. Dar există și o formulă gata făcută pentru calcularea intervalului de încredere - NORMA DE ÎNCREDERE. Sintaxa sa este următoarea.

NORMĂ DE ÎNCREDERE(alpha, standard_dev, size)

alfa– nivelul de semnificație sau nivelul de încredere, care în notația de mai sus este egal cu 1-γ, i.e. probabilitatea ca matematicaașteptarea va fi în afara intervalului de încredere. Cu un nivel de încredere de 0,95, alfa este 0,05 și așa mai departe.

standard_off este abaterea standard a datelor eșantionului. Nu trebuie să calculați eroarea standard, Excel va împărți la rădăcina lui n.

marimea– dimensiunea eșantionului (n).

Rezultatul functiei CONFIDENCE.NORM este al doilea termen din formula de calcul a intervalului de incredere, i.e. jumătate de interval. În consecință, punctele inferior și superior sunt media ± valoarea obținută.

Astfel, este posibil să se construiască un algoritm universal pentru calcularea intervalelor de încredere pentru media aritmetică, care nu depinde de distribuția datelor inițiale. Prețul pentru universalitate este natura sa asimptotică, adică. necesitatea folosirii de mostre relativ mari. Cu toate acestea, în era tehnologiei moderne, colectarea cantității potrivite de date nu este de obicei dificilă.

Testarea ipotezelor statistice folosind un interval de încredere

(modulul 111)

Una dintre principalele probleme rezolvate în statistică este. Pe scurt, esența sa este aceasta. Se presupune, de exemplu, că așteptările populației generale sunt egale cu o anumită valoare. Apoi se construiește distribuția mediilor eșantionului, care poate fi observată cu o așteptare dată. În continuare, ne uităm la unde în această distribuție condiționată se află media reală. Dacă depășește limitele admise, atunci apariția unei astfel de medii este foarte puțin probabilă, iar cu o singură repetare a experimentului este aproape imposibil, ceea ce contrazice ipoteza propusă, care este respinsă cu succes. Dacă media nu depășește nivelul critic, atunci ipoteza nu este respinsă (dar nici nu se dovedește!).

Deci, cu ajutorul intervalelor de încredere, în cazul nostru pentru așteptare, puteți testa și unele ipoteze. Este foarte ușor de făcut. Să presupunem că media aritmetică pentru un eșantion este 100. Se testează ipoteza că valoarea așteptată este, să zicem, 90. Adică, dacă punem întrebarea în mod primitiv, sună astfel: poate fi aceasta, cu adevărata valoare a medie egală cu 90, media observată a fost 100?

Pentru a răspunde la această întrebare, vor fi necesare informații suplimentare despre abaterea standard și dimensiunea eșantionului. Să presupunem că abaterea standard este 30, iar numărul de observații este 64 (pentru a extrage cu ușurință rădăcina). Atunci eroarea standard a mediei este 30/8 sau 3,75. Pentru a calcula intervalul de încredere de 95%, va trebui să lăsați deoparte două erori standard de ambele părți ale mediei (mai precis, 1,96). Intervalul de încredere va fi de aproximativ 100 ± 7,5 sau de la 92,5 la 107,5.

Raționamentul suplimentar este următorul. Dacă valoarea testată se încadrează în intervalul de încredere, atunci nu contrazice ipoteza, deoarece se încadrează în limitele fluctuațiilor aleatorii (cu o probabilitate de 95%). Dacă punctul testat se află în afara intervalului de încredere, atunci probabilitatea unui astfel de eveniment este foarte mică, în orice caz sub nivelul acceptabil. Prin urmare, ipoteza este respinsă ca fiind în contradicție cu datele observate. În cazul nostru, ipoteza așteptărilor se află în afara intervalului de încredere (valoarea testată de 90 nu este inclusă în intervalul de 100±7,5), deci ar trebui respinsă. Răspunzând la întrebarea primitivă de mai sus, ar trebui să spunem: nu, nu se poate, în niciun caz, acest lucru se întâmplă extrem de rar. Adesea, aceasta indică o probabilitate specifică de respingere eronată a ipotezei (p-level), și nu un nivel dat, conform căruia a fost construit intervalul de încredere, ci mai mult de altă dată.

După cum puteți vedea, nu este dificil să construiți un interval de încredere pentru medie (sau așteptări matematice). Principalul lucru este să prindeți esența și apoi lucrurile vor merge. În practică, cei mai mulți folosesc intervalul de încredere de 95%, care este aproximativ două erori standard de fiecare parte a mediei.

Asta este tot pentru acum. Toate cele bune!

Instruire

Vă rugăm să rețineți că interval(l1 sau l2), a cărei zonă centrală va fi estimarea l* și, de asemenea, în care valoarea adevărată a parametrului este conținută cu probabilitate, va fi doar încrederea interval ohm sau valoarea corespunzătoare a nivelului de încredere alfa. În acest caz, l* însuși se va referi la estimări punctuale. De exemplu, în funcție de rezultatele oricăror valori ale eșantionului ale unei valori aleatoare X (x1, x2,..., xn), este necesar să se calculeze un parametru indicator necunoscut l, de care va depinde distribuția. În acest caz, obținerea unei estimări a unui parametru dat l* va însemna că pentru fiecare probă va fi necesar să se pună în linie o anumită valoare a parametrului, adică să se creeze o funcție a rezultatelor observării indicatorului Q, a cărui valoare va fi luată egală cu valoarea estimată a parametrului l* sub forma unei formule : l*=Q*(x1, x2,..., xn).

Rețineți că orice funcție a rezultatelor unei observații se numește statistică. În plus, dacă descrie complet parametrul (fenomenul) luat în considerare, atunci se numește statistici suficiente. Și pentru că rezultatele observațiilor sunt aleatoare, atunci l * va fi și o variabilă aleatoare. Sarcina de calculare a statisticilor ar trebui efectuată ținând cont de criteriile pentru calitatea acesteia. Aici este necesar să se țină cont de faptul că legea de distribuție a estimării este destul de definită, distribuția densității de probabilitate W(x, l).

Puteți calcula încrederea interval destul de ușor dacă cunoașteți legea despre distribuirea evaluării. De exemplu, încredere interval estimări în raport cu așteptarea matematică (valoarea medie a unei valori aleatorii) mx* =(1/n)*(x1+x2+ …+xn) . Această estimare va fi imparțială, adică așteptarea matematică sau valoarea medie a indicatorului va fi egală cu valoarea adevărată a parametrului (M(mx*) = mx).

Puteți stabili că varianța estimării prin așteptare matematică este: bx*^2=Dx/n. Pe baza teoremei centrale a limitei, putem trage concluzia corespunzătoare că legea de distribuție a acestei estimări este gaussiană (normală). Prin urmare, pentru calcule, puteți utiliza indicatorul Ф (z) - integrala probabilităților. În acest caz, alegeți durata încrederii intervalși 2ld, deci obțineți: alfa \u003d P (mx-ld (folosind proprietatea integralei de probabilitate conform formulei: Ф (-z) \u003d 1- Ф (z)).

A cladi increderea interval estimări ale așteptării matematice: - găsiți valoarea formulei (alfa + 1) / 2; - selectați valoarea egală cu ld / sqrt (Dx / n) din tabelul integral de probabilitate; - luați estimarea varianței adevărate: Dx * = (1 / n) * ( (x1 - mx*)^2+(x2 - mx*)^2+…+(xn - mx*)^2); interval după formula: (mx*-ld, mx*+ld).

În statistică, există două tipuri de estimări: punct și interval. Estimarea punctului este un singur eșantion statistic care este utilizat pentru a estima un parametru de populație. De exemplu, media eșantionului este o estimare punctuală a mediei populației și a varianței eșantionului S2- estimarea punctuală a varianței populației σ2. sa arătat că media eșantionului este o estimare imparțială a așteptărilor populației. Media eșantionului se numește imparțial deoarece media tuturor mediilor eșantionului (cu aceeași dimensiune a eșantionului n) este egală cu așteptarea matematică a populației generale.

Pentru variația eșantionului S2 a devenit un estimator imparțial al varianței populației σ2, numitorul varianței eșantionului trebuie setat egal cu n – 1 , dar nu n. Cu alte cuvinte, varianța populației este media tuturor variațiilor posibile ale eșantionului.

La estimarea parametrilor populației, ar trebui să se țină cont de faptul că statisticile eșantionului precum , depind de mostre specifice. A ține cont de acest fapt, a obține estimarea intervalului așteptările matematice ale populației generale analizează distribuția mediilor eșantionului (pentru mai multe detalii, vezi). Intervalul construit este caracterizat de un anumit nivel de încredere, care este probabilitatea ca parametrul adevărat al populației generale să fie estimat corect. Intervale similare de încredere pot fi utilizate pentru a estima proporția unei caracteristici Rși principala masă distribuită a populației generale.

Descărcați nota în sau format, exemple în format

Construirea unui interval de încredere pentru așteptarea matematică a populației generale cu o abatere standard cunoscută

Construirea unui interval de încredere pentru proporția unei trăsături în populația generală

În această secțiune, conceptul de interval de încredere este extins la datele categorice. Acest lucru vă permite să estimați ponderea trăsăturii în populația generală R cu o cotă de probă RS= X/n. După cum sa menționat, dacă valorile nRși n(1 - p) depășește numărul 5, distribuția binomială poate fi aproximată cu cea normală. Prin urmare, pentru a estima ponderea unei trăsături în populația generală R se poate construi un interval al cărui nivel de încredere este egal cu (1 - α)x100%.


Unde pS- cota de probă a caracteristicii, egală cu X/n, adică numărul de succese împărțit la dimensiunea eșantionului, R- ponderea trăsăturii în populația generală, Z este valoarea critică a distribuției normale standardizate, n- marime de mostra.

Exemplul 3 Sa presupunem ca din sistemul informatic se extrage o proba, formata din 100 de facturi completate in ultima luna. Să presupunem că 10 dintre aceste facturi sunt incorecte. Prin urmare, R= 10/100 = 0,1. Nivelul de încredere de 95% corespunde valorii critice Z = 1,96.

Astfel, există o șansă de 95% ca între 4,12% și 15,88% din facturi să conțină erori.

Pentru o anumită dimensiune a eșantionului, intervalul de încredere care conține proporția trăsăturii în populația generală pare a fi mai larg decât pentru o variabilă aleatoare continuă. Acest lucru se datorează faptului că măsurătorile unei variabile aleatoare continue conțin mai multe informații decât măsurătorile datelor categorice. Cu alte cuvinte, datele categorice care iau doar două valori conțin informații insuficiente pentru a estima parametrii distribuției lor.

LAcalculul estimărilor extrase dintr-o populație finită

Estimarea așteptărilor matematice. Factorul de corecție pentru populația finală ( fpc) a fost folosit pentru a reduce eroarea standard cu un factor de . La calcularea intervalelor de încredere pentru estimările parametrilor populației, se aplică un factor de corecție în situațiile în care eșantioanele sunt extrase fără înlocuire. Astfel, intervalul de încredere pentru așteptarea matematică, având un nivel de încredere egal cu (1 - α)x100%, se calculează prin formula:

Exemplul 4 Pentru a ilustra aplicarea unui factor de corecție pentru o populație finită, să revenim la problema calculării intervalului de încredere pentru suma medie a facturilor discutată în exemplul 3 de mai sus. Să presupunem că o companie emite 5.000 de facturi pe lună și X= 110,27 USD, S= 28,95 USD N = 5000, n = 100, α = 0,05, t99 = 1,9842. Conform formulei (6) obținem:

Estimarea ponderii caracteristicii. Atunci când alegeți fără întoarcere, intervalul de încredere pentru proporția caracteristicii care are un nivel de încredere egal cu (1 - α)x100%, se calculează prin formula:

Intervale de încredere și probleme etice

Atunci când se eșantionează o populație și se formulează inferențe statistice, apar adesea probleme etice. Principalul este modul în care intervalele de încredere și estimările punctuale ale statisticilor eșantionului sunt de acord. Publicarea estimărilor punctului fără a specifica intervalele de încredere adecvate (de obicei la niveluri de încredere de 95%) și dimensiunea eșantionului din care sunt derivate pot fi înșelătoare. Acest lucru poate da utilizatorului impresia că o estimare punctuală este exact ceea ce are nevoie pentru a prezice proprietățile întregii populații. Astfel, este necesar să înțelegem că în orice cercetare, nu estimările punctuale, ci pe intervale ar trebui puse în prim plan. În plus, trebuie acordată o atenție deosebită alegerii corecte a dimensiunilor eșantionului.

Cel mai adesea, obiectele manipulărilor statistice sunt rezultatele anchetelor sociologice ale populației pe diverse probleme politice. În același timp, rezultatele sondajului sunt plasate pe primele pagini ale ziarelor, iar eroarea de eșantionare și metodologia analizei statistice sunt tipărite undeva la mijloc. Pentru a demonstra validitatea estimărilor punctuale obţinute este necesar să se indice mărimea eşantionului pe baza căruia au fost obţinute, limitele intervalului de încredere şi nivelul de semnificaţie al acestuia.

Următoarea notă

Sunt folosite materiale din cartea Levin et al. Statistici pentru manageri. - M.: Williams, 2004. - p. 448–462

Teorema limitei centrale afirmă că, având în vedere o dimensiune a eșantionului suficient de mare, distribuția eșantionului de medii poate fi aproximată printr-o distribuție normală. Această proprietate nu depinde de tipul de distribuție a populației.

Interval de încredere(CI; în engleză, interval de încredere - CI) obținut în studiu la eșantion oferă o măsură a acurateței (sau incertitudinii) rezultatelor studiului, pentru a trage concluzii despre populația tuturor acestor pacienți (populația generală). ). Definiția corectă a IC 95% poate fi formulată astfel: 95% dintre astfel de intervale vor conține valoarea adevărată în populație. Această interpretare este oarecum mai puțin precisă: CI este intervalul de valori în care puteți fi 95% sigur că conține valoarea adevărată. Când se utilizează CI, se pune accent pe determinarea efectului cantitativ, spre deosebire de valoarea P, care este obținută ca rezultat al testării semnificației statistice. Valoarea P nu evaluează nicio sumă, ci servește mai degrabă ca măsură a puterii dovezilor față de ipoteza nulă a „fără efect”. Valoarea lui P în sine nu ne spune nimic despre mărimea diferenței sau chiar despre direcția acesteia. Prin urmare, valorile independente ale lui P sunt absolut neinformative în articole sau rezumate. În schimb, CI indică atât cantitatea de efect de interes imediat, cum ar fi utilitatea unui tratament, cât și puterea dovezilor. Prin urmare, DI este direct legată de practicarea DM.

Abordarea estimativă a analizei statistice, ilustrată de CI, urmărește măsurarea mărimii efectului de interes (sensibilitatea testului de diagnostic, incidența prezisă, reducerea riscului relativ cu tratament etc.), precum și măsurarea incertitudinii în aceeași măsură. efect. Cel mai adesea, CI este intervalul de valori de pe ambele părți ale estimării în care este probabil să se află adevărata valoare și puteți fi 95% sigur de aceasta. Convenția de utilizare a probabilității de 95% este arbitrară, precum și valoarea lui P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI se bazează pe ideea că același studiu efectuat pe seturi diferite de pacienți nu ar produce rezultate identice, ci că rezultatele lor ar fi distribuite în jurul valorii adevărate, dar necunoscute. Cu alte cuvinte, CI descrie acest lucru drept „variabilitate dependentă de eșantion”. CI nu reflectă incertitudine suplimentară din alte cauze; în special, nu include impactul pierderii selective a pacienților asupra urmăririi, conformarea slabă sau măsurarea inexactă a rezultatului, lipsa orbirii etc. Astfel, CI subestimează întotdeauna cantitatea totală de incertitudine.

Calcul intervalului de încredere

Tabelul A1.1. Erori standard și intervale de încredere pentru unele măsurători clinice

De obicei, CI este calculată dintr-o estimare observată a unei măsuri cantitative, cum ar fi diferența (d) între două proporții și eroarea standard (SE) în estimarea acelei diferențe. CI de aproximativ 95% astfel obţinut este d ± 1,96 SE. Formula se modifică în funcție de natura măsurării rezultatului și de acoperirea IC. De exemplu, într-un studiu randomizat, controlat cu placebo, al vaccinului acelular împotriva pertussis, tusea convulsivă s-a dezvoltat la 72 din 1670 (4,3%) sugari care au primit vaccinul și 240 din 1665 (14,4%) din grupul de control. Diferența procentuală, cunoscută sub numele de reducerea absolută a riscului, este de 10,1%. SE a acestei diferențe este de 0,99%. În consecință, CI de 95% este 10,1% + 1,96 x 0,99%, i.e. de la 8.2 la 12.0.

În ciuda diferitelor abordări filozofice, CI și testele de semnificație statistică sunt strâns legate matematic.

Astfel, valoarea lui P este „semnificativă”, adică. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Incertitudinea (inecizia) estimării, exprimată în CI, este în mare măsură legată de rădăcina pătrată a dimensiunii eșantionului. Eșantioanele mici oferă mai puține informații decât eșantioanele mari, iar CI sunt în mod corespunzător mai largi la eșantioanele mai mici. De exemplu, un articol care compară performanța a trei teste utilizate pentru a diagnostica infecția cu Helicobacter pylori a raportat o sensibilitate la testul respirației cu uree de 95,8% (95% CI 75-100). În timp ce cifra de 95,8% pare impresionantă, dimensiunea mică a eșantionului a 24 de pacienți adulți cu H. pylori înseamnă că există o incertitudine semnificativă în această estimare, așa cum indică IC larg. Într-adevăr, limita inferioară de 75% este mult mai mică decât estimarea de 95,8%. Dacă s-ar observa aceeași sensibilitate la un eșantion de 240 de persoane, atunci IC de 95% ar fi 92,5-98,0, oferind mai multă asigurare că testul este foarte sensibil.

În studiile randomizate controlate (RCT), rezultatele nesemnificative (adică cele cu P > 0,05) sunt deosebit de susceptibile la interpretare greșită. CI este deosebit de util aici, deoarece indică cât de compatibile sunt rezultatele cu efectul real util din punct de vedere clinic. De exemplu, într-un RCT care compară sutura cu anastomoza cu capse în colon, infecția plăgii s-a dezvoltat la 10,9% și, respectiv, 13,5% dintre pacienți (P = 0,30). CI de 95% pentru această diferență este de 2,6% (de la -2 la +8). Chiar și în acest studiu, care a inclus 652 de pacienți, rămâne probabil să existe o diferență modestă în incidența infecțiilor rezultate din cele două proceduri. Cu cât studiul este mai mic, cu atât este mai mare incertitudinea. Sung și colab. a efectuat un RCT care a comparat perfuzia de octreotidă cu scleroterapia de urgență pentru sângerare variceală acută la 100 de pacienți. În grupul cu octreotidă, rata de oprire a sângerării a fost de 84%; în grupul de scleroterapie - 90%, ceea ce dă P = 0,56. Rețineți că ratele de sângerare continuă sunt similare cu cele ale infecției rănilor din studiul menționat. În acest caz, totuși, IC de 95% pentru diferența dintre intervenții este de 6% (-7 până la +19). Acest interval este destul de larg comparativ cu o diferență de 5% care ar fi de interes clinic. Este clar că studiul nu exclude o diferență semnificativă de eficacitate. Prin urmare, concluzia autorilor „infuzia de octreotidă și scleroterapia sunt la fel de eficiente în tratamentul sângerărilor de la varice” cu siguranță nu este valabilă. În cazuri ca acesta, în care IC de 95% pentru reducerea riscului absolut (ARR) include zero, ca aici, IC pentru NNT (numărul necesar pentru tratare) este destul de dificil de interpretat. NLP și CI sunt obținute din reciprocele ACP (înmulțindu-le cu 100 dacă aceste valori sunt date ca procente). Aici obținem NPP = 100: 6 = 16,6 cu un CI de 95% de la -14,3 la 5,3. După cum se poate vedea din nota de subsol „d” din tabel. A1.1, acest CI include valori pentru NTPP de la 5,3 la infinit și NTLP de la 14,3 la infinit.

CI pot fi construite pentru cele mai utilizate estimări sau comparații statistice. Pentru RCT, include diferența dintre proporțiile medii, riscurile relative, cotele de cote și NRR. În mod similar, CI pot fi obținute pentru toate estimările majore făcute în studiile de acuratețe a testelor de diagnosticare - sensibilitate, specificitate, valoare predictivă pozitivă (toate fiind proporții simple) și rapoarte de probabilitate - estimări obținute în meta-analize și comparație cu control. studii. Un program de calculator personal care acoperă multe dintre aceste utilizări ale DI este disponibil cu a doua ediție a Statistics with Confidence. Macro-urile pentru calcularea CI pentru proporții sunt disponibile gratuit pentru Excel și programele statistice SPSS și Minitab la http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Evaluări multiple ale efectului tratamentului

Deși construirea CI este de dorit pentru rezultatele primare ale unui studiu, acestea nu sunt necesare pentru toate rezultatele. CI se referă la comparații importante din punct de vedere clinic. De exemplu, când se compară două grupuri, CI corect este cel care este construit pentru diferența dintre grupuri, așa cum se arată în exemplele de mai sus, și nu CI care poate fi construit pentru estimarea în fiecare grup. Nu numai că este inutil să dai CI separate pentru scorurile din fiecare grup, dar această prezentare poate induce în eroare. În mod similar, abordarea corectă atunci când se compară eficacitatea tratamentului în diferite subgrupuri este de a compara direct două (sau mai multe) subgrupuri. Este incorect să presupunem că tratamentul este eficient doar într-un subgrup dacă CI exclude valoarea corespunzătoare fără efect, în timp ce altele nu. CI sunt utile și atunci când se compară rezultatele din mai multe subgrupuri. Pe fig. A1.1 arată riscul relativ de eclampsie la femeile cu preeclampsie în subgrupuri de femei dintr-un RCT controlat cu placebo de sulfat de magneziu.

Orez. A1.2. Graficul Forest arată rezultatele a 11 studii clinice randomizate ale vaccinului cu rotavirus bovin pentru prevenirea diareei comparativ cu placebo. Intervalul de încredere de 95% a fost utilizat pentru a estima riscul relativ de diaree. Dimensiunea pătratului negru este proporțională cu cantitatea de informații. În plus, sunt prezentate o estimare sumară a eficacității tratamentului și un interval de încredere de 95% (indicat cu un romb). Meta-analiza a folosit un model cu efecte aleatoare care le depășește pe unele prestabilite; de exemplu, ar putea fi dimensiunea utilizată la calcularea mărimii eșantionului. Conform unui criteriu mai strict, întreaga gamă de CI trebuie să prezinte un beneficiu care depășește un minim predeterminat.

Am discutat deja eroarea de a lua absența semnificației statistice ca un indiciu că două tratamente sunt la fel de eficiente. Este la fel de important să nu echivalăm semnificația statistică cu semnificația clinică. Importanța clinică poate fi asumată atunci când rezultatul este semnificativ statistic și amploarea răspunsului la tratament

Studiile pot arăta dacă rezultatele sunt semnificative din punct de vedere statistic și care sunt importante din punct de vedere clinic și care nu. Pe fig. A1.2 arată rezultatele a patru studii pentru care întregul CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Din acest articol veți învăța:

    Ce interval de încredere?

    Care este scopul regulile 3 sigma?

    Cum pot fi puse în practică aceste cunoștințe?

În prezent, datorită unei supraabundențe de informații asociate cu o gamă largă de produse, direcții de vânzare, angajați, activități etc., este greu să alegi principalul, care, în primul rând, merită să-i acordăm atenție și să depunem eforturi pentru a-l gestiona. Definiție interval de încredereși analiza depășirii limitelor valorilor reale - o tehnică care vă ajută să identificați situațiile, influențarea tendințelor. Veți putea dezvolta factori pozitivi și reduce influența celor negativi. Această tehnologie este utilizată în multe companii mondiale binecunoscute.

Există așa-zise alerte", care informează managerii afirmând că următoarea valoare într-o anumită direcție a trecut dincolo interval de încredere. Ce inseamna asta? Acesta este un semnal că a avut loc un eveniment nestandard, care poate schimba tendința existentă în această direcție. Acesta este semnalul la asta pentru a o rezolvaîn situație și înțelegeți ce a influențat-o.

De exemplu, luați în considerare mai multe situații. Am calculat prognoza vânzărilor cu limitele prognozate pentru 100 de articole de mărfuri pentru 2011 pe luni și vânzările reale în martie:

  1. Pentru „Uleiul de floarea soarelui” au depășit limita superioară a prognozei și nu au intrat în intervalul de încredere.
  2. Pentru „Drojdie uscată” a depășit limita inferioară a prognozei.
  3. Pe „Teci de ovăz” a depășit limita superioară.

Pentru restul mărfurilor, vânzările efective s-au încadrat în limitele de prognoză specificate. Acestea. vânzările lor au fost în conformitate cu așteptările. Așadar, am identificat 3 produse care au depășit granițele și am început să ne dăm seama ce a influențat trecerea dincolo de granițe:

  1. Cu uleiul de floarea soarelui, am intrat într-o nouă rețea de tranzacționare, care ne-a oferit un volum suplimentar de vânzări, ceea ce a dus la depășirea limitei superioare. Pentru acest produs, merită să recalculăm prognoza până la sfârșitul anului, ținând cont de prognoza de vânzări către acest lanț.
  2. Pentru Dry Yeast, mașina a rămas blocată la vamă, iar în 5 zile a existat un deficit, ceea ce a afectat scăderea vânzărilor și depășirea frontierei inferioare. Ar putea fi util să vă dați seama ce a cauzat cauza și să încercați să nu repetați această situație.
  3. Pentru Oatmeal a fost lansată o promoție de vânzări, care a avut ca rezultat o creștere semnificativă a vânzărilor și a dus la o depășire a prognozei.

Am identificat 3 factori care au influențat depășirea prognozei. Pot fi mult mai multe în viață.Pentru a îmbunătăți acuratețea prognozei și a planificării, factorii care duc la faptul că vânzările efective pot depăși previziunile, merită să evidențiem și să construim previziuni și planuri pentru ele separat. Și apoi luați în considerare impactul lor asupra prognozei principale de vânzări. De asemenea, puteți evalua în mod regulat impactul acestor factori și puteți schimba situația în bine prin reducerea influenței factorilor negativi și creșterea influenței factorilor pozitivi.

Cu un interval de încredere, putem:

  1. Evidențiați destinațiile, cărora merită să le acordați atenție, pentru că în aceste zone au avut loc evenimente care pot afecta schimbare de tendință.
  2. Determinați factorii care chiar fac diferența.
  3. A accepta decizie ponderată(de exemplu, despre achiziții, când planificați etc.).

Acum să ne uităm la ce este un interval de încredere și cum să-l calculăm în Excel folosind un exemplu.

Ce este un interval de încredere?

Intervalul de încredere reprezintă limitele de prognoză (superioare și inferioare), în cadrul cărora cu o probabilitate dată (sigma) obțineți valorile reale.

Acestea. calculăm prognoza - acesta este principalul nostru reper, dar înțelegem că este puțin probabil ca valorile reale să fie 100% egale cu prognoza noastră. Și se pune întrebarea în ce măsură poate obține valori reale, dacă tendința actuală continuă? Și această întrebare ne va ajuta să răspundem calculul intervalului de încredere, adică - limitele superioare și inferioare ale prognozei.

Ce este o probabilitate sigma dată?

La calcul interval de încredere putem probabilitate stabilită lovituri valori reale în limitele date de prognoză. Cum să o facă? Pentru a face acest lucru, setăm valoarea lui sigma și, dacă sigma este egal cu:

    3 sigma- atunci, probabilitatea de a atinge următoarea valoare reală în intervalul de încredere va fi de 99,7%, sau 300 la 1, sau există o probabilitate de 0,3% de a depăși limitele.

    2 sigma- atunci, probabilitatea de a atinge următoarea valoare în limite este ≈ 95,5%, i.e. șansele sunt de aproximativ 20 la 1 sau există o șansă de 4,5% să ieși din limite.

    1 sigma- atunci, probabilitatea este ≈ 68,3%, i.e. șansele sunt de aproximativ 2 la 1, sau există o șansă de 31,7% ca următoarea valoare să cadă în afara intervalului de încredere.

Noi am formulat Regula 3 Sigma,care spune că probabilitatea de lovire o altă valoare aleatorie în intervalul de încredere cu o valoare dată trei sigma este 99,7%.

Marele matematician rus Cebyshev a demonstrat o teoremă conform căreia există o șansă de 10% de a depăși granițele unei prognoze cu o valoare dată de trei sigma. Acestea. probabilitatea de a se încadra în intervalul de încredere de 3 sigma va fi de cel puțin 90%, în timp ce o încercare de a calcula prognoza și limitele acesteia „cu ochi” este plină de erori mult mai semnificative.

Cum se calculează independent intervalul de încredere în Excel?

Să luăm în considerare calculul intervalului de încredere în Excel (adică limitele superioare și inferioare ale prognozei) folosind un exemplu. Avem o serie de timp - vânzări pe luni timp de 5 ani. Vezi fisierul atasat.

Pentru a calcula limitele prognozei, calculăm:

  1. Prognoza de vânzări().
  2. Sigma - abatere standard modele de prognoză din valori reale.
  3. Trei sigma.
  4. Interval de încredere.

1. Prognoza vânzărilor.

=(RC[-14] (date în serii de timp)-RC[-1] (valoarea modelului))^2(pătrat)


3. Însumați pentru fiecare lună valorile abaterii de la etapa 8 Sum((Xi-Ximod)^2), adică Să însumăm ianuarie, februarie... pentru fiecare an.

Pentru a face acest lucru, utilizați formula =SUMIF()

SUMIF(matrice cu numere de perioade din interiorul ciclului (pentru luni de la 1 la 12); referință la numărul perioadei din ciclu; referință la o matrice cu pătrate ale diferenței dintre datele inițiale și valorile perioade)


4. Calculați abaterea standard pentru fiecare perioadă din ciclu de la 1 la 12 (etapa 10 in fisierul atasat).

Pentru a face acest lucru, din valoarea calculată la etapa 9, extragem rădăcina și împărțim la numărul de perioade din acest ciclu minus 1 = ROOT((Suma(Xi-Ximod)^2/(n-1))

Să folosim formule în Excel =ROOT(R8 (referire la (Suma(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (referință la o matrice cu numere de ciclu); O8 (referință la un anumit număr de ciclu, pe care îl considerăm în matrice))-1))

Folosind formula Excel = COUNTIF numărăm numărul n


Prin calcularea abaterii standard a datelor reale de la modelul de prognoză, am obținut valoarea sigma pentru fiecare lună - etapa 10 in fisierul atasat.

3. Calculați 3 sigma.

La etapa 11, setăm numărul de sigma - în exemplul nostru, „3” (etapa 11 in fisierul atasat):

De asemenea, valori practice sigma:

1,64 sigma - 10% sanse de a depasi limita (1 sansa din 10);

1,96 sigma - 5% șanse de a ieși din limite (1 șansă din 20);

2,6 sigma - 1% șansă de a ieși din limite (1 șansă din 100).

5) Calculăm trei sigma, pentru aceasta înmulțim valorile „sigma” pentru fiecare lună cu „3”.

3. Determinați intervalul de încredere.

  1. Limită superioară de prognoză- previziunea vanzarilor tinand cont de crestere si sezonalitate + (plus) 3 sigma;
  2. Limită inferioară de prognoză- prognoza vânzărilor ținând cont de creștere și sezonalitate - (minus) 3 sigma;

Pentru comoditatea calculării intervalului de încredere pentru o perioadă lungă (vezi fișierul atașat), folosim formula Excel =Y8+CĂUTAREV(W8;8$U$:19$V$;2;0), Unde

Y8- Prognoza de vânzări;

W8- numarul lunii pentru care vom lua valoarea de 3 sigma;

Acestea. Limită superioară de prognoză= „prognoza vânzărilor” + „3 sigma” (în exemplu, CĂUTARE V (numărul lunii; tabel cu valori 3 sigma; coloană din care extragem valoarea sigma egală cu numărul lunii din rândul corespunzător; 0)).

Limită inferioară de prognoză= „prognoza vânzărilor” minus „3 sigma”.

Deci, am calculat intervalul de încredere în Excel.

Acum avem o prognoză și un interval cu limite în care valorile reale vor cădea cu o anumită probabilitate sigma.

În acest articol, am analizat ce sunt sigma și regula trei sigma, cum să determinați un interval de încredere și pentru ce puteți folosi această tehnică în practică.

Prognoze precise și succes pentru tine!

Cum Forecast4AC PRO vă poate ajutala calcularea intervalului de încredere?:

    Forecast4AC PRO va calcula automat limitele superioare sau inferioare de prognoză pentru mai mult de 1000 de serii temporale în același timp;

    Capacitatea de a analiza limitele prognozei în comparație cu prognoza, tendința și vânzările reale pe diagramă cu o singură apăsare de tastă;

În programul Forcast4AC PRO, este posibil să setați valoarea sigma de la 1 la 3.

Alăturaţi-ne!

Descărcați aplicații gratuite de prognoză și Business Intelligence:


  • Novo Forecast Lite- automată calculul prognozeiîn excela.
  • 4analitica- Analiza ABC-XYZși analiza emisiilor în Excela.
  • Qlik Sense Desktop și Qlik ViewPersonal Edition - sisteme BI pentru analiza și vizualizarea datelor.

Testați caracteristicile soluțiilor plătite:

  • Novo Forecast PRO- prognoza in Excel pentru matrice mari de date.