Vypočítajte interval spoľahlivosti. Výpočet intervalu spoľahlivosti v programe Microsoft Excel

"Katren-Style" pokračuje v publikovaní cyklu Konstantina Kravchika o lekárskych štatistikách. V dvoch predchádzajúcich článkoch sa autor dotkol vysvetlenia takých pojmov ako a.

Konštantín Kravčík

Matematik-analytik. Špecialista v oblasti štatistického výskumu v medicíne a humanitných vedách

Mesto Moskva

Veľmi často v článkoch o klinických štúdiách nájdete záhadnú frázu: „interval spoľahlivosti“ (95% CI alebo 95% CI - interval spoľahlivosti). Napríklad článok môže znieť: „Na posúdenie významnosti rozdielov sa použil študentský t-test s vypočítaným 95 % intervalom spoľahlivosti.“

Aká je hodnota „intervalu spoľahlivosti 95 %“ a prečo ho počítať?

Čo je interval spoľahlivosti? - Toto je rozsah, do ktorého spadajú skutočné priemerné hodnoty v populácii. A čo, existujú "nepravdivé" priemery? V istom zmysle áno. Vysvetlili sme, že nie je možné merať parameter záujmu v celej populácii, takže výskumníci sa uspokojili s obmedzenou vzorkou. V tejto vzorke (napríklad podľa telesnej hmotnosti) existuje jedna priemerná hodnota (určitá hmotnosť), podľa ktorej posudzujeme priemernú hodnotu v celej bežnej populácii. Je však nepravdepodobné, že by sa priemerná hmotnosť vo vzorke (najmä malej) zhodovala s priemernou hmotnosťou vo všeobecnej populácii. Preto je správnejšie vypočítať a použiť rozsah priemerných hodnôt bežnej populácie.

Predpokladajme napríklad, že 95 % interval spoľahlivosti (95 % CI) pre hemoglobín je medzi 110 a 122 g/l. To znamená, že s 95 % pravdepodobnosťou bude skutočná stredná hodnota hemoglobínu v bežnej populácii v rozmedzí od 110 do 122 g/l. Inými slovami, nepoznáme priemerný hemoglobín v bežnej populácii, ale s 95% pravdepodobnosťou môžeme určiť rozsah hodnôt pre túto vlastnosť.

Intervaly spoľahlivosti sú obzvlášť dôležité pre rozdiel v priemeroch medzi skupinami alebo to, čo sa nazýva veľkosť účinku.

Predpokladajme, že sme porovnali účinnosť dvoch prípravkov železa: jedného, ​​ktorý je na trhu už dlho, a jedného, ​​ktorý je práve zaregistrovaný. Po ukončení terapie bola zhodnotená koncentrácia hemoglobínu v skúmaných skupinách pacientov a štatistický program nám vypočítal, že rozdiel medzi priemernými hodnotami oboch skupín s pravdepodobnosťou 95 % je v rozmedzí od 1,72 až 14,36 g/l (tabuľka 1).

Tab. 1. Kritérium pre nezávislé vzorky
(skupiny sa porovnávajú podľa hladiny hemoglobínu)

Treba to interpretovať nasledovne: u časti pacientov z bežnej populácie, ktorí užívajú nový liek, bude hemoglobín vyšší v priemere o 1,72–14,36 g/l ako u tých, ktorí užili už známy liek.

Inými slovami, vo všeobecnej populácii je rozdiel v priemerných hodnotách hemoglobínu v skupinách s 95% pravdepodobnosťou v rámci týchto limitov. Či je to veľa alebo málo, posúdi bádateľ. Pointou toho všetkého je, že nepracujeme s jednou priemernou hodnotou, ale s rozsahom hodnôt, preto spoľahlivejšie odhadneme rozdiel v parametri medzi skupinami.

V štatistických balíkoch, podľa uváženia výskumníka, je možné nezávisle zúžiť alebo rozšíriť hranice intervalu spoľahlivosti. Znižovaním pravdepodobností intervalu spoľahlivosti zužujeme rozsah priemerov. Napríklad pri 90 % CI bude rozsah priemerov (alebo priemerných rozdielov) užší ako pri 95 % CI.

Naopak, zvýšenie pravdepodobnosti na 99 % rozširuje rozsah hodnôt. Pri porovnávaní skupín môže spodná hranica CI prekročiť nulovú značku. Napríklad, ak sme rozšírili hranice intervalu spoľahlivosti na 99 %, potom sa hranice intervalu pohybovali od –1 do 16 g/l. To znamená, že vo všeobecnej populácii existujú skupiny, medzi ktorými je rozdiel medzi priemermi pre skúmaný znak 0 (M=0).

Intervaly spoľahlivosti možno použiť na testovanie štatistických hypotéz. Ak interval spoľahlivosti prekročí nulu, potom platí nulová hypotéza, ktorá predpokladá, že skupiny sa v skúmanom parametri nelíšia. Príklad je popísaný vyššie, keď sme rozšírili hranice na 99%. Niekde v bežnej populácii sme našli skupiny, ktoré sa nijako nelíšili.

95 % interval spoľahlivosti rozdielu hemoglobínu, (g/l)


Obrázok znázorňuje 95 % interval spoľahlivosti priemerného hemoglobínového rozdielu medzi týmito dvoma skupinami ako čiaru. Čiara prechádza cez nulovú značku, preto je rozdiel medzi priemermi rovný nule, čo potvrdzuje nulovú hypotézu, že skupiny sa nelíšia. Rozdiel medzi skupinami sa pohybuje od -2 do 5 g/l, čo znamená, že hemoglobín sa môže buď znížiť o 2 g/l, alebo zvýšiť o 5 g/l.

Interval spoľahlivosti je veľmi dôležitým ukazovateľom. Vďaka nej môžete vidieť, či rozdiely v skupinách boli naozaj spôsobené rozdielom v priemeroch alebo kvôli veľkej vzorke, pretože pri veľkej vzorke je šanca nájsť rozdiely väčšia ako pri malej.

V praxi to môže vyzerať takto. Odobrali sme vzorku 1000 ľudí, zmerali sme hladinu hemoglobínu a zistili sme, že interval spoľahlivosti pre rozdiel v priemeroch leží od 1,2 do 1,5 g/l. Hladina štatistickej významnosti v tomto prípade p

Vidíme, že koncentrácia hemoglobínu sa zvýšila, ale takmer nebadateľne, preto sa štatistická významnosť prejavila práve kvôli veľkosti vzorky.

Intervaly spoľahlivosti možno vypočítať nielen pre priemery, ale aj pre podiely (a rizikové pomery). Zaujíma nás napríklad interval spoľahlivosti podielov pacientov, ktorí dosiahli remisiu pri užívaní vyvinutého lieku. Predpokladajme, že 95 % CI pre proporcie, t. j. pre podiel takýchto pacientov, je v rozmedzí 0,60–0,80. Môžeme teda povedať, že náš liek má terapeutický účinok v 60 až 80 % prípadov.

Myseľ nie je len vo vedomostiach, ale aj v schopnosti aplikovať poznatky v praxi. (Aristoteles)

Intervaly spoľahlivosti

všeobecný prehľad

Odoberaním vzorky z populácie získame bodový odhad parametra, ktorý nás zaujíma, a vypočítame štandardnú chybu, aby sme naznačili presnosť odhadu.

Vo väčšine prípadov však štandardná chyba ako taká nie je prijateľná. Je oveľa užitočnejšie skombinovať túto mieru presnosti s intervalovým odhadom pre parameter populácie.

Dá sa to urobiť pomocou znalosti teoretického rozdelenia pravdepodobnosti štatistiky vzorky (parametra) na výpočet intervalu spoľahlivosti (CI - interval spoľahlivosti, CI - interval spoľahlivosti) pre parameter.

Vo všeobecnosti interval spoľahlivosti rozširuje odhady v oboch smeroch o nejaký násobok štandardnej chyby (daného parametra); dve hodnoty (limity spoľahlivosti), ktoré definujú interval, sú zvyčajne oddelené čiarkou a uzavreté v zátvorkách.

Interval spoľahlivosti pre priemer

Použitie normálneho rozdelenia

Ak je veľkosť vzorky veľká, má výberová priemerná distribúciu normálnu distribúciu, takže znalosť normálnej distribúcie možno použiť pri zvažovaní priemernej vzorky.

Najmä 95 % distribúcie priemeru vzorky je v rámci 1,96 štandardnej odchýlky (SD) priemeru populácie.

Keď máme iba jednu vzorku, nazývame to štandardná chyba priemeru (SEM) a vypočítame 95% interval spoľahlivosti pre priemer takto:

Ak sa tento experiment opakuje niekoľkokrát, interval bude obsahovať skutočný priemer populácie 95 % času.

Zvyčajne ide o interval spoľahlivosti, ako je rozsah hodnôt, v rámci ktorého skutočný priemer populácie (všeobecný priemer) leží s úrovňou spoľahlivosti 95 %.

Aj keď nie je celkom striktné (priemer populácie je pevná hodnota, a preto s ňou nemôže súvisieť pravdepodobnosť), interpretovať interval spoľahlivosti týmto spôsobom, je koncepčne ľahšie pochopiteľné.

Použitie t- distribúcia

Ak poznáte hodnotu rozptylu v populácii, môžete použiť normálne rozdelenie. Ak je veľkosť vzorky malá, priemer vzorky sleduje normálne rozdelenie, ak sú údaje, ktoré sú základom populácie, normálne rozdelené.

Ak údaje, ktoré sú základom populácie, nie sú normálne rozdelené a/alebo všeobecný rozptyl (rozptyl populácie) nie je známy, priemer vzorky sa riadi Študentovo t-rozdelenie.

Vypočítajte 95 % interval spoľahlivosti pre priemer populácie takto:

Kde – percentuálny bod (percentil) t-Študentské rozdelenie s (n-1) stupňami voľnosti, ktoré dáva obojstrannú pravdepodobnosť 0,05.

Vo všeobecnosti poskytuje širší interval ako pri použití normálneho rozdelenia, pretože berie do úvahy dodatočnú neistotu, ktorá je zavedená odhadom štandardnej odchýlky populácie a/alebo v dôsledku malej veľkosti vzorky.

Keď je veľkosť vzorky veľká (rádovo 100 alebo viac), rozdiel medzi týmito dvoma distribúciami ( t-študent a normálne) je zanedbateľné. Vždy však používajte t- pri výpočte intervalov spoľahlivosti, aj keď je veľkosť vzorky veľká.

Zvyčajne je indikovaný 95% CI. Môžu sa vypočítať ďalšie intervaly spoľahlivosti, ako napríklad 99 % CI pre priemer.

Namiesto súčinu štandardnej chyby a tabuľkovej hodnoty t- rozdelenie, ktoré zodpovedá obojstrannej pravdepodobnosti 0,05, vynásobte ho (štandardná chyba) hodnotou, ktorá zodpovedá obojstrannej pravdepodobnosti 0,01. Toto je širší interval spoľahlivosti ako v prípade 95 %, pretože odráža zvýšenú istotu, že interval skutočne zahŕňa priemer populácie.

Interval spoľahlivosti pre pomer

Výberové rozdelenie proporcií má binomické rozdelenie. Ak však veľkosť vzorky n primerane veľké, potom je podielové rozdelenie vzorky približne normálne so strednou hodnotou .

Odhad podľa vzorkovacieho pomeru p=r/n(kde r- počet jednotlivcov vo vzorke s charakteristikami, ktoré nás zaujímajú) a odhaduje sa štandardná chyba:

95 % interval spoľahlivosti pre podiel sa odhaduje:

Ak je veľkosť vzorky malá (zvyčajne keď np alebo n(1-p) menšie 5 ), potom sa na výpočet presných intervalov spoľahlivosti musí použiť binomické rozdelenie.

Všimnite si, že ak p vyjadrené v percentách, teda (1-p) nahradený (100p).

Interpretácia intervalov spoľahlivosti

Pri interpretácii intervalu spoľahlivosti nás zaujímajú nasledujúce otázky:

Aký široký je interval spoľahlivosti?

Široký interval spoľahlivosti naznačuje, že odhad je nepresný; úzky označuje dobrý odhad.

Šírka intervalu spoľahlivosti závisí od veľkosti štandardnej chyby, ktorá zase závisí od veľkosti vzorky, a pri zvažovaní numerickej premennej z variability údajov uveďte širšie intervaly spoľahlivosti ako štúdie veľkého súboru údajov niekoľkých málo premenné.

Obsahuje KI nejaké hodnoty, ktoré sú mimoriadne zaujímavé?

Môžete skontrolovať, či pravdepodobná hodnota parametra populácie spadá do intervalu spoľahlivosti. Ak áno, potom sú výsledky v súlade s touto pravdepodobnou hodnotou. Ak nie, potom je nepravdepodobné (pre 95 % interval spoľahlivosti je šanca takmer 5 %), že parameter má túto hodnotu.

Predpokladajme, že máme veľké množstvo položiek s normálnym rozložením niektorých charakteristík (napríklad plný sklad zeleniny rovnakého druhu, ktorej veľkosť a hmotnosť sa líšia). Chcete vedieť priemerné vlastnosti celej šarže tovaru, no nemáte čas ani chuť každú zeleninu merať a vážiť. Chápete, že to nie je potrebné. Koľko kusov by ste však potrebovali zobrať na náhodnú kontrolu?

Pred uvedením niektorých vzorcov užitočných pre túto situáciu si pripomenieme niekoľko zápisov.

Po prvé, ak by sme zmerali celý sklad zeleniny (tento súbor prvkov sa nazýva všeobecná populácia), potom by sme so všetkou presnosťou, ktorú máme k dispozícii, poznali priemernú hodnotu hmotnosti celej dávky. Nazvime to priemer X porov .g en . - všeobecný priemer. Už vieme, čo je úplne určené, ak je známa jeho stredná hodnota a odchýlka s . Pravda, zatiaľ nie sme ani X priem., ani s bežnú populáciu nepoznáme. Môžeme odobrať iba určitú vzorku, zmerať hodnoty, ktoré potrebujeme, a vypočítať pre túto vzorku strednú hodnotu X sr vo vzorke aj smerodajnú odchýlku S sb.

Je známe, že ak naša vlastná kontrola obsahuje veľký počet prvkov (zvyčajne n je väčšie ako 30), a sú brané naozaj náhodné, potom s všeobecná populácia sa takmer nebude líšiť od S ..

Okrem toho v prípade normálneho rozdelenia môžeme použiť nasledujúce vzorce:

S pravdepodobnosťou 95%


S pravdepodobnosťou 99%



Vo všeobecnosti s pravdepodobnosťou Р (t)


Vzťah medzi hodnotou t a hodnotou pravdepodobnosti P (t), s ktorou chceme poznať interval spoľahlivosti, môžeme získať z nasledujúcej tabuľky:


Zistili sme teda, v akom rozmedzí sa pohybuje priemerná hodnota pre všeobecnú populáciu (s danou pravdepodobnosťou).

Pokiaľ nemáme dostatočne veľkú vzorku, nemôžeme tvrdiť, že populácia má s = S sel. Okrem toho je v tomto prípade problematická blízkosť vzorky k normálnemu rozdeleniu. V tomto prípade namiesto toho použite aj S sb s vo vzorci:




ale hodnota t pre pevnú pravdepodobnosť P(t) bude závisieť od počtu prvkov vo vzorke n. Čím väčšie n, tým bližšie bude výsledný interval spoľahlivosti k hodnote danej vzorcom (1). Hodnoty t sú v tomto prípade prevzaté z inej tabuľky (Studentov t-test), ktorú uvádzame nižšie:

Hodnoty študentského t-testu pre pravdepodobnosť 0,95 a 0,99


Príklad 3 Zo zamestnancov firmy bolo náhodne vybraných 30 ľudí. Podľa vzorky sa ukázalo, že priemerná mzda (za mesiac) je 30 000 rubľov s priemernou štvorcovou odchýlkou ​​5 000 rubľov. S pravdepodobnosťou 0,99 určte priemernú mzdu vo firme.

rozhodnutie: Podľa podmienky máme n = 30, X porov. = 30 000, S = 5 000, P = 0,99. Na zistenie intervalu spoľahlivosti používame vzorec zodpovedajúci kritériu študenta. Podľa tabuľky pre n \u003d 30 a P \u003d 0,99 teda nájdeme t \u003d 2,756,


tie. želaná dôvera interval 27484< Х ср.ген < 32516.

Takže s pravdepodobnosťou 0,99 možno tvrdiť, že interval (27484; 32516) obsahuje priemernú mzdu vo firme.

Dúfame, že túto metódu použijete bez toho, aby ste museli mať vždy pri sebe tabuľku. Výpočty je možné vykonávať automaticky v Exceli. V súbore Excel kliknite na tlačidlo fx v hornej ponuke. Potom vyberte medzi funkciami typ "štatistická" az navrhovaného zoznamu v rámčeku - STEUDRASP. Potom na výzvu umiestnením kurzora do poľa "pravdepodobnosť" zadajte hodnotu recipročnej pravdepodobnosti (to znamená, že v našom prípade namiesto pravdepodobnosti 0,95 musíte zadať pravdepodobnosť 0,05). Očividne je tabuľka navrhnutá tak, aby výsledok odpovedal na otázku, aká je pravdepodobnosť, že sa môžeme mýliť. Podobne do poľa „stupeň voľnosti“ zadajte hodnotu (n-1) pre vašu vzorku.

Jednou z metód riešenia štatistických problémov je výpočet intervalu spoľahlivosti. Používa sa ako preferovaná alternatíva k bodovému odhadu, keď je veľkosť vzorky malá. Treba poznamenať, že proces výpočtu intervalu spoľahlivosti je pomerne komplikovaný. Ale nástroje programu Excel vám umožňujú trochu zjednodušiť. Poďme zistiť, ako sa to robí v praxi.

Táto metóda sa používa pri intervalovom odhade rôznych štatistických veličín. Hlavnou úlohou tohto výpočtu je zbaviť sa neistôt bodového odhadu.

V Exceli existujú dve hlavné možnosti výpočtu pomocou tejto metódy: keď je rozptyl známy a keď nie je známy. V prvom prípade sa funkcia používa na výpočty NORMÁLNA DÔVERA a v druhom DÔVEROVAŤ.ŠTUDENT.

Metóda 1: Funkcia CONFIDENCE NORM

Operátor NORMÁLNA DÔVERA, ktorý odkazuje na štatistickú skupinu funkcií, sa prvýkrát objavil v Exceli 2010. Staršie verzie tohto programu používajú jeho náprotivok DÔVEROVAŤ. Úlohou tohto operátora je vypočítať interval spoľahlivosti s normálnym rozdelením pre priemer populácie.

Jeho syntax je nasledovná:

CONFIDENCE NORM(alfa; štandardný_vývoj; veľkosť)

"alfa" je argument označujúci úroveň významnosti, ktorá sa používa na výpočet úrovne spoľahlivosti. Úroveň spoľahlivosti sa rovná nasledujúcemu výrazu:

(1-"Alfa")*100

"Štandardná odchýlka" je argument, ktorého podstata je jasná už z názvu. Toto je štandardná odchýlka navrhovanej vzorky.

"Veľkosť" je argument, ktorý určuje veľkosť vzorky.

Všetky argumenty pre tento operátor sú povinné.

Funkcia DÔVEROVAŤ má presne tie isté argumenty a možnosti ako ten predchádzajúci. Jeho syntax je:

TRUST(alfa; štandardný_vývoj; veľkosť)

Ako vidíte, rozdiely sú len v názve operátora. Táto funkcia bola zachovaná v Exceli 2010 a novších verziách v špeciálnej kategórii z dôvodov kompatibility. "kompatibilita". Vo verziách Excelu 2007 a starších sa nachádza v hlavnej skupine štatistických operátorov.

Hranica intervalu spoľahlivosti sa určí pomocou vzorca v nasledujúcom tvare:

X+(-)NORMALNA DÔVERY

Kde X je priemer vzorky, ktorý sa nachádza v strede zvoleného rozsahu.

Teraz sa pozrime na to, ako vypočítať interval spoľahlivosti pomocou konkrétneho príkladu. Uskutočnilo sa 12 testov, ktorých výsledkom boli rôzne výsledky, ktoré sú uvedené v tabuľke. Toto je naša totalita. Štandardná odchýlka je 8. Musíme vypočítať interval spoľahlivosti na úrovni spoľahlivosti 97 %.

  1. Vyberte bunku, kde sa zobrazí výsledok spracovania údajov. Kliknutím na tlačidlo "Vložiť funkciu".
  2. Objaví sa Sprievodca funkciou. Prejdite do kategórie "štatistické" a zvýraznite názov "CONFIDENCE.NORM". Potom kliknite na tlačidlo OK.
  3. Otvorí sa okno s argumentmi. Jeho polia prirodzene zodpovedajú názvom argumentov.
    Nastavte kurzor na prvé pole - "alfa". Tu by sme mali špecifikovať úroveň významnosti. Ako si pamätáme, naša úroveň dôvery je 97%. Zároveň sme povedali, že sa počíta takto:

    (1-úroveň dôvery)/100

    To znamená, že dosadením hodnoty dostaneme:

    Jednoduchými výpočtami zistíme, že argument "alfa" rovná sa 0,03 . Zadajte túto hodnotu do poľa.

    Ako viete, štandardná odchýlka sa rovná 8 . Preto v teréne "Štandardná odchýlka" stačí napísať to číslo.

    V teréne "Veľkosť" musíte zadať počet prvkov vykonaných testov. Ako si pamätáme, oni 12 . Aby sme ale vzorec zautomatizovali a neupravovali ho pri každom novom teste, nastavme túto hodnotu nie na obyčajné číslo, ale pomocou operátora KONTROLA. Takže umiestnime kurzor do poľa "Veľkosť" a potom kliknite na trojuholník, ktorý sa nachádza naľavo od riadka vzorcov.

    Zobrazí sa zoznam naposledy použitých funkcií. Ak prevádzkovateľ KONTROLA ktorý ste nedávno použili, mal by byť na tomto zozname. V tomto prípade stačí kliknúť na jeho názov. V opačnom prípade, ak to nenájdete, prejdite k veci "Viac funkcií...".

  4. Zdá sa nám to už povedomé Sprievodca funkciou. Presun späť do skupiny "štatistické". Tam vyberieme meno "KONTROLA". Kliknite na tlačidlo OK.
  5. Zobrazí sa okno argumentov pre vyššie uvedený operátor. Táto funkcia je určená na výpočet počtu buniek v určenom rozsahu, ktoré obsahujú číselné hodnoty. Jeho syntax je nasledovná:

    COUNT(hodnota1; hodnota2;…)

    Skupina argumentov "hodnoty" je odkaz na rozsah, v ktorom chcete vypočítať počet buniek vyplnených číselnými údajmi. Celkovo môže byť takýchto argumentov až 255, no v našom prípade potrebujeme len jeden.

    Nastavte kurzor do poľa "Hodnota 1" a podržaním ľavého tlačidla myši vyberte rozsah na hárku, ktorý obsahuje našu populáciu. Potom sa v poli zobrazí jeho adresa. Kliknite na tlačidlo OK.

  6. Potom aplikácia vykoná výpočet a výsledok zobrazí v bunke, kde sa nachádza. V našom konkrétnom prípade vzorec dopadol takto:

    CONFIDENCE NORM(0,03;8;POČET(B2:B13))

    Celkový výsledok výpočtov bol 5,011609 .

  7. To však nie je všetko. Ako si pamätáme, hranica intervalu spoľahlivosti sa vypočíta pripočítaním a odčítaním od priemernej hodnoty vzorky výsledku výpočtu NORMÁLNA DÔVERA. Týmto spôsobom sa vypočíta pravá a ľavá hranica intervalu spoľahlivosti, resp. Samotný výberový priemer možno vypočítať pomocou operátora PRIEMERNÝ.

    Tento operátor je určený na výpočet aritmetického priemeru zvoleného rozsahu čísel. Má nasledujúcu pomerne jednoduchú syntax:

    AVERAGE(číslo1; číslo2;…)

    Argumentovať "číslo" môže byť buď jedna číselná hodnota alebo odkaz na bunky alebo dokonca celé rozsahy, ktoré ich obsahujú.

    Vyberte teda bunku, v ktorej sa zobrazí výpočet priemernej hodnoty, a kliknite na tlačidlo "Vložiť funkciu".

  8. otvára Sprievodca funkciou. Späť do kategórie "štatistické" a vyberte meno zo zoznamu "Priemerný". Ako vždy kliknite na tlačidlo OK.
  9. Spustí sa okno argumentov. Nastavte kurzor do poľa "Číslo 1" a so stlačeným ľavým tlačidlom myši vyberte celý rozsah hodnôt. Po zobrazení súradníc v poli kliknite na tlačidlo OK.
  10. Potom PRIEMERNÝ vypíše výsledok výpočtu do prvku listu.
  11. Vypočítame pravú hranicu intervalu spoľahlivosti. Ak to chcete urobiť, vyberte samostatnú bunku a vložte znamienko «=» a pridajte obsah prvkov listu, v ktorom sa nachádzajú výsledky výpočtu funkcií PRIEMERNÝ a NORMÁLNA DÔVERA. Ak chcete vykonať výpočet, stlačte tlačidlo Zadajte. V našom prípade sme dostali nasledujúci vzorec:

    Výsledok výpočtu: 6,953276

  12. Rovnakým spôsobom vypočítame ľavú hranicu intervalu spoľahlivosti, len tentoraz z výsledku výpočtu PRIEMERNÝ odpočítajte výsledok výpočtu operátora NORMÁLNA DÔVERA. Ukazuje sa vzorec pre náš príklad nasledujúceho typu:

    Výsledok výpočtu: -3,06994

  13. Snažili sme sa podrobne popísať všetky kroky na výpočet intervalu spoľahlivosti, preto sme podrobne opísali každý vzorec. Všetky akcie však môžete spojiť do jedného vzorca. Výpočet pravej hranice intervalu spoľahlivosti možno napísať takto:

    AVERAGE(B2:B13)+CONFIDENCE(0,03;8;COUNT(B2:B13))

  14. Podobný výpočet ľavého okraja by vyzeral takto:

    AVERAGE(B2:B13)-CONFIDENCE.NORM(0.03;8;COUNT(B2:B13))

Metóda 2: Funkcia TRUST.STUDENT

Okrem toho existuje v Exceli ďalšia funkcia, ktorá súvisí s výpočtom intervalu spoľahlivosti - DÔVEROVAŤ.ŠTUDENT. Objavuje sa až od Excelu 2010. Tento operátor vykonáva výpočet populačného intervalu spoľahlivosti pomocou Studentovho rozdelenia. Je veľmi vhodné ho použiť v prípade, keď nie je známy rozptyl a teda aj štandardná odchýlka. Syntax operátora je:

TRUST.STUDENT(alfa,štandardný_vývoj,veľkosť)

Ako vidíte, mená operátorov v tomto prípade zostali nezmenené.

Pozrime sa, ako vypočítať hranice intervalu spoľahlivosti s neznámou smerodajnou odchýlkou ​​na príklade tej istej populácie, ktorú sme uvažovali v predchádzajúcej metóde. Úroveň dôvery, ako naposledy, vezmeme 97%.

  1. Vyberte bunku, v ktorej sa vykoná výpočet. Kliknite na tlačidlo "Vložiť funkciu".
  2. V otvorenom Sprievodca funkciou prejdite do kategórie "štatistické". Vyberte meno "DÔVERUJTE.ŠTUDENT". Kliknite na tlačidlo OK.
  3. Spustí sa okno argumentov pre zadaný operátor.

    V teréne "alfa", vzhľadom na to, že úroveň spoľahlivosti je 97 %, číslo si zapíšeme 0,03 . Druhýkrát sa nebudeme zaoberať princípmi výpočtu tohto parametra.

    Potom nastavte kurzor do poľa "Štandardná odchýlka". Tentoraz nám tento ukazovateľ nie je známy a treba ho spočítať. To sa vykonáva pomocou špeciálnej funkcie - STDEV.B. Ak chcete zavolať okno tohto operátora, kliknite na trojuholník naľavo od riadku vzorcov. Ak v zozname, ktorý sa otvorí, nenájdeme požadovaný názov, prejdite na položku "Viac funkcií...".

  4. beží Sprievodca funkciou. Presun do kategórie "štatistické" a označte meno "STDEV.B". Potom kliknite na tlačidlo OK.
  5. Otvorí sa okno s argumentmi. úloha operátora STDEV.B je definícia štandardnej odchýlky pri odbere vzoriek. Jeho syntax vyzerá takto:

    STDEV.V(číslo1,číslo2,…)

    Je ľahké uhádnuť, že argument "číslo" je adresa prvku výberu. Ak je výber umiestnený v jedinom poli, potom pomocou iba jedného argumentu môžete dať odkaz na tento rozsah.

    Nastavte kurzor do poľa "Číslo 1" a ako vždy podržaním ľavého tlačidla myši vyberte sadu. Keď sú súradnice v poli, neponáhľajte sa stlačiť tlačidlo OK pretože výsledok bude nesprávny. Najprv sa musíme vrátiť do okna argumentov operátora DÔVEROVAŤ.ŠTUDENT predniesť posledný argument. Ak to chcete urobiť, kliknite na príslušný názov na riadku vzorcov.

  6. Opäť sa otvorí okno argumentov už známej funkcie. Nastavte kurzor do poľa "Veľkosť". Opäť kliknite na už známy trojuholník, aby ste prešli na výber operátorov. Ako ste pochopili, potrebujeme meno "KONTROLA". Keďže sme túto funkciu použili pri výpočtoch v predchádzajúcej metóde, nachádza sa v tomto zozname, stačí na ňu kliknúť. Ak ho nenájdete, postupujte podľa algoritmu opísaného v prvej metóde.
  7. Vstup do okna argumentov KONTROLA, umiestnite kurzor do poľa "Číslo 1" a so stlačeným tlačidlom myši vyberte kolekciu. Potom kliknite na tlačidlo OK.
  8. Potom program vypočíta a zobrazí hodnotu intervalu spoľahlivosti.
  9. Na určenie hraníc budeme musieť opäť vypočítať výberový priemer. Ale vzhľadom na to, že algoritmus výpočtu používa vzorec PRIEMERNÝ rovnako ako v predchádzajúcej metóde a ani výsledok sa nezmenil, nebudeme sa tomu druhýkrát podrobne venovať.
  10. Sčítanie výsledkov výpočtu PRIEMERNÝ a DÔVEROVAŤ.ŠTUDENT, získame pravú hranicu intervalu spoľahlivosti.
  11. Odpočítanie od výsledkov výpočtu operátora PRIEMERNÝ výsledok výpočtu DÔVEROVAŤ.ŠTUDENT, máme ľavú hranicu intervalu spoľahlivosti.
  12. Ak je výpočet napísaný v jednom vzorci, potom bude výpočet pravej hranice v našom prípade vyzerať takto:

    PRIEMERNÉ(B2:B13)+SEBAVEDOMIE ŠTUDENTOV(0,03,STDV(B2:B13),POČET(B2:B13))

  13. Podľa toho bude vzorec na výpočet ľavého okraja vyzerať takto:

    PRIEMERNÉ(B2:B13)-SEBAVEDOMIE ŠTUDENTOV(0,03;STDV(B2:B13);POČET(B2:B13))

Ako vidíte, nástroje programu Excel umožňujú výrazne uľahčiť výpočet intervalu spoľahlivosti a jeho hraníc. Na tieto účely sa používajú samostatné operátory pre vzorky, ktorých rozptyl je známy a neznámy.

A ďalšie.Všetky sú to odhady ich teoretických náprotivkov, ktoré by sa dali získať, keby neexistovala vzorka, ale všeobecná populácia. Ale bohužiaľ, bežná populácia je veľmi drahá a často nedostupná.

Pojem intervalového odhadu

Akýkoľvek odhad vzorky má určitý rozptyl, pretože je náhodná premenná v závislosti od hodnôt v konkrétnej vzorke. Preto pre spoľahlivejšie štatistické závery treba poznať nielen bodový odhad, ale aj interval, ktorý s vysokou pravdepodobnosťou γ (gama) pokrýva odhadovaný ukazovateľ θ (theta).

Formálne sú to dve takéto hodnoty (štatistika) T1(X) a T2(X), čo T1< T 2 , pre ktoré pri danej úrovni pravdepodobnosti γ podmienka je splnená:

Je to skrátka pravdepodobné γ alebo viac, skutočná hodnota je medzi bodmi T1(X) a T2(X), ktoré sa nazývajú dolná a horná hranica interval spoľahlivosti.

Jednou z podmienok konštrukcie intervalov spoľahlivosti je jeho maximálna úzka, t.j. mala by byť čo najkratšia. Túžba je celkom prirodzená, pretože. výskumník sa snaží presnejšie lokalizovať zistenie požadovaného parametra.

Z toho vyplýva, že interval spoľahlivosti by mal pokrývať maximálne pravdepodobnosti rozdelenia. a samotné skóre bude v strede.

To znamená, že pravdepodobnosť odchýlky (skutočného ukazovateľa od odhadu) smerom nahor sa rovná pravdepodobnosti odchýlky smerom nadol. Treba tiež poznamenať, že pre zošikmené distribúcie sa interval vpravo nerovná intervalu vľavo.

Vyššie uvedený obrázok jasne ukazuje, že čím vyššia je úroveň spoľahlivosti, tým širší je interval - priamy vzťah.

Toto bol malý úvod do teórie intervalového odhadu neznámych parametrov. Prejdime k hľadaniu hraníc spoľahlivosti pre matematické očakávania.

Interval spoľahlivosti pre matematické očakávania

Ak sú pôvodné údaje rozdelené na , priemer bude normálna hodnota. Vyplýva to z pravidla, že lineárna kombinácia normálnych hodnôt má tiež normálne rozdelenie. Preto by sme na výpočet pravdepodobností mohli použiť matematický aparát zákona normálneho rozdelenia.

To si však bude vyžadovať poznať dva parametre – očakávanú hodnotu a rozptyl, ktoré zvyčajne nie sú známe. Namiesto parametrov môžete samozrejme použiť odhady (aritmetický priemer a ), ale potom nebude rozdelenie priemeru celkom normálne, bude mierne sploštené. Írsky občan William Gosset si túto skutočnosť šikovne všimol, keď svoj objav zverejnil v marci 1908 v časopise Biometrica. Z dôvodu utajenia podpísal Gosset so Študentom. Takto sa objavilo Študentovo t-rozdelenie.

Normálna distribúcia údajov, ktorú používa K. Gauss pri analýze chýb v astronomických pozorovaniach, je však v pozemskom živote extrémne vzácna a je dosť ťažké ju určiť (na vysokú presnosť je potrebných asi 2 000 pozorovaní). Preto je najlepšie upustiť od predpokladu normality a použiť metódy, ktoré nezávisia od distribúcie pôvodných údajov.

Vzniká otázka: aké je rozdelenie aritmetického priemeru, ak sa vypočítava z údajov neznámeho rozdelenia? Odpoveď dáva dobre známy z teórie pravdepodobnosti Centrálna limitná veta(CPT). V matematike existuje niekoľko jeho verzií (formulácie sa v priebehu rokov zdokonaľovali), ale všetky, zhruba povedané, vedú k konštatovaniu, že súčet veľkého počtu nezávislých náhodných premenných sa riadi zákonom normálneho rozdelenia.

Pri výpočte aritmetického priemeru sa používa súčet náhodných premenných. Z toho vyplýva, že aritmetický priemer má normálne rozdelenie, v ktorom očakávaná hodnota je očakávaná hodnota pôvodných údajov a rozptyl je .

Chytrí ľudia vedia dokázať CLT, ale overíme si to pomocou experimentu v Exceli. Simulujme vzorku 50 rovnomerne rozdelených náhodných premenných (pomocou excelovej funkcie RANDOMBETWEEN). Potom urobíme 1000 takýchto vzoriek a pre každú vypočítame aritmetický priemer. Pozrime sa na ich distribúciu.

Je vidieť, že rozdelenie priemeru sa blíži normálnemu zákonu. Ak sa objem vzoriek a ich počet ešte zväčšia, podobnosť bude ešte lepšia.

Teraz, keď sme na vlastné oči videli platnosť CLT, môžeme pomocou , vypočítať intervaly spoľahlivosti pre aritmetický priemer, ktoré pokrývajú skutočný priemer alebo matematické očakávania s danou pravdepodobnosťou.

Na stanovenie hornej a dolnej hranice je potrebné poznať parametre normálneho rozdelenia. Spravidla nie sú, preto sa používajú odhady: aritmetický priemer a vzorový rozptyl. Táto metóda opäť poskytuje dobrú aproximáciu iba pre veľké vzorky. Keď sú vzorky malé, často sa odporúča použiť Studentovu distribúciu. Neverte! Študentovo rozdelenie pre priemer sa vyskytuje iba vtedy, keď pôvodné údaje majú normálne rozdelenie, teda takmer nikdy. Preto je lepšie okamžite nastaviť minimálnu latku pre množstvo požadovaných údajov a použiť asymptoticky správne metódy. Hovorí sa, že stačí 30 pozorovaní. Vezmite 50 - nemôžete sa pokaziť.

T 1.2 sú dolné a horné hranice intervalu spoľahlivosti

– vzorový aritmetický priemer

s0– vzorová štandardná odchýlka (nezaujatá)

n - veľkosť vzorky

γ – úroveň spoľahlivosti (zvyčajne sa rovná 0,9, 0,95 alebo 0,99)

c γ =Φ -1 ((1+γ)/2) je prevrátená hodnota funkcie štandardného normálneho rozdelenia. Jednoducho povedané, ide o počet štandardných chýb od aritmetického priemeru po dolnú alebo hornú hranicu (uvedené tri pravdepodobnosti zodpovedajú hodnotám 1,64, 1,96 a 2,58).

Podstatou vzorca je, že sa vezme aritmetický priemer a potom sa z neho vyčlení určitá čiastka ( s γ) štandardné chyby ( s 0 /√n). Všetko je známe, vezmite a počítajte.

Pred masovým používaním PC na získanie hodnôt funkcie normálneho rozdelenia a jeho inverznej hodnoty používali . Stále sa používajú, ale efektívnejšie je obrátiť sa na hotové vzorce Excelu. Všetky prvky z vyššie uvedeného vzorca ( , a ) možno jednoducho vypočítať v Exceli. Existuje však aj hotový vzorec na výpočet intervalu spoľahlivosti - NORMÁLNA DÔVERA. Jeho syntax je nasledovná.

CONFIDENCE NORM(alfa; štandardný_vývoj; veľkosť)

alfa– hladina významnosti alebo hladina spoľahlivosti, ktorá sa vo vyššie uvedenom zápise rovná 1-γ, t.j. pravdepodobnosť, že matematickéočakávanie bude mimo intervalu spoľahlivosti. S úrovňou spoľahlivosti 0,95 je alfa 0,05 atď.

štandard_vyp je štandardná odchýlka údajov vzorky. Nemusíte počítať štandardnú chybu, Excel bude deliť odmocninou z n.

veľkosť– veľkosť vzorky (n).

Výsledkom funkcie CONFIDENCE.NORM je druhý člen zo vzorca na výpočet intervalu spoľahlivosti, t.j. polovičný interval. V súlade s tým sú dolné a horné body priemer ± získaná hodnota.

Je teda možné vytvoriť univerzálny algoritmus na výpočet intervalov spoľahlivosti pre aritmetický priemer, ktorý nezávisí od distribúcie počiatočných údajov. Cenou za univerzálnosť je jej asymptotická povaha, t.j. nutnosť použiť relatívne veľké vzorky. V dobe moderných technológií však zhromaždenie správneho množstva údajov zvyčajne nie je ťažké.

Testovanie štatistických hypotéz pomocou intervalu spoľahlivosti

(modul 111)

Jedným z hlavných problémov riešených v štatistike je. Stručne povedané, jeho podstatou je toto. Vychádza sa napríklad z predpokladu, že očakávanie bežnej populácie sa rovná nejakej hodnote. Potom sa skonštruuje distribúcia priemerov vzorky, ktorú možno pozorovať s daným očakávaním. Ďalej sa pozrieme na to, kde sa v tomto podmienenom rozdelení nachádza skutočný priemer. Ak prekročí povolené limity, potom je výskyt takéhoto priemeru veľmi nepravdepodobný a pri jedinom opakovaní experimentu je takmer nemožný, čo je v rozpore s predloženou hypotézou, ktorá sa úspešne zamieta. Ak priemer neprekročí kritickú úroveň, hypotéza sa nezamietne (ale ani sa nepotvrdí!).

Takže pomocou intervalov spoľahlivosti, v našom prípade pre očakávanie, môžete otestovať aj niektoré hypotézy. Je to veľmi jednoduché. Predpokladajme, že aritmetický priemer pre nejakú vzorku je 100. Testuje sa hypotéza, že očakávaná hodnota je povedzme 90. To znamená, že ak otázku položíme primitívne, znie to takto: môže to byť so skutočnou hodnotou priemer rovný 90, pozorovaný priemer bol 100?

Na zodpovedanie tejto otázky budú potrebné ďalšie informácie o štandardnej odchýlke a veľkosti vzorky. Povedzme, že štandardná odchýlka je 30 a počet pozorovaní je 64 (na ľahké extrahovanie koreňa). Potom je štandardná chyba priemeru 30/8 alebo 3,75. Na výpočet 95 % intervalu spoľahlivosti budete musieť vyčleniť dve štandardné chyby na oboch stranách priemeru (presnejšie 1,96). Interval spoľahlivosti bude približne 100 ± 7,5 alebo od 92,5 do 107,5.

Ďalšie zdôvodnenie je nasledovné. Ak testovaná hodnota spadá do intervalu spoľahlivosti, potom to nie je v rozpore s hypotézou, pretože zapadá do limitov náhodných výkyvov (s pravdepodobnosťou 95 %). Ak je testovaný bod mimo intervalu spoľahlivosti, potom je pravdepodobnosť takejto udalosti veľmi malá, v každom prípade pod prijateľnou úrovňou. Preto sa hypotéza zamieta, pretože je v rozpore s pozorovanými údajmi. V našom prípade je hypotéza očakávania mimo intervalu spoľahlivosti (testovaná hodnota 90 nie je zahrnutá v intervale 100±7,5), preto ju treba zamietnuť. Pri odpovedi na vyššie uvedenú primitívnu otázku by sa malo povedať: nie, nemôže, v žiadnom prípade sa to stáva veľmi zriedka. Často to naznačuje konkrétnu pravdepodobnosť chybného zamietnutia hypotézy (úroveň p), a nie danú úroveň, podľa ktorej bol interval spoľahlivosti zostavený, ale o tom inokedy.

Ako vidíte, nie je ťažké vytvoriť interval spoľahlivosti pre priemer (alebo matematické očakávania). Hlavná vec je zachytiť podstatu a potom to pôjde. V praxi väčšina používa 95 % interval spoľahlivosti, čo sú približne dve štandardné chyby široké na oboch stranách priemeru.

To je zatiaľ všetko. Všetko najlepšie!