Metódy štatistickej analýzy. Analýza údajov: Metódy štatistického výskumu

Odoslanie dobrej práce do databázy znalostí je jednoduché. Použite nižšie uvedený formulár

Študenti, postgraduálni študenti, mladí vedci, ktorí pri štúdiu a práci využívajú vedomostnú základňu, vám budú veľmi vďační.

Hostené na http://www.allbest.ru/

  • 3. Rad dynamiky
  • Literatúra

1. Absolútne a relatívne hodnoty

Výsledkom súhrnu a zoskupovania štatistický materiál v rukách výskumníka sú najrozmanitejšie informácie o skúmaných javoch a procesoch. Pozastavovať sa však nad získanými výsledkami by bolo veľkou chybou, pretože aj keď sú tieto údaje zoskupené podľa daných kritérií a premietnuté do tabuľkovej alebo grafickej podoby, sú stále len akousi ilustráciou, medzivýsledok, ktoré je potrebné analyzovať – v tomto prípade štatistické. Štatistickéanalýza - Toto výkon študoval objekt v kvalitu rozkúskované systémy, tie. komplexný prvkov a spojenia, generovanie v jeho interakcia organické celý.

Výsledkom takejto analýzy by malo byť vytvorenie modelu skúmaného objektu, a keďže hovoríme o štatistike, pri zostavovaní modelu by sa mali použiť štatisticky významné prvky a vzťahy.

V skutočnosti je štatistická analýza zameraná na identifikáciu takýchto významných prvkov a vzťahov.

Absolútnaukazovatele(hodnoty) - celkové hodnoty vypočítané alebo prevzaté zo súhrnných štatistických výkazov bez akýchkoľvek transformácií. Absolútne ukazovatele sú vždy nominálne a sú vyjadrené v merných jednotkách, ktoré boli stanovené pri zostavovaní programu štatistického pozorovania (počet začatých trestných vecí, počet spáchaných trestných činov, počet rozvodov atď.).

Absolútne ukazovatele sú základom pre akékoľvek ďalšie štatistické operácie, ale samotné sú na analýzu málo užitočné. V absolútnom vyjadrení je napríklad ťažké posúdiť mieru kriminality v rôznych mestáchči krajov a je prakticky nemožné odpovedať na otázku, kde je kriminalita vyššia a kde nižšia, keďže mestá či kraje sa môžu výrazne líšiť počtom obyvateľov, územím a inými dôležitými parametrami.

príbuznýmnožstvá v štatistike sú to zovšeobecňujúce ukazovatele, ktoré prezrádzajú číselnú podobu pomeru dvoch porovnávaných štatistických hodnôt. Pri výpočte relatívnych hodnôt sa najčastejšie porovnávajú dve absolútne hodnoty, ale možno porovnávať priemerné aj relatívne hodnoty, čím sa získajú nové relatívne ukazovatele. Najjednoduchším príkladom výpočtu relatívnej hodnoty je odpoveď na otázku: koľkokrát je jedno číslo väčšie ako druhé?

Pri zvažovaní relatívnych hodnôt je potrebné vziať do úvahy nasledujúce. V zásade sa dá porovnať čokoľvek, dokonca aj lineárne rozmery listu papiera A4 s počtom výrobkov vyrobených v porcelánke Lomonosov. Takéto porovnanie nám však nič nedá. Najdôležitejšia podmienka pre plodný výpočet relatívnych množstiev môže byť formulovaná takto:

1. Jednotky merania porovnávaných veličín musia byť rovnaké alebo celkom porovnateľné. Počty trestných činov, trestných vecí a odsúdených sú korelačné ukazovatele, t.j. súvisiace, ale neporovnateľné z hľadiska jednotiek merania. V jednej trestnej veci možno posudzovať viacero trestných činov a odsúdiť skupinu osôb; Jeden trestný čin môže spáchať viacero odsúdených a naopak, jeden odsúdený môže spáchať veľa skutkov. Počty trestných činov, prípadov a odsúdení sú porovnateľné s počtom obyvateľov, počtom zamestnancov trestného súdnictva, životnou úrovňou ľudí a ďalšími údajmi toho istého roku. Navyše v rámci jedného roka sú uvažované ukazovatele navzájom celkom porovnateľné.

2. Porovnateľné údaje si musia nevyhnutne navzájom zodpovedať z hľadiska času alebo územia ich prijatia, prípadne oboch.

Absolútna hodnota, s ktorý porovnávané iné vemasky, volal základ alebo základňu prirovnania, a porovnaťavyrezávané indikátor - rozsah prirovnania. Napríklad pri výpočte pomeru dynamiky kriminality v Rusku v rokoch 2000-2010. 2000 údaje budú základom. Možno ich brať ako jednotku (vtedy relatívna hodnota bude vyjadrená ako faktor), na 100 (v percentách). V závislosti od rozmeru porovnávaných hodnôt sa volí najvhodnejšia, indikatívna a vizuálna forma vyjadrenia relatívnej hodnoty.

Ak je porovnávaná hodnota oveľa väčšia ako základ, výsledný pomer najlepšie vyjadrí koeficienty. Napríklad kriminalita za určité obdobie (v rokoch) vzrástla 2,6-krát. Vyjadrenie v časoch bude v tomto prípade skôr orientačné ako v percentách. V percentách sú relatívne hodnoty vyjadrené, keď sa porovnávacia hodnota príliš nelíši od základne.

Relatívne hodnoty používané v štatistike, vrátane právnych, sú odlišné typy. V právnej štatistike sa používajú tieto typy relatívnych hodnôt:

1. vzťahy charakterizujúce štruktúru obyvateľstva, prípadne distribučné vzťahy;

2. vzťah časti k celku alebo vzťah intenzity;

3. vzťahy, ktoré charakterizujú dynamiku;

4. vzťahy stupňa a porovnávania.

Relatívnarozsahdistribúcia - Toto príbuzný hodnota, vyjadrený v percent individuálny časti agregátov študoval javov(zločiny, zločinci, občianske prípady, súdne spory, kauzy, preventívne opatrenia atď.) do ich všeobecný Celkom, prijatý pozadu 100% . Ide o najbežnejší (a najjednoduchší) druh relatívnych údajov používaných v štatistike. Ide napríklad o štruktúru kriminality (podľa druhov trestných činov), štruktúru odsúdení (podľa druhov trestných činov, podľa veku odsúdených) atď.

štatistická analýza absolútna hodnota

Postojintenzita(pomer časti k celku) – zovšeobecňujúca relatívna hodnota, ktorá odráža prevalenciu konkrétneho znaku v sledovanom agregátov.

Najčastejším ukazovateľom intenzity používaným v právnej štatistike je intenzita kriminality. . Intenzita kriminality sa zvyčajne odráža v miere kriminality , tie. počet trestných činov na 100 alebo 10 tisíc obyvateľov.

KP \u003d (P * 100 000) / N

kde P- absolútne číslo registrovaných trestných činov, H je absolútny počet obyvateľov.

Predpokladom, ktorý určuje samotnú možnosť výpočtu takýchto ukazovateľov, ako je uvedené vyššie, je, aby všetky použité absolútne ukazovatele boli brané na jednom území a za jedno časové obdobie.

vzťahy,charakterizujúcedynamika, zastupovať zovšeobecňujúci príbuzný množstvá, zobrazujúci zmeniť v čas tie alebo iné ukazovatele legálne štatistiky. Časový interval sa zvyčajne berie ako rok.

Za základ (základ) rovný 1 alebo 100% sa berie informácia o študovanom znaku určitého roku, ktorý bol niečím charakteristickým pre skúmaný jav. Údaje za základný rok fungujú ako pevný základ, ku ktorému sú percentá ukazovateľov nasledujúcich rokov.

Úlohy štatistickej analýzy si často vyžadujú ročné (alebo iné obdobia) porovnania základňu prijatý údajov každý predchádzajúce roku(mesiac alebo iné obdobie). Takáto základňa je tzv mobilné. Toto sa zvyčajne používa pri analýze časových radov (sérií dynamiky).

Vzťahystupňaaprirovnania umožňujú porovnávať rôzne ukazovatele s cieľom identifikovať, ktorá hodnota je oveľa väčšia ako druhá, do akej miery sa jeden jav líši od druhého alebo je mu podobný, čo je spoločné a odlišné v sledovaných štatistických procesoch atď.

Index je špeciálne vytvorený relatívny ukazovateľ porovnania (v čase, priestore, v porovnaní s predpoveďou atď.), ktorý ukazuje, koľkokrát sa úroveň skúmaného javu v určitých podmienkach líši od úrovne toho istého javu v iných podmienkach. podmienky. Najbežnejšie indexy sú v ekonomických štatistikách, aj keď zohrávajú určitú úlohu aj pri analýze právnych javov.

Indexy sú nevyhnutné v prípadoch, keď je potrebné porovnávať rozdielne ukazovatele, ktorých jednoduché sčítanie nie je možné. Preto sú indexy zvyčajne definované ako čísla-ukazovatelepremeraniastrednáreproduktoryagregátovheterogénneprvkov.

V štatistike sa indexy zvyčajne označujú písmenom I (i). Veľké písmeno alebo kapitál - závisí od toho, či hovoríme o individuálnom (súkromnom) indexe alebo je všeobecný.

Individuálneindexy i) odrážať pomer ukazovateľa bežného obdobia k zodpovedajúcemu ukazovateľu porovnávaného obdobia.

Konsolidovanéindexy sa používajú pri analýze korelácie komplexných sociálno-ekonomických javov a pozostávajú z dvoch častí: zo skutočnej indexovanej hodnoty a zo spoločného merania („váha“).

2. Priemery a ich aplikácia v právnej štatistike

Výsledkom spracovania absolútnych a relatívnych ukazovateľov je konštrukcia distribučných radov. riadok distribúcia - TotoobjednalnakvalitualebokvantitatívneuvádzanýdistribúciaJednotkyagregátov. Analýza týchto sérií je základom každej štatistickej analýzy, bez ohľadu na to, aká zložitá sa v budúcnosti ukáže.

Distribučný rad môže byť zostavený na základe kvalitatívnych alebo kvantitatívnych znakov. V prvom prípade ide o tzv prívlastkový, v druhom - variačný. V tomto prípade sa rozdiel v kvantitatívnom znaku nazýva variácia a toto znamenie samotné - možnosť. Práve s variačnými radmi sa právna štatistika musí najčastejšie zaoberať.

Variačný rad pozostáva vždy z dvoch stĺpcov (grafu). Jeden označuje hodnotu kvantitatívneho atribútu vo vzostupnom poradí, ktoré sa v skutočnosti nazývajú opcie, ktoré sú označené X. Druhý stĺpec (stĺpec) udáva počet jednotiek, ktoré sú charakteristické pre ten či onen variant. Nazývajú sa frekvencie a označujú sa latinským písmenom f.

Tabuľka 2.1

Možnosť X

Frekvencia f

Frekvencia prejavu jedného alebo druhého znaku je veľmi dôležitá pri výpočte iných významných štatistických ukazovateľov, konkrétne priemerov a ukazovateľov variácie.

Variačné série zas môžu byť diskrétne alebo interval. Diskrétne série, ako už názov napovedá, sú postavené na základe diskrétne sa meniacich vlastností a intervalové série sú postavené na základe kontinuálnych variácií. Takže napríklad rozdelenie páchateľov podľa veku môže byť buď diskrétne (18, 19,20 rokov atď.), alebo súvislé (do 18 rokov, 18 – 25 rokov, 25 – 30 rokov atď.). Navyše, samotné intervalové série môžu byť zostavené ako diskrétne, tak aj podľa kontinuálny princíp. V prvom prípade sa hranice susedných intervalov neopakujú; v našom príklade budú intervaly vyzerať takto: do 18 rokov, 18-25, 26-30, 31-35 atď. Takáto séria je tzv nepretržitýdiskrétneriadok. intervalriadoksnepretržitývariácia predpokladá zhodu hornej hranice predchádzajúceho intervalu s nižšia hranica následné.

Úplne prvým ukazovateľom popisujúcim variačný rad je stredná množstvá. V právnej štatistike zohrávajú dôležitú úlohu, keďže len s ich pomocou je možné charakterizovať populácie podľa kvantitatívneho premenného znaku, podľa ktorého ich možno porovnávať. Pomocou priemerných hodnôt je možné porovnať súbory pre nás právne významných javov podľa určitých kvantitatívnych charakteristík a vyvodiť z týchto porovnaní potrebné závery.

Strednámnožstvá odrážať najviac všeobecný trend (pravidelnosť), inherentná celej mase skúmaných javov. Prejavuje sa v typický kvantitatívna charakteristika, t.j. v priemernej hodnote všetkých dostupných (variabilných) ukazovateľov.

Štatistika vyvinula mnoho typov priemerov: aritmetické, geometrické, kubické, harmonické atď. V právnej štatistike sa však prakticky nepoužívajú, preto budeme uvažovať len o dvoch typoch priemerov – aritmetický priemer a geometrický priemer.

Najbežnejším a najznámejším priemerom je priemeraritmetika. Na jej výpočet sa vypočíta a vydelí súčet ukazovateľov celkový počet ukazovatele. Napríklad 4-člennú rodinu tvoria rodičia vo veku 38 a 40 rokov a dve deti vo veku 7 a 10 rokov. Sčítame vek: 38 + 40 + 7 + 10 a výsledný súčet 95 vydelíme 4. priemerný vek rodina - 23,75 rokov. Alebo si spočítajme priemernú mesačnú záťaž vyšetrovateľov, ak oddelenie 8 ľudí rieši mesačne 25 prípadov. Vydeľte 25 8 a získajte 3 125 prípadov mesačne na vyšetrovateľa.

V právnej štatistike sa aritmetický priemer používa pri výpočte úväzku zamestnancov (vyšetrovateľov, prokurátorov, sudcov a pod.), pri výpočte absolútneho nárastu kriminality, pri výpočte vzorky a pod.

Vo vyššie uvedenom príklade však bolo nesprávne vypočítané priemerné mesačné zaťaženie na jedného vyšetrovateľa. Faktom je, že jednoduchý aritmetický priemer neberie do úvahy frekvenciaštudovaná vlastnosť. V našom príklade je priemerná mesačná záťaž vyšetrovateľa rovnako správna a informatívna ako „priemerná teplota v nemocnici“ zo známej anekdoty, ktorou, ako viete, je izbová teplota. Aby sa pri výpočte aritmetického priemeru zohľadnila frekvencia prejavov študovaného znaku, používa sa takto priemeraritmetikavážený alebo priemer pre diskrétne variačné série. (Diskrétny variačný rad - postupnosť zmeny znamienka podľa diskrétnych (nespojitých) ukazovateľov).

Aritmetický vážený priemer ( vážený priemer) nemá zásadné rozdiely od jednoduchého aritmetického priemeru. V ňom sa súčet tej istej hodnoty nahradí vynásobením tejto hodnoty jej frekvenciou, t.j. v tomto prípade je každá hodnota (variant) vážená frekvenciou výskytu.

Ak teda vypočítame priemernú záťaž vyšetrovateľov, musíme vynásobiť počet prípadov počtom vyšetrovateľov, ktorí vyšetrovali práve takýto počet prípadov. Zvyčajne je vhodné prezentovať takéto výpočty vo forme tabuliek:

Tabuľka 2.2

Počet prípadov

(možnosť X)

Počet vyšetrovateľov (frekvencia f)

Možnosť umeleckého diela

na frekvencie ( Xf)

2. Vypočítajte skutočný vážený priemer podľa vzorca:

kde X- počet trestných vecí a f- počet vyšetrovateľov.

Vážený priemer teda nie je 3,125, ale 4,375. Ak sa nad tým zamyslíte, tak by to malo byť: záťaž na každého jednotlivého vyšetrovateľa sa zvyšuje v dôsledku toho, že jeden vyšetrovateľ na našom hypotetickom oddelení sa ukázal byť lenivcom – alebo naopak, vyšetroval obzvlášť dôležitého a zložitý prípad. Ale otázka interpretácie výsledkov štatistickej štúdie bude zvážená v ďalšia téma. V niektorých prípadoch, konkrétne v prípadoch zoskupených frekvencií diskrétna distribúcia- výpočet priemeru na prvý pohľad nie je zrejmý. Predpokladajme, že potrebujeme vypočítať aritmetický priemer na rozdelenie osôb odsúdených za výtržníctvo podľa veku. Distribúcia vyzerá takto:

Tabuľka 2.3

(možnosť X)

Počet odsúdených (frekvencia f)

Stred intervalu

Možnosť umeleckého diela

na frekvencie ( Xf)

(21-18) /2+18=19,5

Ďalej sa priemer počíta podľa všeobecného pravidla a pre tento diskrétny rad je 23,6 roka. V prípade tzv. otvorené riadky, to znamená v situáciách, keď sú extrémne intervaly určené „menej ako X" alebo viac X“, hodnota krajných intervalov sa nastavuje podobne ako pri iných intervaloch.

3. Rad dynamiky

Sociálne javy skúmané štatistikou sú v neustály vývoj a zmeniť. Sociálno-právne ukazovatele možno prezentovať nielen v statickej podobe, odrážajúcej určitý jav, ale aj ako proces prebiehajúci v čase a priestore, ako aj vo forme interakcie skúmaných charakteristík. Inými slovami, časové rady ukazujú vývoj vlastnosti, t.j. jeho zmena v čase, priestore alebo v závislosti od podmienok prostredia.

Táto séria je sekvenciou priemerných hodnôt v určených časových obdobiach (za každý kalendárny rok).

Pre hlbšie štúdium sociálnych javov a ich analýzu nestačí jednoduché porovnanie úrovní radu dynamiky, je potrebné vypočítať odvodené ukazovatele radu dynamiky: absolútny rast, tempo rastu, tempo rastu, priemer rast a tempo rastu, absolútny obsah jednopercentného prírastku.

Výpočet ukazovateľov radu dynamiky sa vykonáva na základe porovnania ich úrovní. V tomto prípade existujú dva spôsoby, ako porovnať úrovne dynamickej série:

základné ukazovatele, keď sa všetky nasledujúce úrovne porovnávajú s niektorými počiatočnými, ktoré sa berú ako základ;

reťazové ukazovatele, keď sa každá nasledujúca úroveň série dynamiky porovnáva s predchádzajúcou.

Absolútny rast ukazuje, o koľko jednotiek je úroveň aktuálneho obdobia väčšia alebo menšia ako úroveň základného alebo predchádzajúceho obdobia za konkrétne časové obdobie.

Absolútny rast (P) sa vypočíta ako rozdiel medzi porovnávanými úrovňami.

Základný absolútny rast:

P b = r i - r základne . (f.1).

Absolútny rast reťazca:

P c = r i - r i -1 (f.2).

Miera rastu (Tr) ukazuje, koľkokrát (o koľko percent) je úroveň aktuálneho obdobia väčšia alebo menšia ako úroveň základného alebo predchádzajúceho obdobia:

Základná miera rastu:

(f.3)

Rýchlosť rastu reťazca:

(f.4)

Miera rastu (Tpr) ukazuje, o koľko percent je úroveň bežného obdobia viac alebo menej ako úroveň základného alebo predchádzajúceho obdobia, brané ako základ porovnania, a vypočíta sa ako pomer absolútneho rastu k absolútnej úrovni. , braný ako základ.

Rýchlosť rastu možno vypočítať aj odpočítaním 100 % od rýchlosti rastu.

Základná miera rastu:

alebo (f.5)

Rýchlosť rastu reťazca:

alebo (f.6)

Priemerná miera rastu sa vypočíta podľa vzorca geometrického priemeru rýchlostí rastu série dynamiky:

(formulár 7)

kde je priemerná miera rastu;

- miery rastu za určité obdobia;

n- počet mier rastu.

Podobné problémy s koreňovým exponentom väčším ako tri sa spravidla riešia pomocou logaritmu. Z algebry je známe, že logaritmus koreňa sa rovná logaritmu koreňová hodnota delená koreňovým exponentom a že logaritmus súčinu niekoľkých faktorov sa rovná súčtu logaritmy týchto faktorov.

Priemerná rýchlosť rastu sa teda vypočíta tak, že sa vezme koreň n stupňa z diel jednotlivých n- miera rastu reťazca. Priemerná miera rastu je rozdiel medzi priemernou mierou rastu a jedným (), alebo 100 %, ak je miera rastu vyjadrená v percentách:

alebo

Pri absencii dynamickej série stredné úrovne priemerné miery rastu a rastu sa určujú podľa tohto vzorca:

(f.8)

kde je konečná úroveň dynamického radu;

- počiatočná úroveň dynamickej série;

n - počet úrovní (dátumy).

Je zrejmé, že ukazovatele priemernej miery rastu a rastu vypočítané pomocou vzorcov (f.7 a f.8) majú rovnaké číselné hodnoty.

Absolútny obsah 1% rastu ukazuje, aká absolútna hodnota obsahuje 1% rast a je vypočítaný ako pomer absolútneho rastu k tempu rastu.

Absolútny obsah zvýšenia o 1 %:

základné: (f.9)

reťaz: (f.10)

Výpočet a analýza absolútna hodnota každé percentuálne zvýšenie prispieva k hlbšiemu pochopeniu podstaty vývoja skúmaného javu. Údaje z nášho príkladu ukazujú, že napriek kolísaniu tempa rastu a rastu cez jednotlivé roky, základné ukazovatele absolútneho obsahu 1% rastu zostávajú nezmenené, pričom reťazové ukazovatele charakterizujúce zmeny absolútnej hodnoty jednopercentného rastu v každom ďalšom roku oproti predchádzajúcemu sa kontinuálne zvyšujú.

Pri konštrukcii, spracovaní a analýze časových radov často vzniká potreba určiť priemerné úrovne skúmaných javov za určité časové obdobia. Priemerný chronologický intervalový rad sa počíta v rovnakých intervaloch podľa vzorca jednoduchého aritmetického priemeru s nerovnakými intervalmi - aritmetickým váženým priemerom:

kde - stredná úroveň intervalové série;

- počiatočné úrovne série;

n- počet úrovní.

Pre momentovú sériu dynamiky, za predpokladu, že časové intervaly medzi dátumami sú rovnaké, sa priemerná úroveň vypočíta pomocou vzorca chronologického priemeru:

(f.11)

kde je priemerná chronologická hodnota;

r 1 ,., r n- absolútna úroveň série;

n - počet absolútnych úrovní série dynamiky.

Priemerná chronologická úroveň úrovní momentového radu dynamiky sa rovná súčtu ukazovateľov tohto radu vydelenému počtom ukazovateľov bez jedného; v tomto prípade by sa počiatočná a konečná úroveň mala brať na polovicu, pretože počet dátumov (momentov) je zvyčajne o jeden väčší ako počet období.

V závislosti od obsahu a formy prezentácie počiatočných údajov (intervalový alebo momentový rad dynamiky, rovnaké alebo žiadne časové intervaly) na výpočet rôznych sociálne ukazovatele, napríklad priemerný ročný počet trestných činov a trestných činov (podľa druhu), priemerná veľkosť zostatkov pracovného kapitálu, priemerný počet páchateľov atď., použite vhodné analytické výrazy.

4. Štatistické metódy vzájomných vzťahov

V predchádzajúcich otázkach sme uvažovali, ak to tak môžem povedať, o analýze „jednorozmerných“ distribúcií – variačných radov. Ide o veľmi dôležitý, no zďaleka nie jediný typ štatistickej analýzy. Analýza variačných radov je základom pre „pokročilejšie“ typy štatistickej analýzy, predovšetkým pre štúdiumprepojenia. V dôsledku takejto štúdie sa odhalia vzťahy príčin a následkov medzi javmi, čo umožňuje určiť, ktoré zmeny znakov ovplyvňujú variácie študovaných javov a procesov. Zároveň znaky, ktoré spôsobujú zmenu u iných, sa nazývajú faktoriálne (faktory) a znaky, ktoré sa pod ich vplyvom menia, sa nazývajú efektívne.

V štatistickej vede existujú dva typy vzťahov medzi rôzne znaky a ich informácie – funkčné prepojenie (pevne určené) a štatistické (stochastické).

Pre funkčnéspojenia charakteristická je úplná zhoda medzi zmenou atribútu faktora a zmenou efektívnej hodnoty. Tento vzťah sa rovnako prejavuje vo všetkých jednotkách akejkoľvek populácie. Najjednoduchší príklad: zvýšenie teploty sa prejaví v objeme ortuti v teplomere. V tomto prípade pôsobí okolitá teplota ako faktor a objem ortuti - ako efektívna vlastnosť.

Funkčné vzťahy sú typické pre javy, ktoré skúmajú také vedy ako chémia, fyzika, mechanika, v ktorých je možné uskutočňovať „čisté“ experimenty, pri ktorých je eliminovaný vplyv vonkajších faktorov. Faktom je, že funkčné spojenie medzi nimi je možné len vtedy, ak závisí druhá hodnota (výsledný atribút). iba a výlučne od prvého. Na verejných podujatiach je to mimoriadne zriedkavé.

Sociálno-právne procesy, ktoré sú výsledkom súčasného vplyvu Vysoké číslo faktory sú opísané pomocou štatistických vzťahov, teda vzťahov stochasticky (náhodou) deterministický keď rôzne hodnoty jednej premennej zodpovedajú rôznym hodnotám inej premennej.

Najdôležitejším (a bežným) prípadom stochastickej závislosti je koreláciazávislosť. Pri takejto závislosti príčina určuje následok nie jednoznačne, ale len s určitou mierou pravdepodobnosti. Identifikácii takýchto vzťahov je venovaný samostatný typ štatistickej analýzy - korelačná analýza.

Hlavná úloha korelačná analýza - na základe striktne matematických metód stanoviť kvantitatívne vyjadrenie vzťahu, ktorý existuje medzi skúmanými charakteristikami. Existuje niekoľko prístupov k tomu, ako presne sa vypočítava korelácia a podľa toho aj niekoľko typov korelačných koeficientov: koeficient kontingencie A.A. Chuprov (na meranie vzťahu medzi kvalitatívnymi znakmi), koeficient asociácie K. Pearsona, ako aj koeficienty poradovej korelácie Spearmana a Kendalla. Vo všeobecnom prípade takéto koeficienty ukazujú pravdepodobnosť, s akou sa skúmané vzťahy objavujú. Čím vyšší je koeficient, tým výraznejší je vzťah medzi znakmi.

Medzi skúmanými faktormi môžu existovať priame aj inverzné korelácie. Rovnokoreláciazávislosť pozorované v prípadoch, keď zmena hodnôt faktora zodpovedá rovnakým zmenám hodnoty výsledného atribútu, to znamená, že keď sa hodnota atribútu faktora zvýši, zvýši sa aj hodnota efektívneho atribútu a naopak. naopak. Existuje napríklad priama korelácia medzi kriminogénnymi faktormi a kriminalitou ( so znamienkom „+“). Ak zvýšenie hodnôt jedného atribútu spôsobí spätné zmeny v hodnotách iného, ​​potom sa takýto vzťah nazýva obrátene. Napríklad, čím vyššia je sociálna kontrola v spoločnosti, tým nižšia je miera kriminality (spojenie so znakom „-“).

Priama aj spätná väzba môžu byť priame a krivočiare.

Priamočiare ( lineárne) vzťahy sa objavujú, keď so zvýšením hodnôt atribútu-faktora dôjde k zvýšeniu (priamemu) alebo zníženiu (reverznému) hodnoty atribútu-dôsledku. Matematicky je takýto vzťah vyjadrený regresnou rovnicou: pri = a + bX, kde pri - znamenie-dôsledok; a a b - zodpovedajúce väzbové koeficienty; X - znakový faktor.

Krivočiary spojenia sú rôzne. Zvýšenie hodnoty atribútu faktora má nerovnomerný vplyv na hodnotu výsledného atribútu. Spočiatku môže byť tento vzťah priamy a potom opačný. Známym príkladom je vzťah trestných činov k veku páchateľov. Jednak priamoúmerne so zvyšovaním veku páchateľov rastie trestná činnosť jednotlivcov (približne do 30 rokov) a následne s pribúdajúcim vekom trestná činnosť klesá. Navyše vrchol distribučnej krivky páchateľov podľa veku je posunutý od priemeru doľava (smerom k mladšiemu veku) a je asymetrický.

Korelačné priame odkazy môžu byť jedenofaktoriál, keď sa skúma vzťah medzi jedným znakovým faktorom a jedným znakovým dôsledkom (párová korelácia). Môžu byť tiež multifaktoriálny, keď sa študuje vplyv mnohých interagujúcich znakov-faktorov na znak-dôsledok (viacnásobná korelácia).

Ale bez ohľadu na to, ktorý z korelačných koeficientov sa použije, bez ohľadu na to, aká korelácia sa skúma, nie je možné stanoviť vzťah medzi znakmi iba na základe štatistických ukazovateľov. Prvotná analýza ukazovateľov je vždy analýzou kvalitatívne, počas ktorej sa študuje a chápe sociálno-právna podstata javu. V tomto prípade sa využívajú tie vedecké metódy a prístupy, ktoré sú charakteristické pre vedný odbor, ktorý študuje tento fenomén (sociológia, právo, psychológia atď.). Potom vám analýza zoskupení a priemerov umožňuje predkladať hypotézy, zostavovať modely, určiť typ spojenia a závislosti. Až potom sa určí kvantitatívna charakteristika závislosti – vlastne korelačný koeficient.

Literatúra

1. Avanesov G.A. Základy kriminologického prognózovania. Návod. Moskva: Vyššia škola ministerstva vnútra ZSSR, 1970.

2. Avrutin K.E., Gilinsky Ya.I. Kriminalistický rozbor kriminality v regióne: metodika, technika, technika. L., 1991.

3. Adamov E. a kol Ekonomika a štatistika firiem: Učebnica / Ed. SD. Ilyenková. M.: Financie a štatistika, 2008.

4. Balakina N.N. Štatistika: Proc. - metóda. komplexný. Chabarovsk: IVESEP, pobočka v Chabarovsku, 2008.

5. Bluvshtein Yu.D., Volkov G.I. Časové rady Zločin: Študijný sprievodca. Minsk, 1984.

6. Borovikov V.P., Borovikov I.P. STATISTICA - Štatistická analýza a spracovanie údajov v Prostredie Windows. M.: Informačný a vydavateľský dom "Filin", 1997.

7. Borodin S.V. Boj proti zločinu: teoretický model komplexný program. Moskva: Nauka, 1990.

8. Otázky štatistiky // Mesačný vedecký a informačný časopis Štátneho výboru pre štatistiku Ruskej federácie M., 2002-2009.

9. Gusarov V.M. Štatistika: Proc. príspevok pre vysoké školy. M.: UNITI-DANA, 2009.

10. Dobrynina N.V., Nimenya I.N. Štatistika: Proc. - metóda. príspevok. Petrohrad: SPbGIEU, 2009.

11. Eliseeva I.I., Yuzbashev M.M. Všeobecná teóriaštatistika: Učebnica pre vysoké školy / Ed.I. I. Eliseeva, 4. vyd. M.: Financie a štatistika, 1999.

12. Eliseeva I.I., Yuzbashev M.M. Všeobecná teória štatistiky: učebnica. - M.: Financie a štatistika, 1995.

13. Eremina T., Matyatina V., Plushevskaya Yu. Problémy rozvoja sektorov ruskej ekonomiky // Otázky ekonomiky. 2009. Číslo 7.

14. Efimova M.R., Ganchenko O.I., Petrova E.V. Workshop zo všeobecnej teórie štatistiky: Proc. príspevok. 2. vyd., prepracované. a dodatočné M.: Financie a štatistika, 2009.

15. Efimova M.R., Petrova E.V., Rumyantsev V.N. Všeobecná teória štatistiky: učebnica. - M.: INFRA-M, 1998.

16. Kirillov L.A. Kriminalistika a prevencia kriminality orgánmi vnútorných vecí M., 1992.

17. Kosoplechev N.P., Metódy kriminologického výskumu. M., 1984.

18. Lee D.A. Zločin v Rusku: systémová analýza. M., 1997.

19. Lee D.A. Kriminálne štatistické účtovníctvo: štrukturálne a funkčné vzorce. M .: Informačná a vydavateľská agentúra "Ruský svet", 1998.

20. Makarova N.V., Trofimets V.Ya. Štatistika v Exceli: Proc. príspevok. M.: Financie a štatistika, 2009.

21. Nesterov L.I. Nové trendy v štatistike národného bohatstva // Otázky štatistiky. 2008. Číslo 11.

22. Petrova E.V. a iné Workshop o dopravnej štatistike: Proc. príspevok. M.: Financie a štatistika, 2008.

23. Zločin v Rusku v deväťdesiatych rokoch a niektoré aspekty zákonnosti a boj proti nej. M., 1995.

24. Kriminalita, štatistika, právo // Ed. Prednášal prof. A.I. Dlh. Moskva: Kriminologická asociácia, 1997.

25. Rostov K.T. Kriminalita v regiónoch Ruska (sociálna a kriminologická analýza). Petrohrad: Petrohradská akadémia Ministerstva vnútra Ruska, 1998.

26. Usmernenie pre sčítania ľudu o postupe pri vykonávaní celoruského sčítania ľudu v roku 2002 a vypĺňaní dokumentov zo sčítania ľudu. M.: PIK "Offset", 2003.

27. Savyuk L.K. Právna štatistika: Učebnica. M.: Právnik, 1999.

28. Salin V.N., Shpakovskaya E.P. Sociálno-ekonomická štatistika: Učebnica pre vysoké školy. Moskva: Gardanika Lawyer, 2008.

29. Sidenko A.V., Popov G.Yu., Matveeva V.M. Štatistika: Učebnica. Moskva: Obchod a služby, 2008.

30. Sociálna prevencia priestupkov: rady, odporúčania // Ed. ÁNO. Kerimov. M., 1989.

31. sociálne štatistiky: Učebnica pre vysoké školy // Ed. I.I. Eliseeva. 3. vyd. M.: Financie a štatistika, 2009.

Hostené na Allbest.ru

Podobné dokumenty

    Zváženie hlavných metód štatistickej analýzy. Štúdia mestskej časti Kungursky. Vykonávanie výpočtov podľa ukazovateľov ročenky. Analýza demografie a sociálno-ekonomického vývoja územia na základe výsledkov žiadosti.

    semestrálna práca, pridaná 24.06.2015

    Priemerná hodnota - voľná charakteristika zákonitosti procesu v podmienkach, v ktorých prebieha. Formuláre a metódy na výpočet priemerných hodnôt. Aplikácia priemerov v praxi: Výpočet diferenciácie mzdy podľa sektorov hospodárstva.

    ročníková práca, pridaná 12.4.2007

    Štatistické metódy rozvodovej analýzy. Štatistická analýza rozvodov v regióne Amur. Analýza dynamiky a štruktúry rozvodov. Zoskupenie miest a okresov regiónu Amur podľa počtu rozvodov za rok. Výpočet priemerných hodnôt a ukazovateľov variácie.

    semestrálna práca, pridaná 4.12.2014

    Aspekty štatistickej analýzy zabezpečenia bývania. Aplikácia štatistických metód na analýzu zabezpečenia bývania obyvateľstva. Analýza homogenity obyvateľstva okresov z hľadiska faktora demografickej záťaže. Korelačno-regresná analýza.

    ročníková práca, pridaná 18.01.2009

    Organizácia štátna štatistika v Rusku. Požiadavky na zhromaždené údaje. Formy, druhy a metódy štatistického pozorovania. Príprava štatistického pozorovania. Chyby štatistického pozorovania. Metódy sledovania štatistík.

    abstrakt, pridaný 02.12.2007

    Vypracovanie monitorovacieho programu pre štatistiku trestného práva, jeho hlavné etapy a požiadavky, metódy a postupy implementácie. Zisťovanie stavu kriminality v skúmanom území. Pravidlá registrácie výsledkov štatistického pozorovania.

    test, pridané 18.05.2010

    Klasifikácia štatistickej dokumentácie. Druhy dokumentov: písomné, ikonografické, štatistické a fonetické. Metódy a spôsoby analýzy materiálov: neformalizované (tradičné) a formalizované. Postup pri realizácii obsahovej analýzy.

    prezentácia, pridané 16.02.2014

    koncepcia stredná veľkosť. Metóda priemerov pri skúmaní sociálnych javov. Relevantnosť aplikácie metódy priemerov pri skúmaní sociálnych javov je zabezpečená možnosťou prechodu od singuláru k všeobecnému, od náhodného k pravidelnému.

    semestrálna práca, pridaná 13.01.2009

    Pojem štatistické pozorovanie. Analýza priamočiarych a krivočiarych korelácie. Oboznámenie sa so vzorcami a hodnotami štatistického pozorovania. Analýza výpočtov vzťahu indexov, konštrukcia histogramu, prvky distribučného radu.

    test, pridané 27.03.2012

    Charakteristika hlavných ukazovateľov štatistickej analýzy sociálne podmienenie verejné zdravie v Ruská federácia. Úrovne hodnotenia zdravia z pohľadu sociálneho lekárstva. Klasifikácia detskej časti populácie podľa zdravotných skupín.

Dostatočne podrobný v domácej literatúry. V praxi ruských podnikov sa medzitým používajú iba niektoré z nich. Zvážte ďalšie niektoré metódy štatistické spracovanie.

Všeobecné informácie

V praxi domácich podnikov je to prevažne bežné štatistické metódy kontroly. Ak hovoríme o regulácii technologického procesu, potom je to veľmi zriedkavo. Aplikácia štatistických metód stanovuje, že v podniku sa vytvorí skupina odborníkov, ktorí majú príslušnú kvalifikáciu.

Význam

Podľa ISO ser. 9000, dodávateľ potrebuje určiť potrebu štatistických metód, ktoré sa aplikujú pri vývoji, regulácii a testovaní príležitostí proces produkcie a vlastnosti produktu. Použité metódy sú založené na teórii pravdepodobnosti a matematických výpočtoch. Štatistické metódy analýzy údajov môžu byť implementované v ktorejkoľvek fáze životného cyklu produktu. Poskytujú posúdenie a posúdenie stupňa heterogenity produktov alebo variability ich vlastností vzhľadom na stanovené nominálne hodnoty alebo požadované hodnoty, ako aj variabilitu procesu ich tvorby. Štatistické metódy sú metódy, ktorými môžete daná presnosť a spoľahlivosť na posúdenie stavu javov, ktoré sa skúmajú. Umožňujú vám predvídať určité problémy, vyvíjať optimálne riešenia na základe študovaných faktických informácií, trendov a vzorcov.

Návod na použitie

Hlavné oblasti, v ktorých sú rozšírené štatistické metódy sú:


Prax vyspelých krajín

Štatistické metódy sú základ, ktorý zabezpečuje vytváranie produktov s vysokými spotrebiteľskými vlastnosťami. Tieto techniky sú široko používané v priemyselných krajinách. Štatistické metódy sú v skutočnosti zárukou, že spotrebitelia dostanú produkty, ktoré spĺňajú stanovené požiadavky. Účinok ich používania je praxou overený. priemyselné podniky Japonsko. Práve oni prispeli k dosiahnutiu najvyššej výrobnej úrovne v tejto krajine. Dlhoročné skúsenosti zo zahraničia ukazujú, aké efektívne sú tieto techniky. Najmä je známe, že Hewlelt Packard pomocou štatistických metód dokázal v jednom z prípadov znížiť počet sobášov za mesiac z 9 000 na 45 jednotiek.

Ťažkosti pri implementácii

V domácej praxi existuje množstvo prekážok, ktoré neumožňujú použitie štatistické metódy štúdia ukazovatele. Ťažkosti vznikajú v dôsledku:


Vývoj programu

Treba povedať, že určenie potreby určitých štatistických metód v oblasti kvality, výber, zvládnutie špecifických techník je pomerne komplikovaná a zdĺhavá práca pre každý domáci podnik. Pre jeho efektívnu realizáciu je vhodné vypracovať špeciálny dlhodobý program. Mal by zabezpečiť vytvorenie služby, ktorej úlohy budú zahŕňať organizáciu a metodická príručka aplikácie štatistických metód. V rámci programu je potrebné zabezpečiť vybavenie vhodnými technickými prostriedkami, školenie špecialistov a stanovenie skladby výrobných úloh, ktoré je potrebné riešiť vybranými metódami. Mastering sa odporúča začať s použitím najjednoduchších prístupov. Môžete napríklad použiť známu elementárnu výrobu. Následne je vhodné prejsť na iné metódy. Môže ísť napríklad o analýzu rozptylu, selektívne spracovanie informácií, reguláciu procesov, plánovanie faktoriálneho výskumu a experimentov atď.

Klasifikácia

Štatistické metódy ekonomickej analýzy zahŕňajú rôzne triky. Netreba dodávať, že ich nie je málo. Popredný odborník v oblasti manažérstva kvality v Japonsku K. Ishikawa však odporúča použiť sedem základných metód:

  1. Paretove diagramy.
  2. Zoskupovanie informácií podľa spoločných znakov.
  3. Kontrolné karty.
  4. Diagramy príčin a následkov.
  5. Histogramy.
  6. Kontrolné hárky.
  7. Bodové grafy.

Na základe vlastných skúseností v oblasti manažmentu Ishikawa tvrdí, že 95 % všetkých problémov a problémov v podniku možno vyriešiť pomocou týchto siedmich prístupov.

Paretov graf

Tento je založený na určitom pomere. Nazýva sa to „Paretov princíp“. Z 20 % príčin sa podľa neho objaví 80 % následkov. ukazuje jasným a zrozumiteľným spôsobom relatívny vplyv každej okolnosti na bežný problém v zostupnom poradí. Tento vplyv je možné skúmať na počte strát, porúch vyvolaných každou príčinou. Relatívny vplyv je znázornený pruhmi, kumulatívny vplyv faktorov kumulatívnou priamkou.

diagram príčin a následkov

Na ňom je skúmaný problém konvenčne znázornený vo forme vodorovnej priamej šípky a podmienky a faktory, ktoré ho nepriamo alebo priamo ovplyvňujú, sú vo forme šikmých šípok. Pri stavbe treba brať ohľad aj na zdanlivo nepodstatné okolnosti. Je to spôsobené tým, že v praxi sa pomerne často vyskytujú prípady, kedy je riešenie problému zabezpečené vylúčením viacerých zdanlivo nepodstatných faktorov. Dôvody, ktoré ovplyvňujú hlavné okolnosti (prvého a nasledujúcich rádov), sú na diagrame znázornené vodorovnými krátkymi šípkami. Podrobný diagram bude vo forme rybej kostry.

Informácie o zoskupení

Toto ekonomicko-štatistická metóda sa používa na usporiadanie súboru ukazovateľov, ktoré boli získané vyhodnotením a meraním jedného alebo viacerých parametrov objektu. Takéto informácie sú spravidla prezentované vo forme neusporiadanej postupnosti hodnôt. Môžu to byť lineárne rozmery obrobku, bod topenia, tvrdosť materiálu, počet defektov atď. Na základe takéhoto systému je ťažké robiť závery o vlastnostiach produktu alebo procesoch jeho tvorby. Objednávanie sa vykonáva pomocou čiarové grafy. Jasne ukazujú zmeny sledovaných parametrov za určité obdobie.

Kontrolný hárok

Spravidla sa uvádza vo forme tabuľky rozdelenia frekvencií pre výskyt nameraných hodnôt parametrov objektu v zodpovedajúcich intervaloch. Kontrolné zoznamy sa zostavujú v závislosti od účelu štúdie. Rozsah hodnôt ukazovateľa je rozdelený do rovnakých intervalov. Ich počet sa zvyčajne volí rovný druhej odmocnine z počtu vykonaných meraní. Formulár by mal byť jednoduchý, aby sa eliminovali problémy pri vypĺňaní, čítaní, kontrole.

stĺpcový graf

Je prezentovaný vo forme stupňovitého mnohouholníka. Jasne ilustruje rozdelenie ukazovateľov merania. Rozsah nastavené hodnoty je rozdelená na rovnaké intervaly, ktoré sú položené pozdĺž osi x. Pre každý interval sa vytvorí obdĺžnik. Jeho výška sa rovná frekvencii výskytu hodnoty v danom intervale.

Rozptylové zápletky

Používajú sa na testovanie hypotézy o vzťahu medzi dvoma premenné. Model je zostavený nasledovne. Hodnota jedného parametra je vynesená na osi x a hodnota iného ukazovateľa je vynesená na osi y. V dôsledku toho sa na grafe objaví bodka. Tieto akcie sa opakujú pre všetky hodnoty premenných. Ak existuje vzťah, korelačné pole sa rozšíri a smer sa nezhoduje so smerom osi y. Ak neexistuje žiadne obmedzenie, bude rovnobežné s jednou z osí alebo bude mať tvar kruhu.

Kontrolné karty

Používajú sa pri hodnotení procesu za určité obdobie. Zostavenie kontrolných diagramov je založené na nasledujúcich ustanoveniach:

  1. Všetky procesy sa časom odchyľujú od nastavených parametrov.
  2. Nestabilný priebeh javu sa nemení náhodou. Odchýlky, ktoré presahujú hranice očakávaných limitov, nie sú náhodné.
  3. Jednotlivé zmeny sa dajú predvídať.
  4. Stabilný proces sa môže náhodne odchýliť v rámci očakávaných limitov.

Použitie v praxi ruských podnikov

Treba povedať, že domáce a zahraničné skúsenosti ukazujú, že najefektívnejšou štatistickou metódou hodnotenia stability a presnosti zariadení a technologických procesov je zostavovanie regulačných diagramov. Táto metóda sa využíva aj pri regulácii kapacít výrobného potenciálu. Pri konštrukcii máp je potrebné správne zvoliť skúmaný parameter. Odporúča sa uprednostňovať tie ukazovatele, ktoré priamo súvisia so zamýšľaným použitím produktu, ktoré sa dajú ľahko merať a ktoré je možné ovplyvniť riadením procesu. Ak je takáto voľba ťažká alebo neopodstatnená, je možné vyhodnotiť hodnoty korelujúce (súvisiace) s kontrolovaným parametrom.

Nuansy

Ak meranie ukazovateľov s presnosťou potrebnou na mapovanie podľa kvantitatívneho kritéria nie je ekonomicky alebo technicky možné, použije sa alternatívne znamienko. Spájajú sa s ním pojmy ako „manželstvo“ a „defekt“. Tým posledným sa rozumie každý samostatný nesúlad produktu so stanovenými požiadavkami. Manželstvo je tovar, ktorého poskytovanie nie je spotrebiteľom dovolené z dôvodu prítomnosti vád.

Zvláštnosti

Každý typ karty má svoje špecifiká. Treba to brať do úvahy pri ich výbere pre konkrétny prípad. Karty podľa kvantitatívneho kritéria sa považujú za citlivejšie na zmeny procesu ako karty, ktoré využívajú alternatívnu funkciu. Tie prvé sú však náročnejšie na prácu. Používajú sa na:

  1. Ladenie procesov.
  2. Posúdenie možností zavedenia technológie.
  3. Kontrola presnosti zariadenia.
  4. Definície tolerancie.
  5. Viacnásobné mapovania prijateľné spôsoby tvorba produktu.

Okrem toho

Ak je porucha procesu charakterizovaná posunom riadeného parametra, je potrebné použiť X-maps. Ak dôjde k zvýšeniu rozptylu hodnôt, mali by sa zvoliť modely R alebo S. Je však potrebné vziať do úvahy množstvo funkcií. Najmä použitie S-grafov umožní presnejšie a rýchlejšie zistiť poruchu procesu ako R-modely s rovnakými modelmi. Zároveň si ich konštrukcia nevyžaduje zložité výpočty.

Záver

V ekonómii je možné skúmať faktory, ktoré sa odhaľujú v priebehu kvalitatívne hodnotenie v priestore a dynamike. Môžu byť použité na vykonávanie prediktívnych výpočtov. Štatistické metódy ekonomickej analýzy nezahŕňajú metódy hodnotenia príčinno-následkových vzťahov ekonomických procesov a udalostí, identifikácie sľubných a nevyužitých rezerv na zlepšenie výkonnosti. Inými slovami, faktoriálne techniky nie sú zahrnuté v uvažovaných prístupoch.

štatistiky"bioštatistika".

1. nominálny;
2. radový;
3. interval;

vzorky

reprezentatívny

vzorový rám jednoduchá náhodná vzorka intervalové vzorkovanie

stratifikovaný odber vzoriek

zhluk a kvóta odberu vzoriek

nulová hypotéza

alternatívna hypotéza moc

úroveň sebavedomia».


Názov: Základy analýzy štatistických údajov
Detailný popis:

Po ukončení akéhokoľvek vedeckého výskumu, základného alebo experimentálneho, sa vykonáva štatistická analýza získaných údajov. Aby bola štatistická analýza úspešne vykonaná a úlohy boli vyriešené, musí byť štúdia dobre naplánovaná. Preto bez pochopenia základov štatistiky nie je možné plánovať a spracovať výsledky vedeckého experimentu. však lekárske vzdelanie neposkytuje nielen znalosti štatistiky, ale ani základy vyššia matematika. Preto sa veľmi často možno stretnúť s názorom, že štatistickým spracovaním by sa v biomedicínskom výskume mal zaoberať iba štatistik a medicínsky výskumník by sa mal venovať medicínskej problematike sebe samej. vedecká práca. Takáto deľba práce, ktorá zahŕňa pomoc pri analýze údajov, je plne opodstatnená. Pochopenie princípov štatistiky je však potrebné aspoň preto, aby sa predišlo nesprávnemu nastaveniu problému pre odborníka, s ktorým je komunikácia pred začiatkom štúdie rovnako dôležitá ako vo fáze spracovania údajov.

Predtým, ako začneme hovoriť o základoch štatistickej analýzy, je potrebné objasniť význam pojmu „ štatistiky". Existuje mnoho definícií, ale najkompletnejšia a najvýstižnejšia je podľa nášho názoru definícia štatistiky ako „vedy o zbere, prezentovaní a analýze údajov“. Použitie štatistík v aplikáciách pre živý svet sa zase nazýva „biometria“ alebo „ bioštatistika".

Je potrebné poznamenať, že štatistika sa veľmi často redukuje iba na spracovanie experimentálnych údajov bez toho, aby sa venovala pozornosť štádiu ich získavania. Štatistické znalosti sú však potrebné už pri plánovaní experimentu, aby ukazovatele získané počas neho mohol výskumník poskytnúť spoľahlivé informácie. Preto môžeme povedať, že štatistická analýza výsledkov experimentu začína ešte pred začiatkom štúdie.

Už vo fáze vývoja plánu by mal výskumník jasne pochopiť, aký typ premenných bude v jeho práci. Všetky premenné možno rozdeliť do dvoch tried: kvalitatívne a kvantitatívne. Aký rozsah môže mať premenná, závisí od rozsahu merania. Existujú štyri hlavné stupnice:

1. nominálny;
2. radový;
3. interval;
4. racionálne (škála vzťahov).

V nominálnej škále (škála „mien“) sú len symboly na popis niektorých tried objektov, napríklad „pohlavie“ alebo „povolanie pacienta“. Nominálna stupnica znamená, že premenná bude nadobúdať hodnoty, medzi ktorými nemožno určiť kvantitatívne vzťahy. Nie je teda možné stanoviť matematický vzťah medzi mužským a ženským pohlavím. Bežné číselné označenia (ženy - 0, muži - 1 alebo naopak) sú uvedené absolútne ľubovoľne a sú určené len na počítačové spracovanie. Nominálna škála je kvalitatívna vo svojej najčistejšej podobe, jednotlivé kategórie v tejto škále sú vyjadrené frekvenciou (počet alebo podiel pozorovaní, percentá).

Poradová (ordinálna) stupnica zabezpečuje, že jednotlivé kategórie v nej môžu byť usporiadané vzostupne alebo zostupne. V lekárskej štatistike je klasickým príkladom radovej stupnice stupňovanie závažnosti ochorenia. V tomto prípade môžeme závažnosť zostaviť vo vzostupnom poradí, ale stále nemáme možnosť špecifikovať kvantitatívne vzťahy, t. j. vzdialenosť medzi hodnotami nameranými v poradovej škále je neznáma alebo na nej nezáleží. Je ľahké určiť poradie hodnôt premennej „závažnosť“, ale nie je možné určiť, koľkokrát sa ťažký stav líši od stredného stavu.

Poradová stupnica sa vzťahuje na pohlavie kvantitatívne typyúdaje a ich gradácie možno opísať frekvenciami (ako v kvalitatívnej škále), ako aj mierami ústredné hodnoty na ktoré sa zameriame nižšie.

Intervalové a racionálne škály sú čisto kvantitatívne dátové typy. V intervalovej škále už vieme určiť, ako veľmi sa líši jedna hodnota premennej od druhej. Zvýšenie telesnej teploty o 1 stupeň Celzia teda vždy znamená zvýšenie uvoľneného tepla o pevný počet jednotiek. V intervalovej škále sú však pozitívne aj záporné hodnoty(žiadna absolútna nula). V tomto smere sa nedá povedať, že 20 stupňov Celzia je dvakrát teplejších ako 10. Môžeme len konštatovať, že 20 stupňov je o toľko teplejších ako 10, ako je 30 teplejších ako 20.

Racionálna škála (pomerová škála) má iba jeden referenčný bod kladné hodnoty. V medicíne je väčšina racionálnych mierok koncentrácie. Napríklad hladina glukózy 10 mmol/l je dvojnásobkom koncentrácie v porovnaní s 5 mmol/l. Pre teplotu je racionálna stupnica Kelvinova stupnica, kde je absolútna nula (neprítomnosť tepla).

Treba dodať, že akákoľvek kvantitatívna premenná môže byť spojitá, ako v prípade merania telesnej teploty (ide o spojitú intervalovú škálu), alebo diskrétna, ak počítame počet krviniek alebo potomkov laboratórnych zvierat (ide o diskrétna racionálna mierka).

Tieto rozdiely majú rozhodujúci význam pre výber metód štatistickej analýzy experimentálnych výsledkov. Takže pre nominálne dáta je použiteľný chí-kvadrát test a známy Studentov test vyžaduje, aby premenná (intervalová alebo racionálna) bola spojitá.

Po vyriešení otázky typu premennej je potrebné začať s formovaním vzorky. Vzorka je malá skupina predmetov určitej triedy (v medicíne populácia). Na získanie absolútne presných údajov je potrebné preštudovať všetky objekty danej triedy, avšak z praktických (často finančných) dôvodov sa študuje len časť populácie, ktorá sa nazýva vzorka. V budúcnosti štatistická analýza umožňuje výskumníkovi rozšíriť získané vzory na celú populáciu s určitým stupňom presnosti. V skutočnosti sú všetky biomedicínske štatistiky zamerané na získanie čo najpresnejších výsledkov z čo najmenšieho počtu pozorovaní, pretože pri výskume ľudí je dôležitá aj etická otázka. Nemôžeme si dovoliť riskovať veľká kvantita než je potrebné.

Vytvorenie vzorky je regulované množstvom povinných požiadaviek, ktorých porušenie môže viesť k chybným záverom z výsledkov štúdie. Po prvé, veľkosť vzorky je dôležitá. Presnosť odhadu študovaných parametrov závisí od veľkosti vzorky. Tu treba brať do úvahy slovo „presnosť“. Ako viac veľkostí zo študovaných skupín tým presnejšie (ale nie nevyhnutne správne) výsledky vedec dostane. Aby boli výsledky štúdií odberu vzoriek prenosné na celú populáciu ako celok, vzorka musí byť reprezentatívny. Reprezentatívnosť vzorky znamená, že odráža všetky podstatné vlastnosti populácie. Inými slovami, v skúmaných skupinách sa s rovnakou frekvenciou ako v celej populácii nachádzajú osoby rôzneho pohlavia, veku, profesie, sociálneho postavenia a pod.

Pred začatím výberu študijnej skupiny by sa však malo rozhodnúť o potrebe študovať konkrétnu populáciu. Príkladom populácie môžu byť všetci pacienti s určitou nosológiou alebo ľudia v produktívnom veku atď. Výsledky získané pre populáciu mladých ľudí vo vojenskom veku sa teda len ťažko dajú extrapolovať na ženy po menopauze. Súbor charakteristík, ktoré bude mať študijná skupina, určuje „zovšeobecniteľnosť“ údajov štúdie.

Vzorky môžu byť generované rôznymi spôsobmi. Najjednoduchší je výber pomocou generátora náhodných čísel. požadované množstvo objekty z populácie resp vzorový rám(rámček na odber vzoriek). Táto metóda sa nazýva jednoduchá náhodná vzorka". Ak si náhodne vyberiete počiatočný bod v rámci vzorkovania a potom vezmete každý druhý, piaty alebo desiaty objekt (v závislosti od veľkosti skupiny, ktorá sa vyžaduje v štúdii), získate intervalové vzorkovanie. Intervalové vzorkovanie nie je náhodné, pretože možnosť periodického opakovania údajov v rámci vzorkovacieho rámca nie je nikdy vylúčená.

Je možné vytvoriť tzv. stratifikovaný odber vzoriek“, ktorý predpokladá, že populácia pozostáva z niekoľkých rôznych skupín a táto štruktúra by sa mala reprodukovať v experimentálnej skupine. Napríklad, ak je pomer mužov a žien v populácii 30:70, potom v stratifikovanej vzorke by ich pomer mal byť rovnaký. o tento prístup Je mimoriadne dôležité vzorku príliš nevyvážiť, to znamená vyhnúť sa homogenite jej charakteristík, inak môže výskumník premeškať šancu nájsť rozdiely alebo vzťahy v údajoch.

Okrem opísaných spôsobov vytvárania skupín existujú aj zhluk a kvóta odberu vzoriek. Prvý sa používa vtedy, keď je získanie kompletných informácií o vzorovom ráme náročné kvôli jeho veľkosti. Potom sa vzorka vytvorí z niekoľkých skupín obsiahnutých v populácii. Druhá - kvóta - je podobná stratifikovanej vzorke, tu však rozloženie objektov nezodpovedá tomu v populácii.

Ak sa vrátime k veľkosti vzorky, treba povedať, že úzko súvisí s pravdepodobnosťou štatistických chýb prvého a druhého druhu. Štatistické chyby môžu byť spôsobené tým, že štúdia neskúma celú populáciu, ale jej časť. Chyba typu I je chybná odchýlka nulová hypotéza. Nulová hypotéza je zase predpoklad, že všetky skúmané skupiny pochádzajú z rovnakej všeobecnej populácie, čo znamená, že rozdiely alebo vzťahy medzi nimi sú náhodné. Ak urobíme analógiu s diagnostickými testami, potom chyba typu I je falošne pozitívny výsledok.

Chyba typu II je nesprávna odchýlka alternatívna hypotéza, ktorého význam spočíva v tom, že rozdiely alebo vzťahy medzi skupinami nie sú spôsobené náhodnou zhodou okolností, ale vplyvom skúmaných faktorov. A opäť analógia s diagnostikou: chyba druhého druhu je falošne negatívny výsledok. S touto chybou súvisí aj pojem moc, ktorý vypovedá o tom, aká efektívna je určitá štatistická metóda za daných podmienok, o jej citlivosti. Výkon sa vypočíta podľa vzorca: 1-β, kde β je pravdepodobnosť chyby typu II. Tento ukazovateľ závisí najmä od veľkosti vzorky. Čím väčšia je veľkosť skupiny, tým nižšia je pravdepodobnosť chyby typu II a tým vyššia je sila štatistických testov. Táto závislosť je prinajmenšom kvadratická, to znamená, že zníženie veľkosti vzorky na polovicu povedie k poklesu výkonu najmenej štyrikrát. Minimálny povolený výkon sa považuje za 80% a maximálna povolená úroveň chyby prvého druhu je 5%. Vždy však treba pamätať na to, že tieto hranice sú ľubovoľné a môžu sa meniť v závislosti od charakteru a cieľov štúdie. Vedecká komunita spravidla uznáva svojvoľnú zmenu moci, ale v drvivej väčšine prípadov nemôže úroveň chyby prvého druhu prekročiť 5%.

Všetko vyššie uvedené priamo súvisí s fázou plánovania výskumu. Mnohí výskumníci však mylne označujú štatistické spracovanie údajov len za nejakú manipuláciu vykonanú po dokončení hlavnej časti práce. Často po skončení neplánovaného experimentu existuje neodolateľná túžba objednať analýzu štatistických údajov na strane. Ale aj pre štatistika bude veľmi ťažké vydolovať z „kopy odpadu“ výsledok, ktorý výskumník očakáva. Preto pri nedostatočných znalostiach bioštatistiky je potrebné vyhľadať pomoc pri štatistickej analýze ešte pred začatím experimentu.

Pokiaľ ide o samotný postup analýzy, treba zdôrazniť dva hlavné typy štatistických techník: deskriptívne a založené na dôkazoch (analytické). Opisné techniky zahŕňajú techniky na prezentáciu údajov kompaktným a ľahko pochopiteľným spôsobom. Patria sem tabuľky, grafy, frekvencie (absolútne a relatívne), miery centrálnej tendencie (priemer, medián, režim) a miery rozptylu údajov (variance, smerodajná odchýlka, medzikvartilový interval atď.). Inými slovami, deskriptívne metódy charakterizujú študované vzorky.

Najpopulárnejším (hoci často zavádzajúcim) spôsobom opisu dostupných kvantitatívnych údajov je definovanie nasledujúcich ukazovateľov:

  • počet pozorovaní vo vzorke alebo jej veľkosť;
  • priemerná hodnota (aritmetický priemer);
  • štandardná odchýlka je miera toho, ako široko sa menia hodnoty premenných.

Je dôležité si uvedomiť, že aritmetický priemer a štandardná odchýlka sú mierou centrálnej tendencie a rozptylu v pomerne malom počte vzoriek. V takýchto vzorkách sú hodnoty väčšiny objektov s rovnako pravdepodobné sa odchýlili od priemeru a ich rozdelenie tvorí symetrický „zvonček“ (Gaussova alebo Gauss-Laplaceova krivka). Takáto distribúcia sa tiež nazýva „normálna“, ale v praxi lekárskeho experimentu sa vyskytuje iba v 30% prípadov. Ak sú hodnoty premennej rozdelené asymetricky okolo stredu, skupiny sa najlepšie popíšu pomocou mediánu a kvantilov (percentily, kvartily, decily).

Po dokončení popisu skupín je potrebné odpovedať na otázku o ich vzťahoch a možnosti zovšeobecnenia výsledkov štúdie na celú populáciu. Na tento účel sa používajú metódy bioštatistiky založené na dôkazoch. Práve na ne pamätajú výskumníci v prvom rade pri štatistickom spracovaní údajov. Zvyčajne sa táto fáza práce nazýva "testovanie štatistických hypotéz".

Úlohy testovania hypotéz možno rozdeliť do dvoch veľké skupiny. Prvá skupina odpovedá na otázku, či existujú rozdiely medzi skupinami v hladine nejakého ukazovateľa, napríklad rozdiely v hladine pečeňových transamináz u pacientov s hepatitídou a zdravých ľudí. Druhá skupina vám umožňuje dokázať existenciu vzťahu medzi dvoma alebo viacerými ukazovateľmi, napríklad funkciou pečene a imunitným systémom.

V praxi možno úlohy z prvej skupiny rozdeliť do dvoch podtypov:

  • porovnanie ukazovateľa len v dvoch skupinách (zdraví a chorí, muži a ženy);
  • porovnanie troch alebo viacerých skupín (štúdia rôznych dávok lieku).

Malo by sa vziať do úvahy, že štatistické metódy sa výrazne líšia pre kvalitatívne a kvantitatívne údaje.

V situácii, keď je skúmaná premenná kvalitatívna a porovnávajú sa iba dve skupiny, možno použiť chí-kvadrát test. Toto je pomerne silné a všeobecne známe kritérium, avšak nie je dostatočne účinné, ak je počet pozorovaní malý. Na vyriešenie tohto problému existuje niekoľko metód, ako napríklad Yatesova korekcia kontinuity a Fisherova presná metóda.

Ak je skúmaná premenná kvantitatívna, potom možno použiť jeden z dvoch typov štatistických testov. Kritériá prvého typu vychádzajú zo špecifického typu rozloženia všeobecnej populácie a operujú s parametrami tejto populácie. Takéto kritériá sa nazývajú „parametrické“ a zvyčajne sú založené na predpoklade normálneho rozdelenia hodnôt. Neparametrické testy nevychádzajú z predpokladu o type rozloženia všeobecnej populácie a nevyužívajú jej parametre. Niekedy sa takéto kritériá nazývajú „testy bez distribúcie“. Do určitej miery je to chybné, pretože každý neparametrický test predpokladá, že distribúcie vo všetkých porovnávaných skupinách budú rovnaké, inak sa môžu získať falošne pozitívne výsledky.

Existujú dva parametrické testy aplikované na údaje získané z normálne rozloženej populácie: Studentov t-test na porovnanie dvoch skupín a Fisherov F-test na testovanie rovnosti rozptylov (aka ANOVA). Existuje oveľa viac neparametrických kritérií. Rôzne testy sa navzájom líšia v predpokladoch, na ktorých sú založené, v zložitosti výpočtov, v štatistickej sile atď. Wilcoxon pre nezávislé vzorky. Tieto testy sú vhodné v tom, že nevyžadujú predpoklady o povahe distribúcie údajov. Ak sa však ukáže, že vzorky sú odobraté z normálne rozloženej všeobecnej populácie, potom sa ich štatistická sila nebude výrazne líšiť od štatistickej sily pre Studentov test.

Úplný popis štatistických metód nájdete v špeciálna literatúra Kľúčovým bodom je však to, že každý štatistický test vyžaduje súbor pravidiel (predpokladov) a podmienok na jeho použitie a mechanické vymenovanie niekoľkých metód na nájdenie „požadovaného“ výsledku je absolútne neprijateľné s vedecký bod vízie. V tomto zmysle sú štatistické testy blízke drogám - každý má indikácie a kontraindikácie, vedľajšie účinky a pravdepodobnosť zlyhania. A rovnako nebezpečné je aj nekontrolované používanie štatistických testov, pretože na nich sú založené hypotézy a závery.

Pre úplnejšie pochopenie problematiky presnosti štatistickej analýzy je potrebné definovať a analyzovať pojem „ úroveň sebavedomia." Pravdepodobnosť spoľahlivosti je hodnota braná ako hranica medzi pravdepodobnými a nepravdepodobnými udalosťami. Tradične sa označuje písmenom „p“. Pre mnohých výskumníkov je jediným účelom vykonávania štatistickej analýzy vypočítať požadovanú hodnotu p, ktorá, zdá sa, dáva čiarky do slávna fráza"exekúcia nemôže byť odpustená." Maximálna povolená úroveň spoľahlivosti je 0,05. Malo by sa pamätať na to, že úroveň spoľahlivosti nie je pravdepodobnosťou nejakej udalosti, ale vecou spoľahlivosti. Vystavením pravdepodobnosti spoľahlivosti pred začatím analýzy tak určíme stupeň spoľahlivosti výsledkov nášho výskumu. A ako viete, nadmerná dôverčivosť a nadmerné podozrievanie rovnako negatívne ovplyvňujú výsledky akejkoľvek práce.

Úroveň spoľahlivosti označuje maximálnu pravdepodobnosť chyby typu I, ktorú výskumník považuje za prijateľnú. Zníženie úrovne spoľahlivosti, inými slovami, sprísnenie podmienok na testovanie hypotéz zvyšuje pravdepodobnosť chýb typu II. Preto musí byť výber úrovne spoľahlivosti vykonaný s ohľadom na možné škody spôsobené výskytom chýb prvého a druhého druhu. Napríklad prísne limity prijaté v biomedicínskej štatistike, ktoré určujú podiel falošne pozitívnych výsledkov nie viac ako 5 %, sú vážnou nevyhnutnosťou, pretože nové spôsoby liečby sa zavádzajú alebo zamietajú na základe výsledkov lekárskeho výskumu. životná záležitosť pre tisíce ľudí.

Treba mať na pamäti, že samotná hodnota p nie je pre lekára príliš informatívna, pretože vypovedá len o pravdepodobnosti chybného zamietnutia nulovej hypotézy. Tento ukazovateľ nehovorí nič napríklad o veľkosti terapeutického efektu pri použití skúmaného lieku v bežnej populácii. Preto existuje názor, že namiesto úrovne spoľahlivosti by bolo lepšie hodnotiť výsledky štúdie podľa veľkosti intervalu spoľahlivosti. Interval spoľahlivosti je rozsah hodnôt, v ktorom je s určitou pravdepodobnosťou obsiahnutá skutočná hodnota populácie (priemer, medián alebo frekvencia). V praxi je vhodnejšie mať obe tieto hodnoty, čo umožňuje spoľahlivejšie posúdiť použiteľnosť získaných výsledkov na populáciu ako celok.

Na záver treba povedať pár slov o nástrojoch, ktoré používa štatistik alebo výskumník, ktorý nezávisle analyzuje údaje. Manuálne výpočty sú dávno preč. Štatistické počítačové programy, ktoré dnes existujú, umožňujú vykonávať štatistickú analýzu bez toho, aby to bolo vážne matematický tréning. Takéto výkonné systémy ako SPSS, SAS, R atď. umožňujú výskumníkovi využívať komplexné a výkonné štatistické metódy. To však nie je vždy dobré. Bez znalosti stupňa použiteľnosti použitých štatistických testov na konkrétne experimentálne údaje môže výskumník robiť výpočty a dokonca získať nejaké čísla na výstupe, ale výsledok bude veľmi pochybný. takze predpokladom na uskutočnenie štatistického spracovania výsledkov experimentu je potrebná dobrá znalosť matematické základyštatistiky.


Štatistické metódy - metódy na analýzu štatistických údajov. Alokovať metódy aplikovanej štatistiky, ktoré možno aplikovať vo všetkých oblastiach vedecký výskum a akékoľvek priemyselné odvetvia Národné hospodárstvo, a iné štatistické metódy, ktorých použiteľnosť je obmedzená na určitú oblasť. Ide o metódy ako štatistická akceptačná kontrola, štatistická kontrola technologických procesov, spoľahlivosť a testovanie a návrh experimentov.

Štatistické metódy analýzy údajov sa používajú takmer vo všetkých oblastiach ľudskej činnosti. Používajú sa vždy, keď je potrebné získať a podložiť akékoľvek úsudky o skupine (objektoch alebo subjektoch) s určitou vnútornou heterogenitou. V oblasti štatistických metód analýzy údajov je vhodné rozlišovať tri typy vedeckých a aplikovaných činností (podľa miery špecifickosti metód spojených s ponorením sa do konkrétnych problémov):

a) vývoj a výskum metód na všeobecné použitie bez zohľadnenia špecifík oblasti použitia;

b) vývoj a výskum štatistických modelov skutočné javy a procesy v súlade s potrebami konkrétnej oblasti činnosti;

c) aplikácia štatistických metód a modelov na štatistickú analýzu špecifických údajov.

Disperzná analýza. Analýza rozptylu (z latinského Dispersio - disperzia / v angličtine Analysis Of Variance - ANOVA) sa používa na štúdium vplyvu jednej alebo viacerých kvalitatívnych premenných (faktorov) na jednu závislú kvantitatívnu premennú (odpoveď). Analýza rozptylu je založená na predpoklad, že niektoré premenné možno považovať za príčiny (faktory, nezávislé premenné) a iné za dôsledky (závislé premenné). Nezávislé premenné sa niekedy nazývajú nastaviteľné faktory práve preto, že v experimente ich má výskumník možnosť obmieňať a analyzovať výsledný výsledok.

hlavný cieľ analýza rozptylu (ANOVA) je štúdium významnosti rozdielov medzi priemermi pomocou porovnania (analýzy) rozptylov. Rozdelenie celkového rozptylu do viacerých zdrojov umožňuje porovnať rozptyl spôsobený rozdielom medzi skupinami s rozptylom spôsobeným variabilitou v rámci skupiny. Ak je pravdivá nulová hypotéza (o rovnosti priemerov vo viacerých skupinách pozorovaní vybraných zo všeobecnej populácie), odhad rozptylu spojeného s vnútroskupinovou variabilitou by sa mal približovať odhadu medziskupinového rozptylu. Ak porovnávate len priemery dvoch vzoriek, analýza rozptylu poskytne rovnaký výsledok ako bežný nezávislý výberový t-test (ak porovnávate dva nezávislé skupiny objekty alebo pozorovania) alebo t-test pre závislé vzorky (ak sa porovnávajú dve premenné na rovnakom súbore objektov alebo pozorovaní).


Podstata analýzy rozptylu spočíva v rozdelení celkového rozptylu skúmaného znaku na samostatné zložky vplyvom špecifických faktorov a testovaní hypotéz o významnosti vplyvu týchto faktorov na skúmaný znak. Vzájomným porovnaním zložiek rozptylu pomocou Fisherovho F-testu je možné určiť, aký podiel na celkovej variabilite výsledného znaku tvorí pôsobenie nastaviteľných faktorov.

východiskový materiál na analýzu rozptylu sa používajú údaje zo štúdie troch alebo viacerých vzoriek, ktorých počet môže byť rovnaký alebo nerovnaký, či už spojených alebo rozpojených. Podľa počtu identifikovaných nastaviteľných faktorov môže byť analýza rozptylu jednofaktorová (v tomto prípade sa skúma vplyv jedného faktora na výsledky experimentu), dvojfaktorová (pri skúmaní vplyvu dvoch faktorov) a multifaktoriálny (umožňuje hodnotiť nielen vplyv každého z faktorov samostatne, ale aj ich vzájomné pôsobenie).

Platí analýza rozptylu do skupiny parametrických metód, a preto by sa mala použiť len vtedy, keď sa preukáže, že rozdelenie je normálne.

Používa sa analýza rozptylu, ak je závislá premenná meraná na stupnici pomerov, intervalov alebo rádu a ovplyvňujúce premenné sú nenumerického charakteru (menná stupnica).

Príklady úloh. V úlohách, ktoré sa riešia analýza rozptylu, dochádza k odozve číselného charakteru, na ktorú vplýva viacero premenných nominálneho charakteru. Napríklad niekoľko druhov výkrmových dávok hospodárskych zvierat alebo dva spôsoby ich držania atď.

Príklad 1: Počas týždňa fungovalo niekoľko kioskov lekární na troch rôznych miestach. V budúcnosti môžeme nechať len jeden. Je potrebné zistiť, či existuje štatistika veľký rozdiel medzi objemami predaja liekov v kioskoch. Ak áno, vyberieme kiosk s najvyšším priemerným denným objemom predaja. Ak sa rozdiel v objeme predaja ukáže ako štatisticky nevýznamný, základom pre výber kiosku by mali byť iné ukazovatele.

Príklad 2: Porovnanie kontrastov skupinových prostriedkov. Týchto sedem politických príslušností je zoradených od extrémne liberálnej po extrémne konzervatívnu a lineárny kontrast sa používa na testovanie, či existuje nenulový vzostupný trend v priemeroch skupín – t. j. či existuje významný lineárny nárast priemerného veku, ak vezmeme do úvahy skupiny usporiadané v smer od liberálov ku konzervatívnym.

Príklad 3: Obojsmerná analýza rozptylu. Počet predajov produktov okrem veľkosti predajne často ovplyvňuje aj umiestnenie regálov s produktom. Tento príklad obsahuje týždenné údaje o predaji charakterizované štyrmi rozloženiami regálov a tromi veľkosťami predajní. Výsledky analýzy ukazujú, že obidva faktory – umiestnenie regálov s tovarom a veľkosť predajne – ovplyvňujú počet predajov, ale ich interakcia nie je významná.

Príklad 4: Univariantná ANOVA: Randomizovaný dizajn plného bloku s dvomi úpravami. Skúma sa vplyv všetkých možných kombinácií troch tukov a troch trhačov cesta na pečenie chleba. Ako blokové faktory slúžili štyri vzorky múky odobraté zo štyroch rôznych zdrojov. Je potrebné identifikovať význam interakcie tuk-rozrývač. Potom môžete určiť rôzne možnosti výberu kontrastov, čo vám umožní zistiť, ktoré kombinácie úrovní faktorov sa líšia.

Príklad 5: Model hierarchického (vnoreného) plánu so zmiešanými účinkami. Študuje sa vplyv štyroch náhodne vybraných hláv namontovaných v obrábacom stroji na deformáciu vyrobených držiakov sklenených katód. (Hlavy sú zabudované do stroja, takže rovnakú hlavu nemožno použiť na rôznych strojoch.) Účinok hlavy sa považuje za náhodný faktor. Štatistiky ANOVA ukazujú, že medzi strojmi nie sú žiadne významné rozdiely, ale existujú náznaky, že hlavy sa môžu líšiť. Rozdiel medzi všetkými strojmi nie je výrazný, ale u dvoch z nich je rozdiel medzi typmi hláv výrazný.

Príklad 6: Jednorozmerná analýza opakovaných meraní pomocou plánu rozdeleného grafu. Tento experiment sa uskutočnil s cieľom určiť vplyv hodnotenia úzkosti jednotlivca na výkon skúšky pri štyroch po sebe nasledujúcich pokusoch. Údaje sú usporiadané tak, že ich možno považovať za skupiny podmnožín celého súboru údajov („celý graf“). Účinok úzkosti nebol významný, zatiaľ čo účinok snahy bol významný.

Kovariančná analýza. Kovariančná analýza - súbor metód matematickej štatistiky súvisiacich s analýzou modelov závislosti strednej hodnoty niektorej náhodnej premennej súčasne od súboru (hlavných) kvalitatívnych faktorov a (spojených) kvantitatívnych faktorov. Faktory F nastavujú kombinácie podmienok, za ktorých boli získané pozorovania X, Y, a sú opísané pomocou indikátorových premenných, pričom medzi sprievodnými a indikátorovými premennými môžu byť náhodné aj nenáhodné (kontrolované v experimente).

Ak je náhodná premenná Y vektor, potom sa hovorí o multivariačnej analýze kovariancie.

Často sa používa analýza kovariancie pred analýzou rozptylu skontrolovať homogenitu (homogenitu, reprezentatívnosť) vzorky pozorovaní X,Y pre všetky sprievodné faktory.