Metode de analiză statistică. Analiza datelor: Metode de cercetare statistică

Trimiteți-vă munca bună în baza de cunoștințe este simplu. Utilizați formularul de mai jos

Studenții, studenții absolvenți, tinerii oameni de știință care folosesc baza de cunoștințe în studiile și munca lor vă vor fi foarte recunoscători.

Găzduit la http://www.allbest.ru/

  • 3. Serii de dinamică
  • Literatură

1. Valori absolute și relative

Ca urmare a rezumatului și grupării material statisticîn mâinile cercetătorului se află cele mai diverse informații despre fenomenele și procesele studiate. Totuși, să insistăm asupra rezultatelor obținute ar fi o mare greșeală, deoarece chiar și grupate după criterii date și reflectate în formă tabelară sau grafică, aceste date sunt încă doar un fel de ilustrare, rezultat intermediar, care trebuie analizat – în acest caz, statistic. Statisticanaliză - acest reprezentare studiat obiect în calitate dezmembrat sisteme, acestea. complex elemente Și conexiuni, generatoare în a lui interacţiune organic întreg.

În urma unei astfel de analize, ar trebui construit un model al obiectului studiat și, întrucât vorbim de statistică, la construirea modelului ar trebui folosite elemente și relații semnificative statistic.

De fapt, analiza statistică are ca scop identificarea unor astfel de elemente și relații semnificative.

Absolutindicatori(valori) - valori totale calculate sau preluate din rapoarte statistice de sinteză fără nicio transformare. Indicatorii absoluti sunt întotdeauna nominali și se reflectă în unitățile de măsură care au fost stabilite la întocmirea programului de observare statistică (numărul de dosare penale deschise, numărul infracțiunilor comise, numărul divorțurilor etc.).

Indicatorii absoluti sunt de bază pentru orice operațiuni statistice ulterioare, dar ei înșiși sunt de puțin folos pentru analiză. În termeni absoluti, de exemplu, este dificil să se judece nivelul criminalității diferite orase sau regiuni și este practic imposibil să se răspundă la întrebarea unde criminalitatea este mai mare și unde este mai mică, deoarece orașele sau regiunile pot diferi semnificativ ca populație, teritoriu și alți parametri importanți.

relativcantitățiîn statistică, sunt indicatori generalizatori care relevă forma numerică a raportului dintre două valori statistice comparate. La calcularea valorilor relative, cel mai adesea se compară două valori absolute, dar se pot compara atât valorile medii, cât și cele relative, obținându-se noi indicatori relativi. Cel mai simplu exemplu de calcul al unei valori relative este răspunsul la întrebarea: de câte ori este un număr mai mare decât altul?

Începând să luați în considerare valorile relative, este necesar să luați în considerare următoarele. În principiu, orice poate fi comparat, chiar și dimensiunile liniare ale unei foi de hârtie A4 cu numărul de produse fabricate de Fabrica de Porțelan Lomonoșov. Totuși, o astfel de comparație nu ne va oferi nimic. Cea mai importantă condiție pentru un calcul fructuos al cantităților relative poate fi formulată după cum urmează:

1. Unitățile de măsură ale mărimilor comparate trebuie să fie aceleași sau destul de comparabile. Numărul de infracțiuni, dosare penale și condamnați sunt indicatori corelați, adică. înrudite, dar nu comparabile în ceea ce privește unitățile de măsură. Într-o cauză penală pot fi luate în considerare mai multe infracțiuni și un grup de persoane condamnate; Mai mulți condamnați pot săvârși o singură infracțiune și, invers, un condamnat poate săvârși mai multe fapte. Numărul de infracțiuni, cauze și condamnări este comparabil cu populația, numărul personalului sistemului de justiție penală, nivelul de trai al oamenilor și alte date din același an. Mai mult, în decurs de un an indicatorii considerați sunt destul de comparabili între ei.

2. Datele comparabile trebuie să corespundă în mod necesar între ele în ceea ce privește timpul sau teritoriul primirii lor, sau ambele.

Absolut valoare, din care comparat alte înemăști, numit bază sau baza comparatii, dar comparaţieȘisculptate indicator - magnitudinea comparatii. De exemplu, atunci când se calculează raportul dintre dinamica criminalității în Rusia în 2000-2010. Datele din 2000 vor fi de referință. Ele pot fi luate ca o unitate (apoi valoare relativă va fi exprimat ca factor), la 100 (ca procent). În funcție de dimensiunea valorilor comparate, se alege cea mai convenabilă, indicativă și vizuală formă de exprimare a valorii relative.

Dacă valoarea comparată este mult mai mare decât baza, raportul rezultat este cel mai bine exprimat în termeni de coeficienți. De exemplu, criminalitatea pe o anumită perioadă (în ani) a crescut de 2,6 ori. Expresia în timpi în acest caz va fi mai indicativă decât în ​​procente. Ca procent, valorile relative sunt exprimate atunci când valoarea de comparație nu diferă mult de bază.

Valorile relative utilizate în statistici, inclusiv cele legale, sunt tipuri diferite. Următoarele tipuri de valori relative sunt utilizate în statisticile juridice:

1. relații care caracterizează structura populației, sau relații de distribuție;

2. relația părții cu întregul, sau relația de intensitate;

3. relaţii care caracterizează dinamica;

4. relaţii de grad şi comparaţie.

Relativmagnitudineadistributie - acest relativ valoare, exprimat în la sută individual părți agregate studiat fenomene(infracțiuni, infracțiuni, cauze civile, procese, cauze, măsuri preventive etc.) la lor general total, admis in spate 100% . Acesta este cel mai comun (și cel mai simplu) tip de date relative utilizate în statistici. Acestea sunt, de exemplu, structura infracțiunii (pe tipuri de infracțiuni), structura condamnărilor (pe tipuri de infracțiuni, după vârsta condamnaților) etc.

analiză statistică valoare absolută

Atitudineintensitate(raportul dintre părți și întreg) - o valoare relativă generalizantă care reflectă prevalența unei anumite caracteristici în agregate.

Cel mai comun indicator al intensității utilizat în statisticile juridice este intensitatea criminalității. . Intensitatea criminalității este de obicei reflectată de rata criminalității , acestea. numărul infracţiunilor la 100 sau 10 mii de locuitori.

KP \u003d (P * 100000) / N

unde P - număr absolut infracțiuni înregistrate, H este numărul absolut al populației.

O condiție prealabilă care determină însăși posibilitatea de a calcula astfel de indicatori, așa cum s-a menționat mai sus, este ca toți indicatorii absoluti utilizați să fie luați pe un singur teritoriu și pentru o perioadă de timp.

Relaţii,caracterizareadinamica, reprezinta generalizand relativ cantități, arătând Schimbare în timp acestea sau alte indicatori legale statistici. Intervalul de timp este de obicei luat ca un an.

Pentru baza (baza) egală cu 1, sau 100%, se iau informații despre trăsătura studiată a unui anumit an, care era ceva caracteristic fenomenului studiat. Datele anului de bază acționează ca bază fixă, la care se procentează indicatorii anilor următori.

Sarcinile de analiză statistică necesită adesea comparații anuale (sau alte perioade) când baza admis date toata lumea anterior al anului(lună sau altă perioadă). O astfel de bază se numește mobil. Acesta este de obicei folosit în analiza seriilor de timp (serii de dinamică).

RelaţiigradeȘicomparatii vă permit să comparați diferiți indicatori pentru a identifica ce valoare este mult mai mare decât cealaltă, în ce măsură un fenomen diferă de altul sau este similar cu acesta, ce este comun și diferit în procesele statistice observate etc.

Un indice este un indicator relativ special creat de comparație (în timp, spațiu, în comparație cu o prognoză etc.), care arată de câte ori nivelul fenomenului studiat în unele condiții diferă de nivelul aceluiași fenomen în alte condiții. conditii. Cei mai des întâlniți indici sunt în statistica economică, deși aceștia joacă un anumit rol și în analiza fenomenelor juridice.

Indicii sunt indispensabili în cazurile în care este necesară compararea unor indicatori disparați, a căror simplă însumare este imposibilă. Prin urmare, indicii sunt de obicei definiți ca numere-indicatoripentrumăsurătorimijlocdifuzoareagregateeterogenelemente.

În statistică, indicii sunt de obicei notați cu litera I (i). Majusculă sau capital – depinde dacă vorbim despre un indice individual (privat) sau este general.

Individualindici(i) reflectă raportul dintre indicatorul perioadei curente și indicatorul corespunzător perioadei comparate.

Consolidatindici sunt utilizate în analiza corelației fenomenelor socio-economice complexe și constau din două părți: valoarea indexată reală și co-măsurarea („greutatea”).

2. Medii și aplicarea lor în statistica juridică

Rezultatul procesării indicatorilor absoluti și relativi este construcția seriilor de distribuție. Rând distributie - acestordonatpecalitatesaucantitativRecomandatedistributieunitatiagregate. Analiza acestor serii stă la baza oricărei analize statistice, oricât de complexă se va dovedi a fi în viitor.

O serie de distribuție poate fi construită pe baza unor caracteristici calitative sau cantitative. În primul caz se numește atributiv, in secunda - variațională. În acest caz, se numește diferența într-o trăsătură cantitativă variație, și acest semn în sine - opțiune. Serii variaționale trebuie să se ocupe cel mai adesea de statisticile juridice.

O serie variațională constă întotdeauna din două coloane (grafic). Se indică valoarea unui atribut cantitativ în ordine crescătoare, care, de fapt, se numesc opțiuni, care sunt indicate X. Cealaltă coloană (coloană) indică numărul de unități care sunt caracteristice uneia sau alteia variante. Ele sunt numite frecvențe și sunt notate cu litera latină f.

Tabelul 2.1

Opțiune X

Frecvență f

Frecvența de manifestare a uneia sau alteia trăsături este foarte importantă la calcularea altor indicatori statistici semnificativi, și anume, mediile și indicatorii de variație.

Serii de variații, la rândul lor, pot fi discret sau interval. Seriile discrete, după cum sugerează și numele, sunt construite pe baza unor caracteristici care variază discret, iar seriile de intervale sunt construite pe baza variațiilor continue. Deci, de exemplu, repartizarea infractorilor pe vârstă poate fi fie discretă (18, 19,20 ani etc.) fie continuă (până la 18 ani, 18-25 ani, 25-30 ani etc.). Mai mult decât atât, seriile de intervale în sine pot fi construite atât în ​​funcție de discret, cât și în funcție de principiul continuu. În primul caz, limitele intervalelor adiacente nu se repetă; în exemplul nostru, intervalele vor arăta astfel: până la 18 ani, 18-25, 26-30, 31-35 etc. O astfel de serie se numește continuudiscretrând. intervalrânddincontinuuvariație presupune coincidenta limitei superioare a intervalului anterior cu limita inferioară ulterior.

Primul indicator care descrie seria variațională este mediu cantități. Ele joacă un rol important în statistica juridică, deoarece numai cu ajutorul lor este posibilă caracterizarea populațiilor după un semn variabil cantitativ, prin care pot fi comparate. Cu ajutorul valorilor medii, este posibil să comparăm seturi de fenomene semnificative din punct de vedere juridic care ne interesează în funcție de anumite caracteristici cantitative și să tragem concluziile necesare din aceste comparații.

Mediucantități Reflectați cel mai general tendinţă (regularitate), inerente întregii mase de fenomene studiate. Se manifestă în tipic caracteristică cantitativă, adică în valoarea medie a tuturor indicatorilor (variabili) disponibili.

Statistica a dezvoltat multe tipuri de medii: aritmetice, geometrice, cubice, armonice etc. Cu toate acestea, practic nu sunt utilizate în statistica juridică, așa că vom lua în considerare doar două tipuri de medii - media aritmetică și media geometrică.

Cea mai comună și cunoscută medie este in mediearitmetic. Pentru a-l calcula, se calculează suma indicatorilor și se împarte la numărul total indicatori. De exemplu, o familie de 4 persoane este formată din părinți de 38 și 40 de ani și doi copii de 7 și 10 ani. Însumăm vârsta: 38 + 40 + 7 + 10 și împărțim suma rezultată de 95 la 4. Rezultatul rezultat varsta medie familie - 23,75 ani. Sau să calculăm volumul mediu lunar de muncă al investigatorilor dacă un departament de 8 persoane rezolvă 25 de cazuri pe lună. Împărțiți 25 la 8 și obțineți 3.125 de cazuri pe lună per investigator.

În statistica juridică, media aritmetică este utilizată la calcularea volumului de muncă al angajaților (anchetatori, procurori, judecători etc.), calcularea creșterii absolute a criminalității, calcularea eșantionului etc.

Cu toate acestea, în exemplul de mai sus, volumul mediu de lucru lunar per investigator a fost calculat incorect. Cert este că media aritmetică simplă nu ia în considerare frecvență trăsătură studiată. În exemplul nostru, volumul mediu lunar de muncă pentru un investigator este la fel de corect și informativ ca „temperatura medie într-un spital” dintr-o anecdotă binecunoscută, care, după cum știți, este temperatura camerei. Pentru a ține cont de frecvența manifestărilor trăsăturii studiate la calcularea mediei aritmetice, se utilizează după cum urmează in mediearitmeticponderat sau medie pentru serii variaționale discrete. (Seria variațională discretă - succesiunea schimbării unui semn în funcție de indicatori discreti (discontinui).

Media ponderată aritmetică ( medie ponderată) nu are diferențe fundamentale față de media aritmetică simplă. În ea, însumarea aceleiași valori este înlocuită prin înmulțirea acestei valori cu frecvența ei, adică. în acest caz, fiecare valoare (variantă) este ponderată în funcție de frecvența de apariție.

Deci, calculând volumul mediu de muncă al anchetatorilor, trebuie să înmulțim numărul de cazuri cu numărul de anchetatori care au investigat exact un astfel de număr de cazuri. De obicei, este convenabil să prezentați astfel de calcule sub formă de tabele:

Tabelul 2.2

Numărul de cazuri

(opțiune X)

Numărul de investigatori (frecvență f)

Opțiune de artă

la frecvente ( Xf)

2. Calculați media ponderată reală cu formula:

Unde X- numărul de dosare penale, și f- numărul de anchetatori.

Astfel, media ponderată nu este 3,125, ci 4,375. Dacă vă gândiți bine, așa ar trebui să fie: sarcina asupra fiecărui investigator în parte crește datorită faptului că un investigator din departamentul nostru ipotetic s-a dovedit a fi un leneș - sau, dimpotrivă, a investigat un investigator deosebit de important și caz complex. Dar chestiunea interpretării rezultatelor unui studiu statistic va fi luată în considerare în subiectul următor. În unele cazuri și anume în cazurile de frecvențe grupate distribuție discretă- calculul mediei, la prima vedere, nu este evident. Să presupunem că trebuie să calculăm media aritmetică pentru distribuția persoanelor condamnate pentru huliganism în funcție de vârstă. Distribuția arată astfel:

Tabelul 2.3

(opțiune X)

Numărul de condamnați (frecvență f)

Punct de mijloc al intervalului

Opțiune de artă

la frecvente ( Xf)

(21-18) /2+18=19,5

În plus, media este calculată conform regulii generale și este de 23,6 ani pentru această serie discretă. În cazul așa-numitului. rânduri deschise, adică în situațiile în care intervalele extreme sunt determinate de „mai puțin decât X" sau mai mult X„, valoarea intervalelor extreme este setată similar celorlalte intervale.

3. Serii de dinamică

Fenomenele sociale studiate de statistică sunt în dezvoltare constantăși schimbare. Indicatorii socio-juridici pot fi prezentați nu numai într-o formă statică, reflectând un anumit fenomen, ci și ca proces care se desfășoară în timp și spațiu, precum și sub forma interacțiunii caracteristicilor studiate. Cu alte cuvinte, seriile de timp arată dezvoltarea unei trăsături, de ex. schimbarea sa în timp, spațiu sau în funcție de condițiile de mediu.

Această serie este o succesiune de valori medii în perioadele specificate de timp (pentru fiecare an calendaristic).

Pentru un studiu mai profund al fenomenelor sociale și analiza acestora nu este suficientă o simplă comparație a nivelurilor unei serii de dinamici; este necesar să se calculeze indicatorii derivați ai unei serii de dinamici: creștere absolută, rata de creștere, rata de creștere, medie. creșterea și ratele de creștere, conținutul absolut de o creștere la sută.

Calculul indicatorilor seriei de dinamică se realizează pe baza unei comparații a nivelurilor acestora. În acest caz, există două moduri de a compara nivelurile seriei dinamice:

indicatori de bază, când toate nivelurile ulterioare sunt comparate cu unele inițiale, luate ca bază;

indicatori de lanț, când fiecare nivel ulterior al unei serii de dinamică este comparat cu cel anterior.

Creșterea absolută arată câte unități este nivelul perioadei curente mai mult sau mai mic decât nivelul perioadei de bază sau anterioare pentru o anumită perioadă de timp.

Creșterea absolută (P) este calculată ca diferență între nivelurile comparate.

Creștere absolută de bază:

P b = y i - y bazele . (f.1).

Creștere absolută în lanț:

P c = y i - y i -1 (f.2).

Rata de creștere (Tr) arată de câte ori (cu ce procent) nivelul perioadei curente este mai mare sau mai mic decât nivelul perioadei de bază sau anterioare:

Rata de creștere de bază:

(f.3)

Rata de creștere a lanțului:

(f.4)

Rata de creștere (Tpr) arată cât de procente este nivelul perioadei curente mai mult sau mai mic decât nivelul de bază sau al perioadei anterioare, luate ca bază de comparație și este calculată ca raportul dintre creșterea absolută și nivelul absolut , luată ca bază.

Rata de creștere poate fi calculată și scăzând 100% din rata de creștere.

Rata de creștere de bază:

sau (f.5)

Rata de creștere a lanțului:

sau (f.6)

Rata medie de creștere este calculată prin formula mediei geometrice a ratelor de creștere a unei serii de dinamice:

(formularul 7)

unde este rata medie de creștere;

- rate de crestere pentru anumite perioade;

n- numărul de rate de creștere.

Probleme similare cu un exponent rădăcină mai mare de trei, de regulă, sunt rezolvate folosind logaritmul. Din algebră se știe că logaritmul rădăcinii este egal cu logaritmul valoarea rădăcinii împărțită la exponentul rădăcinii și că logaritmul produsului mai multor factori este egală cu suma logaritmii acestor factori.

Astfel, rata medie de creștere se calculează prin luarea rădăcinii n grad din lucrările individului n- ratele de creștere a lanțului. Rata medie de creștere este diferența dintre rata medie de creștere și unu (), sau 100% atunci când rata de creștere este exprimată ca procent:

sau

În lipsa unei serii dinamice niveluri intermediare creșterea medie și ratele de creștere sunt determinate de următoarea formulă:

(f.8)

unde este nivelul final al seriei dinamice;

- nivelul initial al seriei dinamice;

n - numărul de niveluri (date).

Este evident că indicatorii ratelor medii de creștere și creștere, calculați prin formulele (f.7 și f.8), au aceleași valori numerice.

Conținutul absolut al creșterii de 1% arată ce valoare absolută conține o creștere de 1% și este calculat ca raportul dintre creșterea absolută și rata de creștere.

Conținut absolut de creștere cu 1%:

de bază: (f.9)

lanț: (f.10)

Calcul si analiza valoare absolută fiecare creștere procentuală contribuie la o înțelegere mai profundă a naturii dezvoltării fenomenului studiat. Datele exemplului nostru arată că, în ciuda fluctuațiilor ratelor de creștere și a creșterii peste ani individuali, indicatorii de bază ai conținutului absolut de creștere de 1% rămân neschimbați, în timp ce indicatorii de lanț care caracterizează modificările valorii absolute a creșterii de un procent în fiecare an următor față de cel precedent sunt în continuă creștere.

Atunci când se construiesc, se prelucrează și se analizează serii de timp, este adesea necesară determinarea nivelurilor medii ale fenomenelor studiate pentru anumite perioade de timp. Seria de intervale cronologice medii se calculează la intervale egale prin formula mediei aritmetice simple, cu intervale inegale - prin media ponderată aritmetică:

Unde - nivel mediu serie de intervale;

- nivelurile inițiale ale seriei;

n- numărul de niveluri.

Pentru seria momentelor de dinamică, cu condiția ca intervalele de timp dintre date să fie egale, nivelul mediu se calculează folosind formula medie cronologică:

(f.11)

unde este valoarea cronologică medie;

y 1 ,., y n- nivelul absolut al seriei;

n - numărul de niveluri absolute ale seriei de dinamică.

Media cronologică a nivelurilor seriei de moment de dinamică este egală cu suma indicatorilor acestei serii, împărțită la numărul de indicatori fără unul; în acest caz, nivelurile inițiale și finale ar trebui luate la jumătate, deoarece numărul de date (momente) este de obicei cu unul mai mult decât numărul de perioade.

În funcție de conținutul și forma de prezentare a datelor inițiale (interval sau serie de momente de dinamică, intervale de timp egale sau nu) pentru a calcula diverse indicatori sociali, de exemplu, numărul mediu anual de infracțiuni și infracțiuni (pe tip), mărimea medie a soldurilor capitalului de lucru, numărul mediu de infractori etc., utilizează expresiile analitice adecvate.

4. Metode statistice interrelații

În întrebările anterioare, am luat în considerare, dacă pot să spun așa, analiza distribuțiilor „unidimensionale” – serii variaționale. Aceasta este o analiză foarte importantă, dar departe de singurul tip de analiză statistică. Analiza seriilor variaționale este baza pentru tipuri mai „avansate” de analiză statistică, în primul rând pentru studiuinterconexiuni. În urma unui astfel de studiu, se dezvăluie relații cauzale între fenomene, ceea ce face posibilă determinarea ce modificări ale semnelor afectează variațiile fenomenelor și proceselor studiate. În același timp, semnele care provoacă o schimbare în alții se numesc factoriale (factori), iar semnele care se modifică sub influența lor se numesc efective.

În știința statistică, există două tipuri de relații între diverse semne si informatiile lor – legatura functionala (rigid determinata) si statistica (stochastica).

Pentru funcţionalconexiuni corespondența deplină între modificarea atributului factorului și modificarea valorii efective este caracteristică. Această relație se manifestă în mod egal în toate unitățile oricărei populații. Cel mai simplu exemplu: o creștere a temperaturii se reflectă în volumul de mercur dintr-un termometru. În acest caz, temperatura ambientală acționează ca un factor, iar volumul de mercur - ca o caracteristică eficientă.

Relațiile funcționale sunt tipice pentru fenomene studiate de științe precum chimia, fizica, mecanica, în care este posibil să se înființeze experimente „pure”, în care influența factorilor străini este eliminată. Adevărul este că conexiune funcționalăîntre cele două este posibilă numai dacă a doua valoare (atributul rezultat) depinde numai Și exclusiv din prima. În evenimentele publice, acest lucru este extrem de rar.

Procesele socio-juridice, care sunt rezultatul impactului simultan un numar mare factorii sunt descriși prin intermediul unor relații statistice, adică relații stocastic (întâmplător) determinat când valori diferite ale unei variabile corespund unor valori diferite ale altei variabile.

Cel mai important (și comun) caz de dependență stocastică este corelațiedependenta. Cu o astfel de dependență, cauza determină efectul nu clar, ci doar cu un anumit grad de probabilitate. Un tip separat de analiză statistică este dedicat identificării unor astfel de relații - analiza corelației.

Principal o sarcină analiza corelației – pe baza unor metode strict matematice pentru a stabili o expresie cantitativă a relației care există între caracteristicile studiate. Există mai multe abordări ale modului în care exact este calculată corelația și, în consecință, mai multe tipuri de coeficienți de corelație: coeficientul de contingență A.A. Chuprov (pentru a măsura relația dintre caracteristicile calitative), coeficientul de asociere al lui K. Pearson, precum și coeficienții de corelare a rangului lui Spearman și Kendall. În cazul general, astfel de coeficienți arată probabilitatea cu care apar relațiile studiate. În consecință, cu cât coeficientul este mai mare, cu atât relația dintre trăsături este mai pronunțată.

Pot exista atât corelații directe, cât și inverse între factorii studiați. Dreptcorelațiedependenta observat în cazurile în care modificarea valorilor factorului corespunde acelorași modificări ale valorii atributului rezultat, adică atunci când valoarea atributului factorului crește, crește și valoarea atributului efectiv și vice invers. De exemplu, există o corelație directă între factorii criminogeni și criminalitatea ( cu semnul „+”). Dacă o creștere a valorilor unui atribut provoacă modificări inverse ale valorilor altuia, atunci o astfel de relație se numește verso. De exemplu, cu cât controlul social este mai mare într-o societate, cu atât rata criminalității este mai mică (conexiune cu semnul „-”).

Atât direct, cât și feedback-ul pot fi drepte și curbilinie.

Rectilinie ( liniare) relațiile apar atunci când, odată cu creșterea valorilor factorului-atribut, are loc o creștere (directă) sau o scădere (inversă) a valorii atributului-consecință. Matematic, o astfel de relație este exprimată prin ecuația de regresie: la = dar + bX, Unde la - semn-consecință; dar Și b - coeficienții de cuplare corespunzători; X - factor-semn.

Curbiliniu conexiunile sunt diferite. O creștere a valorii unui atribut factor are un efect inegal asupra valorii atributului rezultat. Inițial, această relație poate fi directă și apoi inversă. Un exemplu binecunoscut este relația dintre infracțiuni și vârsta infractorilor. În primul rând, activitatea infracțională a indivizilor crește direct proporțional cu creșterea vârstei infractorilor (până la aproximativ 30 de ani), iar apoi, odată cu creșterea vârstei, activitatea infracțională scade. În plus, vârful curbei de distribuție a infractorilor în funcție de vârstă este deplasat de la medie la stânga (spre o vârstă mai mică) și este asimetric.

Legăturile directe de corelație pot fi unudesprefactorial, când se investighează relația dintre un factor-semn și un semn-consecință (corelația de perechi). Pot fi, de asemenea multifactorial, când se studiază influența multor semne-factori care interacționează asupra semnului-consecință (corelația multiplă).

Însă, indiferent care dintre coeficienții de corelație este utilizat, indiferent de corelația investigată, este imposibil să se stabilească o relație între semne pe baza doar indicatorilor statistici. Analiza inițială a indicatorilor este întotdeauna o analiză calitativ, timp în care se studiază și se înțelege natura socio-juridică a fenomenului. În acest caz, se folosesc acele metode și abordări științifice care sunt caracteristice ramurii științei care studiază acest fenomen (sociologie, drept, psihologie etc.). Apoi, analiza grupărilor și a mediilor vă permite să prezentați ipoteze, să construiți modele, să determinați tipul de conexiune și dependență. Abia după aceasta se determină caracteristica cantitativă a dependenței - de fapt, coeficientul de corelație.

Literatură

1. Avanesov G.A. Fundamentele previziunii criminologice. Tutorial. Moscova: Școala Superioară a Ministerului Afacerilor Interne al URSS, 1970.

2. Avrutin K.E., Gilinsky Ya.I. Analiza criminologică a criminalității în regiune: metodologie, tehnică, tehnică. L., 1991.

3. Adamov E. şi colab. Economia şi statistica firmelor: Manual / Ed. S.D. Ilyenkova. M.: Finanțe și statistică, 2008.

4. Balakina N.N. Statistici: Proc. - metoda. complex. Khabarovsk: IVESEP, filiala din Khabarovsk, 2008.

5. Bluvshtein Yu.D., Volkov G.I. Serii de timp Crima: un ghid de studiu. Minsk, 1984.

6. Borovikov V.P., Borovikov I.P. STATISTICA - Analiza statistica si prelucrarea datelor in Mediul Windows. M.: Editura de informare și „Filin”, 1997.

7. Borodin S.V. Lupta împotriva criminalității: model teoretic program cuprinzător. Moscova: Nauka, 1990.

8. Întrebări de statistică // Jurnalul științific și informativ lunar al Comitetului de Stat de Statistică al Federației Ruse M., 2002-2009.

9. Gusarov V.M. Statistici: Proc. indemnizație pentru universități. M.: UNITI-DANA, 2009.

10. Dobrynina N.V., Nimenya I.N. Statistici: Proc. - metoda. indemnizatie. Sankt Petersburg: SPbGIEU, 2009.

11. Eliseeva I.I., Yuzbashev M.M. Teoria generală statistică: Manual pentru universităţi / Ed.I. I. Eliseeva.ed. a IV-a. M.: Finanțe și statistică, 1999.

12. Eliseeva I.I., Yuzbashev M.M. Teoria generală a statisticii: manual. - M.: Finanțe și statistică, 1995.

13. Eremina T., Matyatina V., Plushevskaya Yu. Probleme de dezvoltare a sectoarelor economiei ruse // Questions of Economics. 2009. Nr. 7.

14. Efimova M.R., Ganchenko O.I., Petrova E.V. Workshop de teoria generală a statisticii: Proc. indemnizatie.ed. a II-a, revizuita. si suplimentare M.: Finanțe și statistică, 2009.

15. Efimova M.R., Petrova E.V., Rumyantsev V.N. Teoria generală a statisticii: manual. - M.: INFRA-M, 1998.

16. Kirillov L.A. Studiu criminologic și prevenire a criminalității de către organele de afaceri interne M., 1992.

17. Kosoplechev N.P., Metode de cercetare criminologică. M., 1984.

18. Lee D.A. Crima în Rusia: analiza sistemului. M., 1997.

19. Lee D.A. Contabilitatea statistică penală: modele structurale și funcționale. M .: Agenția de informare și publicare „Lumea Rusă”, 1998.

20. Makarova N.V., Trofimets V.Ya. Statistici în Excel: Proc. indemnizatie. M.: Finanțe și statistică, 2009.

21. Nesterov L.I. Noi tendințe în statistica averii naționale // Întrebări de statistică. 2008. Nr. 11.

22. Petrova E.V. si altele.Atelier de statistica transport: Proc. indemnizatie. M.: Finanțe și statistică, 2008.

23. Criminalitatea în Rusia în anii nouăzeci și unele aspecte ale legalității și lupta împotriva acesteia. M., 1995.

24. Criminalitate, statistică, drept // Ed. prof. A.I. Creanţă. Moscova: Asociația Criminologică, 1997.

25. Rostov K.T. Criminalitatea în regiunile Rusiei (analiza socială și criminologică). Sankt Petersburg: Academia din Sankt Petersburg a Ministerului Afacerilor Interne al Rusiei, 1998.

26. Instrucțiuni pentru recensământul privind procedura de desfășurare a recensământului populației din 2002 din întreaga Rusie și de completare a documentelor de recensământ. M.: PIK „Offset”, 2003.

27. Savyuk L.K. Statistici juridice: manual. M.: Jurist, 1999.

28. Salin V.N., Shpakovskaya E.P. Statistica socio-economică: Manual pentru universități. Moscova: Gardanika avocat, 2008.

29. Sidenko A.V., Popov G.Yu., Matveeva V.M. Statistici: manual. Moscova: Afaceri și servicii, 2008.

30. Prevenirea socială a infracțiunilor: sfaturi, recomandări // Ed. DA. Kerimov. M., 1989.

31. statistici sociale: Manual pentru universităţi // Ed. I.I. Eliseeva. a 3-a ed. M.: Finanțe și statistică, 2009.

Găzduit pe Allbest.ru

Documente similare

    Luarea în considerare a principalelor metode de analiză statistică. Studiul districtului municipal Kungursky. Efectuarea calculelor conform indicatorilor din anuar. Analiza demografiei și dezvoltării socio-economice a zonei pe baza rezultatelor aplicației.

    lucrare de termen, adăugată 24.06.2015

    Valoarea medie - caracteristică liberă regularităţile procesului în condiţiile în care se desfăşoară. Forme și metode de calcul al valorilor medii. Aplicarea mediilor în practică: calculul diferențierii salariile pe sectoare ale economiei.

    lucrare de termen, adăugată 12/04/2007

    Metode statistice de analiză a divorțului. Analiza statistică a divorțurilor în regiunea Amur. Analiza dinamicii și structurii divorțurilor. Gruparea orașelor și districtelor din regiunea Amur după numărul de divorțuri pe an. Calcularea valorilor medii și a indicatorilor de variație.

    lucrare de termen, adăugată 04.12.2014

    Aspecte ale analizei statistice a furnizării de locuințe. Aplicarea metodelor statistice de analiză a furnizării de locuințe a populației. Analiza omogenității populației raioanelor în ceea ce privește factorul de încărcare demografică. Analiza corelației-regresiune.

    lucrare de termen, adăugată 18.01.2009

    Organizare statistici de stat in Rusia. Cerințe pentru datele colectate. Forme, tipuri și metode de observație statistică. Pregătirea observaţiei statistice. Erori de observare statistică. Metode de monitorizare a statisticilor.

    rezumat, adăugat 02.12.2007

    Elaborarea unui program de monitorizare a statisticilor de drept penal, principalele sale etape și cerințe, metode și proceduri de implementare. Determinarea stării criminalităţii în zona de studiu. Reguli de înregistrare a rezultatelor observației statistice.

    test, adaugat 18.05.2010

    Clasificarea documentaţiei statistice. Tipuri de documente: scrise, iconografice, statistice și fonetice. Metode și modalități de analiză a materialelor: neformalizate (tradiționale) și formalizate. Procedura de implementare a analizei de conținut.

    prezentare, adaugat 16.02.2014

    concept mărime medie. Metoda mediilor în studiul fenomenelor sociale. Relevanța aplicării metodei mediilor în studiul fenomenelor sociale este asigurată de posibilitatea trecerii de la singular la general, de la aleatoriu la regulat.

    lucrare de termen, adăugată 13.01.2009

    Conceptul de observație statistică. Analiza rectilinii și curbilinii corelații. Cunoașterea formulelor și valorilor observației statistice. Analiza calculelor relației indicilor, construcția unei histograme, elemente ale unei serii de distribuție.

    test, adaugat 27.03.2012

    Caracteristicile principalelor indicatori ai analizei statistice condiționarea socială sănătate Publicăîn Federația Rusă. Niveluri de evaluare a sănătății din punctul de vedere al medicinei sociale. Clasificarea părții copiilor din populație pe grupe de sănătate.

Suficient detaliat în literatura internă. În practica întreprinderilor rusești, între timp, doar unele dintre ele sunt folosite. Luați în considerare următoarele metode prelucrare statistică.

Informatii generale

În practica întreprinderilor autohtone, este predominant obișnuit metode de control statistic. Dacă vorbim despre reglementarea procesului tehnologic, atunci se remarcă extrem de rar. Aplicarea metodelor statistice prevede că la întreprindere se formează un grup de specialişti care au calificarea corespunzătoare.

Sens

Conform ISO ser. 9000, furnizorul trebuie să determine necesitatea metodelor statistice care sunt aplicate în timpul dezvoltării, reglementării și testării oportunităților proces de producțieși caracteristicile produsului. Metodele folosite se bazează pe teoria probabilității și calcule matematice. Metode statistice pentru analiza datelor poate fi implementat în orice etapă a ciclului de viață al produsului. Acestea oferă o evaluare și o evaluare a gradului de eterogenitate a produselor sau a variabilității proprietăților acestora în raport cu denumirile stabilite sau valorile cerute, precum și variabilitatea procesului de creare a acestora. Metodele statistice sunt metode prin care poți precizie datăși fiabilitatea de a judeca starea fenomenelor care sunt investigate. Ele vă permit să preziceți anumite probleme, să dezvoltați soluții optime pe baza informațiilor, tendințe și modele de fapt studiate.

Instructiuni de utilizare

Principalele domenii în care sunt răspândite metodele statistice sunt:


Practica țărilor dezvoltate

Metodele statistice sunt o bază care asigură crearea de produse cu caracteristici ridicate de consumator. Aceste tehnici sunt utilizate pe scară largă în țările industrializate. Metodele statistice sunt, de fapt, garanții că consumatorii primesc produse care îndeplinesc cerințele stabilite. Efectul utilizării lor a fost dovedit prin practică. întreprinderile industriale Japonia. Ei au fost cei care au contribuit la atingerea celui mai înalt nivel de producție în această țară. Experiența pe termen lung a țărilor străine arată cât de eficiente sunt aceste tehnici. În special, se știe că Hewlelt Packard, folosind metode statistice, a reușit să reducă numărul căsătoriilor pe lună de la 9.000 la 45 de unități într-unul dintre cazuri.

Dificultăți de implementare

În practica casnică, există o serie de obstacole care nu permit utilizarea metode statistice de studiu indicatori. Dificultățile apar din cauza:


Dezvoltarea programelor

Trebuie spus că determinarea necesității anumitor metode statistice în domeniul calității, alegerea, stăpânirea unor tehnici specifice este o muncă destul de complicată și îndelungată pentru orice întreprindere autohtonă. Pentru implementarea sa eficientă, se recomandă dezvoltarea unui program special pe termen lung. Ar trebui să prevadă formarea unui serviciu ale cărui sarcini vor include organizarea și ghid metodologic aplicarea metodelor statistice. În cadrul programului, este necesar să se asigure dotarea cu mijloace tehnice adecvate, formarea specialiștilor și determinarea compoziției sarcinilor de producție care ar trebui rezolvate folosind metodele selectate. Stăpânirea este recomandată pentru a începe cu utilizarea celor mai simple abordări. De exemplu, puteți folosi binecunoscuta producție elementară. Ulterior, este indicat să treceți la alte metode. De exemplu, poate fi analiza varianței, prelucrarea selectivă a informațiilor, reglarea proceselor, planificarea cercetărilor și experimentelor factoriale etc.

Clasificare

Metodele statistice de analiză economică includ diferite trucuri. Inutil să spun că sunt destul de multe. Cu toate acestea, un expert de top în domeniul managementului calității din Japonia, K. Ishikawa, recomandă utilizarea a șapte metode de bază:

  1. Diagrame Pareto.
  2. Gruparea informațiilor în funcție de caracteristicile comune.
  3. Carduri de control.
  4. Diagrame cauză și efect.
  5. Histograme.
  6. Fișe de control.
  7. Diagrame de dispersie.

Pe baza propriei sale experiențe în domeniul managementului, Ishikawa susține că 95% din toate problemele și problemele din întreprindere pot fi rezolvate folosind aceste șapte abordări.

Diagrama Pareto

Acesta se bazează pe un anumit raport. A fost numit „Principiul Pareto”. Potrivit acestuia, din 20% din cauze apar 80% din consecinte. arată într-un mod clar şi înţeles influenţa relativă a fiecărei circumstanţe asupra problema obisnuitaîn ordine descrescătoare. Acest impact poate fi investigat asupra numărului de pierderi, defecte, provocate de fiecare cauză. Influența relativă este ilustrată de bare, influența cumulativă a factorilor printr-o linie dreaptă cumulată.

diagrama cauza si efect

Pe ea, problema studiată este descrisă în mod convențional sub forma unei săgeți drepte orizontale, iar condițiile și factorii care o afectează indirect sau direct sunt sub formă de săgeți oblice. La construcție, chiar și circumstanțe aparent nesemnificative ar trebui să fie luate în considerare. Acest lucru se datorează faptului că în practică există destul de des cazuri în care rezolvarea problemei este asigurată prin excluderea mai multor factori aparent nesemnificativi. Motivele care influențează circumstanțele principale (ale primului și al comenzii următoare) sunt reprezentate pe diagramă cu săgeți scurte orizontale. Diagrama detaliată va fi sub forma unui schelet de pește.

Gruparea informațiilor

Acest metoda economico-statistică este folosit pentru a organiza un set de indicatori care au fost obținuți prin evaluarea și măsurarea unuia sau mai multor parametri ai unui obiect. De regulă, astfel de informații sunt prezentate sub forma unei secvențe neordonate de valori. Acestea pot fi dimensiunile liniare ale piesei de prelucrat, punctul de topire, duritatea materialului, numărul de defecte și așa mai departe. Pe baza unui astfel de sistem, este dificil să se tragă concluzii despre proprietățile produsului sau despre procesele de creare a acestuia. Comanda se face folosind diagrame cu linii. Ele arată clar modificări ale parametrilor observați pe o anumită perioadă.

Fișa de control

De regulă, este prezentat sub forma unui tabel de distribuție a frecvenței pentru apariția valorilor măsurate ale parametrilor obiectului în intervalele corespunzătoare. Listele de verificare sunt întocmite în funcție de scopul studiului. Gama de valori ale indicatorului este împărțită în intervale egale. Numărul lor este de obicei ales egal cu rădăcina pătrată a numărului de măsurători efectuate. Formularul trebuie să fie simplu pentru a elimina problemele la completare, citire, verificare.

grafic de bare

Se prezintă sub forma unui poligon în trepte. Ea ilustrează clar distribuția indicatorilor de măsurare. Gamă valorile stabilite este împărțit în intervale egale, care sunt așezate de-a lungul axei x. Se construiește un dreptunghi pentru fiecare interval. Înălțimea sa este egală cu frecvența de apariție a valorii în intervalul dat.

Scatterplots

Ele sunt folosite pentru a testa ipoteza despre relația dintre doi variabile. Modelul este construit după cum urmează. Valoarea unui parametru este reprezentată pe axa absciselor, iar valoarea altui indicator este reprezentată pe ordonată. Ca rezultat, pe grafic apare un punct. Aceste acțiuni se repetă pentru toate valorile variabilelor. Dacă există o relație, câmpul de corelație este extins, iar direcția nu va coincide cu direcția axei y. Dacă nu există nicio constrângere, aceasta va fi paralelă cu una dintre axe sau va avea forma unui cerc.

Carduri de control

Ele sunt utilizate atunci când se evaluează un proces pe o anumită perioadă. Formarea graficelor de control se bazează pe următoarele prevederi:

  1. Toate procesele se abate de la parametrii setați în timp.
  2. Cursul instabil al fenomenului nu se schimbă întâmplător. Abaterile care depășesc limitele limitelor așteptate sunt non-aleatorie.
  3. Schimbările individuale pot fi prezise.
  4. Un proces stabil poate devia aleatoriu în limitele așteptate.

Utilizare în practica întreprinderilor rusești

Trebuie spus că experiența internă și străină arată că cea mai eficientă metodă statistică de evaluare a stabilității și acurateței echipamentelor și a proceselor tehnologice este compilarea graficelor de control. Această metodă este utilizată și în reglarea capacităților potențiale de producție. La construirea hărților, este necesar să alegeți corect parametrul studiat. Se recomandă să se acorde preferință acelor indicatori care au legătură directă cu utilizarea prevăzută a produsului, care pot fi măsurați cu ușurință și care pot fi influențați de controlul procesului. Dacă o astfel de alegere este dificilă sau nu este justificată, este posibil să se evalueze valorile corelate (interrelate) cu parametrul controlat.

Nuanțe

Dacă măsurarea indicatorilor cu acuratețea necesară cartografierii după un criteriu cantitativ nu este posibilă din punct de vedere economic sau tehnic, se folosește un semn alternativ. Termeni precum „căsătorie” și „defect” îi sunt asociați. Acesta din urmă este înțeles ca fiecare neconformitate separată a produsului cu cerințele stabilite. Căsătoria este un produs, a cărui furnizare nu este permisă consumatorilor, din cauza prezenței de defecte în el.

Particularități

Fiecare tip de card are propriile sale particularități. Trebuie luat în considerare atunci când le alegeți pentru un anumit caz. Cardurile după criteriu cantitativ sunt considerate mai sensibile la schimbările procesului decât cele care utilizează o caracteristică alternativă. Cu toate acestea, primele necesită mai multă muncă. Sunt folosite pentru:

  1. Depanare proces.
  2. Evaluarea posibilităţilor de introducere a tehnologiei.
  3. Verificarea preciziei echipamentului.
  4. Definiții ale toleranței.
  5. Mapări multiple moduri acceptabile crearea produsului.

În plus

Dacă dezordinea procesului este caracterizată de deplasarea parametrului controlat, este necesar să se utilizeze hărți X. Dacă există o creștere a dispersiei valorilor, ar trebui alese modele R sau S. Este necesar, totuși, să se țină cont de o serie de caracteristici. În special, utilizarea diagramelor S va face posibilă stabilirea mai precisă și mai rapidă a dezordinei procesului decât modelele R cu aceleași, în același timp, construcția acestora din urmă nu necesită calcule complexe.

Concluzie

În economie, este posibil să se exploreze factorii care sunt dezvăluiți în cursul evaluare calitativă, în spațiu și dinamică. Ele pot fi folosite pentru a efectua calcule predictive. Metodele statistice de analiză economică nu includ metode de evaluare a relațiilor cauză-efect ale proceselor și evenimentelor economice, identificarea rezervelor promițătoare și neexploatate pentru îmbunătățirea performanței. Cu alte cuvinte, tehnicile factoriale nu sunt incluse în abordările luate în considerare.

statistici"biostatistica".

1. nominal;
2. ordinal;
3. interval;

mostre

reprezentant

cadru de probă eșantion simplu aleatoriu eșantionare pe intervale

eșantionarea stratificată

clusterȘi cota de eşantionare

ipoteza nulă

ipoteză alternativă putere

nivel de încredere».


Titlu: Fundamentele analizei datelor statistice
Descriere detaliata:

După finalizarea oricărei cercetări științifice, fundamentale sau experimentale, se efectuează o analiză statistică a datelor obținute. Pentru ca analiza statistică să fie realizată cu succes și să rezolve sarcinile, studiul trebuie planificat corespunzător. Prin urmare, fără a înțelege elementele de bază ale statisticilor, este imposibil să planificați și să procesați rezultatele unui experiment științific. Cu toate acestea, educatie medicala nu oferă nu numai cunoștințe de statistică, ci chiar elementele de bază matematica superioara. Prin urmare, de foarte multe ori se poate da peste părerea că doar un statistician ar trebui să se ocupe de prelucrarea statistică în cercetarea biomedicală, iar un cercetător medical ar trebui să se concentreze pe problemele sale medicale. munca stiintifica. O astfel de diviziune a muncii, care implică asistență în analiza datelor, este pe deplin justificată. Cu toate acestea, o înțelegere a principiilor statisticii este necesară cel puțin pentru a evita stabilirea incorectă a problemei pentru un specialist, comunicarea cu care înainte de începerea studiului este la fel de importantă ca și în etapa de prelucrare a datelor.

Înainte de a vorbi despre elementele de bază ale analizei statistice, este necesar să clarificăm sensul termenului " statistici". Sunt multe definiții, dar cea mai completă și concisă, în opinia noastră, este definiția statisticii ca „știința culegerii, prezentării și analizei datelor”. La rândul său, utilizarea statisticilor în aplicații pentru lumea vie se numește „biometrie” sau „ biostatistica".

De remarcat că de foarte multe ori statistica se reduce doar la prelucrarea datelor experimentale, fără a se acorda atenție stadiului de obținere a acestora. Cu toate acestea, cunoștințele statistice sunt necesare deja în timpul planificării experimentului, astfel încât indicatorii obținuți în timpul acestuia să poată oferi cercetătorului informaţii de încredere. Prin urmare, putem spune că analiza statistică a rezultatelor experimentului începe chiar înainte de începerea studiului.

Deja în stadiul de elaborare a unui plan, cercetătorul trebuie să înțeleagă clar ce tip de variabile vor fi în munca sa. Toate variabilele pot fi împărțite în două clase: calitative și cantitative. Intervalul pe care îl poate lua o variabilă depinde de scara de măsurare. Există patru scale principale:

1. nominal;
2. ordinal;
3. interval;
4. raţional (scara relaţiilor).

În scara nominală (scala „numelor”) există doar simboluri pentru descrierea unor clase de obiecte, de exemplu, „sex” sau „profesia pacientului”. Scara nominală presupune că variabila va lua valori, relații cantitative între care nu pot fi determinate. Astfel, este imposibil să se stabilească o relație matematică între sexul masculin și cel feminin. Denumirile numerice convenționale (femei - 0, bărbați - 1 sau invers) sunt date în mod absolut arbitrar și sunt destinate numai procesării computerizate. Scara nominală este calitativă în forma sa pură, categorii separate în această scară sunt exprimate prin frecvențe (număr sau proporție de observații, procente).

Scala ordinală (ordinală) prevede că categoriile individuale din ea pot fi aranjate în ordine crescătoare sau descrescătoare. În statistica medicală, un exemplu clasic de scară ordinală este gradarea severității unei boli. În acest caz, putem construi severitatea în ordine crescătoare, dar încă nu avem capacitatea de a specifica relații cantitative, adică distanța dintre valorile măsurate la scara ordinală este necunoscută sau nu contează. Este ușor de stabilit ordinea valorilor variabilei „severitate”, dar este imposibil să se determine de câte ori o afecțiune severă diferă de o afecțiune moderată.

Scara ordinală se referă la gen tipuri cantitative date, iar gradația acesteia poate fi descrisă atât prin frecvențe (ca la o scară calitativă), cât și prin măsuri valorile centrale pe care ne vom concentra mai jos.

Scalele de interval și raționale sunt tipuri de date pur cantitative. Într-o scară de interval, putem deja stabili cât de mult diferă o valoare a unei variabile de alta. Astfel, o creștere a temperaturii corpului cu 1 grad Celsius înseamnă întotdeauna o creștere a căldurii degajate de un număr fix de unități. Cu toate acestea, în scala intervalului există atât pozitive, cât și valori negative(fără zero absolut). În acest sens, este imposibil să spunem că 20 de grade Celsius sunt de două ori mai calde decât 10. Putem afirma doar că 20 de grade este cu atât mai cald decât 10, cât 30 este mai cald decât 20.

Scara rațională (scala raportului) are un singur punct de referință și numai valori pozitive. În medicină, cele mai multe scale raționale sunt concentrații. De exemplu, un nivel de glucoză de 10 mmol/L este de două ori mai mare decât 5 mmol/L. Pentru temperatură, scara rațională este scara Kelvin, unde există zero absolut (absența căldurii).

Trebuie adăugat că orice variabilă cantitativă poate fi continuă, ca în cazul măsurării temperaturii corpului (aceasta este o scală de intervale continue), sau discretă, dacă numărăm numărul de celule sanguine sau descendenții animalelor de laborator (aceasta este un scară rațională discretă).

Aceste diferențe sunt de o importanță decisivă pentru alegerea metodelor de analiză statistică a rezultatelor experimentale. Deci, pentru datele nominale, este aplicabil testul chi-pătrat, iar binecunoscutul test Student necesită ca variabila (interval sau rațional) să fie continuă.

După ce problema tipului de variabilă a fost rezolvată, este necesar să începem formarea mostre. Un eșantion este un grup mic de obiecte dintr-o anumită clasă (în medicină, o populație). Pentru a obține date absolut exacte, este necesar să se studieze toate obiectele unei clase date, cu toate acestea, din motive practice (adesea financiare), este studiată doar o parte a populației, care se numește eșantion. Pe viitor, analiza statistică permite cercetătorului să extindă tiparele obținute la întreaga populație cu un anumit grad de acuratețe. De fapt, toate statisticile biomedicale au ca scop obținerea celor mai precise rezultate din cel mai mic număr posibil de observații, deoarece în cercetarea umană este importantă și o problemă etică. Nu ne putem permite să riscăm cantitate mare pacienţi decât este necesar.

Crearea unui eșantion este reglementată de o serie de cerințe obligatorii, a căror încălcare poate duce la concluzii eronate din rezultatele studiului. În primul rând, dimensiunea eșantionului este importantă. Precizia estimării parametrilor studiați depinde de dimensiunea eșantionului. Cuvântul „acuratețe” ar trebui luat în considerare aici. Cum mai multe dimensiuni dintre grupurile studiate, cu atât rezultatele sunt mai exacte (dar nu neapărat corecte) pe care le primește omul de știință. Pentru ca rezultatele studiilor de eșantionare să fie transferabile întregii populații în ansamblu, eșantionul trebuie să fie reprezentant. Reprezentativitatea eșantionului implică faptul că acesta reflectă toate proprietățile esențiale ale populației. Cu alte cuvinte, în loturile studiate se regăsesc persoane de sex, vârstă, profesii, statut social diferit etc. cu aceeași frecvență ca și în întreaga populație.

Cu toate acestea, înainte de a începe selecția grupului de studiu, ar trebui să se decidă asupra necesității de a studia o anumită populație. Un exemplu de populație pot fi toți pacienții cu o anumită nosologie sau persoane în vârstă de muncă etc. Astfel, rezultatele obținute pentru o populație de tineri de vârstă militară pot fi cu greu extrapolate la femeile aflate în postmenopauză. Setul de caracteristici pe care le va avea grupul de studiu determină „generalizabilitatea” datelor de studiu.

Eșantioanele pot fi generate în diferite moduri. Cel mai simplu este alegerea cu un generator de numere aleatorii. suma necesară obiecte dintr-o populaţie sau cadru de probă(cadru de eșantionare). Această metodă se numește eșantion simplu aleatoriu". Dacă alegeți aleatoriu un punct de plecare în cadrul de eșantionare și apoi luați fiecare al doilea, al cincilea sau al zecelea obiect (în funcție de ce dimensiuni de grup sunt necesare în studiu), obțineți eșantionare pe intervale. Eșantionarea pe intervale nu este aleatorie, deoarece posibilitatea repetării periodice a datelor în cadrul de eșantionare nu este niciodată exclusă.

Este posibil să se creeze așa-numitul „ eșantionarea stratificată”, care presupune că populația este formată din mai multe grupuri diferite și această structură ar trebui reprodusă în grupul experimental. De exemplu, dacă raportul dintre bărbați și femei dintr-o populație este de 30:70, atunci într-un eșantion stratificat, raportul lor ar trebui să fie același. La această abordare Este extrem de important să nu echilibrăm eșantionul în mod excesiv, adică să evitați omogenitatea caracteristicilor acestuia, altfel cercetătorul poate pierde șansa de a găsi diferențe sau relații în date.

Pe lângă metodele descrise de formare a grupurilor, există și clusterȘi cota de eşantionare. Primul este folosit atunci când obținerea de informații complete despre cadrul eșantionului este dificilă din cauza dimensiunii sale. Apoi eșantionul este format din mai multe grupuri incluse în populație. A doua - cota - este asemănătoare unui eșantion stratificat, dar aici distribuția obiectelor nu corespunde cu cea din populație.

Revenind la dimensiunea eșantionului, trebuie spus că aceasta este strâns legată de probabilitatea erorilor statistice de primul și al doilea fel. Erorile statistice se pot datora faptului că studiul nu studiază întreaga populație, ci o parte a acesteia. Eroarea de tip I este abaterea eronată ipoteza nulă. La rândul său, ipoteza nulă este ipoteza că toate grupurile studiate sunt luate din aceeași populație generală, ceea ce înseamnă că diferențele sau relațiile dintre ele sunt aleatorii. Dacă facem o analogie cu testele de diagnosticare, atunci o eroare de tip I este un rezultat fals pozitiv.

Eroarea de tip II este o abatere incorectă ipoteză alternativă, al cărui sens constă în faptul că diferențele sau relațiile dintre grupuri se datorează nu unei coincidențe întâmplătoare, ci influenței factorilor studiați. Și din nou analogia cu diagnosticul: o eroare de al doilea fel este un rezultat fals negativ. Legat de această eroare este noțiunea putere, care spune despre cât de eficientă este o anumită metodă statistică în condiții date, despre sensibilitatea acesteia. Puterea este calculată prin formula: 1-β, unde β este probabilitatea unei erori de tip II. Acest indicator depinde în principal de dimensiunea eșantionului. Cu cât grupele sunt mai mari, cu atât probabilitatea unei erori de tip II este mai mică și puterea testelor statistice este mai mare. Această dependență este cel puțin pătratică, adică reducerea dimensiunii eșantionului la jumătate va duce la o scădere a puterii de cel puțin patru ori. Puterea minimă admisă este considerată a fi de 80%, iar nivelul maxim admisibil de eroare de primul fel este de 5%. Cu toate acestea, trebuie amintit întotdeauna că aceste limite sunt arbitrare și se pot schimba în funcție de natura și obiectivele studiului. De regulă, o schimbare arbitrară a puterii este recunoscută de comunitatea științifică, dar în majoritatea covârșitoare a cazurilor, nivelul de eroare de primul fel nu poate depăși 5%.

Toate cele de mai sus sunt direct legate de etapa de planificare a cercetării. Cu toate acestea, mulți cercetători se referă în mod eronat la prelucrarea datelor statistice doar ca la un fel de manipulare efectuată după finalizarea părții principale a lucrării. Adesea, după încheierea unui experiment neplanificat, există o dorință irezistibilă de a ordona analiza datelor statistice pe partea laterală. Dar va fi foarte greu chiar și pentru un statistician să extragă rezultatul așteptat de cercetător din „grămada de gunoi”. Prin urmare, cu cunoștințe insuficiente de biostatistică, este necesar să se caute ajutor în analiza statistică chiar înainte de începerea experimentului.

Revenind la procedura de analiză în sine, trebuie subliniate două tipuri principale de tehnici statistice: descriptive și bazate pe dovezi (analitice). Tehnicile descriptive includ tehnici de prezentare a datelor într-un mod compact și ușor de înțeles. Acestea includ tabele, grafice, frecvențe (absolute și relative), măsuri ale tendinței centrale (medie, mediană, mod) și măsuri ale împrăștierii datelor (varianță, deviație standard, interval intercuartil etc.). Cu alte cuvinte, metodele descriptive caracterizează probele studiate.

Cel mai popular mod (deși adesea înșelător) de a descrie datele cantitative disponibile este definirea următorilor indicatori:

  • numărul de observații din eșantion sau dimensiunea acestuia;
  • valoarea medie (media aritmetică);
  • abaterea standard este o măsură a gradului de schimbare a valorilor variabilelor.

Este important de reținut că media aritmetică și abaterea standard sunt măsuri de tendință centrală și dispersie într-un număr destul de mic de eșantioane. În astfel de mostre, valorile majorității obiectelor cu la fel de probabil deviat de la medie, iar distribuția lor formează un „clopot” simetric (curba Gauss sau Gauss-Laplace). O astfel de distribuție este numită și „normală”, dar în practica unui experiment medical apare doar în 30% din cazuri. Dacă valorile variabilei sunt distribuite asimetric în jurul centrului, atunci grupurile sunt cel mai bine descrise folosind mediana și cuantilele (percentile, quartile, decile).

După finalizarea descrierea grupurilor, este necesar să se răspundă la întrebarea despre relațiile lor și despre posibilitatea generalizării rezultatelor studiului la întreaga populație. Pentru aceasta, sunt folosite metode de biostatistică bazate pe dovezi. Este vorba despre ele pe care cercetătorii își amintesc în primul rând atunci când vine vorba de prelucrarea datelor statistice. De obicei, această etapă de lucru se numește „testarea ipotezelor statistice”.

Sarcinile de testare a ipotezelor pot fi împărțite în două grupuri mari. Primul grup răspunde la întrebarea dacă există diferențe între grupuri în ceea ce privește nivelul unui indicator, de exemplu, diferențe în nivelul transaminazelor hepatice la pacienții cu hepatită și la persoanele sănătoase. Al doilea grup vă permite să demonstrați existența unei relații între doi sau mai mulți indicatori, de exemplu, funcția ficatului și a sistemului imunitar.

În termeni practici, sarcinile din primul grup pot fi împărțite în două subtipuri:

  • compararea indicatorului în doar două grupuri (sănătoși și bolnavi, bărbați și femei);
  • compararea a trei sau mai multe grupuri (studiul diferitelor doze de medicament).

Trebuie avut în vedere faptul că metodele statistice diferă semnificativ pentru datele calitative și cantitative.

Într-o situație în care variabila studiată este calitativă și doar două grupuri sunt comparate, se poate utiliza testul chi-pătrat. Acesta este un criteriu destul de puternic și cunoscut pe scară largă, dar nu este suficient de eficient dacă numărul de observații este mic. Pentru a rezolva această problemă, există mai multe metode, cum ar fi corecția Yates pentru continuitate și metoda exactă a lui Fisher.

Dacă variabila studiată este cantitativă, atunci poate fi utilizat unul dintre cele două tipuri de teste statistice. Criteriile de primul tip se bazează pe un anumit tip de distribuție a populației generale și funcționează cu parametrii acestei populații. Astfel de criterii sunt numite „parametrice” și se bazează de obicei pe presupunerea unei distribuții normale a valorilor. Testele neparametrice nu se bazează pe ipoteza despre tipul de distribuție a populației generale și nu folosesc parametrii acesteia. Uneori, astfel de criterii sunt numite „teste fără distribuție”. Într-o anumită măsură, acest lucru este eronat, deoarece orice test neparametric presupune că distribuțiile în toate grupurile comparate vor fi aceleași, altfel se pot obține rezultate fals pozitive.

Există două teste parametrice aplicate datelor extrase dintr-o populație distribuită normal: testul t Student pentru a compara două grupuri și testul F Fisher pentru a testa egalitatea varianțelor (alias ANOVA). Există mult mai multe criterii neparametrice. Diferitele teste diferă între ele în ipotezele pe care se bazează, în complexitatea calculelor, în puterea statistică etc. Cu toate acestea, testul Wilcoxon (pentru grupurile înrudite) și testul Mann-Whitney, cunoscut și sub denumirea de test Wilcoxon pentru mostre independente. Aceste teste sunt convenabile prin faptul că nu necesită presupuneri cu privire la natura distribuției datelor. Dar dacă se dovedește că eșantioanele sunt luate dintr-o populație generală distribuită normal, atunci puterea lor statistică nu va diferi semnificativ de cea pentru testul Student.

O descriere completă a metodelor statistice poate fi găsită în literatură specială, cu toate acestea, punctul cheie este că fiecare test statistic necesită un set de reguli (presupune) și condiții pentru utilizarea sa, iar enumerarea mecanică a mai multor metode pentru a găsi rezultatul „dorit” este absolut inacceptabilă cu punct științific viziune. În acest sens, testele statistice sunt aproape de medicamente - fiecare are indicații și contraindicații, efecte secundareși probabilitatea de eșec. Și la fel de periculoasă este utilizarea necontrolată a testelor statistice, pentru că pe ele se bazează ipotezele și concluziile.

Pentru o înțelegere mai completă a problemei acurateței analizei statistice, este necesar să se definească și să se analizeze conceptul de " nivel de încredere." Probabilitatea de încredere este o valoare luată ca limită între evenimentele probabile și cele improbabile. În mod tradițional, este notat cu litera „p”. Pentru mulți cercetători, singurul scop al efectuării analizei statistice este de a calcula valoarea p râvnită, care pare să pună virgule în frază celebră„execuția nu poate fi iertată”. Nivelul de încredere maxim admis este 0,05. Trebuie amintit că nivelul de încredere nu este probabilitatea unui eveniment, ci o chestiune de încredere. Prin expunerea probabilității de încredere înainte de a începe analiza, determinăm astfel gradul de încredere în rezultatele cercetării noastre. Și, după cum știți, credulitatea excesivă și suspiciunea excesivă afectează în mod negativ rezultatele oricărei lucrări.

Nivelul de încredere indică probabilitatea maximă a unei erori de tip I pe care cercetătorul o consideră acceptabilă. Scăderea nivelului de încredere, cu alte cuvinte, înăsprirea condițiilor de testare a ipotezelor, crește probabilitatea erorilor de tip II. Prin urmare, alegerea nivelului de încredere trebuie făcută ținând cont de eventuala prejudiciu din apariția erorilor de primul și al doilea fel. De exemplu, limitele stricte adoptate în statisticile biomedicale, care determină ponderea rezultatelor fals pozitive de cel mult 5%, este o necesitate severă, deoarece sunt introduse sau respinse noi tratamente pe baza rezultatelor cercetării medicale, iar acesta este un chestiune de viață pentru multe mii de oameni.

Trebuie avut în vedere că valoarea p în sine nu este foarte informativă pentru un medic, deoarece spune doar despre probabilitatea unei respingeri eronate a ipotezei nule. Acest indicator nu spune nimic, de exemplu, despre dimensiunea efectului terapeutic atunci când se utilizează medicamentul de studiu în populația generală. Prin urmare, există o opinie că în loc de nivelul de încredere, ar fi mai bine să se evalueze rezultatele studiului după mărimea intervalului de încredere. Interval de încredere este intervalul de valori în care valoarea reală a populației (pentru medie, mediană sau frecvență) este conținută cu o anumită probabilitate. În practică, este mai convenabil să existe ambele valori, ceea ce face posibilă aprecierea cu mai multă încredere a aplicabilității rezultatelor obținute la nivelul populației în ansamblu.

În concluzie, ar trebui spuse câteva cuvinte despre instrumentele folosite de un statistician sau un cercetător care analizează independent datele. Calculele manuale au dispărut de mult. Programele de calculator statistice care există astăzi fac posibilă efectuarea de analize statistice fără a avea un serios pregătire matematică. Astfel de sisteme puternice precum SPSS, SAS, R etc. permit cercetătorului să utilizeze metode statistice complexe și puternice. Cu toate acestea, acesta nu este întotdeauna un lucru bun. Fără a cunoaște gradul de aplicabilitate al testelor statistice folosite la date experimentale specifice, cercetătorul poate face calcule și chiar obține câteva numere la ieșire, dar rezultatul va fi foarte îndoielnic. De aceea, condiție prealabilă pentru a efectua prelucrarea statistică a rezultatelor experimentului, trebuie să existe o bună cunoaștere fundamente matematice statistici.


Metode statistice - metode de analiză a datelor statistice. Alocați metode de statistică aplicată care pot fi aplicate în toate domeniile cercetare științificăși orice industrii economie nationala, și alte metode statistice, a căror aplicabilitate este limitată la o anumită zonă. Aceasta se referă la metode precum controlul statistic al acceptării, controlul statistic al proceselor tehnologice, fiabilitatea și testarea și proiectarea experimentelor.

Metodele statistice de analiză a datelor sunt utilizate în aproape toate domeniile activității umane. Ele sunt folosite ori de câte ori este necesar pentru a obține și fundamenta orice judecăți despre un grup (obiecte sau subiecți) cu o oarecare eterogenitate internă. Este recomandabil să se distingă trei tipuri de activități științifice și aplicate în domeniul metodelor statistice de analiză a datelor (în funcție de gradul de specificitate al metodelor asociate cu imersiunea în probleme specifice):

a) dezvoltarea și cercetarea metodelor de uz general, fără a ține cont de specificul domeniului de aplicare;

b) dezvoltarea şi cercetarea modelelor statistice fenomene realeși procese în conformitate cu nevoile unui anumit domeniu de activitate;

c) aplicarea metodelor și modelelor statistice pentru analiza statistică a datelor specifice.

Analiza dispersiei. Analiza varianței (din latinescul Dispersio - dispersion / în engleză Analysis Of Variance - ANOVA) este utilizată pentru a studia influența uneia sau mai multor variabile calitative (factori) asupra unei variabile cantitative dependente (răspuns). Analiza varianței se bazează pe ipoteza că unele variabile pot fi considerate cauze (factori, variabile independente), iar altele drept consecințe (variabile dependente). Variabilele independente sunt uneori numite factori ajustabili tocmai pentru că în experiment cercetătorul are posibilitatea să le varieze şi să analizeze rezultatul rezultat.

scopul principal analiza varianței (ANOVA) este studiul semnificației diferențelor dintre medii prin intermediul unei comparații (analizei) varianțelor. Împărțirea variației totale în mai multe surse permite compararea varianței datorate diferenței intergrup cu variația datorată variabilității în interiorul grupului. Dacă ipoteza nulă este adevărată (despre egalitatea mediilor în mai multe grupuri de observații selectate din populația generală), estimarea varianței asociate cu variabilitatea intragrup ar trebui să fie apropiată de estimarea varianței intergrup. Dacă doar comparați mediile a două eșantioane, analiza varianței va da același rezultat ca un test t obișnuit pentru eșantion independent (dacă comparați două grupuri independente obiecte sau observații) sau un test t pentru eșantioane dependente (dacă două variabile sunt comparate pe același set de obiecte sau observații).


Esența analizei varianței constă în împărțirea varianței totale a trăsăturii studiate în componente separate datorită influenței unor factori specifici, și testarea ipotezelor despre semnificația influenței acestor factori asupra trăsăturii studiate. Comparând componentele varianței între ele folosind testul F Fisher, este posibil să se determine ce proporție din variabilitatea totală a trăsăturii rezultate se datorează acțiunii factorilor ajustabili.

materie prima pentru analiza varianței sunt datele studiului a trei sau mai multe eșantioane, care pot fi fie egale, fie inegale ca număr, atât conectate, cât și deconectate. În funcție de numărul de factori ajustabili identificați, analiza varianței poate fi cu un singur factor (în acest caz, se studiază influența unui factor asupra rezultatelor experimentului), cu doi factori (când se studiază influența a doi factori) și multifactorial (vă permite să evaluați nu numai influența fiecăruia dintre factori separat, ci și interacțiunea lor).

Se aplică analiza varianței la grupul de metode parametrice și de aceea trebuie aplicat numai atunci când s-a dovedit că distribuția este normală.

Se utilizează analiza varianței, dacă variabila dependentă este măsurată pe o scară de rapoarte, intervale sau ordine, iar variabilele de influență sunt de natură nenumerică (scara de nume).

Exemple de sarcini.În sarcinile care se rezolvă analiza variatiei, există un răspuns de natură numerică, care este afectat de mai multe variabile cu caracter nominal. De exemplu, mai multe tipuri de rații de îngrășare a animalelor sau două moduri de păstrare a acestora etc.

Exemplul 1: În timpul săptămânii, mai multe chioșcuri de farmacie au funcționat în trei locuri diferite. Pe viitor, putem lăsa doar unul. Este necesar să se determine dacă există o statistică diferenta semnificativaîntre volumele vânzărilor de droguri în chioșcuri. Dacă da, vom selecta chioșcul cu cel mai mare volum mediu de vânzări zilnic. Dacă diferența în volumul vânzărilor se dovedește a fi nesemnificativă din punct de vedere statistic, atunci alți indicatori ar trebui să stea la baza alegerii unui chioșc.

Exemplul 2: Comparația contrastelor mediilor de grup. Cele șapte afilieri politice sunt ordonate de la extrem de liberale la extrem de conservatoare, iar contrastul liniar este utilizat pentru a testa dacă există o tendință ascendentă diferită de zero în mediile grupului, adică dacă există o creștere liniară semnificativă a vârstei medii atunci când se iau în considerare grupurile ordonate în direcția de la liberal la conservator.

Exemplul 3: Analiza bidirecțională a varianței. Numărul vânzărilor de produse, pe lângă dimensiunea magazinului, este adesea afectat de locația rafturilor cu produsul. Acest exemplu conține cifre de vânzări săptămânale caracterizate prin patru forme de rafturi și trei dimensiuni de magazin. Rezultatele analizei arată că ambii factori - amplasarea rafturilor cu marfa și dimensiunea magazinului - afectează numărul de vânzări, dar interacțiunea lor nu este semnificativă.

Exemplul 4: ANOVA univariată: proiectare aleatorie în bloc complet cu două tratamente. Se investighează influența tuturor combinațiilor posibile de trei grăsimi și trei scăpărători de aluat asupra coacerii pâinii. Patru mostre de făină luate din patru surse diferite au servit drept factori bloc. Este necesar să se identifice semnificația interacțiunii fat-ripper. După aceea, pentru a determina diferitele opțiuni pentru alegerea contrastelor, permițându-vă să aflați ce combinații de niveluri de factori diferă.

Exemplul 5: Model de plan ierarhic (imbricat) cu efecte mixte. Se studiază influența a patru capete alese aleatoriu montate într-o mașină-uneltă asupra deformării suporturilor de catozi din sticlă fabricate. (Capetele sunt încorporate în mașină, astfel încât același cap nu poate fi utilizat pe mașini diferite.) Efectul capului este tratat ca un factor aleatoriu. Statisticile ANOVA arată că nu există diferențe semnificative între mașini, dar există indicii că capetele pot diferi. Diferența dintre toate mașinile nu este semnificativă, dar pentru două dintre ele diferența dintre tipurile de capete este semnificativă.

Exemplul 6: Analiză univariată a măsurătorilor repetate utilizând un plan divizat. Acest experiment a fost realizat pentru a determina efectul evaluării anxietății unui individ asupra performanței la examen la patru încercări consecutive. Datele sunt organizate astfel încât să poată fi considerate ca grupuri de subseturi ale întregului set de date ("întregul plot"). Efectul anxietății nu a fost semnificativ, în timp ce efectul încercării a fost semnificativ.

Analiza covarianței. Analiza covarianței - un set de metode de statistică matematică legate de analiza modelelor de dependență a valorii medii a unei variabile aleatoare simultan de un set de factori calitativi (de bază) și factori cantitativi (asociați). Factorii F stabilesc combinații de condiții în care s-au obținut observațiile X, Y și sunt descrise folosind variabile indicatoare, iar între variabilele însoțitoare și indicatoare pot fi atât aleatoare, cât și nealeatoare (controlate în experiment).

Dacă variabila aleatoare Y este un vector, atunci se vorbește despre o analiză multivariată a covarianței.

Analiza covarianței este adesea folosităînainte de analiza varianței, pentru a verifica omogenitatea (omogenitatea, reprezentativitatea) eșantionului de observații X,Y pentru toți factorii concomitenți.