Metode parametrice și neparametrice de statistică. Proceduri parametrice și neparametrice pentru analiza datelor statistice

Strategia generală de evaluare a ipotezelor statistice discutate mai sus determină în primul rând utilizarea așa-numitelor metode parametrice ale statisticii matematice.

Metode parametrice se bazează pe unele, de regulă, ipoteze destul de probabile despre natura distribuției unei variabile aleatoare. De obicei, metodele parametrice utilizate în analiza datelor experimentale se bazează pe presupunerea că distribuția acestor date este normală. O consecință a acestei ipoteze este necesitatea de a estima parametrii de distribuție supuși studiului. Astfel, în cazul următoarelor t -Testul elevului astfel de parametri estimați sunt așteptările și varianța matematică. În unele cazuri, se fac ipoteze suplimentare despre modul în care parametrii care caracterizează distribuția unei variabile aleatoare în diferite eșantioane se corelează între ei. Astfel, în testul Student, care este adesea folosit pentru a compara valorile medii (așteptările) a două serii de date pentru omogenitatea sau eterogenitatea lor, se face o ipoteză suplimentară despre omogenitatea variațiilor distribuției variabilelor aleatoare în două populaţii generale din care au fost extrase aceste date.

Avantajul metodelor de analiză parametrică a datelor este faptul că au o putere destul de mare. Sub puterea de testare ține cont de capacitatea sa de a evita erorile de al doilea fel sau erorile β. Cu cât eroarea β este mai mică, cu atât puterea testului este mai mare. Cu alte cuvinte, puterea de testare = 1 - β.

Puterea mare a testelor parametrice, sau a criteriilor, se datorează faptului că aceste metode necesită ca datele disponibile să fie descrise în scara metrica. După cum știți, scalele metrice includ scala intervalului și scala raportului, care uneori este numită și scară absolută. Scala de intervale permite cercetătorului să afle nu numai relațiile de egalitate sau inegalitate ale elementelor eșantionului (cum permite să facă scara de nume ) și nu numai relații de ordine (cum permite să facă scara de ordine ), dar și evaluează echivalența intervalelor. Scara absolută pe lângă aceasta, vă permite să evaluați echivalența relațiilor dintre elementele mulțimii obținute în timpul măsurării. De aceea, scalele metrice sunt denumite scale de măsurare puternice. Datorită acestei puteri, metodele parametrice permit exprimarea mai precisă a diferențelor în distribuția unei variabile aleatoare cu condiția ca marcatorul sau ipotezele alternative să fie adevărate.

De asemenea, trebuie remarcat faptul că, în general, metodele parametrice de statistică sunt mai dezvoltate în teoria statisticii matematice și, prin urmare, sunt utilizate mult mai pe scară largă. Aproape orice rezultat experimental poate fi evaluat folosind oricare dintre aceste metode. Aceste metode sunt luate în considerare în principal în manuale și manuale de analiză a datelor statistice.

În același timp, dificultățile asociate cu utilizarea metodelor de analiză parametrică în statistică sunt că în unele cazuri ipotezele a priori despre natura distribuției variabilelor aleatoare studiate se pot dovedi a fi incorecte. Și aceste cazuri sunt foarte tipice pentru cercetările psihologice în anumite situații.

Deci, dacă comparăm două mostre folosind t -Testul studentului, puteți constata că distribuția datelor noastre diferă de cea normală, iar variațiile din cele două eșantioane diferă semnificativ. În acest caz, utilizarea unui test parametric al Studentului poate, într-o oarecare măsură, să distorsioneze concluziile pe care cercetătorul dorește să le tragă. Acest pericol crește dacă valorile statisticilor calculate se dovedesc a fi apropiate de valorile limită ale cuantilelor care sunt folosite pentru a accepta sau respinge ipotezele. În majoritatea cazurilor, însă, ca, de exemplu, în cazul utilizării t -test, unele abateri de la ipotezele date teoretic nu sunt critice pentru o inferență statistică fiabilă. În alte cazuri, astfel de abateri pot reprezenta o amenințare serioasă pentru o astfel de concluzie. Apoi, cercetătorii pot dezvolta proceduri speciale care pot ajusta procedura de luare a deciziilor cu privire la adevărul ipotezelor statistice. Scopul acestor proceduri este de a eluda sau relaxa cerințele prea stricte ale modelelor parametrice ale statisticilor utilizate.

Una dintre opțiunile pentru astfel de acțiuni ale cercetătorului, atunci când descoperă că datele pe care le-a primit diferă în parametrii lor de ceea ce este specificat în modelul structural al testului parametric utilizat, poate fi încercarea de a transforma aceste date în forma dorită. De exemplu, după cum s-a menționat în cap. 1, la măsurarea timpului de reacție, este posibil să se evite o valoare mare a asimetriei distribuției sale dacă pentru analiză se folosesc logaritmii valorilor obținute, și nu valorile timpului de reacție în sine.

O altă opțiune este de a refuza utilizarea oricăror ipoteze a priori despre natura distribuției unei variabile aleatoare în populația generală. Și asta înseamnă respingerea metodelor parametrice ale statisticii matematice în favoarea celor neparametrice.

Neparametric sunt numite metode de statistică matematică, în care nu se fac ipoteze a priori cu privire la natura distribuției datelor studiate și nu se fac ipoteze cu privire la raportul parametrilor de distribuție a valorilor analizate. Acesta este principalul avantaj al acestor metode.

Avantajul statisticii neparametrice este pe deplin dezvăluit atunci când rezultatele obținute în experiment sunt prezentate într-o formă mai slabă. scară nonmetrică, reprezentând rezultatele clasamentului. O astfel de scară se numește scara de ordine. Desigur, în unele cazuri, cercetătorul poate converti aceste date la o scară de interval mai puternică utilizând proceduri de normalizare a datelor, dar, de regulă, cea mai bună opțiune în această situație este să folosească teste neparametrice special concepute pentru analiza statistică.

De regulă, testele de statistici neparametrice presupun estimarea rapoartelor disponibile ale sumelor de rang în două sau mai multe eșantioane și, pe baza acesteia, se formulează o concluzie despre raportul acestor eșantioane. Exemple de astfel de teste sunt test de semn, test de rang semnat Wilcoxon, precum și Mann U-test Whitney, care sunt folosite ca analog al parametrilor t - Testul elevului.

În același timp, dacă rezultatele măsurării sunt prezentate la o scară mai puternică, utilizarea statisticilor neparametrice înseamnă respingerea unora dintre informațiile conținute în date. Consecința acestui fapt este pericolul unei creșteri a erorii de al doilea fel inerente acestor metode.

Astfel, metodele statisticii neparametrice sunt mai conservatoare decât metodele statisticii parametrice. Folosirea lor amenință într-o măsură mai mare cu o eroare de al doilea fel, adică. o situație în care cercetătorul, de exemplu, nu poate detecta diferențe între două eșantioane, atunci când astfel de diferențe au loc de fapt. Cu alte cuvinte, astfel de metode se dovedesc a fi mai puțin puternice decât metodele parametrice. Prin urmare, se preferă, în general, utilizarea statisticilor parametrice în analiza datelor experimentale, altele decât clasarea simplă.

La rezolvarea problemelor de construire a modelelor de sisteme, sarcina de a genera informații inițiale despre parametrii elementelor care alcătuiesc sistemul are o importanță deosebită. Precizia și fiabilitatea informațiilor inițiale determină acuratețea estimărilor caracteristicilor analizate ale sistemelor, acuratețea calculelor pentru optimizarea strategiilor de funcționare și a regulilor de întreținere a acestora, rezolvarea problemelor legate de prezicerea comportamentului sistemului în viitor. , și alte probleme. La formarea informațiilor inițiale despre parametrii elementelor, de regulă, se iau ca bază informațiile obținute în timpul examinării sistemelor și studiul experienței de funcționare a acestuia. Cu alte cuvinte, informațiile despre comportamentul componentelor sistemului în procesul de funcționare sunt luate ca bază.

Analiza indicatorilor inițiali ai elementelor, ansamblurilor, componentelor, care se realizează în etapele de exploatare, testare, dezvoltare de proiectare, se realizează pentru a rezolva următoarele probleme:

    determinarea valorilor reale ale caracteristicilor studiate ale componentelor în condițiile funcționării lor efective;

    identificarea relației dintre caracteristicile studiate ale elementelor și condițiile de funcționare ale acestora, analizând impactul asupra indicatorilor studiați a influențelor externe;

    prezicerea comportamentului echipamentelor nou create.

Astfel, pentru a rezolva aceste probleme, în primul rând,

este necesar să se organizeze controlul asupra comportamentului echipamentului în condiţii reale de funcţionare a acestuia. Pe viitor, informațiile obținute în timpul funcționării obiectelor sunt folosite pentru a construi modele de sisteme pentru care se efectuează analiza.

La efectuarea unor studii experimentale, un rol important îl au informațiile obținute în urma observațiilor unor obiecte al căror comportament este de natură probabilistică. Studiul unor astfel de sisteme se realizează în funcție de rezultatele implementării parametrilor de ieșire, care sunt variabile aleatorii. Cea mai generală caracteristică care descrie comportamentul unei variabile aleatoare unidimensionale este densitatea de distribuție a acesteia / (0- Cunoscând densitatea de distribuție a unei variabile aleatoare, se pot determina în mod unic caracteristici precum probabilitatea realizării unui eveniment, intensitatea producerea evenimentului, timpul mediu dintre realizările evenimentelor etc. Prezentăm formulele , permițând evaluarea indicatorilor corespunzători.

Probabilitatea ca un eveniment să se producă în timp t este determinat de formula

Q(t) = F(t)=\f(t)dt.

În practică, cantitatea definită prin funcția de distribuție este adesea folosită după cum urmează:

De exemplu, în teoria fiabilității, probabilitatea de funcționare fără defecțiuni este definită în acest fel.

Timpul mediu dintre realizările evenimentului este determinat din relație

T a =]tf(f)dt=]p(t)dt.

Intensitatea apariției unui eveniment poate fi determinată prin formula

„_/(f)_ClFjt) eu _ dP(t) 1 P(t)dt P(t)dt Pit)"

Astfel, cunoscând funcția de densitate sau distribuție a unei variabile aleatoare, putem proceda la determinarea caracteristicilor unui sistem complex. În practică, funcția de distribuție este adesea necunoscută. Acesta trebuie restaurat conform datelor statistice ale implementării variabilei aleatoare. Deoarece statisticile privind rezultatele observațiilor sunt întotdeauna prezente într-o formă limitată, restabilirea funcției de distribuție este posibilă cu un anumit grad de fiabilitate. Prin urmare, dacă funcția de distribuție este estimată cu o anumită eroare,

urya

f (X - t ) 2 ^ 2a 2

" (x-t ) 2 ^ 2 A 2

Să calculăm derivatele parțiale:

dPN(t,m,o) _ 1

dm

d P N (t, t, O) _ dA 2

r r \t

2 despre 2

\ /-J

atunci calculul caracteristicilor sistemului se va efectua și cu o eroare.

Precizia estimării indicatorilor sistemelor complexe este caracterizată de mărimea dispersiei. Să fie necesar să se estimeze un indicator R(t). Să arătăm cum este determinată varianța în estimarea sa. Vom presupune că indicatorul R(t ) se determină prin funcţia de distribuţie. Lăsați funcția de distribuție să depindă de doi parametri aer. Exemple de funcții cu doi parametri sunt distribuția normală, normală trunchiată, log-normală, distribuția gamma, distribuția Weibull și o serie de altele. Asa ca lasa F(t) = F(t, a, r). În consecință, indicatorul estimat al unui sistem complex poate fi reprezentat ca funcțional al F(t) = F(t, a, r):

K(r) = K = K(f,a,p).

Să descompunăm estimarea R ( t) în seria Taylor în punctul a, p și ne limităm la trei termeni:

i(0 = K(0+^®(a-a)+^®(p-p).

Ambelor părți ale acestei expresii, aplicăm operația de calcul a varianței

(t-m) 2

-t exp

Distributie normala

Densitatea legii distribuției normale are forma

Pn(t, m, despre)= 1 -7=- J exp

Fn(t, apoi)= -y=- J exp

(t-m)

2o 2

Timpul mediu dintre realizările evenimentului este determinat de formă

(t- m) 2 2 A 2

unde cov(a, P) este covarianța dintre parametrii aerului. Astfel, pentru a estima varianța unui anumit indicator, este necesar să se determine derivatele parțiale ale acestui indicator în raport cu parametrii legii distribuției și variația în estimarea parametrilor legii distribuției.

Luați în considerare problemele determinării derivatelor parțiale pentru indicatorii introduși mai sus pentru legile de distribuție specifice.Determinarea varianței estimărilor parametrilor legilor de distribuție va fi descrisă mai jos.

Ca exemplu, să luăm în considerare definiția derivatelor parțiale ale indicatorului estimat în raport cu parametrii legii distribuției pentru legea normală.

Ґ ( t-m) 2 ^

2 din 2

În consecință, derivatele parțiale sunt definite ca

dTN(m,A) 1 7

-- - = - f=~ exp

d m V2nab

dTN(m, o) eu

it= F

f 2 ~\ m

2 0

\ /

Și, în sfârșit, pentru intensitatea evenimentului, avem

X(t, t, o) = -

Distribuție normală trunchiată cu o singură coadă

Densitatea de distribuție a legii normale trunchiate cu trunchierea unilaterală în stânga la punctul 0 are forma

/ (t-m ) 2 ^ 2 A 2

\ І2pe

(X - t) 2 2a 2

\І2po(

Expresiile pentru derivate parțiale au forma

dX N (t, m, a ) _ f N (t, m, a )" m (l -F N (t, m,o))-f N (t, m,o )[ l-F N (t, m,o )]" m m

2

dm

cu = -

(*-YU 2 2 Kommersant

despreyj2nb

, ., t-m eu ( t-m ) 2

f H (fW O ra =Ir=-T ex PV

Ґ , h2 4 V

( t-m) 2

( 2M t

2 A 2

\

2s 7

\ /J

" a2

da 2

2

[( t-m ) 2 - A 2 ] 2l/2lst 3

(t-m)

dX

P(SCH,b) = \-{

(t -m) 2a 2

m2O 2

\ =

(t-m)exp

m exp

2 2 pe 3

Să introducem notația:

R= J exp

J

Astfel, sunt prezentate formule pentru determinarea indicatorilor derivați corespunzători pentru parametrii legii de distribuție pentru legea normală. O generalizare a distribuției normale este distribuția normală trunchiată. Să luăm în considerare utilizarea unei distribuții normale trunchiate unilaterale în problemele de estimare a indicatorilor sistemelor complexe. Într-o serie de probleme de analiză a sistemului, parametrii aleatori sunt definiți pozitiv. Un exemplu sunt problemele teoriei fiabilității, în care parametrii aleatori au un domeniu de definire de la 0 până, de exemplu, timpul de funcționare până la defecțiune este o valoare definită pozitivă. În acest caz, este ilegal să se aplice legea distribuției normale pentru a descrie aceste variabile aleatoare. În astfel de situații, se utilizează o distribuție normală trunchiată la stânga. Să luăm în considerare acest caz în raport cu estimarea indicatorilor de fiabilitate.

(x-c) 2 2 b

( X - U-U

dx; Q= jexp

Derivatele corespunzătoare au forma

Ґ 2\ .hl

2 Kommersant

r,"H

db(Q-Rf

unde componentele corespunzătoare sunt determinate de formule

Timpul mediu dintre realizările evenimentului este determinat de formulă

2 b 2

/ . .і \ (*-YU

S / h’ ^

l/ts l/ts fG G-M-

(QW b =^exp

I^lbeu-Jlb Jb

Să notăm numărătorul prin L.

Derivatele corespunzătoare sunt calculate prin formule

distribuție log-normală

Variabila aleatoare respectă legea distribuției normale din punct de vedere logaritmic t, al cărui logaritm este distribuit conform legii normale. Densitatea de distribuție a legii log-normală are forma

KMY) _ i;q-%l Jf_urz _______

"-!Li S)

/ 2 N .a! 2fc

SHAMKQ Ul.

-^ , A, -ex R

Funcția de distribuție are forma

2 b 2

În sfârșit, intensitatea apariției evenimentelor este egală cu

(*-10 2 LA

2 b

UndeLA= Kommersant 1 .

Să scriem formule pentru determinarea indicatorilor de fiabilitate

(X -M-) 2 2 Kommersant

(X -\i .? 2 Kommersant

dx-jexpdespre

I „(*, I, D) \u003d I - Jexp

Introducem notația

Derivatele corespunzătoare au forma

(*-YU

M= exp

2 \

( (eunf-H) 2 LA

Rln(; , N.D) _ 1 En - JlnB

P „Jt,\i,B) 1pg-n

Să determinăm derivatele intensității în raport cu parametrii

dkyM(t,№) _ M^jQ-R)- (Q-RY 11 M EC(Q-R) 2 :

uhîn


( (Domnul) m 2 b

Pentru a determina timpul mediu până la eșec, utilizați formula

(Doamna. 2

M 11 =-m^exp

; (b-l)"= exp

iar ultima expresie

Derivatele sunt egale

dtlaC, R, LA) 1 (în ,

Să scriem o expresie pentru probabilitatea unei operații fără eșec

Expresia pentru determinarea ratei de eșec are forma \Jt,\i, b) = -

P B (t, a, b) = exp\

KAJ

Să calculăm derivatele acestei expresii în raport cu parametrii de distribuție:

<У2дВ I 2 LA

E P^(t,a,b) _ b da a

dPB(t,A, b) _

Derivatele parțiale sunt determinate din expresii

E CL^V) _

^ 2

L tjbw în exp|

(lnf- |X) 2 2 LA

unde (/ln(0)

7 B(a ^) = J ex P

(Inf-(X) 2 2 LA

E T B (a, b)_~ r b(t

* (t"În

\df, E7v(a ^ e b

dK»ShV) (0 ) " al (eu - (0 )- / l. (eu- F n J t))"

EV 2

* P

Rata de eșec este

(^ b-" , A

Derivatele cu privire la parametri au forma

aceasta,A,b)

(1 - F„„) = - I n Vii exp

_ (Inf- (X) 2 LA

E ^a,b) b 2

E Xînia, b)_Ґ" b

da~a 2

dbAbA

A ,

Distribuție Weibull

Densitatea distribuției Weibull are forma

f B (t,a,b) = -(-

Distribuție gamma

Densitatea distribuției gamma se scrie după cum urmează

F B (t, a, b) = 1-exp

În consecință, funcția de distribuție are forma

x, a *

Fr(t,X,a) = fXA~ " exn(-Xx) dx.

Probabilitatea de funcționare fără defecțiuni este calculată prin formula

P v (t , X , a) = Eu fexp(-Xx)dx.

Derivatele în raport cu parametrii sunt

і і OcX a4 Jx a4 exp (-Xx) Jx-X a J X A exp ( -Xx)dx

EXG(g,a,X) _ (f r ( ‘Xa)) K - / r(f,X,A); Ea 2

J exp(-Xx)(a - Xx)dx \

[!-,F r (ZAa)];=-

DR G (t, X , A) _ X 1

Pa) i

DR ^da A) = ~ G^a) I * A ~" ex P(-^t r (a)(ta ^ - 111 0 - Г"(а)]Жс, unde Г(а) = J X A t A ~ " exp (- Xt)dt \u003d J Z a " 1 exp (-r)<&; Г(а) = J г“"’ exp(-z) In z 4 z

Timpul mediu până la eșec este determinat de formulă

G r (o, X) \u003d J ^ - exp(-Xt)di =~.

oG(a) X

Derivatele corespunzătoare sunt

dt G (Oh ) AdG G ( A ,X) _ 1 EH.X 2 da~X"

Se înregistrează rata de eșec

X A t A -" exp (- xt )

Xr(t,A,X) =

(f r (t , X ,A )) A = ^-y-^-[(X a InXf a „exp (- Xt)+X A t A 1 Infexp(-Xt))-

X 1 V a " 1 exp(-Xf)r„ (a)];

G a ((X)X a Jjr a "1 exp (-Xx) Jx-

t tX A În Xj X a ’ 1 exp (-Xx)dx +X a Jx a 1 Injfexp (-Xx)dx

Astfel, se obțin expresii care permit rezolvarea problemelor de apreciere a preciziei în determinarea indicatorilor sistemelor complexe. Sunt luate în considerare legile de distribuție cel mai frecvent utilizate în analiza sistemului. Se obțin formule pentru determinarea principalilor indicatori ai sistemelor și se calculează primele derivate parțiale ale indicatorilor în funcție de parametrii legilor de distribuție corespunzătoare. Următoarea problemă care trebuie abordată este problema estimării parametrilor legii de distribuție alese. Să vedem cum se rezolvă această problemă.

Derivatele cu privire la parametri sunt definite ca

d X r ( t,a , X) _ (fr(tX A) ) \ -/ r(t, X,a) 2

Unde A^ g" 1 „pW-X-r-exp(-Xr)

Scale statistice

Prelucrarea statistică a datelor de cercetare

Datele statistice sunt folosite în prelucrarea materialelor de cercetare psihologică pentru a extrage cât mai multe informații utile din datele cantitative obținute în experiment.

Utilizarea anumitor metode statistice este determinată de scara statistică căreia îi aparține materialul primit.

Scala de nume. Această scară include materiale în care obiectele studiate diferă unele de altele prin calitatea lor, iar ordinea nu este importantă. De exemplu, distribuirea participanților la conferință. În prelucrarea statistică a unor astfel de materiale, trebuie să se țină cont de numărul de unități pe care fiecare obiect este reprezentat.

Scala de comandă. Ordinea obiectelor este focalizarea. Această scară în statistică include astfel de materiale de cercetare în care obiectele aparținând uneia sau mai multor clase sunt supuse luării în considerare, dar diferă atunci când se compară una cu alta: mai mult - mai puțin, mai mare - mai mic etc.

Cel mai simplu mod de a arăta caracteristicile tipice ale scalei de ordine este să te uiți la rezultatele oricărei competiții sportive. Ei listează secvenţial participanţii care au ocupat prima, a doua, a treia şi, respectiv, alte poziţii.

în ordinea locului, iar informațiile despre realizările reale ale sportivilor trec în fundal sau sunt absente.

Scala de intervale. Include astfel de materiale în care o evaluare cantitativă a obiectului studiat este dată în unități fixe. Materialele corespunzătoare scalei de intervale trebuie să aibă o unitate de măsură care să fie identică cu ea însăși pentru toate măsurătorile repetate.

Scala de relații. Această scară include materiale care iau în considerare nu numai numărul de unități fixe , ca la scara intervalelor, dar si raporturile rezultatelor totale obtinute intre ele. Pentru a lucra cu astfel de relații, trebuie să aveți un punct absolut, de la care se efectuează numărătoarea inversă.

Dacă datele disponibile cercetătorului, la o examinare mai atentă, se abate doar ușor de curba de distribuție normală gaussiană, atunci acest lucru dă cercetătorului dreptul de a utiliza metode parametrice în prelucrarea statistică, ale căror prevederi inițiale se bazează pe curba de distribuție normală gaussiană. . Distribuția normală se numește parametrică deoarece pentru a construi și analiza curba Gauss, este suficient să aveți doar doi parametri: media aritmetică, a cărei valoare ar trebui să corespundă înălțimii perpendicularei restabilite în centrul curbei și așa-numita rădăcină pătrată medie, sau abatere standard, o valoare care caracterizează intervalul de fluctuații din această curbă.

Dacă este imposibil să se aplice metode parametrice, este necesar să se apeleze la cele neparametrice.

Unul dintre factorii care limitează aplicarea testelor statistice bazate pe ipoteza normalității este dimensiunea eșantionului. Atâta timp cât eșantionul este suficient de mare (de exemplu, 100 sau mai multe observații), distribuția eșantionului poate fi presupusă a fi normală, chiar dacă nu este sigur că distribuția variabilei în populație este normală. Cu toate acestea, dacă eșantionul este mic, atunci testele parametrice ar trebui utilizate numai dacă există încredere că variabila este într-adevăr distribuită normal. Cu toate acestea, chiar și pentru astfel de variabile, nu există nicio modalitate de a testa această ipoteză pe un eșantion mic (testele statistice pentru normalitate încep efectiv să funcționeze pe un eșantion care conține cel puțin 51 de observații).

Metodele neparametrice sunt cele mai adecvate atunci când dimensiunea eșantionului este mică și datele sunt la scară ordinală sau nominală. Dacă există o mulțime de date empirice (de exemplu, n>100), atunci adesea nu are sens și chiar pare incorect să folosești statistici neparametrice. Dacă dimensiunea eșantionului este foarte mică (de exemplu, n=10 sau mai puțin), atunci nivelurile de semnificație p pentru acele teste neparametrice care utilizează aproximarea normală pot fi considerate doar estimări brute.



Aplicarea criteriilor bazate pe ipoteza normalității este limitată și de faptul că caracteristicile studiate aparțin unei anumite scale de măsurare. Metode statistice precum, de exemplu, testul t Student (pentru eșantioane dependente și independente), corelația liniară a lui Pearson, precum și analiza de regresie, cluster și factori presupun că datele sursă sunt continue (valorile variabilelor studiate). sunt legate de o scară de interval sau raport) . Cu toate acestea, există cazuri în care datele sunt pur și simplu clasate (măsurate pe o scară ordinală) mai degrabă decât măsurate cu precizie. Atunci pare oportun să se utilizeze astfel de criterii statistice, cum ar fi, de exemplu, testul T Wilcoxon, testul G al semnelor, testul U Mann-Whitney, testul Z Wald-Wolfowitz, corelarea rangului lui Spearman etc. Metodele statistice proprii va lucra pe date nominale, de exemplu, corelarea caracteristicilor calitative, testul chi-pătrat, testul Q Cochran etc. Alegerea unui anumit criteriu este asociată cu o ipoteză pe care cercetătorul o propune în cursul cercetării științifice , iar apoi încearcă să o demonstreze la nivel empiric.

Deci, pentru fiecare criteriu parametric, există cel puțin o alternativă neparametrică. În general, aceste proceduri se încadrează în una din următoarele categorii: (1) evaluarea gradului de dependenţă între variabile; (2) criterii de diferență pentru eșantioane independente; (3) criterii de diferență pentru eșantioanele dependente.

Pentru a evalua dependența (relația), sau gradul de etanșeitate (densitate, rezistență) conexiunii, se calculează coeficientul de corelație Pearson (r). Strict vorbind, utilizarea sa are și limitări asociate, de exemplu, cu tipul de scară în care sunt măsurate datele și neliniaritatea dependenței. Prin urmare, coeficienții de corelație neparametrici sau așa-numiții de rang (de exemplu, coeficientul de corelație de rang al lui Spearman (ρ), statisticile Kendall tau (τ), Gamma (Gamma)), utilizați pentru datele ordinale (clasate), sunt utilizați ca alternativă. Dacă există mai mult de două variabile, atunci este utilizat coeficientul Kendall de concordanță. Este folosit, de exemplu, pentru a evalua coerența opiniilor experților independenți (de exemplu, punctele acordate aceluiași subiect, participant la concurs).

Dacă datele sunt măsurate la o scară nominală, atunci este firesc să le prezentăm în tabele de contingență care utilizează testul chi-pătrat al lui Pearson cu diverse variații și ajustări pentru acuratețe.

Diferențele dintre grupurile independente. Dacă există două eșantioane (de exemplu, băieți și fete) care trebuie comparate cu o valoare medie, de exemplu, gândirea creativă, atunci puteți utiliza testul t pentru eșantioane independente (testul t pentru eșantioanele independente) . Alternative neparametrice la acest test sunt testul Wald-Wolfowitz, testul Mann-Whitney U și testul Kolmogorov-Smirnov cu două eșantioane. Trebuie amintit că testul Kolmogorov-Smirnov cu două eșantioane este sensibil nu numai la diferența de poziție a celor două distribuții, ci și la forma distribuției. De fapt, este sensibil la orice abatere de la ipoteza omogenității, dar nu indică cu ce abatere se confruntă cercetătorul.

Diferențele dintre grupurile dependente. Dacă este necesară compararea a două variabile legate de același eșantion, de exemplu, indicatorii de agresivitate a acelorași subiecți înainte și după munca corecțională, atunci se utilizează de obicei testul t pentru eșantioanele dependente. Testele neparametrice alternative sunt testul semnului și testul perechilor potrivite Wilcoxon. Testul Wilcoxon sugerează că este posibil să se claseze diferențele dintre observațiile comparate. Dacă acest lucru nu se poate face, atunci se folosește criteriul semnului, care ia în considerare doar semnele diferențelor dintre valorile comparate.

Dacă variabilele luate în considerare sunt categorice (nominale), atunci chi-pătratul McNemar este adecvat. Dacă există două variabile categoriale, atunci statisticile standard și criteriile adecvate pentru tabelele de contingență sunt utilizate pentru a evalua gradul de dependență: Chi-pătrat, Phi-pătrat, test exact Fisher.

Tabelul de mai jos prezintă teste parametrice și alternativele lor neparametrice, ținând cont de următoarele categorii: 1) evaluarea gradului de dependență între variabile; 2) criterii de diferență.

Tabelul 4.1 - Criterii parametrice și neparametrice

Criterii parametrice Teste neparametrice
evaluarea dependenței (relații)
Coeficientul de corelație Pearson (r) coeficienții de corelație de rang (coeficientul de corelație de rang al lui Spearman ρ), statistica tau a lui Kendall (τ), Gamma (Gamma)); chi-pătratul lui Pearson (pentru date nominale)
diferențe între grupuri independente
Testul t al lui Student pentru probe independente (testul t pentru probe independente) Testul de rulare Wald-Wolfowitz, testul Mann-Whitney U, testul Kolmogorov-Smirnov cu două probe
diferențe dintre grupurile dependente
Testul t al lui Student pentru eșantioanele dependente (testul t pentru eșantioanele dependente) Testul G al semnelor (Testul semnelor), testul T al comparațiilor perechi Wilcoxon (testul perechilor potrivite Wilcoxon); McNemar Chi-pătrat, Chi-pătrat, Phi-pătrat, Fisher exact (pentru date nominale)

Dacă sunt luate în considerare mai mult de două variabile din același eșantion (de exemplu, pre-ajustare, post-ajustare-1 și post-ajustare-2), atunci este de obicei utilizată analiza de varianță cu măsuri repetate, care poate fi considerată ca o generalizarea testului t pentru probele dependente.să crească sensibilitatea analizei. Abrevierea în limba engleză pentru analiza varianței este ANOVA (Analysis of Variation). Analiza varianței vă permite să controlați simultan nu numai nivelul de bază al variabilei dependente, ci și alți factori, precum și să includeți mai mult de o variabilă dependentă în planul de experiment. Metodele alternative non-parametrice sunt analiza varianței Kruskal-Wallis și testul median (ANOVA Kruskal-Wallis, testul median), analiza varianței lui Friedman (ANOVA Friedman prin ranguri).

Întrebări pe criterii neparametrice.

Criteriul statistic - o regulă de decizie care asigură acceptarea unui adevărat și respingerea unei ipoteze false cu o mare probabilitate.Totodată, un criteriu statistic este o metodă de calcul a unui anumit număr și a acestui număr în sine.

Criteriile parametrice sunt utilizate atunci când eșantionul este normal, în timp ce calculul în aceste criterii include caracteristici ale distribuției de probabilitate a caracteristicii, adică medii și varianță. Aceasta presupune că datele sunt continue. Testele parametrice includ: testul t al lui Student, testul chi-pătrat. Potrivit pentru scale de rapoarte de interval.

Testele neparametrice sunt folosite atunci când este imposibil să vorbim despre o distribuție normală, testele se bazează pe operarea cu ranguri sau frecvențe. Cele neparametrice includ testul semnului, testul Wilcoxon, testul Mann-Whitney și Jonkheer. Potrivit pentru scalele mai slabe decât scalele cu intervale.

Înainte de a alege un criteriu, trebuie să verificăm normalitatea eșantionului.

Habar nu am ce să scriu în ceea ce privește măsurile medii și împrăștiate, pentru că se pare că există toate aceleași concepte de dispersie și bla bla alte lucruri *_*

2. Metode de testare a ipotezelor statistice: testul t, testul Wilcoxon, testul Mann-Whitney, testul Kruskal-Wallace (condiții de aplicare, formularea ipotezelor, distribuțiile statisticilor, ideea de calcul)

t-test (Student) - folosit dacă proba este normală. Ipotezele sunt formulate astfel:

1. Se formulează H0

2. Se formulează H1, alternativa H0 (de obicei indică interacțiunea caracteristicilor).

3. Se selectează o statistică pentru a alege între două ipoteze

4. Pentru fiecare nivel de semnificație α se stabilește o regiune critică, unde a) rezultatul care se încadrează în această regiune indică H1 mai degrabă decât H0 b) probabilitatea ca rezultatul să cadă în această regiune la H0 adevărat este egală cu α.

Probabilitatea unei erori acceptabile de primul fel α=0,05, dacă valoarea criteriului din eșantionul nostru este mai mare decât t 0,05, atunci acceptăm ipoteza H0, respingem ipoteza H1.

Pentru o mostră

Pentru mostre independente.

Testul de rang semnat Wilcoxon ia în considerare nu valorile numerelor din eșantion, ci doar semnele acestora. Criteriul ia în considerare valorile absolute ale membrilor eșantionului. Este utilizat atunci când eșantionul poate să nu fie normal și când este necesar să se decidă dacă eșantionul are o medie semnificativ diferită de zero. Aplicația necesită:

1) Setați nivelul de semnificație α și găsiți cuantila Wilcoxon inferioară corespunzătoare.


2) Aranjați toți membrii eșantionului în ordine crescătoare a valorii absolute, semnați rangurile sub ei.

3) Calculați statistica Wilcoxon, pentru care calculăm suma rangurilor atribuite membrilor negativi ai eșantionului.

4) Comparați statisticile obținute cu cuantila găsită anterior. Dacă această sumă de ranguri este mai mică decât cuantila inferioară, respingem ipoteza H0 și acceptăm ipoteza H1. În mod similar, dacă suma rangurilor tuturor membrilor eșantionului pozitiv este mai mare decât cuantila superioară, acceptăm H1 și respingem H0.

Testul Mann-Whitney (U) este un test pentru probe independente, un analog al testului t Student. Valoarea sa empirică arată cum cele două rânduri de valori ale atributelor coincid. Se folosește atunci când eșantionul poate să nu fie normal, se păstrează doar cerința de similitudine a distribuțiilor, dar nu trebuie să fie normale + atunci când se cere pentru a rezolva problema, este posibil să se afirme că. Că valoarea medie a eșantionului experimental este semnificativ mai mare decât valoarea medie a grupului de control.

1) Notăm membrii ambelor eșantioane în ordine crescătoare, evidențiind membrii diferitelor mostre în moduri diferite.

2) Pentru fiecare număr al primului eșantion (de control), calculăm câte numere ale celui de-al doilea eșantion (experimental) sunt situate în stânga acestuia. Dacă numărul primului eșantion este egal cu numărul celui de-al doilea, atunci adăugați 0,5. Obținem rezultate consistente și le adunăm.

3) Ne uităm la nivelul de semnificație pe care l-am ales pentru cuantila inferioară conform lui Mann-Whitney. Dacă suma primită de noi este mai mică decât cuantila inferioară, atunci respingem ipoteza H0, acceptăm ipoteza H1.

Distribuția Mann-Whitney este simetrică (adică puteți număra înapoi și puteți utiliza cuantila superioară).

Testul Kruskal-Wallace este un analog neparametric al analizei unidirecționale a varianței pentru probe independente. Similar testului Mann-Whitney. Evaluează gradul de coincidență a mai multor serii de valori ale caracteristicii modificate. Ideea principală este de a prezenta toate valorile eșantioanelor comparate ca o secvență comună de valori clasate cu calculul ulterior al rangului mediu pentru fiecare dintre eșantioane.

Calculat după clasare.

N este numărul total al tuturor probelor.

k este numărul de mostre comparate.

R i este suma rangurilor pentru un eșantion specific.

n i – dimensiunea eșantionului i.

Cu cât eșantioanele diferă mai mult, cu atât valoarea de calcul a lui H este mai mare, cu atât nivelul p-semnificației este mai mic. Când o ipoteză statistică nulă este respinsă, se acceptă una alternativă despre diferențele semnificative statistic în această trăsătură fără a specifica direcția diferențelor. (pentru direcție este necesar testul Mann-Whitney, pentru că este pentru două probe, iar acesta este pentru mai mult de două).