Manna Whitney. Mann-Whitney U-criteriul în lucrarea de teză, curs și master în psihologie

Criteriul U Mann - Whitney

Atribuirea unui criteriu. Criteriul este conceput pentru a evalua diferențele dintre Două mostre de către nivel orice trăsătură care poate fi cuantificată. Vă permite să distingeți între mic mostre când P 1, n 2 > 3 sau p L \u003d 2, p 2\u003e 5 și este mai puternic decât criteriul Q Rosenbaum.

Această metodă determină dacă aria de suprapunere a valorilor dintre două serii este suficient de mică. Ne amintim că numim primul rând (eșantion, grup) rândul de valori în care valorile, conform unei estimări preliminare, sunt mai mari, iar al 2-lea rând este cel în care se presupune că sunt mai mici.

Cu cât zona de încrucișare este mai mică, cu atât este mai probabil ca diferențe de încredere. Aceste diferențe sunt uneori denumite diferențe în Locație două mostre. Valoarea empirică a criteriului reflectă cât de mare este zona de coincidență dintre rânduri. Asa de mai putin t/ 3Mn, in mod deosebit este probabil ca diferențele de încredere.

Ipoteze.

Nivelul de inteligență non-verbală în lotul studenților la fizică este mai mare decât în grupul studenților la psihologie.

Reprezentarea grafică a unui criteriuU. Pa fig. 7.25 prezintă trei dintre numeroasele opțiuni posibile pentru raportul a două serii de valori.

În opțiunea (a), al doilea rând este mai jos decât primul, iar rândurile aproape că nu se intersectează. Zona de suprapunere ( S j) prea mic pentru a ascunde diferențele dintre rânduri. Există șansa ca diferențele dintre ele să fie semnificative. Putem determina exact acest lucru folosind criteriul U.

În varianta (b), al doilea rând este, de asemenea, mai mic decât primul, dar aria de suprapunere a valorilor pentru cele două rânduri este destul de extinsă (5 2). Este posibil să nu atingă încă o valoare critică, când diferențele vor trebui recunoscute ca fiind nesemnificative. Dar dacă acest lucru este așa poate fi determinat doar prin calculul exact al criteriului U.

În opțiunea (c), al doilea rând este mai jos decât primul, dar suprapunerea este atât de extinsă (5 3) încât diferențele dintre rânduri sunt ascunse.

Orez. 7.25.

în două mostre

Notă. Suprapunerea (5 t , S 2 , *$z) indică zonele de posibilă suprapunere. Restricții de criteriiU.

1. Fiecare eșantion trebuie să conțină cel puțin trei observații: n v p 2 > 3; este permis ca într-o probă să fie două observații, dar atunci trebuie să existe cel puțin 5 dintre ele în al doilea.
2. Fiecare probă nu trebuie să conțină mai mult de 60 de observații; p l, p 2 w, n 2 > 20 clasarea devine destul de laborioasă.

Să revenim la rezultatele unui sondaj al studenților facultăților fizice și psihologice ale Universității din Leningrad folosind metoda lui D. Veksler pentru măsurarea inteligenței verbale și non-verbale. Folosind criteriul Q Rosenbaum, s-a determinat cu un nivel ridicat de semnificație că nivelul inteligenței verbale în eșantionul de studenți ai Facultății de Fizică este mai ridicat. Să încercăm acum să stabilim dacă acest rezultat este reprodus atunci când comparăm mostre în funcție de nivelul de inteligență non-verbală. Datele sunt date în tabel.

2 este sub nivelul trăsăturii din eșantionul 1 la un nivel semnificativ semnificativ. Cu cât valoarea este mai mică tu, cu atât semnificația diferențelor este mai mare.

Acum să facem toată această muncă pe materialul exemplului nostru. Ca rezultat al lucrului pe 1-6 pași ai algoritmului, vom construi un tabel (Tabelul 7.4).

Tabelul 7.4

Calculul sumelor de rang pentru eșantioane de studenți ai facultăților fizice și psihologice

Studenți la fizică (P = 14)		Studenți la psihologie (n= 12)
		Scorul de inteligență non-verbală























Medie 107,2

Suma totală de ranguri: 165 + 186 = 351. Suma calculată conform formulei (5.1) este următoarea:

Se respectă egalitatea sumelor reale și estimate. Vedem că în ceea ce privește nivelul de inteligență non-verbală, un eșantion de studenți la psihologie este mai „mai înalt”. Acest eșantion reprezintă o sumă mare de rang: 186. Acum suntem gata să formulăm ipoteze statistice:

Sine 0: un grup de studenți la psihologie nu depășește un grup de studenți la fizică în ceea ce privește inteligența non-verbală;

Eu: un grup de studenți la psihologie depășește un grup de studenți la fizică în ceea ce privește inteligența non-verbală.

În conformitate cu următorul pas al algoritmului, determinăm valoarea empirică U :

Pentru că în cazul nostru p l * p 2, calculați valoarea empirică U iar pentru suma de rangul doi (165), înlocuind în formula (7.4) cea corespunzătoare p x.:

Conform Anexei 8, determinăm valorile critice pentru p l = 14, n 2 = 12:

Ne amintim că criteriul U este una dintre cele două excepții de la regula generală pentru a decide dacă diferențele sunt semnificative, și anume, putem afirma diferențe semnificative dacă (/ emp U Kp 0 05 (la temperatură = 60, și sp > U Kf) aproximativ,05).

Prin urmare, H 0 se ia astfel: lotul studenţilor la psihologie nu depăşeşte lotul studenţilor la fizică din punct de vedere al nivelului de inteligenţă non-verbală.

Să acordăm atenție faptului că, în acest caz, criteriul Rosenbaum Q nu este aplicabil, deoarece intervalul de variabilitate în grupul de fizicieni este mai larg decât în grupul de psihologi: atât cele mai mari, cât și cele mai scăzute valori ale non-ului. -inteligenta verbala se incadreaza asupra grupului de fizicieni (vezi Tabelul 7.4) .

Această metodă statistică a fost propusă de Frank Wilcoxon (vezi foto) în 1945. Cu toate acestea, în 1947, metoda a fost îmbunătățită și extinsă de H. B. Mann și D. R. Whitney, astfel încât testul U este denumit mai frecvent prin numele lor.

Criteriul este conceput pentru a evalua diferențele dintre două eșantioane în ceea ce privește nivelul oricărei trăsături, măsurat cantitativ. Vă permite să identificați diferențele dintre eșantioanele mici atunci când n 1 ,n 2 ≥3 sau n 1 =2, n 2 ≥5 și este mai puternic decât testul Rosenbaum.

Descrierea testului Mann-Whitney U

Există mai multe modalități de utilizare a criteriului și mai multe opțiuni pentru tabelele de valori critice corespunzătoare acestor metode (Gubler E. V., 1978; Runion R., 1982; Zakharov V. P., 1985; McCall R., 1970; Krauth J., 1988). ).

Cu cât zona de încrucișare este mai mică, cu atât este mai probabil ca diferențele să fie semnificative. Uneori, aceste diferențe sunt numite diferențe în localizarea a două eșantioane (Welkowitz J. și colab., 1982).

Valoarea empirică a criteriului U reflectă cât de mare este zona de coincidență dintre rânduri. Prin urmare, cu cât U emp mai mic, cu atât este mai probabil ca diferențele să fie semnificative.

Ipotezele U - testul Mann-Whitney

H0: Nivelul atributului din grupul 2 nu este mai mic decât nivelul atributului din grupul 1.
H1: Nivelul trăsăturii din grupul 2 este mai scăzut decât nivelul trăsăturii din grupul 1.

Limitele testului Mann-Whitney U

1. Fiecare probă trebuie să conţină cel puţin 3 observaţii: n 1 ,n 2 ≥ З; este permis ca într-o probă să fie 2 observații, dar atunci trebuie să fie cel puțin 5 dintre ele în al doilea.

2. Fiecare probă nu trebuie să conțină mai mult de 60 de observații; n1, n2 ≤ 60.

Calculul automat al testului U Mann-Whitney

Pasul 1

Introduceți datele din primul eșantion în prima coloană („Eșantionul 1”) și datele din al doilea eșantion în a doua coloană („Eșantionul 2”). Datele sunt introduse un număr pe linie; fără spații, goluri etc. Sunt introduse doar numere. Numerele fracționale sunt introduse cu un „.” (punct). După completarea coloanelor, faceți clic pe butonul „Pasul 2” pentru a calcula automat testul U Mann-Whitney.

Testul U Mann-Whitney(Engleză) Testul U Mann-Whitney) este un test statistic folosit pentru a evalua diferențele dintre două eșantioane independente în ceea ce privește nivelul oricărei trăsături, măsurat cantitativ. Vă permite să detectați diferențele de valoare a unui parametru între eșantioane mici.

Testul Wilcoxon-sumă de rang ). Mai puțin frecvent: criteriul pentru numărul de inversiuni.

Poveste

Această metodă de detectare a diferențelor dintre probe a fost propusă în 1945 de Frank Wilcoxon ( F. WilcoxonH. B. Mann) și D. R. Whitney ( D. R. Whitney

Descrierea criteriului

Nu ar trebui să existe valori de potrivire în datele eșantionului (toate numerele sunt diferite) sau ar trebui să existe foarte puține astfel de potriviri (până la 10).

Utilizarea unui criteriu

Alcătuiți o singură serie clasificată din ambele eșantioane comparate, aranjandu-le elementele în funcție de gradul de creștere al caracteristicii și atribuind un rang inferior valorii inferioare. Numărul total de ranguri va fi egal cu: N = n 1 + n 2 , (\displaystyle N=n_(1)+n_(2),) unde n 1 (\displaystyle n_(1)) este numărul de elemente în primul eșantion și n 2 (\displaystyle n_(2)) - numărul de elemente din al doilea eșantion.
Împărțiți o singură serie clasată în două, constând din unități din primul și, respectiv, al doilea eșantion. Calculați separat suma rangurilor care au căzut pe ponderea elementelor din primul eșantion și separat - pe ponderea elementelor din al doilea eșantion. Defini mare a două sume de rang (T x (\displaystyle T_(x))) corespunzătoare unui eșantion cu n x (\displaystyle n_(x)) elemente.
Determinați valoarea testului U Mann-Whitney folosind formula: U = n 1 ⋅ n 2 + n x ⋅ (n x + 1) 2 − T x . (\displaystyle U=n_(1)\cdot n_(2)+(\frac (n_(x)\cdot (n_(x)+1))(2))-T_(x).)
Folosind tabelul pentru nivelul selectat de semnificație statistică, determinați valoarea critică a criteriului pentru datele n 1 (\displaystyle n_(1)) și n 2 (\displaystyle n_(2)) . Dacă valoarea primită este U (\displaystyle U) mai mici tabelar sau egal cu acesta, atunci se recunoaște existența unei diferențe semnificative între nivelul caracteristicii din eșantioanele considerate (se acceptă o ipoteză alternativă). Dacă valoarea rezultată U (\displaystyle U) este mai mare decât valoarea tabelului, se acceptă ipoteza nulă. Semnificația diferențelor este mai mare, cu atât valoarea lui U (\displaystyle U) este mai mică.
Dacă ipoteza nulă este adevărată, criteriul are așteptarea M (U) = n 1 ⋅ n 2 2 (\displaystyle M(U)=(\frac (n_(1))\cdot n_(2))(2)) ) și varianța D (U) = n 1 ⋅ n 2 ⋅ (n 1 + n 2 + 1) 12 (\displaystyle D(U)=(\frac (n_(1))\cdot n_(2)\cdot (n_) (1)+ n_(2)+1))(12))) și cu o cantitate suficient de mare de date eșantion (n 1 > 19 , n 2 > 19) (\displaystyle (n_(1)>19,\; n_(2)>19 )) este distribuit aproape normal.

Tabelul valorilor critice

Calculul valorilor critice ale testului U Mann-Whitney pentru probe mai mari de 20 (N>20) (link descendent din 10-02-2017)

Testul Mann-Whitney: exemplu, tabel

Un criteriu în statistica matematică este o regulă strictă conform căreia o ipoteză cu un anumit nivel de semnificație este acceptată sau respinsă. Pentru a-l construi, trebuie să găsiți o anumită funcție. Ar trebui să depindă de rezultatele finale ale experimentului, adică de valorile găsite empiric. Această funcție va fi un instrument pentru evaluarea discrepanței dintre eșantioane.

Valoare semnificativă statistic. Informatii generale

Semnificația statistică este o cantitate care este puțin probabil să apară întâmplător. Indicatorii săi mai extremi sunt, de asemenea, nesemnificativi. Se spune că o diferență este semnificativă din punct de vedere statistic dacă există date care nu pot apărea, presupunând că aceste diferențe nu există. Dar asta nu înseamnă deloc că această diferență trebuie să fie neapărat mare și semnificativă.

Nivelul de semnificație statistică a testului

Acest termen trebuie înțeles ca fiind probabilitatea de a respinge ipoteza nulă dacă este adevărată. Aceasta se mai numește și eroare de tip I sau o decizie fals pozitivă. În cele mai multe cazuri, procesul se bazează pe o valoare p („valoare pi”). Aceasta este probabilitatea cumulativă la respectarea nivelului criteriului statistic. Acesta, la rândul său, se calculează din eșantion în momentul acceptării ipotezei nule. Ipoteza va fi respinsă dacă această valoare p este mai mică decât nivelul declarat de analist. Semnificația valorii testului depinde direct de acest indicator: cu cât este mai mică, cu atât mai mult motiv pentru a respinge ipoteza.
Nivelul de semnificație este de obicei notat cu litera b (alfa). Indicatori populari în rândul specialiștilor: 0,1%, 1%, 5% și 10%. Dacă, să zicem, se spune că șansele de coincidență sunt 1 la 1000, atunci cu siguranță vorbim de nivelul de 0,1% al semnificației statistice a unei variabile aleatoare. Diferitele niveluri B au avantajele și dezavantajele lor. Dacă scorul este mai mic, atunci este mai probabil ca ipoteza alternativă să fie semnificativă. Cu toate acestea, există riscul ca presupunerea falsă nulă să nu fie respinsă. Se poate concluziona că alegerea nivelului b optim depinde de balanța „semnificație-putere” sau, în consecință, de compromisul dintre probabilitățile de decizii fals pozitive și fals negative. Un sinonim pentru „semnificație statistică” în literatura internă este termenul „fiabilitate”.

Definiția ipotezei nule

În statisticile matematice, aceasta este o ipoteză care este testată pentru coerență cu datele empirice deja în stoc. În majoritatea cazurilor, ipoteza nulă este ipoteza că nu există o corelație între variabilele studiate sau că nu există diferențe de omogenitate în distribuțiile studiate. În cercetarea standard, un matematician încearcă să infirme ipoteza nulă, adică să demonstreze că nu este în concordanță cu datele experimentale. Mai mult, trebuie să existe o ipoteză alternativă, care este luată în locul celei zero.

Definiție cheie

Criteriul U (Mann-Whitney) în statistica matematică vă permite să evaluați diferențele dintre două eșantioane. Ele pot fi date în funcție de nivelul unei trăsături, care se măsoară cantitativ. Această metodă este ideală pentru estimarea diferențelor în eșantioane mici. Acest criteriu simplu a fost propus de Frank Wilcoxon în 1945. Și deja în 1947, metoda a fost revizuită și completată de oamenii de știință H. B. Mann și D. R. Whitney, ale căror nume este numită până astăzi. Criteriul Mann-Whitney în psihologie, matematică, statistică și multe alte științe este unul dintre elementele fundamentale ale fundamentării matematice a rezultatelor cercetării teoretice.

Descriere

Testul Mann-Whitney este o metodă relativ simplă, fără parametri. Puterea sa este semnificativă. Este semnificativ mai mare decât puterea testului Rosenbaum Q. Metoda evaluează cât de mică este aria valorilor încrucișate dintre eșantioane, și anume între seria de valori clasate din primul și al doilea set. Cu cât valoarea criteriului este mai mică, cu atât este mai probabil ca discrepanțele dintre valoarea parametrilor să fie fiabile. Pentru a aplica corect criteriul U (Mann-Whitney), nu trebuie să uităm de unele limitări. Fiecare eșantion trebuie să conțină cel puțin 3 valori caracteristice. Este posibil ca într-un caz să existe două valori, dar în al doilea caz trebuie să existe cel puțin cinci dintre ele. În eșantioanele studiate, ar trebui să existe un număr minim de indicatori de potrivire. În mod ideal, toate numerele ar trebui să fie diferite.

Utilizare

Cum se utilizează corect testul Mann-Whitney? Tabelul alcătuit prin această metodă conține anumite valori critice. Primul pas este să creați o singură serie din ambele eșantioane potrivite, care este apoi clasată. Adică, elementele sunt aliniate în funcție de gradul de creștere al atributului, iar un rang inferior este atribuit unei valori mai mici. Ca rezultat, obținem următorul număr total de ranguri:

N = N1 + N2,

unde valorile N1 și N2 sunt numărul de unități conținute în primul și, respectiv, al doilea eșantion. În plus, o singură serie de valori clasate este împărțită în două categorii. Unități, respectiv, din prima și a doua probă. Acum se calculează pe rând suma rândurilor valorilor din primul și al doilea rând. Se determină cel mai mare dintre ele (Tx), care corespunde unui eșantion cu nx unități. Pentru a utiliza în continuare metoda Wilcoxon, valoarea acesteia este calculată prin următoarea metodă. Este necesar să se afle din tabelul pentru nivelul de semnificație ales valoarea critică a acestui criteriu pentru N1 și N2 luate în mod specific.
Indicatorul rezultat poate fi mai mic sau egal cu valoarea din tabel. În acest caz, se constată o diferență semnificativă a nivelurilor trăsăturii din probele studiate. Dacă valoarea obţinută este mai mare decât valoarea tabelului, atunci ipoteza nulă este acceptată. Când se calculează testul Mann-Whitney, trebuie remarcat că dacă ipoteza nulă este adevărată, testul va avea o medie și o varianță. Rețineți că pentru volume suficient de mari de date de eșantion, metoda este considerată a fi distribuită aproape normal. Semnificația diferențelor este cu cât este mai mare, cu atât valoarea testului Mann-Whitney este mai mică.

Valorile criteriului Pearson (criteriul)

Tabele de probabilități asociate cu valorile testului Mann-Whitney.

Tabele de probabilități asociate cu valorile testului Mann-Whitney. Pentru valoarea experimentală a criteriului (cea mai mică dintre cele două valori) și dimensiunile eșantionului, găsiți probabilitatea ca ambele grupuri să aparțină aceleiași populații generale. Astfel, o valoare de probabilitate scăzută, de exemplu, P

Tabelul 3

Tabelul 4

Tabelul 5

Tabelul 6

Tabelul valorilor critice ale testului Mann-Whitney pentru nivelul de semnificație.

Dacă , atunci diferența dintre eșantioane este semnificativă pentru , adică ipoteza nulă ar trebui respinsă.

N 2

N 1

2. U - testul Mann-Whitney

Criteriul este conceput pentru a evalua diferențele dintre două eșantioane în ceea ce privește nivelul oricărei trăsături, măsurat cantitativ. Vă permite să detectați diferențele dintre eșantioanele mici atunci când n1 și n2 sunt mai mari sau egale cu 3 (sau n1 = 2, iar n2 este atunci mai mare sau egal cu 5.)

Metoda determină dacă aria de suprapunere a valorilor dintre două serii este suficient de mică. Cu cât această zonă este mai mică, cu atât este mai probabil ca diferențele să fie semnificative. Valoarea empirică (obținută efectiv) a criteriului U reflectă cât de mare este zona de coincidență dintre rânduri. Cu cât Uemp. mai mic, cu atât este mai probabil ca diferențele să fie semnificative.

Ipoteze.

Dar: Nivelul atributului din grupa 2 nu este mai mic decât nivelul atributului din grupa 1.

H1: Nivelul trăsăturii din grupul 2 este mai scăzut decât nivelul trăsăturii din grupul 1.

Limitări ale criteriului U.

1. Trebuie să existe cel puțin 3 observații în fiecare probă sau, în cazuri extreme, este permis un raport de 2 la 5 sau mai mult.

2. Nu ar trebui să existe mai mult de 60 de observații în fiecare probă.

Algoritm de calcul al criteriului U - Mann-Whitney.

1. Transferați toate datele eșantioanelor pe carduri individuale (pe care vor fi reflectate în culoare sau într-un alt mod căruia dintre eșantioane îi aparține valoarea).

2. Așezați toate cărțile într-un rând comun pe măsură ce semnul crește, indiferent de probă căreia îi aparțin.

3. Clasificați (conform algoritmului de clasare) valorile de pe cărți, atribuind un rang inferior valorii inferioare. Ar trebui să existe n1 + n2 ranguri în total (mărimea primului eșantion + dimensiunea celui de-al doilea eșantion).

4. Rearanjați cardurile pe două rânduri, în funcție de apartenența la eșantionul 1 sau eșantionul 2.

6. Determinați cea mai mare dintre cele două sume de rang.

7. Determinați valoarea lui U cu formula:

8. Determinați din tabele valorile critice ale lui U, în conformitate cu aceasta, acceptați sau respingeți ipoteza nr.

3. H - criteriul Kruskal - Wallis

Criteriul H este utilizat pentru a evalua diferențele de severitate a trăsăturii analizate simultan între trei, patru sau mai multe probe. Vă permite să identificați gradul de modificare a trăsăturii în probe, fără a indica, însă, direcția acestor modificări.

Criteriul se bazează pe principiul că, cu cât suprapunerea probelor este mai mică, cu atât este mai mare nivelul de semnificație. H emp . Trebuie subliniat faptul că poate exista un număr diferit de subiecți în eșantioane, deși în sarcinile de mai jos este dat un număr egal de subiecți din eșantioane.

Lucrul cu date începe cu faptul că toate eșantioanele sunt combinate condiționat în ordinea valorilor care apar într-un singur eșantion, iar valorile acestui eșantion combinat sunt clasificate. Apoi, rangurile obținute sunt atașate la datele eșantionului inițial, iar suma rangurilor este calculată separat pentru fiecare eșantion. Criteriul este construit pe următoarea idee – dacă diferențele dintre eșantioane sunt nesemnificative, atunci sumele rangurilor nu vor diferi semnificativ unele de altele și invers.

Valoare H emp calculat prin formula:

H emp

Unde N este numărul total de membri din eșantionul generalizat;

n i este numărul de membri din fiecare eșantion individual;

sunt pătratele sumelor rangurilor pentru fiecare eșantion.

Când determinați valorile critice ale criteriului pentru patru sau mai multe probe, utilizați tabelul pentru criteriu hee-pătrat, având calculat în prealabil numărul de grade de libertate v pentru c = 4. Apoi v = c - 1 = 4 – 1=3..

Subliniem că dacă folosim criterii care ne permit să comparăm doar două serii de valori, atunci rezultatul obținut mai sus ar necesita șase comparații - primul eșantion cu al doilea, al treilea etc.

Pentru a folosi criteriul H trebuie respectate urmatoarele conditii:

1. Măsurarea trebuie făcută pe o scară de ordine, intervale sau rapoarte.

2. Probele trebuie să fie independente.

3. Este permis un număr diferit de subiecți din eșantioanele comparate.

4. La compararea a trei mostre, este permis ca una dintre ele să conțină n = 3, iar în celelalte două n = 2. Totuși, în acest caz, diferențele pot fi înregistrate doar la nivelul de semnificație de 5%.

5. Tabelul 9 din apendice este furnizat doar pentru trei eșantioane și ( n 1n 2, n H), £ 5, adică numărul maxim de subiecți din toate cele trei eșantioane poate fi mai mic și egal cu 5.

6. Cu un număr mai mare de mostre și un număr diferit de subiecți în fiecare eșantion, ar trebui să utilizați tabelul pentru criteriu hee-pătrat. În acest caz, numărul de grade de libertate este determinat de formula: v = cu - 1, unde cu - numărul de mostre potrivite.

Testul U Mann-Whitney este:

Testul U Mann-Whitney

Testul U Mann-Whitney(Engleză) Testul U Mann-Whitney) este un test statistic folosit pentru a evalua diferențele dintre două eșantioane în ceea ce privește nivelul unei trăsături, măsurat cantitativ. Vă permite să detectați diferențele de valoare a unui parametru între eșantioane mici.

Alte denumiri: testul Mann-Whitney-Wilcoxon Mann-Whitney-Wilcoxon, MWW), testul sumei rangului Wilcoxon (ing. Testul Wilcoxon-sumă de rang) sau testul Wilcoxon-Mann-Whitney (ing. Testul Wilcoxon - Mann - Whitney).