Manna Whitney. Mann-Whitney U-criteriul în lucrarea de teză, curs și master în psihologie

Criteriul U Mann - Whitney

Atribuirea unui criteriu. Criteriul este conceput pentru a evalua diferențele dintre Două mostre de către nivel orice trăsătură care poate fi cuantificată. Vă permite să distingeți între mic mostre când P 1, n 2 > 3 sau p L \u003d 2, p 2\u003e 5 și este mai puternic decât criteriul Q Rosenbaum.

Această metodă determină dacă aria de suprapunere a valorilor dintre două serii este suficient de mică. Ne amintim că numim primul rând (eșantion, grup) rândul de valori în care valorile, conform unei estimări preliminare, sunt mai mari, iar al 2-lea rând este cel în care se presupune că sunt mai mici.

Cu cât zona de încrucișare este mai mică, cu atât este mai probabil ca diferențe de încredere. Aceste diferențe sunt uneori denumite diferențe în Locație două mostre. Valoarea empirică a criteriului reflectă cât de mare este zona de coincidență dintre rânduri. Asa de mai putin t/ 3Mn, in mod deosebit este probabil ca diferențele de încredere.

Ipoteze.

Nivelul de inteligență non-verbală în lotul studenților la fizică este mai mare decât în ​​grupul studenților la psihologie.

Reprezentarea grafică a unui criteriuU. Pa fig. 7.25 prezintă trei dintre numeroasele opțiuni posibile pentru raportul a două serii de valori.

În opțiunea (a), al doilea rând este mai jos decât primul, iar rândurile aproape că nu se intersectează. Zona de suprapunere ( S j) prea mic pentru a ascunde diferențele dintre rânduri. Există șansa ca diferențele dintre ele să fie semnificative. Putem determina exact acest lucru folosind criteriul U.

În varianta (b), al doilea rând este, de asemenea, mai mic decât primul, dar aria de suprapunere a valorilor pentru cele două rânduri este destul de extinsă (5 2). Este posibil să nu atingă încă o valoare critică, când diferențele vor trebui recunoscute ca fiind nesemnificative. Dar dacă acest lucru este așa poate fi determinat doar prin calculul exact al criteriului U.

În opțiunea (c), al doilea rând este mai jos decât primul, dar suprapunerea este atât de extinsă (5 3) încât diferențele dintre rânduri sunt ascunse.

Orez. 7.25.

în două mostre

Notă. Suprapunerea (5 t , S 2 , *$z) indică zonele de posibilă suprapunere. Restricții de criteriiU.

  • 1. Fiecare eșantion trebuie să conțină cel puțin trei observații: n v p 2 > 3; este permis ca într-o probă să fie două observații, dar atunci trebuie să existe cel puțin 5 dintre ele în al doilea.
  • 2. Fiecare probă nu trebuie să conțină mai mult de 60 de observații; p l, p 2 w, n 2 > 20 clasarea devine destul de laborioasă.

Să revenim la rezultatele unui sondaj al studenților facultăților fizice și psihologice ale Universității din Leningrad folosind metoda lui D. Veksler pentru măsurarea inteligenței verbale și non-verbale. Folosind criteriul Q Rosenbaum, s-a determinat cu un nivel ridicat de semnificație că nivelul inteligenței verbale în eșantionul de studenți ai Facultății de Fizică este mai ridicat. Să încercăm acum să stabilim dacă acest rezultat este reprodus atunci când comparăm mostre în funcție de nivelul de inteligență non-verbală. Datele sunt date în tabel.

2 este sub nivelul trăsăturii din eșantionul 1 la un nivel semnificativ semnificativ. Cu cât valoarea este mai mică tu, cu atât semnificația diferențelor este mai mare.

Acum să facem toată această muncă pe materialul exemplului nostru. Ca rezultat al lucrului pe 1-6 pași ai algoritmului, vom construi un tabel (Tabelul 7.4).

Tabelul 7.4

Calculul sumelor de rang pentru eșantioane de studenți ai facultăților fizice și psihologice

Studenți la fizică (P = 14)

Studenți la psihologie (n= 12)

Scorul de inteligență non-verbală

Medie 107,2

Suma totală de ranguri: 165 + 186 = 351. Suma calculată conform formulei (5.1) este următoarea:

Se respectă egalitatea sumelor reale și estimate. Vedem că în ceea ce privește nivelul de inteligență non-verbală, un eșantion de studenți la psihologie este mai „mai înalt”. Acest eșantion reprezintă o sumă mare de rang: 186. Acum suntem gata să formulăm ipoteze statistice:

Sine 0: un grup de studenți la psihologie nu depășește un grup de studenți la fizică în ceea ce privește inteligența non-verbală;

Eu: un grup de studenți la psihologie depășește un grup de studenți la fizică în ceea ce privește inteligența non-verbală.

În conformitate cu următorul pas al algoritmului, determinăm valoarea empirică U :

Pentru că în cazul nostru p l * p 2, calculați valoarea empirică U iar pentru suma de rangul doi (165), înlocuind în formula (7.4) cea corespunzătoare p x.:

Conform Anexei 8, determinăm valorile critice pentru p l = 14, n 2 = 12:

Ne amintim că criteriul U este una dintre cele două excepții de la regula generală pentru a decide dacă diferențele sunt semnificative, și anume, putem afirma diferențe semnificative dacă (/ emp U Kp 0 05 (la temperatură = 60, și sp > U Kf) aproximativ,05).

Prin urmare, H 0 se ia astfel: lotul studenţilor la psihologie nu depăşeşte lotul studenţilor la fizică din punct de vedere al nivelului de inteligenţă non-verbală.

Să acordăm atenție faptului că, în acest caz, criteriul Rosenbaum Q nu este aplicabil, deoarece intervalul de variabilitate în grupul de fizicieni este mai larg decât în ​​grupul de psihologi: atât cele mai mari, cât și cele mai scăzute valori ale non-ului. -inteligenta verbala se incadreaza asupra grupului de fizicieni (vezi Tabelul 7.4) .

Această metodă statistică a fost propusă de Frank Wilcoxon (vezi foto) în 1945. Cu toate acestea, în 1947, metoda a fost îmbunătățită și extinsă de H. B. Mann și D. R. Whitney, astfel încât testul U este denumit mai frecvent prin numele lor.

Criteriul este conceput pentru a evalua diferențele dintre două eșantioane în ceea ce privește nivelul oricărei trăsături, măsurat cantitativ. Vă permite să identificați diferențele dintre eșantioanele mici atunci când n 1 ,n 2 ≥3 sau n 1 =2, n 2 ≥5 și este mai puternic decât testul Rosenbaum.

Descrierea testului Mann-Whitney U

Există mai multe modalități de utilizare a criteriului și mai multe opțiuni pentru tabelele de valori critice corespunzătoare acestor metode (Gubler E. V., 1978; Runion R., 1982; Zakharov V. P., 1985; McCall R., 1970; Krauth J., 1988). ).

Această metodă determină dacă aria de suprapunere a valorilor dintre două serii este suficient de mică. Ne amintim că numim primul rând (eșantion, grup) rândul de valori în care valorile, conform unei estimări preliminare, sunt mai mari, iar al 2-lea rând este cel în care se presupune că sunt mai mici.

Cu cât zona de încrucișare este mai mică, cu atât este mai probabil ca diferențele să fie semnificative. Uneori, aceste diferențe sunt numite diferențe în localizarea a două eșantioane (Welkowitz J. și colab., 1982).

Valoarea empirică a criteriului U reflectă cât de mare este zona de coincidență dintre rânduri. Prin urmare, cu cât U emp mai mic, cu atât este mai probabil ca diferențele să fie semnificative.

Ipotezele U - testul Mann-Whitney

H0: Nivelul atributului din grupul 2 nu este mai mic decât nivelul atributului din grupul 1.
H1: Nivelul trăsăturii din grupul 2 este mai scăzut decât nivelul trăsăturii din grupul 1.

Limitele testului Mann-Whitney U

1. Fiecare probă trebuie să conţină cel puţin 3 observaţii: n 1 ,n 2 ≥ З; este permis ca într-o probă să fie 2 observații, dar atunci trebuie să fie cel puțin 5 dintre ele în al doilea.

2. Fiecare probă nu trebuie să conțină mai mult de 60 de observații; n1, n2 ≤ 60.

Calculul automat al testului U Mann-Whitney

Pasul 1

Introduceți datele din primul eșantion în prima coloană („Eșantionul 1”) și datele din al doilea eșantion în a doua coloană („Eșantionul 2”). Datele sunt introduse un număr pe linie; fără spații, goluri etc. Sunt introduse doar numere. Numerele fracționale sunt introduse cu un „.” (punct). După completarea coloanelor, faceți clic pe butonul „Pasul 2” pentru a calcula automat testul U Mann-Whitney.

Testul U Mann-Whitney(Engleză) Testul U Mann-Whitney) este un test statistic folosit pentru a evalua diferențele dintre două eșantioane independente în ceea ce privește nivelul oricărei trăsături, măsurat cantitativ. Vă permite să detectați diferențele de valoare a unui parametru între eșantioane mici.

Testul Wilcoxon-sumă de rang ). Mai puțin frecvent: criteriul pentru numărul de inversiuni.

Poveste

Această metodă de detectare a diferențelor dintre probe a fost propusă în 1945 de Frank Wilcoxon ( F. WilcoxonH. B. Mann) și D. R. Whitney ( D. R. Whitney

Descrierea criteriului

  1. Nu ar trebui să existe valori de potrivire în datele eșantionului (toate numerele sunt diferite) sau ar trebui să existe foarte puține astfel de potriviri (până la 10).

Utilizarea unui criteriu

  1. Alcătuiți o singură serie clasificată din ambele eșantioane comparate, aranjandu-le elementele în funcție de gradul de creștere al caracteristicii și atribuind un rang inferior valorii inferioare. Numărul total de ranguri va fi egal cu: N = n 1 + n 2 , (\displaystyle N=n_(1)+n_(2),) unde n 1 (\displaystyle n_(1)) este numărul de elemente în primul eșantion și n 2 (\displaystyle n_(2)) - numărul de elemente din al doilea eșantion.
  2. Împărțiți o singură serie clasată în două, constând din unități din primul și, respectiv, al doilea eșantion. Calculați separat suma rangurilor care au căzut pe ponderea elementelor din primul eșantion și separat - pe ponderea elementelor din al doilea eșantion. Defini mare a două sume de rang (T x (\displaystyle T_(x))) corespunzătoare unui eșantion cu n x (\displaystyle n_(x)) elemente.
  3. Determinați valoarea testului U Mann-Whitney folosind formula: U = n 1 ⋅ n 2 + n x ⋅ (n x + 1) 2 − T x . (\displaystyle U=n_(1)\cdot n_(2)+(\frac (n_(x)\cdot (n_(x)+1))(2))-T_(x).)
  4. Folosind tabelul pentru nivelul selectat de semnificație statistică, determinați valoarea critică a criteriului pentru datele n 1 (\displaystyle n_(1)) și n 2 (\displaystyle n_(2)) . Dacă valoarea primită este U (\displaystyle U) mai mici tabelar sau egal cu acesta, atunci se recunoaște existența unei diferențe semnificative între nivelul caracteristicii din eșantioanele considerate (se acceptă o ipoteză alternativă). Dacă valoarea rezultată U (\displaystyle U) este mai mare decât valoarea tabelului, se acceptă ipoteza nulă. Semnificația diferențelor este mai mare, cu atât valoarea lui U (\displaystyle U) este mai mică.
  5. Dacă ipoteza nulă este adevărată, criteriul are așteptarea M (U) = n 1 ⋅ n 2 2 (\displaystyle M(U)=(\frac (n_(1))\cdot n_(2))(2)) ) și varianța D (U) = n 1 ⋅ n 2 ⋅ (n 1 + n 2 + 1) 12 (\displaystyle D(U)=(\frac (n_(1))\cdot n_(2)\cdot (n_) (1)+ n_(2)+1))(12))) și cu o cantitate suficient de mare de date eșantion (n 1 > 19 , n 2 > 19) (\displaystyle (n_(1)>19,\; n_(2)>19 )) este distribuit aproape normal.

Tabelul valorilor critice

  • Calculul valorilor critice ale testului U Mann-Whitney pentru probe mai mari de 20 (N>20) (link descendent din 10-02-2017)

Testul Mann-Whitney: exemplu, tabel

Un criteriu în statistica matematică este o regulă strictă conform căreia o ipoteză cu un anumit nivel de semnificație este acceptată sau respinsă. Pentru a-l construi, trebuie să găsiți o anumită funcție. Ar trebui să depindă de rezultatele finale ale experimentului, adică de valorile găsite empiric. Această funcție va fi un instrument pentru evaluarea discrepanței dintre eșantioane.

Valoare semnificativă statistic. Informatii generale

Semnificația statistică este o cantitate care este puțin probabil să apară întâmplător. Indicatorii săi mai extremi sunt, de asemenea, nesemnificativi. Se spune că o diferență este semnificativă din punct de vedere statistic dacă există date care nu pot apărea, presupunând că aceste diferențe nu există. Dar asta nu înseamnă deloc că această diferență trebuie să fie neapărat mare și semnificativă.

Nivelul de semnificație statistică a testului

Acest termen trebuie înțeles ca fiind probabilitatea de a respinge ipoteza nulă dacă este adevărată. Aceasta se mai numește și eroare de tip I sau o decizie fals pozitivă. În cele mai multe cazuri, procesul se bazează pe o valoare p („valoare pi”). Aceasta este probabilitatea cumulativă la respectarea nivelului criteriului statistic. Acesta, la rândul său, se calculează din eșantion în momentul acceptării ipotezei nule. Ipoteza va fi respinsă dacă această valoare p este mai mică decât nivelul declarat de analist. Semnificația valorii testului depinde direct de acest indicator: cu cât este mai mică, cu atât mai mult motiv pentru a respinge ipoteza.
Nivelul de semnificație este de obicei notat cu litera b (alfa). Indicatori populari în rândul specialiștilor: 0,1%, 1%, 5% și 10%. Dacă, să zicem, se spune că șansele de coincidență sunt 1 la 1000, atunci cu siguranță vorbim de nivelul de 0,1% al semnificației statistice a unei variabile aleatoare. Diferitele niveluri B au avantajele și dezavantajele lor. Dacă scorul este mai mic, atunci este mai probabil ca ipoteza alternativă să fie semnificativă. Cu toate acestea, există riscul ca presupunerea falsă nulă să nu fie respinsă. Se poate concluziona că alegerea nivelului b optim depinde de balanța „semnificație-putere” sau, în consecință, de compromisul dintre probabilitățile de decizii fals pozitive și fals negative. Un sinonim pentru „semnificație statistică” în literatura internă este termenul „fiabilitate”.

Definiția ipotezei nule

În statisticile matematice, aceasta este o ipoteză care este testată pentru coerență cu datele empirice deja în stoc. În majoritatea cazurilor, ipoteza nulă este ipoteza că nu există o corelație între variabilele studiate sau că nu există diferențe de omogenitate în distribuțiile studiate. În cercetarea standard, un matematician încearcă să infirme ipoteza nulă, adică să demonstreze că nu este în concordanță cu datele experimentale. Mai mult, trebuie să existe o ipoteză alternativă, care este luată în locul celei zero.

Definiție cheie

Criteriul U (Mann-Whitney) în statistica matematică vă permite să evaluați diferențele dintre două eșantioane. Ele pot fi date în funcție de nivelul unei trăsături, care se măsoară cantitativ. Această metodă este ideală pentru estimarea diferențelor în eșantioane mici. Acest criteriu simplu a fost propus de Frank Wilcoxon în 1945. Și deja în 1947, metoda a fost revizuită și completată de oamenii de știință H. B. Mann și D. R. Whitney, ale căror nume este numită până astăzi. Criteriul Mann-Whitney în psihologie, matematică, statistică și multe alte științe este unul dintre elementele fundamentale ale fundamentării matematice a rezultatelor cercetării teoretice.

Descriere

Testul Mann-Whitney este o metodă relativ simplă, fără parametri. Puterea sa este semnificativă. Este semnificativ mai mare decât puterea testului Rosenbaum Q. Metoda evaluează cât de mică este aria valorilor încrucișate dintre eșantioane, și anume între seria de valori clasate din primul și al doilea set. Cu cât valoarea criteriului este mai mică, cu atât este mai probabil ca discrepanțele dintre valoarea parametrilor să fie fiabile. Pentru a aplica corect criteriul U (Mann-Whitney), nu trebuie să uităm de unele limitări. Fiecare eșantion trebuie să conțină cel puțin 3 valori caracteristice. Este posibil ca într-un caz să existe două valori, dar în al doilea caz trebuie să existe cel puțin cinci dintre ele. În eșantioanele studiate, ar trebui să existe un număr minim de indicatori de potrivire. În mod ideal, toate numerele ar trebui să fie diferite.

Utilizare

Cum se utilizează corect testul Mann-Whitney? Tabelul alcătuit prin această metodă conține anumite valori critice. Primul pas este să creați o singură serie din ambele eșantioane potrivite, care este apoi clasată. Adică, elementele sunt aliniate în funcție de gradul de creștere al atributului, iar un rang inferior este atribuit unei valori mai mici. Ca rezultat, obținem următorul număr total de ranguri:

N = N1 + N2,

unde valorile N1 și N2 sunt numărul de unități conținute în primul și, respectiv, al doilea eșantion. În plus, o singură serie de valori clasate este împărțită în două categorii. Unități, respectiv, din prima și a doua probă. Acum se calculează pe rând suma rândurilor valorilor din primul și al doilea rând. Se determină cel mai mare dintre ele (Tx), care corespunde unui eșantion cu nx unități. Pentru a utiliza în continuare metoda Wilcoxon, valoarea acesteia este calculată prin următoarea metodă. Este necesar să se afle din tabelul pentru nivelul de semnificație ales valoarea critică a acestui criteriu pentru N1 și N2 luate în mod specific.
Indicatorul rezultat poate fi mai mic sau egal cu valoarea din tabel. În acest caz, se constată o diferență semnificativă a nivelurilor trăsăturii din probele studiate. Dacă valoarea obţinută este mai mare decât valoarea tabelului, atunci ipoteza nulă este acceptată. Când se calculează testul Mann-Whitney, trebuie remarcat că dacă ipoteza nulă este adevărată, testul va avea o medie și o varianță. Rețineți că pentru volume suficient de mari de date de eșantion, metoda este considerată a fi distribuită aproape normal. Semnificația diferențelor este cu cât este mai mare, cu atât valoarea testului Mann-Whitney este mai mică.

Valorile criteriului Pearson (criteriul)

  1. Tabele de probabilități asociate cu valorile testului Mann-Whitney.

Tabele de probabilități asociate cu valorile testului Mann-Whitney. Pentru valoarea experimentală a criteriului (cea mai mică dintre cele două valori) și dimensiunile eșantionului, găsiți probabilitatea ca ambele grupuri să aparțină aceleiași populații generale. Astfel, o valoare de probabilitate scăzută, de exemplu, P

    Tabelul 3

  1. Tabelul 4

  2. Tabelul 5

    1. Tabelul 6

  1. Tabelul valorilor critice ale testului Mann-Whitney pentru nivelul de semnificație.

Dacă , atunci diferența dintre eșantioane este semnificativă pentru , adică ipoteza nulă ar trebui respinsă.

N 2

N 1

2. U - testul Mann-Whitney

Criteriul este conceput pentru a evalua diferențele dintre două eșantioane în ceea ce privește nivelul oricărei trăsături, măsurat cantitativ. Vă permite să detectați diferențele dintre eșantioanele mici atunci când n1 și n2 sunt mai mari sau egale cu 3 (sau n1 = 2, iar n2 este atunci mai mare sau egal cu 5.)

Metoda determină dacă aria de suprapunere a valorilor dintre două serii este suficient de mică. Cu cât această zonă este mai mică, cu atât este mai probabil ca diferențele să fie semnificative. Valoarea empirică (obținută efectiv) a criteriului U reflectă cât de mare este zona de coincidență dintre rânduri. Cu cât Uemp. mai mic, cu atât este mai probabil ca diferențele să fie semnificative.

Ipoteze.

Dar: Nivelul atributului din grupa 2 nu este mai mic decât nivelul atributului din grupa 1.

H1: Nivelul trăsăturii din grupul 2 este mai scăzut decât nivelul trăsăturii din grupul 1.

Limitări ale criteriului U.

1. Trebuie să existe cel puțin 3 observații în fiecare probă sau, în cazuri extreme, este permis un raport de 2 la 5 sau mai mult.

2. Nu ar trebui să existe mai mult de 60 de observații în fiecare probă.

Algoritm de calcul al criteriului U - Mann-Whitney.

1. Transferați toate datele eșantioanelor pe carduri individuale (pe care vor fi reflectate în culoare sau într-un alt mod căruia dintre eșantioane îi aparține valoarea).

2. Așezați toate cărțile într-un rând comun pe măsură ce semnul crește, indiferent de probă căreia îi aparțin.

3. Clasificați (conform algoritmului de clasare) valorile de pe cărți, atribuind un rang inferior valorii inferioare. Ar trebui să existe n1 + n2 ranguri în total (mărimea primului eșantion + dimensiunea celui de-al doilea eșantion).

4. Rearanjați cardurile pe două rânduri, în funcție de apartenența la eșantionul 1 sau eșantionul 2.

6. Determinați cea mai mare dintre cele două sume de rang.

7. Determinați valoarea lui U cu formula:

8. Determinați din tabele valorile critice ale lui U, în conformitate cu aceasta, acceptați sau respingeți ipoteza nr.

3. H - criteriul Kruskal - Wallis

Criteriul H este utilizat pentru a evalua diferențele de severitate a trăsăturii analizate simultan între trei, patru sau mai multe probe. Vă permite să identificați gradul de modificare a trăsăturii în probe, fără a indica, însă, direcția acestor modificări.

Criteriul se bazează pe principiul că, cu cât suprapunerea probelor este mai mică, cu atât este mai mare nivelul de semnificație. H emp . Trebuie subliniat faptul că poate exista un număr diferit de subiecți în eșantioane, deși în sarcinile de mai jos este dat un număr egal de subiecți din eșantioane.

Lucrul cu date începe cu faptul că toate eșantioanele sunt combinate condiționat în ordinea valorilor care apar într-un singur eșantion, iar valorile acestui eșantion combinat sunt clasificate. Apoi, rangurile obținute sunt atașate la datele eșantionului inițial, iar suma rangurilor este calculată separat pentru fiecare eșantion. Criteriul este construit pe următoarea idee – dacă diferențele dintre eșantioane sunt nesemnificative, atunci sumele rangurilor nu vor diferi semnificativ unele de altele și invers.

Valoare H emp calculat prin formula:

H emp

Unde N este numărul total de membri din eșantionul generalizat;

n i este numărul de membri din fiecare eșantion individual;

sunt pătratele sumelor rangurilor pentru fiecare eșantion.

Când determinați valorile critice ale criteriului pentru patru sau mai multe probe, utilizați tabelul pentru criteriu hee-pătrat, având calculat în prealabil numărul de grade de libertate v pentru c = 4. Apoi v = c - 1 = 4 – 1=3..

Subliniem că dacă folosim criterii care ne permit să comparăm doar două serii de valori, atunci rezultatul obținut mai sus ar necesita șase comparații - primul eșantion cu al doilea, al treilea etc.

Pentru a folosi criteriul H trebuie respectate urmatoarele conditii:

1. Măsurarea trebuie făcută pe o scară de ordine, intervale sau rapoarte.

2. Probele trebuie să fie independente.

3. Este permis un număr diferit de subiecți din eșantioanele comparate.

4. La compararea a trei mostre, este permis ca una dintre ele să conțină n = 3, iar în celelalte două n = 2. Totuși, în acest caz, diferențele pot fi înregistrate doar la nivelul de semnificație de 5%.

5. Tabelul 9 din apendice este furnizat doar pentru trei eșantioane și ( n 1n 2, n H), £ 5, adică numărul maxim de subiecți din toate cele trei eșantioane poate fi mai mic și egal cu 5.

6. Cu un număr mai mare de mostre și un număr diferit de subiecți în fiecare eșantion, ar trebui să utilizați tabelul pentru criteriu hee-pătrat. În acest caz, numărul de grade de libertate este determinat de formula: v = cu - 1, unde cu - numărul de mostre potrivite.

Testul U Mann-Whitney este:

Testul U Mann-Whitney

Testul U Mann-Whitney

Testul U Mann-Whitney(Engleză) Testul U Mann-Whitney) este un test statistic folosit pentru a evalua diferențele dintre două eșantioane în ceea ce privește nivelul unei trăsături, măsurat cantitativ. Vă permite să detectați diferențele de valoare a unui parametru între eșantioane mici.

Alte denumiri: testul Mann-Whitney-Wilcoxon Mann-Whitney-Wilcoxon, MWW), testul sumei rangului Wilcoxon (ing. Testul Wilcoxon-sumă de rang) sau testul Wilcoxon-Mann-Whitney (ing. Testul Wilcoxon - Mann - Whitney).

Poveste

Această metodă de detectare a diferențelor dintre probe a fost propusă în 1945 de Frank Wilcoxon ( F. Wilcoxon). În 1947 a fost revizuit și extins substanțial de H. B. Mann ( H. B. Mann) și D. R. Whitney ( D. R. Whitney), sub ale cărui nume este de obicei numit astăzi.

Descrierea criteriului

Un simplu test neparametric. Puterea testului este mai mare decât cea a testului Rosenbaum Q.

Această metodă determină dacă aria de suprapunere a valorilor dintre două serii (seria clasată de valori ale parametrilor în prima probă și aceeași în a doua probă) este suficient de mică. Cu cât valoarea criteriului este mai mică, cu atât este mai probabil ca diferențele dintre valorile parametrilor din eșantioane să fie semnificative.

Limitări de aplicabilitate a criteriilor

  1. Fiecare dintre eșantioane trebuie să conțină cel puțin 3 valori caracteristice. Este permis ca într-o probă să fie două valori, dar în a doua să fie cel puțin cinci.
  2. Nu ar trebui să existe valori de potrivire în datele eșantionului (toate numerele sunt diferite) sau ar trebui să existe foarte puține astfel de potriviri.

Utilizarea unui criteriu

Pentru a aplica testul U Mann-Whitney, trebuie să efectuați următoarele operații.

  • Calculul automat al testului U Mann-Whitney

Tabelul valorilor critice

  • Tabelul valorilor critice ale testului U Mann-Whitney
  • Valori critice pentru testul U Mann - Whitney.

Vezi si

  • Testul Kruskal-Wallis este o generalizare multivariată a testului U Mann-Whitney.

Literatură

  • Mann H.B., Whitney D.R. La un test pentru a stabili dacă una dintre cele două variabile aleatoare este stocastic mai mare decât cealaltă. // Analele statisticii matematice. - 1947. - Nr. 18. - P. 50-60.
  • Wilcoxon F. Comparații individuale prin metode de clasare. // Buletinul de biometrie 1. - 1945. - P. 80-83.
  • Gubler E. V., Genkin A. A. Aplicarea criteriilor statistice neparametrice în cercetarea biomedicală. - L., 1973.
  • Sidorenko E.V. Metode de prelucrare matematică în psihologie. - Sankt Petersburg, 2002.

Fundația Wikimedia. 2010.

  • U-954
  • Femeile cu punctul U

Vedeți ce este „testul U Mann-Whitney” în alte dicționare:

    Mann U-test- testul U Mann Whitney (ing. testul Mann Whitney U) este un test statistic folosit pentru a evalua diferențele dintre două eșantioane independente în ceea ce privește nivelul oricărei trăsături, măsurat cantitativ. Vă permite să identificați ... ... Wikipedia

    Testul U Mann-Whitney- (Testul ing. Mann Whitney U) test statistic neparametric utilizat pentru a evalua diferențele dintre două eșantioane în ceea ce privește nivelul oricărei trăsături, măsurat cantitativ. Vă permite să identificați diferențele în valoarea unui parametru între mici ... Wikipedia

    Testul Mann-Whitney

    Testul Mann-Whitney-Wilcoxon- Testul Mann Whitney U este un test statistic neparametric folosit pentru a evalua diferențele dintre două eșantioane în ceea ce privește nivelul oricărei trăsături, măsurat cantitativ. Vă permite să identificați diferențele de sens... Wikipedia

    Testul Mann-Whitney-Wilcoxon- Testul Mann Whitney U este un test statistic neparametric folosit pentru a evalua diferențele dintre două eșantioane în ceea ce privește nivelul oricărei trăsături, măsurat cantitativ. Vă permite să identificați diferențele de sens... Wikipedia

    Testul Mann Whitney- - Subiecte de telecomunicații, concepte de bază EN Mann Whitney U test ... Ghid tehnic al traducătorului

    Testul Wilcoxon-Mann-Whitney- Testul Mann Whitney U este un test statistic neparametric folosit pentru a evalua diferențele dintre două eșantioane în ceea ce privește nivelul oricărei trăsături, măsurat cantitativ. Vă permite să identificați diferențele de sens... Wikipedia

    Testul Wilcoxon-Mann-Whitney- Testul Mann Whitney U este un test statistic neparametric folosit pentru a evalua diferențele dintre două eșantioane în ceea ce privește nivelul oricărei trăsături, măsurat cantitativ. Vă permite să identificați diferențele de sens... Wikipedia

    Testul sumei rangului Wilcoxon- Testul Mann Whitney U este un test statistic neparametric folosit pentru a evalua diferențele dintre două eșantioane în ceea ce privește nivelul oricărei trăsături, măsurat cantitativ. Vă permite să identificați diferențele de sens... Wikipedia

    Testul sumei rangului Wilcoxon- Testul Mann Whitney U este un test statistic neparametric folosit pentru a evalua diferențele dintre două eșantioane în ceea ce privește nivelul oricărei trăsături, măsurat cantitativ. Vă permite să identificați diferențele de sens... Wikipedia

Cărți

  • Statistici și sigilii, Vladimir Savelyev. Din această carte veți afla ce sunt varianța și abaterea standard, cum să găsiți testul t Student și testul U Mann-Whitney, pentru ce sunt utilizate analizele de regresie și factori, ... Mai mult Cumpărați pentru 280 de ruble e-book

Criteriul U este unul de rang, deci este invariant în raport cu orice transformare monotonă a scalei de măsurare.

Alte denumiri: testul Mann-Whitney-Wilcoxon (Mann-Whitney-Wilcoxon, MWW), testul Wilcoxon rank-sum sau testul Wilcoxon-Mann-Whitney (WMW).

Exemple de sarcini

Exemplul 1 Prima probă este reprezentată de pacienții care au fost tratați cu medicamentul A. A doua probă sunt pacienții care au fost tratați cu medicamentul B. Valorile din probe sunt câteva caracteristici ale eficacității tratamentului (nivelul metabolitului din sânge, temperatura trei zile de la începerea tratamentului, durata recuperării, numărul de paturi de spital).zile etc.) Este necesar să se afle dacă există o diferență semnificativă în eficacitatea medicamentelor A și B, sau diferențele sunt pur aleatoriu și sunt explicate prin variația „naturală” a caracteristicii selectate.

Exemplul 2 Primul eșantion sunt câmpurile tratate cu metoda de cultură A. Al doilea eșantion sunt câmpurile tratate cu metoda de cultură B. Valorile din probe sunt randamentul. Este necesar să se afle dacă una dintre metode este mai eficientă decât cealaltă sau dacă diferențele de randament se datorează unor factori aleatori.

Exemplul 3 Primul eșantion sunt zilele în care o promoție de tip A (etichete roșii de preț cu reducere) a fost organizată în supermarket. Al doilea eșantion sunt zilele promoției de tip B (fiecare al cincilea pachet este gratuit). Valorile din mostre sunt un indicator al eficacității promoției (volumul vânzărilor sau veniturile în ruble). Este necesar să se afle ce tip de promovare este mai eficient.

Descrierea criteriului

Sunt date două mostre.

Estimări suplimentare:

Uneori se consideră eronat că testul U testează ipoteza nulă a medianelor egale în două eșantioane. Există distribuții pentru care ipoteza este adevărată, dar medianele lor sunt diferite.

Criteriul U poate fi folosit pentru a testa ipoteza deplasării ca alternativă, unde este o constantă diferită de zero. Cu această alternativă, testul U este consistent. Este recomandabil să îl utilizați dacă se efectuează două serii de măsurători a două valori ale unei anumite mărimi fizice cu același instrument. În acest caz, funcția de distribuție descrie erorile de măsurare ale unei valori și alteia. Cu toate acestea, în multe aplicații (în special în econometrie) nu există niciun motiv special pentru a presupune că distribuția celui de-al doilea eșantion se schimbă doar, dar nu se modifică în alt mod.

Testul U este un analog neparametric al testului t al lui Student. Dacă eșantioanele sunt normale, atunci este de preferat să se aplice testul t Student mai puternic pentru a testa ipoteza deplasării.

Poveste

Această metodă de detectare a diferențelor dintre probe a fost propusă în 1945 de Frank Wilcoxon. A fost revizuită și extinsă în mod substanțial în 1947 de către Mann și Whitney, sub ale căror nume se face referire în mod obișnuit astăzi.

Literatură

  1. Mann H.B., Whitney D.R. La un test pentru a stabili dacă una dintre cele două variabile aleatoare este stocastic mai mare decât cealaltă. // Analele statisticii matematice. - 1947, nr. 18. - Pp. 50-60.
  2. Wilcoxon F. Comparații individuale prin metode de clasare. // Buletinul de Biometrie 1. 1945. - Pg. 80–83.
  3. Orlov A.I. Econometrie. - M.: Examen, 2003. - 576 p. (§4.5 Ce ipoteze pot fi testate folosind testul Wilcoxon cu două eșantioane?)
  4. Kobzar A.I. Statistică matematică aplicată. - M.: Fizmatlit, 2006. - 816 p.

Testul Mann-Whitney reprezintă o alternativă neparametrică la testul t pentru probe independente. Avantajul său este că abandonăm ipoteza distribuției normale și a variațiilor egale. Este esențial ca datele să fie măsurate cel puțin pe o scară ordinală.

STATISTICA presupune că datele sunt aranjate în același mod ca în și testele t pentru probe independente. Fișierul trebuie să conțină o variabilă cod (independentă) care are cel puțin două coduri diferite pentru a identifica în mod unic dacă fiecare observație aparține unui anumit grup.

Ipoteze și interpretare. Testul Mann-Whitney presupune că variabilele în cauză sunt măsurate cel puțin pe o scară ordinală (clasată). Interpretarea testului este în esență similară cu interpretarea rezultatelor testului t pentru eșantioane independente, cu excepția faptului că testul U este calculat ca suma indicatorilor comparării în perechi a elementelor primului eșantion cu elementele testului. a doua probă. Testul U - cea mai puternică alternativă (sensibilă) neparametrică test t pentru probe independente; de fapt, în unele cazuri este chiar mai puternic decât testul t.

Dacă dimensiunea eșantionului este mai mare de 20, atunci distribuția eșantionului pentru statistica U converge rapid către o distribuție normală (vezi Siegel, 1956). Prin urmare, împreună cu statistica U, vor fi afișate valoarea z (pentru o distribuție normală) și valoarea p corespunzătoare.

Probabilități exacte pentru eșantioane mici. Pentru eșantioane mici, STATISTICA va calcula probabilitatea exactă asociată cu statistica U corespunzătoare. Această probabilitate se bazează pe numărarea tuturor valorilor posibile ale lui U dat fiind numărul de observații din două eșantioane (vezi Dinneen și Blakesley, 1973). Programul va raporta (în ultima coloană a tabelului cu rezultate) valoarea 2 * p, unde p este egal cu 1 minus probabilitatea cumulativă (o singură coadă) a statisticii U corespunzătoare. Rețineți că acest lucru nu duce de obicei la o subestimare mare a semnificației statistice a efectelor relevante (vezi Siegel, 1956).

Statistica testului arată așa.

Unde W- statistici Wilcoxon conceput pentru a testa aceeași ipoteză

in caz contrar

Deci statisticile U numără numărul total de cazuri în care elementele celui de-al doilea eșantion depășesc numărul elementelor din primul eșantion. Dacă ipoteza este corectă, atunci

Testul Mann-Whitney presupune că variabilele în cauză sunt măsurate cel puțin pe o scară ordinală (clasată). Interpretarea testului este în esență aceeași cu interpretarea rezultatelor t-criterii pentru eșantioane independente, cu excepția faptului că criteriul U este calculat ca sumă a indicatorilor de comparare perechi a elementelor primului eșantion cu elementele celui de-al doilea eșantion. Testul U - cea mai puternică alternativă (sensibilă) neparametrică t-criterii pentru probe independente; de fapt, în unele cazuri are chiar mai multă putere decât t-criteriu.

Dacă dimensiunea eșantionului este mai mare de 20, atunci distribuția eșantionului pentru statistica U converge rapid către o distribuție normală. Prin urmare, împreună cu statistica U, valoarea z (pentru o distribuție normală) și cea corespunzătoare p-sens.

Instrucțiuni detaliate despre cum să utilizați criteriile pot fi găsite mai târziu în secțiunea exemple de aplicație.

Exemplu

Să testăm ipoteza că eșantioanele independente comparate aparțin aceleiași populații generale folosind testul U Mann-Whitney neparametric. Să comparăm rezultatele obținute în exemplul Statistici de bază și testul t al lui Student pentru coloanele a 2-a și a treia din tabelul testului t al lui Student cu rezultatele comparației neparametrice.

Pentru a calcula testul Wilcoxon U, aranjam variantele eșantioanelor comparate în ordine crescătoare într-o serie generalizată și atribuim ranguri de la 1 la n1 + n2 variantelor seriei generalizate. Prima linie reprezintă variantele primului eșantion, al doilea - al doilea eșantion, al treilea - rangurile corespunzătoare din seria generalizată:





















Trebuie remarcat faptul că, dacă există opțiuni identice, li se atribuie un rang mediu, dar valoarea ultimului rang trebuie să fie egală cu n1 + n2 (în cazul nostru, 20). Această regulă este folosită pentru a verifica dacă clasamentul este corect.

Separat pentru fiecare probă, calculăm suma rangurilor variantelor lor R1 și R2. În cazul nostru:

R1 = 1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69

R2 = 5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19,5 + 19,5 = 141

Pentru a verifica corectitudinea calculelor, puteți folosi o altă regulă: R1 + R2 = 0,5 * (n1 + n2) * (n1 + n2 + 1). În cazul nostru, R1 + R2 = 210.

Statistica U1 = 69 - 10*11/2 = 14; U2 \u003d 141 - 10 * 11/2 \u003d 86.

Pentru a testa un test cu o singură coadă, alegem statistica minimă U1 = 14 și o comparăm cu valoarea critică pentru n1 = n2 = 10 și nivelul de semnificație de 1% egal cu 19.

Întrucât valoarea calculată a criteriului este mai mică decât cea tabelară, ipoteza nulă este respinsă la nivelul de semnificație ales, iar diferențele dintre eșantioane sunt considerate semnificative statistic. Astfel, concluzia despre existența diferențelor, făcută cu ajutorul testului parametric Student, se confirmă prin această metodă neparametrică.