Manna Whitney. Mann-Whitney U-kritérium v ​​diplomovej práci, kurze a magisterskej práci v psychológii

Kritérium U Mann - Whitney

Priradenie kritéria. Kritérium je určené na posúdenie rozdielov medzi dva vzorky podľa úrovni akúkoľvek vlastnosť, ktorú možno kvantifikovať. Umožňuje rozlišovať medzi malý vzorky kedy P 1, n 2 > 3 alebo p L \u003d 2, p 2\u003e 5 a je silnejší ako kritérium Q Rosenbaum.

Táto metóda určuje, či je oblasť prekrývajúcich sa hodnôt medzi dvoma sériami dostatočne malá. Pamätáme si, že 1. riadok (vzorka, skupina) nazývame radom hodnôt, v ktorom sú hodnoty podľa predbežného odhadu vyššie a 2. riadkom je ten, kde sú údajne nižšie.

Čím je plocha prechodu menšia, tým je pravdepodobnejšie rozdiely spoľahlivý. Tieto rozdiely sa niekedy označujú ako rozdiely v umiestnenie dve vzorky. Empirická hodnota kritéria odráža, aká veľká je zóna zhody medzi riadkami. Takže menej t/ 3Mn, najmä je pravdepodobné, že rozdiely spoľahlivý.

Hypotézy.

Úroveň neverbálnej inteligencie v skupine študentov fyziky je vyššia ako v skupine študentov psychológie.

Grafické znázornenie kritériaU. Pa obr. 7.25 uvádza tri z mnohých možných možností pre pomer dvoch radov hodnôt.

Pri možnosti (a) je druhý riadok nižší ako prvý a riadky sa takmer nepretínajú. Oblasť prekrytia ( S j) príliš malé na to, aby zakryli rozdiely medzi riadkami. Existuje šanca, že rozdiely medzi nimi sú značné. Presne to vieme určiť pomocou kritéria U.

Vo variante (b) je druhý riadok tiež nižší ako prvý, ale oblasť prekrývajúcich sa hodnôt pre dva riadky je pomerne rozsiahla (5 2). Možno ešte nedosiahne kritickú hodnotu, keď rozdiely budú musieť byť uznané ako nevýznamné. Či je to tak, však možno určiť len presným výpočtom kritéria U.

Pri možnosti (c) je druhý rad nižšie ako prvý, ale prekrytie je také rozsiahle (5 3), že rozdiely medzi riadkami sú zakryté.

Ryža. 7.25.

v dvoch vzorkách

Poznámka. Prekrytie (5 t, S2, *$z) označuje oblasti možného prekrytia. Obmedzenia kritériíU.

  • 1. Každá vzorka musí obsahovať aspoň tri pozorovania: n v p 2 > 3; je povolené, aby v jednej vzorke boli dve pozorovania, ale potom ich v druhej musí byť aspoň 5.
  • 2. Každá vzorka by nemala obsahovať viac ako 60 pozorovaní; p l, p 2 w, n 2 > 20 klasifikácia sa stáva dosť pracnou.

Vráťme sa k výsledkom prieskumu medzi študentmi fyzikálnych a psychologických fakúlt Leningradskej univerzity metódou D. Vekslera na meranie verbálnej a neverbálnej inteligencie. Použitie kritéria Q Rosenbaum, s vysokou mierou významnosti bolo zistené, že úroveň verbálnej inteligencie je vo vzorke študentov PF vyššia. Skúsme teraz zistiť, či sa tento výsledok reprodukuje pri porovnávaní vzoriek podľa úrovne neverbálnej inteligencie. Údaje sú uvedené v tabuľke.

2 je pod úrovňou znaku vo vzorke 1 na významne významnej úrovni. Čím je hodnota menšia ty tým vyššia je významnosť rozdielov.

Teraz urobme všetku túto prácu na materiáli nášho príkladu. Ako výsledok práce na 1-6 krokoch algoritmu vytvoríme tabuľku (tabuľka 7.4).

Tabuľka 7.4

Výpočet poradových súm pre vzorky študentov fyzikálnych a psychologických fakúlt

Študenti fyziky (P = 14)

Študenti psychológie (n= 12)

Skóre neverbálnej inteligencie

Priemer 107,2

Celkový počet hodností: 165 + 186 = 351. Vypočítaná suma podľa vzorca (5.1) je nasledovná:

Dodržiava sa rovnosť skutočných a odhadovaných súm. Vidíme, že z hľadiska úrovne neverbálnej inteligencie je vzorka študentov psychológie „vyššia“. Je to táto vzorka, ktorá predstavuje veľký súčet poradia: 186. Teraz sme pripravení formulovať štatistické hypotézy:

Ja 0: skupina študentov psychológie neprevyšuje skupinu študentov fyziky z hľadiska neverbálnej inteligencie;

Ja: skupina študentov psychológie prevyšuje skupinu študentov fyziky v neverbálnej inteligencii.

V súlade s ďalším krokom algoritmu určíme empirickú hodnotu U :

Pretože v našom prípade p l * p 2, vypočítajte empirickú hodnotu U a pre druhý radový súčet (165) dosadením do vzorca (7.4) zodpovedajúci p x.:

Podľa prílohy 8 určujeme kritické hodnoty pre p l = 14, n2 = 12:

Toto kritérium si pamätáme U je jednou z dvoch výnimiek zo všeobecného pravidla pre rozhodovanie o tom, či sú rozdiely významné, konkrétne môžeme uviesť významné rozdiely, ak (/ emp U Kp 0 05 (pri teplote = 60, a sp > U Kf) asi,05).

teda H 0 sa berie nasledovne: skupina študentov psychológie svojou úrovňou neverbálnej inteligencie neprevyšuje skupinu študentov fyziky.

Venujme pozornosť skutočnosti, že pre tento prípad nie je možné použiť Rosenbaumovo Q-kritérium, pretože rozsah variability v skupine fyzikov je širší ako v skupine psychológov: najvyššie aj najnižšie hodnoty non -verbálna inteligencia patrí do skupiny fyzikov (pozri tabuľku 7.4) .

Túto štatistickú metódu navrhol Frank Wilcoxon (pozri fotografiu) v roku 1945. V roku 1947 však metódu zdokonalili a rozšírili H. B. Mann a D. R. Whitney, takže U-test sa častejšie označuje ich názvami.

Kritérium je navrhnuté tak, aby posúdilo rozdiely medzi dvoma vzorkami, pokiaľ ide o úroveň ktoréhokoľvek kvantitatívne meraného znaku. Umožňuje vám identifikovať rozdiely medzi malými vzorkami, keď n 1 , n 2 ≥ 3 alebo n 1 = 2, n 2 ≥ 5, a je výkonnejší ako Rosenbaumov test.

Popis Mann-Whitney U testu

Existuje niekoľko spôsobov použitia kritéria a niekoľko možností pre tabuľky kritických hodnôt zodpovedajúcich týmto metódam (Gubler E. V., 1978; Runion R., 1982; Zakharov V. P., 1985; McCall R., 1970; Krauth J., 1988 ).

Táto metóda určuje, či je oblasť prekrývajúcich sa hodnôt medzi dvoma sériami dostatočne malá. Pamätáme si, že 1. riadok (vzorka, skupina) nazývame radom hodnôt, v ktorom sú hodnoty podľa predbežného odhadu vyššie a 2. riadkom je ten, kde sú údajne nižšie.

Čím menšia je plocha prechodu, tým je pravdepodobnejšie, že rozdiely budú výrazné. Niekedy sa tieto rozdiely nazývajú rozdiely v umiestnení dvoch vzoriek (Welkowitz J. et al., 1982).

Empirická hodnota kritéria U odráža, aká veľká je zóna zhody medzi riadkami. Preto čím je U emp menší, tým je pravdepodobnejšie, že rozdiely sú významné.

Hypotézy U - Mann-Whitneyho test

H0: Úroveň atribútu v skupine 2 nie je nižšia ako úroveň atribútu v skupine 1.
H1: Úroveň vlastnosti v skupine 2 je nižšia ako úroveň vlastnosti v skupine 1.

Obmedzenia Mann-Whitney U testu

1. Každá vzorka musí obsahovať aspoň 3 pozorovania: n 1 ,n 2 ≥ З; je povolené, aby v jednej vzorke boli 2 pozorovania, ale potom ich v druhej musí byť aspoň 5.

2. Každá vzorka by nemala obsahovať viac ako 60 pozorovaní; n1, n2 ≤ 60.

Automatický výpočet Mann-Whitneyho U-testu

Krok 1

Zadajte údaje z prvej vzorky do prvého stĺpca („Vzorka 1“) a údaje z druhej vzorky do druhého stĺpca („Vzorka 2“). Údaje sa zadávajú jedno číslo na riadok; žiadne medzery, medzery atď. Zadávajú sa iba čísla. Zlomkové čísla sa zadávajú s "." (bodka). Po vyplnení stĺpcov kliknite na tlačidlo „Krok 2“, aby sa automaticky vypočítal Mann-Whitney U-test.

Mann-Whitney U-test(Angličtina) Mann-Whitney U-test) je štatistický test, ktorý sa používa na vyhodnotenie rozdielov medzi dvoma nezávislými vzorkami z hľadiska úrovne ktoréhokoľvek znaku, meraného kvantitatívne. Umožňuje zistiť rozdiely v hodnote parametra medzi malými vzorkami.

Wilcoxonov test poradia a súčtu ). Menej časté: kritérium počtu prevrátení.

Príbeh

Túto metódu na zisťovanie rozdielov medzi vzorkami navrhol v roku 1945 Frank Wilcoxon ( F. WilcoxonH. B. Mann) a D. R. Whitney ( D. R. Whitney

Popis kritéria

  1. Vo vzorových údajoch by nemali byť žiadne zhodné hodnoty (všetky čísla sú odlišné) alebo by malo byť takýchto zhôd veľmi málo (do 10).

Použitie kritéria

  1. Zostavte jednu zoradenú sériu z oboch porovnávaných vzoriek, usporiadajte ich prvky podľa stupňa rastu prvku a priraďte nižšie poradie k nižšej hodnote. Celkový počet hodnotení sa bude rovnať: N = n 1 + n 2 , (\displaystyle N=n_(1)+n_(2),) kde n 1 (\displaystyle n_(1)) je počet prvkov v prvej vzorke a n 2 (\displaystyle n_(2)) - počet prvkov v druhej vzorke.
  2. Rozdeľte jednu zoradenú sériu na dve časti pozostávajúce z jednotiek prvej a druhej vzorky. Vypočítajte oddelene súčet poradí, ktoré pripadli na podiel prvkov prvej vzorky, a oddelene - na podiel prvkov druhej vzorky. Definujte veľký dvoch hodnotových súčtov (T x (\displaystyle T_(x))) zodpovedajúcich vzorke s n x (\displaystyle n_(x)) prvkov.
  3. Určte hodnotu Mann-Whitneyho U-testu pomocou vzorca: U = n 1 ⋅ n 2 + n x ⋅ (n x + 1) 2 − T x . (\displaystyle U=n_(1)\cdot n_(2)+(\frac (n_(x)\cdot (n_(x)+1))(2))-T_(x).)
  4. Pomocou tabuľky pre zvolenú hladinu štatistickej významnosti určte kritickú hodnotu kritéria pre údaje n 1 (\displaystyle n_(1)) a n 2 (\displaystyle n_(2)) . Ak je prijatá hodnota U (\displaystyle U) menšie tabuľkový alebo jej rovný, potom sa rozpozná existencia významného rozdielu medzi úrovňou znaku v uvažovaných vzorkách (akceptuje sa alternatívna hypotéza). Ak je výsledná hodnota U (\displaystyle U) väčšia ako tabuľková hodnota, je akceptovaná nulová hypotéza. Významnosť rozdielov je tým väčšia, čím menšia je hodnota U (\displaystyle U) .
  5. Ak je nulová hypotéza pravdivá, kritérium má očakávanie M (U) = n 1 ⋅ n 2 2 (\displaystyle M(U)=(\frac (n_(1)\cdot n_(2))(2)) ) a rozptyl D (U) = n 1 ⋅ n 2 ⋅ (n 1 + n 2 + 1) 12 (\displaystyle D(U)=(\frac (n_(1)\cdot n_(2)\cdot (n_) (1)+ n_(2)+1))(12))) a s dostatočne veľkým množstvom vzorových údajov (n 1 > 19, n 2 > 19) (\displaystyle (n_(1)>19,\; n_(2)>19 )) je distribuovaný takmer normálne.

Tabuľka kritických hodnôt

  • Výpočet kritických hodnôt Mann-Whitney U-testu pre vzorky väčšie ako 20 (N>20) (downlink od 10-02-2017)

Mann-Whitney test: príklad, tabuľka

Kritérium v ​​matematickej štatistike je prísne pravidlo, podľa ktorého sa hypotéza s určitou úrovňou významnosti prijíma alebo zamieta. Na jej zostavenie musíte nájsť určitú funkciu. Malo by to závisieť od konečných výsledkov experimentu, teda od empiricky zistených hodnôt. Práve táto funkcia bude nástrojom na posúdenie nesúladu medzi vzorkami.

Štatisticky významná hodnota. Všeobecné informácie

Štatistická významnosť je veličina, ktorá sa pravdepodobne nevyskytne náhodou. Jeho extrémnejšie ukazovatele sú tiež nevýznamné. Rozdiel sa považuje za štatisticky významný, ak existujú údaje, ktoré sa pravdepodobne nevyskytnú, za predpokladu, že tieto rozdiely neexistujú. To však vôbec neznamená, že tento rozdiel musí byť nevyhnutne veľký a významný.

Hladina štatistickej významnosti testu

Tento pojem by sa mal chápať ako pravdepodobnosť zamietnutia nulovej hypotézy, ak je pravdivá. Toto sa nazýva aj chyba typu I alebo nesprávne pozitívne rozhodnutie. Vo väčšine prípadov sa proces spolieha na hodnotu p ("hodnota pí"). Ide o kumulatívnu pravdepodobnosť pri dodržaní úrovne štatistického kritéria. Tá sa zase vypočíta zo vzorky v čase prijatia nulovej hypotézy. Predpoklad bude zamietnutý, ak je táto p-hodnota nižšia ako úroveň deklarovaná analytikom. Významnosť testovacej hodnoty priamo závisí od tohto ukazovateľa: čím je menší, tým väčší je dôvod na zamietnutie hypotézy, resp.
Hladina významnosti sa zvyčajne označuje písmenom b (alfa). Populárne ukazovatele medzi odborníkmi: 0,1 %, 1 %, 5 % a 10 %. Ak sa povedzme povie, že šanca na náhodu je 1 ku 1000, tak sa určite bavíme o hladine 0,1 % štatistickej významnosti náhodnej premennej. Rôzne úrovne b majú svoje klady a zápory. Ak je skóre nižšie, potom je pravdepodobnejšie, že alternatívna hypotéza bude významnejšia. Existuje však riziko, že falošný nulový odhad nebude zamietnutý. Dá sa dospieť k záveru, že výber optimálnej úrovne b závisí od rovnováhy „významnosť-sila“ alebo podľa toho od kompromisu pravdepodobnosti falošne pozitívnych a falošne negatívnych rozhodnutí. Synonymom pre „štatistickú významnosť“ je v domácej literatúre pojem „spoľahlivosť“.

Definícia nulovej hypotézy

V matematickej štatistike ide o predpoklad, ktorý sa testuje na konzistentnosť s empirickými údajmi, ktoré sú už na sklade. Vo väčšine prípadov je nulovou hypotézou hypotéza, že medzi skúmanými premennými neexistuje žiadna korelácia alebo že neexistujú rozdiely v homogenite v študovaných distribúciách. V štandardnom výskume sa matematik snaží vyvrátiť nulovú hypotézu, teda dokázať, že nie je v súlade s experimentálnymi údajmi. Okrem toho musí existovať alternatívny predpoklad, ktorý sa použije namiesto nulového.

Kľúčová definícia

Kritérium U (Mann-Whitney) v matematickej štatistike umožňuje vyhodnotiť rozdiely medzi dvoma vzorkami. Môžu byť dané podľa úrovne nejakého znaku, ktorý sa meria kvantitatívne. Táto metóda je ideálna na odhadovanie rozdielov v malých vzorkách. Toto jednoduché kritérium navrhol Frank Wilcoxon v roku 1945. A už v roku 1947 metódu revidovali a doplnili vedci H. B. Mann a D. R. Whitney, ktorých mená sa nazývajú dodnes. Mann-Whitneyho kritérium v ​​psychológii, matematike, štatistike a mnohých ďalších vedách je jedným zo základných prvkov matematického zdôvodnenia výsledkov teoretického výskumu.

Popis

Mann-Whitney test je pomerne jednoduchá metóda bez parametrov. Jeho sila je významná. Je výrazne vyššia ako sila Rosenbaumovho Q-testu. Metóda vyhodnocuje, aká malá je oblasť krížových hodnôt medzi vzorkami, konkrétne medzi zoradenými sériami hodnôt prvej a druhej sady. Čím menšia je hodnota kritéria, tým je pravdepodobnejšie, že nezrovnalosti v hodnote parametra sú spoľahlivé. Pre správne uplatnenie U (Mann-Whitneyho) kritéria netreba zabúdať na niektoré obmedzenia. Každá vzorka musí obsahovať aspoň 3 hodnoty vlastností. Je možné, že v jednom prípade sú dve hodnoty, ale v druhom prípade ich musí byť aspoň päť. V študovaných vzorkách by mal byť minimálny počet zhodných ukazovateľov. Všetky čísla by sa mali v ideálnom prípade líšiť.

Použitie

Ako správne používať Mann-Whitney test? Tabuľka zostavená touto metódou obsahuje určité kritické hodnoty. Prvým krokom je vytvorenie jednej série z oboch spárovaných vzoriek, ktorá sa potom zoradí. To znamená, že prvky sú zoradené podľa stupňa rastu atribútu a nižšia hodnota je priradená nižšej hodnote. Výsledkom je nasledujúci celkový počet hodnotení:

N = N1 + N2,

kde hodnoty N1 a N2 sú počet jednotiek obsiahnutých v prvej a druhej vzorke. Ďalej je jedna zoradená séria hodnôt rozdelená do dvoch kategórií. Jednotky z prvej a druhej vzorky. Teraz sa postupne vypočíta súčet hodnôt v prvom a druhom riadku. Určí sa najväčší z nich (Tx), čo zodpovedá vzorke s nx jednotkami. Na ďalšie použitie Wilcoxonovej metódy sa jej hodnota vypočíta nasledujúcou metódou. Pre zvolenú hladinu významnosti je potrebné z tabuľky zistiť kritickú hodnotu tohto kritéria pre konkrétne brané N1 a N2.
Výsledný ukazovateľ môže byť menší alebo rovný hodnote z tabuľky. V tomto prípade sa uvádza významný rozdiel v úrovniach znaku v skúmaných vzorkách. Ak je získaná hodnota väčšia ako tabuľková hodnota, potom sa akceptuje nulová hypotéza. Pri výpočte Mann-Whitneyho testu si treba uvedomiť, že ak je pravdivá nulová hypotéza, test bude mať priemer aj rozptyl. Všimnite si, že pre dostatočne veľké objemy vzorových údajov sa metóda považuje za takmer normálne distribuovanú. Významnosť rozdielov je tým vyššia, čím nižšia je hodnota Mann-Whitney testu.

Hodnoty Pearsonovho kritéria (kritérium)

  1. Tabuľky pravdepodobností spojených s hodnotami testu Mann-Whitney.

Tabuľky pravdepodobností spojených s hodnotami testu Mann-Whitney. Pre experimentálnu hodnotu kritéria (menšia z dvoch hodnôt) a veľkosti vzorky nájdite pravdepodobnosť, že obe skupiny patria do rovnakej všeobecnej populácie. Teda nízka hodnota pravdepodobnosti, napríklad P

    Tabuľka 3

  1. Tabuľka 4

  2. Tabuľka 5

    1. Tabuľka 6

  1. Tabuľka kritických hodnôt Mann-Whitneyho testu pre hladinu významnosti.

Ak , potom je rozdiel medzi vzorkami významný pre , to znamená, že nulová hypotéza by mala byť zamietnutá.

N 2

N 1

2. U - Mann-Whitney test

Kritérium je navrhnuté tak, aby posúdilo rozdiely medzi dvoma vzorkami, pokiaľ ide o úroveň ktoréhokoľvek kvantitatívne meraného znaku. Umožňuje vám zistiť rozdiely medzi malými vzorkami, keď n1 a n2 sú väčšie alebo rovné 3 (alebo n1 = 2 a n2 je potom väčšie alebo rovné 5.)

Metóda určuje, či je oblasť prekrývajúcich sa hodnôt medzi dvoma sériami dostatočne malá. Čím je táto oblasť menšia, tým je pravdepodobnejšie, že rozdiely sú výrazné. Empirická (skutočne získaná) hodnota kritéria U odráža, aká veľká je zóna zhody medzi riadkami. Čím nižšie Uemp., tým je pravdepodobnejšie, že rozdiely sú významné.

Hypotézy.

Ale: Úroveň atribútu v skupine 2 nie je nižšia ako úroveň atribútu v skupine 1.

H1: Úroveň vlastnosti v skupine 2 je nižšia ako úroveň vlastnosti v skupine 1.

Obmedzenia kritéria U.

1. V každej vzorke musia byť aspoň 3 pozorovania alebo v extrémnych prípadoch je povolený pomer 2 až 5 alebo viac.

2. V každej vzorke by nemalo byť viac ako 60 pozorovaní.

Algoritmus pre výpočet kritéria U - Mann-Whitney.

1. Preneste všetky vzorové údaje na jednotlivé kartičky (na ktorých sa farebne alebo iným spôsobom prejavia, ktorej zo vzoriek hodnota patrí).

2. S pribúdajúcim znamienkom vyložte všetky karty do spoločného radu, bez ohľadu na to, do ktorej vzorky patria.

3. Zoraďte (podľa hodnotiaceho algoritmu) hodnoty na kartách, pričom nižšej hodnote priraďte nižšiu hodnosť. Celkovo by malo byť n1 + n2 poradí (veľkosť prvej vzorky + veľkosť druhej vzorky).

4. Znovu usporiadajte karty do dvoch radov podľa toho, či patria k vzorke 1 alebo vzorke 2.

6. Určte väčší z dvoch hodnotových súčtov.

7. Určte hodnotu U podľa vzorca:

8. Určte z tabuliek kritické hodnoty U, v súlade s tým prijmite alebo zamietnite hypotézu č.

3. Kritérium H – Kruskal – Wallis

Kritérium H sa používa na posúdenie rozdielov v závažnosti analyzovaného znaku súčasne medzi tromi, štyrmi alebo viacerými vzorkami. Umožňuje vám identifikovať stupeň zmeny znaku vo vzorkách, bez toho, aby naznačoval smer týchto zmien.

Kritérium je založené na princípe, že čím menšie je prekrytie vzoriek, tým vyššia je hladina významnosti. H emp . Je potrebné zdôrazniť, že vo vzorkách môže byť rôzny počet subjektov, hoci v úlohách nižšie je uvedený rovnaký počet subjektov vo vzorkách.

Práca s údajmi začína skutočnosťou, že všetky vzorky sú podmienene kombinované v poradí vyskytujúcich sa hodnôt do jednej vzorky a hodnoty tejto kombinovanej vzorky sú zoradené. Potom sa získané poradia priradia k údajom pôvodnej vzorky a súčet poradí sa vypočíta samostatne pre každú vzorku. Kritérium vychádza z nasledujúcej myšlienky – ak sú rozdiely medzi vzorkami nevýznamné, potom sa súčty poradí navzájom nebudú výrazne líšiť a naopak.

Hodnota H emp vypočítané podľa vzorca:

H emp

Kde N je celkový počet členov v zovšeobecnenej vzorke;

n i je počet členov v každej jednotlivej vzorke;

sú druhé mocniny súčtu hodnotení pre každú vzorku.

Pri určovaní kritických hodnôt kritéria pre štyri alebo viac vzoriek použite pre kritérium tabuľku hee-štvorec, ktorý predtým vypočítal počet stupňov voľnosti v pre c = 4. Potom v = c - 1 = 4 – 1=3..

Zdôrazňujeme, že ak použijeme kritériá, ktoré nám umožňujú porovnávať iba dve série hodnôt, potom by si výsledok získaný vyššie vyžadoval šesť porovnaní – prvá vzorka s druhou, treťou atď.

Ak chcete použiť kritérium H musia byť splnené tieto podmienky:

1. Meranie sa musí vykonať na stupnici poradia, intervalov alebo pomerov.

2. Vzorky musia byť nezávislé.

3. Odlišný počet subjektov v porovnávaných vzorkách je povolený.

4. Pri porovnávaní troch vzoriek je povolené, aby jedna z nich mala n = 3 a v ďalších dvoch n = 2. V tomto prípade však možno rozdiely zaznamenať len na 5 % hladine významnosti.

5. Tabuľka 9 v prílohe sa poskytuje len pre tri vzorky a ( n 1n 2, n H), £ 5, to znamená, že maximálny počet subjektov vo všetkých troch vzorkách môže byť menší a rovný 5.

6. Pri väčšom počte vzoriek a inom počte subjektov v každej vzorke by ste ako kritérium mali použiť tabuľku hee-námestie. V tomto prípade je počet stupňov voľnosti určený vzorcom: v = s - 1, kde s - počet zhodných vzoriek.

Mann-Whitney U-test je:

Mann-Whitney U-test

Mann-Whitney U-test

Mann-Whitney U-test(Angličtina) Mann-Whitney U-test) je štatistický test, ktorý sa používa na hodnotenie rozdielov medzi dvoma vzorkami z hľadiska úrovne nejakého znaku, meraného kvantitatívne. Umožňuje zistiť rozdiely v hodnote parametra medzi malými vzorkami.

Iné názvy: Mann-Whitney-Wilcoxonov test Mann-Whitney-Wilcoxon, MWW), test Wilcoxonovho poradového súčtu (angl. Wilcoxonov test poradia a súčtu) alebo Wilcoxon-Mann-Whitney test (angl. Wilcoxon - Mann - Whitney test).

Príbeh

Tento spôsob zisťovania rozdielov medzi vzorkami navrhol v roku 1945 Frank Wilcoxon ( F. Wilcoxon). V roku 1947 ho podstatne prepracoval a rozšíril H. B. Mann ( H. B. Mann) a D. R. Whitney ( D. R. Whitney), ktorých menami sa dnes zvyčajne nazýva.

Popis kritéria

Jednoduchý neparametrický test. Sila testu je vyššia ako u Rosenbaumovho Q-testu.

Táto metóda určuje, či je oblasť prekrývajúcich sa hodnôt medzi dvoma sériami (hodnotená séria hodnôt parametrov v prvej vzorke a rovnaká v druhej vzorke) dostatočne malá. Čím menšia je hodnota kritéria, tým je pravdepodobnejšie, že rozdiely medzi hodnotami parametrov vo vzorkách sú významné.

Obmedzenia použiteľnosti kritéria

  1. Každá zo vzoriek musí obsahovať aspoň 3 hodnoty vlastností. Je povolené, aby v jednej vzorke boli dve hodnoty, ale v druhej aspoň päť.
  2. Vo vzorových údajoch by nemali byť žiadne zhodné hodnoty (všetky čísla sú odlišné) alebo by malo byť takýchto zhôd veľmi málo.

Použitie kritéria

Ak chcete použiť Mann-Whitney U-test, musíte vykonať nasledujúce operácie.

  • Automatický výpočet Mann-Whitneyho U-testu

Tabuľka kritických hodnôt

  • Tabuľka kritických hodnôt Mann-Whitney U-testu
  • Kritické hodnoty pre Mann - Whitney U-Test.

pozri tiež

  • Kruskal-Wallisov test je viacrozmerné zovšeobecnenie Mann-Whitneyho U-testu.

Literatúra

  • Mann H.B., Whitney D.R. Na test, či jedna z dvoch náhodných premenných je stochasticky väčšia ako druhá. // Annals of Mathematical Statistics. - 1947. - Číslo 18. - S. 50-60.
  • Wilcoxon F. Individuálne porovnania podľa metód hodnotenia. // Bulletin biometrie 1. - 1945. - S. 80-83.
  • Gubler E. V., Genkin A. A. Aplikácia kritérií neparametrickej štatistiky v biomedicínskom výskume. - L., 1973.
  • Sidorenko E.V. Metódy matematického spracovania v psychológii. - Petrohrad, 2002.

Nadácia Wikimedia. 2010.

  • U-954
  • Ženy s U-bodom

Pozrite sa, čo je "Mann-Whitney U-test" v iných slovníkoch:

    Mannov U-test- U test Mann Whitney (angl. Mann Whitney U test) je štatistický test, ktorý sa používa na posúdenie rozdielov medzi dvoma nezávislými vzorkami z hľadiska úrovne ľubovoľnej vlastnosti, meranej kvantitatívne. Umožňuje identifikovať ... ... Wikipedia

    Mann-Whitney U test- (angl. Mann Whitney U test) neparametrický štatistický test používaný na posúdenie rozdielov medzi dvoma vzorkami z hľadiska úrovne ktoréhokoľvek znaku, meraného kvantitatívne. Umožňuje identifikovať rozdiely v hodnote parametra medzi malými ... Wikipedia

    Mann-Whitney test

    Mann-Whitney-Wilcoxonov test- Mann Whitney U test je neparametrický štatistický test, ktorý sa používa na posúdenie rozdielov medzi dvoma vzorkami z hľadiska úrovne akéhokoľvek znaku, meraného kvantitatívne. Umožňuje identifikovať rozdiely vo význame ... Wikipedia

    Mann-Whitney-Wilcoxonov test- Mann Whitney U test je neparametrický štatistický test, ktorý sa používa na posúdenie rozdielov medzi dvoma vzorkami z hľadiska úrovne akéhokoľvek znaku, meraného kvantitatívne. Umožňuje identifikovať rozdiely vo význame ... Wikipedia

    Mann Whitney test- - Telekomunikačné témy, základné pojmy EN Mann Whitney U test ... Technická príručka prekladateľa

    Wilcoxon-Mann-Whitney test- Mann Whitney U test je neparametrický štatistický test, ktorý sa používa na posúdenie rozdielov medzi dvoma vzorkami z hľadiska úrovne akéhokoľvek znaku, meraného kvantitatívne. Umožňuje identifikovať rozdiely vo význame ... Wikipedia

    Wilcoxon-Mann-Whitney test- Mann Whitney U test je neparametrický štatistický test, ktorý sa používa na posúdenie rozdielov medzi dvoma vzorkami z hľadiska úrovne akéhokoľvek znaku, meraného kvantitatívne. Umožňuje identifikovať rozdiely vo význame ... Wikipedia

    Wilcoxonov test súčtu poradia- Mann Whitney U test je neparametrický štatistický test, ktorý sa používa na posúdenie rozdielov medzi dvoma vzorkami z hľadiska úrovne akéhokoľvek znaku, meraného kvantitatívne. Umožňuje identifikovať rozdiely vo význame ... Wikipedia

    Wilcoxonov test súčtu poradia- Mann Whitney U test je neparametrický štatistický test, ktorý sa používa na posúdenie rozdielov medzi dvoma vzorkami z hľadiska úrovne akéhokoľvek znaku, meraného kvantitatívne. Umožňuje identifikovať rozdiely vo význame ... Wikipedia

knihy

  • Štatistiky a pečate, Vladimir Savelyev. Z tejto knihy sa dozviete, čo je rozptyl a smerodajná odchýlka, ako nájsť Studentov t-test a Mann-Whitney U-test, na čo sa používajú regresné a faktorové analýzy, ... Viac Kúpiť za 280 rubľov e-kniha

U-kritérium je hodnotové, takže je invariantné vzhľadom na akúkoľvek monotónnu transformáciu meracej stupnice.

Ďalšie názvy: Mann-Whitney-Wilcoxonov test (Mann-Whitney-Wilcoxon, MWW), Wilcoxonov rank-sum test alebo Wilcoxon-Mann-Whitney test (WMW).

Príklady úloh

Príklad 1 Prvou vzorkou sú pacienti liečení liekom A. Druhou vzorkou sú pacienti liečení liekom B. Hodnoty vo vzorkách predstavujú niektoré charakteristiky účinnosti liečby (hladina metabolitu v krvi, teplota tri dni po začatí liečby, trvanie rekonvalescencie, počet nemocničných lôžok) dni a pod.) Je potrebné zistiť, či je významný rozdiel v účinnosti liekov A a B, alebo rozdiely sú čisto náhodné a sú vysvetlené „prirodzeným“ rozptylom vybranej charakteristiky.

Príklad 2 Prvou vzorkou sú polia ošetrené kultivačnou metódou A. Druhou vzorkou sú polia ošetrené kultivačnou metódou B. Hodnoty vo vzorkách sú výnosy. Je potrebné zistiť, či je jedna z metód efektívnejšia ako druhá, alebo či sú rozdiely vo výnosoch spôsobené náhodnými faktormi.

Príklad 3 Prvou ukážkou sú dni, keď sa v supermarkete konala akcia typu A (červené cenovky so zľavou). Druhou ukážkou sú dni akcie typu B (každé piate balenie je zadarmo). Hodnoty vo vzorkách sú ukazovateľom účinnosti propagácie (objem predaja alebo príjem v rubľoch). Je potrebné zistiť, ktorý typ propagácie je efektívnejší.

Popis kritéria

Uvádzajú sa dve vzorky.

Dodatočné odhady:

Niekedy sa mylne domnieva, že U-test testuje nulovú hypotézu rovnakých mediánov v dvoch vzorkách. Existujú distribúcie, pre ktoré je hypotéza pravdivá, ale ich mediány sú odlišné.

U-kritérium môže byť použité na testovanie hypotézy posunu ako alternatíva, kde je nejaká nenulová konštanta. S touto alternatívou je U-test konzistentný. Je vhodné ho použiť, ak sa na tom istom prístroji vykonávajú dve série meraní dvoch hodnôt určitej fyzikálnej veličiny. V tomto prípade distribučná funkcia popisuje chyby merania jednej a druhej hodnoty. V mnohých aplikáciách (najmä v ekonometrii) však neexistuje žiadny konkrétny dôvod predpokladať, že distribúcia druhej vzorky sa iba posúva, ale inak sa nemení.

U-test je neparametrickým analógom Studentovho t-testu. Ak sú vzorky normálne, potom je na testovanie hypotézy posunu vhodnejšie použiť silnejší Studentov t-test.

Príbeh

Tento spôsob zisťovania rozdielov medzi vzorkami navrhol v roku 1945 Frank Wilcoxon. V roku 1947 ho podstatne prepracovali a rozšírili Mann a Whitney, pod ktorých menami sa dnes bežne označuje.

Literatúra

  1. Mann H.B., Whitney D.R. Na test, či jedna z dvoch náhodných premenných je stochasticky väčšia ako druhá. // Annals of Mathematical Statistics. - 1947, č.18. - Pp. 50-60.
  2. Wilcoxon F. Individuálne porovnania podľa metód hodnotenia. // Bulletin biometrie 1. 1945. - Pp. 80–83.
  3. Orlov A.I. Ekonometria. - M.: Skúška, 2003. - 576 s. (§4.5 Aké hypotézy možno testovať pomocou dvojvzorkového Wilcoxonovho testu?)
  4. Kobzar A.I. Aplikovaná matematická štatistika. - M.: Fizmatlit, 2006. - 816 s.

Mann-Whitney test predstavuje neparametrickú alternatívu k t-testu pre nezávislé vzorky. Jeho výhodou je, že upúšťame od predpokladu normálneho rozdelenia a rovnakých rozptylov. Je nevyhnutné, aby sa údaje merali aspoň v ordinálnej mierke.

STATISTICA predpokladá, že údaje sú usporiadané rovnakým spôsobom ako v a t-testoch pre nezávislé vzorky. Súbor musí obsahovať kódovú (nezávislú) premennú, ktorá má aspoň dva rôzne kódy, aby bolo možné jednoznačne identifikovať, či každé pozorovanie patrí do určitej skupiny.

Predpoklady a interpretácia. Mann-Whitney test predpokladá, že príslušné premenné sú merané aspoň na ordinálnej stupnici (zoradené). Interpretácia testu je v podstate podobná interpretácii výsledkov t-testu pre nezávislé vzorky s tým rozdielom, že U test je vypočítaný ako súčet ukazovateľov párového porovnania prvkov prvej vzorky s prvkami druhá vzorka. U test – najvýkonnejšia (citlivá) neparametrická alternatíva t-test pre nezávislé vzorky; v niektorých prípadoch je dokonca výkonnejší ako t-test.

Ak je veľkosť vzorky väčšia ako 20, potom rozdelenie vzorky pre štatistiku U rýchlo konverguje k normálnemu rozdeleniu (pozri Siegel, 1956). Preto sa spolu so štatistikou U zobrazí hodnota z (pre normálne rozdelenie) a zodpovedajúca hodnota p.

Presné pravdepodobnosti pre malé vzorky. Pre malé vzorky STATISTICA vypočíta presnú pravdepodobnosť spojenú s príslušnou štatistikou U. Táto pravdepodobnosť je založená na spočítaní všetkých možných hodnôt U vzhľadom na počet pozorovaní v dvoch vzorkách (pozri Dinneen & Blakesley, 1973). Program vykáže (v poslednom stĺpci tabuľky výsledkov) hodnotu 2 * p, kde p sa rovná 1 mínus kumulatívna (jednostranná) pravdepodobnosť zodpovedajúcej U štatistiky. Všimnite si, že to zvyčajne nevedie k veľkému podhodnoteniu štatistickej významnosti relevantných účinkov (pozri Siegel, 1956).

Štatistika testu vyzerá takto.

kde W- štatistika Wilcoxon navrhnutý na testovanie rovnakej hypotézy

inak

Takže štatistika U spočíta celkový počet prípadov, v ktorých prvky druhej vzorky prevyšujú prvky prvej vzorky. Ak je hypotéza správna, tak

Mann-Whitney test predpokladá, že príslušné premenné sú merané aspoň na ordinálnej stupnici (zoradené). Interpretácia testu je v podstate rovnaká ako interpretácia výsledkov t-kritériá pre nezávislé vzorky, okrem toho, že kritérium U sa vypočíta ako súčet ukazovateľov párového porovnania prvkov prvej vzorky s prvkami druhej vzorky. U test – najvýkonnejšia (citlivá) neparametrická alternatíva t-kritériá pre nezávislé vzorky; v niektorých prípadoch má dokonca väčšiu silu ako t-kritérium.

Ak je veľkosť vzorky väčšia ako 20, potom rozdelenie vzorky pre štatistiku U rýchlo konverguje k normálnemu rozdeleniu. Preto spolu so štatistikou U aj hodnota z (pre normálne rozdelenie) a príslušné p-význam.

Podrobné pokyny na používanie kritérií nájdete neskôr v sekcii príkladov aplikácie.

Príklad

Otestujme hypotézu, že porovnávané nezávislé vzorky patria do rovnakej všeobecnej populácie pomocou neparametrického Mann-Whitneyho U-testu. Porovnajme výsledky získané v príklade Základná štatistika a Studentov t-test pre 2. a 3. stĺpec tabuľky Studentovho t-testu s výsledkami neparametrického porovnania.

Na výpočet Wilcoxonovho U-testu usporiadame varianty porovnávaných vzoriek vo vzostupnom poradí do jednej zovšeobecnenej série a variantom zovšeobecnenej série priradíme poradie od 1 do n1 + n2. Prvý riadok predstavuje varianty prvej vzorky, druhý - druhá vzorka, tretí - zodpovedajúce poradie v zovšeobecnenej sérii:





















Je potrebné poznamenať, že ak existujú identické možnosti, priradí sa im priemerné poradie, ale hodnota posledného poradia by sa mala rovnať n1 + n2 (v našom prípade 20). Toto pravidlo sa používa na kontrolu správnosti poradia.

Samostatne pre každú vzorku vypočítame súčet radov ich variantov R1 a R2. V našom prípade:

R1 = 1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69

R2 = 5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19,5 + 19,5 = 141

Na kontrolu správnosti výpočtov môžete použiť ďalšie pravidlo: R1 + R2 = 0,5 * (n1 + n2) * (n1 + n2 + 1). V našom prípade R1 + R2 = 210.

Štatistika U1 = 69 - 10*11/2 = 14; U2 \u003d 141 – 10 * 11/2 \u003d 86.

Na testovanie jednostranného testu zvolíme minimálnu štatistiku U1 = 14 a porovnáme ju s kritickou hodnotou pre n1 = n2 = 10 a 1 % hladinou významnosti rovnajúcou sa 19.

Keďže vypočítaná hodnota kritéria je menšia ako tabuľková, nulová hypotéza sa zamietne na zvolenej hladine významnosti a rozdiely medzi vzorkami sa považujú za štatisticky významné. Záver o existencii rozdielov, urobený pomocou parametrického Studentovho testu, sa teda potvrdzuje pomocou tejto neparametrickej metódy.