Manna Whitney. Mann-Whitneyn U-kriteeri psykologian opinnäytetyössä, kurssi- ja maisterityössä

Kriteeri U Mann - Whitney

Kriteerin määrittäminen. Kriteeri on suunniteltu arvioimaan eroja kaksi näytteitä taso mikä tahansa ominaisuus, joka voidaan mitata. Sen avulla voit erottaa toisistaan pieni näytteitä milloin P 1, n 2 > 3 tai p L \u003d 2, p 2\u003e 5, ja se on tehokkaampi kuin kriteeri K Rosenbaum.

Tämä menetelmä määrittää, onko kahden sarjan päällekkäisten arvojen alue tarpeeksi pieni. Muistamme, että kutsumme 1. riviä (näyte, ryhmä) arvoriviä, jossa arvot alustavan arvion mukaan ovat korkeampia, ja 2. rivi on se, jossa ne oletetaan olevan pienempiä.

Mitä pienempi risteysalue on, sitä todennäköisemmin se on eroja luotettava. Näitä eroja kutsutaan joskus eroiksi sijainti kaksi näytettä. Kriteerin empiirinen arvo heijastaa sitä, kuinka suuri rivien välinen yhteensattumaalue on. Niin vähemmän t/3Mn, erityisesti on todennäköistä, että erot luotettava.

Hypoteesit.

Fysiikan opiskelijoiden ryhmässä ei-verbaalisen älykkyyden taso on korkeampi kuin psykologian opiskelijoiden ryhmässä.

Graafinen esitys kriteeristäU. Pa kuva. 7.25 esittää kolme monista mahdollisista vaihtoehdoista kahden arvosarjan suhteelle.

Vaihtoehdossa (a) toinen rivi on alempi kuin ensimmäinen, eivätkä rivit juuri leikkaa. Peittoalue ( S j) liian pieni hämärtämään rivien välisiä eroja. On mahdollista, että erot niiden välillä ovat merkittäviä. Voimme määrittää tämän tarkalleen kriteerin avulla U.

Vaihtoehdossa (b) toinen rivi on myös alempi kuin ensimmäinen, mutta kahden rivin päällekkäisten arvojen alue on melko laaja (5 2). Se ei ehkä vielä saavuta kriittistä arvoa, jolloin erot on tunnustettava merkityksettömiksi. Mutta onko näin, voidaan määrittää vain kriteerin tarkalla laskelmalla U.

Vaihtoehdossa (c) toinen rivi on alempi kuin ensimmäinen, mutta päällekkäisyys on niin laaja (5 3), että rivien väliset erot hämärtyvät.

Riisi. 7.25.

kahdessa näytteessä

Huomautus. Päällekkäisyys (5 t, S 2, *$z) osoittaa mahdolliset päällekkäisyydet. KriteerirajoituksetU.

  • 1. Jokaisessa näytteessä on oltava vähintään kolme havaintoa: n v p 2 > 3; on sallittua, että yhdessä otoksessa on kaksi havaintoa, mutta tällöin niitä on oltava vähintään 5 toisessa.
  • 2. Jokainen näyte saa sisältää enintään 60 havaintoa; p l, s 2 w, n 2 > 20 ranking tulee melko työlästä.

Palataan Leningradin yliopiston fyysisten ja psykologisten tiedekuntien opiskelijoille tehdyn kyselyn tuloksiin D. Vekslerin menetelmällä verbaalisen ja ei-verbaalisen älykkyyden mittaamiseksi. Kriteeriä käyttämällä K Rosenbaumin mukaan todettiin suurella merkityksellisyydellä, että fysiikan tiedekunnan opiskelijoiden otoksessa verbaalisen älykkyyden taso on korkeampi. Yritetään nyt selvittää, toistetaanko tämä tulos, kun verrataan näytteitä ei-verbaalisen älykkyyden tason mukaan. Tiedot on annettu taulukossa.

2 on näytteen 1 piirteen tason alapuolella merkittävästi merkitsevällä tasolla. Mitä pienempi arvo sinä, sitä suurempi erojen merkitys.

Tehdään nyt kaikki tämä työ esimerkkimme materiaalilla. Algoritmin 1-6 askeleen työskentelyn tuloksena rakennamme taulukon (Taulukko 7.4).

Taulukko 7.4

Sijoitussumman laskeminen fyysisten ja psykologisten tiedekuntien opiskelijoiden näytteille

Fysiikan opiskelijat (P = 14)

Psykologian opiskelijat (n = 12)

Ei-verbaalinen älykkyyspisteet

Keskiarvo 107,2

Ristojen kokonaismäärä: 165 + 186 = 351. Kaavan (5.1) mukaan laskettu määrä on seuraava:

Todellisen ja arvioitujen määrien yhtäläisyyttä noudatetaan. Näemme, että ei-verbaalisen älykkyyden tasolla psykologian opiskelijoiden otos on "korkeampi". Juuri tämä otos muodostaa suuren sijoitussumman: 186. Nyt olemme valmiita muotoilemaan tilastollisia hypoteeseja:

Itse 0: psykologian opiskelijoiden ryhmä ei päihitä fysiikan opiskelijoiden ryhmää ei-verbaalisen älykkyyden suhteen;

Minä: ryhmä psykologian opiskelijoita päihittää fysiikan opiskelijoiden ryhmän ei-verbaalisen älykkyyden suhteen.

Algoritmin seuraavan vaiheen mukaisesti määritämme empiirisen arvon U :

Koska meidän tapauksessamme p l * p 2, laske empiirinen arvo U ja toisen asteen summalle (165) korvaamalla kaava (7.4) vastaavalla p x.:

Liitteen 8 mukaisesti määritämme kriittiset arvot p l = 14, n 2 = 12:

Muistamme sen kriteerin U on yksi kahdesta poikkeuksesta yleiseen sääntöön, jonka mukaan erot ovat merkittäviä, eli voimme sanoa merkittäviä eroja, jos (/ emp U Kp 0 05 (lämpötilassa = 60, ja sp > U Kf) noin,05).

Siten, H 0 on otettu seuraavasti: psykologian opiskelijoiden ryhmä ei ylitä fysiikan opiskelijoiden ryhmää ei-verbaalisen älykkyyden tasolla.

Kiinnitetään huomiota siihen, että tässä tapauksessa Rosenbaumin Q-kriteeriä ei voida soveltaa, koska fyysikkojen ryhmässä vaihteluväli on laajempi kuin psykologien ryhmässä: sekä korkeimmat että alhaisimmat ei-arvot. verbaalinen älykkyys kuuluu fyysikkojen ryhmään (katso taulukko 7.4).

Tätä tilastollista menetelmää ehdotti Frank Wilcoxon (katso kuva) vuonna 1945. Kuitenkin vuonna 1947 H. B. Mann ja D. R. Whitney paransivat ja laajensivat menetelmää, joten U-testiin viitataan yleisemmin heidän nimillään.

Kriteeri on suunniteltu arvioimaan kahden näytteen välisiä eroja minkä tahansa ominaisuuden tason suhteen kvantitatiivisesti mitattuna. Sen avulla voit tunnistaa erot pienten näytteiden välillä, kun n 1 ,n 2 ≥3 tai n 1 =2, n 2 ≥5, ja se on tehokkaampi kuin Rosenbaumin testi.

Kuvaus Mann-Whitney U -testistä

Kriteeriä voidaan käyttää useilla tavoilla ja useita vaihtoehtoja kriittisten arvojen taulukoille, jotka vastaavat näitä menetelmiä (Gubler E. V., 1978; Runion R., 1982; Zakharov V. P., 1985; McCall R., 1970; Krauth J., 1988 ) .

Tämä menetelmä määrittää, onko kahden sarjan päällekkäisten arvojen alue tarpeeksi pieni. Muistamme, että kutsumme 1. riviä (näyte, ryhmä) arvoriviä, jossa arvot alustavan arvion mukaan ovat korkeampia, ja 2. rivi on se, jossa ne oletetaan olevan pienempiä.

Mitä pienempi jakoalue on, sitä todennäköisemmin erot ovat merkittäviä. Joskus näitä eroja kutsutaan eroiksi kahden näytteen sijainnissa (Welkowitz J. et al., 1982).

U-kriteerin empiirinen arvo heijastaa sitä, kuinka suuri rivien välinen yhteensattumaalue on. Siksi mitä pienempi U emp, sitä todennäköisemmin erot ovat merkittäviä.

Hypoteesit U - Mann-Whitney testi

H0: Attribuutin taso ryhmässä 2 ei ole alempi kuin ryhmän 1 määritteen taso.
H1: Ominaisuuden taso ryhmässä 2 on alhaisempi kuin ryhmän 1 piirteen taso.

Mann-Whitney U -testin rajoitukset

1. Jokaisessa näytteessä on oltava vähintään 3 havaintoa: n 1 ,n 2 ≥ З; on sallittua, että yhdessä otoksessa on 2 havaintoa, mutta sitten niitä tulee olla vähintään 5 toisessa.

2. Jokainen näyte saa sisältää enintään 60 havaintoa; n 1, n 2 ≤ 60.

Mann-Whitneyn U-testin automaattinen laskenta

Vaihe 1

Syötä ensimmäisen näytteen tiedot ensimmäiseen sarakkeeseen ("Sample 1") ja toisen näytteen tiedot toiseen sarakkeeseen ("Sample 2"). Tiedot syötetään yksi numero riviä kohden; ei välilyöntejä, rakoja jne. Vain numerot syötetään. Murtoluvut syötetään "." (piste). Kun olet täyttänyt sarakkeet, napsauta "Step 2" -painiketta laskeaksesi automaattisesti Mann-Whitneyn U-testin.

Mann-Whitneyn U-testi(Englanti) Mann-Whitneyn U-testi) on tilastollinen testi, jota käytetään kahden riippumattoman otoksen välisten erojen arvioimiseen minkä tahansa ominaisuuden tason suhteen kvantitatiivisesti mitattuna. Mahdollistaa pienten näytteiden välisten parametrien arvon erojen havaitsemisen.

Wilcoxonin rank-sum testi ). Harvinainen: inversioiden lukumäärän kriteeri.

Tarina

Tätä menetelmää näytteiden välisten erojen havaitsemiseksi ehdotti vuonna 1945 Frank Wilcoxon ( F. WilcoxonH. B. Mann) ja D. R. Whitney ( D. R. Whitney

Kriteerin kuvaus

  1. Otostiedoissa ei saa olla vastaavia arvoja (kaikki luvut ovat erilaisia) tai tällaisia ​​osumia tulisi olla hyvin vähän (enintään 10).

Kriteerin käyttäminen

  1. Muodosta yksi rankattu sarja molemmista verratuista otoksista järjestämällä niiden elementit piirteen kasvuasteen mukaan ja antamalla alemman arvon alemman tason. Sijoitusten kokonaismäärä on yhtä suuri kuin: N = n 1 + n 2 , (\displaystyle N=n_(1)+n_(2),) missä n 1 (\displaystyle n_(1)) on elementtien lukumäärä ensimmäisessä näytteessä ja n 2 (\displaystyle n_(2)) - toisen näytteen elementtien lukumäärä.
  2. Jaa yksittäinen rankattu sarja kahteen osaan, jotka koostuvat vastaavasti ensimmäisen ja toisen näytteen yksiköistä. Laske erikseen niiden rivien summa, jotka putosivat ensimmäisen otoksen elementtien osuuteen, ja erikseen - toisen otoksen elementtien osuuteen. Määritellä iso kahdesta arvosummasta (T x (\displaystyle T_(x))) vastaa näytettä, jossa on n x (\displaystyle n_(x)) -elementtiä.
  3. Määritä Mann-Whitneyn U-testin arvo kaavalla: U = n 1 ⋅ n 2 + n x ⋅ (n x + 1) 2 − T x . (\displaystyle U=n_(1)\cdot n_(2)+(\frac (n_(x)\cdot (n_(x)+1))(2))-T_(x).)
  4. Määritä datan n 1 (\displaystyle n_(1)) ja n 2 (\displaystyle n_(2)) kriteerin kriittinen arvo valitun tilastollisen merkitsevyystason taulukon avulla. Jos vastaanotettu arvo on U (\displaystyle U) pienempi taulukko tai yhtä suuri kuin se, silloin tunnistetaan merkittävän eron olemassaolo piirteen tason välillä tarkasteluissa näytteissä (vaihtoehtoinen hypoteesi hyväksytään). Jos tuloksena saatu arvo U (\displaystyle U) on suurempi kuin taulukon arvo, nollahypoteesi hyväksytään. Erojen merkitys on sitä suurempi, mitä pienempi on U:n arvo (\displaystyle U) .
  5. Jos nollahypoteesi on totta, kriteerillä on odotusarvo M (U) = n 1 ⋅ n 2 2 (\displaystyle M(U)=(\frac (n_(1)\cdot n_(2))(2)) ) ja varianssi D (U) = n 1 ⋅ n 2 ⋅ (n 1 + n 2 + 1) 12 (\displaystyle D(U)=(\frac (n_(1)\cdot n_(2)\cdot (n_) (1)+ n_(2)+1))(12))) ja riittävän suurella näytedatamäärällä (n 1 > 19 , n 2 > 19) (\displaystyle (n_(1)>19,\; n_(2)>19 )) jakautuu lähes normaalisti.

Taulukko kriittisistä arvoista

  • Mann-Whitneyn U-testin kriittisten arvojen laskeminen näytteille, jotka ovat suurempia kuin 20 (N>20) (downlink alkaen 10-02-2017)

Mann-Whitney testi: esimerkki, taulukko

Matemaattisen tilaston kriteeri on tiukka sääntö, jonka mukaan tietyn merkittävyyden omaava hypoteesi hyväksytään tai hylätään. Sen rakentamiseksi sinun on löydettävä tietty toiminto. Sen pitäisi riippua kokeen lopullisista tuloksista, eli empiirisesti löydetyistä arvoista. Tämä toiminto on työkalu näytteiden välisten erojen arvioinnissa.

Tilastollisesti merkitsevä arvo. Yleistä tietoa

Tilastollinen merkitsevyys on suure, jota ei todennäköisesti tapahdu sattumalta. Sen äärimmäisemmät indikaattorit ovat myös merkityksettömiä. Eron sanotaan olevan tilastollisesti merkitsevä, jos on tietoja, joita ei todennäköisesti tapahdu, olettaen, että näitä eroja ei ole. Mutta tämä ei suinkaan tarkoita, että tämän eron on välttämättä oltava suuri ja merkittävä.

Testin tilastollisen merkitsevyyden taso

Tämä termi tulee ymmärtää todennäköisyydeksi hylätä nollahypoteesi, jos se on totta. Tätä kutsutaan myös tyypin I virheeksi tai vääräksi positiiviseksi päätökseksi. Useimmissa tapauksissa prosessi perustuu p-arvoon ("pi-arvo"). Tämä on kumulatiivinen todennäköisyys, kun tarkastellaan tilastollisen kriteerin tasoa. Se puolestaan ​​lasketaan otoksesta nollahypoteesin hyväksymishetkellä. Oletus hylätään, jos tämä p-arvo on pienempi kuin analyytikon ilmoittama taso. Testiarvon merkitys riippuu suoraan tästä indikaattorista: mitä pienempi se on, sitä enemmän syytä hylätä hypoteesi.
Merkitystasoa merkitään yleensä kirjaimella b (alfa). Suositut indikaattorit asiantuntijoiden keskuudessa: 0,1%, 1%, 5% ja 10%. Jos sanotaan, että sattuman todennäköisyys on 1:1000, silloin puhutaan ehdottomasti 0,1 %:n tasosta satunnaismuuttujan tilastollisesta merkitsevyydestä. Eri b-tasoilla on hyvät ja huonot puolensa. Jos pistemäärä on pienempi, vaihtoehtoinen hypoteesi on todennäköisemmin merkittävä. On kuitenkin olemassa riski, että väärää nolla-arvausta ei hylätä. Voidaan päätellä, että optimaalisen b-tason valinta riippuu "merkittävyys-voima"-tasapainosta tai vastaavasti väärien positiivisten ja väärien negatiivisten päätösten todennäköisyyksien vaihdosta. Synonyymi sanalle "tilastollinen merkitys" kotimaisessa kirjallisuudessa on termi "luotettavuus".

Nollahypoteesin määritelmä

Matemaattisissa tilastoissa tämä on oletus, jonka johdonmukaisuus jo varastossa olevien empiiristen tietojen kanssa testataan. Useimmissa tapauksissa nollahypoteesi on hypoteesi, että tutkittavien muuttujien välillä ei ole korrelaatiota tai että tutkittavien jakaumien homogeenisuudessa ei ole eroja. Vakiotutkimuksessa matemaatikko yrittää kumota nollahypoteesin, toisin sanoen todistaa, että se ei ole yhdenmukainen kokeellisen tiedon kanssa. Lisäksi on oltava vaihtoehtoinen oletus, joka otetaan nollan sijasta.

Avaimen määritelmä

U-kriteeri (Mann-Whitney) matemaattisissa tilastoissa mahdollistaa kahden otoksen välisten erojen arvioinnin. Ne voidaan antaa jonkin ominaisuuden tason mukaan, joka mitataan määrällisesti. Tämä menetelmä on ihanteellinen pienten näytteiden erojen arvioimiseen. Tämän yksinkertaisen kriteerin ehdotti Frank Wilcoxon vuonna 1945. Ja jo vuonna 1947 tutkijat H. B. Mann ja D. R. Whitney, joiden nimiä sitä kutsutaan tähän päivään, muuttivat ja täydensivät menetelmää. Mann-Whitneyn kriteeri psykologiassa, matematiikassa, tilastoissa ja monissa muissa tieteissä on yksi teoreettisen tutkimuksen tulosten matemaattisen perustelun peruselementeistä.

Kuvaus

Mann-Whitneyn testi on suhteellisen yksinkertainen menetelmä ilman parametreja. Sen voima on merkittävä. Se on huomattavasti suurempi kuin Rosenbaumin Q-testin teho. Menetelmä arvioi, kuinka pieni ristiarvojen alue on näytteiden välillä, nimittäin ensimmäisen ja toisen joukon arvostettujen arvosarjojen välillä. Mitä pienempi kriteerin arvo on, sitä todennäköisemmin parametrien arvoerot ovat luotettavia. Jotta U (Mann-Whitney) -kriteeriä voitaisiin soveltaa oikein, ei pidä unohtaa joitain rajoituksia. Jokaisessa näytteessä on oltava vähintään 3 ominaisuuden arvoa. On mahdollista, että yhdessä tapauksessa arvoja on kaksi, mutta toisessa tapauksessa niitä on oltava vähintään viisi. Tutkituissa näytteissä tulee olla vähimmäismäärä yhteensopivia indikaattoreita. Ihannetapauksessa kaikkien numeroiden tulisi olla erilaisia.

Käyttö

Kuinka käyttää Mann-Whitney-testiä oikein? Tällä menetelmällä koottu taulukko sisältää tiettyjä kriittisiä arvoja. Ensimmäinen vaihe on luoda yksi sarja molemmista vastaavista näytteistä, jotka sitten luokitellaan. Eli elementit asetetaan riviin attribuutin kasvuasteen mukaan ja alemmalle arvolle annetaan alempi arvo. Tuloksena saamme seuraavan rivien kokonaismäärän:

N = N1 + N2,

jossa arvot N1 ja N2 ovat ensimmäisessä ja toisessa näytteessä olevien yksiköiden lukumäärä, vastaavasti. Lisäksi yksittäinen rankattu arvosarja on jaettu kahteen luokkaan. Yksiköt ensimmäisestä ja toisesta näytteestä. Nyt lasketaan vuorollaan ensimmäisen ja toisen rivin arvojen rivien summa. Suurin niistä (Tx) määritetään, mikä vastaa nx ykköstä sisältävää näytettä. Wilcoxon-menetelmän käyttöä varten sen arvo lasketaan seuraavalla menetelmällä. Taulukosta on selvitettävä valitulle merkitsevyystasolle tämän kriteerin kriittinen arvo erikseen otetuille N1:lle ja N2:lle.
Tuloksena oleva indikaattori voi olla pienempi tai yhtä suuri kuin taulukon arvo. Tässä tapauksessa todetaan merkittävä ero piirteen tasoissa tutkituissa näytteissä. Jos saatu arvo on suurempi kuin taulukon arvo, nollahypoteesi hyväksytään. Mann-Whitneyn testiä laskettaessa on huomioitava, että jos nollahypoteesi pitää paikkansa, testillä on sekä keskiarvo että varianssi. Huomaa, että riittävän suurille näytedatamäärille menetelmän katsotaan olevan lähes normaalijakautuma. Erojen merkitys on sitä suurempi, mitä pienempi on Mann-Whitneyn testin arvo.

Pearson-kriteerin arvot (kriteeri)

  1. Mann-Whitneyn testin arvoihin liittyvät todennäköisyystaulukot.

Mann-Whitneyn testin arvoihin liittyvät todennäköisyystaulukot. Määritä kriteerin kokeelliselle arvolle (pienempi kahdesta arvosta) ja otoskokoille todennäköisyys, että molemmat ryhmät kuuluvat samaan yleiseen populaatioon. Näin ollen pieni todennäköisyysarvo, esimerkiksi P

    Taulukko 3

  1. Taulukko 4

  2. Taulukko 5

    1. Taulukko 6

  1. Taulukko Mann-Whitneyn testin kriittisistä arvoista merkitsevyystasolle.

Jos , niin näytteiden välinen ero on merkitsevä , eli nollahypoteesi tulee hylätä.

N 2

N 1

2. U - Mann-Whitney -testi

Kriteeri on suunniteltu arvioimaan kahden näytteen välisiä eroja minkä tahansa ominaisuuden tason suhteen kvantitatiivisesti mitattuna. Sen avulla voit havaita erot pienten näytteiden välillä, kun n1 ja n2 ovat suurempia tai yhtä suuria kuin 3 (tai n1 = 2 ja n2 on silloin suurempi tai yhtä suuri kuin 5).

Menetelmä määrittää, onko kahden sarjan päällekkäisten arvojen alue tarpeeksi pieni. Mitä pienempi tämä alue, sitä todennäköisemmin erot ovat merkittäviä. U-kriteerin empiirinen (todellisuudessa saatu) arvo heijastaa sitä, kuinka suuri rivien välinen yhteensattumaalue on. Mitä pienempi Uemp., sitä todennäköisemmin erot ovat merkittäviä.

Hypoteesit.

Mutta: Attribuutin taso ryhmässä 2 ei ole alempi kuin ryhmän 1 attribuutin taso.

H1: Ominaisuuden taso ryhmässä 2 on alhaisempi kuin ryhmän 1 piirteen taso.

U-kriteerin rajoitukset.

1. Jokaisessa näytteessä on oltava vähintään 3 havaintoa tai äärimmäisissä tapauksissa suhde 2:5 tai enemmän on sallittu.

2. Kussakin näytteessä saa olla enintään 60 havaintoa.

Algoritmi kriteerin U laskemiseen - Mann-Whitney.

1. Siirrä kaikki näytetiedot yksittäisille korteille (joille heijastuu värinä tai jollain muulla tavalla, mihin näytteistä arvo kuuluu).

2. Aseta kaikki kortit yhteiselle riville merkin kasvaessa riippumatta siitä, mihin näytteeseen ne kuuluvat.

3. Järjestä (sijoitusalgoritmin mukaan) korttien arvot asettamalla alemman arvon alempaan arvoon. Rivejä tulee olla yhteensä n1 + n2 (ensimmäisen otoksen koko + toisen otoksen koko).

4. Järjestä kortit uudelleen kahteen riviin sen mukaan, kuuluvatko ne näytteeseen 1 tai näytteeseen 2.

6. Määritä suurempi kahdesta arvosummasta.

7. Määritä U:n arvo kaavalla:

8. Määritä taulukoista U:n kriittiset arvot, tämän mukaisesti hyväksy tai hylkää hypoteesi nro.

3. H - Kruskal - Wallis -kriteeri

H-kriteeriä käytetään arvioimaan eroja analysoitavan ominaisuuden vakavuuden välillä samanaikaisesti kolmen, neljän tai useamman näytteen välillä. Sen avulla voit tunnistaa ominaisuuden muutosasteen näytteissä ilmoittamatta kuitenkaan näiden muutosten suuntaa.

Kriteeri perustuu periaatteeseen, että mitä pienempi näytteiden päällekkäisyys on, sitä korkeampi on merkitsevyystaso. H emp . On syytä korostaa, että otoksissa voi olla eri määrä koehenkilöitä, vaikka alla olevissa tehtävissä otoksissa on sama määrä koehenkilöitä.

Tietojen käsittely alkaa siitä, että kaikki näytteet yhdistetään ehdollisesti esiintyvien arvojen järjestyksessä yhdeksi näytteeksi ja tämän yhdistetyn näytteen arvot asetetaan paremmuusjärjestykseen. Sitten saadut arvot liitetään alkuperäiseen näytetietoon ja arvojen summa lasketaan erikseen jokaiselle näytteelle. Kriteeri perustuu seuraavaan ajatukseen – jos otosten väliset erot ovat merkityksettömiä, niin rankkojen summat eivät eroa merkittävästi toisistaan ​​ja päinvastoin.

Arvo H emp lasketaan kaavalla:

H emp

Missä N on jäsenten kokonaismäärä yleisessä otoksessa;

n i on kunkin yksittäisen näytteen jäsenten lukumäärä;

ovat kunkin näytteen rivien summien neliöt.

Kun määrität kriteerin kriittisiä arvoja neljälle tai useammalle näytteelle, käytä kriteerin taulukkoa hei-neliö, laskettuaan aiemmin vapausasteiden lukumäärän v varten c = 4. Sitten v = c - 1 = 4 – 1=3..

Korostamme, että jos käytämme kriteerejä, joiden avulla voimme verrata vain kahta arvosarjaa, niin yllä saatu tulos vaatisi kuusi vertailua - ensimmäinen näyte toiseen, kolmanteen jne.

Käyttääksesi kriteeriä H seuraavia ehtoja on noudatettava:

1. Mittaus on suoritettava järjestys-, aikaväli- tai suhdeasteikolla.

2. Näytteiden on oltava riippumattomia.

3. Vertailevissa näytteissä sallitaan eri määrä koehenkilöitä.

4. Kolmea näytettä verrattaessa sallitaan, että yksi niistä sisältää n = 3 ja kahdessa muussa n = 2. Tässä tapauksessa erot voidaan kuitenkin kirjata vain 5 %:n merkitsevyystasolla.

5. Liitteen taulukko 9 sisältää vain kolme näytettä ja ( n 1n 2, n H), 5 puntaa, eli koehenkilöiden enimmäismäärä kaikissa kolmessa näytteessä voi olla pienempi ja yhtä suuri kuin 5.

6. Jos näytteitä on suurempi määrä ja jokaisessa otoksessa eri määrä koehenkilöitä, sinun tulee käyttää kriteerinä taulukkoa hei-neliö. Tässä tapauksessa vapausasteiden lukumäärä määritetään kaavalla: v = kanssa - 1, missä kanssa - vastaavien näytteiden määrä.

Mann-Whitneyn U-testi on:

Mann-Whitneyn U-testi

Mann-Whitneyn U-testi

Mann-Whitneyn U-testi(Englanti) Mann-Whitneyn U-testi) on tilastollinen testi, jota käytetään arvioimaan kahden näytteen välisiä eroja jonkin ominaisuuden tason suhteen kvantitatiivisesti mitattuna. Mahdollistaa pienten näytteiden välisten parametrien arvon erojen havaitsemisen.

Muut nimet: Mann-Whitney-Wilcoxon testi Mann-Whitney-Wilcoxon, MWW), Wilcoxonin rank-summatesti (eng. Wilcoxonin rank-sum testi) tai Wilcoxon-Mann-Whitneyn testi (eng. Wilcoxon - Mann - Whitney testi).

Tarina

Tätä menetelmää näytteiden välisten erojen havaitsemiseksi ehdotti vuonna 1945 Frank Wilcoxon ( F. Wilcoxon). Vuonna 1947 H. B. Mann muutti ja laajensi sitä huomattavasti. H. B. Mann) ja D. R. Whitney ( D. R. Whitney), joiden nimillä sitä yleensä kutsutaan nykyään.

Kriteerin kuvaus

Yksinkertainen ei-parametrinen testi. Testin teho on suurempi kuin Rosenbaumin Q-testin.

Tämä menetelmä määrittää, onko päällekkäisten arvojen pinta-ala kahden sarjan välillä (parametriarvojen järjestyssarja ensimmäisessä näytteessä ja sama toisessa näytteessä) riittävän pieni. Mitä pienempi kriteeriarvo on, sitä todennäköisemmin näytteiden parametriarvojen väliset erot ovat merkittäviä.

Kriteerin sovellettavuuden rajoitukset

  1. Jokaisessa näytteessä on oltava vähintään 3 ominaisarvoa. Yhdessä näytteessä saa olla kaksi arvoa, mutta toisessa vähintään viisi.
  2. Otostiedoissa ei saa olla vastaavia arvoja (kaikki luvut ovat erilaisia) tai tällaisia ​​osumia pitäisi olla hyvin vähän.

Kriteerin käyttäminen

Mann-Whitneyn U-testin suorittamiseksi sinun on suoritettava seuraavat toiminnot.

  • Mann-Whitneyn U-testin automaattinen laskenta

Taulukko kriittisistä arvoista

  • Taulukko Mann-Whitneyn U-testin kriittisistä arvoista
  • Mann - Whitneyn U-testin kriittiset arvot.

Katso myös

  • Kruskal-Wallis-testi on Mann-Whitneyn U-testin monimuuttujayleistys.

Kirjallisuus

  • Mann H.B., Whitney D.R. Testissä, onko toinen kahdesta satunnaismuuttujasta stokastisesti suurempi kuin toinen. // Annals of Mathematical Statistics. - 1947. - nro 18. - s. 50-60.
  • Wilcoxon F. Yksittäiset vertailut luokitusmenetelmien mukaan. // Biometriikkatiedote 1. - 1945. - P. 80-83.
  • Gubler E. V., Genkin A. A. Ei-parametristen tilastokriteerien soveltaminen biolääketieteen tutkimuksessa. - L., 1973.
  • Sidorenko E.V. Matemaattisen käsittelyn menetelmät psykologiassa. - Pietari, 2002.

Wikimedia Foundation. 2010.

  • U-954
  • U-pisteen naiset

Katso, mitä "Mann-Whitney U-testi" on muissa sanakirjoissa:

    Mann U-testi- U-testi Mann Whitney (eng. Mann Whitney U-testi) on tilastollinen testi, jota käytetään arvioimaan kahden riippumattoman otoksen välisiä eroja minkä tahansa ominaisuuden tason suhteen, mitattuna kvantitatiivisesti. Voit tunnistaa ... ... Wikipedia

    Mann-Whitneyn U-testi- (Eng. Mann Whitney U -testi) ei-parametrinen tilastollinen testi, jota käytetään arvioimaan kahden näytteen välisiä eroja minkä tahansa ominaisuuden tason suhteen, mitattuna kvantitatiivisesti. Voit tunnistaa parametrin arvon erot pienten ... Wikipedia

    Mann-Whitneyn testi

    Mann-Whitney-Wilcoxonin testi- Mann Whitney U -testi on ei-parametrinen tilastollinen testi, jota käytetään arvioimaan kahden näytteen välisiä eroja minkä tahansa ominaisuuden tason suhteen kvantitatiivisesti mitattuna. Voit tunnistaa merkityseroja ... Wikipedia

    Mann-Whitney-Wilcoxonin testi- Mann Whitney U -testi on ei-parametrinen tilastollinen testi, jota käytetään arvioimaan kahden näytteen välisiä eroja minkä tahansa ominaisuuden tason suhteen kvantitatiivisesti mitattuna. Voit tunnistaa merkityseroja ... Wikipedia

    Mann Whitneyn testi- - Tietoliikenneaiheet, peruskäsitteet FI Mann Whitney U testi ... Tekninen kääntäjän opas

    Wilcoxon-Mann-Whitney testi- Mann Whitney U -testi on ei-parametrinen tilastollinen testi, jota käytetään arvioimaan kahden näytteen välisiä eroja minkä tahansa ominaisuuden tason suhteen kvantitatiivisesti mitattuna. Voit tunnistaa merkityseroja ... Wikipedia

    Wilcoxon-Mann-Whitney testi- Mann Whitney U -testi on ei-parametrinen tilastollinen testi, jota käytetään arvioimaan kahden näytteen välisiä eroja minkä tahansa ominaisuuden tason suhteen kvantitatiivisesti mitattuna. Voit tunnistaa merkityseroja ... Wikipedia

    Wilcoxonin rank-summatesti- Mann Whitney U -testi on ei-parametrinen tilastollinen testi, jota käytetään arvioimaan kahden näytteen välisiä eroja minkä tahansa ominaisuuden tason suhteen kvantitatiivisesti mitattuna. Voit tunnistaa merkityseroja ... Wikipedia

    Wilcoxonin rank-summatesti- Mann Whitney U -testi on ei-parametrinen tilastollinen testi, jota käytetään arvioimaan kahden näytteen välisiä eroja minkä tahansa ominaisuuden tason suhteen kvantitatiivisesti mitattuna. Voit tunnistaa merkityseroja ... Wikipedia

Kirjat

  • Tilastot ja sinetit, Vladimir Saveljev. Tästä kirjasta opit mitä ovat varianssi ja keskihajonta, kuinka löydät Studentin t-testin ja Mann-Whitneyn U-testin, mihin regressio- ja tekijäanalyysejä käytetään, ... Lisää Osta hintaan 280 ruplaa e-kirja

U-testi on arvoltaan yksi, joten se on invariantti minkä tahansa mitta-asteikon monotonisen muunnoksen suhteen.

Muut nimet: Mann-Whitney-Wilcoxon testi (Mann-Whitney-Wilcoxon, MWW), Wilcoxon rank-sum testi tai Wilcoxon-Mann-Whitney testi (WMW).

Tehtäväesimerkkejä

Esimerkki 1 Ensimmäinen näyte on potilaat, joita hoidettiin lääkkeellä A. Toinen näyte on potilaat, joita hoidettiin lääkkeellä B. Näytteiden arvot ovat joitain hoidon tehokkuuden ominaisuuksia (metaboliitin määrä veressä, lämpötila kolme päivää hoidon aloittamisen jälkeen toipumisen kesto, sairaalasänkyjen määrä) päivää jne.) On selvitettävä, onko lääkkeiden A ja B tehokkuudessa merkittävää eroa vai erot ovat puhtaasti satunnainen ja selittyvät valitun ominaisuuden "luonnollisella" varianssilla.

Esimerkki 2 Ensimmäinen näyte on viljelymenetelmällä A käsitellyt pellot. Toinen näyte viljelymenetelmällä B käsitellyt pellot. Näytteiden arvot ovat sato. On selvitettävä, onko toinen menetelmä tehokkaampi kuin toinen vai johtuvatko tuottoerot satunnaisista tekijöistä.

Esimerkki 3 Ensimmäinen näyte on päivät, jolloin tyypin A kampanja (punaiset hintalaput alennuksella) pidettiin supermarketissa. Toinen näyte on B-tyypin kampanjan päivät (joka viides pakkaus on ilmainen). Näytteiden arvot ovat osoitus myynnin tehokkuudesta (myyntimäärä tai tulot ruplissa). On selvitettävä, mikä promootiotyyppi on tehokkaampi.

Kriteerin kuvaus

Kaksi näytettä annetaan.

Lisäarvauksia:

Joskus ajatellaan virheellisesti, että U-testi testaa nollahypoteesia yhtäläisistä mediaaneista kahdessa otoksessa. On jakaumia, joille hypoteesi pitää paikkansa, mutta niiden mediaanit ovat erilaisia.

U-kriteeriä voidaan käyttää siirtohypoteesin testaamiseen vaihtoehtona , jossa on jokin nollasta poikkeava vakio. Tämän vaihtoehdon kanssa U-testi on johdonmukainen. On suositeltavaa käyttää sitä, jos samalla instrumentilla suoritetaan kaksi mittaussarjaa kahdesta tietyn fyysisen suuren arvosta. Tässä tapauksessa jakaumafunktio kuvaa yhden ja toisen arvon mittausvirheitä. Monissa sovelluksissa (erityisesti ekonometriassa) ei kuitenkaan ole erityistä syytä olettaa, että toisen otoksen jakauma vain siirtyisi, mutta ei muutu millään muulla tavalla.

U-testi on Studentin t-testin ei-parametrinen analogi. Jos näytteet ovat normaaleja, on parempi käyttää tehokkaampaa Studentin t-testiä siirtymähypoteesin testaamiseen.

Tarina

Tätä menetelmää näytteiden välisten erojen havaitsemiseksi ehdotti vuonna 1945 Frank Wilcoxon. Mann ja Whitney muuttivat ja laajensivat sitä huomattavasti vuonna 1947, joiden nimillä sitä yleisesti kutsutaan nykyään.

Kirjallisuus

  1. Mann H.B., Whitney D.R. Testissä, onko toinen kahdesta satunnaismuuttujasta stokastisesti suurempi kuin toinen. // Annals of Mathematical Statistics. - 1947, nro 18. - Pp. 50-60.
  2. Wilcoxon F. Yksittäiset vertailut luokitusmenetelmien mukaan. // Biometriikkatiedote 1. 1945. - Ss. 80–83.
  3. Orlov A.I. Ekonometria. - M.: Tentti, 2003. - 576 s. (§4.5 Mitä hypoteeseja voidaan testata käyttämällä kahden otoksen Wilcoxon-testiä?)
  4. Kobzar A.I. Sovellettu matemaattinen tilasto. - M.: Fizmatlit, 2006. - 816 s.

Mann-Whitneyn testi edustaa ei-parametrista vaihtoehtoa riippumattomien näytteiden t-testille. Sen etuna on, että hylkäämme normaalijakauman ja yhtäläisten varianssien oletuksen. Olennaista on, että tiedot mitataan vähintään järjestysasteikolla.

STATISTICA olettaa, että tiedot on järjestetty samalla tavalla kuin riippumattomien näytteiden ja t-testeissä. Tiedostossa on oltava koodi (riippumaton) muuttuja, jossa on vähintään kaksi eri koodia, joiden avulla voidaan yksilöidä, kuuluuko kukin havainto tiettyyn ryhmään.

Oletukset ja tulkinta. Mann-Whitneyn testi oletetaan, että kyseessä olevat muuttujat mitataan vähintään järjestysasteikolla (rankattu). Testin tulkinta on olennaisesti samanlainen kuin riippumattomien näytteiden t-testin tulosten tulkinta, paitsi että U-testi lasketaan ensimmäisen näytteen alkioiden parittaisen vertailun indikaattoreiden summana. toinen näyte. U-testi - tehokkain (herkin) ei-parametrinen vaihtoehto t-testi riippumattomille näytteille; itse asiassa, joissain tapauksissa se on jopa tehokkaampi kuin t-testi.

Jos otoskoko on suurempi kuin 20, U-tilaston otosjakauma konvergoi nopeasti normaalijakaumaan (katso Siegel, 1956). Siksi U-tilaston ohella näytetään z-arvo (normaalijakaumaa varten) ja vastaava p-arvo.

Tarkat todennäköisyydet pienille näytteille. Pienille näytteille STATISTICA laskee tarkan todennäköisyyden, joka liittyy vastaavaan U-tilastoon. Tämä todennäköisyys perustuu kaikkien mahdollisten U:n arvojen laskemiseen, kun otetaan huomioon havaintojen määrä kahdessa näytteessä (katso Dinneen & Blakesley, 1973). Ohjelma raportoi (tulostaulukon viimeisessä sarakkeessa) arvon 2 * p, jossa p on yhtä suuri kuin 1 miinus vastaavan U-tilaston kumulatiivinen (yksisuuntainen) todennäköisyys. Huomaa, että tämä ei yleensä johda asiaankuuluvien vaikutusten tilastollisen merkityksen suureen aliarvioimiseen (ks. Siegel, 1956).

Testitilasto näyttää tältä.

missä W- tilastot Wilcoxon suunniteltu testaamaan samaa hypoteesia

muuten

Tilastot siis U laskee niiden tapausten kokonaismäärän, joissa toisen otoksen elementtejä on enemmän kuin ensimmäisen otoksen elementtejä. Jos hypoteesi pitää paikkansa, niin

Mann-Whitneyn testi oletetaan, että kyseessä olevat muuttujat mitataan vähintään järjestysasteikolla (rankattu). Testin tulkinta on olennaisesti sama kuin tulosten tulkinta t-kriteerit riippumattomille näytteille, paitsi että U-kriteeri lasketaan ensimmäisen otoksen alkioiden parittaisen vertailun indikaattoreiden summana toisen otoksen elementteihin. U-testi - tehokkain (herkin) ei-parametrinen vaihtoehto t- riippumattomien näytteiden kriteerit; itse asiassa, joissakin tapauksissa sillä on jopa enemmän voimaa kuin t-kriteeri.

Jos otoskoko on suurempi kuin 20, U-tilaston otosjakauma konvergoi nopeasti normaalijakaumaan. Siksi U-tilaston ohella z-arvo (normaalijakaumaa varten) ja vastaava p-merkitys.

Yksityiskohtaiset ohjeet kriteerien käyttämisestä löytyvät myöhemmin sovellusesimerkkiosiosta.

Esimerkki

Testataan hypoteesia, että verratut riippumattomat otokset kuuluvat samaan yleiseen populaatioon, käyttämällä ei-parametrista Mann-Whitneyn U-testiä. Verrataan esimerkissä Perustilastot ja Studentin t-testissä saatuja tuloksia Studentin t-testitaulukon 2. ja 3. sarakkeelle ei-parametrisen vertailun tuloksiin.

Wilcoxonin U-testin laskemiseksi järjestämme verrattujen näytteiden variantit nousevassa järjestyksessä yhdeksi yleistetyksi sarjaksi ja annamme yleistetyn sarjan muunnelmille arvot 1 - n1 + n2. Ensimmäinen rivi edustaa ensimmäisen näytteen muunnelmia, toinen - toista näytettä, kolmas - vastaavia rivejä yleistetyssä sarjassa:





















On huomattava, että jos on identtisiä vaihtoehtoja, niille annetaan keskimääräinen sijoitus, mutta viimeisen arvon tulee olla yhtä suuri kuin n1 + n2 (tässä tapauksessa 20). Tätä sääntöä käytetään tarkistamaan, onko sijoitus oikea.

Laskemme jokaiselle näytteelle erikseen niiden R1- ja R2-varianttien rivien summan. Meidän tapauksessamme:

R1 = 1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69

R2 = 5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19,5 + 19,5 = 141

Voit tarkistaa laskelmien oikeellisuuden käyttämällä toista sääntöä: R1 + R2 = 0,5 * (n1 + n2) * (n1 + n2 + 1). Meidän tapauksessamme R1 + R2 = 210.

Tilastot U1 = 69 - 10*11/2 = 14; U2 \u003d 141 - 10 * 11/2 \u003d 86.

Yksisuuntaisen testin testaamiseksi valitsemme vähimmäistilastoarvon U1 = 14 ja vertaamme sitä kriittiseen arvoon n1 = n2 = 10 ja 1 %:n merkitsevyystasoon, joka on yhtä suuri kuin 19.

Koska kriteerin laskettu arvo on pienempi kuin taulukkoarvo, nollahypoteesi hylätään valitulla merkitsevyystasolla ja otosten välisiä eroja pidetään tilastollisesti merkittävinä. Näin ollen parametrisella Studentin testillä tehty johtopäätös erojen olemassaolosta vahvistetaan tällä ei-parametrisella menetelmällä.